Skip to content
AI-Daily-Builder

2026-05-21 views

Anthropic Code with Claude ロンドン:エージェントプラットフォームの成熟 —— Dreaming、Outcomes、Finance

読む理由 テーマは「より良いモデル」から「信頼できる自律性」へのシフト。Outcomes(エージェント実行を採点する grader loop)と Dreaming(スケジュールされたメモリ整理)は、無人で走らせ続けられるエージェントのインフラ —— エンタープライズ展開の本当の障壁はモデル IQ ではない。

Code with Claude ロンドン(5/20-21)で Anthropic が 5 つのエージェント機能 —— Dreaming、Outcomes、マルチエージェント編成、Claude Finance、Add-ins —— と Small Business 統合を出荷。

Anthropic は Code with Claude 開発者イベントを ロンドン(5/20-21) に持ち込み、エージェントプラットフォームの本番で重要な部分を出荷した —— 新フラッグシップモデルではなく、エージェント周りの信頼性スキャフォールディング。

5 つのエージェント機能

機能役割
Dreaming(リサーチプレビュー)過去のエージェントセッション + メモリストアをレビューし、パターンを抽出、長期メモリをキュレートするスケジュールプロセス
Outcomes(パブリックベータ)定義された成功基準に対しエージェントの実行を採点する grader loop —— 「エージェントは実際に成功したか?」のギャップを埋める
マルチエージェント編成1 つのタスクで複数の専門エージェントを協調
Claude Finance10 の金融特化エージェントスイート
Add-insClaude を既存アプリ面に拡張

加えて Claude for Small Business —— QuickBooks、PayPal、HubSpot、Canva、Docusign、Google Workspace、Microsoft 365 との事前構築統合 —— 非技術オペレーター向けにエージェント能力をパッケージ化。

すべて Claude Opus 4.7(この春先にコーディングベンチのリードを奪ったモデル、93 タスクのコーディングスイートで Opus 4.6 比 約 +13%)上で動作。

本当のテーマ:自律性の信頼性、モデル IQ ではない

過小評価されているシフト:Anthropic がここで売っているのはより賢いモデルではなく —— エージェントを無人で走らせ続けられるほど信頼できるものにするインフラ。

両者は「一度動くデモ」と「本番にデプロイして立ち去れるエージェント」のギャップを狙う。

なぜ重要か

Practitioner note

Claude 上で出荷するビルダー向け:

過小評価される角度:エージェントプラットフォーム戦は信頼性ツールで勝つ、モデルベンチマークではない。 Outcomes と Dreaming は地味 —— grader とメモリ整理は新モデルのように見出しにならない。だがそれらこそエージェントデモをデプロイ済み・無人本番システムに変えるもの。エージェントを 退屈で信頼できる ものに先にしたラボがエンタープライズを勝ち取る、次のベンチマークで誰がトップでも。


ソース

タグ

チップ