タグ · #coding-agents

OpenAI、Ona（旧 Gitpod）を買収——Codex エージェントに永続的で安全なクラウド環境を与える

読む理由エージェント型コーディングの競争は、モデルの品質から実行環境へと移った。OpenAI が買っているのは、地味で難しいインフラ——永続性、サンドボックス、監査——であり、それが賢いエージェントを展開可能なエージェントに変える。

OpenAI が Ona——旧 Gitpod として知られるクラウド開発環境企業——を買収し、Codex エージェントが永続的で顧客管理下の監査可能な環境で長時間タスクを実行できるようにする。

読む理由見出しは 1.5 兆のパラメータ数ではなく、訓練コーパスだ。Cursor の実際の開発者ワークフローでフロンティアモデルを調整するのは、Claude と Codex が支配するコーディング層への直接的な挑戦。重みか API が出るまで、ベンチマークと時期はベンダー発表として扱え。

Musk は xAI の 1.5 兆パラメータ Grok V9-Medium が訓練を完了したと発表（5/25）。本番モデルの約 3 倍で Cursor 開発データで訓練、6 月中旬の公開予定。

読む理由約 53 倍の ARR 倍率は、「エージェント＝ツール」ではなく「エージェント＝人員」への賭けだ。フライホイールは証明であり同時にリスク：Cognition は自社コードの約 90% を Devin で書くので、成長物語とデモは同じもの —— 成長が鈍るまでは。

Devin コーディングエージェントの開発元 Cognition が評価額 260 億ドルで 10 億ドル超を調達（5/27）—— 8 か月で 2.5 倍、ARR $492M、自社コードの約 90% を AI が記述。

読む理由シグナルは価格性能の逆転。バジェット級が今や前四半期フラッグシップを「ドルあたりエージェントスループット」で上回る。インフラを Pro 級価格で設計していたなら、コード変更なしでユニットエコノミクスが改善した。

I/O 2026：Flash 級 Gemini 3.5 Flash がコーディング+エージェントで Gemini 3.1 Pro を上回る。$1.50/$9 per 1M token。Terminal-Bench 76.2% vs 70.3%。4 倍速・半額。

読む理由注目すべきはベンチマークスコアではなく「8 サブエージェント並列」という構造的選択。これが定着すれば、コストモデルは「タスクあたりトークン」から「分あたりタスク」へ反転 —— Claude Code/Codex のチームは精度ではなくスループットで再評価。

5/14 パブリックベータ。SWE-Bench 70.8%、256K context、$0.20/$1.50 per 1M tokens、$99 イントロ。8 サブエージェント並列で四つ巴に。