Cloudflare Infire — 分離型LLM推論でvLLMを20%上回る。Unweightが22%無損失圧縮を実現
CloudflareのRust製Infireエンジンがプリフィル/デコード分離アーキテクチャでH100満負荷時にvLLM 0.10比20%高スループットを達成。Unweightは15–22%の無損失重み圧縮を実現。
CloudflareのRust製Infireエンジンがプリフィル/デコード分離アーキテクチャでH100満負荷時にvLLM 0.10比20%高スループットを達成。Unweightは15–22%の無損失重み圧縮を実現。
JulesがGemini 3 Pro搭載でグローバルパブリックベータ公開。GitHubラベルトリガーのActionと新しい「Jules Tools」CLIを提供し、Claude Codeへの最初の本格的な非同期GitHub対抗馬となった。
Agent 365がユーザーあたり月$15でGA。各エージェントに独自のEntra IDとDefender MCP脅威検知を付与。Agent Framework 1.0はA2A・MCP互換を標準搭載したオープンソース多エージェント基盤。
GR00T N1.7(オープンVLAロボット基盤モデル)が商用早期アクセスに移行。黄仁勲氏はGR00T N2が現行トップVLAの2倍以上のタスク成功率を達成すると予告。
GitHub Copilot in VS にクラウドエージェントセッション、プロファイル単位のカスタムエージェント、.claude/skills/ や .agents/skills/ からの skills 読み込み、ランタイム上で issue を再現して修正を検証する Debugger エージェントを追加。
Cursor は TypeScript SDK(@cursor/sdk)を発表。デスクトップ、CLI、Web 共通のランタイム、ハーネス、モデルにプログラム的にアクセス可能で、トークン課金。
Mistral Medium 3.5 は 128B パラメータの密モデル、256K context。あわせて Vibe にクラウド remote agent、Le Chat に Work Mode を追加。
vLLM v0.20.0:752 commits、320 名のコントリビューター。デフォルトで CUDA 13.0、PyTorch 2.11、Transformers v5、Python 3.14、FlashAttention 4 がデフォルト、TurboQuant 2-bit KV cache で 4 倍の容量。
Cursor 3.2 は /multitask による並列 async サブエージェント、Agents Window の worktrees、複数フォルダ/repo にまたがる multi-root workspace を追加しました。
GPT-5.5 と GPT-5.5 Pro は 4/23 に ChatGPT と Codex で提供開始、4/24 に API 公開。OpenAI は Terminal-Bench 2.0 で 82.7%、FrontierMath では Opus 4.7 を上回ったとしています。
Claude Design(リサーチプレビュー)は自然言語からプロトタイプ、スライド、ワンページャーを生成。社内コードベースやデザインファイルを読み取り、デザインシステムを抽出して一貫適用。
Anthropic は Claude 製品、API、Bedrock、Vertex、Microsoft Foundry で Claude Opus 4.7 を提供開始。コーディングと長尺エージェントタスクの精度向上、視覚入力は約 3.75 MP に拡大、価格は据え置き。