2026-06-02 — views

xAI、Cursor 開発者データで調整した 1.5 兆パラメータの Grok V9-Medium を訓練完了

読む理由見出しは 1.5 兆のパラメータ数ではなく、訓練コーパスだ。Cursor の実際の開発者ワークフローでフロンティアモデルを調整するのは、Claude と Codex が支配するコーディング層への直接的な挑戦。重みか API が出るまで、ベンチマークと時期はベンダー発表として扱え。

Musk は xAI の 1.5 兆パラメータ Grok V9-Medium が訓練を完了したと発表（5/25）。本番モデルの約 3 倍で Cursor 開発データで訓練、6 月中旬の公開予定。

2026 年 5 月 25 日、Elon Musk は xAI の新しい Grok 基盤モデル V9-Medium が訓練を完了し、良好な評価結果が出たと発表した。このモデルは 1.5 兆（trillion）パラメータを持ち、現在すべての Grok 本番トラフィックを処理しているバージョンのおよそ 3 倍の大きさだ。Musk によれば教師ありファインチューニング（SFT）はすでに進行中で、強化学習（RL）は数日以内に開始、公開はおよそ 2〜3 週間後、すなわち 2026 年 6 月中旬が見込まれるという。

本当に重要なのはこの一点

多くの人が繰り返す数字は「1.5 兆パラメータ」だ。だがそこは面白い部分ではない。面白いのは V9-Medium が何で訓練されたかである。Musk は、このモデルが明示的に Cursor のデータ——最も広く使われている AI コードエディタの一つから得た現実の開発者ワークフロー——で訓練されたと述べた。

これは脚注ではなく、意図的な選択だ。多くのフロンティアモデルは、公開リポジトリ、ドキュメント、合成問題からコーディングを学ぶ。実際に働く開発者のインタラクション履歴——何を求め、どう反復し、どこで提案を受け入れ・拒否するか——で直接訓練するのは、完成物だけでなく**「ソフトウェアを作るという行為」**そのものをモデル化しようとする試みだ。xAI がどこで戦いたいのかが、はっきり示されている。

二つのモデルという全体像

実際には二つの Grok モデルが並行して進んでおり、その間の差こそが核心だ：

モデル	規模	状況	備考
Grok V9-Medium	1.5 兆パラメータ	訓練完了、次に SFT + RL	現行本番モデルの約 3 倍、Cursor データで訓練、公開は 6 月中旬頃
Grok 5	6 兆パラメータ（MoE）	なお活発に訓練中	予測市場は 6/30 までの公開を約 33% と見る

旗艦の Grok 5——**6 兆パラメータの Mixture-of-Experts（MoE）**モデル——はまだ訓練中で、予測市場はそれが 2026 年 6 月 30 日までに出荷される確率をわずか約 33% としている。背景には訓練後（post-training）の不確実性と、2026 年 2 月に SpaceX が xAI を吸収して以降に伝えられる人材流出がある。したがって xAI の近期の一手は旗艦ではまったくなく、より小さくコーディングに特化した Medium モデルを、いま出すことなのだ。

ビルダーにとってなぜ重要か

6 月中旬の予定が保たれるなら、V9-Medium は今日の AI で最も速く収益化するワークロード、すなわちコーディングに真正面から着地する。ここは Anthropic の Claude と OpenAI の Codex が、開発者のマインドシェアと支出を現在支配している層だ。Cursor のワークフローに特化して調整されたフロンティア規模のモデルは、汎用アシスタントではなく「開発者の実際の働き方によって形づくられたシステム」で、その層を真っ向から奪いにいく明確な試みである。

順序こそが現実的な部分だ。xAI は 6 兆の旗艦を待たず、より小さく、より速く、コーディングに集中した階層を先に出す——競合がすでに運用している「速くて安い vs. フロンティア」の分割と同じだ。6 月に到着する 1.5 兆のコーディング特化モデルは、時期の不確かな 6 兆の汎用モデルが出荷されるよりずっと前から圧力をかけ始められる。

実務メモ

ここでのすべての数字は、証明されるまでベンダー発表として扱うべきだ。訓練完了とベンチマークの主張は xAI と Musk によるもので、独立検証は受けていない——公開された重みも、API も、第三者評価もまだない。「訓練完了」は「公開準備完了」でもない。教師ありファインチューニングと強化学習が、今日と使えるモデルの間になお横たわり、その差こそが能力と振る舞いが決まる場所だ。もし V9-Medium をコーディングワークフロー向けに評価する計画があるなら、意味を持つ唯一のテストはあなた自身のものだ——API が出たら、あなたの実際のリポジトリ、あなたのレビュー関門、あなたの受け入れ基準に対して走らせること。それまでは「Cursor データで訓練」は品質に関する実測結果ではなく、意図に関するポジショニングの主張にすぎない。重みかエンドポイントを注視し、パラメータ数は無視せよ。

あまり論じられない視点

Cursor の開発者データでフロンティアモデルを訓練することは、パラメータとは無関係の問いを突きつける。誰のワークフローが教師になるのか、という問いだ。あるエディタのユーザーのインタラクション履歴からコーディングを学んだモデルは、その結果として、信号を供給したまさにそのツールによって形づくられ、同時にそれと競合する。これは xAI、Cursor、そしてセッションが訓練データとなった開発者たちを、発表時にはめったに明言されない形で絡み合わせる。能力の物語は単純明快だ。その下にあるデータの出所とインセンティブの物語こそ、コーディングエージェント層が統合していく中で注視に値するものだ。