2026-06-02 — views

xAI 完成訓練 Grok V9-Medium：1.5 兆參數、以 Cursor 開發者資料調校的模型

為什麼值得讀重點不是 1.5 兆的參數量，而是訓練語料。以 Cursor 真實開發者工作流調校一個前沿模型，是直接搶攻 Claude 與 Codex 主導的程式碼層。在權重或 API 出現前，請把基準與時程都視為廠商自述。

Musk 表示 xAI 的 1.5 兆參數 Grok V9-Medium 已完成訓練（5/25），約為現行生產模型的 3 倍，並以 Cursor 開發資料訓練，預計六月中旬發布。

2026 年 5 月 25 日，Elon Musk 宣布 xAI 全新的 Grok 基礎模型 V9-Medium 已完成訓練，並表示評測結果正面。該模型擁有 1.5 兆（trillion）參數——大約是目前承載所有 Grok 生產流量版本的三倍大。Musk 說監督式微調（SFT）已在進行，強化學習（RL）將於數日內啟動，公開發布預計在約兩到三週後，也就是落在 2026 年六月中旬。

真正關鍵的細節

多數人會複述的數字是「1.5 兆參數」。那不是重點。重點是 V9-Medium 用什麼訓練：Musk 說這個模型明確地以 Cursor 資料訓練——也就是來自最被廣泛使用的 AI 程式編輯器之一的真實世界開發者工作流。

這是刻意的選擇，而非註腳。多數前沿模型是從公開程式庫、文件與合成題目學會寫程式。直接以實際開發者的互動軌跡訓練——他們提出什麼需求、如何反覆迭代、在哪裡接受或拒絕建議——是要去建模**「打造軟體這個動作」**本身，而不只是成品。這明確指出了 xAI 想競爭的位置。

兩個模型的全貌

實際上有兩個 Grok 模型同時在進行，而兩者之間的落差正是故事所在：

模型	規模	狀態	備註
Grok V9-Medium	1.5 兆參數	訓練完成；接著 SFT + RL	約為現行生產模型 3 倍；以 Cursor 資料訓練；約六月中發布
Grok 5	6 兆參數（MoE）	仍在積極訓練	預測市場給它在 6/30 前發布約 33% 機率

旗艦級的 Grok 5——一個 **6 兆參數的混合專家（MoE）**模型——仍在訓練中，而預測市場僅給它約 33% 的機率會在 2026 年 6 月 30 日前發布；背後是訓練後（post-training）的不確定性，以及自 2026 年 2 月 SpaceX 併入 xAI 以來傳出的人員流失。因此 xAI 的近期策略根本不是旗艦，而是這個更小、為程式碼特化的 Medium 模型，且是現在就推出。

為何對打造者重要

若六月中的時程站得住，V9-Medium 將正中當今 AI 變現最快的工作負載：寫程式。這正是 Anthropic 的 Claude 與 OpenAI 的 Codex 目前在開發者心佔率與花費上主導的一層。一個前沿規模、且專門以 Cursor 工作流調校的模型，是要正面爭奪這一層——不是用通用助理，而是用一個「依開發者實際工作方式塑形」的系統。

排序方式才是務實之處。xAI 沒有去等那個 6 兆的旗艦，而是先推出更小、更快、聚焦程式碼的層級——這正是對手早已採用的「快又便宜 vs. 前沿」分層。一個六月就到位的 1.5 兆程式碼特化模型，能在時程不明的 6 兆通用模型問世之前，就開始施壓。

實務筆記

這裡的每個數字都應在被證實之前，當作廠商自述。訓練完成與基準的主張都來自 xAI 與 Musk，且尚未經獨立驗證——目前沒有公開權重、沒有 API、也沒有第三方評測。「訓練完成」也不等於「可發布」：監督式微調與強化學習仍橫在今天與一個可用模型之間，而那段落差正是能力與行為被決定之處。若你打算為某個程式碼工作流評估 V9-Medium，唯一算數的測試是你自己的——等到有 API 後，拿它對你真實的程式庫、你的審查關卡、你的驗收標準去跑。在那之前，「以 Cursor 資料訓練」是一個關於意圖的定位主張，而非關於品質的實測結果。請盯著權重或端點；別管參數量。

較少被討論的角度

以 Cursor 的開發者資料訓練一個前沿模型，引出一個與參數無關的問題：誰的工作流成了那個老師？當一個模型從某編輯器使用者的互動軌跡學會寫程式，最終的產品就被——同時也在競爭——那個提供訊號的工具所塑形。這把 xAI、Cursor，以及那些工作階段成為訓練資料的開發者，纏在一起，而這在發布公告時鮮少被講清楚。能力的故事很直白；底下那個關於資料來源與誘因的故事，才是在程式碼代理層整併之際值得緊盯的一個。