Skip to content
AI-Daily-Builder

2026-06-02 views

xAI 完成訓練 Grok V9-Medium:1.5 兆參數、以 Cursor 開發者資料調校的模型

為什麼值得讀 重點不是 1.5 兆的參數量,而是訓練語料。以 Cursor 真實開發者工作流調校一個前沿模型,是直接搶攻 Claude 與 Codex 主導的程式碼層。在權重或 API 出現前,請把基準與時程都視為廠商自述。

Musk 表示 xAI 的 1.5 兆參數 Grok V9-Medium 已完成訓練(5/25),約為現行生產模型的 3 倍,並以 Cursor 開發資料訓練,預計六月中旬發布。

2026 年 5 月 25 日Elon Musk 宣布 xAI 全新的 Grok 基礎模型 V9-Medium完成訓練,並表示評測結果正面。該模型擁有 1.5 兆(trillion)參數——大約是目前承載所有 Grok 生產流量版本的三倍大。Musk 說監督式微調(SFT)已在進行,強化學習(RL)將於數日內啟動,公開發布預計在約兩到三週後,也就是落在 2026 年六月中旬

真正關鍵的細節

多數人會複述的數字是「1.5 兆參數」。那不是重點。重點是 V9-Medium 用什麼訓練:Musk 說這個模型明確地以 Cursor 資料訓練——也就是來自最被廣泛使用的 AI 程式編輯器之一的真實世界開發者工作流

這是刻意的選擇,而非註腳。多數前沿模型是從公開程式庫、文件與合成題目學會寫程式。直接以實際開發者的互動軌跡訓練——他們提出什麼需求、如何反覆迭代、在哪裡接受或拒絕建議——是要去建模**「打造軟體這個動作」**本身,而不只是成品。這明確指出了 xAI 想競爭的位置。

兩個模型的全貌

實際上有兩個 Grok 模型同時在進行,而兩者之間的落差正是故事所在:

模型規模狀態備註
Grok V9-Medium1.5 兆參數訓練完成;接著 SFT + RL約為現行生產模型 3 倍;以 Cursor 資料訓練;約六月中發布
Grok 56 兆參數(MoE)仍在積極訓練預測市場給它在 6/30 前發布約 33% 機率

旗艦級的 Grok 5——一個 **6 兆參數的混合專家(MoE)**模型——仍在訓練中,而預測市場僅給它約 33% 的機率會在 2026 年 6 月 30 日前發布;背後是訓練後(post-training)的不確定性,以及自 2026 年 2 月 SpaceX 併入 xAI 以來傳出的人員流失。因此 xAI 的近期策略根本不是旗艦,而是這個更小、為程式碼特化的 Medium 模型,且是現在就推出。

為何對打造者重要

若六月中的時程站得住,V9-Medium 將正中當今 AI 變現最快的工作負載:寫程式。這正是 Anthropic 的 ClaudeOpenAI 的 Codex 目前在開發者心佔率與花費上主導的一層。一個前沿規模、且專門以 Cursor 工作流調校的模型,是要正面爭奪這一層——不是用通用助理,而是用一個「依開發者實際工作方式塑形」的系統。

排序方式才是務實之處。xAI 沒有去等那個 6 兆的旗艦,而是先推出更小、更快、聚焦程式碼的層級——這正是對手早已採用的「快又便宜 vs. 前沿」分層。一個六月就到位的 1.5 兆程式碼特化模型,能在時程不明的 6 兆通用模型問世之前,就開始施壓。

實務筆記

這裡的每個數字都應在被證實之前,當作廠商自述。訓練完成與基準的主張都來自 xAI 與 Musk,且尚未經獨立驗證——目前沒有公開權重、沒有 API、也沒有第三方評測。「訓練完成」也不等於「可發布」:監督式微調與強化學習仍橫在今天與一個可用模型之間,而那段落差正是能力與行為被決定之處。若你打算為某個程式碼工作流評估 V9-Medium,唯一算數的測試是你自己的——等到有 API 後,拿它對你真實的程式庫、你的審查關卡、你的驗收標準去跑。在那之前,「以 Cursor 資料訓練」是一個關於意圖的定位主張,而非關於品質的實測結果。請盯著權重或端點;別管參數量。

較少被討論的角度

Cursor 的開發者資料訓練一個前沿模型,引出一個與參數無關的問題:誰的工作流成了那個老師?當一個模型從某編輯器使用者的互動軌跡學會寫程式,最終的產品就被——同時也在競爭——那個提供訊號的工具所塑形。這把 xAI、Cursor,以及那些工作階段成為訓練資料的開發者,纏在一起,而這在發布公告時鮮少被講清楚。能力的故事很直白;底下那個關於資料來源與誘因的故事,才是在程式碼代理層整併之際值得緊盯的一個。


來源

標籤

請喝咖啡