2026-06-02 — views

xAI 完成训练 Grok V9-Medium：1.5 万亿参数、以 Cursor 开发者数据调校的模型

为什么值得读重点不是 1.5 万亿的参数量，而是训练语料。以 Cursor 真实开发者工作流调校一个前沿模型，是直接抢攻 Claude 与 Codex 主导的代码层。在权重或 API 出现前，请把基准与时间表都视为厂商自述。

Musk 表示 xAI 的 1.5 万亿参数 Grok V9-Medium 已完成训练（5/25），约为现行生产模型的 3 倍，并以 Cursor 开发数据训练，预计六月中旬发布。

2026 年 5 月 25 日，Elon Musk 宣布 xAI 全新的 Grok 基础模型 V9-Medium 已完成训练，并表示评测结果正面。该模型拥有 1.5 万亿（trillion）参数——大约是目前承载全部 Grok 生产流量版本的三倍大。Musk 说监督式微调（SFT）已在进行，强化学习（RL）将于数日内启动，公开发布预计在约两到三周后，也就是落在 2026 年六月中旬。

真正关键的细节

多数人会复述的数字是“1.5 万亿参数”。那不是重点。重点是 V9-Medium 用什么训练：Musk 说这个模型明确地以 Cursor 数据训练——也就是来自最被广泛使用的 AI 代码编辑器之一的真实世界开发者工作流。

这是刻意的选择，而非脚注。多数前沿模型是从公开代码库、文档与合成题目学会写代码。直接以实际开发者的交互轨迹训练——他们提出什么需求、如何反复迭代、在哪里接受或拒绝建议——是要去建模**“打造软件这个动作”**本身，而不只是成品。这明确指出了 xAI 想竞争的位置。

两个模型的全貌

实际上有两个 Grok 模型同时在进行，而两者之间的落差正是故事所在：

模型	规模	状态	备注
Grok V9-Medium	1.5 万亿参数	训练完成；接着 SFT + RL	约为现行生产模型 3 倍；以 Cursor 数据训练；约六月中发布
Grok 5	6 万亿参数（MoE）	仍在积极训练	预测市场给它在 6/30 前发布约 33% 概率

旗舰级的 Grok 5——一个 **6 万亿参数的混合专家（MoE）**模型——仍在训练中，而预测市场仅给它约 33% 的概率会在 2026 年 6 月 30 日前发布；背后是训练后（post-training）的不确定性，以及自 2026 年 2 月 SpaceX 并入 xAI 以来传出的人员流失。因此 xAI 的近期策略根本不是旗舰，而是这个更小、为代码特化的 Medium 模型，且是现在就推出。

为何对打造者重要

若六月中的时间表站得住，V9-Medium 将正中当今 AI 变现最快的工作负载：写代码。这正是 Anthropic 的 Claude 与 OpenAI 的 Codex 目前在开发者心智份额与花费上主导的一层。一个前沿规模、且专门以 Cursor 工作流调校的模型，是要正面争夺这一层——不是用通用助理，而是用一个“依开发者实际工作方式塑形”的系统。

排序方式才是务实之处。xAI 没有去等那个 6 万亿的旗舰，而是先推出更小、更快、聚焦代码的层级——这正是对手早已采用的“快又便宜 vs. 前沿”分层。一个六月就到位的 1.5 万亿代码特化模型，能在时间表不明的 6 万亿通用模型问世之前，就开始施压。

实务笔记

这里的每个数字都应在被证实之前，当作厂商自述。训练完成与基准的主张都来自 xAI 与 Musk，且尚未经独立验证——目前没有公开权重、没有 API、也没有第三方评测。“训练完成”也不等于“可发布”：监督式微调与强化学习仍横在今天与一个可用模型之间，而那段落差正是能力与行为被决定之处。若你打算为某个代码工作流评估 V9-Medium，唯一算数的测试是你自己的——等到有 API 后，拿它对你真实的代码库、你的审查关卡、你的验收标准去跑。在那之前，“以 Cursor 数据训练”是一个关于意图的定位主张，而非关于质量的实测结果。请盯着权重或端点；别管参数量。

较少被讨论的角度

以 Cursor 的开发者数据训练一个前沿模型，引出一个与参数无关的问题：谁的工作流成了那个老师？当一个模型从某编辑器用户的交互轨迹学会写代码，最终的产品就被——同时也在竞争——那个提供信号的工具所塑形。这把 xAI、Cursor，以及那些会话成为训练数据的开发者，缠在一起，而这在发布公告时鲜少被讲清楚。能力的故事很直白；底下那个关于数据来源与激励的故事，才是在代码代理层整合之际值得紧盯的一个。