Skip to content
AI-Daily-Builder

2026-06-02 views

xAI 完成训练 Grok V9-Medium:1.5 万亿参数、以 Cursor 开发者数据调校的模型

为什么值得读 重点不是 1.5 万亿的参数量,而是训练语料。以 Cursor 真实开发者工作流调校一个前沿模型,是直接抢攻 Claude 与 Codex 主导的代码层。在权重或 API 出现前,请把基准与时间表都视为厂商自述。

Musk 表示 xAI 的 1.5 万亿参数 Grok V9-Medium 已完成训练(5/25),约为现行生产模型的 3 倍,并以 Cursor 开发数据训练,预计六月中旬发布。

2026 年 5 月 25 日Elon Musk 宣布 xAI 全新的 Grok 基础模型 V9-Medium完成训练,并表示评测结果正面。该模型拥有 1.5 万亿(trillion)参数——大约是目前承载全部 Grok 生产流量版本的三倍大。Musk 说监督式微调(SFT)已在进行,强化学习(RL)将于数日内启动,公开发布预计在约两到三周后,也就是落在 2026 年六月中旬

真正关键的细节

多数人会复述的数字是“1.5 万亿参数”。那不是重点。重点是 V9-Medium 用什么训练:Musk 说这个模型明确地以 Cursor 数据训练——也就是来自最被广泛使用的 AI 代码编辑器之一的真实世界开发者工作流

这是刻意的选择,而非脚注。多数前沿模型是从公开代码库、文档与合成题目学会写代码。直接以实际开发者的交互轨迹训练——他们提出什么需求、如何反复迭代、在哪里接受或拒绝建议——是要去建模**“打造软件这个动作”**本身,而不只是成品。这明确指出了 xAI 想竞争的位置。

两个模型的全貌

实际上有两个 Grok 模型同时在进行,而两者之间的落差正是故事所在:

模型规模状态备注
Grok V9-Medium1.5 万亿参数训练完成;接着 SFT + RL约为现行生产模型 3 倍;以 Cursor 数据训练;约六月中发布
Grok 56 万亿参数(MoE)仍在积极训练预测市场给它在 6/30 前发布约 33% 概率

旗舰级的 Grok 5——一个 **6 万亿参数的混合专家(MoE)**模型——仍在训练中,而预测市场仅给它约 33% 的概率会在 2026 年 6 月 30 日前发布;背后是训练后(post-training)的不确定性,以及自 2026 年 2 月 SpaceX 并入 xAI 以来传出的人员流失。因此 xAI 的近期策略根本不是旗舰,而是这个更小、为代码特化的 Medium 模型,且是现在就推出。

为何对打造者重要

若六月中的时间表站得住,V9-Medium 将正中当今 AI 变现最快的工作负载:写代码。这正是 Anthropic 的 ClaudeOpenAI 的 Codex 目前在开发者心智份额与花费上主导的一层。一个前沿规模、且专门以 Cursor 工作流调校的模型,是要正面争夺这一层——不是用通用助理,而是用一个“依开发者实际工作方式塑形”的系统。

排序方式才是务实之处。xAI 没有去等那个 6 万亿的旗舰,而是先推出更小、更快、聚焦代码的层级——这正是对手早已采用的“快又便宜 vs. 前沿”分层。一个六月就到位的 1.5 万亿代码特化模型,能在时间表不明的 6 万亿通用模型问世之前,就开始施压。

实务笔记

这里的每个数字都应在被证实之前,当作厂商自述。训练完成与基准的主张都来自 xAI 与 Musk,且尚未经独立验证——目前没有公开权重、没有 API、也没有第三方评测。“训练完成”也不等于“可发布”:监督式微调与强化学习仍横在今天与一个可用模型之间,而那段落差正是能力与行为被决定之处。若你打算为某个代码工作流评估 V9-Medium,唯一算数的测试是你自己的——等到有 API 后,拿它对你真实的代码库、你的审查关卡、你的验收标准去跑。在那之前,“以 Cursor 数据训练”是一个关于意图的定位主张,而非关于质量的实测结果。请盯着权重或端点;别管参数量。

较少被讨论的角度

Cursor 的开发者数据训练一个前沿模型,引出一个与参数无关的问题:谁的工作流成了那个老师?当一个模型从某编辑器用户的交互轨迹学会写代码,最终的产品就被——同时也在竞争——那个提供信号的工具所塑形。这把 xAI、Cursor,以及那些会话成为训练数据的开发者,缠在一起,而这在发布公告时鲜少被讲清楚。能力的故事很直白;底下那个关于数据来源与激励的故事,才是在代码代理层整合之际值得紧盯的一个。


来源

标签

请喝咖啡