2026-05-22 — views
Andrej Karpathy 加入 Anthropic —— 用 Claude 加速 Claude 的预训练
为什么值得读 重点是任务,不是这次招募。「用 Claude 加速 Claude 的预训练」是把递归自我改进写成职务说明 —— 与 Recursive Superintelligence 募资 $650M 追逐的同一个循环,如今被放进前沿实验室内部编制。
OpenAI 联合创始人、前 Tesla Autopilot AI 负责人 Andrej Karpathy 加入 Anthropic 预训练团队(5/19),向 Nick Joseph 汇报。任务:用 Claude 加速预训练研发本身。
Andrej Karpathy —— OpenAI 创始成员、前 Tesla Autopilot AI 总监、Eureka Labs 创办人 —— 本周加入 Anthropic(5/19 宣布),进入 预训练(pretraining) 团队,向负责人 Nick Joseph 汇报。
任务本身就是头条
据 Anthropic:Karpathy 将 成立一个团队,专注于用 Claude 加速预训练研究。 预训练是赋予 Claude 核心知识与能力的大规模训练。
照字面读:用 Claude 让下一代 Claude 的预训练更好、更快。 这就是 把递归自我改进写成职务说明 —— AI 改进建造 AI 的流程。
这与 Recursive Superintelligence 募资 $650M 追逐的 是同一个循环。差别在于:那是 30 人创业公司在赌;这是前沿实验室用业界最知名的研究者之一,在既有的大规模预训练运营中正式编制。
为什么是 Anthropic、为什么现在
- 人才磁吸信号。 Karpathy 选择 Anthropic(而非继续独立经营 Eureka Labs 或回 OpenAI),是顶尖人才战的一记重拳 —— 也再次佐证 Claude Opus 4.7 之后,资深研究者想去的地方是 Anthropic。
- 他自己定调为「回归研发」。 在 X 公告中他说「非常兴奋加入这里的团队、回归研发」,并提到日后会「重拾教育工作」。是研究回归,不是管理职。
- 预训练是护城河层。 后训练(RLHF、agent)拿产品头条,但预训练决定原始能力。把招牌研究者放在这里,等于宣告 Anthropic 相信下一次能力跃进来自预训练效率,而不只是后训练打磨。
为什么重要
- 「AI 加速 AI 研究」现在是有编制的职能,不再只是论述。 当前沿实验室指派具名团队「用我们的模型改进我们模型的训练」,递归改进的时间轴就从臆测变成季度 OKR。
- 这次招募验证了 test-time compute / AutoTTS 方向 —— AI 优化自身管线(从推理编排到预训练本身)的大主题。
实务笔记
- 2-3 季内留意 Anthropic 的预训练效率论文。 若 Karpathy 的团队出货,信号会是 Claude 训练算力效率或每 FLOP 能力的阶跃 —— 出现在模型卡,而非新闻稿。
- 人才流向是领先指标。 资深研究者聚集处,预示 18-24 个月后哪家领先。Karpathy → Anthropic 是与 4.7 后动能同一方向的又一个向量。
- 别对单一招募过度解读。 再知名的单一研究者,也无法一夜改变模型路线图。信号是方向性的(Anthropic 的拉力 + 递归改进的框架),不是即时的能力宣称。
被低估的角度:递归自我改进的故事,已悄悄从宣言走进组织图。 一年前「AI 改进 AI」是 VC 资助的论述;现在是顶级实验室内部一个有负责人的具名团队。问题不再是实验室「会不会」尝试闭合这个循环 —— 而是谁先做出可量测的预训练效率提升。
来源
- OpenAI co-founder Andrej Karpathy joins Anthropic's pre-training team — TechCrunch ↗
- Anthropic hires OpenAI co-founder Andrej Karpathy, former Tesla AI lead — CNBC ↗
- OpenAI co-founder Andrej Karpathy joins Anthropic — Axios ↗