2026-05-22 — views

Andrej Karpathy 加入 Anthropic —— 用 Claude 加速 Claude 的预训练

为什么值得读重点是任务，不是这次招募。「用 Claude 加速 Claude 的预训练」是把递归自我改进写成职务说明 —— 与 Recursive Superintelligence 募资 $650M 追逐的同一个循环，如今被放进前沿实验室内部编制。

OpenAI 联合创始人、前 Tesla Autopilot AI 负责人 Andrej Karpathy 加入 Anthropic 预训练团队（5/19），向 Nick Joseph 汇报。任务：用 Claude 加速预训练研发本身。

Andrej Karpathy —— OpenAI 创始成员、前 Tesla Autopilot AI 总监、Eureka Labs 创办人 —— 本周加入 Anthropic（5/19 宣布），进入 预训练（pretraining） 团队，向负责人 Nick Joseph 汇报。

任务本身就是头条

据 Anthropic：Karpathy 将 成立一个团队，专注于用 Claude 加速预训练研究。 预训练是赋予 Claude 核心知识与能力的大规模训练。

照字面读：用 Claude 让下一代 Claude 的预训练更好、更快。 这就是 把递归自我改进写成职务说明 —— AI 改进建造 AI 的流程。

这与 Recursive Superintelligence 募资 $650M 追逐的是同一个循环。差别在于：那是 30 人创业公司在赌；这是前沿实验室用业界最知名的研究者之一，在既有的大规模预训练运营中正式编制。

为什么是 Anthropic、为什么现在

人才磁吸信号。 Karpathy 选择 Anthropic（而非继续独立经营 Eureka Labs 或回 OpenAI），是顶尖人才战的一记重拳 —— 也再次佐证 Claude Opus 4.7 之后，资深研究者想去的地方是 Anthropic。
他自己定调为「回归研发」。 在 X 公告中他说「非常兴奋加入这里的团队、回归研发」，并提到日后会「重拾教育工作」。是研究回归，不是管理职。
预训练是护城河层。 后训练（RLHF、agent）拿产品头条，但预训练决定原始能力。把招牌研究者放在这里，等于宣告 Anthropic 相信下一次能力跃进来自预训练效率，而不只是后训练打磨。

为什么重要

「AI 加速 AI 研究」现在是有编制的职能，不再只是论述。 当前沿实验室指派具名团队「用我们的模型改进我们模型的训练」，递归改进的时间轴就从臆测变成季度 OKR。
这次招募验证了 test-time compute / AutoTTS 方向 —— AI 优化自身管线（从推理编排到预训练本身）的大主题。

实务笔记

2-3 季内留意 Anthropic 的预训练效率论文。 若 Karpathy 的团队出货，信号会是 Claude 训练算力效率或每 FLOP 能力的阶跃 —— 出现在模型卡，而非新闻稿。
人才流向是领先指标。 资深研究者聚集处，预示 18-24 个月后哪家领先。Karpathy → Anthropic 是与 4.7 后动能同一方向的又一个向量。
别对单一招募过度解读。 再知名的单一研究者，也无法一夜改变模型路线图。信号是方向性的（Anthropic 的拉力 + 递归改进的框架），不是即时的能力宣称。

被低估的角度：递归自我改进的故事，已悄悄从宣言走进组织图。 一年前「AI 改进 AI」是 VC 资助的论述；现在是顶级实验室内部一个有负责人的具名团队。问题不再是实验室「会不会」尝试闭合这个循环 —— 而是谁先做出可量测的预训练效率提升。