2026-05-22 — views
Andrej Karpathy 加入 Anthropic —— 用 Claude 加速 Claude 的預訓練
為什麼值得讀 重點是任務,不是這次招募。「用 Claude 加速 Claude 的預訓練」是把遞迴自我改進寫成職務說明 —— 與 Recursive Superintelligence 募資 $650M 追逐的同一個迴圈,如今被放進前沿實驗室內部編制。
OpenAI 共同創辦人、前 Tesla Autopilot AI 負責人 Andrej Karpathy 加入 Anthropic 預訓練團隊(5/19),向 Nick Joseph 報告。任務:用 Claude 加速預訓練研發本身。
Andrej Karpathy —— OpenAI 創始成員、前 Tesla Autopilot AI 總監、Eureka Labs 創辦人 —— 本週加入 Anthropic(5/19 宣布),進入 預訓練(pretraining) 團隊,向負責人 Nick Joseph 報告。
任務本身就是頭條
據 Anthropic:Karpathy 將 成立一個團隊,專注於用 Claude 加速預訓練研究。 預訓練是賦予 Claude 核心知識與能力的大規模訓練。
照字面讀:用 Claude 讓下一代 Claude 的預訓練更好、更快。 這就是 把遞迴自我改進寫成職務說明 —— AI 改進建造 AI 的流程。
這與 Recursive Superintelligence 募資 $650M 追逐的 是同一個迴圈。差別在於:那是 30 人新創在賭;這是前沿實驗室用業界最知名的研究者之一,在既有的大規模預訓練營運中正式編制。
為什麼是 Anthropic、為什麼現在
- 人才磁吸訊號。 Karpathy 選擇 Anthropic(而非繼續獨立經營 Eureka Labs 或回 OpenAI),是頂尖人才戰的一記重拳 —— 也再次佐證 Claude Opus 4.7 之後,資深研究者想去的地方是 Anthropic。
- 他自己定調為「回歸研發」。 在 X 公告中他說「非常興奮加入這裡的團隊、回歸研發」,並提到日後會「重拾教育工作」。是研究回歸,不是管理職。
- 預訓練是護城河層。 後訓練(RLHF、agent)拿產品頭條,但預訓練決定原始能力。把招牌研究者放在這裡,等於宣告 Anthropic 相信下一次能力躍進來自預訓練效率,而不只是後訓練打磨。
為什麼重要
- 「AI 加速 AI 研究」現在是有編制的職能,不再只是論述。 當前沿實驗室指派具名團隊「用我們的模型改進我們模型的訓練」,遞迴改進的時間軸就從臆測變成季度 OKR。
- 這次招募驗證了 test-time compute / AutoTTS 方向 —— AI 優化自身管線(從推論編排到預訓練本身)的大主題。
實務筆記
- 2-3 季內留意 Anthropic 的預訓練效率論文。 若 Karpathy 的團隊出貨,訊號會是 Claude 訓練算力效率或每 FLOP 能力的階躍 —— 出現在模型卡,而非新聞稿。
- 人才流向是領先指標。 資深研究者聚集處,預示 18-24 個月後哪家領先。Karpathy → Anthropic 是與 4.7 後動能同一方向的又一個向量。
- 別對單一招募過度解讀。 再知名的單一研究者,也無法一夜改變模型路線圖。訊號是方向性的(Anthropic 的拉力 + 遞迴改進的框架),不是即時的能力宣稱。
被低估的角度:遞迴自我改進的故事,已悄悄從宣言走進組織圖。 一年前「AI 改進 AI」是 VC 資助的論述;現在是頂級實驗室內部一個有負責人的具名團隊。問題不再是實驗室「會不會」嘗試閉合這個迴圈 —— 而是誰先做出可量測的預訓練效率提升。
來源
- OpenAI co-founder Andrej Karpathy joins Anthropic's pre-training team — TechCrunch ↗
- Anthropic hires OpenAI co-founder Andrej Karpathy, former Tesla AI lead — CNBC ↗
- OpenAI co-founder Andrej Karpathy joins Anthropic — Axios ↗