2026-05-22 — views

Andrej Karpathy 加入 Anthropic —— 用 Claude 加速 Claude 的預訓練

為什麼值得讀重點是任務，不是這次招募。「用 Claude 加速 Claude 的預訓練」是把遞迴自我改進寫成職務說明 —— 與 Recursive Superintelligence 募資 $650M 追逐的同一個迴圈，如今被放進前沿實驗室內部編制。

OpenAI 共同創辦人、前 Tesla Autopilot AI 負責人 Andrej Karpathy 加入 Anthropic 預訓練團隊（5/19），向 Nick Joseph 報告。任務：用 Claude 加速預訓練研發本身。

Andrej Karpathy —— OpenAI 創始成員、前 Tesla Autopilot AI 總監、Eureka Labs 創辦人 —— 本週加入 Anthropic（5/19 宣布），進入 預訓練（pretraining） 團隊，向負責人 Nick Joseph 報告。

任務本身就是頭條

據 Anthropic：Karpathy 將 成立一個團隊，專注於用 Claude 加速預訓練研究。 預訓練是賦予 Claude 核心知識與能力的大規模訓練。

照字面讀：用 Claude 讓下一代 Claude 的預訓練更好、更快。 這就是 把遞迴自我改進寫成職務說明 —— AI 改進建造 AI 的流程。

這與 Recursive Superintelligence 募資 $650M 追逐的是同一個迴圈。差別在於：那是 30 人新創在賭；這是前沿實驗室用業界最知名的研究者之一，在既有的大規模預訓練營運中正式編制。

為什麼是 Anthropic、為什麼現在

人才磁吸訊號。 Karpathy 選擇 Anthropic（而非繼續獨立經營 Eureka Labs 或回 OpenAI），是頂尖人才戰的一記重拳 —— 也再次佐證 Claude Opus 4.7 之後，資深研究者想去的地方是 Anthropic。
他自己定調為「回歸研發」。 在 X 公告中他說「非常興奮加入這裡的團隊、回歸研發」，並提到日後會「重拾教育工作」。是研究回歸，不是管理職。
預訓練是護城河層。 後訓練（RLHF、agent）拿產品頭條，但預訓練決定原始能力。把招牌研究者放在這裡，等於宣告 Anthropic 相信下一次能力躍進來自預訓練效率，而不只是後訓練打磨。

為什麼重要

「AI 加速 AI 研究」現在是有編制的職能，不再只是論述。 當前沿實驗室指派具名團隊「用我們的模型改進我們模型的訓練」，遞迴改進的時間軸就從臆測變成季度 OKR。
這次招募驗證了 test-time compute / AutoTTS 方向 —— AI 優化自身管線（從推論編排到預訓練本身）的大主題。

實務筆記

2-3 季內留意 Anthropic 的預訓練效率論文。 若 Karpathy 的團隊出貨，訊號會是 Claude 訓練算力效率或每 FLOP 能力的階躍 —— 出現在模型卡，而非新聞稿。
人才流向是領先指標。 資深研究者聚集處，預示 18-24 個月後哪家領先。Karpathy → Anthropic 是與 4.7 後動能同一方向的又一個向量。
別對單一招募過度解讀。 再知名的單一研究者，也無法一夜改變模型路線圖。訊號是方向性的（Anthropic 的拉力 + 遞迴改進的框架），不是即時的能力宣稱。

被低估的角度：遞迴自我改進的故事，已悄悄從宣言走進組織圖。 一年前「AI 改進 AI」是 VC 資助的論述；現在是頂級實驗室內部一個有負責人的具名團隊。問題不再是實驗室「會不會」嘗試閉合這個迴圈 —— 而是誰先做出可量測的預訓練效率提升。