2026-05-18 — views
Recursive Superintelligence 帶 $6.5 億美元出場,挑戰「自我改進的 AI」
為什麼值得讀 NVIDIA 與 AMD 同時出現在 cap table 才是暗號:押注的是「對哪家晶片廠都不忠誠的算力工作量」(對架構空間做遞迴搜尋)—— 而不是某家的模型家族。
$6.5 億美元、估值 $46.5 億美元,產品未出。GV 與 Greycroft 領投;NVIDIA 與 AMD 同場跟投。論點:AI 自動進行架構搜尋。
新前沿模型實驗室 Recursive Superintelligence 於 5/13 結束隱身,以 $46.5 億美元估值募得 $6.5 億美元 —— 產品未出、營收為零、員工不到 30 人。這是目前對「AI 從『協助研究』躍進到『自己做研究』」這條路最具體的下注。
真正的故事是這張 cap table
| 領投 | 戰略跟投 |
|---|---|
| GV(Alphabet 旗下) | NVIDIA |
| Greycroft | AMD |
兩家領先晶片廠出現在同一輪 Series A 並不尋常。以前的模式都是「獨占綁定」 —— Microsoft + OpenAI、Google + Anthropic、Amazon + Anthropic —— 因為雲端綁定了算力承諾與股權於同一條線。這次 NVIDIA 與 AMD 兩邊都在買選擇權:押注一個「誰家晶片先有 FLOPs,就跑誰」的工作量。
創辦團隊
| 創辦人 | 過往職位 |
|---|---|
| Richard Socher | 前 Salesforce 首席科學家 |
| 田淵棟 Yuandong Tian | 前 Meta FAIR 主任 |
| Tim Rocktäschel | 前 DeepMind |
| Jeff Clune | DeepMind、OpenAI |
| Josh Tobin | 前 OpenAI |
| Tim Shi | 早期 Cresta、OpenAI |
陣容偏向「開放式搜尋與 meta-learning」(Clune、Rocktäschel),而不是目前主流的「對 base model 做 post-train」路線。
「遞迴自我改進」實務上是什麼意思
從公開發言提煉的技術賭注:
- 架構搜尋。 現在要選一個新的 transformer 變體,需要一小群研究員跑數個月的 ablation。實驗室的主張:Level-1 系統會自己提出架構改動、跑實驗、讀自己的 loss 曲線決定要留什麼。
- 訓練配方最佳化。 Learning-rate 排程、資料配比、curriculum —— 訓練本身的「後設語言」變成最佳化目標,而不只是權重。
- 評估自動生成。 模型自己生成 benchmark 變體,偵測 over-fit 與人類策展 benchmark 看不出的能力缺口。
如果其中任何一項在規模上奏效,「下一代模型的時間表」會從季度級壓縮到週級。
Roadmap
- 現在 → 2026 中: 打造 Level-1 自動訓練系統。內部使用。
- 2026 中公開發布: 目標推出客戶可見的交付物。是否為模型 API、架構搜尋服務、或 research-as-a-service 仍未明說。
- 沒揭露營收承諾。 約 30 人 + 前沿規模算力,每季度燒掉 $5–15M 是合理估計。
為什麼是現在
時機不是巧合,三個原因:
- 前沿實驗室毛利率突破 70%(Anthropic 近期揭露)。這個 cycle 第一次有真正的 headroom 拿去做投機性的架構研究。
- 「Compute overhang」論點正在崩。 如果光靠加算力模型就會繼續一般化,你不需要遞迴自改。如果遇到報酬遞減,遞迴搜尋就成了關鍵 lever —— 而那種「AI-2027」式的時間表就會從敘事變得可量化。
- 投資人定位。 30 人、零營收、$46.5 億美元 —— 這個區間和 Sutskever 的 SSI 同一檔。下注的是「市場容得下 3–5 個這類實驗室」,不是只能有一個。
Practitioner note
對今天就在出貨的開發者,實務建議:
- 不要為了「AI 自己造模型」提前重構你的技術棧。 那個時間表至少還有多年,輸家局是把應用層為一個還沒出貨的架構重寫。以本季存在的 Claude / GPT / Gemini 家族為基礎來開發。
- 追蹤架構搜尋的論文。 創辦人過往實驗室(FAIR 的 open-ended search、DeepMind 的 meta-learning 線)的論文是領先指標。若某個公開的架構搜尋 benchmark 突然跳 15+ 分,那就是 RSI 類方法跨過某個門檻的訊號。
- 盯緊 GPU vs TPU vs MI400 的敘事。 一個天生對矽片無關的工作量(RSI 本質就是),會侵蝕任何單一加速器廠商的護城河。如果 Recursive 的產品推出並證明工作量可移植,「NVIDIA 溢價」會被壓縮。
被低估的角度:團隊組成本身就是「業界對 RSI 可行性的領先指標」。當 Clune-田淵棟-Rocktäschel 等級的研究員離開 FAIR / DeepMind / OpenAI 把職涯壓在這上面,業界對「這是真的嗎」的中位估計,已經悄悄移動。
來源
- What happens when AI starts building itself? — TechCrunch ↗
- Recursive Superintelligence raises $650M to build self-improving AI models — SiliconANGLE ↗
- Recursive Superintelligence self-improving AI funding — TNW ↗
- AI startup Recursive emerges from stealth with $650M — The Decoder ↗
- Recursive Superintelligence raises $650M to pursue self-improving AI — Unite.AI ↗