Skip to content
AI-Daily-Builder

2026-06-18 views

實體 AI 運算基礎設施 — Tesla Dojo、Google TPU、NVIDIA H100 在自駕訓練軍備競賽中的角力

Tesla 押注 Dojo 自研晶片目標達成每 FLOP 1 美元,Waymo 繼承 Google TPU 規模優勢,兩者在訓練迭代速度上皆遠超依賴 NVIDIA 的競爭對手。

實體 AI 基準測評系列第 130 篇 — 實體 AI 運算基礎設施:Tesla Dojo vs Google TPU vs NVIDIA H100/H200,FSD、Waymo 神經網路與 Optimus 策略學習背後的 AI 訓練軍備競賽

驅動 FSD、Waymo 感知系統與 Optimus 策略學習的 AI 模型,均在大規模運算叢集上完成訓練。運算基礎設施決定了各公司的迭代速度——訓練新模型、執行消融實驗、將改進部署至車隊的速度。Tesla 押注自研晶片(Dojo D1 晶片加 ExaPOD 叢集)。Waymo 繼承 Google 世界級的 TPU 基礎設施。其餘所有自駕車與機器人公司則租用 NVIDIA H100/H200 叢集。本文將運算基礎設施作為實體 AI 基準測評的核心維度加以呈現。

標記「(估計)」的數據來自公開市場資訊、公司揭露及分析師估算,而非經核實的原始數據。


第一節 — Tesla Dojo:自研晶片的豪賭

Tesla 的 Dojo 計畫是自駕車業界最雄心勃勃的自研晶片賭注。Tesla 不向雲端供應商租用 NVIDIA 算力,而是自行設計訓練晶片(Dojo D1),並將其組裝成專用於 FSD 訓練、自動標註及 Optimus 策略學習的 ExaPOD 叢集。

指標Dojo D1 晶片Dojo ExaPOD(訓練叢集)現狀(2026 年中)
架構台積電 7nm 自研設計;362 TFLOPS BF16;10 TB/s 晶片內頻寬(Tesla 已揭露)每個訓練模組 120 顆 Dojo D1;每個 ExaPOD 機櫃 3,000 顆晶片自研設計——無 GPU 廠商依賴
目標算力每 ExaPOD 叢集 1 ExaFLOP(Tesla 揭露之目標)多個 ExaPOD = 多個 ExaFLOP依 Tesla AI Day 揭露,約達 1 ExaFLOP(估計)
訓練用途FSD 神經網路(影像到駕駛策略);Occupancy Network;Auto-Labeling 管線完整 FSD 訓練流程:從 600 萬輛以上車隊的原始影像生成更新的 FSD 模型FSD v12/v13/v14 在 Dojo 上訓練(估計)
Optimus 應用Optimus 策略學習(操作、導航)共享 Dojo 基礎設施(估計)人形機器人策略比駕駛需要更多樣的數據——每次改進所需算力更高(估計)Optimus 早期訓練在 Dojo 上進行(估計);規模持續擴大
相較 NVIDIA 的成本Musk 引用每訓練 FLOP 1 美元目標,vs 租用 NVIDIA H100 叢集約 3-4 美元(估計)若達成:每次訓練運行相較雲端 GPU 具約 3-4 倍成本優勢優勢取決於 Dojo 使用率與良率
風險自研晶片良率風險;台積電 7nm 現已成熟,但 Dojo 架構為專有技術;若晶片設計有缺陷,修復速度慢單一供應商依賴自身晶片團隊核心風險:NVIDIA H100 叢集現已可大規模取得;Dojo 建設有所延誤
策略價值若 Dojo 實現成本目標:Tesla 訓練 FSD 比任何租用算力的競爭對手都更快、更便宜訓練速度 = 模型迭代速度 = 脫離輔助率改善速度Dojo 賭注將資本支出轉化為持久的成本護城河

Dojo 論點建立在一個直觀的成本方程式上:若 Tesla 能以每 FLOP 1 美元完成模型訓練,而不是在租用的 H100 叢集上花費 3-4 美元,則每次 FSD 迭代的成本比競爭對手低三到四倍。在每年數百次訓練運行的情況下,這一成本優勢會複利累積成迭代速度優勢——每美元能執行更多實驗,意味著更快收斂至更優質的模型。


第二節 — Waymo 與 Google TPU:以母公司身份繼承的基礎設施優勢

Waymo 的算力優勢是結構性的而非靠努力爭取的:作為 Alphabet 子公司,Waymo 繼承了 Google TPU 基礎設施的存取權——驅動 Google 搜尋、YouTube 推薦及 Gemini 訓練的同款自研晶片。沒有任何自駕車新創公司能在不投入同等資本的情況下與之匹敵。

指標Google TPU v4/v5Waymo 的存取權策略意涵
架構Google 自研 TPU(張量處理器);v4 = 275 TFLOPS;v5p = 約 460 TFLOPS(估計)Waymo 是 Alphabet 子公司——可完全存取 Google TPU 叢集及 Google Cloud 基礎設施Waymo 無需在算力上自行投入資本;Alphabet 承擔基礎設施成本
叢集規模Google 運營全球最大規模的 TPU 叢集之一(確切容量未揭露)Waymo 可按需存取 Google 規模的算力Waymo 的算力上限即為 Google 的整體基礎設施
模擬基礎設施Google 的 NeRF 場景重建(大規模模擬)在 TPU + GPU 叢集上執行Waymo 的模擬管線將真實里程倍增為合成訓練數據1 英里真實數據 → 1,000 多個模擬變體 → TPU 對全部變體進行訓練
對 Waymo 的成本Alphabet 內部成本分攤(未揭露);Waymo 按內部轉讓價格付費實質上是 Alphabet 的補貼競爭護城河:沒有自駕車新創公司能在不投入同等資本的情況下複製 Google 的算力
風險依賴 Alphabet:若 Waymo 被分拆或出售,TPU 存取權可能改變Alphabet 已展現持續投資 Waymo 的意願在 Waymo 仍為子公司時風險低;若獨立 IPO 則風險中等
訓練重點Waymo 的 MultiPath++(軌跡預測)、OccupancyFlow(環境模型)、感知堆疊Waymo 所有主要神經網路均在 Google TPU 基礎設施上訓練可能涉及 Google Brain / DeepMind 合作(估計)

模擬倍增器是 Waymo 最被低估的算力放大器。一英里真實世界的駕駛數據可被轉換為數千個模擬變體——不同光線條件、不同行人行為、不同交通模式、感測器雜訊變化。每個模擬變體都是一個新的訓練樣本。當這些樣本由 Google 規模的 TPU 基礎設施生成並處理時,Waymo 的有效訓練數據量遠超其車隊的實際里程數。


第三節 — NVIDIA:所有其他自駕車公司依賴的既有供應商

對於任何既非 Tesla 也非 Waymo 的自駕車或機器人公司而言,NVIDIA 是唯一可行的大規模算力路徑。這造成了一種結構性依賴,將訓練迭代速度限制在公司所能負擔或談判取得的 H100/H200 容量範圍內。

指標NVIDIA H100NVIDIA H200NVIDIA DRIVE Orin(車載)
架構Hopper;3.9 PetaFLOPS BF16(已揭露)Hopper + HBM3e;約 3.9 PF BF16 + 更高記憶體頻寬每晶片 254 TOPS;汽車安全等級
雲端可用性AWS、Azure、GCP、CoreWeave、Lambda Labs——任何自駕車公司均可取得H200 可透過與 H100 相同的雲端供應商取得銷售給 Tier 1 供應商和自駕車公司
成本雲端每小時約 2-4 美元(估計,因供應商與現貨定價而異)雲端每小時約 3-5 美元(估計)每晶片約 750 美元以上(估計);用於 Zoox、Aurora 等自駕車
使用 H100/H200 訓練的自駕車公司Aurora、Zoox、Mobileye、Wayve 及大多數非 Waymo/Tesla 自駕車公司均租用 H100/H200 時間
NVIDIA DRIVE 平台獨立產品:DRIVE Orin(254 TOPS)+ DRIVE Thor(2,000 TOPS,已宣布);車內自駕感知/規劃 AI
策略角色若無 Dojo 或 Google TPU,自駕車訓練的預設基礎設施H200 = 當前前沿;H100 = 可取得且廣泛使用NVIDIA 車載算力主導非 Tesla/非 Waymo 自駕車市場
自駕車公司的風險集中風險:NVIDIA 定價能力;2023 年 H100 供應限制導致訓練延誤除 Tesla(HW4)和 Waymo(自研 TPU)外,所有競爭對手的車載算力均依賴 NVIDIA

NVIDIA 依賴形成了一種隨時間複利加劇的策略不對稱性。Aurora、Zoox、Mobileye 和 Wayve 均在租用的 H100 叢集上執行訓練工作負載。當 NVIDIA 推出 H200 或下一代 Blackwell 晶片時,這些公司都會同等受益——沒有人能從硬體存取中獲得優勢。訓練算力的底線對所有人同步提升,但上限保持不變:即雲端市場按市價願意出售給你的容量。


第四節 — 算力作為擴張倍增器:訓練迭代速度

算力基礎設施差異的實際後果是訓練迭代速度——每月每家公司能執行多少個模型改進週期。迭代次數越多,意味著脫離輔助率改善越快、長尾邊緣案例覆蓋越快、對新駕駛環境的適應越快。

公司訓練叢集估計每月訓練次數模型迭代速度擴張意涵
TeslaDojo ExaPOD(1+ ExaFLOP 估計)高——專用叢集服務 FSD + Optimus若 Dojo 達到規格:迭代速度最快(估計)脫離輔助率改善速度與訓練迭代速度成正比
WaymoGoogle TPU(Alphabet 規模)非常高——Google 基礎設施;不與商業客戶競爭資源非常快;Google 的算力規模無可匹敵Waymo 的模擬到訓練管線倍增有效算力
Aurora租用 NVIDIA H100/H200中等——受預算限制;優先安全驗證中等——依賴資本募資限制制約訓練迭代
ZooxAmazon 雲端(EC2 + 租用 H100)——Amazon 擁有 Zoox高——Amazon 基礎設施快——Amazon 雲端存取類似 Waymo 的 Google 優勢被低估的優勢:Zoox 的 Amazon 所有權 = 按需雲端算力
MobileyeIntel 算力 + 租用 H100中等中等EyeQ 晶片團隊具備矽基專業知識;訓練算力聚焦度較低
Figure AI租用 H100;NVIDIA 合作夥伴關係中等中等OpenAI 語言模型整合 = 語言組件的獨特算力存取

Zoox 在此表中值得特別關注,因其是繼 Tesla 和 Waymo 之後,最被低估的算力優勢自駕車公司。Amazon 對 Zoox 的所有權賦予其按內部轉讓價格存取 AWS 基礎設施的能力——一種本質上與 Waymo 的 TPU 存取平行的結構性優勢。這一優勢尚未轉化為可見的商業牽引力,但這意味著 Zoox 的訓練迭代上限並不受限於與 Aurora 相同的預算約束。


第五節 — 算力基礎設施基準測評計分卡

維度Tesla(Dojo)Waymo(Google TPU)依賴 NVIDIA 的公司優勢方
可用原始算力約 1+ ExaFLOP 估計(持續增長)Google 規模(未揭露;實際上無上限)受預算和 H100 可用性限制Waymo(Alphabet 支撐)
每 FLOP 成本(估計)目標每 FLOP 1 美元(若 Dojo 達成)近乎零(內部轉讓)雲端每 FLOP 2-4 美元(估計)Waymo 或 Tesla(取決於 Dojo 良率)
自研晶片優勢是——Dojo D1;D2 開發中是——Google TPU v4/v5否——依賴 NVIDIATesla + Waymo 均具備自研晶片護城河
迭代速度高(專用叢集)非常高(Google 規模 + 模擬倍增器)中等(受預算限制)Waymo 略勝(模擬倍增器複利效應)
車載算力HW4 = 288 TOPS(4 顆台積電 7nm 自研晶片);無 NVIDIA 依賴Waymo 車載自研 TPUNVIDIA DRIVE Orin(約 750 美元以上估計)Tesla(垂直整合;無第三方成本或交期)
Dojo vs TPU 評判Dojo 是一項數十億美元的賭注,押注自研晶片能打造持久成本護城河Google TPU 已被大規模驗證;Waymo 繼承其成果兩者在規模上均優於租用 H100;Waymo 今日的存取規模更大

算力基礎設施計分卡揭示了一個兩層架構的實體 AI 產業。第一層由 Tesla 和 Waymo 組成——兩者均擁有用於訓練和推論的自研晶片,均擁有可獨立於雲端市場定價擴展的專用叢集,且車載算力均不依賴 NVIDIA。第二層由所有其他自駕車和機器人公司組成——在訓練和車載推論上均結構性依賴 NVIDIA,訓練迭代速度受雲端預算限制而非基礎設施上限。

長期影響是一個隨時間複利加劇的訓練迭代差距。若 Tesla 每月能執行 Dojo 讓其成本為 Aurora 三分之一的 FSD 訓練實驗,而 Waymo 因 Google 基礎設施無容量上限而能執行五倍的實驗,則第一層與第二層之間的神經網路品質差距將逐月擴大——與研究團隊的素質無關。算力基礎設施不是實體 AI 領導地位的充分條件,但它日益成為必要條件。

注意: 所有標記「(估計)」的數據均來自 2026 年中的公開市場資訊、公司揭露、分析師估算及產業報告。本文不構成投資建議。


來源

標籤

請喝咖啡