2026-06-18 — views

Physical AI 半導體供應鏈 — Nvidia Orin vs Thor vs Tesla FSD 晶片

Nvidia Orin vs Thor vs Tesla FSD 晶片：AV 推論運算供應鏈（台積電、三星、先進封裝）如何制約 Physical AI 的擴產節奏。

Physical AI 基準指數系列第 102 篇 — Physical AI 半導體供應鏈：Nvidia Orin vs Thor vs Tesla FSD 晶片，以及車內運算堆疊為何是擴產的戰略制約

每一輛自動駕駛車輛，本質上都是一個行駛中的推論叢集。當前向攝影機的影像幀抵達時，神經網路必須在 50 毫秒內完成物件分類、深度估計、軌跡預測，並輸出控制指令——在熱功耗預算緊繃、完全不允許現場故障的車輛環境中。執行這些神經網路的晶片並非商品，而是一個戰略設計、地緣政治高度集中、需要多年研發的產物，決定了哪些 AI 架構在特定車輛平台上可以被實際部署。然而，半導體供應鏈分析幾乎完全缺席於面向消費者的自動駕駛報導中。本文將其作為 Physical AI 系列的一個基準維度進行系統性梳理。

分析涵蓋三個層次：運算全景（晶片必須做什麼、誰在做什麼）、晶片層級比較（Nvidia Drive Orin vs Drive Thor vs Tesla 自研 FSD 晶片），以及使台積電新竹廠成為每個 Physical AI 擴產預測中系統性變數的地緣政治供應鏈風險。

第一節 — AV 推論運算全景

並非所有車載運算都服務相同功能。商業自動駕駛車輛至少需要四個截然不同的運算層，各自有不同的性能、安全認證與供應鏈要求。

運算層	功能	主要廠商
感測器預處理	原始數據清理、時間同步、攝影機/雷達/光達基礎濾波	Mobileye EyeQ、德州儀器 TDA、自研
感知推論	在感測器數據上執行目標偵測、分割、深度估計神經網路	Nvidia Orin/Thor、Tesla FSD 晶片、Qualcomm Snapdragon Ride
規劃與控制	將感知輸出轉化為軌跡預測與車輛控制指令	在端到端系統中通常與感知共用同一晶片
冗餘 / 安全監控	獨立安全處理器，監控主運算並可觸發緊急停車	Infineon、Renesas、STMicro（符合汽車安全認證）
雲端訓練	訓練部署在車上的神經網路——在數據中心完成，非車載	Nvidia H100/A100（Tesla：Dojo D1 估計）、AMD Instinct、Google TPU

感知推論層是架構競爭最為激烈的地方。這顆晶片必須以汽車級可靠性、在電力與散熱限制下實時執行車輛主神經網路堆疊。伺服器級 H100 GPU 功耗高達 700W；車載推論晶片必須在 45–150W 的功耗下提供可媲美的 TOPS（兆次運算每秒）。這一限制使 AV 推論矽晶片成為一門獨立學科——不是縮水版伺服器晶片，而是為神經網路基本運算定制專用硬體加速器的汽車級運算。

向端到端 AI 駕駛架構（單一神經網路將感測器輸入直接映射到控制輸出，繞過顯式規則規劃）的轉變，已大幅提高了每輛車的 TOPS 需求。第一代 ADAS 系統使用傳統電腦視覺可能只需要 5–10 TOPS；執行大型 Transformer 模型的端到端系統每輛車可能需要 200–2,000 TOPS。這一需求差距正是 Orin（254 TOPS）和 Thor（2,000 TOPS 估計）之間的代差不是漸進式改進，而是針對駕駛堆疊架構轉型的原因。

第二節 — Nvidia Drive Orin：當前標準

截至 2026 年中，Nvidia Drive Orin 是主導 AV 推論晶片市場的產品。其高 TOPS、靈活可程式化能力與廣泛 OEM 採用，使其成為高端自動駕駛系統的事實標準平台。

Orin 維度	詳情
架構	12 個 Arm Cortex-A78AE 核心 + 2048 核 Ampere GPU + 專用 DLA（深度學習加速器）單元
性能	每顆晶片最高 254 TOPS
功耗	45–60W TDP，視配置而定
製程節點	三星 8nm（部分型號估計採用台積電 7nm）
AV 部署	賓士 EQS/S-Class DRIVE 系統；Volvo EX90；Lucid Air；小鵬；理想；Waymo（估計）——主導高端 AV 車輛
售價（估計）	汽車量產規模下每顆約 $100–300（估計）
多晶片擴展	雙 Orin = 508 TOPS；高端 AV 平台採用雙 Orin 或更多
競爭對手	Mobileye EyeQ Ultra（目標 2024–2026）、Qualcomm Snapdragon Ride Elite、Tesla FSD 晶片（專有）

Orin 相對前代的架構優勢在於在 GPU 核心旁整合了專用 DLA 硬體。DLA 是針對卷積神經網路所使用的特定矩陣乘法模式優化的固定功能單元，在推論工作負載下的每瓦 TOPS 遠優於通用 GPU 運算——這正是功耗受限的車載使用場景。代價是靈活性：DLA 無法執行任意程式碼，只能執行其設計對應的特定運算。

第三節 — Nvidia Drive Thor：下一代

Nvidia Drive Thor 是 Orin 的繼任者，目標量產車型為 2025–2026 年。其最具顛覆性的架構特徵是整合：Thor 用一顆晶片取代了多顆晶片。

Thor 維度	詳情
架構	單晶片整合 AV 運算 + 車載資訊娛樂（IVI）+ ADAS——統一了過去需要多晶片完成的功能
性能	2,000 TOPS（約為 Orin 254 TOPS 的 8 倍）
製程節點	台積電 4N（4nm 級）
功耗（估計）	約 150W TDP（估計）——高於 Orin；車輛熱管理成為設計制約
關鍵設計勝利	比亞迪（全球最大電動車製造商）宣布在下一代車型中採用 Drive Thor
架構優勢	Blackwell GPU 架構；Transformer Engine 加速注意力機制神經網路；加速端到端駕駛模型
重要意義	運算世代決定了哪些 AI 架構在車上實際可部署

Thor 整合策略——將 AV 推論、資訊娛樂與 ADAS 合入一顆晶片——是一個系統層級的架構賭注，不僅僅是性能升級。台積電 4N 製程節點（4nm 級）是 Nvidia Drive 晶片首次在台積電而非三星製造，這使 Orin 的三星集中供應鏈風險，轉換為 Thor 的台灣台積電集中風險——這是第五節討論的重要地緣政治變數。

比亞迪設計勝利是 Thor 最重要的商業信號。比亞迪年產量約 350 萬輛（估計，截至 2026 年中），若相當比例採用 Thor，將成為歷史上最大規模的 AV 推論晶片部署，Nvidia 汽車營收的影響將十分顯著。

第四節 — Tesla FSD 晶片：自研替代方案

自 Hardware 3（2019 年）起，Tesla 便為 FSD 堆疊自研推論晶片。選擇自研而非購買 Nvidia 硬體，是汽車產業中最具影響力的垂直整合決策之一。

Tesla FSD 晶片維度	詳情
設計	完全客製——由 Tesla 矽晶片團隊設計（由前蘋果員工 Pete Bannon 領導）；無 Arm CPU 核心；針對 Tesla 攝影機管線神經網路推論優化
製造	台積電 7nm（HW3/FSD 晶片 1）；台積電 7nm+（HW4/FSD 晶片 2 估計）
性能	HW3：每顆 144 TOPS（每輛車 2 顆 = 288 TOPS）；HW4：300–500+ TOPS（估計）
成本優勢（估計）	自研設計並從台積電大量採購晶圓，估計比採購具相當性能的 Nvidia 晶片便宜 40–60%（估計）
供應鏈獨立性	Tesla 不受 Nvidia 晶片分配限制或定價約束；掌控 FSD 運算自身供應鏈
客製化	Tesla 可針對自身特定神經網路架構精確優化晶片；Nvidia Orin/Thor 需服務需求各異的眾多客戶
風險	若 Tesla 神經網路架構需要 FSD 晶片無法提供的運算能力，必須等待下一代晶片（12–18 個月矽晶片開發週期）
Dojo 晶片（D1）	獨立於 FSD 晶片；僅用於訓練（Dojo 數據中心）；不部署在車輛上

自研矽晶片決策是 Tesla 在 AV 運算堆疊中最重要的結構性優勢。通過設計針對 Tesla 神經網路架構優化的晶片，Tesla 能從每瓦電力中提取遠多於為服務多元 OEM 需求設計的通用晶片的有效 TOPS。成本優勢在大規模量產下呈複合效應——在 Tesla 的規模下，每輛車節省 40–60% 是合理的估計（est.），儘管確切數據未公開披露。

風險面同樣真實：晶片開發週期從架構決策到流片再到量產約需 18–36 個月。若 Tesla 神經網路團隊轉向當前 FSD 晶片無法高效執行的架構，Tesla 不能簡單地購買不同晶片——必須等待下一個矽晶片世代。這是垂直整合的根本張力：以架構靈活性換取最大客製化。

第五節 — 地緣政治供應鏈風險

Physical AI 運算供應鏈存在嚴峻的地緣政治集中風險，在汽車或 AV 行業分析中鮮有討論。制約因素是地理性和政治性的，而非工程性的。

風險維度	詳情
台積電集中度	Tesla FSD 晶片與 Nvidia Thor 均在台積電（台灣）製造；全球約 90% 的先進節點（7nm 以下）晶片在台積電生產；台灣地緣政治風險是供應鏈的根本性變數
Orin 的三星 8nm	Nvidia Orin 使用三星 8nm；三星代工平澤廠（南韓）——地緣政治暴露度低於台積電台灣廠，但仍高度集中
美國出口管制	Nvidia Drive Orin/Thor 對中國汽車 AI 應用有出口限制；中國 AV 公司必須使用國產替代品
地平線機器人 Journey 6	中國國產 AV 晶片；128–256 TOPS（估計）；在較低性能層次上與舊版 Orin 競爭；在中國車輛中部署規模擴大
HBM（高頻寬記憶體）	高端 AI 晶片需要來自 SK 海力士或三星的 HBM；SK 海力士是主要供應商；南韓集中度增加供應鏈風險
先進封裝（CoWoS、InFO）	AI 晶片的 2.5D 封裝幾乎完全依賴台積電的 CoWoS 製程；封裝產能曾是 Nvidia H100/H200 供應的瓶頸

出口管制變數使全球 AV 半導體市場一分為二：中國以外 Nvidia 主導，中國境內國產晶片主導，Tesla 憑藉自研 FSD 晶片（不受 Nvidia 出口限制）在兩個市場佔據獨有賽道。先進封裝已成為獨立於晶圓生產的瓶頸——Nvidia H100/H200 供應短缺主要不是晶圓產能問題，而是 CoWoS 封裝產能問題，封裝產能擴充週期為 18–24 個月。

第六節 — 運算作為擴產基準指標

運算基準	Tesla	Waymo（估計）	中國 AV（估計）
車載推論晶片	專有 FSD 晶片（台積電）	Nvidia Orin（估計，雙晶片）	地平線 Journey 6 / 華為 MDC
每輛車 TOPS（估計）	288+ TOPS（HW3）；500+ TOPS（HW4 估計）	508+ TOPS（雙 Orin 估計）	128–256 TOPS（估計）
供應鏈獨立性	高（專有晶片；台積電供應協議）	低至中（依賴 Nvidia 配額）	中（國產晶片；無美國出口管制暴露）
每輛車晶片成本（估計）	較低（自研設計經濟性）	較高（Nvidia 量產定價）	較低（國內定價）
下一代晶片時間線	HW5（估計 2026–2027）；可能採用台積電 3nm	Thor 導入（估計 2025–2026）	Journey 7 / 昇騰汽車版（估計）

三個結構性觀察：其一，Tesla 自研矽晶片在非中國市場賦予其最強的供應鏈獨立性；其二，Waymo 對 Nvidia 的依賴是真實的運營制約；其三，中國 AV 生態系統的每輛車 TOPS 差距（128–256 TOPS vs 領先西方部署的 288–508 TOPS）是部署最高運算密度端到端 AI 駕駛架構的真實限制。運算世代節奏——大約每 3–4 年一個新晶片世代，TOPS 提升 4–8 倍——決定了 AV 堆疊架構進步的節拍。Physical AI 擴產時間線不能脫離晶片時間線獨立分析。

注意： 本文所有性能數據、成本估算、供應鏈評估及市場結構觀察均基於截至 2026 年中的公開公司公告、技術文件、新聞報導及分析師研究。標有「（估計）」的數據為方向性估算，不應視為已確認的規格數據。本文不構成投資建議。