2026-06-18 — views
Physical AI 半导体供应链 — Nvidia Orin vs Thor vs Tesla FSD 芯片
Nvidia Orin vs Thor vs Tesla FSD 芯片:AV 推理算力供应链(台积电、三星、先进封装)如何制约 Physical AI 的扩产节奏。
Physical AI 基准指数系列第 102 篇 — Physical AI 半导体供应链:Nvidia Orin vs Thor vs Tesla FSD 芯片,以及车内算力堆栈为何是扩产的战略制约
每一辆自动驾驶车辆,本质上都是一个行驶中的推理集群。当前向摄像头的图像帧到达时,神经网络必须在 50 毫秒内完成目标分类、深度估计、轨迹预测,并输出控制指令——在热功耗预算紧张、完全不允许现场故障的车辆环境中。运行这些神经网络的芯片并非商品,而是一个战略设计、地缘政治高度集中、需要多年研发的产物,决定了哪些 AI 架构在特定车辆平台上可以被实际部署。然而,半导体供应链分析几乎完全缺席于面向消费者的自动驾驶报道中。本文将其作为 Physical AI 系列的一个基准维度进行系统性梳理。
第一节 — AV 推理算力全景
并非所有车载算力都服务于相同功能。商业自动驾驶车辆至少需要四个截然不同的算力层,各自有不同的性能、安全认证与供应链要求。
| 算力层 | 功能 | 主要厂商 |
|---|---|---|
| 传感器预处理 | 原始数据清理、时间同步、摄像头/激光雷达/毫米波雷达基础滤波 | Mobileye EyeQ、德州仪器 TDA、自研 |
| 感知推理 | 在传感器数据上运行目标检测、分割、深度估计神经网络 | Nvidia Orin/Thor、Tesla FSD 芯片、Qualcomm Snapdragon Ride |
| 规划与控制 | 将感知输出转化为轨迹预测与车辆控制指令 | 在端到端系统中通常与感知共用同一芯片 |
| 冗余 / 安全监控 | 独立安全处理器,监控主算力并可触发紧急停车 | Infineon、Renesas、STMicro(符合汽车安全认证) |
| 云端训练 | 训练部署在车上的神经网络——在数据中心完成,非车载 | Nvidia H100/A100(Tesla:Dojo D1 估计)、AMD Instinct、Google TPU |
向端到端 AI 驾驶架构的转变已大幅提高了每辆车的 TOPS 需求。第一代 ADAS 系统使用传统计算机视觉可能只需要 5–10 TOPS;运行大型 Transformer 模型的端到端系统每辆车可能需要 200–2,000 TOPS。这一需求差距正是 Orin(254 TOPS)和 Thor(2,000 TOPS 估计)之间的代差不是渐进式改进,而是针对驾驶堆栈架构转型的原因。
第二节 — Nvidia Drive Orin:当前标准
截至 2026 年中,Nvidia Drive Orin 是主导 AV 推理芯片市场的产品。其高 TOPS、灵活可编程能力与广泛 OEM 采用,使其成为高端自动驾驶系统的事实标准平台。
| Orin 维度 | 详情 |
|---|---|
| 架构 | 12 个 Arm Cortex-A78AE 核心 + 2048 核 Ampere GPU + 专用 DLA(深度学习加速器)单元 |
| 性能 | 每颗芯片最高 254 TOPS |
| 功耗 | 45–60W TDP,视配置而定 |
| 制程节点 | 三星 8nm(部分型号估计采用台积电 7nm) |
| AV 部署 | 奔驰 EQS/S-Class DRIVE 系统;Volvo EX90;Lucid Air;小鹏;理想;Waymo(估计)——主导高端 AV 车辆 |
| 售价(估计) | 汽车量产规模下每颗约 $100–300(估计) |
| 多芯片扩展 | 双 Orin = 508 TOPS;高端 AV 平台采用双 Orin 或更多 |
| 竞争对手 | Mobileye EyeQ Ultra(目标 2024–2026)、Qualcomm Snapdragon Ride Elite、Tesla FSD 芯片(专有) |
Orin 相对前代的架构优势在于在 GPU 核心旁集成了专用 DLA 硬件。DLA 是针对卷积神经网络所使用的特定矩阵乘法模式优化的固定功能单元,在推理工作负载下的每瓦 TOPS 远优于通用 GPU 计算——这正是功耗受限的车载使用场景。Orin 还具备显著的软件生态优势:Nvidia DRIVE 软件栈、CUDA 工具链和 Isaac 机器人平台为 OEM 工程团队提供了熟悉的编程接口,形成了强大的软件护城河。
第三节 — Nvidia Drive Thor:下一代
Nvidia Drive Thor 是 Orin 的继任者,目标量产车型为 2025–2026 年。其最具颠覆性的架构特征是整合:Thor 用一颗芯片取代了多颗芯片。
| Thor 维度 | 详情 |
|---|---|
| 架构 | 单芯片整合 AV 算力 + 车载信息娱乐(IVI)+ ADAS——统一了过去需要多芯片完成的功能 |
| 性能 | 2,000 TOPS(约为 Orin 254 TOPS 的 8 倍) |
| 制程节点 | 台积电 4N(4nm 级) |
| 功耗(估计) | 约 150W TDP(估计)——高于 Orin;车辆热管理成为设计制约 |
| 关键设计胜利 | 比亚迪(全球最大电动车制造商)宣布在下一代车型中采用 Drive Thor |
| 架构优势 | Blackwell GPU 架构;Transformer Engine 加速注意力机制神经网络;加速端到端驾驶模型 |
| 重要意义 | 算力世代决定了哪些 AI 架构在车上实际可部署 |
Thor 整合策略是一个系统层级的架构赌注。台积电 4N 制程节点(4nm 级)是 Nvidia Drive 芯片首次在台积电而非三星制造,这将 Orin 的三星集中供应链风险转换为 Thor 的台湾台积电集中风险。比亚迪年产量约 350 万辆(估计,截至 2026 年中),若相当比例采用 Thor,将成为历史上规模最大的 AV 推理芯片部署,对 Nvidia 汽车营收的影响将十分显著。
第四节 — Tesla FSD 芯片:自研替代方案
自 Hardware 3(2019 年)起,Tesla 便为 FSD 堆栈自研推理芯片。选择自研而非购买 Nvidia 硬件,是汽车行业中最具影响力的垂直整合决策之一。
| Tesla FSD 芯片维度 | 详情 |
|---|---|
| 设计 | 完全定制——由 Tesla 硅芯片团队设计(由前苹果员工 Pete Bannon 领导);无 Arm CPU 核心;针对 Tesla 摄像头管线神经网络推理优化 |
| 制造 | 台积电 7nm(HW3/FSD 芯片 1);台积电 7nm+(HW4/FSD 芯片 2 估计) |
| 性能 | HW3:每颗 144 TOPS(每辆车 2 颗 = 288 TOPS);HW4:300–500+ TOPS(估计) |
| 成本优势(估计) | 自研设计并从台积电大量采购晶圆,估计比采购具相当性能的 Nvidia 芯片便宜 40–60%(估计) |
| 供应链独立性 | Tesla 不受 Nvidia 芯片分配限制或定价约束;掌控 FSD 算力自身供应链 |
| 定制化 | Tesla 可针对自身特定神经网络架构精确优化芯片;Nvidia Orin/Thor 需服务需求各异的众多客户 |
| 风险 | 若 Tesla 神经网络架构需要 FSD 芯片无法提供的算力,必须等待下一代芯片(12–18 个月硅芯片开发周期) |
| Dojo 芯片(D1) | 独立于 FSD 芯片;仅用于训练(Dojo 数据中心);不部署在车辆上 |
自研硅芯片决策是 Tesla 在 AV 算力堆栈中最重要的结构性优势。通过设计针对 Tesla 神经网络架构优化的芯片,Tesla 能从每瓦电力中提取远多于通用芯片的有效 TOPS。成本优势在大规模量产下呈复合效应,在 Tesla 的规模下每辆车节省 40–60% 是合理的估计(est.),尽管确切数据未公开披露。风险面同样真实:芯片开发周期约需 18–36 个月,架构灵活性是垂直整合必须付出的代价。
第五节 — 地缘政治供应链风险
| 风险维度 | 详情 |
|---|---|
| 台积电集中度 | Tesla FSD 芯片与 Nvidia Thor 均在台积电(台湾)制造;全球约 90% 的先进节点(7nm 以下)芯片在台积电生产;台湾地缘政治风险是供应链的根本性变量 |
| Orin 的三星 8nm | Nvidia Orin 使用三星 8nm;三星代工平泽厂(韩国)——地缘政治暴露度低于台积电台湾厂,但仍高度集中 |
| 美国出口管制 | Nvidia Drive Orin/Thor 对中国汽车 AI 应用有出口限制;中国 AV 公司必须使用国产替代品 |
| 地平线机器人 Journey 6 | 中国国产 AV 芯片;128–256 TOPS(估计);在较低性能层次上与旧版 Orin 竞争 |
| HBM(高带宽内存) | 高端 AI 芯片需要来自 SK 海力士或三星的 HBM;SK 海力士是主要供应商;韩国集中度增加供应链风险 |
| 先进封装(CoWoS、InFO) | AI 芯片的 2.5D 封装几乎完全依赖台积电的 CoWoS 制程;封装产能曾是 Nvidia H100/H200 供应的瓶颈 |
出口管制变量使全球 AV 半导体市场一分为二:中国以外 Nvidia 主导,中国境内国产芯片主导,Tesla 凭借自研 FSD 芯片在两个市场占据独有赛道。先进封装已成为独立于晶圆生产的瓶颈,封装产能扩充周期为 18–24 个月。
第六节 — 算力作为扩产基准指标
| 算力基准 | Tesla | Waymo(估计) | 中国 AV(估计) |
|---|---|---|---|
| 车载推理芯片 | 专有 FSD 芯片(台积电) | Nvidia Orin(估计,双芯片) | 地平线 Journey 6 / 华为 MDC |
| 每辆车 TOPS(估计) | 288+ TOPS(HW3);500+ TOPS(HW4 估计) | 508+ TOPS(双 Orin 估计) | 128–256 TOPS(估计) |
| 供应链独立性 | 高(专有芯片;台积电供应协议) | 低至中(依赖 Nvidia 配额) | 中(国产芯片;无美国出口管制暴露) |
| 每辆车芯片成本(估计) | 较低(自研设计经济性) | 较高(Nvidia 量产定价) | 较低(国内定价) |
| 下一代芯片时间线 | HW5(估计 2026–2027);可能采用台积电 3nm | Thor 导入(估计 2025–2026) | Journey 7 / 昇腾汽车版(估计) |
算力世代节奏——大约每 3–4 年一个新芯片世代,TOPS 提升 4–8 倍——决定了 AV 堆栈架构进步的节拍。Physical AI 扩产时间线不能脱离芯片时间线独立分析。Tesla 自研硅芯片赋予其最强的供应链独立性;Waymo 对 Nvidia 的依赖是真实的运营制约;中国 AV 生态系统的每辆车 TOPS 差距是部署最高算力密度端到端 AI 驾驶架构的真实限制。
注意: 本文所有性能数据、成本估算、供应链评估及市场结构观察均基于截至 2026 年中的公开公司公告、技术文件、新闻报道及分析师研究。标有”(估计)“的数据为方向性估算,不应视为已确认的规格数据。本文不构成投资建议。
来源
- Nvidia Drive Orin 产品页面 — Nvidia ↗
- Nvidia Drive Thor 发布 — Nvidia ↗
- Tesla FSD 芯片架构 — Tesla AI Day 2021 ↗
- 地平线机器人 Journey 6 — Horizon Robotics ↗
- 台积电先进节点产能 — TSMC ↗