Skip to content
AI-Daily-Builder

2026-06-17 views

自动驾驶传感器堆栈指数 — Tesla 纯视觉 vs. Waymo 激光雷达:感知架构之争

比较自动驾驶传感器堆栈——Tesla 纯摄像头 vs. Waymo 激光雷达融合——涵盖成本、天气韧性与架构取舍。

传感器堆栈是自动驾驶架构的第一个分岔点

在自动驾驶系统能够规划路线或执行操控动作之前,它必须先感知周围的世界。驱动这个感知流程的传感器并非无关紧要的细节——它们决定了整个自动驾驶堆栈的成本、地理适用范围、天气韧性以及安全上限。

整个行业已分裂为两个阵营。Waymo、Mobileye、Cruise 和 Zoox 都构建了将激光雷达、毫米波雷达和摄像头整合成冗余传感器融合架构的系统。Tesla 则走向相反的哲学:仅用摄像头、零激光雷达、零超声波传感器(2022年已移除),以业界最大的视频训练数据集作为后盾。

这是实体 AI 基准测试系列的第六篇文章。前几篇涵盖了运营量产、人形机器人、自动驾驶法规、投资资本以及计算芯片。本文绘制感知层的全貌——传感器硬件、成本影响,以及两派架构各自最核心的论点。


第一节 — 传感器堆栈主要对比表

下表涵盖截至2026年中,自动驾驶行业中最常被引用的五种传感器架构。摄像头数量、激光雷达单元与雷达模块反映的是公开规格或制造商公告信息。

公司摄像头激光雷达雷达超声波计算架构
Waymo(第六代)294组(360° Honeycomb + 近场)6未披露自研ASIC(Waymo Driver芯片)全传感器融合,无人驾驶L4
Tesla(HW4)8(360° + 前向长焦)01(选配,部分车型)0(2022年移除)双FSD芯片纯视觉,端到端神经网络
Mobileye(EyeQ Ultra)摄像头 + 可选激光雷达选配EyeQ Ultra ASICREM地图层,可扩展融合
Cruise(已暂停)40516自研ASIC最高冗余度堆栈
Zoox(亚马逊)844自研计算双向车辆,全融合

解读此表: Waymo的29个摄像头反映全方位360度周边覆盖加上专用近场摄像头,远多于Tesla的8个。Cruise的堆栈拥有40个摄像头、5组激光雷达和16个雷达模块,是GM于2023年底暂停计划前最具冗余度的商用自动驾驶架构。Zoox的双向车辆设计(没有前后之分——正反方向操控相同)需要两端对称的传感器覆盖。

Tesla的零激光雷达是刻意的设计选择,而非成本省略。 双FSD芯片提供超过1,000 TOPS(Tesla内部基准测试)的纯摄像头推理能力。2022年移除超声波传感器是同步的决定——两项决策都反映同一个架构押注:以摄像头数据训练的神经网络,能达到等同甚至优于传感器融合方案的安全水平。


第二节 — 核心辩论:纯视觉 vs. 传感器融合

这两种架构代表对自动驾驶安全本质截然不同的假设。两者都不是明显错误的——但其前提假设差异之大,足以让各公司围绕各自的理念构建截然不同的工程组织。

Tesla 纯视觉的论点

人类道路是为人类眼睛设计的。 每一个交通标志、车道标线、交通信号灯和行人信号,都是为了让一对人类眼睛从行驶中的车辆能够读取而设计的。如果任务是在为人类视觉设计的道路上驾驶,摄像头就是正确的传感器——一种能产生与道路基础设施设计基准相同信息来源的传感器。

成本核算。 激光雷达单元在目前的制造规模下,每辆车成本为500至5,000美元。摄像头传感器每个只需几美元。跨越数百万辆车,这个成本差距决定了一款定价3万美元以下的消费性产品与一个需要以乘车收入摊销硬件成本的机器人出租车服务之间的差异。

车队数据规模。 Tesla超过600万辆的车队持续产生来自真实世界边缘案例的摄像头影像:不寻常的车道配置、施工区、行为异常的行人、紧急车辆、洪水、强光眩光。没有任何装备激光雷达的车队能匹敌这个数据量。训练优势随时间复利累积——车队每遇到一个新的边缘案例,就能改善所有其他Tesla车辆的模型。

无地图依赖的端到端学习。 Tesla以Dojo训练的方法旨在直接从视频输入学习驾驶策略,不依赖高精度预先测绘的路网。这让系统可以延伸到任何道路,而不仅限于已预先测绘的路段。

Waymo 传感器融合的论点

激光雷达提供摄像头无法获得的深度信息。 摄像头将世界感知为二维投影。从单一摄像头估算三维距离需要推断——神经网络必须从视觉线索(如表观大小、阴影和视差)学习判断深度。激光雷达通过飞行时间激光脉冲直接测量距离,无论光线条件如何,都能产生精确的三维点云。再多的神经网络训练都无法消除单目深度估算的根本模糊性。

雷达穿透摄像头无法应对的条件。 毫米波雷达能穿透使摄像头图像质量劣化的雨、雪和雾。镜头被凝结水雾化或被大雨遮蔽的摄像头会失去有意义的信号。雷达不会。在恶劣天气下,雷达提供的结构性场景信息——大型物体在哪里、它们移动多快——正是摄像头系统会失去的。

无人驾驶所需的冗余度。 没有安全驾驶员的机器人出租车无法靠边停车请人类接手。当一种传感器类型失效时——摄像头镜头破裂、激光雷达单元被冰堵塞、雷达模块被碎片击中——系统必须依靠剩余传感器继续安全运作。完全无人驾驶L4作业所需的安全裕度,高于有人类监控可随时介入的L2辅助驾驶系统。

安全标准倾向冗余架构。 ISO 21448(SOTIF——预期功能安全性)以及更广泛的L4监管环境,隐性地倾向具备多个独立感知模态的架构。监管机构可以要求公司展示当任何单一传感器失效时系统如何优雅降级。纯视觉系统没有摄像头故障时的备援。


第三节 — 每辆车传感器堆栈成本估算

两种架构之间的成本差距是这场辩论中最具体的数字。以下估算反映规模化制造成本——而非零售或更换成本——基于截至2026年可获得的行业数据与分析师估计。

组件Waymo第六代(估算)Tesla HW4(估算)
摄像头阵列约200美元约150美元
激光雷达(4组)约3,000–5,000美元0美元
雷达约300美元约100美元(选配)
计算(ASIC / FSD芯片)约500美元约400美元(双芯片)
传感器+计算合计约4,000–6,000美元约650–700美元

这个成本差距对商业模式的意义。 Waymo经营网约车服务——Waymo One机器人出租车——每辆车在整个使用寿命内产生持续的收入来摊销硬件成本。这个模式可以在车辆每年运行数万英里并按里程收费的情况下,合理化4,000–6,000美元的传感器套件。

Tesla的Cybercab目标定价低于30,000美元,与5,000美元的激光雷达堆栈不相容。纯摄像头架构不只是哲学立场——它是Tesla正在构建的消费者车辆商业模式的必要前提。配备Waymo传感器堆栈的Cybercab售价将需要35,000–40,000美元甚至更高,完全消除了大众市场机器人出租车的命题。


第四节 — 天气与地理限制

传感器架构的选择决定了系统能够可靠运行的地点。下表将各条件映射到预期性能特性——这些是架构倾向,而非任何特定系统的保证测量结果。

条件纯摄像头(Tesla)激光雷达+摄像头(Waymo)
强烈阳光良好良好
夜间(城市,有照明)良好(HW4低光优化)优秀
大雨劣化良好(雷达备援)
浓雾显著劣化中等(激光雷达在雾中散射)
降雪(路面标线遮蔽)显著劣化中等
传感器遮挡(镜头污垢/结冰)单点故障风险具备冗余备援

这张表解释了行业的地理选择。 Waymo在亚利桑那州凤凰城启动商业服务,并扩展到旧金山和洛杉矶——这些都是天气温和、年均日照高、降雪极少的市场。凤凰城的大雨事件不常见。这并非巧合——即使拥有激光雷达和雷达,浓雾和结冰对当前自动驾驶系统仍具挑战性。

Tesla宣布将德克萨斯州奥斯汀作为首个机器人出租车市场(预计2025年)。奥斯汀的气候以干热和低降雨量为特征,相较于美国较高纬度城市更为干燥。纯视觉架构在干燥、光线充足的条件下表现更好。选择奥斯汀而非西雅图或明尼阿波利斯,是对纯摄像头感知作业包络限制的承认。


第五节 — 融合论点

部分分析师认为两个阵营最终将随时间趋近。论点双向都成立。

Tesla增加激光雷达的理由。 自2017年以来,激光雷达制造成本持续下降。Luminar Technologies已公开宣布以量产规模达到每单元低于100美元的目标;Innoviz Technologies和禾赛科技有类似路线图。如果激光雷达降到每单元50–100美元——大约等于中档摄像头模块的成本——反对激光雷达的成本论点就大幅削弱了。即使不在消费者车辆上加装激光雷达,Tesla也可能为其机器人出租车车队采用激光雷达。

反对Tesla加入激光雷达的理由。 Tesla的整个训练流程是针对视觉优化的。Dojo训练基础设施处理视频。端到端神经网络策略以摄像头数据训练。车队数据收集系统采集摄像头影像。加入激光雷达不只是在车上加装一个传感器——它需要重建数据流程以吸收激光雷达点云、以融合数据重新训练模型,并重新设计推理堆栈架构。这是一个多年工程计划,而非产品更新。

最可能的结果。 两种方法将各自持续改进。基于摄像头的系统将持续受益于更大的训练数据集、更好的神经架构和更高分辨率的传感器。基于激光雷达的系统将受益于成本更低、射程更长、分辨率更高的单元。成本差距将缩小,但在与消费者车辆相关的制造量下可能不会完全消除。


基准测试背景:这是实体 AI 系列的第六篇文章

本追踪报告是从多个角度涵盖实体 AI 的系列第六篇:

  1. 运营量产指标 — 产量计数、部署规模、行驶里程
  2. 人形机器人技术 — 硬件世代、灵巧性基准、基础模型能力
  3. 自动驾驶安全与法规 — 加州DMV数据、NHTSA事故报告、州许可证地图
  4. 投资与估值 — 资金流向、融资轮次、隐含估值
  5. 计算与芯片 — 推理芯片、训练集群、NVIDIA供应限制
  6. 传感器堆栈与感知架构 — 本文

传感器架构问题位于成本、安全与可扩展性的交叉点。它将由车队数据、监管决策,以及最终哪种架构能以可接受的成本处理真实世界驾驶条件的完整分布来解决。那个答案仍在进行中。


来源

标签

请喝咖啡