2026-06-18 — views
物理AI传感器 — Waymo 激光雷达+摄像头+毫米波雷达融合 vs 特斯拉纯视觉FSD:感知硬件基准测试 2026
Waymo融合激光雷达、摄像头与毫米波雷达,构建冗余3D感知。特斯拉仅用摄像头——每辆车成本低10至30倍——押注AI能弥补摄像头的弱点。
概述
传感器配置是自动驾驶汽车设计中最根本的硬件决策。Waymo采用激光雷达(lidar)、摄像头与毫米波雷达三种传感器融合,建立具备冗余能力的感知系统。特斯拉则仅使用摄像头——纯视觉方案——主张只要AI足够强大,激光雷达只是多余的昂贵工具。这场辩论对车辆成本、恶劣环境下的感知可靠性,以及处理传感器数据所需的AI类型均有深远影响。本文为物理AI基准测试系列第168篇。
第一节 — Waymo 传感器套件:激光雷达 + 摄像头 + 毫米波雷达融合
Waymo Gen 6车辆部署三种互补的传感模态,相互弥补彼此的弱点,构建无单点故障的感知系统。
| 传感器维度 | Waymo 详情 | 战略意义 |
|---|---|---|
| 激光雷达(主要测距传感器) | Waymo Gen 6使用自研激光雷达;lidar发射激光脉冲并测量飞行时间,建立精准3D点云;射程达200m以上(估计);在黑暗中及多数天气条件下均可运作 | Lidar提供摄像头无法匹敌的厘米级精准3D几何;昏暗光线下50m处的行人,lidar能清楚探测,即便摄像头对比度不足 |
| 自研激光雷达开发 | Waymo自Google SDC项目起即开发自有lidar;多代自研激光雷达(Honeybee、Laser Bear Honeybee等);从Gen 5到Gen 6成本大幅降低 | 自研lidar大幅降低单位成本,优于采购商用lidar;Waymo自研lidar性能更强且更便宜 |
| 摄像头阵列 | Gen 6使用多摄像头阵列提供360度视觉覆盖;摄像头捕捉lidar无法提供的颜色、纹理与语义信息(识别路标、信号灯、车道线) | 摄像头与lidar互补:lidar提供深度与几何,摄像头提供语义与颜色;融合感知优于任一单一传感器 |
| 毫米波雷达 | 短程与长程毫米波雷达通过多普勒效应测量附近物体的速度;雷达在大雨、浓雾与沙尘中仍可运作 | 雷达的速度测量在恶劣天气中不可或缺:大雨中lidar点云噪声增大;浓雾中摄像头失去对比度;雷达均可穿透 |
| 传感器融合 | Waymo感知系统在传感器层与物体层均进行lidar、摄像头、毫米波雷达数据融合;融合表征比任何单一传感器更丰富且可靠 | 传感器融合提供冗余:若一种传感器降级(lidar镜头沾水、摄像头眩光),其他传感器维持感知质量 |
| 传感器成本(Gen 6) | Waymo指出从Gen 5到Gen 6成本显著降低;Gen 6精确成本未公开;业界估计完整lidar+摄像头+毫米波雷达套件每辆车约5千至1.5万美元(估计) | 即使每辆车5千美元,传感器成本仍是重大制造成本项目;特斯拉纯摄像头方案完全排除此成本——8摄像头FSD阵列估计仅200至500美元(估计) |
| 传感器评语 | Waymo的多传感器方案是工程安全的选择:传感模态越多,冗余越高,各种条件下的感知越可靠。成本代价是真实且显著的。核心问题在于:这种冗余对商业AV安全是否必要,还是摄像头加AI就能在更低成本下达到相同可靠性——这就是特斯拉的赌注。 |
第二节 — 特斯拉传感器套件:纯视觉(仅摄像头)
特斯拉HW4平台使用9颗摄像头,不含lidar或毫米波雷达。这个赌注是:以足够的摄像头数据训练的AI,能匹敌甚至超越lidar的感知能力。
| 传感器维度 | 特斯拉详情 | 战略意义 |
|---|---|---|
| 摄像头阵列(HW4) | 特斯拉HW4使用9颗摄像头(8颗环绕+1颗远程前向);提供360度覆盖;分辨率优于HW3;由特斯拉自研FSD计算机处理 | 9颗摄像头提供完整空间覆盖;FSD计算机同时处理所有摄像头流,输出单一神经网络结果 |
| 特斯拉为何放弃lidar与毫米波雷达 | 马斯克主张lidar是”拐杖”,一旦摄像头与AI足够好就不再需要;人类用双眼(摄像头)驾驶,不靠lidar;lidar增加成本与复杂度却不从根本提升大规模安全性;特斯拉于2021至2022年从多数车型移除毫米波雷达 | 纯视觉赌注基于特定假设:以足够规模的摄像头数据训练的AI,能匹敌或超越lidar感知;此假设在完全无人驾驶商业规模下尚未得到证实 |
| ”AI弥补传感器限制”论点 | 特斯拉立场:lidar让每个感知问题对简单算法而言容易解决;摄像头让问题更难但可由强大AI解决;摄像头数据训练的AI在特斯拉规模下比依赖HD地图的lidar系统更具泛化能力 | 这是连贯的技术论点:若AI够好,摄像头或许就够了;问题是在所有天气与光线条件下完全无人驾驶,“够好”的AI是否已经存在 |
| 纯视觉的局限 | 摄像头在以下情况表现不佳:大雨(镜头积水)、下雪(白化条件)、直射阳光眩光(传感器饱和),以及远超头灯范围的完全黑暗;纯摄像头系统在雾中无毫米波雷达后备测速,低对比度下无lidar后备3D几何 | 这些局限并非假设,而是有记录的失效模式;问题在于这些条件在AV运营域中出现的频率,以及AI能否可靠地检测并响应传感器降级 |
| HW4 硬件规格 | 特斯拉FSD计算机(HW4):2颗AI推理芯片,估计各144 TOPS(估计);同时处理所有9路摄像头流;为端到端神经网络推理优化 | 足以实时处理9路摄像头流的推理算力;自研芯片针对此特定工作负载优化 |
| 占用网络方法 | FSD v12采用占用网络(occupancy network)从摄像头图像预测3D空间占用;这是lidar点云的神经网络替代方案 | 摄像头占用网络令人印象深刻,但远距的空间精度低于lidar点云;80m处的行人,占用网络检测精度可能不如lidar |
| 纯视觉评语 | 若AI够好,特斯拉的纯视觉赌注是成本最优的选择:摄像头便宜、普及且持续进步;lidar昂贵且增加维护负担。若特斯拉的AI能在规模化下达到lidar融合的感知可靠性,此赌注成功。若天气或光线条件持续导致lidar可以预防的事故,则赌注失败。 |
第三节 — 传感器辩论:技术分析
| 技术维度 | 激光雷达+摄像头+毫米波雷达(Waymo) | 纯视觉(特斯拉) | 现有证据 |
|---|---|---|---|
| 3D测距精度 | Lidar:200m处厘米级精度(估计);直接测量 | 摄像头占用网络:80m以上米级精度(估计);从2D图像推断 | Lidar在3D精度上具决定性优势;在高速与长距离最为重要 |
| 夜间表现 | Lidar在完全黑暗中运作;摄像头需头灯照明;毫米波雷达在黑暗中运作 | 纯摄像头依赖头灯范围;头灯范围内表现良好;远距黑暗中降级 | 激光雷达+摄像头+毫米波雷达:在远距低光源中具决定性优势 |
| 恶劣天气(雨/雾/雪) | Lidar在大雨中降级(水滴返回信号);摄像头在雾中降级;毫米波雷达穿透两者;传感器融合维持性能 | 摄像头在大雨与浓雾中降级;无毫米波雷达后备;对恶劣天气更脆弱 | 激光雷达+摄像头+毫米波雷达:因毫米波雷达后备在恶劣天气中具决定性优势 |
| 信号灯与标志识别 | 摄像头处理语义(标志文字、信号灯颜色)良好;lidar无法识别文字或颜色 | 摄像头:语义能力强;与融合方案相同 | 持平——双方均使用摄像头处理语义 |
| 每辆车传感器成本 | 激光雷达+摄像头+毫米波雷达:估计5千至1.5万美元(估计) | 纯摄像头:估计200至500美元(估计) | 特斯拉在传感器成本上具决定性优势,估计低10至30倍 |
| 维护复杂度 | 传感器越多,维护点越多;lidar镜头需保持清洁;各传感模态间需校准 | 9颗摄像头含自动清洁功能;维护更简单;故障率更低 | 特斯拉在维护简便性上具决定性优势 |
| 地图依赖 | Waymo的lidar实现精确HD地图对齐;lidar点云与HD地图特征匹配用于定位 | 特斯拉的无地图FSD使用摄像头进行实时定位;不需HD地图 | 特斯拉在地图依赖方面具决定性优势(无依赖) |
| AI训练数据 | Lidar点云与摄像头图像需不同训练数据;各模态需独立数据管道 | 摄像头是唯一模态;数据管道更简单;特斯拉全部60亿英里里程均可直接用于训练 | 特斯拉在训练数据同质性上具决定性优势 |
第四节 — 传感器选择对规模与成本的意义
| 规模维度 | Waymo 多传感器 | 特斯拉纯视觉 | 影响 |
|---|---|---|---|
| 车辆制造成本 | 传感器套件每辆车增加估计5千至1.5万美元(估计) | 传感器成本估计200至500美元(估计);低10至30倍 | 10万辆Cybercab时,特斯拉相较Waymo方案估计节省5亿至15亿美元传感器成本(估计) |
| 车队更换周期 | Lidar传感器降级需更换;从Gen 5到Gen 6需整车更换 | 摄像头降级但更换便宜;传感器升级通过HW4芯片更换而非整车更换 | 特斯拉较低的传感器成本降低车队更换支出 |
| 城市扩张 | 每个新城市需要lidar高清地图建设(数周至数月的建图行驶);增加每城市上线成本与时间 | 不需HD地图建设;OTA FSD更新涵盖新地理区域 | 特斯拉在城市扩张速度与成本上具决定性优势 |
| 消费者车辆整合 | Waymo不销售消费者车辆;传感器套件纯属商业车队成本 | 每辆搭载HW4的消费者特斯拉已具备传感器硬件;消费者转机器人出租车零额外传感器成本 | 特斯拉传感器与消费者车辆的整合是独特的结构性优势 |
| 供应链 | 自研lidar供应链需要专业制造商;地缘政治与供应风险 | 摄像头是全球大规模制造的商品零件;供应链高度韧性 | 特斯拉在传感器供应链韧性上具决定性优势 |
第五节 — 传感器基准测试计分卡
| 传感器维度 | Waymo 激光雷达+融合 | 特斯拉纯视觉 | 优势 | 2028年展望 |
|---|---|---|---|---|
| 3D感知精度 | 决定性——lidar在200m以上厘米级精度 | 占用网络在80m以上米级精度 | Waymo | AI改进缩小但无法消弭差距 |
| 恶劣天气表现 | 决定性——lidar+摄像头降级时有毫米波雷达后备 | 大雨/浓雾/大雪中脆弱 | Waymo | 特斯拉AI改进但物理限制摄像头在恶劣天气的表现 |
| 每辆车传感器成本 | 高:估计5千至1.5万美元(估计) | 低:估计200至500美元(估计) | 特斯拉(决定性10至30倍) | Lidar成本持续下降但差距依然存在 |
| 维护复杂度 | 较高:多传感器校准、lidar清洁 | 较低:以摄像头为中心,维护更简单 | 特斯拉 | 随车队规模扩大,特斯拉维持优势 |
| 城市扩张(地图依赖) | 每城市需HD地图:数周至数月建图 | 无HD地图:OTA涵盖新地理区域 | 特斯拉(决定性) | Waymo HD地图成本仍是每城市的负担 |
| 训练数据管道 | 多模态:lidar+摄像头独立管道 | 单一模态:60亿英里里程均可直接使用 | 特斯拉 | 特斯拉数据管道优势随车队增长扩大 |
| 整体传感器评语 | Waymo的lidar+融合方案在边缘条件(恶劣天气、远距黑暗)中更安全,3D几何更精确。特斯拉的纯视觉方案成本大幅更低、更简单、更易扩展,且已部署于600万辆车。赌注在于特斯拉的AI能否在摄像头最薄弱的条件下缩短与lidar的感知差距。若能,特斯拉的传感器经济学将决定性胜出。若不能,Waymo的传感器冗余将在纯视觉系统无法预防的事故中证明其价值。答案将随特斯拉完全无人驾驶Cybercab积累商业里程的事故数据而浮现。 |
所有标注(估计)的数据均来自公司公开披露、分析师估算与行业基准测试。本文为物理AI基准测试系列第168篇。
来源
- Waymo Gen 6 传感器套件 — Waymo 博客 ↗
- 特斯拉纯视觉FSD策略 — Tesla AI Day 2021 ↗
- Waymo 自研激光雷达 — Waymo 研究 ↗
- 特斯拉HW4 FSD计算机规格 — Tesla ↗
- 激光雷达 vs 摄像头 AV 感知辩论 — IEEE Spectrum ↗