2026-06-17 — views
自动驾驶软件架构与 OTA 更新管道指标 — 谁在实地部署中进步最快?(2026 年中)
OTA 更新频率、仿真深度与现场数据飞轮——决定特斯拉、Waymo、百度在部署中实际改进速度的三大关键。
指标背后的核心问题
行驶里程、脱离率与许可证数量衡量的是自动驾驶系统今天的位置。对长期竞争格局更重要的问题是:系统进步的速度有多快?改进速度是三个相乘因素的乘积——数据量、算力吞吐量与 OTA 更新频率——而三家前沿厂商在每个因素上都做出了根本不同的架构押注。这是实体 AI 基准系列的第十二篇文章。
第一节 — 软件架构比较
架构层面的基本设计选择会层层影响所有下游能力:数据如何标注、模型如何训练、更新如何验证,以及新版本软件多快能推送到实地车队。
| 维度 | 特斯拉 FSD | Waymo Driver | 百度 Apollo | 说明 |
|---|---|---|---|---|
| 核心架构 | 端到端神经网络(摄像头到动作) | 模块化(感知+预测+规划) | 模块化(感知+预测+规划) | 特斯拉押注学习策略;其他厂商保留显式规划 |
| 传感器输入 | 仅 8 个摄像头 | 激光雷达+摄像头+毫米波雷达 | 激光雷达+摄像头+毫米波雷达 | 单模态 vs 传感器融合 |
| 仿真平台 | 特斯拉 Dojo+内部仿真器 | Waymo Simulation(Carcraft) | AADS 仿真器 | Waymo Carcraft 据称可同时运行约 25,000 辆虚拟车辆 |
| OTA 更新频率 | 每周至每月(消费者 FSD) | 每季度或更长(运营车队) | 未公开 | 特斯拉更新频率远高于两家竞争对手 |
| OTA 测试车队规模 | 逾 600 万辆 | 约 1,500 辆 | 约 1,000 辆 | 特斯拉可进行人口规模的 A/B 测试 |
| 训练数据管道 | 车队→Dojo→模型→OTA | 运营车队→Google TPU→模型→分阶段推送 | 运营车队→百度云 | 特斯拉的循环因车队规模而最快 |
| 影子模式测试 | 是——FSD 在未购买 FSD 的车辆上静默运行 | 仅限运营车队 | 未公开 | 特斯拉以零边际成本从非付费车辆收集数据 |
解读表格: 端到端与模块化的架构分叉不仅是技术偏好——它决定了迭代速度与成本。端到端系统可通过更多数据重新训练来改善新的边缘案例;模块化系统需要识别哪个模块出错、重新标注该模块的训练集、重新训练模块,再验证整体堆栈。特斯拉的架构在设计上迭代更快,Waymo 的模块化架构则更易解释,也更容易通过安全监管审查。
第二节 — 改进速度方程
三个因素相乘决定了系统在实地的改进速度:
- 数据量 — 每月进入训练管道的实际行驶里程
- 算力 — 处理这些数据的基础设施训练吞吐量
- 更新频率 — 改进后的模型多快抵达实地车队并开始产生新训练数据
| 指标 | 特斯拉 | Waymo | 百度 |
|---|---|---|---|
| 每月进入训练管道的里程 | 10–20 亿英里(估计) | 500–1,000 万英里(估计) | 2,000–5,000 万英里(估计) |
| 训练算力(相对) | 高——Dojo 集群加 NVIDIA GPU | 中——Google TPU | 中——百度云 |
| OTA 频率 | 每周 | 每季度或更长 | 未公开 |
| 影子模式覆盖 | 逾 600 万辆 | 无 | 无 |
| 无人驾驶质量里程 | 较低——主要为监督式消费者驾驶 | 高——全部为商业无人驾驶 | 高——在指定城市无人驾驶 |
特斯拉的数据量优势是真实且巨大的。在估计每月 10–20 亿英里的训练管道规模下,特斯拉处理的原始里程比两家竞争对手多出几个数量级。但需注意数据质量:监督式消费者驾驶里程(人类驾驶员可能在模型遭遇完整困难场景前介入)与无人驾驶商业里程(自驾系统必须自行解决情况)并不等同。
第三节 — Waymo Carcraft:仿真优势
Waymo 的 Carcraft 仿真平台是公司应对特斯拉数据量优势的答案。据称可同时运行约 25,000 辆虚拟车辆,Carcraft 将每一个实际脱离事件与边缘案例以数千种受控变体重新仿真——不同天气、不同行人时机、不同车速——并在任何 OTA 更新获批推送前测试模型的应对方式。
这种做法的战略价值在于前向覆盖:Carcraft 可测试从未在现实世界发生的场景。Phoenix 的冰雪暴、工地旁突然跑出的行人、以特定角度闯红灯的车辆——Waymo 可在商业部署遭遇之前就仿真并训练。特斯拉的训练管道则需要先在现实世界遭遇边缘案例,才能取得对应的训练数据。
第四节 — 特斯拉影子模式的护城河
特斯拉在未购买 FSD 的车辆上静默运行 FSD 影子模式。神经网络无声地处理摄像头画面并记录它原本会做的决策,不干预实际驾驶。当影子模式的预测与人类驾驶员的实际行为出现分歧时,那些时刻就成为高价值训练样本。
影子模式将特斯拉的训练车队有效扩展到逾 600 万辆主动车辆以外,涵盖搭载 HW3 或 HW4 硬件的大多数在用车辆。数据收集不需要付费订阅、不需要特别登记,每个训练样本的边际成本为零。没有其他自动驾驶公司能在这样的规模下取得类似的被动数据收集机制。
第五节 — OTA 作为竞争护城河
持续更新实地车队软件的能力本身就是一个随时间复利的竞争优势。在其他条件相同的情况下,每周 OTA 周期的公司改进速度约是每季度周期公司的 13 倍。
| 能力 | 特斯拉 | Waymo | 重要性 |
|---|---|---|---|
| 消费者 OTA(非商业车队) | 是,每周 | 无消费者车队 | 特斯拉同时与 600 万用户迭代 |
| 商业运营 OTA | 是 | 是,分阶段且保守 | Waymo 优先考量运营安全而非更新速度 |
| 回滚能力 | 是 | 是 | 两者均可还原有问题的软件版本 |
| 大规模 A/B 测试 | 是——每次实验数百万辆 | 有限——数百辆 | 特斯拉可进行统计显著的人口规模实验 |
| 硬件算力 OTA | HW4 功能可通过软件解锁 | 固定硬件配置 | 特斯拉可在现有部署硬件上启用新能力 |
复利效应在这里至关重要。更快的更新周期意味着每次改进循环——收集数据、训练模型、推送更新、收集新数据——完成得更快。在 24 个月的时间跨度中,每周周期的公司已执行循环约 100 次;每季度周期的公司只执行了 8 次。
第六节 — 优势实际所在
两种方式都没有干净的胜出。特斯拉的数据量、影子模式覆盖与 OTA 频率创造了一个难以从零复制的飞轮。弱点在于验证:拥有 600 万辆车队与每周软件更新,验证失败的代价非常高。Waymo 较慢的节奏部分是刻意选择——商业无人驾驶服务无法承担向付费公众推送退化版本的声誉成本。
2026 年中的图景是两种不同押注:特斯拉押注数据量与更新速度是制约因素;Waymo 押注仿真质量与无人驾驶里程深度是制约因素。哪个押注正确,将在未来 24–36 个月的安全数据中见分晓。
基准背景:这是实体 AI 系列的第十二篇文章
本追踪报告是从多角度覆盖实体 AI 的系列文章中的第十二篇:
- 运营规模指标、2. 人形机器人技术、3. AV 安全与法规、4. 投资与估值、5. 算力与芯片、6. 传感器堆栈与感知架构、7. 机器出租车单位经济学、8. 全球竞赛、9. 主评分卡、10. 高精地图与定位、11. 车队运营与远程协助、12. 软件架构与 OTA 管道(本文)
改进速度问题无法仅从公开数据得出确定答案。但架构、车队规模与更新频率所创造的结构性逻辑清晰可见——这些差异会随时间复利。
来源
- 特斯拉 FSD 端到端架构 — Tesla AI Day ↗
- Waymo Carcraft 仿真平台 — Waymo 技术博客 ↗
- Waymo Driver 模块化架构 — Waymo 研究 ↗
- 百度 Apollo 开放平台 — Apollo ↗