2026-06-18 — views
实体AI数据飞轮 — Tesla 6百万辆车的训练优势、Waymo 5千万英里无人驾驶里程,以及数量还是质量决定AV竞赛胜负
Tesla 6M车队 vs Waymo 5千万无人英里:以数据飞轮为实体AI基准维度,分析数量与质量何者胜出。
实体AI基准系列第123篇 — 实体AI数据飞轮:Tesla 6百万辆车的训练优势、Waymo 5千万英里无人驾驶商业里程,以及数据数量还是质量决定AV竞赛胜负
实体AI基准系列在前122篇文章中,已针对自动驾驶车辆与人形机器人的技术就绪度、运营指标、安全记录、法规框架、供应链及市场估值进行了全面分析。第123篇将焦点转向实体AI中最深层的竞争护城河:数据。
每一英里的行驶都在训练神经网络。每一个边缘案例的记录都在改善系统。但并非所有里程都具有同等价值。在监督模式下人类驾驶员介入五次的FSD英里,与在复杂城市交通中无安全员的无人驾驶商业英里,本质上是不同的训练信号。本文探讨的核心问题是:谁拥有最多里程、谁的里程质量最高,以及现有证据显示数量还是质量决定自动驾驶训练竞赛的胜负。
所有标记”(估计)“的数字均来自公开市场信息、分析师估计及公司披露,而非经过验证的一手数据。
第一节 — 数据飞轮机制
“数据飞轮”描述的是一种自我强化循环:训练更好的模型会产生更干净的训练数据,干净的数据再训练出更好的模型,如此往复。在自动驾驶车辆中,飞轮分为五个可辨识的阶段,每个阶段都会让最早进入且车队规模最大的公司的优势复利累积。
| 飞轮阶段 | 发生什么 | 为什么会复利累积 |
|---|---|---|
| 车辆收集数据 | 每一帧摄像头画面、每一个传感器读数、每一次人类介入、每一次险情都被记录并传输至训练管道 | 车队规模越大,每单位时间收集的数据越多;数据收集速率与车队规模成正比 |
| 数据标记与过滤 | 原始视频及传感器数据被处理:边缘案例、介入事件和罕见场景优先标记;例行公路里程则降采样 | 标记质量决定训练信号质量;对边缘案例的错误标记会让模型学到错误行为 |
| 模型以标记数据训练 | 神经网络权重在标记数据集上更新;Dojo(Tesla)或TPU集群(Waymo/Google)处理训练运行 | 算力决定模型可重新训练的频率;Dojo投资等同于更快的迭代周期 |
| 改进模型通过OTA部署 | 更好的模型通过无线更新推送至车队;由于模型犯错的可能性降低,车队立即生成更好的数据 | 正向循环:更好的模型产生更干净的数据,干净的数据训练出更好的模型,进一步降低脱离接管率 |
| 边缘案例发现 | 改进的模型仍会遇到新的边缘案例;这些案例被记录为下一轮的训练目标 | 分布尾部(罕见但危险的场景)从未完全消失;数据飞轮是永恒的 |
| 车队规模放大一切 | 600万辆车队每单位时间收集的数据是1辆车队的600万倍 | Tesla的消费者车队优势是结构性的:没有任何AV公司能在没有消费者汽车业务的情况下复制600万辆的规模 |
飞轮在两端都是自我强化的。更大的车队收集更多数据,但也能更频繁地发现罕见事件——因为罕见事件的发生频率与车队规模和行驶里程成正比。拥有1,500辆车的AV公司每667个车辆运行天才能看到一次百万分之一的道路事件,而Tesla的600万辆车队每天都能看到同样的事件数百次。
第二节 — Tesla的数据优势:数量
Tesla基于车队的数据优势是AV行业中规模最大的结构性护城河。没有其他AV公司运营着可比规模的消费者车辆车队,这意味着没有其他AV公司能以相近的速率收集数据。
| 指标 | Tesla | Waymo | 比例 |
|---|---|---|---|
| 在场收集数据的车辆 | 约600万辆FSD兼容车辆(估计) | 约1,100-1,800辆商业AV车队(估计) | 多约3,300-5,400倍的车辆(估计) |
| 每日行驶里程(车队合计) | 约5,000万-7,000万英里/天(估计,600万辆 x 平均每天约10英里活跃) | 约15万-20万英里/天(估计,1,500辆 x 每辆约100英里/天) | 每日原始里程多约250-450倍(估计) |
| 累计监督FSD里程 | 约50-60亿英里(估计,2026年第一季度已披露范围) | 约5,000万英里无人驾驶商业里程(已披露) | 原始里程多约100倍(估计) |
| 记录的人类介入次数 | 监督FSD模式下的每次手动接管都被记录并标记;在600万辆车下,即使是罕见事件类型也频繁发生 | Waymo记录所有远程协助介入和系统脱离接管 | Tesla每日记录的介入事件多约100倍(估计) |
| 地理多样性 | 美国全部50州及加拿大;欧盟有限;100,000+种道路配置 | 凤凰城、旧金山、洛杉矶、奥斯汀、亚特兰大——仅限5个地理围栏 | Tesla地理多样性显著更高 |
| 天气多样性 | 涵盖美国所有气候的所有天气条件 | 凤凰城:干燥/炎热;旧金山:雾;洛杉矶:温和;降雪曝露有限 | Tesla全面涵盖雪、冰、雾、雨、沙漠、公路和城市场景 |
地理和天气多样性是数量优势中被低估的维度。仅在凤凰城、旧金山、洛杉矶、奥斯汀和亚特兰大训练的模型——无论多么深度——从未见过明尼苏达公路上的黑冰、密歇根的暴风雪或德克萨斯的季风。Tesla的车队每天在美国每个州以规模化的方式遭遇所有这些条件。
第三节 — Waymo的数据优势:质量
Waymo的数据优势不是体量的——而是质量的。该公司积累了超过5,000万英里无人驾驶商业里程,车辆中没有人类驾驶员。这些里程产生的训练信号与监督FSD里程有本质上的不同。
| 指标 | Waymo优势 | 为什么质量重要 |
|---|---|---|
| 无人驾驶商业里程 | 5,000万+英里,车辆中没有人类驾驶员;模型必须在没有安全网的情况下处理一切 | 无人驾驶里程产生更干净的训练信号:只有模型的决策被记录;没有人类接管的噪声污染数据集 |
| 城市密度和复杂性 | 旧金山是地球上最复杂的城市驾驶环境之一:双排停放的快递车辆、激进的骑行者、行人、缆车、雾气、窄街道 | 旧金山无人驾驶里程与公路或郊区里程相比边缘案例密度更高 |
| 完整传感器套件数据 | 每英里记录的激光雷达+摄像头+雷达融合数据;3D点云+RGB视频+速度数据 | 更丰富的传感器数据能训练出更强健的感知模型;Tesla的仅摄像头数据无法训练激光雷达感知 |
| 闭环模拟 | Waymo使用神经渲染(基于NeRF)重建真实场景并运行数百万个模拟变体 | 1英里真实里程可产生1,000+个模拟变体;模拟将有效训练数据成倍增加 |
| 每英里安全关键时刻密度 | 在旧金山和凤凰城的商业叫车服务每英里产生的安全关键时刻多于公路驾驶 | 一英里旧金山无人驾驶里程可能包含的训练价值相当于100英里公路FSD里程 |
| 标记质量 | Waymo有专门的数据标记团队;3D激光雷达标记更昂贵但比2D摄像头标记更准确 | 更高的标记成本等同于更高质量的训练信号;Waymo每标记英里的投入更多 |
无人驾驶质量这一点值得特别强调。当人类驾驶员在监督FSD模式下接管时,两件事发生了:模型的预测被中断(反事实结果未知),以及人类的介入被记录为训练信号。但人类介入是不一致的——不同的驾驶员有不同的舒适度、反应阈值和修正风格。这些噪声在Waymo的无人驾驶数据集中是缺席的,在这些数据中,模型自己的决策在真实交通中完整播放。
Waymo的模拟倍增能力是难以精确量化的力量倍增器。基于NeRF的场景重建——将单次真实世界的摄像头和激光雷达采集转化为参数化的3D场景,可以用不同的天气、光照、交通密度和路面条件重新运行——意味着5,000万英里真实无人驾驶里程可能实际上代表了数亿个训练场景变体(估计)。
第四节 — 质量与数量问题:现有证据说明了什么
| 证据类型 | 显示什么 | 诠释 |
|---|---|---|
| FSD脱离接管率趋势 | Tesla FSD关键脱离接管率从2022年到2026年改善了约10倍(估计,基于Tesla季度报告) | 监督里程的数量确实在产生改善;飞轮对Tesla有效 |
| Waymo安全记录 | 5,000万+英里无人驾驶,零起安全气囊展开的碰撞事故(已披露);远低于人类驾驶基准 | 质量无人驾驶里程确实在有限地理围栏内产生了可证明安全的系统 |
| 泛化问题 | Tesla的FSD立即泛化到新道路(无需地图);Waymo在新地区运营前需要高清地图 | Tesla的数量方法产生地理泛化能力;Waymo的质量方法在地理围栏内实现安全优先 |
| 边缘案例尾部 | Tesla由于车队规模每天发现更多新的边缘案例类型;Waymo由于无人驾驶质量在地图区域内更完整地解决边缘案例 | 两者同时为真;竞赛在于Tesla的数量是否能比Waymo的质量更快覆盖边缘案例 |
| 关键实验 | 当Tesla在奥斯汀撤除安全驾驶员时:模型是否足够安全?这是监督里程是否能转化为无人驾驶性能的真实测试 | 这是AV中最重要的开放数据问题:从监督学习到无人驾驶能力的转移率 |
| 学术证据 | 缩放定律表明算力和数据数量都重要;在尾部,数据质量往往比原始数量更重要 | 无人驾驶里程可能是AV训练的高质量token;但Tesla的数量确保了完整分布覆盖 |
第五节 — 数据飞轮基准评分卡
| 维度 | Tesla | Waymo | 优势 |
|---|---|---|---|
| 原始里程数量 | 约50-60亿英里监督里程(估计) | 约5,000万英里无人驾驶里程 | Tesla多约100倍原始里程 |
| 每日数据收集速率 | 约5,000万-7,000万英里/天(估计) | 约15万-20万英里/天(估计) | Tesla每日累积速度快约300倍 |
| 数据质量(每英里) | 监督模式;人类介入为训练信号添加噪声 | 无人驾驶;全程仅有模型的决策 | Waymo每英里质量更高 |
| 地理多样性 | 美国全部50州及加拿大;所有天气条件 | 5个地理围栏;有限天气曝露 | Tesla多样性显著更高 |
| 每英里边缘案例密度 | 较低——车队大量行驶在公路和郊区路线 | 较高——在复杂城市环境中的商业城市路线 | Waymo每英里边缘案例密度更高 |
| 模拟倍增能力 | Tesla使用基于重建的模拟(估计) | Waymo使用基于NeRF的场景重建(已披露);高度发达的管道 | Waymo模拟倍增能力更成熟 |
| 传感器数据丰富度 | 仅摄像头(每辆8个摄像头) | 激光雷达+摄像头+雷达完整融合 | Waymo每英里传感器数据更丰富 |
| 训练迭代速度 | Dojo实现快速重训练(估计) | Google TPU集群;世界级基础设施 | 相当;两者都在训练算力前沿 |
| 总体评判 | 在数量、地理和天气多样性上胜出 | 在质量、边缘案例密度和传感器丰富度上胜出 | 不同但互补的优势;两者对规模化安全都是必要的 |
注意: 所有标记”(估计)“的数字均来自截至2026年中期的公开市场信息、分析师估计、行业报告和公司投资者关系材料。里程数字和车队规模估计基于公开披露范围和公开分析师估计;实际数字可能存在重大差异。本文不构成投资建议。
来源
- Tesla季度车辆安全报告 — Tesla ↗
- Waymo安全报告与行驶里程 — Waymo ↗
- Waymo模拟基础设施 — Waymo Research ↗
- Chinchilla缩放定律 — DeepMind ↗
- Tesla Dojo超级计算机 — Tesla AI ↗