2026-06-18 — views
AV数据飞轮比较 — 特斯拉数量vs.Waymo质量与AI训练竞赛
特斯拉拥有数十亿英里的监督里程;Waymo拥有数千万英里完全无人驾驶里程。哪种数据类型能赢得AI训练竞赛?
实体AI基准系列第30篇 — 训练数据问题
特斯拉与Waymo之间最深层的技术差异,不在于车队规模、行程数量或地理覆盖,而在于各自产生的训练数据——以及数据数量或数据质量,究竟哪个能赢得AI训练竞赛。特斯拉已从超过600万辆消费者车辆中累积了估计50–60亿英里的监督里程。Waymo则累积了估计3,000–5,000万英里的完全无人驾驶商业里程。这两个数字表面上无从比较,但实际上的比较远比看起来复杂。
本文从十个维度全面对比两个数据飞轮,检视核心的质量vs.数量辩论,解释脱离事件缺口(这是支持质量优先于数量最强的论据),回顾特斯拉的影子模式应对策略,并预测各公司的数据优势如何在2030年前持续复利增长。
本文所有数字均为基于公开资料、公司公告、分析师报告及加州DMV申报的估算值。特斯拉与Waymo均未发布完整的数据统计报告。
第一节 — 数据飞轮比较表
下表从十个维度对比两个数据飞轮。没有任何单一行能说明全貌;战略意涵需从十个维度整体解读。
| 维度 | 特斯拉 | Waymo |
|---|---|---|
| 累积里程(估算) | 50–60亿英里(FSD启用监督里程累积) | 3,000–5,000万英里(无人驾驶商业里程,估算) |
| 主动产生数据的车辆 | 约200–300万辆(FSD订阅/启用,估算) | 约1,000–1,500辆专用车 |
| 每日里程(估算) | 约1,000–1,500万英里/天 | 约30–50万英里/天 |
| 数据类型 | 监督式(人在回路中,可介入) | 完全无人驾驶(无人工介入) |
| 边缘案例密度 | 每英里低(人工防止大多数介入) | 每英里高(每个边缘案例均由AV自行解决) |
| 传感器模态 | 纯摄像头(8颗摄像头) | LiDAR+摄像头+雷达(完整传感器套件) |
| 标注方法 | 自动标注+人工审查标注片段 | 来自传感器融合的高保真真实标注 |
| 地理多样性 | 美国全州+加拿大+有限欧洲 | 4–5个城市(凤凰城、旧金山、洛杉矶、奥斯汀+亚特兰大) |
| 天气多样性 | 高(所有气候,监督驾驶员处理边缘案例) | 低(仅晴天/温和市场;无积雪验证) |
| 脱离事件(已标注) | 罕见(人工接管但并非每次均记录) | 每个自主边界均记录并标注 |
解读表格: 特斯拉在原始数量、地理广度、天气多样性及每日数据生成速率上占优。Waymo在每英里数据质量、传感器丰富度、标注精确度及边缘案例密度上占优。战略辩论核心在于:哪个轴向对训练模型应对最艰难驾驶场景更重要。
第二节 — 质量vs.数量辩论
核心张力有两个面向,且两者在技术上均站得住脚。
特斯拉的论点——数量致胜:
在估计超过50亿英里的里程中,即使极为罕见的边缘案例也频繁出现,足以用于训练。百万分之一的事件在50亿英里的数据集中大约会出现5,000次。地理多样性是无可替代的:凤凰城的夏季酷热、纽约市的拥挤路况、明尼苏达州的冬季冰雪——全部汇聚于同一数据集。车队规模意味着数据收集几乎是免费的;现有用户在正常驾驶过程中产生训练数据,每英里无需额外成本。端到端神经网络(特斯拉在FSD v12部署并于后续版本扩展)如果量足够大,能从不完美的数据中提取学习。模型学会在任何有限的专用测试车辆无法复制的条件下泛化。
Waymo的论点——质量致胜:
监督里程与无人驾驶里程本质上不同。当人类驾驶员脱离时,AI模型永远看不到在危机时刻应该怎么做——人类恰好在场景变得最有教育意义的时候接管。传感器融合(LiDAR+雷达+摄像头)创造了更丰富的真实标注:仅靠摄像头无法获取深度、反射率和精确物体距离。在Waymo的无人驾驶数据集中,AV每时每刻的决策都以完整传感器保真度记录。在特斯拉的监督数据集中,人工介入在最关键的时刻制造了训练噪声。论点:如果介入系统性地排除了最重要的场景,3,000万英里的完全无人驾驶里程可能包含比50亿英里监督里程更多的可操作学习信号。
仅凭公开数据无法解决这一问题。答案取决于各公司所做的具体架构选择,以及其模型在训练过程中如何为不同信号类型加权。
第三节 — 脱离事件问题
最重要的数据不对称,是在边缘案例——真正困难的时刻——发生了什么。
在特斯拉监督驾驶中:
人类驾驶员在察觉到危险时脱离。这意味着AI模型在危险时刻的行为没有被记录——人类在危机之前或危机期间接管。结果是训练数据集在恰恰最重要的时刻存在系统性盲点。AI学会了导致困难场景的前因,却学不到如何解决它,因为每次情况变得困难时,人类的解决方案就取代了AI的解决方案。
在Waymo无人驾驶中:
没有人类可以脱离。每一个边缘案例——险些碰撞、激进的行人穿越、道路上的碎片、复杂的多车辆汇入、模糊的施工区——都由AI处理并以完整传感器数据记录。模型在最艰难场景中从自身行为中学习,在决策时刻由传感器融合提供真实标注。
这个脱离事件缺口是支持数据质量优先于数量最强的论据。特斯拉的监督数据集对轻松英里存在选择性偏差:人类信任AI到不需要介入的那些英里。最艰难的英里——人类确实介入的那些——被记录为介入事件,但不记录为完整的AI解决轨迹。
这种选择性偏差是否是致命性的,取决于端到端网络能否从邻近数据推断缺失的解决行为,还是这个缺口是不可缩减的。这是AV研究中最具后果性的开放问题之一。
第四节 — 特斯拉的应对方式:影子模式
特斯拉通过三种机制演进其数据策略,以部分解决脱离事件问题。
影子模式: 即使在人类手动驾驶时,FSD也在后台做出决策。系统将其规划的轨迹和行动与人类的实际行为进行比较——在不让人类输入影响车辆的情况下记录两者。影子模式为人类完全掌控的场景生成训练信号,有效地将每位特斯拉驾驶员变成一个无意识的数据标注员。
规模化自动标注: 特斯拉的训练流水线使用车队本身作为分布式传感器网络,对数十亿个视频片段进行自动标注。特斯拉使用模型生成的标注、跨多个摄像头的一致性检查以及对标注边缘案例的针对性人工审查的组合,而不是支付人工标注员标注每个片段。标注流水线随车队而非固定的标注人力规模扩展。
介入作为负向奖励信号: 即使人类接管,接管事件也被记录为负向训练信号——模型学习导致人工介入的行动模式,该模式获得降低的奖励。这将脱离事件从数据缺口转化为不完美但有用的训练信号。
影子模式加上规模化自动标注是否能匹敌Waymo的真实标注无人驾驶信号,是AV研究中最关键的未解决技术问题。影子模式产生数量,但可能无法产生无人驾驶里程提供的危机时刻精确解决方案。答案可能会随着两家公司在2026–2028年间扩大商业运营,在公开数据中显现的比较安全性表现中逐渐清晰。
第五节 — 数据飞轮2030年前预测
数据优势并非静态。每家公司的飞轮以不同方式复利增长,随着机器人出租车车队扩大,差距也在演变。
| 年份 | 特斯拉数据轨迹 | Waymo数据轨迹 | 评估(估算) |
|---|---|---|---|
| 2026 | 60–80亿英里监督;FSD v14训练 | 4,000–6,000万无人驾驶里程;Gen 6贡献 | Waymo质量领先;特斯拉数量领先 |
| 2027 | 100–120亿英里;Cybercab+FSD消费者车队 | 8,000万–1.2亿无人驾驶里程(亚特兰大、迈阿密加入) | 趋近——特斯拉FSD快速改善 |
| 2028 | 150亿+英里;机器人出租车车队加入无人驾驶里程 | 1.5–2亿无人驾驶里程 | 若机器人出租车车队扩大,特斯拉在无脱离数据上超前 |
| 2030 | Optimus加入具身AI数据流 | Waymo独立上市后;5亿+无人驾驶里程 | 特斯拉(具身规模);Waymo(纯AV深度) |
特斯拉的关键解锁: 若特斯拉将奥斯汀机器人出租车车队扩大到数万辆,最终达到全球数十万辆Cybercab,它将开始以消费者车队速度产生自己的无人驾驶里程。一个每天产生500万英里无人驾驶里程的10万辆机器人出租车车队,在持续运营约两到三年内,将缩小与Waymo的质量差距。
Waymo的关键解锁: 地理扩张——增加积雪市场、当前五个城市以外的高密度城市核心,以及最终的国际市场——将实质性地改变比较表中的天气多样性和地理多样性行。若Waymo到2028年在20个城市运营,到2030年在50个城市运营,差距将显著缩小。
2030年的意外因素: 特斯拉的Optimus人形机器人计划将增加一个全新的数据模态——具身操作和真实世界物理交互——这是Waymo没有对等物的。若Optimus按特斯拉预测在2028–2029年达到有意义的量产规模,特斯拉的数据飞轮将成为多领域资产,而非单一领域资产,其影响远超自动驾驶,延伸至更广泛的实体AI市场。
第六节 — 关于本系列
这是实体AI基准系列第30篇。本系列已涵蓋:爬坡指数、人形机器人竞赛、单位经济学、全球竞争、高精度地图、车队运营、软件与OTA、保险与责任、消费者需求、合作伙伴关系、竞争护城河、Cybercab vs. Model Y、安全数据、Waymo Gen 6、Optimus制造、记分卡快照、2030预测场景、投资者框架、Waymo城市扩张管线、特斯拉州批准地图、AV天气与气候限制、人才竞争、前瞻性法规日历(第28篇)以及机器人出租车票价定价分析(第29篇)。
本文解决了上述所有议题背后的基础技术问题:哪家公司产生更好的AI训练数据,而更好意味着更多还是更丰富?答案尚未定论。脱离事件缺口支持Waymo的质量论;特斯拉的影子模式和机器人出租车规模化轨迹是有意义的回应。数据飞轮比较将是2026–2030年视窗中最具后果性的技术竞争之一——而且与车队规模或行程数量不同,它对外部观察者来说在很大程度上是不可见的,直到训练优势在出现于公开数据的安全表现差异中复利显现为止。