Skip to content
AI-Daily-Builder

2026-06-18 views

实体AI数据飞轮 — Tesla 6百万辆车的训练优势、Waymo 5千万英里无人驾驶里程,以及数量还是质量决定AV竞赛胜负

Tesla 6M车队 vs Waymo 5千万无人英里:以数据飞轮为实体AI基准维度,分析数量与质量何者胜出。

实体AI基准系列第123篇 — 实体AI数据飞轮:Tesla 6百万辆车的训练优势、Waymo 5千万英里无人驾驶商业里程,以及数据数量还是质量决定AV竞赛胜负

实体AI基准系列在前122篇文章中,已针对自动驾驶车辆与人形机器人的技术就绪度、运营指标、安全记录、法规框架、供应链及市场估值进行了全面分析。第123篇将焦点转向实体AI中最深层的竞争护城河:数据。

每一英里的行驶都在训练神经网络。每一个边缘案例的记录都在改善系统。但并非所有里程都具有同等价值。在监督模式下人类驾驶员介入五次的FSD英里,与在复杂城市交通中无安全员的无人驾驶商业英里,本质上是不同的训练信号。本文探讨的核心问题是:谁拥有最多里程、谁的里程质量最高,以及现有证据显示数量还是质量决定自动驾驶训练竞赛的胜负。

所有标记”(估计)“的数字均来自公开市场信息、分析师估计及公司披露,而非经过验证的一手数据。


第一节 — 数据飞轮机制

“数据飞轮”描述的是一种自我强化循环:训练更好的模型会产生更干净的训练数据,干净的数据再训练出更好的模型,如此往复。在自动驾驶车辆中,飞轮分为五个可辨识的阶段,每个阶段都会让最早进入且车队规模最大的公司的优势复利累积。

飞轮阶段发生什么为什么会复利累积
车辆收集数据每一帧摄像头画面、每一个传感器读数、每一次人类介入、每一次险情都被记录并传输至训练管道车队规模越大,每单位时间收集的数据越多;数据收集速率与车队规模成正比
数据标记与过滤原始视频及传感器数据被处理:边缘案例、介入事件和罕见场景优先标记;例行公路里程则降采样标记质量决定训练信号质量;对边缘案例的错误标记会让模型学到错误行为
模型以标记数据训练神经网络权重在标记数据集上更新;Dojo(Tesla)或TPU集群(Waymo/Google)处理训练运行算力决定模型可重新训练的频率;Dojo投资等同于更快的迭代周期
改进模型通过OTA部署更好的模型通过无线更新推送至车队;由于模型犯错的可能性降低,车队立即生成更好的数据正向循环:更好的模型产生更干净的数据,干净的数据训练出更好的模型,进一步降低脱离接管率
边缘案例发现改进的模型仍会遇到新的边缘案例;这些案例被记录为下一轮的训练目标分布尾部(罕见但危险的场景)从未完全消失;数据飞轮是永恒的
车队规模放大一切600万辆车队每单位时间收集的数据是1辆车队的600万倍Tesla的消费者车队优势是结构性的:没有任何AV公司能在没有消费者汽车业务的情况下复制600万辆的规模

飞轮在两端都是自我强化的。更大的车队收集更多数据,但也能更频繁地发现罕见事件——因为罕见事件的发生频率与车队规模和行驶里程成正比。拥有1,500辆车的AV公司每667个车辆运行天才能看到一次百万分之一的道路事件,而Tesla的600万辆车队每天都能看到同样的事件数百次。


第二节 — Tesla的数据优势:数量

Tesla基于车队的数据优势是AV行业中规模最大的结构性护城河。没有其他AV公司运营着可比规模的消费者车辆车队,这意味着没有其他AV公司能以相近的速率收集数据。

指标TeslaWaymo比例
在场收集数据的车辆约600万辆FSD兼容车辆(估计)约1,100-1,800辆商业AV车队(估计)多约3,300-5,400倍的车辆(估计)
每日行驶里程(车队合计)约5,000万-7,000万英里/天(估计,600万辆 x 平均每天约10英里活跃)约15万-20万英里/天(估计,1,500辆 x 每辆约100英里/天)每日原始里程多约250-450倍(估计)
累计监督FSD里程约50-60亿英里(估计,2026年第一季度已披露范围)约5,000万英里无人驾驶商业里程(已披露)原始里程多约100倍(估计)
记录的人类介入次数监督FSD模式下的每次手动接管都被记录并标记;在600万辆车下,即使是罕见事件类型也频繁发生Waymo记录所有远程协助介入和系统脱离接管Tesla每日记录的介入事件多约100倍(估计)
地理多样性美国全部50州及加拿大;欧盟有限;100,000+种道路配置凤凰城、旧金山、洛杉矶、奥斯汀、亚特兰大——仅限5个地理围栏Tesla地理多样性显著更高
天气多样性涵盖美国所有气候的所有天气条件凤凰城:干燥/炎热;旧金山:雾;洛杉矶:温和;降雪曝露有限Tesla全面涵盖雪、冰、雾、雨、沙漠、公路和城市场景

地理和天气多样性是数量优势中被低估的维度。仅在凤凰城、旧金山、洛杉矶、奥斯汀和亚特兰大训练的模型——无论多么深度——从未见过明尼苏达公路上的黑冰、密歇根的暴风雪或德克萨斯的季风。Tesla的车队每天在美国每个州以规模化的方式遭遇所有这些条件。


第三节 — Waymo的数据优势:质量

Waymo的数据优势不是体量的——而是质量的。该公司积累了超过5,000万英里无人驾驶商业里程,车辆中没有人类驾驶员。这些里程产生的训练信号与监督FSD里程有本质上的不同。

指标Waymo优势为什么质量重要
无人驾驶商业里程5,000万+英里,车辆中没有人类驾驶员;模型必须在没有安全网的情况下处理一切无人驾驶里程产生更干净的训练信号:只有模型的决策被记录;没有人类接管的噪声污染数据集
城市密度和复杂性旧金山是地球上最复杂的城市驾驶环境之一:双排停放的快递车辆、激进的骑行者、行人、缆车、雾气、窄街道旧金山无人驾驶里程与公路或郊区里程相比边缘案例密度更高
完整传感器套件数据每英里记录的激光雷达+摄像头+雷达融合数据;3D点云+RGB视频+速度数据更丰富的传感器数据能训练出更强健的感知模型;Tesla的仅摄像头数据无法训练激光雷达感知
闭环模拟Waymo使用神经渲染(基于NeRF)重建真实场景并运行数百万个模拟变体1英里真实里程可产生1,000+个模拟变体;模拟将有效训练数据成倍增加
每英里安全关键时刻密度在旧金山和凤凰城的商业叫车服务每英里产生的安全关键时刻多于公路驾驶一英里旧金山无人驾驶里程可能包含的训练价值相当于100英里公路FSD里程
标记质量Waymo有专门的数据标记团队;3D激光雷达标记更昂贵但比2D摄像头标记更准确更高的标记成本等同于更高质量的训练信号;Waymo每标记英里的投入更多

无人驾驶质量这一点值得特别强调。当人类驾驶员在监督FSD模式下接管时,两件事发生了:模型的预测被中断(反事实结果未知),以及人类的介入被记录为训练信号。但人类介入是不一致的——不同的驾驶员有不同的舒适度、反应阈值和修正风格。这些噪声在Waymo的无人驾驶数据集中是缺席的,在这些数据中,模型自己的决策在真实交通中完整播放。

Waymo的模拟倍增能力是难以精确量化的力量倍增器。基于NeRF的场景重建——将单次真实世界的摄像头和激光雷达采集转化为参数化的3D场景,可以用不同的天气、光照、交通密度和路面条件重新运行——意味着5,000万英里真实无人驾驶里程可能实际上代表了数亿个训练场景变体(估计)。


第四节 — 质量与数量问题:现有证据说明了什么

证据类型显示什么诠释
FSD脱离接管率趋势Tesla FSD关键脱离接管率从2022年到2026年改善了约10倍(估计,基于Tesla季度报告)监督里程的数量确实在产生改善;飞轮对Tesla有效
Waymo安全记录5,000万+英里无人驾驶,零起安全气囊展开的碰撞事故(已披露);远低于人类驾驶基准质量无人驾驶里程确实在有限地理围栏内产生了可证明安全的系统
泛化问题Tesla的FSD立即泛化到新道路(无需地图);Waymo在新地区运营前需要高清地图Tesla的数量方法产生地理泛化能力;Waymo的质量方法在地理围栏内实现安全优先
边缘案例尾部Tesla由于车队规模每天发现更多新的边缘案例类型;Waymo由于无人驾驶质量在地图区域内更完整地解决边缘案例两者同时为真;竞赛在于Tesla的数量是否能比Waymo的质量更快覆盖边缘案例
关键实验当Tesla在奥斯汀撤除安全驾驶员时:模型是否足够安全?这是监督里程是否能转化为无人驾驶性能的真实测试这是AV中最重要的开放数据问题:从监督学习到无人驾驶能力的转移率
学术证据缩放定律表明算力和数据数量都重要;在尾部,数据质量往往比原始数量更重要无人驾驶里程可能是AV训练的高质量token;但Tesla的数量确保了完整分布覆盖

第五节 — 数据飞轮基准评分卡

维度TeslaWaymo优势
原始里程数量约50-60亿英里监督里程(估计)约5,000万英里无人驾驶里程Tesla多约100倍原始里程
每日数据收集速率约5,000万-7,000万英里/天(估计)约15万-20万英里/天(估计)Tesla每日累积速度快约300倍
数据质量(每英里)监督模式;人类介入为训练信号添加噪声无人驾驶;全程仅有模型的决策Waymo每英里质量更高
地理多样性美国全部50州及加拿大;所有天气条件5个地理围栏;有限天气曝露Tesla多样性显著更高
每英里边缘案例密度较低——车队大量行驶在公路和郊区路线较高——在复杂城市环境中的商业城市路线Waymo每英里边缘案例密度更高
模拟倍增能力Tesla使用基于重建的模拟(估计)Waymo使用基于NeRF的场景重建(已披露);高度发达的管道Waymo模拟倍增能力更成熟
传感器数据丰富度仅摄像头(每辆8个摄像头)激光雷达+摄像头+雷达完整融合Waymo每英里传感器数据更丰富
训练迭代速度Dojo实现快速重训练(估计)Google TPU集群;世界级基础设施相当;两者都在训练算力前沿
总体评判在数量、地理和天气多样性上胜出在质量、边缘案例密度和传感器丰富度上胜出不同但互补的优势;两者对规模化安全都是必要的

注意: 所有标记”(估计)“的数字均来自截至2026年中期的公开市场信息、分析师估计、行业报告和公司投资者关系材料。里程数字和车队规模估计基于公开披露范围和公开分析师估计;实际数字可能存在重大差异。本文不构成投资建议。


来源

标签

请喝咖啡