2026-06-18 — views

Tesla FSD 数据飞轮 — 600 万辆车如何打造无法复制的 AI 训练回路

Tesla 每天产生的驾驶训练数据超过全球所有机器人出租车公司的总和。FSD 数据飞轮如何复利增长，以及为何没有竞争者能够复制。

Physical AI 基准系列第 95 篇 — Tesla FSD 数据飞轮：600 万辆车如何打造自我强化的 AI 训练回路，以及为何没有机器人出租车公司能够复制

Tesla 在 Physical AI 领域最重要的竞争优势，既不是车辆本身，也不是电池技术或制造能力。而是数据飞轮：一个自我强化的回路——路上的每一辆 Tesla 都在产生训练数据，改善 FSD 神经网络，提升 FSD 表现，增加 FSD 使用率，进而产生更多训练数据。截至 2026 年中，全球估计有超过 600 万辆具备 FSD 功能的消费者车辆在路上行驶，Tesla 每天产生的驾驶数据量超过全球所有机器人出租车公司的总和——多出许多个数量级。

本文将 FSD 数据飞轮的技术机制梳理为 Physical AI 斜坡的基准指数。这个飞轮并非营销话术，而是一套具体可衡量的技术架构——影子模式推理、边缘案例检测、目标数据采集和 Dojo 训练计算——它以规模化的方式复利增长，而没有消费者车辆车队的公司在结构上无法接近这一点。

第一节 — 数据飞轮的四个组成部分

FSD 数据飞轮由四个相互嵌合的机制组成。每一个机制都依赖消费者车辆车队提供输入，每一个机制都直接反馈给其他机制。

组件	功能	重要性
影子模式	每辆启用 FSD 或 Autopilot 的 Tesla，在人类驾驶的同时并行运行神经网络——对转向、制动和加速做出预测，这些预测从不被执行，但会被记录	产生数十亿个带标签的训练样本：模型的预测与人类实际行为之间的差异即为隐式标签
边缘案例检测	Tesla 车队识别模型预测与人类行为存在显著偏差的情况，或人类在 FSD 模式下不得不介入的情况	自动浮现最难的场景——这正是对改进模型最有价值的数据
数据引擎（目标采集）	一旦识别出一类边缘案例（例如雨夜无保护左转），Tesla 可以对车队进行编程，主动采集该特定场景的更多样本	将被动数据采集转化为目标课程——车队是可编程的训练数据采集器
Dojo 训练集群	Tesla 专为处理车队高吞吐量视频数据而建造的自定义 AI 训练基础设施，采用 D1 芯片	实现快速迭代：模型变更可以在数十亿英里的车队数据上训练，并在数天至数周内通过 OTA 部署到车队

飞轮复利效应： 更好的模型带来更多 FSD 使用（用户更信任它），进而带来更多影子模式里程，再带来更多边缘案例被检测，再带来更好的下一代模型。这个回路之所以能复利增长，是因为每一次改进都招募更多用户进入影子模式数据生成的循环。

关键的结构洞察在于：每个组件都依赖于在真实世界条件下运行的大型消费者车辆车队。影子模式需要有人类驾驶员的车辆。边缘案例多样性需要车辆在多样的地域、天气和道路类型中行驶。目标数据采集需要足够大的车队，使得对特定场景进行编程采集能快速产生足够的样本。Dojo 需要数据量来支撑其资本支出的合理性。1,500 辆商业车辆组成的车队无法以有意义的规模为这些机制提供输入。

第二节 — 数字呈现的规模优势

Tesla 消费者车队相对于任何机器人出租车运营商的数据优势并非边际差异，而是结构性的，描述这一差距的数字根本无从接近。

数据维度	Tesla 车队（2026 年中估计）	Waymo 商业车队（2026 年中估计）	比率
具备 FSD/AV 功能的车辆	超过 600 万辆消费者车辆（估计）	约 1,500 至 2,000 辆商业 AV 车辆（估计）	约多 3,000 至 4,000 倍
每日里程（估计）	数亿英里（消费者驾驶，FSD 影子模式在部分车辆上启用）	约 50 至 100 万英里（商业车队，每天 22 小时）（估计）	约多 100 至 500 倍
每日影子模式里程	数千万英里（估计）——每英里 FSD 参与里程都产生预测数据	所有商业里程均为无人驾驶；无同等影子模式	Tesla 产生 Waymo 无法复制的影子模式数据
边缘案例多样性	Tesla 销售地区的所有道路类型、天气条件和地理区域	4 至 5 个美国城市的围栏商业走廊；主要为晴天白天条件（估计）	Tesla 看到 Waymo 可能数年内都不会遇到的数百万个独特场景
地理覆盖	美国、加拿大、欧洲、中国、澳大利亚——Tesla 销售的所有地方	旧金山、凤凰城、洛杉矶、奥斯汀——4 个美国城市	Tesla 的地理覆盖为全球范围
每年训练数据（估计）	数千亿个带标签视频帧（估计）	数百亿个高质量无人驾驶帧（估计）	不同的质量结构；Tesla 拥有体量和多样性优势

这一比较中重要的细微差别在于，质量和数量是不同的维度。Waymo 的商业无人驾驶里程在某个特定意义上质量可以说更高：它们由完全自主的系统在无人监督下生成，这意味着每英里都是能力的证明，而非影子模式推理的演示。但 Waymo 这种高质量数据是以 Tesla 车队数量的三千分之一、在 4 个城市中生成的，而 Tesla 的数据，无论其质量结构如何，以某种数量级到达，而当目标是覆盖罕见道路场景的长尾时，任何质量提升都无法替代这一体量。

第三节 — 影子模式的技术运作方式

影子模式是使数据飞轮成为可能的机制，也是最常被误解的机制，因为它在不可见的状态下运行——人类驾驶员对其运行毫无感知。

影子模式元素	技术细节
并行推理	即使在人类驾驶时，FSD 神经网络也会持续对每一帧摄像头画面进行推理——生成从不被执行但会被记录的预测
标签来源	人类驾驶员的实际行为是真值标签：转向角度、制动压力、加速度——全部精确记录
自动偏差标记	当模型预测与人类行为存在显著差异时（例如模型预测左转，人类直行），该片段被标记为有趣的训练样本
介入标记	当 FSD 启用时，如果驾驶员介入（接管方向盘），该时刻被标记为模型失败的案例
隐私处理	片段在上传前被匿名化；训练数据中的人脸和车牌被模糊化（估计）；Tesla 的服务条款涵盖数据采集
上传带宽	车辆通过家中 WiFi 或 Tesla 超级充电站上传压缩数据片段；高优先级边缘案例优先上传
体量	在数百万辆活跃影子模式车辆的条件下，Tesla 每天接收数百万个带标签视频片段（估计）

标签来源是竞争对手无法复制的结构性优势。在商业无人驾驶车队中，不存在其行为能产生隐式标签的人类驾驶员。Waymo 的训练数据需要人工标记（人类观看片段并标注正确行为应为何），或合成数据生成（模拟现实中未发生的场景）。这两种方法都有效且被广泛使用，但每个带标签样本的成本都比影子模式的隐式标记机制高出数个数量级，因为影子模式以每辆车零边际成本的方式自我标记。

第四节 — Dojo：计算基础架构

Tesla 的 Dojo 超级计算机专为在飞轮所需的规模上处理 FSD 车队的视频数据而建造。没有 Dojo——或同等的定制计算——600 万辆车生成的数据体量在竞争优势所需的迭代时间线内将无法处理。

Dojo 元素	详情
D1 芯片	Tesla 定制的 AI 训练芯片；针对芯片间高带宽互连进行优化（类似 NVLink 用于视频处理工作负载）
ExaPOD	每个 ExaPOD 包含 120 个 Dojo D1 芯片；多个 ExaPOD 构成集群
训练算力（估计）	Tesla 目标到 2025 年底达到约 1 exaFLOP 训练容量；2026 年持续扩展（估计）
对比云端替代方案	在 AWS 或 GCP 上进行 Dojo 规模的训练每年将耗费数亿美元（估计）；Dojo 在足够规模下摊销了这一成本
视频专业化	与通用 GPU 集群不同，Dojo 专为 FSD 训练所需的多摄像头视频处理流水线而优化
OTA 部署流水线	训练好的模型更新通过 Tesla 的 OTA 系统部署到车队；训练运行后数天内即可完成全车队更新
迭代速度	更快的训练带来更快的模型迭代，带来更快的改进回路，带来随时间复利增长的竞争优势

Dojo 的战略逻辑不仅仅是节省成本，更是迭代速度。在 Dojo 上训练的模型可以在数周内在车队上测试。车队识别的回归问题可以在数天内触发目标数据采集活动，一周内完成再训练，两周内完成车队部署。这种反馈回路速度——从真实世界观察到部署的模型改进——是飞轮在技术层面实现的，也是 Dojo 在计算层面实现的。在云端规模的约束不仅是成本，还有为非通用云端存储架构设计的多拍字节视频数据集启动训练任务的延迟。

第五节 — Waymo 无法复制的原因

FSD 数据飞轮的竞争优势是结构性的，而非边际性的。产生这一优势的机制取决于拥有配备人类驾驶员的消费者车辆车队——这一要求排除了当今所有运营的机器人出租车公司。

飞轮元素	Waymo 的处境	难以复制的原因
车队规模	约 1,500 至 2,000 辆商业车辆（估计）	若不进入消费者汽车业务，无法缩小 3,000 至 4,000 倍的车辆差距
影子模式	无同等机制——Waymo 商业车队无人驾驶；不存在能产生隐式标签的人类驾驶员	无人驾驶运营在商业上更优，但消除了影子模式机制
地理多样性	4 至 5 个美国城市（估计）	城市进入剧本限制地理扩张速度为每年 1 至 2 个新城市（估计）
消费者数据同意	Alphabet 拥有消费者数据（Google Maps、Android），但没有来自个人车辆的驾驶行为视频	需要进入消费者汽车市场——超过 1,000 亿美元的资本投入
Dojo 同等物	Waymo 使用 Google Cloud TPU 基础设施（估计）	获取 Google 计算资源是强大的，但没有车队就不存在驱动定制芯片需求的数据体量
结构性差距	Tesla 与 Waymo 之间训练数据体量的差距在没有消费者车辆车队的情况下无法缩小	这是护城河：它无法在 2 至 3 年内被购买或建造

重要的反面观点是：Waymo 已经在 4 个城市实现了商业无人驾驶运营，而 Tesla 截至 2026 年中尚未在任何美国司法管辖区获得无监督商业机器人出租车服务的监管批准（估计）。飞轮优势是训练数据优势——它转化为模型改进优势——但模型改进最终必须在真实世界无人驾驶表现中得到验证，才能成为商业优势。Tesla 的飞轮正在加速能力曲线，而这条曲线是否在 Waymo 扩大其商业领先优势之前或之后达到商业无人驾驶能力批准，是 Physical AI 斜坡的核心基准问题。

第六节 — 数据飞轮作为 Physical AI 基准指数

将 FSD 数据飞轮框架化为基准指数——而非仅仅是技术特性——使得能够在随时间可见复利的维度上追踪 Physical AI 斜坡。

飞轮指标一：每季 FSD 参与里程。 Tesla 在财报电话会议上披露累计 FSD 里程。每季度参与里程的环比增长率是影子模式数据体量增长的直接代理指标。加速增长意味着飞轮在加速。

飞轮指标二：FSD 版本发布节奏。 Tesla 发布新 FSD 版本的频率是训练迭代速度的下游信号。更快的节奏意味着 Dojo 更快地将车队数据处理为模型更新。

飞轮指标三：FSD 介入率。 每次介入里程指标（披露时）衡量模型质量。介入率改善结合参与里程增长，是飞轮复利效应在性能上的体现。

飞轮指标四：影子模式地理扩展。 随着 FSD 在新国家和地区启用，训练数据的地理多样性不断扩大。每个新国家都增加了模型在训练规模上尚未遇到的道路类型、交通法规差异和天气模式。

飞轮指标五：Dojo 容量公告。 Tesla 关于 Dojo ExaPOD 部署和训练算力扩展的公开声明是飞轮处理能力增长的代理指标。更多 Dojo 意味着更快的迭代。

这五项指标共同构成 FSD 数据飞轮复利增长速率的基准指数。这个指数不衡量 Tesla 是否会获得商业无人驾驶批准——那是监管问题。它衡量的是底层能力曲线是否在加速，而这正是商业部署之前 Physical AI 斜坡的信号。

第七节 — 关于本系列

本文是 Physical AI 基准系列的第 95 篇。前 94 篇涵盖了斜坡指数、人形机器人竞赛、单元经济学、全球竞争、高精度地图、软件与 OTA 更新、消费者需求、竞争护城河、安全数据、Waymo Gen 6、Optimus 制造、记分卡快照、2030 预测场景、投资者框架、城市扩张管线、Tesla FSD 州批准地图、AV 天气与气候约束、监管日历、机器人出租车票价定价、人形机器人部署追踪器、供应链分析、消费者采用需求指数、估值与 IPO 分析、Physical AI 2026 年中回顾、AV 单元经济学每英里成本分解、AV 数据飞轮比较、Physical AI 供应链、AV 车队运营、完整生命周期环境成本、无障碍层、地图架构比较、中国 AV 竞赛、模拟和合成数据训练、AV 城市规划与城市影响、自动驾驶卡车货运经济学、欧洲 AV 竞争格局、AV 传感器技术辩论、AV 安全指标、AV 人才争夺战、全球 AV 监管地图、AV 财务可持续性燃烧率、Tesla Cybercab 对比 Waymo Gen 6 正面交锋（第 84 篇）、AV 网络安全攻击面（第 85 篇）、人形机器人商业部署格局（第 86 篇）、AV 车队电气化与充电竞赛（第 87 篇）、AV 数据作为业务（第 88 篇）、AV 保险与责任（第 89 篇）、无人驾驶舱与乘客体验（第 90 篇）、Physical AI 投资格局（第 91 篇）、AV 安全对比人类驾驶员统计（第 92 篇）、AV 老年人与残障人士无障碍（第 93 篇）和 Waymo 城市扩张剧本（第 94 篇）。

本文新增 FSD 数据飞轮维度：飞轮的四个技术组件（影子模式、边缘案例检测、目标数据采集、Dojo）、与 Waymo 商业车队的规模比较、影子模式作为自我标记机制的技术运作方式、Dojo 作为计算基础架构、为何飞轮结构在没有消费者车辆车队的情况下无法复制，以及用于追踪飞轮复利增长速率的五指标基准指数。

注意： 本文中的车队规模估计、训练数据体量估计和竞争评估均为方向性估计，基于截至 2026 年中 Tesla 的公开披露、分析师研究、Waymo 的公开声明和新闻报道。凡数据不确定或为估计值的地方，数字均标记为「（估计）」，应视为方向性指引，而非确认的确定性数据。本文不构成投资建议。