2026-06-18 — views
自动驾驶安全指标——为何没有标准方式比较 Tesla 与 Waymo
各家 AV 公司使用不兼容的安全指标。本文提出真正的 Physical AI Ramp Index 应衡量哪些项目,以及各领导厂商现状。
Physical AI Benchmark 系列第 80 篇——自动驾驶安全指标:为何没有标准方式比较 Tesla 与 Waymo
追踪自动驾驶发展进程的根本问题之一,在于 Tesla、Waymo、Aurora 及所有 AV 公司都以不兼容的指标来报告安全性与性能。Waymo 谈论”严重事件之间的行驶里程”;Tesla 报告”每 1,000 英里 FSD 严重解除接管率”;Aurora 引用”每次干预的里程数”;加州 DMV 发布的解除接管报告已被业者学会如何应付。目前没有标准化的 Physical AI Ramp Index,没有 AV 安全报告的 GAAP 等效标准,这让回答行业最重要的问题几乎不可能:到底谁在自动驾驶竞赛中领先,速度有多快?
第一节——为何现有 AV 指标无从比较
每家公司发布的指标,至少在一定程度上是因为这些指标能让自己看起来更好。这不是阴谋,而是在没有强制报告标准的竞争行业中的理性行为。结果是没有两家公司报告相同的事情。
| 指标 | 使用者 | 问题所在 |
|---|---|---|
| 解除接管之间的行驶里程 | 加州 DMV 报告(所有获准 AV 运营商) | 定义各异——Waymo 计”为防止事故的人工接管”;Tesla 计”驾驶员干预”——两者不等 |
| 每千英里严重解除接管率 | Tesla(FSD 报告) | Tesla 自定义”严重”——无外部审计;涵盖驾驶员预计在场的监督驾驶 |
| 每次干预的里程 | Aurora、Waymo(内部) | 各公司对”干预”定义不同;何谓干预因协议而异 |
| 每百万英里事故数 | NHTSA Standing General Order(SGER) | 最标准化的外部指标;但需 30 天延迟;事故定义仍有灰色地带 |
| 每亿英里行驶事故率 | NHTSA/FHWA(人类基准) | 人类基准:约每百万英里 1.35 起(估计);难以与 AV 运营组合比较 |
| 乘客舒适度评分 | 内部(无公开报告) | 无外部标准;对商业可行性重要但外界看不到 |
| 可用性/正常运行时间 | 内部 | 多少比例的行程无需技术接管完成?任何公司均未公开报告 |
核心问题: AV 公司有动机选择对自己最有利的指标。没有相当于 GAAP 的 AV 安全报告标准。安全记录真正不佳的公司可以选择能掩盖问题的指标——而缺乏强制性外部审计标准意味着无法核实所发布的数字。
第二节——真正的 Physical AI Ramp Index 应衡量什么
一个可信的指数需要跨越四个维度的指标:安全性、规模、能力成长及商业可行性。每个维度都能捕捉其他维度无法捕捉的内容。
维度 A——安全性
| 指标 | 定义 | 重要原因 |
|---|---|---|
| 每百万无人驾驶英里事故数(NHTSA 应报告) | 需 NHTSA SGER 报告的碰撞事故,按每百万自驾英里标准化 | 最可外部审计;NHTSA 在 30 天内收到这些报告 |
| 每百万英里归咎 AV 的事故数 | 上述中调查认定 AV 有责任的子集 | 区分 AV 错误与混合交通中人为造成的事故 |
| 每 10 万英里安全关键解除接管数 | 系统基于安全考量(非人类偏好)主动移交给人类的次数 | 将安全关键与舒适性解除接管分开 |
维度 B——规模
| 指标 | 定义 | 重要原因 |
|---|---|---|
| 累计无人驾驶英里数 | 无安全驾驶员在场的行驶里程 | 无人驾驶曝光规模——赋予安全统计意义的分母 |
| 每周无人驾驶付费乘车次数 | 有别于测试乘车;仅限创收 | 商业吸引力;需要愿意付费的公共乘客 |
| 活跃无人驾驶车队规模 | 无安全驾驶员运营的车辆 | 规模化硬件指标 |
| 地理覆盖(无人驾驶 ODD 平方英里) | 无人驾驶作业设计域的总平方英里 | 广度与深度的权衡可见度 |
维度 C——能力成长
| 指标 | 定义 | 重要原因 |
|---|---|---|
| ODD 扩展速度(每年城市数) | 每年新增进入无人驾驶商业服务的城市 | 地理扩展速度 |
| 天气条件覆盖 | 无人驾驶处理的天气事件百分比(雨、雾、雪) | 恶劣条件下的能力深度 |
| 夜间及全天 24 小时运营百分比 | 夜间运营的服务时间百分比 | 证明系统非仅限白天 |
维度 D——商业可行性
| 指标 | 定义 | 重要原因 |
|---|---|---|
| 每无人驾驶英里收入 | 商业乘车收入除以英里(不分配驾驶成本) | 单位经济健康度 |
| 每车每日乘车次数 | 车队利用率 | 运营效率 |
| 等待时间(中位数接送) | 从请求到车辆到达的时间 | 消费者体验质量 |
| 行程完成率 | 接受的乘车中无需人类接管完成的百分比 | 从乘客角度看可靠性 |
第三节——领导厂商现状(2026 年中期估计)
| 指标 | Waymo | Tesla 机器人出租车 | Aurora | 备注 |
|---|---|---|---|---|
| 累计无人驾驶英里数 | 3,000 万以上(估计) | 不足 100 万(估计——奥斯汀启动阶段) | 约 500 万(估计——货运) | Waymo 的领先以商业运营年数计 |
| 每周付费无人驾驶乘车 | 15 万次以上 | 数百至低千次(估计) | 不适用(货运) | Waymo 在乘车量上领先 100 倍以上 |
| 活跃无人驾驶车队 | 1,000–1,500 辆(估计) | 10–50 辆(估计——奥斯汀地理围栏) | 数十辆(估计——I-45) | 不同规模的部署 |
| 每百万英里 NHTSA 应报告事故数 | 未按模式公开拆分 | 未拆分 | 未拆分 | 最佳外部数据:Waymo 在某些披露中报告低于每百万 1 起(估计) |
| 商业城市(无人驾驶) | 4 个(旧金山、凤凰城、洛杉矶、奥斯汀) | 1 个(奥斯汀,限制区域) | 1 条走廊(I-45 货运) | Waymo 地理广度最大 |
| 全天 24 小时运营 | 是(旧金山、凤凰城) | 否(目前) | 部分(高速公路时程) | Waymo 已验证全天候能力 |
| ODD 覆盖(约) | 4 城市数百平方英里(估计) | 约 10–20 平方英里(估计奥斯汀地理围栏) | 约 240 英里走廊 | ODD 类型差异极大 |
| 行程完成率 | 99% 以上(估计) | 尚未达到可报告规模 | 不适用(货运) | Waymo 高完成率是关键商业差异化 |
第四节——Tesla 的数据问题(及优势)
Tesla 在任何 Physical AI Index 中都占据独特且真正异常的位置。该公司拥有世界上最大的真实驾驶数据集——却几乎没有无人驾驶数据。
Tesla 公开报告的内容:
- FSD 累计监督里程:约 50–60 亿英里(估计)
- 解除接管率:定义为每 1,000 英里的严重干预,监督模式
- 通过 NHTSA SGER 报告的自动驾驶仪和 FSD 事故数据
尚无法报告的内容:
- 无人驾驶里程:奥斯汀机器人出租车业务尚处于极早期——截至 2026 年中商业运营仅数周
- 乘车次数:太少,统计上尚无意义
- 无人驾驶模式的归咎 AV 事故率:尚无数据
没有任何指数目前能捕捉的 Tesla 结构性优势:
拥有 600 万以上车辆的 FSD 监督车队,是全球最大的端到端神经网络驾驶真实世界概念验证。监督里程不等于无人驾驶里程,但在公共道路上有驾驶员监督并能干预的监督 FSD 的安全性,确实是真实的能力信号。解除接管率趋势每年提升约两倍(估计),是监督何时变为无人驾驶的领先指标。任何只计算今日无人驾驶里程的指数,都会系统性地低估 Tesla 的发展轨迹。
第五节——提议的 Physical AI Ramp Index 计分板
基于截至 2026 年中期的公开资料及估计数据:
| 维度 | Waymo 得分 | Tesla 得分 | 原因 |
|---|---|---|---|
| 安全(无人驾驶运营) | ●●●●○ | ●○○○○ | Waymo 有数百万无人驾驶里程;Tesla 机器人出租车仅数周 |
| 规模(无人驾驶) | ●●●●○ | ●○○○○ | 每周 15 万次 vs 数百次;4 城市 vs 1 区域 |
| 能力成长速度 | ●●●○○ | ●●●●○ | Tesla FSD 进步更快;Waymo 稳定但扩展较慢 |
| 商业可行性 | ●●●○○ | ●●○○○ | Waymo 已创收;单位经济仍在改善;Tesla 太早期 |
| 人形机器人及更广泛机器人 | ○○○○○ | ●●●○○ | Waymo 仅做 AV;Tesla 有 Optimus 量产计划 |
| 车队数据优势 | ●●○○○ | ●●●●● | Tesla 600 万监督车队;Waymo 1,000–1,500 辆无人驾驶 |
| 整体 Physical AI Ramp | ●●●●○ | ●●●○○ | Waymo 今日 AV 领先;Tesla 轨迹更强且范畴更广 |
关键结论: Waymo 今日在每一项可衡量的无人驾驶指标上领先 AV 竞赛。Tesla 在数据和轨迹竞赛中领先,并且是唯一有可信路径同时实现 L4 AV 和人形机器人规模化的公司。只计算今日无人驾驶里程的一维指数会遗漏全局——并系统性地偏向现有者而非挑战者。完整的 Physical AI Ramp Index 必须同时捕捉两个维度。
第六节——关于本系列
这是 Physical AI Benchmark 系列的第 80 篇。
本文新增了指标层面:现有 AV 安全指标为何不可比、真正的 Physical AI Ramp Index 应跨越四个维度衡量什么、截至 2026 年中期各领导厂商在每个维度的现状(估计),以及为何任何单一维度指数都无法捕捉真实竞争格局。
注意: 统计数据、车队规模、里程计数和评分在基于行业估计和公开报告的情况下标记为”(估计)“。本文不构成投资建议。
来源
- NHTSA Standing General Order AV 事故报告 ↗
- 加州 DMV 自动驾驶车辆解除接管报告 ↗
- Waymo 安全报告 ↗
- Tesla 车辆安全报告 ↗
- Aurora 安全案例 ↗