2026-06-18 — views

自动驾驶安全指标——为何没有标准方式比较 Tesla 与 Waymo

各家 AV 公司使用不兼容的安全指标。本文提出真正的 Physical AI Ramp Index 应衡量哪些项目，以及各领导厂商现状。

Physical AI Benchmark 系列第 80 篇——自动驾驶安全指标：为何没有标准方式比较 Tesla 与 Waymo

追踪自动驾驶发展进程的根本问题之一，在于 Tesla、Waymo、Aurora 及所有 AV 公司都以不兼容的指标来报告安全性与性能。Waymo 谈论”严重事件之间的行驶里程”；Tesla 报告”每 1,000 英里 FSD 严重解除接管率”；Aurora 引用”每次干预的里程数”；加州 DMV 发布的解除接管报告已被业者学会如何应付。目前没有标准化的 Physical AI Ramp Index，没有 AV 安全报告的 GAAP 等效标准，这让回答行业最重要的问题几乎不可能：到底谁在自动驾驶竞赛中领先，速度有多快？

第一节——为何现有 AV 指标无从比较

每家公司发布的指标，至少在一定程度上是因为这些指标能让自己看起来更好。这不是阴谋，而是在没有强制报告标准的竞争行业中的理性行为。结果是没有两家公司报告相同的事情。

指标	使用者	问题所在
解除接管之间的行驶里程	加州 DMV 报告（所有获准 AV 运营商）	定义各异——Waymo 计”为防止事故的人工接管”；Tesla 计”驾驶员干预”——两者不等
每千英里严重解除接管率	Tesla（FSD 报告）	Tesla 自定义”严重”——无外部审计；涵盖驾驶员预计在场的监督驾驶
每次干预的里程	Aurora、Waymo（内部）	各公司对”干预”定义不同；何谓干预因协议而异
每百万英里事故数	NHTSA Standing General Order（SGER）	最标准化的外部指标；但需 30 天延迟；事故定义仍有灰色地带
每亿英里行驶事故率	NHTSA/FHWA（人类基准）	人类基准：约每百万英里 1.35 起（估计）；难以与 AV 运营组合比较
乘客舒适度评分	内部（无公开报告）	无外部标准；对商业可行性重要但外界看不到
可用性／正常运行时间	内部	多少比例的行程无需技术接管完成？任何公司均未公开报告

核心问题： AV 公司有动机选择对自己最有利的指标。没有相当于 GAAP 的 AV 安全报告标准。安全记录真正不佳的公司可以选择能掩盖问题的指标——而缺乏强制性外部审计标准意味着无法核实所发布的数字。

第二节——真正的 Physical AI Ramp Index 应衡量什么

一个可信的指数需要跨越四个维度的指标：安全性、规模、能力成长及商业可行性。每个维度都能捕捉其他维度无法捕捉的内容。

维度 A——安全性

指标	定义	重要原因
每百万无人驾驶英里事故数（NHTSA 应报告）	需 NHTSA SGER 报告的碰撞事故，按每百万自驾英里标准化	最可外部审计；NHTSA 在 30 天内收到这些报告
每百万英里归咎 AV 的事故数	上述中调查认定 AV 有责任的子集	区分 AV 错误与混合交通中人为造成的事故
每 10 万英里安全关键解除接管数	系统基于安全考量（非人类偏好）主动移交给人类的次数	将安全关键与舒适性解除接管分开

维度 B——规模

指标	定义	重要原因
累计无人驾驶英里数	无安全驾驶员在场的行驶里程	无人驾驶曝光规模——赋予安全统计意义的分母
每周无人驾驶付费乘车次数	有别于测试乘车；仅限创收	商业吸引力；需要愿意付费的公共乘客
活跃无人驾驶车队规模	无安全驾驶员运营的车辆	规模化硬件指标
地理覆盖（无人驾驶 ODD 平方英里）	无人驾驶作业设计域的总平方英里	广度与深度的权衡可见度

维度 C——能力成长

指标	定义	重要原因
ODD 扩展速度（每年城市数）	每年新增进入无人驾驶商业服务的城市	地理扩展速度
天气条件覆盖	无人驾驶处理的天气事件百分比（雨、雾、雪）	恶劣条件下的能力深度
夜间及全天 24 小时运营百分比	夜间运营的服务时间百分比	证明系统非仅限白天

维度 D——商业可行性

指标	定义	重要原因
每无人驾驶英里收入	商业乘车收入除以英里（不分配驾驶成本）	单位经济健康度
每车每日乘车次数	车队利用率	运营效率
等待时间（中位数接送）	从请求到车辆到达的时间	消费者体验质量
行程完成率	接受的乘车中无需人类接管完成的百分比	从乘客角度看可靠性

第三节——领导厂商现状（2026 年中期估计）

指标	Waymo	Tesla 机器人出租车	Aurora	备注
累计无人驾驶英里数	3,000 万以上（估计）	不足 100 万（估计——奥斯汀启动阶段）	约 500 万（估计——货运）	Waymo 的领先以商业运营年数计
每周付费无人驾驶乘车	15 万次以上	数百至低千次（估计）	不适用（货运）	Waymo 在乘车量上领先 100 倍以上
活跃无人驾驶车队	1,000–1,500 辆（估计）	10–50 辆（估计——奥斯汀地理围栏）	数十辆（估计——I-45）	不同规模的部署
每百万英里 NHTSA 应报告事故数	未按模式公开拆分	未拆分	未拆分	最佳外部数据：Waymo 在某些披露中报告低于每百万 1 起（估计）
商业城市（无人驾驶）	4 个（旧金山、凤凰城、洛杉矶、奥斯汀）	1 个（奥斯汀，限制区域）	1 条走廊（I-45 货运）	Waymo 地理广度最大
全天 24 小时运营	是（旧金山、凤凰城）	否（目前）	部分（高速公路时程）	Waymo 已验证全天候能力
ODD 覆盖（约）	4 城市数百平方英里（估计）	约 10–20 平方英里（估计奥斯汀地理围栏）	约 240 英里走廊	ODD 类型差异极大
行程完成率	99% 以上（估计）	尚未达到可报告规模	不适用（货运）	Waymo 高完成率是关键商业差异化

第四节——Tesla 的数据问题（及优势）

Tesla 在任何 Physical AI Index 中都占据独特且真正异常的位置。该公司拥有世界上最大的真实驾驶数据集——却几乎没有无人驾驶数据。

Tesla 公开报告的内容：

FSD 累计监督里程：约 50–60 亿英里（估计）
解除接管率：定义为每 1,000 英里的严重干预，监督模式
通过 NHTSA SGER 报告的自动驾驶仪和 FSD 事故数据

尚无法报告的内容：

无人驾驶里程：奥斯汀机器人出租车业务尚处于极早期——截至 2026 年中商业运营仅数周
乘车次数：太少，统计上尚无意义
无人驾驶模式的归咎 AV 事故率：尚无数据

没有任何指数目前能捕捉的 Tesla 结构性优势：

拥有 600 万以上车辆的 FSD 监督车队，是全球最大的端到端神经网络驾驶真实世界概念验证。监督里程不等于无人驾驶里程，但在公共道路上有驾驶员监督并能干预的监督 FSD 的安全性，确实是真实的能力信号。解除接管率趋势每年提升约两倍（估计），是监督何时变为无人驾驶的领先指标。任何只计算今日无人驾驶里程的指数，都会系统性地低估 Tesla 的发展轨迹。

第五节——提议的 Physical AI Ramp Index 计分板

基于截至 2026 年中期的公开资料及估计数据：

维度	Waymo 得分	Tesla 得分	原因
安全（无人驾驶运营）	●●●●○	●○○○○	Waymo 有数百万无人驾驶里程；Tesla 机器人出租车仅数周
规模（无人驾驶）	●●●●○	●○○○○	每周 15 万次 vs 数百次；4 城市 vs 1 区域
能力成长速度	●●●○○	●●●●○	Tesla FSD 进步更快；Waymo 稳定但扩展较慢
商业可行性	●●●○○	●●○○○	Waymo 已创收；单位经济仍在改善；Tesla 太早期
人形机器人及更广泛机器人	○○○○○	●●●○○	Waymo 仅做 AV；Tesla 有 Optimus 量产计划
车队数据优势	●●○○○	●●●●●	Tesla 600 万监督车队；Waymo 1,000–1,500 辆无人驾驶
整体 Physical AI Ramp	●●●●○	●●●○○	Waymo 今日 AV 领先；Tesla 轨迹更强且范畴更广

关键结论： Waymo 今日在每一项可衡量的无人驾驶指标上领先 AV 竞赛。Tesla 在数据和轨迹竞赛中领先，并且是唯一有可信路径同时实现 L4 AV 和人形机器人规模化的公司。只计算今日无人驾驶里程的一维指数会遗漏全局——并系统性地偏向现有者而非挑战者。完整的 Physical AI Ramp Index 必须同时捕捉两个维度。

第六节——关于本系列

这是 Physical AI Benchmark 系列的第 80 篇。

本文新增了指标层面：现有 AV 安全指标为何不可比、真正的 Physical AI Ramp Index 应跨越四个维度衡量什么、截至 2026 年中期各领导厂商在每个维度的现状（估计），以及为何任何单一维度指数都无法捕捉真实竞争格局。

注意： 统计数据、车队规模、里程计数和评分在基于行业估计和公开报告的情况下标记为”（估计）“。本文不构成投资建议。