2026-06-18 — views

Physical AI 安全记录——自动驾驶汽车事故率对比人类驾驶及终极基准

加州 DMV、NHTSA 数据与 Waymo 安全报告揭示：AV 事故率与人类驾驶的差距，以及为何这是 Physical AI 的终极基准。

Physical AI 基准系列第 120 篇——Physical AI 安全记录：AV 事故率对比人类驾驶、加州 DMV 与 NHTSA 数据揭示的真相，以及为何安全统计是 Physical AI 的终极基准

每一个自动驾驶汽车的商业论点——单位经济效益、监管批准、乘客 NPS、投资者估值——最终都建立在一个根本问题上：自动驾驶汽车比人类驾驶更安全吗？这不是次要考量，也不是监管勾选项目，而是整个产业的核心前提。若 AV 无法证明比人类更安全，监管窗口将收窄、保险经济恶化、公众信任崩塌、投资论点瓦解。若能证明更安全，商业模型中的每个变量都会同步改善。安全统计不只是众多基准之一——它是其他所有基准的依附根基。

本文使用公开可查的数据，建立比较安全统计框架：加州 DMV 年度脱离报告、Waymo 自身安全报告、NHTSA 事故数据，以及 Tesla 向 NHTSA 提交的季度安全报告。目标是厘清 AV 目前相对于人类基准的位置、趋势线的走向，以及为何安全基准在结构上远比单纯的「每英里事故数」比较更为复杂。

第一节——人类驾驶基准

在评估 AV 安全数据之前，必须先确立 AV 必须超越的基准。美国人类驾驶基准来自 NHTSA 年度交通安全事实数据库，涵盖所有道路类型、所有天气条件、所有驾驶年龄及所有醉驾/分心状态。这是美国驾驶的全貌——不是精心筛选的理想条件子集。

安全指标	美国人类驾驶平均值	备注 / 来源
每 1 亿英里致命事故数	每 1 亿英里约 1.37 起死亡（NHTSA 2022 数据）	全国平均值；包含所有道路类型、所有条件、所有年龄及醉驾状态
每 1 亿英里伤亡事故数	每 1 亿英里约 77 起（NHTSA 估计）	伤亡 = 任何需要就医的事故
每 1 亿英里全部事故数	每 1 亿英里约 200-250 起（NHTSA 估计，含轻微事故）	财损 + 伤亡 + 死亡合计
醉驾贡献	约 37% 的交通死亡涉及酒精（NHTSA）	AV 完全消除此类别
分心驾驶贡献	约 8-9% 的致命事故涉及分心（NHTSA）	AV 完全消除此类别
疲劳驾驶贡献	约 2-3% 的致命事故涉及昏睡（NHTSA；可能低报）	AV 完全消除此类别
人为错误整体占比	约 94% 的严重事故涉及人为错误（NHTSA 估计）	AV 的核心安全论点：消除人为错误
年轻驾驶风险	16-19 岁驾驶事故率是 20 岁以上的 3 倍（NHTSA）	AV 无论”年龄”均提供一致表现

94% 人为错误这个数字是 AV 安全论点的核心依据。若几乎所有严重事故都源于人类决策——醉酒、分心、疲劳、判断失误、超速——那么移除人类控制者的系统在理论上应能消除大多数事故。「理论上」这个词需谨慎对待：AV 必须消除人为错误，同时不引入新的故障模式（传感器失效、软件边缘案例、恶劣天气、不寻常道路配置）。因此安全基准不是「比普通人类更安全」，而是「比普通人类更安全，且不引入新的失效类别」。

第二节——Waymo 安全数据（已披露）

Waymo 是唯一积累足够里程并公开安全数据、可与人类基准进行统计意义比较的全无人商业 AV 运营商。截至 2026 年初，Waymo 已累积 5,000 万英里以上的无人商业里程——样本量足以进行死亡率和伤亡率比较。

指标	Waymo 已披露数据	与人类基准比较	可信度
Waymo One 无人里程（累计）	截至 2026 年初超过 5,000 万无人商业英里（Waymo 公告）	足以进行统计比较的样本量	Waymo 披露
每 1 亿英里伤亡事故率（Waymo 无人）	Waymo 2023 年安全报告：在可比较城市里程中远低于人类基准	城市人类基准：每 1 亿英里约 76 起伤亡事故（估计）；Waymo 远低于此（已报告）	Waymo 安全报告
气囊展开 / 严重事故率	Waymo 报告 2023 年报告期间无人模式下零气囊展开事故	人类基准气囊展开事故：每 1 亿英里约 4-5 起（估计）	Waymo 2023 年安全报告
报告事故中的责任归属	加州 DMV 报告的事故中，大多数由对方驾驶造成（追撞停止的 Waymo、闯红灯冲入 Waymo 路径）	Waymo 车辆操作保守；更可能被撞而非主动碰撞	加州 DMV 事故报告
脱离率（加州 DMV 报告）	Waymo 在加州 DMV 报告的 AV 公司中脱离率最低之列；2022-2023 年报告持续改善	脱离率是系统信心的代理指标（非直接安全指标）	加州 DMV 年度 AV 报告
需警察报告的事故率	Waymo 公开声明其需警察报告的事故率低于可比较城市驾驶的人类基准	城市美国事故率：每 1 亿英里约 200 起（所有严重程度，估计）	Waymo 博客披露
行人 / 自行车事故	截至 2026 年中，Waymo One 无人服务中无行人死亡（估计）	人类驾驶每年在美国造成约 7,500 起行人死亡（NHTSA）	估计；Waymo 尚未披露死亡事故

Waymo 2023 年安全报告中零气囊展开事故的数字特别重要。气囊展开是高严重性撞击的代理指标——冲击力足以触发车辆自身安全系统的事故。人类基准的气囊展开事故率约为每 1 亿英里 4-5 起（估计）。Waymo 在数百万城市无人里程中报告零气囊展开，这一安全差距难以单纯归因于样本偏差。

加州 DMV 事故报告中的责任归属模式是第二个重要信号。当 Waymo 车辆涉及碰撞时，大多数事故涉及对方当事人为责任驾驶：另一辆车追撞静止或缓慢行驶的 Waymo，或驾驶闯红灯冲入 Waymo 路径。这一模式反映了 Waymo 保守的驾驶风格——系统调整为优先让行、停车和保持缓冲空间，而非强势机动。

第三节——Tesla FSD 安全数据

Tesla 的安全数据披露方式与 Waymo 根本不同。Tesla 向 NHTSA 提交季度安全数据并在官网发布摘要统计，而非向政府数据库提交全面安全报告。关键区别在于：Tesla 的 FSD 系统——包括商业部署的「Full Self-Driving」监督模式——始终有人类安全驾驶在场并能介入。这是监督式自动化系统，而非无人系统。

指标	Tesla 已报告数据	备注
Tesla Autopilot/FSD 事故率（NHTSA）	Tesla 向 NHTSA 提交季度安全数据；2023 年 Q4：Autopilot 下每 570 万英里 1 起事故 vs 未启用时每 150 万英里 1 起（Tesla 季度报告）	Autopilot 包含人类安全驾驶；非完全无人比较
比较注意事项	Autopilot 和监督式 FSD 不等同于无人驾驶；人类在监控且可介入；安全效益包含人类干预，不仅是 AI 表现	与 Waymo 无人数据的直接比较方法论复杂
NHTSA 调查	多起 NHTSA 对 Tesla Autopilot 事故的调查；多起涉及紧急车辆（停放的消防车、救护车）；Tesla 已通过 OTA 更新回应	NHTSA 尚未判定 Autopilot 有缺陷；调查为持续过程
Tesla 安全声明	Tesla Autopilot 下的车辆比美国平均驾驶安全约 4 倍（Tesla 季度安全报告表述）	方法论争议：Autopilot 主要在高速公路启用，事故率本就较低
FSD 无人驾驶（奥斯汀）	Tesla 奥斯汀机器人出租车采用监督式 FSD；无监督无人驾驶操作的安全记录尚未公开建立	这是关键数据缺口；随奥斯汀规模扩大将逐渐浮现

Tesla「安全 4 倍」声明背后的方法论争议是真实且重要的。Autopilot 主要在高速公路和受控道路上启用，而这些本就是低事故率环境。有效比较需要控制道路类型和驾驶环境——而 Tesla 的公开统计未能充分说明这一点。NHTSA 对 Tesla Autopilot 涉及紧急车辆事故的调查揭示了一个特定故障模式：系统对处于行驶车道中的静止物体（尤其是具有不寻常视觉特征的物体）的检测和规避能力。Tesla 已通过 OTA 更新解决多起此类事故，展示了 AV 架构软件可更新的优势。

第四节——为何安全统计是 Physical AI 的终极基准

安全统计在 AV 商业模型中占据独特地位：它同时是监管门槛、投资者信心信号、保险定价输入、公众信任驱动力，以及核心技术论点的主要验证。

机制	安全数据如何影响商业推进	风险
监管门槛	一起严重的 AV 责任死亡事故可暂停公司整个商业运营待查；加州在 2023 年事故后暂停了 Cruise 的运营	一起致命事故 = 数月至数年的监管审查；风险高度不对称
Cruise 事件先例（2023 年 10 月）	GM Cruise 车辆撞上已被另一辆车击倒的行人，随后将其拖行 20 英尺；加州 DMV 在数周内暂停 Cruise 的无人许可证；Cruise 再未恢复商业运营（GM 于 2023 年底关闭该业务）	行业定义性事件：证明监管机构会对安全事故迅速行动；为所有 AV 运营商设立标准
投资者信心	Alphabet 持续对 Waymo 的投资部分依赖于干净的安全记录；重大责任事故将影响估值和融资	Waymo 450 亿美元以上的估值意味着市场相信安全记录将持续
保险精算数据	AV 保险公司需要统计数据来准确定价商业车队保障；更多里程加上干净记录带来更低保费（复利经济效益）	良性循环：安全带来更低保费，带来更好单位经济
公众信任形成	公众对 AV 技术的信任脆弱；任何地方的高知名度事故（即使是不同公司）都会损害整个类别的信任	行业外部性：Cruise 事件使公众对 AV 的接受度下降 12-18 个月
94% 人为错误论点	若约 94% 的事故涉及人为错误（NHTSA），且 AV 消除人为错误，理论安全上限巨大；但 AV 也不能引入新故障模式	安全基准不是「比普通人类更安全」，而是「比最佳人类更安全且无新故障模式」

2023 年 10 月的 Cruise 事件确立了整个行业的监管风险模板。一辆 GM Cruise 机器人出租车在旧金山无人驾驶时，撞上了已被另一辆车击倒并抛入 Cruise 路径的行人，随后将其拖行约 20 英尺。加州 DMV 在数周内暂停 Cruise 的无人许可证。加上平行调查发现 Cruise 未向监管机构完整披露事故，公众和投资者信心丧失，GM 于 2023 年底关闭整个 Cruise 自动驾驶业务。数十亿美元的投资、庞大的旧金山车队，以及多年商业运营经验——在一起严重事故的数月后消失殆尽。

第五节——安全基准评分表：Waymo vs Tesla vs 人类基准

安全维度	人类驾驶	Waymo（无人）	Tesla（监督式 FSD）
醉驾风险	存在（约 37% 的死亡）	已消除	已消除
分心驾驶风险	存在（约 8-9% 的死亡）	已消除	降低（人类监控）
疲劳风险	存在	已消除	降低
每 1 亿英里伤亡事故率	约 76（城市估计）	远低于人类基准（已报告）	比未启用 Autopilot 低约 4 倍（Tesla 声明）
气囊展开事故率	每 1 亿英里约 4-5 起（估计）	无人商业服务中约为 0（已报告）	FSD 未单独披露
行人死亡	美国每年约 7,500 起	Waymo One 无人驾驶中无（估计）	Autopilot 下多起 NHTSA 调查事故
责任归属模式	因驾驶而异	大多数事故：对方负责（加州 DMV 数据）	NHTSA 调查进行中；紧急车辆事件
趋势	持平 / 缓慢改善（美国）	随里程累积快速改善	随 OTA 更新改善

趋势线与绝对数字同等重要。Waymo 的安全指标随里程累积而改善——更多里程产生更多训练数据，进而改善模型，进而改善安全表现。这种复利动态意味着，今日的比较低估了 Waymo 在 5 亿英里对比 5 千万英里时的安全优势。人类驾驶基准则多年来基本持平。

第六节——迈向「可证明比人类更安全」表现的路径

统计挑战在于罕见事件——死亡事故——需要庞大的样本量才能确立信心。美国人类驾驶死亡率约为每 1 亿英里 1.37 起（NHTSA 2022）。要以统计显著性证明 AV 系统的死亡率低于此水准，需要足够的里程使预期死亡数达到若干起。在 1 亿英里时，按人类基准预期死亡数约为 1.37 起——统计力不足以断定 AV 费率更低。在 5 亿英里时，图像变得更清晰。在 10 亿英里时，比较具有统计稳健性。

Waymo 累计超过 5,000 万无人英里，正在接近伤亡事故率比较具统计意义的区间，但死亡率比较仍受样本量限制。无人驾驶中无死亡的记录是正面信号，但尚未是统计上更低死亡率的证明。在 5 亿英里零死亡时，「系统略微更安全且尚未碰上死亡概率」的解释将变得极不可能。行业在 2026 年中的轨迹表明，Waymo 无人城市运营的安全证明将在 2-4 年内完成，前提是车队持续增长且无重大责任事故。

注意： 标注「（估计）」的所有数字均来自截至 2026 年中的公开监管文件、公司公告、安全报告和行业估计。本文不构成投资或法律建议。