2026-06-18 — views
Physical AI 安全记录——自动驾驶汽车事故率对比人类驾驶及终极基准
加州 DMV、NHTSA 数据与 Waymo 安全报告揭示:AV 事故率与人类驾驶的差距,以及为何这是 Physical AI 的终极基准。
Physical AI 基准系列第 120 篇——Physical AI 安全记录:AV 事故率对比人类驾驶、加州 DMV 与 NHTSA 数据揭示的真相,以及为何安全统计是 Physical AI 的终极基准
每一个自动驾驶汽车的商业论点——单位经济效益、监管批准、乘客 NPS、投资者估值——最终都建立在一个根本问题上:自动驾驶汽车比人类驾驶更安全吗?这不是次要考量,也不是监管勾选项目,而是整个产业的核心前提。若 AV 无法证明比人类更安全,监管窗口将收窄、保险经济恶化、公众信任崩塌、投资论点瓦解。若能证明更安全,商业模型中的每个变量都会同步改善。安全统计不只是众多基准之一——它是其他所有基准的依附根基。
本文使用公开可查的数据,建立比较安全统计框架:加州 DMV 年度脱离报告、Waymo 自身安全报告、NHTSA 事故数据,以及 Tesla 向 NHTSA 提交的季度安全报告。目标是厘清 AV 目前相对于人类基准的位置、趋势线的走向,以及为何安全基准在结构上远比单纯的「每英里事故数」比较更为复杂。
第一节——人类驾驶基准
在评估 AV 安全数据之前,必须先确立 AV 必须超越的基准。美国人类驾驶基准来自 NHTSA 年度交通安全事实数据库,涵盖所有道路类型、所有天气条件、所有驾驶年龄及所有醉驾/分心状态。这是美国驾驶的全貌——不是精心筛选的理想条件子集。
| 安全指标 | 美国人类驾驶平均值 | 备注 / 来源 |
|---|---|---|
| 每 1 亿英里致命事故数 | 每 1 亿英里约 1.37 起死亡(NHTSA 2022 数据) | 全国平均值;包含所有道路类型、所有条件、所有年龄及醉驾状态 |
| 每 1 亿英里伤亡事故数 | 每 1 亿英里约 77 起(NHTSA 估计) | 伤亡 = 任何需要就医的事故 |
| 每 1 亿英里全部事故数 | 每 1 亿英里约 200-250 起(NHTSA 估计,含轻微事故) | 财损 + 伤亡 + 死亡合计 |
| 醉驾贡献 | 约 37% 的交通死亡涉及酒精(NHTSA) | AV 完全消除此类别 |
| 分心驾驶贡献 | 约 8-9% 的致命事故涉及分心(NHTSA) | AV 完全消除此类别 |
| 疲劳驾驶贡献 | 约 2-3% 的致命事故涉及昏睡(NHTSA;可能低报) | AV 完全消除此类别 |
| 人为错误整体占比 | 约 94% 的严重事故涉及人为错误(NHTSA 估计) | AV 的核心安全论点:消除人为错误 |
| 年轻驾驶风险 | 16-19 岁驾驶事故率是 20 岁以上的 3 倍(NHTSA) | AV 无论”年龄”均提供一致表现 |
94% 人为错误这个数字是 AV 安全论点的核心依据。若几乎所有严重事故都源于人类决策——醉酒、分心、疲劳、判断失误、超速——那么移除人类控制者的系统在理论上应能消除大多数事故。「理论上」这个词需谨慎对待:AV 必须消除人为错误,同时不引入新的故障模式(传感器失效、软件边缘案例、恶劣天气、不寻常道路配置)。因此安全基准不是「比普通人类更安全」,而是「比普通人类更安全,且不引入新的失效类别」。
第二节——Waymo 安全数据(已披露)
Waymo 是唯一积累足够里程并公开安全数据、可与人类基准进行统计意义比较的全无人商业 AV 运营商。截至 2026 年初,Waymo 已累积 5,000 万英里以上的无人商业里程——样本量足以进行死亡率和伤亡率比较。
| 指标 | Waymo 已披露数据 | 与人类基准比较 | 可信度 |
|---|---|---|---|
| Waymo One 无人里程(累计) | 截至 2026 年初超过 5,000 万无人商业英里(Waymo 公告) | 足以进行统计比较的样本量 | Waymo 披露 |
| 每 1 亿英里伤亡事故率(Waymo 无人) | Waymo 2023 年安全报告:在可比较城市里程中远低于人类基准 | 城市人类基准:每 1 亿英里约 76 起伤亡事故(估计);Waymo 远低于此(已报告) | Waymo 安全报告 |
| 气囊展开 / 严重事故率 | Waymo 报告 2023 年报告期间无人模式下零气囊展开事故 | 人类基准气囊展开事故:每 1 亿英里约 4-5 起(估计) | Waymo 2023 年安全报告 |
| 报告事故中的责任归属 | 加州 DMV 报告的事故中,大多数由对方驾驶造成(追撞停止的 Waymo、闯红灯冲入 Waymo 路径) | Waymo 车辆操作保守;更可能被撞而非主动碰撞 | 加州 DMV 事故报告 |
| 脱离率(加州 DMV 报告) | Waymo 在加州 DMV 报告的 AV 公司中脱离率最低之列;2022-2023 年报告持续改善 | 脱离率是系统信心的代理指标(非直接安全指标) | 加州 DMV 年度 AV 报告 |
| 需警察报告的事故率 | Waymo 公开声明其需警察报告的事故率低于可比较城市驾驶的人类基准 | 城市美国事故率:每 1 亿英里约 200 起(所有严重程度,估计) | Waymo 博客披露 |
| 行人 / 自行车事故 | 截至 2026 年中,Waymo One 无人服务中无行人死亡(估计) | 人类驾驶每年在美国造成约 7,500 起行人死亡(NHTSA) | 估计;Waymo 尚未披露死亡事故 |
Waymo 2023 年安全报告中零气囊展开事故的数字特别重要。气囊展开是高严重性撞击的代理指标——冲击力足以触发车辆自身安全系统的事故。人类基准的气囊展开事故率约为每 1 亿英里 4-5 起(估计)。Waymo 在数百万城市无人里程中报告零气囊展开,这一安全差距难以单纯归因于样本偏差。
加州 DMV 事故报告中的责任归属模式是第二个重要信号。当 Waymo 车辆涉及碰撞时,大多数事故涉及对方当事人为责任驾驶:另一辆车追撞静止或缓慢行驶的 Waymo,或驾驶闯红灯冲入 Waymo 路径。这一模式反映了 Waymo 保守的驾驶风格——系统调整为优先让行、停车和保持缓冲空间,而非强势机动。
第三节——Tesla FSD 安全数据
Tesla 的安全数据披露方式与 Waymo 根本不同。Tesla 向 NHTSA 提交季度安全数据并在官网发布摘要统计,而非向政府数据库提交全面安全报告。关键区别在于:Tesla 的 FSD 系统——包括商业部署的「Full Self-Driving」监督模式——始终有人类安全驾驶在场并能介入。这是监督式自动化系统,而非无人系统。
| 指标 | Tesla 已报告数据 | 备注 |
|---|---|---|
| Tesla Autopilot/FSD 事故率(NHTSA) | Tesla 向 NHTSA 提交季度安全数据;2023 年 Q4:Autopilot 下每 570 万英里 1 起事故 vs 未启用时每 150 万英里 1 起(Tesla 季度报告) | Autopilot 包含人类安全驾驶;非完全无人比较 |
| 比较注意事项 | Autopilot 和监督式 FSD 不等同于无人驾驶;人类在监控且可介入;安全效益包含人类干预,不仅是 AI 表现 | 与 Waymo 无人数据的直接比较方法论复杂 |
| NHTSA 调查 | 多起 NHTSA 对 Tesla Autopilot 事故的调查;多起涉及紧急车辆(停放的消防车、救护车);Tesla 已通过 OTA 更新回应 | NHTSA 尚未判定 Autopilot 有缺陷;调查为持续过程 |
| Tesla 安全声明 | Tesla Autopilot 下的车辆比美国平均驾驶安全约 4 倍(Tesla 季度安全报告表述) | 方法论争议:Autopilot 主要在高速公路启用,事故率本就较低 |
| FSD 无人驾驶(奥斯汀) | Tesla 奥斯汀机器人出租车采用监督式 FSD;无监督无人驾驶操作的安全记录尚未公开建立 | 这是关键数据缺口;随奥斯汀规模扩大将逐渐浮现 |
Tesla「安全 4 倍」声明背后的方法论争议是真实且重要的。Autopilot 主要在高速公路和受控道路上启用,而这些本就是低事故率环境。有效比较需要控制道路类型和驾驶环境——而 Tesla 的公开统计未能充分说明这一点。NHTSA 对 Tesla Autopilot 涉及紧急车辆事故的调查揭示了一个特定故障模式:系统对处于行驶车道中的静止物体(尤其是具有不寻常视觉特征的物体)的检测和规避能力。Tesla 已通过 OTA 更新解决多起此类事故,展示了 AV 架构软件可更新的优势。
第四节——为何安全统计是 Physical AI 的终极基准
安全统计在 AV 商业模型中占据独特地位:它同时是监管门槛、投资者信心信号、保险定价输入、公众信任驱动力,以及核心技术论点的主要验证。
| 机制 | 安全数据如何影响商业推进 | 风险 |
|---|---|---|
| 监管门槛 | 一起严重的 AV 责任死亡事故可暂停公司整个商业运营待查;加州在 2023 年事故后暂停了 Cruise 的运营 | 一起致命事故 = 数月至数年的监管审查;风险高度不对称 |
| Cruise 事件先例(2023 年 10 月) | GM Cruise 车辆撞上已被另一辆车击倒的行人,随后将其拖行 20 英尺;加州 DMV 在数周内暂停 Cruise 的无人许可证;Cruise 再未恢复商业运营(GM 于 2023 年底关闭该业务) | 行业定义性事件:证明监管机构会对安全事故迅速行动;为所有 AV 运营商设立标准 |
| 投资者信心 | Alphabet 持续对 Waymo 的投资部分依赖于干净的安全记录;重大责任事故将影响估值和融资 | Waymo 450 亿美元以上的估值意味着市场相信安全记录将持续 |
| 保险精算数据 | AV 保险公司需要统计数据来准确定价商业车队保障;更多里程加上干净记录带来更低保费(复利经济效益) | 良性循环:安全带来更低保费,带来更好单位经济 |
| 公众信任形成 | 公众对 AV 技术的信任脆弱;任何地方的高知名度事故(即使是不同公司)都会损害整个类别的信任 | 行业外部性:Cruise 事件使公众对 AV 的接受度下降 12-18 个月 |
| 94% 人为错误论点 | 若约 94% 的事故涉及人为错误(NHTSA),且 AV 消除人为错误,理论安全上限巨大;但 AV 也不能引入新故障模式 | 安全基准不是「比普通人类更安全」,而是「比最佳人类更安全且无新故障模式」 |
2023 年 10 月的 Cruise 事件确立了整个行业的监管风险模板。一辆 GM Cruise 机器人出租车在旧金山无人驾驶时,撞上了已被另一辆车击倒并抛入 Cruise 路径的行人,随后将其拖行约 20 英尺。加州 DMV 在数周内暂停 Cruise 的无人许可证。加上平行调查发现 Cruise 未向监管机构完整披露事故,公众和投资者信心丧失,GM 于 2023 年底关闭整个 Cruise 自动驾驶业务。数十亿美元的投资、庞大的旧金山车队,以及多年商业运营经验——在一起严重事故的数月后消失殆尽。
第五节——安全基准评分表:Waymo vs Tesla vs 人类基准
| 安全维度 | 人类驾驶 | Waymo(无人) | Tesla(监督式 FSD) |
|---|---|---|---|
| 醉驾风险 | 存在(约 37% 的死亡) | 已消除 | 已消除 |
| 分心驾驶风险 | 存在(约 8-9% 的死亡) | 已消除 | 降低(人类监控) |
| 疲劳风险 | 存在 | 已消除 | 降低 |
| 每 1 亿英里伤亡事故率 | 约 76(城市估计) | 远低于人类基准(已报告) | 比未启用 Autopilot 低约 4 倍(Tesla 声明) |
| 气囊展开事故率 | 每 1 亿英里约 4-5 起(估计) | 无人商业服务中约为 0(已报告) | FSD 未单独披露 |
| 行人死亡 | 美国每年约 7,500 起 | Waymo One 无人驾驶中无(估计) | Autopilot 下多起 NHTSA 调查事故 |
| 责任归属模式 | 因驾驶而异 | 大多数事故:对方负责(加州 DMV 数据) | NHTSA 调查进行中;紧急车辆事件 |
| 趋势 | 持平 / 缓慢改善(美国) | 随里程累积快速改善 | 随 OTA 更新改善 |
趋势线与绝对数字同等重要。Waymo 的安全指标随里程累积而改善——更多里程产生更多训练数据,进而改善模型,进而改善安全表现。这种复利动态意味着,今日的比较低估了 Waymo 在 5 亿英里对比 5 千万英里时的安全优势。人类驾驶基准则多年来基本持平。
第六节——迈向「可证明比人类更安全」表现的路径
统计挑战在于罕见事件——死亡事故——需要庞大的样本量才能确立信心。美国人类驾驶死亡率约为每 1 亿英里 1.37 起(NHTSA 2022)。要以统计显著性证明 AV 系统的死亡率低于此水准,需要足够的里程使预期死亡数达到若干起。在 1 亿英里时,按人类基准预期死亡数约为 1.37 起——统计力不足以断定 AV 费率更低。在 5 亿英里时,图像变得更清晰。在 10 亿英里时,比较具有统计稳健性。
Waymo 累计超过 5,000 万无人英里,正在接近伤亡事故率比较具统计意义的区间,但死亡率比较仍受样本量限制。无人驾驶中无死亡的记录是正面信号,但尚未是统计上更低死亡率的证明。在 5 亿英里零死亡时,「系统略微更安全且尚未碰上死亡概率」的解释将变得极不可能。行业在 2026 年中的轨迹表明,Waymo 无人城市运营的安全证明将在 2-4 年内完成,前提是车队持续增长且无重大责任事故。
注意: 标注「(估计)」的所有数字均来自截至 2026 年中的公开监管文件、公司公告、安全报告和行业估计。本文不构成投资或法律建议。
来源
- NHTSA 2022 年交通安全事实 — NHTSA ↗
- Waymo 2023 年安全报告 — Waymo ↗
- Tesla 季度安全报告 — Tesla ↗
- 加州 DMV 自动驾驶汽车测试年度报告 — 加州 DMV ↗
- NHTSA 自动驾驶系统调查 — NHTSA ↗