2026-06-18 — views

自駕安全指標——為何沒有標準方式比較 Tesla 與 Waymo

各家 AV 公司使用不相容的安全指標。本文提出真正的 Physical AI Ramp Index 應衡量哪些項目，以及各領導廠商現況。

Physical AI Benchmark 系列第 80 篇——自駕安全指標：為何沒有標準方式比較 Tesla 與 Waymo

追蹤自駕車發展進程的根本問題之一，在於 Tesla、Waymo、Aurora 及所有 AV 公司都以不相容的指標來報告安全性與性能。Waymo 談論「嚴重事件之間的行駛里程」；Tesla 報告「每 1,000 英里 FSD 嚴重解除接管率」；Aurora 引用「每次干預的里程數」；加州 DMV 公佈的解除接管報告已被業者學會如何應付。目前沒有標準化的 Physical AI Ramp Index，沒有 AV 安全報告的 GAAP 等效標準，這讓回答業界最重要的問題幾乎不可能：到底誰在自駕車競賽中領先，速度有多快？

第一節——為何現有 AV 指標無從比較

每家公司公佈的指標，至少在一定程度上是因為這些指標能讓自己看起來更好。這不是陰謀，而是在沒有強制報告標準的競爭行業中的理性行為。結果是沒有兩家公司報告相同的事情。

指標	使用者	問題所在
解除接管之間的行駛里程	加州 DMV 報告（所有獲准 AV 業者）	定義各異——Waymo 計「為防止事故的人工接管」；Tesla 計「駕駛干預」——兩者不等
每千英里嚴重解除接管率	Tesla（FSD 報告）	Tesla 自定義「嚴重」——無外部稽核；涵蓋駕駛預計在場的監督駕駛
每次干預的里程	Aurora、Waymo（內部）	各公司對「干預」定義不同；何謂干預因協議而異
每百萬英里事故數	NHTSA Standing General Order（SGER）	最標準化的外部指標；但需 30 天延遲；事故定義仍有灰色地帶
每億英里行駛事故率	NHTSA/FHWA（人類基準）	人類基準：約每百萬英里 1.35 起（估計）；難以與 AV 運營組合比較
乘客舒適度評分	內部（無公開報告）	無外部標準；對商業可行性重要但外界看不到
可用性／正常運行時間	內部	多少比例的行程無需技術接管完成？任何公司均未公開報告

核心問題： AV 公司有動機選擇對自己最有利的指標。沒有相當於 GAAP 的 AV 安全報告標準。安全記錄真正不佳的公司可以選擇能掩蓋問題的指標——而缺乏強制性外部稽核標準意味著無法核實所公佈的數字。

第二節——真正的 Physical AI Ramp Index 應衡量什麼

一個可信的指數需要跨越四個維度的指標：安全性、規模、能力成長及商業可行性。每個維度都能捕捉其他維度無法捕捉的內容。

維度 A——安全性

指標	定義	重要原因
每百萬無人駕駛英里事故數（NHTSA 應報告）	需 NHTSA SGER 報告的碰撞事故，按每百萬自駕英里標準化	最可外部稽核；NHTSA 在 30 天內收到這些報告
每百萬英里歸咎 AV 的事故數	上述中調查認定 AV 有責任的子集	區分 AV 錯誤與混合交通中人為造成的事故
每 10 萬英里安全關鍵解除接管數	系統基於安全考量（非人類偏好）主動移交給人類的次數	將安全關鍵與舒適性解除接管分開

維度 B——規模

指標	定義	重要原因
累計無人駕駛英里數	無安全駕駛員在場的行駛里程	無人駕駛曝光規模——賦予安全統計意義的分母
每週無人駕駛付費乘車次數	有別於測試乘車；僅限創收	商業吸引力；需要願意付費的公共乘客
活躍無人駕駛車隊規模	無安全駕駛員運營的車輛	規模化硬體指標
地理覆蓋（無人駕駛 ODD 平方英里）	無人駕駛作業設計域的總平方英里	廣度與深度的取捨可見度

維度 C——能力成長

指標	定義	重要原因
ODD 擴展速度（每年城市數）	每年新增進入無人駕駛商業服務的城市	地理擴展速度
天氣條件覆蓋	無人駕駛處理的天氣事件百分比（雨、霧、雪）	惡劣條件下的能力深度
夜間及全天 24 小時運營百分比	夜間運營的服務時間百分比	證明系統非僅限白天

維度 D——商業可行性

指標	定義	重要原因
每無人駕駛英里收入	商業乘車收入除以英里（不分配駕駛成本）	單位經濟健康度
每車每日乘車次數	車隊利用率	運營效率
等待時間（中位數接送）	從請求到車輛到達的時間	消費者體驗品質
行程完成率	接受的乘車中無需人類接管完成的百分比	從乘客角度看可靠性

第三節——領導廠商現況（2026 年中期估計）

指標	Waymo	Tesla 機器人計程車	Aurora	備注
累計無人駕駛英里數	3,000 萬以上（估計）	不足 100 萬（估計——奧斯汀啟動階段）	約 500 萬（估計——貨運）	Waymo 的領先以商業運營年數計
每週付費無人駕駛乘車	15 萬次以上	數百至低千次（估計）	不適用（貨運）	Waymo 在乘車量上領先 100 倍以上
活躍無人駕駛車隊	1,000–1,500 輛（估計）	10–50 輛（估計——奧斯汀地理圍欄）	數十輛（估計——I-45）	不同規模的部署
每百萬英里 NHTSA 應報告事故數	未按模式公開拆分	未拆分	未拆分	最佳外部資料：Waymo 在某些披露中報告低於每百萬 1 起（估計）
商業城市（無人駕駛）	4 個（舊金山、鳳凰城、洛杉磯、奧斯汀）	1 個（奧斯汀，限制區域）	1 條走廊（I-45 貨運）	Waymo 地理廣度最大
全天 24 小時運營	是（舊金山、鳳凰城）	否（目前）	部分（高速公路時程）	Waymo 已驗證全天候能力
ODD 覆蓋（約）	4 城市數百平方英里（估計）	約 10–20 平方英里（估計奧斯汀地理圍欄）	約 240 英里走廊	ODD 類型差異極大
行程完成率	99% 以上（估計）	尚未達到可報告規模	不適用（貨運）	Waymo 高完成率是關鍵商業差異化

第四節——Tesla 的數據問題（及優勢）

Tesla 在任何 Physical AI Index 中都佔據獨特且真正異常的位置。該公司擁有世界上最大的真實駕駛數據集——卻幾乎沒有無人駕駛數據。

Tesla 公開報告的內容：

FSD 累計監督里程：約 50–60 億英里（估計）
解除接管率：定義為每 1,000 英里的嚴重干預，監督模式
通過 NHTSA SGER 報告的自動駕駛儀和 FSD 事故數據

尚無法報告的內容：

無人駕駛里程：奧斯汀機器人計程車業務尚處於極早期——截至 2026 年中商業運營僅數週
乘車次數：太少，統計上尚無意義
無人駕駛模式的歸咎 AV 事故率：尚無數據

沒有任何指數目前能捕捉的 Tesla 結構性優勢：

擁有 600 萬以上車輛的 FSD 監督車隊，是全球最大的端到端神經網路駕駛真實世界概念驗證。監督里程不等於無人駕駛里程，但在公共道路上有駕駛員監督並能干預的監督 FSD 的安全性，確實是真實的能力信號。解除接管率趨勢每年提升約兩倍（估計），是監督何時變為無人駕駛的領先指標。任何只計算今日無人駕駛里程的指數，都會系統性地低估 Tesla 的發展軌跡。

第五節——提議的 Physical AI Ramp Index 計分板

基於截至 2026 年中期的公開資料及估計數據：

維度	Waymo 得分	Tesla 得分	原因
安全（無人駕駛運營）	●●●●○	●○○○○	Waymo 有數百萬無人駕駛里程；Tesla 機器人計程車僅數週
規模（無人駕駛）	●●●●○	●○○○○	每週 15 萬次 vs 數百次；4 城市 vs 1 區域
能力成長速度	●●●○○	●●●●○	Tesla FSD 進步更快；Waymo 穩定但擴展較慢
商業可行性	●●●○○	●●○○○	Waymo 已創收；單位經濟仍在改善；Tesla 太早期
人形機器人及更廣泛機器人	○○○○○	●●●○○	Waymo 僅做 AV；Tesla 有 Optimus 量產計畫
車隊數據優勢	●●○○○	●●●●●	Tesla 600 萬監督車隊；Waymo 1,000–1,500 輛無人駕駛
整體 Physical AI Ramp	●●●●○	●●●○○	Waymo 今日 AV 領先；Tesla 軌跡更強且範疇更廣

關鍵結論： Waymo 今日在每一項可衡量的無人駕駛指標上領先 AV 競賽。Tesla 在數據和軌跡競賽中領先，並且是唯一有可信路徑同時實現 L4 AV 和人形機器人規模化的公司。只計算今日無人駕駛里程的一維指數會遺漏全局——並系統性地偏向現有者而非挑戰者。完整的 Physical AI Ramp Index 必須同時捕捉兩個維度。

第六節——關於本系列

這是 Physical AI Benchmark 系列的第 80 篇。

本文新增了指標層面：現有 AV 安全指標為何不可比、真正的 Physical AI Ramp Index 應跨越四個維度衡量什麼、截至 2026 年中期各領導廠商在每個維度的現況（估計），以及為何任何單一維度指數都無法捕捉真實競爭格局。

注意： 統計數據、車隊規模、里程計數和評分在基於行業估計和公開報告的情況下標記為「（估計）」。本文不構成投資建議。