2026-06-18 — views
自駕安全指標——為何沒有標準方式比較 Tesla 與 Waymo
各家 AV 公司使用不相容的安全指標。本文提出真正的 Physical AI Ramp Index 應衡量哪些項目,以及各領導廠商現況。
Physical AI Benchmark 系列第 80 篇——自駕安全指標:為何沒有標準方式比較 Tesla 與 Waymo
追蹤自駕車發展進程的根本問題之一,在於 Tesla、Waymo、Aurora 及所有 AV 公司都以不相容的指標來報告安全性與性能。Waymo 談論「嚴重事件之間的行駛里程」;Tesla 報告「每 1,000 英里 FSD 嚴重解除接管率」;Aurora 引用「每次干預的里程數」;加州 DMV 公佈的解除接管報告已被業者學會如何應付。目前沒有標準化的 Physical AI Ramp Index,沒有 AV 安全報告的 GAAP 等效標準,這讓回答業界最重要的問題幾乎不可能:到底誰在自駕車競賽中領先,速度有多快?
第一節——為何現有 AV 指標無從比較
每家公司公佈的指標,至少在一定程度上是因為這些指標能讓自己看起來更好。這不是陰謀,而是在沒有強制報告標準的競爭行業中的理性行為。結果是沒有兩家公司報告相同的事情。
| 指標 | 使用者 | 問題所在 |
|---|---|---|
| 解除接管之間的行駛里程 | 加州 DMV 報告(所有獲准 AV 業者) | 定義各異——Waymo 計「為防止事故的人工接管」;Tesla 計「駕駛干預」——兩者不等 |
| 每千英里嚴重解除接管率 | Tesla(FSD 報告) | Tesla 自定義「嚴重」——無外部稽核;涵蓋駕駛預計在場的監督駕駛 |
| 每次干預的里程 | Aurora、Waymo(內部) | 各公司對「干預」定義不同;何謂干預因協議而異 |
| 每百萬英里事故數 | NHTSA Standing General Order(SGER) | 最標準化的外部指標;但需 30 天延遲;事故定義仍有灰色地帶 |
| 每億英里行駛事故率 | NHTSA/FHWA(人類基準) | 人類基準:約每百萬英里 1.35 起(估計);難以與 AV 運營組合比較 |
| 乘客舒適度評分 | 內部(無公開報告) | 無外部標準;對商業可行性重要但外界看不到 |
| 可用性/正常運行時間 | 內部 | 多少比例的行程無需技術接管完成?任何公司均未公開報告 |
核心問題: AV 公司有動機選擇對自己最有利的指標。沒有相當於 GAAP 的 AV 安全報告標準。安全記錄真正不佳的公司可以選擇能掩蓋問題的指標——而缺乏強制性外部稽核標準意味著無法核實所公佈的數字。
第二節——真正的 Physical AI Ramp Index 應衡量什麼
一個可信的指數需要跨越四個維度的指標:安全性、規模、能力成長及商業可行性。每個維度都能捕捉其他維度無法捕捉的內容。
維度 A——安全性
| 指標 | 定義 | 重要原因 |
|---|---|---|
| 每百萬無人駕駛英里事故數(NHTSA 應報告) | 需 NHTSA SGER 報告的碰撞事故,按每百萬自駕英里標準化 | 最可外部稽核;NHTSA 在 30 天內收到這些報告 |
| 每百萬英里歸咎 AV 的事故數 | 上述中調查認定 AV 有責任的子集 | 區分 AV 錯誤與混合交通中人為造成的事故 |
| 每 10 萬英里安全關鍵解除接管數 | 系統基於安全考量(非人類偏好)主動移交給人類的次數 | 將安全關鍵與舒適性解除接管分開 |
維度 B——規模
| 指標 | 定義 | 重要原因 |
|---|---|---|
| 累計無人駕駛英里數 | 無安全駕駛員在場的行駛里程 | 無人駕駛曝光規模——賦予安全統計意義的分母 |
| 每週無人駕駛付費乘車次數 | 有別於測試乘車;僅限創收 | 商業吸引力;需要願意付費的公共乘客 |
| 活躍無人駕駛車隊規模 | 無安全駕駛員運營的車輛 | 規模化硬體指標 |
| 地理覆蓋(無人駕駛 ODD 平方英里) | 無人駕駛作業設計域的總平方英里 | 廣度與深度的取捨可見度 |
維度 C——能力成長
| 指標 | 定義 | 重要原因 |
|---|---|---|
| ODD 擴展速度(每年城市數) | 每年新增進入無人駕駛商業服務的城市 | 地理擴展速度 |
| 天氣條件覆蓋 | 無人駕駛處理的天氣事件百分比(雨、霧、雪) | 惡劣條件下的能力深度 |
| 夜間及全天 24 小時運營百分比 | 夜間運營的服務時間百分比 | 證明系統非僅限白天 |
維度 D——商業可行性
| 指標 | 定義 | 重要原因 |
|---|---|---|
| 每無人駕駛英里收入 | 商業乘車收入除以英里(不分配駕駛成本) | 單位經濟健康度 |
| 每車每日乘車次數 | 車隊利用率 | 運營效率 |
| 等待時間(中位數接送) | 從請求到車輛到達的時間 | 消費者體驗品質 |
| 行程完成率 | 接受的乘車中無需人類接管完成的百分比 | 從乘客角度看可靠性 |
第三節——領導廠商現況(2026 年中期估計)
| 指標 | Waymo | Tesla 機器人計程車 | Aurora | 備注 |
|---|---|---|---|---|
| 累計無人駕駛英里數 | 3,000 萬以上(估計) | 不足 100 萬(估計——奧斯汀啟動階段) | 約 500 萬(估計——貨運) | Waymo 的領先以商業運營年數計 |
| 每週付費無人駕駛乘車 | 15 萬次以上 | 數百至低千次(估計) | 不適用(貨運) | Waymo 在乘車量上領先 100 倍以上 |
| 活躍無人駕駛車隊 | 1,000–1,500 輛(估計) | 10–50 輛(估計——奧斯汀地理圍欄) | 數十輛(估計——I-45) | 不同規模的部署 |
| 每百萬英里 NHTSA 應報告事故數 | 未按模式公開拆分 | 未拆分 | 未拆分 | 最佳外部資料:Waymo 在某些披露中報告低於每百萬 1 起(估計) |
| 商業城市(無人駕駛) | 4 個(舊金山、鳳凰城、洛杉磯、奧斯汀) | 1 個(奧斯汀,限制區域) | 1 條走廊(I-45 貨運) | Waymo 地理廣度最大 |
| 全天 24 小時運營 | 是(舊金山、鳳凰城) | 否(目前) | 部分(高速公路時程) | Waymo 已驗證全天候能力 |
| ODD 覆蓋(約) | 4 城市數百平方英里(估計) | 約 10–20 平方英里(估計奧斯汀地理圍欄) | 約 240 英里走廊 | ODD 類型差異極大 |
| 行程完成率 | 99% 以上(估計) | 尚未達到可報告規模 | 不適用(貨運) | Waymo 高完成率是關鍵商業差異化 |
第四節——Tesla 的數據問題(及優勢)
Tesla 在任何 Physical AI Index 中都佔據獨特且真正異常的位置。該公司擁有世界上最大的真實駕駛數據集——卻幾乎沒有無人駕駛數據。
Tesla 公開報告的內容:
- FSD 累計監督里程:約 50–60 億英里(估計)
- 解除接管率:定義為每 1,000 英里的嚴重干預,監督模式
- 通過 NHTSA SGER 報告的自動駕駛儀和 FSD 事故數據
尚無法報告的內容:
- 無人駕駛里程:奧斯汀機器人計程車業務尚處於極早期——截至 2026 年中商業運營僅數週
- 乘車次數:太少,統計上尚無意義
- 無人駕駛模式的歸咎 AV 事故率:尚無數據
沒有任何指數目前能捕捉的 Tesla 結構性優勢:
擁有 600 萬以上車輛的 FSD 監督車隊,是全球最大的端到端神經網路駕駛真實世界概念驗證。監督里程不等於無人駕駛里程,但在公共道路上有駕駛員監督並能干預的監督 FSD 的安全性,確實是真實的能力信號。解除接管率趨勢每年提升約兩倍(估計),是監督何時變為無人駕駛的領先指標。任何只計算今日無人駕駛里程的指數,都會系統性地低估 Tesla 的發展軌跡。
第五節——提議的 Physical AI Ramp Index 計分板
基於截至 2026 年中期的公開資料及估計數據:
| 維度 | Waymo 得分 | Tesla 得分 | 原因 |
|---|---|---|---|
| 安全(無人駕駛運營) | ●●●●○ | ●○○○○ | Waymo 有數百萬無人駕駛里程;Tesla 機器人計程車僅數週 |
| 規模(無人駕駛) | ●●●●○ | ●○○○○ | 每週 15 萬次 vs 數百次;4 城市 vs 1 區域 |
| 能力成長速度 | ●●●○○ | ●●●●○ | Tesla FSD 進步更快;Waymo 穩定但擴展較慢 |
| 商業可行性 | ●●●○○ | ●●○○○ | Waymo 已創收;單位經濟仍在改善;Tesla 太早期 |
| 人形機器人及更廣泛機器人 | ○○○○○ | ●●●○○ | Waymo 僅做 AV;Tesla 有 Optimus 量產計畫 |
| 車隊數據優勢 | ●●○○○ | ●●●●● | Tesla 600 萬監督車隊;Waymo 1,000–1,500 輛無人駕駛 |
| 整體 Physical AI Ramp | ●●●●○ | ●●●○○ | Waymo 今日 AV 領先;Tesla 軌跡更強且範疇更廣 |
關鍵結論: Waymo 今日在每一項可衡量的無人駕駛指標上領先 AV 競賽。Tesla 在數據和軌跡競賽中領先,並且是唯一有可信路徑同時實現 L4 AV 和人形機器人規模化的公司。只計算今日無人駕駛里程的一維指數會遺漏全局——並系統性地偏向現有者而非挑戰者。完整的 Physical AI Ramp Index 必須同時捕捉兩個維度。
第六節——關於本系列
這是 Physical AI Benchmark 系列的第 80 篇。
本文新增了指標層面:現有 AV 安全指標為何不可比、真正的 Physical AI Ramp Index 應跨越四個維度衡量什麼、截至 2026 年中期各領導廠商在每個維度的現況(估計),以及為何任何單一維度指數都無法捕捉真實競爭格局。
注意: 統計數據、車隊規模、里程計數和評分在基於行業估計和公開報告的情況下標記為「(估計)」。本文不構成投資建議。