2026-06-18 — views

2026 實體 AI 行人與騎士安全——Waymo 多感測器 VRU 偵測對比 Tesla FSD 純視覺夜間表現：自動駕駛安全基準

Waymo LIDAR 在夜間偵測行人的能力與正午相同。Tesla FSD 純視覺系統依賴頭燈與神經網路。夜間 VRU 安全是關鍵戰場。

實體 AI 基準系列第 197 篇——易受傷害道路使用者安全

行人、騎自行車者及其他易受傷害道路使用者（VRU）是自動駕駛車（AV）設計中風險最高的安全挑戰。一輛 2 噸重的自動駕駛車以時速 25 英里撞上行人，幾乎必然對 VRU 造成嚴重或致命的後果。本基準的核心架構問題因此不僅僅是性能問題——而是安全架構問題：在 VRU 碰撞最可能發生的場景——黑暗、降雨、遮蔽——中，具主動光達（LIDAR）照明的多感測器方案是否比純視覺神經網路方案提供結構性安全優勢？

Waymo 的多感測器融合系統（光達 LIDAR＋雷達＋攝影機）與 Tesla 全自動輔助駕駛（FSD）的純視覺神經網路，代表 2026 年商業規模下兩種主流 AV 設計哲學。本基準從五個維度系統性比較其 VRU 偵測能力：VRU 類別風險、多感測器對比純視覺偵測、夜間表現（關鍵戰場）、騎士預測，以及整體安全評分卡。

第一節——為何 VRU 安全是最高風險的 AV 挑戰

VRU——行人、騎自行車者、機車騎士、兒童、輪椅使用者、電動滑板車與電動自行車騎士——在交通生態系統中處於最脆弱的位置。與車對車碰撞不同，後者的潰縮區、安全帶和安全氣囊將碰撞能量分散在兩個受保護的乘員艙；VRU 碰撞則將人體完全暴露於 2 噸車輛的全部動能之下，毫無自身防護結構。以時速 25 英里計算，行人碰撞所攜帶的動能約為時速 10 英里的 4 倍——這個差距決定了傷害是中度還是致命。

AV 系統必須在各種複雜條件下偵測 VRU：

低環境光： 人類駕駛交通中的行人死亡事故在傍晚及夜間達到高峰（根據美國公路交通安全局（NHTSA）交通安全數據，估計 75% 的美國行人死亡事故發生於黑暗環境）；任何 AV 系統都必須在人類表現最差的條件下達到或超越人類駕駛的 VRU 偵測能力
惡劣天氣： 降雨和霧氣會大幅降低攝影機能見度；夜間霧中穿著深色衣物的 VRU 是攝影機偵測的高難度問題
遠距離偵測： 以時速 45 英里（城市快速道路速度）行駛時，安全煞車需要估計 50–70 公尺的偵測距離；在住宅區以時速 25 英里行駛時，偵測距離要求較低，但反應時間仍至關重要
部分遮蔽： 從停靠車輛後方走出的兒童，從首次偵測到完全停車只有估計 0.5–1.5 秒的反應時間——短於多數人類駕駛反應時間；能夠在尚未偵測到任何 VRU 之前就在已知遮蔽點主動減速的 AV 系統具有結構性安全優勢
不可預測行為： 追球跑入街道的兒童、在斑馬線中途折返的醉酒行人、突然轉向的騎士——AV 系統必須預測並禮讓不遵循正常交通模式的 VRU 行為

VRU 類別及其特定偵測挑戰：

VRU 類別	偵測挑戰	速度範圍	最危險情境
行人（成人）	直立雙足輪廓是最清晰的 VRU 偵測類別；挑戰在於夜間深色衣物	步行：1.2–1.8 公尺/秒	夜間穿深色衣物在非路口橫越馬路
兒童	身材矮小降低攝影機系統的偵測距離；移動速度較快且難以預測	步行：1.0–1.5 公尺/秒；奔跑：3–5 公尺/秒	從停靠車輛之間奔跑進入車道
騎自行車者	窄小輪廓、動態速度與方向變化、與車道互動	城市騎行：4–8 公尺/秒	突然轉向躲避障礙物；高速穿越路口
機車騎士	雷達反射截面窄（最難被雷達偵測的 VRU）；加州允許車道分割；高速	城市/公路：15–35 公尺/秒	在車流間車道分割；突然煞車
電動滑板車/電動自行車騎士	比行人快，通常無燈光，有時在自行車道逆行；較舊 AV 模型的罕見分類	4–8 公尺/秒	夜間無燈騎行，在自行車道逆行
輪椅使用者	低矮輪廓；當人行道受阻時可能在車道上移動；速度比行人慢	0.5–1.5 公尺/秒	在非指定地點穿越；因人行道受阻而在車道上移動

VRU 安全的法規環境正在收緊：

NHTSA 常設通報令（2021 年）： 要求 AV 運營商和部分自動化系統運營商在 24 小時內（嚴重事故）或每年（輕微事故）向 NHTSA AV 碰撞資料庫通報事故；該資料庫可公開查詢
加州 DMV AV 事故通報： 要求所有 AV 運營商通報涉及其 AV 的任何事件，不僅限於碰撞事故；加州是 Waymo 和 Tesla AV 運營的主要法規環境
ISO 21448（SOTIF）： 預期安全功能標準（Safety Of The Intended Functionality）特別將 VRU 互動列為第一層級測試場景類別；SOTIF 合規正成為受監管市場商業 AV 部署的事實要求
歐盟 AV 法規（預期 2025–2026 年）： 將 VRU 保護列為第一層級安全要求；法規草案語言特別強調 VRU 密集城市環境中無人駕駛運營的感測器冗餘

公眾審查環境放大了風險：一起 AV/行人事件所受到的媒體報導比同等人類駕駛事件不成比例地多。一起高知名度的 VRU 事件可能觸發監管審查、車隊暫停和重大公眾信任損失——2023 年 10 月 Cruise 在舊金山因行人碰撞事件被暫停即為明證。VRU 安全記錄因此不僅是安全指標，更是存亡攸關的商業風險指標。

第二節——Waymo 的 VRU 偵測：多感測器融合優勢

VRU 偵測維度	Waymo 方法	詳細說明	安全意涵
基於光達 LIDAR 的 VRU 偵測（日間與夜間）	主動感測器：發射雷射脈衝；測量飛行時間；偵測精度不受環境光影響	光達 LIDAR 以公分級空間解析度偵測行人形狀物體（直立雙足輪廓），偵測距離估計 100–300 公尺（估計值）；在黑暗與完全日光下偵測效果相同——光達不依賴反射的環境光	夜間光達 VRU 偵測是 Waymo 的結構性安全優勢：在行人死亡事故最多的時段（深夜/夜間），光達保持完整偵測能力，而基於攝影機的系統則面臨最大性能差距
基於雷達的 VRU 速度測量	雷達測量物體的都卜勒速度；在零能見度霧中仍能區分移動行人（都卜勒速度符合人類步行速度約 1.4 公尺/秒）與靜止物體	雷達能穿透遮蔽攝影機的雨霧；即使光達和攝影機能見度下降時仍能提供 VRU 速度	雷達 VRU 偵測在舊金山頻繁的沿岸霧氣中特別有價值；光達（空間）＋雷達（速度）＋攝影機（視覺分類）＝三條獨立的 VRU 偵測路徑
基於攝影機的 VRU 視覺分類	攝影機提供語義 VRU 資訊：身體姿勢（朝向或背向？）、行人意圖（看手機還是與駕駛目光接觸？）、騎士手勢、兒童與成人識別、輪椅分類	攝影機提供光達點雲和雷達都卜勒無法提供的行為語境：一個在斑馬線看手機的行人與一個與駕駛目光接觸的行人，即使空間位置相同，行為上也截然不同	攝影機是 VRU 行為意圖層；光達是精確空間位置層；雷達是速度層；三感測器融合同時實現可靠偵測與行為預測
遮蔽處理	Waymo 的高精地圖為遮蔽場景提供語境：系統知道特定斑馬線的停靠車輛會形成行人可能出現的部分遮蔽區；在偵測到任何 VRU 之前主動減速	地圖感知遮蔽意識使 Waymo 能在任何感測器偵測到 VRU 之前主動減速——它從地圖得知行人可能從特定斑馬線位置的停靠車輛後方出現	高精地圖＋光達空間感知＋行為預測＝具有多重獨立保障的遮蔽安全系統；從停靠車輛後方奔跑出來的兒童在出現在任何感測器視野之前就已觸發主動減速
騎士與微型交通工具預測	Waymo 基於多年舊金山和鳳凰城的商業數據訓練了騎士行為預測模型；根據航向、速度和道路語境估計 2–5 秒後的騎士位置	騎士行為比行人行為更難預測（騎士移動更快，與交通互動更動態）；Waymo 的預測已在多個城市和多年的真實城市騎士行為上訓練	真實商業城市騎士的長期訓練歷史是一個重要優勢；早期 AV 系統在城市騎行上舉步維艱，因為騎士在訓練數據中代表性不足
安全記錄（VRU）	Waymo 的 NHTSA SGO 和加州 DMV 事故報告顯示部分低速事件；Waymo 發布的安全報告稱截至 2026 年中期，商業無人駕駛運營中零 VRU 生命威脅傷亡（依公開報告）	完整事件資料庫可通過 NHTSA SGO 和加州 DMV 公開記錄查詢；媒體報導的事件包括車輛碰撞騎士自行車（騎士未受傷），以及車輛異常停車導致人類駕駛輕微追尾	Waymo 在商業無人駕駛運營中的 VRU 安全記錄相較人類駕駛基準表現強勁；然而，其車隊規模較小（估計 2,500 輛以上，估計每週 150,000 次以上乘車），相對 Tesla（估計 600 萬輛以上）——統計比較需要費率標準化，而非絕對數量比較

第三節——Tesla FSD 的純視覺 VRU 偵測

VRU 偵測維度	Tesla 方法	詳細說明	安全意涵
純視覺 VRU 偵測	Tesla FSD 完全依賴攝影機進行 VRU 偵測（搭載 Tesla Vision 的新款 Model 3/Y 無光達、無雷達）；FSD 神經網路必須僅憑攝影機輸入在所有光線和天氣條件下偵測所有 VRU 類別	低光條件下基於攝影機的 VRU 偵測比基於光達的更困難：攝影機需要環境光或主動光源在 VRU 和背景之間創造對比；夜間僅由車輛頭燈照明的穿著深色衣物行人，比同一場景在日光下更難偵測	夜間 VRU 偵測是純視覺 AV 的主要結構性限制：估計 75% 的美國行人死亡事故發生於黑暗條件（NHTSA 數據）；純視覺 AV 系統必須單靠神經網路和頭燈工程在夜間達到等同光達的 VRU 偵測性能
端對端 VRU 學習	Tesla 的端對端 FSD 神經網路已在估計 60 億英里以上的人類駕駛監督數據上訓練，包括跨越多樣地理、光線條件和天氣的數百萬 VRU 互動場景	規模優勢：Tesla 訓練數據包含的 VRU 場景多樣性比 Waymo 更多，因為其車隊規模遠大，且涵蓋所有道路類型和時段的消費者駕駛	訓練數據規模是 VRU 場景多樣性優勢；品質限制：VRU 場景中人類駕駛行為並非始終是安全金標準——訓練數據同時包含人類 VRU 偵測錯誤和正確回應
主動頭燈輔助夜間 VRU 偵測	Tesla 使用車輛頭燈照亮前方道路供攝影機偵測；FSD 攝影機採用高靈敏度影像感測器針對低光性能設計；每一代神經網路更新後夜間 FSD 性能均有顯著提升	頭燈照明的攝影機偵測對正前方頭燈照射錐內的 VRU 效果良好；來自周邊（側街、車道）的 VRU 及複雜環境光場景仍存在挑戰	Tesla 夜間攝影機性能顯著優於標準汽車攝影機；但主動光達照明以高空間解析度同時照亮所有方向，而頭燈主要照亮前方錐形區域
騎士預測	FSD 已在美國消費者車隊中數十億英里的人類駕駛對騎士反應數據上訓練；騎士預測是 FSD 在消費者部署中展示顯著進步的領域	消費者 FSD 用戶對騎士處理的評價褒貶不一；Tesla 未公布系統性騎士互動性能數據	消費者車隊部署意味著 FSD 每週遇到的騎士場景遠多於 Waymo；這種騎士場景的規模優勢有利於通過持續重新訓練改進預測模型
已知的 FSD VRU 限制（已報告）	NHTSA 調查包括對 FSD 在緊急車輛附近（VRU 密集環境）和公路施工區（工人是 VRU）行為的調查；2023 年 FSD v11.x 召回涉及斑馬線行人行為	每次 NHTSA 召回/調查代表一個 FSD 行為被認定不足的 VRU 場景；OTA 更新解決了已報告問題；但純視覺 VRU 邊緣案例導致召回的模式，相對於 Waymo 的多感測器冗餘，是一個結構性架構差異	純視覺 VRU 偵測需要持續改進神經網路以解決光達可通過獨立主動感測處理的邊緣案例
安全記錄（VRU，消費者 FSD）	Tesla 依常設通報令向 NHTSA 提交 AV 碰撞報告；Tesla 報告顯示消費者 FSD 碰撞事故多數涉及追尾和變道失誤，而非 VRU 碰撞；VRU 特定費率未在公開報告中單獨列出	NHTSA SGO 碰撞資料庫可公開查詢；VRU 特定分析需要按碰撞類型篩選；Tesla 消費者車隊以絕對數量產生更多碰撞（行駛里程遠更多），但相關指標是每百萬 FSD 啟用英里碰撞次數——未單獨披露	Tesla 未公布每百萬英里 FSD 啟用 VRU 碰撞率；沒有這個費率，無法對 Waymo 無人駕駛 VRU 記錄進行方法論上有效的直接比較

第四節——夜間安全：關鍵 VRU 戰場

夜間是基於光達和純視覺 VRU 偵測之間架構差異具有最大安全意涵的場景。NHTSA 行人死亡數據顯示，約四分之三的美國行人死亡事故發生於黑暗條件——使夜間表現成為 VRU 安全最重要的單一維度，而不僅僅是眾多維度之一。

夜間 VRU 維度	Waymo 光達系統	Tesla 純視覺系統	為何重要
基本偵測機制	光達發射自有 905nm 雷射脈衝；偵測不受環境光影響；夜間穿著全黑衣物的行人以與日光下相同的距離和解析度被偵測到	攝影機需要反射光（環境路燈或車輛頭燈）；低環境光環境需要高靈敏度影像感測器和神經網路適應感測器雜訊	光達夜間偵測在物理上與日間偵測相同——無性能下降；基於攝影機的偵測在夜間面臨光達不存在的物理性能上限
夜間偵測距離（估計）	光達在夜間條件下偵測行人大小物體估計可達 100–200 公尺（估計值）；雷達以更低空間解析度偵測移動 VRU 距離更遠	夜間基於攝影機的偵測距離受頭燈照射距離限制：近光燈估計 50–100 公尺，遠光燈估計 150–200 公尺（估計值）；頭燈照射錐外的 VRU 可能直到更近才被偵測到	時速 35 英里的煞車距離約需 35 公尺；時速 45 英里約需 55 公尺；頭燈照射距離（尤其近光燈）在較高城市速度下對突然出現的 VRU 可能不足
夜間部分遮蔽	光達 360 度覆蓋同時偵測來自任何方向的 VRU 反射；從側面踏下路沿的行人在所有光線條件和任何接近角度下均被偵測到	攝影機頭燈主要照亮前方錐形區域；從側面或後方接近的行人不在頭燈光束中，可能直到進入前方弧形區域才對前向攝影機可見	Waymo 光達提供 360 度夜間 VRU 偵測；Tesla 頭燈照明攝影機主要覆蓋前方弧形——結構性偵測幾何差異
行人死亡率語境	NHTSA 數據：人類駕駛行人死亡事故在深夜/夜間達到高峰；黑暗條件（無路燈或頭燈不足）是最危險的行人碰撞環境；任何 AV 系統必須在這種最高風險光線條件下超越人類駕駛性能	任何 AV VRU 安全主張都必須具體說明夜間表現——行人死亡事故最多的時段，正是光達相對純視覺系統具有最大結構性性能優勢的時段	這是最重要的 VRU 安全維度：基於光達和純視覺夜間偵測之間的差距，與最高風險和較低風險行人碰撞時段之間的差距完全吻合
天氣性能下降	降雨和霧氣在極端密度下會降低光達性能；然而雷達能可靠穿透兩種條件；光達＋雷達＋攝影機組合即使在惡劣天氣下也能提供冗餘 VRU 偵測	降雨和霧氣直接降低攝影機能見度；大雨可能在安全煞車所需距離上遮蔽前方攝影機的行人；針對惡劣天氣訓練的神經網路能提高性能，但無法克服降水造成的物理遮光	感測器冗餘意味著即使主要感測器（光達、攝影機）因天氣受損，Waymo 仍有備用 VRU 偵測（雷達速度）；純視覺系統沒有獨立的後備感測器

夜間安全分析匯聚到一個結構性結論：光達的光源獨立 VRU 偵測在行人死亡事故最多且基於攝影機偵測面臨最大性能懲罰的確切時段（深夜至午夜）內，以零性能下降運作。這不是邊際差異——而是在 VRU 安全最高後果運作條件下的安全架構差異。

第五節——VRU 安全基準評分卡

VRU 安全維度	Waymo	Tesla FSD	優勢	2028 年展望
夜間 VRU 偵測	高：光達提供光源獨立的 VRU 偵測；夜間與日間無性能差距	中：基於攝影機的偵測受頭燈距離和環境光限制；神經網路工程顯著緩解但無法匹敵光達物理特性	Waymo——最高風險光線條件下的結構性光達優勢	光達成本下降和攝影機神經網路持續改進；差距縮小但光達保留物理夜間偵測優勢至 2028 年
多感測器 VRU 冗餘	高：光達（空間）＋雷達（速度）＋攝影機（視覺分類）＝三條獨立偵測路徑；任何單一感測器故障均由其他兩條路徑補償	低：純視覺意味著單一感測器故障模式（鏡片污染、眩光偽影、神經網路邊緣案例）對 VRU 偵測沒有獨立後備	Waymo——三條獨立感測器路徑對比一條	沒有雷達/光達的 Tesla 在架構上無法實現感測器冗餘；這是根本性而非漸進性差異
騎士行為預測	高：多年舊金山和鳳凰城商業無人駕駛城市騎士數據；預測在真實商業騎行場景上訓練	高：數十億英里人類駕駛數據，包含龐大的騎士場景多樣性；場景廣度的規模優勢	大致相當——各有優勢：Waymo＝無人駕駛語境品質；Tesla＝規模/多樣性	雙方均隨更多數據改進；比較需要目前尚未提供的每場景公開性能指標
兒童與微型交通工具偵測	強：光達無論高度或大小均偵測所有實體物件；兒童可在與成人相同的距離被偵測到；電動滑板車的小雷達截面由光達補償	依賴訓練數據：依賴在兒童/微型交通工具場景上訓練的神經網路；兒童較矮的身高是基於攝影機偵測在較遠距離的已知挑戰	Waymo——光達尺寸無關的偵測對較矮 VRU 是結構性優勢	神經網路改進幫助 Tesla；光達尺寸無關性至 2028 年仍是根本架構優勢
遮蔽安全	強：高精地圖在偵測到任何 VRU 之前提供主動斑馬線減速；光達提供遮蔽物周圍的空間語境	標準：FSD 從視覺場景語境推斷遮蔽風險；在已知遮蔽位置無基於地圖的主動減速	Waymo——高精地圖＋光達在已知遮蔽點啟用主動安全邊際	Tesla 端對端模型可從訓練中學習遮蔽風險推斷；基於地圖的主動減速仍是 Waymo 特有的結構性能力
法規事件透明度	高：NHTSA SGO＋加州 DMV 事故報告可公開查詢；Waymo 發布具有具體安全指標的年度安全報告	中：已提交 NHTSA SGO 報告；VRU 特定碰撞率未單獨公布；FSD 啟用碰撞率未披露	Waymo——更透明的 VRU 安全報告使外部驗證成為可能	雙方公司均面臨 VRU 特定數據的日益嚴格法規要求；強制 VRU 費率披露可能於 2028 年前實施

總體結論： 夜間 VRU 偵測是多感測器對比純視覺架構差異具有最明確和最重要安全意涵的領域。光達的光源獨立 VRU 偵測是在人類駕駛行人死亡事故最多的確切條件下發揮作用的主動安全機制。Tesla 的純視覺方案要求神經網路在夜間解決一個從根本上更難的感知問題——儘管 FSD 在每個版本都有顯著改進，但純視覺夜間偵測在不進行根本性感測器架構變更的情況下，無法匹敵光達的物理級夜間偵測能力。

對於大規模商業無人駕駛運營，VRU 安全法規環境正朝著多感測器冗餘要求方向演進。歐盟 AV 法規草案和美國 NHTSA 的 AV 安全框架均強調完全無人駕駛（非監督型）AV 服務的感測器冗餘。Tesla 的純視覺架構在 VRU 安全要求針對無人駕駛部署收緊時——而非針對在不同法規層級下運作的監督型消費者 FSD——可能面臨日益增加的法規阻力。在當前法規和安全架構格局下，結構性感測器優勢屬於 Waymo；Tesla 的神經網路改進軌跡能否在 2028 年前縮小差距，是本基準下一代的關鍵問題。

資料來源：NHTSA 常設通報令 AV 碰撞資料庫（nhtsa.gov）；加州 DMV AV 事故報告（dmv.ca.gov）；Waymo 安全報告（waymo.com/safety）；NHTSA 行人安全數據（nhtsa.gov/road-safety/pedestrian-safety）。所有標記為（估計）的數據均為基於公開披露、法規申報和第三方報告的估計值；尚未經獨立驗證。