2026-06-18 — views
物理AI感測器 — Waymo 雷達+攝影機+雷射雷達融合 vs Tesla 純視覺FSD:感知硬體基準測試 2026
Waymo 融合雷射雷達、攝影機與雷達,打造冗餘3D感知。Tesla 僅用攝影機——每輛車成本低10至30倍——押注AI能彌補攝影機的弱點。
概覽
感測器堆疊是自動駕駛車輛設計中最根本的硬體決策。Waymo 採用雷射雷達(lidar)、攝影機與雷達三種感測器融合,建立具備冗餘能力的感知系統。Tesla 則僅使用攝影機——純視覺方案——主張只要AI足夠強大,雷射雷達只是多餘的昂貴支撐。這場辯論對車輛成本、惡劣環境下的感知可靠性,以及處理感測器資料所需的AI類型,均有深遠影響。本文為物理AI基準測試系列第168篇。
第一節 — Waymo 感測器套件:雷射雷達 + 攝影機 + 雷達融合
Waymo Gen 6 車輛部署三種互補的感測模態,相互彌補彼此的弱點,建構無單點故障的感知系統。
| 感測器維度 | Waymo 詳情 | 策略意義 |
|---|---|---|
| 雷射雷達(主要測距感測器) | Waymo Gen 6 使用自研雷射雷達;lidar 發射雷射脈衝並量測飛行時間,建立精準3D點雲;射程達200m以上(估計);在黑暗中及多數天氣條件下均可運作 | Lidar 提供攝影機無法匹敵的公尺級精準3D幾何;昏暗光線下50m處的行人,lidar能清楚偵測,即便攝影機對比度不足 |
| 自研雷射雷達開發 | Waymo 自Google SDC計畫起即開發自有lidar;多代自研雷射雷達(Honeybee、Laser Bear Honeybee等);從Gen 5到Gen 6成本大幅降低 | 自研lidar大幅降低單位成本,優於採購商用lidar;Waymo自研lidar性能更強且更便宜 |
| 攝影機陣列 | Gen 6 使用多攝影機陣列提供360度視覺覆蓋;攝影機捕捉lidar無法提供的顏色、紋理與語義資訊(辨識路標、號誌、車道線) | 攝影機與lidar互補:lidar提供深度與幾何,攝影機提供語義與顏色;融合感知優於任一單一感測器 |
| 雷達 | 短程與長程雷達透過都卜勒效應量測附近物體的速度;雷達在豪雨、濃霧與沙塵中仍可運作 | 雷達的速度量測在惡劣天氣中不可或缺:豪雨中lidar點雲變得雜訊;濃霧中攝影機失去對比度;雷達均可穿透 |
| 感測器融合 | Waymo感知系統在感測器層與物體層均進行lidar、攝影機、雷達資料融合;融合表示比任何單一感測器更豐富且可靠 | 感測器融合提供冗餘:若一種感測器退化(lidar鏡頭沾水、攝影機眩光),其他感測器維持感知品質 |
| 感測器成本(Gen 6) | Waymo 指出從Gen 5到Gen 6成本顯著降低;Gen 6精確成本未公開;業界估計完整lidar+攝影機+雷達套件每輛車約5千至1.5萬美元(估計) | 即使每輛車5千美元,感測器成本仍是重大製造成本項目;Tesla 純攝影機方案完全排除此成本——8攝影機FSD陣列估計僅200至500美元(估計) |
| 感測器評語 | Waymo的多感測器方案是工程安全的選擇:感測模態越多,冗餘越高,各種條件下的感知越可靠。成本代價是真實且顯著的。核心問題在於:這種冗餘對商業AV安全是否必要,還是攝影機加AI就能在更低成本下達到相同可靠性——這就是Tesla的賭注。 |
第二節 — Tesla 感測器套件:純視覺(僅攝影機)
Tesla HW4平台使用9顆攝影機,不含lidar或雷達。這個賭注是:以足夠的攝影機資料訓練的AI,能匹敵甚至超越lidar的感知能力。
| 感測器維度 | Tesla 詳情 | 策略意義 |
|---|---|---|
| 攝影機陣列(HW4) | Tesla HW4 使用9顆攝影機(8顆環繞+1顆遠程前向);提供360度覆蓋;解析度優於HW3;由Tesla自研FSD電腦處理 | 9顆攝影機提供完整空間覆蓋;FSD電腦同時處理所有攝影機串流,輸出單一神經網路結果 |
| Tesla為何捨棄lidar與雷達 | Musk 主張lidar是「拐杖」,一旦攝影機與AI足夠好就不再需要;人類用兩眼(攝影機)駕駛,不靠lidar;lidar增加成本與複雜度卻不根本提升大規模安全性;Tesla 於2021至2022年從多數車型移除雷達 | 純視覺賭注基於特定假設:以足夠規模的攝影機資料訓練的AI,能匹敵或超越lidar感知;此假設在完全無人駕駛商業規模下尚未證實 |
| 「AI彌補感測器限制」論點 | Tesla立場:lidar讓每個感知問題對簡單演算法而言容易解決;攝影機讓問題更難但可由強大AI解決;攝影機資料訓練的AI在Tesla規模下比依賴HD地圖的lidar系統更具泛化能力 | 這是連貫的技術論點:若AI夠好,攝影機或許就夠了;問題是在所有天氣與光線條件下完全無人駕駛,「夠好」的AI是否已存在 |
| 純視覺的局限 | 攝影機在以下情況表現不佳:豪雨(鏡頭積水)、下雪(白化條件)、直射陽光眩光(感測器飽和),以及遠超頭燈範圍的完全黑暗;純攝影機系統在霧中無雷達後備測速,低對比度下無lidar後備3D幾何 | 這些局限非假設性的,而是有記錄的失效模式;問題在於這些條件在AV運作域中出現的頻率,以及AI能否可靠偵測並回應感測器退化 |
| HW4 硬體規格 | Tesla FSD電腦(HW4):2顆AI推論晶片,估計各144 TOPS(估計);同時處理所有9路攝影機串流;為端對端神經網路推論最佳化 | 足以即時處理9路攝影機串流的推論算力;自研矽晶針對此特定工作負載最佳化 |
| 佔用網路方法 | FSD v12 採用佔用網路(occupancy network)從攝影機影像預測3D空間佔用;這是lidar點雲的神經網路替代方案 | 攝影機佔用網路令人印象深刻,但遠距的空間精度低於lidar點雲;80m處的行人,佔用網路偵測精度可能不如lidar |
| 純視覺評語 | 若AI夠好,Tesla的純視覺賭注是成本最優的選擇:攝影機便宜、普及且持續進步;lidar昂貴且增加維護負擔。若Tesla的AI能在規模化下達到lidar融合的感知可靠性,此賭注成功。若天氣或光線條件持續導致lidar可以預防的事故,則賭注失敗。 |
第三節 — 感測器辯論:技術分析
| 技術維度 | 雷射雷達+攝影機+雷達(Waymo) | 純視覺(Tesla) | 現有證據 |
|---|---|---|---|
| 3D測距精度 | Lidar:200m處公分級精度(估計);直接量測 | 攝影機佔用網路:80m以上公尺級精度(估計);從2D影像推論 | Lidar在3D精度上具決定性優勢;在高速與長距離最為重要 |
| 夜間表現 | Lidar在完全黑暗中運作;攝影機需頭燈照明;雷達在黑暗中運作 | 純攝影機依賴頭燈範圍;頭燈範圍內表現良好;遠距黑暗中退化 | 雷射雷達+攝影機+雷達:在遠距低光源中具決定性優勢 |
| 惡劣天氣(雨/霧/雪) | Lidar在豪雨中退化(水滴返回信號);攝影機在霧中退化;雷達穿透兩者;感測器融合維持性能 | 攝影機在豪雨與濃霧中退化;無雷達後備;對惡劣天氣更脆弱 | 雷射雷達+攝影機+雷達:因雷達後備在惡劣天氣中具決定性優勢 |
| 號誌與標誌辨識 | 攝影機處理語義(標誌文字、號誌顏色)良好;lidar無法辨識文字或顏色 | 攝影機:語義能力強;與融合方案相同 | 持平——雙方均使用攝影機處理語義 |
| 每輛車感測器成本 | 雷射雷達+攝影機+雷達:估計5千至1.5萬美元(估計) | 純攝影機:估計200至500美元(估計) | Tesla在感測器成本上具決定性優勢,估計低10至30倍 |
| 維護複雜度 | 感測器越多,維護點越多;lidar鏡頭需保持清潔;各感測模態間需校準 | 9顆攝影機含自動清潔功能;維護更簡單;故障率更低 | Tesla在維護簡便性上具決定性優勢 |
| 地圖依賴 | Waymo的lidar實現精確HD地圖對齊;lidar點雲與HD地圖特徵匹配用於定位 | Tesla的無地圖FSD使用攝影機進行即時定位;不需HD地圖 | Tesla在地圖依賴方面具決定性優勢(無依賴) |
| AI訓練資料 | Lidar點雲與攝影機影像需不同訓練資料;各模態需獨立資料管道 | 攝影機是唯一模態;資料管道更簡單;Tesla全部60億英里里程均可直接用於訓練 | Tesla在訓練資料同質性上具決定性優勢 |
第四節 — 感測器選擇對規模與成本的意義
| 規模維度 | Waymo 多感測器 | Tesla 純視覺 | 影響 |
|---|---|---|---|
| 車輛製造成本 | 感測器套件每輛車增加估計5千至1.5萬美元(估計) | 感測器成本估計200至500美元(估計);低10至30倍 | 10萬輛Cybercab時,Tesla相較Waymo方案估計節省5億至15億美元感測器成本(估計) |
| 車隊更換週期 | Lidar感測器退化需更換;從Gen 5到Gen 6需整車更換 | 攝影機退化但更換便宜;感測器升級透過HW4晶片更換而非整車更換 | Tesla較低的感測器成本降低車隊更換支出 |
| 城市擴展 | 每個新城市需要lidar高清地圖建置(數週至數月的建圖行駛);增加每城市上線成本與時間 | 不需HD地圖建置;OTA FSD更新涵蓋新地理區域 | Tesla在城市擴展速度與成本上具決定性優勢 |
| 消費者車輛整合 | Waymo不銷售消費者車輛;感測器套件純屬商業車隊成本 | 每輛搭載HW4的消費者Tesla已具備感測器硬體;消費者轉機器人計程車零額外感測器成本 | Tesla感測器與消費者車輛的整合是獨特的結構性優勢 |
| 供應鏈 | 自研lidar供應鏈需要專業製造商;地緣政治與供應風險 | 攝影機是全球大規模製造的商品零件;供應鏈高度韌性 | Tesla在感測器供應鏈韌性上具決定性優勢 |
第五節 — 感測器基準測試計分卡
| 感測器維度 | Waymo 雷射雷達+融合 | Tesla 純視覺 | 優勢 | 2028年展望 |
|---|---|---|---|---|
| 3D感知精度 | 決定性——lidar在200m以上公分級精度 | 佔用網路在80m以上公尺級精度 | Waymo | AI改進縮小但無法消弭差距 |
| 惡劣天氣表現 | 決定性——lidar+攝影機退化時有雷達後備 | 豪雨/濃霧/大雪中脆弱 | Waymo | Tesla AI改進但物理限制攝影機在惡劣天氣的表現 |
| 每輛車感測器成本 | 高:估計5千至1.5萬美元(估計) | 低:估計200至500美元(估計) | Tesla(決定性10至30倍) | Lidar成本持續下降但差距依然存在 |
| 維護複雜度 | 較高:多感測器校準、lidar清潔 | 較低:以攝影機為中心,維護更簡單 | Tesla | 隨車隊規模擴大,Tesla維持優勢 |
| 城市擴展(地圖依賴) | 每城市需HD地圖:數週至數月建圖 | 無HD地圖:OTA涵蓋新地理區域 | Tesla(決定性) | Waymo HD地圖成本仍是每城市的負擔 |
| 訓練資料管道 | 多模態:lidar+攝影機獨立管道 | 單一模態:60億英里里程均可直接使用 | Tesla | Tesla資料管道優勢隨車隊增長擴大 |
| 整體感測器評語 | Waymo的lidar+融合方案在邊緣條件(惡劣天氣、遠距黑暗)中更安全,3D幾何更精確。Tesla的純視覺方案成本大幅更低、更簡單、更易擴展,且已部署於600萬輛車。賭注在於Tesla的AI能否在攝影機最薄弱的條件下縮短與lidar的感知差距。若能,Tesla的感測器經濟學將決定性勝出。若不能,Waymo的感測器冗餘將在純視覺系統無法預防的事故中證明其價值。答案將隨Tesla完全無人駕駛Cybercab累積商業里程的事故資料而浮現。 |
所有標註(估計)的數據均來自公司公開揭露、分析師估算與業界基準測試。本文為物理AI基準測試系列第168篇。
來源
- Waymo Gen 6 感測器套件 — Waymo 部落格 ↗
- Tesla 純視覺FSD策略 — Tesla AI Day 2021 ↗
- Waymo 自研雷射雷達 — Waymo 研究 ↗
- Tesla HW4 FSD電腦規格 — Tesla ↗
- 雷射雷達 vs 攝影機 AV 感知辯論 — IEEE Spectrum ↗