Skip to content
AI-Daily-Builder

2026-06-18 views

物理AI感測器 — Waymo 雷達+攝影機+雷射雷達融合 vs Tesla 純視覺FSD:感知硬體基準測試 2026

Waymo 融合雷射雷達、攝影機與雷達,打造冗餘3D感知。Tesla 僅用攝影機——每輛車成本低10至30倍——押注AI能彌補攝影機的弱點。

概覽

感測器堆疊是自動駕駛車輛設計中最根本的硬體決策。Waymo 採用雷射雷達(lidar)、攝影機與雷達三種感測器融合,建立具備冗餘能力的感知系統。Tesla 則僅使用攝影機——純視覺方案——主張只要AI足夠強大,雷射雷達只是多餘的昂貴支撐。這場辯論對車輛成本、惡劣環境下的感知可靠性,以及處理感測器資料所需的AI類型,均有深遠影響。本文為物理AI基準測試系列第168篇。


第一節 — Waymo 感測器套件:雷射雷達 + 攝影機 + 雷達融合

Waymo Gen 6 車輛部署三種互補的感測模態,相互彌補彼此的弱點,建構無單點故障的感知系統。

感測器維度Waymo 詳情策略意義
雷射雷達(主要測距感測器)Waymo Gen 6 使用自研雷射雷達;lidar 發射雷射脈衝並量測飛行時間,建立精準3D點雲;射程達200m以上(估計);在黑暗中及多數天氣條件下均可運作Lidar 提供攝影機無法匹敵的公尺級精準3D幾何;昏暗光線下50m處的行人,lidar能清楚偵測,即便攝影機對比度不足
自研雷射雷達開發Waymo 自Google SDC計畫起即開發自有lidar;多代自研雷射雷達(Honeybee、Laser Bear Honeybee等);從Gen 5到Gen 6成本大幅降低自研lidar大幅降低單位成本,優於採購商用lidar;Waymo自研lidar性能更強且更便宜
攝影機陣列Gen 6 使用多攝影機陣列提供360度視覺覆蓋;攝影機捕捉lidar無法提供的顏色、紋理與語義資訊(辨識路標、號誌、車道線)攝影機與lidar互補:lidar提供深度與幾何,攝影機提供語義與顏色;融合感知優於任一單一感測器
雷達短程與長程雷達透過都卜勒效應量測附近物體的速度;雷達在豪雨、濃霧與沙塵中仍可運作雷達的速度量測在惡劣天氣中不可或缺:豪雨中lidar點雲變得雜訊;濃霧中攝影機失去對比度;雷達均可穿透
感測器融合Waymo感知系統在感測器層與物體層均進行lidar、攝影機、雷達資料融合;融合表示比任何單一感測器更豐富且可靠感測器融合提供冗餘:若一種感測器退化(lidar鏡頭沾水、攝影機眩光),其他感測器維持感知品質
感測器成本(Gen 6)Waymo 指出從Gen 5到Gen 6成本顯著降低;Gen 6精確成本未公開;業界估計完整lidar+攝影機+雷達套件每輛車約5千至1.5萬美元(估計)即使每輛車5千美元,感測器成本仍是重大製造成本項目;Tesla 純攝影機方案完全排除此成本——8攝影機FSD陣列估計僅200至500美元(估計)
感測器評語Waymo的多感測器方案是工程安全的選擇:感測模態越多,冗餘越高,各種條件下的感知越可靠。成本代價是真實且顯著的。核心問題在於:這種冗餘對商業AV安全是否必要,還是攝影機加AI就能在更低成本下達到相同可靠性——這就是Tesla的賭注。

第二節 — Tesla 感測器套件:純視覺(僅攝影機)

Tesla HW4平台使用9顆攝影機,不含lidar或雷達。這個賭注是:以足夠的攝影機資料訓練的AI,能匹敵甚至超越lidar的感知能力。

感測器維度Tesla 詳情策略意義
攝影機陣列(HW4)Tesla HW4 使用9顆攝影機(8顆環繞+1顆遠程前向);提供360度覆蓋;解析度優於HW3;由Tesla自研FSD電腦處理9顆攝影機提供完整空間覆蓋;FSD電腦同時處理所有攝影機串流,輸出單一神經網路結果
Tesla為何捨棄lidar與雷達Musk 主張lidar是「拐杖」,一旦攝影機與AI足夠好就不再需要;人類用兩眼(攝影機)駕駛,不靠lidar;lidar增加成本與複雜度卻不根本提升大規模安全性;Tesla 於2021至2022年從多數車型移除雷達純視覺賭注基於特定假設:以足夠規模的攝影機資料訓練的AI,能匹敵或超越lidar感知;此假設在完全無人駕駛商業規模下尚未證實
「AI彌補感測器限制」論點Tesla立場:lidar讓每個感知問題對簡單演算法而言容易解決;攝影機讓問題更難但可由強大AI解決;攝影機資料訓練的AI在Tesla規模下比依賴HD地圖的lidar系統更具泛化能力這是連貫的技術論點:若AI夠好,攝影機或許就夠了;問題是在所有天氣與光線條件下完全無人駕駛,「夠好」的AI是否已存在
純視覺的局限攝影機在以下情況表現不佳:豪雨(鏡頭積水)、下雪(白化條件)、直射陽光眩光(感測器飽和),以及遠超頭燈範圍的完全黑暗;純攝影機系統在霧中無雷達後備測速,低對比度下無lidar後備3D幾何這些局限非假設性的,而是有記錄的失效模式;問題在於這些條件在AV運作域中出現的頻率,以及AI能否可靠偵測並回應感測器退化
HW4 硬體規格Tesla FSD電腦(HW4):2顆AI推論晶片,估計各144 TOPS(估計);同時處理所有9路攝影機串流;為端對端神經網路推論最佳化足以即時處理9路攝影機串流的推論算力;自研矽晶針對此特定工作負載最佳化
佔用網路方法FSD v12 採用佔用網路(occupancy network)從攝影機影像預測3D空間佔用;這是lidar點雲的神經網路替代方案攝影機佔用網路令人印象深刻,但遠距的空間精度低於lidar點雲;80m處的行人,佔用網路偵測精度可能不如lidar
純視覺評語若AI夠好,Tesla的純視覺賭注是成本最優的選擇:攝影機便宜、普及且持續進步;lidar昂貴且增加維護負擔。若Tesla的AI能在規模化下達到lidar融合的感知可靠性,此賭注成功。若天氣或光線條件持續導致lidar可以預防的事故,則賭注失敗。

第三節 — 感測器辯論:技術分析

技術維度雷射雷達+攝影機+雷達(Waymo)純視覺(Tesla)現有證據
3D測距精度Lidar:200m處公分級精度(估計);直接量測攝影機佔用網路:80m以上公尺級精度(估計);從2D影像推論Lidar在3D精度上具決定性優勢;在高速與長距離最為重要
夜間表現Lidar在完全黑暗中運作;攝影機需頭燈照明;雷達在黑暗中運作純攝影機依賴頭燈範圍;頭燈範圍內表現良好;遠距黑暗中退化雷射雷達+攝影機+雷達:在遠距低光源中具決定性優勢
惡劣天氣(雨/霧/雪)Lidar在豪雨中退化(水滴返回信號);攝影機在霧中退化;雷達穿透兩者;感測器融合維持性能攝影機在豪雨與濃霧中退化;無雷達後備;對惡劣天氣更脆弱雷射雷達+攝影機+雷達:因雷達後備在惡劣天氣中具決定性優勢
號誌與標誌辨識攝影機處理語義(標誌文字、號誌顏色)良好;lidar無法辨識文字或顏色攝影機:語義能力強;與融合方案相同持平——雙方均使用攝影機處理語義
每輛車感測器成本雷射雷達+攝影機+雷達:估計5千至1.5萬美元(估計)純攝影機:估計200至500美元(估計)Tesla在感測器成本上具決定性優勢,估計低10至30倍
維護複雜度感測器越多,維護點越多;lidar鏡頭需保持清潔;各感測模態間需校準9顆攝影機含自動清潔功能;維護更簡單;故障率更低Tesla在維護簡便性上具決定性優勢
地圖依賴Waymo的lidar實現精確HD地圖對齊;lidar點雲與HD地圖特徵匹配用於定位Tesla的無地圖FSD使用攝影機進行即時定位;不需HD地圖Tesla在地圖依賴方面具決定性優勢(無依賴)
AI訓練資料Lidar點雲與攝影機影像需不同訓練資料;各模態需獨立資料管道攝影機是唯一模態;資料管道更簡單;Tesla全部60億英里里程均可直接用於訓練Tesla在訓練資料同質性上具決定性優勢

第四節 — 感測器選擇對規模與成本的意義

規模維度Waymo 多感測器Tesla 純視覺影響
車輛製造成本感測器套件每輛車增加估計5千至1.5萬美元(估計)感測器成本估計200至500美元(估計);低10至30倍10萬輛Cybercab時,Tesla相較Waymo方案估計節省5億至15億美元感測器成本(估計)
車隊更換週期Lidar感測器退化需更換;從Gen 5到Gen 6需整車更換攝影機退化但更換便宜;感測器升級透過HW4晶片更換而非整車更換Tesla較低的感測器成本降低車隊更換支出
城市擴展每個新城市需要lidar高清地圖建置(數週至數月的建圖行駛);增加每城市上線成本與時間不需HD地圖建置;OTA FSD更新涵蓋新地理區域Tesla在城市擴展速度與成本上具決定性優勢
消費者車輛整合Waymo不銷售消費者車輛;感測器套件純屬商業車隊成本每輛搭載HW4的消費者Tesla已具備感測器硬體;消費者轉機器人計程車零額外感測器成本Tesla感測器與消費者車輛的整合是獨特的結構性優勢
供應鏈自研lidar供應鏈需要專業製造商;地緣政治與供應風險攝影機是全球大規模製造的商品零件;供應鏈高度韌性Tesla在感測器供應鏈韌性上具決定性優勢

第五節 — 感測器基準測試計分卡

感測器維度Waymo 雷射雷達+融合Tesla 純視覺優勢2028年展望
3D感知精度決定性——lidar在200m以上公分級精度佔用網路在80m以上公尺級精度WaymoAI改進縮小但無法消弭差距
惡劣天氣表現決定性——lidar+攝影機退化時有雷達後備豪雨/濃霧/大雪中脆弱WaymoTesla AI改進但物理限制攝影機在惡劣天氣的表現
每輛車感測器成本高:估計5千至1.5萬美元(估計)低:估計200至500美元(估計)Tesla(決定性10至30倍)Lidar成本持續下降但差距依然存在
維護複雜度較高:多感測器校準、lidar清潔較低:以攝影機為中心,維護更簡單Tesla隨車隊規模擴大,Tesla維持優勢
城市擴展(地圖依賴)每城市需HD地圖:數週至數月建圖無HD地圖:OTA涵蓋新地理區域Tesla(決定性)Waymo HD地圖成本仍是每城市的負擔
訓練資料管道多模態:lidar+攝影機獨立管道單一模態:60億英里里程均可直接使用TeslaTesla資料管道優勢隨車隊增長擴大
整體感測器評語Waymo的lidar+融合方案在邊緣條件(惡劣天氣、遠距黑暗)中更安全,3D幾何更精確。Tesla的純視覺方案成本大幅更低、更簡單、更易擴展,且已部署於600萬輛車。賭注在於Tesla的AI能否在攝影機最薄弱的條件下縮短與lidar的感知差距。若能,Tesla的感測器經濟學將決定性勝出。若不能,Waymo的感測器冗餘將在純視覺系統無法預防的事故中證明其價值。答案將隨Tesla完全無人駕駛Cybercab累積商業里程的事故資料而浮現。

所有標註(估計)的數據均來自公司公開揭露、分析師估算與業界基準測試。本文為物理AI基準測試系列第168篇。


來源

標籤

請喝咖啡