Skip to content
AI-Daily-Builder

2026-06-18 views

Physical AI 資料管線 — Tesla 600萬輛車收集飛輪 vs Waymo 每日150億模擬里程:訓練基礎設施競賽

Tesla 每日從600萬輛車收集數百萬英里FSD里程;Waymo每日運行150億模擬里程。數量vs品質定義了Physical AI資料管線競賽。

Physical AI 基準測試系列第155篇 — Physical AI 資料管線:Tesla 與 Waymo 如何大規模收集、標註、儲存與處理訓練資料

資料管線是決定自動駕駛公司改善AI模型速度的隱形基礎設施。每行駛一英里、每記錄一個感測器幀、每應用一個標籤、每完成一次訓練執行,都在積累對後來者難以縮小的複利優勢。Tesla 的自動標註管線處理來自約600萬輛具備FSD功能車輛的資料(估計值);Waymo 的人工標註團隊則標註來自規模較小但完全無人駕駛車隊的數十億個感測器幀。本文是 Physical AI 基準測試系列第155篇,對完整的資料管線進行基準測試——包括收集、標註、儲存、計算與反饋迴圈——並分析資料速度對 Physical AI 競爭優勢的意義。

所有標有「(估計值)」的數字均來自公開披露、行業研究與分析師估計,而非獨立驗證的原始資料。


第1節 — 資料收集:原材料從哪裡來

資料管線從收集開始。每一幀影像、每個雷達點雲和每個雷達回波都必須被記錄、篩選並傳輸到訓練叢集,才能開始任何學習。Tesla 和 Waymo 採取截然不同的收集策略。

維度TeslaWaymo影響
車隊規模(資料來源)全球約600萬輛具備FSD功能的車輛(估計值);每日約100萬輛以上啟用FSD(估計值)在4座城市約2,500輛專用AV車輛(估計值)Tesla:車輛數量多出2,400倍;原始資料量具有壓倒性優勢
每日收集里程(估計值)每日FSD行駛里程達數千萬英里(估計值,跨越整個車隊)每日約5萬至10萬無人駕駛里程(估計值)Tesla:每日里程約多出500至1,000倍
感測器資料類型9個攝影機(多種解析度);4D雷達;無光達攝影機加光達加雷達(三種模式全備)Waymo每輛車收集的感測器資料更豐富;Tesla收集的攝影機資料量更大
每英里資料密度約9個攝影機串流,每個約36幀/秒 = 每輛車約324幀/秒攝影機加光達點雲加雷達 = 每英里位元組數約為純攝影機的10倍Waymo每英里資料更豐富;Tesla里程數更多
邊緣案例密度(估計值)在600萬輛車的規模下,Tesla每天多次遭遇每種罕見場景;影子模式標記偏差Waymo的無人駕駛車隊較少遭遇罕見場景,但標注保真度更高(無駕駛員在場 = 無駕駛員行為干擾)Tesla在邊緣案例數量上獲勝;Waymo在邊緣案例標注品質上獲勝
地理多樣性美國、加拿大、歐盟、中國、澳洲——全球攝影機資料4座美國城市(舊金山、鳳凰城、洛杉磯、奧斯汀)——範圍窄但深入Tesla:全球場景多樣性;Waymo:4個市場的深度城市場景
資料選擇(上傳內容)並非所有里程都會上傳;Tesla車載電腦選擇FSD行為偏離駕駛員或遭遇不確定性的片段所有無人駕駛資料都有價值;Waymo上傳其較小數量中的更高比例Tesla的針對性上傳降低頻寬成本;但有遺漏車載模型未標記為不確定場景的風險

規模與豐富度的權衡

Tesla 放棄光達的決定不僅是成本決策,更是資料策略決策。攝影機資料比光達點雲更便宜收集、儲存和標注。在600萬輛車每日產生數千萬英里資料(估計值)的規模下,能夠經濟高效地處理純攝影機資料是 Tesla 資料飛輪運作的前提。Waymo 的光達加攝影機加雷達方案每英里產生更豐富的資料,但成本結構在車隊規模擴大時的擴展性較差。


第2節 — 資料標注:標籤管線

原始感測器資料在標注之前對訓練毫無價值。行人必須被識別為行人,而非騎自行車的人;停車標誌必須在三維空間中定位,而非只是一個像素群。標注管線是原始資料轉化為訓練信號的地方——也是 Tesla 和 Waymo 在運營方式上分歧最大的地方。

階段Tesla方法Waymo方法成本/速度權衡
自動標注(神經網路標注)Tesla管線的核心:神經網路自動標注每個影像幀中的物件(行人、車輛、騎行者、標誌);人工僅審查邊緣案例和分歧Waymo也使用自動標注,但更依賴人工標注員進行光達點雲標注(比攝影機更難自動標注)Tesla:更自動化;Waymo:更多人工參與
4D標注Tesla的4D(三維空間加時間)標注跨幀追蹤物件,包括遮擋情況;在Tesla AI Day 2022上作為核心創新披露Waymo對光達點雲使用三維邊界框加攝影機;也使用時間追蹤Tesla的4D方法從影像中更自然地捕捉物件軌跡
人工標注人力(估計值)Tesla僱用大量標注團隊(估計數百至數千人),但自動標注降低了每幀人工需求Waymo有人工標注團隊;具體規模未披露;Waymo曾與Scale AI合作進行部分標注工作兩者均使用人工標注;Tesla的自動標注管線在降低每英里人工需求方面更成熟
主動學習Tesla使用主動學習:模型識別不確定的幀;這些幀被優先分配給人工標注Waymo使用類似的主動學習方法兩者都優先標注最難的案例,而非隨機幀
標注品質控制神經網路自動標注與人工標注之間的分歧觸發審查;追蹤一致性指標Waymo將標注品質視為安全關鍵需求;困難幀由多位標注員處理兩者都在標注品質上大量投入;標注錯誤會傳播到模型錯誤
每英里標注成本(估計值)Tesla目標:通過自動標注將邊際成本降至接近零Waymo:光達標注比攝影機更昂貴;每英里標注成本更高Tesla的純攝影機架構實現了更便宜的大規模標注
閉環資料管線Tesla的FSD部署產生資料、自動標注、訓練新模型、通過OTA部署、產生更好的資料,如此循環Waymo:無人駕駛運營產生資料、標注、訓練、在模擬中驗證、部署Tesla的OTA速度實現更快的閉環迭代;Waymo的模擬驗證環節增加了一個步驟

第3節 — 資料儲存與計算基礎設施

標注後的訓練資料集必須被儲存、批量處理並輸入訓練叢集。訓練計算叢集的規模決定了每週可以運行多少實驗以及新模型能以多快的速度驗證部署。

元件TeslaWaymo備注
訓練計算(主要)Dojo叢集(Tesla自建,ExaPOD約1 ExaFLOP估計值)加NVIDIA H100/H200 GPU(補充)Google TPU v5(通過Alphabet);Google Cloud基礎設施Waymo立即受益於Google世界級TPU基礎設施;Tesla建設Dojo以獲得長期成本優勢
資料儲存(估計值)拍位元組級別的影像;Tesla未披露具體儲存容量;雲端加本地混合(估計值)拍位元組級別的多模式感測器資料;Google Cloud提供近乎無限的儲存兩者均擁有企業級儲存;Waymo的Google Cloud訪問更靈活
資料傳輸頻寬車輛到雲端:通過LTE/5G定向片段上傳;非連續串流車輛到雲端:選擇性上傳已標記的場景兩者都進行選擇性上傳;均不連續串流所有感測器資料
訓練運行頻率FSD更新大約每月至每週一次(OTA);意味著頻繁的訓練運行Waymo更新頻率較低(無人駕駛需要更多驗證);每月至每季一次(估計值)Tesla更快的OTA節奏實現更快的模型迭代
模型規模與架構FSD使用大型基於Transformer的神經網路;Tesla未披露參數數量Waymo使用多個專用模型(感知、預測、規劃);非單一整體模型不同的架構選擇反映了不同的設計哲學(端到端vs.模組化)
合成資料增強Tesla使用模擬增強真實資料,尤其是罕見場景;Dojo處理合成加真實資料Waymo的CarCraft模擬每天產生150億模擬里程(Waymo披露);大量用於增強兩者都大量使用合成資料;Waymo的模擬量更大

第4節 — 資料飛輪:更多資料如何創造自我強化的優勢

步驟Tesla飛輪Waymo飛輪飛輪強度
第1步:收集600萬輛車每日產生數百萬英里(估計值);影子模式標記偏差2,500輛車每日產生5至10萬無人駕駛里程(估計值)Tesla:收集量500至1,000倍優勢
第2步:標注自動標注處理片段;人工審查困難案例人工加自動標注;光達標注成本更高Tesla:更低的邊際標注成本
第3步:訓練Dojo加NVIDIA;新模型在標注資料上訓練Google TPU;新模型在標注加模擬資料上訓練Waymo:今天計算基礎設施佔優;Tesla迎頭趕上
第4步:部署OTA更新至600萬輛車;立即大規模真實世界測試部署至2,500輛車;更慢的驗證週期Tesla:更快、更大規模的部署
第5步:重複更高品質的FSD產生更好的影子資料、更好的標注、更好的模型、更快的循環更安全的無人駕駛產生更好的事件資料、更好的標注、更好的模型兩個飛輪都在轉動;Tesla的由於規模而轉得更快
飛輪瓶頸(Tesla)品質控制:在自動標注規模下,標注錯誤會傳播;系統性標注錯誤導致系統性模型錯誤Tesla必須在標注品質控制上大量投入以維持飛輪品質
飛輪瓶頸(Waymo)數量:2,500輛車產生的里程約為Tesla每日里程的0.04%;模擬補償,但模擬與真實的差距依然存在Waymo必須以卓越的模擬和標注品質彌補數量差距
長期飛輪贏家若自動標注品質能夠達到或超過人工標注水準(不確定),Tesla勝出若模擬能充分縮短與真實世界資料的差距(同樣不確定),Waymo勝出競賽結果取決於哪個品質瓶頸率先被解決

第5節 — 資料管線基準測試評分卡

維度TeslaWaymo優勢2028年展望
原始資料量決定性 — 來自600萬輛車的每日數百萬英里適中 — 來自2,500輛車的每日5至10萬英里Tesla隨Tesla車隊增長差距擴大
每英里資料豐富度純攝影機(更簡單,標注成本更低)攝影機加光達加雷達(更豐富但標注成本更高)Waymo(每英里品質)取決於豐富度是否能補償數量差距
每英里標注成本更低 — 自動標注成熟;攝影機比光達更便宜更高 — 光達標注更昂貴;更多人工審查Tesla隨自動標注改進,Tesla優勢增長
訓練計算正在建立優勢(Dojo);目前由NVIDIA補充今天佔優 — Google TPU基礎設施Waymo(今天);Tesla(2027年+)Tesla Dojo D2預計2026至2027年 = 轉折點
閉環迭代速度快速 — 每週OTA;數百萬輛測試車輛較慢 — 更多驗證;測試車輛更少TeslaTesla在迭代速度上的優勢持久
模擬量增長中;Dojo處理合成資料每日150億模擬里程(Waymo披露)WaymoWaymo的模擬領先優勢顯著

總體結論

Tesla的資料管線擁有隨時間複利增長的決定性原始數量優勢:車隊中的車輛越多,資料越多,模型越好,啟用FSD的車輛越多。Waymo的資料管線擁有品質優勢——更豐富的感測器資料、更仔細的標注以及自動駕駛行業中最先進的模擬系統。這場競賽是Tesla的數量飛輪與Waymo的品質飛輪之間的較量。結果取決於在AV能力前沿,品質還是數量更重要——截至2026年中期,這一問題仍存在真正的不確定性。


注意: 所有標有「(估計值)」的數字均來自公開披露、行業研究、分析師估計及截至2026年中期的報告資料。本文不構成投資建議或產品推薦。


來源

標籤

請喝咖啡