Skip to content
AI-Daily-Builder

2026-06-18 views

自動駕駛資料飛輪 — Tesla 600萬輛 vs Waymo 無人駕駛品質優勢

Tesla 收集數量,Waymo 追求品質。哪個資料飛輪能在2028年前打造出更強的自動駕駛系統?AV投資人必讀的結構性護城河比較。

實體AI基準系列第65篇 — 訓練資料護城河

自動駕駛領域最重要的長期結構性優勢,不是感測器堆疊、軟體團隊或監管關係,而是資料飛輪:這個自我強化的循環將已部署的車輛轉化為更好的訓練資料,進而打造更強的模型,再吸引更多車輛部署。建立最佳飛輪的公司,不靠單一工程突破,而是靠著逐年累積的邊際資料優勢,最終打造出最好的自動駕駛系統。

Tesla 與 Waymo 建立了根本上截然不同的飛輪架構。Tesla 追求數量:超過600萬輛FSD車輛,以任何競爭對手都無法複製的規模收集有監督的駕駛資料。Waymo 追求品質:完全無人駕駛的商業運營,每一趟車程都是由AV系統獨立處理的高風險真實世界場景,沒有人類可供模仿。這場架構競爭的結果,將決定哪家公司的AI技術棧在2028年及以後真正領先。


第一節 — 為何訓練資料是AI護城河

在端到端神經網路駕駛架構中(Tesla FSD v12+ 與 Waymo 現行神經網路技術棧均採用此架構),模型不遵循手工編寫的規則,而是透過觀察數百萬個駕駛場景來學習正確的行為應該是什麼。觀察經驗的品質與數量,幾乎決定了模型的所有表現。

飛輪運作方式如下:

部署更多車輛 → 行駛更多里程 → 捕捉更多邊緣案例 → 更好的訓練資料 → 更強的模型 → 銷售或部署更多車輛 → 循環重複

關鍵洞察是:資料數量與資料品質並不相同。 10億英里中人類駕駛從未遭遇異常狀況的有監督FSD資料,每英里的價值,遠低於100萬英里完全無人駕駛中AV系統必須獨立應對全新情境的資料。每英里的資訊含量存在根本性差異。

自動駕駛最困難的部分,不是熟悉路段上可預測行為的普通99%里程,而是那1%的長尾邊緣案例:不尋常的道路配置、意外的行人行為、路面障礙物、褪色的車道標線、施工區域,以及四向停車時每位駕駛行為略有不同的複雜多方博弈。這些正是導致失敗的場景——而捕捉它們的訓練資料,價值遠超任何普通公路行駛的資料。

這形成了核心張力:Tesla 擁有更多容易的里程;Waymo 擁有更多在無人協助下處理的困難里程。哪個維度——數量還是品質——對於打造安全的商業自動駕駛更重要?


第二節 — Tesla的資料飛輪:規模化的數量優勢

Tesla的資料飛輪是汽車AI史上最雄心勃勃的資料收集行動,其規模在業界無可比擬。

維度詳情
車隊規模2026年中期已有超過600萬輛FSD車輛
每日里程估計整個車隊每日FSD啟動行駛數千萬英里(估計值)
資料類型有監督:人類駕駛始終在場;系統觀察人類行為;捕捉人類接管干預
邊緣案例捕捉遍及美國40+州、加拿大、有限歐盟市場:極大的地理與場景多樣性;罕見事件在車隊規模下頻繁發生
訓練信號人類接管 = 標記的訓練資料;「人類接管」= 系統做了錯誤的事;車隊每年產生數十億個標記修正事件(估計值)
資料管道影子模式:即使未啟用FSD的駕駛,FSD也在背景運行;捕捉人類行為與FSD預測行為之間的差異;生成龐大的未標記比較資料集
DojoTesla自研AI訓練叢集;D1晶片針對影片型駕駛訓練所需的特定張量運算最佳化
核心優勢沒有競爭對手能在沒有消費者汽車業務的情況下複製600萬輛的規模;資料護城河隨每輛新車銷售而增強
核心限制有監督資料存在選擇偏差:人類大多在正常場景下駕駛;人類也犯錯的真正新穎情境被嚴重低估;人在迴路中造成品質上限

影子模式管道是Tesla最被低估的競爭優勢。即使是從未啟用FSD的Tesla車主,也在為訓練資料集做出貢獻:車輛觀察人類駕駛的行為,並與FSD系統預測的行為進行比較。這在零增量採集成本下,創造了有史以來最大的持續更新駕駛行為比較資料集。


第三節 — Waymo的資料飛輪:品質優於數量

Waymo的資料飛輪規模小了幾個數量級,但專為捕捉Tesla無法規模化收集的特定訓練信號而設計:系統在沒有人類可模仿時的實際表現。

維度詳情
車隊規模2026年中期約1,500輛專用車輛
每日里程約15萬次/週 × 平均約4英里/次 = 約60萬商業英里/週 = 約8.6萬英里/天(估計值)
資料類型完全無人駕駛:無人在迴路中;捕捉AV系統在無人類備援下實際處理新穎情境的方式
邊緣案例捕捉地理多樣性有限(4個城市);但每次商業車程都是真實世界的無人駕駛場景,有真實乘客——後果比有監督場景更嚴重
訓練信號不適感事件、乘客行為、場景難度、遠端協助請求——比單純「人類接管」更豐富的行為信號
模擬Waymo模擬城市可大規模生成合成場景;能在真實世界部署前運行數十億模擬英里
多感測器資料光達 + 攝影機 + 雷達 = 比僅攝影機更豐富的每英里空間資料;3D點雲提供訓練的地面實況幾何
核心優勢無人駕駛里程為問題最困難部分提供最高品質信號:系統在沒有人類可模仿時會怎麼做?
核心限制每日約8.6萬商業英里 vs Tesla估計的數千萬英里——數量差距達100至1,000倍(估計值);地理多樣性僅限4個城市

Waymo的無人駕駛信號在質上與Tesla目前能大規模收集的任何資料都不同。當Waymo車輛遭遇前所未見的場景時,它必須自行處理,或請求遠端協助。兩種結果都是高信號訓練事件。Waymo的模擬能力部分彌補了數量差距——可以生成在真實世界駕駛中幾乎從未出現的合成罕見事件。


第四節 — 品質 vs 數量的辯論

Tesla與Waymo架構理念之間的核心分歧,對應到機器學習中一個真正未解決的問題:更多低品質資料是否優於更少高品質資料?

論點支持Tesla數量的理由支持Waymo品質的理由
罕見事件600萬輛車下,百萬分之一的罕見事件每天都會發生;1,500輛車下可能永遠不會出現在訓練資料中模擬可大規模生成合成罕見事件;無人駕駛的真實世界罕見事件提供最高品質信號
邊緣案例標記人類接管提供自然標記(接管 = 系統出錯)無人駕駛場景 = 系統必須處理;結果可觀察(車程完成?請求協助?)
泛化能力更多地理多樣性 → 更好地泛化到不同路況、標誌和天氣城市有限,但模擬補足;多感測器資料提供更豐富的每樣本資訊
長尾罕見駕駛場景的長尾是主要安全挑戰;Tesla的規模自然捕捉更多長尾Waymo認為最重要的長尾場景,正是人類也會失敗的情境——只有無人駕駛資料能揭示
遷移學習消費者資料能很好地遷移到有監督駕駛改進;對完全自主駕駛是否適用尚不明確無人駕駛資料直接符合目標行為分佈;無從有監督到自主的分佈偏移
結論(估計)數量在有監督駕駛改進和ADAS方面勝出;品質在無人駕駛安全認證方面勝出兩者皆需要;理想訓練集結合Tesla規模的數量與Waymo品質的無人駕駛信號

遷移學習問題值得特別關注。Tesla的有監督訓練資料在與目標行為不同的分佈下收集:系統在有人類備援的情況下進行訓練,但目標是在沒有人類的情況下安全駕駛。這種從有監督收集到自主部署的分佈差距,是單靠增加數量無法解決的根本挑戰。


第五節 — 飛輪如何塑造競爭格局

資料飛輪競爭在幾個場景中展開,每個場景對2028年的競爭結果有不同影響。

場景結果
Tesla無人駕駛率先規模化Tesla飛輪從有監督轉為無人駕駛資料收集;品質趕上數量;複合優勢加速;對所有競爭對手的差距擴大
Waymo車隊達到10萬輛品質規模化成為可能;真實世界無人駕駛資料結合模擬,創造同時提供覆蓋範圍和信號品質的訓練資料集
中國AV玩家由於資料本地化法規形成獨立護城河;比亞迪和蔚來的國內規模可在中國境內複製Tesla的數量飛輪
新進者顛覆任何新進者都面臨冷啟動問題:沒有訓練資料 → 沒有能力的系統 → 沒有部署 → 沒有訓練資料;需要大規模模擬投資或收購現有玩家
資料共享沒有主要AV公司共享訓練資料;每家都在建立專有護城河;贏家是最先將資料優勢轉化為商業規模的公司

冷啟動問題是AV競爭中投資人最重要的結構性事實。資料飛輪創造了隨時間增強(而非減弱)的複合進入障礙。新進者今天試圖打造有競爭力的AV系統,面臨無法快速彌合的訓練資料赤字:累積真實世界駕駛里程需要數年,僅靠模擬資料不足以通過無人駕駛商業認證。


第六節 — 投資人信號:2028年哪個飛輪更值錢?

Tesla數量飛輪的多頭論點依賴三個假設:有監督到無人駕駛的遷移學習效果足夠好;Tesla Robotaxi在2026-2027年達到商業規模,將飛輪從有監督轉為無人駕駛收集;以及攝影機純視覺感知通過規模最終追平或超越光達感知。

Waymo品質飛輪的多頭論點依賴三個不同假設:無人駕駛資料對最後的安全認證至關重要;Waymo車隊通過Google合作和Uber貨運部署增長至5萬至10萬輛;以及光達多感測器資料提供持久的每英里資訊優勢。

綜合觀點:兩個飛輪都是必要的,單獨任何一個都不夠。理想的商業無人駕駛系統訓練資料集,結合了Tesla規模的數量(場景廣度、地理多樣性、車隊規模下的罕見事件密度)與Waymo品質的無人駕駛信號(符合政策的資料、高後果場景、無分佈偏移)。

對投資人而言,關鍵觀察信號是:Tesla Robotaxi無人駕駛部署進度(轉換飛輪)、Waymo車隊擴張公告(品質收集規模化)、AV公司間的任何資料共享夥伴關係(將重新分配護城河),以及監管安全認證門檻(可能最終決定數量或品質飛輪提供必要的認證證據)。

資料飛輪意味著AV領先者與跟隨者之間的差距,隨時間擴大而非縮小。將資料優勢轉化為商業規模的競賽,是未來三年實體AI中最具決定性的競爭事件。


第七節 — 關於本系列

這是實體AI基準系列的第65篇。前64篇涵蓋了加速指數、人形機器人競賽、單位經濟學、全球競爭、高精地圖、車隊運營、軟體與OTA、保險與責任、消費者需求、競爭護城河、Cybercab對比Model Y、安全資料、Waymo Gen 6、Optimus製造、記分卡快照、2030預測場景、投資人框架、城市擴張管道、Tesla FSD州級審批地圖、AV天氣與氣候限制、人才戰爭、監管日曆、機器人計程車定價、人形機器人部署追蹤器、供應鏈分析、消費者採用需求指數、估值與IPO分析、實體AI 2026年中回顧,以及AV每英里成本分解。

本文新增資料飛輪維度:Tesla數量飛輪(600萬輛、有監督資料規模化、影子模式管道、Dojo)與Waymo品質飛輪(完全無人駕駛商業車程、多感測器地面實況、模擬城市)之間的架構比較,以機器學習術語闡述的數量 vs 品質辯論,以及揭示哪個飛輪正在勝出的投資人信號。

注意: 本文中所有車隊規模、每日里程和商業車程估計,均基於公開的公司披露、新聞稿和業界分析。無精確資料時,估計值標記為「(估計值)」,僅供方向性參考。本文不構成投資建議。


來源

標籤

請喝咖啡