2026-06-18 — views

自動駕駛資料飛輪 — Tesla 600萬輛 vs Waymo 無人駕駛品質優勢

Tesla 收集數量，Waymo 追求品質。哪個資料飛輪能在2028年前打造出更強的自動駕駛系統？AV投資人必讀的結構性護城河比較。

實體AI基準系列第65篇 — 訓練資料護城河

自動駕駛領域最重要的長期結構性優勢，不是感測器堆疊、軟體團隊或監管關係，而是資料飛輪：這個自我強化的循環將已部署的車輛轉化為更好的訓練資料，進而打造更強的模型，再吸引更多車輛部署。建立最佳飛輪的公司，不靠單一工程突破，而是靠著逐年累積的邊際資料優勢，最終打造出最好的自動駕駛系統。

Tesla 與 Waymo 建立了根本上截然不同的飛輪架構。Tesla 追求數量：超過600萬輛FSD車輛，以任何競爭對手都無法複製的規模收集有監督的駕駛資料。Waymo 追求品質：完全無人駕駛的商業運營，每一趟車程都是由AV系統獨立處理的高風險真實世界場景，沒有人類可供模仿。這場架構競爭的結果，將決定哪家公司的AI技術棧在2028年及以後真正領先。

第一節 — 為何訓練資料是AI護城河

在端到端神經網路駕駛架構中（Tesla FSD v12+ 與 Waymo 現行神經網路技術棧均採用此架構），模型不遵循手工編寫的規則，而是透過觀察數百萬個駕駛場景來學習正確的行為應該是什麼。觀察經驗的品質與數量，幾乎決定了模型的所有表現。

飛輪運作方式如下：

部署更多車輛 → 行駛更多里程 → 捕捉更多邊緣案例 → 更好的訓練資料 → 更強的模型 → 銷售或部署更多車輛 → 循環重複

關鍵洞察是：資料數量與資料品質並不相同。 10億英里中人類駕駛從未遭遇異常狀況的有監督FSD資料，每英里的價值，遠低於100萬英里完全無人駕駛中AV系統必須獨立應對全新情境的資料。每英里的資訊含量存在根本性差異。

自動駕駛最困難的部分，不是熟悉路段上可預測行為的普通99%里程，而是那1%的長尾邊緣案例：不尋常的道路配置、意外的行人行為、路面障礙物、褪色的車道標線、施工區域，以及四向停車時每位駕駛行為略有不同的複雜多方博弈。這些正是導致失敗的場景——而捕捉它們的訓練資料，價值遠超任何普通公路行駛的資料。

這形成了核心張力：Tesla 擁有更多容易的里程；Waymo 擁有更多在無人協助下處理的困難里程。哪個維度——數量還是品質——對於打造安全的商業自動駕駛更重要？

第二節 — Tesla的資料飛輪：規模化的數量優勢

Tesla的資料飛輪是汽車AI史上最雄心勃勃的資料收集行動，其規模在業界無可比擬。

維度	詳情
車隊規模	2026年中期已有超過600萬輛FSD車輛
每日里程	估計整個車隊每日FSD啟動行駛數千萬英里（估計值）
資料類型	有監督：人類駕駛始終在場；系統觀察人類行為；捕捉人類接管干預
邊緣案例捕捉	遍及美國40+州、加拿大、有限歐盟市場：極大的地理與場景多樣性；罕見事件在車隊規模下頻繁發生
訓練信號	人類接管 = 標記的訓練資料；「人類接管」= 系統做了錯誤的事；車隊每年產生數十億個標記修正事件（估計值）
資料管道	影子模式：即使未啟用FSD的駕駛，FSD也在背景運行；捕捉人類行為與FSD預測行為之間的差異；生成龐大的未標記比較資料集
Dojo	Tesla自研AI訓練叢集；D1晶片針對影片型駕駛訓練所需的特定張量運算最佳化
核心優勢	沒有競爭對手能在沒有消費者汽車業務的情況下複製600萬輛的規模；資料護城河隨每輛新車銷售而增強
核心限制	有監督資料存在選擇偏差：人類大多在正常場景下駕駛；人類也犯錯的真正新穎情境被嚴重低估；人在迴路中造成品質上限

影子模式管道是Tesla最被低估的競爭優勢。即使是從未啟用FSD的Tesla車主，也在為訓練資料集做出貢獻：車輛觀察人類駕駛的行為，並與FSD系統預測的行為進行比較。這在零增量採集成本下，創造了有史以來最大的持續更新駕駛行為比較資料集。

第三節 — Waymo的資料飛輪：品質優於數量

Waymo的資料飛輪規模小了幾個數量級，但專為捕捉Tesla無法規模化收集的特定訓練信號而設計：系統在沒有人類可模仿時的實際表現。

維度	詳情
車隊規模	2026年中期約1,500輛專用車輛
每日里程	約15萬次/週 × 平均約4英里/次 = 約60萬商業英里/週 = 約8.6萬英里/天（估計值）
資料類型	完全無人駕駛：無人在迴路中；捕捉AV系統在無人類備援下實際處理新穎情境的方式
邊緣案例捕捉	地理多樣性有限（4個城市）；但每次商業車程都是真實世界的無人駕駛場景，有真實乘客——後果比有監督場景更嚴重
訓練信號	不適感事件、乘客行為、場景難度、遠端協助請求——比單純「人類接管」更豐富的行為信號
模擬	Waymo模擬城市可大規模生成合成場景；能在真實世界部署前運行數十億模擬英里
多感測器資料	光達 + 攝影機 + 雷達 = 比僅攝影機更豐富的每英里空間資料；3D點雲提供訓練的地面實況幾何
核心優勢	無人駕駛里程為問題最困難部分提供最高品質信號：系統在沒有人類可模仿時會怎麼做？
核心限制	每日約8.6萬商業英里 vs Tesla估計的數千萬英里——數量差距達100至1,000倍（估計值）；地理多樣性僅限4個城市

Waymo的無人駕駛信號在質上與Tesla目前能大規模收集的任何資料都不同。當Waymo車輛遭遇前所未見的場景時，它必須自行處理，或請求遠端協助。兩種結果都是高信號訓練事件。Waymo的模擬能力部分彌補了數量差距——可以生成在真實世界駕駛中幾乎從未出現的合成罕見事件。

第四節 — 品質 vs 數量的辯論

Tesla與Waymo架構理念之間的核心分歧，對應到機器學習中一個真正未解決的問題：更多低品質資料是否優於更少高品質資料？

論點	支持Tesla數量的理由	支持Waymo品質的理由
罕見事件	600萬輛車下，百萬分之一的罕見事件每天都會發生；1,500輛車下可能永遠不會出現在訓練資料中	模擬可大規模生成合成罕見事件；無人駕駛的真實世界罕見事件提供最高品質信號
邊緣案例標記	人類接管提供自然標記（接管 = 系統出錯）	無人駕駛場景 = 系統必須處理；結果可觀察（車程完成？請求協助？）
泛化能力	更多地理多樣性 → 更好地泛化到不同路況、標誌和天氣	城市有限，但模擬補足；多感測器資料提供更豐富的每樣本資訊
長尾	罕見駕駛場景的長尾是主要安全挑戰；Tesla的規模自然捕捉更多長尾	Waymo認為最重要的長尾場景，正是人類也會失敗的情境——只有無人駕駛資料能揭示
遷移學習	消費者資料能很好地遷移到有監督駕駛改進；對完全自主駕駛是否適用尚不明確	無人駕駛資料直接符合目標行為分佈；無從有監督到自主的分佈偏移
結論（估計）	數量在有監督駕駛改進和ADAS方面勝出；品質在無人駕駛安全認證方面勝出	兩者皆需要；理想訓練集結合Tesla規模的數量與Waymo品質的無人駕駛信號

遷移學習問題值得特別關注。Tesla的有監督訓練資料在與目標行為不同的分佈下收集：系統在有人類備援的情況下進行訓練，但目標是在沒有人類的情況下安全駕駛。這種從有監督收集到自主部署的分佈差距，是單靠增加數量無法解決的根本挑戰。

第五節 — 飛輪如何塑造競爭格局

資料飛輪競爭在幾個場景中展開，每個場景對2028年的競爭結果有不同影響。

場景	結果
Tesla無人駕駛率先規模化	Tesla飛輪從有監督轉為無人駕駛資料收集；品質趕上數量；複合優勢加速；對所有競爭對手的差距擴大
Waymo車隊達到10萬輛	品質規模化成為可能；真實世界無人駕駛資料結合模擬，創造同時提供覆蓋範圍和信號品質的訓練資料集
中國AV玩家	由於資料本地化法規形成獨立護城河；比亞迪和蔚來的國內規模可在中國境內複製Tesla的數量飛輪
新進者顛覆	任何新進者都面臨冷啟動問題：沒有訓練資料 → 沒有能力的系統 → 沒有部署 → 沒有訓練資料；需要大規模模擬投資或收購現有玩家
資料共享	沒有主要AV公司共享訓練資料；每家都在建立專有護城河；贏家是最先將資料優勢轉化為商業規模的公司

冷啟動問題是AV競爭中投資人最重要的結構性事實。資料飛輪創造了隨時間增強（而非減弱）的複合進入障礙。新進者今天試圖打造有競爭力的AV系統，面臨無法快速彌合的訓練資料赤字：累積真實世界駕駛里程需要數年，僅靠模擬資料不足以通過無人駕駛商業認證。

第六節 — 投資人信號：2028年哪個飛輪更值錢？

Tesla數量飛輪的多頭論點依賴三個假設：有監督到無人駕駛的遷移學習效果足夠好；Tesla Robotaxi在2026-2027年達到商業規模，將飛輪從有監督轉為無人駕駛收集；以及攝影機純視覺感知通過規模最終追平或超越光達感知。

Waymo品質飛輪的多頭論點依賴三個不同假設：無人駕駛資料對最後的安全認證至關重要；Waymo車隊通過Google合作和Uber貨運部署增長至5萬至10萬輛；以及光達多感測器資料提供持久的每英里資訊優勢。

綜合觀點：兩個飛輪都是必要的，單獨任何一個都不夠。理想的商業無人駕駛系統訓練資料集，結合了Tesla規模的數量（場景廣度、地理多樣性、車隊規模下的罕見事件密度）與Waymo品質的無人駕駛信號（符合政策的資料、高後果場景、無分佈偏移）。

對投資人而言，關鍵觀察信號是：Tesla Robotaxi無人駕駛部署進度（轉換飛輪）、Waymo車隊擴張公告（品質收集規模化）、AV公司間的任何資料共享夥伴關係（將重新分配護城河），以及監管安全認證門檻（可能最終決定數量或品質飛輪提供必要的認證證據）。

資料飛輪意味著AV領先者與跟隨者之間的差距，隨時間擴大而非縮小。將資料優勢轉化為商業規模的競賽，是未來三年實體AI中最具決定性的競爭事件。

第七節 — 關於本系列

這是實體AI基準系列的第65篇。前64篇涵蓋了加速指數、人形機器人競賽、單位經濟學、全球競爭、高精地圖、車隊運營、軟體與OTA、保險與責任、消費者需求、競爭護城河、Cybercab對比Model Y、安全資料、Waymo Gen 6、Optimus製造、記分卡快照、2030預測場景、投資人框架、城市擴張管道、Tesla FSD州級審批地圖、AV天氣與氣候限制、人才戰爭、監管日曆、機器人計程車定價、人形機器人部署追蹤器、供應鏈分析、消費者採用需求指數、估值與IPO分析、實體AI 2026年中回顧，以及AV每英里成本分解。

本文新增資料飛輪維度：Tesla數量飛輪（600萬輛、有監督資料規模化、影子模式管道、Dojo）與Waymo品質飛輪（完全無人駕駛商業車程、多感測器地面實況、模擬城市）之間的架構比較，以機器學習術語闡述的數量 vs 品質辯論，以及揭示哪個飛輪正在勝出的投資人信號。

注意： 本文中所有車隊規模、每日里程和商業車程估計，均基於公開的公司披露、新聞稿和業界分析。無精確資料時，估計值標記為「（估計值）」，僅供方向性參考。本文不構成投資建議。