2026-06-18 — views
Physical AI 數據飛輪 2026 — 特斯拉 60 億英里監督式 FSD 數據 vs Waymo 3000 萬英里全自動駕駛:訓練數據基準測試
特斯拉累積超過 60 億英里監督式 FSD 數據,Waymo 擁有 3000 萬英里全自動駕駛里程。規模對品質——這場數據飛輪之爭定義了 Physical AI 的訓練優勢。
Physical AI 基準系列第 173 篇 — 訓練數據與數據飛輪
Physical AI 訓練競賽中最根本的不對稱性不是算力、估值或監管許可,而是數據。截至 2026 年中,特斯拉已從約 600 萬輛消費者車輛中累積了估計超過 60 億英里的監督式全自動駕駛(FSD)里程(估計值)。Waymo 則在鳳凰城、舊金山、洛杉磯和奧斯丁的機器人計程車隊中累積了約 2500 萬至 3500 萬英里的完全無人駕駛商業里程(估計值)。原始數字給了特斯拉約 200:1 的規模優勢。但這些數據並不等同:Waymo 每一英里都是完全自主駕駛完成的,從未有人可以介入;特斯拉每一英里都有持照人類駕駛員在場,隨時準備接管。本文基準測試哪種數據優勢在戰略上更持久、每種數據類型實際上訓練的是什麼,以及隨著兩個車隊的成長,飛輪的樣貌。
第一節 — 兩個數據飛輪:規模 vs. 純粹度
| 維度 | 特斯拉 FSD 數據飛輪 | Waymo 無人駕駛數據飛輪 |
|---|---|---|
| 總里程(估計值) | 截至 2026 年中累計超過 60 億英里監督式 FSD 里程(估計值) | 截至 2026 年中累計約 2500 萬至 3500 萬英里無人駕駛商業里程(估計值) |
| 每週里程(估計值) | 估計每週數千萬英里監督式里程(600 萬輛車輛乘以平均 FSD 使用率) | 估計每週 15 萬次以上付費乘車乘以平均 3–5 英里 = 估計每週 45 萬至 75 萬英里無人駕駛里程 |
| 數據生成比例 | 特斯拉每週生成的里程估計比 Waymo 多 100–200 倍(估計值) | Waymo 總里程少得多,但全部為完全自主駕駛 |
| 駕駛員在場? | 是 — 持照人類駕駛員必須全程監督 FSD;駕駛員可隨時脫離接管 | 否 — 零人為介入;車輛完全自主做出每一個決策 |
| 數據標籤品質 | 監督式里程包含 AI 成功決策和人類覆蓋(脫離);脫離時刻是最有價值的訓練信號 | 完全自主里程:AI 做出的每一個決策都是實際結果——沒有人類校正信號,但 AI 必須足夠強健以在無人幫助下處理每一個場景 |
| 數據訓練的內容 | FSD:訓練神經網路匹配人類駕駛行為,並在需要介入時恢復;脫離事件自動標記邊緣案例以重新訓練 | Waymo:訓練系統完全自主地處理現實世界場景的完整分佈——包括在無人幫助下從自身錯誤中恢復 |
| 數據引擎(特斯拉) | Tesla 的 Data Engine:FSD 行程錄製影片;車載模型自動標記幀;低信心幀被標記並發送到雲端進行人工審查;自動標記可擴展;人工審查聚焦於困難案例 | Waymo 的等效系統:所有無人駕駛行程都被記錄;任何需要遠端操作注意的場景都被標記;模擬生成合成邊緣案例 |
| 飛輪複利 | 更多特斯拉車輛 → 更多 FSD 里程 → 更多訓練數據 → 更好的 FSD → 更高的使用率 → 更多收入 → 更多研發 → 更好的 FSD | 更多 Waymo 無人駕駛乘車 → 更多無人駕駛里程 → 發現更多邊緣案例 → 更好的系統 → 更多許可 → 更多城市 → 更多乘車 |
規模比率令人矚目。特斯拉每年增加估計 20–30 億英里監督式里程;Waymo 每年增加估計 2500 至 4000 萬英里無人駕駛里程。特斯拉的原始里程生成速率比 Waymo 高約兩個數量級。但 200:1 的里程比率並不能轉化為 200:1 的訓練信號品質優勢——因為兩種里程類型訓練的是不同的能力。
第二節 — 監督式與無人駕駛里程實際訓練的差異
| 訓練維度 | 特斯拉監督式里程訓練的內容 | Waymo 無人駕駛里程訓練的內容 | 戰略意涵 |
|---|---|---|---|
| 正常駕駛 | 匹配人類的駕駛行為:車道保持、速度、跟車距離、路口處理——全部根據人類駕駛方式校準 | Waymo 自己的正常駕駛策略:獨立於人類行為規範開發;針對乘客舒適度、安全性和效率優化 | 兩者都有高質量的正常駕駛數據;特斯拉的更像人類,Waymo 的可能更優化 |
| 邊緣案例發現 | 人類脫離 = 自動標記的邊緣案例;60 億英里在規模上產生數百萬個邊緣案例例子;邊緣案例每英里罕見但在車隊規模上數量龐大 | 無人駕駛運行:Waymo 在無人類後盾的情況下在現實中遇到邊緣案例;系統必須處理它們;每個被處理的邊緣案例都是強健性的證明 | 特斯拉發現更多總邊緣案例(規模);Waymo 的邊緣案例個別更有價值(證明無人可處理) |
| 從錯誤中恢復 | 人類在錯誤成為事故之前捕獲它;AI 從未學會在無人幫助下從深度失敗狀態中恢復 | Waymo 必須自主從自身錯誤中恢復;這訓練了監督系統不會學到的恢復行為 | Waymo 的恢復訓練是完全無人駕駛操作的結構性優勢;監督系統在此有缺口 |
| 罕見天氣和條件 | 特斯拉車隊在全美 50 個州加上國際:雪、冰、霧、大雨、施工區——在規模上廣泛的環境覆蓋 | Waymo 車隊在 4 個陽光帶和溫和氣候城市(鳳凰城、舊金山、洛杉磯、奧斯丁)——與特斯拉全球車隊相比天氣多樣性有限 | 特斯拉有顯著的天氣多樣性優勢;Waymo 的鳳凰城和舊金山數據品質高但地理上較窄 |
| 夜間和低光照 | 600 萬輛車輛 24 小時運行包括夜間;大量夜間駕駛數據集 | 15 萬次以上每週乘車包括舊金山 24 小時運行;但較小的車隊意味著絕對夜間數據較少 | 特斯拉有更多絕對夜間里程;Waymo 來自舊金山 24 小時運行的夜間數據是高品質城市夜間數據 |
| 新場景 | 在 60 億英里中,特斯拉遇到了數百萬個不尋常的場景;Data Engine 找出模型出錯的那些 | 在 3000 萬英里無人駕駛中,Waymo 遇到必須在無人幫助下處理的新場景——對”已處理”的要求門檻更高 | 不同但互補;在新場景訓練方面沒有明確的贏家 |
| 長尾覆蓋 | 特斯拉:60 億英里以監督式數據品質為代價生成龐大的長尾覆蓋 | Waymo:3000 萬無人駕駛里程以更高的每英里品質生成深度長尾覆蓋 | Waymo 的長尾覆蓋已被證實(車輛已處理它);特斯拉的被觀察到但有人類安全網 |
第三節 — 脫離數據:特斯拉最有價值的信號
| 脫離維度 | 細節 | 備注 |
|---|---|---|
| 脫離是什麼 | 人類 FSD 用戶接管車輛控制——自願(不喜歡 FSD 的做法)或因為 FSD 發起交接 | 每次脫離都是自動標記的訓練例子:“在這個時刻,在這個情境中,人類決定 FSD 沒有正確處理情況” |
| 脫離率趨勢(估計值) | FSD v12/v13 關鍵脫離率:估計每 1,000 英里 0.03–0.05 次(估計值);意味著估計每 20,000–33,000 英里 FSD 運行有 1 次脫離(估計值) | 每次比率提升,每英里的訓練例子更少——但在 60 億總里程中,絕對數量仍然龐大 |
| 特斯拉如何使用脫離數據 | 脫離幀被自動標記並反饋到訓練管道;單一脫離事件產生數百幀”FSD 即將做 X,人類糾正”訓練信號 | 這創建了監督駕駛獨有的封閉反饋迴路:人類行為是訓練信號 |
| Waymo 等效物 | Waymo 沒有脫離數據(沒有人類可以脫離);相反,遠端操作聯繫率作為”系統發現具有挑戰性的情況”的代理 | 遠端操作聯繫比特斯拉脫離更罕見,代表更高嚴重程度的情況 |
| 脫離數據對 FSD 的重要性 | 特斯拉正在訓練 AI 像人類一樣駕駛;人類糾正告訴 AI 何時以及如何偏離人類判斷;這個反饋迴路將 FSD 從每 500 英里 1 次脫離(v10 估計)推進到估計每 20,000 英里以上 1 次(v13 估計) | 改進軌跡表明反饋迴路工作效果非常好;FSD 快速改進曲線部分由脫離訓練信號的品質解釋 |
| 監督到無人駕駛的差距 | 對監督里程的訓練優化”人類不會介入”;過渡到無人駕駛需要”系統從不需要人類介入”——這些是微妙但重要的不同優化目標 | 特斯拉在監督數據上訓練的 FSD 必須遷移到無人駕駛運行;這非同小可,是特斯拉自主過渡的核心挑戰 |
第四節 — 車隊規模 vs. 車隊品質:哪個飛輪勝出?
| 場景 | 特斯拉優勢 | Waymo 優勢 | 在此場景中誰勝出 |
|---|---|---|---|
| 提升正常駕駛性能 | 龐大數據集;快速迭代週期;數十億英里可學習 | 高品質自主數據;每英里都證明強健性 | 兩者都強;特斯拉的規模優勢對規模下罕見但真實的場景具有決定性 |
| 實現無人駕駛運行 | 必須跨越監督到無人駕駛的差距;大型車隊但數據為監督優化 | 已在運行無人駕駛;數據直接反映無人駕駛性能要求 | Waymo:無人駕駛訓練數據對無人駕駛部署更直接相關 |
| 擴展到新地域 | 600 萬輛車輛已在新地域:雪、冰、國際道路 | 必須將車隊實際部署到新城市;無法對不存在的數據進行預訓練 | 特斯拉:新環境預訓練的巨大地理覆蓋優勢 |
| 天氣強健性 | 規模下的雪、冰、霧、雨數據(美國加上國際車隊) | 陽光帶重點;有限的惡劣天氣數據 | 特斯拉:決定性的天氣多樣性優勢 |
| 無人類的邊緣案例恢復 | 監督數據:邊緣案例被觀察到但人類防止最壞結果 | 無人駕駛數據:邊緣案例完全自主處理 | Waymo:無人類介入的恢復訓練是獨特的無人駕駛特性 |
| 訓練效率 | FSD v12:端到端模型;數十億英里訓練一個神經網路 | Waymo:模組化系統加端到端組件;更小的數據集但更高的每英里資訊密度 | 大致相當;不同架構從各自數據集中提取不同價值 |
| 整體飛輪結論 | 特斯拉在規模、速度和地理覆蓋上勝出 | Waymo 在無人駕駛特定能力的數據品質上勝出 | 長期飛輪的勝者取決於監督到無人駕駛的差距是否可以被規模彌合(特斯拉的賭注),或者無人駕駛特定訓練數據是否不可替代(Waymo 的結構性地位) |
第五節 — 數據飛輪上升指數:需要追蹤的關鍵指標
| KPI | 特斯拉 2026 年 Q2 | Waymo 2026 年 Q2 | 2026 年下半年軌跡 |
|---|---|---|---|
| 累計里程(估計值) | 估計 60 億以上監督式(估計值) | 估計 2500 至 3500 萬無人駕駛(估計值) | 特斯拉:估計每年增加 20–30 億英里;Waymo:估計每年增加 2500–4000 萬英里 |
| 每週里程生成(估計值) | 估計每週數千萬英里(估計值) | 估計每週 45 萬至 75 萬無人駕駛英里(估計值) | 特斯拉隨 FSD 使用率增長;Waymo 隨車隊規模增長 |
| 脫離率(FSD 估計值) | 估計每 1,000 英里 0.03–0.05 次(估計值) | 不適用(無監督駕駛) | 關鍵指標:比率持續下降 → FSD 接近無人駕駛門檻 |
| 每週無人駕駛里程(估計值) | 估計 0 無人駕駛英里(奧斯丁僅為監督式) | 估計每週 45 萬至 75 萬無人駕駛英里(估計值) | 特斯拉:奧斯丁第一批無人駕駛里程待 FMVSS;Waymo:隨 Gen 6 車隊上升 |
| 模型改進率 | FSD v10 → v13:脫離率在估計 3 年內改進了估計 40 倍(估計值) | Waymo:脫離率 = 0(不適用);通過新城市發布和邊緣案例處理追蹤運行能力改進 | 兩者都顯示快速改進;不同指標 |
| 數據優勢持久性 | 特斯拉的規模優勢隨每輛新 FSD 車輛銷售而增長;只要 FSD 使用率保持就持久 | Waymo 的無人駕駛品質優勢只要特斯拉無法在沒有無人駕駛特定訓練數據的情況下跨越監督到無人駕駛差距就持久 | 兩者的關鍵問題:特斯拉的規模能否彌合品質差距,還是無人駕駛需要無人駕駛數據?FSD v13 的軌跡表明規模正在勝出——但實驗尚未結束 |
第六節 — 關於本系列
本文是 Physical AI 基準系列第 173 篇。本文新增了數據飛輪維度:特斯拉監督式里程與 Waymo 無人駕駛里程之間 200:1 的規模比率、每種里程類型實際訓練的內容,以及為什麼監督到無人駕駛的差距是 Physical AI 數據競賽中最重要的開放問題。
提示: 本文中所有里程數字、脫離率、車隊規模和預測均為基於公開信息、公司披露和行業分析的估計值,全程標記為”(估計值)“。本文不構成投資建議。在做出任何投資決策之前,請進行自己的盡職調查並諮詢持牌財務顧問。
來源
- Tesla FSD 累計里程 — Tesla AI Day 及財報電話 ↗
- Waymo 無人駕駛里程與乘車次數 — Waymo 部落格 ↗
- Tesla FSD Data Engine — Tesla AI 基礎設施 ↗
- Waymo 安全報告 — Waymo ↗
- FSD 脫離率 — Tesla AI Day 及公開披露 ↗