Skip to content
AI-Daily-Builder

2026-06-18 views

Physical AI 數據飛輪 2026 — 特斯拉 60 億英里監督式 FSD 數據 vs Waymo 3000 萬英里全自動駕駛:訓練數據基準測試

特斯拉累積超過 60 億英里監督式 FSD 數據,Waymo 擁有 3000 萬英里全自動駕駛里程。規模對品質——這場數據飛輪之爭定義了 Physical AI 的訓練優勢。

Physical AI 基準系列第 173 篇 — 訓練數據與數據飛輪

Physical AI 訓練競賽中最根本的不對稱性不是算力、估值或監管許可,而是數據。截至 2026 年中,特斯拉已從約 600 萬輛消費者車輛中累積了估計超過 60 億英里的監督式全自動駕駛(FSD)里程(估計值)。Waymo 則在鳳凰城、舊金山、洛杉磯和奧斯丁的機器人計程車隊中累積了約 2500 萬至 3500 萬英里的完全無人駕駛商業里程(估計值)。原始數字給了特斯拉約 200:1 的規模優勢。但這些數據並不等同:Waymo 每一英里都是完全自主駕駛完成的,從未有人可以介入;特斯拉每一英里都有持照人類駕駛員在場,隨時準備接管。本文基準測試哪種數據優勢在戰略上更持久、每種數據類型實際上訓練的是什麼,以及隨著兩個車隊的成長,飛輪的樣貌。


第一節 — 兩個數據飛輪:規模 vs. 純粹度

維度特斯拉 FSD 數據飛輪Waymo 無人駕駛數據飛輪
總里程(估計值)截至 2026 年中累計超過 60 億英里監督式 FSD 里程(估計值)截至 2026 年中累計約 2500 萬至 3500 萬英里無人駕駛商業里程(估計值)
每週里程(估計值)估計每週數千萬英里監督式里程(600 萬輛車輛乘以平均 FSD 使用率)估計每週 15 萬次以上付費乘車乘以平均 3–5 英里 = 估計每週 45 萬至 75 萬英里無人駕駛里程
數據生成比例特斯拉每週生成的里程估計比 Waymo 多 100–200 倍(估計值)Waymo 總里程少得多,但全部為完全自主駕駛
駕駛員在場?是 — 持照人類駕駛員必須全程監督 FSD;駕駛員可隨時脫離接管否 — 零人為介入;車輛完全自主做出每一個決策
數據標籤品質監督式里程包含 AI 成功決策和人類覆蓋(脫離);脫離時刻是最有價值的訓練信號完全自主里程:AI 做出的每一個決策都是實際結果——沒有人類校正信號,但 AI 必須足夠強健以在無人幫助下處理每一個場景
數據訓練的內容FSD:訓練神經網路匹配人類駕駛行為,並在需要介入時恢復;脫離事件自動標記邊緣案例以重新訓練Waymo:訓練系統完全自主地處理現實世界場景的完整分佈——包括在無人幫助下從自身錯誤中恢復
數據引擎(特斯拉)Tesla 的 Data Engine:FSD 行程錄製影片;車載模型自動標記幀;低信心幀被標記並發送到雲端進行人工審查;自動標記可擴展;人工審查聚焦於困難案例Waymo 的等效系統:所有無人駕駛行程都被記錄;任何需要遠端操作注意的場景都被標記;模擬生成合成邊緣案例
飛輪複利更多特斯拉車輛 → 更多 FSD 里程 → 更多訓練數據 → 更好的 FSD → 更高的使用率 → 更多收入 → 更多研發 → 更好的 FSD更多 Waymo 無人駕駛乘車 → 更多無人駕駛里程 → 發現更多邊緣案例 → 更好的系統 → 更多許可 → 更多城市 → 更多乘車

規模比率令人矚目。特斯拉每年增加估計 20–30 億英里監督式里程;Waymo 每年增加估計 2500 至 4000 萬英里無人駕駛里程。特斯拉的原始里程生成速率比 Waymo 高約兩個數量級。但 200:1 的里程比率並不能轉化為 200:1 的訓練信號品質優勢——因為兩種里程類型訓練的是不同的能力。


第二節 — 監督式與無人駕駛里程實際訓練的差異

訓練維度特斯拉監督式里程訓練的內容Waymo 無人駕駛里程訓練的內容戰略意涵
正常駕駛匹配人類的駕駛行為:車道保持、速度、跟車距離、路口處理——全部根據人類駕駛方式校準Waymo 自己的正常駕駛策略:獨立於人類行為規範開發;針對乘客舒適度、安全性和效率優化兩者都有高質量的正常駕駛數據;特斯拉的更像人類,Waymo 的可能更優化
邊緣案例發現人類脫離 = 自動標記的邊緣案例;60 億英里在規模上產生數百萬個邊緣案例例子;邊緣案例每英里罕見但在車隊規模上數量龐大無人駕駛運行:Waymo 在無人類後盾的情況下在現實中遇到邊緣案例;系統必須處理它們;每個被處理的邊緣案例都是強健性的證明特斯拉發現更多總邊緣案例(規模);Waymo 的邊緣案例個別更有價值(證明無人可處理)
從錯誤中恢復人類在錯誤成為事故之前捕獲它;AI 從未學會在無人幫助下從深度失敗狀態中恢復Waymo 必須自主從自身錯誤中恢復;這訓練了監督系統不會學到的恢復行為Waymo 的恢復訓練是完全無人駕駛操作的結構性優勢;監督系統在此有缺口
罕見天氣和條件特斯拉車隊在全美 50 個州加上國際:雪、冰、霧、大雨、施工區——在規模上廣泛的環境覆蓋Waymo 車隊在 4 個陽光帶和溫和氣候城市(鳳凰城、舊金山、洛杉磯、奧斯丁)——與特斯拉全球車隊相比天氣多樣性有限特斯拉有顯著的天氣多樣性優勢;Waymo 的鳳凰城和舊金山數據品質高但地理上較窄
夜間和低光照600 萬輛車輛 24 小時運行包括夜間;大量夜間駕駛數據集15 萬次以上每週乘車包括舊金山 24 小時運行;但較小的車隊意味著絕對夜間數據較少特斯拉有更多絕對夜間里程;Waymo 來自舊金山 24 小時運行的夜間數據是高品質城市夜間數據
新場景在 60 億英里中,特斯拉遇到了數百萬個不尋常的場景;Data Engine 找出模型出錯的那些在 3000 萬英里無人駕駛中,Waymo 遇到必須在無人幫助下處理的新場景——對”已處理”的要求門檻更高不同但互補;在新場景訓練方面沒有明確的贏家
長尾覆蓋特斯拉:60 億英里以監督式數據品質為代價生成龐大的長尾覆蓋Waymo:3000 萬無人駕駛里程以更高的每英里品質生成深度長尾覆蓋Waymo 的長尾覆蓋已被證實(車輛已處理它);特斯拉的被觀察到但有人類安全網

第三節 — 脫離數據:特斯拉最有價值的信號

脫離維度細節備注
脫離是什麼人類 FSD 用戶接管車輛控制——自願(不喜歡 FSD 的做法)或因為 FSD 發起交接每次脫離都是自動標記的訓練例子:“在這個時刻,在這個情境中,人類決定 FSD 沒有正確處理情況”
脫離率趨勢(估計值)FSD v12/v13 關鍵脫離率:估計每 1,000 英里 0.03–0.05 次(估計值);意味著估計每 20,000–33,000 英里 FSD 運行有 1 次脫離(估計值)每次比率提升,每英里的訓練例子更少——但在 60 億總里程中,絕對數量仍然龐大
特斯拉如何使用脫離數據脫離幀被自動標記並反饋到訓練管道;單一脫離事件產生數百幀”FSD 即將做 X,人類糾正”訓練信號這創建了監督駕駛獨有的封閉反饋迴路:人類行為是訓練信號
Waymo 等效物Waymo 沒有脫離數據(沒有人類可以脫離);相反,遠端操作聯繫率作為”系統發現具有挑戰性的情況”的代理遠端操作聯繫比特斯拉脫離更罕見,代表更高嚴重程度的情況
脫離數據對 FSD 的重要性特斯拉正在訓練 AI 像人類一樣駕駛;人類糾正告訴 AI 何時以及如何偏離人類判斷;這個反饋迴路將 FSD 從每 500 英里 1 次脫離(v10 估計)推進到估計每 20,000 英里以上 1 次(v13 估計)改進軌跡表明反饋迴路工作效果非常好;FSD 快速改進曲線部分由脫離訓練信號的品質解釋
監督到無人駕駛的差距對監督里程的訓練優化”人類不會介入”;過渡到無人駕駛需要”系統從不需要人類介入”——這些是微妙但重要的不同優化目標特斯拉在監督數據上訓練的 FSD 必須遷移到無人駕駛運行;這非同小可,是特斯拉自主過渡的核心挑戰

第四節 — 車隊規模 vs. 車隊品質:哪個飛輪勝出?

場景特斯拉優勢Waymo 優勢在此場景中誰勝出
提升正常駕駛性能龐大數據集;快速迭代週期;數十億英里可學習高品質自主數據;每英里都證明強健性兩者都強;特斯拉的規模優勢對規模下罕見但真實的場景具有決定性
實現無人駕駛運行必須跨越監督到無人駕駛的差距;大型車隊但數據為監督優化已在運行無人駕駛;數據直接反映無人駕駛性能要求Waymo:無人駕駛訓練數據對無人駕駛部署更直接相關
擴展到新地域600 萬輛車輛已在新地域:雪、冰、國際道路必須將車隊實際部署到新城市;無法對不存在的數據進行預訓練特斯拉:新環境預訓練的巨大地理覆蓋優勢
天氣強健性規模下的雪、冰、霧、雨數據(美國加上國際車隊)陽光帶重點;有限的惡劣天氣數據特斯拉:決定性的天氣多樣性優勢
無人類的邊緣案例恢復監督數據:邊緣案例被觀察到但人類防止最壞結果無人駕駛數據:邊緣案例完全自主處理Waymo:無人類介入的恢復訓練是獨特的無人駕駛特性
訓練效率FSD v12:端到端模型;數十億英里訓練一個神經網路Waymo:模組化系統加端到端組件;更小的數據集但更高的每英里資訊密度大致相當;不同架構從各自數據集中提取不同價值
整體飛輪結論特斯拉在規模、速度和地理覆蓋上勝出Waymo 在無人駕駛特定能力的數據品質上勝出長期飛輪的勝者取決於監督到無人駕駛的差距是否可以被規模彌合(特斯拉的賭注),或者無人駕駛特定訓練數據是否不可替代(Waymo 的結構性地位)

第五節 — 數據飛輪上升指數:需要追蹤的關鍵指標

KPI特斯拉 2026 年 Q2Waymo 2026 年 Q22026 年下半年軌跡
累計里程(估計值)估計 60 億以上監督式(估計值)估計 2500 至 3500 萬無人駕駛(估計值)特斯拉:估計每年增加 20–30 億英里;Waymo:估計每年增加 2500–4000 萬英里
每週里程生成(估計值)估計每週數千萬英里(估計值)估計每週 45 萬至 75 萬無人駕駛英里(估計值)特斯拉隨 FSD 使用率增長;Waymo 隨車隊規模增長
脫離率(FSD 估計值)估計每 1,000 英里 0.03–0.05 次(估計值)不適用(無監督駕駛)關鍵指標:比率持續下降 → FSD 接近無人駕駛門檻
每週無人駕駛里程(估計值)估計 0 無人駕駛英里(奧斯丁僅為監督式)估計每週 45 萬至 75 萬無人駕駛英里(估計值)特斯拉:奧斯丁第一批無人駕駛里程待 FMVSS;Waymo:隨 Gen 6 車隊上升
模型改進率FSD v10 → v13:脫離率在估計 3 年內改進了估計 40 倍(估計值)Waymo:脫離率 = 0(不適用);通過新城市發布和邊緣案例處理追蹤運行能力改進兩者都顯示快速改進;不同指標
數據優勢持久性特斯拉的規模優勢隨每輛新 FSD 車輛銷售而增長;只要 FSD 使用率保持就持久Waymo 的無人駕駛品質優勢只要特斯拉無法在沒有無人駕駛特定訓練數據的情況下跨越監督到無人駕駛差距就持久兩者的關鍵問題:特斯拉的規模能否彌合品質差距,還是無人駕駛需要無人駕駛數據?FSD v13 的軌跡表明規模正在勝出——但實驗尚未結束

第六節 — 關於本系列

本文是 Physical AI 基準系列第 173 篇。本文新增了數據飛輪維度:特斯拉監督式里程與 Waymo 無人駕駛里程之間 200:1 的規模比率、每種里程類型實際訓練的內容,以及為什麼監督到無人駕駛的差距是 Physical AI 數據競賽中最重要的開放問題。

提示: 本文中所有里程數字、脫離率、車隊規模和預測均為基於公開信息、公司披露和行業分析的估計值,全程標記為”(估計值)“。本文不構成投資建議。在做出任何投資決策之前,請進行自己的盡職調查並諮詢持牌財務顧問。


來源

標籤

請喝咖啡