2026-06-18 — views
フィジカルAIデータフライホイール — Teslaの600万台訓練優位性、Waymoの5000万マイル無人商業走行、そしてAV競争を制するのはデータ量か品質か
Tesla 600万台車隊 vs Waymo 5000万マイル無人走行:データフライホイールをフィジカルAI基準軸として分析し、量と質のどちらが勝つかを検証。
フィジカルAIベンチマークシリーズ第123回 — フィジカルAIデータフライホイール:Teslaの600万台訓練優位性、Waymoの5000万マイル無人商業走行、そしてデータ量と品質のどちらがAV競争を制するか
フィジカルAIベンチマークシリーズは122本の記事にわたって、自動運転車とヒューマノイドロボットにおける技術準備度、運用指標、安全記録、規制枠組み、サプライチェーン、市場評価を網羅的に分析してきた。第123回では、フィジカルAIにおける最も深い競争上の堀に焦点を当てる:データである。
走行する1マイルごとにニューラルネットワークが訓練される。記録されるエッジケースごとにシステムが改善される。しかし、すべてのマイルが等価ではない。人間が5回介入した監視下FSDの1マイルと、複雑な都市交通における安全担当者なしの無人商業走行の1マイルは、本質的に異なる訓練信号である。本記事が解決しようとする問いは構造的だ:誰が最も多くのマイルを持ち、誰のマイルが最も高品質で、そして量と品質のどちらが自動運転訓練競争の勝者を決定するのか。
「(推定)」と表記されたすべての数値は、検証された一次データではなく、公開市場情報、アナリスト推定、企業開示から導出されている。
第1節 — データフライホイールの仕組み
「データフライホイール」とは自己強化サイクルを指す:より良く訓練されたモデルがより清潔な訓練データを生成し、そのデータがさらに優れたモデルを訓練し、という繰り返しだ。自動運転車においてフライホイールには5つの識別可能なステージがあり、各ステージは最も早く参入し最大の車隊を持つ企業の優位性を複利で蓄積する。
| フライホイールステージ | 何が起きるか | なぜ複利になるか |
|---|---|---|
| 車両がデータを収集 | すべてのカメラフレーム、センサー読み取り値、人間の介入、ニアミスが記録され訓練パイプラインに送信される | 現場の車両が多いほど単位時間あたりのデータが多くなる;データ収集速度は車隊規模に比例して拡大する |
| データのラベリングとフィルタリング | 生の映像・センサーデータが処理される:エッジケース、介入、レアシナリオが優先的にラベリングされ、日常の高速道路走行はダウンサンプリングされる | ラベル品質が訓練信号の品質を決定する;エッジケースの誤ったラベリングはモデルに誤った行動を学習させる |
| ラベル付きデータでモデルを訓練 | ニューラルネットワークの重みがラベル付きデータセット上で更新される;Dojo(Tesla)またはTPUクラスター(Waymo/Google)が訓練を処理する | 計算能力がモデルを再訓練できる頻度を決定する;Dojo投資はより速い反復サイクルを意味する |
| 改善されたモデルをOTAで展開 | より良いモデルが無線アップデートで車隊に配信される;モデルのミス率が下がるため車隊は即座により良いデータを生成する | 好循環:より良いモデルがより清潔なデータを生成し、それがさらに良いモデルを訓練し、介入脱離率を低下させる |
| エッジケースの発見 | 改善されたモデルは依然として新しいエッジケースを発見する;これらが次のラウンドの訓練ターゲットとして記録される | 分布の裾(稀だが危険なシナリオ)は完全には消えない;データフライホイールは永続する |
| 車隊規模がすべてを増幅 | 600万台の車隊は1台の車隊と比較して単位時間あたり600万倍のデータを収集する | Teslaの消費者向け車隊優位性は構造的だ:消費者向け自動車事業なしに600万台を複製できるAV企業はない |
第2節 — Teslaのデータ優位性:量
| 指標 | Tesla | Waymo | 比率 |
|---|---|---|---|
| データを収集する現場車両 | 約600万台のFSD対応車両(推定) | 約1,100-1,800台の商業AV車隊(推定) | 約3,300-5,400倍多い車両(推定) |
| 1日あたり走行距離(車隊合計) | 約5,000万-7,000万マイル/日(推定、600万台 x 平均アクティブ10マイル/日) | 約15万-20万マイル/日(推定、1,500台 x 約100マイル/台/日) | 約250-450倍多い生マイル/日(推定) |
| 累計監視FSD走行距離 | 約50-60億マイル(推定、2026年Q1開示範囲) | 約5,000万マイルの無人商業走行距離(開示済み) | 約100倍多い生マイル(推定) |
| 記録された人間介入回数 | 監視FSDモードでのすべての手動介入が記録・タグ付けされる;600万台では稀なイベントタイプも頻繁に発生する | Waymoはすべてのリモートアシスト介入とシステム離脱を記録する | Teslaは1日約100倍多くの介入イベントを記録する(推定) |
| 地理的多様性 | 米国全50州およびカナダ;EUは限定的;100,000以上の道路構成 | フェニックス、SF、LA、オースティン、アトランタ — 5つのジオフェンスに限定 | Teslaの方が地理的に圧倒的に多様 |
| 天候多様性 | 米国のすべての気候の全天候条件 | フェニックス:乾燥/暑い;SF:霧;LA:穏やか;雪への露出は限定的 | Teslaは雪、氷、霧、雨、砂漠、高速道路、都市を包括的にカバー |
第3節 — Waymoのデータ優位性:品質
| 指標 | Waymoの優位性 | なぜ品質が重要か |
|---|---|---|
| 無人商業走行距離 | 5,000万マイル以上、車内に人間ドライバーなし;モデルはセーフティネットなしですべてを処理しなければならなかった | 無人走行マイルはより清潔な訓練信号を生成する:モデルの決断のみが記録される;人間介入のノイズがデータセットを汚染しない |
| 都市密度と複雑性 | サンフランシスコは地球上で最も複雑な都市運転環境の一つ:二重駐車の配送車両、攻撃的な自転車乗り、歩行者、ケーブルカー、霧、狭い通り | SFの無人走行マイルは高速道路や郊外走行と比較してエッジケース密度が不釣り合いに高い |
| フルセンサースイートデータ | 毎マイルのライダー+カメラ+レーダー融合データが記録される;3Dポイントクラウド+RGBビデオ+速度データ | より豊富なセンサーデータはより堅牢な知覚モデルの訓練を可能にする;Teslaのカメラのみのデータはライダー知覚を訓練できない |
| クローズドループシミュレーション | Waymoはニューラルレンダリング(NeRFベース)を使用して実際のシナリオを再構成し、数百万のシミュレーションバリエーションを実行する | 1マイルの実走行が1,000以上のシミュレーションバリエーションを生成できる;シミュレーションが有効訓練データを桁違いに増加させる |
| 1マイルあたりの安全クリティカルな瞬間の密度 | SF/フェニックスの商業ライドヘイルは高速道路走行よりも1マイルあたりより多くの安全クリティカルな瞬間を生成する | SFの無人走行1マイルは高速道路FSD 100マイルよりも多くの訓練価値を含む可能性がある |
| アノテーション品質 | Waymoは専任のデータアノテーションチームを持つ;3Dライダーアノテーションはより高価だが2Dカメラアノテーションより正確 | より高いアノテーションコストはより高品質な訓練信号に等しい;Waymoはラベル付きマイルあたりにより多く投資する |
第4節 — 品質対数量の問題:証拠が示すこと
| 証拠の種類 | 示すこと | 解釈 |
|---|---|---|
| FSD離脱率トレンド | Tesla FSDの重大離脱率は2022年から2026年にかけて約10倍改善した(推定、Tesla四半期報告に基づく) | 監視走行マイルの量は確かに改善をもたらしている;フライホイールはTeslaで機能している |
| Waymoの安全記録 | 5,000万マイル以上の無人走行でエアバッグ展開事故ゼロ(開示済み);人間の運転ベースラインを大幅に下回る | 品質のある無人走行マイルは限定的なジオフェンス内で証明可能な安全なシステムを生み出している |
| 汎化の問題 | TeslaのFSDは新しい道路に即座に汎化する(地図不要);Waymoは新しい地理で運行する前にHDマップが必要 | Teslaの量的アプローチは地理的汎化を生み出す;Waymoの品質アプローチはジオフェンス内で安全優先を実現する |
| エッジケースの裾 | Teslaは車隊規模により毎日より多くの新しいエッジケースタイプを発見する;Waymoは無人走行品質によりマップされたエリアでエッジケースをより完全に解決する | 両方が同時に真実;競争はTeslaの量がWaymoの品質よりも速くエッジケースをカバーできるかどうかにある |
| 決定的実験 | Teslaがオースティンで安全ドライバーを取り除くとき:モデルは十分に安全か?これが監視走行マイルが無人走行性能に転換されるかどうかの実際のテストだ | これはAVにおける最も重要なオープンデータ問題:監視学習から無人走行能力への転移率 |
| 学術的証拠 | スケーリング則は計算能力とデータ量の両方が重要であることを示す;裾において、データ品質は生の量よりも重要なことが多い | 無人走行マイルはAV訓練の「高品質トークン」かもしれない;しかしTeslaの量は完全な分布カバレッジを確保する |
第5節 — データフライホイールベンチマークスコアカード
| 次元 | Tesla | Waymo | 優位性 |
|---|---|---|---|
| 生走行距離量 | 約50-60億マイルの監視走行距離(推定) | 約5,000万マイルの無人走行距離 | Teslaが約100倍多い生マイル |
| 1日あたりデータ収集速度 | 約5,000万-7,000万マイル/日(推定) | 約15万-20万マイル/日(推定) | Teslaが約300倍速い日次蓄積 |
| データ品質(1マイルあたり) | 監視下;人間介入が訓練信号にノイズを加える | 無人走行;全行程でモデルの決断のみ | Waymoが1マイルあたり高品質 |
| 地理的多様性 | 米国全50州およびカナダ;全天候条件 | 5つのジオフェンス;限定的な天候露出 | Teslaが圧倒的に多様 |
| 1マイルあたりエッジケース密度 | 低い — 車隊の多くが高速道路と郊外ルートを走行 | 高い — 複雑な都市環境での商業都市ルート | Waymoが1マイルあたりエッジケース密度が高い |
| シミュレーション倍増能力 | Teslaは再構成ベースのシミュレーションを使用(推定) | WaymoはNeRFベースのシーン再構成を使用(開示済み);高度に発達したパイプライン | Waymoのシミュレーション倍増能力が成熟 |
| センサーデータの豊富さ | カメラのみ(車両あたり8カメラ) | ライダー+カメラ+レーダーのフルフュージョン | Waymoが1マイルあたり豊富なセンサーデータ |
| 訓練反復速度 | Dojoが高速再訓練を可能にする(推定) | GoogleのTPUクラスター;世界クラスのインフラ | 同等;両者とも訓練計算の最前線にある |
| 総合評価 | 量、地理、天候多様性で勝る | 品質、エッジケース密度、センサー豊富さで勝る | 異なるが補完的な優位性;規模での安全性には両方が必要 |
注意: 「(推定)」と表記されたすべての数値は、2026年中頃時点での公開市場情報、アナリスト推定、業界報告、および企業IR資料から導出されている。走行距離と車隊規模の推定は公開開示範囲と公開アナリスト推定に基づいており、実際の数値は大きく異なる場合がある。本記事は投資助言を構成しない。
ソース
- Tesla四半期車両安全報告 — Tesla ↗
- Waymo安全報告と走行距離 — Waymo ↗
- Waymoシミュレーションインフラ — Waymo Research ↗
- Chinchillaスケーリング則 — DeepMind ↗
- Tesla Dojo スーパーコンピュータ — Tesla AI ↗