2026-06-18 — views

フィジカルAI算力対決 — Waymo Google Cloud TPU vs Tesla Dojo D1：訓練インフラベンチマーク 2026

WaymoはGoogle TPUポッドを補助金コストで利用し、毎日150億マイルをシミュレーション。TeslaはDojo D1をビデオ学習用に開発し、NVIDIA H100クラスターも並行稼働。

概要

AI訓練コンピュートインフラは、各社が自動運転モデルを改善するためのエンジンです。WaymoはAlphabetの子会社として、GeminiなどのGoogle AIシステムの訓練に使用されるものと同じコンピュートエコシステム——Google Cloud TPU——を利用しています。TeslaはDojo超高性能コンピューターを構築し、大規模ビデオデータ訓練のために特別設計された独自のD1チップを採用しています。本記事では2つのアプローチをベンチマーク比較します——各社のリソース構成、コスト構造、AIモデル改善ペースへの影響。これはフィジカルAIベンチマークシリーズ第165弾です。

セクション1 — Waymoのコンピュートスタック：Google Cloud + TPUエコシステム

Waymoの訓練インフラは、Alphabetの子会社という立場と切り離せません。Google TPUポッド——世界最先端のAI訓練インフラ——へのアクセスは、独立系AVスタートアップが再現できない構造的優位性です。

コンピュート次元	Waymoの詳細	戦略的意義
主要訓練インフラ	WaymoはニューラルネットワークトレーニングにGoogle Cloud TPUを使用；Alphabetの子会社として、WaymoはGoogleの内部TPUポッド——GeminiなどのGoogle AIシステムの訓練に使用されるものと同じインフラ——にアクセスできる	Alphabetの子会社であることで、Waymoは世界最先端のAI訓練インフラに限界コストでアクセスできる；どのAVスタートアップも独力で同等のコンピュートを賄えない
Google TPU v4/v5世代	GoogleのTPU v4ポッドは1ポッドあたり約1 exaFLOPのコンピュートを提供；TPU v5（2023年発表）はワット当たり性能を推定2倍以上向上（推定）；Waymoはこれらのリソースに必要に応じてアクセスできる	TPU v5の性能は、TransformerおよびConvolutionalアーキテクチャ——AV認識・計画で使用される種類——のトレーニングにおける業界最高の処理能力を表す
Google DeepMindとのシナジー	WaymoはDeepMindの研究人材・方法論に潜在的にアクセスできる（両者はAlphabetの子会社）；AlphaFold、Gemini、ロボット工学に関するDeepMindの研究はAVの課題と重なる	子会社間の知識移転は自動的・保証されたものではないが、組織的近接性は重要；DeepMindのロボット工学研究はWaymoの予測・計画問題に直接関連する
シミュレーションコンピュート（CarCraft）	WaymoのCarCraftシミュレーションシステムは、Google Cloud全体で推定150億シミュレーションマイル/日（推定）を実行；このスケールでの稀少・危険・新規シナリオのシミュレーションには大量の並列コンピュートが必要	150億シミュレーションマイル/日は、現実世界では決して十分な量を提供できない極めて稀なエッジケース（100万回に1回のシナリオ）での訓練を可能にする；Google Cloudの弾力的スケールがこれを実現可能にする
コスト構造	WaymoはGoogle Cloudコンピュートに市場価格を支払わない；Alphabetの子会社として、コンピュートコストは事実上補助されている；Waymoの訓練予算は独立して開示されていない	この補助金は巨大な構造的優位性：同等のGoogle Cloudコンピュートに年間10億ドル以上を支払う独立系AVスタートアップが直面する資本制約を、Waymoは持たない
HDマッピングコンピュート	WaymoのHDマップはGoogle Mapsのベースデータ＋Waymo専用のセンチメートル精度ライダー強化で生成・更新；生のライダー点群を航行可能なHDマップに処理するには相当なコンピュートが必要	Google Mapsの既存の地図レンダリング・処理コンピュートインフラがWaymoのHDマップ生成に活用されている——Alphabetとの関係による別の見えない補助金
コンピュート戦略の評定	Waymoのコンピュートアプローチは深度優先：狭く明確に定義された問題領域（自動運転認識・計画）に世界最良のAI訓練インフラ（Google TPU）を使用し、エッジケースカバレッジにGoogleのシミュレーションスケールを活用する。主要リスク：AIアーキテクチャが異なるコンピュートパラダイムを好む方向にシフトした場合、WaymoはGoogleのロードマップに依存することになる。

セクション2 — Teslaのコンピュートスタック：Dojo D1 + NVIDIAクラスター

Teslaのコンピュート戦略はWaymoの正反対です：既存のハイパースケーラーのインフラを活用する代わりに、主要な訓練ワークロード——ビデオ——に最適化した独自チップと超高性能コンピューターを構築しました。

コンピュート次元	Teslaの詳細	戦略的意義
Dojo超高性能コンピューターアーキテクチャ	Teslaはビデオ訓練のためにD1チップ（7nm、362 TFLOPS BF16、チップあたり900 GB/sメモリ帯域幅）を設計；D1チップは訓練ノード（25チップ/ノード = 9 PFLOPS）にタイル化され、ノードはExaPODキャビネット（120ノード = 1.1 EFLOPS/ExaPOD）、ExaPODが完全なDojoクラスターを形成	Dojoのアーキテクチャは、Teslaの特定の訓練ワークロード——数百万台の車両からの大量のビデオフレーム——に最適化されている。チップトポロジー（タイル間の高帯域幅相互接続）はビデオ訓練のデータ移動オーバーヘッドを最小化する
Teslaが独自チップを構築した理由	Teslaの主要訓練ワークロードはビデオ：600万台の車両からの何十億もの8カメラビデオセグメント；既存のGPUおよびTPUアーキテクチャはこの特定のワークロードパターンに最適設計されていなかった；カスタムシリコンにより、Teslaはメモリ帯域幅・相互接続トポロジー・ビデオの精度形式を最適化できる	カスタムシリコン開発には数億ドルと3〜5年が必要；Teslaの根拠は5〜10年の期間にわたる訓練コスト削減が開発コストを超えるというもの——AppleがM系チップに適用したのと同じ論理
Dojo vs. NVIDIA GPUクラスター	TeslaはNVIDIA H100クラスターも訓練に使用（DojoはNVIDIAを補完するが完全に置き換えない）；NVIDIA H100はGPUあたり約2,000 TFLOPS BF16を提供；10,000 GPU H100クラスター = 20 EFLOPS；Tesla合計のDojo + NVIDIAコンピュートは、ハイパースケーラー以外では最大規模の単一企業AI算力展開の一つと推定（推定）	Teslaのデュアルトラック戦略（Dojoによるビデオ最適化訓練 + NVIDIAによる汎用AI）は実用主義を反映：H100は今すぐ利用可能；Dojoは徐々に拡大。両方を並行稼働することで、TeslaはDojoの成熟を待たずにFSDを継続改善できる
訓練データパイプライン	Teslaの主要な算力優位性はチップではなくデータ：600万台の車両 × 平均FSD稼働1時間/日 × 8カメラ = 膨大な日次ビデオ量；ラベリングはData Engine（シャドウモード：FSDが決定し、人間が修正し、修正がラベル付き訓練データとなる）で自動化	Data Engine自体の算力要件も膨大：数百万台の車両でシャドウモード推論を実行し修正を処理するには、訓練コンピュートだけでなく、大量の推論・ストレージインフラが必要
Dojo展開タイムライン	最初のDojo ExaPODは2022年にテキサスGigafactoryで稼働；マスクは2024年末までに100 EFLOPSを目標とした（推定）；実際の展開ペースは完全には開示されていない；その後のNVIDIA H100クラスターへのTeslaの継続投資は、Dojoの拡大が計画より遅かったことを示唆（推定）	計画より遅いDojoの拡大は、カスタムシリコンの典型的なスケジュール超過と一致；これは失敗ではなく——第一世代カスタムチップの通常の軌跡。NVIDIA H100がDojo v2（次世代）まで間を埋める
Dojo v2と将来のコンピュート	Teslaは次世代Dojoチップに言及；2026年中期時点で詳細は未開示（推定）；Dojo v2が典型的な世代当たり2倍の性能向上に従えば、Teslaの訓練コンピュートは2027年に数百 EFLOPSに達する可能性がある（推定）	軌跡は現在の容量より重要：Dojo v2が約束通り実現し、Teslaの訓練コンピュートがハイパースケーラー規模に達した場合、Teslaはそのレベルで独自AI訓練シリコンを持つ唯一の非ハイパースケーラーとなる
コンピュート戦略の評定	Teslaのコンピュートアプローチは自社構築vs外部調達の最大野心版：特定の訓練ワークロードに最適化したカスタムチップと超高性能コンピューターを構築しながら、過渡期はNVIDIAを借用。高リスク（カスタムシリコンは期待外れになることが多い）・高報酬（Dojoが設計通りに機能すれば、FSD改善あたりの訓練コストが大幅に低下）。主要リスク：Dojo D1がNVIDIA依存継続に対する開発コストを正当化するほどの性能・歩留まり目標を達成しない可能性。

セクション3 — 算力正面比較

次元	Waymo / Google TPU	Tesla Dojo + NVIDIA	優位
訓練コンピュートスケール（推定）	GoogleのTPU全機隊にアクセス——潜在的に数百 EFLOPS（推定）；すべてのGoogle AIプロジェクトと共有	Tesla合計Dojo + NVIDIA推定数十 EFLOPS（推定）；TeslaのAIワークロード専用	Waymoはより多くの総コンピュートにアクセス；Teslaはより多くの専用コンピュートを保有
コンピュートコスト構造	事実上補助（Alphabetの子会社）；Google TPUに市場価格支払いなし	混合：Dojoの設備投資を訓練ライフタイムで償却；NVIDIA H100は市場価格で賃借/購入；相当額だが有限	現在のスケールでの訓練あたりコンピュートコストはWaymoが決定的優位
AVのためのチップカスタマイズ	TPUはGoogleのワークロードに最適化（AV専用ではない）；柔軟だが特化していない	Dojo D1はAVスケールのビデオ訓練専用に設計	チップ適合性でTeslaが決定的優位；Waymoは汎用AIチップを使用
訓練データ量	約3,000万無人商業走行マイル（推定）；高純度（完全無人 = クリーンラベル）だが量が少ない	約60億監視付きFSDマイル（推定）；ラベル純度低い（人間監視）が量は膨大	データ量でTeslaが決定的優位；データ純度でWaymoが決定的優位
シミュレーションスケール	Google Cloud上のCarCraft経由で推定150億シミュレーションマイル/日（推定）	Dojo経由で成長中のシミュレーション能力；スケール未開示（推定）	現在のシミュレーションスケールでWaymoが決定的優位
コンピュートロードマップコントロール	GoogleのTPUロードマップに依存（TPU v5からv6等）；独立したチップ設計なし	TeslaはD1からD2へのAV最適化が可能な独自チップロードマップを制御	コンピュート主権とロードマップコントロールでTeslaが決定的優位
算力総評	WaymoのGoogle Cloud / TPU優位は今日構造的：より多い総コンピュート、より低い実効コスト、業界最高TPU性能、比類なきシミュレーションスケール。TeslaのDojo優位は長期的に戦略的：特定ビデオ訓練ワークロードに最適化した専用シリコン、独立したロードマップ、他のAlphabet AIプロジェクトとの共有なし。2028年の問いはDojo v2が性能の約束を果たせるかどうか。

セクション4 — AV競争においてコンピュートが決定するもの

AI能力	コンピュートがどう決定するか	Waymoの優位	Teslaの優位
認識精度	より良い訓練データ + より多いコンピュート → より低い検出エラー率；認識モデルは何十億もの注釈フレームで訓練が必要	無人ラベル純度：訓練データに人間監視のノイズがない	60億マイルのビデオデータ；量がレアケースカバレッジを可能に
予測（他エージェント）	人間行動のモデリングには多様な実世界シナリオでの訓練が必要；シミュレーションが実データでカバーできないギャップを埋める	150億シミュレーションマイル/日がエッジケースを系統的にカバー	実世界データのスケールがシミュレーションが近似する行動多様性を提供
計画（何をするか）	計画ポリシー訓練には安全なエッジケーステストのための大規模シミュレーションが必要；実世界テストはレアシナリオに危険すぎコストが高い	Google Cloudシミュレーションスケールが計画ポリシー改善に決定的	エンドツーエンドFSD v12が認識と計画を一つのネットワークに統合——コンピュート問題を2ステップから1ステップに簡略化
汎化（新都市）	新都市への汎化には：(a) その都市のデータでの訓練、または (b) その都市シナリオのコンピュート集約的シミュレーションが必要	HDマップ + シミュレーションアプローチはWaymoが商業開始前に各新都市のマップ生成とシミュレーションを必要とすることを意味	TeslaのマップレスFSDアプローチは都市固有のシミュレーションが不要；モデルは訓練分布から汎化
モデル反復速度	高速な訓練コンピュート → 週あたりより多くの実験 → より高速なモデル改善	より多くのTPUアクセス = より多くの同時実験が可能	専用Dojoコンピュート = 他のGoogle AIプロジェクトとの競合なし

セクション5 — コンピュートベンチマークスコアカード

次元	Waymo / Google	Tesla Dojo + NVIDIA	優位	2028年の展望
総訓練コンピュートアクセス	決定的 — Google TPU機隊は地球上で最大のAI算力展開の一つ	大規模だがGoogleスケールには及ばない	Waymo（現在）	Dojoの拡大につれTeslaがギャップを縮小
コンピュートコスト効率	決定的 — Alphabetの子会社として事実上補助	市場価格のNVIDIA + Dojoの設備投資	Waymo（現在）	Dojo D2の納品次第
AVワークロードへのシリコン適合	汎用TPU（柔軟だがAV最適化ではない）	Dojo D1はビデオ訓練専用設計（AV最適化）	Tesla	Teslaの目的特化型シリコンは約束通りに実現すれば長期優位
コンピュートロードマップコントロール	GoogleのTPUロードマップに依存	独立したDojoロードマップ	Tesla	TeslaのシリコンロードマップコントロールはAV計画の長期的な戦略資産
シミュレーションスケール	決定的 — 推定150億シミュレーションマイル/日（推定）	成長中；スケール未開示（推定）	Waymo（現在）	双方とも拡大；Waymoの先行優位は重要
訓練データ品質 × 量	より高い純度（無人）、より少ない量	より低い純度（監視付き）、はるかに多い量	ユースケース次第	Teslaの車隊成長に伴い量の優位が複利で蓄積
総合評定	Waymoは今日ほとんどの指標で優れたコンピュートインフラを持つ：より多いTPUアクセス、より低い実効コスト、世界最高のシミュレーションスケール。Teslaの賭けは、Dojo（ビデオ訓練専用構築）が最終的に汎用TPUより訓練実行あたりのコストを低下させ、データ量（600万台）がラベル純度の低さを十分に補うというもの。2028年のコンピュート競争はDojo v2 vs TPU v6：どのチップロードマップが大規模な汎用AVポリシー訓練の特定の需要をより良く提供するか。

（推定）と表示されているすべての数値は、公開会社開示、アナリスト推計、および業界ベンチマークから導出されています。本記事はフィジカルAIベンチマークシリーズ第165弾です。