2026-06-18 — views
フィジカルAI算力対決 — Waymo Google Cloud TPU vs Tesla Dojo D1:訓練インフラベンチマーク 2026
WaymoはGoogle TPUポッドを補助金コストで利用し、毎日150億マイルをシミュレーション。TeslaはDojo D1をビデオ学習用に開発し、NVIDIA H100クラスターも並行稼働。
概要
AI訓練コンピュートインフラは、各社が自動運転モデルを改善するためのエンジンです。WaymoはAlphabetの子会社として、GeminiなどのGoogle AIシステムの訓練に使用されるものと同じコンピュートエコシステム——Google Cloud TPU——を利用しています。TeslaはDojo超高性能コンピューターを構築し、大規模ビデオデータ訓練のために特別設計された独自のD1チップを採用しています。本記事では2つのアプローチをベンチマーク比較します——各社のリソース構成、コスト構造、AIモデル改善ペースへの影響。これはフィジカルAIベンチマークシリーズ第165弾です。
セクション1 — Waymoのコンピュートスタック:Google Cloud + TPUエコシステム
Waymoの訓練インフラは、Alphabetの子会社という立場と切り離せません。Google TPUポッド——世界最先端のAI訓練インフラ——へのアクセスは、独立系AVスタートアップが再現できない構造的優位性です。
| コンピュート次元 | Waymoの詳細 | 戦略的意義 |
|---|---|---|
| 主要訓練インフラ | WaymoはニューラルネットワークトレーニングにGoogle Cloud TPUを使用;Alphabetの子会社として、WaymoはGoogleの内部TPUポッド——GeminiなどのGoogle AIシステムの訓練に使用されるものと同じインフラ——にアクセスできる | Alphabetの子会社であることで、Waymoは世界最先端のAI訓練インフラに限界コストでアクセスできる;どのAVスタートアップも独力で同等のコンピュートを賄えない |
| Google TPU v4/v5世代 | GoogleのTPU v4ポッドは1ポッドあたり約1 exaFLOPのコンピュートを提供;TPU v5(2023年発表)はワット当たり性能を推定2倍以上向上(推定);Waymoはこれらのリソースに必要に応じてアクセスできる | TPU v5の性能は、TransformerおよびConvolutionalアーキテクチャ——AV認識・計画で使用される種類——のトレーニングにおける業界最高の処理能力を表す |
| Google DeepMindとのシナジー | WaymoはDeepMindの研究人材・方法論に潜在的にアクセスできる(両者はAlphabetの子会社);AlphaFold、Gemini、ロボット工学に関するDeepMindの研究はAVの課題と重なる | 子会社間の知識移転は自動的・保証されたものではないが、組織的近接性は重要;DeepMindのロボット工学研究はWaymoの予測・計画問題に直接関連する |
| シミュレーションコンピュート(CarCraft) | WaymoのCarCraftシミュレーションシステムは、Google Cloud全体で推定150億シミュレーションマイル/日(推定)を実行;このスケールでの稀少・危険・新規シナリオのシミュレーションには大量の並列コンピュートが必要 | 150億シミュレーションマイル/日は、現実世界では決して十分な量を提供できない極めて稀なエッジケース(100万回に1回のシナリオ)での訓練を可能にする;Google Cloudの弾力的スケールがこれを実現可能にする |
| コスト構造 | WaymoはGoogle Cloudコンピュートに市場価格を支払わない;Alphabetの子会社として、コンピュートコストは事実上補助されている;Waymoの訓練予算は独立して開示されていない | この補助金は巨大な構造的優位性:同等のGoogle Cloudコンピュートに年間10億ドル以上を支払う独立系AVスタートアップが直面する資本制約を、Waymoは持たない |
| HDマッピングコンピュート | WaymoのHDマップはGoogle Mapsのベースデータ+Waymo専用のセンチメートル精度ライダー強化で生成・更新;生のライダー点群を航行可能なHDマップに処理するには相当なコンピュートが必要 | Google Mapsの既存の地図レンダリング・処理コンピュートインフラがWaymoのHDマップ生成に活用されている——Alphabetとの関係による別の見えない補助金 |
| コンピュート戦略の評定 | Waymoのコンピュートアプローチは深度優先:狭く明確に定義された問題領域(自動運転認識・計画)に世界最良のAI訓練インフラ(Google TPU)を使用し、エッジケースカバレッジにGoogleのシミュレーションスケールを活用する。主要リスク:AIアーキテクチャが異なるコンピュートパラダイムを好む方向にシフトした場合、WaymoはGoogleのロードマップに依存することになる。 |
セクション2 — Teslaのコンピュートスタック:Dojo D1 + NVIDIAクラスター
Teslaのコンピュート戦略はWaymoの正反対です:既存のハイパースケーラーのインフラを活用する代わりに、主要な訓練ワークロード——ビデオ——に最適化した独自チップと超高性能コンピューターを構築しました。
| コンピュート次元 | Teslaの詳細 | 戦略的意義 |
|---|---|---|
| Dojo超高性能コンピューターアーキテクチャ | Teslaはビデオ訓練のためにD1チップ(7nm、362 TFLOPS BF16、チップあたり900 GB/sメモリ帯域幅)を設計;D1チップは訓練ノード(25チップ/ノード = 9 PFLOPS)にタイル化され、ノードはExaPODキャビネット(120ノード = 1.1 EFLOPS/ExaPOD)、ExaPODが完全なDojoクラスターを形成 | Dojoのアーキテクチャは、Teslaの特定の訓練ワークロード——数百万台の車両からの大量のビデオフレーム——に最適化されている。チップトポロジー(タイル間の高帯域幅相互接続)はビデオ訓練のデータ移動オーバーヘッドを最小化する |
| Teslaが独自チップを構築した理由 | Teslaの主要訓練ワークロードはビデオ:600万台の車両からの何十億もの8カメラビデオセグメント;既存のGPUおよびTPUアーキテクチャはこの特定のワークロードパターンに最適設計されていなかった;カスタムシリコンにより、Teslaはメモリ帯域幅・相互接続トポロジー・ビデオの精度形式を最適化できる | カスタムシリコン開発には数億ドルと3〜5年が必要;Teslaの根拠は5〜10年の期間にわたる訓練コスト削減が開発コストを超えるというもの——AppleがM系チップに適用したのと同じ論理 |
| Dojo vs. NVIDIA GPUクラスター | TeslaはNVIDIA H100クラスターも訓練に使用(DojoはNVIDIAを補完するが完全に置き換えない);NVIDIA H100はGPUあたり約2,000 TFLOPS BF16を提供;10,000 GPU H100クラスター = 20 EFLOPS;Tesla合計のDojo + NVIDIAコンピュートは、ハイパースケーラー以外では最大規模の単一企業AI算力展開の一つと推定(推定) | Teslaのデュアルトラック戦略(Dojoによるビデオ最適化訓練 + NVIDIAによる汎用AI)は実用主義を反映:H100は今すぐ利用可能;Dojoは徐々に拡大。両方を並行稼働することで、TeslaはDojoの成熟を待たずにFSDを継続改善できる |
| 訓練データパイプライン | Teslaの主要な算力優位性はチップではなくデータ:600万台の車両 × 平均FSD稼働1時間/日 × 8カメラ = 膨大な日次ビデオ量;ラベリングはData Engine(シャドウモード:FSDが決定し、人間が修正し、修正がラベル付き訓練データとなる)で自動化 | Data Engine自体の算力要件も膨大:数百万台の車両でシャドウモード推論を実行し修正を処理するには、訓練コンピュートだけでなく、大量の推論・ストレージインフラが必要 |
| Dojo展開タイムライン | 最初のDojo ExaPODは2022年にテキサスGigafactoryで稼働;マスクは2024年末までに100 EFLOPSを目標とした(推定);実際の展開ペースは完全には開示されていない;その後のNVIDIA H100クラスターへのTeslaの継続投資は、Dojoの拡大が計画より遅かったことを示唆(推定) | 計画より遅いDojoの拡大は、カスタムシリコンの典型的なスケジュール超過と一致;これは失敗ではなく——第一世代カスタムチップの通常の軌跡。NVIDIA H100がDojo v2(次世代)まで間を埋める |
| Dojo v2と将来のコンピュート | Teslaは次世代Dojoチップに言及;2026年中期時点で詳細は未開示(推定);Dojo v2が典型的な世代当たり2倍の性能向上に従えば、Teslaの訓練コンピュートは2027年に数百 EFLOPSに達する可能性がある(推定) | 軌跡は現在の容量より重要:Dojo v2が約束通り実現し、Teslaの訓練コンピュートがハイパースケーラー規模に達した場合、Teslaはそのレベルで独自AI訓練シリコンを持つ唯一の非ハイパースケーラーとなる |
| コンピュート戦略の評定 | Teslaのコンピュートアプローチは自社構築vs外部調達の最大野心版:特定の訓練ワークロードに最適化したカスタムチップと超高性能コンピューターを構築しながら、過渡期はNVIDIAを借用。高リスク(カスタムシリコンは期待外れになることが多い)・高報酬(Dojoが設計通りに機能すれば、FSD改善あたりの訓練コストが大幅に低下)。主要リスク:Dojo D1がNVIDIA依存継続に対する開発コストを正当化するほどの性能・歩留まり目標を達成しない可能性。 |
セクション3 — 算力正面比較
| 次元 | Waymo / Google TPU | Tesla Dojo + NVIDIA | 優位 |
|---|---|---|---|
| 訓練コンピュートスケール(推定) | GoogleのTPU全機隊にアクセス——潜在的に数百 EFLOPS(推定);すべてのGoogle AIプロジェクトと共有 | Tesla合計Dojo + NVIDIA推定数十 EFLOPS(推定);TeslaのAIワークロード専用 | Waymoはより多くの総コンピュートにアクセス;Teslaはより多くの専用コンピュートを保有 |
| コンピュートコスト構造 | 事実上補助(Alphabetの子会社);Google TPUに市場価格支払いなし | 混合:Dojoの設備投資を訓練ライフタイムで償却;NVIDIA H100は市場価格で賃借/購入;相当額だが有限 | 現在のスケールでの訓練あたりコンピュートコストはWaymoが決定的優位 |
| AVのためのチップカスタマイズ | TPUはGoogleのワークロードに最適化(AV専用ではない);柔軟だが特化していない | Dojo D1はAVスケールのビデオ訓練専用に設計 | チップ適合性でTeslaが決定的優位;Waymoは汎用AIチップを使用 |
| 訓練データ量 | 約3,000万無人商業走行マイル(推定);高純度(完全無人 = クリーンラベル)だが量が少ない | 約60億監視付きFSDマイル(推定);ラベル純度低い(人間監視)が量は膨大 | データ量でTeslaが決定的優位;データ純度でWaymoが決定的優位 |
| シミュレーションスケール | Google Cloud上のCarCraft経由で推定150億シミュレーションマイル/日(推定) | Dojo経由で成長中のシミュレーション能力;スケール未開示(推定) | 現在のシミュレーションスケールでWaymoが決定的優位 |
| コンピュートロードマップコントロール | GoogleのTPUロードマップに依存(TPU v5からv6等);独立したチップ設計なし | TeslaはD1からD2へのAV最適化が可能な独自チップロードマップを制御 | コンピュート主権とロードマップコントロールでTeslaが決定的優位 |
| 算力総評 | WaymoのGoogle Cloud / TPU優位は今日構造的:より多い総コンピュート、より低い実効コスト、業界最高TPU性能、比類なきシミュレーションスケール。TeslaのDojo優位は長期的に戦略的:特定ビデオ訓練ワークロードに最適化した専用シリコン、独立したロードマップ、他のAlphabet AIプロジェクトとの共有なし。2028年の問いはDojo v2が性能の約束を果たせるかどうか。 |
セクション4 — AV競争においてコンピュートが決定するもの
| AI能力 | コンピュートがどう決定するか | Waymoの優位 | Teslaの優位 |
|---|---|---|---|
| 認識精度 | より良い訓練データ + より多いコンピュート → より低い検出エラー率;認識モデルは何十億もの注釈フレームで訓練が必要 | 無人ラベル純度:訓練データに人間監視のノイズがない | 60億マイルのビデオデータ;量がレアケースカバレッジを可能に |
| 予測(他エージェント) | 人間行動のモデリングには多様な実世界シナリオでの訓練が必要;シミュレーションが実データでカバーできないギャップを埋める | 150億シミュレーションマイル/日がエッジケースを系統的にカバー | 実世界データのスケールがシミュレーションが近似する行動多様性を提供 |
| 計画(何をするか) | 計画ポリシー訓練には安全なエッジケーステストのための大規模シミュレーションが必要;実世界テストはレアシナリオに危険すぎコストが高い | Google Cloudシミュレーションスケールが計画ポリシー改善に決定的 | エンドツーエンドFSD v12が認識と計画を一つのネットワークに統合——コンピュート問題を2ステップから1ステップに簡略化 |
| 汎化(新都市) | 新都市への汎化には:(a) その都市のデータでの訓練、または (b) その都市シナリオのコンピュート集約的シミュレーションが必要 | HDマップ + シミュレーションアプローチはWaymoが商業開始前に各新都市のマップ生成とシミュレーションを必要とすることを意味 | TeslaのマップレスFSDアプローチは都市固有のシミュレーションが不要;モデルは訓練分布から汎化 |
| モデル反復速度 | 高速な訓練コンピュート → 週あたりより多くの実験 → より高速なモデル改善 | より多くのTPUアクセス = より多くの同時実験が可能 | 専用Dojoコンピュート = 他のGoogle AIプロジェクトとの競合なし |
セクション5 — コンピュートベンチマークスコアカード
| 次元 | Waymo / Google | Tesla Dojo + NVIDIA | 優位 | 2028年の展望 |
|---|---|---|---|---|
| 総訓練コンピュートアクセス | 決定的 — Google TPU機隊は地球上で最大のAI算力展開の一つ | 大規模だがGoogleスケールには及ばない | Waymo(現在) | Dojoの拡大につれTeslaがギャップを縮小 |
| コンピュートコスト効率 | 決定的 — Alphabetの子会社として事実上補助 | 市場価格のNVIDIA + Dojoの設備投資 | Waymo(現在) | Dojo D2の納品次第 |
| AVワークロードへのシリコン適合 | 汎用TPU(柔軟だがAV最適化ではない) | Dojo D1はビデオ訓練専用設計(AV最適化) | Tesla | Teslaの目的特化型シリコンは約束通りに実現すれば長期優位 |
| コンピュートロードマップコントロール | GoogleのTPUロードマップに依存 | 独立したDojoロードマップ | Tesla | TeslaのシリコンロードマップコントロールはAV計画の長期的な戦略資産 |
| シミュレーションスケール | 決定的 — 推定150億シミュレーションマイル/日(推定) | 成長中;スケール未開示(推定) | Waymo(現在) | 双方とも拡大;Waymoの先行優位は重要 |
| 訓練データ品質 × 量 | より高い純度(無人)、より少ない量 | より低い純度(監視付き)、はるかに多い量 | ユースケース次第 | Teslaの車隊成長に伴い量の優位が複利で蓄積 |
| 総合評定 | Waymoは今日ほとんどの指標で優れたコンピュートインフラを持つ:より多いTPUアクセス、より低い実効コスト、世界最高のシミュレーションスケール。Teslaの賭けは、Dojo(ビデオ訓練専用構築)が最終的に汎用TPUより訓練実行あたりのコストを低下させ、データ量(600万台)がラベル純度の低さを十分に補うというもの。2028年のコンピュート競争はDojo v2 vs TPU v6:どのチップロードマップが大規模な汎用AVポリシー訓練の特定の需要をより良く提供するか。 |
(推定)と表示されているすべての数値は、公開会社開示、アナリスト推計、および業界ベンチマークから導出されています。本記事はフィジカルAIベンチマークシリーズ第165弾です。
ソース
- Tesla Dojo D1チップアーキテクチャ — Tesla AI Day 2021 ↗
- Google TPU v5発表 — Google Cloud ↗
- Waymo CarCraftシミュレーション — Waymo研究ブログ ↗
- Tesla FSD訓練データパイプライン — Tesla AI Day 2022 ↗
- Google Alphabet AIインフラ — Alphabet決算 ↗