Skip to content
AI-Daily-Builder

2026-06-18 views

フィジカルAI算力対決 — Waymo Google Cloud TPU vs Tesla Dojo D1:訓練インフラベンチマーク 2026

WaymoはGoogle TPUポッドを補助金コストで利用し、毎日150億マイルをシミュレーション。TeslaはDojo D1をビデオ学習用に開発し、NVIDIA H100クラスターも並行稼働。

概要

AI訓練コンピュートインフラは、各社が自動運転モデルを改善するためのエンジンです。WaymoはAlphabetの子会社として、GeminiなどのGoogle AIシステムの訓練に使用されるものと同じコンピュートエコシステム——Google Cloud TPU——を利用しています。TeslaはDojo超高性能コンピューターを構築し、大規模ビデオデータ訓練のために特別設計された独自のD1チップを採用しています。本記事では2つのアプローチをベンチマーク比較します——各社のリソース構成、コスト構造、AIモデル改善ペースへの影響。これはフィジカルAIベンチマークシリーズ第165弾です。


セクション1 — Waymoのコンピュートスタック:Google Cloud + TPUエコシステム

Waymoの訓練インフラは、Alphabetの子会社という立場と切り離せません。Google TPUポッド——世界最先端のAI訓練インフラ——へのアクセスは、独立系AVスタートアップが再現できない構造的優位性です。

コンピュート次元Waymoの詳細戦略的意義
主要訓練インフラWaymoはニューラルネットワークトレーニングにGoogle Cloud TPUを使用;Alphabetの子会社として、WaymoはGoogleの内部TPUポッド——GeminiなどのGoogle AIシステムの訓練に使用されるものと同じインフラ——にアクセスできるAlphabetの子会社であることで、Waymoは世界最先端のAI訓練インフラに限界コストでアクセスできる;どのAVスタートアップも独力で同等のコンピュートを賄えない
Google TPU v4/v5世代GoogleのTPU v4ポッドは1ポッドあたり約1 exaFLOPのコンピュートを提供;TPU v5(2023年発表)はワット当たり性能を推定2倍以上向上(推定);Waymoはこれらのリソースに必要に応じてアクセスできるTPU v5の性能は、TransformerおよびConvolutionalアーキテクチャ——AV認識・計画で使用される種類——のトレーニングにおける業界最高の処理能力を表す
Google DeepMindとのシナジーWaymoはDeepMindの研究人材・方法論に潜在的にアクセスできる(両者はAlphabetの子会社);AlphaFold、Gemini、ロボット工学に関するDeepMindの研究はAVの課題と重なる子会社間の知識移転は自動的・保証されたものではないが、組織的近接性は重要;DeepMindのロボット工学研究はWaymoの予測・計画問題に直接関連する
シミュレーションコンピュート(CarCraft)WaymoのCarCraftシミュレーションシステムは、Google Cloud全体で推定150億シミュレーションマイル/日(推定)を実行;このスケールでの稀少・危険・新規シナリオのシミュレーションには大量の並列コンピュートが必要150億シミュレーションマイル/日は、現実世界では決して十分な量を提供できない極めて稀なエッジケース(100万回に1回のシナリオ)での訓練を可能にする;Google Cloudの弾力的スケールがこれを実現可能にする
コスト構造WaymoはGoogle Cloudコンピュートに市場価格を支払わない;Alphabetの子会社として、コンピュートコストは事実上補助されている;Waymoの訓練予算は独立して開示されていないこの補助金は巨大な構造的優位性:同等のGoogle Cloudコンピュートに年間10億ドル以上を支払う独立系AVスタートアップが直面する資本制約を、Waymoは持たない
HDマッピングコンピュートWaymoのHDマップはGoogle Mapsのベースデータ+Waymo専用のセンチメートル精度ライダー強化で生成・更新;生のライダー点群を航行可能なHDマップに処理するには相当なコンピュートが必要Google Mapsの既存の地図レンダリング・処理コンピュートインフラがWaymoのHDマップ生成に活用されている——Alphabetとの関係による別の見えない補助金
コンピュート戦略の評定Waymoのコンピュートアプローチは深度優先:狭く明確に定義された問題領域(自動運転認識・計画)に世界最良のAI訓練インフラ(Google TPU)を使用し、エッジケースカバレッジにGoogleのシミュレーションスケールを活用する。主要リスク:AIアーキテクチャが異なるコンピュートパラダイムを好む方向にシフトした場合、WaymoはGoogleのロードマップに依存することになる。

セクション2 — Teslaのコンピュートスタック:Dojo D1 + NVIDIAクラスター

Teslaのコンピュート戦略はWaymoの正反対です:既存のハイパースケーラーのインフラを活用する代わりに、主要な訓練ワークロード——ビデオ——に最適化した独自チップと超高性能コンピューターを構築しました。

コンピュート次元Teslaの詳細戦略的意義
Dojo超高性能コンピューターアーキテクチャTeslaはビデオ訓練のためにD1チップ(7nm、362 TFLOPS BF16、チップあたり900 GB/sメモリ帯域幅)を設計;D1チップは訓練ノード(25チップ/ノード = 9 PFLOPS)にタイル化され、ノードはExaPODキャビネット(120ノード = 1.1 EFLOPS/ExaPOD)、ExaPODが完全なDojoクラスターを形成Dojoのアーキテクチャは、Teslaの特定の訓練ワークロード——数百万台の車両からの大量のビデオフレーム——に最適化されている。チップトポロジー(タイル間の高帯域幅相互接続)はビデオ訓練のデータ移動オーバーヘッドを最小化する
Teslaが独自チップを構築した理由Teslaの主要訓練ワークロードはビデオ:600万台の車両からの何十億もの8カメラビデオセグメント;既存のGPUおよびTPUアーキテクチャはこの特定のワークロードパターンに最適設計されていなかった;カスタムシリコンにより、Teslaはメモリ帯域幅・相互接続トポロジー・ビデオの精度形式を最適化できるカスタムシリコン開発には数億ドルと3〜5年が必要;Teslaの根拠は5〜10年の期間にわたる訓練コスト削減が開発コストを超えるというもの——AppleがM系チップに適用したのと同じ論理
Dojo vs. NVIDIA GPUクラスターTeslaはNVIDIA H100クラスターも訓練に使用(DojoはNVIDIAを補完するが完全に置き換えない);NVIDIA H100はGPUあたり約2,000 TFLOPS BF16を提供;10,000 GPU H100クラスター = 20 EFLOPS;Tesla合計のDojo + NVIDIAコンピュートは、ハイパースケーラー以外では最大規模の単一企業AI算力展開の一つと推定(推定)Teslaのデュアルトラック戦略(Dojoによるビデオ最適化訓練 + NVIDIAによる汎用AI)は実用主義を反映:H100は今すぐ利用可能;Dojoは徐々に拡大。両方を並行稼働することで、TeslaはDojoの成熟を待たずにFSDを継続改善できる
訓練データパイプラインTeslaの主要な算力優位性はチップではなくデータ:600万台の車両 × 平均FSD稼働1時間/日 × 8カメラ = 膨大な日次ビデオ量;ラベリングはData Engine(シャドウモード:FSDが決定し、人間が修正し、修正がラベル付き訓練データとなる)で自動化Data Engine自体の算力要件も膨大:数百万台の車両でシャドウモード推論を実行し修正を処理するには、訓練コンピュートだけでなく、大量の推論・ストレージインフラが必要
Dojo展開タイムライン最初のDojo ExaPODは2022年にテキサスGigafactoryで稼働;マスクは2024年末までに100 EFLOPSを目標とした(推定);実際の展開ペースは完全には開示されていない;その後のNVIDIA H100クラスターへのTeslaの継続投資は、Dojoの拡大が計画より遅かったことを示唆(推定)計画より遅いDojoの拡大は、カスタムシリコンの典型的なスケジュール超過と一致;これは失敗ではなく——第一世代カスタムチップの通常の軌跡。NVIDIA H100がDojo v2(次世代)まで間を埋める
Dojo v2と将来のコンピュートTeslaは次世代Dojoチップに言及;2026年中期時点で詳細は未開示(推定);Dojo v2が典型的な世代当たり2倍の性能向上に従えば、Teslaの訓練コンピュートは2027年に数百 EFLOPSに達する可能性がある(推定)軌跡は現在の容量より重要:Dojo v2が約束通り実現し、Teslaの訓練コンピュートがハイパースケーラー規模に達した場合、Teslaはそのレベルで独自AI訓練シリコンを持つ唯一の非ハイパースケーラーとなる
コンピュート戦略の評定Teslaのコンピュートアプローチは自社構築vs外部調達の最大野心版:特定の訓練ワークロードに最適化したカスタムチップと超高性能コンピューターを構築しながら、過渡期はNVIDIAを借用。高リスク(カスタムシリコンは期待外れになることが多い)・高報酬(Dojoが設計通りに機能すれば、FSD改善あたりの訓練コストが大幅に低下)。主要リスク:Dojo D1がNVIDIA依存継続に対する開発コストを正当化するほどの性能・歩留まり目標を達成しない可能性。

セクション3 — 算力正面比較

次元Waymo / Google TPUTesla Dojo + NVIDIA優位
訓練コンピュートスケール(推定)GoogleのTPU全機隊にアクセス——潜在的に数百 EFLOPS(推定);すべてのGoogle AIプロジェクトと共有Tesla合計Dojo + NVIDIA推定数十 EFLOPS(推定);TeslaのAIワークロード専用Waymoはより多くの総コンピュートにアクセス;Teslaはより多くの専用コンピュートを保有
コンピュートコスト構造事実上補助(Alphabetの子会社);Google TPUに市場価格支払いなし混合:Dojoの設備投資を訓練ライフタイムで償却;NVIDIA H100は市場価格で賃借/購入;相当額だが有限現在のスケールでの訓練あたりコンピュートコストはWaymoが決定的優位
AVのためのチップカスタマイズTPUはGoogleのワークロードに最適化(AV専用ではない);柔軟だが特化していないDojo D1はAVスケールのビデオ訓練専用に設計チップ適合性でTeslaが決定的優位;Waymoは汎用AIチップを使用
訓練データ量約3,000万無人商業走行マイル(推定);高純度(完全無人 = クリーンラベル)だが量が少ない約60億監視付きFSDマイル(推定);ラベル純度低い(人間監視)が量は膨大データ量でTeslaが決定的優位;データ純度でWaymoが決定的優位
シミュレーションスケールGoogle Cloud上のCarCraft経由で推定150億シミュレーションマイル/日(推定)Dojo経由で成長中のシミュレーション能力;スケール未開示(推定)現在のシミュレーションスケールでWaymoが決定的優位
コンピュートロードマップコントロールGoogleのTPUロードマップに依存(TPU v5からv6等);独立したチップ設計なしTeslaはD1からD2へのAV最適化が可能な独自チップロードマップを制御コンピュート主権とロードマップコントロールでTeslaが決定的優位
算力総評WaymoのGoogle Cloud / TPU優位は今日構造的:より多い総コンピュート、より低い実効コスト、業界最高TPU性能、比類なきシミュレーションスケール。TeslaのDojo優位は長期的に戦略的:特定ビデオ訓練ワークロードに最適化した専用シリコン、独立したロードマップ、他のAlphabet AIプロジェクトとの共有なし。2028年の問いはDojo v2が性能の約束を果たせるかどうか。

セクション4 — AV競争においてコンピュートが決定するもの

AI能力コンピュートがどう決定するかWaymoの優位Teslaの優位
認識精度より良い訓練データ + より多いコンピュート → より低い検出エラー率;認識モデルは何十億もの注釈フレームで訓練が必要無人ラベル純度:訓練データに人間監視のノイズがない60億マイルのビデオデータ;量がレアケースカバレッジを可能に
予測(他エージェント)人間行動のモデリングには多様な実世界シナリオでの訓練が必要;シミュレーションが実データでカバーできないギャップを埋める150億シミュレーションマイル/日がエッジケースを系統的にカバー実世界データのスケールがシミュレーションが近似する行動多様性を提供
計画(何をするか)計画ポリシー訓練には安全なエッジケーステストのための大規模シミュレーションが必要;実世界テストはレアシナリオに危険すぎコストが高いGoogle Cloudシミュレーションスケールが計画ポリシー改善に決定的エンドツーエンドFSD v12が認識と計画を一つのネットワークに統合——コンピュート問題を2ステップから1ステップに簡略化
汎化(新都市)新都市への汎化には:(a) その都市のデータでの訓練、または (b) その都市シナリオのコンピュート集約的シミュレーションが必要HDマップ + シミュレーションアプローチはWaymoが商業開始前に各新都市のマップ生成とシミュレーションを必要とすることを意味TeslaのマップレスFSDアプローチは都市固有のシミュレーションが不要;モデルは訓練分布から汎化
モデル反復速度高速な訓練コンピュート → 週あたりより多くの実験 → より高速なモデル改善より多くのTPUアクセス = より多くの同時実験が可能専用Dojoコンピュート = 他のGoogle AIプロジェクトとの競合なし

セクション5 — コンピュートベンチマークスコアカード

次元Waymo / GoogleTesla Dojo + NVIDIA優位2028年の展望
総訓練コンピュートアクセス決定的 — Google TPU機隊は地球上で最大のAI算力展開の一つ大規模だがGoogleスケールには及ばないWaymo(現在)Dojoの拡大につれTeslaがギャップを縮小
コンピュートコスト効率決定的 — Alphabetの子会社として事実上補助市場価格のNVIDIA + Dojoの設備投資Waymo(現在)Dojo D2の納品次第
AVワークロードへのシリコン適合汎用TPU(柔軟だがAV最適化ではない)Dojo D1はビデオ訓練専用設計(AV最適化)TeslaTeslaの目的特化型シリコンは約束通りに実現すれば長期優位
コンピュートロードマップコントロールGoogleのTPUロードマップに依存独立したDojoロードマップTeslaTeslaのシリコンロードマップコントロールはAV計画の長期的な戦略資産
シミュレーションスケール決定的 — 推定150億シミュレーションマイル/日(推定)成長中;スケール未開示(推定)Waymo(現在)双方とも拡大;Waymoの先行優位は重要
訓練データ品質 × 量より高い純度(無人)、より少ない量より低い純度(監視付き)、はるかに多い量ユースケース次第Teslaの車隊成長に伴い量の優位が複利で蓄積
総合評定Waymoは今日ほとんどの指標で優れたコンピュートインフラを持つ:より多いTPUアクセス、より低い実効コスト、世界最高のシミュレーションスケール。Teslaの賭けは、Dojo(ビデオ訓練専用構築)が最終的に汎用TPUより訓練実行あたりのコストを低下させ、データ量(600万台)がラベル純度の低さを十分に補うというもの。2028年のコンピュート競争はDojo v2 vs TPU v6:どのチップロードマップが大規模な汎用AVポリシー訓練の特定の需要をより良く提供するか。

(推定)と表示されているすべての数値は、公開会社開示、アナリスト推計、および業界ベンチマークから導出されています。本記事はフィジカルAIベンチマークシリーズ第165弾です。


ソース

タグ

チップ