2026-06-18 — views
フィジカルAI計算インフラ — Tesla Dojo対Google TPU対NVIDIA H100:自動運転トレーニング軍拡競争の全貌
TeslaはDojoカスタムシリコンで1FLOP当たり1ドルを目標とし、WaymoはGoogle TPUのスケールを継承。両者ともNVIDIA依存の競合他社を訓練反復速度で大幅に上回る。
フィジカルAIベンチマークシリーズ第130回 — フィジカルAI計算インフラ:Tesla Dojo対Google TPU対NVIDIA H100/H200、FSD・Waymoニューラルネット・OptimusポリシーラーニングのAIトレーニング軍拡競争
FSD、Waymoの認識システム、OptimusのポリシーラーニングはすべてAIモデルによって動いており、その訓練は大規模な計算クラスターで行われています。計算インフラは各社のイテレーション速度——新モデルのトレーニング、アブレーション実験の実行、フリートへの改善デプロイの速さ——を決定します。Teslaはカスタムシリコン(Dojo D1チップとExaPODクラスター)に賭けました。WaymoはGoogleの世界クラスのTPUインフラを継承しています。その他すべてのAVおよびロボティクス企業はNVIDIA H100/H200クラスターを賃借しています。本稿ではフィジカルAIベンチマークの次元として計算インフラを分析します。
「(推定)」と表示されたデータは、公開市場情報、企業開示、およびアナリスト推定に基づくものであり、検証済みの一次データではありません。
第1節 — Tesla Dojo:カスタムシリコンへの大勝負
TeslaのDojoプログラムは自動運転業界で最も野心的なカスタムシリコンへの賭けです。Teslaはクラウドプロバイダーからのコンピュートを賃借するのではなく、自社でトレーニングチップ(Dojo D1)を設計し、FSD訓練・自動ラベリング・Optimusポリシーラーニング専用のExaPODクラスターに組み上げました。
| 指標 | Dojo D1チップ | Dojo ExaPOD(トレーニングクラスター) | 現状(2026年中頃) |
|---|---|---|---|
| アーキテクチャ | TSMCカスタム7nm; 362 TFLOPS BF16; 10 TB/sオンチップ帯域幅(Tesla開示) | トレーニングタイルあたり120枚のDojo D1; ExaPODキャビネットあたり3,000チップ | カスタム設計 — GPUベンダー依存なし |
| 目標コンピュート | ExaPODクラスターあたり1 ExaFLOP(Tesla開示目標) | 複数ExaPOD = 複数ExaFLOP | Tesla AI Day開示によると約1 ExaFLOP達成(推定) |
| トレーニング目的 | FSDニューラルネット(映像→運転ポリシー); Occupancy Network; 自動ラベリングパイプライン | 完全なFSDトレーニング実行: 600万台以上のフリートからの生の映像 → 更新されたFSDモデル | FSD v12/v13/v14はDojoで訓練(推定) |
| Optimusへの活用 | Optimusポリシーラーニング(操作、ナビゲーション)は同じDojoインフラを共有(推定) | ヒューマノイドポリシーは運転より多様なデータが必要 — 改善あたりの高い計算コスト(推定) | Optimus初期トレーニングはDojoで実施(推定);拡大中 |
| NVIDIAとのコスト比較 | Muskは賃借NVIDIA H100クラスターの約3-4ドル/FLOPに対し1ドル/FLOPの目標を掲げる(推定) | 達成した場合:クラウドGPUに対しトレーニング実行あたり約3-4倍のコスト優位 | 優位性はDojoの稼働率と歩留まりに依存 |
| リスク | カスタムシリコン歩留まりリスク;TSMC 7nmは成熟しているがDojoアーキテクチャは独自仕様;チップ設計にバグがあれば修正に時間 | Tesla自身のチップチームへの単一ソース依存 | 主なリスク:NVIDIA H100クラスターは今すぐ大規模に利用可能;Dojoの建設に遅延あり |
| 戦略的価値 | Dojoがコスト目標を達成した場合:Teslaはコンピュートをレンタルする競合他社よりFSDを速くかつ安価に訓練 | 訓練速度 = モデルイテレーション速度 = ディスエンゲージメントレート改善速度 | Dojoへの賭けはキャピタルを持続的なコスト護城河に転換 |
Dojoのテーゼはシンプルなコスト方程式に基づいています: TeslaがFLOPあたり1ドルでモデルを訓練できれば、賃借H100クラスターの3-4ドルに対して、各FSDイテレーションは競合他社の3-4分の1のコストになります。年間数百回のトレーニング実行にわたって、このコスト優位はイテレーション速度優位として複利で蓄積されます。
第2節 — WaymoとGoogle TPU:親会社から継承したインフラ優位
Waymoの計算優位は構造的なものであり、努力して得たものではありません:Alphabet子会社として、WaymoはGoogleのTPUインフラへのアクセスを継承しています——Google検索、YouTubeレコメンデーション、Geminiトレーニングを動かすのと同じカスタムシリコンです。同等の資本投資なしにこれに匹敵できるAVスタートアップはありません。
| 指標 | Google TPU v4/v5 | Waymoのアクセス | 戦略的意味 |
|---|---|---|---|
| アーキテクチャ | GoogleカスタムTPU; v4 = 275 TFLOPS; v5p = 約460 TFLOPS(推定) | WaymoはAlphabet子会社 — GoogleのTPUフリートとGoogle Cloudインフラへの完全アクセス | Waymoはコンピュートへの資本支出不要;Alphabetがインフラコストを負担 |
| クラスター規模 | Googleは世界最大規模のTPUクラスターの一つを運営(正確な容量は非開示) | Waymoはオンデマンドでグーグル規模の計算リソースにアクセス可能 | Waymoの計算上限はGoogleのインフラ全体 |
| シミュレーションインフラ | GoogleのNeRFベースのシーン再構成(大規模シミュレーション)がTPU + GPUクラスターで動作 | Waymoのシミュレーションパイプラインが実際の走行距離を合成トレーニングデータに増倍 | 実走1マイル → 1,000以上のシミュレーションバリエーション → TPUがすべてで訓練 |
| Waymoへのコスト | Alphabet内部コスト配賦(非開示);Waymoは内部振替価格で支払い | 実質的にAlphabetからの補助金 | 競争護城河:同等の資本なしにはGoogleの計算リソースを複製できるAVスタートアップなし |
| リスク | Alphabetへの依存:Waymoが分離売却された場合、TPUアクセスが変わる可能性 | Alphabetは継続投資意欲を示している | 子会社のままなら低リスク;独立IPOなら中リスク |
| トレーニング重点 | WaymoのMultiPath++(軌道予測)、OccupancyFlow(環境モデル)、認識スタック | WaymoのすべてのメジャーニューラルネットがGoogle TPUインフラで訓練 | Google Brain / DeepMindコラボレーションの可能性(推定) |
シミュレーション乗数はWaymoの最も過小評価されている計算増幅器です。実際の1マイルの走行データは何千ものシミュレーションバリアントに変換できます——異なる照明条件、異なる歩行者行動、異なる交通パターン、センサーノイズ変動。各バリアントが新しいトレーニング例となります。Google規模のTPUインフラで生成・処理されることで、Waymoの実効的なトレーニングデータ量はフリートの実際の走行距離を大きく超えます。
第3節 — NVIDIA:他のすべてのAV企業が依存する既存プレーヤー
TeslaでもWaymoでもないAVまたはロボティクス企業にとって、NVIDIAは大規模コンピュートへの唯一の現実的な経路です。これは構造的な依存関係を生み出し、訓練イテレーション速度を企業が余裕を持てる、または交渉でアクセスできるH100/H200の容量に制限します。
| 指標 | NVIDIA H100 | NVIDIA H200 | NVIDIA DRIVE Orin(車載) |
|---|---|---|---|
| アーキテクチャ | Hopper; 3.9 PetaFLOPS BF16(開示済み) | Hopper + HBM3e; 約3.9 PF BF16 + より高いメモリ帯域幅 | チップあたり254 TOPS; 自動車安全グレード |
| クラウド可用性 | AWS、Azure、GCP、CoreWeave、Lambda Labs — どのAV企業もアクセス可能 | H200はH100と同じクラウドプロバイダーを通じて利用可能 | Tier 1サプライヤーおよびAV企業に販売 |
| コスト | クラウド1時間あたり約2-4ドル(推定、プロバイダーとスポット価格により変動) | クラウド1時間あたり約3-5ドル(推定) | チップあたり約750ドル以上(推定); Zoox、AuroraなどのAV車両に搭載 |
| H100/H200でトレーニングするAV企業 | Aurora、Zoox、Mobileye、Wayve、Waymo/Tesla以外のほとんどのAV企業がH100/H200の時間をレンタル | — | — |
| NVIDIA DRIVEプラットフォーム | — | — | 別製品:DRIVE Orin(254 TOPS)+ DRIVE Thor(2,000 TOPS、発表済み); 車内AV認識/計画AI |
| 戦略的役割 | DojoやGoogle TPUがなければAVトレーニングのデフォルトインフラ | H200 = 現在の最前線;H100 = アクセス可能かつ広く利用可能 | NVIDIAの車載コンピュートがTesla/Waymo以外のAV市場を支配 |
| AV企業のリスク | 集中リスク:NVIDIAの価格決定力;2023年のH100供給制約がトレーニング遅延を引き起こした | — | Tesla(HW4)とWaymo(カスタムTPU)を除くすべての競合他社の車載コンピュートがNVIDIA依存 |
NVIDIA依存は時間とともに複利で悪化する戦略的非対称性を生み出します。Aurora、Zoox、Mobileye、WayveはすべてレンタルのH100クラスターでトレーニングワークロードを実行しています。NVIDIAがH200や次世代Blackwellチップを発表すると、これらの企業はすべて平等に恩恵を受けますが、誰もハードウェアアクセスから優位性を得ることはできません。
第4節 — 計算リソースを成長倍増器として活用:訓練イテレーション速度
計算インフラの差異の実際の帰結は訓練イテレーション速度です——各企業が月に実行できるモデル改善サイクルの数。より多くのイテレーションは、より速いディスエンゲージメントレート改善、より速いエッジケースカバレッジ、新しい運転環境への適応の加速を意味します。
| 企業 | トレーニングクラスター | 推定月間トレーニング実行数 | モデルイテレーション速度 | 成長への意味 |
|---|---|---|---|---|
| Tesla | Dojo ExaPOD(1+ ExaFLOP推定) | 高 — FSD + Optimus専用クラスター | 仕様通りならDojoが最速イテレーション(推定) | ディスエンゲージメントレート改善速度は訓練イテレーション速度に比例 |
| Waymo | Google TPU(Alphabetスケール) | 非常に高 — Googleインフラ;商業顧客との競合なし | 非常に速い;Googleの計算スケールは比類なし | Waymoのシミュレーション-トレーニングパイプラインが実効的計算リソースを乗増 |
| Aurora | レンタルNVIDIA H100/H200 | 中程度 — 予算制約;安全検証を優先 | 中程度 — 資本依存 | 資金調達制約がトレーニングイテレーションを制限 |
| Zoox | Amazon Cloud(EC2 + レンタルH100)— AmazonがZooxを所有 | 高 — Amazonインフラ | 速い — AmazonクラウドアクセスはWaymoのGoogle優位に類似 | 過小評価:ZooxのAmazon所有権 = オンデマンドクラウドコンピュート |
| Mobileye | Intelコンピュート + レンタルH100 | 中程度 | 中程度 | EyeQチップチームはシリコン専門知識あり;トレーニングコンピュートへの注力度は低め |
| Figure AI | レンタルH100;NVIDIAパートナーシップ | 中程度 | 中程度 | OpenAI言語モデル統合 = 言語コンポーネントへの独自コンピュートアクセス |
Zooxはこの表で特に注目に値します。TeslaとWaymoに次いで、最も過小評価されている計算優位AVスタートアップだからです。AmazonによるZooxの所有権は、内部振替価格でAWSインフラにアクセスする能力を与えています——本質的にWaymoのTPUアクセスと平行する構造的優位です。
第5節 — 計算インフラベンチマークスコアカード
| 次元 | Tesla(Dojo) | Waymo(Google TPU) | NVIDIA依存企業 | 優位 |
|---|---|---|---|---|
| 利用可能な生計算リソース | 約1+ ExaFLOP推定(成長中) | Googleスケール(非開示;実質的に無制限) | 予算とH100可用性に制限 | Waymo(Alphabetバックストップ) |
| FLOP当たりコスト(推定) | 目標1ドル/FLOP(Dojoが達成した場合) | ほぼゼロ(内部振替) | クラウド2-4ドル/FLOP(推定) | WaymoまたはTesla(Dojo歩留まり次第) |
| カスタムシリコン優位 | あり — Dojo D1;D2開発中 | あり — Google TPU v4/v5 | なし — NVIDIA依存 | TeslaとWaymoの両方がカスタムシリコン護城河 |
| イテレーション速度 | 高(専用クラスター) | 非常に高い(Googleスケール + シミュレーション乗数) | 中程度(予算制約) | Waymo微差(シミュレーション乗数の複利効果) |
| 車載コンピュート | HW4 = 288 TOPS(4x TSMCカスタム7nm);NVIDIA依存なし | Waymo車載カスタムTPU | NVIDIA DRIVE Orin(約750ドル以上推定) | Tesla(垂直統合;第三者コスト・リードタイムなし) |
| Dojo対TPUの評価 | Dojoはカスタムシリコンが持続的コスト護城河を生み出すという数十億ドル規模の賭け | Google TPUはすでに大規模で実証済み;Waymoが継承 | — | 両者とも大規模なレンタルH100より優位;今日のWaymoのアクセスは大きい |
計算インフラスコアカードは二層構造のフィジカルAI産業を明らかにします。第一層はTeslaとWaymoで構成——両者ともトレーニングと推論にカスタムシリコンを持ち、クラウド市場価格から独立して拡張できる専用クラスターを持ち、車載コンピュートもNVIDIAに依存していません。第二層は他のすべてのAVおよびロボティクス企業で、トレーニングと車載推論の両方で構造的にNVIDIA依存であり、インフラ上限ではなくクラウド予算によって制限されます。
長期的な影響は時間とともに複利で拡大する訓練イテレーションのギャップです。TeslaがDojoでAuroraの3分の1のコストでより多くのFSD訓練実験を毎月実行でき、WaymoがGoogleインフラの容量上限なしに5倍の実験を実行できる場合、第一層と第二層の間のニューラルネットの品質ギャップは毎月拡大し続けます——研究チームの質とは無関係に。
注記: 「(推定)」と表示されたすべての数値は、2026年中頃時点の公開市場情報、企業開示、アナリスト推定、および業界レポートに基づいています。本稿は投資アドバイスを構成するものではありません。
ソース
- Tesla Dojoスーパーコンピュータ — Tesla AI Day ↗
- Google TPUインフラ — Google Cloud ↗
- NVIDIA H100仕様 — NVIDIA ↗
- NVIDIA DRIVE Orin車載プラットフォーム — NVIDIA ↗
- Waymo研究・シミュレーションインフラ — Waymo ↗