Skip to content
AI-Daily-Builder

2026-06-18 views

フィジカルAI計算インフラ — Tesla Dojo対Google TPU対NVIDIA H100:自動運転トレーニング軍拡競争の全貌

TeslaはDojoカスタムシリコンで1FLOP当たり1ドルを目標とし、WaymoはGoogle TPUのスケールを継承。両者ともNVIDIA依存の競合他社を訓練反復速度で大幅に上回る。

フィジカルAIベンチマークシリーズ第130回 — フィジカルAI計算インフラ:Tesla Dojo対Google TPU対NVIDIA H100/H200、FSD・Waymoニューラルネット・OptimusポリシーラーニングのAIトレーニング軍拡競争

FSD、Waymoの認識システム、OptimusのポリシーラーニングはすべてAIモデルによって動いており、その訓練は大規模な計算クラスターで行われています。計算インフラは各社のイテレーション速度——新モデルのトレーニング、アブレーション実験の実行、フリートへの改善デプロイの速さ——を決定します。Teslaはカスタムシリコン(Dojo D1チップとExaPODクラスター)に賭けました。WaymoはGoogleの世界クラスのTPUインフラを継承しています。その他すべてのAVおよびロボティクス企業はNVIDIA H100/H200クラスターを賃借しています。本稿ではフィジカルAIベンチマークの次元として計算インフラを分析します。

「(推定)」と表示されたデータは、公開市場情報、企業開示、およびアナリスト推定に基づくものであり、検証済みの一次データではありません。


第1節 — Tesla Dojo:カスタムシリコンへの大勝負

TeslaのDojoプログラムは自動運転業界で最も野心的なカスタムシリコンへの賭けです。Teslaはクラウドプロバイダーからのコンピュートを賃借するのではなく、自社でトレーニングチップ(Dojo D1)を設計し、FSD訓練・自動ラベリング・Optimusポリシーラーニング専用のExaPODクラスターに組み上げました。

指標Dojo D1チップDojo ExaPOD(トレーニングクラスター)現状(2026年中頃)
アーキテクチャTSMCカスタム7nm; 362 TFLOPS BF16; 10 TB/sオンチップ帯域幅(Tesla開示)トレーニングタイルあたり120枚のDojo D1; ExaPODキャビネットあたり3,000チップカスタム設計 — GPUベンダー依存なし
目標コンピュートExaPODクラスターあたり1 ExaFLOP(Tesla開示目標)複数ExaPOD = 複数ExaFLOPTesla AI Day開示によると約1 ExaFLOP達成(推定)
トレーニング目的FSDニューラルネット(映像→運転ポリシー); Occupancy Network; 自動ラベリングパイプライン完全なFSDトレーニング実行: 600万台以上のフリートからの生の映像 → 更新されたFSDモデルFSD v12/v13/v14はDojoで訓練(推定)
Optimusへの活用Optimusポリシーラーニング(操作、ナビゲーション)は同じDojoインフラを共有(推定)ヒューマノイドポリシーは運転より多様なデータが必要 — 改善あたりの高い計算コスト(推定)Optimus初期トレーニングはDojoで実施(推定);拡大中
NVIDIAとのコスト比較Muskは賃借NVIDIA H100クラスターの約3-4ドル/FLOPに対し1ドル/FLOPの目標を掲げる(推定)達成した場合:クラウドGPUに対しトレーニング実行あたり約3-4倍のコスト優位優位性はDojoの稼働率と歩留まりに依存
リスクカスタムシリコン歩留まりリスク;TSMC 7nmは成熟しているがDojoアーキテクチャは独自仕様;チップ設計にバグがあれば修正に時間Tesla自身のチップチームへの単一ソース依存主なリスク:NVIDIA H100クラスターは今すぐ大規模に利用可能;Dojoの建設に遅延あり
戦略的価値Dojoがコスト目標を達成した場合:Teslaはコンピュートをレンタルする競合他社よりFSDを速くかつ安価に訓練訓練速度 = モデルイテレーション速度 = ディスエンゲージメントレート改善速度Dojoへの賭けはキャピタルを持続的なコスト護城河に転換

Dojoのテーゼはシンプルなコスト方程式に基づいています: TeslaがFLOPあたり1ドルでモデルを訓練できれば、賃借H100クラスターの3-4ドルに対して、各FSDイテレーションは競合他社の3-4分の1のコストになります。年間数百回のトレーニング実行にわたって、このコスト優位はイテレーション速度優位として複利で蓄積されます。


第2節 — WaymoとGoogle TPU:親会社から継承したインフラ優位

Waymoの計算優位は構造的なものであり、努力して得たものではありません:Alphabet子会社として、WaymoはGoogleのTPUインフラへのアクセスを継承しています——Google検索、YouTubeレコメンデーション、Geminiトレーニングを動かすのと同じカスタムシリコンです。同等の資本投資なしにこれに匹敵できるAVスタートアップはありません。

指標Google TPU v4/v5Waymoのアクセス戦略的意味
アーキテクチャGoogleカスタムTPU; v4 = 275 TFLOPS; v5p = 約460 TFLOPS(推定)WaymoはAlphabet子会社 — GoogleのTPUフリートとGoogle Cloudインフラへの完全アクセスWaymoはコンピュートへの資本支出不要;Alphabetがインフラコストを負担
クラスター規模Googleは世界最大規模のTPUクラスターの一つを運営(正確な容量は非開示)Waymoはオンデマンドでグーグル規模の計算リソースにアクセス可能Waymoの計算上限はGoogleのインフラ全体
シミュレーションインフラGoogleのNeRFベースのシーン再構成(大規模シミュレーション)がTPU + GPUクラスターで動作Waymoのシミュレーションパイプラインが実際の走行距離を合成トレーニングデータに増倍実走1マイル → 1,000以上のシミュレーションバリエーション → TPUがすべてで訓練
WaymoへのコストAlphabet内部コスト配賦(非開示);Waymoは内部振替価格で支払い実質的にAlphabetからの補助金競争護城河:同等の資本なしにはGoogleの計算リソースを複製できるAVスタートアップなし
リスクAlphabetへの依存:Waymoが分離売却された場合、TPUアクセスが変わる可能性Alphabetは継続投資意欲を示している子会社のままなら低リスク;独立IPOなら中リスク
トレーニング重点WaymoのMultiPath++(軌道予測)、OccupancyFlow(環境モデル)、認識スタックWaymoのすべてのメジャーニューラルネットがGoogle TPUインフラで訓練Google Brain / DeepMindコラボレーションの可能性(推定)

シミュレーション乗数はWaymoの最も過小評価されている計算増幅器です。実際の1マイルの走行データは何千ものシミュレーションバリアントに変換できます——異なる照明条件、異なる歩行者行動、異なる交通パターン、センサーノイズ変動。各バリアントが新しいトレーニング例となります。Google規模のTPUインフラで生成・処理されることで、Waymoの実効的なトレーニングデータ量はフリートの実際の走行距離を大きく超えます。


第3節 — NVIDIA:他のすべてのAV企業が依存する既存プレーヤー

TeslaでもWaymoでもないAVまたはロボティクス企業にとって、NVIDIAは大規模コンピュートへの唯一の現実的な経路です。これは構造的な依存関係を生み出し、訓練イテレーション速度を企業が余裕を持てる、または交渉でアクセスできるH100/H200の容量に制限します。

指標NVIDIA H100NVIDIA H200NVIDIA DRIVE Orin(車載)
アーキテクチャHopper; 3.9 PetaFLOPS BF16(開示済み)Hopper + HBM3e; 約3.9 PF BF16 + より高いメモリ帯域幅チップあたり254 TOPS; 自動車安全グレード
クラウド可用性AWS、Azure、GCP、CoreWeave、Lambda Labs — どのAV企業もアクセス可能H200はH100と同じクラウドプロバイダーを通じて利用可能Tier 1サプライヤーおよびAV企業に販売
コストクラウド1時間あたり約2-4ドル(推定、プロバイダーとスポット価格により変動)クラウド1時間あたり約3-5ドル(推定)チップあたり約750ドル以上(推定); Zoox、AuroraなどのAV車両に搭載
H100/H200でトレーニングするAV企業Aurora、Zoox、Mobileye、Wayve、Waymo/Tesla以外のほとんどのAV企業がH100/H200の時間をレンタル
NVIDIA DRIVEプラットフォーム別製品:DRIVE Orin(254 TOPS)+ DRIVE Thor(2,000 TOPS、発表済み); 車内AV認識/計画AI
戦略的役割DojoやGoogle TPUがなければAVトレーニングのデフォルトインフラH200 = 現在の最前線;H100 = アクセス可能かつ広く利用可能NVIDIAの車載コンピュートがTesla/Waymo以外のAV市場を支配
AV企業のリスク集中リスク:NVIDIAの価格決定力;2023年のH100供給制約がトレーニング遅延を引き起こしたTesla(HW4)とWaymo(カスタムTPU)を除くすべての競合他社の車載コンピュートがNVIDIA依存

NVIDIA依存は時間とともに複利で悪化する戦略的非対称性を生み出します。Aurora、Zoox、Mobileye、WayveはすべてレンタルのH100クラスターでトレーニングワークロードを実行しています。NVIDIAがH200や次世代Blackwellチップを発表すると、これらの企業はすべて平等に恩恵を受けますが、誰もハードウェアアクセスから優位性を得ることはできません。


第4節 — 計算リソースを成長倍増器として活用:訓練イテレーション速度

計算インフラの差異の実際の帰結は訓練イテレーション速度です——各企業が月に実行できるモデル改善サイクルの数。より多くのイテレーションは、より速いディスエンゲージメントレート改善、より速いエッジケースカバレッジ、新しい運転環境への適応の加速を意味します。

企業トレーニングクラスター推定月間トレーニング実行数モデルイテレーション速度成長への意味
TeslaDojo ExaPOD(1+ ExaFLOP推定)高 — FSD + Optimus専用クラスター仕様通りならDojoが最速イテレーション(推定)ディスエンゲージメントレート改善速度は訓練イテレーション速度に比例
WaymoGoogle TPU(Alphabetスケール)非常に高 — Googleインフラ;商業顧客との競合なし非常に速い;Googleの計算スケールは比類なしWaymoのシミュレーション-トレーニングパイプラインが実効的計算リソースを乗増
AuroraレンタルNVIDIA H100/H200中程度 — 予算制約;安全検証を優先中程度 — 資本依存資金調達制約がトレーニングイテレーションを制限
ZooxAmazon Cloud(EC2 + レンタルH100)— AmazonがZooxを所有高 — Amazonインフラ速い — AmazonクラウドアクセスはWaymoのGoogle優位に類似過小評価:ZooxのAmazon所有権 = オンデマンドクラウドコンピュート
MobileyeIntelコンピュート + レンタルH100中程度中程度EyeQチップチームはシリコン専門知識あり;トレーニングコンピュートへの注力度は低め
Figure AIレンタルH100;NVIDIAパートナーシップ中程度中程度OpenAI言語モデル統合 = 言語コンポーネントへの独自コンピュートアクセス

Zooxはこの表で特に注目に値します。TeslaとWaymoに次いで、最も過小評価されている計算優位AVスタートアップだからです。AmazonによるZooxの所有権は、内部振替価格でAWSインフラにアクセスする能力を与えています——本質的にWaymoのTPUアクセスと平行する構造的優位です。


第5節 — 計算インフラベンチマークスコアカード

次元Tesla(Dojo)Waymo(Google TPU)NVIDIA依存企業優位
利用可能な生計算リソース約1+ ExaFLOP推定(成長中)Googleスケール(非開示;実質的に無制限)予算とH100可用性に制限Waymo(Alphabetバックストップ)
FLOP当たりコスト(推定)目標1ドル/FLOP(Dojoが達成した場合)ほぼゼロ(内部振替)クラウド2-4ドル/FLOP(推定)WaymoまたはTesla(Dojo歩留まり次第)
カスタムシリコン優位あり — Dojo D1;D2開発中あり — Google TPU v4/v5なし — NVIDIA依存TeslaとWaymoの両方がカスタムシリコン護城河
イテレーション速度高(専用クラスター)非常に高い(Googleスケール + シミュレーション乗数)中程度(予算制約)Waymo微差(シミュレーション乗数の複利効果)
車載コンピュートHW4 = 288 TOPS(4x TSMCカスタム7nm);NVIDIA依存なしWaymo車載カスタムTPUNVIDIA DRIVE Orin(約750ドル以上推定)Tesla(垂直統合;第三者コスト・リードタイムなし)
Dojo対TPUの評価Dojoはカスタムシリコンが持続的コスト護城河を生み出すという数十億ドル規模の賭けGoogle TPUはすでに大規模で実証済み;Waymoが継承両者とも大規模なレンタルH100より優位;今日のWaymoのアクセスは大きい

計算インフラスコアカードは二層構造のフィジカルAI産業を明らかにします。第一層はTeslaとWaymoで構成——両者ともトレーニングと推論にカスタムシリコンを持ち、クラウド市場価格から独立して拡張できる専用クラスターを持ち、車載コンピュートもNVIDIAに依存していません。第二層は他のすべてのAVおよびロボティクス企業で、トレーニングと車載推論の両方で構造的にNVIDIA依存であり、インフラ上限ではなくクラウド予算によって制限されます。

長期的な影響は時間とともに複利で拡大する訓練イテレーションのギャップです。TeslaがDojoでAuroraの3分の1のコストでより多くのFSD訓練実験を毎月実行でき、WaymoがGoogleインフラの容量上限なしに5倍の実験を実行できる場合、第一層と第二層の間のニューラルネットの品質ギャップは毎月拡大し続けます——研究チームの質とは無関係に。

注記: 「(推定)」と表示されたすべての数値は、2026年中頃時点の公開市場情報、企業開示、アナリスト推定、および業界レポートに基づいています。本稿は投資アドバイスを構成するものではありません。


ソース

タグ

チップ