Skip to content
AI-Daily-Builder

2026-06-18 views

2026年 Physical AI 算力競争 — NVIDIA B200 vs Tesla Dojo vs Google TPU:AV・ロボティクス訓練インフラ基準評価

NVIDIA B200推定9 exaFLOPSがほぼ全AV AI訓練を支える。Tesla DojoCは独自シリコンに賭け、WaymoはAlphabet経由でGoogle TPUを活用。算力が勝敗を決める。

Physical AI ベンチマークシリーズ 第205回 — 2026年 Physical AI 算力競争:NVIDIA H100/B200 vs Tesla Dojo vs Google TPU — AV・ロボティクス AI 訓練インフラ基準評価

Physical AI 競争は、その本質において算力競争である。単位時間当たりより多くの訓練実験を実行できる企業は、より速くイテレーションを重ね、より優れた自動運転・ロボティクスポリシーをより速く発見し、最終的により優れた製品をより速く展開できる。これは大規模言語モデルから物理システムに直接適用された教訓だ:スケール則は有効であり、より多くの訓練算力を持つ組織が中長期的な時間軸で勝利する。2026年、3つの訓練算力エコシステムがPhysical AIスタックの主導権を争っている——NVIDIAのGPUクラスター(H100、H200、Blackwell B200)、Teslaの独自Dojosupercomputer、そしてGoogleのTPUインフラ(Alphabetの所有構造を通じてWaymoが利用)。各システムのアーキテクチャ、コスト構造、戦略的意味を理解することが、今十年後半のAV・ロボティクス競争の勝者を判断する鍵となる。


第1節 — なぜ算力がPhysical AIの決戦場なのか

Physical AIの進歩速度は、大規模言語モデルと同様に算力によって制限されている。AV企業が神経網絡訓練に投入できるGPU時間が多いほど、離脱率の低下が速く、モデルが汎化する地理的カバレッジが広く、モデルが正確に処理できるエッジケースのテールが長くなる。スケール則はPhysical AIにおいて希望ではなく、すべての真剣な競合他社が自社のロードマップを構築している実証済みの経験的規則である。

原則説明Physical AIへの意味
スケール則の適用ニューラルネットワークの性能は、算力・データ・より大きなモデルの増加とともに予測可能に向上する(Chinchilla スケール則;OpenAI スケーリング論文)より多くの訓練算力 + より多くのデータ = より優れた自動運転・ロボティクスポリシー — LLMがスケールで改善するのと同じメカニズム
2つの異なる算力環境訓練算力(クラスター規模のGPU/TPU、数千チップ)vs 推論算力(車載チップ、展開済みモデルを実行)異なる最適化目標:訓練 = スループット最大化と実験コスト最小化;推論 = 決定ごとの遅延と電力消費の最小化
訓練データ量Teslaの車隊は毎週推定数千万マイルの訓練データを生成(推定);これらすべてを処理するには膨大な訓練算力が必要訓練算力が不足すると、データフライホイールが減速する——収集されたデータが処理されずに滞積する;データ量の優位性が無駄になる
イテレーション速度の複利効果より速い訓練 = 単位時間当たりより多くの実験 = より速いアーキテクチャ発見;2〜3年で、この複利がモデル品質の大きな差を生む1ドル当たり3倍の訓練実験を実行できる企業は、より優れたポリシーを3倍速く発見する;複利が24〜36ヶ月で大きな差を生む
推論レイテンシは安全に直結時速60マイルで100msの知覚遅延 = 2.7メートルの盲走距離車載推論は、車両が危険な距離を走行する前に道路の危険に反応できるほど高速でなければならない

訓練算力はデータからAV・ロボティクスAIモデルを構築する「ラボ」だ。データセンターの大型GPU・TPUクラスター——数千から数万チップ——で動作する。この競争の核心は、FLOPあたりのコスト、クラスタースループット、インターコネクト帯域幅、大型モデルに必要なメモリ容量にある。Physical AIモデルは通常大規模だ:Transformerベースの知覚モデル、ロボティクス操作のための拡散ポリシー、エンドツーエンドの映像-行動ニューラルネットワーク。これらのモデルに対して数十億の訓練フレームにわたって勾配降下法を実行するには、exaFLOPS単位で測定される算力規模が必要だ。

推論算力は「車両」端——展開されたモデルが物理システム上でリアルタイムに動作する。AVの場合、これは車に組み込まれたチップで、8つのカメラフィードを処理し、完全なニューラルネットワークを実行し、ミリ秒以内に操舵・加速・制動コマンドを出力しなければならない。Tesla FSD HW4チップ(推定350+ TOPS(推定))とWaymoの車載算力(世代によってNVIDIA DRIVEまたは独自ソリューション)がこの競争の推論側を構成する。

AMD要因は実在するが2026年では二次的な地位にある。AMD MI300Xは192 GB HBM3メモリ(H100の80 GBより多い)と推定2.6 exaFLOPS FP8(推定)を提供する——競争力のある生スペックだ。しかしCUDAエコシステムのロックイン効果が切り替えコストを高くしている。ほぼすべてのAV訓練コードはCUDA向けに書かれており、AMDのROCmソフトウェアスタックの成熟度は低い。一部のAV企業はコスト上の理由でAMDクラスターを使用するかもしれないが、NVIDIAエコシステムの優位性が2026年の業界のデフォルトとなっている。


第2節 — NVIDIAのAV・ロボティクス訓練クラスター支配

NVIDIAは、独自の訓練シリコンを持たないほぼすべてのAV・ロボティクス企業に訓練算力インフラを提供している。H100、H200、Blackwell B200が標準スタックを形成する。NVIDIAのIsacsシミュレーションスイート(Isaac Lab、Isaac Gym)はロボティクス訓練データ生成のためのGPU加速物理シミュレーションを提供する。DRIVEプラットフォームは独自シリコンを構築しないAV企業の車載推論を担う。

NVIDIAチップ仕様Physical AI用途価格・供給(推定)
H100 SXM580 GB HBM3;推定3.35 exaFLOPS FP8(推定);NVLink 4.0;700W TDP;DGX H100 = 8 H100/システム2024-2025年にほぼ全AV企業の主要訓練チップ;Waymo、Aurora、Figure AI、Agility、Boston Dynamics Atlas;知覚モデル・運動予測・軌道最適化の訓練に使用推定$25K-$30K/チップ(推定);DGX H100システム推定$200K-$250K(推定);クラウドH100:推定$2-$3/時/GPU(推定)
H200 SXM5141 GB HBM3e(H100より75%多いメモリ);計算バウンドワークロードではH100と同じ訓練スループット;メモリバウンドタスクでは帯域幅優位大型モデルPhysical AI訓練(Figure AIのVLM、TeslaのエンドツーエンドモデルなどのVLM);より大きなバッチサイズを可能にする高メモリ容量推定$30K-$40K/チップ(推定);2024-2025年展開サイクルでのH100後継
B100 / B200(Blackwell)B200:推定192 GB HBM3e(推定);推定9 exaFLOPS FP8(推定)——H100の約3倍;NVLink 5.0次世代AV訓練;Figure AI、Tesla、Auroraが2025-2026年にBlackwellへの訓練クラスター移行を検討;チップあたり3倍のスループットで訓練時間を比例して短縮推定$35K-$45K/チップ(推定);2025-2026年に生産能力拡大中;Blackwell初期は供給不足
Jetson AGX Orin(推論)275 TOPS車載推論プラットフォーム;64 GB LPDDR5;エッジAI推論向け設計Agility Robotics DigitがJetsonクラスの算力を使用;Boston Dynamics Atlasの開発;WaymoとTeslaの車両では使用なし(両社とも独自シリコンを使用)推定開発者キット$1,099(推定);量産モジュール価格はより低い
NVIDIA DRIVEプラットフォームDRIVE Orin:254 TOPS/チップ;DRIVE Thor(後継):推定2,000 TOPS(推定)Waymo Gen 5は報告によりNVIDIAハードウェアを使用;複数のAVスタートアップがDRIVEプラットフォームを使用;独自シリコンを構築しない企業の標準AV推論算力DRIVE Orin量産価格推定$500-$2,000/車(推定);DRIVE Thor価格推定より高価
NVIDIA Isaac(ロボティクス)Isaac ROS:ロボティクスミドルウェア;Isaac Lab:強化学習シミュレーションフレームワーク;Isaac Gym:GPU加速物理シミュレーションFigure AI、Agility Roboticsなどがリアルなシミュレーションから合成訓練データを生成するためにNVIDIAのIsaacスタックを使用ソフトウェア:オープンソース;ハードウェア:Isaacシミュレーションワークロード用標準GPUクラスター

クラスター規模では、経済的影響は相当なものになる。10,000 GPU H100クラスター——真剣なAV訓練に必要な規模——はハードウェアだけで推定$2.5億〜$3億(推定)かかる。Blackwell B200への移行(推定9 exaFLOPS/チップ vs H100の推定3.35 exaFLOPS)は、同じ設備投資で3倍の訓練スループット、または約3分の1のハードウェア数で同等のスループットを意味する。


第3節 — Tesla Dojo:独自訓練インフラ

TeslaのDojoスーパーコンピューターはPhysical AIにおける最も野心的な算力インフラ差別化戦略だ。Teslaは、NVIDIA GPUをレンタルしたりクラウドTPUを使用したりする代わりに、独自訓練チップ(D1)、独自訓練タイル(25個のD1チップ)、独自訓練キャビネット(ExaPOD、120タイル)を構築した。戦略的論理は、Teslaの特定の訓練ワークロード——600万台以上の車隊からの数億個のドラレコ動画クリップの処理——が十分に専門化されており、このワークロードに最適化された専用チップが、この特定タスクにおいてFLOPあたりコストで汎用GPU訓練を上回るというものだ。

Dojo次元現状戦略的意味リスク・不確実性
D1チップアーキテクチャTSMC 7nmプロセス;推定362 TFLOPS FP32(推定)/チップ;25 D1チップ/訓練タイル;タイル内高帯域幅チップ間インターコネクト;映像入力ニューラルネットワーク訓練向け設計D1アーキテクチャはTeslaの特定ワークロードに最適化:FSD神経網絡訓練のための数百万時間のドラレコ映像処理;タイル内チップ間インターコネクト帯域幅(推定約10 TB/s)は映像訓練の勾配同期パターン向けに調整D1の性能優位性はワークロード固有;汎用LLM訓練ではH100またはB200が優位;Teslaの映像密集ワークロードでは、D1のインターコネクト帯域幅が最適化ポイントかもしれない
ExaPODとクラスター規模1訓練タイル = 25 D1;1 ExaPODキャビネット = 120訓練タイル = 3,000 D1;複数のExaPODキャビネットがDojoスーパーコンピュータークラスターを形成;Tesla目標:1 ExaPODあたり推定1 exaFLOP+の訓練容量(推定)exaFLOP規模で、DojoはTeslaの以前のNVIDIAベースクラスターと比較して毎日より多くのFSD訓練データを処理できる;より高い訓練スループット = より多くのモデルイテレーション = より速い離脱率改善Dojoの実際の展開容量と各ExaPODの利用率は公式に確認されていない;TeslaはexaFLOP目標を掲げているが、規模での正確な運用状況は(推定)
FLOPあたりコスト vs NVIDIATeslaの主張:Dojoは映像処理ワークロードでNVIDIA H100をレンタルするよりFLOPあたりコストが低い;D1の映像でのFLOPあたりコストがH100より推定30-50%低い場合(推定)、10 exaFLOP訓練でDojo はTeslaに推定$1億〜$10億節約させる(推定)Dojoのコスト優位性(本物であれば)がTeslaの生命周期全体で複利累積:実験あたり低訓練コスト → 予算あたりより多くのイテレーション → より速いモデル改善 → より優れたFSD → より高いアタッチレート → より多くの収益コスト優位性はTeslaの主張であり独立検証されていない;NVIDIAもH100とB200の競争で実効クラウド価格を引き下げた
訓練データフライホイールTeslaのFSD搭載600万台以上の車両が毎週推定数千万マイルの訓練データを生成(推定);消費者向け自動車フリートなしに競合他社はこのデータ量を複製できないWaymoの訓練データは1〜2桁小さい(推定3000万マイル以上の商業無人運転マイル vs 推定60億マイル以上のTesla監視マイル(推定))Teslaのデータは監視データ(人間操作)であり、無人運転データではない;モデルは人間の運転行動から学習し、これには人間の運転ミスが訓練シグナルとして含まれる
Dojo vs NVIDIA レンタル(戦略選択)Teslaはクラウドの NVIDIA GPUをレンタルする代わりに独自訓練インフラを構築することを選択;高資本・高リスク・高潜在リターン戦略;Dojoが設計通りに機能すれば、Teslaは5〜10年間で数十億ドルの訓練コストを節約構築vs.レンタルの決定は業界が注目している:Dojoが成功すれば他のAV企業が追随するかもしれない;Dojoが苦戦すれば、すべての競合他社のNVIDIAレンタル路線が検証されるTeslaはDojo投資の継続を示している;NVIDIA比の近期パフォーマンスに関わらず戦略は放棄されない

第4節 — Waymo・Google TPUと競合他社訓練インフラ

WaymoのGPU優位性はAV分野で最も語られていないが、潜在的に最も持続的な優位性だ。Alphabetの子会社として、WaymoはGoogleのTPUインフラにアクセスできる——世界で最も成熟し、コスト効率の高いAI訓練プラットフォームの1つ——その条件は公開されていないが、公共クラウド市場レートよりも有利であることはほぼ確実だ。これはGoogleを買収せずに複製することが不可能な構造的優位性だ。

算力アプローチ使用者訓練能力Physical AI関連性
Google TPU v5e / v5p(Waymo)Waymo(Alphabet経由);Googleの内部AIプロジェクト;競合他社には一般に提供されないTPU v5p:推定459 TFLOPS BF16/チップ(推定);大型Google TPUポッドに展開(数千チップ);世界で最も成熟しコスト効率の高いAI訓練プラットフォームの1つWaymoのAlpaca経由TPUアクセスは、公共クラウドGPUをレンタルしなければならない競合他社に対する構造的優位性;コストは実質的にAlphabetのインフラ投資で補助されている
NVIDIA H100 / B200クラスター(Aurora、Figure AI、Agility等)Aurora(AV輸送トラック);Figure AI(ヒューマノイドロボット、OpenAI GPU経由);Agility Robotics;Boston Dynamics;独自算力を持たないAVスタートアップの多くH100:推定3.35 exaFLOPS FP8(推定);B200:推定9 exaFLOPS FP8(推定);業界標準訓練プラットフォームNVIDIA H100/B200をレンタルする競合他社は市場レートを支払う(推定$2-3/時/H100(推定));大規模訓練実行では相当な運用コストになる
AMD MI300X(新興)一部のデータセンター運営者;コスト意識の高いAV企業での潜在的使用MI300X:192 GB HBM3(H100の80 GBの2.4倍);推定2.6 exaFLOPS FP8(推定)AMD MI300Xは技術的に競争力があるが、CUDAエコシステムのロックインがPhysical AIでの採用を制限している;主要なAV訓練コードベースはすべてCUDA最適化
Tesla FSDチップ(車載推論)Tesla車両(HW3、HW4);Teslaのシリコンチームが社内設計HW3:144 TOPS(1車両に2チップ);HW4:推定350+ TOPS(推定);Tesla FSDニューラルネットワーク推論に最適化されたカスタムアーキテクチャTesla FSDモデル専用に設計された車載推論チップ:低遅延で8カメラフィードをリアルタイムでニューラルネットワークに処理
Waymo独自車載シリコン(Gen 6)Waymo Gen 5・Gen 6車両WaymoはすべてのGen 5のJaguarI-PACEがNVIDIAハードウェアを使用していると報告;Gen 6専用車両はおそらくWaymoの独自シリコンを使用WaymoのGen 6車両は車載算力を最適化する機会:独自シリコンがNVIDIA DRIVEライセンスより低コスト、低消費電力(EV航続距離に重要)を実現
シミュレーションインフラすべての主要Physical AI企業NVIDIA Isaac GymとIsaac Lab(Agility、Figure、Boston Dynamics等);WaymoのCarCraftシミュレーター;Tesla独自シミュレーションスタック;AuroraのTORCHシミュレーターシミュレーションはPhysical AI訓練データの力乗数:GPU加速シミュレーションは物理データ収集より桁違いに速く合成訓練シナリオを生成

第5節 — Physical AI 算力ベンチマーク採点カード

算力次元Waymo(Alphabet)TeslaAuroraFigure AI2028年展望
訓練インフラGoogle TPUポッド(Alphabet経由)+ NVIDIA GPU;Alphabetが補助するインフラからの構造的コスト優位性Dojo(独自D1チップ)がexaFLOP規模を目標;構築 vs レンタルの戦略的賭け;Dojoが設計通りに機能すればTeslaは映像処理ワークロードで最低FLOPあたりコストレンタルNVIDIA H100/B200クラスター;独自訓練インフラなし;訓練コストは重大な運用費OpenAIパートナーシップを通じたNVIDIA GPU;OpenAIがFigure-OpenAIコラボレーションの一部としてGPUアクセスを提供TeslaのDojo賭けがより明確になる;Dojoが競争力あるコストでマルチexaFLOP規模に達すれば、Teslaは構造的訓練コスト優位性を持つ
車載推論NVIDIA DRIVEまたはWaymo独自シリコン(Gen 6詳細は完全未開示(推定))Tesla FSD HW4チップ:推定350+ TOPS(推定);社内設計;ハードウェア-ソフトウェア協調設計優位性Aurora Driver:NVIDIAベース算力;Class 8トラック統合向け設計;安全機能準拠のため推定1トラックあたり3+冗長算力ユニット(推定)非適用(ヒューマノイドロボット、車両ではない);Figure 02は独自算力使用;Agility Robotics DigitはJetsonクラス車載算力使用TeslaのカスタムシリコンパスはHW5へ継続;WaymoのGen 6独自シリコン展開でNVIDIAベースGen 5との車載算力格差縮小
シミュレーションインフラCarCraft:Waymo独自シミュレーター;年間数十億シミュレーションシナリオ;AV業界で最成熟したシミュレーションスタックの1つ独自シミュレーションスタック;Teslaは現実世界データを主要訓練シグナルとして使用し、シミュレーションを補完として位置づけTORCHシミュレーター;GPU加速;物理テストマイルでカバーされていないエッジケースにシミュレーションを使用NVIDIA Isaac Lab + Figure独自ロボティクスシミュレーション;操作・移動ポリシーのための物理精密なヒューマノイドタスクシミュレーション物理データ収集だけではロングテールエッジケースを効率的にカバーできないため、シミュレーション品質がますます重要に
データ量(訓練データ)推定3000万マイル以上の商業無人運転マイル(推定);最高品質の無人運転データ;しかし3大AVプレイヤーの中で最少データ量推定60億マイル以上の監視マイル(推定);AVで最大の訓練データセット;600万台以上の車隊によるデータフライホイール2025年4月の商業ローンチ以来、推定1000万マイル以上の高速道路商業マイル(推定)ロボットタスクデータ:初期段階;NVIDIA Isaacシミュレーションが物理データギャップを埋める;Figure AIがBMW工場に展開して現実世界のロボットタスクデータを生成Teslaのデータ量優位性は構造的で増大し続ける;Waymoの無人運転データ品質は無人運転モデル訓練に優れている
算力総合評価Physical AI算力競争はまだ決着していない。NVIDIAは依然としてほぼすべてのPhysical AI企業の訓練インフラの主要プロバイダーだ——この地位が莫大な収益を生み出しNVIDIAのエコシステム護城河を強化している。TeslaのDojo賭けはPhysical AIで最も野心的な算力インフラ差別化であり、信頼できる論拠(映像訓練に最適化された独自チップ + 最大訓練データセット = 構造的モデル改善優位性)を持つが、Teslaが目標とするフルスケールではまだ証明されていない。WaymoのGoogle TPUアクセスはAV訓練算力で最も目立たないが最も持続的な構造的優位性だ——AlphabetのTPUインフラは世界で最も成熟しコスト効率が高いものの1つであり、Waymoが補助レートでそれにアクセスできることは過小評価された競争護城河だ。Physical AI算力競争を追うKPIとして監視すべきは生のFLOP数ではなく、1ドルあたりの訓練スループットと、それによるモデル改善速度(離脱率低下と地理的拡大速度で測定)だ。

注記: 「(推定)」と標記された数値は、2026年半ば時点で公開されている情報に基づく方向性推定値です。ハードウェア価格、クラスター規模の経済性、訓練算力容量は、関連企業によって完全には公開されていません。本記事は投資アドバイスを構成するものではありません。


ソース

タグ

チップ