2026-06-18 — views
Physical AI 計算基盤 2026 — Waymo Google TPU対Tesla Dojo D1・FSDチップ:AIトレーニングインフラ競争力ベンチマーク
WaymoはGoogle TPUクラスターで学習。TeslaはDojo D1と600万台のフリートデータを活用。学習計算格差はPhysical AIの隠れたボトルネックだ。
Physical AIベンチマークシリーズ 第182回:AIトレーニング・推論インフラ
世界最高の自動運転システムを構築する競争は、AI計算力の競争でもある。トレーニング計算力は各社がモデルを改善するスピードを決定し、推論計算力はその改善されたモデルが車両内でリアルタイム動作できるかを決定する。どちらの次元も重要だ——にもかかわらず、センサーハードウェア、安全走行マイル数、規制承認と同等の厳密さで分析されることはほとんどない。本稿はWaymoとTeslaのAIトレーニング・推論インフラをPhysical AI競争力の核心変数としてベンチマークする。
第1節:AIトレーニング計算力がPhysical AIのボトルネックになる理由
自動運転は根本的に機械学習の問題だ。自動運転システムの品質は2つのことによって制約される:トレーニングデータの品質、そしてそのデータを学習するために使える計算力。計算力が多ければ大きなモデルを訓練でき、より多くの実験を実施し、反復サイクルを速め、汎化能力を高められる。同じデータセットを10倍の計算力で訓練すれば、確実により良いモデルが生まれる。トレーニング計算力は「改善レート」のレバーだ——品質の天井が上昇するスピードを決定する変数である。
2つの重要な計算力次元がPhysical AI競争を形成する:
トレーニング計算力 — オフラインでモデルを改善するために使用され、本社で実施される。Google TPUとTesla Dojoが競う領域だ。トレーニング計算力は今日の車両には影響しないが、来四半期のソフトウェアアップデートの品質を決定する。
推論計算力 — 車両内でモデルをリアルタイム実行するチップ。Tesla FSD HW3/HW4シリコンとWaymoの車内計算力が競う領域だ。推論計算力は現在の車両が今日安全に実行できることを決定する。
トレーニングと推論は別の課題だ。世界トップクラスのトレーニング計算力を持ちながら車内推論能力が限られている、あるいはその逆というケースもある。複利優位はどちらでも優れることから生まれる。
NVIDIAの支配が基準線: ほとんどのAV企業——Zoox、Aurora、Mobileye、Cruise——はNVIDIA GPUクラスター(A100、H100、H200)でモデルを訓練する。これが商品化基準線だ。面白い競争差別化は基準から2方向に外れる企業から来る:(1)独自の非NVIDIAトレーニングシリコンへのアクセス(WaymoはGoogle TPU経由、AlphabetがAZ親会社)、または(2)カスタムトレーニングシリコンへの投資(TeslaのDojo D1)。
垂直統合の希少性: Teslaは自製トレーニングシリコン(Dojo D1)と自製推論シリコン(FSDチップ、TSMC製造)の両方を構築している極めて少数の企業の一つだ。この垂直統合はコストと技術的難度が高いが、NVIDIA供給制約とコスト構造から戦略的独立性をもたらす。
第2節:WaymoのTPU優位:Google計算基盤へのアクセス
Waymoのトレーニング計算力における構造的優位は一つの事実から生まれる:AlphabetのAZ子会社であることだ。Alphabetは地球上最大のカスタムAI計算力展開の一つを構築しており、WaymoはこのインフラでモデルをAZ内部振替価格で訓練している。
| 次元 | 詳細 |
|---|---|
| トレーニングインフラ | WaymoはGoogleのTPU(テンソル処理ユニット)クラスターでモデルを訓練する。GoogleはAZ世界最大規模のTPU展開の一つを持つ。Alphabet子会社として、Waymoは内部振替価格で優先アクセスを受け——商業GPUクラスターのレンタル料率を大幅に下回る。 |
| Google TPU v4仕様 | Google TPU v4は1チップあたり推定275 TFLOPS(BF16)を提供。TPU v5eは推定197 TFLOPSだが、メモリ帯域幅とインターコネクトアーキテクチャが大幅に改善。Googleは数百から数千チップを高帯域ファブリックで相互接続したTPUポッドを運用する。 |
| 実効トレーニング容量 | AlphabetのインフラからWaymoが引き出せる実効トレーニング計算力は、独立系AV新興企業やAV子会社のほとんどを上回ると見られる。Zoox(Amazon AWS)とWaymo(Google TPU)だけがこのレベルのクラウド親会社計算力優位を持つ。 |
| 計算力アクセスコスト | Waymoは内部振替価格でAlphabetに計算力費用を支払う。同等のGPUクラスターの市場価格を大幅に下回る推定。正確な数値は公開されていない。 |
| トレーニングデータパイプライン | Waymoのトレーニングデータは無人商業フリート(商業乗車のセンサーデータ)、高精度地図データ、Carcraft シミュレーションから来る。LIDARプラスカメラプラスレーダーにより、カメラのみのアプローチよりフレームごとの信号が豊富なマルチモーダルトレーニングデータを生成する。 |
| Carcraftシミュレーション | WaymoはCarcraftシミュレーションプラットフォームを使って大規模に合成トレーニングシナリオを生成する。Carcraftは1日に数百万マイルのシミュレーションを実行すると言われる。 |
| 独立系AV企業との比較 | WaymoのGoogle TPUアクセスは、公開市場でNVIDIA GPUクラスターを購入またはレンタルしなければならないAV企業に対する構造的計算力優位だ。Aurora、Mobileye、Zoox(AWSあり)はすべてGPUクラスター層で運営する。 |
| Waymoの重大な計算力制約 | Google TPUアクセスにもかかわらず、Waymoのトレーニングデータ量はフリート規模に制限される——2026年半ば時点で推定約2,500台。Teslaの600万台以上のFSD対応フリートが生成するトレーニングデータは桁違いに多い。計算力はこの規模のデータ格差を補えない。 |
第3節:Tesla Dojo:カスタムトレーニングシリコンの規模展開
Tesla’s Dojo D1への戦略的賭けは、テクノロジー業界で最も野心的なカスタムシリコンプロジェクトの一つだ。カスタムAIスーパーコンピューターを最初から構築すること——チップ、インターコネクト、冷却、ソフトウェアスタック、トレーニングフレームワークを設計する——は、ほとんどの企業が試みたことのない複数年の資本とエンジニアリング人材のコミットメントを必要とした。
| 次元 | 詳細 |
|---|---|
| Dojoとは何か | DojはFSD訓練の支配的なモダリティであるビデオトレーニング専用に構築されたTeslaのカスタムAIスーパーコンピューターだ。Teslaのフリートは何十億マイルものカメラ映像を生成する。このデータを大規模に効率的に処理するには、汎用MLではなくビデオワークロード用に最適化されたハードウェアが必要だ。Dojoがそのハードウェアだ。 |
| D1チップ仕様(推定) | Tesla D1チップ:推定362 TFLOPS(BF16)/チップ。カスタムチップ間インターフェースによる高帯域幅相互接続設計。25枚のD1チップが「トレーニングタイル」を形成。タイルがExaPODキャビネットに接続。アーキテクチャはチップ間データ移動コスト——大規模ビデオトレーニングの支配的コスト——の最小化を設計目標とする。すべての数値はTesla AI Day 2022開示からの推定値。 |
| Dojo対NVIDIA H100 | NVIDIA H100:推定989 TFLOPS(BF16)/チップ——D1の約2.7倍の1チップスループット。ただしD1は規模拡大時の低コスト/FLOP向け設計であり、汎用MLではなくTeslaが実行するビデオトレーニングワークロードに最適化されている。 |
| Dojo規模(推定) | Teslaは2023〜2024年にDojo容量のランプアップを開始した。目標:2025〜2026年にマルチexaFLOPクラスター達成(推定)。正確な現在の展開容量は公開されていない。 |
| TeslaがDojoを構築した理由 | 3つの動機:(1)2021〜2023年の不足期間中のNVIDIA GPU供給制約による単一ソース依存リスク;(2)Teslaの特定ビデオトレーニングワークロードでの規模化時の低コスト/FLOP;(3)NVIDIA価格・割当決定からの戦略的独立性。潜在的な第4の動機:Dojo計算力を外部AIおよびビデオ処理企業へのサービスとして販売。 |
| Dojoトレーニング用途 | 主要:FSDビデオトレーニング——Teslaの600万台以上のフリートからの何十億マイルのカメラ映像を処理。二次的:同じビデオベースのアプローチを使用するOptimus人型ロボットのニューラルネット訓練。 |
| Dojo+NVIDIAハイブリッド | TeslaはDojoと並行して大規模なNVIDIA H100クラスターも運用する。2024年時点の推定では約3万台以上のH100 GPU(推定)がTeslaのトレーニングインフラにある。DojoはNVIDIAの近期代替ではなく追加容量だ。 |
| Dojo設備投資(推定) | Dojo構築は資本集約的だ。Teslaは2024年までに10億ドル以上(推定)のDojo投資を引用している。継続拡張でこれは増加する。 |
第4節:車内推論:FSDチップ対Waymoの車内計算力
トレーニング計算力と推論計算力は別のレースだ。より優れたトレーニングクラスターはより良いモデルを生む。しかしそれらのモデルは低レイテンシ、低消費電力で、エッジケース処理のヘッドルームを十分に持った形で車両内のハードウェア上でリアルタイム実行されなければならない。車内推論チップはPhysical AIの「ラストマイル」——トレーニング改善を実世界の運転能力に変換するコンポーネントだ。
| 次元 | Waymo | Tesla FSD | 備考 |
|---|---|---|---|
| 車内計算プラットフォーム | Waymoは車両内にカスタム計算ハードウェアを使用する。具体的なチップ仕様は公開されていない。ハードウェアは知覚融合(LIDAR+カメラ+レーダー)、予測、計画をリアルタイムで同時実行しなければならない。 | Tesla HW3:推定144 TOPS——現行のFSD対応車両の大部分に搭載。Tesla HW4:推定1,000以上のTOPS——2023年初め以降の新型車。世代間の大幅なジャンプ。 | TeslaはFSDチップアーキテクチャの詳細を公開している。WaymoはAZ車内ハードウェア仕様を開示していない。 |
| カスタムシリコン | Waymoはカスタム車内推論チップを発表していない。車内計算力には商業用アクセラレータハードウェアを使用している可能性が高い。 | TeslaはTSMC製造の独自FSD推論チップを設計。内部チップ設計チームが複数世代(HW1〜HW4)を実行。これはAV企業として極めて稀だ。 | Teslaのトレーニング(Dojo)から推論(FSDチップ)へのチップ垂直統合はAV企業中比類ない。 |
| 推論効率 | Waymoのマルチセンサー融合(LIDAR+カメラ+レーダー)は複数のモダリティを融合するために大量のフレームあたり計算力を必要とする。 | Teslaのカメラのみのアプローチはセンサーあたりの計算需要を削減するが、エンド・ツー・エンドのニューラルネットモデルは大規模だ。HW4の1,000以上のTOPSはより大きなモデルと複雑な推論のための十分なヘッドルームを提供する。 | Tesla HW4の計算ヘッドルームによりHW3では不可能だった機能が可能になり得る。 |
| OTAモデル展開 | WaymoはOTA経由でフリート全体のソフトウェアとMLモデルを更新する。 | TeslaはOTA経由でFSDソフトウェアを更新する。ハードウェア能力は固定(HW3対HW4)だが、ソフトウェアは既存ハードウェアの計算エンベロープ内でより多くを引き出せる。 | 両フリートともOTA経由で同時にモデル改善を受け取る。Teslaの600万台以上のフリートは各モデル改善をはるかに大きなベースに配布する。 |
| フリート全体の改善乗数 | Waymoの推定2,500台のフリートが同時にモデル更新の恩恵を受ける。 | Teslaの600万台以上のFSD対応車両が同じOTAモデル更新を同時に受け取る。 | 各モデル改善の価値はフリートサイズとともに倍増する。Teslaのフリート乗数はWaymoの約2,400倍だ。 |
第5節:AI計算力ベンチマーク採点表
| 次元 | Waymo / Alphabet | Tesla | 2028年展望 | 優位 |
|---|---|---|---|---|
| トレーニング計算力アクセス | Google TPU Podインフラ(大規模、内部振替価格) | NVIDIA H100クラスター(推定3万台以上)+Dojo D1(カスタム、成長中) | 両社とも大規模。Dojo拡張が格差を縮小。 | ほぼ互角——Waymo Google TPU対Tesla Dojo+NVIDIA |
| トレーニング計算力コスト | 内部振替価格——市場価格を大幅に下回ると推定 | 多額の設備投資(Dojo)+運営費(NVIDIA、推定) | Dojo FLOP当たりコストは規模化で大幅低下の可能性 | Waymo(近期トレーニングコストは低い可能性) |
| トレーニングデータ量 | 推定2,500台のフリートによる制限——Teslaより桁違いに少ない | 600万台以上のFSD対応車両が継続的に実世界カメラデータを生成 | Teslaのフリート成長とともに格差は拡大し続ける | Tesla(圧倒的かつ複利的な優位) |
| カスタムトレーニングシリコン | なし——Alphabet/Google TPU(Google設計、Waymo設計ではない)を使用 | Dojo D1(Tesla設計、NVIDIA非依存、カスタムビデオトレーニングアーキテクチャ) | TeslaはDojo自給自足に向け前進 | Tesla(戦略的独立性) |
| 車内推論チップ | カスタムハードウェア——仕様は非公開 | HW3(推定144 TOPS)+HW4(推定1,000以上のTOPS)、TSMC製FSDチップ | HW5開発中の可能性。Teslaの推論ロードマップが前進。 | Tesla(公開仕様、HW4の十分なヘッドルーム) |
| OTA改善展開 | 推定2,500台のフリートが各モデル更新を受け取る | 600万台以上が各OTAモデル更新を同時に受け取る | フリート成長で格差拡大 | Tesla |
| 垂直統合 | 部分的——トレーニング用Google TPU、推論用非公開ハードウェア | 高度——トレーニング用Dojo、推論用カスタムFSDチップ、OTAソフトウェアスタック | TeslaがAV企業中最も垂直統合されたシリコン企業 | Tesla |
総合評価: WaymoのGoogle TPUインフラへのアクセスは、独立系AV新興企業やほとんどのAV子会社に対する意味のあるトレーニング計算力優位だ——しかしWaymoの小規模フリートによって生じるトレーニングデータ格差を補うことはできない。Teslaのデータ優位(600万台以上の車両が何十億マイルもの実世界データを生成)とDojoの成長するトレーニング容量、FSDチップの推論計算力が組み合わさって、いかなる競合他社も匹敵できないデータ+計算力の複利フライホイールを生み出している。
この分析から最も重要な洞察:規模化された機械学習では、十分な品質のデータ量は単純な計算力量をほぼ常に上回る。Teslaはあらゆる競合他社より多くのデータを持ち、かつ成長する計算力を持つ。Waymoは1データポイントあたりより多くの計算力を持つ——しかしデータポイントは桁違いに少ない。最も重要な次元において、トレーニング軍拡競争は現在Teslaに有利に動いている:(トレーニングデータ量)×(モデル反復速度)の積という点で。WaymoのGoogle TPU優位は本物だ。TeslaのデータフライホイールはAZ大きい。
第6節:このシリーズについて
本稿はPhysical AIベンチマークシリーズの第182回だ。前回までの稿では、ランプ指数、ヒューマノイドレース、ユニットエコノミクス、グローバル競争、HD地図、フリート運営、ソフトウェア・OTAアーキテクチャ、保険・賠償責任、パートナーシップ、競争上の堀、Cybercab対Model Y、安全データ、Waymo Gen 6、Optimusの製造、スコアカードスナップショット、2030年予測シナリオ、投資家フレームワーク、Waymoの都市展開、Teslaの州承認地図、AV気象制約、人材戦争、規制カレンダー、ロボタクシー料金設定、データフライホイール比較、ヒューマノイド展開トラッカー、サプライチェーン分析、消費者採用需要、Waymoバリュエーション・IPO分析、ソフトウェアアーキテクチャ深度解析、FSD時間軸の歴史を取り上げてきた。
本稿はAIトレーニングインフラ次元を追加する:各社が展開するトレーニング計算力、車内推論ハードウェアの比較、そしてトレーニングデータ量とトレーニング計算容量の相互作用がなぜPhysical AI品質改善の隠れたボトルネックなのか。計算力軍拡競争はほとんどのアナリストには見えない——しかしまさにこの層が各社の次回ソフトウェアアップデートの品質天井の上昇スピードを決定している。
ソース
- Tesla Dojo AIスーパーコンピューター — Tesla AI Day 2022 ↗
- Tesla FSDチップ仕様 — Tesla ↗
- Google TPUインフラ — Google Cloud ↗
- Waymo研究・MLインフラ — Waymo Research ↗