2026-06-18 — views
AV シミュレーション——Waymo と Tesla が数十億の仮想マイルで自律システムを訓練する方法
Waymoは年間200億マイルをシミュレート;Teslaは600万台の映像をDojoで学習——シミュレーションがAVリーダーの差を生む乗数だ。
フィジカルAIベンチマークシリーズ第74回——AVシミュレーションと合成データ
歩行者が赤信号を無視したり、高速走行中にタイヤがバーストしたり、子どもが突然車道に飛び出したりする状況を、実際の道路でその瞬間を待ちながら自動運転車に教えることはできない。シミュレーションは訓練の乗数だ——AV企業が実際の車両がそれに直面する前に、ソフトウェアの中で希少で危険なシナリオに何十億回も遭遇できるようにする。
Waymoは年間約200億マイルのシミュレーション走行を実施していると推定される(推定値)。Teslaは600万台の実際の車両からの映像でDojoスーパーコンピューターを使って訓練している。AVリーダーと追随者の差は走行距離だけではない——シミュレーション能力、合成訓練データの規模、そして実世界のエッジケースからシミュレーション訓練環境へのループ速度が問われる。
本稿では、シミュレーションアーキテクチャ、合成データパイプライン、そしてシミュレーション能力がフィジカルAIランプベンチマークにとって何を意味するかを整理する。
第1節——シミュレーションが不可欠な理由
AV訓練の根本的な問題はロングテールにある:実際の運転シナリオの分布は非常に広いが、安全上最も重要なシナリオ——希少で危険なニアミスイベント——は有機的な実データ中に極めてまれにしか現れない。それらのイベントが実際の道路で発生するのを待つことは、実行可能な訓練戦略ではない。
| 訓練課題 | 実道路アプローチ | シミュレーションアプローチ |
|---|---|---|
| 希少だが重要なイベント | 歩行者が赤信号を無視するのを待つ——百万マイルに一度しか起こらないかもしれない | ランダム化されたタイミング・速度・車両位置で、数百万件の合成赤信号無視シナリオを生成 |
| 致命的シナリオ | 実車をサイクリストに意図的に衝突させることはできない | 完全な物理的忠実度で衝突をシミュレート;コストゼロで回避ポリシーを訓練 |
| エッジケースのカバレッジ | 実車隊はデータを有機的に蓄積——低速でかつ地理的偏りがある | あらゆる地理・天候・時間帯・交通密度のデータを生成可能 |
| ポリシー反復速度 | 新ソフトウェアを展開→実走行マイルを収集→評価:1サイクル数週間 | 新ポリシーをシミュレーションでテスト→数時間で評価;100倍速い反復 |
| コーナーケース(ロングテール) | 実データ中の希少シナリオのロングテールは網羅不可能なほど長い | シミュレーションはターゲットを絞ったロングテールシナリオをオンデマンドで生成可能 |
| 安全性 | 真に危険なシナリオでの実道路訓練は不可能 | シミュレーションは本質的に安全;人員・機材へのリスクゼロ |
コアとなるシミュレーション原則:実際の走行1マイルは数千種類のシミュレーション変体に拡張できる——異なる天候、異なる道路利用者、異なる初期条件。最も効果的にシミュレーションできる企業は、実走行マイルのみに依存するいかなる競合他社よりも速くポリシーネットワークを改善できる。
第2節——Waymoのシミュレーションプラットフォーム:Carcraft
WaymoはCarcraft(カークラフト)という内部シミュレーションプラットフォームを運営しており、実世界のAVプログラムと並行して10年以上かけて構築されてきた。Carcraftは補助ツールではない——Waymoの主要な訓練環境だ。
| 属性 | 詳細 |
|---|---|
| 名称 | Carcraft(Waymoの内部シミュレーションプラットフォーム) |
| 規模 | Waymoは年間約200億シミュレーションマイルを走行していると発表(推定値) |
| アーキテクチャ | 高忠実度物理シミュレーション;現実的なセンサーモデリング(LIDARポイントクラウド・カメラレンダリング・レーダー反射);他車両・歩行者・自転車利用者のエージェント行動モデル |
| センサーシミュレーション | Waymoは完全なセンサースイートをシミュレート——シミュレートされたLIDARポイントクラウドは、実際の認識スタックが修正なしに処理できるほど物理的に正確でなければならない |
| シナリオ生成 | 実走行データをシミュレーションにフィードバックし、実道路で遭遇したエッジケースを系統的にバリエーション生成 |
| エージェント行動 | Waymoシミュレーション内の他車両・歩行者は、実世界観測から導出した校正済み行動分布でモデル化 |
| インフラ | Google Cloud TPU上で動作(GoogleのWaymo所有により大規模算力へのアクセスが可能);いかなる産業においても最大規模の専用シミュレーション算力クラスターの一つと推定(推定値) |
| リアル→シムループ | 実Waymo車両が予期しない状況に遭遇すると、そのシナリオは自動的にシミュレーションに取り込まれ、訓練・回帰テストに使用される |
リアル→シムループはWaymoの構造的優位点だ:すべての実世界エッジケースは数時間以内にシミュレーション訓練データになる。サンフランシスコで珍しい歩行者行動に遭遇した車両は、そのシナリオの数千種類の合成バリエーションの生成をトリガーできる——異なる速度・異なる照明・異なる天候——次のソフトウェアアップデートが出る前に完了する。
Carcraftの規模は、実世界プログラムでは不可能なレベルの回帰テストも可能にする。Waymoはソフトウェアアップデートを出す際、実車がアップデートされたコードを走らせる前に、数万の過去記録シナリオに対するシミュレーション回帰テストをパスしなければならない。これがシミュレーション安全ネットだ。
第3節——Teslaのアプローチ:実映像プラスDojo
Teslaの訓練哲学はWaymoとは根本的に異なる。Waymoが合成世界を構築するのに対し、Teslaは現実世界を収穫する。
| 属性 | Tesla | Waymo |
|---|---|---|
| 主要訓練データ | 600万台以上の車隊からの実映像(ペタバイト規模の実世界カメラ映像) | 約1,500台のAV車両からのシミュレーションプラス実走行マイル |
| シミュレーションの役割 | 二次的——Teslaは特定シナリオでシミュレーションを使うが実映像が主 | 主要——年間数百億シミュレーションマイル(推定値) |
| Dojo | 大規模映像訓練専用に構築されたスーパーコンピューター;タイル間帯域幅に最適化したカスタムD1チップ | Google Cloud TPUを使用(Googleの親会社関係) |
| Dojo D1チップ | カスタム7nmチップ;362 TFLOPS FP16;チップ間900 GB/s相互接続——分散映像処理向けに設計 | 該当なし |
| 訓練目標 | 8カメラフィードを直接運転決定にマッピングするニューラルネットを訓練(大規模エンドツーエンドまたは模倣学習) | 認識・予測・計画モジュールを個別に訓練;シミュレーションが各モジュールをカバー |
| 優位点 | 実世界データ分布——モデルは現実で実際のエッジケースを目にする | あらゆるシナリオに無制限の合成データを生成可能;車隊規模に制限されない |
| 劣位点 | 実際に発生するのを待たずに希少・危険なシナリオを訓練できない | シミュレーション忠実度ギャップ——シミュレートされたセンサーデータは実センサーデータと完全には一致しない |
DojoはWaymoのTPUクラスターアクセスに対するTeslaの回答だ。D1チップはTeslaが直面する特定の計算ボトルネック——数百万台の車からのペタバイト規模の連続映像を処理し、そのデータでリアルタイムに大型ニューラルネットを訓練すること——に対して設計された。従来のGPUクラスターは分散映像訓練のメモリ帯域幅要求に苦労するが、D1の900 GB/sチップ間相互接続はこの特定のボトルネックを解消するために設計されている。
Teslaの実データフライホイールは異なる種類の複利優位を生む。Tesla車オーナーが走るすべてのFSDマイルが訓練データを生成する。車隊が成長するにつれ、訓練データも比例して成長する——重要なのは、それがモデルが展開される実世界のシナリオ分布と同じ分布で成長することだ。Waymoはシミュレーションでその分布をエンジニアリングしなければならない;Teslaはただ収集している。
第4節——シム→リアルギャップ:未解決の問題
シミュレーション重視のアプローチの根本的な限界がシム→リアルギャップだ:シミュレーションデータのみで訓練されたモデルは、シミュレーションとは微妙に異なる実センサー入力に対して同様の性能を発揮しない場合がある。
| 課題 | 説明 | 現状 |
|---|---|---|
| センサー忠実度 | シミュレートされたLIDARポイントクラウドは、モデルがシムからリアルに汎化できるよう、実LIDARポイントクラウドと十分に近くなければならない | Waymoは高忠実度センサーシミュレーションに多額投資;それでも完全ではない——シムデータのみで訓練されたモデルは実データで性能が低下 |
| 行動リアリズム | シミュレートされた歩行者・ドライバーは実際の人間と同じように振る舞わなければならない | 実データから校正された行動モデルが助けになる;極端な希少行動はまだモデル化が困難 |
| ドメインランダム化 | 戦略:シムパラメーターを広くランダム化してモデルがあらゆるシム変体に対してロバストに学習→実世界により良くTransfer | 一部シナリオには有効;他には不十分 |
| NeRFとガウシアンスプラッティング | 新アプローチ:実シーンをカメラ映像から3DニューラルRepresentationに再構築;新しい視点から再レンダリングして訓練データを生成 | Waymo・Nvidia等がニューラルシーン再構築でシム→リアルギャップを縮小中;有望だが計算集約的 |
| UniSimとGAIA | Waymo(UniSim)等が実世界入力からフォトリアリスティックなセンサーデータを生成するニューラルシミュレーターを構築中 | 活発な研究領域;手工業的物理シミュレーションへの依存を軽減 |
ドメインランダム化——シミュレーションパラメーターに意図的にバリエーションを導入すること——はシム→リアル転移の最初の系統的戦略だった。照明・テクスチャ・天候・センサーノイズをランダム化したシミュレーションで訓練することで、モデルは特定シミュレーターの具体的な欠点に対してよりロバストになる。しかしドメインランダム化だけでは、すべての条件下で生産AVデプロイに必要なレベルまでギャップを縮小できていない。
NeRFとガウシアンスプラッティングのアプローチは根本的に異なる戦略を示す:合成世界をゼロから構築するのではなく、現実世界を3Dニューラル表現で捉え、あらゆる視点・あらゆる条件で再レンダリングする。Waymo車両がサンフランシスコで記録したシーンを、雨の中・夜間に再レンダリングし、遮蔽された歩行者を追加できる——物理シミュレーションパイプラインがそれらの条件をゼロからモデル化する必要なしに。
第5節——競争上の堀としてのシミュレーション
シミュレーション能力はAVレースの主要な競争軸になっている。より速く・より正確に・より大規模にシミュレーションできる企業は、実世界テストにより多く依存するいかなる競合他社よりも速くポリシーを反復できる。
| 次元 | リーダー | 重要性 |
|---|---|---|
| 年間シミュレーションマイル数 | Waymo(約200億マイル、推定値) | より多いシミュレーションマイル=より多いエッジケースカバレッジ=より安全な実世界性能 |
| シミュレーション算力 | Waymo(Google TPUアクセス)vs Tesla(Dojo) | 算力規模がポリシー反復速度を決定 |
| リアル→シムパイプライン | Waymo(Carcraftリアル→シムループ) | 実エッジケースのシミュレーション取り込みが速いほど改善が速い |
| ニューラルシミュレーション | 積極的な競争(Waymo UniSim・Nvidia COSMOS等) | 次のフロンティア:フォトリアリスティックなニューラルシミュレーターがシム→リアルギャップを解消 |
| シナリオライブラリ | Waymo(10年以上かけて構築した最大ライブラリ) | 深いシナリオライブラリは複製が難しい——構築に何年もかかる |
| データフライホイール統合 | Tesla(実車隊→実映像→訓練→より良いモデル→より大きな車隊) | Teslaの優位:大規模実データ;シミュレーションは補完 |
Nvidia COSMOS(2025年): Nvidiaは2025年初頭にCOSMOS——フィジカルAIシミュレーション向けのワールド基盤モデル——を発表した。COSMOSはロボティクスとAVシステムの訓練のためにフォトリアリスティックな合成映像を生成する。これはプロダクトとして利用可能な最初の汎用ニューラルワールドシミュレーターを表す——WaymoやTeslaのような社内シミュレーションインフラを持たない企業でも高忠実度シミュレーションを利用できる可能性がある。小規模なAVプログラムにとって、COSMOSは高品質な合成データ生成の参入障壁を、何年もの工学投資から算力予算の問題へと引き下げる。
シナリオライブラリの優位は特に持続的だ。Waymoは10年以上かけてエッジケース・希少イベント・コーナーシナリオのライブラリを構築してきた——それぞれがタグ付け・分類され、実車隊が新しい状況に遭遇するたびに継続的に追加されている。今日シミュレーション競争に参入する競合は、Waymoがすでにカタログ化したすべてのエッジケースをゼロからエンジニアリングし、さらに物理シミュレーションインフラを構築しなければならない。これは毎年の運営とともに大きくなる複利の堀を形成する。
第6節——このシリーズについて
これはフィジカルAIベンチマークシリーズの第74回だ。前回の記事ではランプインデックス、ヒューマノイドレース、ユニットエコノミクス、グローバル競争、HDマッピング、ソフトウェアとOTA、消費者需要、競争上の堀、サイバーキャブ対Model Y、安全データ、Waymo Gen 6、Optimusの製造、スコアカードスナップショット、2030年予測シナリオ、投資家フレームワーク、都市展開パイプライン、Tesla FSD州承認マップ、AV天候・気候制約、人材戦争、規制カレンダー、ロボタクシー料金設定、ヒューマノイドデプロイメントトラッカー、サプライチェーン分析、消費者採用需要インデックス、評価とIPO分析、フィジカルAI 2026年中間まとめ、AVユニットエコノミクスマイルあたりコスト分析、AVデータフライホイール比較、AVサイバーセキュリティ攻撃面、フィジカルAIサプライチェーン、AV車隊オペレーション、AV保険と責任の進化、フィジカルAIの全ライフサイクル環境コスト、高齢者・障害者向けアクセシビリティ層、マッピングアーキテクチャ比較、そして中国のAVレースを取り上げた。
本稿はシミュレーション次元を追加する:合成訓練インフラが、AVリーダーに実車隊が生成できる以上の速度で訓練経験を蓄積させる仕組みと、次の5年間でシミュレーション優位を誰が握るかを形作るかもしれないニューラルワールドモデルの最前線。
注: シミュレーションマイル推定・車隊規模・チップ仕様・競争評価は「(推定値)」として標記されており、公開情報・企業開示・業界分析を反映しています。本記事は投資アドバイスではありません。
ソース
- Waymoシミュレーションとカークラフト——Waymoテクノロジーブログ ↗
- Tesla Dojoスーパーコンピューター——Tesla AI ↗
- Nvidia COSMOSワールド基盤モデル——Nvidia ↗
- Waymo UniSimニューラル閉ループセンサーシミュレーター——Waymo Research ↗
- 自律走行シミュレーション——スタンフォードHAI ↗