2026-06-18 — views
Physical AIシミュレーション — TeslaリレンダーとWaymo CarCraftの合成データ競争
TeslaのニューラルリレンダーエンジンとWaymoのCarCraftプラットフォームは、大規模な合成訓練データ生成における2つの根本的に異なる戦略を代表する。
Physical AIベンチマークシリーズ第109回 — Physical AIシミュレーションインフラストラクチャ:TeslaのリレンダーエンジンとWaymoのシミュレーションプラットフォームがいかにして合成訓練データを生成し、レアなエッジケースをテストし、実走行マイルの価値を倍増させるか
実世界の走行データは収集コストが高く、ラベル付けが困難で、完全な制御は不可能だ。雨天条件をオンデマンドで作り出してモデルの挙動をテストすることはできない。ニアミスシナリオを強制的に作り出して緊急対応を検証することもできない。同じ交差点での遭遇を1万回繰り返してばらつきを測定することもできない。シミュレーションは、合成走行シナリオを大規模に生成することでこれらの問題を解決する——そして企業のシミュレーションインフラストラクチャの品質は、訓練データの品質に直接影響し、ひいてはモデルの品質を左右する倍率係数となる。
TeslaとWaymoは、それぞれの広範なアーキテクチャ哲学を反映した根本的に異なるシミュレーションアプローチを構築している。Teslaのリレンダーエンジンは実際のカメラ映像から始まり、フォトリアリスティックな合成バリアントに再構築することで、ビジョンオンリーシステムのシミュレーションと現実のギャップを排除する。WaymoのCarCraftプラットフォームは、LiDAR、カメラ、レーダーを同時にシミュレートしなければならない3Dワールドモデルを構築する——より困難な物理学的問題だが、よりリッチなマルチセンサー合成データセットを生み出す。
セクション1 — シミュレーションが自動運転訓練にもたらすもの
| シミュレーション機能 | 重要な理由 | シミュレーションなしの場合 |
|---|---|---|
| レアエッジケース生成 | 実世界データは通常走行に大きく偏っており、ニアミスシナリオ、異常な歩行者行動、センサー障害は稀——シミュレーションはオンデマンドで生成 | モデルは本番環境で遭遇するまでエッジケースを見たことがない;壊滅的な失敗リスク |
| 反事実テスト | 「車両が右ではなく左に曲がっていたら何が起きていたか?」という問い——シミュレーションでのみ回答可能 | 実車両で代替決定を安全にテストできない |
| 実世界データを超えるスケール | シミュレーションは1日に数百万の訓練シナリオを生成;実世界フリートは数千件 | データを必要とするモデルは実世界収集レートにボトルネック |
| センサーモデルの忠実度 | 異なる天気、照明、センサー劣化条件下でLiDAR/カメラ/レーダーが見るものを正確にシミュレート | センサーを実際に劣化させることなくセンサー劣化に対して訓練できない |
| 回帰テスト | 展開前にすべてのソフトウェアリリースを数千のシミュレーションシナリオに対してテスト;実車両に影響が出る前に回帰を検出 | すべてのソフトウェアアップデートが生体実験;リスクが高い |
| 安全クリティカルシステム検証 | 規制当局はシミュレーションを機能安全検証の一部として受け入れることが増加(ISO 26262、SOTIF) | すべての安全検証を実道路で行う必要がある——非現実的に遅い |
重要な洞察は、シミュレーションが実世界データを置き換えるのではなく、倍増させるということだ。適切にキャプチャされてリレンダーや3D再構築パイプラインに入力された単一の実世界ニアミスイベントは、数千の訓練バリアントを生成できる。フリートが種であり、シミュレーションが乗数だ。
セクション2 — Teslaのシミュレーションアプローチ:ニューラルレンダリングとリレンダー
Teslaのシミュレーション戦略は、ビジョンオンリー、LiDARなしのアーキテクチャに密接に結びついている。
| コンポーネント | 機能 | 重要な理由 |
|---|---|---|
| リレンダーエンジン | フリートからのリアルワールドビデオクリップを取り込み、物理的に正確な3D表現でシーンを再構築;次に異なる視点、照明条件、天気、または挿入された合成オブジェクト(車両、歩行者)でシーンを再レンダリング | フェニックスで一度起きたニアミスは10,000通りのバリエーションで再レンダリングできる——1つの実際のイベントを数千の訓練例に効果的に倍増 |
| ニューラルRadiance Fields(NeRF)/ 3Dガウシアンスプラッティング | 複数のカメラアングルからフォトリアリスティックな3D表現を構築するニューラルシーン再構築手法;Teslaはこれらの技術の独自バリアントを使用(推定) | FSDが見るものと正確に一致するカメラ解像度でのフォトリアリスティック再レンダリングが可能;ベースシーンが実際のものであるため「シム・トゥ・リアルギャップ」問題なし |
| 自動ラベリングパイプライン | FSD自体が再構築シーンにラベルを付ける——モデルが元のクリップで歩行者を識別すれば、そのラベルはすべての再レンダリングバリアントに伝播 | 人間のラベリングコストを削減;ラベル生成がモデル能力とともにスケール |
| Dojo統合 | シミュレーションシナリオがDojo訓練実行に直接フィード;コンピュートとシミュレーションが協調設計 | 密な統合は実験からモデルへのイテレーションサイクルの高速化を意味する |
| 主要な優位性 | シム・トゥ・リアルギャップなし——レンダリングシーンは実際のセンサーデータから始まるためフォトリアリスティック;モデルが訓練されるものは本番環境で見るものと正確に一致 | 従来の合成シミュレーションには「シム・トゥ・リアルギャップ」がある:合成ビジュアルで訓練されたモデルは実際のカメラ画像では異なる動作をする可能性 |
| スケール | Teslaは数十億のシミュレーション訓練マイルを生成できると主張(推定);正確な数字は未公開 | 実世界収集のみより桁違いに多くのデータ |
セクション3 — Waymoのシミュレーションアプローチ:CarCraftとクローズドループテスト
| コンポーネント | 機能 |
|---|---|
| CarCraft | Waymoの内部シミュレーションプラットフォーム(公開開示済み);1日あたり数百万マイルのシミュレーション走行を実行(推定);HDマップから車両、歩行者、自転車乗り、道路形状をモデル化 |
| 実走行からのシナリオ抽出 | 実世界のインシデントとニアミスを抽出、匿名化してシミュレーションにシードしバリアントを生成;Teslaのリレンダーコンセプトに類似するが、カメラ画像ではなく3Dワールドモデルに適用 |
| マルチセンサーシミュレーション | LiDAR(3Dポイントクラウド)、カメラ(2D画像)、レーダー(距離プラス速度)を同時にシミュレートする必要がある;カメラオンリーシミュレーションより複雑 |
| 行動モデリング | 他の道路利用者のリアルな行動をシミュレート(車線変更するドライバー、飛び出す歩行者、ふらつく自転車乗り);単純なシミュレーションとの主要差別化要因 |
| クローズドループテスト | シミュレーションAVの決定がシミュレーション世界に影響;他のシミュレーションエージェントがAVの選択に反応 |
| スケール | Waymoは1日あたり数千万シミュレーションマイルを実行していると開示(推定) |
| シム・トゥ・リアルの課題 | WaymoのLiDARシミュレーションは、レーザーパルスが表面、再帰反射材料、ガラスと相互作用する方法を正確にモデル化する必要がある——カメラ画像合成より困難な物理学的問題(推定) |
クローズドループ能力はWaymoの最も重要なシミュレーション優位性だ。オープンループテストでは、AVの決定はシミュレーションで次に何が起きるかに影響しない。クローズドループテストでは、シミュレーション世界がAVの行動に反応する。これにより、AV自身の行動が危険な状況を作り出すシナリオというクラス全体の失敗モードを検出できる。
セクション4 — 産業インフラとしてのNVIDIA Omniverse
| 次元 | NVIDIAが提供するもの | 利用者 |
|---|---|---|
| Omniverseプラットフォーム | USD(Universal Scene Description)上に構築された物理的に正確なシミュレーション環境;ロボットシミュレーション、AVテスト、産業デジタルツインに使用 | ロボット分野で広く採用(Figure AI、Boston Dynamicsなど);一部のAV企業が非本番シミュレーションに使用(推定) |
| Isaac Sim | Omniverse内のNVIDIAロボットシミュレーションプラットフォーム;物理的に正確なセンサーモデル;ROS2互換 | ヒューマノイドロボット開発;TeslaのプライマリAVシミュレーションではない(Teslaは独自ビルド) |
| Drive Sim | Omniverse内のNVIDIA AV専用シミュレーション;LiDAR/カメラ/レーダーセンサーモデル;天気シミュレーション;複数のAV企業が使用(Cruise、BYDなど——推定) | Waymoは主に独自CarCraftを使用;一部のOEMがNVIDIA Drive Simを使用 |
| 合成データ生成 | NVIDIAプラットフォームはスケールでラベル付き合成訓練データを生成できる | 独自シミュレーションを構築できない小規模AVプログラムとロボットスタートアップ |
セクション5 — シミュレーションベンチマーク指標
| 指標 | 測定内容 | Tesla(推定) | Waymo(推定) |
|---|---|---|---|
| 1日のシミュレーションマイル | 生成される合成走行体験の量 | 1日数十億マイルと主張(独立検証なし) | 1日数千万マイル(開示済み) |
| シナリオライブラリサイズ | 訓練/テストに利用可能な異なるエッジケースシナリオ数 | 未開示 | 未開示 |
| シム・トゥ・リアル忠実度 | シミュレーションが実際のセンサー出力にどれだけ近いか | 非常に高い(実データからリレンダー);ギャップ最小 | 高い(マルチセンサー物理モデル);稀な表面でいくらかのギャップ(推定) |
| クローズドループ能力 | シミュレーションAVの決定がシミュレーション世界に影響 | あり(推定) | あり(CarCraft——開示済み) |
| 回帰テストカバレッジ | 各ソフトウェアリリースでテストされるシナリオ | 未開示 | 未開示 |
| 主要優位性 | ニューラルリレンダーがカメラのシム・トゥ・リアルギャップを排除;実際のイベントからエッジケースをスケール | マルチセンサーシミュレーション;堅牢なクローズドループ;確立されたプラットフォーム(推定) |
セクション6 — Physical AIレースへの戦略的含意
| 戦略的次元 | Teslaのポジション | Waymoのポジション |
|---|---|---|
| シミュレーションからモデルへのフィードバックループ | 高速——Dojo統合はリレンダーから訓練実行までの密なサイクルを意味する(推定) | 成熟——CarCraftは数年間大規模で稼働 |
| データフライホイール | 600万台以上のFSD車両がリレンダーエンジンにシードする実際の映像を生成 | 小規模フリートだが車両あたりのセンサーデータ品質が高い |
| シム・トゥ・リアルギャップ | カメラはほぼゼロ(実際の映像からリレンダー) | カメラは低い;LiDAR稀有表面相互作用でいくらかの残留(推定) |
| マルチセンサーシミュレーション能力 | 不要——ビジョンオンリー;未構築(推定) | アーキテクチャに必要;CarCraftに組み込み済み |
| 競争上のモート | リレンダーエンジンは600万台のフリートに結びついている——競合他社はデータを複製できない | CarCraftのスケールとクローズドループの成熟度は10年以上かけて構築 |
結論として:シミュレーション品質は他のすべての指標の隠れた乗数だ。Teslaのリレンダーアプローチはアーキテクチャ的に洗練されており、ビジョンオンリーの賭けと密接に結びついている。WaymoのCarCraftはより複雑でコストの高いマルチセンサーシミュレーションで、センサー冗長アーキテクチャに必要なものであり、そのクローズドループ能力はAV誘発の失敗モードを捕捉するための本物の優位性だ。どちらのアプローチも明確に優れているわけではない——それらは自動運転の正しいアーキテクチャとは何かという2つの異なる賭けの一貫した実装だ。
注記: 「(推定)」とラベル付けされた数字は、2026年中頃の公開情報に基づく方向性の推定です。正確なシミュレーション量と内部プラットフォームの詳細は独立して検証されていません。この記事は投資アドバイスを構成しません。
ソース
- Tesla AI Day simulation presentation — Tesla ↗
- Waymo simulation — CarCraft blog post ↗
- NVIDIA Omniverse and Isaac Sim — NVIDIA ↗
- Neural Radiance Fields survey — arXiv ↗
- SOTIF ISO 21448 autonomous driving safety — ISO ↗