Skip to content
AI-Daily-Builder

2026-06-18 views

Physical AIシミュレーション — TeslaリレンダーとWaymo CarCraftの合成データ競争

TeslaのニューラルリレンダーエンジンとWaymoのCarCraftプラットフォームは、大規模な合成訓練データ生成における2つの根本的に異なる戦略を代表する。

Physical AIベンチマークシリーズ第109回 — Physical AIシミュレーションインフラストラクチャ:TeslaのリレンダーエンジンとWaymoのシミュレーションプラットフォームがいかにして合成訓練データを生成し、レアなエッジケースをテストし、実走行マイルの価値を倍増させるか

実世界の走行データは収集コストが高く、ラベル付けが困難で、完全な制御は不可能だ。雨天条件をオンデマンドで作り出してモデルの挙動をテストすることはできない。ニアミスシナリオを強制的に作り出して緊急対応を検証することもできない。同じ交差点での遭遇を1万回繰り返してばらつきを測定することもできない。シミュレーションは、合成走行シナリオを大規模に生成することでこれらの問題を解決する——そして企業のシミュレーションインフラストラクチャの品質は、訓練データの品質に直接影響し、ひいてはモデルの品質を左右する倍率係数となる。

TeslaとWaymoは、それぞれの広範なアーキテクチャ哲学を反映した根本的に異なるシミュレーションアプローチを構築している。Teslaのリレンダーエンジンは実際のカメラ映像から始まり、フォトリアリスティックな合成バリアントに再構築することで、ビジョンオンリーシステムのシミュレーションと現実のギャップを排除する。WaymoのCarCraftプラットフォームは、LiDAR、カメラ、レーダーを同時にシミュレートしなければならない3Dワールドモデルを構築する——より困難な物理学的問題だが、よりリッチなマルチセンサー合成データセットを生み出す。


セクション1 — シミュレーションが自動運転訓練にもたらすもの

シミュレーション機能重要な理由シミュレーションなしの場合
レアエッジケース生成実世界データは通常走行に大きく偏っており、ニアミスシナリオ、異常な歩行者行動、センサー障害は稀——シミュレーションはオンデマンドで生成モデルは本番環境で遭遇するまでエッジケースを見たことがない;壊滅的な失敗リスク
反事実テスト「車両が右ではなく左に曲がっていたら何が起きていたか?」という問い——シミュレーションでのみ回答可能実車両で代替決定を安全にテストできない
実世界データを超えるスケールシミュレーションは1日に数百万の訓練シナリオを生成;実世界フリートは数千件データを必要とするモデルは実世界収集レートにボトルネック
センサーモデルの忠実度異なる天気、照明、センサー劣化条件下でLiDAR/カメラ/レーダーが見るものを正確にシミュレートセンサーを実際に劣化させることなくセンサー劣化に対して訓練できない
回帰テスト展開前にすべてのソフトウェアリリースを数千のシミュレーションシナリオに対してテスト;実車両に影響が出る前に回帰を検出すべてのソフトウェアアップデートが生体実験;リスクが高い
安全クリティカルシステム検証規制当局はシミュレーションを機能安全検証の一部として受け入れることが増加(ISO 26262、SOTIF)すべての安全検証を実道路で行う必要がある——非現実的に遅い

重要な洞察は、シミュレーションが実世界データを置き換えるのではなく、倍増させるということだ。適切にキャプチャされてリレンダーや3D再構築パイプラインに入力された単一の実世界ニアミスイベントは、数千の訓練バリアントを生成できる。フリートが種であり、シミュレーションが乗数だ。


セクション2 — Teslaのシミュレーションアプローチ:ニューラルレンダリングとリレンダー

Teslaのシミュレーション戦略は、ビジョンオンリー、LiDARなしのアーキテクチャに密接に結びついている。

コンポーネント機能重要な理由
リレンダーエンジンフリートからのリアルワールドビデオクリップを取り込み、物理的に正確な3D表現でシーンを再構築;次に異なる視点、照明条件、天気、または挿入された合成オブジェクト(車両、歩行者)でシーンを再レンダリングフェニックスで一度起きたニアミスは10,000通りのバリエーションで再レンダリングできる——1つの実際のイベントを数千の訓練例に効果的に倍増
ニューラルRadiance Fields(NeRF)/ 3Dガウシアンスプラッティング複数のカメラアングルからフォトリアリスティックな3D表現を構築するニューラルシーン再構築手法;Teslaはこれらの技術の独自バリアントを使用(推定)FSDが見るものと正確に一致するカメラ解像度でのフォトリアリスティック再レンダリングが可能;ベースシーンが実際のものであるため「シム・トゥ・リアルギャップ」問題なし
自動ラベリングパイプラインFSD自体が再構築シーンにラベルを付ける——モデルが元のクリップで歩行者を識別すれば、そのラベルはすべての再レンダリングバリアントに伝播人間のラベリングコストを削減;ラベル生成がモデル能力とともにスケール
Dojo統合シミュレーションシナリオがDojo訓練実行に直接フィード;コンピュートとシミュレーションが協調設計密な統合は実験からモデルへのイテレーションサイクルの高速化を意味する
主要な優位性シム・トゥ・リアルギャップなし——レンダリングシーンは実際のセンサーデータから始まるためフォトリアリスティック;モデルが訓練されるものは本番環境で見るものと正確に一致従来の合成シミュレーションには「シム・トゥ・リアルギャップ」がある:合成ビジュアルで訓練されたモデルは実際のカメラ画像では異なる動作をする可能性
スケールTeslaは数十億のシミュレーション訓練マイルを生成できると主張(推定);正確な数字は未公開実世界収集のみより桁違いに多くのデータ

セクション3 — Waymoのシミュレーションアプローチ:CarCraftとクローズドループテスト

コンポーネント機能
CarCraftWaymoの内部シミュレーションプラットフォーム(公開開示済み);1日あたり数百万マイルのシミュレーション走行を実行(推定);HDマップから車両、歩行者、自転車乗り、道路形状をモデル化
実走行からのシナリオ抽出実世界のインシデントとニアミスを抽出、匿名化してシミュレーションにシードしバリアントを生成;Teslaのリレンダーコンセプトに類似するが、カメラ画像ではなく3Dワールドモデルに適用
マルチセンサーシミュレーションLiDAR(3Dポイントクラウド)、カメラ(2D画像)、レーダー(距離プラス速度)を同時にシミュレートする必要がある;カメラオンリーシミュレーションより複雑
行動モデリング他の道路利用者のリアルな行動をシミュレート(車線変更するドライバー、飛び出す歩行者、ふらつく自転車乗り);単純なシミュレーションとの主要差別化要因
クローズドループテストシミュレーションAVの決定がシミュレーション世界に影響;他のシミュレーションエージェントがAVの選択に反応
スケールWaymoは1日あたり数千万シミュレーションマイルを実行していると開示(推定)
シム・トゥ・リアルの課題WaymoのLiDARシミュレーションは、レーザーパルスが表面、再帰反射材料、ガラスと相互作用する方法を正確にモデル化する必要がある——カメラ画像合成より困難な物理学的問題(推定)

クローズドループ能力はWaymoの最も重要なシミュレーション優位性だ。オープンループテストでは、AVの決定はシミュレーションで次に何が起きるかに影響しない。クローズドループテストでは、シミュレーション世界がAVの行動に反応する。これにより、AV自身の行動が危険な状況を作り出すシナリオというクラス全体の失敗モードを検出できる。


セクション4 — 産業インフラとしてのNVIDIA Omniverse

次元NVIDIAが提供するもの利用者
OmniverseプラットフォームUSD(Universal Scene Description)上に構築された物理的に正確なシミュレーション環境;ロボットシミュレーション、AVテスト、産業デジタルツインに使用ロボット分野で広く採用(Figure AI、Boston Dynamicsなど);一部のAV企業が非本番シミュレーションに使用(推定)
Isaac SimOmniverse内のNVIDIAロボットシミュレーションプラットフォーム;物理的に正確なセンサーモデル;ROS2互換ヒューマノイドロボット開発;TeslaのプライマリAVシミュレーションではない(Teslaは独自ビルド)
Drive SimOmniverse内のNVIDIA AV専用シミュレーション;LiDAR/カメラ/レーダーセンサーモデル;天気シミュレーション;複数のAV企業が使用(Cruise、BYDなど——推定)Waymoは主に独自CarCraftを使用;一部のOEMがNVIDIA Drive Simを使用
合成データ生成NVIDIAプラットフォームはスケールでラベル付き合成訓練データを生成できる独自シミュレーションを構築できない小規模AVプログラムとロボットスタートアップ

セクション5 — シミュレーションベンチマーク指標

指標測定内容Tesla(推定)Waymo(推定)
1日のシミュレーションマイル生成される合成走行体験の量1日数十億マイルと主張(独立検証なし)1日数千万マイル(開示済み)
シナリオライブラリサイズ訓練/テストに利用可能な異なるエッジケースシナリオ数未開示未開示
シム・トゥ・リアル忠実度シミュレーションが実際のセンサー出力にどれだけ近いか非常に高い(実データからリレンダー);ギャップ最小高い(マルチセンサー物理モデル);稀な表面でいくらかのギャップ(推定)
クローズドループ能力シミュレーションAVの決定がシミュレーション世界に影響あり(推定)あり(CarCraft——開示済み)
回帰テストカバレッジ各ソフトウェアリリースでテストされるシナリオ未開示未開示
主要優位性ニューラルリレンダーがカメラのシム・トゥ・リアルギャップを排除;実際のイベントからエッジケースをスケールマルチセンサーシミュレーション;堅牢なクローズドループ;確立されたプラットフォーム(推定)

セクション6 — Physical AIレースへの戦略的含意

戦略的次元TeslaのポジションWaymoのポジション
シミュレーションからモデルへのフィードバックループ高速——Dojo統合はリレンダーから訓練実行までの密なサイクルを意味する(推定)成熟——CarCraftは数年間大規模で稼働
データフライホイール600万台以上のFSD車両がリレンダーエンジンにシードする実際の映像を生成小規模フリートだが車両あたりのセンサーデータ品質が高い
シム・トゥ・リアルギャップカメラはほぼゼロ(実際の映像からリレンダー)カメラは低い;LiDAR稀有表面相互作用でいくらかの残留(推定)
マルチセンサーシミュレーション能力不要——ビジョンオンリー;未構築(推定)アーキテクチャに必要;CarCraftに組み込み済み
競争上のモートリレンダーエンジンは600万台のフリートに結びついている——競合他社はデータを複製できないCarCraftのスケールとクローズドループの成熟度は10年以上かけて構築

結論として:シミュレーション品質は他のすべての指標の隠れた乗数だ。Teslaのリレンダーアプローチはアーキテクチャ的に洗練されており、ビジョンオンリーの賭けと密接に結びついている。WaymoのCarCraftはより複雑でコストの高いマルチセンサーシミュレーションで、センサー冗長アーキテクチャに必要なものであり、そのクローズドループ能力はAV誘発の失敗モードを捕捉するための本物の優位性だ。どちらのアプローチも明確に優れているわけではない——それらは自動運転の正しいアーキテクチャとは何かという2つの異なる賭けの一貫した実装だ。

注記: 「(推定)」とラベル付けされた数字は、2026年中頃の公開情報に基づく方向性の推定です。正確なシミュレーション量と内部プラットフォームの詳細は独立して検証されていません。この記事は投資アドバイスを構成しません。


ソース

タグ

チップ