2026-06-18 — views
フィジカルAIコンピューティング — エッジ vs クラウド:Tesla FSDチップ・WaymoカスタムASIC・Dojo
エッジ推論 vs クラウド学習:Tesla FSDチップ・WaymoカスタムASIC・Dojoが自動運転の完全な計算スタックをどう分担するか。
フィジカルAIベンチマークシリーズ 第57回 — 完全な計算スタック
FSDを有効にしたTeslaが歩行者の歩道からの踏み出しを検出するたびに、その検出を支える計算はすべて車内で完結する。ダッシュボード背後に固定されたカスタムチップの中で、約100ワットを消費しながら、Teslaのサーバーとは無接続で処理される。しかし、そのチップに読み込まれたニューラルネットワークの重みは、Teslaのクラウドインフラで数千GPU年分の計算能力を使って学習されたものだ。問題の二つの側面——推論と学習——は根本的に異なるコンピューティングアーキテクチャを必要とし、各自動運転企業がこの両端でどのような選択をするかが、今後10年の競争を左右する。
本稿では計算スタックの全体像を描く:車載エッジコンピューティングの実態、クラウドの仕組み、そして各社が勝利のために構築したカスタムシリコン。
第1節 — エッジコンピューティングが自動運転に不可欠な理由
あらゆる自動運転車の基本アーキテクチャは、回避不能な物理的制約によって規定される:ミリ秒単位で実行しなければならない判断は、何百キロも離れたサーバーを待つことができない。
| 制約 | 詳細 |
|---|---|
| レイテンシ要件 | 自動運転車は知覚・計画・制御を合計100ミリ秒以内で完了しなければならない(推定値);クラウドの往復だけで20〜100ミリ秒のネットワーク遅延が生じる——安全クリティカルな判断には許容不能 |
| 接続信頼性 | 4G/5G網には不感地帯・輻輳・障害がある;安全な走行に接続を必要とする自動運転車は商業規模での展開が不可能 |
| データ帯域幅 | カメラ8台+LIDAR+レーダーは毎時1〜2TBの生センサーデータを生成する(推定値);現在のいかなる無線規格でもこれをリアルタイムにクラウドへストリーミングすることはできない |
| 規制要件 | ほとんどの自動運転安全基準は車載フェイルオペレーショナル機能を要求する——車両は外部接続なしに自力で安全停止できなければならない |
これらの制約から、すべての真剣な自動運転エンジニアリングチームが従う原則が生まれる:推論はエッジで実行し、学習はクラウドで行う。 車両はクラウドで学習したモデルをローカルで実行し、エッジケースの精選されたクリップをクラウドに送信して再学習させ、定期的にOTAでモデルの更新を受信する。
第2節 — TeslaのエッジコンピューティングとFSDチップ
Teslaは2016年に、サプライヤーに頼るのではなく自社でニューラル処理ハードウェアを設計するという決断を下し、自動車業界で最も重要なエッジシリコンへの賭けを打った。その成果がTesla FSDコンピューターだ。
| コンポーネント | 詳細 |
|---|---|
| チップ名 | Tesla FSDコンピューター(HW3:2019年、HW4:2023年) |
| アーキテクチャ | 元Appleチップチームのリーダー、Pete Bannonが率いるTesla社内シリコンチームが設計したカスタムニューラル処理ユニット(NPU) |
| HW4仕様 | デュアルチップ設計;各チップに12個のARM Cortex-A77コア、2個のNPU、GPUを搭載;1チップあたり約100 TOPS、合計約200 TOPS(推定値) |
| 消費電力 | FSDコンピューターシステム全体で約100W(推定値) |
| 冗長設計 | デュアルチップ設計によりハードウェア冗長性を確保;フェイルオペレーショナルアーキテクチャにより一方のチップが故障しても動作継続可能 |
| メモリ | 推論中のニューラルネットワーク重みへの高速アクセスのためHBM2(高帯域幅メモリ)を搭載 |
| 実行内容 | すべてのFSD推論:カメラ処理、オキュパンシーネットワーク、ニューラルプランナー、速度コントローラー——完全なエンドツーエンドパイプライン |
| OTAアップデート | TeslaのセルラーネットワークでモデルウェイトをOTA更新;新しいFSDソフトウェアバージョンごとに更新されたニューラルネットの重みがチップに配信される |
| HW5(推定値) | 次世代チップが予定;FSD v14以降に対応するため大幅なTOPS向上が見込まれる |
自社設計の戦略的論理はAppleがMシリーズに適用したものと同じだ:ニューラルネットワークトポロジーを所有していれば、そのネットワークが必要とする正確な行列演算を加速するようにチップアーキテクチャを共同最適化できる。この特殊性が特定タスクにおける優れたワットあたり性能に変換される——電力が制限され熱管理が乗客快適性に影響する車両では、これが非常に重要だ。
第3節 — WaymoのエッジコンピューティングとカスタムASIC+Orin
WaymoのオンボードコンピューティングはTeslaよりも構造的に難しい問題だ。TeslaのセンサースイートはカメラのみだがWaymoのセンサースイートはLIDAR・カメラ・レーダーを組み合わせており、それぞれが高頻度で異なる種類のデータを生成し、すべてをリアルタイムで処理・融合・解釈しなければならない。
| コンポーネント | 詳細 |
|---|---|
| 主推論チップ | WaymoはセンサープロセシングのためにカスタムASICを設計;10〜20 HzでのLIDARポイントクラウド処理には専用ハードウェアが必要;一般的なニューラルネットワーク推論にはNVIDIA Orin SoCを使用(推定値) |
| LIDAR処理 | 高頻度の360度LIDARポイントクラウドには、点群セグメンテーションと物体検出のための専用計算が必要;このワークロードは汎用GPUアーキテクチャに効率的にマッピングできない |
| センサーフュージョン | LIDAR・カメラ・レーダーデータストリームのリアルタイム融合はカメラのみの処理より計算集約的;融合ステップはニューラルネットワークプランナーが動作する前に完了しなければならない |
| HDマップローカライゼーション | リアルタイムのLIDARポイントクラウドを保存されたHDマップと照合するには、知覚パイプライン以外の追加専用計算が必要 |
| オンボード総計算量 | LIDARとレーダー処理要件のためTeslaよりも大幅に多い(推定値);WaymoはTOPS数値を公開していない |
| 消費電力 | LIDARハードウェア+レーダーハードウェア+追加計算のためTeslaより高い(推定値);熱管理は認識されたエンジニアリング課題 |
| 第6世代車両 | Waymo専用の第6世代車両はセンサーと計算ハードウェアをゼロから統合し、初期世代の改造オーバーヘッドを削減 |
第4節 — クラウド学習:Dojo vs Google TPU
エッジコンピューティングが今日の車の能力を決定する。クラウド学習インフラが明日の改善速度を決定する。
| Tesla Dojo | Waymo(Google TPU) | |
|---|---|---|
| 学習ハードウェア | カスタムDojo D1チップ+ExaPODクラスター;各D1チップはBF16精度で約50 TFLOPS、メモリ帯域幅10 TB/s | Google TPU v4/v5 Pod;WaymoはAlphabet子会社でGoogleの完全なTPUフリートにアクセス可能 |
| クラスター規模 | Teslaは約1 ExaFLOPのAI学習計算能力を目標(推定値、2025年末);Dojo 2がさらなる拡張のため発表済み | GoogleのTPUフリートは世界最大のAI学習クラスターの一つ;Waymoは事実上無制限のオンデマンドアクセスを持つ(推定値) |
| 学習データパイプライン | FSD対応Tesla車両約600万台がシャドーモードでクリップを生成;エッジケースとしてフラグされたクリップが優先的にアップロードされラベリングされる | 専用マッピング車両+約1,500台のロボタクシーフリート;データセット規模は小さいが完全無人運転マイルの比率が高い |
| 学習目標 | 人間ドライバー映像からの模倣学習(FSD v12+):ニューラルネット出力と人間の運転行動の差異を最小化 | 物体検出・占有予測・軌跡予測・行動予測にわたるマルチタスク学習(推定値) |
| 主な優位点 | 学習パイプラインのエンドツーエンド制御;高速イテレーション;クラウドベンダー依存なし | GoogleのフルTPU容量へのオンデマンドスケール;学習ハードウェアへの設備投資不要 |
| 主なリスク | カスタムシリコンは集中的な賭け;Dojoが代替NVIDIAを下回れば学習スループットが遅れる | ハードウェアリスクなし;Google TPUは大規模で実証済み;リスクはTeslaに対するデータ量 |
第5節 — フリートデータループ:学習とデプロイメントの連携
計算アーキテクチャ——エッジ推論チップとクラウド学習クラスター——は、各システムの改善速度を決定するデータフライホイールを支えている。
フリート車両がエッジ推論を実行
→ 精選されたクリップをクラウドにアップロード
→ 新データでクラウド学習(Dojo / Google TPU)
→ 改善されたモデルウェイトを生成
→ OTAアップデートをフリートに配信
→ フリート性能が向上
→ より良いクリップ → より効果的な次の学習サイクル
| フライホイール要素 | Tesla | Waymo |
|---|---|---|
| データ量 | FSD対応車両約600万台;週に数千万フリートマイル | 約1,500台;週15万回以上の無人ライド |
| データ品質 | 主に監督付きマイル(人間ドライバーが同乗);人間の介入が真のエッジケースをマーク | 完全無人運転マイル;引き継ぐ人間ドライバーなし——すべての判断がシステム生成 |
| アップロード帯域幅 | セルラー接続;車載ネットワークが異常とフラグしたクリップを選択的にアップロード | 既知のガレージ・デポから専用アップロード(推定値) |
| 学習スループット | Dojoは設備投資でスケール;Teslaがペースを制御 | Google TPUがオンデマンドでスケール;新ハードウェアなしで容量急増が可能 |
| デプロイレイテンシ | 新モデルリリース後数日以内に約600万台へOTA | 数時間以内に約1,500台へOTA |
このフライホイールの非対称性が自動運転業界の中核的な戦略的緊張だ。Teslaは膨大なデータ量の優位性を持つ——600万台対1,500台。しかしWaymoはデータ品質の優位性を持つ:そのデータセットの全マイルは人間の介入なしに走行されており、システム自身の判断(ミスを含む)が完全に記録されている。データ量とデータ品質のどちらがより重要かはまだ実証的に決着がついていない——答えは数十億マイルにわたる安全記録によって明らかになる。
出典:Tesla FSDコンピューターおよびDojo仕様——tesla.com/AI(Tesla AI Day 2022、2023);NVIDIA Orin SoC車載仕様——nvidia.com/en-us/self-driving-cars/drive-orin/;Google Cloud TPUドキュメント——cloud.google.com/tpu;Waymo技術概要——waymo.com/waymo-driver/。「推定値」と記された数値は、公開企業資料・業界報道・アナリストリサーチから導出されたものであり、独立した検証を経ておらず、方向性の参考として扱うべきです。本稿は投資アドバイスを構成しません。
ソース
- Tesla FSDコンピューター HW4仕様 — Tesla AI Day 2022 ↗
- Tesla Dojoスーパーコンピューター — Tesla AIインフラ ↗
- NVIDIA Orin SoC 車載コンピューティング — NVIDIA ↗
- Google TPUフリート — Google Cloud ↗