Skip to content
AI-Daily-Builder

2026-06-18 views

フィジカルAIコンピューティング — エッジ vs クラウド:Tesla FSDチップ・WaymoカスタムASIC・Dojo

エッジ推論 vs クラウド学習:Tesla FSDチップ・WaymoカスタムASIC・Dojoが自動運転の完全な計算スタックをどう分担するか。

フィジカルAIベンチマークシリーズ 第57回 — 完全な計算スタック

FSDを有効にしたTeslaが歩行者の歩道からの踏み出しを検出するたびに、その検出を支える計算はすべて車内で完結する。ダッシュボード背後に固定されたカスタムチップの中で、約100ワットを消費しながら、Teslaのサーバーとは無接続で処理される。しかし、そのチップに読み込まれたニューラルネットワークの重みは、Teslaのクラウドインフラで数千GPU年分の計算能力を使って学習されたものだ。問題の二つの側面——推論と学習——は根本的に異なるコンピューティングアーキテクチャを必要とし、各自動運転企業がこの両端でどのような選択をするかが、今後10年の競争を左右する。

本稿では計算スタックの全体像を描く:車載エッジコンピューティングの実態、クラウドの仕組み、そして各社が勝利のために構築したカスタムシリコン。


第1節 — エッジコンピューティングが自動運転に不可欠な理由

あらゆる自動運転車の基本アーキテクチャは、回避不能な物理的制約によって規定される:ミリ秒単位で実行しなければならない判断は、何百キロも離れたサーバーを待つことができない。

制約詳細
レイテンシ要件自動運転車は知覚・計画・制御を合計100ミリ秒以内で完了しなければならない(推定値);クラウドの往復だけで20〜100ミリ秒のネットワーク遅延が生じる——安全クリティカルな判断には許容不能
接続信頼性4G/5G網には不感地帯・輻輳・障害がある;安全な走行に接続を必要とする自動運転車は商業規模での展開が不可能
データ帯域幅カメラ8台+LIDAR+レーダーは毎時1〜2TBの生センサーデータを生成する(推定値);現在のいかなる無線規格でもこれをリアルタイムにクラウドへストリーミングすることはできない
規制要件ほとんどの自動運転安全基準は車載フェイルオペレーショナル機能を要求する——車両は外部接続なしに自力で安全停止できなければならない

これらの制約から、すべての真剣な自動運転エンジニアリングチームが従う原則が生まれる:推論はエッジで実行し、学習はクラウドで行う。 車両はクラウドで学習したモデルをローカルで実行し、エッジケースの精選されたクリップをクラウドに送信して再学習させ、定期的にOTAでモデルの更新を受信する。


第2節 — TeslaのエッジコンピューティングとFSDチップ

Teslaは2016年に、サプライヤーに頼るのではなく自社でニューラル処理ハードウェアを設計するという決断を下し、自動車業界で最も重要なエッジシリコンへの賭けを打った。その成果がTesla FSDコンピューターだ。

コンポーネント詳細
チップ名Tesla FSDコンピューター(HW3:2019年、HW4:2023年)
アーキテクチャ元Appleチップチームのリーダー、Pete Bannonが率いるTesla社内シリコンチームが設計したカスタムニューラル処理ユニット(NPU)
HW4仕様デュアルチップ設計;各チップに12個のARM Cortex-A77コア、2個のNPU、GPUを搭載;1チップあたり約100 TOPS、合計約200 TOPS(推定値)
消費電力FSDコンピューターシステム全体で約100W(推定値)
冗長設計デュアルチップ設計によりハードウェア冗長性を確保;フェイルオペレーショナルアーキテクチャにより一方のチップが故障しても動作継続可能
メモリ推論中のニューラルネットワーク重みへの高速アクセスのためHBM2(高帯域幅メモリ)を搭載
実行内容すべてのFSD推論:カメラ処理、オキュパンシーネットワーク、ニューラルプランナー、速度コントローラー——完全なエンドツーエンドパイプライン
OTAアップデートTeslaのセルラーネットワークでモデルウェイトをOTA更新;新しいFSDソフトウェアバージョンごとに更新されたニューラルネットの重みがチップに配信される
HW5(推定値)次世代チップが予定;FSD v14以降に対応するため大幅なTOPS向上が見込まれる

自社設計の戦略的論理はAppleがMシリーズに適用したものと同じだ:ニューラルネットワークトポロジーを所有していれば、そのネットワークが必要とする正確な行列演算を加速するようにチップアーキテクチャを共同最適化できる。この特殊性が特定タスクにおける優れたワットあたり性能に変換される——電力が制限され熱管理が乗客快適性に影響する車両では、これが非常に重要だ。


第3節 — WaymoのエッジコンピューティングとカスタムASIC+Orin

WaymoのオンボードコンピューティングはTeslaよりも構造的に難しい問題だ。TeslaのセンサースイートはカメラのみだがWaymoのセンサースイートはLIDAR・カメラ・レーダーを組み合わせており、それぞれが高頻度で異なる種類のデータを生成し、すべてをリアルタイムで処理・融合・解釈しなければならない。

コンポーネント詳細
主推論チップWaymoはセンサープロセシングのためにカスタムASICを設計;10〜20 HzでのLIDARポイントクラウド処理には専用ハードウェアが必要;一般的なニューラルネットワーク推論にはNVIDIA Orin SoCを使用(推定値)
LIDAR処理高頻度の360度LIDARポイントクラウドには、点群セグメンテーションと物体検出のための専用計算が必要;このワークロードは汎用GPUアーキテクチャに効率的にマッピングできない
センサーフュージョンLIDAR・カメラ・レーダーデータストリームのリアルタイム融合はカメラのみの処理より計算集約的;融合ステップはニューラルネットワークプランナーが動作する前に完了しなければならない
HDマップローカライゼーションリアルタイムのLIDARポイントクラウドを保存されたHDマップと照合するには、知覚パイプライン以外の追加専用計算が必要
オンボード総計算量LIDARとレーダー処理要件のためTeslaよりも大幅に多い(推定値);WaymoはTOPS数値を公開していない
消費電力LIDARハードウェア+レーダーハードウェア+追加計算のためTeslaより高い(推定値);熱管理は認識されたエンジニアリング課題
第6世代車両Waymo専用の第6世代車両はセンサーと計算ハードウェアをゼロから統合し、初期世代の改造オーバーヘッドを削減

第4節 — クラウド学習:Dojo vs Google TPU

エッジコンピューティングが今日の車の能力を決定する。クラウド学習インフラが明日の改善速度を決定する。

Tesla DojoWaymo(Google TPU)
学習ハードウェアカスタムDojo D1チップ+ExaPODクラスター;各D1チップはBF16精度で約50 TFLOPS、メモリ帯域幅10 TB/sGoogle TPU v4/v5 Pod;WaymoはAlphabet子会社でGoogleの完全なTPUフリートにアクセス可能
クラスター規模Teslaは約1 ExaFLOPのAI学習計算能力を目標(推定値、2025年末);Dojo 2がさらなる拡張のため発表済みGoogleのTPUフリートは世界最大のAI学習クラスターの一つ;Waymoは事実上無制限のオンデマンドアクセスを持つ(推定値)
学習データパイプラインFSD対応Tesla車両約600万台がシャドーモードでクリップを生成;エッジケースとしてフラグされたクリップが優先的にアップロードされラベリングされる専用マッピング車両+約1,500台のロボタクシーフリート;データセット規模は小さいが完全無人運転マイルの比率が高い
学習目標人間ドライバー映像からの模倣学習(FSD v12+):ニューラルネット出力と人間の運転行動の差異を最小化物体検出・占有予測・軌跡予測・行動予測にわたるマルチタスク学習(推定値)
主な優位点学習パイプラインのエンドツーエンド制御;高速イテレーション;クラウドベンダー依存なしGoogleのフルTPU容量へのオンデマンドスケール;学習ハードウェアへの設備投資不要
主なリスクカスタムシリコンは集中的な賭け;Dojoが代替NVIDIAを下回れば学習スループットが遅れるハードウェアリスクなし;Google TPUは大規模で実証済み;リスクはTeslaに対するデータ量

第5節 — フリートデータループ:学習とデプロイメントの連携

計算アーキテクチャ——エッジ推論チップとクラウド学習クラスター——は、各システムの改善速度を決定するデータフライホイールを支えている。

フリート車両がエッジ推論を実行
    → 精選されたクリップをクラウドにアップロード
    → 新データでクラウド学習(Dojo / Google TPU)
    → 改善されたモデルウェイトを生成
    → OTAアップデートをフリートに配信
    → フリート性能が向上
    → より良いクリップ → より効果的な次の学習サイクル
フライホイール要素TeslaWaymo
データ量FSD対応車両約600万台;週に数千万フリートマイル約1,500台;週15万回以上の無人ライド
データ品質主に監督付きマイル(人間ドライバーが同乗);人間の介入が真のエッジケースをマーク完全無人運転マイル;引き継ぐ人間ドライバーなし——すべての判断がシステム生成
アップロード帯域幅セルラー接続;車載ネットワークが異常とフラグしたクリップを選択的にアップロード既知のガレージ・デポから専用アップロード(推定値)
学習スループットDojoは設備投資でスケール;Teslaがペースを制御Google TPUがオンデマンドでスケール;新ハードウェアなしで容量急増が可能
デプロイレイテンシ新モデルリリース後数日以内に約600万台へOTA数時間以内に約1,500台へOTA

このフライホイールの非対称性が自動運転業界の中核的な戦略的緊張だ。Teslaは膨大なデータ量の優位性を持つ——600万台対1,500台。しかしWaymoはデータ品質の優位性を持つ:そのデータセットの全マイルは人間の介入なしに走行されており、システム自身の判断(ミスを含む)が完全に記録されている。データ量とデータ品質のどちらがより重要かはまだ実証的に決着がついていない——答えは数十億マイルにわたる安全記録によって明らかになる。


出典:Tesla FSDコンピューターおよびDojo仕様——tesla.com/AI(Tesla AI Day 2022、2023);NVIDIA Orin SoC車載仕様——nvidia.com/en-us/self-driving-cars/drive-orin/;Google Cloud TPUドキュメント——cloud.google.com/tpu;Waymo技術概要——waymo.com/waymo-driver/。「推定値」と記された数値は、公開企業資料・業界報道・アナリストリサーチから導出されたものであり、独立した検証を経ておらず、方向性の参考として扱うべきです。本稿は投資アドバイスを構成しません。


ソース

タグ

チップ