Skip to content
AI-Daily-Builder

2026-06-07

ボストン・ダイナミクスの Atlas が冷蔵庫を持ち上げることを学習:シミュレーションで訓練された全身制御が、負荷上限を超えて汎化する

ビュー

2026 年 5 月中旬、ボストン・ダイナミクスは技術ブログと複数の動画を公開し、電動 Atlas が腕だけでなく全身制御を用いて重い家電を持ち上げ運ぶ様子を示した。このポリシーはほぼ完全にシミュレーション内で、ドメインランダム化を伴う強化学習によって訓練され、訓練時の 50〜70 ポンドの範囲を超える負荷へと汎化した。これは、人形ロボットが演出されたデモから力の大きい接触の多い作業へと移行しつつあることを示す具体的なデータ点だ。

何が公開されたか

2026 年 5 月中旬、ボストン・ダイナミクスは技術ブログ(日付は 5 月 18 日、著者は Alberto Rodriguez、Shane Rozen-Levy、Vinay Kamidi)と 2 本の動画を出し、電動 Atlas 人形ロボットが重い家庭用電化製品を拾い上げ、運び、置く様子を示した。目玉のクリップは約 50 ポンドのミニ冷蔵庫だ。より興味深い主張はその下にある:チームが内部テストで冷蔵庫を 100 ポンド超まで、つまり訓練した重量帯を超えて積載したとき、同じ学習済みポリシーが再訓練なしで持ちこたえたのだ。Atlas は約 110 ポンド(50 kg)を扱える仕様になっている。

このデモの要点は対象物ではない。方法だ。Atlas は全身制御を用いて持ち上げを行い、脚を静止した土台として固定して腕で手を伸ばすのではなく、脚、腰、胴、肩、腕を一つの協調したシステムとして扱う。負荷が重いとき、脚はバランスのために調整し、胴はカウンターウェイトとして働き、腕は対象物を位置づける一方で、身体の残りの部分は質量が実際に位置する場所を補償する。Atlas 制御担当アソシエイトディレクターの Benjamin Stephens が述べたように、「全身を使え、というのがいわば発想だった」。

なぜ視覚ではなく固有受容感覚が持ち上げを担うのか

物事を物語る細部:ロボットは主に電化製品を視覚的に識別してからその周りで計画するのではない。それは固有受容感覚、すなわち身体の位置と力の内的な感覚に頼り、すべての関節にわたって重量分布、握りの抵抗、バランスを一度にリアルタイムで読み取る。それこそが、単一のポリシーが訓練中のどんな負荷よりも重いものを吸収できる理由だ。身体は関節トルクを通じて余分な質量を感じ取り、安定を保つために重心を移動させる。「これは冷蔵庫で重さは X だ」と告げる視覚モデルを必要とするのではなく。

この枠組みが重要なのは、公開された操作デモの大半が視覚-言語-行動パイプラインに強く依存しているからだ。力が支配的で接触の多いタスク(持ち上げ、寄りかかり、踏ん張り)は、視覚優先のスタックが苦戦するまさにその場所であり、全身の力フィードバックがその真価を発揮する場所だ。

どのように訓練されたか

このレシピは、ますます標準的なシミュレーションから現実(sim-to-real)への手順書であり、それを的確に実行している:

StageWhat happened
SeedA simple reference animation sketches roughly what the lift should look like
Reinforcement learningAtlas practices in simulation, rewarded for keeping the fridge stable, holding grip and staying balanced
Domain randomizationWeight, fridge position, floor friction, grip level and even motor-strength variations are scrambled across thousands of variants
Scale”Millions of hours” of practice run in parallel on GPUs, compressing years of physical reps into weeks

二つの点が際立つ。第一にタイムライン:ボストン・ダイナミクスは、この挙動が 1 月の Atlas の CES 2026 公開デビューから数週間以内にまとまったと述べている。第二に、この汎化はランダム化の直接的な見返りだ。ポリシーはシミュレーション内で幅広い重量と摩擦の条件を見たため、100 ポンド超の実世界の負荷は、いかなる単一の訓練エピソードもその正確な質量を使わなかったにもかかわらず、実質的に扱えるよう学習した分布の内側に収まった。

この成果はまた、2025 年 8 月のボストン・ダイナミクスとトヨタ・リサーチ・インスティテュート(Toyota Research Institute)による以前の「大規模行動モデル」(large behavior model)の取り組み——フローマッチング(flow-matching)目的を持ち 30 Hz で動作し、数十の器用なタスクを学習した 450M パラメータの拡散トランスフォーマーポリシー——の上に乗っている。2026 年 5 月の重量物持ち上げの結果は、その操作の系統に対する、移動プラス力の補完だ:テーブルクロスを畳むことよりも、重い物を運ぶ間に転ばないことに関するものだ。

現実の確認

量産のギャップを視野に入れておくこと。ボストン・ダイナミクスの親会社である現代(Hyundai)は、2028 年までにジョージア州サバンナ(Savannah)近郊の Metaplant で年間 30,000 台の Atlas を生産する目標を表明しており、部品の順序付けのような低リスクのタスクで 2028 年から工場展開を開始する。それに対し、元従業員たちは現在の産出を概ね月 4 台と表現している。きれいなシミュレーション訓練済みの持ち上げポリシーと、年間 30,000 台のラインは非常に異なる問題であり、後者は主に機械工学、サプライチェーン、歩留まりであって、学習ではない。

実務者メモ

ロボットのポリシーを構築するなら、移転可能な教訓は「シーディングとランダム化」の組み合わせだ:探索を境界づける粗い参照軌道、そして積極的なドメインランダム化(とりわけ摩擦やモーター強度のような、実行時に正確に測定できない物理パラメータについて)により、展開後のポリシーが仕様外の条件を単なるもう一つのサンプルとして扱うようにする。訓練範囲を超えた負荷が機能したという事実は、名目上の目標重量ではなくランダム化こそが、実際の能力の包絡線を定義したという証だ。人形ロボットのベンダーを評価する者は誰でも、きれいな視覚-言語のピックアンドプレイスのリールだけでなく、力の大きいタスクと固有受容感覚による制御について具体的に尋ねるべきだ。なぜなら、接触の多い作業こそが、難しく、あまり見せられない失敗が潜む場所だからだ。

あまり考慮されていない視点

誰もが器用さ、指先の話をベンチマークする。人形ロボットが負荷について誤り、そこから回復する能力をベンチマークする人ははるかに少ないが、それは人の近くで重い物を持ち上げるあらゆるロボットにとって、間違いなく安全上重要なケースだ。予想より重い物体を全身の補償によって優雅に吸収するポリシーは、ひそかに、能力の結果であると同時に堅牢性の結果でもある。興味深い未解決の問いは失敗の境界だ:どれほど予想外の重量で、あるいは運搬の途中で対象物の重心がどのように突然変化したとき、固有受容感覚による回復が破綻し、ロボットが負荷を落とすか倒れるのか?これらの機械が、実際の人のそばで実際の床の上で信頼できるかどうかを決めるのは、きれいな冷蔵庫の持ち上げではなく、その縁であり、そしてそれこそが、磨き上げられたデモ動画が決して見せない数字なのだ。


Sources

チップ