Skip to content
AI-Daily-Builder

2026-06-07

波士頓動力的 Atlas 學會搬起一台冰箱:在模擬中訓練的全身控制,泛化到超出其負重上限

次瀏覽

2026 年 5 月中,波士頓動力發布了一篇技術部落格以及多段影片,展示其電動 Atlas 使用全身控制、而非僅靠手臂來舉起與搬運重型家電。該策略幾乎完全在模擬中、透過帶有域隨機化的強化學習訓練而成,並泛化到超出其訓練時的 50 至 70 磅範圍的負重。這是人形機器人如何從擺拍式展示跨向力量密集、接觸密集工作的一個具體數據點。

發布了什麼

2026 年 5 月中,波士頓動力推出了一篇技術部落格(日期為 5 月 18 日,作者為 Alberto Rodriguez、Shane Rozen-Levy 與 Vinay Kamidi)以及兩段影片,展示電動 Atlas 人形機器人拾起、搬運並放置重型家用電器。主打片段是一台約 50 磅的迷你冰箱。更有趣的主張藏在底下:當團隊在內部測試中把冰箱加載到超過 100 磅、超出其訓練時的重量區間時,同一個學習到的策略依然撐得住,且無需重新訓練。Atlas 的規格設定為可處理約 110 磅(50 公斤)。

這場展示的重點不在於物件,而在於方法。Atlas 使用全身控制來完成舉升,把腿、髖、軀幹、肩與手臂當成一個協調的系統,而不是把腿固定為靜止的底座、再用手臂去伸取。當負重很重時,腿會為平衡而調整,軀幹充當配重,手臂負責定位物件,而身體其餘部分則為質量實際所在之處進行補償。如 Atlas 控制副總監 Benjamin Stephens 所說:「把你的整個身體都投入進去,差不多就是這個想法。」

為何是本體感覺、而非視覺,扛起這次舉升

一個說明問題的細節:機器人並非主要透過視覺辨識這台電器、再圍繞它規劃。它仰賴本體感覺,一種對身體位置與力量的內在感知,同時即時讀取每一個關節的重量分布、握持阻力與平衡。這正是讓單一策略能吸收比訓練中任何負重都更重的東西的原因。身體透過關節扭矩感受到額外的質量,並移動其質心以保持穩定,而不需要一個告訴它「這是一台冰箱、重量是 X」的視覺模型。

這種框架很重要,因為大多數已發布的操作展示都重度依賴視覺-語言-動作管線。以力量為主、接觸密集的任務(舉升、倚靠、撐住)正是視覺優先的技術堆疊吃力之處,也是全身力量回饋發揮其價值之處。

它是如何訓練的

這套配方越來越像是標準的模擬到現實(sim-to-real)操作手冊,且執行得乾淨俐落:

StageWhat happened
SeedA simple reference animation sketches roughly what the lift should look like
Reinforcement learningAtlas practices in simulation, rewarded for keeping the fridge stable, holding grip and staying balanced
Domain randomizationWeight, fridge position, floor friction, grip level and even motor-strength variations are scrambled across thousands of variants
Scale”Millions of hours” of practice run in parallel on GPUs, compressing years of physical reps into weeks

有兩點很突出。第一是時間線:波士頓動力表示,這項行為是在 Atlas 於 1 月公開亮相 CES 2026 之後數週內成形的。第二,這種泛化是隨機化的直接回報。因為該策略在模擬中見過範圍寬廣的重量與摩擦條件,那個超過 100 磅的真實世界負重,落在它實際上已學會處理的分布之內,即便沒有任何單一訓練回合用過那個確切的質量。

這項工作也建立在波士頓動力與豐田研究院(Toyota Research Institute)先前於 2025 年 8 月的「大型行為模型」(large behavior model)成果之上,那是一個 450M 參數、採用流匹配(flow-matching)目標、以 30 Hz 運行、學會了數十項靈巧任務的擴散-Transformer 策略。2026 年 5 月的重物舉升成果,是那條操作路線在運動加力量上的互補:較少關於折疊桌布,較多關於在搬運重物時不要摔倒。

現實檢驗

把量產差距放在視野裡。波士頓動力的母公司現代(Hyundai)已表明目標是到 2028 年在其位於喬治亞州薩凡納(Savannah)附近的 Metaplant 每年生產 30,000 台 Atlas,並從 2028 年開始在如零件排序這類低風險任務上展開工廠部署。相較之下,前員工形容目前的產出大約是每月四台。一個乾淨的、模擬訓練出的舉升策略,與一條年產 30,000 台的產線,是非常不同的問題,而後者主要是機械工程、供應鏈與良率,而非學習。

從業者筆記

如果你在打造機器人策略,可遷移的教訓是「種子加隨機化」的組合:用一條粗略的參考軌跡來界定探索範圍,然後進行積極的域隨機化(尤其是針對那些你在執行時無法精確測量的物理參數,例如摩擦力與馬達強度),如此部署後的策略就會把超出規格的條件當成又一個樣本。一個超出訓練範圍的負重也能成功,正是揭示了是隨機化、而非名目目標重量,定義了真正的能力包絡。對於任何在評估人形機器人供應商的人,要明確詢問力量密集的任務與本體感覺控制,而不只是整潔的視覺-語言抓取與擺放展示片,因為接觸密集的工作正是那些困難、鮮少被展示的失敗所在之處。

一個被忽視的角度

每個人都在對靈巧度——指尖那套東西——做基準測試。遠少有人對人形機器人「對負重判斷錯誤後還能恢復」的能力做基準測試,而對於任何在人附近舉起重物的機器人來說,這可說是攸關安全的情境。一個能透過全身補償、優雅地吸收比預期更重物件的策略,悄悄地,既是一項能力成果、也同樣是一項穩健性成果。有趣的待解問題是失敗邊界:在多少出乎意料的重量下、或在搬運途中物件質心發生哪種突然偏移時,本體感覺的恢復會失效、機器人會放掉負重或翻倒?決定這些機器在真實地板上、緊鄰一個真實的人時是否值得信賴的,正是那個邊緣,而非乾淨的冰箱舉升——而那也正是精修過的展示影片從不展示的那個數字。


Sources

請喝咖啡