Skip to content
AI-Daily-Builder

2026-06-07

波士顿动力的 Atlas 学会搬起一台冰箱:在模拟中训练的全身控制,泛化到超出其负重上限

次浏览

2026 年 5 月中,波士顿动力发布了一篇技术博客以及多段视频,展示其电动 Atlas 使用全身控制、而非仅靠手臂来举起与搬运重型家电。该策略几乎完全在模拟中、通过带有域随机化的强化学习训练而成,并泛化到超出其训练时的 50 至 70 磅范围的负重。这是人形机器人如何从摆拍式演示跨向力量密集、接触密集工作的一个具体数据点。

发布了什么

2026 年 5 月中,波士顿动力推出了一篇技术博客(日期为 5 月 18 日,作者为 Alberto Rodriguez、Shane Rozen-Levy 与 Vinay Kamidi)以及两段视频,展示电动 Atlas 人形机器人拾起、搬运并放置重型家用电器。主打片段是一台约 50 磅的迷你冰箱。更有趣的主张藏在底下:当团队在内部测试中把冰箱加载到超过 100 磅、超出其训练时的重量区间时,同一个学习到的策略依然撑得住,且无需重新训练。Atlas 的规格设定为可处理约 110 磅(50 公斤)。

这场演示的重点不在于物件,而在于方法。Atlas 使用全身控制来完成举升,把腿、髋、躯干、肩与手臂当成一个协调的系统,而不是把腿固定为静止的底座、再用手臂去伸取。当负重很重时,腿会为平衡而调整,躯干充当配重,手臂负责定位物件,而身体其余部分则为质量实际所在之处进行补偿。如 Atlas 控制副总监 Benjamin Stephens 所说:「把你的整个身体都投入进去,差不多就是这个想法。」

为何是本体感觉、而非视觉,扛起这次举升

一个说明问题的细节:机器人并非主要通过视觉辨识这台电器、再围绕它规划。它仰赖本体感觉,一种对身体位置与力量的内在感知,同时实时读取每一个关节的重量分布、握持阻力与平衡。这正是让单一策略能吸收比训练中任何负重都更重的东西的原因。身体通过关节扭矩感受到额外的质量,并移动其质心以保持稳定,而不需要一个告诉它「这是一台冰箱、重量是 X」的视觉模型。

这种框架很重要,因为大多数已发布的操作演示都重度依赖视觉-语言-动作管线。以力量为主、接触密集的任务(举升、倚靠、撑住)正是视觉优先的技术堆栈吃力之处,也是全身力量反馈发挥其价值之处。

它是如何训练的

这套配方越来越像是标准的模拟到现实(sim-to-real)操作手册,且执行得干净利落:

StageWhat happened
SeedA simple reference animation sketches roughly what the lift should look like
Reinforcement learningAtlas practices in simulation, rewarded for keeping the fridge stable, holding grip and staying balanced
Domain randomizationWeight, fridge position, floor friction, grip level and even motor-strength variations are scrambled across thousands of variants
Scale”Millions of hours” of practice run in parallel on GPUs, compressing years of physical reps into weeks

有两点很突出。第一是时间线:波士顿动力表示,这项行为是在 Atlas 于 1 月公开亮相 CES 2026 之后数周内成形的。第二,这种泛化是随机化的直接回报。因为该策略在模拟中见过范围宽广的重量与摩擦条件,那个超过 100 磅的真实世界负重,落在它实际上已学会处理的分布之内,即便没有任何单一训练回合用过那个确切的质量。

这项工作也建立在波士顿动力与丰田研究院(Toyota Research Institute)此前于 2025 年 8 月的「大型行为模型」(large behavior model)成果之上,那是一个 450M 参数、采用流匹配(flow-matching)目标、以 30 Hz 运行、学会了数十项灵巧任务的扩散-Transformer 策略。2026 年 5 月的重物举升成果,是那条操作路线在运动加力量上的互补:较少关于折叠桌布,较多关于在搬运重物时不要摔倒。

现实检验

把量产差距放在视野里。波士顿动力的母公司现代(Hyundai)已表明目标是到 2028 年在其位于乔治亚州萨凡纳(Savannah)附近的 Metaplant 每年生产 30,000 台 Atlas,并从 2028 年开始在如零件排序这类低风险任务上展开工厂部署。相较之下,前员工形容目前的产出大约是每月四台。一个干净的、模拟训练出的举升策略,与一条年产 30,000 台的产线,是非常不同的问题,而后者主要是机械工程、供应链与良率,而非学习。

从业者笔记

如果你在打造机器人策略,可迁移的教训是「种子加随机化」的组合:用一条粗略的参考轨迹来界定探索范围,然后进行积极的域随机化(尤其是针对那些你在执行时无法精确测量的物理参数,例如摩擦力与马达强度),如此部署后的策略就会把超出规格的条件当成又一个样本。一个超出训练范围的负重也能成功,正是揭示了是随机化、而非名目目标重量,定义了真正的能力包络。对于任何在评估人形机器人供应商的人,要明确询问力量密集的任务与本体感觉控制,而不只是整洁的视觉-语言抓取与摆放演示片,因为接触密集的工作正是那些困难、鲜少被展示的失败所在之处。

一个被忽视的角度

每个人都在对灵巧度——指尖那套东西——做基准测试。远少有人对人形机器人「对负重判断错误后还能恢复」的能力做基准测试,而对于任何在人附近举起重物的机器人来说,这可说是攸关安全的情境。一个能通过全身补偿、优雅地吸收比预期更重物件的策略,悄悄地,既是一项能力成果、也同样是一项稳健性成果。有趣的待解问题是失败边界:在多少出乎意料的重量下、或在搬运途中物件质心发生哪种突然偏移时,本体感觉的恢复会失效、机器人会放掉负重或翻倒?决定这些机器在真实地板上、紧邻一个真实的人时是否值得信赖的,正是那个边缘,而非干净的冰箱举升——而那也正是精修过的演示视频从不展示的那个数字。


Sources

请喝咖啡