2026-06-18 — views
Physical AI 人形机器人竞赛 2026——Tesla Optimus vs Figure AI vs Agility Digit:商业人形机器人基准评测
Tesla Optimus目标量产成本$20K。Agility Digit率先进驻亚马逊仓库。Figure AI结合OpenAI VLM,操作演示领先业界。
Physical AI 基准系列第 202 篇——Physical AI 人形机器人竞赛 2026:Tesla Optimus vs Boston Dynamics Atlas vs Figure AI vs Agility Robotics Digit——商业人形机器人基准评测
人形机器人市场在 2025–2026 年已从概念验证跨入早期商业部署。Agility Robotics Digit 正在亚马逊物流中心处理周转箱搬运;Figure AI 的 Figure 02 已进驻南卡罗来纳州 BMW 工厂车间;Tesla Optimus 在 Tesla 超级工厂执行电池组装与质量检验任务。问题已不再是”人形机器人能否运作”,而是”谁将赢得商业爬坡,关键维度是什么”。
本基准指数涵盖五个维度:(1)人形形态为何是 Physical AI 的融合点;(2)Tesla Optimus 的竞争定位深度解析;(3)竞争格局——Boston Dynamics、Figure AI、Agility Robotics、1X Technologies、Unitree;(4)关键技术战场;(5)成本、AI 架构、商业部署与战略支持全面评分。
第一节——为何人形机器人是 Physical AI 的融合点
人形机器人的核心论点源自一个观察:世界是为人类设计的。门口是人的宽度,楼梯是人的尺寸,工具是人手大小,键盘、车辆、货架与生产线都围绕人体构建。与人类共用形态的机器人可以在人类环境中操作,无需改造基础设施——可立即部署到现有工厂、仓库、办公室与家庭,无需任何建设投入。没有任何其他形态的机器人能提供这一优势。
其他形态各有结构性限制:
- AGV(自动导引车): 只能在平坦地板上行驶;需要 QR 码、磁条或结构化导航基础设施;无法应对楼梯、坡道或可变高度货架;无法用手操作物品。
- 固定式机械臂: 单任务高精度;需要专门安装与基础设施;无法在工位之间移动;无法穿越厂区地板。
- 四足机器人(如 Boston Dynamics Spot): 地形移动性强,适合巡检;缺乏灵巧操作手,非通用工厂劳动设计。
人形机器人的价值主张在于经济性:一台可在同一设施内执行多种任务的通用机器人——搬箱、操作设备、开门、响应口头指令、与人并肩工作——比为每类任务部署多套专用机器人更具经济效益。统一机器人机群、统一训练流程、统一维护体系。
主要应用市场:
| 市场 | 规模(估) | 人形机器人优势 |
|---|---|---|
| 仓储与物流 | 全球仓储劳动成本估$1,500亿+/年(估) | 亚马逊拥有75万名以上员工;物流中心涉及重复性高量物料搬运任务,最适合自动化 |
| 汽车制造 | 汽车工厂已广泛使用机械臂,但灵活组装任务仍需人工 | BMW与Figure AI的合作瞄准机械臂无法胜任的车身车间灵活组装任务 |
| 半导体晶圆厂 | 洁净室环境,严格污染管控 | Foxconn与台积电正在探索人形机器人用于精密且无污染搬运任务 |
| 老年护理与医疗 | 估2050年全球60岁以上人口达21亿(估);照护人力短缺为结构性问题 | 人形形态允许在为人设计的家庭环境中操作 |
| 危险环境 | 核退役、采矿、化工厂巡检 | 危险人体环境——远程操控或自主人形机器人取代人员暴露 |
成本路径 是关键解锁因素。目前商业人形机器人早期部署售价估$10万至$25万(估)。市场拐点要求将成本降至广泛商业应用所需的$3万至$5万(估)以下。Tesla最激进的目标是量产后每台Optimus低于$20,000(估)——低于美国仓库工人的年薪。
AI助力: 使Tesla FSD v12端到端神经网络成为可能的相同基础模型进展,正在推动灵巧操作学习。Google DeepMind RT-2、Figure的VLM集成、Tesla的端到端Optimus策略——这些架构方法正在融合,让机器人无需逐任务编程即可泛化学习新任务。
部署时间线:
- 2023–2024:原型演示
- 2025:在受控环境中首次商业部署
- 2026:商业爬坡开始(有限数量,特定应用)
- 2028–2030:预测首批大规模部署(估)
第二节——Tesla Optimus:将自动驾驶技术栈应用于人形机器人
Tesla Optimus是知名度最高、垂直整合程度最深的人形机器人计划。核心战略论点是:Tesla的FSD开发技术栈——视觉神经网络、Dojo训练算力、Tesla自研AI芯片、摄像头硬件——可直接迁移至人形操作。
| Optimus维度 | 现状 | 细节 | 商业爬坡指标 |
|---|---|---|---|
| 生产与部署(2026) | Tesla Optimus已在Tesla超级工厂内部部署,执行电池组装与质量管控任务;Elon Musk在财报会上设定2026年底累计5万至10万台目标;首批对外商业销售计划于2026年启动 | Optimus Gen 2(现行量产代):5英尺8英寸双足人形,估重约125磅(估),手部11个自由度,全身22 DOF;步速与手部灵活性较Gen 1提升;整体设计以致动器效率为核心进行重量优化 | 超级工厂部署 = Tesla以自身需求验证Optimus商业价值;若Optimus在Tesla内部工厂证明生产力,对外销售的商业案例即由Tesla自身用例所确立 |
| AI架构 | Optimus使用与FSD相同的端到端视觉神经网络:摄像头→神经网络→动作;FSD训练基础设施(Dojo超级计算机)+ FSD开发经验直接迁移至Optimus;Tesla通过录制人类示范并以模仿学习+强化学习训练策略 | Tesla从FSD到Optimus的迁移是真实的竞争优势:传感器系统(Tesla自研摄像头)、处理芯片(FSD芯片)与训练基础设施(Dojo)共用;Tesla AI训练能力的每次提升同时使FSD与Optimus受益 | FSD迁移至人形操作的迁移学习:两者均使用视觉→动作策略;基础架构相同,即便具体任务领域不同 |
| 制造成本轨迹 | Tesla目标量产后每台Optimus低于$20,000(估)(Musk财报会声明);当前成本显著更高(规模化生产前);Tesla制造专长(超级工厂量产、垂直整合)是降成本主路径 | Tesla的制造成本目标(每台Optimus $20K)是人形机器人业界最激进的;实现需要:(1)高量生产(年产10万台以上);(2)垂直整合(Tesla自研致动器、芯片、电池);(3)量产带来的学习曲线成本下降 | 每台$20K时,Optimus售价低于美国仓库工人年劳动成本(估$3.5万至$4.5万/年);这是快速普及的经济门槛 |
| 灵活性与操作 | Optimus Gen 2手部:11个自由度,可比拟人手DOF;已演示夹取鸡蛋不破;已演示走线、分拣及基本组装任务;目前执行速度为人速或更慢 | 在多样操作任务中达到人类水准的灵活性,是所有人形机器人的核心技术挑战;Optimus手部设计具竞争力但尚未在精细操作中取得领先地位 | 灵活性是仓储与制造应用的瓶颈能力;目前Optimus可处理Tesla的电池组装任务,但尚未能广泛应对任意操作任务 |
| 对外销售与营收 | 截至2026年中,Tesla尚未报告Optimus对外营收;首批对Tesla以外客户的商业销售计划于2026年展开;对外销售定价未公开 | 对外Optimus销售将为Tesla创造新收入来源;以早期商业销售每台$5万至$10万(估)、目标5万台以上,规模化后Optimus对外年营收潜力达$25亿至$50亿以上(估) | 首批对外Optimus客户公告+交付将是重大Physical AI商业里程碑;截至2026年中尚未发生,是2026下半年的关键观察指标 |
| 竞争定位 | Tesla拥有最大规模内部部署(超级工厂)、最大AI训练基础设施(Dojo)、最低成本目标($20K)、最激进产量目标;但最令人信服的操作演示来自Figure AI,首批商业仓库部署来自Agility Digit | Tesla的规模与成本优势具结构性;若Optimus达成成本与产量目标,将成为主导人形机器人平台;风险在于执行力:2026年达到5万至10万台需要尚未被验证的量产爬坡 | Optimus量产爬坡(实际交付量vs目标)是追踪Tesla人形机器人地位的核心KPI |
第三节——竞争格局:主要挑战者
| 公司 | 平台 | 融资/支持 | 商业现状 | 核心差异化 |
|---|---|---|---|---|
| Boston Dynamics(Atlas电动版) | Atlas电动人形机器人:2024年发布,取代液压版Atlas;双足,5英尺10英寸,估重约154磅(估);卓越移动性与杂技动作;Spot四足机器人展现BD的商业化能力 | 现代汽车集团持有(2021年以估$11亿收购);Spot机器人已有销售收入;Stretch仓库物流机器人 | Atlas电动版:研发+早期商业探索;现代/起亚汽车工厂是目标部署客户;尚未广泛商业化;Spot已有商业成功(估售出1,000台以上) | 无与伦比的移动性与杂技动作;现代汽车制造为首批目标客户;Boston Dynamics逾30年品牌认知 |
| Figure AI | Figure 02:5英尺6英寸,70公斤双足人形;16 DOF手部;集成OpenAI多模态VLM用于自然语言任务指令;在南卡罗来纳州BMW工厂部署 | 2024年完成$6.75亿以上融资:微软、OpenAI、NVIDIA、亚马逊、英特尔、LG Innotek;融资后估值$26亿以上(估) | 商业部署:与BMW合作执行汽车工厂地板任务(车身间装配、零件搬运);BMW = 人形机器人领域首个商业规模汽车客户 | OpenAI VLM集成实现自然语言任务指令;BMW汽车合作为核心商业客户;业界最佳操作演示 |
| Agility Robotics(Digit) | Digit:5英尺9英寸,约65公斤;腿部+手臂+躯干人形;专为仓库物流设计;周转箱搬运、货架操作 | 亚马逊持有(2023年收购);目标部署在亚马逊物流中心 | 商业部署:亚马逊物流中心使用Digit执行周转箱搬运;这是首台在实际仓库运营中商业规模部署的人形机器人——领先Optimus对外销售 | 首批商业仓库人形机器人部署(领先所有竞争者);亚马逊75万名以上物流中心员工为自带需求;从零为仓库任务设计 |
| 1X Technologies(NEO) | NEO:双足人形;EV1:轮式人形;聚焦家庭服务+安保应用 | 融资$1亿以上;与OpenAI合作(OpenAI最早的机器人投资之一) | 早期商业:有限部署;EV1轮式平台用于安保巡逻 | 最早阶段的OpenAI AI集成;聚焦家庭+安保应用(有别于仓库/工厂) |
| Unitree Robotics(G1/H1) | G1:4英尺6英寸双足,估售价$16,000(估)——目前市场最低价商业人形机器人;H1:5英尺10英寸研究/工业型,估$90,000(估) | 中国制造商;获大量中国VC支持;全球研究机构出口销售持续增长 | G1已向全球研究机构+早期商业客户销售;尚未在生产工厂场景规模化部署;出口销售活跃 | 价格:G1估$16,000(估)是市场上迄今最平价的人形机器人;以成本威胁美国/欧盟制造商;中国制造效率与政府支持 |
第四节——人形机器人竞赛的关键技术战场
| 技术维度 | 目前领先者 | Tesla Optimus定位 | 2028展望 |
|---|---|---|---|
| 灵巧操作 | Figure AI(Figure 02 VLM+手部设计展示最佳操作演示);Agility Robotics(Digit专为仓库搬运任务设计) | Optimus Gen 2手部(11 DOF)具竞争力但未取得精细操作领先地位;Tesla视频展示有竞争力但非业界领先的灵活性 | 随着模仿学习+VLM基础模型提升,各平台操作能力将趋近;2028年差距缩小 |
| AI通用任务学习 | Figure AI(OpenAI VLM集成:自然语言指令+视觉场景理解→动作);Boston Dynamics(自有ML用于运动控制) | Tesla端到端FSD衍生策略学习与OpenAI VLM集成在架构上具竞争力;Dojo训练算力是人形机器人领域最大 | 基础模型集成(VLM+Physical AI策略)将趋近;Tesla架构与Figure/OpenAI架构将从不同路径达到相似能力 |
| 运动与移动性 | Boston Dynamics(Atlas电动版):无与伦比的动态移动性(双足奔跑、后空翻、多地形);未为商业量产优化 | Tesla Optimus:稳定双足行走;针对工厂地板优化(平坦地面、适中地形);以商业部署为导向而非竞技型 | 商业人形机器人将趋近”稳定可靠”的运动方式;Boston Dynamics竞技优势对野外机器人有利,对仓库/工厂无优先性 |
| 制造成本 | Unitree(G1估$16,000):最低商业成本;Tesla(目标$20,000量产):全尺寸人形平台中最激进的大众市场成本目标 | Tesla量产后$20K目标是人形机器人业界最重要的成本里程碑;实现需要人形机器人专用致动器与零件的超级工厂级量产 | 成本将是2028–2030商业爬坡的决定性竞争维度;最先在规模化下达到$20K–$30K的平台将主导仓库/工厂市场 |
| 商业规模化部署 | Agility Robotics Digit(亚马逊物流):首台在生产性商业仓库部署的人形机器人;Figure AI(BMW):首台进入汽车生产的人形机器人;Tesla Optimus(超级工厂):单一公司最大规模内部部署 | Tesla Optimus拥有任何单一公司最大规模的企业部署,但属于内部使用(非对外商业销售) | 对外商业销售+生产性部署(非内部使用、非演示)将是2028年的决定性指标;各平台竞相获取首批大型外部客户 |
| 垂直整合 | Tesla:垂直整合程度最高(Tesla自研摄像头、芯片、电池、致动器、训练基础设施);其他公司更依赖外部供应商 | Tesla的垂直整合是业界最先进;自有AI芯片+训练算力+摄像头系统+致动器设计=最全面的技术栈 | 垂直整合优势随时间复利累积:Tesla FSD芯片+Dojo训练的改进同时提升Optimus;此结构优势持续扩大而非收窄 |
第五节——人形机器人基准评分与爬坡指数
| 维度 | Tesla Optimus | Figure AI | Agility Digit | Boston Dynamics Atlas | Unitree G1/H1 | 2028展望 |
|---|---|---|---|---|---|---|
| 商业现状 | 超级工厂内部部署;首批对外销售计划2026年 | BMW汽车工厂商业部署 | 亚马逊物流中心商业部署(首台仓库规模人形机器人) | 早期商业+研发;现代工厂为目标 | 全球G1研究/早期商业销售 | 五个平台2028年均进入商业部署;规模差异巨大 |
| 成本目标 | 量产后$20K(估)——最激进大众市场目标 | 未公开;估当前$10万以上(估) | 亚马逊内部成本(未商业化公开) | 未公开;估$15万以上(估)(研究/展示平台) | G1:估$16K(估)(现可商购);H1:估$9万(估) | 商业平台成本将在2028年趋近$20K–$50K |
| AI架构 | FSD衍生端到端视觉→动作策略;Dojo训练算力 | OpenAI VLM集成:自然语言→视觉→动作 | 亚马逊内部AI;仓库任务专用运动+操作 | 自有ML运动控制;Boston Dynamics逾30年动态专长 | 中国AI实验室+自有运动模型 | 均趋向VLM+Physical策略;基础模型集成成为标准 |
| 量产 | 2026目标5万至10万台(估);实际交付量未公开;远超任何竞争者的声明量产目标 | BMW部署估计数十至低于百台(估) | 亚马逊部署估计数百台(估) | 数十台(主要用于研发+现代开发) | 全球G1售出数千台(目前最大商业销量) | 直到Tesla Optimus爬坡兑现前,Unitree可能在量上领先;Figure+Digit随各自核心客户增长 |
| 战略支持 | Tesla(市值估约$1.3兆);Dojo算力;FSD数据飞轮 | 微软、OpenAI、NVIDIA、亚马逊、英特尔($6.75亿以上融资);估值$26亿以上(估) | 亚马逊(AWS+物流规模+75万名以上仓库员工为自带需求) | 现代汽车集团(汽车制造为核心市场) | 中国政府产业政策+VC;全球研究机构销售 | 五个平台均获充裕资金;Tesla资源最为雄厚 |
整体评判: 人形机器人竞赛是继机器人出租车与AV货运之后,Physical AI的下一个重大商业前沿。Tesla Optimus拥有最激进的产量与成本目标、最大的训练算力基础设施、最深的垂直整合——但Agility Robotics Digit(亚马逊)已率先实现商业上最重要的事:在实际生产性商业运营中部署并创造真实生产力。Figure AI拥有最令人印象深刻的AI演示(OpenAI VLM+BMW合作)。Unitree拥有最具竞争力的价格。2028年的赢家将由谁能同时跨越两个门槛决定:成本低于$30,000且商业生产部署(非内部使用、非演示)超过10,000台。按此标准,Tesla是最可能的候选者——但Optimus量产爬坡的执行风险真实存在。
备注: 本文所有产量数据、机台数量、成本估算、竞争评估与市场规模估计,均为基于截至2026年中公开公司公告、财报会声明、新闻报道与分析师研究的方向性估算。数据不确定或为估算者,数据标注”(估)“,应视为方向性而非经确认的确定数据。本文不构成投资建议。
来源
- Tesla Optimus最新进展 — Tesla AI ↗
- Figure AI获$675M融资并宣布BMW合作 — Figure AI ↗
- Agility Robotics Digit进驻亚马逊 — 亚马逊新闻室 ↗
- Boston Dynamics电动Atlas人形机器人 — Boston Dynamics ↗