Skip to content
AI-Daily-Builder

2026-06-18 views

物理AI Tesla Optimus 2026 — FSD共用AI堆栈 vs 工业自动化:人形机器人基准测试与估值影响

Tesla Optimus 复用FSD的AI堆栈——视觉芯片、端到端训练。Waymo无人形机器人计划。Optimus可能成为Tesla到2035年最大物理AI业务。

概览

本文为物理AI基准测试系列第170篇。Tesla的物理AI战略建立在三大支柱上:FSD(汽车)、Cybercab(机器人出租车)及Optimus(人形机器人)。Waymo无人形机器人计划。本文将Tesla Optimus与现有工业自动化进行基准比较,分析与FSD共用AI堆栈的意义,并量化即使是适度的Optimus商业部署对Tesla估值的影响。


第一节 — Optimus:现状与量产进程

Tesla Optimus Gen 2于2023年底发布,是Gen 1概念验证机的量产意图继任者。截至2026年第二季度,Optimus主要部署于Tesla自家Gigafactory,执行特定重复性制造任务。

维度Q2 2026 现状备注
Optimus世代Optimus Gen 2(2023年底发布);估计步行速度5公里/小时(估);每手估计11个自由度(估);估计重量63公斤(估)Gen 1为概念验证;Gen 2为量产意图;Gen 3规格尚未公开
累计产量(估)截至2026年中估计已生产5,000至10,000台(估);主要部署于Tesla GigafactoryMusk的2025年目标为估计1,000台;2026年目标为50,000至100,000台;实际进度估计低于目标(估)
Gigafactory内部使用案例电池芯分类与质量检验;线束安装;零件运输;螺丝锁固任务特定重复任务——非通用操作;符合Optimus目前的灵巧度水平
外部商业供应截至2026年中供应有限(估);Tesla已讨论对其他制造商开放,但未确认重大外部部署(估)战略:先内部使用(零商业风险、收集训练数据),可靠性验证后再对外
目标售价Musk曾提及长期目标低于每台20,000美元;目前生产成本估计远高于此(估);尚未公布商业售价低于2万美元是Optimus在制造业劳动力竞争中具备经济竞争力的目标门槛
目前任务能力可靠执行特定训练任务;通用操作(抓取任意物品、对新任务序列进行推理)仍是研究挑战Optimus距离通用操作的差距,大于FSD距离完全自动驾驶的差距——操作问题比驾驶问题更难

第二节 — 与FSD共用AI堆栈的意义

关于Optimus最具分析价值的论点,是它复用了Tesla的FSD AI堆栈——这不仅是营销说辞,而是真实的工程架构。转移是真实的;问题在于FSD积累的能力有多少真正适用于机器人操作。

共用维度FSD能力Optimus应用转移价值
视觉感知8路环绕摄像头;实时物体检测与3D占用网络Optimus手部与头部摄像头;抓取物体检测;任务规划场景理解高:相同的摄像头感知架构;Optimus直接受益于FSD多年视觉感知研究
端到端神经网络FSD v12:从摄像头输入到驾驶指令的单一神经网络Optimus:从摄像头输入到马达指令的神经网络;架构上类似FSD高:FSD所倡导的端到端网络转型直接适用于机器人策略学习
训练数据管道FSD:来自600万辆车的60亿英里以上监督里程;数据引擎自动标记边缘案例Optimus:来自数千小时机器人工厂任务的数据;人工示范视频;远程操作数据中:数据管道架构可转移;但机器人操作数据远比驾驶数据难以收集
仿真基于Dojo的罕见驾驶场景仿真机器人操作任务的仿真到真实转移;仿真抓取物理、关节动态、环境变化中:仿真方法可转移;机器人物理仿真比驾驶仿真更难(接触丰富动态)
自研芯片(FSD芯片+Dojo)HW4芯片用于车载推理;Dojo用于训练Optimus使用相同的FSD推理芯片;受益于Dojo训练基础设施高:相同硬件,无需额外开发推理芯片
共用堆栈总结FSD到Optimus的转移真实且有意义:相同感知架构、相同端到端理念、相同训练基础设施、相同推理硬件。Optimus并非独立AI项目——它是将FSD应用于不同物理执行器(手臂和手,而非车轮和方向盘)。转移价值在感知最高,在操作最低:视觉转移良好;机器人特定灵巧度(抓取、精细动作)需要FSD无法提供的新数据与新训练。

第三节 — Optimus vs 工业机器人:竞争格局

工业机器人(ABB、Fanuc、KUKA)已在制造业规模化部署数十年,可靠性极高。人形机器人(Optimus、Figure、1X、Agility)主张人形外观能解锁工业机器人无法匹敌的灵活性。

比较维度Tesla Optimus传统工业机器人(ABB、Fanuc、KUKA)人形机器人竞争对手(Figure、1X、Agility)
外观形态人形(双足、双臂、双手);设计在人类环境中操作,无需改造工作场所固定臂机器人;安装于地板或天花板;需要专用工作单元;无法使用人类工具或工作空间人形(双足);与Tesla相同的外观理由
编程方式从示范和远程操作进行端到端AI策略学习;通过学习泛化到新任务每项任务需明确编程;需要机器人程序员;无法在未重新编程的情况下泛化类似的AI学习方法;成熟度低于Tesla
成本长期目标低于20,000美元(估)估计每臂25,000至200,000美元以上(依类型和能力而异)(估)尚未达到商业定价;估计最初与Tesla目标相当或更高(估)
灵活性高(理论上):可执行多种不同任务;可使用人类工具;在人类工作空间运作低:一台机器人等于一项任务;更换任务需要大量重新工程高(与Tesla相同的理由)
可靠性低于工业机器人(当前成熟度阶段);通用AI策略在新场景下会失败非常高:工业机器人在编程任务上达到99.9%以上的正常运行时间低于工业机器人;与Tesla目前成熟度相似
部署规模全球数千台(估);截至2026年中估计5,000至10,000台(估,主要为Tesla内部)全球部署数百万台工业机械臂;规模已验证数百至低千台;均处于早期阶段
Optimus主要优势无需改造工作单元;可与人类并肩工作;可使用现有人类工具;一台机器人处理多项任务这些优势均不具备:工业机器人需要专用工作空间相同优势;Tesla在AI堆栈上具有竞争优势
工业机器人主要优势在灵活性上无优势编程任务上99.9%以上可靠性;成熟供应链;完善维护生态系统;无AI不确定性在当前可靠性上无优势

第四节 — Optimus TAM与估值影响

TAM维度计算备注
全球制造业劳动成本全球制造业雇用估计3至4亿工人;全球平均制造业工资估计每年15,000至30,000美元(差异大:中国估计8千美元,美国4.5万美元以上)(估)成本低于2万美元的Optimus加上每年估计3,000至5,000美元维护费(估),在许多地区可与制造业工人竞争
Optimus渗透10%制造业(20年情景)3至4千万台Optimus,每台平均2万美元 = 估计6,000亿至8,000亿美元硬件收入(估,20年累计)加软件和服务收入这是理论上限,非近期预测
近期现实TAM(5年)若Optimus到2030年达到估计每年10万至50万台(估),售价2万至3万美元(估)= 估计每年20亿至150亿美元收入(估)此范围涵盖”有限商业成功”到”Tesla重要业务单元”
分析师估值归因ARK Invest及其他Tesla多头对Optimus估计每股300至1,000美元的Tesla价值(估);差异极大Optimus估值在目前成熟度水平下极具投机性
Tesla内部价值若Optimus执行10%的制造工人年工作量,每台每年可为Tesla节省估计4,500美元;10,000台内部 = 估计每年4,500万美元(估)目前内部部署主要用于数据收集
重新评估Optimus的条件第一个确认的大型外部客户大规模部署;宣布低于2万美元商业售价;公开可靠性指标;Figure-BMW合作证明了市场需求真实存在Tesla需要同等的外部验证里程碑

第五节 — Optimus基准计分卡

维度Tesla OptimusWaymo(无人形机器人)工业机器人优势
AI能力(当前)学习型;对训练任务泛化;在新场景下失败不适用规则型;在编程任务上极度可靠;零泛化能力Optimus在灵活性领先;工业机器人在可靠性领先
与AV的共用AI协同决定性:与FSD相同堆栈;共用芯片、训练基础设施、感知架构不适用 — Waymo仅做自动驾驶Tesla在AI协同上具决定性优势
量产规模(估)估计累计5,000至10,000台(估)不适用已部署数百万台工业机器人在当前规模上具决定性优势
成本经济性长期目标低于2万美元;目前成本估计远高于此(估)不适用工业臂估计2.5万至20万美元以上(估)Optimus目标具竞争力成本;尚未实现
商业牵引力仅限Tesla内部(估);无已确认的大型外部客户(估)不适用全球数百万台在商业使用中工业机器人在商业牵引力上具决定性优势
估值选择性公开市场中最大的物理AI选择性(分析师估计每股0至1,000美元范围)Waymo无Optimus敞口未作为独立公司上市Tesla在估值选择性上具决定性优势
总体判决Optimus是Tesla风险最高、回报最高的物理AI赌注。共用FSD AI堆栈是真正的优势——不仅是营销。但人形机器人操作在本质上比自动驾驶更难,从”可靠执行特定工厂任务”到”商业规模通用制造机器人”的差距,比FSD监督版到FSD无人驾驶版的差距更大。对投资者而言,Optimus是一个免费期权:如果成功,到2035年可能成为Tesla最大的业务。如果失败,FSD和Cybercab仍是核心物理AI故事。Waymo没有等效的选择性——它是纯自动驾驶业务。

所有标注(估)的数据均来自公司公开披露、分析师估计及行业基准。本文为物理AI基准测试系列第170篇。


来源

标签

请喝咖啡