「我相信,机器人技术即将迎来与个人电脑诞生时相同的转折点——从少数人的玩具,变成改变所有人生活的工具。
—— 比尔·盖茨,《科学美国人》,2007年
一镜到底:两段视频,两种答案
最近,两段机器人视频在科技圈引发热议。
一段来自深圳。镜头没有剪辑,没有字幕提示,没有任何作弊暗示——逐际动力的全尺寸人形机器人 Oli 接到多个任务后,自主排列任务优先级,先将挡住文件的纸箱搬走,再取出快递包裹,顺手将地上的垃圾捡进垃圾桶。整个过程一气呵成,背后没有任何人工遥操作。
另一段来自硅谷。Figure 的机器人配备最新的 Helix 02 系统,在厨房里独立完成了一套长达四分钟的全流程任务:走到洗碗机旁,取出餐具,穿越厨房放置到位,再重新装载启动——61个连续的运动与操作动作,全程无人干预。
这两段视频,一中一美,分别展示了当前人形机器人最前沿的真实能力。它们都令人印象深刻,但路数截然不同。
与上一篇《机器人行业里,99%的公司都将是炮灰》的判断遥相呼应——能上镜的机器人很多,但既能想、又能动的,才算真正入局。这两家公司,恰恰都触碰到了这条生死线。
📺 参考视频链接
🎬 逐际动力 COSA 系统发布(B站)
Figure Helix 02 发布(官网)
拆解那段深圳视频:三件事,一次震动
普通观众看逐际动力的视频,觉得『哇,机器人好厉害』。行业内的人看,会意识到那三个动作背后,各自代表一个技术维度的突破。
▌ 动作一:自主排序任务
机器人接收到多个任务指令后,没有按照输入顺序执行,而是自主评估场景、调整优先级。先处理障碍物,再执行主任务。这意味着 Oli 内部有一个真正在运转的「任务规划层」,而不只是一个动作播放器。
▌ 动作二:移开箱子取快递
这是机器人领域的经典难题,叫做「工具使用与环境推理」。机器人需要理解:物体A挡住了物体B,要拿B必须先移A。 这种常识推理对人类不假思索,但对机器人意味着需要将语义理解与物理世界的空间推理真正打通。逐际动力的 COSA 系统,做到了。
▌ 动作三:顺手捡垃圾
这才是最耐人寻味的细节。捡垃圾不在任务列表里,是机器人「主动发现」并「自发处理」的。 这意味着 Oli 并非在执行剧本,而是在感知环境并做出行为决策——哪怕是计划外的。这是具身智能迈向真正「主动性」的一小步,也是区别于所有靠剧本驱动机器人的核心特征。
三个动作合在一起,就是 COSA 系统架构的完整映射:底层强化学习运控(小脑)× 语义感知(感觉)× 高阶认知规划(大脑)——逐际动力把「会动的机器」升级成了「会想的智能体」。
硅谷的答卷:Figure 与 Helix 02
如果说逐际动力的视频展示的是「智能」,那 Figure 的视频展示的是「协调」。
Helix 02 最令人瞩目的,是它将运动与操作真正融为一体。System 0 + System 1 + System 2 的三层架构,分别对应人体运动的「脊髓反射」「运动皮层」和「前额叶思考」:S0 用超过百万个仿真环境训练的神经网络,取代了原来十万行手写代码,让机器人的行走姿态前所未有地自然;S1 以200Hz的刷新率统一控制整个身体;S2 则理解语言指令、分配任务目标。
更值得注意的是 Figure 03 的硬件升级:掌心摄像头和指尖触觉传感器让机器人第一次能在不用眼睛的情况下感知手中物体的形态——提取药片、推注射器、从杂乱箱子中取出细小零件,这些对灵巧度的要求接近人类外科医生水准。
Figure 的数据策略同样值得关注。他们新建了专属的 Helix Lab,用以收集人类第一视角的真实动作数据,形成高质量训练语料库——不依赖单一外部大模型,走向完全自研的闭环。
公平地说,Figure 的硬件设计精度和感知能力仍处于全球顶尖。逐际动力 Oli 在灵巧操作的细腻程度上,距离 Helix 02 的指尖级控制仍有差距。这是一个需要承认的事实。
📊对决全景:一张表看清两家差距
对比维度 | 逐际动力 Oli | Figure Figure 03 |
核心AI系统 | COSA Agentic OS(自研全栈) | Helix 02 VLA(自研) |
架构理念 | 小脑+大脑一体化 | S0+S1+S2 三层架构 |
运动控制 | 强化学习,野外徒步级 | 神经网络全身控制,200Hz |
数据策略 | DreamActor 三元融合范式 | Helix Lab 人类遥操作 |
感知硬件 | 主动感知+全身移动操作 | 掌心摄像头+指尖触觉传感 |
商业路径 | IDS开发者生态+京东物流 | BMW等大客户+家用场景 |
量产进度 | Oli 已正式开售,起售15.8万元 | Figure 03 面向商业部署 |
中国机器人的真实位置:不必自大,也无需自卑
围绕这两段视频,网上出现了两种极端声音:一种是「中国机器人完胜Figure」,另一种是「深圳这家没名气,根本不能比」。这两种判断都失于草率。
▌ 逐际动力的真实优势
这家成立于2017年的深圳公司,是中国最早布局双足人形机器人的团队之一。在全球机器人运动控制领域,逐际动力有真正的技术积累——全球首次实现双足机器人野外徒步、复杂地形自适应,这些是被国际学术界认可的成果,不是营销噱头。
COSA 系统最大的架构创新,在于不依赖单一外部大模型,自建具身 Agentic OS,将感知、规划、运控三层融合为一体。这种设计意味着更低的延迟、更强的场景适应性,以及更不容易被「卡脖子」的技术底座。
商业层面,京东战略领投、全尺寸人形机器人 LimX Oli 已于2025年正式开售,三款版本起售价15.8万元,面向科研人员、开发者与系统集成商——逐际动力是中国少有的既有技术深度、又真正迈过「量产上市」门槛的机器人公司之一。
▌ Figure 的真实优势
Figure 同样不可小觑。作为硅谷最具代表性的人形机器人公司,Figure 03 的硬件设计精度和感知能力仍处于全球顶尖。Helix 02 展示的四分钟连续全自主任务,目前仍是人形机器人领域已公开演示中最高难度的长流程任务之一。
更重要的是,Figure 已经与 BMW 等制造业巨头展开商业合作,从实验室进入了真实产线。这是中国大多数人形机器人公司尚未跨越的鸿沟。
▌ 两者的共同挑战
无论是逐际动力还是 Figure,真正的家用机器人仍然是一个未竟的目标。家庭场景的混乱程度、任务的无限多样性、与人类共处的安全要求,都远超任何一段演示视频所呈现的边界。
回到那篇炮灰文的结论:决胜的不是某一段视频,而是谁能先把技术变成可量产、可落地、可持续迭代的产品体系。 这场比赛,才刚刚开始。
深圳,正在成为另一个坐标系
有一个视角容易被忽视:逐际动力选择做机器人「操作系统」这件事本身,比单一技术突破更具战略意义。
Figure 依靠精密硬件和超大规模数据训练建立优势,这条路需要大量资本持续投入,并高度依赖美国的芯片、算法和人才生态。逐际动力的路径则不同——用自研 OS 降低对外部依赖,用京东的物流场景积累真实数据,用 IDS 开发者生态建立护城河。 这是一条更适合中国产业环境的路。
中国有全球最大的快递市场、最密集的制造工厂、最复杂的家庭结构——这些都是训练「会干活的机器人」最好的温床,也是 Figure 难以复制的数据优势。
一段视频比不出胜负,但可以看清方向。逐际动力和 Figure,各自选择了一条与自身生态深度绑定的路。最终胜出的,一定是那个把技术与场景真正融合在一起的人。
写在最后
上篇我们说,99%的机器人公司是炮灰。有读者问:那剩下的1%,凭什么活?
答案藏在这两段视频里:不是最贵的硬件,不是最大的融资,而是真正能把「思考」和「行动」融为一体的能力。 逐际动力和 Figure,走的是两条不同的路,但指向同一个终点——一个能真正理解你、帮助你的机器人伙伴。
比尔·盖茨在2007年说,机器人会像个人电脑一样进入每一个家庭。如今,深圳和硅谷同时在做同一件事。关注我,这个系列会继续深挖——谁在真正打仗,谁在陪跑。下一篇见。