通研院新框架赋能人形机器人 统一策略掌握极限动作成功率超90%
2026年春晚舞台上,人形机器人再次吸引众人目光。
对比去年略显生硬的扭秧歌表演,宇树人形机器人如今已能流畅完成武术、双节棍、醉拳等一系列动作,丝滑的操作让全网惊叹,也让大众切实感受到人形机器人技术的飞速进步。

随着人形机器人运动能力不断突破,支撑这些极限动作的关键技术也逐渐进入公众视野。
近日,北京通用人工智能研究院(简称“通研院”)发布并开源新一代人形机器人通用运动框架OmniXtreme(通极)。
该框架使机器人能通过一套统一策略完成后空翻、托马斯全旋、武术踢击等多种高动态动作,在真实机器人上的成功率超过90%。
这项成果提出了全新的训练路径:不再针对每个动作单独训练策略,而是通过生成式模型与强化学习相结合的方式,让机器人掌握一整类极限运动能力。
通研院研究员贾宝雄在接受智东西采访时表示:“过去许多机器人控制模型都需要针对单个动作反复调整参数。OmniXtreme的核心目标,就是找到一种统一策略,让机器人能够学习并泛化不同类型的极限动作。”
01.从“蹒跚学步”到“动作达人”,人形机器人运动能力的飞跃
人形机器人的这波热度,可以追溯到2024年北京大学春季运动会。当时,北京大学智能学院学生方阵中的机器人因步态缓慢、动作僵硬,被网友调侃为“太奶机器人”。

2024年4月,北京大学春季运动会智能学院学生方阵
此后两年,人形机器人的运动控制能力快速迭代升级。
2025年蛇年春晚,机器人已能完成扭秧歌等舞蹈动作,但整体动作仍偏机械。同年8月,在首届世界人形机器人运动会上,通研院团队凭借融合探戈、太极、恰恰的舞蹈表演,获得单机舞蹈比赛冠军。

2025年8月,通研院在首届世界人形机器人运动会上获得单机舞蹈比赛冠军
到2026年春晚,《武bot》节目中的机器人完成了武术动作,运动能力实现进一步突破。
在贾宝雄看来,这一变化背后是“技术破壁”,他用“破次元壁”来形容这一过程:“以前机器人更多停留在实验室或科研展示中,很少有人会觉得它能达到现在的水平。但随着算法和硬件的快速迭代,我们逐渐接受机器人不仅能跳舞,还能完成很多高难度动作。”
02.一套算法搞定极限动作,OmniXtreme破解“多动作控制难题”
让机器人完成翻腾、倒立、霹雳舞等高动态动作,一直是机器人控制领域的难题。
近年来,强化学习成为主流技术路线。通过大规模仿真训练,机器人可以逐步学会复杂动作。但当动作种类增多时,系统往往会出现新问题——动作越多,控制精度越下降。
OmniXtreme正是为解决这一问题而生,该框架采用两阶段学习机制。
第一阶段,研究团队先为不同动作训练多个“专家策略”,再利用生成式建模方法,将这些专家能力融合为统一策略。这一过程借鉴了生成模型中的Flow Matching技术,使系统能够学习“动作分布”,而非简单的动作映射。
贾宝雄用一个类比解释道:“可以把它理解为先让机器人模仿很多顶级舞者的动作,然后再在此基础上通过强化学习不断调整,使其能在真实环境中稳定完成这些动作。”
相比传统强化学习需要不断通过奖励函数逼近目标动作,生成式模型在初始阶段就能建立更完整的动作表达,因此在多动作场景下具有更好的泛化能力。
03.突破Sim2Real瓶颈,人形机器人在真实世界实现翻跟头
在人形机器人研究中,Sim2Real(仿真到真实)一直是核心挑战。很多动作在仿真环境中可以完成,但部署到真实机器人时往往会失败。
OmniXtreme的第二阶段训练,重点解决的就是这一问题。研究团队在强化学习过程中加入了大量真实物理因素,例如:
•电机扭矩—速度关系建模
•制动功率限制
•电池能量传递模型
•更真实的执行器物理模拟
这些设计显著提升了策略在真实机器人上的可执行性。贾宝雄告诉智东西,过去很多团队在部署时需要通过网线连接主机进行控制,而OmniXtreme的目标是实现完全上机运行。
“真正的难点不只是算法本身,还包括模型推理效率和硬件适配。如果这些问题得到解决,再加上稳定的控制模型,就能实现现在这种真实部署效果。”实验结果显示,在真实机器人测试中,该方法在多种高动态动作任务上的成功率超过90%。

真机部署成功率
在不少人看来,翻跟头、跳舞等动作更像“炫技”,似乎与实际应用关系不大。对此,贾宝雄解释道:“从科研角度来说,如果机器人能完成这些极限动作,那么在人类能胜任的工作场景中,它通常也能完成任务。”
他将这一过程比作“先强身健体”,并补充说:“如果机器人能够掌握人类极限运动的控制能力,那么在工业、服务等场景中的任务执行,其实会更容易。”
因此,极限运动能力往往被视为机器人控制能力的“上限测试”。
04.企业造本体、研究院研“大脑”,人形机器人研发路径清晰呈现
值得一提的是,这项研究的主要作者均来自北京通用人工智能研究院通用人工智能协同攻关合作体人才培养计划(简称“通计划”)的联培博士生。
在研发模式上,通研院采用分工协作的路径:企业负责机器人本体,研究院负责核心智能算法。例如,通研院与宇树科技合作建设具身智能联合实验室开展协同研究。

2025年9月,通研院在国际机器人学习大会CoRL获杰出论文奖
贾宝雄介绍,很多技术突破其实来自双方工程师的交流,“有些仿真和现实之间的差距,是我们和硬件工程师一起讨论后才发现的。”
在产业化方面,通研院还孵化了具身智能创业公司德塔智能(Delta Intelligence)。德塔智能借助通研院积累的技术能力,在工业制造、巡检、家居等场景中探索人形机器人的实际应用。目前相关技术已在电网巡检、汽车制造等场景开展测试。
支撑这套路径的还有通研院的人才机制。OmniXtreme的研发团队主要来自通研院“通计划”博士生培养项目。该项目由通研院联合全国多所高校开展,目前已培养300余名人工智能领域博士生。
贾宝雄介绍,团队目前约有10至20名博士生参与人形机器人研究,“很多学生既在研究院做算法,也会去企业和工程师一起解决真实问题。”
05.结语:让机器人真正走进现实是下一步目标
在贾宝雄看来,人形机器人接下来有两个方向会同步推进。
一方面,技术仍会继续挑战更高难度动作,例如跑酷、复杂环境运动等。另一方面,机器人也需要逐渐进入真实生活场景。
“未来机器人既可能像现在这样参与比赛,也可能成为日常生活中的助手,”他说。
当运动能力、感知能力和自主决策能力逐渐融合,人形机器人距离真正进入现实世界,也许只差最后一次“破壁”。
本文来自微信公众号“智东西”(ID:zhidxcom),作者:江宇,编辑:漠影,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




