两项具身智能成果亮相WAIC,让机器人行动更自如

07-28 06:51

7月27日,2025世界人工智能大会(WAIC)进入第二天,具身智能成为大会焦点。当天,商汤科技、智元机器人分别发布“悟能”具身智能平台和面向真实世界双臂机器人的世界模型开源平台GE。


“悟能”具身智能平台:让机器人“闻令而动”


在“大爱无疆·模塑未来”WAIC 2025大模型论坛上,商汤科技推出“悟能”具身智能平台。该平台以商汤具身世界模型为核心,借助商汤大装置提供的端侧和云侧算力,能为机器人、智能设备赋予强大的感知、视觉导航及多模态交互能力,推动智能终端向更高层次的自主化与智能化发展。它可赋能各类终端硬件,使机器人具备对世界万物的感知理解能力,还能嵌入端侧芯片,场景适配性强。


在7月27日召开的“大爱无疆·模塑未来”WAIC 2025大模型论坛上,商汤科技发布“悟能”具身智能平台。 本文图均为 受访者供图


论坛现场,商汤科技董事长兼首席执行官徐立展示了搭载具身世界引擎的人形机器人讲解PPT的效果。该机器人语言自然、幽默,不仅能自动翻页,还能回答问题并进行阶段性小结。


商汤表示,商汤具身世界模型可构建面向人、物、场的4D真实世界。用户只需输入如“在厨房区域的架子上找东西”“进入娱乐室、向右转,然后打开通往院子的门”等简单提示词,具身世界模型就能自主生成位姿、动作骨架和指令,真正做到“闻令而动”。徐立称,商汤希望“悟能”具身智能平台助力具身智能企业实现与现实世界交互的梦想。


智元发布双臂机器人世界模型开源平台


同样在7月27日,由智元机器人主办的“智启具身论坛”在上海世博展览馆举行,众多全球具身智能领域的专家汇聚一堂,聚焦机器人基础模型泛化、高性能操控等关键方向展开讨论。


智元机器人合伙人&具身业务部总裁姚卯青介绍,智元通过自建专业数采工厂,形成全球最大数据集AgiBot World并开源。同时,智元发布了行业首个通用具身基座模型——启元大模型,具备“一脑多形”能力,可适配其他异构机器人本体。在场景应用方面,智元机器人凭借“机器人+具身模型”技术,已在工业制造、仓储物流、电力巡检、交互引导四大场景取得突破性进展。


论坛上,姚卯青代表智元机器人发布了行业首个面向真实世界双臂机器人的世界模型开源平台“Genie Envisioner”(简称GE)。该平台融合预测、控制、评测三大核心能力,为机器人从“看见”到“行动”提供了一体化解决方案。


2025世界人工智能大会智元机器人展台。


GE平台的核心是多视角视频扩散模型GE - Base,以AgiBot - World - Beta数据集为基础,利用大量头部与双臂腕同步视频流,捕捉机器人操作任务中的关键信息。160M参数级别的动作解码器GE - Act,可帮助机器人实现从视觉感知到动作执行的跨模态迁移。在真实平台验证中,搭载GE - Act的机器人完成多项任务,成功率远超行业平均水平。GE平台的发布,标志着机器人从被动执行向主动“想象—验证—行动”转变,将推动智能制造与服务机器人的应用。


姚卯青透露,智元的精灵系列下一代机器人本体——精灵G2即将发布。与上一代相比,G2在运动精度、场景适配性上全面提升,具备原生数采能力,能适应多元场景,拓宽具身智能的应用范围。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com