人形机器人应用场景加速拓展,数据瓶颈成关键制约

1天前
随着人形机器人应用场景不断扩大,数据正成为其发展的关键瓶颈。

从特斯拉Optimus进入工厂开启人形机器人工作潮流,到机器人结合脑机接口技术助力康复训练,再到上纬启元推出首款面向科研、创作及家庭用户的个人机器人Q1并开放“二次开发”能力,过去几年还多停留在实验室和舞台的人形机器人,如今应用边界正朝着更具持续性“作业”的场景拓展。



上纬启元Q1个人机器人身高仅80cm,针对科研、创作和家庭用户的“二次创作”需求设计


市场研究机构IDC的数据表明,2025年全球人形机器人市场将进入加速发展阶段,应用需求主要集中在文娱商演、科研教育、数据采集、导览导购、工业制造与仓储物流等领域。


然而,随着机器人从样机向规模化应用迈进,一个无法回避的现实问题逐渐凸显——数据正成为具身智能进一步发展的阻碍。


场景持续扩张,数据却远远滞后


和自动驾驶、通用大模型类似,具身智能也高度依赖数据驱动。但与前两者不同的是,机器人所需的数据不只是视觉和语言信息,还包括在真实物理世界中完成接触、施力、协同以及失败过程的完整记录。


实际情况是,这类数据十分稀缺。


一方面,真实机器人数据的采集成本高、周期长。每一次抓取、插入、搬运、双臂协作,都伴随着硬件磨损、人力投入和复杂标注;另一方面,仅依靠公开视频、仿真数据,难以体现第一人称视角下的真实操作意图,更无法覆盖触觉、接触力等关键物理维度的数据。


“如果只依靠视频,机器人永远学不会如何用力。”上海一位具身智能领域的研究人员向《科创板日报》记者坦言,这意味着在本体性能逐渐接近、硬件方案趋于一致的背景下,谁能率先积累高质量、可泛化的真实交互数据,谁就更有可能在接下来的阶段掌握模型与生态的话语权。


在此背景下,围绕数据、接口与标准的协作明显增多。近期,上海多家机器人企业与科研机构陆续发布或推进数据集建设。


国地中心还联合上海纬钛科技有限公司发布了全球首个大规模跨本体视触觉多模态数据集——白虎-VTouch。该数据集包含视触觉传感器数据、RGB-D数据、关节位姿等多模态信息,覆盖轮臂机器人、双足机器人及手持终端等多种本体构型,数据规模超过6万分钟,被业内认为是目前全球规模最大、模态最完整的视触觉真实交互数据集之一。


在国家地方共建人形机器人创新中心(以下简称“国地中心”)的训练场里,每天都有多台机器人同时执行多种真实场景的作业任务。



国地中心训练场中机器人进行典型场景的真机操作


据国地中心介绍,与以往“单任务、人工采集”的方式不同,白虎-VTouch采用了“矩阵式”任务构建思路,从双臂协同结构、原子操作类型、接触与触觉模式三个维度进行系统设计,覆盖家居、工业、餐饮、特种作业等四大类场景、380余种任务类型。


“数据并非越多越好”


关于数据的重要性,傅利叶CEO顾捷在近期接受《科创板日报》等媒体采访时给出了更为理性的判断。


顾捷表示,数据对机器人未来是否具备泛化能力至关重要,这一点在自动驾驶和早期大模型的发展中已被多次验证。但他同时强调,数据并非越多越好,质量、结构与来源同样关键。


“一项任务重复执行一千次甚至一万次,有时并没有太大价值。真正有价值的是在不同任务之间切换,并且包含成功与失败的完整过程。”顾捷指出。


他进一步认为,机器人数据不能仅依赖自身采集。互联网上的大量公开视频可以作为基础,但这些视频的局限在于缺乏第一人称视角,难以反映人类真实的操作意图。因此,还需要大量基于人类第一视角的人体运动和操作数据,并将其与机器人在真实环境中采集的本体数据相融合。


在傅利叶的规划中,理想的数据结构由三部分组成:公开视频作为大规模基础、第一人称人类交互数据作为核心补充、再加上小批量但高价值的机器人实际采集数据。即便后者占比不高,其绝对数量未来也可能达到亿级。



傅利叶GR-3机器人参与手眼康复训练


围绕数据展开的竞争,正朝着更底层的方向延伸。


一方面,多模态传感器、视触觉融合等技术不断成熟,使得真实物理交互数据的采集成为可能;另一方面,对数据格式、标注体系与训练标准的协同需求迅速上升。


近期,库帕思与它石智航宣布达成战略合作,明确提出将共同推进具身数据标准建设;傅利叶也联合多家医院、高校与科研机构,发起“脑机具身·数据引擎联合创新计划”,尝试在康复等场景中打通脑机接口与具身智能的数据闭环。


本文来自微信公众号“科创日报”,作者:张洋洋,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com