机器人学校(中):你们说,这个作业是抄谁的?
在过去的50多年里,人形机器人的“缓慢发展”与以前非常相似。 AI。
深度学习的概念也早在几十年前就诞生了,但是直到 2009 年度斯坦福教授李飞飞发布图像数据集 ImageNet,科学家认识到数据对算法的重要性,深入学习才拉开了变革和快速发展的序幕。

但是在具体智能领域,每个人都在努力创造“ImageNet时刻”。近几年来,业界多次喊出“ImageNet时刻来了”,但是并没有真正加快整个行业的发展。没有高质量的训练数据,ChatGPT时刻、iPhone时刻,即产品的突破点,都远未触及。
为了解决数据问题,研究机构、政府部门、服务提供商、自身制造商等都在其中发挥着重要作用。
开源数据集:聚流成海
在 ChatGPT 科学家们意识到,数据的“大力创造奇迹”规则仍然非常有用。如果每个机器人,甚至每个机器人,每个场景都独立使用一套数据,训练一套模型,智能化的进展显然会慢很多。

2023 年 10 月,谷歌 DeepMind 联合 21 收集了一个机构 22 不同类型的机器人数据,并且开源了这个数据集 Open X-Embodiment。
包括这些数据 527 技能(对应) 16 一万个任务),100 数以万计的真实机器人轨迹。DeepMind 通用机器人模型在这些数据上仍然受到训练 RT-X。
但 Open X-Embodiment 是由 60 由现有机器人数据构建的子数据在数据类型、数据质量和场景多样性上参差不齐,并不是特别“好用”。随后,国内外多家机构也开源了自己的智能数据集。
深圳鹏城实验室于2024年8月与南方科技大学、中山大学联合发布并开源数据 ARIO(All Robots In One)。ARIO 对于具体大数据,有一套标准格式, 258 一个场景序列,32 万只任务、300 一万个例子,在数据统一、数据质量、数据规模、情景丰富度等方面又向前迈进了一步。

南方的研究机构很努力,北方也不落后。由优必选、京城机电、小米机器人、亦庄机器人等单位联合成立的国家建设智能机器人创新中心(位于北京),开源数据集也与北京大学、智源研究院联合发布。 RoboMIND。
除这些研究机构外,行业内领先的机器人制造商也为开源数据做出了贡献。
由“超级天才稚晖君”创建的智元机器人于2024年12月发布开源数据集 AgiBot World,来自100个机器人的100多万条轨迹,覆盖了5个领域的100多个真实场景。因为所有的数据都来自于1000多平方米训练场中智源机器人的真机操作,所以数据具有超高的数据质量和统一性。—— 一种比较是,ARIO 大部分数据来自开源和模拟。
此外,AgiBot World 有近 90% 的任务为 30s 上述“长程任务”,很多都是由多个动作组成的“复杂任务”, Open X-Embodiment 则有 78% 是 5s 简单的任务在内部。AgiBot World 不限于实验室环境,场景范围也扩大到家庭、餐饮、工业、超市、办公室等。

智元机器人于2025年2月25日进一步开源 AgiBot Digital World 模拟数据集。
和智元机器人一样,宇树机器人也开源了它。 G1 机器人操作数据。
数据对于具体智能的训练尤为重要,但是不管开源与否都是不同厂商的选择。波士顿动力的动力 Atlas,还有特斯拉的 Optimus,他们的数据和代码从来没有公开过。
与大语言模型在互联网上拥有“取之不尽”的庞大训练数据相比,拥有数百万智能开源数据显得微不足道。然而,它总是聚集在大海中,每个研究机构和技术制造商的开源数据集仍然非常有价值和不可或缺。
真机训练:再贵的学费也要交
真机训练在现实环境中进行,仍然是具体智能获取数据的重要来源。
上一集我们讲过,人形机器人真机训练主要靠人类动作捕捉和人类遥操作。然而,许多服务提供商诞生于各个领域和环节,成为这种“淘金热”中的“卖铲人”。

诺亦腾是一家动作捕捉企业,其前十年的业务包括电影特效、游戏互动、体育科学、虚拟主播(数字人)、VR等方向。2023 从2008年下半年开始,随着智能人气的不断提高,机器人领域的合作数量急剧增加。诺亦腾合作过的厂商包括智源机器人、千寻智能、Tokyo Robotics 等。
在机器人遥操作领域,最重要的是通过优化算法来减少“Sim2”Real Gap”,让人类的动作更好地体现在机器人本体上。它还是动捕厂商和自身厂商需要共同磨合和训练的地方。
例如,诺亦腾和智源机器人共同改进了惯性动作捕捉算法;另一方面,机器视觉公司凌云光和宇数科技共同开发了光学动作捕捉系统 FZMotion,能准确捕捉人体姿势和运动轨迹,并直接映射到宇树。 H1 本体上的机器人—— H1 这种算法很可能是用来在春晚摇手帕的舞蹈训练的。
除了自身的捕捉和遥控操作,一些服务提供商还专门提供局部数据收集和遥控操作的解决方案,如尾端抓夹和机器人手臂。此外,类似于智能驾驶的发展轨迹,人形机器人的数据采集也包括相应的数据质量检验、数据标记和数据存储服务提供商——这些共同构成了智能真机数据采集的生态链。
为了给机器人一个更好的“学习氛围”,机器人制造商中的“氪金大佬”将建立自己的大型真机训练场。智源机器人建立了世界上最大的机器人数据生产和采集工厂,100个机器人跟随人类的“老师”学习如何冲咖啡、熨衣服、扫码结账等。他们应该通过数百个数据学习这样一项复杂的技能。

国家部门和地方政府也在建设自己的机器人训练场。中国第一个“异构人形机器人训练场”,由国家和地方共同建设的人形机器人创新中心(位于上海,以下简称“国家和地方中心”)最近投入使用。来自智元、傅利叶、开普勒等10多家企业的100多个机器人在这里一起“上学”,在特殊、制造、民生服务三个领域向人类教师学习各种技能。
国家领土中心首席科学家解释说,“异构”是指不同厂家的机器人在形态、功能、技术结构、应用等方面存在差异。“通过将不同厂家的异构机器人放在同一个空间运行,AI可以意识到它生活在多样化的物理世界中,从而建立客观认知,发展辨别是非的能力。”
作为国家创新中心,除了搭建真机训练场,更重要的任务是统一和规范智能机器人的数据标准。2025 2008年,这个训练场有望收集。 1000 为了支持机器人基础模型的进化迭代,一万个优质机器人实体数据。
模拟训练:现实界限无限扩展
虽然真机数据收集质量最高,但成本最高,很难解决机器人“泛化”的问题。许多自己的制造商和服务提供商也在探索模拟数据收集和训练解决方案。
比如上面提到的智元科技 AgiBot Digital World,事实上,它是一个开源模拟框架。除了模拟数据集,还包括专家轨迹生成机制、模型评估工具等。,可以实现一系列模拟服务。

在机器人模拟领域,有许多完善的模拟平台供机器人制造商建造物体和场景。然而,随着近一两年智能化的普及,国内外服务提供商也推出了更灵活、更智能的模拟解决方案。
空间智能公司群核技术有一个比较知名的产品叫“酷家乐”。群核技术的主要业务是通过酷家乐在家装领域提供设计和渲染服务,然后为人形机器人提供空间数据。设计师和业主可以在平台上设计自己喜欢的房间装修,完成逼真的渲染。
酷家乐在装修领域积累了十多年的模型数据,如今已成为人形机器人最好的训练“养分”。
有群核空间智能平台 3.6 亿次 3D 模拟物体模型具有密度、摩擦力、弹性、阻尼等真实的物理性质。以前,设计师用这个平台设计人类的家;现在,科学家也可以用这个平台来设计机器人的工作环境——并确保正确的物理。

在机器人模拟训练中,“物理正确”是非常重要的一点, AI 暂时不能完美解决的难题。OpenAI 发布 Sora 当时,大家首先被“文生视频”强大的创作能力所震撼,但随后却发现, Sora 缺乏对物理规律的认识。牛顿的棺材板在其混乱的世界里砰砰作响。
对人形机器人而言,真机训练费用过高,而模拟训练则需要复杂的建模过程—— AI 只要能无限生成一个“赛博世界”。这个数字世界最好能像真实的物理世界一样运行。当人们在地上行走时,鸟儿在天空中飞翔,水在低处流动,球落入路面时会弹起,当光线碰到镜子时会反射...
那是世界模型。
今年英伟达 1 月 7 每天推出世界模型 Cosmos,基于物理世界的高度仿真的虚拟世界可以通过文本、图像或视频提醒产生。英伟达对此的定义是:“世界基本模型是一个工具,可以根据过去发生的事情和当前的变化来预测未来会发生什么。”

理想情况下,有 Cosmos,无人驾驶汽车可以根据各种天气下的路况进行判断,仓储机器人可以设计不同仓库的交货和运输路线,人形机器人可以对装满杂物的桌面进行分类和清理...这一切都可以在虚拟世界中完成,实时反馈,无需真机参与。
Sora 出生的时候也是如此 OpenAI 被定义为“世界模型”,这个领域伴随着智能或物理。 AI 发展越来越受到重视。李飞飞创造的 World Labs 正致力于构建大型世界模型(LWM),Mind谷歌Deep 也聘请了前 Sora 在世界模型的研究和开发中,核心成员。
也许在不久的将来,机器人可以在无限变化的“赛博世界”中杀死怪物,学习技能,然后回到物理世界进行实际操作,而不是在固定的“过程”上工作。听起来你真的想试试吗?
拥有“智能”的人形机器人就像一个刚出生的孩子。为了让它不仅能在新年期间限制亲戚朋友的表演,还能不断提高自己的实践能力和学习能力,成长真正的“智慧”,相关各方都“破碎了心”。
从国家到地方,再到各种服务提供商,以及自己的制造商,都在努力突破数据培训的难度,到达质变的“ImageNet时刻”。未来会发生什么?我们将在下一篇文章中谈论它。
本文来源于微信微信官方账号“果核”(ID:作者:冰点,编辑:卧虫,36氪经授权发布,Guokr42)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




