新一代赛博佣人,这个机器人会帮你做各种家务。
不知你是否曾经有过这样的想法:「甩手掌柜」,把所有的家务都交给家务机器人。老实说,这是科幻作品中常见的场景。
归根结底,谁不想拥有一个任劳任怨的人?「赛博佣人」呢?
创业公司来自旧金山。Physical Intelligence(物理智能,简称 Pi)我们正致力于帮助每个人实现这个梦想。最近,这家公司展示了一个「接受前所未有的数据量训练。」人工智能模型,它已经学会了做各种有用的家务。

Physical Intelligence 发布的视频显示,他们的机器人可以非常灵巧地完成各种家务,包括但不限于:桌面上摆满了水杯和盘子:

将咖啡豆从袋子里舀入机器:

纸箱甚至可以组装:

最令人印象深刻的是,他们能把烘干机里的衣服拿出来,折叠整齐。。两个机械臂就像人的双手一样,配合熟练:


有意思的是,该公司开发的这一算法有时会表现出一些。类似于人的爱好,比如晃动 T t恤和短裤,让它们平整地铺开。
Physical Intelligence 首席执行官豪斯曼(Hausman)指出折叠衣服对机器人来说特别具有挑战性,因为它涉及到处理各种不可预测的变形和皱纹的软物体,所以需要大量的物理世界一般智能。
同时,他也表示,目前的算法并不稳定。就像 AI 有时候聊天机器人也会「崩溃」一样,这些「家务机器人」有时候会做出一些不可思议的行为:比如会把鸡蛋装满装不下的纸箱,强制关闭纸箱;有一次,机器人在装东西的时候,突然把盒子从桌子上扔了下来。

Physical Intelligence 的 CEO 豪斯曼. 图片来自:The Information
尽管算法并不完美, Physical Intelligence 至少是未来「通用家务机器人」提供了一个概率。
不过,豪斯曼的野心远不止于此。「家务」只是其中一个用途,「通用」正是公司的豪情壮志:
我们的目标是通过一个通用的模型将人工智能带入物理世界。基本上,对于任何应用程序来说,这个模型都可以为任何机器人或其他物理设备增加动力。
图片来自:maginative
也就是说,Physical Intelligence 目的是创建一个类似于大型语言模型的模型(LLMs)的物理学世界模型,这是一种「通用人工智能模型」。
通过训练大量的机器人数据,他们将构建语言模型的技术与控制和引导机器的自有方法相结合。豪斯曼说,他们的方法「非常通用」,可利用不同机器人类型的数据进行训练,类似于每个人训练语言模型的方法。
在过去的八个月里,公司开发了它「基础模型」,名叫 π0(pi-zero)。π0 公司还经常让人类远程控制机器人,通过使用各种机器人执行各种家务的数据进行培训,从而提供必要的教学。
Physical Intelligence 加州大学伯克利分校副教授谢尔盖·莱文的创始人之一。(Sergey Levine)表示,他们受过训练与以往任何机器人模型相比,信息量要大得多,「幅度特别大」。

谢尔盖·莱文(Sergey Levine). 图片来自:YouTube
比如其他公司 Figure AI 和特斯拉一样,他们致力于构建仿人机器人, Covariant 这类公司开发的通用机器人软件不一样,Pi 旨在建立一般机器人硬件软件都能使用。。
对于这一点,知名的科技投资者, Pi 拉奇·格鲁姆的创始人之一(Lachy Groom)表示「是我们的大脑,而非我们的硬件,使人类变得有趣。终极通用主义者」。

特斯拉研究开发的名字「Optimus」人形机器人
Physical Intelligence 与大型语言模型训练中可用的文本数据相比,面临的一个关键挑战是,用于训练的机器人数据有限。
所以,企业必须生成自己的数据,并考虑提高从更有限数据集中学习的技能。
实际上,为了发展 π0,公司整合了所谓的所谓整合。视觉语言模型(训练图像和文字)和扩散建模(从 AI 在图像生成中借鉴的技术)更通用的学习。
一切,都在为之「通用」而努力。
对于 Physical Intelligence 莱文对现状和未来的看法是:
为 为了使机器人能够承担人类要求他们做的任何杂务,这种学习需要大幅度扩大。 尽管还有很长的路要走,但是我们有些东西你可以认为是基本框架,未来的事情可以从中看出。
但是与此同时,莱文是对的 Pi 发展充满信心。他指出,在现实世界中使用机器人的最大障碍是充分的迹象「如今已能解决问题」。
本文来自微信微信官方账号“APPSO作者:范津瑞,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




