获得贝索斯投资的4亿美元融资,该公司用于建造机器人。GPT-4”
在以往的AI创新趋势中,机器人创新将受益,AI热潮也将受益。但目前大部分都是专门的机器人,这些机器人的智能也是某个领域的专属智能。这样做的局限性是R&D成果不能重用,机器人使用的模型和硬件只适用于一个小领域。
近来,一种叫做Physicalalal的通用机器人大脑原型诞生。 Intelligence机器人公司培训了一家名为Inteligence的机器人公司π(0)的基本的通用机器人模型,其智能基本适用于任何机器人应用。这就是说,在此类通用模型成熟后,再开发某个专有领域的机器人,至少在“大脑”部分,只需用行业数据进行微调即可。正如软件创业者想要在某一细分领域创业一样,只需微调GPT-4即可。
Physical 在2024年,Intelligence获得了2轮融资,3月份,Thrive Capital投资了7000万美元的种子轮融资,Khosla Ventures、Lux Capital、OpenAI和Sequoia 参与投资的Capital;十一月,杰夫·贝佐斯,OpenAI、Thrive Capital、Lux Capital、Bond Capital、Khosla Ventures和Sequoia Capital共同参与了4亿美元的新一轮融资,使其估值达到24亿美元。
在此之前,杰夫·贝佐斯领先了Figure。 6.75亿美元的AI融资,Skild AI的3亿美元A轮融资,亚马逊还收购了Covariant AI团队。OpenAI参与了Figure AI投资,以及1X金额为2350万美元的早期投资。投资机构和科技巨头普遍看好机器人领域。
一群科学家聚集在一起,创造一个通用的机器人大脑
Physical 来自加州大学伯克利分校、斯坦福大学等高校的Intelligence核心团队,以及特斯拉、谷歌DeepMind、顶级科技企业,如Stripe。

Karol Hausman
Karol的联合创始人和首席执行官 斯坦福大学兼职教授Hausman曾经是Google 机器人方向的研究科学家Brain的论文引用超过13000篇。创始人Sergey 作为加州大学伯克利分校的副教授,Levine也是机器人方面的顶级专家,他的论文引用数达到15万。Chelseaa创始人 作为斯坦福大学的副教授,Finn引用了63,000篇论文。

Sergey Levine
谷歌前研究科学家Brian也在创始团队中。 Ichter,以及Lachyyy,Stripe前高管和知名科技投资者 Groom。
Physical Intelligence的愿景如下:使用者可以让机器人执行任何他们想要的任务,就像使用大模型支持的聊天助手一样。
对行业来说,通用机器人基础模型意味着什么?
当前,AI的应用方向主要有两种,一种是在虚拟空间与人类互动,另一种是直接与物理世界互动。聊天机器人、AI企业搜索、Agent、法律AI等虚拟空间与人类互动、AI等垂直领域的编程AI。
主要通过机器人和无人驾驶汽车来实现与物理世界的直接互动。机器人应用的分类也可分为专用和通用两种。
如今,大多数机器人都是“特殊的”。这些机器人适合限制环境下的少量变化,但很难应对家庭或其他复杂凌乱的真实环境。其中一些属于通用机器人,如一些人形机器人。它们被设计出来,只是为了应对人类可以完成的大部分事情,而不是局限于一个有限的场景。
大致可以将机器人的结构分为“大脑”、“小脑”、“眼睛”和“四肢”,其中“大脑”是机器人的中心,一般是通用或专用模型,负责理解外部指令并做出决策;“小脑”将决策指令输入“四肢”并控制它们,这是一个控制系统;“四肢”是机器人与物理世界直接接触的部分,可能是人、狗或机械臂。甚至可能是一辆车;而且“双眼”就是“大脑”感知外部传感器。
所有这些部分,都有大型企业或顶级创业公司在创新和耕耘,但“小脑”、在之前的机器人浪潮中,“双眼”和“肢体”都逐渐成熟,而机器人“大脑”仍处于起步阶段。
对于垂直场景中的清洁机器人、喷涂机器人、配送机器人和仓储物流机器人,他们只有对应垂直场景的专属智能。他们的“大脑”模型只能在有限的场景中理解和处理情况。更早的专有机器人只能做固定动作,需要大量的人类编程。
通用的机器人大脑模型,可以在一定程度上改变这种状况,它使机器人能够学习并遵循客户的指示,从而使新的编程行为变得非常简单,同时也使机器人能够调整自己的行为来适应环境。
对于任何垂直领域的机器人企业家来说,只要有一个通用的机器人大脑模型,结合自己行业的专有数据,就可以微调一个适合具体应用场景的机器人大脑。这一逻辑和大语言模型 专有资料=强大的行业模式,完全相同。
从更深层次来看,通用机器人的基本模型实现通用人工智能(AGI)同时也很有帮助。现在AI研究人员发现,Scaling Law的效果正在减弱,因为AI模型遇到了“数据墙”——现有的优质数据大多已经训练过,模型缺乏更多更好的数据。如果有一个通用的机器人模型,它不断地与物理世界互动,不断地遇到和处理复杂的情况,那么高质量的数据就会不断地产生,最终它会离AGI越来越近。
需要哪些新的方法来训练通用机器人基础模型?
Physical 目前Intelligence的原型通用机器人基本模型叫做π0(pi-zero)。它基于各种数据进行训练,并能够执行各种文本指令。但与大语言模型不同的是,它还融合了图像、文本和动作,通过在机器人体验中积累的实际操作获得物理智能。其输出是其它低级电动机的指令。它可以控制不同类型的机器人,并且可以接受提醒执行所需的任务,也可以微调以适应复杂的使用场景。
在练习π0模型时,Physical Intelligence采用了一些特殊的训练策略。
第一,跨设备混合训练 ,π0模型利用互联网规模的视觉-语言预训练、开源机器人操作数据以及来自8种不同机器人的精密任务数据,可以通过零样本提醒或微调执行各种任务。

这一数据包括多样化的任务,每一项任务都显示出丰富的运动基本单元、不同的物体和多种场景;这类任务还包括机器人灵巧控制的不同维度,Physical Intelligence选择这些任务的目标不是处理特定的应用程序,相反,它为模型提供了一般的物理交互理解——为物理智能奠定了基础。
第二,网络规模的语义理解 ,这次训练的起点是视觉-语言模型。(VLM)。VLM可以有效地从网络中转移语义知识,但是它们只能导出离散的语言token,而精确的机器人操作需要π0以高频率导出电机指令(每秒最多50次)。

为达到这种灵活性,Physical 为了提高VLM模型,Intelligence使用流匹配(扩散模型的组合),使其能够导出连续的动作指令;从而形成视觉-语言-动作流匹配模型,然后对其进行高质量的机器人数据后训练,以减轻一系列下游任务。
最终进行精确操作的后训练。 ,更复杂、更精密的任务需要微调模型,模型需要通过优质数据进行微调,比如折叠衣服的任务,类似于大语言模型的后训练过程。预训练使模型掌握物理世界的知识,而微调则在特定任务中表现良好。
当然,π0并非唯一的通用机器人基本模型,Physical 在Zero-shot的条件下,Intelligence使用了一些实际的任务,如折叠衣服、从面包机中取出吐司面包、包装杂物等。,以测试模型解决实际问题的能力。不管是什么,数据显示π0还是较小的π0-small,就解决问题的能力而言,它们都比现有的OpenVLA模型要好得多。

例如,在折叠衣服、清理餐桌、组装盒子等任务中,π0支持机器人可以将纠缠在一起的衣服分开折叠;餐具或水杯可以放入清洁拖盘中,垃圾可以放入垃圾桶中;你也可以拿起一个平坦的纸箱,折叠成型,然后插入压边。这些动作不是简单的少步任务,而是复杂的动作、家务或生产活动。
然而,到目前为止,π0仍然只是一个原型模型,通用机器人基本模型仍然处于起步阶段。Physical Intelligence表示,他们将继续收集数据并练习模型,从而实现新的灵活性和物理能力。
就商业化而言,Physical 目前,Intelligence还没有明显的动作。
在中国,机器人行业需要核心技术,更需要落地。
为什么顶级投资机构和杰夫·贝索斯等科技巨头的掌舵人都要下注机器人?答案大概是前面提到的。机器人可以与AI结合,探索物理世界,产生大量真实优质的数据,最终帮助实现AGI。
事实上,除了特斯拉的Optimus之外,英伟达还拥有机器人通用模型系列工具NVIDIAIA系列工具,这不仅是一种投资,也是一种投资。 Project 亚马逊有Sparrow(仓储机器人系统)和Digit(双足机器人),GR00T。
就创业公司而言,Figure Figuree主要是AI。 01和Figure 02人形机器人,它们的大脑由OpenAI定制的模型组成,具有很强的通用性。它们不仅可以完成冲泡咖啡等生存技能,还可以在工厂“拧螺丝”。
Skild Skildd主要做Skild Skildd是Brain和移动操作平台 类似于Brainπ0机器人通用大脑。
1X还专门为家庭设计了一个双足人形机器人NEO Beta,而Vayu One是Vayu Robotics的送货机器人,它也有Vayu 移动基本模型Drive。
目前,中国在核心算法和高级运动控制系统方面与美国在机器人方面仍有一定差距,但无论是机器人“大脑”、“小脑”、“眼睛”和“肢体”;各种专有机器人和人形/狗形通用机器人,大型企业和顶级创业公司都在努力创新和发展。这些企业包括阿里、小米、小鹏、DJI、宇树等。
而且中国一方面拥有巨大的市场和完善的使用场景,另一方面机器人密度不够高,这是一个巨大的潜在市场需求。对于机器人企业家来说,即使他们致力于国内市场,也有足够的发展空间,在国内市场“赢”之后,他们可以进一步扩大到国际市场。
就创业方向而言,尽管需要“大脑”、突破了“小脑”等基本和核心方向,更加需要在各种使用场景中涌现出大量的开创者。为了使整个机器人创新创业生态健康发展,应用和基础技术相互促进。阿尔法公社作为天使投资机构,希望在服务机器人领域发现非凡的企业家,帮助下一个世界级的机器人公司发展壮大。
本文来自微信微信官方账号 “阿尔法公社”(ID:alphastartups),作者:发现非凡企业家的,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




