具身智能火了,但是规模落地还需要时间
英伟达CEO黄仁勋去年在ITFF上,“人工智能的下一波浪潮是一个智能系统,可以理解、推理和与物理世界互动。” World 预测2023半导体大会将逐步成为现实。
五月,人形机器人聚集在日本横滨举行的国际顶级机器人学术会议(ICRA2024)上。
七月,上海世界人工智能大会(WAIC 2024年展出人形机器人“十八金钢”是所有会议的“最漂亮的男孩”。
8月,在北京闭幕的世界机器人大会上,人形机器人成为名副其实的“C位”主角。官方表示,这是人形机器人数量最多的会议,现场超过一半的观众集中在人形机器人公司的摊位上。
很明显,人形机器人作为具体智能最重要的实体形态,就像大模型一样,正走向人工智能舞台的中心。
上面展出的各种机器人“文武双全”,会写字、会洗衣、会做家务,都是十项全能;能打咏春,能做搏击陪练,还能当个人保镖。
就场景而言,非常热闹,但深入内心,如此火爆的具身智能,或者人形机器人,距离“凭能力吃饭”还有多远?
大型带火机器人
在进行我们的讨论之前,首先要明确,什么是具体智能?
基于具体智能的英文翻译(Embodied artificial intelligence,EAI)可见,“本身”和“智能体”是两个至关重要的组成部分,具有“感知决策、物理实体、环境交互”的特点。
直截了当的理解是,具体的智能能够感知和理解周围的环境,并在物理环境中执行具体的任务。
事实上,早在60多年前,自动控制的先驱欧姆龙就提出了“机器能做什么,机器能做什么,人类应该从事创造性活动”的观点,但由于技术尚未成熟,很难落地,因为它有一个美好的想法。
自2022年以来,具身智能迎来了新一轮的发展,其背后的核心变量是大模型的发展。
八月二日,创业公司Figure 在与OpenAI合作开发的AI模型的支持下,AI发布人形机器人Figure02,Figure02的对话交互更加实时,常识推理能力也更加到位。
显然,大模型技术为人形机器人实现更好的感知、决策和交互能力提供了技术基础,也为机器人实现了大脑感知决策。小脑运动控制的泛化带来了很大的想象空间。
另一方面,人形机器人的硬件技术也取得了长足的进步。2023年底,特斯拉发布的Optimus Gen2配有自研执行器,脚部采用铰链式连接,并配有强大的传感器,使Gen2的行走速度比Gen1提高30%,并且具有更好的平衡性。
更重要的是,特斯拉发布Optimus后,推动公司股价连续11个交易日收盘,马斯克的社会地位在此期间扩大了约670亿美元,进一步验证了市场对人形机器人商业化的前景,同时将科技界的关注点带回了智能化。
这里主要表现在三个方面。
第一,国家政府在政策层面的指导。
其中,中国制度的短期目标是实现核心部件的技术突破,其长期目标是丰富产业应用和生态;海外政策更侧重于尖端技术的研究和重要场景的落地。

整理中国人形机器人重要政策,资料来源:各政府网站,中金公司研究部
第二,玩家多样化,竞争越来越激烈。
除了优必选、波士顿动力、傅里叶智能等老牌机器人公司,以及一批最近专注于机器人行业的创业公司,如智源机器人、银河通用机器人、星动时代、逐际动力等。,还有两个玩家。
一是以科大讯飞、百度、腾讯、谷歌等为代表的大型科技厂商。,具有感知理解的算法优势;二是以小鹏汽车、小米、追踪、特斯拉为代表的跨界厂商。这类玩家通常使用场景相对确定,产业链可以共享。
第三,资本对具身智能赛道的热情,毕竟真金白银投出去是为了获得更多的收益。
据不完全统计,2023年,中国有9家人形机器人公司获得了超过19亿元的融资。上半年,中国有13家人形机器人公司融资总额超过25亿元,成立仅一年的银河通用机器人。 6 一个月内甚至获得超过7亿人民币的天使轮融资,估值达数十亿人民币,被称为“年度最大天使轮”。
截至今年8月初,以“先进制造-机器人”为标签,出现了135笔融资。
机器人的手和脚,人类还没有“想好”
虽然行业非常热闹,但人形机器人在研发和应用方面仍有许多问题需要解决。
首 在这种情况下,技术路线的收敛。
中关村智友研究院院长王田苗在“2024年世界机器人大会”期间发表意见时表示:“目前人形机器人还面临两大难点。一是机器人目前的‘软’端,适合机器人通用大模型和垂直专业模型,还处于攻坚阶段;此外,灵巧的手目前在技术和成本上有困难。”
所谓“软件”,就是把复杂的任务分成无数的子任务,在现实的物理空间中融合各种子任务,需要大模型技术的赋能,从而实现人机交互。
通俗地说,就是让机器人具备泛化能力。比如家庭服务机器人可以主动安排自己的工作,不需要主人的发号指令,可以按照轻重缓急的顺序逐一完成房屋清洁、烹饪、储物等家务。
业内普遍认为,人形机器人在硬件方面没有堡垒。虽然机器人在移动速度、负载能力等机械性能上存在很大差距,但这些差距并不是不可逾越的,时间和成本最终会平衡一切。
最后,以软件为核心的泛化能力决定了人形机器人的能力。只有具备强大的泛化能力,人形机器人才能适应各种任务场景,才能拥有真正的“可用性”。
延伸机器人的泛化能力,机器人本身的形状,末端执行器的选择,也就是人形机器人的脚和手的技术方向,行业的技术路线还没有相对统一的共识。
对于机器人的移动能力,行业的主要矛盾是双脚和非双脚的区别。
如果你执着于具体智能所强调的“人型”,双脚是最好的选择,但在目前的技术标准下,双脚机器人的实用性、可靠性和开发成本弱于以轮试底盘为主的非双脚方案。
两种方案都有自己的包围。前者认为双脚是人形机器人的最终形式,就像L4级自动驾驶一样。从长远来看,双脚算法的研究极其重要。后者认为,从商业化的角度来看,非双脚方案更适用,也符合“沿途生蛋”的思维。
与脚的选择相比,手指方案的选择更多。
有的企业选择“一步到位”,对照人类在机器人身上也安装了五个手指,比如戴盟机器人。 Sparky 1 五指灵巧手配置基于光学触觉传感器。
有的企业从二指爪和三指手开始,比如星尘智能S1的双机械臂组合二指爪,银河通用G1选择右爪和左吸盘组合,以及 UniX AI 家庭场景机器人 Wanda 的三指手。
技术路线之所以百花齐放,一个很大的原因是厂商想自己定义这项技术,然后才能形成统一的标准。
事实上,与手脚的选择相比,人形机器人制造商更麻烦的是数据收集问题。
要提高机器人“软件”的泛化能力,需要对数据进行训练。
自动驾驶采集数据,只需在检测车辆上设置传感器即可。机器人训练数据需要更多地采集人类的行为数据。也就是说,传感器需要安装在从事特定工作的人或工作场景中。当人类需要参与数据采集时,就会变得复杂。
智源机器人公布了公司的数据采集计划,预计9月底将建成100台左右的机器人采样厂,对应150名工人。其目标是一名工人每天生产1000条数据。先不说数据采集的效率如何,这种数据采集方式是否可行还有待观察。
人形机器人如何赚钱?
一个值得注意的细节,现在很多人形机器人公司已经进入小批量生产阶段,一些产品的价格已经被厂家降到了10万以下。
例如,自5月发布以来,宇树科技G1人形机器人价格9.9万元引发热议。宇树科技在2024年世界机器人大会上宣布G1迎来量产版,设计更适合大规模生产。
在接受媒体采访时,智源机器人合作伙伴兼营销服副总裁姜青松表示,今年10月开始量产智源双足人形机器人,预计后期每月生产100台。今年预计出货量约200台,轮式机器人预计出货量约100台。
此外,EX机器人首席执行官李博阳向媒体透露,该公司已经实现了大规模生产的利润,今年将有500台左右的生产,明年的出货量将进一步增加。
另外,特斯拉还透露,明年将小批量生产人形机器人,并计划在施工现场安排1000多台机器人进行辅助工作。
好消息很多,但人形机器人离真正的商业落地还很远。
王田苗说,目前无论是15万还是10万还是更便宜,主要都是为了科研平台,类似于自动驾驶行业的线控底盘。目前的人形机器人产品更多的是行业内的内部消化,同行购买并开发相关产品。
据业内人士分析,与自动驾驶的商机相对应,具身智能,即人形机器人在发展过程中也有三种机会。
首先,就像L4级自动驾驶一样,机器人的本地发展,可以看到人形机器人的终点,提前占据位置。只要能等到智能时代真正到来,自然就能享受一顿美餐。
其次,在矿山、封闭公园、环卫清洁等特定场景中使用自动驾驶。人形机器人的场景开发机会很多,但目前行业的探索还没有明确的结果。
最后是上下游的工业机会。有时候卖铲子远比挖矿赚钱。这里的上游包括智能计算中心的建设、计算率芯片和端模型的核心技术;下游涉及各种传感器、关节模块等。,类似于各种雷达和自动驾驶中的智能驾驶舱。
与上述相比,人形机器人产业的发展路径实际上已经非常清晰。
虽然业界对人形机器人在服务机器人领域的比例有不同的看法,但乐观主义者认为人形机器人的市场份额最高将超过60%。
另一部分行业观察人员认为,人形机器人只解决了部分需求,而臂式、轮试、履带等其他类型机器人的应用场景更加丰富,因此人形机器人只会占据30%左右的市场份额。
真正的市场竞争仍然不同于坐在办公室里的“战棋推演”。人形机器人的实际形式取决于应用领域和客户的需求,以及客户愿意为什么样的服务成本和产品功能买单,最终取决于技术的创新能力和发展水平。
根据国际机器人协会的预测,从2021年到2030年,全球人形机器人市场的复合增长率将达到71%。根据中国电子学会的数据,到2030年,中国人形机器人市场的规模预计将达到约8700亿元。
本文来自微信微信官方账号“洞察新研究会”(ID:DJXYS-作者:辰纹,36氪经授权发布,0309)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




