近百家新公司在半年内出现,「具身智能」也有春天 | 36氪新风向

2024-06-15

王沁,邱晓芬,作者


编辑苏建勋,邱晓芬


今年5月,在北京中关村一栋建筑中,机器人行业泰斗王田苗创办的智友研究院会议上,机器人企业家的一个重要问题是如何招人。


在论坛上,一位企业家向大家展示了他的手机页面。“我在猎聘上看了4000多份简历,我认真回复了大家。我应该是猎聘中最活跃的老板!”


在机器人领域,北航机器人的声誉优势王田苗不仅是一名学术大师,也是一群带领一群年轻人成为上市公司创业导师的校园科技项目。在他投资的70多个项目中,著名的有九号机器人、国内第一个手术机器人天智航、工业机器人埃夫特等。


在热潮中,王田苗看到了泡沫,也看到了现实的机遇。


他停顿了一下,说:“即使有些具体智能的初创企业估值已达20亿,50亿,甚至100亿,这更多地反映了资本市场的乐观预期,可能会出现泡沫。“但真正的价值创造才刚刚开始,尤其是当硬件的迭代周期跟不上软件或大脑的进化速度时,我们看到了一个拥有智力的机会。”


自2023年年中以来,智能火了,热钱的涌入,在2024年一片萧条的市场中显得格外耀眼。根据IT橘子的统计,2023年中国一级市场机器人产业融资金额达到240亿元,其中10亿元以上的投资事件数量约为4起。


华为天才少年“稚晖君”辞职后创立的最“疯狂”的一家,应该是「智元机器人」——最近一年,这家炙手可热的企业整合了6轮,资方名单包括红杉中国、上汽投资等。成立仅仅一年多,「智元机器人」估值已飙升至70亿元。


一家家具机器人公司的CEO告诉《智能涌现》,“(我们)不接受相对拖延的(投资),谁效率高,速度快,我们优先考虑谁的钱。最近,所有来找他的投资者都排队了。


经过一轮市场调研,一家通用机器人公司的联创惊讶地发现,在过去的半年里,中国出现了100家以下的机器人公司,甚至许多非机器人背景的人也挤在了牌桌上。


根据Markets and 根据Markets的预测,2023年全球智能市场规模将达到18亿美元,预计2028年将达到138亿美元。


大公司也通过投资下注:Open AI下注了海外火爆的具身智能公司1X Technologies、Figure AI,三星站在前者的背后,英伟达、微软、英特尔、亚马逊等知名企业投资。


“具身智能”(Embodied Intelligence)这个概念并不是什么新鲜事。它早在2005年就在学术界提出了。然而,由于当时很难实现,它从未流行起来,但它只是科幻电影中人类夸张的想象。直到AI模型诞生,大家才意识到拥有智能真的可以进入现实。


智能理论认为,智能体是通过视觉、听觉、触觉等各种感官与现实物理世界的持续互动,反馈到大脑,产生智慧和思维能力。比如你想变得聪明,不仅要输入符号知识,博览群书,还要去现实世界看、听、感受、行万里路。


AI大模型的突破,完成了具体智能的“智能”(intelligence),以前遥不可及的目标现在已经走了将近一半,只差“具身”(embodiment)一具能看、能听、能行动的身体。


Aglitiy机器人已经投入亚马逊仓库搬箱子,不仅可以在演示中自行拆解如何烹饪,还可以理解人类流行的文化梗语(如星球大战中黑暗尊主达斯·维达之刃),还可以学会走在从未训练过的路上。


业界开始对具身智能投的热切期待。



显然,传统重点机器人(机械臂、扫地机器人、无人搬运车等)的叙事。)过去已经不能满足人们的想象。人类构建的社会是为人体设计的:手机的大小、电脑的大小、桌椅的高度、门把手的高度等。,都是用人体来衡量的。


当一个像人体一样的机器人得到大型大脑的支持时,机器人真的可以取代人类,在各种场景中做各种事情,科幻电影走向现实。人类类型是人类对机器人的终极想象。


本论文将围绕以下几个问题展开:


1、为什么大模型出来后,具身智能才突然爆红?


2、有哪些玩家具有智能赛道?谁是理想主义者和现实主义者?它们是如何形成分野的?


3、具体智能离商业化还有多远?怎样寻找PMF?(Product Market Fit,产品市场匹配程度)


AI大模型诞生,具身智能有“脑”。

一个人形机器人,大致可以分为三个关键部分:大脑(AI模型)、小脑(运动控制)、硬件身体。


如果将人形机器人与人类进行比较——机器人大脑(AI模型)代表机器人了解人类社会的规则,从而与人类进行自然语言对话和交互,做出顶层行为决策;机器人大脑控制机器人的运动流畅性、身体感知和平衡(比如摔倒后可以自己站起来)。


可以用一个描述来理解机器人大脑:它有点像钢铁侠中的Jarvis,可以帮助你了解外部环境信息,并向机器人发送相应的指令。


当然,机器人大脑并不是我们所理解的人类大脑的形状,有丘壑和皮层。它是一个形状多样的“计算盒”。例如,当Jarvis存在于它的盔甲中时,它是一个人形机器人;但是当钢铁侠脱下人形盔甲时,它也可能变成机械臂或物流车,帮助你在控制台上工作或移动东西。


当然,通用AI模型不能直接等同于机器人大脑。。为了成为一个合格的机器人大脑,通用大模型还需要进一步的“加工”(练习和微调)。


机器人大脑在理解了人类给出的任务后,需要对任务进行分解和规划,并将其“编译”成动作指令,这样机器人大脑就可以将信息输出直接转换成小脑运动控制系统可以理解的指令代码。换句话说,机器人大脑不仅导出文字、语音和视频,还导出一个能让机器人真正移动的动作指令。


过去,没有“大脑”的传统机器人只会按照人类的简单指令执行简单的任务(例如,将物体从定点A移动到定点B)。然而,有了大模型,机器人变得更加聪明和聪明。


比如有人告诉大脑机器人“给我炒菜”的时候,机器人可以自动理解“炒菜”的任务,计划在冰箱里拿菜,在厨房切菜,在锅里炒菜,实施动作。



然而,大型机器人的推广不仅仅是机器人大脑。聪明的机器人行业从业者也开辟了新的思路。——通过大量的人类运动数据,具身机器人能否让机器人小脑也能模仿学习人类的轨迹?


目前行业内很多企业都在努力让机器人观看和学习人类的动作轨迹,让机器人在跳海藻舞的时候模仿人类的手臂波浪动作,比如续水、装东西、放东西、通过复杂的路面。



伯克利分校的美国加州大学团队《Humanoid Locomotion as Next Token Prediction本文将Transformer框架预测下一个token的原理,并将Transformer框架应用到机器人小脑的运动控制中,用27小时的行走数据训练机器人。


资料表明,机器人最终不仅可以在从未受过训练的道路上行走,而且还可以在后退行走的训练中出现从未出现过的动作。



大型机器人使机器人长出大脑,只是近期人形机器人爆红的一个重要因素。另外一个重要原因是,随着机器人硬件成本曲线的迅速下降,机器人产业蓬勃发展。


许多业内人士对“智能涌现”提出了一个共同的分析,人形机器人创业应该发生在中国,而非大洋彼岸的硅谷。——相比之下,中国不仅拥有较强的机器人生产能力,而且还拥有机器人应用场景,需求供应比硅谷更强。


一家人形机器人创业公司的首席执行官以“智能出现”为例。以机器人电驱关节为例,价格从最初的1万元降到了现在的1000元左右,降到了90%。


机器人公司「宇树科技」今年5月发布的G1人形机器人售价9.9万,进一步降低了人形机器人的价格。根据“人形机器人研究院”微信官方账号分析,宇树G1的硬件成本批量生产不超过8万元,定价仍有盈利空间。


「优必选」一位技术人员告诉《智能涌现》,过去人形机器人之所以成本高,是因为专用部件需要定制,产量低,关键部件依赖于海外供应商。但是近几年,国内供应商加入,零部件出货量增加,价格下降。


这形成了一个相互因果的循环:在中国制造硬件相对简单便宜,人形机器人企业敢于尝试制造硬件,提高市场需求,进一步降低硬件价格,进一步降低进入市场的难度。


一派理想,一派现实

一种有趣的现象是,AI机器人现在也大致分为两类:大模型的发展路径分化为理想派和现实派:


理想主义者喜欢谈论人工智能和身体智能,并将人形机器人视为最终形式和最高理想。现实主义者更注重AI机器人与商业应用场景的结合,注重短期商业收入。


无论从最初的To,理想派都将人形贯穿始终。-E(To-Education,客户为高校科研院所)、To-D(To-Developer,客户是开发者)的小批量生产阶段,或者是大B客户阶段,以及To-C阶段。


对初期如何养活自己,理想派不愁。人形机器人企业「加快进化」创始人程昊认为,养活自己最理想的方式就是保持产品形态的通用人型,不需要半途而废做垂直专用机,业务规模逐渐扩大。


“我们只需要锻炼数百台、数千台的量产能力,积累期先卖给科研机构。就像苹果手机一样(相比MP3、相机等专用机器,苹果手机是通用机器。)最早在中国卖的时候,谁买的?都是学校买的。个人PC也是先卖爱好者、大学、华尔街。先吃这一块,让很多人学会使用。"



现实主义者更注重机器人的商业应用领域,他们不一定把人形当作机器人的终极形态。,机器人的具体形状可能会根据具体情况进行调整——它可能是一个足够聪明的机械手,或者是一辆可以在工厂快速滑行的机械车,它的脚是轮子,但它含有手臂。


正是因为这波带火的AI大模型机器人有AI大脑,但不一定要放在人体内,所以也有人认为这波具有泛化智能的机器人更适合表达“AI机器人”,但“人类”对公众的情感影响更强。


服务于机器人企业「星海图」“先不怼人型”的策略是。「星海图」CEO高继扬在一次公开采访中提到,机器人现在面临的环境是人类改造的社会环境,人形机器人可能不是最适合高度特化的任务岗位。


对他来说,具身智能的未来应该是 “一脑多形” 关键是要选择好的商业闭环场景,当自己足够便宜的时候,再降低数据获取成本,数据推动算法进入规模化阶段。


《智能出现》发现,在地域分布上,以北京为代表的北方公司有更多的理想主义者;以珠三角为代表的南方有很多现实主义者。这些都与行业人员的背景、投资者的偏好有关。


北方项目大多孵化在高校(清华、北大、中国科技大学、北航、北京理工大学等)。),从高校实验室出发,再延伸到工业界。普通人形机器人的“专精”理想一般更容易孵化在高校实验室。


一位FA告诉《智能出现》:“北京投资者更喜欢投资型(机器人)和专门精致的故事。无论是投资AI的浪潮,还是投资软件的浪潮,都是这种风格。


投资偏好也和资金来源有很大关系。在北方,政府方面的资金来源比例更高,对科研战略水平、距离落地的人形机器人会更有耐心,在创业公司能够养活自己之前会给他们更长的时间。


初衷资本合作伙伴许邈洋告诉《智能出现》,人形机器人跑道有一些国家政策方面的支持,资金将保持一定的容量、可持续性和容错空间。


“人形机器人涉及生产线工厂,这与政府的投资、税收和人才密切相关。即使人形机器人行业需要探索时间,只要公司能够持续进步,无论是泛化能力还是单点性能,只要最终效果有所突破,我预计至少三年左右就会有(资金持续)。”


而且以珠三角为代表的南方,现实主义观点更具优势。


一位长期驻扎在深圳的FA告诉《智能涌现》,驻扎在华南的投资者风格更加现实,“无论你是物流机器人还是家居清洁机器人,整个应用都比较接近,不会融入20亿,什么都看不见。对于一项新技术,今年一级市场不会给无法商业化的企业太长的容忍期。...要在一两年内看到你是成功还是失败?”


以珠三角为代表的南方,垂直机器人(如仓储物流机器人、工业机器人、餐厅机器人、清洁机器人等)占比较高。).这些企业在模型热潮过后,都尝试在原有机器人形态的基础上,增加一个聪明的AI大脑。


举例来说,一个想法是,对于仓储物流的场景,使用轮试。 双臂类人形机器人,使手臂有与人相同的操作空间,但使用最便宜、最稳定的底盘,可根据货架高度升降。


工业机器人、商业智能机器人在珠三角和长三角的传统场景中,供应链非常成熟,毛利已经非常低。拓斯达、埃夫特、迈赫等下游集成商的收入在工业机器人中一步步被上游压缩;对于商业智能机器人,根据《Equal Ocean》据报道,国内市场毛利率为30%-40%,商业服务机器人公司“F4”云迹、普渡、擎朗、高仙仍处于亏损状态。


传统机器人毛利低,对成本敏感,那么对于AI大脑的成本、收益、使用安全等方面的考虑,更应该仔细考虑。


深圳的一个除雪机器人告诉《智能出现》,他们的新一代产品增加了AI模型功能,但目前他们只使用自然语言交互功能,却没有选择大模型进行机器人视觉训练(比如泛化能力可以让机器人识别模拟的假草),从而防止大模型的幻觉带来安全隐患。


在资本方面,“现实主义者”AI机器人的着陆得到了许多工业资本的支持。这些工业资本不仅是股东,也是客户,提供了工厂的着陆应用领域,场景数据可以反馈给机器人AI算法。


总的来说,无论是理想主义者还是现实主义者,AI模型引发的这波AI机器人浪潮,都非常吃学术资源。AI机器人跑道总体上处于从学术界到行业的跨越期,几乎每一个AI机器人团队背后都有自己的学术界。


资料来自公开渠道,采访,整理《智能涌现》


各大学的风格各不相同。


比如清华大学的背景机器人团队大多是单干的,每个团队都有核心的学术骨干,相互独立。一位FA说,清华大学的研究机器人教授大多有自己的公司。


哈尔滨工业大学(深圳)背景机器人团队更倾向于团队模式——学校与企业之间的深度合作绑定。一家机器人创业公司的首席执行官告诉36Kr。除了股份,哈尔滨工业大学还将为机器人资源和产业融资提供支持,学校和公司将同时扩大板块。


阻止人形机器人落地两座大山。

然而,人形机器人看上去很漂亮,但离落地还有很长的路要走。现在有两大难题需要跨越。


首先,数据的获取是一个难题。


AI语言模型需要投入大量关于人类世界的知识,才能涌现智力。同样,机器人大脑也需要投入大量关于现实物理世界的数据,才能聪明地训练。ChatGPT的诞生是因为互联网花了20年时间数字化了人类的知识,但是物理世界的数字化对具体智能产业来说才刚刚开始。


与AI大模型的训练数据(文字、图像、视频等数据库)相比,智能训练数据需要人类各种场景下的行为数据(如开门、做饭等)。)、以及人类生活在物理世界的场景数据。对于具体的智能创业公司来说,如果数据收集成本高,就很难赚到支出。


一些机器人公司也在尝试处理信息来源问题——积极与行业合作,获取场景中的数据。例如,特斯拉机器人擎天柱Optimus使用与特斯拉自动驾驶FSD相同的计算机硬件,Optimus的AI大脑和FSD 非常相似,包括相同的计算机视觉系统。


国内一家家具智能公司的技术R&D人员推断,FSD的信息来源是用车载摄像头的实时路况训练的视觉模型,而Optimus则用FSD的视觉模型作为机器人底座模型,然后用机器人场景(如搬运操作)的数据训练和微调底座模型。


因为很难获得数据,所以Scaling具有智能。 law(规模定律是指当模型参数、数据大小、计算量增加时,模型性能会提高)还处于起步阶段,还没有出现。一家机器人大脑企业的专业人士告诉《智能出现》,中国没有看到哪家公司的机器人大脑能够达到出现阶段。


而且对于获取数据的难题,目前国内不同的团队有不同的处理方式。


通用机器人公司「银河通用」创始人王鹤提倡使用模拟生成数据(即使用模拟软件将目标的真实数据复制到虚拟环境中)。该团队使用生成数据训练的机器人,可以抓取95%的随机材料和形状的堆叠物体的通过率。


然而,这一解决方案并不能得到所有机器人公司的效仿。「星海图」CEO高继扬认为,具体智能的第一阶段必须是真实数据和模仿学习。真实数据需要从现实世界获得,不能通过虚拟生成。


获取数据的纠纷还没有停止,人形机器人落地的第二个问题就出现了。——机器泛化能力不符合要求。


尽管谷歌RT-2(Robotic Transformer 2)拥有多模式的大模式足以让世界大吃一惊,但距离实际应用还有很长的路要走。谷歌允许机器人通过模仿学习的形式学习数据包中的行为轨迹,从而举一反三,获得语义和视觉泛化能力。


从谷歌的视频中,我们可以看到他们要求机器人抓住机器人从未见过的饮料瓶,即将掉到地上的袋子。



然而,事实证明,即使它们像谷歌一样强大,它们的机器人泛化性也不够。由于谷歌的10多万个数据物理场景非常简单,它们都是在同一个厨房和桌面的高度收集的,一旦机器人改变了场景,甚至改变了桌面的高度,机器人的动作就会面临举一反三的失败。


一个例子可以解释一个高泛化能力的机器人有多聪明有趣——当机器人接受“拧螺栓到几个洞”的任务时,机器人会根据实际情况调整自己的行为,以适应上一个环节的误差。


如同「银河通用」创始人王鹤之前说过,机器人在车厂、工厂应用落地的难题不在于操作精度、移动精度,而在于泛化能力。高度泛化,是当前机器人必须改进、突破的关键。


然而,要解决这一问题,工业界还有很长的路要走,这并不意味着人形机器人的落地就会停止。实际上,机器人落地也可以“抄近道”。


大多数人形机器人从业者认为,与AI模型相比,达到GPT3.5或GPT4的通用能力具有商业价值,但机器人大脑虽然没有达到“出现”的目的,但可以通过匹配合适的身体形态和场景来产生商业价值。


机器人泛化能力也分为等级:初级泛化能力的机械臂只能识别更换形状后的零件;即使在生产线上产品类别发生变化(例如,从梭织牛仔到针织外套)后,更高泛化能力的机械臂也可以自动适应。


很多业内人士告诉《智能涌现》,尽管初等泛化能力的AI机器人还没有一流的智能,但是也有望在短期内落地。


一家拥有机器人大脑的R&D公司表示,他们有望在2024年底前登陆具有基本泛化能力的拥有机器人大脑的产品,这些产品可以用于抛光、抛光、运输和涂胶。借助股东的产业资源和场景,实现商业闭环。至于机器人大脑的价格,其CEO表示,以合作机器人为例,与15-20万元的硬件本身相比,拥有机器人大脑的价格只是零头。


初衷资本合作伙伴许邈洋判断,具有更高泛化能力的AI机器人至少需要两年时间才能落地(比如更换生产品类,或者适应自己)。


一些业内人士,也明确了AI机器人商业化落地的重点。


对于大B端市场,机器人行业的领军人物王田苗表示,对于机器人创业公司来说,第一个要素是场景背后的资源——大工厂不仅可以投资,还可以提供经验和数据。例如,小米汽车和美团物流可以为机器人提供场景数据。


第二,需要产品技术;第三,要能够整合资源和融资,“否则(机器人公司)融资5亿、10亿之后就不能再融资了”。在他看来,成为行业领导者需要两三个要素,只有一个只能成为一般的创业项目。


对于小规模的科研院校市场,要占据渠道优势。可以明确的是,未来很长一段时间,人形机器人都会成为最好的。-E(客户是大学、科研院所)小批量生产阶段,没有B端市场那么大,所以要把握好渠道,争取先发优势。


以「宇树科技」举个例子,宇树早在2017年四足机器狗阶段,就把商品卖给了许多大学。


「宇树科技」最初的投资者和最初的资本合作伙伴许邈洋走访美国,发现斯坦福、伯克利等大学的机器人实验室几乎都有一只宇树的机器狗。由于其天然的渠道优势和品牌信任,宇树在前一阶段铺平了道路,到现在的人形机器人阶段,由于其天然的渠道优势和品牌信任,再次向现有的大学客户出售。「对大学市场来说,如果现在才开始做的话,肉眼可见肯定没有优势。”许邈洋说。


正如黄仁勋最近在台北国际电脑展上所说,“机器人时代已经到来,具身智能是人工智能的下一波浪潮。”


尽管人形机器人的着陆将会有坎坷,但是行业正在一步一步地前进。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com