大型模型为具体智能安装“大脑”

2024-09-06

刚刚过去的八月,AI “上菜”领域机器人。上面有华为天才少年“稚晖君”的智元机器人,一口气发布了五款商用人形机器人,之后有多达 27 一个人形机器人出现在世界机器人大会上。


苹果还宣布将进入机器人行业,推出J959号带有机械臂的桌面机器人。国外媒体猜测苹果将利用这种机器人设备进入智能家居市场,这被称为苹果进入机器人市场的第一步。


根据国外媒体的报道,该设备将与一个类似的设备相结合。 iPad 大显示屏、摄像头和一个带有机械臂的底座,预计将在 2026 年或 2027 大约2000年发布。


人形机器人不断渗透到工业机器人,从运输货物的轮式机器人到可以写成熟书法的AI机器人助手,再到可以检测汽车零部件的工业机器人。


与此同时,国内具身智能热也从产业端蔓延到投融资领域,热钱疯狂涌入。据PEVC数据显示,2024年第一季度,机器人领域共发生59起融资案例,涉及融资金额45.22亿元。其中,最疯狂的是,智源机器人成立17个月后,完成了7轮融资,投资前估值达到70亿元。


具体智能成为继AI之后 在Agent之后,另一个火爆的大模型落地方向,也是每个人都不敢错过的存在。


另一方面,企业家集中涌入。根据IT橘子数据,自2023年1月以来,我国已有29家人形机器人企业成立,其中22家已获得至少一轮融资。


另外一方面,大厂也或多或少地参与到具体智能的投资中。百度、阿里、美团、科大讯飞、小米、联想、JD.COM等科技巨头都在智能创业公司融资的背后。


实际上,现在具身智能之所以如此火爆,离不开大模型和生成式AI的发展。


早在1950年就提出了具体智能的概念。进入21世纪后,具体智能开始在机器人领域进一步发展。直到去年 ITF World 会上,“具体智能”的概念被黄仁勋点燃。黄仁勋直言,人工智能的下一波浪潮将是一个智能系统,可以理解、推理和与物理世界互动。


大型模型的出现使得具身智能赋能实践应用这个曾经遥不可及的梦想有了实现的可能性。


这么大的模型对具体智能有什么影响?具体智能是昙花一现还是可以长盛不衰?它的发展难点、卡点和关键点是什么?


创业公司疯狂吸金,巨头入场烧钱


“新AI四小龙”和“大模五虎”一直在模型领域流传,但是在具身智能跑道上也有自己的“新老四小龙”。


“老四小龙”包括最佳选择、大龙机器人、非夕科技、宇树科技;“新四小龙”分别是智源机器人、鹿机器人、逐际动力和银河通用。


老四小龙成立较早,多集中在2012-2015年,在研发、产品和市场上都比较成熟。


与传统机器人公司相比,新四小龙大部分起源于这波大模型浪潮,更注重AI与机器人的深度融合。虽然成立时间短,但这些新兴公司在市场上表现出强大的竞争力,吸引了大量投资。


智源机器人自成立以来就有自己的光环。由华为天才少年“稚晖君”领导,致力于开发通用人形机器人和智能,致力于使用AI。 整合创新机器人,打造世界领先的机器人产品和生态系统。


现在,智元机器人已获得天使轮,A轮,、A1轮、A1 轮、A2轮、A3轮、A4轮等多轮融资,包括红杉中国、尚欣资本、上海临港新区基金等顶级资本,以及百度、比亚迪、SAIC等产业资本,具有很强的“吸金”能力。


另一家明星公司应该属于银河通用。银河通用于去年5月成立,今年2个月内完成两次融资。今年6月,它获得了超过7亿元的天使轮融资,被称为“年度最大天使轮”。仅仅一个月后,香港投资管理有限公司就增加了额外的投资。新一轮融资后,银河通用最新估值为4.25亿美元。


两个融资阵容也很豪华,包括中关村科学城、首钢基金等国有资产背景,IDG资本、源代码资本等风险投资机构,以及美团战投、讯飞创投、商汤国香资本等产业资本。


凭借自身的技术优势和商业化落地方案,拥有鹿机器人和逐际动力也受到资本的青睐。


鹿机器人致力于机器人通用大脑的研发,依靠第二代智能技术LPLM模型的自主研发,致力于使每一台专用设备都具有智能性。今年5月,我们从中国头部清洁设备制造商那里获得了1000多万元的订单。


根据官方披露,到目前为止,鹿机器人已经完成了投资超过1亿元的融资,如元景资本、创新工场、百度风险投资等。


渐变动力是为数不多的将空间智能与运动智能相结合的企业之一,这意味着机器人同时具有“眼睛”和“身体”的协调能力。其自主研发“CL-人形机器人已基于即时地形感知上楼梯,起跑加快,转身来回等运动。



7月,逐际动力还完成了阿里巴巴、招商局创投、SAIC集团尚高资本领先投资、原股东峰瑞资本、绿洲资本、明势资本等数亿元的战略融资。


另一方面,具身智能创业公司疯狂吸金。据智东西统计,截至2024年6月30日,今年国内机器人行业已有69起融资事件,其中12起融资事件已披露数额,机器人领域已披露融资总额约为75亿元。


另外一方面,巨人们正在疯狂地烧钱。若仔细分析可以发现,在具身智能融资的背后,国内外大厂商在具身智能领域的竞争也进入了白热化阶段。


百度、阿里、腾讯、美团等。选择直接投资。百度今年继续下注智元机器人第二轮;阿里领先逐际动力;但美团站在银河通用的背后;腾讯投资了港股成功上市的“人形机器人第一股”。


字节跳动、小米等。选择独立开发。字节跳动在AI和机器学习领域有着深厚的积累,而小米在智能家居和机器人领域有着丰富的经验。


在大模型之后,具身智能是下一个人工智能的趋势,每个人都不想错过。


第二,大模型为具体智能安装“大脑”


斯坦福大学计算机科学教授李飞飞认为,具体智能是 AI 该领域的下一个“北极星问题”之一,可以在虚拟世界中探索和改变自己的环境,与周围的环境互动,学习复杂的人类任务。


也就是说,具体智能可以在与现实环境互动后,通过自己的学习、理解和改造世界。与我们目前提到的AI模型不同,如果AI模型现在能够认识世界,那么具体智能是AI的一种更高级的方式,可以优化物理世界。


也就是说,具体智能的实现需要高度集中的软硬件,其中核心突破点在于大模型。可以说,大型模型为具体智能安装了强大的“AGI大脑”。提高了机器人在感知、理解和规划任务上的泛化能力,同时也对人机交互产生了颠覆性的影响。


这么大的模型对具体智能有什么影响?


从结构上看,具体智能分为三个重要部分:大脑、小脑和四肢。大脑负责感知和决策,小脑控制四肢的生成动作,四肢通过传感器、执行器等硬件配置与物理世界互动。


过去传统的具体智能系统环境适应性差,只能在特定和预定的环境中运行,不能适应复杂的环境;任务执行效率低,通常需要人工控制;缺乏独立学习和泛化能力。


大模型的出现正在改变这种现象。大模型对身体智能的影响更多的集中在“大脑”上。目前,通用大模型的本质是接收和回答图形信息,这是一个决策和感知的过程,最直观的效果是我们可以用自然语言与机器人交流。


去年7月,李飞飞团队发布了一项新的智能成果。机器人接入大模型后,直接听懂人的话,在没有额外数据和训练的情况下,将复杂的指令转化为具体的行动计划。


在语言模型 在视觉语言模型的辅助下,机器人可以从3D空间中分析出需要绕过的目标和问题,并计划行动。


大型模型的出现大大提高了机器人理解世界、推理决策的能力。


大型模型对智能的意义不仅在于大型模型使机器人获得自然语言能力,而且大大降低了机器人使用的门槛,有望推动机器人在各个行业的应用领域落地。


大型模型的成功,可以说给具体智能的发展带来了一个转折点,除了大型模型的赋能,政策端的支持加速了这个转折点的推进。


2023年11月,工业和信息化部发布了《人形机器人创新发展指导意见》,提出在2025年建立创新体系,使整机产品达到国际先进水平,在2027年产业整体实力达到世界先进水平。


今年6月,北京还发布了《北京市机器人产业创新发展行动计划(2023-2025年)》,首次对人形机器人产业进行政策指导,并提出抓紧人形机器人布局,对标国际领先的人形机器人产品,支持企业和高校对人形机器人产品和关键零部件进行研究和工程化。


在中国,人形机器人不断渗透到智能制造领域,覆盖电子、汽车等领域。今年,家用场景中的机器人也迎来了前所未有的发展机遇。市场规模已经触及数百亿美元的水平,预计未来十年将继续保持高速增长。


根据国际机器人协会的预测,从2021年到2030年,全球人形机器人市场的复合增长率将达到71%。根据中国电子学会的数据,到2030年,中国人形机器人市场的规模预计将达到约8700亿元。


从技术到产业,从政策引导到商业落地,具身智能的时代即将到来,也是各大科技巨头下注具身智能的深层原因。


三是具体智能的难点,卡点和关键点


尽管具身智能现在融资火爆,新产品频发,未来市场广阔,但业界普遍认为这个行业还处于起步阶段,要形成大规模的商业应用还有很长的路要走。


具体智能要向前发展,难以盈利和落地,卡在数据上。


第一,具体智能商业化前景不明朗,盈利困难。


连续四年亏损,被称为“人形机器人第一股”。从2020年到2022年,企业净亏损分别达到7.07亿元、9.20亿元、9.75亿元和12.34,累计亏损超过38亿元,毛利率也在下降。


具体智能难以达到商业化的背后是落地难的困境。


目前,人形机器人主要集中在工业、互动服务、营销、商业3C等场景。在家政服务方面,需要5-8年甚至更长时间才能完全进入,更多的应用场景仍处于探索和实验阶段。虽然一些智能企业已经开始小规模量产,但要满足市场需求还远远不够。


事实上,智能场景的限制和大规模生产的困难背后是成本的限制。虽然目前人形机器人的制造成本正在慢慢下降,从之前的几百万到现在的几十万,但对整个市场的接受度还是在上限之上。


具体智能背后涉及从软件到硬件的超长供应链,而且技术类别很多。


伺服器、减速器和控制器是工业机器人的三大核心部件,成本占70%以上。由于人形机器人的自由度比工业机器人高,减速器和电机的成本比例会更高。


如果要降低人形机器人的成本,通过自研来降低这些关键部件的价格是不可避免的关键。


就成本而言,还有一个大头-数据。


信息是智能发展的核心堡垒。如何持续从物理世界获取数据并高效使用,是制约其持续发展的主要瓶颈。


目前,对于具体的智能公司来说,大部分数据都是闭源的。要想实现快速发展,建立数据自主权是一个必须解决的问题。


在过去的一年里,智元机器人构建了一套完整的全流程具体数据解决方案 AIDEA,投入大量的数据收集费用。


稚晖君说,他预计未来智元将有100多个自由布局机器人,专门用于收集端到端的数据,他们也将在第四季度开源。 AIDEA 数以百万计的真机,数以千计的仿真数据集,积极构建开放生态。


事实上,数据问题的背后还涉及到智力的泛化。泛化可以理解为转移学习能力,将从过去的经验中学到的表达、知识和策略应用到新的领域。


上面提到的大模型对身体智能的影响主要集中在大脑上。感知和决策结束后,机器人需要调用“小脑”进行泛化,根据任务驱动身体完成行为。


而且在这个过程中,大模型对肢体运动和控制的作用要小得多,换句话说,具体智能的泛化能力仍然受到极大的限制。


数据问题不仅仅是数据问题 ,这与商业化密切相关。


在GPT-40发布的时候,有人分析说,OpenAI之所以没有发布GPT-5,而是发布GPT-40,是因为它希望利用GPT-40获得更多高质量的多模态数据资源。


鹿机器人陈俊波博士曾经说过,像特斯拉这样的智能需要在真实的物理世界中获取数据来改善世界模型,但是如果你想获得真实的物理世界数据,你必须率先完成商业化,并在第一时间将商品投放市场,获得更大规模、更高质量的数据。数据规模变大后,智能化程度更高,进一步提升商业化水平,实现正向循环。


从长远来看,智能产品的R&D投资高,应用落地时间长,行业内的马太效应会逐渐显现,资金和资源会涌向技术突破、产品创新、订单头明星创业,而中腰和尾端的生存空间会进一步压缩。


对于具体的智能企业来说,数据、技术、商业化是实现快速发展不可或缺的。只有让这三个飞轮转动,才有望跑出去。


本文来自微信微信官方账号“AI大型工厂”,作者:参商,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com