2025,具体智能是否迎来了“ChatGPT时刻”?| 峰瑞研究所

06-01 10:59

2025年, 人形机器人 该领域持续火热, “科幻走进现实” 场景不断涌现。


四月是世界上第一场比赛 半程马拉松人形机器人 鸣枪开始跑步,各具特色的机器人选手在现实世界的跑道上行走;5月,世界上第一个以人形机器人为参赛主体的人。 格斗比赛 在中间,机器人完成了一系列格斗动作,如勾拳、侧踢、躲闪等;八月 , 世界 人形机器人运动会 还将拉开序幕,有田径、体操、足球等丰富多样的比赛项目。


一年前,我们在那里 报告《通往具体智能之路》 指出,供应链成本效率优势的持续提升,以及第二、第三产业场景需求的快速增长,或成为 具有智能跑道 的持续性机会。一年过去,具有智能跑道 出现了 哪些变化 ? 涌现了 哪些 新的机会?


在 「What's Next|科技早知道」 在播客节目中,峰瑞资本执行董事 刘鹏琦 和「声动活泼」创始人&「科技早知道」主播 Diane丁教 ,以及「科技早知道」节目监制 雅娴 ,围绕具体智能跑道的新阶段和核心挑战,探讨了包括但不限于在内的以下问题:


当下这一波 具体智能热潮的起点 在哪里?为什么一切都在 追寻“人”与“通用”?


人形机器人 软硬件发展 与哪些因素有关?当前的核心挑战是什么?


人形机器人 商业落地状况 怎么样?趋势和机遇是什么?


我们截取了一些播客的内容,希望能带来新的思维视角。欢迎继续和我们一起观察和讨论。也欢迎来到小宇宙APP。 或 Apple podcast,搜索并订阅「What's Next|科技早知道」完整版本的收听。



/ 01 /


制造机器人,为什么要追求?


“人”与“通用”?


雅娴:最近,机器人马拉松非常受关注,世界人形机器人运动会也将于八月举行。为什么这波具身智能如此火爆?


刘鹏琦:这次由亦庄举行 半程马拉松赛人形机器人 事情挺出圈的。除投资圈的小伙伴外,我观察到许多跑步小组也在讨论,关注机器人能否完成比赛。


第一次是人形机器人 走出实验室环境 ,马拉松挑战在现实中已经完成了这么长时间。从结果来看,机器人的完成率可能是 30% ,第一名比许多人类选手还快,其实挺了不起的。


特斯拉宣布进入 人形机器人,是这一波热潮之一。 代表性起点。


2021年, 特斯拉正式宣布人形机器人计划,提出 “Tesla Bot” 概念;2022年,特斯拉正式发布人形机器人 Optimus 原型机(擎天柱)。


同年, Figure AI 建立,重点开发通用类人形机器人。


不像之前成立的人形机器人公司,Optimus和Figure AI的目标非常明确。它们不仅限于制造一个可以实现复杂和酷炫动作的机器人,还可以制造机器人。 送到工厂,参与生产 。


2022、2023年前后 ,国内许多团队也相继成立,下注具体的智能方向,如智元机器人、银河通用、逐际动力等。


为何每个人都选择这个时间节点的结局?可以从软件和硬件两个方面来理解。


就硬件而言,过去十年, 新型能源产业,工业自动化,消费电力 子等领域的 工业化,规模化 随着水平的提高,包括电机、传感器、电池在内的硬件和零件上下游系统得到了改进, 降低了建造机器人的门槛。


就软件而言,从2022年底开始, 大型模型的出现 它被认为是一个提高机器人算法模型能力的机会,尤其是 感知决 策方面。 这样就给了行业很大的想象空间,去构思将来做通用机器人的可能性。


雅娴:2017年,宇树推出的四足机器人可以完成很多任务。例如,在工厂里,机械臂非常熟练地操作和组装汽车,并做一些详细的操作。那为何必须这样做把机器人 做成“人型” ? 为何必须这样做 追寻“通用”?


刘鹏琦:“人型”在一定程度上反映了人类心灵深处对未来通用机器人的终极形态。 普遍的想象。 许多科幻电影、电视剧所呈现的机器人形象也与人类相似,比如动画电影《超能陆战队》中的服务机器人“大白”。


就技术而言,人类所体现的 技术和通用能力 也许看起来更高级,也因此,许多企业将“人型”视为目标。


但是对于狭义的人型和非人型来说,“有没有腿”主要表现在 移 动力能力的差异。 在移动能力方面,可以说80%-90%的场景不需要人型,轮试底盘就够了。所以现在我们可以看到,更多的公司已经开始将资源投入其中。 机器人的上身, 特别是 操作技能 在研究和开发方面,这可能是一个更能发挥商业价值的地方。


雅娴:为了被称为“通用”,机器人需要具备哪些能力?


刘鹏琦:目前我们讨论的是通用机器人,人形,以及在大模型领域讨论AGI的想法。 通用 是我们 追寻最终目标, 但是挑战在于整个世界。 资源有限。 我们还需要平衡,同时追求通用性。 效率,通过率,成本 等因素。


例如,在 工业,制造业 与能否通用相比,效率、通过率、成本等各种因素显然更为重要。但是现在 家政服务 实用性在场景中更为重要。机器人可以牺牲一定的成功率和效率,但是相对来说可以做更多的事情。


目前,业界还没有就通用机器人所需的能力达成共识。我认为我们可以参考自动驾驶能力,从L1到L5对通用机器人进行分类和定义,分类指标可以看到它覆盖了多少场景,不同场景覆盖了多少任务。


丁教:在机器人领域,无论是研究阶段还是应用领域,更需要的是 收敛 ,而不是 泛化 ?


刘鹏琦:偏向学术学校的创始人可能更赞同直接追求全场景泛化的路线。偏向产业背景的创始人可能会在一般方向做减法,选择解决一个垂直场景的问题,然后在未来做其他场景。但不能一概而论。


/ 02 /


软件和硬件是服务机器人所需的。


发展如何?


雅娴:现在机器人需要什么样的硬件,现在不同的硬件已经发展到什么阶段?


刘鹏琦:可简单地将机器人硬件分为几类: 机械部分 (类似于人的骨骼、肌肉、肌腱)、 传感 (类似于人的五官,触感)、 控制 (类似于人脑、小脑、神经系统),以及配套设施 供能系统,通信系统 等。


从投资的角度来看,不同种类的硬件模块处于完全不同的发展阶段,这与 模块化相关产业的成熟度 相关。


目前很多完善的硬件模块都是新能源汽车、工业自动化、消费电子等。 大规模发展后,成熟产业溢出成果。


例如 关节减速机 ,它是机器人广泛使用的一体化关节的重要组成部分。关节减速器在新能源汽车和工业自动化行业发展良好,成本不断降低。机器人行业可以用一点定制。


再比如 传感器 ,得益于自动驾驶和扫地机器人行业的发展,激光雷达、毫米波雷达等视觉感知模块的成本较低,可以使机器人 “用于即用”。


相反,还有一些不完善的硬件模块,其核心部件过去在其他行业方向没有产业化和规模化的积累,需要智能化。 定制研发。 这种情况也存在 创业,投资的机会。


例如 灵巧手 (一种新型的机器人终端执行器是机器人与环境相互作用的最终阶段和执行部件)以及相关的触感和力觉传感器。2024年之前,灵巧手的应用场景主要是假肢和科研。近年来,随着智能行业的日益普及,灵巧手“带火”,吸引更多的资金和人才进入市场,促进其发展。


因时机器人 这是一个特别有趣的例子。2021年,当峰瑞在A轮投资机器人时,该公司已经有了一个灵巧的产品演示,但当时我们更关注它的核心部件。 微型伺服电缸 (线性关节,又称线性执行器,是集成伺服电机、减速器、丝杠等部件的一体化运动模块)。


当时,由于机器人微伺服电缸已经在新能源行业和美容行业得到了成熟的应用,灵巧的手是技术实力的证明,尽管收入占比不高。现在看来,微型伺服电缸的核心部件技术逐渐成熟,成本逐渐下降,这可能是由其他大型行业推动的,最终为智能手的实用性积累了关键能力。现在,由于机器人在灵巧手跑道上的先发优势明显,在行业内出货量领先。


因此,人形机器人零部件、硬件模块的成熟程度在初期是非常依赖的。 支持其它成熟产业。 假如只靠自己的智能产业本身,会比较慢,比较难。


丁教:使我想起了乐森机器人,以前做伺服电机,后来转行做玩具行业,反而在商业上取得了巨大的成功。


刘鹏琦:公司在其它行业积累、卷出的能力, 新兴市场 事实上,反而可能更符合市场逻辑。


雅娴:谈完硬件,我们再来看看软件。机器人控制系统有两条主流的发展路线。


一条是 端到端架构 (end to end,指让大模型直接理解问题,给出决策或答案) VLA模型 (visual language action,指从语言视觉端投射到行动端),特斯拉车辆的FSD(Full-Self Driving,全自动驾驶)是端到端的典型代表。


另一条是 传统的控制系统, 将机器人运动部件分为感知、决策、控制等模块, AI模型结合AI模型分模组合 实现各种功能。


刘鹏琦:我认为这两条路线 并非“非零即一”的状态, 有很多相互借鉴的折中方案。


比如分层模型的一两个模块可以用大模型来实现部分端到端;VLA内部也可以设计成分层结构,比如分为两个不同速度的系统结构。


公司需要根据自己的需求 定位、场景、商业模式, 选对路线。


近十年来自动驾驶的发展状况,能为具身智能产业提供参考。


在自动驾驶行业发展初期,市场上有企业一上来就制定终极L4(高度自动驾驶)计划,也有企业先制定L2(部分自动驾驶)计划。制定L2计划的企业通常会在训练模型之前将足够的商品推向市场。


特斯拉的FSD并非最初实现了端到端的模型。它也可能是 首先进行分层模型, 足够多的积累 用户信息 ,再反过来 训练端到端模型。


当然,端到端模型不一定是“终点”。业内人士认为,端到端模型最多可以起到模仿学习的作用。是否需要添加更多的其他方式和数据来训练端到端模型,主要取决于公司的定位和想法。


雅娴:端到端模型有什么优点?


刘鹏琦:最简单的理解是,端到端的模型结构看起来更简单、更干净。如果有足够的数据计算率,就有可能发挥作用。 Scaling law (OpenAI提出的规模法则认为,大型模型的最终性能主要与计算量、模型参数和培训信息量有关)的优势直接将模型运行出来。


问题是,是的 具体使用场景 里, 从而达到结果的成功率模型 有多高,比如精度能否达到行业目标。以自动驾驶为例,端到端模型的上限是否达到100公里左右接管一次?一百公里一次就够了吗?


雅娴:现在在通用机器人中使用大型模型,有什么挑战?


刘鹏琦:在 偏机器人大脑 挑战部分在于机器人。 需要与物理世界互动, 需要感知环境的3D信息和物理性质,但目前大模型可以为机器人提供的关于“现实世界”的信息相对有限。自动驾驶之所以能使用大模型,是因为车辆和环境之间的交互需求相对较少,尽量避免与外界的接触和碰撞。


规划、控制操作等 偏小脑 部分,目前的大模型可能远远不能满足机器人的需求。 准确性和响应速度。 举例来说,机器人终端控制系统可能需要数百甚至数千HZ的信号更新频率,目前大型Transformer结构(一种新型深度神经网络结构,是目前主流大型模型的基础结构)更难实现这种更新频率。


从另一个角度来看,具身智能实际上是一种 AI面向物理世界 Agent (智能体)。良好的AI 需要Agent 环境感知与记忆, 还要 推理管理能力, 更重要的是 Tool use (使用工具,指 AI Agent 有效地利用外部工具来提高其执行任务的能力)。身体智能是一种AI。 Agent还需要具备上述特性。随着大模型能力的发展,具有智能的环境感知和推理管理能力可以得到提高,但Tool与物理世界互动。 显然,use面临着更大的挑战。


/ 03 /


在投资热潮下,


具体智能跑道的趋势和机会是什么?


雅娴:人形机器人 商业化 处于什么阶段? 落地状况 怎样?


刘鹏琦:首先,从技术角度来看。许多技术,包括端到端模型。 研究阶段很早。


所以,许多企业考虑的核心问题并非商业化。现在,每个人的战略重点都集中在 怎样获得更多的资源,促进前沿技术的研发。


从投资的角度来看,具身智能是 明显过热 在Gartner技术成熟度曲线上,状态可能是 第一波高点 的位置。



“热”的好处在于, 加快相关技术和产业的完善。 比如灵巧手,在获得资本支持之后,行业内出现了许多不错的解决方案。


即使后续的智能产业进入资本低潮和冷静期,也会产生许多 “沿路生蛋” 机会。其中,模型、算法和核心部件是由智能行业开发的,可能会 溢出到其它行业, 比如增强当前智能机器人的能力,做出现在很难实现的机械臂形态。现在有些工业机器人只能在非常固定的过程中活动,未来可能会在更泛化的场景中执行多任务。


从 量 产的角度 看来,目前国内能够实现大规模量产的具体智能公司并不多,其中最大的挑战之一是 PMF还没找到 (Product Market Fit,产品与市场达到最佳契合点),现在更多的是服务于科研情况和展示需求。另外,软件方面 上臂操作技巧, 以及硬件方面 机械性能、可靠性和成本平衡, 还有优化的空间。


假如讨论未来人形机器人是如何着陆的, “不可能三角”的平衡 (指一件事同时存在三个要素,三者不能同时存在),在具体智能领域主要是指具体智能领域。 通过率,实用性和支出。


人形机器人在中国市场需要实现 通过率高于人工操作,在垂直场景中实现泛化, 尤其适合切入 附加值相对较高 的行业。


比如, 人工试验在生物医学领域的阶段 也许可以由机器人来完成。首先,实验室所需的操作比较有限,对机器人的实用性要求也比较低。第二,在实际试验过程中,机器人可能比人工更准确地控制试验条件和规范操作。另外,实验操作者一般需具有本科及以上学历,并具有化学或生物学等学科背景,属于高技能劳动力。如果人形机器人能够做到这一替代工作, 可以创造经济附加值 相对来说也会更高。


相比之下,人形机器人可能不容易。 劳动力集中的场景 其中一个原因是这些场景的附加值较低,比如仓储物流或工业场景。此外,我国劳动力成本低,海外劳动力成本高。因此, 国外市场 更加需要人形机器人来代替人力。


当然,我们也观察到了机器人。 工业领域 试一试,比如造车,但是现在机器人更有可能只做一些质检、随机运输等工作, 真正进入核心生产环节 还有很长的路要走。


国内外做人形机器人的企业画像有许多不同之处。


在美国,著名的人形机器人公司包括特斯拉,Figure AI、Physik Instrumente(PI)等, 新兴企业数量不多,但单一企业估值和融资额较高。 总的来说,美国企业倾向于追求追求 技术领先, 研究开发侧重于机器人的大脑部分,如软件和算法。除Optimus和Figure之外, 除了AI等少数企业, 自研机器人本体 公司不多。


进入中国人形机器人的企业 数量很多, 除遥遥领先的第一梯队外,还有无数的第二梯队、第三梯队。根据新战略人形机器人产业研究所的估计,2025年上半年仍有许多企业家进入。另外,看起来中国的具身智能企业也许更想要。 实现“全能”, 比如既做软件又做自己的硬件,既要展示酷炫的技术demo、还要有落地思考和布局。


就市场环境而言,中国在孕育人形机器人行业方面具有独特的优势:完善 产业链基础 、规模化的 市场需求 、积极的 政策引导 ,以及广阔的 出海机会 。


雅娴:对未来的人形机器人来说,公众可能会有一些“机器人进入家庭”的想象。就目前的技术发展阶段而言, 进入家庭场景的机器人 是否需要更长的时间?


刘鹏琦:的确。当机器人进入家庭时,除了成功率、实用性和成本之外,还有很多问题需要考虑在“不可能三角”中。 伦理问题,哲学问题 需要解决和克服。


丁教:但愿在资本的推动下,具身智能产业能迎来一个新的发展。 技术突破节点, 一点一点向前推进,我想最终应该能够实现这个目标。


刘鹏琦:假如仅仅靠一波就把它推到了最后的高度,那么这件事肯定不是什么大事。一件大事必须是 需要几波浪潮, 把它推到最后。


雅娴:那么现在机器人到了吗? ChatGPT时刻?


刘鹏琦:我觉得还远没有到。


在2024年5月,我们发表了一份报告《通往具体智能之路》。


和一年前相比,我想 具体智能变得更加火爆, 更多的团队出现,更多的机构进入。不变的是,整个行业仍然存在。 处于起步阶段, 虽然机器人马拉松等很多现象“爆红”,但是商业化还是很少的。


在硬件领域,大量新的创业公司和团队布局 力量传感器,触觉传感器,灵巧手等。 在 小脑机器人数据 在这一细分方向上,出现了公司或平台,提供遥操作、动捕和生成模拟数据。这也符合之前在报告中的判断。


在未来,新的趋势和机遇可能会出现 控制大脑和小脑算法 另一方面,这是目前智力最大的瓶颈之一。解决办法可能是先选择一个。 考虑到落地场景的通过率、实用性和成本, 形成现有的技术能力 闭环解决方案, 积累 场景数据, 再逐步演变 新型算法架构。


若延长时间线,人形机器人的终极形态就会出现, 实现晚于量子计算和核聚变。 像漫威漫画中的钢铁侠一样,人形机器人可能会将可控核聚变视为 能源设备 、作为量子计算 计算单元 ,然后真正实现 一般人型机的形态。


本文来自微信公众号“峰瑞资本”(ID:freesvc),作者:与企业家同行,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com