为宇树提供“大脑”的具身智能企业获数亿元融资 红杉中国参与投资

1天前
2026年,投资人对具身智能的投资逻辑发生转变:他们希望看到机器人能在“某一项具体工作”中获得客户的复购。

文|富充


编辑|苏建勋


在我们对具身智能公司“中科第五纪”进行访谈的过程中,先后发生了两件事。


第一件事是,2026年1月,中科第五纪获得宇树科技“核心生态合作伙伴”的称号。在To B及工业场景中,中科第五纪目前是宇树机器人的“大脑”模型供应商。


第二件事是,中科第五纪近期接连完成Pre - A及Pre - A+轮融资,两笔交易在一个月内完成,融资规模达数亿元。其中,Pre - A轮由红杉中国领投,东方富海跟投;Pre - A+轮由芯能创投、优山资本联合领投,清控金信跟投。


中科第五纪创始人兼CEO刘年丰认为,这两件事之间存在关联,核心逻辑是一级市场对机器人的认知变得更加务实了。


“去年,投资人更倾向于通用的具身智能叙事,比如喜欢‘既能搬箱子、又能收拾桌子、还能叠衣服’的机器人。但现在更看重能否先深入垂直类场景,并且让客户愿意复购。这关系到商业化能力,也关系到能否用数据飞轮突破真机数据不足的瓶颈。”刘年丰向《智能涌现》介绍道。


中科第五纪与宇树的合作,正是这种“身体+大脑”分工模式的落地。自2025年起,双方就已逐步在电力巡检、工业等场景开展测试验证和落地工作。



△采用中科第五纪“具身大脑”的宇树机器人正在展示工业场景的搬运工作,图片:采访人提供


除了以“宇树大脑供应商”的身份进入场景外,中科第五纪也直接面向行业客户提供完整的机器人解决方案。


在北京的办公室里,我们见到了中科第五纪为一家头部央企客户定制的机器人。这款红色涂装的机器人,即将进入零售门店承担货品销售工作,未来还将进入加油站为汽车加油。此外,为行业客户的检测、搬运订单也已逐步推进。


中科第五纪成立于2024年9月,成立一年多便拿下宇树等多家知名企业客户。提及接订单的方法,刘年丰表示,现在找客户不难,难的是供给——“每次拿大订单都要与众多对手竞争,为客户的场景做POC,经过数轮可靠性、鲁棒性和稳定性的测试,通过测试的才能留下来。”


刘年丰透露,现在看似很多具身智能公司进入了场景,但真正能把活干好的并不多。“比如在工厂里搬运料箱,光线变化、料箱外观和尺寸有所不同,机器人就无法识别,导致任务失败,”他说。


这种“认得出、干得了”的能力,源于中科第五纪的技术团队。


在算法方面,团队核心成员均来自中科院自动化所。除刘年丰外,联创及算法总监刘京、青年首席科学家黄岩均为谭铁牛院士的博士生,深耕人工智能与多模态智能领域,毕业后曾就职于微软、华为等企业;联创曹恩华为中科院自动化所硕士,曾任阿里达摩院算法专家。


团队自研的超少样本具身操作大模型“FAM系列”采用“二次预训练”和“热力图对齐”技术,让模型在执行任务时更聚焦局部关键点。例如,搬运料箱时优先关注把手,而不是依靠堆积大量不同颜色、新旧程度的料箱图片来“记住外观”。


刘年丰称,这套方法使机器人只需最少3到5条真机示范数据就能完成新任务学习,基础任务成功率可达97%。


中科第五纪的硬件能力来自清华大学团队。清华大学长聘教授孙富春担任中科第五纪联合创始人兼首席科学家,其师生团队为公司提供硬件和运控能力的支撑。


以下是刘年丰的采访实录,对话经过作者整理:



△中科第五纪轮式双臂机器人,图片:采访人提供


从“通用的大脑”到“在垂直领域真正干活的大脑”

智能涌现:成为宇树“核心生态合作伙伴”意味着什么?


刘年丰:成为宇树“核心生态合作伙伴”,意味着我们的具身智能模型能够与宇树的高性能机器人平台深度融合。宇树机器人在运动控制和硬件设计上具有领先优势,出货量持续增长。作为生态伙伴,我们将自研的具身大脑集成到宇树整机中,赋予其执行复杂任务的能力。这种模式下,可使机器人更快地进入工业、巡检等实际作业场景,宇树的规模化出货也带动了我们的业务落地。


智能涌现:在具身智能大脑方面有优势的公司有很多,为什么是中科第五纪成为宇树的模型供应方?


刘年丰:宇树的合作,也是从众多头部具身企业中竞争胜出的。


宇树之前接触过不少头部大脑公司和高校研究机构,有很多模型能力也不错。我们之所以能胜出,核心原因有两个,一是我们的大脑能力扎实,尤其是通过小数据量样本快速学习的能力;二是我们具备快速交付落地的执行力,同时团队也拥有丰富的产品经验。


智能涌现:你说帮助宇树做电力巡检,但行业内一些公司已经进入这个场景了,你们的优势或者差异化在哪里?


刘年丰:传统的巡检只能“看”,发现问题后还得派人去解决。我们的目标是巡检加操作——巡检到点位后,直接完成操作,比如掏钥匙开柜门、按开关、拔插头。


传统的电力巡检使用的是四足机器人,但这些操作需要类人的构型。在最近的电力智能巡检大赛中,我们的机器人实现了跨站室迁移成功率90%、新柜型示教少于10次、末端定位精度±15mm的严苛指标,验证了落地的可行性。


智能涌现:给四足机器人加个手臂不能解决这个问题吗?


刘年丰:不太可行,主要有两个原因。


第一个就是马斯克所说的,我们人类的世界是为人类设计的。有很多设备是按照人的身高设计的,四足形态的机器人很难够到2米高的电柜。


第二个问题在于,四足机器人加双臂是一种非标的构型,我觉得我们做机器人公司,一定要避免按照非标的构型思路。因为非标意味着无法放量——今天臂长要1.5米,明天要2米;今天精度0.1毫米,明天要1毫米——这样就会导致产量上不去,成本降不下来,算法也无法复用。


行业应该先“收敛”到标准硬件构型,比如至少上半身双臂可以达成共识。再解决不同负载、节拍的泛化问题,而不是总是用新构型来解决问题。


智能涌现:无论是面向宇树还是整机客户,中科第五纪提供的确定性其实都围绕着“进入场景”的能力,投资人现阶段认可的也是这一点吗?


刘年丰:是的,之前行业可能追求的是一个“既能搬箱子、又能收拾桌子、还能叠衣服”的通用模型。


但比起一个遥远而终极的通用智能,我们一直坚持做能够在垂直领域、具体任务中落地的模型,比如至少能把工厂搬料箱这个问题真正解决。今年一级市场也意识到了这一点的重要性。


技术核心:小数据量样本、高数据使用效率

智能涌现:包括中科第五纪在内,最近采访的多家具身智能公司都说自己的机器人在工业场景搬箱子。但你提到,即使这个看似简单的任务,真正能做好的企业也不是很多,所以从模型能力来看,具身机器人搬箱子的难点是什么?


刘年丰:看似搬箱子是一个单调重复的工作,但其实存在多个难点。


第一是泛化:料箱颜色、尺寸、新旧程度都不同,能否用同一个模型稳定完成识别、抓取与搬运。第二是导航:搬起之后从A点到B点怎么走,路径规划、避障,途中被打断后能否继续完成任务。第三是策略理解:比如“从面前100个箱子里搬走50个”,机器人能否理解数量、以及该选择哪50个箱子,到目的地怎么码放,以及放下后要不要把物体取出等等,每个环节都存在问题。


这些看起来是搬箱子,背后其实是一整套复杂的任务规划与执行。


智能涌现:刚才你说到料箱的泛化性,感觉箱子已经是外观比较简单的物体了,为什么光照变化,具身智能模型的辨认就变难了?


刘年丰:最本质的原因就是,我们现在具身模型主流使用的VLA,沿袭了动态模型和大语言模型——对整张图片做全局信息映射。


举个例子,比如拍一张有三瓶矿泉水的照片,白天和晚上光线不同,整张图片的色温、亮度都变了,模型可能就不认识了。


问题在于,具身智能没有大模型那样的数据体量去覆盖所有光照变化。但换个思路,如果模型能关注局部信息——比如只锁定每瓶水的外观特征,而不关心背景、光线、桌子颜色——就能避免被全局变化干扰。这正是我们做“热力图”的出发点:让模型聚焦操作对象本身,而不是整个画面。


智能涌现:具体讲讲中科第五纪的模型是如何提高泛化性的?


刘年丰:操作的核心是操作对象,但以前的主流模型太关注全局信息。我们的思路是:通过多个二维热力图,把要操作的对象位置自适应地学习出来,让模型意识到什么是最需要响应的操作对象。



△中科第五纪FAM模型图,图片:采访人提供


热力图可以理解为一张“重点标记图”——图像中颜色越深的区域,代表模型应该越关注。比如指令是让机器人开办公室门,它会重点盯着门把手,而不是整扇门——不管门是木门、玻璃门还是什么颜色,只要把手在那儿,它就知道怎么操作。回到工厂搬料箱的场景也一样,模型关注的是把手,不是整个料箱,更不是整个视野里的工厂。


这是通过“二次预训练”实现的,第一次预训练,我们让模型知道各个物体是什么;第二次预训练,我们通过“热力图”让模型重点关注操作对象,让模型学会分辨“什么才是当前任务最重要的东西”。


智能涌现:所以你之前说拿到宇树订单的原因之一在于,FAM模型能通过小数据量样本,快速实现新任务学习,正是因为你们的技术方法比较节省数据?


刘年丰:是的,当前真机数据不足是行业共识。


我们的解决方法之一是通过“二次预训练”提高模型对重点操作对象的关注,可以提高数据使用效率,节省大量预训练数据。


此外,我们重视进入场景,也是因为可以通过实际工作的数据飞轮,把真机数据运转起来。


商业化展望:“复购”至关重要

智能涌现:具身智能行业从去年下半年开始,就非常注重“商业化落地”,但你指出今年更考验的是“复购”?


刘年丰:对。2025年,我们看到很多机器人看似进入了工作场景,其实还是在POC(概念验证)阶段。到了2026年,考验的是复购,像搬箱子这样的场景,要在2026年被彻底解决。


智能涌现:今年彻底解决搬箱子这个任务之后,在工业场景里,下一个被具身智能企业集中探索,且可能被解决的工作是什么?


刘年丰:有很多,比如移动分拣,这是一种更精细的搬箱子。需要把箱子里面的某些特定的东西,拿到特定的位置去。这一大类任务,无论是横向(跨客户)还是纵向(跨场景)看,都有极强的泛化空间。


智能涌现:你们的商业模式是怎样的?如何收费?


刘年丰:面向本体公司,我们交付大脑,并按照一个机器人对应一个license收费,现阶段会根据场景和任务的复杂度判断费用。


而面向终端场景客户,我们交付自研的轮式机器人,按照整台机器人收费。未来随着供应链愈加成熟,整机的价格会进一步下降,客户也会看到更好的ROI数据。


智能涌现:中科第五纪既给客户提供“软”的部分,也自己做软硬一体的机器人。所以最后公司的商业模式究竟会更偏向哪条路?


刘年丰:我们的最终定位是软硬一体的公司,我们也认为具身智能的关键在“脑”不在“型”。可以参考苹果,最核心的竞争力不是摄像头、不是主板,而是操作系统和生态。这条路虽然难,但也是我们想走的路。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com