在“通用”之前,苹果手机已经使用了15年,机器人需要多长时间?

04-30 09:35

AI的流行到智能的流行,再到今年的CES,老黄以“美国队长”的形象举起了人形机器人,仿佛“机器人养老”和“机器人做家务”的时代即将到来。


但现实很快给了这个想象一记耳光。就在不久前举行的第一场全球人形机器人半程马拉松上,机器人甚至很难完成“连续行走”的通用化第一步。理想与现实的差距让公众开始质疑:我们离第一个真正的通用机器人有多远?有哪些路径可以让我们更接近“通用”的目标?



腾讯科技“具身之路”系列直播第二期,腾讯科技邀请了腾讯科技。赵哲伦维他动力创始人“九只机器狗”的主人,零零后CEO、前STARY电动滑板品牌创始人张振尧和CEO陈正翔是硬件工程师,探讨智能的实用起点和实现通用机器人的有效途径。其中,维他动力创始人赵哲伦从产业化和商业化的角度分享了他对通用机器人发展的理解和思考。


维他动力(Vita Dynamics)它是一家机器人公司,于去年12月在北京成立。它的三位创始人是地平线前智能驾驶总裁余轶南和前理想汽车智能驾驶产品总监赵哲伦,前地平线软件平台总架构师宋巍。核心业务是将机器人产品交付给C端用户。


赵哲伦在本次直播中分享的核心观点如下:


1、通用机器人的发展路径,类似于从PDA到iPhone的十五年智能手机的演变,必须依靠底层技术的成熟和应用领域的迭代,不可能一蹴而就。


2、要真正落地机器人产品,必须把握原理技术向工程技术过渡的临界点,结合场景拆分、移动和操作技能,优先实现自然交互。


3、机器人产品交付应优先从简单、容错率高的任务入手,逐步验证PMF,沿着“低复杂性、低风险”到“高复杂性、高风险”的路径拓展应用边界。


下面是赵哲伦的观点整理:


要走向通用,首先要交付商品


其实我特别想问你一个问题:机器人实现“通用”需要多少年?五年内?十年内?还是十几年?另外,未来的“通用机器人”一定是人吗?


创业,做产品落地,必须面对的现实问题是——究竟能否做出真正有用的商品。所以我经常问自己,什么是“通用”?为什么人形机器人“通用”?是因为它“像人”,能适应很多环境吗?我们身边有哪些真正通用的东西?手机,电脑,还是人本身?


我认为手机可能是一种非常典型的通用产品。它是一个“通用信息终端”,我们可以通过它完成我们所有的信息交互、内容获取和数据接收。它之所以这样成长,是因为它恰好是最适合用手握住的,也方便放入口袋。这一设计与今天大家对人形机器人的看法非常相似:因为它是服务人员,所以要“像人”。



谈到手机,我们都知道2007年iPhone发布后,手机的形态基本定型。但是如果我们向前看,事实上,在1992年,苹果发布了第一款PDA产品“牛顿”,尽管它并非由乔布斯主导。之后PDA真正做得更好的是美国的Palm公司。那时候北美的PC普及率已经上升,所以自然有人想:“能不能把电脑放进口袋?“这实际上是“掌上计算机”或“通用信息终端”的原始设想。但是这个想法真的落地了,花了15年。


当时PDA的很多技术条件还不成熟:屏幕是黑白的,没有很好的显示能力;电阻触摸笔,没有电容屏;不能安装相机,不能拍照;没有内容生产能力;存储能力差;电池寿命也不好。因此,这个“通用终端”最终能够形成,是由于技术的逐步积累。


过去15年发生了什么?通讯技术从1G开始、随着2G逐渐发展到3G,手机硬件开始支持触摸和安装摄像头;随身听(如Walkman)促进了电池和存储的发展;手持游戏(从GameBoy到PSP)促进了显示和计算的发展。最终,这些领域的进步汇聚到一个时期,就像乔布斯一样,有一个人理解人文和技术。只有把它们整合起来,真正通用的信息终端iPhone才会出现。


在我看来,今天的机器人肯定会到达那个目的地,但在这个过程中,会有大量的垂直和有价值的中间产品。每一代都可能是服务于不同场景的优秀产品。


我一直认同Steve “Jobs的名言:”Real artists ship”,真正的创造者是要把商品做出来的。而且现在流行的那句“先做个垃圾,再迭代”,其实也挺有道理的。在不断迭代、打磨之前,你必须先“上道”。



前几天刷了一张小红书的海报,讲的是产品迭代路径:不是从一开始就做了一辆完整的车,而是从滑板车开始,逐渐演变。我非常同意这个想法。对于我们这样的C端机器人公司来说,一个特别的核心是“沿途生蛋”。


根据我们过去5-10年的自动驾驶经验,比如L2级高速NOA。、随着芯片能力、信息量和算法能力的发展,城市NOA等很多都在逐渐实现。中间的每个阶段都是“生蛋”,产生了具体的价值,积累了商业闭环所需的能力。这是一个现实的过程。


所以我觉得短时间内做一个完全通用的机器人是不现实的。那么我们如何选择机器人呢?我认为底层可以分为三个部分:


首先,自然交互;


其次,独立移动;


三是自主操作。



这三种能力的组合和不断增强是智力真正产生价值的基础。在这些基本能力的不断演变中,未来的路径自然会一步步接近普遍性。


走向通用的有效途径有哪些?


在我们心中,一直有一个明确的划分,那就是技术大致可以分为两类:一种是“原理技术”,另一种是“工程技术”。


其实大家都很清楚,原理技术更多的是科研热点,它的目标可能是实现0到1的突破——即使通过率只有1%。、2%,只要能跑一次,即使在科研方面完成了任务。


但是如果我们真的想把产品交付给用户,我们需要的是工程技术。这项技术的要求是,你必须将通过率从90%提高到99.999%,然后你可能需要更多的9。因为一旦你想给用户一个具体的价值,它的错误率必须足够低,才能有真正的商业意义,这是一个非常核心的区别。


我们今天如何看待这件事?如果把机器人拆分成几个关键模块,我们认为像四条腿和爪子这样的技术已经到了可以从原理过渡到工程过渡的阶段,是有机会推进的。像两条腿走路和灵巧的手,还停留在实验室阶段,相对不完善。


举几个例子,其实有些领域已经从原理阶段过渡到工程阶段,比如大模型驱动的自然语言交流。比如我熟悉的城市智能驾驶,以及Chatbot等大型应用,已经开始大规模落地,比如高速智能驾驶,现在已经成为十几万级车辆的必备品。这些AI能力已经实际应用到用户端,已经从科研走向应用。


在“从0到1”的创业过程中,我们选择了以下策略:我们制造产品的基本逻辑是从那些原理型技术转化为工程化的“临界点”,进行落地。


但是在落地场景中,我们从一开始就把场景分为两类:一类是outdoor,即自然环境;另一类是indoor,也就是人类建造的空间。



谈到这里,我不得不提到:我曾经是Elon。 十年前,Musk的铁粉飞往美国参加Cybertruck的新闻发布会。


Elon总是要把机器人做成“人形”。


但是现在我也开始有了一些新的想法。比如我们今天讨论的人形机器人,很多逻辑其实都是围绕着“人创造的世界”,我们的大部分生活空间,比如桌子的高度、椅子的大小、橱柜的等级,都是围绕人臂的展示和腿的长度来设计的,所以人形机器人自然适合室内环境。


但是一旦你离开建筑,进入户外的自然环境,人类就会失去一些优势。人类从四条腿到直立,是一个不断失去户外生存能力的过程。在自然环境中,如果机器人有四条腿和全地形运动能力,它实际上更有优势。


所以我们在寻找情景时,也在分解能力的分布。——outdoor更注重自主移动的能力,而indoor更依赖于自主操作的能力。这是一个自然分化的想法。例如,在室内,大多数情况下,轮子可以解决问题。事实上,轮式机器人已经足够应对上楼、下楼、擦桌子、送外卖的场景。相对来说,移动的需求没有那么高。


另外一个关键点是自然交互。无论在什么情况下,自然交互必须是机器人的核心交互技术。每一代爆炸性产品的出现往往伴随着交互界面的变化。比如乔布斯定义了GUI(图形界面)。如今,机器人最理想的交互技术一定是AI。 自然语言交互的native(NUI)。


我们现在正在做的四足原型机,第一个开发能力是“跟随”,第二个是“自然语言交互”。因为当你发现机器人可以跟着你的时候,你自然不想拿出手机来控制它,也不想拿起控制器。你只想直接对它说“离我近一点”或者“离我远一点”。这是人们对智力的自然期待。


从我们的角度来看,户外场景更需要的是重量、独立移动和全地形能力;室内场景更需要的是操作技巧,比如做家务。其实做家务不需要四足机器人;如果你想出去跑腿,你不需要你的胳膊。我们目前的策略是把这两个能力栈分开,有选择地集中精力,既保证了一定的实用性,又降低了商业路径中的复杂性和成本。


简单的低风险任务优先完成机器人产品交付。


接下来,我们来谈谈机器人产品交付的优先顺序。现实中,我们家有各种各样的任务,比如清洁、整理和储存。除了清洁地面的机器人,其他大部分任务都没有被机器人真正解决。



我们可以用二维坐标来理解任务分布:横轴是任务的复杂性,纵轴是错误的容忍度。比如把衣架上的衣服拿下来扔到沙发上,任务不复杂,出错成本低,就算掉在地上也没关系;但是机器人叠衣服特别难,因为它涉及到复杂的形态识别和操作计划。


假如机器人在厨房里拿着一把刀,或拿着一个玻璃杯,那就完全不同了——一个错误可能会带来很大的损失。因此,我们倾向于优先考虑“左下角”的任务,即简单且容错率高的任务,通过这些入口切入用户生活,然后慢慢扩展到“右上角”的高复杂、高风险的任务。


这是我们长期做自动驾驶带来的探索路径:不要一下子冲到顶端,而是“从左到右延伸”。当然,科研挑战可以直接与右上角进行比较,但商业化必须从最划算、最容易验证PMF的点入手。


比如在有宝宝的家庭里,玩具经常被扔得到处都是。机器人能帮忙整理吗?比如沙发上堆了一堆衣服,能帮忙做基本收纳吗?这些问题比“帮你在厨房切菜”好得多。这是典型的渐进路径。


本文来自微信微信官方账号“腾讯科技”,作者:小燕,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com