有一个机器人梦想黄仁勋

2024-12-11

11 月底,在香港科技大学博士学位授予仪式上,黄仁勋将人形机器人与汽车、无人机并列列为未来将大规模生产的三种机器人。


这已经不是黄仁勋第一次在公共场合“支持”人形机器人了。在今年3月的英伟达GTC大会上,黄仁勋和1X Technologies、Agility Robotics、Boston Dynamics、Figure AI、同时登台的宇树等9个人形机器人,发布英伟达人形机器人通用基础模型——Project GR00T。



▲ 在GTC大会上,黄仁勋 直播截图


在后来的许多场合,黄仁勋向公众传达了同样的观点:人形机器人将成为人类生活中不可或缺的伙伴,最终成为汽车一样的主流产品。


黄仁勋也与马斯克不谋而合,从人类未来在人类生活中的重要地位来看。


在2024年特斯拉股东大会上,马斯克还表示,未来“全世界每个人都会想要一台机器人。 ”他认为,人形机器人与人类的比例,至少是2-1,甚至可以达到1-1,未来将有100亿甚至200亿、300亿台人形机器人。在一次采访中,黄仁勋也承认“100年后,人形机器人在街上无处不在”,而马斯克在X上心照不宣地回答说:“人形机器人的普及程度将是汽车的10倍”。



▲在X平台上,马斯克与黄仁勋互动 截图


除了马斯克,黄仁勋几乎成为了人形机器人平台上最拼命的科技巨头。然而,与马斯克更注重制造人形机器人本身,并将其应用于特斯拉的生产和劳动补充不同,黄仁勋更注重制造人形机器人的技术服务提供商。


Deepuu,英伟达机器人和边缘计算副总裁 Talla在东京的一次会议上直言,英伟达瞄准的是一个由“数十万”机器人制造商组成的分散市场,而不是一个由少数主要参与者主导的集中智能手机市场。“我们为机器人提供平台,而不是制造机器人”。


所以,英伟到底想成为什么样的机器人平台?


01 创建人形机器软件生态系统


波士顿动力于2021年发布了一段Atlas跑酷视频,首次在全球范围内掀起了人形机器人的狂热。


在这段视频中,Atlas可以轻松地在各种形状和坡度的踏板之间跳跃、奔跑和上下台阶。但是很多人不知道Atlas在这个惊艳世界的视频背后训练了十几年。


机器人和人一样,需要无数次的训练才能学会走路,积累足够的数据。对于早期的人形机器人来说,积累数据没有捷径,只能通过一次又一次的摔倒来完成。


所以在Atlas早期的训练视频中,我们可以看到它总是跟随着几个工作人员,以确保在它“落地”时及时检查零件。


但是这一过程显然过于漫长,不利于人形机器人的快速发展。 为提高人形机器人的实践效率,人们在AI中、 在大数据、云计算等前沿技术的基础上,建立了一套运用虚拟世界练习人形机器人的方法。


一般来说,人形机器人的练习会经历从Real2Sim(真实到虚拟)到Sim2Real(虚拟到真实)的过程。也就是说,机器人可以在模拟环境中充分学习和训练,然后将数据从真实环境中收集并投入到模拟环境中进行训练,然后将其拉入现实世界进行训练。


由于这个过程中有相当一部分是在虚拟环境中进行的,所以不但能加快训练速度,而且能降低硬件消耗。


在人形机器人领域,英伟达的第一个布局就是建立一套模拟训练设施, 它主要包括虚拟场所建设、人形机器人与环境互动的模拟训练、人形机器人控制计划学习模拟训练,这些都是人形机器人模拟训练场所需要的。


它们分别对应虚拟合作和模拟平台 Omniverse 、用于机器人行为模拟的平台 Isaac Sim 、平台用于机器人算法训练和优化。 Isaac Lab



▲ 英伟达人形机器人软件生态系统,有界UnKnown绘图


Omniverse就像一座城市,有一个形象的比喻。 ,这座城市有高层建筑、繁忙的道路和人类生活所需的所有基础设施,而人形机器人就像生活在这座城市的人一样,穿着城市。 从事劳动活动的梭子。


Isaac Sim就像Omniverse这座城市的健身房一样。 ,人形机器人需要在这个健身房不断磨合各种运动器材,这对应的是人形机器人与环境互动的技能训练。他们需要知道路径规划,比如如何正确。 确实到达了所需的运动器材,并且知道如何使用每种器材。比如看到哑铃就知道是用来抓的,看到跑步机就知道是用来跑的。开发者使用Isaac开发者 Sim可以检测机器人在不同环境下的表现,不需要实际硬件就可以验证机器人的动作和决策。


Isaac 就像Omniverse这座城市的图书馆一样,Lab, 在这个图书馆里,人形机器人需要不断地创新知识,它主要集中在算法开发和训练上。 练习,为机器人提供决策和控制,允许开发者在虚拟环境中开发、检测和优化机器人控制和智能算法。



▲ 英伟达GTC 2024大会,Isaac Digitit在Lab环境中。


所以,Omniverse是一个让机器人学习如何更好地适应现实世界的地方,在这种虚拟环境下,机器人可以进行智力训练和动作训练。基于Omniverse,英伟达开发了机器人开发模拟平台和参考应用Isaac 模块化机器人学习框架,Sim和开源。 Lab。


总的来说,英伟达的人形机器人软件生态可以提高机器人数据训练的效率,降低成本,让机器人在进入真实环境之前,不用在复杂的硬件配置上磕磕绊绊,可以在虚拟世界中进行“训练”。


这一生态的第一批“种子用户”是今年3月在英伟达GTC大会上登台的9个人形机器人。


在这样一套模拟系统的配合下,英伟达发布了一个智能通用大模型。——Project GR00T与迪士尼动画《银河护卫队》中的小树人格鲁特同名,这意味着人形机器人可以像动画中的格鲁特一样拥有非凡的力量。


GROOT促使机器人理解和处理自然语言,并具有多模态感知能力,即它可以通过视觉、听觉等多种感官输入来处理信息。


但是做软件生态,还不能满足英伟达这样一家以芯片起家的企业的欲望。


02 人造机器人工“芯”


对英伟达而言,企业的核心始终是硬件,是GPU。


因此,在人形机器人领域,黄仁勋也希望在游戏中保持英伟达,在AI领域。、智能化汽车领域的神话,做出遥遥领先的芯片。


一个人形机器人也由多个“芯片器官”组成。每个芯片都负责不同的任务,让机器人像人一样思考、感知、行动、交流和生活。人形机器人需要包括中央控制、运动、视觉、语音、传感器和通信处理芯片在内的6-8种不同类型的芯片,以完成全身调度、环境感知和与人类的交流。



▲ 人形机器人所需的芯片,有界UnKnown绘图


而且在这些芯片中,有两种是比较关键的。一个是控制机器人运动路线的芯片,另一个是帮助机器人思考的芯片。


以特斯拉的人形机器人Optimus为例。这两个芯片都是由特斯拉汽车使用的FSD自动驾驶芯片和特斯拉训练自动驾驶开发的DOJO芯片制成的。


就自动驾驶芯片而言,英伟达一直遥遥领先,其最新发布的DRIVE AGX Thor可以提供高达2000TFLOPS的计算率,是目前计算率最高、效果最好的自动驾驶芯片。


而且英伟达的人形机器人芯片也和Thor一样。


华尔街日报今年11月中旬报道,英伟达计划在2025年推出面向人形机器人的专用芯片Jetson Thor,它在机器人行业的快速增长中占有一席之地。


Jetson Thor具有高性能AI推理能力,支持GR00T等多种模式的生成AI模型运行,选择英伟达最新的Blackwell架构,并配备Transformer引擎,可以支持人形机器人在视觉、语音、触觉等多种模式下的交互,提高其与人类的自然交流能力。这个芯片平台也是英伟达第一次公开宣称专门为人形机器人设计。


Jetson是英伟达的旗下公司。 AI 除机器人外,应用设计的紧凑型计算机平台还应用于无人机、智能家居、医疗设备、工业自动化等场景。


Jetson平台最早可以追溯到2014年,这也是英伟达在机器人领域规划的开始。


今年,物联网、边缘计算、人工智能和机器人技术开始崭露头角,市场对与之匹配的芯片需求不断扩大。与此同时,今年人形机器人也逐步投入初步应用。 今年,软银推出了Pepper,这是世界上第一个可以识别和回应人类情绪的商用人形机器人;法国Aldebaran 开发NAO机器人的Robotics公司开始进入教育行业,帮助学生学习编程、科学和数学。


同样在这一年,英伟达推出了Jetson。 TK1芯片,它具有更强的图像处理能力和AI处理能力,采用基于Kepler结构的GPU,并与ARM结合。 Cortex-A15 CPU,适用于低功耗设备。虽然不是直接针对人形机器人,但它为人形机器人处理复杂的视觉感知和计算提供了硬件支持。


接着,几乎每隔一两年,英伟达Jetson系列就会推出新产品,其中Jetson Xavier 还有Jetson 关于人类的Orin系列。 支持形机器人的发展, 而且他们都是推理芯片。



▲ 介绍英伟达Jetson芯片应用


虽然Jetson AGX Xavier和Jetson Orin系列适用于机器人领域,但不是专门为人形机器人设计的,它们也适用于无人驾驶、自动驾驶等商品。


Jetson计划于2025年上线。 根据英伟达官方的说法,Thor是专门为人形机器人设计的,Jetson 通过英伟达最新的Blackwell架构和Transformer引擎,Thor可以执行复杂的任务,并与人和机器安全自然地交互,它可以支持人形机器人在视觉、语音和触觉等多模态感知下的交互,提高与人类的自然交流能力。


03 结语


在黄仁勋辉煌的历史中,人形机器人并非黄仁勋首次进行趋势预测领域,曾连续两次“押对宝”。


一九九九年,中央处理单元(CPU)它仍然是计算机系统的核心。尽管图像处理的需求不断增加,但CPU主要负责包括图形渲染在内的所有计算任务。当时,虽然图形显卡市场也在发展,但大多数显卡只能提供基本的2D图形渲染,很少有3D加速能力。


今年,黄仁勋推出了GeForce GPU系列,发布GeForce256,成为世界上第一个GPU,也是第一个支持硬件加速实时3D图形渲染的图形控制部件。


它给玩家带来了前所未有的流畅感受。根据1999年《英伟达中国》关于这款GPU的相关文章描述, 结合GeForce256游戏《虚幻竞争》 作为第一批具有真实反射效果的游戏之一,技场在发行的第一年就卖出了超过100万份。[1]


黄仁勋于2006年发布并行计算平台和编程模型“CUDA”,促使GPU有能力处理通用计算任务,CUDA的发布被夸大为一场“灾难”。 如果把GPU描述成一个拥有成千上万工人的工厂,可以驱动工人同时处理成千上万的图形像素,那么CUDA就像这群工厂工人的管理系统,它不仅可以制作图形 就像渲染一样,还可以进行科学计算,分析大数据,训练AI模型。


黄仁勋这两次都赢得了芯片。


那么,在人形机器人领域,除了模拟训练平台,黄仁勋为人形机器人的“新品类”打造的“核心”能否让英伟达再次站在新时代的高点?


也许,在不到100年的时间里,你可以看到人形机器人走在街上。 。


参考资料:


[1]:英伟达中国“生日快乐!一九九九年世界上第一个GPU问世!


本文来自微信公众号“有界UnKnown”,作者:有界UnKnown,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com