英伟达开始了机器人
春节前夕,黄仁勋像往常一样开年会巡演,北京站成为各行各业CEO偶像化现场。在大照片中,坐在黄仁勋左边的是宇树科技的王兴兴,第一排最右边的是银河通用的王鹤。
三人曾经在年初的CES展上举行过一次“非正式会谈”。当时黄仁勋的演讲结束了,人形机器人军团压轴登场,包括春晚宇树转手帕的H1。、Galbot银河通用 G1。


2025年英伟达年会和CES展览
在新闻发布会上,14个人形机器人排成一排,包括波士顿动力等老牌玩家,宇树等行业新贵,跨境玩家小鹏。只有特斯拉在购买黄色整体芯片的同时,才悄悄从事自主研发。
黄仁勋在机器人军团压轴出现之前,公布了一系列由大型机器人训练平台组成的机器人训练平台Cosmos。
Cosmos的功效可以简单理解为在虚拟世界中模拟真实的物理环境,针对目前人形机器人行业的真空带,也是英伟达围绕人形机器人规划的最后一个环节。——仿真数据。
三个月后,英伟达GTC,机器人再次成为压轴节目。除Cosmos再次刷脸外,英伟达还发布了一款基本的人形机器人模型Isaac GR00T N1,模拟概念模型Newton,由小机器人Blue完成。

Blue(右)机器人
如果人形机器人被视为人工智能领域正在疯狂建设的高速公路,那么英伟达正在做的就是提前修好收费站。
模拟五年高考三年
英伟达真正的关键字是“物理AI”,从年初的CES到前两天的GTC。
根据黄仁勋的说法,AI的新浪潮是物理AI,其重要环节是让AI了解物理定律,而人形机器人是目前最重要的媒介。
大多数传统的工业机器人都是基于特定的计划来执行特定的操作,比如运输和分拣,而不是机器人,而是一种“自动机械”。
但是人形机器人在理想状态下,能够理解物理世界各种物体、语言和文字的含义,并且能够独立规划和决策。
2023年7月,《纽约时报》探班谷歌实验室,记录了一个基于RT-2模型机器人智能闪光的瞬间: 桌子上有三个塑料玩具:恐龙,鲸鱼,狮子,工程师让机器人“捡起灭绝的动物”,机器人拿起恐龙。
这一案例很好地反映了人形机器人最大的变化:机器人不仅可以识别三种动物,还可以理解“灭绝动物”的含义,并且可以完成具体的操作。

机器人基于RT-2模型
换句话说,两者的核心区别在于“智能”。判断机器人的智能化程度,不是看它是否会在前后空翻,而是看它是否能像人一样思考。
就像大模型训练一样,使机器人具有思考能力的过程,同样是对数据的消耗——换句话说,就是做题。
人工智能大师李飞飞对算法的训练过程有一个生动的解释:让算法不断观察包括猫和其他动物在内的图片,并在每张照片后面写出正确的答案。每次电脑看照片,都会和背面的答案核对一次。只要有足够的频率,算法就能学会识别猫。
但是问题是,写完答案的照片并不是现成的。
与GPT等大型模型抓取互联网数据不同,机器人会与现实世界互动,因此需要遵循物理规则的真实数据来训练算法。但是,如果用真人动作捕捉来训练,不仅成本高,而且很容易成为真正的“AI奴役人类”地狱笑话。
数据空白已经成为模拟数据的实践空间。所谓模拟数据,可以简单理解为在虚拟空间中构建遵循真实世界物理规则的场景,并将其输出为可用于训练的数据。
马斯克就是模拟数据的铁杆粉丝,2021年的特斯拉AI Day,马斯克公开了自己的数据模拟模拟。当时生成并投入训练的模拟数据已经达到了37.1亿张图片和4.8亿张标记[2]。XAi最新发布的Grok 还投喂了大量的模拟数据进行训练。
自动化驾驶仍然可以收集车主真实的驾驶数据进行训练,机器人还没有大规模投入使用,对模拟数据的需求更加迫切。
真实数据和模拟数据就像“五年高考”和“三年模拟”,一个是真题,一个是模拟题。真题参考价值更高,但数量不多,模拟题数量充足,但参考价值取决于其与真题的相似程度。
到目前为止,英伟达已经聚集了人形机器人开发的“三大件”——超级计算机DGX(训练算率)、Omniverse(训练数据)是Cosmos的模拟平台。、Jetson终端芯片 Thor(推理算率)。
除无结局造机器人外,能做的工作基本都做了。
物理学骗术和算率游戏
英伟达的积累可能比大多数人想象的要强烈,因为虚拟世界建立了物理规则。
一项技术的应用并不取决于技术本身,而是能否将高商业价值的场景捆绑起来,实现自我造血的良性循环。在机器人和自动驾驶大规模工业化之前,最符合这项技术的英伟达的老本行:游戏。
大多数游戏都是模拟现实世界的,但虚拟世界不遵循现实世界的物理规则。从游戏世界的草叶飘动方向到服装面料的褶皱,再到刀剑挥刀的范围和反馈效果,都会影响游戏的“沉浸感”。
由此产生了一种改进思路:为何不使用物理公式来计算物体的实时运动状态,设计运动轨迹?
当时,一家名为Ageia的创业公司开发了游戏引擎PhysX,通过实时循环计算“应力分析->带入运动方程->更新定位信息->导出”,让游戏中的场景尽可能符合现实世界的物理规则。
Ageia还专门开发了配套硬件PPU,因为PhysX需要大量的计算率。(Physics Processing Unit)主要负责物理计算。遗憾的是,PPU销量惨淡,Ageia濒临破产,黄仁勋骑着白马来了。
收购完成后,英伟达做的第一件事就是砍掉PPU产品线,把PhysX的计算工作交给自己的GPU,并推出PhysX软件工具箱。 APEX,降低使用门槛。
由于PhysX的特点是模拟和模拟物理规则,在接下来的几年里,英伟达还推动了PhysX在医疗手术、影视特效等工业场景中的应用。
英伟达于2019年将RT核心引入GPU架构,推出了光跟踪功能。
类似于PhysX,光线追踪的关键也是对真实物理规则的模拟——根据物体、光源和障碍物之间的位置关系,实时计算出光线反射到人眼的状态[4],每束光线实时计算结果形成一帧的场景,让英伟达展现出计算能力的肌肉。
随着自动驾驶、人形机器人等新兴产业的出现,对“虚拟世界模拟物理规则”的需求日益增加。
Cosmos和Omniverse等软件工具的出现,相当于英伟达为人形机器人建造了一个可以沉浸式训练的“健身房”,下面就可以出售“私教课程”了——你觉得我的芯片怎么样?
英伟达的野心
在过去的二十年里,英伟达的经营理念可以用一句话来描述:使高性能计算不断地覆盖高颜值场景。
GPU是高性能计算的载体,也是英伟达的核心产品。尽管有些学者在2010年之前就开始使用GPU来训练神经网络,但是GPU对应的高价值场景实际上只有一个游戏。
根据黄仁勋的说法,游戏行业 它不仅代表着最棘手的技术难题,而且具有惊人的市场规模,同时具有这两个特点的市场极为罕见。
移动终端是英伟达开发的第一个新场景。小米3于2013年发布,Cpu选择了高通骁龙800与英伟达的Tegra系列混搭,这是英伟达切入手机行业,在显卡之外开拓第二战线的绝佳机会。
那时候,英语不好的雷军和中文不好的黄仁勋很少同场,黄仁勋现场还当了一次米粉。

2013年小米3发布会
遗憾的是,由于工艺和插件基带问题,Tegra芯片的能耗失控严重燃烧。从那以后,英伟达的移动业务一直没有改善,Tegra系列只能在任天堂Switch上发挥余热。随后,黄仁勋去台大演讲,称英伟达“主动放弃”了智能手机市场。
另一个场景是自动驾驶。特斯拉是第一个吃螃蟹的人,Model S/X都配备了英伟达的计划。黄仁勋也从米粉变成了特斯拉车主,与马斯克亲密无间。

在社交平台上,黄仁勋分享了他的Model X
虽然特斯拉后来用自主研发计划取代了英伟达,但凭借榜样的力量,英伟达成功进入了造车新势力的内部。但在英伟达的版图中,汽车业务远不如游戏和数据中心耀眼,营收占比几乎从未超过5%。
三是人工智能。ChatGPT的诞生,让英伟达彻底打开了收入的天花板。英伟达的芯片是计算机视觉、大语言模型等前沿计算机科学不可或缺的,也让后者成为世界上市值最高的半导体公司。

马斯克作为OpenAI董事长,于2016年签署了英伟达DXG-11
四是人形机器人,以及更广阔的“物理AI”场景。按照黄仁勋的说法 ,"我们正处于生成式人工AI阶段,将进入智能体AI时代,然后是物理AI时代."
但在具体思路上,英伟达不仅提供芯片,还开发相应的软件工具箱和配套服务。换句话说,英伟达不仅卖铲子,还提供全套维护工具和保护设备,但必须与英伟达的铲子相结合。
在游戏业务中,光跟踪、DLSS等功能必须与英伟达的GPU结合使用;同样,英伟达不仅向大型和云计算公司销售GPU,还提供通信连接方案NVLink和CUDA编程平台与之紧密联系。
由于今年GTC演讲结束,Cosmos、Newton等软件和模型发布,一个以GPU和“物理AI”为主的收费站也宣布了峻工。
假如黄仁勋的中文水平足够高,多少也要说一句“英伟达不造机器人,协助机器人公司建造机器人”。
参考资料
[1]未来简史,尤瓦尔·赫拉利
[2] 万字长文详细介绍特斯拉的自动驾驶系统,自动驾驶的心灵
[3] 给我一个游戏引擎,我也可以“预测”世界杯?中国科学院物理研究所
[4] “光跟踪”杂谈,电子报纸
[5] Unimate 机器人:工业自动化的起源,AGV
本文来自微信公众号“远川科技评论”(ID:kechuangych),作家:何律衡,编辑:李墨天,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




