黄仁勋万字采访:我们最终会成为超人,不是因为我们的超能力,而是因为我们非常AI。
一月七日,英伟达CEO黄仁勋做客Huge If 与Cleo主持人True采访 Abram进行了深度对话。
Huge If True 这是Cleo的一档 Abram主持的面试节目,旨在深入探讨科技、创新、社会转型等前沿话题。 Cleo 在之前的节目中,Abram曾经在Vox工作过扎克伯格。(Meta CEO)、Daniel Ek(Spotify的CEO)等待技术领袖。
在一个小时的采访中,黄仁勋回顾了我们今天是如何到来的,是什么洞察力在推动计算机领域取得了如此重大的突破;他谈到了自己对所有正在发生的事情的看法,并大胆预测了人工智能的未来。
起点:起源于游戏。20世纪90年代,电子游戏对3D图形的需求催生了GPU,GPU的核心优势在于其并行计算能力,这与传统的CPU串行处理模式有很大不同。
关键:CUDA的推出,使得研究人员能够更方便地使用GPU的算率,加速人工智能的发展。
突破:AlexNet。2012年Alex Krizhevsky、Ilya Kever和SutsGeoffrey 在ImageNet竞赛中,Hinton提出的AlexNet深层卷积神经网络取得了突破性胜利,开启了人工智能革命的序幕。
如今:AI应用时代。黄仁勋认为,过去十年是人工智能科学的研究阶段,未来十年将是人工智能应用科学的时代,AI将渗透到各行各业。
将来:黄仁勋推测,未来所有的移动设备都将成为机器人,人类将成为“超人”。
黄仁勋推测:所有会移动的东西都会被机器人化,在眼镜、汽车和手机中。
以下是整个面试内容,由腾讯科技编译。为了保证阅读体验,英语口语内容被删除了。本文没有投资建议,只供读者阅读和分享。
我们现在所处的计算领域,从游戏机到计算机,是如何走到这一步的?
主持人:为了讨论我们目前处于人工智能的关键时期,我认为有必要回到20世纪90年代的电子游戏行业。当时游戏开发者想创造更逼真的图形,但硬件能力不能满足他们的需求。当时,英伟达提出了一个解决方案,不仅改变了游戏行业,也改变了整个计算机运算领域。
你能带领我们回到那个时代,解释一下当时的情况,以及是什么样的洞察力促使你和英伟达团队创造了第一个现代化吗? GPU?
黄仁勋:在 90 20世纪初,当我们开始成立公司时,我们观察到软件系统中只有几行代码,可能只占几行。 10% 代码,却完成了 99% 处理任务。而且这 99% 处理任务可以并行完成。然而剩下的 90% 代码必须按顺序执行。事实证明,一台真正完美的计算机是一台可以同时进行顺序处理和并行计算的计算机,而不是一台只能进行处理的计算机。
因此,我们开始建立一家公司,致力于解决普通计算机无法解决的计算难题,这是我们当时最重要的发现。
那就是英伟达的真正开始。
1. 起源于电子游戏
主持人:为什么首先选择游戏?
黄仁勋:电子游戏需要并行计算来渲染 3D 图形。我们选择电子游戏有两个原因:
首先,我们热爱这个应用程序,它本质上是对虚拟世界的模拟,而谁不想进入虚拟世界呢?
其次,我们敏锐地观察到,电子游戏有潜力成为历史上最大的娱乐市场。
事实证明,我们的判断是正确的。拥有一个巨大的市场尤为重要,因为它非常复杂。如果市场足够大,我们的R&D预算可以相应增加,从而创造更多的新技术。技术、市场和更强大的技术之间的良性循环真正促进了英伟成为世界上最重要的技术公司之一。
所有这些起点,都来自于电子游戏。
主持人:听说你曾经说过 GPU 就像一台时间机器?
黄仁勋:是的。
主持人:你们能解释一下这么说的原因吗?
黄仁勋:GPU 就像一台时间机,因为它可以让你更早地看到未来。
一位量子化学家曾经对我说过一句让我印象深刻的话。“因为英伟达的工作,我可以在有生之年完成一生的研究。” 那就是时间旅行。由于我们大大提高了应用程序的启动速度,使您能够看到未来,所以他能够在有生之年完成成本超过他生命长度的工作。
所以,当你做天气预报的时候,你其实是在预测未来;当你进行模拟的时候,比如在虚拟城市进行汽车自动驾驶的模拟测试,我们也在进行时间旅行。
主持人: 因此,并行处理技术在游戏领域取得了巨大的成就,这使我们能够在计算机中创造一个过去无法想象的世界。游戏是并行处理技术最初的最佳应用案例,它释放了巨大的计算率。
正如你所说,后来人们开始将这项技术应用到许多不同的行业。例如,量子研究人员,他就是 NVIDIA GPU 与以前在超级计算机中使用的超级计算机相比,上并行运行分子模拟的速度 CPU 运转速度要快得多。
这项技术也在彻底改变其他行业。2000年初,它开始改变我们对计算机潜力的认识。你看到了这一点,意识到实际上很难做到这一点,因为当时的研究人员不得不“欺骗” GPU,让 GPU 认为他们的问题是图形问题。
黄仁勋:你做了一些研究,完全正确。
2. 什么是CUDA?
主持人:所以你创造了一种让这一切变得容易得多的方法。
黄仁勋:没错。
主持人:具体而言,这是一个名字。 CUDA 这是一个平台,它使程序员能够指示他们熟悉的编程语言。 GPU 执行操作。
这个问题很重要,因为它促使更多的人更容易使用这些强大的计算能力。你们可以解释一下,是什么样的愿景促使你们创造出来的? CUDA ?
黄仁勋:CUDA 一部分来自于研究人员的发现,一部分来自于内部的灵感,一部分来自于解决实际问题。要知道,在这样复杂的背景下,产生了很多有趣的想法。有些想法是出于渴望和灵感,而有些则纯粹是出于危机感来解决问题。
在 CUDA 在这种情况下,情况也是如此。先把我们的 GPU 用于并行计算的外部想法可能来自医学成像领域的一些研究。当时,美国麻省总医院的一些研究人员正试图使用我们的图形处理器 CT 重建。它们的工作给了我们极大的启发。
同时,我们在公司内部也面临着一个挑战:当你想为电子游戏创造一个逼真的虚拟世界时,你不仅希望它看起来漂亮,还希望它能动态变化。例如,水应像真水一样流动,爆炸应具有真正的爆炸效果。
这就是说,你需要进行粒子物理模拟和流体力学模拟。但是如果你的计算过程只能处理计算机图形,那么这些模拟就很难实现。所以,在自己的服务市场中,我们有很强的内在动力来解决这个问题。
另外,一些研究人员也在试图把我们的 GPU 用于加快通用计算。各种因素汇聚在一起,最终促使我们决定付诸行动,并正式开发。 CUDA。
从根本上说,我相信 CUDA 我们知道,我们的资源是成功的,所以我们倾注了整个公司的资源, GPU 它将成为世界上产量最高的并行Cpu,而庞大的电子游戏市场保证了这一点。所以,这一结构有很大的潜力让更多的人受益。
主持人:对我来说,建立 CUDA 正如你所说,如果我们创造了一种让更多的人使用更多计算能力的方法,他们可能会创造出令人难以置信的东西,就像一件令人难以置信的事情一样。然后,它变成了现实。
3. 为什么AlexNet? 如此重要
主持人:2012年,由三名研究人员组成。(Ilya分别是Ilya Sutskever、Alex Krizhevsky 和 Geoff Hinton,现在他们已经成为AI领域的著名人物。 )组成一个小组,提交了一个名字。 AlexNet 参加比赛的作品,参与名著。 ImageNet 竞赛。
本次比赛的目的是建立一个能够识别图像并进行分类标记的计算机软件。它们的作品直接击败了所有竞争对手,并以极低的误差率震惊了所有人。它被称为 AlexNet,这是一种卷积神经网络。
之所以如此出色,是因为他们使用了大量的数据进行系统的训练,而这项工作正在进行。 NVIDIA GPU 上完成的。
突然间,GPU不再只是一个工具,使计算机运行更快,效率更高,而是一个全新的计算模式引擎。我们正在通过展示大量示例来训练计算机学习,从使用逐渐引导计算机。
2012年的这一刻,我们现在看到的人工智能真的开始了巨大的变化吗?你能从你的角度描述那一刻的场景,你认为它对我们所有人的未来意味着什么吗?
当你创造形象时,黄仁勋 CUDA 当你建造这样的新事物时,它们可能不会来,这是悲观主义者的观点。但是乐观主义者的观点会说,但是如果你不建造它们,它们就不会来。它通常是我们看待世界的一种方式,我们应该根据感觉来推断为什么它很有用。
事实上,2012年,多伦多大学 Ilya Sutskever、Alex Krizhevsky 和 Geoff Hinton 开始使用他们所在的实验室。 GeForce GTX 因为他们知道CUDA,并认为CUDA可以作为并行Cpu来训练AlexNet,所以我们的灵感就是CUDA。 GeForce 能成为将这一并行结构带入世界的载体。
同时,我们也在努力解决公司内部的计算机视觉问题,并努力使计算机视觉问题。 CUDA 成为好的计算机视觉Cpu,我们对内部计算机视觉初期项目的进度感到沮丧, CUDA 无法提供更多的帮助。
突然间,我们看见了 AlexNet,这种新算法与以前的计算机视觉算法完全不同,在计算机视觉能力方面取得了很大的飞跃。
当我们看到这一点时,一部分是出于兴趣,另一部分是因为我们也在为工作推进不顺利而挣扎。所以当你看到它的时候。 AlexNet 那时,我们受到了启发。
但是我想说,当我们看到它时,最大的突破是 AlexNet 有时候,我们问自己,AlexNet 能走多远?如果能用计算机视觉做到这一点,能走多远?如果能达到我们认为能达到的极限,对计算机行业意味着什么?计算机结构意味着什么?
如果机器学习能够扩大深度学习结构,那么大多数机器学习问题都可以通过深度神经网络来涵盖,这是我们有理由推断的。
我们可以通过机器学习来解决这么多类型的问题,以至于它可以完全重塑整个计算机行业,这促使我们重新设计整个计算栈,这就是 DGX 来历,而这个小小的来历 DGX 坐在这儿,这一切都来自于我们应该逐步重新设计整个计算堆栈的分析。
你知道,自 IBM System 360 推出现代通用计算 65 到目前为止,我们已经完全重塑了我们所知道的计算方法。
主持人:把这个看作是一个完整的故事,并行计算重塑了现代游戏,并彻底改变了一个完整的行业,随后,这种并行计算的计算方法开始应用于不同的行业。
你通过建立 CUDA 来投资它,随后 CUDA 和 GPU 应用促进了神经网络和机器学习的快速发展,开始了我们现在看到的计算革命。
人工智能和深度学习具有革命性的能力:它能学习和转换几乎任何方法的数据。
1、英伟达的核心信念
黄仁勋:计算机视觉、语音识别、语言逻辑——这些曾经被视为无法解决的人工智能问题,在短短几年内被一个接一个地突破,令人惊叹。
主持人: 是的,我们看到你很久以前就做了一个高风险的筹码。作为一个外行,我觉得这个要花很长时间才能实现,你坚持了多久?
黄仁勋:10年。
主持人:这10年你感觉怎么样?
黄仁勋:那是个好问题。第一,你必须有核心信念。。
我们应该对行业和科学有深刻的理解,但最根本的是始终遵循第一原则。
在实践过程中,有时我们可以找到证据证明方向正确;但更多的时候,我们走了很长一段路却找不到任何验证,所以我们需要适当调整航向。
为何能长期坚持?回答很简单:因为我们对这一方向深信不疑,所以没有理由不继续前进。
我对英伟达的信念已经持续了30多年。我相信我们在创新计算领域所做的一切,不仅在今天仍然有效,而且比以往任何时候都更有价值。
当然,在前进的道路上不可避免地会有很多挑战。但是你必须对未来有信念,继续投资自己。正是这种坚强的意志驱使我们投资了数百亿美元,最终实现了我们的目标。这确实是一个漫长的10年,但整个过程充满了快乐。
主持人:您如何总结这10年的核心信念?电脑究竟应该怎样为人们工作?在接下来的几十年里,你有什么判断?
黄仁勋:第一个核心信念是加快计算。,特别是并行计算和通用计算的融合。通过将多个Cpu结合起来,我们可以加速计算。我仍然相信这个想法。
第二个核心信念来源于深度神经网络(DNN)潜力的洞悉。自2012年问世以来,这些深度神经网络表现出强大的能力,可以从各种数据中获取方式和联系。更重要的是,这些网络具有优异的可扩展性——通过扩大规模,他们可以学到更详细的特征;通过增加深度或总宽度,他们的性能可以相应提高。这种结构的可扩展性在实践中得到了充分的验证。
经验表明,模型和数据规模的增长与知识获取量成正相关。所以,这种增长是否存在上限?这种扩展似乎可以持续下去,除非我们遇到物理、结构或数学的根本限制。
这个问题引出了一个关键问题:到底我们能从数据中学到什么?从经验中得到什么?事实上,数据是人类经验的数字化呈现。我们可以看到,机器可以通过图像学习物体识别,通过声波掌握语音识别,甚至可以通过研究大量的字母符号来理解语言、词汇和语法规则。
现在,我们已经证明,人工智能和深度学习具有一种革命性的能力,它能够学习和转换几乎任何方法的数据。
这是什么意思?让我们来看一下这些令人兴奋的概率:
在文本领域,AI可以实现文本之间的转换,如文章摘要和语言翻译;在视觉领域,它可以将文本转换为图像(图像生成),或者将图像转换为文本(图像描述);在生物学领域,它甚至可以将氨基酸序列转化为精确的蛋白质结构。
展望未来,我们也将实现从蛋白质到自然语言的转化,这样我们就可以提出“这种蛋白质的功能是什么”或者“请举例说明具有特定特征的蛋白质”这样的问题。
既然AI可以把文字转换成视频,那么把文字转换成机器人动作指令有什么区别呢?从计算机的底层逻辑来看,这些转换本质上是相通的。这打开了一扇充满挑战和机遇的大门,正是这些无限可能让我们对未来充满期待。
2、为什么此时此刻如此与众不同?
主持人:我认为我们正站在一个巨大变化的风口浪尖上。回顾过去的十年,我们确实经历了巨大的变化。但是展望未来十年,我发现我无法准确预测我们将如何使用目前正在开发的技术。
黄仁勋:你的感觉很准确。这种不可预测的感觉来自一个重要的转折点:过去十年主要集中在人工智能基础科学的研究上。未来十年,虽然人工智能科学的突破还会继续,但更具象征意义的是,我们即将进入人工智能应用科学时代。
从基础研究到实际应用,这是一个重要的转变。现在核心问题已转向实际应用:如何将人工智能应用于数字生物学?如何将人工智能应用于气候技术研究?如何让人工智能服务于农业、渔业和机器人技术?如何通过人工智能提高运输和物流系统?如何利用人工智能改革教育?如何将人工智能融入播客等媒体形式?
3、将来机器人会是什么样子?
主持人:让我们关注一些具体的例子,帮助我们更好地理解我们讨论的计算革命将如何实质性地改变我们的生活体验,以及人们将如何实际应用这些前沿技术。
在我们刚才讨论的许多领域中,物理人工智能特别引起了我的兴趣。在这里,物理人工智能不仅包括人形机器人,还包括各种物理智能系统,如无人驾驶汽车、智能建筑、独立仓库、智能割草机等。据我所知,这些机器人的能力可能很快就会有很大的进步,这源于我们在训练方法上的创新。
过去,机器人训练面临两个主要限制:
第一,训练必须在实际环境中进行,这可能会导致设备损坏和磨损。
第二,训练数据,如穿着动作捕捉服的人类,需要从有限的信息来源中获取。由于这些限制,机器人无法获得足够的学习样本,从而影响了他们的学习效率和速度。
但是现在,我们开辟了数字世界训练机器人的新时代。这一突破性的变化带来了机器人可以重复更多次的训练,适应更多样化的条件,大大提高学习效率的几个关键优势。这使得我们很可能正站在机器人技术爆发的前夕,英伟达正在开发一种强大的工具来推动这场革命。
具体而言,每个人都开发了。 Omniverse 提供了一个完整的平台 3D 虚拟世界使机器人系统能够在不依赖物理环境的情况下进行训练。更令人兴奋的是,每个人最新发布的 Cosmos 这项技术得到了进一步的提高。 3D 真实的宇宙。
举例来说,如果我们要在这张桌子上训练机器人,Cosmos 可以模拟:不同的光照条件,一天中不同时间段的环境变化,丰富多样的场景体验等。这些进步促使机器人从 Omniverse 获得的学习经验远远超过以前。
在我的童年,我被星际迷航中描绘的机器人世界深深迷住了。从我们现在已经实现的机器人技术出发,你认为我们需要哪些重要的突破才能走向这个充满未来感的机器人世界?
黄仁勋:让我以 ChatGPT 以此语言模型为例,帮助理解。 Omniverse 和 Cosmos 发展逻辑。ChatGPT 虽然最初的版本在文本生成方面表现出色,但在处理长文本或不理解的主题时,往往会产生“幻觉”——即产生看似合理但缺乏事实依据的内容。
为了应对这个问题,新一代模型引入了前后文学习能力,通过访问 PDF 作为事实的基础,文档和搜索引擎可以基于可靠的信息进行推理和回答。在此基础上,它可以推断出如何生成你想要的答案。
因此,首先是生成型人工智能,其次是基本事实。现在让我们把视角转化为物理世界。为了让机器人真正了解物理环境,我们应该建立一个类似的环境 ChatGPT 世界核心模型模型。
这一模型必须准确理解:基本物理定律(重力、摩擦、惯性)、空间几何认知,物体永久性(物体在视线之外仍然存在的概念)、逻辑关系(比如物体倾斜导致倒下的关系)必须在世界基础模型中编码这些物理常识,这正是我们通过的。 Cosmos 实现目标-创建“世界语言模型”,如同 ChatGPT 就像文字语言模型一样。
接下来,我们应该使用真实数据进行基础处理,就像处理PDF和前后文一样。这就是为什么我们使用物理模拟来改进它。 Cosmos。Omniverse 利用基于牛顿物理原理的求解器,对我们长期理解的基本物理定律进行编码,使之成为精确的模拟器。
使用该模拟器进行调整 Cosmos ,根据物理规律,我们可以生成无数的场景预测。Omniverse 加上 Cosmos 搭配,就像赋予搜索能力一样。 ChatGPT 同样,让我们能在物理世界中产生一个基于真实物理规律的无限可能的互动场景。
主持人:让我用一个具体的工厂场景来解释这项技术的革命性:假设我们应该训练一个工业机器人来学习所有可能的运动路线。传统方法需要在实体工厂反复训练,不仅需要几天时间,还会造成机器人硬件的严重消耗。
如今,借助数字模拟技术,我们可以在很短的时间内完成所有路线的训练。更重要的是,我们可以模拟各种复杂环境下机器人的表现——如光线不足、视野障碍等。这种突破性的训练方法大大加快了机器人的学习速度。
从这个角度来看,未来的机器人技术将与现在有质的不同。
将来,所有会移动的设备都会进化成机器人,人类也会变成“超人”
主持人: 假如把时间轴延长到十年,你认为大家在不久的将来会如何与这项技术互动?
黄仁勋: 不久的将来,所有的移动设备都将进化成机器人,这种变化正在加速。好好想想。大家还在手动推割草机本身就有点过时了。这不仅效率低下,而且完全没有必要。同理,每辆车都会成为一个独立运行的机器人。对于人形机器人来说,实现这项技术的所有要素都是触手可及的。
所有可移动的设备都将进化成机器人,它们将在 Omniverse Cosmos 在平台上完成学习和进化。在这个平台上,我们可以生成无数符合物理规律、逻辑合理的未来场景。在虚拟环境中学习后,机器人可以将所学应用到现实世界中。
这个过程和人类学习一样自然。可以预见,在不久的将来,我们的生活环境将不可避免地被服务机器人包围。作为一名科技爱好者,我特别期待在星球大战中拥有一个类似的 R2-D2 这种个人助手。
这个个人助手可能会以多种形式存在,但本质上是一样的。 R2。这将无处不在地陪伴我:有时候它会以虚拟助手的形式出现在我的智能眼镜里,有时候在我的手机里,有时候在我的电脑里,包括我的智能汽车系统。
即使在我回家的时候,也可以和一个实体版本在一起 R2 互动。无论它以什么形式出现,我们都可以与之自然交流。我相信,在未来,每个人都会有一个相似的 R2-D2 这种终身数字伙伴,将随着我们的生活经历不断进步,这已成为一个明确的未来景象。
1. 黄仁勋对AI感到焦虑
主持人:在谈到人工智能高度发达的未来时,我认为很多新闻媒体都会关注可能有害的地区, 你会考虑哪些方面?
黄仁勋:嗯,有很多事情大家都在谈论——偏见、有害或者只是幻觉。
举例来说,人工智能可以自信地说一些它一无所知的话,结果我们依赖于这些信息。它是一种产生虚假信息、虚假新闻或虚假图像的方法。
当然也有伪装,它可以如此出色地装扮成人,甚至可以很完美地装扮成特定的人。
所以,我们需要注意的领域是相当明确的,许多人都在努力解决这个问题。 其中一些与 AI 安全性相关问题,需要对工程设计进行深入研究。
有时,它想做正确的事,只是做错了,结果伤害了别人。
举例来说,无人驾驶汽车想要好好、正确地驾驶,但是不知怎么的,传感器坏了,或者它没有检测到什么东西,或者它做了一个过于激进的转弯等等。它做得不好,它做错了。
所以,要保证大量的工程工作, AI 确保产品功能的正常运行,确保安全。
还有最后一点,如果 AI 希望做好事情,但是系统失败了会怎么样?
我的意思是,AI 希望阻止某件事发生,但是当它想做的时候,机器坏了。
这和飞机上的航行计算机没什么区别。系统内部有三个冗余。然后有两名飞行员,包括空中交通管制和其他飞行员在观察这些飞行员。因此,AI 安全系统必须作为一个社区来构建,以确保这些社区。 AI 第一,能正常工作,功能正常。如果他们不能正常工作,就不会让人陷入危险。并且周围有足够的安全和保障系统,以确保我们能够维护。 AI 的安全。
所以,这一讨论范围非常广泛,我们需要把每一个部分分开,作为工程师来构建。
2. 提高能源效率是我们的首要任务。
主持人: 现在,我们所处的时代令人兴奋,因为我们不再受制于传统。 CPU 以及串行处理的技术瓶颈。我们不仅开创了一种全新的计算模式,而且开辟了一个不断进步的渠道。并行计算的物理特征和过去 CPU 改进方法大不相同。
你认为当前世界在科技领域面临的主要挑战是什么,我很好奇?
黄仁勋: 嗯,究其根源,所有问题的核心都归结于我们在既定能量限制下能完成多少工作。
事实上,这是一种物理限制。信息传输和比特旋转的物理定律决定了所需能量的下限,从而限制了我们能够实现的工作量。
与此同时,我们所拥有的能量也限制了我们的能力。尽管如此,我们还没有接触到阻碍我们前进的根本障碍。
所以,我们正在努力开发更高效、更节能的计算机。举例来说,这台小电脑,它的升级版价值 25 万美金(DIGITS)。首先,我们交付的版本只是一台原型机。
2016 年,我向 Open AI 第一个正式版本已经交付 DGX 1,售价为 25 一万美元。这是一个新版本的能耗。 1 一万倍,而新版本的性能却是它的性能。 6 倍。
我们确实处在一个全新的时代。
仅仅在 2016 2008年至今,我们在计算方面的能源效率有所提高。 1 万倍。
想象一下,如果汽车或灯泡的能效也可以提高。 1 万倍,那么原来的一个 100 瓦片灯泡,现在只需要 1 一万分之一的能源消耗可以产生相同的亮度。
所以,我们一直在努力提高计算,特别是 AI 能源效率的计算尤为重要,因为我们希望建立一个更加智能化的系统,并且利用更加强大的计算能力来提高智力。
所以,提高计算能效总是我们的首要任务。
3. Transformer 也许是算法演化过程中的垫脚石。
主持人:Transformer 这是一种比较流行的,比较新的。 AI 结构,它在各种工具中得到了广泛的应用。由于其结构有利于“关注”重要信息,从而产生更好的结果,因此很受欢迎。
虽然可以专门针对特定的制造 AI 模型芯片,但是这样可以降低芯片的灵活性。所以,有争议的一点是:我们是否应该把筹码“固化在芯片中”,制作出高度定制的硬件?或者是否要保持硬件的实用性?
我想问你,你是怎么做出这些决定的?你是如何衡量自己是选择一辆可以随意驾驶的车,还是选择升级一列只能往返? A 地和 B 地面之间的火车? 当你进行高风险投资时,你是怎么看待这个问题的?
黄仁勋:是啊,这个问题又回到了你最初的问题,那就是我们的核心信念是什么?
英伟达的核心信念,其焦点在于——Transformer 这是最后一个可以被研究人员发现的。 AI 或者算法或者结构,仍然认为 Transformer 只是一个跳板,将来会演变成一个与现在完全不同的新结构?我们坚信后者。
原因很简单。我们只需要回顾过去,反思一下,在计算机算法、软件、工程和创新的发展过程中,有没有一个想法可以长期保持一致?答案是否定的。
它就是计算机的魅力所在,它可以在十年前实现人们无法想象的事情。
因此,我们坚信创新的多样性和发明的多样性。我们希望建立一个开放的架构,让发明者、先锋、软件工程师和人工智能研究者在这里自由探索,提出惊人的想法。
Transformer 其基本特征之一是其“注意力机制”,这一机制使 Transformer 能理解每个单词和其它所有单词之间的含义和联系。
例如,如果有的话 10 个词,Transformer 必须分析这 10 单词之间的关系。但是如果单词的数量增加到 10 万,或者前后文扩展到需要阅读的地方。 PDF 文件,甚至是大量的 PDF 文件,并且前后文窗口达到百万级别。 token,所以要处理好所有单词之间的关系是不可能的。
所以,解决这一难题的方法就是引入各种新概念,比如 flash attention、hierarchical attention 或是我最近看到的 wave attention。
自打 Transformer 自出现以来,每个人都创造了许多不同的注意机制,这是很棒的。
我认为这一创新将会持续下去,我们对此充满信心。
计算机科学的探索不会停止,人工智能研究者也不会放弃,特别是我们。
拥有一台灵活的计算机,能够支持研究、创新和新思想,从根本上说尤为重要。
4. 芯片制造
主持人:英伟达致力于芯片的设计,但是其他一些公司会负责芯片的组装,一些公司会负责硬件,这样他们就可以在纳米尺度上工作。
在这种背景下,英伟达如何从物理限定框架下可行的角度进行设计?贵公司在推进技术界限的过程中,主要集中在哪些方面?
黄仁勋: 我们的做法是,即使我们与台积电等公司合作生产芯片,我们仍然认为我们需要具备与台积电相同水平的专业知识。因此,公司内部有许多在半导体物理方面有很强造诣的专家,他们帮助我们深刻理解半导体的能力极限,并与这些专家密切合作,共同探索技术界限,始终致力于突破这些限制。
对于系统工程和冷却技术,我们也采取了类似的策略。对于液冷技术,我们发现管道系统尤为重要,而风扇系统则是蒸发冷却技术的关键。此外,我们正在设计具有优异空气动力学性能的风扇,以达到最大气体流通量,同时产生最小噪音。所以,公司聘请了空气动力学工程师。虽然我们不直接生产这些组件,但是我们对它们的制造过程有着深刻的设计和了解,并且通过这种方式不断尝试突破技术的极限。
5. 对于未来,黄仁勋下注
主持人: 您是一个敢于大胆下注未来的人,而且事实证明,您之前的下注都是正确的。我们讨论过 GPU、CUDA,以及你在 AI 包括自动驾驶在内的领域投资。
黄仁勋: 是啊,我们相信在自动驾驶、机器人技术方面也会取得同样的成功。
主持人: 这样就引出了我的问题:你现在正在进行哪些新的下注?
黄仁勋: 最近,我们在CES上发布了一个令人兴奋的新项目——Omniverse和Cosmos的结合。这种结合创造了一个全新的生成世界建设系统,一个多重宇宙生成系统。
我认为这个系统对于机器人技术和物理系统的未来发展尤为重要。虽然我们刚刚开始在机器人领域工作,包括开发工具、培训系统和人类演示系统,尤其是在与人类机器人相关的工作中,但我相信人类机器人在未来五年将迎来快速发展。
此外,我们还在数字生物学领域进行了深入的研究。我们的目标是解码分子和细胞的语言,就像理解物理世界的语言一样。如果我们能做到这一点并具备预测能力,就有可能实现人类的数字孪生。我对这个领域的未来充满期待。
我非常喜欢在气候科学领域工作,这些研究令人兴奋。比如我们可以从天气预报中了解和预测高分辨率的区域气候,甚至可以掌握一公里以内的天气模式。如果我们能以极高的准确性预测这些变化,它们的影响将是非常长远的。
有幸创造出这样一种工具,它就像一台“时间机器”(具有前瞻性)。在我们刚才讨论的所有领域,机器都需要时间。我们试图预测未来,我们试图设计的一切都是为了优化最好的未来版本,让未来成为最好的版本。这也是很多科学家想要预测未来的原因。
6. 每个人都应该如何为未来做准备?
主持人:也许许多人都知道 NVIDIA 它是一家至关重要的公司,但并不完全理解它为什么重要。如今,人们希望更好地了解我们在过去几十年计算领域经历的巨大变化,以及我们目前所处和面临的激动人心的时刻。我们似乎站在许多变化的边缘。
假如这个人想要对未来有更多的了解和展望,你会建议他们在这一刻如何做好充分的准备或思考,特别是考虑到这些工具会如何真正影响他们?
黄仁勋:假设有些工作需要一周的时间才能完成,但是现在我们可以大大缩短,甚至压缩到几乎一瞬间,这意味着一些繁琐的工作几乎消失了,这种影响类似于高速公路的出现。回顾上一次工业革命,国际高速公路的建设使郊区发展迅速,货物运输方便。加油站、快餐店、汽车旅馆也应运而生,新的经济形式和能力应运而生。
比如我身边随时都有程序员可以根据我的需求编写代码,或者只需要我提供一个简单的想法和草图,就可以帮助我设计产品原型。这将如何改变我们的生活和机会?未来十年,虽然智能技术不会在所有领域,但在某些领域,它可能会超越人类。
但我们也不必担心被超越或被取代。身边有许多“超级人类”,从我的角度来看,他们在各自的领域都是世界上最好的,他们所做的远远超过我。我被成千上万这样的大师包围着,但我从来没有觉得自己不重要。相反,它给了我力量和信心,让我更有勇气去挑战更多的目标。假如每一个人都被超级人工智能包围在特定的领域,你就会觉得它给了你力量和信心。
我相信你可能已经在使用ChatGPT等AI工具了。我对更新这些产品感到更有力量和信心去学习新事物。这种感觉就像身边总有一个个人导师,帮助我清除任何知识领域理解的问题。
假如我给你一个建议,那就是马上给自己找个“AI导师”。它可以教你任何你想学的东西,帮助你编程、写作、分析、思考和推理,所有这些都会让你感觉更强大。我认为这是我们的未来:由于拥有超能力,我们将不再成为超人,而是因为我们拥有非常AI。
7. 对于这一代人来说,最重要的是利用好AI。
主持人: 你们觉得对观众来说,我还没问到的最重要的事情是什么?
黄仁勋: 最重要的事情之一是我会推荐:假如我今天是个学生,最重要的是学习人工智能。我应该学习如何与之相处。 ChatGPT、Gemini Pro 和 Grok 等 AI 工具互动。学习怎么与 AI 互动就像成为一个善于提问的人。为了有效地提醒你,你必须掌握一些专业知识和技能 AI,让它成为你的助手。
黄仁勋:如果我是学生,无论我打算从事什么职业,我首先要做的就是学会使用AI。
无论你将来从事哪一个科学领域或行业,都要问问自己:如何利用 AI 提高工作效率? 要当律师,怎样利用? AI 成为更好的律师? 要是当医生,怎么用? AI 成为更好的医生? 若要成为科学家或生物学家,怎样利用? AI 为了提高自己的专业技能? 这一问题应该永远萦绕在每一个人的心中。
就像我们这一代人是第一代必须思考如何利用计算机提高工作效率的人一样。我上一代没有电脑,我们这一代人是第一个必须学习如何利用电脑更好地工作的人。
黄仁勋谈技术浪潮:我们这一代人学会了使用计算机,下一代人的关键在于使用好AI。
我记得在 1984 2000年,办公室里没有电脑。之后电脑开始普及,要思考如何用电脑提高工作效率。下一代不需要再问这个问题了,但是他们必须问下一个问题:
如何利用 AI 为了更好地完成我的工作? 在我看来,这应该是一切的初衷和终点,这是一个令人兴奋的、略带恐惧的问题,但是很值得探讨。
我觉得这样会很有意思。AI 很明显,这是一个大家刚刚开始理解的概念,但是它使你的计算机更容易使用。 提醒 ChatGPT 提出你想问的任何问题都比自己做研究容易得多。我们降低了理解和知识的门槛,也降低了智力的门槛。每个人都应该试试。
假如把一台电脑放在一个从未使用过电脑的人面前,他们就不能在一天之内学会使用它,必须有人教你。 但是,如果你不知道如何使用它呢? ChatGPT,您只需输入即可 "我不知道怎么用 ChatGPT,请告诉我,它还会给出一些使用的例子。
这便是 AI 最为神奇的地方:它会一路帮助你,让你一路变得更强大。
8. 墓志铭:希望怎样被记住?
主持人:我还有一个问题。我不打算问你,但是在来这里的路上,我有点害怕飞机,今天的飞行有点摇晃。我坐在那里,飞机在摇晃。我想知道他们会在我的葬礼上说什么。
黄仁勋: "她问了一个很好的问题",这将是你墓志铭上写的。
主持人:在谈到我爱我的丈夫、朋友和家人后,我希望他们能讨论我的乐观。我希望他们能意识到我在这里试图做什么。你们描述了未来这么多的愿景,我很好奇,你们希望大家能讨论一下你们试图做什么。
黄仁勋:我觉得我们很幸运,因为我们坚持了很久以前的核心信念,这促使英伟达成为世界上最重要、最有影响力的科技公司之一,而且可能永远都是这样。
我们非常重视这一责任,努力确保我们创造的技术能够被各个领域的大公司、研究人员和开发人员使用,无论其规模、利润和名气如何。我们知道这项工作的深刻影响,以及它对许多人的潜在影响,所以我们希望尽可能地普及这种能力。
但愿当下一代回首往事时,他们会意识到:
它们是通过我们创造的游戏技术认识我们的;
数字化生物与生命科学领域发生了彻底的变化,我们对材料科学的认识也被彻底颠覆;
机器人正在帮助我们完成危险和繁琐的工作;
在未来,我们可以像在家庭影院一样享受无人驾驶汽车;
如果他们回顾过去,他们会发现几乎所有这些变化的中心都有一家公司,而这家公司恰好是他们从小一起玩游戏的公司。我希望这是下一代所知道的——这一切的起点都来自电子游戏。
(腾讯科技编辑组编译)
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




