黄仁勋发布了最强的AI芯片,制作了“核弹显卡”,已经不能满足英伟达

商界观察
2023-08-10

英伟达新时代

 

每年 8 月亮,英伟达将在世界上最重要的计算机图形大会上举行。 SIGGRAPH 上秀一秀「肌肉」。

 

五年前,英伟达 CEO 黄仁勋在 2018 SIGGRAPH 首款支持光跟踪的显卡已经发布。 Quadro RTX,那是英伟达自 G80 到目前为止,最重要的商品,英伟达 GPU 从 GTX 时代推向了 RTX 时代。

 

那时候,英伟达还是一家很简单的图形计算芯片制造商,脑子里想着怎样把它放在脑海里。 3D 渲染推向完美,其市值约为 814 一亿美元,还没有进入千亿俱乐部。

 

但到了 2023 2008年,英伟达经历了一场脱胎换骨的巨变。 月份的 GTC 会上,老黄抛出金句。「AI 的 iPhone 时间到了」此后,英伟达的股价开始稳步上涨,不断创下历史新高。

 

在过去的五年里,英伟达的股价上涨近乎接近 10 倍,目前市值已经突破 11000 亿,成为世界上市值突破万亿美元的第一家芯片公司,也是目前市值仅次于苹果、微软、Alphabet、美股第五大科技股亚马逊。

 

英伟达的显卡在市场上仍然很受欢迎,但现在正在争相购买。 GPU 不再是那些追求极致画面的玩家,而是微软,Meta 等待科技巨头急于部署和训练大模型。

 

在昨晚的 2023 SIGGRAPH 其实你已经很难听到老黄讲游戏,实时渲染,3D了。 等待熟悉的关键字,接下来就是生成式 AI、概念,如数据中心,加速计算。

 

它是一个全新的英伟达,也是一个全新的时代。

 

01 英伟达变了

 

从英伟达的财务报告中,我们可以解释这是一家什么样的公司。

 

长期以来,游戏业务一直是英伟达的主营业务,直到 2023 年度第一财季,在 PC 低迷的市场消费和低迷 AI 在计算升温的双重影响下,英伟达的数据中心业务终于成为英伟达的第一收入来源,这也标志着英伟达正式从传统中走出来。 GPU 供应商已经转变为世界上最大的算率供应商之一。

 

从那以后,英伟达的数据中心开始一路飙升, H100、A100 等待显卡的计算 AI 行业硬通货,一度出现严重短缺。一些分析师推断,全世界可能需要 43.2 万张 H100 为了满足市场需求。

 

根据英伟达最新一季的财务报告,由于公司的强烈需求,英伟达的数据中心业务在 Q1 的营收有为 42 亿,同比增长 环比增长了14% 超出华尔街预期的18%。

 

 

 

但是如果你认为英伟达只是碰巧被 AI 热钱砸中的幸运儿,这也太小看老黄了。

 

对于英伟达来说,造「核弹 GPU」、投入 AI,这只是实现他们最终愿景所要做的事情。「准备工作」,英伟达真正想要做的,就是建立一个真正的元宇宙。

 

02 最先进的「锄头」

 

工欲善其事,工欲善其事,英伟达深谙此道。

 

今年 3 月亮,英伟达发布了 H100 NVL GPU、L4 Tensor Core GPU、L40 GPU 以和 NVIDIA Grace Hopper 四款 AI 为了满足企业日益增长的计算能力需求,推理芯片。

 

5 在月台北电脑展上,老黄发布了使用。 256 个 NVIDIA GH200 Grace Hopper 超级计算机是由非常芯片组成的 DGX GH200。

 

而且就在昨天,老黄又发布了搭载。 HBM3e 内存新版 GH200,甚至是上一代。 GH200 还没有正式发货,更新速度很快。

 

新老 GH200 它们之间的差异主要集中在内存上。

 

GH200 Grace Hopper 这是世界上第一个搭载 HBM3e 内存的 GPU 从每一个内存空间来看,芯片 GPU 96 GB 拓展到 144 GB,增强了 50% 。

 

 

HBM3e 在运算速度方面,内存是一种新型的高带宽内存技术。 HBM3e 能比 HBM3 运算速度快 提供最高50% 传输速度为5TB/秒。这样,新版本 GH200 运行 AI 模型速度比目前的模型更快 3.5 倍。

 

这些都是双装备的 GH200 内存可以达到 282 GB 的 HBM3e 与上一代相比,内存的容量增加了 3.5 加倍,带宽增强 3 倍数。比较受欢迎的 H100,内存增强。 1.7 倍数,增加带宽 1.5 倍。

 

和上一代一样,新的 GH200 它还具有几乎夸张的扩展性。

 

 

得益于英伟达 NVLink 互联技术, GH200 单卡、双卡、多卡服务器、机柜甚至超级计算机都可以根据企业的需求构成不同规模的形式。

 

 

最后,GH200 能够组成 256 张卡的 DGX GH200 SuperPod 拥有超级计算机 144 TB 快速内存,每秒都能执行。 10 的 18 次方浮点运算。

 

假如这还不能满足你的需要,也可以使用。 Nvidia Quantum-2 InfiniBand Switch 让多个交换机 Nvidia DGX GH200 SuperPod 相连。

 

老黄调侃提到「现在应该可以带动《孤岛困境》了。」

 

强大的可扩展性为 GH200 未来提供无限可能。

 

换言之,如果你想提高计算速度,你只需要添加更多的网络机柜。这对黄仁勋未来的感觉非常有利。 GH200 常用的应用领域是大语言模型,「加快计算」、「AI 计算」逐步取代传统 x86 GPU 的「通用计算」。

 

举例来说,过去 1 一亿美元的预算,只能建立一个小的数据中心,购买。 800 个 x86 GPU,并用 5 兆瓦的电力运转。

 

但是在相同的预算下,选择加速计算的。 Grace Hopper 只需要消耗 3 兆瓦的功率,而且数据吞吐量也可以提高一个数量级。而且如果以相同的工作量来计算,Grace Hopper 只需计算方案 800 万美金。

 

谈到这里,老黄又抛出了自己的名言:「你们买得越多,省得越多。」

 

官方估计,新款 GH200 需要等到 2024 2008年第二季度上市。 HBM3 内存的 GH200 今年下半年将按计划陆续出货。

 

当然,对于个人开发者和小团队来说,建立上亿的数据中心是不现实的,所以英伟达达「贴心」本地推出了集成先进 RTX 新一代工作站技术显卡:NVIDIA RTX 5000 、NVIDIA RTX 4500 以及 NVIDIA RTX 4000。

 

其中,作为旗舰级别 GPU,NVIDIA RTX 5000 使用了第 4 代 Tensor Core 和第 3 代 RT Core,相比上一代 GPU,提高了单精度浮点运算的性能 2 倍,达到了 90 TFLOPS 峰值,配置高达 32GB 的 GDDR6 支持视频内存 ECC 错误校验,适用于高端工作站、数据中心和云游戏。

 

而且是中高档等级 GPU,NVIDIA RTX 4500 配置 24GB GDDR6 还支持视频内存 ECC 校验。

 

与前一代产品相比,NVIDIA RTX 4500 光跟踪性能提高 1 倍,AI 处理性能提高 2 倍,其性价比十分突出,适用于创意专业客户、小型工作站等使用场景。

 

NVIDIA RTX 4000 则采用了与 RTX 4500 同样的 GPU 核心,配置 20GB GDDR6 录像内存,光线跟踪和光线跟踪 AI 计算性能都有了很大的提高。

 

目前全新的 NVIDIA RTX 5000 GPU 已开售,而且 NVIDIA RTX 4500 和 RTX 4000 GPU 今年下半年将陆续发货。

 

03 最富饶的「土地」

 

应用农夫山泉的广告词,我们可以这样介绍英伟达的最新广告。 AI 策略:

 

我们不生产 AI,我们只是 AI 的搬运工。

 

大家都知道,当地的设备 AI 模型是一项繁琐而复杂的工作。为了帮助开发者解决这个问题,老黄宣布英伟达将推出。「AI Workbench」。

 

简单来说,AI Workbench 能一站式为开发者提供配备 AI 模型所需的框架、工具开发包等环境,可直接开始创建项目。

 

老黄在现场举了一个很生动的例子。

 

 

例如,公司需要配备一个 Stable Diffusion 画模型,但你既没有硬件配置,也不知道如何配置模型。

 

别担心,此时你只需打开它。 AI Workbench,选择一个 4 个 RTX 6000 Ada GPU 云工作站,然后可以一键配备。 Stable Diffusion 模型。

 

如果您对生成的图片不满意,也可以自行上传照片,再次训练模型后再生成。

 

不到一分钟,就会产生一张像样的照片,整个过程中你不必担心其它问题,因为 AI Workbench 其它一切都准备好了。

 

英伟达宣布将和解 AI 开源平台 Hugging Face 建立战略合作关系,将这项技术应用到企业端。

 

只需在 Hugging Face 简单点击平台上的两次,开发者就可以轻松地将生成式 AI 项目从笔记本电脑转移到工作站,再转移到数据中心或云端,最后借助 NVIDIA DGX 云 AI 训练超级计算资源 AI 模型。

 

老黄强调,通过和 Hugging Face 英伟达最先进的合作, AI 技术可以支持各行各业。公司还可以根据公司的规划需求,利用开源社区的力量推动公司。 AI 的练习。

 

04 最宏大的「梦想」

 

介绍了软硬件平台的更新,老黄长吁一口气说:「今晚我们来谈谈最重要的话题。——OpenUSD。」

 

OpenUSD 对于大多数人来说,这应该是一个陌生的名词。OpenUSD 是皮克斯(是的,拍摄动画的皮克斯) 2015 在此之前,皮克斯已经使用了一个开源框架,超过了这个框架。 10 2008年,我们看到的很多动画都是围绕着它们。 OpenUSD 制作框架。

 

 

OpenUSD 可理解为是一种建立。 3D 用于描述、组合、模拟和合作的世界通用标准,老黄将其比作「HTML 对于 2D 网页的意义」「真正地凝聚了整个世界」。

 

上个星期,皮克斯, Adobe 、苹果、 Autodesk、英伟达,以及 JDF 宣布成立 OpenUSD 同盟 (AOUSD) ,以推动 OpenUSD 标准化、发展、演化和发展。

 

为什么这个名字不为人知的名字能让这么多不同领域的巨头公司聚集在一起?这个要从吗? 3D 谈工作流程。

 

3D 工作过程非常精细和复杂,如设计师、艺术家和工程师。 3D 在工作过程的某一部分,如建模、纹理、材料、物理模拟、动画、布景设计和生成等。

 

这是因为他们使用的工具(PS、AutoCAD、Blender 等。)由不同的公司开发,很多文件类型不能相互兼容,导致用户频繁导出、转换格式、导入,内容容易因为繁琐而损坏。

 

OpenUSD 正是为解决这一问题而生的技术, OpenUSD,Adobe Stager、Houdini、Maya、Blender、Renderman、Pixar 的 Minuteman 和 Epic 的 Unreal Engine 等待工具可以互通数据,发挥更强大的作用。

 

接着,老黄郑重宣布英伟达。 Omniverse 将成为第一个完整的目标 OpenUSD 构建平台,从底层数据库到发动机系统,每一行代码都是基于 OpenUSD 设计为中心。

 

不仅如此,英伟达还一起推出了。 RunUSD、ChatUSD 和 DeepSearch 等 API,基于开发者的建设将进一步减少 OpenUSD 应用门槛,让 3D 工作流程可以和谐 AI 等待技术的结合。

 

举例来说,全球最大的广告公司 WPP 为了比亚迪的腾势 N7 制作广告,就是在那里「元宇宙」拍的。

 

WPP 把腾势 N7 的高精 CAD 这些数据已经上传 Omniverse 在上面,设计了一辆数字孪生车, WPP 艺术家可以在那里 Omniverse 在环境中创造。

 

例如可以调用 ChatUSD API,只要输入一个句子描述,就可以 AI 创造不同的背景环境,进而创造数千个个性化的全球营销活动内容片段。

 

元宇宙和生成式 AI 正如天生的一对搭档,当两人相遇时,其价值将被指数级放大, OpenUSD 技术使这一切成为可能。

 

老黄认为,未来将有越来越多的产业需要进行数字化转型,Omniverse 在完成数字化转型时,人工智能将成为这些公司最重要的工作流程。

 

而要搭建 Omniverse 与人工智能相比,自然离不开强大的算率支持,这才是英伟达的真实形态:

 

以 GPU 为骨、AI 为了皮肤,构成了促进工业数字化转型最有力的手。

 

本文来自微信公众号“爱范儿”(ID:ifanr),作者:智健泽钧崇宇,36氪经授权发布。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com