AI计算爆发!吴泳铭支持GPU计算,CPU真的成了配角?
9 月 19 日,2024 杭州如约召开云起大会。作为阿里云年度重磅活动之一,云起大会致力于推动云计算、大数据、人工智能等前沿技术的发展和应用,以促进计算技术创新为核心。
作为关注 AI 硬科技头部新媒体,雷科技也应邀出席云栖大会,阿里集团开幕演讲由阿里集团组成 CEO、阿里智能云董事长兼 CEO 吴泳铭主持,但是在整个主题演讲中,最令人印象深刻的就是这句话:
生成式 AI 改变计算架构,从 CPU 主导计算系统 GPU 主导的 AI 计算转移。AI 时代将是" GPU 算率为主,CPU 计算率为辅”的计算模式。2024 年度市场新增算率,超过 50% 的需要 AI 驱动力的产生,这种趋势将继续扩大。阿里云投资建设了许多 AI 计算基础设施,仍远远不能满足客户的需要。
没错,GPU 计算,就是未来。
近几十年来,从云服务器到超级计算机,CPU 它一直是计算系统的核心职责。比如天河一号这个名字,就采用了 14336 一个商业Cpu、7168 一个加速处理器和 2048 个自主飞腾 -1000 Cpu,这基本上是Cpu「CPU」,这就是“逻辑Cpu”。
CPU 该设计主要用于处理通用计算任务,进行复杂的逻辑计算和顺序计算。你可以 CPU 作为一名大学生,他有足够的逻辑计算能力处理各种复杂的任务,但他每次只能处理一项任务,这就是所谓的。「单线程」。
虽然是后续的 CPU 在设计过程中,工程师通过指令集,CPU 结构等形式,让 CPU 两个工作(双线程)可以同时处理,但现在已经是极限了。而且 CPU 处理完任务后,仍然需要先处理好手头的工作,然后进入下一个工作流程,即「顺序执行」。
形成了逻辑运算和顺序执行, CPU 只要您的输入程序符合通用计算基础, CPU 计算逻辑,那么 CPU 给出的数值是相同的,并非因为你使用的数值是相同的。 AMD,他用的是英特尔,所以你的 1 1=2,他的 1 1=3。
得益于强大的通用计算能力,CPU 在人类建立通用计算中心时,首选,因为计算中心的设计初衷是用来执行不同领域的计算任务。服务器承担着为云应用提供数据交换和计算的支持。为了适应不同类型的应用计算,通用计算能力是关键。
近两年来,一切都发生了翻天覆地的变化,GPU 成为大多数新数据中心和超级计算机的关键,GPU 计算能力的增长速度屡屡突破历史记录,公司疯狂采购 GPU 建立一个全新的计算矩阵的核心,「元凶」,便是生成式 AI。
生成式是近几年最受关注、最受欢迎的前沿领域。 AI 有一个特点,那就是对计算能力的恐怖需求。这种需求不仅体现在训练和提高上。 AI 在大型模型中,更是随着用户数量的增加而飙升。生成式 AI 可以算是人类难得的前沿技术,从出现到普及,耗时最短。如今,每个接入互联网的人都可以通过浏览通义千问等网站使用生成式。 AI。
巨大的需求催生了大量的数据中心,但也让一些人对此产生了疑问:为什么选择? GPU 而非 CPU 来搭建 AI 数据中心?
GPU 最初的设计目的是图形渲染任务,这决定了它需要更强的并行任务处理量。以游戏为例。当你在游戏中看到一个盒子时,你实际上看到了一个由大量三角形组成的盒子。 3D 模型,如果你玩过早期的模型 3D 这个游戏,那么你一定会对游戏中“棱角分明”的角色产生深刻的印象。
实际上,这个问题是由于早期的原因。 GPU 计算率不足,只能计算100位数的三角形,不能满足构建要求。「光滑」模型要求。跟随 GPU 增强了计算性能,当我们能在一秒钟内渲染出千万个三角形并形成一个三角形时, 3D 模型,那么在游戏玩家眼中,这个模型有着非常真实的视觉效果,即「拟真级」精细建模。
因为需要处理的任务很简单(产生三角形并着色),但是任务的数量却很多(几千万),导致 GPU 成为一名偏科生。谈论处理单个数据的能力,GPU 与 CPU 对比就像婴儿和大学生一样,区别在于 GPU 这是数千万个“小宝宝”的集合, CPU 这是几十个大学生的集合。
在我们需要执行的时候, 1000 在任务从左向右移动后,万个“三角形”,GPU 和 CPU 谁的效率更高?GPU 并行计算能力,也是其处理复杂性的能力 3D 模型渲染的关键。
但在生成式 AI 人们在诞生之后发现 GPU 并行计算能力远远大于 CPU 要更适合进行 AI 计算,原因和原因 AI 底层结构与大型模型有关。虽然在大家眼中,AI 根据数据集群的不同,大型模型可以产生各种类型的结果,如文字、图片、音乐等,但在实际计算中,事实上,所有数据都以一种形式存在。—— Token,也就是「语义模块最小化」。
在您输入一段文本时,应用程序将文本拆解到数以万计。 Token,然后扔进处理核心进行计算。这个过程熟悉吗?是的,整个逻辑 GPU 渲染一个盒子实际上是一样的,把一个任务分成大量的小任务,然后根据 AI 整合结果,输出模型逻辑判断的答案。
可以说,在 AI 在时代的数据中心,GPU 就是整个 AI 计算矩阵的核心,其重要性远远超过 CPU,并且掌握了最先进的技能 GPU 制造商,将成为半导体领域的无冕之王。
在目前的 AI 在市场上,大多数人都同意这一观点:英伟达就是 AI 计算能力的代名词。无论是每秒能进行数十万亿个浮点计算的 H100仍然是目前最强的消费级别。 AI 显卡 RTX 4090让英伟达成为无可争议的商业和消费领域。 NO.1。
特别是在消费领域,英伟达已成为个人 AI 电脑的唯一选择,其背后的原因就是英伟达。「杀手锏」—— CUDA。CUDA 是由 NVIDIA 开发的并行计算平台和编程模型,其作用是允许开发者使用英伟达 GPU 通用计算任务具有强大的并行计算性能。
看了上一章的朋友,估计会有点迷茫。为什么要用? GPU 执行通用计算任务?那不是吗? CPU 工作?是的,通用计算任务的确是什么? CPU 强项,但俗话说:三个臭皮匠,顶个诸葛亮。当 GPU 如果平行计算率强到一定程度,那么只要有一个模型可以转换任务,就可以将其转换为 GPU 在一般计算任务中应用计算率。
同时,英伟达也是为了 CUDA 为使用英伟达提供了大量的工具库和各种计算模型。 GPU 开发者可以大大节省开发时间,并充分发挥其作用。 GPU 性能。正是利用 CUDA 支配并行计算能力,促使英伟达 GPU 能有效地执行个人计算机中的各种通用计算任务,为用户提供足够的地方支持 AI 大型模型部署 AI 算率。
那么 AMD 难道没有类似的工具吗?实际上是有的,名字 ROCm,ROCm 前身 Radeon Open Compute 其实在 2016 2008年已发布,主要用于通用。 GPU 计算(GPGPU)、高性能计算(HPC)以及异构计算等领域。但由于缺乏足够的支持,生态规模远远不能与之相提并论。 CUDA 相比之下,但是在生成式 AI 爆红以后,AMD 很快就意识到了 Radeon Open Compute 把它改名为它的重要性 ROCm 并且投入大量资源进行更新。
作为一个 AMD 事实上,在过去的两年里,显卡客户能明显感觉到。 AMD 在 AI 这一领域的进步,曾经只能依靠翻译来运作本地。 AI 模型 AMD 现在显卡已经可以使用了。 ROCm 实现原生本地工具, AI 在模型部署和计算中,效率和计算率都有质的变化。
尽管仍然无法与之相处 CUDA 相比之下,已经让人看到了一些希望,更何况从价格上来说,性能差不多。 AMD 通常只要英伟达显卡的显卡价格。 80% 甚至 70%。这个也意味着 AMD 只要能解决一般计算模型的问题,就能为个人和小企业提供更划算的选择,吃相当一部分。 AI 显卡市场。
但是在 ROCm 在完善之前,英伟达仍将是消费级别。 AI 市场的最佳选择。
不像消费市场,AMD 但是服务器市场的增长却非常迅速,Data Center Dunamics 数据显示,2024 年度第一季度,AMD 数据中心业务创造了新的内部收益记录,同比增长 38%。但是第二季度,AI 服务器出货量同比增长 占总出货量的41.5% 12.2%。
虽然从整体市场份额来看,英伟达仍然占有一席之地。 90% 上述市场,但是 AMD 也不是唯一的挑战者。
不久前谷歌推出的 TPU(Tensor Processing Unit)专门用于加快机器学习和深度学习的芯片,选择 Arm 结构模式,在性能和能效方面都有很好的表现,已经在谷歌应用了很多项目。 AI 服务中。
而且英特尔是通过收购来购买的。 Habana Labs 拿到了 Gaudi AI 加速器,结合新一代至强处理器 AI 加快功能,紧密布局 CPU AI 领域。这个市场的规模也很大,因为并不是所有的数据中心都是 AI 作为核心应用,新一代 CPU 能更好地兼顾数据中心的通用计算目标和 AI 计算任务,降低重复建设数据中心的成本和维护费用。
另外,英特尔也一直关注移动。 PC 的 AI 需求,这是目前英伟达最弱的市场,因为英伟达 GPU 虽然他们很优秀 AI 计算率,代价却是极高的功耗,不能满足移动的需要。 PC 这就给英特尔和其他制造商留下了长期续航的机会。
在今年 IFA 在上面,英特尔推出了内置新一代。 NPU(AI 加速核心)酷睿 Ultra 200v 系列Cpu,在提供强大算率支持的同时,还具备长续航等条件,以及高通等新一代。 Arm PC Cpu在 AI PC 市场竞争激烈。
在短时间内,英伟达 AI 计算市场的优势仍然很大,但从长远来看,群狼环伺下的优势仍然很大。 AI 市场上,英伟达双拳难敌四手。例如挪动 PC、英伟达的弱势市场,如智能终端,很快就会被其它厂商刮掉,而关键的服务器市场也并非无忧无虑,AMD 的 MI300 系列 AI 显卡份额快速增长,足以引起英伟达的警惕。
然而,科技创新的关键在于竞争所产生的创新与发展, AI 事实上,这个领域的竞争也在加剧, AI 降低成本,让 AI 技术得到了更快、更广泛的应用。最后,我想用吴泳铭先生演讲中的一句话来结束:
AI 数字世界的驱动力与数字世界相连。 AI 物理世界的能力,将大大提高整个世界的生产力,对物理世界的运行效率产生革命性的影响。
一个全新的世界,就在眼前。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




