中国疯狂抢GPU,这个困境怎么破?
在AI领域,GPU有两个主要应用领域。第一个是训练场景,即使用GPU加快AI算法的训练。第二个场景是推理场景,即使用GPU加快AI算法推理。目前国内高端AI场景中的GPU应用基本都覆盖了英伟达的A800。
A800被认为是A100的“阉割版”。去年,英伟达迅速推出了数据传输速度相对较慢的A800,因为美国政府收紧了对华出口的控制,用于取代A100出口到中国。类似于更高端的英伟达H100和H800。
由于中国暂时无法为云AI训练提供高性能GPU,A800受到中国互联网巨头的青睐。
全球性芯片巨头,囤积GPU
据报道,中国互联网巨头百度、腾讯、阿里巴巴和字节跳动公司今年向英国 伟达发布的交付订单金额达到10亿美元,总共购买了约10万个A800芯片;明年交付的AI芯片价值将达到40亿美元。
由此可见,中国大型科技公司对GPU采购十分迫切。不仅国内企业,海外大客户对英伟达的A100/H100芯片也有很强的需求。
最近,一张社区广为人知的图片“我们应该有多少个GPU”,引起了很多网友的讨论。
按照图片内容所示:GPT-大约需要21000-25000张A100才能练习;Meta大约需要21000张A1000张。;大约需要7000个TeslaA1000张。;Stability 大约需要5000个A1000个AI。;Falcon-在384张A100上,40B进行了训练;Inflection使用了3500张H100,对GPT-3.5能力相当的模型进行训练。另外,根据马斯克的说法,GPT-H100可能需要30000-50000张。
英伟达的GPU面临着如此强大的需求,极其紧缺。据外媒报道,供应链消息显示,英伟达在生成型人工智能需求上升和国际形势变化的影响下,为中国市场提供了A800和H800。 GPU价格持续上涨。七月中旬,英伟达代理反馈,英伟达A800 GPU价格上涨到12万元,H800和H100的价格也超过了20万元。现在英伟达订单的可见度已经到了2024年,即使是A800/H800也要到今年年底或者明年才能交货。
产量瓶颈在哪里?
根据tomshardware的报道,英伟达DGX系统副总裁兼Charliee总经理 Boyle出来澄清了企业GPU产量问题的实际情况。Charlie Boyle表示,问题并非来自于英伟达的错误计算需求,或者它的制造合作伙伴台积电的晶圆产量。相反,为了满足消费者和专业工作负荷(如AI),制造足够的GPU的瓶颈在于后续的芯片封装步骤。
英伟达的H系列GPU选用台积电2.5D CoWoS封装技术是一个多步、高精度的工程流程,其复杂性降低了GPU在给定时间内可以组装的数量,这可能会不成比例地影响供应。马斯克还说“GPU很少见”。
所以,当我们使用“GPU短缺”这个词时,它们实际上是在讨论主板上某些部件的短缺或积压,而非GPU本身。
在芯片成为可用的GPU之前,需要执行从芯片设计到制造的多个步骤。由于设计疏忽,ic设计期间的问题可能会导致制造瓶颈,从而降低设计的良率。稀土金属或其他材料的缺乏(如最近有限的钒)会影响长物流链中的其他步骤;材料污染、能源中断等诸多因素也会造成影响。
但是CoWoS的瓶颈问题可能比预期的要严重。台积电还表示,为了恢复封装订单的正常积压,估计需要一年半的时间(以及完成额外的晶圆厂和扩建目前的设施)。这可能意味着英伟达不得不决定将哪些包装能力分配给哪些产品,因为它没有足够的时间和能力来包装所有产品。
不仅如此,为了限制中国AI产业的发展,美国总统拜登于今年8月正式签署行政命令,限制美国企业未来在敏感技术上投资中国,包括半导体、量子计算和人工智能,预计明年将实施。
产量不足仍然可以打破。如果供应被切断,这些正在进行云AI培训的大公司很可能会陷入困境。因此,这些科技巨头开始争相囤积。 A800 芯片。还需要注意的是,如果A800/H800真的受到美国禁令的影响,中国本土芯片公司和正在自主研发的芯片科技厂商是否有能力承担这一重任?
运行大模型,国产GPGPU有哪些可选标的?
如今,美国实施了一项新的许可要求,限制中国使用高端GPU获得先进的计算能力,因为近两年商业领域最先进的GPU产品受到限制,目前还没有完全替代的选择。因此,美国政府认为,切断中国从美国企业获得这些芯片的直接渠道,可以阻碍中国人工智能的发展,延缓中国人工智能的发展,希望中国人工智能领域能够崩溃。
但事实呢?事实是,美国公司的股票被禁止下跌,而生产类似芯片的中国公司的股票却呈现出相反的上涨趋势。这也意味着中国公司作为美国企业的战略竞争对手,可能会获得更大的发展空间。
事实上,从2019年开始,应用于超级计算领域的高端GPU在中国销售时就受到了严格的控制,但当时只有AMD产品受到限制,英伟达的产品并没有受到影响,所以公司和消费者对产品的感知并不强烈。这次扩大范围后,除了超级计算中心,其主要应用领域还包括云计算服务器、数据中心、AI培训等场景,影响了很多大型互联网公司。
由于前车可鉴,随着国内云计算和互联网公司在云备份和数据处理方面需要的信息越来越多,各大互联网公司和云厂商也在AI芯片领域进行布局。
2019年,阿里推出了“含光800”的人工智能芯片,“含光800”是一款面向数据中心AI的人工处理推理芯片,选用台积电12nm。 工艺,这是一个为AI情景深度定制的芯片,进一步提高了AI情景计算的效率。阿里曾经说过,“含光800”是当年世界上最强的AI芯片,性能和能效比都是第一位的,一个“含光800”的算率相当于10个GPU。现已应用于阿里云云服务器,可提升电商智能搜索、智能营销等场景。虽然阿里“含光800”不卖,但阿里云智能总裁张建峰也提到“含光800”将采用阿里云对外导出。 AI 计算率,未来企业可通过阿里云获得“含光800”的计算率。
百度还在2020年量产了第一代AI芯片——昆仑。百度昆仑1采用三星14nm工艺,目前量产超过2万片,广泛布局在搜索引擎和百度智能云生态合作伙伴等场景中。2021年下半年,百度昆仑实现量产,采用7nm先进工艺,性能比百度昆仑提升3倍。据悉,百度正在制作第三款昆仑芯片,将于明年年初上市。
腾讯也在2021年发布了视频处理芯片“沧海”和AI芯片“紫霄”。字节在“2022” 火山发动机原动力大会也正式确定了其自主芯的规划。目前,字节自主研发芯片已涉足视频平台、信息和娱乐应用。
到目前为止,国内互联网制造商的芯片研发方向集中在云计算、视频图像处理等方面的特殊或通用芯片。除了互联网制造商,国内一些GPU制造商不断发布一些性能优异的产品。
当前全球AI计算芯片主要分为GPGPUP。、ASIC、FPGA有三种结构。而且受限的A800和H800芯片属于GPGPU架构芯片。现在只有GPGPU架构可以运行大模型训练。
目前,国内AI芯片的主要制造商包括华为、寒武纪、海光信息、遂原、墙体、天数智能芯片等。此外,龙芯也在布局。其中,使力GPGPU芯片包括海光、墙体科技、沐曦科技、龙芯等。
海光深算一号选择的是GPGPU架构,是企业DCU。 该系列主要销售商品。
从实际量产技术来看,国内厂商中海光信息是第一梯队,深算一号可以用来运行大模型,在2022年。 在大数据处理、人工智能、商业计算等方面,年度完成了商业应用。但其整体性能仅相当于英伟达P100的水平,大约是2014年英伟达的技术水平。然而,其深算二、三号也处于研发阶段,海光表示其产品特性在国内处于领先地位。
GPGPU芯片BR100系列于2022年发布,其性能超过英伟达A100。BR100 系列通用 GPU 芯片支持云训练和推理,现在已经到了收尾阶段,正在准备流片。墙体技术的第二个芯片已经开始构建模式。未来,墙体技术将逐步推出面向智能计算中心、云游戏和边缘计算的GPU芯片。对未来大规模生产的应用情况暂时存疑。另外需要注意的是,软件生态对于国内初创GPGPU公司来说更为重要。现在国内的初创企业虽然在细分领域有一定的落地,但真正能够在模型训练中得到实践应用的还非常欠缺。如果未来BR100的实际应用效果还不错,那么在软件生态方面还需要更加努力。
沐曦也是国内GPGPU运动员之一。沐曦公司主要有曦思和曦云两种AI芯片,其中曦云MXC系列是该公司开发的GPU芯片,用于AI培训和通用计算。与A100/A800相比,MXC500是沐曦的算率芯片,FP32浮点性能可以达到15TFlops,与A100显卡FP32相比。 性能19.5 TFLOPS。MXC500的完整软件栈除了性能接近外,(MXMACA)同时兼容CUDA,预计年底大规模出货。
目前龙芯还没有产品发布,目前已经完成了相关IP的设计。在验证升级的过程中,第一个集成GPGPU核的SOC芯片计划于2024年Q1流片。从流片到量产,如果按照最快6-12个月计算,龙芯的GPGPU产品至少要在2024年Q3之后才能发布,估计需要2025年才能量产。
另外,华为升腾也很受欢迎。华为的升腾910也可以作为训练芯片,它的算率很强,超级英伟达的Tesla V100翻了一番。但由于盛腾910依赖华为自身的软件生态,需要华为的深度提升和代码移植,实用性相对较差,其选择台积电的7nm工艺在生产上也受到限制,暂时不做过多讨论。
英伟达是最好的选择,但不能被视为唯一的选择。
如今,GPU缺口仍在加速扩大。如果A800/H800也受到供应限制,中国云服务器制造商必须提前规划自己的发展路径。
从最初强调计算率和独特技术的趋势,中国AI芯片制造商正在逐步转向针对特定应用领域的优化方向。虽然现在微软、谷歌、百度都用AI来聊天画画,但并不代表他们的AI不能做别的事情。目前,让AI落地民用市场,不仅可以让厂商利用AI获得更多的利润,尤其是微软、谷歌、百度,还可以让用户更直观地体验AI,在民用市场收集更多的数据进行实践,也可以反馈云场景的应用。这个过程可能会长一点,慢一点,但这也是必须要做的事情。
类似地,如果不能与中国进行贸易,美国公司也将遭受巨大的损失。这些GPUA800和H800就是英伟达为绕过美国对中国实施的出口禁令而开发的,从而保持其在中国市场的地位。英伟达此前透露,他们可以在下半年提供更多的GPU,但没有提供任何定量信息。Colettet英伟达首席财务官 Kress此前在2023年2月至4月的财务报告会上透露:“我们正在处理这个季度的供应,但是我们也为下半年购买了大量的生产材料。相信下半年的供应量会比上半年高很多。”
就中国行业现状而言,英伟达GPU确实是首选,但从长远来看,它并不能被视为唯一的选择。
本文来自微信公众号“半导体产业纵横”(ID:ICViews),作者:丰宁,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




