ASIC会不会取代GPU?

2024-12-21

最近,美国股市发出了很大的声音。科技股有两个概念,突然变得非常流行,引起了市场的高度关注,涨幅惊人。这两个概念是ASIC和量子计算。


今日本文,我们主要谈谈ASIC。


根据资本市场的说法,ASIC正在加速崛起,威胁着GPU在AI计算中的主导地位。作为ASIC最重要的概念股,博通股价暴涨,一度从180飙升至250,市值超过1亿美元。相比之下,英伟达成为昨天的黄花,股价一路下跌,甚至不到130美元。



博通股价(昨日下跌)


所以,ASIC时代真的来了吗?博通真的会取代英伟达,并逐渐成为AI的第一名?


什么是ASIC和GPU?


ASIC和GPU,全部用于计算功能的半导体芯片。又称“AI芯片”,因为它们都可以用于AI计算。


准确地说,除了两者之外,计算芯片还包括大家比较熟悉的CPU和FPGA。


在工业上,半导体芯片通常分为数字芯片和模拟芯片。在这些芯片中,数字芯片的市场规模比较大,达到70%左右。


还可以进一步细分数字芯片,分为:逻辑芯片、存储芯片和微控制单元(MCU)。CPU、GPU、FPGA、ASIC,全部属于逻辑芯片。



芯片分类


计算芯片就是逻辑芯片。它包含各种逻辑门电路,可以实现计算和逻辑判断功能。


在四个芯片中,CPU和GPU是一个通用芯片,可以完成各种任务。尤其是CPU,是全能玩家,单核主频率高,什么都能做,所以经常被用作Cpu。


GPU最初用于图像处理(显卡)。它有大量的核心(数千个),可以并行计算,也就是说,它擅长同时完成大量的简单计算任务。(图像处理是同时处理大量像素计算。)



AI运算图形计算也是典型的并行计算任务。


AI计算包括大量的矩阵乘坐、卷积、循环层、梯度计算等平行任务,非常适合GPU。CPU不适合AI计算,这也是英特尔股价跌至20美元以下的原因之一。


自2023年以来,AI浪潮爆发,大多数企业使用AI培训,使用AI培训。 英伟达的GPU集群。如果进行合理优化,一张GPU卡可以提供数十到数百个CPU服务器的计算率。这直接导致英伟达的股价飙升了几十倍,买不到。



NVIDIA HGX A100 8 GPU 部件


再次看看ASIC和FPGA。


ASIC(Application Specific Integrated Circuit,专用集成电路)是专门用于特定任务的芯片。ASIC官方定义是指专门设计和制造的集成电路,以满足特定用户或特定电子系统的要求。



著名的Google企业TPU(Tensor Processing Unit,张量处理单元),以及前些年非常流行的比特币矿机,英特尔的Gaudi 2 IBM芯片,ASIC芯片AIU,AWS的Trainium,全部属于ASIC芯片。


这些年很火DPU(Data Processing Unit,数据处理单元)和NPU(Neural Processing Unit,ASIC芯片也是神经网络处理单元。


FPGA(Field Programmable Gate Array,现场可编程门阵列),是半定制芯片,又称半定制芯片,“全能芯片”。为了实现所需的数字逻辑功能,FPGA可以在生产后进行无限频率的重复编程。


AISC和FPGA的区别在于,AISC是全定制芯片,功能写死,无法更改。 而且FPGA是半定制芯片,功能灵活,可玩性强。 FPGA不需要流片(一个非常昂贵的过程),但是由于可编辑和多余的功能,一旦用于单一目的,就会有浪费。在大规模生产的情况下,FPGA的成本高于ASIC,能效完美不如ASIC。


因此,FPGA现在广泛应用于产品原型的研究、开发、设计迭代,以及一些低产量的特定应用,或用于培训和教学。适用于ASIC验证开发进度短的产品。


总而言之,大家要记住,AI计算中使用的大规模出货,一般不考虑FPGA。


所以,AI芯片,即GPU和ASIC之间的争论。


GPU和ASIC,到底谁厉害?


ASIC作为一种特殊的定制芯片,基于芯片所面临的特殊任务。其计算能力和计算效率与任务算法严格匹配。整个芯片架构,如芯片核心数量、逻辑计算单元与控制单元的比例、缓存等,也是精确定制的。


因此,ASIC可以实现最大的体积和功耗。这类芯片的稳定性、保密性、计算率和能效都将优于通用芯片。(GPU)更强。


例如,AWS的预算相同,Trainium H100(ASIC芯片)可与英伟达相比。 GPU更有效地完成了推理任务,性价比提高了30-40%。Trainium3计划在明年推出,其计算性能提高了2倍,能效提高了40%。



但是,为什么这两年一直火的都是GPU呢?


其根本原因是英伟达太猛了。


英伟达在AI上更是扭打。当初,AI巨头辛顿(新诺贝尔获得者)带着弟子使用GPU进行AI训练,取得了巨大的突破,让英伟达发现自己还有这样的财富


接着,英伟达开始在AI上下功夫,拼命做更强大的GPU(当然,也有游戏推广)。


随着英伟达的不断努力,GPU的核心数量和工作频率不断增加,芯片面积也越来越大。计算率越强,越有利于缩短训练时间,加快产品发布,这也是一个重要优势。


当然,计算率越来越高,功耗也越来越高。但是,依靠工艺制造、水冷等被动散热,勉强也能承受,总之不会烧坏。


除硬件外,英伟达在软件和生态方面也非常擅长布局。


CUDA(AI开发的软件套件)是GPU的核心竞争力。基于CUDA,初学者可以很快上手。因此,英伟达的GPU计划被全球用户广泛接受,形成了稳定的生态。


相比之下,FPGA和ASIC的研发仍然过于复杂,不适合普及。


ASIC之所以在AI上做不到GPU,与其成本高、发展进度长、发展风险大有关。 现在AI算法变化很快,ASIC这一开发进度,非常致命。


基于以上原因,GPU才有了当前的大好局面。


值得一提的是,正如我前面所说,AI计算可以分为两种:练习和推理。培训任务需要更强的计算率,所以在AI培训中,厂商主要以GPU为主。


如果推理任务,计算率要求较低,不需要任何平行性,所以GPU的计算率优势没有那么明显。许多企业将开始选择更便宜、更省电的FPGA或ASIC进行计算。


这一状况一直持续到今天。AI芯片,GPU的比例可以达到70%以上。


现在,因为每个人都真的是“苦英伟达久了”,不想总是被英伟达“卡脖子”,所以他们非常希望计算率多样化。此外,大模型现在已经从“训练热”变成了“推理热”。推理AI计算的需求增加,给了ASIC一个机会。


所以,帮助ASIC产业链,提高ASIC芯片在AI领域的份额,已经成为大家的共识。这样,博通和Marvell的股价就暴涨了。(据说博通正在和三大客户开发AI芯片,预计2025年AI芯片业务收入将达到150亿-200亿美元。)


所以,替代真的那么容易吗?ASIC会不会很快淘汰GPU?


绝对不是。


英伟达的GPU依然是中短期AI芯片的首选,因为它在性能、生态、集成能力等方面的优势。英伟达的整个软硬件网络方案都很完善,技术和经济实力太强。GPU的存量和出货量还是很大的,市场地位很难撼动。


虽然ASIC的崛起速度很快,但是它仍然需要一些时间才能成熟。AI ASIC芯片研发,风险也很大。即使研究成功,也需要时间得到用户的认可。


这意味着GPU和ASIC将在很长一段时间内并存。用户会根据不同的场景选择最适合自己的芯片。开发自主研发的ASIC更有利于厂商与英伟达的谈判。


未来的情况仍然比较难以预测。 目前,量子计算是否会对计算领域产生颠覆性影响,也是讨论的热点。


本文来自微信微信官方账号“鲜枣课堂”,作者:小枣君,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com