国产GPU与NVIDIA显卡对比:数据带来惊喜
快科技8月3日消息,近年来国产GPU不断取得突破。前不久,砺算科技的7G01芯片性能达到了RTX 4060级别,更早之前摩尔线程也推出了高性能GPU,其不仅在游戏方面表现出色,AI领域也是重点发展方向。
在AI领域,目前最强的GPU由NVIDIA推出,其硬件架构及CUDA生态构筑了几乎难以逾越的壁垒。那么,国产GPU在这方面与NVIDIA的差距究竟有多大呢?这一问题引发了诸多争议。知乎用户@菽陌松囿作为业内人员,进行了实际测试,并公布了一些值得参考的数据。

据他所说,(摩尔线程的GPU)kernel launch能做到5us,而NVIDIA大概是几十us(他有点记不清具体数值了);gemm mfu能达到98%,NVIDIA大概为85%;FA mfu达到95%,NVIDIA则是68%。
此外,他还指出了N卡的一些不足。例如,通信offload ace,NVIDIA根本未考虑,是DeepSeek帮他们做的sm隔离,导致15%的sm被浪费。
当然,摩尔线程的GPU也并非完美无缺。比如,它支持Link,但带宽受限于硬件,与NVIDIA仍存在一定差距,不过这并非难以克服的障碍。
他强调,这些数据经过了研发同事的确认,不会欺骗同行,这意味着这些数据结果相当可靠。总体来看,这番对比结果令人惊喜,也让人颇感意外。
他认为,摩尔线程的GPU从硬件、kmd、umd算子库全部进行了重写,有力回击了那些认为摩尔线程没有核心技术的观点。
他援引的数据详细信息可参考摩尔线程官号公布的文章,其中有更全面的技术解析,只是没有与NVIDIA的数据对比。菽陌松囿提供的数据对比能让我们观察到两者在AI方面的表现。虽然这并不意味着国产GPU能全面超越N卡,但也反驳了部分网友认为国产GPU只是使用国外IP套壳的说法。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




