国产GPU与NVIDIA显卡对比：数据带来惊喜

2025-08-04

快科技8月3日消息，近年来国产GPU不断取得突破。前不久，砺算科技的7G01芯片性能达到了RTX 4060级别，更早之前摩尔线程也推出了高性能GPU，其不仅在游戏方面表现出色，AI领域也是重点发展方向。

在AI领域，目前最强的GPU由NVIDIA推出，其硬件架构及CUDA生态构筑了几乎难以逾越的壁垒。那么，国产GPU在这方面与NVIDIA的差距究竟有多大呢？这一问题引发了诸多争议。知乎用户@菽陌松囿作为业内人员，进行了实际测试，并公布了一些值得参考的数据。

据他所说，（摩尔线程的GPU）kernel launch能做到5us，而NVIDIA大概是几十us（他有点记不清具体数值了）；gemm mfu能达到98%，NVIDIA大概为85%；FA mfu达到95%，NVIDIA则是68%。

此外，他还指出了N卡的一些不足。例如，通信offload ace，NVIDIA根本未考虑，是DeepSeek帮他们做的sm隔离，导致15%的sm被浪费。

当然，摩尔线程的GPU也并非完美无缺。比如，它支持Link，但带宽受限于硬件，与NVIDIA仍存在一定差距，不过这并非难以克服的障碍。

他强调，这些数据经过了研发同事的确认，不会欺骗同行，这意味着这些数据结果相当可靠。总体来看，这番对比结果令人惊喜，也让人颇感意外。

他认为，摩尔线程的GPU从硬件、kmd、umd算子库全部进行了重写，有力回击了那些认为摩尔线程没有核心技术的观点。

他援引的数据详细信息可参考摩尔线程官号公布的文章，其中有更全面的技术解析，只是没有与NVIDIA的数据对比。菽陌松囿提供的数据对比能让我们观察到两者在AI方面的表现。虽然这并不意味着国产GPU能全面超越N卡，但也反驳了部分网友认为国产GPU只是使用国外IP套壳的说法。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com