B30曝光了NVIDIA专用芯片!

06-05 07:22

电子发烧友网综合报道。 报道称,NVIDIA 正在为中国市场开发一款名为“” B30 "的降规版 AI 芯片,这个芯片将首次支持多支持? GPU 扩展,用户可以通过连接多个芯片来创建更高性能的计算集群。B30 预计将采用最新的芯片。 Blackwell 架构,使用 GDDR7 显存,而非高频宽内存(HBM),同时也不会选择先进的台积电封装技术。


很多人认为很多 GPU 扩展能力是指 NVLink,但 NVIDIA 已经处于其消费水平 GPU 芯片中取消 NVLink 支持,因此 B30 是否支持 NVLink 现在还不能确定。有消息称 B30 芯片得多 GPU 因特网功能可以基于 NVIDIA 的 ConnectX-8 SuperNICs 技术,这个技术曾经存在 Computex 2025 上面显示,用于连接 RTX Pro 6000 GPU。


NVIDIA ConnectX-8 SuperNIC 是行业内第一款集成支持单一设备的设备。 PCIe Gen6 快速网络的交换机和交换机 SuperNIC。ConnectX-8 专为现代 AI 在简化系统设计、提高功耗和成本效率的同时,基础架构模式可以提供更高的吞吐量。


NVIDIA ConnectX-8 基于重新定义 PCIe 系统的概率。通过将 PCIe Gen6 高性能的交换机和交换机 SuperNIC 集成到单一的集成设备中,ConnectX-8 可以简化服务器设计,减少零件数量,解锁现代 AI 高带宽通信路径是工作负载所需。从而打造更简单、更节能的平台,同时降低整体拥有成本。 ( TCO ) 并且具有优异的性能可扩展性。


此外,ConnectX-8 SuperNIC 也可以以多为基础 GPU 在平台上获得强化的机密计算能力。


B30 与 H20 存在性能差异,主要表现在几个方面:1、H20显存技术差异 芯片选用 HBM3 显存,带宽高达 4.0TB/s,而 B30 预计使用芯片 GDDR7 显存,带宽可降至 1.7TB/s 上下。HBM3 显著优于带宽和能效比。 特别是在处理大规模数据集时,GDDR7,H20 显存性能优势将更加明显。


2、互联网技术比较:H20 支持 NVLink 技术、卡间互联带宽高达 900GB/s,建立大规模计算集群是合适的。B30 芯片得多 GPU 可以依靠扩展功能 ConnectX-8 SuperNICs 技术,而非 NVLink,它的互联带宽和延迟可能不如 在需要低延迟通信的情况下,H20的表现可能受到限制。


3、性能定位差异:H20 芯片在 FP8 和 FP16 精度下的 Tensor Core 性能分别是 296 TFLOPS 和 148 TFLOPS,适用于高精度计算任务。B30 作为降规版的芯片,单芯片的计算率可能低于 H20,但是通过很多 GPU 扩展可以提高整体性能,适用于对成本敏感但需要一定扩展性的场景。


4、适应应用领域:H20 芯片在垂直模型训练和推理任务中表现出色,特别适合需要高带宽和低延迟的场景。B30 芯片更侧重于通过更多的芯片。 GPU 扩展可以满足中小规模计算的需要,在性价比和灵活性方面可能更有优势,但是单芯片的性能可能不可能。 H20 媲美。


与华为昇腾 910 与国产芯片相比,B30 该系列在显存容量方面占优势,但价格和能效比可能处于劣势。B30 售价预估为 6500-8000 美金,较 H20 的 1-1.2 大约一万美元减少 40%,但仍然高于一些国产芯片。


B30 中国产业的发展面临挑战。如果技术限制,显存带宽和接口简化导致性能下降,可能无法满足高端用户的需求。从长远来看,技术限制可能会减弱。 NVIDIA 竞争力在中国市场。在市场接受度方面,中国客户对性能和成本平衡比较敏感,B30 价值需要通过实际表现来证明。国产芯片的崛起可能会分流一些市场需求,B30 需要不断优化生态和价格。


另外,出口管制政策可能会进一步收紧,影响 B30 供应链和市场份额。中国对自主可控技术的重视可能会推动国产芯片的替代,B30 应对政策不确定性。


阅读更多热门文章


加关注 星标我们


把我们设为星标,不要错过每一次更新!


喜欢就奖励一个“在看”!


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com