AMD 发布下一代开源软件栈技术 ROCm 7
06-14 06:57
IT 世家 6 月 13 今天凌晨的日消息 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 生产力与开发者。
随着 ROCm 7 的发布,AMD 终于从其 ROCm 6 在过去的几年里,软件栈向前迈进。 —— 特别是在 AI 自从计算出现以来 —— 经过多次更新。下面是 AMD 在 ROCm 7 重点关注的一些功能:
最新算法和模型
用于拓展 AI 的高级功能
MI350 系列支持
集群管理
企业级功能
通过 ROCm,AMD 这意味着它在软件堆栈中越来越注重推理能力的提高。ROCm 7 堆栈将包括加强框架。,如 vLLM v1、llm-d、SGLang,并且专注于提供多种提升。即将到来 ROCm 7 包括新核心和算法 GEMM 自动调优、MoE、Attention 和基于 Python 内核编写。
AMD 已宣布对其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 还包括对这些高级数据类型的全面支持,例如 FP8、FP6、FP4 混合精度。
IT 从新闻发布会上了解到,在性能方面,AMD 表示 ROCm 7 把推理作为重点,为 AI 高达带来了工作负荷 3.5 性能提升倍。
具体而言,相比之下 ROCm 6,ROCm 7 的 Llama 3.1 70B 提高了 3.2 Qwen2-72B 提高了 3.4 倍,DeepSeek R1 提高了 3.8 倍。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




