阶跃星辰发布新一代基础大模型Step 3,成功搭载华为昇腾芯片

07-28 06:06

IT之家7月26日消息,在2025世界人工智能大会(简称“WAIC 2025”)开幕前夕,阶跃星辰于昨日在上海正式发布了新一代基础大模型——Step 3,并将于7月31日面向全球企业和开发者开源。


据官方介绍,Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,在兼顾模型效果与推理成本方面,是模型架构创新、算法工程协同设计上的大胆尝试与规模升级。Step 3采用MoE架构,总参数量321B,激活参数量38B


Step 3具备强大的视觉感知和复杂推理能力,能够准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及解决日常生活中的各类视觉分析问题。


Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08 - 2025.05)等榜单上,取得了开源多模态推理模型的最优成绩。


官方表示,目前主流开源模型虽针对解码进行了大量优化,但优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。在架构设计阶段,Step 3充分考量系统与硬件的特性,实现了在广泛硬件平台上的高效推理。凭借系统和架构创新,Step 3达到了行业领先的推理解码效率。


根据原理分析,Step 3在国产芯片上的推理效率最高可达DeepSeek - R1的300%,并且对所有芯片都很友好。在基于NVIDIA Hopper架构的芯片进行分布式推理时,实测Step 3相较于DeepSeek - R1的吞吐量提升超70%,且这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。


阶跃星辰宣布联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现Step 3的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行Step 3,其它联盟厂商的适配工作正在进行中。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com