MiniMax M2.5霸榜全球大模型：凭何力压Claude、GPT？

03-14 06:27

大模型行业的竞争规则正悄然转变。

MiniMax M2.5持续领跑全球大模型榜单！

OpenRouter实时数据显示，这款由Minimax于2月12日推出的模型，自发布后的一个月里，始终占据全球大模型周调用量排行榜首位。

它超越的并非普通模型，而是Gemini、DeepSeek、Claude等一众旗舰级模型。

该榜单的独特之处在于，它并非基于实验室跑分或社交媒体热度，而是OpenRouter依据数百万用户的真实使用数据生成的排名。

为何一款并非“最智能”的模型，能让全球开发者用实际行动投票支持？

01 MiniMax缘何登顶全球第一？

不少人第一反应是，MiniMax M2.5靠低价取胜。

与美国大模型相比，它确实是“价格杀手”。

OpenRouter实时定价显示：

MiniMax M2.5：输入0.27美元/百万Token，输出0.95美元/百万Token。

Claude Opus 4.6：输入5美元/百万Token（约为前者的18倍）、输出25美元/百万Token（约为前者的26倍）。

一位海外开发者在X平台算了一笔账：“运行OpenClaw连续1小时（100 TPS），MiniMax M2.5仅需1美元；若换成Claude，一天可能要花费数百美元。”

还有网友将MiniMax M2.5称作“具备Claude Opus 95%性能的平价版”，并表示“两者的差距不是钱的问题，而是关乎生存”。

正是这种“用得起”的低门槛，将MiniMax M2.5推上了榜首位置。

但MiniMax M2.5不只是价格低廉，其真正特别之处在于，它从设计之初就并非为“聊天”功能打造，而是针对编程、工具使用、搜索、办公等真实工作流程开发。

过去很长一段时间，大模型最主要的应用场景是聊天、问答、写作辅助，模型之间比拼的是谁的回答更自然、推理能力更强、综合性能更优。

然而到了今年，增长最快的需求类型已转变为Agent（智能体）：让模型能够自主搜索资料、调用工具、修改代码、浏览网页、撰写文档、运行流程。

OpenRouter的AI应用榜单清晰地反映了这一变化。

近一个月来，排名靠前的应用包括OpenClaw（累计消耗9.62T tokens）、Kilo Code（5.06T tokens）、BLACKBOXAI（2.01T tokens），这些全都是Agent（智能体）产品。

在这样的背景下，MiniMax M2.5的胜出便不难理解。

MiniMax M2.5采用MoE架构，推理速度快、延迟低，上下文窗口达197K，完美适配Agent的长工作流程。

在Agent场景中，一个任务需要连续调用多轮，价格差异会被成倍放大。

而MiniMax M2.5恰好适合Agent场景，且价格更低，完美满足了Agent“高频调用、低成本执行”的需求特点。

在Reddit和LocalLLaMA社区，开发者们的实际测试反馈好评如潮：“它像Claude Sonnet一样擅长工具调用，但多步工作流程要简洁得多”“它是OpenClaw的主模型，性价比直接超越Claude”。

更巧的是，MiniMax M2.5发布时恰逢开源Agent框架OpenClaw爆发。

MiniMax官方率先上线“OpenClaw专区”教程，OpenClaw文档甚至将MiniMax M2.5列为推荐模型。

在这波“养龙虾”热潮中，MiniMax直接享受到了OpenClaw爆发带来的红利。

数据显示，OpenClaw是MiniMax M2.5月调用量最大的单一应用贡献者之一。OpenClaw的爆发，进一步将MiniMax M2.5推向了巅峰。

02 MiniMax霸榜是短暂现象吗？

如果说MiniMax M2.5只是吃到了短期流量红利，那么其排名大概率很快会回落。但它如今瞄准的，是AI应用的主流方向。

无论是MiniMax，还是DeepSeek、Kimi、阶跃星辰、Google、Anthropic、OpenAI，全球各大模型公司都在押注Agent，这一路线已逐渐成为行业共识。

对于选对方向的MiniMax而言，显然具备先发优势。

一旦开发团队围绕MiniMax M2.5，将prompt、工具调用、长上下文处理、多步执行和成本预算等环节理顺，切换到其他模型就不只是“更换一个核心”那么简单，而是整套工作流程和成本核算都要重新调整。

除非替代模型的性能有显著提升，否则很多开发者不会有足够动力为了小幅性能改进，去承担更高成本或重新调试的麻烦。

当然，这种优势能否持续，还要看MiniMax自身的发展速度。

官方模型更新记录显示，2025年12月MiniMax的模型还是M2.1，到2026年2月已发布M2.5，迭代速度明显快于Anthropic、OpenAI、Google等海外巨头。

这意味着MiniMax在短周期内强化了开发者最关注的能力，M2.5的升级方向也明确指向Agent密集的场景。

尽管如此，围绕Agent的模型竞争已开始加速。

OpenRouter最新公开榜单显示，Step 3.5 Flash、Gemini 3 Flash Preview、DeepSeek V3.2、Claude Opus 4.6都在奋力追赶。

例如，阶跃星辰（Step 3.5 Flash）的优势十分直接：免费。

这一策略的冲击力很强，因为大量开发者和团队仍处于试验阶段，Agent工作流程远未完全定型，谁能先将试用门槛降至最低，谁就更易吸引用户。正因如此，Step 3.5 Flash的调用量迅速上升。

再如，Kimi K2.5的定位与M2.5相同，显然不只是做聊天功能，而是朝着复杂工作流程、工具调用和长链路任务发展，也在争夺同一类Agent/研究/编程用户。

所以接下来，MiniMax要比拼的不是在榜单上的上升速度，而是能否将“调用量”转化为“Agent默认选择”，并将其转化为长期的实际收益。

03 模型霸榜能转化为商业收益吗？

事实上，MiniMax的商业化能力一直备受外界认可。

在“大模型烧钱”的普遍担忧中，MiniMax率先证明大模型未必只能在“收入增长”和“大幅亏损”之间做选择。

2025年，MiniMax收入同比增长158.9%至7904万美元，经调整净亏损为2.509亿美元，仅同比增加2.7%，毛利率则从12.2%提升至25.4%。

对比同样在港股上市的智谱，后者2025年上半年收入1.909亿元人民币，但经调整净亏损达17.52亿元人民币，亏损程度明显更高。

在目前已披露的数据范围内，MiniMax的经营效率更早显现出改善迹象。

再看MiniMax的收入结构。

其中一部分是AI-native products（面向终端用户，如海螺AI、Talkie等产品），2025年收入约5310万美元，占比约三分之二。

另一部分是Open Platform和其他企业服务（面向B端用户，如模型API、开放平台、企业定制等），2025年收入约2596万美元，占比约三分之一。

这表明，MiniMax并非仅靠榜单上的热门模型盈利，也不是依赖单一App变现，而是将模型能力同时接入前台产品和后台平台服务两条线。

MiniMax M2.5作为现阶段性能最强的主力大模型，不仅提升了MiniMax自家产品矩阵的能力上限，还推动了平台收入的增长。

2026年前两个月，MiniMax的业务进展已明显加速，模型调用量和新增用户规模均大幅提升。数据显示，M2系列文本模型在2026年2月的平均单日Token消耗量较2025年12月增长了6倍以上。

这正是MiniMax商业化中最值得关注的一点。

很多模型公司也有热度，也能在开发者圈中获得一轮关注，但最终衰落的原因往往不是模型不够强，而是未能将模型能力转化为可收费的商业闭环。

MiniMax则不同，它透露自己70%以上的收入来自国际市场，2025年的增长很大程度上也来自中国以外的销售。

这表明MiniMax不仅在国内开发者或中文互联网中受欢迎，还在更广泛的范围内被用户认可并付费。

资本市场显然也注意到了这一点。3月10日收盘时，MiniMax市值首次超过百度。

04 结语

MiniMax M2.5此次霸榜，真正值得关注的并非排名本身，而是大模型行业的竞争规则正在改变。

2026年，市场已用一套更现实的标准进行选择：谁更适合接入Agent，谁能降低成本，谁能让开发者和企业真正使用起来？

从某种意义上说，这场竞争比拼的已不是谁更接近未来，而是谁更早将未来转化为实际业务。

本文来自微信公众号“世界模型工场”，作者：世界模型工场，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

全球总裁更迭背后：北面的增长困局与转型压力

伯克利师徒掌舵，上海芯片独角兽加特兰启动IPO

安徽毛豆腐火遍全网好莱坞明星跟风模仿背后低调小城藏着多少惊喜

马斯克挖来Cursor两员大将，Grok Claw要来了？

OpenAI 30亿收购计划遇阻，微软搅局下的AI编程赛道之争

项目推荐

康小虎百岁计划・健康大使招募计划

毛加健康

康老板 · 氧疗堂