MiniMax M2.5霸榜全球大模型:凭何力压Claude、GPT?

1小时前
大模型行业的竞争规则正悄然转变。

MiniMax M2.5持续领跑全球大模型榜单!


OpenRouter实时数据显示,这款由Minimax于2月12日推出的模型,自发布后的一个月里,始终占据全球大模型周调用量排行榜首位。



它超越的并非普通模型,而是Gemini、DeepSeek、Claude等一众旗舰级模型。



该榜单的独特之处在于,它并非基于实验室跑分或社交媒体热度,而是OpenRouter依据数百万用户的真实使用数据生成的排名。


为何一款并非“最智能”的模型,能让全球开发者用实际行动投票支持?


01 MiniMax缘何登顶全球第一?


不少人第一反应是,MiniMax M2.5靠低价取胜。


与美国大模型相比,它确实是“价格杀手”。


OpenRouter实时定价显示:


MiniMax M2.5:输入0.27美元/百万Token,输出0.95美元/百万Token。


Claude Opus 4.6:输入5美元/百万Token(约为前者的18倍)、输出25美元/百万Token(约为前者的26倍)。


一位海外开发者在X平台算了一笔账:“运行OpenClaw连续1小时(100 TPS),MiniMax M2.5仅需1美元;若换成Claude,一天可能要花费数百美元。”


还有网友将MiniMax M2.5称作“具备Claude Opus 95%性能的平价版”,并表示“两者的差距不是钱的问题,而是关乎生存”。


正是这种“用得起”的低门槛,将MiniMax M2.5推上了榜首位置。


但MiniMax M2.5不只是价格低廉,其真正特别之处在于,它从设计之初就并非为“聊天”功能打造,而是针对编程、工具使用、搜索、办公等真实工作流程开发。


过去很长一段时间,大模型最主要的应用场景是聊天、问答、写作辅助,模型之间比拼的是谁的回答更自然、推理能力更强、综合性能更优。


然而到了今年,增长最快的需求类型已转变为Agent(智能体):让模型能够自主搜索资料、调用工具、修改代码、浏览网页、撰写文档、运行流程。


OpenRouter的AI应用榜单清晰地反映了这一变化。


近一个月来,排名靠前的应用包括OpenClaw(累计消耗9.62T tokens)、Kilo Code(5.06T tokens)、BLACKBOXAI(2.01T tokens),这些全都是Agent(智能体)产品。



在这样的背景下,MiniMax M2.5的胜出便不难理解。


MiniMax M2.5采用MoE架构,推理速度快、延迟低,上下文窗口达197K,完美适配Agent的长工作流程。


在Agent场景中,一个任务需要连续调用多轮,价格差异会被成倍放大。


而MiniMax M2.5恰好适合Agent场景,且价格更低,完美满足了Agent“高频调用、低成本执行”的需求特点。


在Reddit和LocalLLaMA社区,开发者们的实际测试反馈好评如潮:“它像Claude Sonnet一样擅长工具调用,但多步工作流程要简洁得多”“它是OpenClaw的主模型,性价比直接超越Claude”。


更巧的是,MiniMax M2.5发布时恰逢开源Agent框架OpenClaw爆发。


MiniMax官方率先上线“OpenClaw专区”教程,OpenClaw文档甚至将MiniMax M2.5列为推荐模型。


在这波“养龙虾”热潮中,MiniMax直接享受到了OpenClaw爆发带来的红利。


数据显示,OpenClaw是MiniMax M2.5月调用量最大的单一应用贡献者之一。OpenClaw的爆发,进一步将MiniMax M2.5推向了巅峰。



02 MiniMax霸榜是短暂现象吗?


如果说MiniMax M2.5只是吃到了短期流量红利,那么其排名大概率很快会回落。但它如今瞄准的,是AI应用的主流方向。


无论是MiniMax,还是DeepSeek、Kimi、阶跃星辰、Google、Anthropic、OpenAI,全球各大模型公司都在押注Agent,这一路线已逐渐成为行业共识。


对于选对方向的MiniMax而言,显然具备先发优势。


一旦开发团队围绕MiniMax M2.5,将prompt、工具调用、长上下文处理、多步执行和成本预算等环节理顺,切换到其他模型就不只是“更换一个核心”那么简单,而是整套工作流程和成本核算都要重新调整。


除非替代模型的性能有显著提升,否则很多开发者不会有足够动力为了小幅性能改进,去承担更高成本或重新调试的麻烦。


当然,这种优势能否持续,还要看MiniMax自身的发展速度。


官方模型更新记录显示,2025年12月MiniMax的模型还是M2.1,到2026年2月已发布M2.5,迭代速度明显快于Anthropic、OpenAI、Google等海外巨头。


这意味着MiniMax在短周期内强化了开发者最关注的能力,M2.5的升级方向也明确指向Agent密集的场景。


尽管如此,围绕Agent的模型竞争已开始加速。


OpenRouter最新公开榜单显示,Step 3.5 Flash、Gemini 3 Flash Preview、DeepSeek V3.2、Claude Opus 4.6都在奋力追赶。


例如,阶跃星辰(Step 3.5 Flash)的优势十分直接:免费。


这一策略的冲击力很强,因为大量开发者和团队仍处于试验阶段,Agent工作流程远未完全定型,谁能先将试用门槛降至最低,谁就更易吸引用户。正因如此,Step 3.5 Flash的调用量迅速上升。


再如,Kimi K2.5的定位与M2.5相同,显然不只是做聊天功能,而是朝着复杂工作流程、工具调用和长链路任务发展,也在争夺同一类Agent/研究/编程用户。


所以接下来,MiniMax要比拼的不是在榜单上的上升速度,而是能否将“调用量”转化为“Agent默认选择”,并将其转化为长期的实际收益。



03 模型霸榜能转化为商业收益吗?


事实上,MiniMax的商业化能力一直备受外界认可。


在“大模型烧钱”的普遍担忧中,MiniMax率先证明大模型未必只能在“收入增长”和“大幅亏损”之间做选择。


2025年,MiniMax收入同比增长158.9%至7904万美元,经调整净亏损为2.509亿美元,仅同比增加2.7%,毛利率则从12.2%提升至25.4%。


对比同样在港股上市的智谱,后者2025年上半年收入1.909亿元人民币,但经调整净亏损达17.52亿元人民币,亏损程度明显更高。


在目前已披露的数据范围内,MiniMax的经营效率更早显现出改善迹象。


再看MiniMax的收入结构。


其中一部分是AI-native products(面向终端用户,如海螺AI、Talkie等产品),2025年收入约5310万美元,占比约三分之二。


另一部分是Open Platform和其他企业服务(面向B端用户,如模型API、开放平台、企业定制等),2025年收入约2596万美元,占比约三分之一。


这表明,MiniMax并非仅靠榜单上的热门模型盈利,也不是依赖单一App变现,而是将模型能力同时接入前台产品和后台平台服务两条线。


MiniMax M2.5作为现阶段性能最强的主力大模型,不仅提升了MiniMax自家产品矩阵的能力上限,还推动了平台收入的增长。


2026年前两个月,MiniMax的业务进展已明显加速,模型调用量和新增用户规模均大幅提升。数据显示,M2系列文本模型在2026年2月的平均单日Token消耗量较2025年12月增长了6倍以上。



这正是MiniMax商业化中最值得关注的一点。


很多模型公司也有热度,也能在开发者圈中获得一轮关注,但最终衰落的原因往往不是模型不够强,而是未能将模型能力转化为可收费的商业闭环。


MiniMax则不同,它透露自己70%以上的收入来自国际市场,2025年的增长很大程度上也来自中国以外的销售。


这表明MiniMax不仅在国内开发者或中文互联网中受欢迎,还在更广泛的范围内被用户认可并付费。


资本市场显然也注意到了这一点。3月10日收盘时,MiniMax市值首次超过百度。


04 结语


MiniMax M2.5此次霸榜,真正值得关注的并非排名本身,而是大模型行业的竞争规则正在改变。


2026年,市场已用一套更现实的标准进行选择:谁更适合接入Agent,谁能降低成本,谁能让开发者和企业真正使用起来?


从某种意义上说,这场竞争比拼的已不是谁更接近未来,而是谁更早将未来转化为实际业务。


本文来自微信公众号“世界模型工场”,作者:世界模型工场,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com