竞技场现神秘模型Kiwi-do,杨植麟2026新模型计划引猜想

01-07 06:18

Kimi是否将推出全新多模态模型K2-VL?近期大模型竞技场(LMArena)上出现的神秘模型Kiwi-do引发了外界的广泛猜测。


有外国网友在LMArena发现了名为Kiwi-do的新模型,经询问得知其隶属于Kimi。X平台的网友们据此推测,Kiwi-do很可能就是Kimi即将发布的K2-VL。



这一猜测并非毫无依据。此前月之暗面创始人杨植麟曾在Reddit回复网友称VL模型正在测试,2024年12月31日的公开信中也提到2026年有新模型发布计划。此外,《科创板日报》消息显示,Kimi计划今年一季度上线多模态新模型,型号或为K2.1或K2.5。种种迹象表明,Kimi的新模型已箭在弦上。


那么Kiwi-do的实际表现如何?有网友对比了Kiwi-do与已上线的K2-Thinking在SVG绘图任务中的表现,测试内容包括鹈鹕骑自行车、游戏手柄等对大模型来说难度较高的题目。


以下是Kiwi-do的绘图作品:



K2-Thinking的绘制结果如下:



逻辑理解能力是大模型的核心竞争力。该网友随后采用VPCT基准测试(Visual Physics Comprehension Test,即视觉物理理解测试)对Kiwi-do进行了评估,这项测试要求模型在理解图像内容的基础上结合物理规律进行推理。


测试结果显示,Kiwi-do成功解决了所有问题,这与K2-VL作为多模态模型的属性相契合,进一步支持了其可能是K2-VL早期版本或测试代号的推测。


对于Kimi新模型的潜在影响,有观点认为多模态是未来发展方向,也有人指出Kimi新模型的发布可能改变多模态Agent的市场格局。在智能客服、内容创作、医疗、教育等领域,Kimi的多模态新模型有望为用户提供更丰富的应用场景。



回顾2025年,月之暗面可谓“低开高走”。年初受DeepSeek冲击,在大规模投流引发的争议中,公司选择沉淀发展。2025年7月推出的万亿参数开源模型KimiK2凭借混合专家(MoE)架构,在代码生成和通用任务处理上表现出色。后续版本将上下文长度扩展至256K,并推出支持“边思考、边工具协作”的Thinking模型,持续推动AI技术边界。


在2025年年终评估中,Lmarena.ai发布的12月开源大模型榜单显示,Kimi-K2-thinking超越DeepSeek v3.2,位列第二。



除技术创新获得认可外,月之暗面的财务状况也为后续发展提供了坚实保障。杨植麟在内部信中透露,公司目前现金储备超100亿元人民币,充足的资金为技术研发和人才储备提供了支持,增强了公司在行业竞争中的韧性。


当前大模型领域竞争激烈,智谱、MiniMax等国内AI厂商积极储备资金筹备IPO,而杨植麟的“不着急”态度,预示着Kimi将走出一条独特的AGI发展路径。


本文来自微信公众号“节点AI观”,作者:道哥,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com