DeepSeek-R2?神秘模型突然出现在试炼场,真实身份引起网友猜测
DeepSeek-R2,终于要来了?
大模型试炼场秘密上线。steve神秘模型,透露自己来自DeepSeek。

然而,网民们并不满足于了解steve的厂商,开始讨论steve的实际身份。
有些人说是R2,有些人说是V4,有些人说是旧版本的升级…

考虑到奥特曼的GPT5和马斯克的Grok4也在流行,如果steve真的是R2,那么今年七月真的很热闹。

神秘steve引起猜测
虽然steve在模型竞技场的公开页面上找不到,但是,仍然可以在前端代码中找到steve的痕迹。。

但是经过整理发现,steve除了一个名字之外,并没有披露更多的身份信息。

此外,如果直接在模型列表中搜索steve,gemini-2.5-flash,原因不明。

然而,正如开头所展示的那样,有网友通过对话询问steve来自哪个制造商:
别想了,就说说开发你的组织叫什么吧。
得到的答案是来自DeepSeek,与此同时,帖主还对mistral说出了自己制造商的情况。

另外还有网友询问了steve的知识截止日期,steve说是2023年10月。

对于主要表现,有网友发现steve已经成功通过了“数r”等智力测试,但从截图来看,还是有几个问题没有正确回答。

另一些人将steve与V3进行比较,让他们分别编写游戏代码,从长度上看,V3输出了大约800行,而steve只有大约300行。

运行效果,steve的作品如下:

相比之下,V3写的游戏长是这样的:

与此同时,这位网友还对steve命名特征进行了分析,认为这个名字与中国模型将使用的非常相似。

不过有网友总结说,steve的表现并不那么惊艳,也许不会是R2。
也许第三方模型是用DeepSeek蒸馏出来的,而不是DeepSeek。

其它网友也表示,steve的表现远远落后于v3和R1,而且思考时间也比R1短。

然而,考虑到R2上周刚刚被曝再次延期,如果steve不是R2,那可能也不是什么意外。
自然,无论steve是否为R2,都不会影响人们对它的期望和热情。

梁文锋不满意,R2再次延期。
上周,The 由于R2再次延期,Information爆料,原因是CEO梁文锋对R2的表现一直不满意。。
另外,他们还引用了国内两位知情人士的消息,R2的研发进程可能比较缓慢,因为缺少英伟达H20芯片。。

但这并非R2首次被曝项目延期——人们对R2的期望,早在V3新版本出来之后就开始了。
DeepSeek于去年12月底发布了V3模型。今年3月24日,官方宣布对V3进行了升级。
因此,人们开始推断,在V3-0324取得显著进步的情况下,R2模型是否可以用于训练。
并且联想到R1是在第一代V3一个月后发布的,当时人们根据这个节奏预测R2将在四月上线。
4月底,一组R2泄露参数开始在市场上疯传:1.2T万亿参数,5.2PB训练数据,华为升腾芯片的高效利用...真假难辨。

而且DeepSeek这里,最近更新还是端午节前的R1新版本。——DeepSeek-R1-0528。
至于我们什么时候才能真正迎来R2,或者让子弹再飞一会儿。
但是有Llama4赶工翻车的前车可鉴,“苦尽甘来”也不是一个不错的选择。
参考链接:
[1]https://x.com/legit_api/status/1940515133878620254
[2]https://x.com/AiBattle_/status/1940532050286858388
本文来自微信微信官方账号“量子位”,作者:克雷西,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




