DeepSeek-R2?神秘模型突然出现在试炼场,真实身份引起网友猜测

07-04 10:57
自称来自DeepSeek的模型

DeepSeek-R2,终于要来了?


大模型试炼场秘密上线。steve神秘模型,透露自己来自DeepSeek



然而,网民们并不满足于了解steve的厂商,开始讨论steve的实际身份。


有些人说是R2,有些人说是V4,有些人说是旧版本的升级…



考虑到奥特曼的GPT5和马斯克的Grok4也在流行,如果steve真的是R2,那么今年七月真的很热闹。



神秘steve引起猜测


虽然steve在模型竞技场的公开页面上找不到,但是,仍然可以在前端代码中找到steve的痕迹。



但是经过整理发现,steve除了一个名字之外,并没有披露更多的身份信息。



此外,如果直接在模型列表中搜索steve,gemini-2.5-flash,原因不明。



然而,正如开头所展示的那样,有网友通过对话询问steve来自哪个制造商:


别想了,就说说开发你的组织叫什么吧。



得到的答案是来自DeepSeek,与此同时,帖主还对mistral说出了自己制造商的情况。



另外还有网友询问了steve的知识截止日期,steve说是2023年10月。



对于主要表现,有网友发现steve已经成功通过了“数r”等智力测试,但从截图来看,还是有几个问题没有正确回答。



另一些人将steve与V3进行比较,让他们分别编写游戏代码,从长度上看,V3输出了大约800行,而steve只有大约300行。



运行效果,steve的作品如下:



相比之下,V3写的游戏长是这样的:



与此同时,这位网友还对steve命名特征进行了分析,认为这个名字与中国模型将使用的非常相似。



不过有网友总结说,steve的表现并不那么惊艳,也许不会是R2。


也许第三方模型是用DeepSeek蒸馏出来的,而不是DeepSeek。



其它网友也表示,steve的表现远远落后于v3和R1,而且思考时间也比R1短。



然而,考虑到R2上周刚刚被曝再次延期,如果steve不是R2,那可能也不是什么意外。


自然,无论steve是否为R2,都不会影响人们对它的期望和热情。



梁文锋不满意,R2再次延期。


上周,The 由于R2再次延期,Information爆料,原因是CEO梁文锋对R2的表现一直不满意。


另外,他们还引用了国内两位知情人士的消息,R2的研发进程可能比较缓慢,因为缺少英伟达H20芯片。



但这并非R2首次被曝项目延期——人们对R2的期望,早在V3新版本出来之后就开始了。


DeepSeek于去年12月底发布了V3模型。今年3月24日,官方宣布对V3进行了升级。


因此,人们开始推断,在V3-0324取得显著进步的情况下,R2模型是否可以用于训练。


并且联想到R1是在第一代V3一个月后发布的,当时人们根据这个节奏预测R2将在四月上线。


4月底,一组R2泄露参数开始在市场上疯传:1.2T万亿参数,5.2PB训练数据,华为升腾芯片的高效利用...真假难辨。



而且DeepSeek这里,最近更新还是端午节前的R1新版本。——DeepSeek-R1-0528。


至于我们什么时候才能真正迎来R2,或者让子弹再飞一会儿。


但是有Llama4赶工翻车的前车可鉴,“苦尽甘来”也不是一个不错的选择。


参考链接:


[1]https://x.com/legit_api/status/1940515133878620254


[2]https://x.com/AiBattle_/status/1940532050286858388


本文来自微信微信官方账号“量子位”,作者:克雷西,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com