马化腾紧跟梁文锋
腾讯元宝下定决心要紧紧抱住DeepSeek大腿,不要松手。
三月二十六日,元宝迎来了重大更新,第一时间再次赶到DeepSeek V3-3024的V3“小版本更新”版本,同时,元宝还同步访问了自研混元T1的官方版本。
之所以紧跟DeepSeek,是因为元宝真正体会到了这种策略带来的好处。马化腾和梁文锋在今年年初的民营企业座谈会上做了一个“同桌”,并排坐着。2月13日,腾讯元宝宣布接入DeepSeek,直到4天前。
没人想到,腾讯的举动让元宝像坐火箭一样飙升了3000英里,一度登上苹果应用商店中国区免费榜首。在不久前的财务报告会上,腾讯总裁刘炽平透露,元宝的日常活动数量飙升了20多倍。

从那以后,“自研” 开源的结合已经成为腾讯最新的AI策略,即通过与自身丰富的产品生态结合,通过不同模型的协同互补,实现用户体验的提升。
另一方面,从V3更新和混元T1官方版的推出中,我们可以看到另一种“结合”趋势,即推理模型与通用模型的相互接近。
未来究竟是属于一般模型,还是推理模型,还是其它黑马?或许这根本就是一个谬论。
如果你有轮子,就不需要两条腿走路。
在掀起全球“推理热”之后,DeepSeek会不会再次掀起“结合”热?
01 勤奋的元宝
必须说,元宝跟得太紧了。
3月24日晚,DeepSeek突然更新了V3的“小版本更新”,即V3-0324。
3月26日,元宝已接入V3-0324,同时接入腾讯自主研发的混合元T1。一个非推理模型,一个推理模型;一个外部模型,一个自主研发模型。元宝理解了组合。
V3这次更新说是“小版本更新”,突然在开源平台上悄悄的Hugginging。 Face上线的时候,其实是一个大的,升级幅度也不小。朋友说“随便吃点”。你以为是速冻饺子,其实是毛血旺。

据DeepSeek官方技术报告显示,V3-0324在数学、百科知识、代码任务等方面的表现均优于上一代,尤其是GPT-4.5和Anthropic的Claude,在数学和代码评价中得分超过OpenAI。-Sonnet-3.7。
最为有趣的是,V3-0324虽然不是推理模型,但有R1的味道。官方技术报告中指出的“推理能力”、“前端开发能力”、“中文合作能力”、“中文搜索”四大亮点都落入了R1的优势范围。

在实际测试中,V3-0324也更倾向于导出比旧版本更多的文本。比如测试一个简单的指令“写一篇自己的散文”,V3给出的有科技浪漫感的文字可以算是“非常R1”。

在报告中,DeepSeek还透露,V3-0324与之前V3使用的base模型相互交流,改进了后期训练方法,并参考了R1推理模型训练过程中的强化学习技巧。
过去,在使用推理模型和非推理模型时,客户明显的选择之一是非推理模型响应快,但精度和准确性较弱,而推理模型往往“思考”得更深,给出详细的思维链,回归的结果更准确、更详细,但响应速度较慢。
但是DeepSeek似乎正走向“中间”。
新推出的腾讯混元T1模型也有这样的特点。DeepSeek的V3-0324和自研混元T1于26日同步接入元宝。
T1是一种推理模式,但响应速度更快。
因为在结构上,混元T1放弃了全Transformer,而是沿用混元Turbor。 选择Hybrid模型架构-Mamba-Transformer。

Transformer架构擅长捕捉复杂的前后文本,而Mamba的特长则是高效处理长序列。两者结合,模型在速度和速度之间找到平衡。
通过经典的“鸡兔同笼”问题,我们分别向DeepSeek 在关闭“网络搜索”的情况下,R1和混元T1提出了最终答案,R1思考需要28秒,T1只需要14秒。
在MMLU-pro、CEval、AIME、Zebra 在Logic等中英文知识,竞赛级数学,以及逻辑判断公开基准测试中,混元T1的分数与DeepSeek相当。 OpenAI的R1和o1(都是推理模型)。
值得注意的是,混元T1每百万tokens 导出价4元,这是DeepSeek R1标准时段导出价格的四分之一,与其优惠时段价格持平。
从这个角度来看,腾讯不仅仅是在元宝接入模型的速度上跟得紧,更是在模型路线和价格上。
02 跟随战略胜利
来得早不如来得巧妙,短短一个月,元宝支棱起来。
三月十九日,腾讯总裁刘炽平在2024年年报电话会议上提到元宝的表现,二月至三月日活猛增20倍以上,成为中国AI原生移动应用的第三高。
去年5月30日,腾讯元宝发布,最初定位为集成腾讯混元大模型的智能助手,但反响平平。1月份DeepSeek的R1模型全球大火,下个月腾讯宣布将DeepSeek-R1满血版接入元宝,因此元宝也迎来了转折点。
此后,元宝高韧性“日更”,35天内版本更新30次。顾客也不断涌入,元宝一度登上苹果中国区应用商店免费名单,超越DeepSeek。
不只是元宝,腾讯在AI领域的发力突然按下了加速键。其核心应用如微信、QQ浏览器、QQ音乐、ima、与DeepSeek模型相连的腾讯文档等,同时支持自研混元模型。
“自研 “开源”的多模型战略将继续。腾讯表示,腾讯元宝将继续坚持“双模”。投资继续增加,近半个月投资近3亿元。在最近的财务报告会上,刘炽平透露:“我们计划在2025年进一步增加资本支出,预计资本支出将占收入的十几个百分点。”
另一次“跟随战略”的胜利(至少是阶段性的胜利)。
腾讯擅长密切关注市场趋势,快速跟进创新相结合,实现后发优势。从腾讯“发家”的QICQ到现在的元宝。
曾被“抄袭”、“模仿”质疑的腾讯。早在2010年,马化腾就被称为“模仿也是一种创新”。2018年面对记者提问时,他的回答更加完整:“有时候创新是为了创新,但会让创新动作变形。很多创新通常都是自下而上的,总是出现在不经意的边缘。假如企业完全从上到下,为创新设定一个好的方向,这通常是没有活力和僵化的。“从与DeepSeek合作、与自主研发模型并行、与内部应用相结合的角度来看,创新可以从下到上,也可以从外到内。
在AI的牌桌上,巨头们不仅要考虑如何打造更好的模型,还要考虑如何充分发挥自己积累的产品优势,如何将AI的投入与自己的策略相结合。

腾讯在接入DeepSeek之前,已经在2024年广泛部署了AI,并且从中“尝到了甜头”。在腾讯内部,已有700多个需求场景接入混元大模型和开源大模型。全年资本支出767亿元,同比增长221%,同比增长11%。其中,腾讯会议收入增长40%,AI功能月增长1500万。而且公司微信收入同比翻倍。
与其说腾讯突然“激进”了,不如说轮子掉进了合适的车辙,加速势在必行。
03 结合的风
在产品层面上,马化腾跟随梁文锋,整个大型产业也跟随梁文锋。
毫无疑问,DeepSeek 从今年年初开始,R1在全球范围内掀起了“推理模式热”。通过DeepSeek对工具的不断开源,AI模型求“大”不再是认可的唯一可行之路,更让大家有目的地追求“效率”的魅力。
OpenAI o3 mini、Gemini,谷歌 Flash Thinking;Kimimi在中国月亮的暗面 科大讯飞1.5 阿里QwenX1 2.5-Math-PRM……
DeepSeek这次更新了通用模型,呈现出“结合”的趋势。V3-3024融合了R1的强化学习推理优化方法,同时保留了一般模型的高效实施特点,是突破一般模型“普通困境”的尝试。

腾讯的混合元T1官方版也差不多。结合结构,作为推理模型的反应速度明显提高,同时可以更好的处理前后文本。DeepSeek试图让通用模型朝着推理模型的方向走,而腾讯则让推理模型朝着通用模型的方向走,两边都靠近中间。
模型制造商兼顾了几种路径,导致产品线冗杂的问题已经出现。
OpenAI之前 山姆·奥特曼CEO(Sam Altman)当谈到GPT-5的计划时,曾透露模型和产品功能过于复杂,OpenAI将在未来统一,o3模型将不再独立发布,GPT-4.5也将是OpenAI的最终非链式思维模式。
Anthropic率先OpenAI一步,试图给出解决办法。“世界上第一个混合模型”于2月底发布Claude 3.7 Sonnet。即在单一架构上整合即时应答。(Fast Thinking)和深度思考(Slow Thinking)。不要让顾客在不同的模型之间切换,而是模型自己判断当前的问题是否需要深入思考。
也许接下来的问题是整合的方式选择:是通过AI自动配制来实现“整合”(实际上是在后台隐藏不同的模型),还是在模型上进行整合(就像V3-3024和腾讯混元T1的官方版本一样)。
所谓“两条腿走路”,是一种通用的模型或推理模型,并行开发和分离。所以今天的结合趋势是把两条腿变成轮子,左脚还是右腿,不用担心。
本文来自微信微信官方账号 “z62426281”(ID:faceurhart),作者:小金牙,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




