马化腾紧跟梁文锋

2025-04-02

腾讯元宝下定决心要紧紧抱住DeepSeek大腿，不要松手。

三月二十六日，元宝迎来了重大更新，第一时间再次赶到DeepSeek V3-3024的V3“小版本更新”版本，同时，元宝还同步访问了自研混元T1的官方版本。

之所以紧跟DeepSeek，是因为元宝真正体会到了这种策略带来的好处。马化腾和梁文锋在今年年初的民营企业座谈会上做了一个“同桌”，并排坐着。2月13日，腾讯元宝宣布接入DeepSeek，直到4天前。

没人想到，腾讯的举动让元宝像坐火箭一样飙升了3000英里，一度登上苹果应用商店中国区免费榜首。在不久前的财务报告会上，腾讯总裁刘炽平透露，元宝的日常活动数量飙升了20多倍。

从那以后，“自研” 开源的结合已经成为腾讯最新的AI策略，即通过与自身丰富的产品生态结合，通过不同模型的协同互补，实现用户体验的提升。

另一方面，从V3更新和混元T1官方版的推出中，我们可以看到另一种“结合”趋势，即推理模型与通用模型的相互接近。

未来究竟是属于一般模型，还是推理模型，还是其它黑马？或许这根本就是一个谬论。

如果你有轮子，就不需要两条腿走路。

在掀起全球“推理热”之后，DeepSeek会不会再次掀起“结合”热？

01 勤奋的元宝

必须说，元宝跟得太紧了。

3月24日晚，DeepSeek突然更新了V3的“小版本更新”，即V3-0324。

3月26日，元宝已接入V3-0324，同时接入腾讯自主研发的混合元T1。一个非推理模型，一个推理模型；一个外部模型，一个自主研发模型。元宝理解了组合。

V3这次更新说是“小版本更新”，突然在开源平台上悄悄的Hugginging。 Face上线的时候，其实是一个大的，升级幅度也不小。朋友说“随便吃点”。你以为是速冻饺子，其实是毛血旺。

据DeepSeek官方技术报告显示，V3-0324在数学、百科知识、代码任务等方面的表现均优于上一代，尤其是GPT-4.5和Anthropic的Claude，在数学和代码评价中得分超过OpenAI。-Sonnet-3.7。

最为有趣的是，V3-0324虽然不是推理模型，但有R1的味道。官方技术报告中指出的“推理能力”、“前端开发能力”、“中文合作能力”、“中文搜索”四大亮点都落入了R1的优势范围。

在实际测试中，V3-0324也更倾向于导出比旧版本更多的文本。比如测试一个简单的指令“写一篇自己的散文”，V3给出的有科技浪漫感的文字可以算是“非常R1”。

在报告中，DeepSeek还透露，V3-0324与之前V3使用的base模型相互交流，改进了后期训练方法，并参考了R1推理模型训练过程中的强化学习技巧。

过去，在使用推理模型和非推理模型时，客户明显的选择之一是非推理模型响应快，但精度和准确性较弱，而推理模型往往“思考”得更深，给出详细的思维链，回归的结果更准确、更详细，但响应速度较慢。

但是DeepSeek似乎正走向“中间”。

新推出的腾讯混元T1模型也有这样的特点。DeepSeek的V3-0324和自研混元T1于26日同步接入元宝。

T1是一种推理模式，但响应速度更快。

因为在结构上，混元T1放弃了全Transformer，而是沿用混元Turbor。选择Hybrid模型架构-Mamba-Transformer。

Transformer架构擅长捕捉复杂的前后文本，而Mamba的特长则是高效处理长序列。两者结合，模型在速度和速度之间找到平衡。

通过经典的“鸡兔同笼”问题，我们分别向DeepSeek 在关闭“网络搜索”的情况下，R1和混元T1提出了最终答案，R1思考需要28秒，T1只需要14秒。

在MMLU-pro、CEval、AIME、Zebra 在Logic等中英文知识，竞赛级数学，以及逻辑判断公开基准测试中，混元T1的分数与DeepSeek相当。 OpenAI的R1和o1(都是推理模型)。

值得注意的是，混元T1每百万tokens 导出价4元，这是DeepSeek R1标准时段导出价格的四分之一，与其优惠时段价格持平。

从这个角度来看，腾讯不仅仅是在元宝接入模型的速度上跟得紧，更是在模型路线和价格上。

02 跟随战略胜利

来得早不如来得巧妙，短短一个月，元宝支棱起来。

三月十九日，腾讯总裁刘炽平在2024年年报电话会议上提到元宝的表现，二月至三月日活猛增20倍以上，成为中国AI原生移动应用的第三高。

去年5月30日，腾讯元宝发布，最初定位为集成腾讯混元大模型的智能助手，但反响平平。1月份DeepSeek的R1模型全球大火，下个月腾讯宣布将DeepSeek-R1满血版接入元宝，因此元宝也迎来了转折点。

此后，元宝高韧性“日更”，35天内版本更新30次。顾客也不断涌入，元宝一度登上苹果中国区应用商店免费名单，超越DeepSeek。

不只是元宝，腾讯在AI领域的发力突然按下了加速键。其核心应用如微信、QQ浏览器、QQ音乐、ima、与DeepSeek模型相连的腾讯文档等，同时支持自研混元模型。

“自研 “开源”的多模型战略将继续。腾讯表示，腾讯元宝将继续坚持“双模”。投资继续增加，近半个月投资近3亿元。在最近的财务报告会上，刘炽平透露:“我们计划在2025年进一步增加资本支出，预计资本支出将占收入的十几个百分点。”

另一次“跟随战略”的胜利(至少是阶段性的胜利)。

腾讯擅长密切关注市场趋势，快速跟进创新相结合，实现后发优势。从腾讯“发家”的QICQ到现在的元宝。

曾被“抄袭”、“模仿”质疑的腾讯。早在2010年，马化腾就被称为“模仿也是一种创新”。2018年面对记者提问时，他的回答更加完整:“有时候创新是为了创新，但会让创新动作变形。很多创新通常都是自下而上的，总是出现在不经意的边缘。假如企业完全从上到下，为创新设定一个好的方向，这通常是没有活力和僵化的。“从与DeepSeek合作、与自主研发模型并行、与内部应用相结合的角度来看，创新可以从下到上，也可以从外到内。

在AI的牌桌上，巨头们不仅要考虑如何打造更好的模型，还要考虑如何充分发挥自己积累的产品优势，如何将AI的投入与自己的策略相结合。

腾讯在接入DeepSeek之前，已经在2024年广泛部署了AI，并且从中“尝到了甜头”。在腾讯内部，已有700多个需求场景接入混元大模型和开源大模型。全年资本支出767亿元，同比增长221%，同比增长11%。其中，腾讯会议收入增长40%，AI功能月增长1500万。而且公司微信收入同比翻倍。

与其说腾讯突然“激进”了，不如说轮子掉进了合适的车辙，加速势在必行。

03 结合的风

在产品层面上，马化腾跟随梁文锋，整个大型产业也跟随梁文锋。

毫无疑问，DeepSeek 从今年年初开始，R1在全球范围内掀起了“推理模式热”。通过DeepSeek对工具的不断开源，AI模型求“大”不再是认可的唯一可行之路，更让大家有目的地追求“效率”的魅力。

OpenAI o3 mini、Gemini，谷歌 Flash Thinking；Kimimi在中国月亮的暗面科大讯飞1.5 阿里QwenX1 2.5-Math-PRM……

DeepSeek这次更新了通用模型，呈现出“结合”的趋势。V3-3024融合了R1的强化学习推理优化方法，同时保留了一般模型的高效实施特点，是突破一般模型“普通困境”的尝试。

腾讯的混合元T1官方版也差不多。结合结构，作为推理模型的反应速度明显提高，同时可以更好的处理前后文本。DeepSeek试图让通用模型朝着推理模型的方向走，而腾讯则让推理模型朝着通用模型的方向走，两边都靠近中间。

模型制造商兼顾了几种路径，导致产品线冗杂的问题已经出现。

OpenAI之前山姆·奥特曼CEO（Sam Altman）当谈到GPT-5的计划时，曾透露模型和产品功能过于复杂，OpenAI将在未来统一，o3模型将不再独立发布，GPT-4.5也将是OpenAI的最终非链式思维模式。

Anthropic率先OpenAI一步，试图给出解决办法。“世界上第一个混合模型”于2月底发布Claude 3.7 Sonnet。即在单一架构上整合即时应答。（Fast Thinking）和深度思考（Slow Thinking）。不要让顾客在不同的模型之间切换，而是模型自己判断当前的问题是否需要深入思考。

也许接下来的问题是整合的方式选择:是通过AI自动配制来实现“整合”(实际上是在后台隐藏不同的模型)，还是在模型上进行整合(就像V3-3024和腾讯混元T1的官方版本一样)。

所谓“两条腿走路”，是一种通用的模型或推理模型，并行开发和分离。所以今天的结合趋势是把两条腿变成轮子，左脚还是右腿，不用担心。

本文来自微信微信官方账号 “z62426281”（ID：faceurhart），作者：小金牙，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

国产手机走过弯路，折叠屏只是其中之一。

量化卷大模型，还有意义吗？

创意茶咖反复热搜，是味蕾革命，还是噱头曝光？？

折叠iPhone「液态金属」决定，苹果将打造最完美的折叠屏幕？

英伟达将购买贾扬清公司的LeptonAI，老黄花数亿美元加码算率租赁。

项目推荐

康小虎 · 健康小屋

毛加健康

康老板 · 氧疗堂