DeepSeek让腾讯阿里再次上桌。

2025-02-22

巨人的行动无疑是行业的真正方向标。在腾讯调整组织结构专攻AI产品后，阿里还宣布，未来三年在云和AI的基础设施投资预计将超过过去十年的总和。AI的发令枪已经响了。

"领导是认真的"

春节复工后，她在深圳一个传统行业担任行政职务的困难被告知她还有一项工作:“用DeepSeek完成一些工作，提高工作效率，部门领导要求每周整理并报告AI工具的使用结果。”

这让她大吃一惊。“我们是传统行业。虽然我们以前使用过一些AI技术，但我们只有R&D同事，不涉及我们的行政部门。”棘棘发牢骚:「每天的行政只是收发快递，贴发票，跑腿，有必要用AI吗？」

但是后来，她意识到这次公司领导特别认真。根据她的说法，几天之内，公司迅速建立了一个“AI战略部门”，并邀请外部讲师培训所有人员使用DeepSeek，并要求所有部门每周提交结果。实施AI的范围也是前所未有的——有领导在培训会上说，从下个月开始，企业计划逐步优化部分可以用AI替代的岗位人员。

秋然在北京一家互联网公司总部工作，也感受到了DeepSeek卷起的热潮。

她回忆说，节后复工一周左右，公司给全体员工发了一条通知，忽略了:“请集思广益，深入思考DeepSeek可能给业务带来什么促进，或者可以在什么场景下落地，并提交思考结果。”

技术支持部门行动迅速，一些工具是通过DeepSeek的开源思路建立起来的。秋然说:“作为一家互联网公司，我们有自己的AI优势储备，业务形式已经非常成熟，所以老板之前一直都很谨慎，不愿意为了AI而刻意向外求AI。”

但是DeepSeek打破了之前所有的犹豫，秋然透露：“听部门领导说，老板觉得如果此时不做动作，可能会在这波浪潮中被甩下。”

老板们的危机感不难理解，DeepSeek的效果令人惊叹，这直接推动了各家各户的决策。棘棘告诉凤凰网科技，员工们私下悄悄交流，发现领导层都被DeepSeek的效果“震撼”了，“ChatGPT之前、Claude发布的时候，公司也有小规模的业务同事尝试过，但是都是各有各的‘智障’，过两天就不提了。”

DeepSeek打破了AI是“人工智能障碍”的刻板印象。据她从新成立的AI部门的同事处了解，该公司甚至考虑增加AI技术的投资。

假设小企业的分析还存在失误的可能性，那么巨人的行动，无疑是这一行业的真正方向标。

二月二十日晚，阿里发布财务报告，阿里集团CEO吴泳铭在财务报告电话会议上表示，“ AI时代对基础设施有着清晰而巨大的需求，将积极投资AI基础设施。预计未来三年云和AI基础设施投资将超过过去十年的总和。"

一位与阿里有过接触的应聘者对凤凰网科技说：“阿里也在AItoC业务层面大举招贤纳士”，“看得出来，很积极”。

就在几天前，腾讯还宣布了组织结构的调整，主要针对AI产品线。在腾讯元宝从TEG(技术工程业务集团)转向CSIG(腾讯云与工业业务集团)后，更多的产品和应用，如QQ浏览器、搜狗输入法和ima，也将汇聚到CSIG。

在接入DeepSeek-R1之后，腾讯也是第一个接入DeepSeek的巨头，微信迅速掀起了市场波澜。

AI的发令枪，已经响了。

狂欢与隐患并存

尽管有很多新的涌入者，但是身处其中的一些人并不感到惊讶，在苏州一家智能制造企业担任CTO的冯牧就是其中之一。

他告诉凤凰。com科技:“成本、技术、环境和各种因素共同创造了行业的狂欢。对于很多像我们这样的企业来说，他们没有很强的R&D大模型能力，在科技革命的过程中非常被动。然而，DeepSeek开源了这样一个强大的模型。(为我们)提供了一剂良药，一种从0到1不平整技术壁垒的方法论。”

正如他所说，上游技术创新带来的好处自然流向下游阶段。但另一方面，压力也给了与DeepSeek同处于底座大模型研发环节的同行。

同样具有优秀研究能力的企业，开始反思自己到底错过了什么。

DeepSeek V3和R1的最大功能亮点是特别优秀的思维链。（Long-CoT）能力。

月亮暗面研究员Flood Sung透露，早在一年多前，月亮的暗面创始人周昕宇就已经验证了长思维链的有效性，但公司首先意识到了长文本。（Long-Text）考虑到成本问题，Kimi选择了优先考虑攻关长文本功能的重要性。

这条路线在DeepSeek爆红之前完全没有问题。

2024年，月之暗面一度借用长文成为中国最热门的大型企业，但长文本的商业化场景一直不够清晰，目前仍在探索中。

冯牧对凤凰网科技的解释：“你可以把长思维链理解为解决复杂问题的能力。当一个大模型有推理思维时，它在编程、数学计算等领域的应用能力就会提高。这就是为什么DeepSeek应该标记OpenAI的o1模型，而后者也是一个标榜思维能力的大模型。”

冯牧强调o1和DeepSeek V3发布时间差:“o1正式版于2024年12月初发布，V3于12月底发布，两者的性能都可以断腕。我们过去常说，国内大模型和国外发展相差几年。至少在这种模式下，DeepSeek帮助我们平衡了一些差距。”

亮丽的效果，也使得DeepSeek迅速下沉，撬动了过去任何一家大型公司都无法撬动的用户盘。

根据QuestMobile的统计，1月28日DeepSeek的日活跃用户数量首次超过豆包，并于2月1日突破3000万大关，成为历史上最快实现这一里程碑的应用。而且随着各大手机厂商、微信等公司正式宣布接入DeepSeek，流量疯狂涌向后者的趋势仍在不断增加。

在这种背景下，从网络时代传承下来的大力投放方式是否有效？凤凰网科技询问百度、腾讯、昆仑万维等公司，下一步是否考虑大型产品调整投放策略，截至发布时尚无回复。

但是从数据中，或许可以看出市场的答案。

AppGrowing数据显示，最近豆包App、Kimi等广告营销量大幅下降，最低水平几乎降至近180天。

那些没有意识到的变化

几天前，DeepSeek悄悄地取下了张贴在办公楼下的LOGO。在DeepSeek飓风席卷半个月后，北京融科信息中心作为DeepSeek与英特尔、中金、德州仪器等公司交流的办公室，竟然成为一处景点。

DeepSeek就像一条鲶鱼，搅拌市场。即使是在DeepSeek楼上工作的百度风险投资也无法避免，被质疑离这么近却错过了投资机会。百度风险投资首席执行官高雪不得不亲自回应，声明对方没有意外融资。

尽管DeepSeek故意保持低调，但是从今天开始，许多人的工作仍然与DeepSeek密切相关。

DeepSeek的独特标签除了思维链模型之外，还有开源模式和低计算能力需求。这三点几乎摆脱了国内市场主流玩家下注的所有玩法，甚至重新定义了游戏规则。

百度原本坚持闭源路线，决定允许所有PC端和APP端用户从4月1日0:00开始免费使用模型服务，并计划从下一代模型开始正式开源。

作为长思维链的代名词，“深度思维”功能逐渐成为众多大模型的核心标签。从1月份开始，百度、阿里、字节、科大讯飞、百川智能、月亮暗面等AI公司为其模型提升了深度思维能力。

怎样看待DeepSeek另辟蹊径给出的答案？

“没有人敢定义它是对的，只能说它真的是一个不可忽视的创新。”北京市朝阳区AI大型培训服务企业AI领域连续创业者和创始人告诉凤凰科技。com。

“我想了很久，最终的答案是这是囚徒的困境——如果关闭源头，作为一家创业公司，谁会用你的东西？”为什么要和大厂竞争？所以创业公司只能开源，但是开发者必须只有效果论，那么在DeepSeek之前，世界上最好的开源模式是海外Llama，你应该如何追上Meta？他说:“所以我最初的预测是，国内大厂迅速进行军备竞赛，做出一些效果不错的模型，然后开源一部分，千行百业集中在大厂的底座上。”

企业家承认，他没有想到DeepSeek会在这场相关背景实力的比赛中脱颖而出。现在在西二旗的一家大工厂工作，曾经有硅谷工作背景的算法工程师也表达了类似的情绪。

这种“DeepSeek效应”席卷了市场，也蔓延到了产业链的上游。

根据DeepSeek发表的相关论文，只有280万GPU被用来训练V3。根据OpenAI创始成员之一Andrej 相比之下，Karpathy解读的模型训练成本是DeepSeek的十倍以上。（Llama 3 405B使用了3080万GPU小时)。

正是如此，DeepSeek-V3和R1模型被称为“有限算率下的精彩工程”，也引发了市场对GPU淘金热持续时间的反思。

DeepSeek发布后，全球领先的GPU英伟达股价一度暴跌，其中单日跌幅最大达17%。但截至成文，英伟达股价已基本回升至本轮下跌前的水平。

即便如此，当DeepSeek指出一条更经济的道路时，玩家是否应该继续沉迷于这场相关的算率资源“无限战争”？接下来，有些人可能会给出更保守的答案。

(冯牧是文章中的化名)

本文来自微信微信官方账号“凤凰网科技”，作者：徐珍，编辑：董雨晴，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com