为什么BAT没有做DeepSeek?
一夜之间,DeepSeek抢走了绝大多数国产大模型的风头。
在过去的一年里,与DeepSeek给全球科技界带来的振动相比,无论是C端出圈的Kimi,还是后面的豆包,无论是客户日常生活很早就突破2亿的文心,还是通义千问,都逊色于DeepSeek给全球科技界带来的振动。
并非一群国产的大型模型都不够强大,而是DeepSeek实在是太好了。
在此之前,国内大厂一直在讨论离OpenAI到底有多少年的差距,但是在DeepSeeK这里,却是另一番景象。在市场上,关于DeepSeeK是否已经干翻了OpenAI,它所代表的开源路线已经在逼迫OpenAI。 “我个人认为,在这个问题上,我们站在历史的错误一边,”CEO山姆·奥尔特曼反思道。如今,我们需要想出不同的开源策略。”
DeepSeek诞生了,它不仅在行业内产生了影响,在C端市场也产生了影响。
数据显示,DeepSeek的日常活动仅上线20天就突破了2000万大关,成为世界上最快的AI应用。相比之下,ChatGPT突破1500万大关需要244天,而DeepSeek只需要18天。DeepSeek上线20天后的日活已经达到2215万,是ChatGPT日活用户的41.6%,远远超过豆包日活用户的1695万。
这个AI飓风非常浮夸,而且与以往完全不同的是,它是一个真正由中国创业公司主导的AI飓风。
问题是,为什么是DeepSeek?
要知道,在过去的几年里,国内主流的互联网公司都在大型跑道上投入了大量的士兵,他们都跑出了很多商品,市场普遍充满期待。我希望其中一些人能在早上赶上OpenAI,与硅谷AI竞争。
但是最终破局的,却是DeepSeek,大厂没有做到,反而完成了。
深耕许久
本质上,DeepSeek目前的爆红,是一种厚积下的爆发。
虽然DeepSeek这次一鸣惊人,但其团队已经在AI领域布局多年,时间线甚至比大厂还早,布局总体宽度和深度也不比大厂差多少。
公开数据显示,DeepSeek,由著名的私募股权巨头幻方量化而生,梁文锋是创始人。
事实上,早在大学里,即使在那个时候,人工智能仍然是一个没有实质性理论的概念,但梁文锋坚信“人工智能一定会改变命运”。
自创业以来,这也成了它的终极愿景。
2015年,梁文锋创立了一个幻方,这是中国第一家使用人工智能进行量化交易的企业。2016年,深度学习产生的第一笔交易头寸在线实施,2017年。 全面应用深度学习技术进行年度交易。
2018年,幻方官网将“将AI确定为公司主要发展方向”写入企业大事。再过一年,幻方干脆改变了组织结构,建立了幻方AI。在向外界介绍自己时,他总是说自己是一家以大规模深度学习基础研究和应用为核心的人工智能公司。
从2019年到2021年,幻方自主研发了“萤火虫一号”和“萤火虫二号”AI集群,其中“萤火虫二号”投资达到10亿元,大大提高了算率支持。与此同时,幻方还积极招募了一批算法科学家。创始人梁文锋本人每天都在打代码,运行代码。

技术上,一直在稳步储备,基础设施,更是没有落后。
也许很少有人能预料到,2023年ChatGPT问世时,市场突然发现,梁文锋旗下的幻方量化,并非人工智能公司拥有最多的高性能GPU芯片。
当时根据郭盛证券的研究报告,在云计算力端,当时除了几家互联网公司(商汤、百度、腾讯、字节、阿里)外,只有一万多个A100芯片储备。
可以看出,幻方对AI的投入,与大厂相比,一点也不落后。
反套路
此外,以梁文锋为代表的DeepSeek创业团队的精神。
互联网制造商的人工智能战略通常依赖于现有的业务系统。腾讯的人工智能需要为社交和游戏生态服务,阿里的人工智能需要嵌入电子商务和云计算场景。虽然这种业务协同逻辑可以快速商业化,但也框定了技术进化的路径——投入越多,越注重提高现有的方式,而不是另辟蹊径。
背靠幻方的DeepSeek,不仅有强大的资金支持,而且有勇气“从零开始”,不怕尝试和犯错。这使得DeepSeek只需要遵循创新的信念,一路走来。
梁文锋对创新的态度非常坚定——“在过去的很多年里,中国企业已经习惯了别人的技术创新,我们把它们作为应用来实现它们,但这不是理所当然的事情。在这波浪潮中,我们的初衷不是借机赚钱,而是走在技术的前沿,促进整个生态发展。”
“我们看到的是,中国AI不可能永远跟随。我们常说中国AI和美国有一两年的差距,但真正的gap是原创和模仿的差距。如果这一点没有改变,中国永远只能是跟随者,所以有些探索是无法逃避的。”
而且怎样做到创新,就是抛弃惯性的反套路。
最为直观的体现,就是在团队构成上。

照片来自幻方官网
国内大厂进入大型跑道,一般以海外挖人为主,引进技术大牛,迅速拉上一个团队,然后快速工作。然而,DeepSeek团队大多由一些地方顶尖大学的应届毕业生组成。不看经验和资历,选人的标准一直是爱和好奇。
同时,在工作机制方面,“我们通常不是外部分工,而是自然分工。每个人都有自己独特的成长过程,都有自己的想法,不需要推他。在探索的过程中,当他遇到问题时,他会吸引人们讨论。但是,当一个想法显示出潜力时,我们会从上到下准备资源。”
“如果你有想法,每个人都可以随时调用培训集群的卡片,不需要审核。同时,只要对方感兴趣,也可以灵活调用所有人,因为不会有层次和跨部门。”
也就是说,大工厂的组织结构本质上是一台精密运行的“高效机器”。然而,颠覆性创新的出现需要的恰恰是反效率的“失控”。
而且DeepSeek正在这样做。
AI蓝媒汇也就是为什么大厂没有提出DeepSeeK的问题,向DeepSeek提问,后者表示,本质上是组织惯性、商业压力和技术路径共同作用的结果,并表示:
这场由开源模型引发的技术革命迫使大厂商重新思考创新逻辑。如果不能跳出现有的框架,其技术话语权可能会进一步削弱。

本文来自微信微信官方账号“AI蓝媒汇”,作者:叶二、36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




