与DeepSeek有关,硅谷大佬“互掐”,OpenAI再次爆发高额融资。
在硅谷,DeepSeek不断引起讨论。
DeepSeek是中国一家大型创业公司,因此之前发布的开源模型V3和R1引起了全世界的关注。DeepSeek使人们开始质疑AI投资中可能出现的泡沫,并挑战硅谷在人工智能领域的绝对领先地位。
对于这一点,OpenAI最强的竞争者,硅谷创业公司Anthropic的创始人,以及大语言模型的创始人之一Dario 昨天,Amodei发表了一篇长文,系统阐述了对DeepSeek的看法。DeepSeek的练习费用远不如大家所说的那么低,“600万美元模型”的说法忽略了许多关键背景。更加准确地说,DeepSeek将近7-10个月前以更低的成本生成美国模型水平的商品。另外,他还强调,美国要加强芯片出口管制,确保自己走在人工智能发展的前沿。
针对Dario Amodei的观点,顶级硅谷风险投资者,A16Z创始人Marc 今天Andreessen发帖称:“与开源和免费相比,闭源、不透明、吹毛求疵、政治操纵并不是美国需要的胜利地位。”

DeepSeek虽然没有直接点名,但是它以开源和免费的方式在全球AI开源社区得到了广泛的认可,而Anthropic开发的Claude模型和OpenAI的GPT模型一样,都属于闭源模型,训练过程和技术细节都不公开。Marc Andreessen的评论也在嘲讽Darioo。 Amodei,作为AI行业的领军人物,企图利用地缘政治遏制对手,否定开源工作,与实现一般人工智能目标的初衷背道而驰。
DeepSeek让闭源社区“破甲”
记者注意到,这不是Marc。 Andreessen首次对DeepSeek发出声音。一月二十四日,Marc 在社交平台上,Andreessen说:“DeepSeekR1是我见过的最令人惊叹、最令人印象深刻的突破之一,它是开源的,是全世界的礼物。
当天,英伟达股价下跌超过3%,华尔街开始关注AI黑马DeepSeek,发现AI模型可能无需依靠沉积率就能取得优异的性能,从而打破了近两年美股在AI浪潮中形成的“算率为王”的投资逻辑。根据美股大V的复盘分析,Marc 根据DeepSeek的推文,Andreessen可能是DeepSeek爆炸的导火索之一。
不只是Marc Andreessen,另一位AI领域的标志人物,斯坦福大学计算机科学系客座教授,谷歌大脑(Google Brain)创始人吴恩达(Andrew Ng)还发布了支持DeepSeek的文件。在生成式AI领域,吴恩达认为中国正在迅速缩小与美国的差距,或者将重塑AI供应链格局。与此同时,开源权重模型推动了基础模型层的普及,为应用开发开辟了新的机遇。单纯扩大模型规模并不是AI发展的唯一出路。算法创新在计算率军备竞赛的喧嚣中显著降低了训练成本。
实际上,Dario Amodei、吴恩达和Marc 关于Andreessen之间的争论,反映了闭源和开源两条路线的差异。除了在有限的计算率资源下实现的技术突破,DeepSeek之所以在行业内引起强烈反响,是因为大模型不再是巨头计算能力的游戏,而是因为完全开源是另一个核心原因。“开源 Meta首席人工智能科学家杨立昆此前曾公开表示,DeepSeek的成功显示了AI模型开源的重要性,DeepSeek的成功显示了AI模型开源的重要性,“DeepSeek的成功并非中国AI的成功,而是开源模型的成功”。
一些业内人士表示:“当OpenAI在2019年以安全为由转变为闭源时,它们实际上是在建立垄断。DeepSeek证明了开放可能是一个更好的策略,它可以通过降低成本而不是提高价格来吸引最好的人才,建立生态系统来获得优势。Jim英伟达高级研究科学家 在阅读DeepSeek的技术报告后,Fan一周前也表示:“我们正处于这样一个历史时刻:一家非美国公司正在继续OpenAI的最初使命——通过真正开放的前沿研究来赋予人类权力。看起来不合理,但最有趣的结局通常是最有可能实现的。”
在一次采访中,DeepSeek创始人梁文锋曾说:“面对颠覆性的技术,闭源形成的环城河是短暂的。即使OpenAI闭源,也无法阻止被他人赶超。”与此同时,关于DeepSeek开源的做法,梁文锋说:“开源更像是一种文化行为,而非商业行为…我们不会闭源。首先,拥有一个强大的技术生态更为重要。”
一般而言,OpenAI和Anthropic等在模型领域具有先发优势和技术领先水平的企业,往往会选择闭源,保护自己的技术秘密。国内一些大型从业者告诉记者,作为一家纯技术驱动的企业,DeepSeek的代码和培训方法是完全开源的,而大型互联网公司通常不会因为商业化而完全开源。当DeepSeek推出一款低成本、高性能的市场模型,并开源时,无疑会对选择闭源路线的公司产生巨大影响。
OpenAI正在讨论新一轮融资。
根据《华尔街日报》的报道,OpenAI正在讨论新一轮融资,它计划在一轮融资中筹集最多400亿美元,估值将达到3000亿美元。与之前估值1570亿美元的近一倍相比,它将成为仅次于埃隆·马斯克SpaceX全球估值第二高的创业公司。
另外,根据PitchBook的数据,这一轮融资将是硅谷历史上最大的一轮融资,并且打破了2023年OpenAI创造的融资记录,当时它从微软融资了100亿美元。上述报道还表示,在这一轮融资中,软银集团将以150亿至250亿美元的身份投资投资。如果新一轮融资完成,孙正义将进一步与OpenAI绑定。
值得注意的是,1月22日,美国总统特朗普宣布,OpenAI、软银集团和甲骨文将合资成立一家名为“星际之门”的公司(Stargate)未来四年,新公司计划在美国投资5000亿美元建设AI基础设施,其中1000亿美元将立即部署。
OpenAICEO山姆·奥特曼之前透露,OpenAI、软银集团、甲骨文和MGX将共同投资450亿美元,OpenAI和软银集团将投资190亿美元进入星际之门,全部拥有合资企业40%的股份,而甲骨文和MGX将共同投资70亿美元。根据华尔街日报的报道,最新的融资资金将用于帮助OpenAI履行其对“星际之门”的投资承诺。
DeepSeek发布的AI模型,以其高性能、廉价、开源等优点,让很多投资者质疑OpenAI等美国AI开发商的高AI资本支出策略。在评价DeepSeek之前,奥特曼承认,DeepSeek R1令人印象深刻,特别是在成本方面,“但是我们无疑会带来更好的模型”。“我们相信,要实现我们的使命,更多的计算能力比以往任何时候都更重要。”他还说。”
另外,据彭博社报道,知情人士透露,OpenAI和微软最近进行了联合调查,针对去年使用OpenAI的DeepSeek。 对API接口的帐户进行审查,并以涉嫌违反服务条款模型蒸馏为由,取消了访问限制。在此之前,OpenAI曾经告诉媒体,它发现DeepSeek使用OpenAI专有模型来训练其开源模型证据,即DeepSeek涉嫌“蒸馏”其模型,但拒绝进一步透露其证据的细节。
据记者了解,蒸馏是模型训练中常见的做法。简单理解就是用事先训练好的复杂模型作为“教师模型”,用它的输出结果作为监管信号,然后训练另一个“学生模型”,让学生模型逐渐接近教师模型水平。因为“从零开始”训练一个模型需要花费大量的计算资源,蒸馏也被认为是AI普惠的一种方式。在中国和美国,创业公司和学术机构使用ChatGPT等领先模型导出数据来训练自己的模型是业界普遍存在的现象。
值得注意的是,1月30日,OpenAI全球事务副总裁Chris在美国国家公共电台的节目中。 LeHane表示,“o3”将于周五发布。紧急推出新模式表明,DeepSeek的崛起已经威胁到了OpenAI,同时也将使AI领域的竞争更加激烈。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




