在被扫地18个月后,马斯克终于报复了OpenAI。

02-20 11:33

二月十八日,马斯克发布了Grok 3个模型之后,转发了一条推特:



敲重点,Grok3目前拥有世界第一强模型(测试场1400分),比OpenAI的推理模型还要强大,18个月就超过了山姆·奥特曼领导下的OpenAI。


要知道马斯克曾经是OpenAI的天使投资者,甚至关键词Open都是马斯克命名的。变化发生在2018年,奥特曼和马斯克在“开源还是闭源”的问题上彻底分手。马斯克坚信人工智能必须透明开放,以规避风险;另一方面,奥特曼选择在资本压力下与微软结盟,将技术封闭在商业环城河中。


在此之前,每个人都很平静,因为当时ChatGPT还没有那么强大。到了2022年底,ChatGPT4问世后,马斯克开始对被踢出这样一个跨世代的项目念念不忘。回答那句话:『不要害怕分手,害怕前任过得好。


这一过去在2024年再次被点燃。马斯克以“违背公益初心”为由,起诉OpenAI,并指控其将技术垄断权交给微软。虽然这场官司没有胜诉,但它为马斯克埋下了一颗复仇的种子。2023年7月,马斯克成立了xAI实验室,并开始发布Grok系列模型,以比较OpenAI的GPT系列模型。


大力创造奇迹,追上OpenAI18个月


开场xAI在Grok3发布会上介绍了他们的决心:


『122天,10万显卡集群建成,92天后,20万张显卡集群建成。 H100 显卡集群。』H100算率集群是世界上最大的集群。



许多朋友不理解这些数据的含义,这意味着Grok3的训练算率超过了DeepSeek 但是V3的263倍只带来超过DeepSeek的263倍 Benchmark能力的33%。


Scaling 暂时不提Law是否失败,就说这个大投入算率基础设施,也算是马斯克追逐的决心。


在短短两年时间里,xAI不断推出Grok系列模型:Grok-1,Grok-1,Grok-1,Grok-1,Grok-1,Grok-1。 Vision,追逐ChatGPT Grok4o 2,以及今天登顶的Grok。 Grok每一步都试图用“暴力开源”战略来撕裂OpenAI的闭源堡垒。



重要的时间节点是2024年底。XAI在田纳西州孟菲斯建立了一个堪比“计算能力核电站”的数据中心,10万元的英伟达H100 由GPU组成的集群,让Grok 三是练习速度比上一代高十倍。马斯克在推特上写道:“算率就是权力,我们将拥有最暴力的武器。


此后,马斯克宣布筹集60亿美元,继续投资Grok大模型的实践。这笔钱比国内大模型六小虎的融资总额还多。


经过18个月的xAI设立(不到2年),Grok 三是正式发布,成功登顶最强模式。


Grok “量子跃升”,有什么杀手锏?


2025年2月18日,全球数百万观众涌入直播平台,见证马斯克最新的大模型。在此之前,他宣布将在中东AI大会上发布世界上最聪明的大模型Grok。 三。现在看来Grok 三个名副其实,有很多强大的能力。


技术核爆点一:最聪明的模型

基准测试数据显示,Grok 三是Elo评分达到1400,这是其它任何模型都没有达到的。


Grok 3在AIME 2025科学推理测试的分数超过Geminini。 2 Pro和GPT-4o,它的迷你模型甚至在编程任务中击败了DeepSeek-R1。


也许每个人都已经被大模型检测到了,这让他们不太相信这些数据的真实性。国外有Grok。 第三次测试的大神,测试了卡坦岛的问题,它超出了人类和一些大模型的理解:


“创建一个显示六边形网格的棋盘游戏网页,就像游戏中的棋盘一样。 Settlers of Catan 相同。每一个六边形网格的编号 1 到 N,其中 N 它是六边形瓷砖的总数。使其通用,这样就可以用滚轮改变“环”的总数。例如, Catan 中半径为 3 六边形。请选择单个六边形。 html 页面。”



他评价很少有模型能够可靠地做到这一点。顶级的 OpenAI 思维模式(例如 o1-pro,每月 200 美元也可以做到这一点,但是 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 这一点也没有做到。


即使是数学史上著名的未接知名『黎曼猜测』,Grok 3也会尝试去计算,不像O1-Pro、Claude等模型不能直接回答,放弃了。


技术核爆点2:动态反思机制

Grok 引入“思维链”推理技术,可以像人类一样拆解复杂的任务,实时调整逻辑断层。在现场演示中,Grok 从地球到火星的航天器轨迹图只需30秒就可以生成,并且标有引力弹弓效应的最佳应用节点。



『您可以看到Grok的确在做一些模糊的思考,这样模型就不会被立即完全复制。』


从图中可以看出,在数学测试中,Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分超过了o3mini的87分,o1的83分,DeepSeek-R1的80分。


Grok3两款模型在科学和编程方面也有一定的领先地位。


技术核爆点3:更多呈现方式

Grok 3不仅可以解锁检测时间计算,还可以启用强大的代理商。这一能力促成了一款名为DeepSearch的新产品。下一代搜索代理商,用来理解宇宙。DeepSearch还将显示搜索过程中采取的步骤。



不仅如此,Elon还强调Grok。 创造力的涌现能力。 Grok增加了第三个标签按钮,这个页面与DeepSeek非常相似。『Big Brain』。 使用Grok,通过更多的计算资源和推理,使用Grok。 三是可能会产生意想不到的效果。



未来Grok 3大模型的创作风格和思考创造力的界限应该没有太大的限制。相比之下,OpenAI解除了ChatGPT的成人内容限制,这就是...


口水战无法完成,奥特曼的反击。


面临Grok OpenAI的突袭并非没有动作。


新闻发布会前天,山姆·奥特曼在X平台上声称:GPT-4.5将带来AGI的第一次体验。“预计GPT-4.5也将在一两个星期内发布。到时候,充满血液的O3应该能够夺回世界上最好模型的宝座。


在此之前,一个由马斯克牵头的财团计划出价。 974 亿美元收购 OpenAI,首席执行官萨姆是后者。・阿尔特曼回应说,“ 没有,谢谢,但是如果你愿意,我们可以 97.4 以1亿美元的价格收购推特(即今天的推特) X)" 后。


商业竞争互不手软,口水战也不断打起来。


未来两家公司仍然存在路线竞争。相对于OpenAI的闭源战略,Grok 三是承诺未来“开源”,Grok 2将在一个月内开源,并计划接入特斯拉车载系统和Optimus人形机器人。


与此同时,xAI同步推出“Super Grok“订阅服务,以每月49美元的价格向开发商开放深度搜索(DeepSearch)功能性-这种能够交叉验证信息来源,公开推理路径的引擎,直接指向ChatGPT的“黑箱”问题。


更深层次的影响来自生态。Grok 开源策略吸引了大量开发者,而特斯拉的硬件布局(例如Model) Q车载系统)为AI着陆提供了一个真实的场景。


AI领域的权力天平在2025年正在倾斜。Grok 3的颠覆不仅在于技术,还在于重新点燃了“开源理想主义”的火种。正如一位硅谷投资者所说:“马斯克用Grok。 3完成了一场迟到的报复,但是这场战斗的真正赢家,或许是那些最终看到技术透明曙光的人。


山姆·奥特曼将采取什么样的竞争策略来反击?


本文来自微信微信官方账号“鲸选AI”,作者:点赞关注,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com