Grok是马斯克花钱砸出来的 超越DeepSeek和OpenAI?
文 | 科技漩涡
北京时间 2 月 18 一天中午,马斯克的人工智能初创公司 xAI 新一代聊天机器人正式发布 Grok 三。马斯克和他的人工智能团队宣称,Grok 3 超越现有人工智能模型的测试版高级推理能力。
被称为地表最聪明的马斯克。 AI,完美地解释了什么是“有钱任性”,只是因为它被使用了。 20 万元 GPU 训练模型。所以,它真的可以超越风头正盛。 DeepSeek 和行业先锋 OpenAI 吗 ?
烧钱无数的 Grok 3 有多强 ?
在 Grok 3 在现场直播中,马斯克等人介绍了。 Grok 3 练习过程。去年马斯克剧透,Grok 3 在 10 万张 H100 上面的练习是第一个达到这样训练集群规模的模型。在今天的新闻发布会上,我们透露到训练的第一步。 92 在这一天,集群规模扩大到了 20 万卡。
Grok 3 实力的确证明,在这一时期,烧钱是一个巨大的优势。这波浪潮 Grok 3 有满血和 mini 在数学、科学、代码等数据方面,两个版本的表现都超过了 GPT-4o、DeepSeek-V3 等待非推理模型。
Grok-3 mini 性能基本领先或与其它闭源相当。 / 开源模型。著名的大型模型 LMSYS Arena 排行榜中,Grok-3 刷榜,Elo 评分超 1400 位居最高,没有任何模型可以与之相比,可以称之为断层式领先。
xAI 这个团队也展示了 Grok 3 怎样执行有趣的任务。例如,计算从地球到火星的航天器任务。Grok 3 产生一个太空发射的动画。 3D 轨迹图 ( 也就是从地球到火星,然后回到地球的可行轨迹。 ) 。它涉及到一些复杂的物理知识,Grok 3 这些内容需要理解。
Grok 3 同时也展示了自动化游戏开发的潜力。xAI 团队要求 Grok 3 结合《俄罗斯方块》和《宝石迷阵》,现场创作了一款新游戏。Grok 3 产生的 Python 剧本定义了游戏的常量、颜色、正方形等元素,呈现出独特的玩法:当连接至少三个颜色相同的正方形时,会触发重力机制去除正方形,类似于宝石迷阵。
此外,Grok 3 包含一个名字 Big Brain 功能,这是一种推理模式,在处理查询时可以更深入地思考。马斯克指出,17 一个月前,最初的 Grok 这种模式几乎无法处理高中问题,但现在已经取得了很大的进步,他幽默地形容。 Grok 已准备好上大学了”。
性价比和猛烧钱,大模型的道路该怎么走? ?
众所周知,DeepSeek 通过独特的算法优化、结构模式和高效的资源利用,大大降低了英伟达高端水平 GPU 依赖。它还导致英伟达股价暴跌 市值单日挥发约16.97% 5926.58 亿美金。
DeepSeek 声称其模型训练费用仅为同类模型。 1/5 至 1/10,这意味着它在摆脱英伟达硬件的束缚时,仍然在推理性能等方面表现出来。 ChatGPT-o1 接近的能力,有些领域还有所超越。
另一方面,马斯克 Grok 3 不仅砸进去 20 万元 GPU,更加是为了快速推出 Grok 三是在短短四个月内建成数据中心。如此巨大的投资也只能得到这样的投资。 lmArena 排行榜中 41 分数提高,这真的值得吗? ?
事实上,马斯克疯狂烧钱的行为可能有提前布局的考虑。当下,任何 AI 所有的练习都是不可或缺的 GPU,只不过 DeepSeek 采用“精算师路线”——通过算法优化,利用行业 1/10 的成本实现 90% 的性能。而马斯克的 20 万元 GPU 不只是为了快速推出 Grok 更有可能是为了后续仍然保持快速迭代的选择。
写在最后
的确,马斯克的 Grok 3 确实超越了 DeepSeek,但是看起来更像是一个强化版,而不是一个大跨度的领导者。我们期待看到未来 DeepSeek 依然可以凭借超高的“性价比”再次震惊世界。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




