Grok是马斯克花钱砸出来的超越DeepSeek和OpenAI？

2025-02-20

文 | 科技漩涡

北京时间 2 月 18 一天中午，马斯克的人工智能初创公司 xAI 新一代聊天机器人正式发布 Grok 三。马斯克和他的人工智能团队宣称，Grok 3 超越现有人工智能模型的测试版高级推理能力。

被称为地表最聪明的马斯克。 AI，完美地解释了什么是“有钱任性”，只是因为它被使用了。 20 万元 GPU 训练模型。所以，它真的可以超越风头正盛。 DeepSeek 和行业先锋 OpenAI 吗 ?

烧钱无数的 Grok 3 有多强 ?

在 Grok 3 在现场直播中，马斯克等人介绍了。 Grok 3 练习过程。去年马斯克剧透，Grok 3 在 10 万张 H100 上面的练习是第一个达到这样训练集群规模的模型。在今天的新闻发布会上，我们透露到训练的第一步。 92 在这一天，集群规模扩大到了 20 万卡。

Grok 3 实力的确证明，在这一时期，烧钱是一个巨大的优势。这波浪潮 Grok 3 有满血和 mini 在数学、科学、代码等数据方面，两个版本的表现都超过了 GPT-4o、DeepSeek-V3 等待非推理模型。

Grok-3 mini 性能基本领先或与其它闭源相当。 / 开源模型。著名的大型模型 LMSYS Arena 排行榜中，Grok-3 刷榜，Elo 评分超 1400 位居最高，没有任何模型可以与之相比，可以称之为断层式领先。

xAI 这个团队也展示了 Grok 3 怎样执行有趣的任务。例如，计算从地球到火星的航天器任务。Grok 3 产生一个太空发射的动画。 3D 轨迹图 ( 也就是从地球到火星，然后回到地球的可行轨迹。 ) 。它涉及到一些复杂的物理知识，Grok 3 这些内容需要理解。

Grok 3 同时也展示了自动化游戏开发的潜力。xAI 团队要求 Grok 3 结合《俄罗斯方块》和《宝石迷阵》，现场创作了一款新游戏。Grok 3 产生的 Python 剧本定义了游戏的常量、颜色、正方形等元素，呈现出独特的玩法:当连接至少三个颜色相同的正方形时，会触发重力机制去除正方形，类似于宝石迷阵。

此外，Grok 3 包含一个名字 Big Brain 功能，这是一种推理模式，在处理查询时可以更深入地思考。马斯克指出，17 一个月前，最初的 Grok 这种模式几乎无法处理高中问题，但现在已经取得了很大的进步，他幽默地形容。 Grok 已准备好上大学了”。

性价比和猛烧钱，大模型的道路该怎么走？ ?

众所周知，DeepSeek 通过独特的算法优化、结构模式和高效的资源利用，大大降低了英伟达高端水平 GPU 依赖。它还导致英伟达股价暴跌市值单日挥发约16.97% 5926.58 亿美金。

DeepSeek 声称其模型训练费用仅为同类模型。 1/5 至 1/10，这意味着它在摆脱英伟达硬件的束缚时，仍然在推理性能等方面表现出来。 ChatGPT-o1 接近的能力，有些领域还有所超越。

另一方面，马斯克 Grok 3 不仅砸进去 20 万元 GPU，更加是为了快速推出 Grok 三是在短短四个月内建成数据中心。如此巨大的投资也只能得到这样的投资。 lmArena 排行榜中 41 分数提高，这真的值得吗？ ?

事实上，马斯克疯狂烧钱的行为可能有提前布局的考虑。当下，任何 AI 所有的练习都是不可或缺的 GPU，只不过 DeepSeek 采用“精算师路线”——通过算法优化，利用行业 1/10 的成本实现 90% 的性能。而马斯克的 20 万元 GPU 不只是为了快速推出 Grok 更有可能是为了后续仍然保持快速迭代的选择。

写在最后

的确，马斯克的 Grok 3 确实超越了 DeepSeek，但是看起来更像是一个强化版，而不是一个大跨度的领导者。我们期待看到未来 DeepSeek 依然可以凭借超高的“性价比”再次震惊世界。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com