美国AI竞争升级，谁会感到焦虑？

2025-11-20

奥特曼罕见发文称“看起来很不错”，马斯克也跟着评论称“做的不错”。

2025年只剩最后42天，被行业统称为物理世界最强的AI——Gemini 3 Pro预览版于北京时间昨夜凌晨正式发布，API也同步开放。

它被称为最强，是因为在所有主要Arena排行榜中几乎全部排名第一，且评分断层。就连最大竞争对手OpenAI CEO奥特曼也罕见发文称赞“看起来很不错”，马斯克也跟着评论“做的不错”。

当天，微软的Ignite 2025大会开幕，微软发布了Edge for Business浏览器的一系列重大更新，似有隔空对垒之意。

有人评价这是谷歌对OpenAI最猛烈的一场打击，业内认为，Gemini3直击了GPT5的性能高地，甚至实现了GPT5.1没能实现的效果。

业内感叹：跑分“断层领先”？

在AI圈子里，模型间通常是微弱优势的你追我赶，但Gemini 3 Pro的表现拉开了性能差距。

仅看跑分，Gemini 3 Pro几乎实现了“断层领先”。除软件工程能力略逊于GPT - 5.1和Claude Sonnet 4.5外，在推理、多模态和Agent工具使用等关键基准上全方位霸榜。

在代表人类智力“天花板”的Humanity's Last Exam中，GPT - 5.1得分在26.5%徘徊，而Gemini 3 Pro直接跑出37.5%的高分。其“深度思考模式”（Deep Think）不使用任何工具时，得分更是飙升至41.0%。

在数理方面，Gemini 3 Pro展现出统治力。AIME 2025（美国数学邀请赛）配合代码执行，准确率达100%。在代表数学极限的MathArena Apex测试里，其他顶尖模型还在个位数或10%左右挣扎时，它跑出了23.4%的分数，开始在许多AI曾“看不懂题”的领域攻城略地。

但这些数据并非最让科技圈震动的原因。Gemini 3 Pro带来了前所未有的体验，它不只是写代码，更是在搞创作。

以往评价AI编程能力，看的是逻辑和Bug情况，但Gemini 3 Pro突破了这一维度。当用户给出极其抽象的Prompt，如“设计一个很温馨的场景，里面要有哆啦A梦，还有大熊，他们在一起憧憬着未来，并且我需要在浏览器里跑出来”，它短则十几秒后就能交给用户可流畅运行的代码。

AI博主数字生命卡兹克让它生成类似window的web os，它真的生成出来了，且有模有样。

图｜来源于AI博主数字生命卡兹克

这一刻，很多前端工程师可能感到寒意。Gemini 3 Pro证明，前端开发中“手写”部分价值正在极速归零，取而代之的是“想象力门槛”。只要Prompt描述有画面感、有“人味”，模型就能还原脑洞。

不过，它对于程序员来说，目前也不是万能的。

之前网络上“彻底颠覆程序员”的说法并不准确。Gemini 3 Pro在AI领域处于顶尖水平，但未实现“颠覆编程”目标。在软件工程能力的SWE - Bench Verified测试中，它获得76.2%的成绩，虽表现出色，但仍落后于Claude Sonnet 4.5的77.2%（SOTA水平）。这表明，处理超长、非常复杂的后端逻辑时，它存在一定局限性。

当前不少模型比拼竞争编程能力，从海外的Claude到国内的Kimi都主打编程。目前，Gemini更偏向于辅助设计，不能完全重构整个后端架构，但设计符合现代审美的网站、生成复杂的SVG交互动画，它能通过简单提示提供惊艳、可立即运行的成果。

另一个例子也证明，现在的AI还不足以让我们完全信任。今天中午，据科技博主@纯银V发文称，Gemini3的第一个大型受害者出现了。

中招的是他一位朋友，使用Cursor进行AI编程时，Gemini3不知为何直接删掉了用户800G的文件，连Cursor自己也被“清理”。

目前无法手动恢复，只能找专门的数据恢复公司。

竞争还在升级

谷歌这次连开发环境都进行了重构。

伴随模型发布的，是名为Google Antigravity的新平台，这可能是目前最接近“自动驾驶编程”的形态。它不是传统的代码编辑器，而是“智能体优先”（Agent - first）的指挥中心。

在Antigravity里，用户不是独自作战。Gemini 3 Pro是大脑，负责顶层架构，Gemini 2.5 Computer Use模型是手眼，负责操控浏览器验证效果，Nano模型负责打杂。用户下达指令，它们分工协作，写代码、跑测试，甚至AI会自己发现问题并修正。

这种“端到端”的工程能力，是谷歌的护城河。

比如在最新搜索模式中，问复杂的物理或生物问题，它不再只提供链接，而是直接生成可交互的动态模拟器。这是算力和数据积累到极致的表现。

目前，Gemini月活跃用户已超6.5亿。今年8月，OpenAI宣布ChatGPT周活用户达到8亿。

在争夺普通消费者的赛道上，OpenAI与谷歌的竞争还在升级。巴克莱银行分析师罗斯·桑德勒依据两大巨头的token消耗量估算，在原生消费级AI应用方面，OpenAI的Token消耗量仍是Gemini的两倍以上。

同在谷歌旗下，DeepMind的CEO官德米斯・哈萨比斯（Demis Hassabis）表示，由Gemini 3驱动的人工智能响应“将摒弃陈词滥调和刻意讨好，提供真正有价值的见解 —— 告诉你需要知道的事，而非你想听的话”。行业批评人士指出，当前的人工智能聊天机器人往往过于“谄媚”。

而一周前，OpenAI更新GPT5.1时称，GPT - 5.1的答案让人感觉更聪明，语气更自然。优秀的人工智能不仅要聪明，还要提供愉快的交谈。

不过，在商业模式上，二者存在显著差异，可能使其面临的压力不同。

多家媒体报道，一份据称来自OpenAI内部的文件显示，OpenAI实际运营成本远超外界想象，收入被显著夸大，运营成本与收入差距惊人。数据显示，2024年第一季度到2025年第三季度的七个季度里，OpenAI仅在Azure上的推理计算支出就超过124亿美元。2025年前九个月，其推理成本高达86.7亿美元。

10月29日，谷歌母公司Alphabet发布截至2025年9月30日的第三季度财报。数据显示，Alphabet第三季度总营收达1023.46亿美元，较去年同期的882.68亿美元增长16%，五年前这一数字是500亿美元。Alphabet CEO桑达尔・皮查伊称，人工智能正为其创造切实价值。值得一提的是，巴菲特发出最后一封股东信之际，伯克希尔·哈撒韦公司持仓报告显示，截至今年第三季度末，该公司已建仓价值43亿美元的谷歌股票，并继续减持苹果。这是巴菲特退休前的关键战役，在人工智能领域，股神已做出选择。

这意味着，OpenAI面临艰难抉择，如果不能显著超越Gemini，ChatGPT拉开的用户规模差距可能被追上，对于烧钱换规模的OpenAI而言，将是毁灭性打击。

本文来自微信公众号“凤凰网科技”，作者：Dale、姜凡，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

阿里员工提离职后笔记本摄像头常亮，引发关注与猜测

项目推荐

康小虎 · 健康小屋

毛加健康

康老板 · 氧疗堂