美国AI竞争升级,谁会感到焦虑?
2025年只剩最后42天,被行业统称为物理世界最强的AI——Gemini 3 Pro预览版于北京时间昨夜凌晨正式发布,API也同步开放。

它被称为最强,是因为在所有主要Arena排行榜中几乎全部排名第一,且评分断层。就连最大竞争对手OpenAI CEO奥特曼也罕见发文称赞“看起来很不错”,马斯克也跟着评论“做的不错”。
当天,微软的Ignite 2025大会开幕,微软发布了Edge for Business浏览器的一系列重大更新,似有隔空对垒之意。
有人评价这是谷歌对OpenAI最猛烈的一场打击,业内认为,Gemini3直击了GPT5的性能高地,甚至实现了GPT5.1没能实现的效果。
业内感叹:跑分“断层领先”?
在AI圈子里,模型间通常是微弱优势的你追我赶,但Gemini 3 Pro的表现拉开了性能差距。
仅看跑分,Gemini 3 Pro几乎实现了“断层领先”。除软件工程能力略逊于GPT - 5.1和Claude Sonnet 4.5外,在推理、多模态和Agent工具使用等关键基准上全方位霸榜。

在代表人类智力“天花板”的Humanity's Last Exam中,GPT - 5.1得分在26.5%徘徊,而Gemini 3 Pro直接跑出37.5%的高分。其“深度思考模式”(Deep Think)不使用任何工具时,得分更是飙升至41.0%。
在数理方面,Gemini 3 Pro展现出统治力。AIME 2025(美国数学邀请赛)配合代码执行,准确率达100%。在代表数学极限的MathArena Apex测试里,其他顶尖模型还在个位数或10%左右挣扎时,它跑出了23.4%的分数,开始在许多AI曾“看不懂题”的领域攻城略地。
但这些数据并非最让科技圈震动的原因。Gemini 3 Pro带来了前所未有的体验,它不只是写代码,更是在搞创作。
以往评价AI编程能力,看的是逻辑和Bug情况,但Gemini 3 Pro突破了这一维度。当用户给出极其抽象的Prompt,如“设计一个很温馨的场景,里面要有哆啦A梦,还有大熊,他们在一起憧憬着未来,并且我需要在浏览器里跑出来”,它短则十几秒后就能交给用户可流畅运行的代码。

AI博主数字生命卡兹克让它生成类似window的web os,它真的生成出来了,且有模有样。

图|来源于AI博主数字生命卡兹克
这一刻,很多前端工程师可能感到寒意。Gemini 3 Pro证明,前端开发中“手写”部分价值正在极速归零,取而代之的是“想象力门槛”。只要Prompt描述有画面感、有“人味”,模型就能还原脑洞。
不过,它对于程序员来说,目前也不是万能的。
之前网络上“彻底颠覆程序员”的说法并不准确。Gemini 3 Pro在AI领域处于顶尖水平,但未实现“颠覆编程”目标。在软件工程能力的SWE - Bench Verified测试中,它获得76.2%的成绩,虽表现出色,但仍落后于Claude Sonnet 4.5的77.2%(SOTA水平)。这表明,处理超长、非常复杂的后端逻辑时,它存在一定局限性。
当前不少模型比拼竞争编程能力,从海外的Claude到国内的Kimi都主打编程。目前,Gemini更偏向于辅助设计,不能完全重构整个后端架构,但设计符合现代审美的网站、生成复杂的SVG交互动画,它能通过简单提示提供惊艳、可立即运行的成果。
另一个例子也证明,现在的AI还不足以让我们完全信任。今天中午,据科技博主@纯银V发文称,Gemini3的第一个大型受害者出现了。
中招的是他一位朋友,使用Cursor进行AI编程时,Gemini3不知为何直接删掉了用户800G的文件,连Cursor自己也被“清理”。
目前无法手动恢复,只能找专门的数据恢复公司。
竞争还在升级
谷歌这次连开发环境都进行了重构。
伴随模型发布的,是名为Google Antigravity的新平台,这可能是目前最接近“自动驾驶编程”的形态。它不是传统的代码编辑器,而是“智能体优先”(Agent - first)的指挥中心。
在Antigravity里,用户不是独自作战。Gemini 3 Pro是大脑,负责顶层架构,Gemini 2.5 Computer Use模型是手眼,负责操控浏览器验证效果,Nano模型负责打杂。用户下达指令,它们分工协作,写代码、跑测试,甚至AI会自己发现问题并修正。
这种“端到端”的工程能力,是谷歌的护城河。

比如在最新搜索模式中,问复杂的物理或生物问题,它不再只提供链接,而是直接生成可交互的动态模拟器。这是算力和数据积累到极致的表现。
目前,Gemini月活跃用户已超6.5亿。今年8月,OpenAI宣布ChatGPT周活用户达到8亿。
在争夺普通消费者的赛道上,OpenAI与谷歌的竞争还在升级。巴克莱银行分析师罗斯·桑德勒依据两大巨头的token消耗量估算,在原生消费级AI应用方面,OpenAI的Token消耗量仍是Gemini的两倍以上。
同在谷歌旗下,DeepMind的CEO官德米斯・哈萨比斯(Demis Hassabis)表示,由Gemini 3驱动的人工智能响应“将摒弃陈词滥调和刻意讨好,提供真正有价值的见解 —— 告诉你需要知道的事,而非你想听的话”。行业批评人士指出,当前的人工智能聊天机器人往往过于“谄媚”。
而一周前,OpenAI更新GPT5.1时称,GPT - 5.1的答案让人感觉更聪明,语气更自然。优秀的人工智能不仅要聪明,还要提供愉快的交谈。
不过,在商业模式上,二者存在显著差异,可能使其面临的压力不同。
多家媒体报道,一份据称来自OpenAI内部的文件显示,OpenAI实际运营成本远超外界想象,收入被显著夸大,运营成本与收入差距惊人。数据显示,2024年第一季度到2025年第三季度的七个季度里,OpenAI仅在Azure上的推理计算支出就超过124亿美元。2025年前九个月,其推理成本高达86.7亿美元。
10月29日,谷歌母公司Alphabet发布截至2025年9月30日的第三季度财报。数据显示,Alphabet第三季度总营收达1023.46亿美元,较去年同期的882.68亿美元增长16%,五年前这一数字是500亿美元。Alphabet CEO桑达尔・皮查伊称,人工智能正为其创造切实价值。值得一提的是,巴菲特发出最后一封股东信之际,伯克希尔·哈撒韦公司持仓报告显示,截至今年第三季度末,该公司已建仓价值43亿美元的谷歌股票,并继续减持苹果。这是巴菲特退休前的关键战役,在人工智能领域,股神已做出选择。
这意味着,OpenAI面临艰难抉择,如果不能显著超越Gemini,ChatGPT拉开的用户规模差距可能被追上,对于烧钱换规模的OpenAI而言,将是毁灭性打击。
本文来自微信公众号“凤凰网科技”,作者:Dale、姜凡,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



