OpenAI推GPT-5.2反击谷歌:这把“刀”够锋利吗?

1天前
似乎难以实现“遥遥领先”。


Sam与Pichai较量,图片由AI生成


一个月前,谷歌的Gemini 3超越所有竞争者成为“全球最佳”;一个月后,正值OpenAI成立10周年(美国时间12月11日),其正式推出新一代AI模型GPT-5.2。


在这场关键的产品发布前,为应对主要对手的产品冲击与挖角攻势,奥特曼在公司内部拉响了最高级别的“红色警报”。


因此,GPT-5.2的登场,不仅关系到两家科技巨头的市场地位,更可能重新划定全球人工智能产业的竞争格局。


提前参与两周“内测”的HyperWrite联合创始人兼CEO马特·舒默评价道:能力出色,尤其推理能力突出,但运行速度慢,且应用场景过于单一,仅能通过ChatGPT使用。


“它是目前世界上最优秀的模型,能花1小时处理难题并出色完成。我已经离不开它了。”



硅谷AI专家艾莉·米勒也是“内测用户”,她将GPT-5.2定义为“专业研究员”:在深度思考与复杂问题解决上表现“严谨”“专业”,但内容结构固化,对追求快速、简洁及拟人化交流的用户不够友好。


“处理复杂工作、头脑风暴、专业分析时,我或许会选择GPT-5.2。”


AI开发者Dp Singh也认同这一判断,他强调AI首次在日常专业任务(如制作演示文稿、电子表格、分析图表)中达到专家级输出水平,而非仅局限于演示场景。


GPT-5.2展现出的与人类研究员相当的专业能力,也引发了学界专家的关注。



宾夕法尼亚大学沃顿商学院教授、人工智能专家伊桑·莫利克表示:“我从未如此确信,即便如今人工智能发展停滞,未来10年社会与经济仍将面临巨大变革,因为人类会竭力挖掘模型的能力。当然,AI的进步不可能就此止步。”


01 OpenAI难续“遥遥领先”


OpenAI对GPT-5.2的定位清晰,即“迄今为止最适配现实世界专业用途的模型”。


而证明其“能力”的核心指标,便是基准测试与跑分数据。



上图是OpenAI在X平台公布的基准测试图(官方新闻稿中甚至未包含此图)。


可见,在其自主研发的GDPval基准测试中,GPT-5.2在70.9%的明确任务上达到或超越顶尖人类专家水平,较8月发布的GPT-5(38.8%)实现大幅提升,也领先于Anthropic的Claude Opus 4.5(59.6%)与谷歌的Gemini 3 Pro(53.5%)。


不过,GDPval毕竟是OpenAI自家的基准测试,表现不佳才不正常。


更关键的是,业界基准测试数量繁多,OpenAI此次仅引用了8项不同类型的测试,而谷歌在Gemini 3发布时引用了约20项——这就存在操作空间:只展示自家表现优异的基准测试数据,其余则避而不谈。



但若将上述表格转化为折线图,便能清晰看到:在多项基准测试中,OpenAI新发布的GPT-5.2与行业前沿模型的差距并不显著。


显然,AI竞赛已从OpenAI一家独大,演变为多方巨头“短兵相接”的混战局面。


《纽约时报》也提及这一观点,并援引行业专家说法指出:“OpenAI所谓的AI基础模型与其他公司模型间的技术差距,实际上已不复存在。”


若基准测试不够直观,可看具体案例:左图是OpenAI官方提供的“海浪模拟器”网页,右图是相同提示词在Gemini中生成的页面,总体而言各有千秋。



前文提到,因竞争对手步步紧逼,奥特曼在公司内部拉响“红色警报”。


从GPT-5.2与同行的差距来看,短期内恐怕难以在产品与模型层面解除“红色警报”。


针对此问题,被奥特曼亲自挖来的应用业务首席执行官菲吉·西莫解释:“红色警报是向公司发出的信号,表明需将资源集中于特定领域,是明确优先级的方式。”


言外之意,红色警报并非生死决战,只是管理层表决心、定方向的手段。实际上GPT-5.2数月前已研发完成,只是选择在这个时间点发布。


问题在于,若要关乎企业生死,除了这款难以拉开差距的GPT-5.2,奥特曼手中是否还有更锋利的“刀”?


当然,相较于内部拉警报,奥特曼在外部表现得颇为轻松。


他在接受CNBC采访时持谨慎乐观态度:“Gemini 3对我们业务指标的影响,可能比预想的要小。”他预计OpenAI将在2026年1月“以非常强势的姿态”解除“红色警报”状态。


02 十年逐梦,初心是否依旧?


OpenAI刚迎来成立10周年,官网发布了一条视频,介绍公司的起源与未来方向。


10年前,马斯克仍参与OpenAI项目时,黄仁勋赠送了OpenAI世界首台DGX-1服务器,众多大佬在上面签名,背景墙有一句格言:“关键问题不在于我们‘知道什么’,而在于如何‘运用所知’……我相信,每个人的责任是——行动时,要仿佛全世界的命运都系于己身。”



十年来,OpenAI推出了ChatGPT、Sora等震撼产品,奥特曼在全球各地推广布道,与硅谷巨头联合布局算力。但随着时间推移,OpenAI从最初的大幅领先,逐渐被对手追平甚至超越?


如今的OpenAI,正站在迷茫的十字路口。


成立初期,OpenAI宣称目标是“以最利于全人类的方式推进数字智能,不受财务回报需求限制”。


斯塔福德郡大学AI伦理学家凯瑟琳·弗利克强调,这一创立理念已发生巨变。因为在OpenAI复杂架构背后,存在着利益交织的营利性公司。


“如今我们看到的是一家营利性公司,它已完全卸下对社会效益的责任,基本接受了‘不惜一切代价增长’的信条。”弗利克表示,原因在于OpenAI身处生成式AI革命前沿,这里“有利可图”。


在红色警报下,OpenAI首要任务是优化产品体验,商业化优先级靠后——这关乎生死存亡,也关乎奥特曼更宏大的理想:10年后可能实现的超级智能。但这一愿景并非OpenAI内部的绝对共识。


03 商业化与治理的冲突


技术竞赛背后,是OpenAI面临的巨大商业化与盈利压力。


奥特曼表示,OpenAI目标是2025年底实现月营收相当于年营收200亿美元,但承认距离整体盈利“仍有很长路要走”。


更引人注目的是,OpenAI承诺未来几年投入高达1.4万亿美元用于计算基础设施建设,以支撑其AI雄心。


市场调研公司Sensor Tower最新数据显示,2025年11月ChatGPT全球月活用户达8.1亿,8-11月增速仅6%,远低于2024年同期40%以上的水平。此外,其全球市场份额四个月内从38%降至35%。



目前,ChatGPT是OpenAI的营收核心。在超8亿月活用户中,约6%每月支付20美元使用高级服务。


OpenAI正尝试从免费用户中挖掘更多价值,探索方向包括在ChatGPT中引入广告,以及开发交易分成模式(如用户通过聊天机器人购物,OpenAI从中抽成)。


西莫还证实,OpenAI计划在推出“成人模式”(或允许成人内容)前,先引入用户年龄预测功能以保护青少年,“成人模式”预计明年第一季度上线。


同时,OpenAI积极进军企业软件市场,将自身定位为同时服务消费者与企业的公司。GPT-5.2在编码、法律、金融等专业领域的性能提升,正是为吸引高价值企业客户。


然而,在该市场,OpenAI将直面谷歌、微软等巨头的激烈竞争——后者能将AI工具与成熟办公软件生态(如Google Workspace、Microsoft 365)深度绑定。


盈利能为OpenAI提供持续资金,支撑其“帮助人类”的远大理想,但过程中也会衍生一系列安全、伦理问题。


就在GPT-5.2发布前,OpenAI遭遇新诉讼,指控ChatGPT与一名心理困扰用户的互动间接导致康涅狄格州一起谋杀-自杀惨剧。需注意,这并非第一起类似诉讼。


OpenAI回应称事件“令人心碎”,并承诺持续改进系统对心理困扰迹象的识别与应对能力,引导用户寻求现实帮助。


此外,《纽约时报》起诉OpenAI及其合作伙伴微软侵犯版权的案件仍在审理中,凸显了AI训练数据合法性这一行业根本性难题。


04 与谷歌的“霸主之争”


OpenAI与谷歌的较量,早已超越单纯技术参数比拼,演变为涵盖技术迭代、生态构建、商业模式、安全治理与资本耐力的全方位战争。


技术层面,基准测试“榜首”争夺日趋激烈。


OpenAI研究副总裁艾丹·克拉克虽未透露GPT-5.2的具体训练突破,但承认在预训练等基础环节持续改进,回应了业界对“预训练潜力是否耗尽”的质疑。


生态层面,OpenAI推出自有浏览器,意在挑战谷歌Chrome,试图构建从底层模型到上层应用的完整生态闭环;而谷歌则凭借庞大现有产品矩阵,试图通过整合创造协同优势。


AI模型评估平台LMArena公司的Wei-Lin Chiang指出:“通用模型用户增长已触及阶段性瓶颈,下一个增长极必然来自垂直领域。”


他还强调,当前竞争核心已非单纯用户扩张,而是谁能率先在医疗、金融等关键行业建立可靠高效的解决方案,真正实现技术能力向产业价值的转化。


战略文化层面,OpenAI从非营利研究机构向高估值商业实体的快速转型,以及对盈利的迫切追求,正重塑其内部文化。一些早期员工曾引以为傲的、与谷歌等广告驱动模式的差异,在现实压力下逐渐模糊。


“这是一场多线展开的竞赛。”追踪最新AI技术性能的公司Vals AI首席执行官拉扬·克里希南的论断,精准概括了当前AI霸主之争的复杂性。


总体而言,GPT-5.2的发布是OpenAI在专业领域的一次有力技术宣示,但远非终局——它未能与对手拉开差距,甚至OpenAI自己都称要到2026年1月才能解除警报。更重要的是,即便短期内“红色警报”暂解,整个AI行业最高强度的竞争警报,已然长鸣。


本文来自微信公众号“腾讯科技”,作者:苏扬 无忌,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com