OpenAI推GPT-5.2反击谷歌：这把“刀”够锋利吗？

2025-12-13

似乎难以实现“遥遥领先”。

Sam与Pichai较量，图片由AI生成

一个月前，谷歌的Gemini 3超越所有竞争者成为“全球最佳”；一个月后，正值OpenAI成立10周年（美国时间12月11日），其正式推出新一代AI模型GPT-5.2。

在这场关键的产品发布前，为应对主要对手的产品冲击与挖角攻势，奥特曼在公司内部拉响了最高级别的“红色警报”。

因此，GPT-5.2的登场，不仅关系到两家科技巨头的市场地位，更可能重新划定全球人工智能产业的竞争格局。

提前参与两周“内测”的HyperWrite联合创始人兼CEO马特·舒默评价道：能力出色，尤其推理能力突出，但运行速度慢，且应用场景过于单一，仅能通过ChatGPT使用。

“它是目前世界上最优秀的模型，能花1小时处理难题并出色完成。我已经离不开它了。”

硅谷AI专家艾莉·米勒也是“内测用户”，她将GPT-5.2定义为“专业研究员”：在深度思考与复杂问题解决上表现“严谨”“专业”，但内容结构固化，对追求快速、简洁及拟人化交流的用户不够友好。

“处理复杂工作、头脑风暴、专业分析时，我或许会选择GPT-5.2。”

AI开发者Dp Singh也认同这一判断，他强调AI首次在日常专业任务（如制作演示文稿、电子表格、分析图表）中达到专家级输出水平，而非仅局限于演示场景。

GPT-5.2展现出的与人类研究员相当的专业能力，也引发了学界专家的关注。

宾夕法尼亚大学沃顿商学院教授、人工智能专家伊桑·莫利克表示：“我从未如此确信，即便如今人工智能发展停滞，未来10年社会与经济仍将面临巨大变革，因为人类会竭力挖掘模型的能力。当然，AI的进步不可能就此止步。”

01 OpenAI难续“遥遥领先”

OpenAI对GPT-5.2的定位清晰，即“迄今为止最适配现实世界专业用途的模型”。

而证明其“能力”的核心指标，便是基准测试与跑分数据。

上图是OpenAI在X平台公布的基准测试图（官方新闻稿中甚至未包含此图）。

可见，在其自主研发的GDPval基准测试中，GPT-5.2在70.9%的明确任务上达到或超越顶尖人类专家水平，较8月发布的GPT-5（38.8%）实现大幅提升，也领先于Anthropic的Claude Opus 4.5（59.6%）与谷歌的Gemini 3 Pro（53.5%）。

不过，GDPval毕竟是OpenAI自家的基准测试，表现不佳才不正常。

更关键的是，业界基准测试数量繁多，OpenAI此次仅引用了8项不同类型的测试，而谷歌在Gemini 3发布时引用了约20项——这就存在操作空间：只展示自家表现优异的基准测试数据，其余则避而不谈。

但若将上述表格转化为折线图，便能清晰看到：在多项基准测试中，OpenAI新发布的GPT-5.2与行业前沿模型的差距并不显著。

显然，AI竞赛已从OpenAI一家独大，演变为多方巨头“短兵相接”的混战局面。

《纽约时报》也提及这一观点，并援引行业专家说法指出：“OpenAI所谓的AI基础模型与其他公司模型间的技术差距，实际上已不复存在。”

若基准测试不够直观，可看具体案例：左图是OpenAI官方提供的“海浪模拟器”网页，右图是相同提示词在Gemini中生成的页面，总体而言各有千秋。

前文提到，因竞争对手步步紧逼，奥特曼在公司内部拉响“红色警报”。

从GPT-5.2与同行的差距来看，短期内恐怕难以在产品与模型层面解除“红色警报”。

针对此问题，被奥特曼亲自挖来的应用业务首席执行官菲吉·西莫解释：“红色警报是向公司发出的信号，表明需将资源集中于特定领域，是明确优先级的方式。”

言外之意，红色警报并非生死决战，只是管理层表决心、定方向的手段。实际上GPT-5.2数月前已研发完成，只是选择在这个时间点发布。

问题在于，若要关乎企业生死，除了这款难以拉开差距的GPT-5.2，奥特曼手中是否还有更锋利的“刀”？

当然，相较于内部拉警报，奥特曼在外部表现得颇为轻松。

他在接受CNBC采访时持谨慎乐观态度：“Gemini 3对我们业务指标的影响，可能比预想的要小。”他预计OpenAI将在2026年1月“以非常强势的姿态”解除“红色警报”状态。

02 十年逐梦，初心是否依旧？

OpenAI刚迎来成立10周年，官网发布了一条视频，介绍公司的起源与未来方向。

10年前，马斯克仍参与OpenAI项目时，黄仁勋赠送了OpenAI世界首台DGX-1服务器，众多大佬在上面签名，背景墙有一句格言：“关键问题不在于我们‘知道什么’，而在于如何‘运用所知’……我相信，每个人的责任是——行动时，要仿佛全世界的命运都系于己身。”

十年来，OpenAI推出了ChatGPT、Sora等震撼产品，奥特曼在全球各地推广布道，与硅谷巨头联合布局算力。但随着时间推移，OpenAI从最初的大幅领先，逐渐被对手追平甚至超越？

如今的OpenAI，正站在迷茫的十字路口。

成立初期，OpenAI宣称目标是“以最利于全人类的方式推进数字智能，不受财务回报需求限制”。

斯塔福德郡大学AI伦理学家凯瑟琳·弗利克强调，这一创立理念已发生巨变。因为在OpenAI复杂架构背后，存在着利益交织的营利性公司。

“如今我们看到的是一家营利性公司，它已完全卸下对社会效益的责任，基本接受了‘不惜一切代价增长’的信条。”弗利克表示，原因在于OpenAI身处生成式AI革命前沿，这里“有利可图”。

在红色警报下，OpenAI首要任务是优化产品体验，商业化优先级靠后——这关乎生死存亡，也关乎奥特曼更宏大的理想：10年后可能实现的超级智能。但这一愿景并非OpenAI内部的绝对共识。

03 商业化与治理的冲突

技术竞赛背后，是OpenAI面临的巨大商业化与盈利压力。

奥特曼表示，OpenAI目标是2025年底实现月营收相当于年营收200亿美元，但承认距离整体盈利“仍有很长路要走”。

更引人注目的是，OpenAI承诺未来几年投入高达1.4万亿美元用于计算基础设施建设，以支撑其AI雄心。

市场调研公司Sensor Tower最新数据显示，2025年11月ChatGPT全球月活用户达8.1亿，8-11月增速仅6%，远低于2024年同期40%以上的水平。此外，其全球市场份额四个月内从38%降至35%。

目前，ChatGPT是OpenAI的营收核心。在超8亿月活用户中，约6%每月支付20美元使用高级服务。

OpenAI正尝试从免费用户中挖掘更多价值，探索方向包括在ChatGPT中引入广告，以及开发交易分成模式（如用户通过聊天机器人购物，OpenAI从中抽成）。

西莫还证实，OpenAI计划在推出“成人模式”（或允许成人内容）前，先引入用户年龄预测功能以保护青少年，“成人模式”预计明年第一季度上线。

同时，OpenAI积极进军企业软件市场，将自身定位为同时服务消费者与企业的公司。GPT-5.2在编码、法律、金融等专业领域的性能提升，正是为吸引高价值企业客户。

然而，在该市场，OpenAI将直面谷歌、微软等巨头的激烈竞争——后者能将AI工具与成熟办公软件生态（如Google Workspace、Microsoft 365）深度绑定。

盈利能为OpenAI提供持续资金，支撑其“帮助人类”的远大理想，但过程中也会衍生一系列安全、伦理问题。

就在GPT-5.2发布前，OpenAI遭遇新诉讼，指控ChatGPT与一名心理困扰用户的互动间接导致康涅狄格州一起谋杀-自杀惨剧。需注意，这并非第一起类似诉讼。

OpenAI回应称事件“令人心碎”，并承诺持续改进系统对心理困扰迹象的识别与应对能力，引导用户寻求现实帮助。

此外，《纽约时报》起诉OpenAI及其合作伙伴微软侵犯版权的案件仍在审理中，凸显了AI训练数据合法性这一行业根本性难题。

04 与谷歌的“霸主之争”

OpenAI与谷歌的较量，早已超越单纯技术参数比拼，演变为涵盖技术迭代、生态构建、商业模式、安全治理与资本耐力的全方位战争。

技术层面，基准测试“榜首”争夺日趋激烈。

OpenAI研究副总裁艾丹·克拉克虽未透露GPT-5.2的具体训练突破，但承认在预训练等基础环节持续改进，回应了业界对“预训练潜力是否耗尽”的质疑。

生态层面，OpenAI推出自有浏览器，意在挑战谷歌Chrome，试图构建从底层模型到上层应用的完整生态闭环；而谷歌则凭借庞大现有产品矩阵，试图通过整合创造协同优势。

AI模型评估平台LMArena公司的Wei-Lin Chiang指出：“通用模型用户增长已触及阶段性瓶颈，下一个增长极必然来自垂直领域。”

他还强调，当前竞争核心已非单纯用户扩张，而是谁能率先在医疗、金融等关键行业建立可靠高效的解决方案，真正实现技术能力向产业价值的转化。

战略文化层面，OpenAI从非营利研究机构向高估值商业实体的快速转型，以及对盈利的迫切追求，正重塑其内部文化。一些早期员工曾引以为傲的、与谷歌等广告驱动模式的差异，在现实压力下逐渐模糊。

“这是一场多线展开的竞赛。”追踪最新AI技术性能的公司Vals AI首席执行官拉扬·克里希南的论断，精准概括了当前AI霸主之争的复杂性。

总体而言，GPT-5.2的发布是OpenAI在专业领域的一次有力技术宣示，但远非终局——它未能与对手拉开差距，甚至OpenAI自己都称要到2026年1月才能解除警报。更重要的是，即便短期内“红色警报”暂解，整个AI行业最高强度的竞争警报，已然长鸣。

本文来自微信公众号“腾讯科技”，作者：苏扬无忌，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

海康威视智能工厂：解码中国制造的领航样本

江淮汽车49亿元再融资项目过审聚焦高端智能电动平台

飞天茅台跌破1499元指导价：神坛跌落，回归消费本质的新起点

当“卖惨”成流量密码，我们该如何坦然表达疲惫？

A股尾盘异动：微盘股杀跌引关注，风格切换成焦点

项目推荐

AI云印侠

宾果智能

幸福绩效