36个月大逆转：谷歌AI携Gemini 3回归，迈向世界模型新征程

2025-11-22

自ChatGPT发布已过去近36个月，面对OpenAI的领先优势，哈萨比斯引领谷歌AI展开全面反攻，凭借新发布的Gemini 3强势回归。Gemini 3在LM Arena等多个模型榜单上登顶，表现超越GPT - 5及其他模型，实现了一场完美逆袭。

大模型排行榜竞争激烈，你方唱罢我登场。

马斯克的Grok 4.1刚登顶不久，就被Gemini 3 Pro反超，上演了AI版的「速度与激情」！

谷歌DeepMind CEO哈萨比斯（Demis Hassabis）在X平台上兴奋地晒出Gemini 3的优异成绩，称其「理所当然地」登顶各大排行榜，并表示这是他迄今为止最喜爱的模型。

就连奥特曼和马斯克，也纷纷为Gemini 3点赞。

马斯克连发两个哭泣的表情包，称：看来我们要尽快推Grok 4.2了。

新发布的Gemini 3具备领先的推理、多媒体处理和编码能力，擅长推理、生成视频和编写代码。谷歌强调，Gemini 3不只是一个更聪明的模型或聊天机器人，更重要的是，从发布之日起，它就开始全面增强谷歌现有产品，包括利润可观的搜索业务。它是谷歌这台庞大赚钱机器的AI引擎，用哈萨比斯的话说：「我们是谷歌的动力引擎，现在我们正在让AI全面接入」。

哈萨比斯认为目前可能存在AI泡沫问题，比如许多未经检验的初创公司却获得了数十亿美元的估值。但在他看来，即便AI泡沫破裂，Gemini 3也让谷歌有了穿越这场泡沫的底气。

把Google搜索塞进Gemini

谷歌内部一直有把Google搜索「塞」进Gemini的想法，这一想法甚至可追溯到谷歌早期。当时的Larry Page和Sergey Brin就设想过把整个互联网放进AI的「记忆」中，然后对外提供服务。为此，谷歌在上下文方面做了大量实验，将上下文窗口提升到100万个token，目前该记录仍未被打破。

哈萨比斯认为，机器理论上可拥有比人类多几百万倍的存储/记忆空间，但简单地暴力存储所有东西并不高效。因此，与将Google搜索「塞」进Gemini相比，谷歌更多是把Gemini作为现有产品的底层模型向用户开放。

此次Gemini 3发布后，谷歌已通过Gemini应用以及Google搜索中的AI Overviews功能向用户开放。据谷歌母公司Alphabet在7月的季度财报显示，AI Overviews推动搜索查询量提升了10%，同时，谷歌视觉搜索出现了70%的激增，该功能依赖于Gemini对照片的分析能力。

与OpenAI相比，谷歌的优势在于其产品「家底」深厚，拥有搜索、Google地图、Gmail、云服务等广泛的基础产品线，且很早就开始利用AI增强已有产品的能力，这使其在与OpenAI、xAI、Anthropic等AI厂商的竞争中进退自如。哈萨比斯表示，「在不利情况下，我们会更依靠这些基础产品；在有利情况下，我们拥有最全面的布局和最具前瞻性的研究。」

谷歌还考虑通过Gemini重启谷歌眼镜（Google Glass）项目。哈萨比斯称，当时谷歌眼镜步子迈得超前，缺少真正的「杀手级用例」，而通用助手正是这样一个用例。未来，Gemini将激活谷歌以往积累的「经验和遗产」，重点放在「世界理解」上。

以Gemini为例，谷歌一开始就将机器人和眼镜视为重要应用场景，因此选择走多模态路线。如今，这些押注逐渐显现成果，Gemini在多模态理解上优势明显。

除增强现有和以往产品外，谷歌还积极利用AI打造受欢迎的新工具，如NotebookLM可根据文字材料自动生成播客，AI Studio能借助AI快速生成应用原型等。此外，谷歌还探索将技术应用到游戏、机器人等领域。

哈萨比斯提到谷歌AI的一个优势，目前所有产品已完全基于Gemini技术栈运行，实现了从产品到模型的「一体化」。这意味着产品改动和模型微调更易进行，产品也能更好地理解和使用底层模型。

目前，哈萨比斯一半精力用于加速做强Gemini应用，另一半用于将AI融入谷歌各业务线，使其成为谷歌的「AI动力舱」。他表示：「我对这一切非常兴奋，目前我们只是刚刚触及未来可能性的表面，明年会更直观地看到这些变化」。

被OpenAI「抢跑」后，谷歌正快速赶上

谷歌在AI领域长期投入大量资源，取得了一系列关键突破。2017年，谷歌发现了Transformer模型架构，但未将其商业化，而是选择公开。直到2022年，OpenAI基于Transformer的ChatGPT爆火，动摇了谷歌的核心搜索业务，谷歌才开始奋起直追。

有意思的是，OpenAI的崛起不仅唤醒了谷歌在AI领域的加速发展，还间接帮助谷歌避免了被分拆、出售搜索业务的命运。如今，谷歌的搜索业务不仅未被OpenAI等AI新势力颠覆，其AI模型还实现了反超。

与Gemini 3相比，OpenAI在8月发布的GPT - 5令人失望，一些评论者认为它「表现平平」，用户也抱怨其风格变得更正式。据谷歌称，Gemini 3在LM Arena等多个模型榜单上表现优于GPT - 5及其他模型，尤其在模拟推理和长时间规划方面表现更佳，有助于提升依赖工具或互联网的AI智能体的实际能力。

在早期的AI竞赛中经历波折后，谷歌渐入佳境。从用户活跃度看，Gemini应用的月活用户已超6.5亿，仅次于ChatGPT的7 - 8亿周活用户（换算成月活可能超10亿）。每月超20亿人通过搜索里的AI Overviews使用Gemini，约1300万开发者在自己的产品中集成了Gemini。这些数字表明谷歌正逐渐缩小与OpenAI在AI领域的差距，作为谷歌AI总负责人的哈萨比斯也能松口气了。

各方面都最强才叫AGI，实现还要5 - 10年

哈萨比斯表示，谷歌仍在追求做「各方面都最强」的模型，在他看来，这才是真正的通用模型，也是通向通用人工智能（AGI）系统的关键组成部分。从之前的版本到Gemini 3，谷歌一直在弥补Gemini模型的短板，提升其编程、推理、数学等能力。

此次Gemini 3在2.5版本基础上迭代，一方面升级基础能力，另一方面巩固多模态领域的优势。哈萨比斯认为未来AI的技术路线会趋于收敛，拥有通用、全能的基础模型是关键。

除Gemini 3 Pro外，Gemini模型家族的其他成员也在打磨中，待这些模型就位后，谷歌将在产品分层服务上提供更大灵活性，即更强性能、更低价格。正如哈萨比斯所说：「大方向是每一代新模型，都要在整体能力上更强，同时所需算力更便宜、更高效，带来更有竞争力的价格和更低的时延」。

目前，哈萨比斯在世界模型研究上投入大量时间，他认为这是通往AGI的关键组件，未来世界模型也将迎来类似ChatGPT的「爆发时刻」。但最大挑战是推理/服务成本，以及解决在更长时间尺度上保持世界一致性等关键难题，才能实现真正的「破圈」。

哈萨比斯称，目前世界模型已有一些内部用例，如训练其他智能体、机器人系统等，未来可能会出现很酷的外部应用场景。他仍坚持对通用人工智能（AGI）时间表的预测，认为距离完全实现AGI还有五到十年，Gemini 3将成为打造更强大AI的重要平台，还需在现有模型不断变强的基础上取得一两次关键性突破。

在通往AGI的路上，哈萨比斯也有算力焦虑。他坦言「即便将现在全世界的算力加在一起，也不够满足我们想做的所有事情」。因此，需要在不同项目间衡量算力投入的回报，如研究收益、新产品探索价值或直接收入等。

除追求AGI外，哈萨比斯还带领DeepMind在AlphaEvolve等科学领域进一步拓展。

穿越AI泡沫的底气

谈到AI泡沫，哈萨比斯总体比较乐观，但认为仍存在一定泡沫。他说：「那些几乎没什么的项目，种子轮估值就能到几十亿美元，这在逻辑上有点行不通。」对比这些泡沫，他认为谷歌的处境很好。

就DeepMind而言，既有扎实营收，又承担着谷歌「AI动力舱」的重任；既有Gemini模型及App，还有基于Gemini的NotebookLM等AI优先产品。哈萨比斯表示，目前AI已在谷歌现有业务中带来显著回报，正在为搜索、YouTube、云等业务「加功率」。

作为DeepMind的联合创始人，哈萨比斯12年前选择与谷歌「联手」时，就考量过双方合作的价值：谷歌可提供海量算力资源，其产品也天然适合用AI增强。目前，这条路正逐步成为现实。在哈萨比斯看来，谷歌与DeepMind的结合，让谷歌在AI竞争中处于有利位置，使其有机会穿越泡沫，笑到最后。

参考资料：

https://sources.news/p/demis - hassibas - on - gemini - 3 - world?r = 1r85f%20

https://www.wired.com/story/google - launches - gemini - 3 - ai - bubble - search/

本文来自微信公众号“新智元”，作者：新智元，编辑：元宇，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

千年运河邂逅千年妈祖：莆田与常州的双向奔赴

7部门发文：茧丝绸产业目标3000亿！

小河之约 | 陈铭：人生弯路守恒，当下避开后续仍需经历

挑战摩尔定律极限：氮化镓3DIC混合集成开辟增长新路径

一觉醒来局势大变：美股暴跌，原因众说纷纭

项目推荐

康小虎 · 健康小屋

毛加健康

康老板 · 氧疗堂