36个月大逆转:谷歌AI携Gemini 3回归,迈向世界模型新征程

2025-11-22

自ChatGPT发布已过去近36个月,面对OpenAI的领先优势,哈萨比斯引领谷歌AI展开全面反攻,凭借新发布的Gemini 3强势回归。Gemini 3在LM Arena等多个模型榜单上登顶,表现超越GPT - 5及其他模型,实现了一场完美逆袭。

大模型排行榜竞争激烈,你方唱罢我登场。

马斯克的Grok 4.1刚登顶不久,就被Gemini 3 Pro反超,上演了AI版的「速度与激情」!

谷歌DeepMind CEO哈萨比斯(Demis Hassabis)在X平台上兴奋地晒出Gemini 3的优异成绩,称其「理所当然地」登顶各大排行榜,并表示这是他迄今为止最喜爱的模型。

就连奥特曼和马斯克,也纷纷为Gemini 3点赞。

马斯克连发两个哭泣的表情包,称:看来我们要尽快推Grok 4.2了。

新发布的Gemini 3具备领先的推理、多媒体处理和编码能力,擅长推理、生成视频和编写代码。谷歌强调,Gemini 3不只是一个更聪明的模型或聊天机器人,更重要的是,从发布之日起,它就开始全面增强谷歌现有产品,包括利润可观的搜索业务。它是谷歌这台庞大赚钱机器的AI引擎,用哈萨比斯的话说:「我们是谷歌的动力引擎,现在我们正在让AI全面接入」。

哈萨比斯认为目前可能存在AI泡沫问题,比如许多未经检验的初创公司却获得了数十亿美元的估值。但在他看来,即便AI泡沫破裂,Gemini 3也让谷歌有了穿越这场泡沫的底气。

把Google搜索塞进Gemini

谷歌内部一直有把Google搜索「塞」进Gemini的想法,这一想法甚至可追溯到谷歌早期。当时的Larry Page和Sergey Brin就设想过把整个互联网放进AI的「记忆」中,然后对外提供服务。为此,谷歌在上下文方面做了大量实验,将上下文窗口提升到100万个token,目前该记录仍未被打破。

哈萨比斯认为,机器理论上可拥有比人类多几百万倍的存储/记忆空间,但简单地暴力存储所有东西并不高效。因此,与将Google搜索「塞」进Gemini相比,谷歌更多是把Gemini作为现有产品的底层模型向用户开放。

此次Gemini 3发布后,谷歌已通过Gemini应用以及Google搜索中的AI Overviews功能向用户开放。据谷歌母公司Alphabet在7月的季度财报显示,AI Overviews推动搜索查询量提升了10%,同时,谷歌视觉搜索出现了70%的激增,该功能依赖于Gemini对照片的分析能力。

与OpenAI相比,谷歌的优势在于其产品「家底」深厚,拥有搜索、Google地图、Gmail、云服务等广泛的基础产品线,且很早就开始利用AI增强已有产品的能力,这使其在与OpenAI、xAI、Anthropic等AI厂商的竞争中进退自如。哈萨比斯表示,「在不利情况下,我们会更依靠这些基础产品;在有利情况下,我们拥有最全面的布局和最具前瞻性的研究。」

谷歌还考虑通过Gemini重启谷歌眼镜(Google Glass)项目。哈萨比斯称,当时谷歌眼镜步子迈得超前,缺少真正的「杀手级用例」,而通用助手正是这样一个用例。未来,Gemini将激活谷歌以往积累的「经验和遗产」,重点放在「世界理解」上。

以Gemini为例,谷歌一开始就将机器人和眼镜视为重要应用场景,因此选择走多模态路线。如今,这些押注逐渐显现成果,Gemini在多模态理解上优势明显。

除增强现有和以往产品外,谷歌还积极利用AI打造受欢迎的新工具,如NotebookLM可根据文字材料自动生成播客,AI Studio能借助AI快速生成应用原型等。此外,谷歌还探索将技术应用到游戏、机器人等领域。

哈萨比斯提到谷歌AI的一个优势,目前所有产品已完全基于Gemini技术栈运行,实现了从产品到模型的「一体化」。这意味着产品改动和模型微调更易进行,产品也能更好地理解和使用底层模型。

目前,哈萨比斯一半精力用于加速做强Gemini应用,另一半用于将AI融入谷歌各业务线,使其成为谷歌的「AI动力舱」。他表示:「我对这一切非常兴奋,目前我们只是刚刚触及未来可能性的表面,明年会更直观地看到这些变化」。

被OpenAI「抢跑」后,谷歌正快速赶上

谷歌在AI领域长期投入大量资源,取得了一系列关键突破。2017年,谷歌发现了Transformer模型架构,但未将其商业化,而是选择公开。直到2022年,OpenAI基于Transformer的ChatGPT爆火,动摇了谷歌的核心搜索业务,谷歌才开始奋起直追。

有意思的是,OpenAI的崛起不仅唤醒了谷歌在AI领域的加速发展,还间接帮助谷歌避免了被分拆、出售搜索业务的命运。如今,谷歌的搜索业务不仅未被OpenAI等AI新势力颠覆,其AI模型还实现了反超。

与Gemini 3相比,OpenAI在8月发布的GPT - 5令人失望,一些评论者认为它「表现平平」,用户也抱怨其风格变得更正式。据谷歌称,Gemini 3在LM Arena等多个模型榜单上表现优于GPT - 5及其他模型,尤其在模拟推理和长时间规划方面表现更佳,有助于提升依赖工具或互联网的AI智能体的实际能力。

在早期的AI竞赛中经历波折后,谷歌渐入佳境。从用户活跃度看,Gemini应用的月活用户已超6.5亿,仅次于ChatGPT的7 - 8亿周活用户(换算成月活可能超10亿)。每月超20亿人通过搜索里的AI Overviews使用Gemini,约1300万开发者在自己的产品中集成了Gemini。这些数字表明谷歌正逐渐缩小与OpenAI在AI领域的差距,作为谷歌AI总负责人的哈萨比斯也能松口气了。

各方面都最强才叫AGI,实现还要5 - 10年

哈萨比斯表示,谷歌仍在追求做「各方面都最强」的模型,在他看来,这才是真正的通用模型,也是通向通用人工智能(AGI)系统的关键组成部分。从之前的版本到Gemini 3,谷歌一直在弥补Gemini模型的短板,提升其编程、推理、数学等能力。

此次Gemini 3在2.5版本基础上迭代,一方面升级基础能力,另一方面巩固多模态领域的优势。哈萨比斯认为未来AI的技术路线会趋于收敛,拥有通用、全能的基础模型是关键。

除Gemini 3 Pro外,Gemini模型家族的其他成员也在打磨中,待这些模型就位后,谷歌将在产品分层服务上提供更大灵活性,即更强性能、更低价格。正如哈萨比斯所说:「大方向是每一代新模型,都要在整体能力上更强,同时所需算力更便宜、更高效,带来更有竞争力的价格和更低的时延」。

目前,哈萨比斯在世界模型研究上投入大量时间,他认为这是通往AGI的关键组件,未来世界模型也将迎来类似ChatGPT的「爆发时刻」。但最大挑战是推理/服务成本,以及解决在更长时间尺度上保持世界一致性等关键难题,才能实现真正的「破圈」。

哈萨比斯称,目前世界模型已有一些内部用例,如训练其他智能体、机器人系统等,未来可能会出现很酷的外部应用场景。他仍坚持对通用人工智能(AGI)时间表的预测,认为距离完全实现AGI还有五到十年,Gemini 3将成为打造更强大AI的重要平台,还需在现有模型不断变强的基础上取得一两次关键性突破。

在通往AGI的路上,哈萨比斯也有算力焦虑。他坦言「即便将现在全世界的算力加在一起,也不够满足我们想做的所有事情」。因此,需要在不同项目间衡量算力投入的回报,如研究收益、新产品探索价值或直接收入等。

除追求AGI外,哈萨比斯还带领DeepMind在AlphaEvolve等科学领域进一步拓展。

穿越AI泡沫的底气

谈到AI泡沫,哈萨比斯总体比较乐观,但认为仍存在一定泡沫。他说:「那些几乎没什么的项目,种子轮估值就能到几十亿美元,这在逻辑上有点行不通。」对比这些泡沫,他认为谷歌的处境很好。

就DeepMind而言,既有扎实营收,又承担着谷歌「AI动力舱」的重任;既有Gemini模型及App,还有基于Gemini的NotebookLM等AI优先产品。哈萨比斯表示,目前AI已在谷歌现有业务中带来显著回报,正在为搜索、YouTube、云等业务「加功率」。

作为DeepMind的联合创始人,哈萨比斯12年前选择与谷歌「联手」时,就考量过双方合作的价值:谷歌可提供海量算力资源,其产品也天然适合用AI增强。目前,这条路正逐步成为现实。在哈萨比斯看来,谷歌与DeepMind的结合,让谷歌在AI竞争中处于有利位置,使其有机会穿越泡沫,笑到最后。

参考资料:

https://sources.news/p/demis - hassibas - on - gemini - 3 - world?r = 1r85f%20

https://www.wired.com/story/google - launches - gemini - 3 - ai - bubble - search/

本文来自微信公众号“新智元”,作者:新智元,编辑:元宇,36氪经授权发布。

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com