Gemini 2.0 来了,只做三件事:智能体、智能体、智能体。

2024-12-13

一般来说,“带货直播”有两个常见的槽点:一是磨蹭太久,看官的注意力被其他地方带走;第二,快乐地装载货物,卡住发货。不幸的是,OpenAI 全赶上了。


当 OpenAI 还在耍宝一样“老铁快看我多美”持续12天的新闻发布会呢,Google 悄悄地,鸡贼地出现了 Gemini 2.0-一个被它 CEO 劈柴被称为“新智能体时代的下一代模型”



它的所有关键特征都集中在可以带来的地方。真正可用的新一代智能体以上:根据目前发布的信息,在搜索、浏览器、学术研究、代码开发甚至游戏助手的场景中,智能体的使用体验将被提供 Gemini 2.0 重塑升级。



Gemini 2.0 的 Flash(轻便快速的尺寸) 从今天开始,体验版已经开放给全部。 Gemini 客户,立等可用;最新的 Deep Research 所有的Gemini也已经对所有的Gemini了 Advanced 客户开放(这个功能类似于研究学术助手,可以帮助个人分析和理解复杂的研究项目,并撰写调查报告。)-我吸取了之前的教训,终于不用因为“画饼送期货”而被吐槽了。



其它将于明年年初推出的新功能智能体,还真有那么多有趣的东西:


Project Astra 升级版:生活更加生活


(我们想念的是它吗?每次我们想念的事情都展示出来。 Astra 新眼镜全部出现~)


Project Astra 是在今年 I/O 大会上推出的多模态智能体应用,你可能还记得当时那段时间。 Deepmind 伦敦办公室利用其翻东西的惊艳宣传片。基于 Gemini 2.0 的 Project Astra 将被赋予更强的升级:



- 新版 Project Astra 能够听懂多种语言与混合语言的对话,对于不同的口音和生僻字也比较宽容(你看,虽然你讨厌中英混杂,但别人却很讨厌。 AI 就很大度);


- 能够调用 Google Search、Google Lens 和 Google Maps,让这个助手的价值在日常生活中更频繁。在演示视频中,有典型的查询门禁密码、查询洗涤标签和洗衣机功能挡位、骑行时实时查询店铺和街景信息等。



- 新的 Project Astra 最多能记住将近 10 分钟对话内容(这个已经比开会时的我强多了);


- 能理解人类对话中的延迟(嗯...嘿...那个...对吗...非常适合理解相声...)


Project Mariner:牛马更牛马


Project Mariner 是个 Gemini 2.0 下面的新玩意,一个在在浏览场景中提供互动的新功能——它的理解和互动范围涵盖了像素、图像、文字、表格和代码等。在浏览器页面(是浏览器,不是单个网页)中。使用Chrome 扩展程序来实现。



在一个真实的世界网页任务功能测试中,针对智能体在端到端。(WebVoyager 检测),Project Mariner 完成了 83.5% 工作效率,属于当前最先进的水平。


还正是因为这些更复杂的任务在浏览器场景中,可能的风险因素,如个人隐私、交易安全等,Google 发送时也承认:检测中的 Project Mariner 仍然处于速度慢、精确度不理想的初始状态。


Jules:代码更智能


另一个 Gemini 2.0 带来的新东西,一个能带来的直接集成到 GitHub 工作流之中的 AI 代码智能体。


游戏助手:小白玩得更高。


Google 还称,运用 Gemini 2.0 构建了一种“游戏助手”智能体,按游戏进度进行对战况进行实时分析,做出决策建议。她们正与一些大型游戏开发商合作,目前测试中的著名游戏,如《部落冲突》、《海岛奇兵》等。




乐观地认为,当初如果有这样的玩意,我的联盟小猎人也不会被三季稻老师杀死那么多次…


根据公开信中劈柴的说法,“假如说 Gemini 1.0 就是整合和理解信息, Gemini 2.0 能使信息更有用。"如果可以的话,那样会让我对这个被子 AI 命名时代更加自信


本文来自微信微信官方账号“果核”,作者:卧虫,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com