谷歌发布了“最强AI模型”Gemini 2.0,大举下注人工智能代理

02-07 09:58

二月六日,美国当地时间星期三,谷歌发布了Geminini 根据官方的描述,这是迄今为止最强大的AI模型套件,并向所有人开放。



谷歌在2024年12月向一些开发者和测试人员提供了Gemini。 2.0的访问限制将部分功能集成到谷歌的产品中,但这一次“全面发布”代表了谷歌AI可以通过所有新模型。 Studio和Gemini API供开发者使用。


Gemini 2.0模型套件包含多个版本,其中:



Gemini 2.0系列模型


  • Gemini 2.0 Flash被称为“高效的工作模式”,适用于处理大规模、高频率的任务,目前已经在AI中。 Studio和Vertex AI上线,并全面向开发者开放;
  • Gemini 2.0 Pro 在编码和数学相关任务中,Experimental提供了“更好的事实准确性”和“更强的性能”。它被描述为谷歌“迄今为止最强大的模型”,现在已经在AI上了 Studio和Vertex 面向Gemini高级用户的AI上线。
  • Gemini 2.0 Flash-Lite是谷歌推出的“最具成本效率的模型”。这个模型的速度和价格是1.5。 Flash相当,但是在“大多数基准测试中表现更好”,有100万个tokens前后文窗口和多模式输入。


和Gemini一起 1.5相比,Gemini 在一系列基准测试中,2.0系列模型的性能显著提高


就价格而言,Gemini Flash的收费标准是每百万个Token Geminini10元 Flash-Lite更具成本效率,每百万个Token只收费0.75元。Token是指模型处理的每一个数据单元,包括文本、图像和视频输入。



Gemini 2.0 Flash和2.0 Flash-进一步降低Lite的成本


谷歌在2024年12月的博客中提到:“在过去的一年里,我们一直在开发更智能的模型。这些模型可以更好地了解周围的世界,进行多步推理,在客户的监督下独立完成任务。Gemini 2.0具有更强的多模态能力,例如支持图像和音频输出,并具有使用原始工具的能力。该系列模型将帮助谷歌建立一个新的AI智能体,并逐步实现通用助手的愿景。”


这次发布是谷歌加强AI智能体投资的一部分。随着AI领域竞争的加剧,谷歌继续努力推动“虚拟代理”AI。Meta、同时,亚马逊、微软、OpenAI和Anthropic等公司也致力于开发AI系统,可以替代客户完成复杂的多步任务。


Anthropic于2024年10月宣布,AI智能体可以像人类一样操作计算机,完成数百步的复杂任务,该系统可以通过任何软件解读屏幕上的内容,点击按钮,输入文本,浏览网站。


最近OpenAI也推出了类似的“Operator“功能,可以自动完成计划假期、填写表格、预订餐厅等任务。OpenAI将“Operator它被称为“能够上网为你完成任务的智能体”。


另外,OpenAI还推出了“Deep Research“功能可以帮助AI智能系统编写复杂的研究报告,分析用户选择的主题。2024年12月,谷歌还推出了同名工具Deep。 作为“研究助手”,Research帮助用户探索复杂的主题并编译报告。


据悉,谷歌计划在2025年初推出更多AI功能。他的首席执行官桑达尔·皮查伊在一次战略会议上说:“在历史上,你不必是第一个,但你必须是最好的。这是我们2025年的目标。”


本文来源于“腾讯科技”,编译:金鹿,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com