全面屠榜,谷歌最强编程模型提前释放,滚压Claude 3.7

05-09 10:53

AI编程1419.95分登顶,Gemini 2.5 Pro“I/O版本性能飙升,视频理解能力“绝世”。



谷歌历史上最好的编程模式来了!


北京时间5月6日晚,智东西5月7日消息,谷歌DeepMind Gemininini正式推出AI研究部门 2.5 Pro “I/O“特别版,回应开发者社区对实际编程和界面设计效率的强烈需求,提前为全球用户“尝鲜”。


WebDev Arena 根据Leaderboard基准测试的最新名单,谷歌自2022年底ChatGPT爆炸式AI竞赛以来,首次在关键编程基准测试中超越Claude,实现了全面领先。“新模型号”Gemini-2.5-pro-preview-05-06已经取代了03-25版本,目前可以使用Geminini。 API、Vertex AI、AI 通过Gemini聊天机器人应用感受,Studio平台可以获得。




Imarenarena的数据来源.AI


Gemininini新模型定价 2.5 与Anthropic的Claudeen相比,Pro模型相同,每百万token的输入输出费用分别为1.25美元和10美元(约合9元和72元)(支持20万token前后文)。 3.7 Sonnet模型3美元和15美元(约合22元和108元)更具成本效益。


戴密斯·哈萨比斯谷歌DeepMindCEO(Demis Hassabis)“我们到目前为止所构建的最强编程模型”在海外社交媒体X平台上大受好评。



01.编程能力首次超过Claude,AI编程“头把交椅”或将易主


这一次,特别模型是Geminini,3月份发布的热门模型。 2.5 新版本的Pro升级,谷歌Gemini LoganAPI高级产品经理 Kilpatrick在技术博客中确定,这次升级的重点是提高函数调用功能,降低错误率,提高触发可靠性。根据谷歌博客的内容,Gemini 2.5 Pro“I/O“特殊版本在编程和构建互动网页应用方面具有“显著”的优势,在代码转换(即修改代码以实现特定目标)等任务方面也有更好的表现。



来自WebDev的数据来源 Arena Leaderboard


Geminiini在博客文章中提到。 2.5 Pro“I/O“WebDevDev特别版 Arena Leaderboard基准测试(测量网页应用程序的美观和功能)的性能。在最新排名中,Gemini 2.5 Pro Preview 以1419.95分超过Claudede(05-06) 3.7 Sonnet(1357.10分)登顶,与上一代03-25版1272.96分相比,新版完成了146.99分的提升。


谷歌DeepMindCEO哈萨比斯对此非常自豪,还狠狠地“凡尔赛”了一番:



此外,本次升级最突出的能力是根据单篇文本提醒生成完整的互动网页应用或模拟程序。根据Gemini应用中的演示,用户可以直接将视觉图案或主题提醒转换为可用代码,从而大大降低设计导向开发者的入门门槛。



02.视频理解超强,视觉基准测试领先。


Gemini 2.5 Pro“I/O“特别版本在视频理解方面也具有超高的性能,谷歌在其博客中表示,该版本在VideoMME基准测试中获得84.8%的分数,占据第一位。根据谷歌官方博客的说法,该模型还驱动了Canvas画板等Gemini移动应用的主要功能。



Imarenarena的数据来源.AI


Gemini 在95等应用程序中,新模型可以自动统一视觉元素的风格匹配。其工作流支持将YouTube视频转换为功能齐全的学习应用程序,可以快速生成响应视频播放器、动态听写界面等高风格部件,几乎不需要手动编写CSS代码。


03.结论:谷歌Gemini模型,转变为实用生产力工具


CursorAI编程工具公司首席执行官Michael Truell透露,内部测试显示Geminini 2.5 Pro“I/O“特殊版本的工具调用失败率明显下降。现在Cursor已经将Geminini 2.5 将Pro集成到它的code agent系统。


Michelelelelelelit代码托管平台企业总裁 Catasta还评价这个模型是“最先进的平衡性能和延迟模型”。


虽然谷歌没有公开Geminini 2.5 Pro的结构细节,但其核心目标始终是提供更快、更直观的开发体验。加强代码生成和多模态输入的优点,Gemini 2.5 从研究创新到解决实际编程挑战的生产力工具,Pro正在转变。这次提前发布,让谷歌DeepMind在重大会议之前更清楚地满足开发者的需求,保持市场势头。


本文来自微信微信官方账号的“智东西”(ID:zhidxcom),作家:王涵,编辑:漠影,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com