同一天,OpenAI和Google的地震级更新:世界上的夜晚,AGI 临近

04-02 15:10

明天AI新星是谁?


Google想要在2024年重新获得AI场景,但是它总是被OpenAI打乱。


OpenAI每次宣布某一天开会,都会提前发布更强大的产品。这让Google的AI产品发布会每次都特别尴尬。


Google在2025年学会了聪明,发布AI商品不再大张旗鼓,而是偷偷滴水直接上线。今天晚上没有任何热身,Google直接推出Geminini 2.5 Pro模型。


在GPT4.5和Grok3之间,这是一个可以推理的混合模型。 ,最大的特点就是能够模仿人类的快慢思考,这难道不堪比GPT-5前奏吗?而且它就这样悄悄地上线了。



OpenAI在推特上宣布,当所有人都认为它将属于Google时:


早上11点,太平洋时间直播。最终,GPT-4oo发布了OpenAI image generation,生成图像技术模型。


它具有与人类摄影相当的绘画质量、自由的构图和细节处理、非凡的图形理解、任何图形中文字和LOGO的特点,也在X上引起了欢呼。


深夜2点多,鲸哥还没有睡觉,看见朋友圈里有很多人发北京地震。所以我写了这样一个朋友圈:


我没有感觉到北京的地震,但此时此刻,Google和OpenAI之间的竞争正在震惊。熟睡的普通大众不知道在这个夜晚,在通向AGI。 人类在路上又跃进了一大步!



无意睡眠,向AGI迈进一大步


Gemini 2.5爆裂出场,第一类人模型

Gemini 2.5 Pro 这次试验版非常爆裂,Gemini 2.5 声称能处理更复杂的编程、科学和数学问题,并且支持更具情感感知能力的智能体。


这一新的“思维模式” LMArena 在数学、科学和编码基准测试中,以显著的优势领先,战胜了 DeepSeek-R1、Grok 3 和 Claude 3.7。而且几乎全面优于OPenAI家族的两个模型-o3-mini和GPT4。.5。



Gemini 2.5 Pro 现在在竞技排行榜上排名第一——这是历史上最大的成就弹跳(比较 Grok-3/GPT-4.5 高出 40 分)。


配置100 万 token 前后文(即将推出 200 万),能处理多模态数据,并经过。 vibe coding 认证可以只通过一个提醒来构建整个游戏。这就是Gemini。 2.5 神奇之处。



更为重要的是,当你向Gemini的时候。 2.5 提问时,会在回答前通过思考进行推理,模仿人类处理思想的方式——逐渐接近问题,细化潜在解决方案,选择最佳解决方案。


鲸哥测试生成了“近三年国内销售KOL的动态演示页面”,2.5 相关代码是由Pro快速生成的。


Google也需要在这里提到 AI的亮眼优势在于,他可以调用以前的。 Flash Google系统工具,如分析YouTube视频,输出内容到Docs等,已经融合了2.0。这波代码演示,生成后也直接调用Colab演示。


以下是2.5 Pro 主播的热门动态演示效果侧重于从代码到生成的过程,并没有体现内容的准确性,但整体可以参考。毕竟2023年的小杨哥还没出事,是直播卖货领域的绝对兄弟。



与此同时,我们测试了2.5。 Pro深度推理能力要求其生成具体的智能报告。这份报告不是一个非常空洞和不可用的内容,而是一个可读的内容。



OpenAI杀死摄像师

第一张图片足以震撼OpenAI展示的官方案例AI生图。



如果你不知道,恐怕没有人能猜到这张图是AI产生的。毕竟反射图片和密集的文字都在说AI不可能这么精彩!


但是实际上,这就是4o生成的AI照片,OpenAI发布的提示如下 。


这是用手机拍摄的玻璃白板的广角图像,拍摄地点是俯瞰海湾大桥的房间。从视线中可以看出,一位女士正在写作,她穿着一件印有大印象的衣服。 OpenAI 标识的 T t恤。字迹看起来很自然,但是有点乱,我们可以看到摄影师的倒影。



更加神奇的是,第二张图片转向人物方向,生成的图像仍然没有破绽,也放出来震撼大家。



假如你没有GPT Plus,然后,使用GPT免费图片生成功能实际上可以杀死大多数文化图片产品。这是鲸哥直接用上面同样的提示产生的照片。



与此同时,鲸哥还使用Google。 2.0 同样的图片生成了Flash模型,同样的提示词。能看到Google不太有美感,手部细节也崩溃了。



但是OpenAI是否为官网案例特别调整,以后还要全量上线模型,大家长期检测。


另外,4o的图像生成指令也足够强大,很多系统都在处理大约。 5-8 一个目标会遇到困难, GPT‑4o 多达可处理 10-20 一个不同的目标。下图是4o在同一张图片上生成了16个物体,每个物体都准确地生成了客户所表达的内容,Amazing!



当 但是,对于Google来说, 2.0 Flash的图片编辑能力,4o也不在话下。可谓精确狙击Google刚刚火出圈的图片编辑能力。



我们是否即将接近AGI?

从今天开始,OpenAI同时宣布,ChatGPT 和 Sora 的所有 Plus、Pro、Team 和 Free 顾客可以开始使用4o。 图像功能。


“山姆奥特曼说,”ChatGPT 新版本的图像还在推出中,所以如果今天没有得到好的图像,请稍后再试一次。 ”。应该意味着多模态模型和产品端结合将继续整合。


有网友评论说,4o图像功能超过了数百家AI图像企业。事实上,即使是一些影像工作的工作,如拍摄和设计师,也不会得到保证。



对于谷歌来说,谷歌席卷的各种基准测试证实了他的实力。在实践中,应该快速回答的问题很快就会得到回答,需要深入推理的问题也会很快实现。一份报告和一个游戏的生成基本不到60秒。


鲸哥对自己的速度感到惊讶,对这个组合模型带来的体验感到更加惊讶。不会再有简单的问题,AI也会去深度推理。当然,2.5不能生成图片。也许下一步3.0就会带来这种能力。


在Anthropic之前,Google这波拉响了硅谷的AI军备竞赛。 CEO表示,还有更高的模型没有发布,预计最近会发布,以避免Claude。 3.7不能保持领先。而且OpenAI在GPT中 在4.5新闻发布会上,山姆奥特曼没有出现,这可能意味着新模型也将在最近发布。


在OpenAI和Google对战的主角戏中,没想到埃隆马斯克最着急。他在X上发了很多内容,说明Grok是一个更好的模型。



当马斯克发布这张照片时,他说:这是一个非常重要的区别,讽刺其他模型撒谎,追求政治正确,而Grok追求真理。


今晚马斯克的出现,为这场比赛增添了趣味性。


就在DeepSeek Google和OpenAI在V3刚刚收回的招牌中展现出了强大的竞争力,而且每个人都在互相追逐,进一步提升了AGI的梦想。


或许在不远处的某个夜晚,AGI就会突然到来!


本文来自微信公众号“鲸选AI”,作者:杨晓鹤,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com