同一天，OpenAI和Google的地震级更新：世界上的夜晚，AGI 临近

2025-04-02

明天AI新星是谁？

Google想要在2024年重新获得AI场景，但是它总是被OpenAI打乱。

OpenAI每次宣布某一天开会，都会提前发布更强大的产品。这让Google的AI产品发布会每次都特别尴尬。

Google在2025年学会了聪明，发布AI商品不再大张旗鼓，而是偷偷滴水直接上线。今天晚上没有任何热身，Google直接推出Geminini 2.5 Pro模型。

在GPT4.5和Grok3之间，这是一个可以推理的混合模型。，最大的特点就是能够模仿人类的快慢思考，这难道不堪比GPT-5前奏吗？而且它就这样悄悄地上线了。

OpenAI在推特上宣布，当所有人都认为它将属于Google时：

早上11点，太平洋时间直播。最终，GPT-4oo发布了OpenAI image generation，生成图像技术模型。

它具有与人类摄影相当的绘画质量、自由的构图和细节处理、非凡的图形理解、任何图形中文字和LOGO的特点，也在X上引起了欢呼。

深夜2点多，鲸哥还没有睡觉，看见朋友圈里有很多人发北京地震。所以我写了这样一个朋友圈：

我没有感觉到北京的地震，但此时此刻，Google和OpenAI之间的竞争正在震惊。熟睡的普通大众不知道在这个夜晚，在通向AGI。人类在路上又跃进了一大步！

无意睡眠，向AGI迈进一大步

Gemini 2.5爆裂出场，第一类人模型

Gemini 2.5 Pro 这次试验版非常爆裂，Gemini 2.5 声称能处理更复杂的编程、科学和数学问题，并且支持更具情感感知能力的智能体。

这一新的“思维模式” LMArena 在数学、科学和编码基准测试中，以显著的优势领先，战胜了 DeepSeek-R1、Grok 3 和 Claude 3.7。而且几乎全面优于OPenAI家族的两个模型-o3-mini和GPT4。.5。

Gemini 2.5 Pro 现在在竞技排行榜上排名第一——这是历史上最大的成就弹跳(比较 Grok-3/GPT-4.5 高出 40 分）。

配置100 万 token 前后文(即将推出 200 万)，能处理多模态数据，并经过。 vibe coding 认证可以只通过一个提醒来构建整个游戏。这就是Gemini。 2.5 神奇之处。

更为重要的是，当你向Gemini的时候。 2.5 提问时，会在回答前通过思考进行推理，模仿人类处理思想的方式——逐渐接近问题，细化潜在解决方案，选择最佳解决方案。

鲸哥测试生成了“近三年国内销售KOL的动态演示页面”，2.5 相关代码是由Pro快速生成的。

Google也需要在这里提到 AI的亮眼优势在于，他可以调用以前的。 Flash Google系统工具，如分析YouTube视频，输出内容到Docs等，已经融合了2.0。这波代码演示，生成后也直接调用Colab演示。

以下是2.5 Pro 主播的热门动态演示效果侧重于从代码到生成的过程，并没有体现内容的准确性，但整体可以参考。毕竟2023年的小杨哥还没出事，是直播卖货领域的绝对兄弟。

与此同时，我们测试了2.5。 Pro深度推理能力要求其生成具体的智能报告。这份报告不是一个非常空洞和不可用的内容，而是一个可读的内容。

OpenAI杀死摄像师

第一张图片足以震撼OpenAI展示的官方案例AI生图。

如果你不知道，恐怕没有人能猜到这张图是AI产生的。毕竟反射图片和密集的文字都在说AI不可能这么精彩！

但是实际上，这就是4o生成的AI照片，OpenAI发布的提示如下。

这是用手机拍摄的玻璃白板的广角图像，拍摄地点是俯瞰海湾大桥的房间。从视线中可以看出，一位女士正在写作，她穿着一件印有大印象的衣服。 OpenAI 标识的 T t恤。字迹看起来很自然，但是有点乱，我们可以看到摄影师的倒影。

更加神奇的是，第二张图片转向人物方向，生成的图像仍然没有破绽，也放出来震撼大家。

假如你没有GPT Plus，然后，使用GPT免费图片生成功能实际上可以杀死大多数文化图片产品。这是鲸哥直接用上面同样的提示产生的照片。

与此同时，鲸哥还使用Google。 2.0 同样的图片生成了Flash模型，同样的提示词。能看到Google不太有美感，手部细节也崩溃了。

但是OpenAI是否为官网案例特别调整，以后还要全量上线模型，大家长期检测。

另外，4o的图像生成指令也足够强大，很多系统都在处理大约。 5-8 一个目标会遇到困难， GPT‑4o 多达可处理 10-20 一个不同的目标。下图是4o在同一张图片上生成了16个物体，每个物体都准确地生成了客户所表达的内容，Amazing！

当但是，对于Google来说， 2.0 Flash的图片编辑能力，4o也不在话下。可谓精确狙击Google刚刚火出圈的图片编辑能力。

我们是否即将接近AGI？

从今天开始，OpenAI同时宣布，ChatGPT 和 Sora 的所有 Plus、Pro、Team 和 Free 顾客可以开始使用4o。图像功能。

“山姆奥特曼说，”ChatGPT 新版本的图像还在推出中，所以如果今天没有得到好的图像，请稍后再试一次。 ”。应该意味着多模态模型和产品端结合将继续整合。

有网友评论说，4o图像功能超过了数百家AI图像企业。事实上，即使是一些影像工作的工作，如拍摄和设计师，也不会得到保证。

对于谷歌来说，谷歌席卷的各种基准测试证实了他的实力。在实践中，应该快速回答的问题很快就会得到回答，需要深入推理的问题也会很快实现。一份报告和一个游戏的生成基本不到60秒。

鲸哥对自己的速度感到惊讶，对这个组合模型带来的体验感到更加惊讶。不会再有简单的问题，AI也会去深度推理。当然，2.5不能生成图片。也许下一步3.0就会带来这种能力。

在Anthropic之前，Google这波拉响了硅谷的AI军备竞赛。 CEO表示，还有更高的模型没有发布，预计最近会发布，以避免Claude。 3.7不能保持领先。而且OpenAI在GPT中在4.5新闻发布会上，山姆奥特曼没有出现，这可能意味着新模型也将在最近发布。

在OpenAI和Google对战的主角戏中，没想到埃隆马斯克最着急。他在X上发了很多内容，说明Grok是一个更好的模型。

当马斯克发布这张照片时，他说：这是一个非常重要的区别，讽刺其他模型撒谎，追求政治正确，而Grok追求真理。

今晚马斯克的出现，为这场比赛增添了趣味性。

就在DeepSeek Google和OpenAI在V3刚刚收回的招牌中展现出了强大的竞争力，而且每个人都在互相追逐，进一步提升了AGI的梦想。

或许在不远处的某个夜晚，AGI就会突然到来！

本文来自微信公众号“鲸选AI”，作者：杨晓鹤，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

西式快餐市场大爆发市场规模接近3000亿

"不穿校服就能买到"！许多中学生沉迷于此...

突发事件！早上连续发生两次地震，超过25万人接到预警！北京、天津等地震明显

刷新上海记录！造血干细胞捐献每周8例，“ “00后”成为第700名捐献者

2024年，华润万象生活股东将获得36.29亿元的利润，同比增长23.9%