ChatGPT图像功能迎重大升级：生成更快更精准，直面谷歌与Photoshop竞争

2025-12-19

OpenAI对ChatGPT的图像功能进行了升级，新功能在图像生成的速度与精准度上均有提升，同时向谷歌的相关模型及Photoshop发起挑战。

OpenAI与谷歌这两大全球顶尖AI应用之间的竞争，再次进入新的阶段。

北京时间周三凌晨，OpenAI正式发布了新版ChatGPT图像功能。此次升级不仅让图像生成的质量更优、速度更快，在图像编辑的精确性方面也取得了显著进步。这意味着OpenAI不仅对谷歌广受好评的Nano Banana系列模型展开回击，还对Photoshop的市场地位造成了冲击。

据OpenAI介绍，基于最新旗舰图像生成模型打造的“ChatGPT图像”功能，能够在保证细节完整的前提下实现精准编辑，更有机会呈现出用户期望的效果。在保持细节完整的同时进行精准编辑，生成速度最多可提升4倍。

当然，图像生成模型的实际效果，还是要通过图像来展示。

作为此次升级的核心亮点，OpenAI表示，新模型在多种类型的精准编辑上表现出色，包括添加、删除、合并、混合以及转置等操作，在完成修图的同时还能保留图片原有的特色。

比如，下面是ChatGPT新图像模型生成的90年代末洛杉矶街头摄影（演示版本）。

→将人物的衬衫换成红色，帽子改成黄色，限速标识调整为15，把卡车换成消防车；

→在画面左侧添加一群围观的人，右侧人行道上停着一只鹰，远处天空中有一艘飞船飞过；

→带有该图像全包印花的T恤挂在晾衣绳上；

→把那件T恤穿到滑板手身上。

在AI生成图像的重要应用领域，ChatGPT图像功能在对现有图片进行创造性改造方面也有所突破。例如，可以将公司CEO奥尔特曼的个人照片，转化为美国80年代的健美操教练形象，或者把他的脸融入世界名画《戴珍珠耳环的少女》之中。

此外，ChatGPT还向谷歌的传统优势领域——生成包含丰富文字信息的示意图发起了挑战。OpenAI称，该模型在文本呈现方面有了进一步提升，能够处理更密集、字号更小的文字。

不过需要注意的是，尽管ChatGPT在生成英文字体时已经能够达到以假乱真的程度，但官方也承认，这个新模型在生成中文、阿拉伯语、希伯来语文字方面仍存在一定的局限性。

所以，至少在中文文字图像生成这一领域，Nano Banana依旧是远超ChatGPT的存在。

值得一提的是，新的图像生成模型不仅性能更强，价格也更实惠。和GPT Image 1相比，升级后的GPT Image 1.5在图像输入和输出的成本上都降低了20%。

本文来源为微信公众号“科创日报”，作者是史正丞，经36氪授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com