ChatGPT图像功能迎重大升级:生成更快更精准,直面谷歌与Photoshop竞争

2025-12-19
OpenAI对ChatGPT的图像功能进行了升级,新功能在图像生成的速度与精准度上均有提升,同时向谷歌的相关模型及Photoshop发起挑战。

OpenAI与谷歌这两大全球顶尖AI应用之间的竞争,再次进入新的阶段。


北京时间周三凌晨,OpenAI正式发布了新版ChatGPT图像功能。此次升级不仅让图像生成的质量更优、速度更快,在图像编辑的精确性方面也取得了显著进步。这意味着OpenAI不仅对谷歌广受好评的Nano Banana系列模型展开回击,还对Photoshop的市场地位造成了冲击。



据OpenAI介绍,基于最新旗舰图像生成模型打造的“ChatGPT图像”功能,能够在保证细节完整的前提下实现精准编辑,更有机会呈现出用户期望的效果。在保持细节完整的同时进行精准编辑,生成速度最多可提升4倍


当然,图像生成模型的实际效果,还是要通过图像来展示。


作为此次升级的核心亮点,OpenAI表示,新模型在多种类型的精准编辑上表现出色,包括添加、删除、合并、混合以及转置等操作,在完成修图的同时还能保留图片原有的特色


比如,下面是ChatGPT新图像模型生成的90年代末洛杉矶街头摄影(演示版本)。



→将人物的衬衫换成红色帽子改成黄色,限速标识调整为15把卡车换成消防车



→在画面左侧添加一群围观的人,右侧人行道上停着一只鹰,远处天空中有一艘飞船飞过;



→带有该图像全包印花的T恤挂在晾衣绳上;



→把那件T恤穿到滑板手身上



在AI生成图像的重要应用领域,ChatGPT图像功能在对现有图片进行创造性改造方面也有所突破。例如,可以将公司CEO奥尔特曼的个人照片,转化为美国80年代的健美操教练形象,或者把他的脸融入世界名画《戴珍珠耳环的少女》之中。



此外,ChatGPT还向谷歌的传统优势领域——生成包含丰富文字信息的示意图发起了挑战。OpenAI称,该模型在文本呈现方面有了进一步提升,能够处理更密集、字号更小的文字



不过需要注意的是,尽管ChatGPT在生成英文字体时已经能够达到以假乱真的程度,但官方也承认,这个新模型在生成中文、阿拉伯语、希伯来语文字方面仍存在一定的局限性



所以,至少在中文文字图像生成这一领域,Nano Banana依旧是远超ChatGPT的存在



值得一提的是,新的图像生成模型不仅性能更强,价格也更实惠。和GPT Image 1相比,升级后的GPT Image 1.5在图像输入和输出的成本上都降低了20%。


本文来源为微信公众号“科创日报”,作者是史正丞,经36氪授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com