Midjourney地位不稳定？另一匹黑马出现在AI制图中，附上4个产品一手实测。

2024-08-26

AI圈，再开卷图像生成。

一连串的进步聚集：

8月21日，2.0版Ideogram正式推出，声称文字渲染能力强。

是的，这是一个项目，它创建于去年8月，由谷歌AI绘画四大牛集体辞职创业，并获得了一批AI大佬的投资。

这次Ideogram还是公开叫嚣Flux，官方自信表示，其人类评价明显优于Flux Pro。

要知道，Flux来自Stable Diffusion原班人马创作，最近因为生成了TED演讲的“照片”而在各大网络上走红。

此外，一周前，谷歌正式发布。Imagen 3，在官方评估中，声称表现优于DALL。-E 3、Midjourney v6、Stable Diffusion 三等一众制图模型。

或许是受到了刺激（doge），在8月22日，Midjourney甚至转换了性别，并向所有用户推出了一个免费网页版。

现在有大戏看了！

因为每个人都声称自己很强大，所以我们不妨把每个人拉到一张桌子上，以获得一个零距离的PK。

最强制图AI是谁？

首先邀请我们的四位选手(全部使用网页版)：

1号选手：Ideogram 2.0。每日免费10分，1分可生成4张图片，每日最多生成40张图片；

2号选手：Flux.1。黑色森林官方在Hugging Chat提供免费的demo(选择FLUX).1 Schnell版本)；

3号选手：Imagen 3。Image FX可免费无限次使用；

4号选手：Midjourney。总共只有25张图片在免费实习期间生成；

接下来正式进入比赛阶段。

黑猴子完全翻车了

一上来，为了测试这些海外AI，是否理解中文提示词，同时，我们也来蹭一波当今顶流黑猴子的热度。

prompt：这个游戏角色，一只猴子，穿着盔甲，戴着凤羽金冠，手里拿着一根金箍，站在悬崖上。

没有意外，意外发生了…

想必大家一眼就被3号大红叉吸引住了。是的，在同一个提示下，只有3号Imagen。 3拒绝生成请求。

看到这里，第一反应是我们的提示是否触发了版权保护。因此，提示中的“游戏角色”首先被删除，但提示仍然无法生成。

是不是谷歌Imagen？ 3不支持中文？于是又随机换了一个更简单的提示，这下倒是有图的。

只是结果一整个大错误，而且换了几个中文提示词，最后都是一些无关紧要的纹路图。

看来谷歌Imagen 3对于中文提示词来说确实不ok。。

3号失败后，再看看其他几个人，也只有11号Ideogram 2.0表现最佳。

2号倒还可以看到国漫的身影，4号Midjourney则完全放飞了自己~(主推一个不相干)

最终还是要表扬一下Ideogram 2.0，所有关键元素都被精确命中。

尽管不是我心中想要的东西(想要黑神话)，但是提示词的还原度确实没有问题。

是真人还是AI？愚蠢不清楚。

下一步，进入各位选手的舒适区——人像生成。

远远望去，Midjourney以一张天台情侣合照在网上走红；目前，Flux更是以一组TED演讲图风靡全网…

到底谁更胜一筹？答案立即揭晓。

prompt：A young man with auburn hair, wearing a checkered shirt in teal and cream, captured with a 50mm lens for a vintage look. Rich colors, sharp focus, and a touch of retro charm.一个头发淡褐色的年轻人，身穿蓝绿色奶油色方格衬衫，用50毫米镜头捕捉复古风格。色彩丰富，焦点清晰，具有一丝复古魅力。

首先单看2号和4号，很明显，Midjourney赢了！

就细节而言，2号Flux.1稍有出入，衣着多了两种颜色，这在一水蓝绿格子衬衫中尤为明显。

另外，我们一上来就发现了Imagen。 3一个独特的小亮点：圈出关键字，然后再生成。

通过它所完成的工作，我们正好可以测试几位选手。关键元素(蓝色方格衬衫，50mm镜头等)的恢复程度。

可以看出，总的来说，几位选手表现都不错(2号除外)，还原度更高，都看着镜头。

而且，如果不是这一切都是我自己用AI产生的，还真不能一下子认出和真人的区别。(汗颜)

最后悄咪咪说，4号选手Midjourney的颜值最高。

老大难：图片显示文字

在成功地欺骗了所有人之后，是时候让AI吃点苦头了。——

给图片添加文字。

这个问题一直是个老大难题，也成为检测AI生图水平的标准之一。

话不多说，让几个玩家直接做一个精美的广告牌。请各位看官自己带入甲方爸爸的角色。

prompt：A horizontal brass sign reading ‘Festive Season’ in a stylish script, encircled by pine and holly on a dark wood backdrop, with a close-up focus on the golden lettering.一个标准的黄铜标牌，上边用时尚手写写着'Festive Season"，周围是松枝和冬青，背景是深色木材，特写集中在金色字体上。

一眼划过，是不是都不错，好像都高度还原了提示词？

但是，一旦拿出甲方爸爸犀利的眼神，这2号就无法隐藏。

仔细看，2号Flux.1以次充好了，单词“Season“少了一个字母”S”。

不过除了2号，其他几个还是不错的。看来每个AI都在。文字渲染功能上都下了功夫。

所以接下来，萝卜青菜各有所爱，大家根据个人爱好做出选择。(自私地投给Midjourney)

顺便说一下，1号Ideogram这次的型号升级还特别推广了“文字渲染”功能，大家不妨多尝试一下。

参考肯德基，整点AI广告。

最近，肯德基邀请了11位AI美女为薯条疯狂打电话，狠狠地火了一把~

事实上，原理也很简单，无非就是用AI生成不同角色宣传薯条的照片，然后拼接成视频。

没想到效果惊人，仅在推特一个平台上，相关视频就获得了近千万的访问量。

在掌握了财富密码之后，我们正式开始工作，作为中国人，AI助农高低得走~

prompt：Against the backdrop of a cyberpunk-style metropolis, a girl is promoting organic agricultural products in her hands.在赛博朋克风格的城市背景下，一个女孩正在宣传手中的有机农产品。

非常好，3号选手又“摆烂”了。但这波浪潮的确令人费解，提示词既不是中文，也没有明显的违规区域…

1号选手Ideogram淘汰3号之后。 2.0带货类型最丰富，包括白菜、西红柿、紫甘蓝等。

并且是唯一的打法文字招牌来宣传有机食品的人，看得出来还是挺辛苦的~

另外，仔细观察还可以发现，只有1号在努力模仿真人，而2号和4号则完全走上了路。二刺猿。

u1s1，如果参考麦麦的广告风格，这一次的短暂生成并没有达到预期的效果。(希望更真实一点)

但是，幸运的是，这些AI工具现在可以免费使用，多来几次也不是不可能，重点还是方法论。[doge]

不要急着走，其实还有一种更可靠的赚钱方式。——

使用AI轻松掌握棚拍商业宣传海报，省钱请摄像师，场地和后期钱不香嘛。

A sleek lipstick tube gleams against a backdrop of sophistication, highlighting the rich pigment and smooth glide. Evoke luxury with sharp focus and a hint of shimmer.光滑的口红管在精致的背景前闪耀，凸显出浓郁的色彩和光滑的涂抹感。用锐利的焦点和微芒唤起奢华感。

每个人，如果你想给身边的一个女人挑一支口红，你会选择哪一支？(死亡考验来了)

嘿嘿，所以有人选择4号吗？

虽然4号Midjourney看起来很高级，但是这种黑色可能有点小。(慎重选择)

除此之外，下一步最好的表现就是Imagen3号 3，下面的丝绒面料衬托出奢华感，而且最重要的是，口红材质非常真实。

相比之下，1号和2号都显得有点假，“塑料感”迎面而来。

所以这个游戏，总的来说，3号选手获胜。

综上所述，总的来说，四位选手的表现都很好。在中文提示下，黑马选手Ideogram 表现最好的2.0。