Midjourney地位不稳定?另一匹黑马出现在AI制图中,附上4个产品一手实测。
AI圈,再开卷图像生成。
一连串的进步聚集:
8月21日,2.0版Ideogram正式推出,声称文字渲染能力强。
是的,这是一个项目,它创建于去年8月,由谷歌AI绘画四大牛集体辞职创业,并获得了一批AI大佬的投资。
这次Ideogram还是公开叫嚣Flux,官方自信表示,其人类评价明显优于Flux Pro。
要知道,Flux来自Stable Diffusion原班人马创作,最近因为生成了TED演讲的“照片”而在各大网络上走红。
此外,一周前,谷歌正式发布。Imagen 3,在官方评估中,声称表现优于DALL。-E 3、Midjourney v6、Stable Diffusion 三等一众制图模型。
或许是受到了刺激(doge),在8月22日,Midjourney甚至转换了性别,并向所有用户推出了一个免费网页版。
现在有大戏看了!
因为每个人都声称自己很强大,所以我们不妨把每个人拉到一张桌子上,以获得一个零距离的PK。
最强制图AI是谁?
首先邀请我们的四位选手(全部使用网页版):
1号选手:Ideogram 2.0。每日免费10分,1分可生成4张图片,每日最多生成40张图片;
2号选手:Flux.1。黑色森林官方在Hugging Chat提供免费的demo(选择FLUX).1 Schnell版本);
3号选手:Imagen 3。Image FX可免费无限次使用;
4号选手:Midjourney。总共只有25张图片在免费实习期间生成;
接下来正式进入比赛阶段。
黑猴子完全翻车了
一上来,为了测试这些海外AI,是否理解中文提示词,同时,我们也来蹭一波当今顶流黑猴子的热度。
prompt:这个游戏角色,一只猴子,穿着盔甲,戴着凤羽金冠,手里拿着一根金箍,站在悬崖上。
没有意外,意外发生了…
想必大家一眼就被3号大红叉吸引住了。是的,在同一个提示下,只有3号Imagen。 3拒绝生成请求。
看到这里,第一反应是我们的提示是否触发了版权保护。因此,提示中的“游戏角色”首先被删除,但提示仍然无法生成。
是不是谷歌Imagen? 3不支持中文?于是又随机换了一个更简单的提示,这下倒是有图的。
只是结果一整个大错误,而且换了几个中文提示词,最后都是一些无关紧要的纹路图。
看来谷歌Imagen 3对于中文提示词来说确实不ok。。

3号失败后,再看看其他几个人,也只有11号Ideogram 2.0表现最佳。
2号倒还可以看到国漫的身影,4号Midjourney则完全放飞了自己~(主推一个不相干)
最终还是要表扬一下Ideogram 2.0,所有关键元素都被精确命中。
尽管不是我心中想要的东西(想要黑神话),但是提示词的还原度确实没有问题。
是真人还是AI?愚蠢不清楚。
下一步,进入各位选手的舒适区——人像生成。
远远望去,Midjourney以一张天台情侣合照在网上走红;目前,Flux更是以一组TED演讲图风靡全网…
到底谁更胜一筹?答案立即揭晓。
prompt:A young man with auburn hair, wearing a checkered shirt in teal and cream, captured with a 50mm lens for a vintage look. Rich colors, sharp focus, and a touch of retro charm.一个头发淡褐色的年轻人,身穿蓝绿色奶油色方格衬衫,用50毫米镜头捕捉复古风格。色彩丰富,焦点清晰,具有一丝复古魅力。

首先单看2号和4号,很明显,Midjourney赢了!
就细节而言,2号Flux.1稍有出入,衣着多了两种颜色,这在一水蓝绿格子衬衫中尤为明显。
另外,我们一上来就发现了Imagen。 3一个独特的小亮点:圈出关键字,然后再生成。

通过它所完成的工作,我们正好可以测试几位选手。关键元素(蓝色方格衬衫,50mm镜头等)的恢复程度。
可以看出,总的来说,几位选手表现都不错(2号除外),还原度更高,都看着镜头。
而且,如果不是这一切都是我自己用AI产生的,还真不能一下子认出和真人的区别。(汗颜)
最后悄咪咪说,4号选手Midjourney的颜值最高。
老大难:图片显示文字
在成功地欺骗了所有人之后,是时候让AI吃点苦头了。——
给图片添加文字。
这个问题一直是个老大难题,也成为检测AI生图水平的标准之一。
话不多说,让几个玩家直接做一个精美的广告牌。请各位看官自己带入甲方爸爸的角色。
prompt:A horizontal brass sign reading ‘Festive Season’ in a stylish script, encircled by pine and holly on a dark wood backdrop, with a close-up focus on the golden lettering.一个标准的黄铜标牌,上边用时尚手写写着'Festive Season",周围是松枝和冬青,背景是深色木材,特写集中在金色字体上。

一眼划过,是不是都不错,好像都高度还原了提示词?
但是,一旦拿出甲方爸爸犀利的眼神,这2号就无法隐藏。
仔细看,2号Flux.1以次充好了,单词“Season“少了一个字母”S”。
不过除了2号,其他几个还是不错的。看来每个AI都在。文字渲染功能上都下了功夫。
所以接下来,萝卜青菜各有所爱,大家根据个人爱好做出选择。(自私地投给Midjourney)
顺便说一下,1号Ideogram这次的型号升级还特别推广了“文字渲染”功能,大家不妨多尝试一下。

参考肯德基,整点AI广告。
最近,肯德基邀请了11位AI美女为薯条疯狂打电话,狠狠地火了一把~
事实上,原理也很简单,无非就是用AI生成不同角色宣传薯条的照片,然后拼接成视频。
没想到效果惊人,仅在推特一个平台上,相关视频就获得了近千万的访问量。
在掌握了财富密码之后,我们正式开始工作,作为中国人,AI助农高低得走~
prompt:Against the backdrop of a cyberpunk-style metropolis, a girl is promoting organic agricultural products in her hands.在赛博朋克风格的城市背景下,一个女孩正在宣传手中的有机农产品。
非常好,3号选手又“摆烂”了。但这波浪潮的确令人费解,提示词既不是中文,也没有明显的违规区域…
1号选手Ideogram淘汰3号之后。 2.0带货类型最丰富,包括白菜、西红柿、紫甘蓝等。
并且是唯一的打法文字招牌来宣传有机食品的人,看得出来还是挺辛苦的~
另外,仔细观察还可以发现,只有1号在努力模仿真人,而2号和4号则完全走上了路。二刺猿。
u1s1,如果参考麦麦的广告风格,这一次的短暂生成并没有达到预期的效果。(希望更真实一点)
但是,幸运的是,这些AI工具现在可以免费使用,多来几次也不是不可能,重点还是方法论。[doge]
不要急着走,其实还有一种更可靠的赚钱方式。——
使用AI轻松掌握棚拍商业宣传海报,省钱请摄像师,场地和后期钱不香嘛。
A sleek lipstick tube gleams against a backdrop of sophistication, highlighting the rich pigment and smooth glide. Evoke luxury with sharp focus and a hint of shimmer.光滑的口红管在精致的背景前闪耀,凸显出浓郁的色彩和光滑的涂抹感。用锐利的焦点和微芒唤起奢华感。
每个人,如果你想给身边的一个女人挑一支口红,你会选择哪一支?(死亡考验来了)
嘿嘿,所以有人选择4号吗?
虽然4号Midjourney看起来很高级,但是这种黑色可能有点小。(慎重选择)
除此之外,下一步最好的表现就是Imagen3号 3,下面的丝绒面料衬托出奢华感,而且最重要的是,口红材质非常真实。
相比之下,1号和2号都显得有点假,“塑料感”迎面而来。
所以这个游戏,总的来说,3号选手获胜。
综上所述,总的来说,四位选手的表现都很好。在中文提示下,黑马选手Ideogram 表现最好的2.0。
Ideogram是谁?
Ideogram于今年2月推出了1.0版本,短短半年时间,它又推出了2.0版本。
事实上,Ideogram和谷歌可谓“沾亲带故”。
创立于去年八月,创始团队前四名是Imagen论文作者谷歌文生图研究。
CEO Mohammad Norouzi,在多伦多大学计算机科学博士学位期间,他获得了谷歌ML博士奖学金。
毕业后,他加入谷歌大脑工作了7年,一路担任高级研究科学家,主要研究的是生成模型。
另外,他还是谷歌神经机器翻译团队的原始成员,Hinton团队对学习框架SimCLR的合作者进行了监督和比较。

CTO William Chan(陈俊乐),论文共同作品,他先后就读于加拿大滑铁卢大学、卡内基梅隆大学。
2012年加入谷歌时,他首先进行了机器学习广告工程,然后转到谷歌大脑进行NLP研究。

创始人 Jonathan Ho,本人毕业于UC伯克利,曾在OpenAI工作一年,后来加入谷歌。
他不仅是Imagen论文的核心推动者,而且是去噪扩散模型的基础。《Denoising Diffusion Probabilistic Models》这篇论文是Pieter合作者的作品。 Abbeel也是Ideogram AI投资者。
创始人 Chitwan Saharia,本科毕业于孟买理工学院,2019年加入谷歌,主要负责谷歌领导image。-to-image扩散模型工作。
另外三个创始团队,Shayaan Abdullah曾经是Twitter的机器学习工程师,去年四月辞职,然后放入Ideogram。 AI。
Jacob Lu在加入Ideogram之前,软件工程师曾在亚马逊等公司工作;Jenny Lei作为软件工程的见习生,加入Ideogram 在谷歌实习之前,AI。
可见,Ideogram是由顶级扩散模型研究团队组成的,自成立以来就受到了资本的青睐。
Ideogram种子轮融资由a16z和Index Ventures领先投资,金额1650万美元(当时约1.2亿人民币)。
Andrej也不乏个人投资者。 Karpathy、强化学习大神Pieter Abbeel,TommGitHub创始人 Preston-Werner等。
另外,今年2月,Ideogram发布了很多消息。新一轮融资。
据报道,筹集成功8000万美金A轮融资(约57亿人民币),领先投资者为Andreessensen Horowitz,其他投资者包括Index Ventures、Redpoint Ventures、Pear VC和SV Angel。
Ideogram看起来富有,技术丰富,无疑是AI生图领域的一匹黑马。
继续卷,继续卷。
Ideogram 2.0链接:https://ideogram.ai/t/explore
Midjourney链接:https://www.midjourney.com/home
Flux链接:https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell
Imagen3链接:https://aitestkitchen.withgoogle.com/tools/image-fx
参考链接:[1]https://x.com/ideogram_ai/status/1826277550798278804[2]https://ideogram.ai/launch[3]https://x.com/AIandDesign/status/1826277963681370213
— 完 —
本文来自微信微信官方账号“量子位”(ID:QbitAI),作者:量子位,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




