让步,世界上最生动的AI小猫来了。

2024-12-06

计算机科学家吴恩达和Jefff2012年 Dean进行了一个实验。


它们使用16,000个CPU、经过3天的训练,1000万张猫咪图片和当时世界上最大的深度学习网络生成了世界上第一张AI猫脸图像。这是人们基于深度学习模型一键生成照片的开始。由于当时的技术能力,照片中的小猫可以算是“面目全非”。


十二年后,当网友们第一次看到黑猫背着白色翅膀的照片时,几乎所有人都认为这是一张真实的照片。


毕竟,宠物博主在用翅膀饰品装扮自己的猫之后,用胶片机拍照并不罕见。直到看到帖子下面的“AIGC”“标签,人们惊讶地发现:“这居然是AI产生的?”



AI小猫12年前 vs AI小猫12年后


怀着极大的好奇心,越来越多的网友沿着网线前往一条名为“Recraft AI“应用,试着在自己心目中生成理想的小猫。


情况一发不可收拾。


最近几天,各种“小猫胶片照片”填满了小红书、Tiktok等社交平台的信息流。无论是拿着红酒杯的小猫,在键盘上打字的小猫,还是拿着魔杖的小猫,都是Recraft AI杰作。


近几年来,AI领域的整个进展,离普通用户最近的非AI生图莫属。


从2021年初开始,OpenAI发布了DALL-E模型,AI可以通过文字生图进化和迭代三年内诞生的AI生图工具。Stable在技术能力方面取得了突破 Diffusion、Midjourney、FLUX等,专门用于C端应用的也有妙鸭相机、Remini等。


从最初追求极致的“形象”,到现在逐渐厌倦了AI的味道,开始追求风格和审美。今年的网友们正在研究Recraft AI捧上新的“神坛”。


“造梦AI”没有AI味。


事实上,Recraft这次火了起来。 一种预置的AI内置风格“Hard Flash”


这种模式可以模拟电影摄影时打开闪光灯后的拍摄效果,照片主体突出,对比度高,色彩丰富。目前,AI网站支持免费客户每天获得50分,生成50张图片。虽然中文提示的形成效果仍然不如英语,但Recraft支持直接输入中文密码。



假设ChatGPT的出现让作者感到焦虑,Midjourney的出现让画家感到焦虑,这次,摄影师惊慌失措。


Recraft是Recraft首次受到国内用户关注的地方,目前已有10,000多个笔记。


其中不乏摄影爱好者哀嚎“我宣布,拍摄不存在”;还有专门的电影摄影博主,看了Recraft生产的照片后,认为AI的构图、色彩、审美都很出色,开始思考人类摄影师能抓住什么;有些人甚至开始研究Recraft的配色和构图,试图进行“反向学习”。



尽管其它AI工具的画风更加细腻,照片也更加精美,但是看久了难免会有一种“AI味”。


无论是不和谐的色彩过渡还是不自然的结构;或者太光滑整齐的勾线,没有瑕疵的质感。总之,最初的“假”是AI的味道,现在太逼真了,也是AI的味道。


强烈而鲜明的视觉风格是Recraft走出圈子的关键,面对众多追求细节、争取真实的AI绘画工具。


刺猬公社(ID:ciweigongshe)尝试使用几种不同的模型,输入相同的密码“many animals"。Recraft内置Hardd,从最终产生的结果来看。 Flash方式,一眼望去的确有一种不同的感觉。


Recraft不像FLUX或DALLLL·E 3那样做常规构图,但是把不同的动物排成一排。图中的土地和天空大规模留白,似乎给图像增添了不同的情感:这是一只孤独的狮子。



Recraft从左到右分别由左到右分别由Recraft、FLUX、DALL·E 3生成


如果AI产生的场景能够传达情感,Recraft AI也被贴上了“梦核”“怪诞”的标签,越来越多的网友开始激发创作欲望。


有些人把自己喜欢的电影台词或歌词作为密码输入Recraft,期待着会产生什么样的画面。


在一篇1.6万赞的小红书笔记中,博主“帆”将《宇宙探索编辑部》的台词输入了Recraft。虽然生成的照片不能100%复制台词内容,但整体画面风格简直“比宇宙探索编辑部还要宇宙探索”。


有些人试图用Recraft记录他们的梦想,或者表达他们无法形容的情绪。一些热心的网友专门整理了一些常见的提示,可以让Recraft产生一个更加空灵和梦幻的图片。甚至有网友发现了新的商机,帮助不能使用Recraft的用户生成他们的梦想照片,一张几元。



在众多网友的热情参与下,继妙鸭相机和Remini粘土特效之后,又一波AI狂欢掀起。似乎每个人都想亲自尝试,给AI输入“咒语”,生成异想天开的照片,实现“法术成真”的奇妙感受。


所以,最近的小红书、抖音等社交媒体似乎被“法术”包围了:HelloKitty站在窗边看烟花,小狗在雪地里吃蛋糕,锦鲤在蓝天上掠过...


十一月二十五日,小红书官方科技薯还专门发起了一项活动,用户使用Recraft生图,并带有相关话题发布笔记,将有机会被拉流。


根据社会媒体的推动,据点点数据显示,Recraft过去一周在国内App中使用。 Store的下载量已跃升至“图形和设计列表”第二名。



什么是AI黑马?


尽管Recraft AI已经俘获了国内大量网友的心,但实际上,这种模式既不能体现,也不能代表Recraft。 技术实力AI。


对于很多经常使用AI生图工具的客户来说,目前已有的许多AI绘画大模型都可以通过密码输入来达到类似的胶片效果。


Recraft真正得到证实 今年发布的Recraft实力是AI。 V3模型。


Recraft正式正式宣布 V3模型前,Recraft AI曾用“red-panda“Artificialial AI图像竞技场在Analysis网站上的投票,一举超越FLUXX、Midjourney、Ideogram、Stable Diffusion 3.5排名第一,成为AI生成图像跑道的一匹黑马。



由于“red-panda"(小熊猫)这个名字,一开始有很多人猜测这个模型背后是否有一家中国公司,直到今年十月,Recraft AI在推特上收到了这个模型,大家才开始关注这个已经成立两年的AI公司。


Recraft AI成立于2022年,是一家总部位于英国的创业公司。


安娜创始人兼首席执行官•维罗尼卡•多罗古什(Anna Veronika Dorogush),此前曾在谷歌和微软从事软件工程相关工作,后来加入了俄罗斯最大的搜索引擎平台Yandex,是CatBoost开源梯度提升库的创造者。


今年1月,Recraft 美国风险投资机构Khoslas获得了AI Ventures领先的A轮融资1100万美元,GitHub 前CEO纳特•弗里德曼(Nat Friedman)此外,该笔融资主要用于加快技术研发和市场开发。



因为国内大部分用户都是通过社交媒体传递的“Hard Flash"方法,了解Recraft AI,所以我们通常会误以为这是一个AI图像生成企业,就像Midjourney一样。


但是了解之后就会发现,Recraft “专注于为平面设计师提供AI辅助工具”是AI成立的初衷。所以,与Midjourney相比,它实际上更像是AI版的Cavan或Photoshop。


即使是Recraft排名第一。 在一定程度上,V3模型也是Recraft 为方便设计师生成海报而进行AI培训。


Recraft 在V3模型官方介绍的博客中,该公司声称该模型是“唯一能生成包含长文本内容的图像生成领域的AI图像模型”。



比如一个设计师需要在海报上呈现大量的文字内容,过去的AI生图模型很容易在文字内容上拼写错误,所以设计师的常规做法可能是先用AI生图生成海报背景图,然后用其他工具P上文字内容。


还有Recraft V3模型的逻辑是通过提高AI直接从图像中渲染文本内容的准确性,简化设计师使用AI生成海报的过程。AI媒体“新智元”在本文中解释了该模型的操作机制:


Recraft团队在建立文本信息的过程中,采用了TextDiffuser-2的表征方式,首先将文本的内容记录在每一行文本中,然后通过坐标来指出文本的具体区域。但Recraft不同于TextDiffuser-2,它使用了三个坐标点来表示文本,使模型能够支持渲染倾斜的文本。



总而言之,结果是借助Recraft V3,设计师对海报中文字内容的形成效果和控制能力,大大提高。



Recraft除了AI生成漫画风格、写实风格、胶片风格、矢量图、插图、图标和3D图像外,还提供套索、局部重绘、抠图、mockup等设计工具。


体验之后,刺猬公社的设计同事们最引人注目的就是其中的mockup功能。借助AI能力,Recraft AI可以实现图案或图标自动贴合产品图片,直接生成产品样品,避免了设计师手动调整参数的麻烦。此外,Recraft还引入了即时合作功能,同一项目的设计师可以在无限画布上评论生成的内容,并立即进行修改。


理解模型是不够的,还要理解内容。


虽然国内用户似乎有80%,但并不像Recraft那样。 AI创始人的想法是,它被用作AI设计工具,但是凭借Hard, Flash爆红对他来说也不是一件坏事。


从AI生成图像领域的历史来看,近三年无疑是跑道上各大玩家竞争最激烈的阶段。大家都在争相更新大模型,怕不小心被甩在后面。


OpenAI于2021年初发布了DALL-E模型,AI可以通过文字生图;


Midjourney于2022年3月上线,可以根据用户输入的文字快速生成高质量的图像;


2022年8月,Stable 通过将随机噪声转化为高保真图像,Diffusion正式开源,实现从文本到图像的生成;


2024年8月,Black Forest Labs推出了FLUX模型,其图像质量、文本理解和细节都超越了Stable。 Diffusion 还有Midjourney,成为这个领域的新领导者…


而且到了十月份,大家讨论的主角很快就变成了Recraft。


按Recraft计算 根据AI的官方数据,Recraft V3模型发布20天后,全球共有200多万注册用户。Recraft每次注册一个账号,都会问客户“如何知道这个应用”。根据创始人多罗古什的说法:"大部分的增长都来自于社交媒体和用户之间的口耳相传."



Recraft AI生成


背后隐含的变化是,随着AI生成图像工具逐渐进入普罗大众的生活,仅仅依靠模型实力可能是不够的。正如多罗古什在采访中所说:仅仅通过生成高质量的AI图像是不够的,(商品)还需要建立一些能够吸引大家注意力的物品。


以前有些主要面向C端AI的商品,其实早就证明了这一点。


比如去年网上流行的妙鸭相机和上半年流行了一段时间的Remini,一个瞄准了“AI照片”,一个创造了“粘土特效”。两者都在客户心中留下了不可替代的商品标签,因为它们具有代表性的产品功能。


对Recraft来说 AI而言,Hard Flash产生的胶片感,就是它在社会媒体上爆红,在更多人心中形成理解的“抓手”。



Recraft AI生成


Recraft出人意料地切入了一条允许不合理的“想象力”跑道,这是一个AI模型,争取画面细节和真实感。


一方面,统一的滤镜风格加深了普通用户对该应用程序的记忆,使得Recraft的名字在人们的脑海中扎根。另一方面,这也巧妙地掩盖了AI模型在某些能力上的不足。即使产生的人物充满了塑料感,画面总是以彩色窗帘为背景,但一切都在“梦核”和“怪诞”的风格标签下变得合理。


AI公司不断追求技术能力的层层突破,自然是目前AI发展阶段的重中之重。但是,如果我们想带领更多的普通用户进入AI时代,我们可能需要进一步降低使用门槛,选择合适的市场定位和营销策略。只有这样,才能有越来越多的AI产品“飞入普通人的家中”。


参照文章

1、新智元:Recraft深度分析 V3 突破文本渲染限制,「文生图」黑马是如何炼成的?


2、天空之城Web3:AI 为什么绘画发展迅速? 从历史到技术突破, 阅读一篇文章很受欢迎 AI 绘画发展史


本文来自微信微信官方账号“刺猬公社”(ID:ciweigongshe),作者:啊游,编辑:陈梅希,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com