可灵让快手支棱起来了?
也许每个人都想不到,安静的快手,却打出了最有分量的文生视频应用。「可灵」。
与Sora相比,它是遥不可及的,它可以通过发布来使用。只是快手巧妙地将其放入其下的另一个视频应用程序「快影」,用户必须申请快影App才能感受到。
猎豹移动、猎户星空董事长傅盛作为第一批内测用户,在个人账户上给予评价,「它可能是当今世界上你所能使用的最好的文生视频人工智能产品。」
AI创作者德里克文在最长2分钟的视频生成中告诉新莓daybreak,「在实际体验中,大规模合理运动、模拟真实物理特征、概念组合等都是达标的。但是灵魂做不到,其他软件也做不到。」
在百度、腾讯、字节、阿里等大厂商中,生成式AI被广泛布局,聚焦视频主营业务的快手从文生文、文生图、文生视频等方面斜杀。
只是这个美好的开场,能否继续下去?
01 可灵的亮眼与局限
可以说,可灵一经发布就受到了AI圈的高度关注,这与Sora的功劳是分不开的。以下是AI创作者创作的对比视频:
并非官方发布的演示视频,而是用户使用可灵产品进行实测的结果。创作者卡尔的AI沃茨告诉新莓daybreak,「这段视频是公平的第三方对比,画面没有任何增强和修改。」
这些都是大家兴奋的主要原因,可灵的表现并不逊色于Sora,而Sora目前还处于PPT阶段,商品还没有向公众开放。
德里克文,知乎科技博主,就是这样被吸引的,「效果太好」。他迫不及待地加入了AI的创作。
一个月后,德里克文的AI作品在Aautorapper上获得了最多7245的好评,并被Aautorapper官方列为高质量创作者。这部分归功于德里克文对AI的长期关注。在此之前,他测试过外国视频生成软件Runway和Luma。
「个人感觉可灵是一种综合能力最强的产品。」德里克文对三个软件进行了比较分析。
RunwayGen-3只有文字视频功能,没有图片视频,官方显示的效果和实际使用效果不一样;Luma的拍摄手法和镜头美感都不错,但是不稳定,生成时间太长,不可控。
在德里克文看来,可灵只是弥补了这两个软件的不足。一套图片放在可灵身上,基本上三两次就能做出满意的作品,非常稳定。目前可灵支持文成图、文生视频、图生视频等功能,可以单独支持一个完整的工作流程。
AI创作者娜娜对可灵的印象也很好。她认为人物的一致性是可灵的一大亮点,这是许多AI软件都在努力实现的目标,比如Midjourney的sref。 random(风格随机)就是这样做的功能优化。
但是娜娜也承认,可灵仍然有一些局限性。举例来说,在创意表现上,可灵很容易掌握艺术风格、摄影语言,「要花很长时间才能得到一个满意的场景。」
德里克文也同意娜娜的观点,他认为这与快手投喂的语料有关。快手更擅长真实的绘画风格,不擅长艺术大片。
正因为如此,德里克文和娜娜都觉得,可灵表现得更好的是美女、动物、吃东西等画面。
可灵的局限性也表现在准确的表达上。哔哩哔哩UP主六道奇收集了网友的脑洞,进行了实测,比如「一名宇航员骑着霸王龙在月球上奔跑」,一个明显的BUG产生了一个视频,那就是宇航员所在的蓝色星球。

哔哩哔哩UP主TheEternal永远习惯于使用图片视频,同样也会遇到类似的问题。他告诉新莓daybreak,「产生精确的结果要碰运气,一般利用率可以达到40%。」
找出德里克文的原因,「一是快手自身基本语料不足,二是提示词描述不到位。」
此外,德里克文还指出了目前专业创作者面临的一个问题。无论是复活老照片还是拟人动物,操作都比较简单,没有太大的发挥空间。他们的诉求是创作故事片和商业片,难度更大,表达能力更强。
它对可灵和创作者提出了更高的要求,如镜头美感、分镜、情节等。现在,操作步骤不亚于传统电影拍摄过程的复杂程度,「只是半途而废的拍摄变成了用可灵来制作。」。
也许这是视频AI走向更广泛应用的另一个区域,需要突破。
02 可灵的用户增长
上线不到两个月,已有70多万客户申请内测可灵。这里面有可灵商品的吸引力,也离不开快手背后的努力。
娜娜告诉新莓daybreak,她第一次接触到灵魂,被朋友拉进了微信内部测试组。大部分群体都是来自抖音、小红书等社交平台的AI博主。「那段时间快手私聊了很多AI博主。」
进入大群体的博主会时不时地发布自己的AI作品,如果表现出色,就会受到高质量创作者的邀请。
同时,创作者的AI作品会长期得到Aautorapp的流量支持。作品在Aautorapp上发布,只要有话题标签#可灵#Aautorapp#可灵AI,就会享受到这个好处。如果在其他平台,优质作品也会有流量支持。
目前尚未看到可灵的广告,但可以发现可灵目前更注重打造高质量的AI创作者池,高质量的创作者可以生产出高质量的作品,接触到更广泛的人群,吸引更多的AI创作者加入。这是一个有利于用户增长的正向循环。
所以,可灵举办创作者激励活动,进行有意识的引导。六月二十一日,可灵发布了图生视频功能。随后,可灵连续发布了两个定向题目投稿活动,「复活」古画、让「老照片」动起来。
有一段时间,蒙娜丽莎转身,戴珍珠耳环的女孩摸了摸自己的耳环。更重要的是,一位网友用可灵复活了爷爷的老照片,重拾了对病重爸爸的信心。这段视频在可灵AIAautorapper上获得了超过1万的好评。
七月六日,在2024年世界人工智能大会上,可灵正式宣布首届可灵AI x 快速视频创作大赛,比赛还特别推出。「可灵AI x 星芒短剧」创造者孵化计划。
这也有利于更多人的参与和高质量的作品输出。为了在更广泛的范围内提高灵魂的知名度和AI创作的更多可能性,Aautorapper官方将亲自示范。
7月13日,Aautorapper第一部AIGC原创奇幻短剧《山海奇镜之劈波斩浪》在Aautorapper星芒短剧全网独播。之前这部短剧预告片发布的时候,引起了很多人的讨论。很多人喊「大片的感觉。」
这部剧的导演陈坤在前一天的电影会上分享说,在过去的电影和电视剧中,奇幻和科幻赛道受到CG特效的高成本和长周期的限制,发展受到限制。随着AI的加入,奇幻短剧的整个创作过程变得非常高效。
快手视觉生成与互动中心负责人万鹏飞在不久前的世界人工智能大会上介绍,「未来,预计视频生成模型将为游戏、动画、泛视频行业带来新的机遇。」
03 可灵的对手们
可灵足以让外界发生意外,不仅仅是因为它首次发布了国内第一个产品级视频应用,还因为之前的AI大模型几乎没有波浪。
快手视觉生成与互动中心负责人万鹏飞在2024北京智源大会上回答记者提问,「可灵这件事一定是一个很复杂的项目,重资源投入,多军种合作。」
事实上,在2023年初,Aautorapper开始了一项新的AI战略。在这项战略开始时,Aautorapper技术副总裁张迪担任负责人,专注于大语言模型、视觉生成模型和多模态模型。
今年也是快手组织结构频繁调整的一年。1月,快手CTO陈定佳辞职,接任快手高级副总裁于越和于冰。12月,快手人工智能团队MMU&Y-tech 王仲远负责人卸任。
与此同时,外界的新鲜血液也在输入。去年加入了Aautorapper视觉生成与互动中心的高级研究员王鑫涛,此前他是腾讯AI实验室的高级研究员。在灵发布之前,他曾经在学术上分享过《视频生成初步探索及其可控性研究》。
快手「弯道超越」背后是Aautorapper内部的不断优化和联合作战。但是不确定Aautorapper能不能一直保持第一。跑道上的其他玩家也在密切关注布局。
首先,同样深耕短视频社区的字节跳动引起了外界的密切关注。根据晚点LatePost的报道,今年第一季度,字节 AI R&D部门优先考虑视频生成模型。另外,原来的Google视频生成模型VideoPoet项目经理蒋路今年加入了字节跳动。
字节还提交了文学视频的答卷。今年2月,剪影推出了一款名为Dreamina的AI绘画工具。三个月后,剪影Dreamina正式更名为中文。「即梦」,AI绘图和AI视频生成功能全部上线。
在张楠掌管剪影之后,这被认为是最重要的产品更新。
剪影与颤音的内容生态相连,是视频创作的重要入口。由于与平台运营体系的强烈相关性,视频编辑工具承载着平台竞争的使命。争夺创作入口,争夺视频上传入口。
目前即梦支持文生视频和图生视频两个功能,生成时间支持3-12s。但即梦的受欢迎程度明显不高,有试用过的网友表示,即梦功能需要加强。即梦目前只支持网页版本。
除了快手和字节,文生视频也是大厂集体下注的关键跑道。
腾讯也在如火如荼地进行着。五月十七日,腾讯云生成式 AI 在工业应用峰会上,腾讯集团副总裁蒋杰表示,腾讯混合元已经支持各种视频生成能力,如文化生成视频、图片生成视频、图片生成视频、视频生成视频等。,并且已经有能力生成16s视频。
年初,百度还推出了一款视频生成模型UniVG,可以处理各种文字和图像的组合输入。许多人认为它的效果与Runway相同。 Gen-2相当。
没有发令枪,没有终点。Aautorapper可能会获得跑步甚至领先的优势,但是这条赛道足够长,雪道足够厚,所以给出任何结论都是时间问题。
本文来源于微信公众号“新莓daybreak”,作者:张芮白,编辑:翟文婷,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




