快手的可灵又更新了,这次搓出来的视频真的有点东西。

04-17 06:25

好消息,可灵 AI 波大这次来了。


今天下午,快手上线了可灵。 2.0 视频生成模型和可图 2.0 图像生成模型,全开放,进入他们家官网即可使用。


快手的高级副总裁盖坤一上来就直接摆数据,可灵灵 2.0 文生视频模型被甩了 Veo2 和 Sora 几个车尾灯,图片视频也会比较。 Runway 的新模型 Gen-4 强不少。


甚至在现场扬言,把可灵 2.0 被称为“世界上最强大的视觉生成模式”。


尽管世超没有去发布会现场,但是结合官方发布的 demo、网民的测试,当然还有我们自己的一手感受,我们不敢打包可灵。 2.0 非常强大,但是实力的确配得上现阶段” AI 录像版本答案“这个称号”。


这次升级比较出色的一点,就是动态质量的提高。


可灵 AI 官方 po 举个例子,那效果可以说是很惊艳了,随便拿出一个,都可以称得上是百万镜头,千亿制作。


例如这样,穿着长衫的人在漫天的黄沙中行走,你别说,还真有点电影《沙丘》的味道。


可灵 2.0 发表后的第一时间,X 世界上也有不少网友把自己的 case 发了出来。


拿已经生成的图片,让可灵 2.0 运行灾难片场景。短短 5 秒的时间,可灵 2.0 流利地展现了男人整体逃跑的动作。


当然也有一些缺陷,大部分散落在空中的传单都被烧毁了。


把同一组直接拿走 prompt 各自测试了可灵 2.0 和可灵 1.6 的效果。


例如这位少女骑上海摩托艇送外卖的视频,可以看到,可灵灵 2.0 海上摩托艇的动态处理更加真实,不再是同样的慢镜头。发动机对海浪的影响正在发生变化。另一方面,它可以灵活。 1.6 摩托艇,稳得有点太假了。。


还有一段图片生成的视频,提示是“她很生气”,可灵灵 2.0 和 1.6 表现力高下立判。


前一种情绪非常生动,把对“愤怒”的认知变成了破口大骂,后一种“愤怒”,有点猜不出到底是愤怒还是无语。


看看,每个人都是对可灵的 2.0 评价还是挺积极的,唯一的一点吐槽,也许是价格的确有点贵。


用可灵 2.0 生成一个 5 秒视频,要花掉 100 积分,即积分 10 人民币。世超也只能用口袋里剩下的几十块钱,给大伙儿一个浅浅的评价。


就动画效果而言,我使用了可图。 2.0 地下室忍者图片生成,跑去模拟被忍者追捕的画面。


prompt 嗯:忍者前空翻后,举起手中的武器奔向镜头,镜头不断向后移动。随着地下室场景的变化,光源越来越暗。


在等待半个小时的时间里,我会在同一组。 prompt 喂给了可灵 1.6。


1.6 很快就会很快,但是质量必须打对折。说好前空翻呢,蹲下这次算什么?


再来看可灵 2.0 结果,相比之下,要顺眼得多。


前空翻的动作虽然完全被烧掉了,但至少动作的完成率是有的,举起手中的武器奔向镜头也是可以理解的。在语义响应方面,真的很好。


但说实话,这段视频的动画效果并没有我想象的那么好,特别是在画面稳定性方面,显然可以看到手、武器的变形。


让我们再来看看这个例子(prompt:在拥堵的交通中,一只机器狗向前奔跑,镜头慢慢向右移动到机器狗的侧面。当它到达十字路口时,机器狗跳了起来,越过了一辆车,然后继续向前奔跑。


不说别的,这张图的质感一定要夸,这只机器狗的耳朵动起来就跟真的一样。而且在机器狗飞行的过程中,没有特别明显的变形,画面流畅,地面的倒影对齐。


也就是镜头移动没有体现出来,还有一种越过汽车的方式,和世超想象中的多少差不多。


值得注意的是,这一次可灵。 2.0 还有一个新的功能叫做多模态编辑。基于一个视频,我们可以替换、添加和删除元素。


世超用上边机器狗的视频来尝试这个功能,然后上传一张柯基的图片,让可灵灵 2.0 帮助我把视频中的机器狗换成柯基。


大家看看效果,评价一下?


原来的交通流量背景没有特别大的变化,柯基的运动轨迹和机器狗基本一致。理论上,我们也可以根据机器狗的视频做更多的改动,比如把路变成花田,或者多加一根金毛。


据快手高级副总裁盖坤介绍,可灵定义了一种人与人之间的关系。 AI 互动新语言 Multi-modal Visual Language(MVL)。


这是什么意思,以前我们用文字和文字? AI 说要生成什么样的视频,最后的结果或多或少都会有误差。但是如果你给出更多的图片和视频参考,AI 可以更加了解你。


这么说吧,多模态编辑的功能使得视频的可控性更高,对视频生成和视频后期编辑都有很大的帮助。


所以经过测试,世超感觉可灵。 2.0 在产品的深度和广度上,我真的付出了很大的努力。我不敢说我已经能碰到瓷器摄像头了,但是如果我能把价格打下来就更好了。


从去年开始,就有一句话 6 自从月快手推出可灵以来,还不到一年。但无论是技术实力还是全球知名度,可灵都是众多玩家中的佼佼者。


快手上个月发财报告,还首次披露了一组数据:截至目前 2025 年 2 月,可灵 AI 累积的营业收入已经突破 1 亿元大关。


虽然面对快手的整体收入,可灵的这一点收入最多也就是苍蝇腿。


但是有一个问题,目前市场上的问题 AIGC 商品收费,营收能干到能干。 1 亿,还有多少?


而快手的财务报告也提到了,2024 第四季度,快手 AIGC 日均营销材料消耗超过 3000 万人民币,换句话说,许多广告商开始选择使用它。 AI 生成材料进行营销。


并且快手 CEO 程一笑还说,AI 大型模型估计能够降低新媒体营销材料的生产成本, 60 - 70% 甚至更多。


所以,快手完全有了 AI 为稳定商业化提供潜力。


若能在可灵之后与快手形成深层联动,不但 AI 商业化已经落下,也许还可以借用。 AI 重新做一个快手。


文章:没有瓜西


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com