颤音快手新战场,视频生成大模型的同与异
AI应用程序的动态视频生成正迎来新的变数。
2023 年,Runway 发布文生视频/图生视频大模型 Gen-2 ;2024年初, OpenAI 的 Sora 展览视频又掀起了一波讨论,但现在 Runway 缺少汉化版, Sora 还处于未公开阶段,被外界戏称为期货,而看到这个空窗时间,国内也见缝插发布相关模型/应用,发布者是国内最大的两个短视频平台——抖音和快手。
今年 6 月份,Aautorapper开启了AI大模型使用申请,号称“世界上第一个普通用户可以使用的真实视频生成大模型”,之后不断升级。 7 月 25 每天全面开放内部测试,会员制度正式上线;然后是 7 月底和 8 月初,字节的即梦AI 1.0.0 在此之前,版本正式上架到安卓/苹果应用商店, 5 月份,剪映 Dreamina 正式宣布其品牌的中文名为“即梦”,并在网上推出。 AI 视频生成功能。
与国外不同的是,国内AI视频生成的大模型确实是由最大的两个短视频平台先发制人进入的。但具体来说,即梦AI的初始应用布局与可灵AI不同,对母公司的意义也大不相同。毕竟字节里有豆包。对于快手来说,可灵AI更接近于“全村希望”这个角色。
另外一方面,两者产生的AI视频风格明显不同,即梦似乎更擅长动画风格,可灵却卷入影像风格。两者的区别与之前的规划无关。虽然不能说明彼此方式的优缺点,但从目前的舆论来看,视频风格的AI视频似乎更加新鲜。
01、即梦VS可灵,特征和地位大不相同。
从目前的舆论偏好来看,字节即梦AI的视频生成表现不如快手可灵AI《新立场》认为,这源于其各自的视频编辑平台剪影和快影本身的不同特点,以及整个字节和快手对AI的规划。
作为一个独立的移动应用,剪影的即梦AI需要更长的上线周期,而Aautorapper选择直接在其视频编辑平台的快影上搭载移动应用,大大缩短了功能全面上线的周期和难度。
然而,关于剪影为什么要重新开发一个应用程序,在《新立场》中,剪影必须独立开发一个应用程序,无论是从月活需求、App规模还是收费模式来看。
先剪映自己的月活用户在整个手机上视频编辑这条赛道看起来早已一骑绝尘,根据这条赛道, Qusetmobile 以前的数据显示大约有一亿,这甚至不包括国际版的剪影。 CapCut ,所以剪影更需要考虑的是将其直接集成到剪影本身的App上。
因为剪影上已经有了关于AI图片生成图片的功能模块和特定模式的图片生成视频模块,剪影本身吃手机内存非常多,如果把即梦AI的视频生成所有功能作为一个模块植入剪影,剪影本身就会变得更加臃肿。
此外,收费模式的平衡也是一个问题,如果将即梦AI直接植入剪影,则只有两种收费模式:1、一刀切直接提高剪影整体会员费用,2、或者在会员费用的基础上,即梦AI相关功能另外收费。但是现在剪映的会员费用已经不低了,这两种方法对于原来的剪映用户来说都是不可接受的。
但是对快手的快影来说,这三个方面的情况正好与剪影相反:与剪影相比,月活提升空间更大,可以依靠更强大的AI功能模块进行引流;App本身规模不大,原来的会员费用远低于剪影。目前剪影包的年会员费是499元,而快影继续包年88元,还有很大的提升空间,所以可以灵活使用AI。植入作为功能模块是目前较好的解决方案。

另外一方面,可灵AI与即梦AI在内部的地位大不相同。
在字节系统中的应用中,除了即梦AI之外,还有聊天机器人豆包,豆包和即梦一样有独立的手机端。 App,而且还植入了像飞书这样的字节应用平台。根据 Similarweb 的榜单,在 7 月份,豆包的访问量已排在国内第四位(前三位是Kimi,文心一言和通义)。此外,字节在网络层还有其它AI应用,如猫箱、星绘等,但是由于这些应用的存在感并不高,这里就不赘述了。
另一方面,快手,早前发布的酣畅大模型在应用上并不大,可灵AI应用一上线就引起了广泛关注。
8 月 27 日本,在快手的光合创作者大会上,快手盖坤透露,已经超过了 160 万人使用快手视频生成大型可灵AI,累计生成超级可灵AI。 1600 一万个视频。甚至在那里 7 月的 Similarweb 榜单上,可灵AI在国内排名第一 18 位置,是国内视频生成AI应用中排名最高的。
只是因为即梦AI的原因 app 正式上线和可灵AI的内测开放都是在 7 月亮,我们还需要等待 8 为了获得进一步的观点,月度榜单的发布。
据悉,早在 Sora 视频发布后不久,有关人士猜测其模型为“Diffusion模型与Transformer模型相结合”,简单地说就是 Transformer 理解文字,Diffusion 拓展照片。但是在可灵AI官网的介绍中也提到:“基于对文本-视频语义的深刻理解和深刻理解 Diffusion Transformer 架构。”
根据业内人士的说法,这种结构在今年年初就已经被业界普遍开始研究。换言之,快手开始研究可灵AI可能要早一点。尽管 Diffusion 和 Transformer 结合不能算是Creative idea,然而,当时国内大多数大型模型制造商仍然处于各种通用的百模对决中。选择视频生成这样一条更具体甚至更大的赛道并不容易。
就字节而言,虽然不同的团队负责豆包和即梦,但就上面的列表而言,与即梦AI相比,豆包AI似乎可以帮助字节在当今多方AI应用白热化阶段的出位。所以,可灵和即梦对母公司的意义是完全不同的。
对于快手来说,可灵AI自然接近于“全村希望”这个角色。
02、即梦擅长动画风格,可灵卷向影像风格
OpenAI 目前在全球 AI 除了自身技术的领先,世界领先也与其优先发布奠定的用户心智和获得更多真实数据培训机会有关。只是问题是,在OpenAI看来,视频生成AI的第一手优势是否会对聊天机器人AI产生如此大的影响可能不大,否则 Sora 也不会那么不慌不忙。
实际上除去 OpenAI 这个极端案例,就国内而言, AI 对于聊天机器人来说,简单的时机优势并不重要,即使是原来平台的规模优势也不重要。 OpenAI 之后,国内大厂首先刷存在感的大模型就是百度的文心一言,2023 年 3 月份已经上线,目前流量排名第一。 AI 应用程序是独角兽 Kimi ,上线于 2023 下半年。
原因在于,聊天机器人这条赛道,Kimi 它占据了某一特定内容模式的先手优势。
以 Kimi 与文心一言、通义等AI方式相比,大厂的这些AI方式 AI 聊天机器人从一开始就学会了 OpenAI 的 GPT ,朝着更全面、更通用的方向前进,这必然会导致无论是获客方面还是模型训练方面都会广泛而不精。而 Kimi 虽然它也是一个通用的大模型,但它有一个非常准确和高效的切入点——主要应用领域是专业学术论文的翻译和理解,协助分析法律问题,快速理解AAPI开发文档等。不言而喻,这方面的内容更具逻辑性,对于 AI 相对来说,理解和输出相对容易。
换句话说,Kimi 与大厂相比,月亮背后的暗面更早引导了早期的核心付费用户和商业模式。此外,充足而坚定的营销投入和精准的营销客户获取渠道有利于 Kim 在内容质量上实现滚雪球的生成。
根据《智能涌现》的报道,月亮暗面在哔哩哔哩的人均成本报价高达 30 元左右。 这一价格不仅在AI界,而且在大多数领域也非常昂贵。 就竞价广告而言,其更高的出价也意味着将分配到更多的流量。 但也许对Kimi来说是值得的,毕竟它的核心受众与哔哩哔哩用户的重合度也比较高。
但是在视频生成AI这条赛道上,可灵AI也掌握了内容模式的先手优势。
事实上,目前市场上并不缺乏特定模式下的AI视频生成应用,比如各种以前非常流行的AI动画风格、瞬息全宇宙风格、各种日常游戏风格、特定动态表情在静态人物照片中的应用...这些应用通常体积小,更容易商业化。例如目前抖音用户正在尝试的“AI拥抱”——输入两人独立的照片,就可以生成两人拥抱的动态视频。
据报道,这个功能来自一个叫做魅脸的小程序。但是这个小程序的商业化方式很粗糙,安卓生成三个拥抱视频收费9.9元。而且这个小程序在抖音和快手都有。
但很明显,以上AI视频的内容并不能完全震撼行业,只能作为C端用户的日常娱乐。与Aautorapper用户相比,Tiktok用户更喜欢讨论生成AI相关信息(以两个平台月活用户和AI话题访问量的比例差距获取)。
不知道有没有受到自己平台这些视频内容模式的影响。无论是今天社交媒体上的一些评价结果,还是《新立场》的独立评价结果,即梦AI产生的内容在一些特定的底图和描述下确实表现得更好;更多的时候,Aautorapper的可灵AI产生的视频,物体动态和光影更自然,画面质感更好。但在移动端,可灵AI生成的内容比即梦AI慢。
上述两段视频是同一张花卉照片作为底图,输入相同的描述词后,两个AI各自产生的效果。即梦AI的形成内容更加奔放动画,而灵魂AI则是一种更加抑制和有气场的形象感。目前的舆论确实更倾向于认同后者的自然形象风格。
换言之,可灵AI也许跟着。 Kimi 同样,我提前想清楚了自己首先要服务的核心用户和内容方式——对图像要求更高的群体,预计只有这种内容方式才能给行业带来一些新的变数。
此时再看抖音方公布即梦AI这个中文名,快手的可灵AI很可能已经为上线做好了准备。
03、写在最后
但由于Tiktok各自掌握着庞大的视频内容宣传渠道,如果有一天Tiktok的即梦AI产生的内容确实让客户更加惊叹,依靠自己的平台向用户传递这些信息并不难。
就像一些特定的小程序或者AI应用一样,之前只有一个热门的挑战和热门的视频才能掀起新一轮的图片视频浪潮,那就是梦想AI当然可以利用自己平台的优势实现口碑翻转,但是用户可能很难以原始动画风格的内容形式走红,用户可能会对这些动画风格的内容失去新鲜感(动画角度的版权问题更大)。
所以即梦AI下一步需要继续发力的点,或许就是可灵AI的影像风格。
另外,即使是Kimi、目前阿里、百度等大厂商主导的聊天机器人赛道相处融洽,但快手和Tiktok驱动的AI视频生成浪潮效果立竿见影,考验了模型本身的内容生成质量和进化速度。接下来,其他大型模型制造商很可能会加入AI生成视频的竞争。
按照这篇文章的逻辑,腾讯拥有视频号和强大的配套娱乐产业,在过去的互联网厂商中似乎更有优势,但那是另一个故事。
*题图及文中的图片来源于网络。
本文来自微信微信官方账号“新立场Pro”,作者:X X,编辑:王威,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




