字节,快手,快手,Vidu升级了“刷野”,AI视频小步快跑
光锥智能在9月份版本更新后,从生数科技联合创始人、CEO唐家渝朋友圈了解到,本周将重新更新Vidu大模型版本,Vidu-1.5版本即将上线。
本版本的更新方向仍然是大模型泛化能力和主体一致性的关键问题。上一个版本的关键是单个主体的一致性,而最新版本可以理解和整合人物、对象、环境等概念。,并在30秒内按照客户指令生成多个主体整合的相关视频结果,率先在视频创作中生成多个主体的一致性。
除了Vidu,从今年9月到现在,据不完全统计,包括字节下的即梦AI。、快手可灵AI、Runway、爱诗科技PixVerserser智谱清影、主流的AI视频生成平台,如Pika,已更新版本。

目前,在流行的AI视频生成轨道上,大型企业和互联网制造商纷纷进入市场。然而,经过前期产品发布的密集阶段,他们现在已经进入商品迭代升级竞争阶段。
通过各种版本更新的内容,不难看出,AI视频生成大模型能力迭代的大方向,仍然是生成视频的时长、画面的稳定性、连续性以及主体前后的一致性。
但另一方面,在实际功能应用中,每个玩家都开始出现“分割”,各有侧重,一些中小玩家也逐渐找到了自己的目标市场。
比如Runway的最新版本更新了Actt角色,可以准确地将真人的面部情绪复制到AI角色。-One,AI摄像头控件可实现3D化。PixVerse推出了各种万圣节特效、毒液特效等。
星贤文化创始人、AI原创玄幻IP《山海奇镜》制作人陈坤对这一轮AI视频生成平台进行了更新,认为“最大更新应该是Act-One的表情转移,提供了人物表演的基本概率。”至于人物主体的一致性和稳定性,“有进步,但没有跨代型进步。”
在AI视频创作者尾鳍Vicky看来,与上半年初的产品相比,最新更新的AI视频平台不仅更新了底层模型能力,还更新了头尾针、画质、帧率补充、配音等功能。“这个功能的完善其实比上半年更全面。”
假设2024年上半年是AI视频生成赛道的军备竞赛,那么下半年将进入小步快跑版本更新周期。
现阶段,字节与Aautorapper的对抗仍在激烈进行中,中小厂商开始找到自己独特的跑道,部分企业专注于走国外市场,也达到了“国内盛开,墙外香”的效果。
毫无疑问,这个阶段的战斗看似温和,实质上影响了平台本身的定位和未来的发展方向,以及后续用户群体和数量规模的可持续增长。
字节狂追,快手抢跑
AI视频生成平台用户给出的客观评价是:“即梦有些落后。
作为去年第一批AI视频生成平台和字节产品,即梦AI的视频生成效果一直受到用户的批评,被Runway批评、Pika等同一批玩家吊打状态。
今年6月,字节在短视频领域的直接竞争对手——Aautorapper正式在官网推出了“可灵”视频生成大模型,并迅速走红。与此同时,越来越多的AI视频生成平台如雨后春笋般涌现,AI视频生成跑道完全走红。
在强大的竞争压力下,作为中国AI产品的第一梯队,弥补视频生成的短板已经成为字节跳动面临的重中之重,追赶的速度超乎想象。
九月二十四日,2024火山引擎AI创新巡展在深圳举行,原抖音艺术负责人陈欣然作为即梦AI、剪影市场和运营负责人亮相,并宣布即梦AI已接入豆包的最新视频生成模式。
与此同时,字节跳动发布了两个视频生成模型Seaweed和Pixeldance的豆包模型家族,并通过即梦 AI、各自面向创作者和企业客户的火山引擎小范围邀请测试。
十一月八日,字节跳动旗下AI内容平台即梦AI宣布,Seaweed由字节跳动自主研发的视频生成模型正式向平台用户开放。
据字节跳动介绍,本次开放使用的豆包视频生成模型Seaweed是该模型的专业版本,生成高质量的AI视频只需60秒,时间为5秒,领先于国内行业3-5分钟的生成时间。
即梦AI还表示,最近Seaweed和Pixeldance两个视频生成模型Pro版本也将开放使用。Pro 版本模型可以实现自然连贯的多拍动作和多主体的复杂互动,突破多镜头切换的一致性问题。在切换镜头时,可以同时保持主体、风格和氛围的一致性,适应电影、电视、电脑、手机等设备的比例。
字节抖音和快手,作为中国短视频平台的领导者,双方的竞争已经从短视频和电子商务转移到人工智能领域。客观地说,抖音在各个方面都很快。但只有在人工智能领域,快手才给出了一个漂亮的反击。
自从六月一鸣惊人之后,快手可灵实际上已经有了几个小版本的迭代。
但在底层大模型能力方面,今年9月20日,Aautorapper发布了可灵1.5版本,访问了新一代模型,大大提高了画质和动态质量。原模型还增加了新功能——运动刷,增强了生成效果的可控性。
AIGC企业家土豆酱AIgen(艺名)对光锥智能说:“可灵1.5非常强大,可以说是所有模型中最真实的,吊打Runway,基本解决了以前的人物变形问题。
在视频效果的实际产生中,通过对比可灵和Runway可以看出,同样的提示词在实际人物主体的稳定性上有很强的效果,但可灵产生的视频效果可以自动解锁面部情绪。
“Runway实际上可以独立产生面部情绪,但效果非常奇怪。”土豆酱AIgen说,但灵性AI和Runway的能力是随机的,不是固定的。
其实可以看出,可灵AI和Runway在实际生成效果上更胜一筹,可灵AI确实在理解提示词方面处于领先地位,但未来还是要不断迭代升级,才能固化这种能力。
(Runway,提示一位身着新中式服装的女模特儿,正在展示自己的造型,背景是彩烟飘落,土豆酱AIgen提供)
(可灵AI,一个穿着新中式服装的女模特,正在展示自己的风格,背景是五颜六色的烟雾飘落,AIgen提供土豆酱)
然而,在最新的即梦视频生成大模型后,尾鳍Vicky认为它在模型能力和UI设计上与灵魂没有太大区别。同时,在内测即梦平台Pro模型时,可以轻松控制画面的运动范围和动作。
AI视频生成轨道布局作为中国头部短视频平台、Aautorapper和字节,最终目的是吸引和留住用户的注意力,这就需要不断创造新颖、优质、新颖的内容。
因此,AI短剧也成为字节即梦与快手可灵竞争的焦点之一。
今年7月,由“可灵AI”创作的AI短剧《山海奇镜之劈波斩浪》引起广泛关注,成为中国第一部AIGC原创奇幻短剧。
9月,Aautorapper星芒短剧联合“灵魂AI”推出“星有灵犀-AI短剧创作大赛”。据悉,比赛鼓励更多人通过流量奖励、荣誉奖励、内容签约等方式加入AI短剧创作。
字节也不甘落后,即梦AI在联合博纳影业发布首部AIGC生成科幻短剧《三星堆:未来启示录》的同时,也在联合抖音平台的多位“非常创作者”中实现了同样的创作。邀请平台拥有高质量的粉丝和知名度的大咖,共同加入“非常创作者联盟”计划,希望打造中国最大的虚拟创作社区。
但现阶段,其视频平台的影视创作者创作的内容,无论是视频还是Aautorapper,都“很难打破圈子。”尾鳍Vicky说:“因为整个行业还没有形成,C端用户不知道用它做什么。头部会有一些商业需求,但需求不多,整体不稳定。”
归根结底,目前世界上的专业创作者还比较少,AI视频生成大模型技术还处于起步阶段。
因此,作为头部视频平台,字节和Aautorapper之间的竞争越来越激烈。除了底层的AI技术和商品之争,更重要的是谁能率先探索技术赋能内容的道路。归根结底,如果平台能够聚集更多具有创新意识的内容创作者,就能创造出更受客户关注和喜爱的社区生态。
当然,除了字节和Aautorapper之外,AI视频生成赛道上的其他玩家也开始“分离”,一些中小厂商也开始探索和走出自己的差异化竞争之路。
目标性市场的崛起,找到自己的定位才是王道。
在颤音、Aautorapper等短视频平台上,有些创作者可能很难打破圈子,但有些视频,包括鬼畜特效,却异常受欢迎,比如AI产生的何炅和黄磊突然打架的视频。

对于AI视频生成跑道的玩家来说,如果字节和Aautorapper是技术和内容生态模式的全方位竞争,而其他中小玩家则更注重细分赛道,找到自己的平台和市场定位,这将成为生存和发展的基础。
十月底,RunwayCEO在公开信中明确表示, “我认为Runway不是一家AI公司,而是一家媒体和娱乐公司,” AI 企业的时代已经结束。”
基于此,Runway显然在AI视频轨道上走出了自己的特色——做专门为艺术、媒体和娱乐服务的AI,当各大公司争相卷入AI视频生成长度、真实性和流畅性时。
从Runway的具体视频生成效果来看,其在人物稳定性和一致性方面的效果可以说是领先。除了基本的技术能力,Runway在最新版本更新中推出的两个新功能都很小,但它们将为动画师、游戏开发者和电影制作人提供极大的便利,节省巨大的成本。
Runway可以说是影视从业者中最受欢迎的产品之一,除了技术水平之外,更重要的是性价比。
“ Runway真的很香,我们用可灵都是省着用的,但是Runway的次数是无限的,一天抽几百次也没关系。”土豆酱AIgen说,“AI视频的随机性还是很强的,如果按次收费,一般创作者可能很难承受这个成本。”
另一方面,如果用1000元买积分,可以买15000元的灵值,每次用35元的灵值,1000元只能生成428次。对于真正的企业家来说,基本上是不够的。“根据我每天在Runway生成200多个视频的次数,1000元买的积分基本上2天就烧完了。”土豆酱AIgen说。
在光锥智能的最后一段“爆炸”AI视频中,大厂向左,创业向右”一文中也提到,对于现阶段各平台采用的会员收费方式,对于不能商业化闭环的创业者来说,后续的付费率和付费意愿都不会很高。现在看来,性价比也是影响其产品使用的重要因素,即使是能够实现商业闭环的创业者。
Pika和Pixverse除了Runway之外,还找到了自己的跑道。从他们最新的更新版本中,我们可以看到这两个关键是训练一些用户可以直接使用的特殊效果。“虽然描述可能不合适,但有点接近之前抖音做的贴纸。”土豆酱AIgen说。
比如10月底万圣节期间,PixVerse V3版增加了很多万圣节主题的特效,包括僵尸模式、巫师帽、怪物入侵等主题效果,以及类似Pika的热门AI捏捏特效。视频增加功能,用户可以为现有视频增加5-8秒的额外内容,准确控制新片段的内容方向。
而且随着近期电影《毒液:最后一舞》的上映,PixVerse基于PixVerserse的最新视频模型 V3推出了“我们是毒液”的新特效视频效果,可以一键生成酷炫的毒液动画。
目前,这种鬼畜特效在社交平台上非常受用户欢迎。在此之前,Pika在1.5版本中推出了AI捏捏的特效。一经推出,就深受用户喜爱,也通过这波特效完成了弯道超越。其实和Pika差不多时间开始增长的海螺AI,也是通过人物表演和meme表情图直接引爆了海外舆论,超越了弯道。

AI捏捏特效Pika
事实上,虽然海螺AI推出较晚,但业内从业者对海螺AI的评价并不低。“海螺AI在人物动作上表现出色。最近,何炅和黄磊打架的AI制作了一个视频,是通过海螺AI制作的。”土豆酱AIgen说。
然而,海螺AI更重要的是完成了“国内盛开,墙外香”的效果。MiniMax作为中国AI企业在国外推出的AI视频生成平台,一经推出,搜索热度持续上升。
据“AI产品清单”统计,9月份海螺AI网页页面浏览量大幅增长860%,在9月份全球和国内增速排名第一。海外客户在社交平台上分享了自己的体验,广泛认为海螺AI是目前市场上最好的AI视频生成工具之一。
而且凭借商品在海外市场的爆红,MiniMax在商业化方面,已经走在了大型六小虎的前列。
相比之下,在主体一致性和人物稳定性方向上,Vidu、智谱清影等平台正在不断进化,但还没有形成自己风格的赛道和独特的竞争优势。
虽然AI视频生成技术在不断进化,但具有特色的细分赛道也在衍生出来。但信达证券研究报告也表明,AI视频生成技术需要进一步提高人物一致性、所需时间和画质,以满足商业化水平。
与此同时,目前主流的AI视频工具还处于视频生成竞争阶段,大部分都是单一功能产品,为了实现直接导出商业视频的效果,仍然需要串联使用各种不同的视频创作工具。
未来,AI视频将生成一个大型平台,并不断迭代进化。
本文来自微信微信官方账号“光锥智能”,作者:白鸽,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




