AI视频生成:技术创新与商业竞争之路
The following article is from RimeData 来觅数据 Author 来觅研究院
导读:2024 年 12 月 30 日,爱诗科技旗下 AI 视频生成模型 PixVerse V3.5 正式上线后,在生成速度、运动控制、动画效果等方面取得了显著进步。 PixVerse V3.5 Turbo 在极速生成模式中,最快 5 秒、均值 10 秒生成视频,进一步推动视频生成 AI 普及视频生成。自 2024 年 2 月 OpenAI 首次发布 AI 视频生成模型 Sora 到目前为止,快手、字节跳动、腾讯、谷歌等多家企业也相继推出。 AI 视频生成模式,市场竞争日益激烈。AI 录像生成现状如何?商业化进展如何?怎样进行投融资?试着对这篇文章进行分析和讨论。
01 AI 视频生成现状
AI 视频生成是指人工智能相关技术,如深度学习、自然语言理解、计算机视觉等,自动生成视频内容的过程。与制作传统视频相比,AI 视频生成商品具有以下特点:(1)效率:AI 视频生成产品可以在短时间内快速生产视频,大大节省了人力和时间成本。例如,制作一个常规的宣传视频,制作传统视频可能需要几天甚至几个星期,但是 AI 视频生成商品只需几分钟至几小时;(2)灵活性:用户只需调整文本描述、基本参数等,AI 视频生成商品可以根据用户的不同需求和输入条件生成多样化的视频内容;(3)创新:AI 该技术为视频创作带来了丰富的思路和风格,帮助用户打破传统创作的限制。
AI 从最初的图像拼接生成阶段到最初的图像拼接生成阶段,视频生成技术的发展经历了多个阶段 GAN(生成对抗网络)、VAE(变分自编码器)、Flow-based(流动模型)的应用,再到自回归和扩散模型的兴起。早期的视频生成主要依靠图像拼接技术,通过将静态图像序列拼接成视频流,但是这种方法产生的视频质量低,连接性差。2016年深度学习技术的突破 年后 GAN、VAE、Flow-based 等待技术开始应用于视频生成,生成视频的质量和连接性得到显著提高。2020 2008年至今,回归模型和扩散模型的出现进一步推动了模型的出现 AI 随着视频生成技术的发展,视频内容更加真实和连贯,应用领域也更加广泛。
当前 AI 从试验阶段到产品化,视频生成技术逐渐转变为产品化, AI 该领域的重要支系。快手,字节跳动,OpenAI、Runway 许多国内外企业和研究机构都在技术研发和产品创新上投入了大量资源,促进了技术研发和产品创新。 AI 视频生成行业发展迅速。比如,OpenAI 发布的 Sora 高质量的视频可以根据文本、图像和视频输入生成,其使用方法 Transformer Diffusion 模型组合,实现视频生成的连贯性和准确性,验证 Transformer 和 Diffusion 模型与实效相结合,为 AI 对视频生成的研究提供了新的思路和目标。
虽然 OpenAI 率先发布 Sora,在 AI 在视频生成领域具有先发优势,但国内企业不断追逐,模型性能不断提升,目前爱诗科技的发展 PixVerse、快手可灵等 AI 在整体性能上,视频生成模型表现出色,甚至在许多方面已经超越了它。 Sora。据 AGI-Eval2024年(上海交通大学、同济大学等高校与机构合作发布的大型评估社区) 年 12 月,PixVerse-V3、Kling1.5、Video-01 评分(评分层面包括视频 - 超越文本一致性、视频质量、运动质量等) Sora。
图表 1:2024 年 12 月文生视频模型评价榜单 Top10
信息来源:AGI-Eval、RimeData 来寻找数据整理
AI 在视频生成领域,参与者众多,行业仍处于起步阶段。AI 主要的视频生成参与者包括:
(1)大型因特网 / 技术公司:腾讯,字节跳动,快手,谷歌等全球互联网 / 凭借自身在人工智能领域的强大积累和强大的技术实力,科技企业先后推出了多个有影响力的企业。 AI 视频生成模型;
(2)创业公司:爱诗科技,生数科技,OpenAI、Pika、Runway 许多创业公司都有创新的思维和技术水平, AI 积极探索和创新视频生成领域,为市场注入新鲜血液和活力;
(3)科研机构:由央国企建立的 AI 研究所和新的R&D机构,如 TeleAI(中国电信人工智能研究所)、在政策支持和资源投入方面,智源研究院等具有优势,致力于推动 AI 研究、开发和应用视频生成技术。
但是许多企业的进入,也在加剧, AI 在视频领域的竞争水平。自 2024 年 2 月 Sora 发布以来,AI 视频生成的商品已经取得了很大的进步,基本生成时间也在增加。同时,这些 AI 在分辨率、帧率等方面,视频生成商品也有了很大的提高,产生的视频效果不断提高。AI 视频业技术不断创新,商品迭代速度快,整体市场竞争格局仍然比较分散。
02 AI 视频生成商业化进展
现阶段,AI 在视频生成领域,主要通过视频生成领域不断探索商业化路径 To C 端和 To B 实现商业化的两种服务模式。To C 终端主要提供付费订阅服务,如快手可灵、字节即梦、智象未来。(HiDream.ai)等等,这些平台提供免费版、专业版、高级版、专属版等不同级别的订阅服务,价格从每月几元到几百元不等。To B 终端主要通过 API 接口和解决方案服务,如Aautorapper、生数技术、爱诗科技等。,包括影视、互联网、营销广告等。,而且价格从每月几十元到几万元不等。
部分 AI 在商业化方面,视频生成商品已经取得了初步的成果。例如,爱诗科技的关键 AI 视频生成商品 PixVerse 全球用户数累计已经超过了 1,200 万,月活跃用户数接近 600 万,其通过 C 终端产品功能不断优化和拓展,如内置数十个特效模板等,降低用户使用门槛,实现用户增长和商业实现。
快手可灵累计服务客户超超服务客户 600 万,累计生成超 6,500 一万个视频,1.75 一亿张照片,截至 2024 2008年第三季度,可灵的商业化月流量超过1000万元。HeyGen 在 2022 年 9 月推出 AI 录像创作应用之后,7 个月内 ARR(年度常规收入)达到 100 万美金,在 2023 年末其 ARR 达 1,800 万美金。爱诗技术,快手可灵,HeyGen 市场表现,表明市场对立 AI 对视频生成的需求很大。
但 AI 长期来看,视频生成仍然面临着商业化的困境。就产品层面而言,AI 视频生成商品一次生成的视频时间较短(一般不超过 60 秒),等待时间长,视频生成效果不稳定,存在事实错误、一致性不足等问题,需要加强其复杂的场景和真实感。另外,高额的会计成本和服务器资源需求也限制了商业化进程。在市场上,普通用户对视频生成的需求较低,媒体从业者、视频制作人等对视频生成的需求较高,但现有产品无法满足其工作需求。而且影视产业接近 3 多年来相对低迷,如今对 AI 对视频生成的需求也很低。
03 AI 生成视频市场规模
AI 有望进一步扩大视频生成的市场规模。据 Fortune business insights 测算,2024 年全球 AI 大约是视频生成市场的规模。 6.1 亿美元,预计到 2032 年将达 25.6 亿美金,2024-2032 年度复合增长率约为 19.5%。AI 以下是视频生成市场规模持续增长的主要驱动因素:
(1)AI 生成视频的成本低:AI 制作视频的成本远低于目前制作视频内容的成本。根据量子位智库的数据,顶级动画电影(迪士尼、皮克斯等)每分钟的制作成本约为 200 万美金,而 AI 每分钟约为视频生成的内容成本 300 美金,降本效果显著;
(2)应用领域普遍:AI 视频已经逐渐应用于影视制作、广告推广、短视频、电子商务、动画等诸多领域,有效提升了各个领域的视频制作效果,降低了制作成本;
(3)内容视频化是主流趋势: QuestMobile 显示,截至 2024 年 9 月份,移动视频行业整体月活客户规模达到 11.36 亿,视频已经逐渐成为流量的核心。此外,在 2024 年 10 华为董事长梁华在月中国移动全球合作伙伴会议上表示,目前网络视频流量占数据流量的比重 用户对视频内容的依赖程度高于70%;
(4)技术创新:深度学习、神经网络、自然语言理解等关键技术的突破, AI 为视频生成提供了强大的技术支持, AI 更高效、更准确地生成和操作视频,从而生成更真实的视频内容;
(5)政策支持: AI 随着行业的快速发展,中国和地方政府出台了一系列政策文件,大力支持资金、人才和政策,加快人工智能相关技术与行业的融合。
图表 2:2023-2032E 全球 AI 视频生成市场规模(亿美元)
信息来源:Fortune business insights、RimeData 来寻找数据整理
04 AI 录像生成投融动态
AI 视频生成领域的技术不断迭代升级,可以逐步生成视频时间更长、场景更复杂的视频内容,进一步拓宽应用范围,增强投资者的信心。2024 年,全球 AI 在视频生成领域,融资规模合计已经超过 600 一亿元,整体以初期融资为主,行业仍处于快速发展阶段。
与此同时,知名投资机构、工业投资基金、科技巨头等多元化投资主体参与 AI 视频生成领域的融资,比如启明风险投资参与生数技术的融资,蚂蚁集团、北京人工智能产业投资基金(北京国家管理公司)参与爱诗技术的融资,百度参与生数技术的投资,不同背景的投资者也是 AI 为视频生成领域的发展提供了强大的资金支持和多样化的资源。
下表是 2024 年 AI 有兴趣的读者可登录视频生成跑道1亿元以上的投融事件。 Rime PEVC 平台获得 AI 全额融资案例、被投项目及视频生成领域深度数据分析。
图表 3:2024 年 AI 视频生成跑道1亿元以上的投融事件。
信息来源:RimeData 来觅数据
本文的内容是基于寻找可靠的公开数据或实地调查数据。我们力求本文内容的客观性和公正性,但不保证或隐含本文中提到的信息、观点和数据的真实性、可靠性、时效性和完整性,也不承担相关法律责任。受研究方法和数据获取资源的限制,本报告的所有内容仅供参考,对任何人的投资、商业决策、法律等操作都不构成任何建议。任何时候,对于因参考本报告而产生的任何影响和后果,寻找数据都不承担任何责任。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




