到处都可以刷到 AI 录像,真的没有你想象的那么简单。
" 疑似使用了AI 生成技术,请谨慎筛选 "
你有没有注意到,这一行小字有点像? " 广告仅供参考 , 以实物为准 " ,在生活中已经越来越普遍了。
特别是现在的短视频平台。
刷出一段小猫视频,嘴型是 AI 生成的。
来自抖音客户的内容 @墩墩吃不饱
刷一张西游记,还可以看到 AI 妖怪真容。
即使是看动画片,画面也总是 AI 生成的。
AI 录像越来越多。
尽管掀起 AI 视频浪潮的 Sora 仍然难产,但是 AI 录像时代也许已悄然而至。
根据东吴证券的一份研究报告,中国 AI 视频生成潜在的行业空间,可能超过 5800 市场亿元。
但是,随着市场的不断普及,行业中的一些问题也逐渐暴露在公众的视野中:
视频化和 AI 的确是未来,但似乎是费用问题,质量问题,协同问题和性能问题,都萦绕在所有的创业公司,大厂的心头。
以费用和质量问题为例。
众所周知,目前的大型生成模型,尤其是视频,就是一个力大飞砖的过程,需要大量的数据来练习。
而且超大规模的视频训练数据,又会对运算处理数据和数据本身有很大的需求,随之而来的成本上升是一种天文数字。
而且视频模型的训练成本更高,以年初推出的视频模型 Sora 举例来说,他们练习和推理所需的计算能力要求,各自都达到了。GPT-4 的 4.5 倍和近 400 倍。。。
大型训练样品质量、处理链接复杂、涉及多个环节的大模型训练成本除外,应多团队合作;自研 / 第三方, GPU 、 CPU 、 ARM 等待多种异构算率资源,还需要灵活调度布局。
所以,对于很多准备拥抱的人来说, AI 对于视频企业来说,当务之急就是想尽一切办法解决这一问题,这样才能更快地进化。
。
上个月底,字节推出了爆红。 PixelDance ,效果就是杠杆。
那时我们还写了一篇专门为大家唠叨的文章,看看我们简单试用产生的视频效果,就知道还真有些物品哦。
但在 15 在号码结束的火山引擎视频云技术大会上,开场使用定制数字人谭待来与大家交流。
结果很好,现场参与者,很多人都认为这是一个视频抠图。
而且这些高质量 AI 在产出的背后,实际上离不开一个名字。 BMF 的智能框架。
通过与自己的大模型团队的内部合作,火山引擎将大量的视频数据进行预处理。
最后基于火山引擎音视频处理平台 BMF 框架,在短时间内生产出足够高质量的视频模板,用于模型训练,才有了 PixelDance 。
功臣之一的 BMF ,为什么能做到这一点?
在日常生活中,我们用一个例子来解释:
一家公司开发大模型就像你家做团圆饭一样。
为吃一顿丰盛的团圆饭,你爸爸负责买菜,妈妈做饭,奶奶包饺子,你搬桌子板凳。
每个人都应该有分工。从头到尾,他们可能要时不时地打个电话,发个微信互相帮助。最后,好家伙,吃团圆饭要花这么多钱。
而 BMF 正是火山引擎推出的一个 " 团圆饭一键全流程套餐 " ,为您提供一系列的工具和服务,帮助您轻松、快速地准备团圆饭。
本套餐重点解决了我们前面提到的问题。 4 一个行业痛点,进行了相应的调整。
举例来说,为了解决视频训练数据的质量问题,他们采用多种算法对视频进行多维度的分析和选择,实现了完全精细的过滤;
处理性能难题,他们又运用 BMF 灵活调度框架,提前准备好性能。。
这相当于一大早就准备了团圆饭,完成了策略。买菜的时候交给了很多买菜送货上门,五星级厨师专门做饭,桌子板凳安排了专门的小工人打杂。。。
反正就是用了 BMF 这个框架方便、省心、省钱。。
满足了公司这边的需求,火山引擎也没有忘记大家。
现在,每个人的设备计算率都在不断上升,这就是对视频画质提升的强烈需求。
通过独特的优势,火山发动机每天都在抖音上。 / 西瓜等 app ,处理大量的视频照片,面对数亿用户。
在获得如此丰富的经验之后,火山引擎 BMF 在此基础上,沉淀出一种更适合普通用户体质的体质 " BMF lite " ,实现了更轻、更高效、更通用的进化。
举例来说,与云相比,在用户端端,对功耗、内存尤其敏感,而场景则涉及到。 Android 、 ios 、 PC 等多平台。
因此 BMF-Lite 重点构建基于跨平台、资源复用的算法包的框架设计。
简单说就是各平台的接口形式统一,集成布署方便。
再次使用算法控制器重用相同的算法案例,在抖音播放场景中,大部分播放和直播都只能起效一次,可以最大限度地重用资源。
而除了 BMF 火山引擎也提出了以智能为代表的框架。智能计算能力和智能编码解码。
从去年开始,火山引擎直接拿出了一个自研视频转码芯片,将自研视频编码解码技术融入其中。
优势在于,对于视频点播、直播等特定场景,这款转码芯片的计算密度更高。
就这么说吧,一个视频编码解码芯片服务器的转码能力,相当于数百个 CPU 服务器。
今日视频转码芯片上线抖音后,通过实际数据显示,在相同的视频压缩效率下,可以节省成本。 95% 以上。
针对编码层,火山引擎推出了基于自主研发的视频转码芯片。 " BVE1.2 编码器 " 。
该编码器大胆融合了深度学习技术,推出了革命性的智能混合编码解决方案,将传统的压缩技术与深度学习压缩技术有机融合成一个整体,大大提高了编码解码的效率,提高了编码性能。
不久前,第六届深度学习图像压缩争霸赛结束。( CLIC 比赛 )中, " BVE1.2 编码器 " 获得两个冠军足以说明实力。
这套小组合拳下来,感兴趣的厂商,估计脑子里都是满脑子的。 " 支付代码扫描在哪里? " ?
不要再说了,火山引擎的确没有遮掩的打算。
像前面说的 BMF 框架,早在去年就已开源,更新完毕。 BMF lite ,还可以直接开源。
总体而言,目前,大型模型的进化仍在继续,视频 AI 公司之间的竞争也只会越来越激烈。
但是如果每个人都只是故步自封,互相争取成果,用产品说话,就会显得竞争激烈,缺乏合作。
而且作为全中国短视频最熟练的字节跳动,他们旗下的火山引擎一次又一次地打开了内部技术,框架。
特别带来的 BMF 一整套由框架和智能计算能力和智能编码解码组成的智能基础,确实可以帮助企业节省大量的时间和成本,更好地帮助企业 AI 项目建设发展。
这一竞争与合作共存的态度,正是中国 AI 最为乐意看到的场景。
一枝独秀难成林,五彩缤纷才是春天。
发文:八戒
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




