全球首款统一多模态视频大模型问世!可灵AI O1正式发布:一句话即可生成视频
2天前
快科技12月2日报道,可灵AI全新O1视频大模型已全面上线,这款被称作“全球首个统一多模态视频大模型”的产品,成功解决了传统视频生成工具功能分散、操作繁琐的问题。
目前,用户可通过可灵App以及官方网站体验该模型。

区别于以往需要分步骤完成文生视频、图生视频、局部编辑等操作的工具,可灵O1依托创新的MVL(多模态视觉语言)交互架构,能在同一个输入框中流畅整合文字、图像、视频等多种指令形式。
借助Chain-of-thought技术,该模型不仅可以准确理解用户的需求,还具备常识推理和事件推演能力,从而生成逻辑更通顺的视频内容。

举例来说,用户上传一段真人视频后,仅需通过简单的对话指令,就能实现局部元素的添加或删除、镜头前后的智能延展以及根据动作生成新画面等操作。
尤为重要的是,O1采用多视角主体构建技术,彻底攻克了视频中人物或物体在镜头切换时出现“特征漂移”的行业难题,保证了多主体场景下画面的精准和连贯。
除此之外,O1支持3到10秒的自由生成时长,将叙事节奏的掌控权交还给创作者。
无论是短视频博主、广告制作团队还是普通个人用户,都能借助该模型快速制作出高质量、高一致性的创意视频。



本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




