全球首款统一多模态视频大模型问世！可灵AI O1正式发布：一句话即可生成视频

2025-12-03

快科技12月2日报道，可灵AI全新O1视频大模型已全面上线，这款被称作“全球首个统一多模态视频大模型”的产品，成功解决了传统视频生成工具功能分散、操作繁琐的问题。

目前，用户可通过可灵App以及官方网站体验该模型。

区别于以往需要分步骤完成文生视频、图生视频、局部编辑等操作的工具，可灵O1依托创新的MVL（多模态视觉语言）交互架构，能在同一个输入框中流畅整合文字、图像、视频等多种指令形式。

借助Chain-of-thought技术，该模型不仅可以准确理解用户的需求，还具备常识推理和事件推演能力，从而生成逻辑更通顺的视频内容。

举例来说，用户上传一段真人视频后，仅需通过简单的对话指令，就能实现局部元素的添加或删除、镜头前后的智能延展以及根据动作生成新画面等操作。

尤为重要的是，O1采用多视角主体构建技术，彻底攻克了视频中人物或物体在镜头切换时出现“特征漂移”的行业难题，保证了多主体场景下画面的精准和连贯。

除此之外，O1支持3到10秒的自由生成时长，将叙事节奏的掌控权交还给创作者。

无论是短视频博主、广告制作团队还是普通个人用户，都能借助该模型快速制作出高质量、高一致性的创意视频。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com