高可控视频大模型Vidu科技发布。 Q1：所有动作行为都可以精确调整

2025-04-03

IT 世家 3 月 29 清华大学人工智能研究院副院长、学生数学科技创始人、首席科学家朱军今天发布了高可控视频模型。 Vidu 官方声称，Q1是行业内第一个高可控性 AI 视频大模型。

IT 这个家庭从官方获悉，Vidu Q1 可控制多主体细节(特别是动作、布局)、在音效同步可控、画质提升等方面都取得了显著的效果。例如，在语义指令的基础上，通过将参考图的视觉指令融入其中，Vidu Q1 对场景的支持进一步控制多主体的位置、大小、运动轨迹等属性。，准确调整所有动作行为(出场、离场、站姿、行动路线)。

它支持音效同步可控功能，可以保证视频环境和画面过渡，Vidu Q1 可以导出产生相应的音效，并且可以精确控制每段音效的长度，精确设定每段音频出现的时间点，如 0-2s 风声、3-5s 雨声等。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

张家朗:遇到挫折不要忘记你的主动心态，支持第十五届全运会。

怎样适应人工智能时代-与吴恩达的对话？

3.30 陕西ZAKER 新闻晨读

许多专家，如赛力斯高管和中国教授，支持增程车:这就是未来比纯电有很多优点

鸿蒙微信1.0.深夜5.34重磅更新：支持微信运动双端登录