高可控视频大模型Vidu科技发布。 Q1:所有动作行为都可以精确调整

04-03 07:50

IT 世家 3 月 29 清华大学人工智能研究院副院长、学生数学科技创始人、首席科学家朱军今天发布了高可控视频模型。 Vidu 官方声称,Q1是行业内第一个高可控性 AI 视频大模型


IT 这个家庭从官方获悉,Vidu Q1 可控制多主体细节(特别是动作、布局)、在音效同步可控、画质提升等方面都取得了显著的效果。例如,在语义指令的基础上,通过将参考图的视觉指令融入其中,Vidu Q1 对场景的支持进一步控制多主体的位置、大小、运动轨迹等属性。准确调整所有动作行为(出场、离场、站姿、行动路线)


它支持音效同步可控功能,可以保证视频环境和画面过渡,Vidu Q1 可以导出产生相应的音效,并且可以精确控制每段音效的长度,精确设定每段音频出现的时间点,如 0-2s 风声、3-5s 雨声等


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com