整整300天,Sora终于引爆了视觉核弹。
最强期货Sora从2024年2月15日到2024年12月10日间隔300天,最强期货Sora从预告到最终问世。
12天春晚,OpenAI在大洋彼岸打造的Day。 山姆奥特曼终于正式发布了Sora。 V2版本。V1版从未正式推出,曾通过演示视频给大家带来震撼。
这一次,OpenAI发布了一个更高端、更快速的版本—Sora Turbo,给ChatGPT带来 Plus 和 Pro 客户。

Sora重新定义了世界模型,就像1984年的Mac一样,“Sora 它是人工智能理解和模拟现实的基础,是开发能够与物理世界互动的模型的重要一步。”
01 让我们看看这次发布 Sora 最后呈现的能力
• 支持高达的分辨率 1080p、时间最长 20 第二个视频,格式可以是宽屏、坚屏或者方形。没什么,国产AI都可以。与国内最长的2分钟相比,Sora的指标仍然落后。
•但是,重要的是,Sora配备了分镜工具,故事板工具(Storyboard)可以让用户准确指定每一帧的输入。用户可以通过在时间线上拖动和间隔卡片、添加字幕和上传源媒体来调节节奏,同时保证适度的间距,防止突然转换。
• 提供文字生成视频(text-to-video)、生成图像视频(text image-to-video)、生成视频剪辑(text video-to-video)。这个没什么,国产AI也可以实现。
• 感觉简单生成并不好玩,OpenAI加入了OpenAI。Remix和Blend两个新功能。也就是说,用户可以选择自带材料进行扩展、混响和混合,或者从文本中生成全新的内容。
也就是说,你可以使用它。修剪和延长Recut修剪和延长(再剪辑)、再一次混合创造新的变化,混合视频之间的过渡。在现场演示中,猛犸象和机器人混合在一起,走在沙漠里。

• Sora可以添加很多帧,连接两个不相关的开头和结尾。据说很多测试艺术家都非常喜欢这个视频循环功能。
• 内容板块包括“优选”和“近期”。Explore,帮助每个人从社区中汲取灵感。
事实上,在这次短暂的直播中,Sora产生的案例视频并没有太多精彩的呈现,而是重点介绍了Sora产品的性能特点。
年轻人舞蹈和OpenAI创意专家ChadNelson在日本艺术家创作的80年代 展示在伦敦 Sora V2 录像,体现了多主体、多视角、多变焦等环境,Sora的场景真实清晰,人物一致,视频延伸等能力。
今日晚点开放后,我们可以感受到Sora,是否是对当前所有视频生成模型的一次辗压。
当然,在Sora闭关迭代的这一年里,国产AI视频也发生了许多变化。
1.Runway:
Runway发布了第三代视频生成模型Gen-3,在保真度、一致性和运动性方面都有了很大的提高。
Gen-3 Alpha模型采用视频和图像联合训练,具有90秒内快速生成10秒视频、并行生成多个视频、模型驱动新文本到视频的特点(T2V)、视频到图像(I2)V)并且文本到图像(T2)I)等功能。
可灵(快手):
快手可灵于6月发布,也是Sora的DiT架构,可以生成长达2分钟的视频,帧率达到30fps。图片视频、文化视频、视频都可以继续写,每天有6次免费机会。
由于其生成时间、效率和视频质量,可灵AI在AI视频生成产品的第一梯队中排名第一,2分钟的形成时间是当今所有产品中的第一,尤其是在真实风格场景中。快手可灵应该是目前商业化最好的,之前已经宣布营收超过1000万。
即梦(字节跳动):
最初的即梦大概也是选择了SDXL模型,当时鲸哥的体验被认为是runway1.0的标准。但在10月豆包发布视频生成-PixelDance模型之后,实际上已经进化到,曾经让我们不再期待Sora了。
配备这个模型即梦AIAI。 2.0在捕捉和理解提示词方面表现出很高的一致性,可以准确控制多个主体,可以高度控制连续动作和连续镜头。超写实效果堪比电影拍摄效果,还支持从第一帧到最后一帧的变化动画。这个功能Sora今天也发布了。
腾讯混元:
最近热议的是腾讯混元正式上线文生视频,全面开源,参数达到130亿,是目前最大的视频开源模式。
混合视频生成模型在文本视频一致性、运动质量、画质等维度上处于领先地位,在人物、人工场所等场景中尤为出色。在保持画面主角不变的前提下,可以实现自动切割镜头。
综合来说,在影像创作、影片生成、短视频内容开发等领域,AI视频具有重要意义。
“AI视频创作者”AI Talk”经理汗青说:“如果Sora能快速提供功能相似的民用服务,那真的是降维攻击。其实对于创作者来说,这个视频中的很多角色都是同一个屏幕,画面的表现力是最珍贵的,完全是另一个层次的东西。什么清晰度和镜头长度其实不是很重要,这是真正创作的人和技术狂热的人从不同的角度看待问题。”
02 现在Sora应该超出很多人的期望,甚至是狂喜。
2023年,成千上万的从业者在好莱坞上街,他们抗议AI带来的挑战和工作机会减少。但是现在,随着Sora的出现,特别是官方表示,他们不想一键生成,而是想促进创造力的发展。真的会有这样的影响吗?
事实上,Sora如此推迟发布,很可能并非技术上的大难题,而是安全隐私保护等问题迟迟没有得到解决。
如今终于有了解决办法,OpenAI在网站上指出:
全部 Sora 生成的视频都有元数据,元数据会将视频标识为来自元数据。 Sora,为了提供透明度和验证来源。虽然不完善,但我们默认增加了可见水印等保护措施,并建立了内部搜索工具。该工具利用第二代技术特性,帮助验证内容是否来自 Sora。
而且对用户非常关心的价格,披露使用 openai plus 你每个月都可以得到账户 50 第二次生成。使用专业帐户,每月可获得。 500 二次快速生成(高分辨率下较少),并且在较慢的形成模式下获得无限生成。

Sam 在直播结束时,Altman说:回到GPT-1的对比,现在还处于起步阶段,它会变得更好。Sora会导致GPT-1。 四是同一波浪潮吗?
本文来自微信微信官方账号“AI鲸选社”,作者:杨晓鹤,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




