谷歌使力世界模型

2025-01-10

谷歌将建立一个新的团队来开发模拟物理世界的AI模型，Timm是原Sora联合领导之一。 Brooks。

根据报道，谷歌正在建立一支新的团队，致力于开发能够模拟物理世界的人工智能模型。

蒂姆·布鲁克斯是球队的负责人。（Tim Brooks），在2024年10月离开OpenAI之后，他曾经是OpenAI视频生成器Sora的联合负责人之一，跳槽到谷歌的人工智能研究实验室谷歌DeepMind。

据Brooks周一(1月6日)在社交媒体X上发布的最新帖子显示，他领导的新团队属于DeepMind，将致力于开发能够模拟物理世界的人工智能模型。

Brooks写道，“DeepMind有一个雄心勃勃的计划，需要制造一个大规模的生成模型来模拟世界。我正在招募一个新的团队来完成这项任务。”

根据描述，Brooks的新团队将专注于开发“实时交互生成”工具，并研究如何将他们的模型与现有的多模型(如Gemini)进行整合。

新的团队也将与谷歌现有的Gemini、Veo与Genie团队合作，并以后者团队的工作为基础，将模型扩展到“最高水平计算”。

据了解，Gemini是谷歌的旗舰AI模型系列，用于分析图像，生成文本等任务；Veo是谷歌的视频生成模式；对Genie来说，这是谷歌的基本世界模式，为用户提供了前所未有的互动体验，支持用户通过文本、合成图像、照片甚至草图等形式，创造出可玩性强的互动环境和可控的虚拟世界。

谷歌还在去年12月推出了Genie升级版。能够模拟动作可控、极具可玩性的真实3D虚拟世界。

世界模型

Brooks发布的工作描述是这样写的：“我们认为，在视频和多模态数据上扩展人工智能训练就是实现通用人工智能。（AGI，指人工智能能够完成人类能够完成的所有任务的关键方法。世界模型将为视觉推理和模拟、具体代理规划和实时互动娱乐等多个领域增添动力。"

“世界模型”是目前技术派系中最难的一种，其特点是使机器能够像人类一样对现实世界有一个全面准确的认识。

现在，许多创业公司和大型科技公司都在追求世界模式，包括李飞飞的Worldorld，这是一个有影响力的人工智能研究员 Labs、以色列新贵Decart和创业公司Odyssey等。它们认为，有一天，世界模型可以用来建立视频游戏和电影等互动媒体，并运行逼真的模拟，例如机器人训练环境。

然而，世界模型的发展似乎对一些有创意的人并不友好。

著名杂志《连线》最近的一项调查显示，就像动视暴雪一样（Activision Blizzard）这种网络游戏工作室已经解雇了大量员工，他们正在利用人工智能来提高生产率，并填补人员流失。根据2024年美国动画协会委托的一项研究，到2026年，美国将有超过10万个电影、电视和动画岗位被人工智能取代。

与被取代相比，合作似乎是一种更友好的方式。Odyssey等一些新兴世界模特领域的创业公司已经承诺与新颖的专业人士合作。这是否会成为谷歌的做法还有待观察。

另外，对于世界模型来说，版权问题还没有解决。一些世界模型是根据视频游戏播放的片段来练习的，这可能会使开发这些模型的企业成为未经允许的诉讼目标。

有Youtube的谷歌声称，根据平台的服务条款，它有权在YouTube视频的基础上训练自己的模型。但是，该公司并没有透露将购买哪些具体的培训视频。

本文来自微信微信官方账号“财联社AI” daily作者：周子意，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com