国产3D生成大模型热外网,歪果仁年都不过了,都在测这个。
"3D大模型终于可以产生锐利的边缘了!"
“在研究了一段时间的3D人工智能之后,我终于通过了Hyper3D。.使用Rodin1.5的ai确实可以改变游戏规则。

在2024年的最后一天,3D生成工具Rodin Gen-1.5网络上掀起了新一波关于3D生成的讨论热潮。
Rodin背后的R&D团队——张启影眸科技CTO的话说:
这是3D模型第一次能产生如此锐利的边缘——我愿意称之为“流畅时代的锐利异类”——它在CAD工业模型和硬表面模型方面具有绝对优势,扩大了3D产生的用户数量。
感觉链接:Hyper3D.ai
由于Rodin的这次更新正值年底,许多海外用户都在度假,但是这并没有阻止用户对于测试这一新模型的热情:
无论是《双城之战》中的海克斯拳套——

或更多细节的赛博朋克靴子——

对这种结构鲜明的模型,Rodin Gen-所有的1.5都是得心应手。
一些动画师甚至在动画制作中直接使用了Rodin产生的资产(下面视频中70%的3D资产是由Rodin产生的)。

当然,这种结构鲜明的生成模式对于3D打印爱好者来说也是极其友好的,稍微涂一下就是一个精致的玩具:

AI生成领域的专业用户也对Rodin生成模型的质量赞赏有加:

不过,这已不再是影眸科技这个3D大模型公司第一次给这个领域带来了一些“小震撼”。
“非共识”路面3D大模型研发
2024年8月,世界顶级计算机图形学大会 ACM SIGGRAPH 会上,影眸与上海科技大学联合开发的3D原生模型Clay发布,同年与团队开发的3D服装生成模型Dresscode拥有SIGGRAPH2024最佳论文荣誉提名,该团队也成为该领域唯一一支在同一学术会议上获得两项提名的中国团队。
Clay的提出显著提高了3D产生的质量,也成为当前学术界普遍认可的3D大模型技术路径。

Clay、获得SIGGRAPH2024最佳论文荣誉的DressCode提名
Rodinn基于CLAY的三维资产生成工具。 Gen-一是于去年六月推出,产品最接近“Production-Ready“形成效果,上线后备受关注。
它的生成质量和可用性在当时的同类产品中处于不同的水平。Rodin仅用45天就达到了100万美元的ARR,而著名的HeyGen用了7个月的时间就达到了这个数字。
它的背后,来自于影眸始终如一对。“Prodution-Ready”的向往。
“Production-Ready”这个词来自CG行业。CG行业包含一个词——后期(Post-Production),而“Production-Ready“这意味着可以直接用于后续环节。
这也是影眸产品研发开发的共识。正是这样的共识,让影眸在3D大模型研发之初就走上了一条路。“非共识”的道路。
在那时,2D升3D技术方案是学术界主流的3D生成方式。,与此同时,市场上已有团队推出了基于2D升维技术路径的3D生成产品。
然而,凭借多年的技术探索和产品建设经验,影眸看到了2D升维路径的瓶颈。毕竟2D数据只记录了真实物体的一侧,再多角度的图像也无法完全描述一个3D内容。所以模型学到的东西还是有很多信息缺失的,生成结果还是需要大量的人工调整,很难满足使用需求。唯一的解决办法是从一开始就使用3D原生数据。
那时,影眸正遭遇着资本环境迅速下降导致的融资失败。因此,影眸面临着一个艰难的选择:
到底是先用主流技术做一个产品上牌桌,还是用更多的力量去坚持一个尚不清楚的技术方向。
影眸队选择了后者,难度大,需要时间,但更正确。
七个月后,对技术的准确直觉和坚持给了他们好处。
还有Rodin Gen-1.5的发布更是影眸对“Production-Ready“更进一步地坚持下去。透过新一代3D原生表达,Rodin Gen-1.5全面解决了行业内长期存在的薄面和边缘锐度问题,再次提升 3D 产生全行业商业标准。
Rodin是Rodin的一种无机形状的生成能力,锋利的边缘和非常干净的拓扑结构。 1.53D生成能力最显著的性能提升。这在游戏中非常重要,尤其是在产品设计领域。这种升级也再次扩大了影眼产品的领先地位。
游戏、动画工作流已经开始。
现在,客户借助Rodin精确生成几何和PBR材料的能力,可以快速地生产出适合不同场景的3D资产。
在实验Rodin中,用户已经能够帮助游戏制作。
单个静态物体可以直接生成。

还有批量生成npc的大场景。

事实上,一些用户已经将Rodin产生的结果放入了自己开发的游戏中。

在Rodin的基础上,还有个人开发者开发了一整套工作流程。

动画片,影视制作也是Rodin应用的一大场景。
一些用户利用Rodin产生的资产建造了整个城市,并设计了简单的动画。

还有用户与当前AI路线相结合,在离线引擎中制作高质量的CG内容。

稍加调整,Rodin的资产质量甚至可以达到影视水平。

什么时候3D大模型迎来“ChatGPT时刻”?
影眸感觉,在Rodin-Gen1.在3D大模型发展之前,主要有两个阶段:
Level1 —— 在Clay发布之前,基于2D升维技术路径的3D生成需要大量的人工后期调整才能实现可用标准。
Level2 —— 以Clay为核心的3D原生3D生成大模型,刚刚接触到“Prodution-Ready”的标准
还有Rodin Gen-1.5的发布将3D模型带到了Level3的水平,更准确、更细致地表达了生成模型,解决了3D模型一直存在的问题,大大拓展了3D模型的应用边界。
近年来,生成式AI在文本、图像、音频和视频方面取得了重大进展,3D生成通常被称为“世界模型”(World Model)”的 最后一块拼图。伴随着技术的进步和消费者需求的提高,3D产业的发展前景广阔。去年,AutoDesk、Meta、NVIDIA、在这一前沿领域,腾讯、微软等都推出了自己的3D生成大模型,积极布局。在与行业巨头的竞争中,影视团队长期领先于3D建模/图形学领域的深度培育和对3D行业客户需求的洞察力。
未来,3D生成还有很大的发掘空间。AR//VR/虚拟世界中的个人创作需要释放用户的3D内容创作能力。作为一个建立在3D空间中的世界,未来机器对世界的理解必须基于3D,所以3D的需求总是存在于智能领域。
相信在影眸科技等3D大模型团队的共同努力下,我们很快就会在3D领域迎来“ChatGPT”时刻。
本文来自微信微信官方账号“量子位”,作者:允中,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com





