Bug变惊喜:AI失误揭秘创造力本质
扩散模型本应是复制机器,却常画出“六指人像”和陌生场景。最新研究显示,AI的“创造力”竟是架构的副作用。有学者推测,人类灵感或许也如此。当灵感能用公式表达,人类与AI的区别还有多大?
你肯定见过那些奇特的AI画作,人物手指增多、脸部细节怪异,却又带着一种难以言喻的新鲜感。
这不禁让人疑惑:扩散模型明明只能“复刻”,为何能创作出前所未见的作品?
最新研究给出了答案:AI的创造力并非“神来之笔”,而是模型架构的副作用。
只会复制的AI,缘何能创作?
扩散模型的任务很简单,就是把数字噪声还原成训练过的图像。就像把一幅画放入碎纸机,直到变成细小灰尘,再将碎片重新拼凑。按常理,它应只生成“复制品”。
但现实让研究者惊讶。DALL·E、Imagen、Stable Diffusion等模型画出的不是“翻版”,而是全新图像,不同元素组合成前所未见的场景,且这些拼贴并非杂乱无章,而是有语义的完整作品。

DALL·E 2制作了“金鱼在海滩上啜饮可口可乐”的图像。这个由OpenAI创建的程序可能从未见过类似图像,却能自行生成。
还记得社交平台疯传的“AI多手指人像”吗?有些图类似超现实主义画作,人物手指莫名增多,但整体结构依然清晰。

这类怪异产物曾被当作笑料,却也引起科学家警觉:模型为何会“即兴发挥”?
Giulio Biroli将此现象称为“扩散模型的悖论”:“如果它们只是记忆,就不该有创造力;可它们偏偏能画出前所未见的东西”。
那么,AI的创造力究竟从何而来?
“六指人像”背后的“bug奖励”
最新研究中,两位物理学家给出意外答案:AI的“创造力”是其架构的副作用。

扩散模型生成图像依赖两条规则。一是局部性,绘制时只关注一个小像素“拼块”,就像拼图时只盯着颜色相近的小碎片,不考虑其在整幅画中的位置。二是平移等变性,输入图像整体移动,模型生成的画面也同步移动,以保持图像结构连贯。
这两条机制本是“去噪”的限制条件,研究者曾认为是缺陷,会使模型无法生成完美复制品。

但事实证明,这种“不完美”让AI无法完全依赖记忆,必须在局部拼贴中即兴重组,导致手指增多、元素拼接怪异,却让画面生出新意。也就是说,AI的创造力是架构的必然副作用。
ELS方程机:创造力的数学证明
若AI的创造力是副作用,如何证明?斯坦福大学研究生Mason Kamb和导师Surya Ganguli进行了实验。


他们基于两条规则构建了ELS方程机(Equivariant Local Score machine),这是一个不依赖海量数据和黑箱深度网络的数学系统,用于预测噪声去除时图像的拼合方式。
他们将同一组噪声图像同时输入ELS方程机和真实扩散模型,结果惊人:二者输出平均重合度高达90%,在机器学习领域几乎是前所未有的精度。

Ganguli感叹:“这就像是用一组公式,写下了创造力的来源。”所谓“AI创造力”,是局部性与等变性动态运行的必然产物,满足这两个条件,“创造”就会自动出现。
AI小失误,揭开人类创造力秘密
这项研究不仅揭开了扩散模型的秘密,还让人联想到生命系统。Mason Kamb因长期研究形态发生,即胚胎如何从细胞自我组装成器官和肢体,而获得灵感。在这个过程中,细胞根据邻居信号做出局部反应,多数时候能正常发育,但偶尔会出错,如多长手指。
当Kamb看到“AI多指人像”时,联想到胚胎发育的“局部拼贴错误”。这表明,AI的创造力与生物自组织过程惊人相似。

研究者大胆类比:人类创造力或许与AI并无本质区别。我们的大脑并非凭空产生灵感,而是在有限经验和记忆中拼接、补全、想象,偶尔的错误与缺口成为创新源泉。
正如IBM研究员Benjamin Hoover所说:“人类和AI的创造力,可能都根植于对世界的不完整理解。”创造力可能是副作用,是“不完美”带来的意外之喜。
当“创造力”能用公式表达,人类与机器的界限愈发模糊。或许,真正的灵感不是天才的特权,而是“不完美”的副产物。这项研究提醒我们:创造往往源于偏差。
参考资料:
https://www.wired.com/story/researchers-uncover-hidden-ingredients-behind-ai-creativity/
https://www.quantamagazine.org/researchers-uncover-hidden-ingredients-behind-ai-creativity-20250630/
本文来自微信公众号“新智元”,作者:新智元,编辑:倾倾,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com

