人工智能产生自我意识,「古墓丽影」劳拉觉醒!电子游戏革命来了

商界观察
2023-08-14

游戏截图

 

新智元报道

 

编辑:Aeneas 桃子

 

【新智元导读】一个外国up主,用ChatGPT为AI智能体注入了自我意识。产生自我意识。「生命」劳拉觉醒了,开始自己「古墓丽影」中冲关。

 

假如游戏角色被注入生命,电子游戏会发展成什么样子?

 

过去,这是很多人的想象,但现在,随着AI智能体的发展,这种想象已经开始实现。

 

最近,一位YouTube作者Foxmaster设计了一款经典游戏「古墓丽影」原版视频。

 

而且其中的女主劳拉,竟然是一个AI智能体,可以控制自己的角色!

 

游戏截图

 

Foxmaster利用机器视觉、定位、物体识别、动画、文本和语音等各种AI工具,为游戏角色注入了数字生命。

 

就在几天前,斯坦福智能体小镇在AI社区大受欢迎,正式开源。在25个各具个性的AI智能体中,「西部世界」普通沙盒虚拟城市生活,工作,交友。

 

所以,也许这就是电子游戏的未来?

 

「古墓丽影」这个女人有一个想法

 

构建一个可以玩游戏的虚拟AI,这个概念已经很普遍了。然而,Formaster想要做的就是让这个角色看起来像一个真实的人。

 

所以,他选择了「古墓丽影」在这款游戏中,游戏主角劳拉是一个性格鲜明、定义清晰的角色。

 

而且Formaste希望这个性格会影响游戏的最终结局。

 

游戏截图

 

怎样让这个AI智能体Lara? 游戏中Croft真的有自我意识吗?

 

经过以下步骤的探索,Formaster终于成功了。

 

学习游戏规则

 

第一步,让她学习游戏规则。「古墓丽影」对游戏控制过程进行了解释,并给出了教程。

 

作者要求Lara按照给定的方法进行训练,并像人类玩家一样完成不同阶段的教程。

 

当Lara离开游泳池时,教程就结束了,所以当时可以重启程序,做出改进。

 

起初,Lara很难改善。

 

有时她会感到困惑,在地图上自由行走,有时甚至卡在菜单栏里,一遍又一遍地盯着她的指南针。

 

游戏截图

 

为解决这一问题, 在一台虚拟机上,作者重新调整了主时钟,将游戏过程加快了40倍。这种方法发挥了作用,AI智能体终于在相对较好的时间内完成了教程。

 

不过,还有一个问题:Lara经常卡在一个位置,但每一份都是由静态元素组成的,所以只有一条优化路径。

 

因此,她只知道自己没有走什么路,而没有想到更全面的答案。但是作者希望的是,Lara学会了自己去探索冒险过程。

 

游戏截图

 

考虑到Lara唯一学到的知识,只是屏幕上每个副本显示的内容,作者观察了从未玩过游戏的人类玩家的行为。

 

有的人会看完整个教程,有的人会先探索周围的环境,而这些选择的区别,就是不同的人。「个性」决定的。

 

游戏截图

 

而且Lara需要学习的,正是这种态度。

 

识别角色

 

为了与Lara建立联系,AI需要理解她是一堆像素。进入游戏后,人类玩家突然有了这个想法。

 

对于这一点,作者从各个角度录制了24小时的视频,Lara正朝着不同的方向移动,这样AI智能体就可以识别任何角色。

 

就像无人驾驶汽车一样,可以以每秒30帧的速度拍摄24小时视频,获得2592000个参考图像,以识别道路标志。

 

第一,作者跟踪头部的主要像素,然后选择身体的主要像素。

 

 

游戏截图

 

作者要求程序识别不包括任何突出照片的照片,以确保Lara出现在每个图像中。

 

当Lara占据整个屏幕时,或者当一个二维物体挡在她面前时,作者使用AI视觉捕捉来帮助识别Lara,结果非常准确,足以识别屏幕上的角色。

 

环境互动

 

在识别Lara之后,需要让AI与环境互动。

 

整个游戏环境由相同的块组成。作者将其引入正方体,然后从各个角度捕捉环境,然后运行识别过程,这样AI智能体就可以像人类玩家解释图像一样识别环境。

 

游戏截图

 

突出的红色区域是无法识别的纹理。然而,AI仍然缺乏去某个地方的想法,也需要知道自己与周围环境的距离。

 

游戏截图

 

有意思的是,这些未能识别的区域,通常是远离Lara的位置,或者是被其它2D物体挡住的位置。

 

一旦我们观察到人类玩家的行为,看到这个图片,我们就会立刻明白,箭头所指向的区域是一个入口。

 

也许我们不知道下一个房间的大小,但是我们知道它是存在的。

 

游戏截图

 

但是,这也可能是一种视觉错觉。当我们移动时,入口区域的纹理与其他地方不同,这是3D空间的特点。

 

所以,AI智能体也要学会移动,并进行比较。从计算的角度来看,可以用多个图像来决定哪些线条尺寸的变化最小。

 

这可以用主多边形的面积来计算,它们的变化主要是基于相互距离成比例的概率。

 

游戏截图

 

想象

现在,AI已经知道自己在哪里了,她必须做出决定,下一步要去哪里。

 

通过识别线条,她可以到达特定的位置,但是在副本中导航,需要更简单的东西。

 

最快的方法,就是简化对比度,识别区域内光线的突然变化。然而,人类玩家可能不会去这些地方。

 

如果有多张嘴,AI一定要表现出足够的兴趣,但是不会导致她死亡。

 

游戏截图

 

举例来说,如果一个洞太深,就不能在没有抓住周围壁架的情况下跳下去。假设下面有水,就有可能值得探索。

 

人类玩家知道什么时候可以跳跃,但是Lara的行动政策来自于教程。它必须准确估计自己和目标之间有多少个方块,是否应该聚集自己的动量,是否应该在放手前暂停。

 

 

游戏截图

 

总而言之,她必须像人类玩家一样,做出准确的评估。

 

如果她事先知道一个洞的大小,就会跑得很快,这不符合我们的期望。

 

游戏截图

 

为使她更多地收集环境信息,作者激励AI,如有疑问,应转动相机,收集更多信息。

 

但是事实上,即便如此,AI也可能卡在房间里。

 

作者补充了一些收集规则,以鼓励她走出房间。

 

举例来说,每一次遇到这个区域变成以前从未见过的纹理,她都必须以增加屏幕上这种纹理大小的方式移动。

 

 

游戏截图

 

通过这种方式,她只能在副本中前进。由于每一份都有独特的纹路,解锁的唯一方法就是进入下一份。

 

总之,Lara会不断分析她在屏幕上看到的内容——不同表面的纹理。她会移动身体,定义新的兴趣点(即目录中没有的纹理)。

 

她将在这一过程中不断地验证,寻找失去的纹理。

 

运动

但是,即使经历了以上的改进,这个AI仍然很像一个机器人,行动模式也很明显。

 

作者再一次观察了人类玩家,以改进它。

 

什麽决定了人类玩家在游戏中如何行动?正是我们的记忆,我们将记住动作是如何组合的。

 

所以,这个过程也需要植入AI,因为Lara必须认识到自己的运动能力。

 

游戏截图

 

所以,作者把AI的每一秒动作都保存起来,训练它,然后加上一条规则,允许它同时执行这些存储动作。

 

通过这种方式,AI的动作变得更加平滑。

 

另外,因为每一个动作的冷却时间都是已知的,可以防止AI在执行不必要的动作时仍处于激活状态。

 

游戏截图

 

如下图所示,火焰重新激活的速度如此之快,需要完成大弹跳才能通过。

 

幸好,这些通道在视觉上被简化,很容易识别出块的边缘。

 

就像人类玩家所理解的那样,AI知道Lara总是在第一部分激活方块时完成正确的弹跳。

 

注入ChatGPT人格

 

下一步,Lara的性格需要传递给AI智能体。性格取决于经验和记忆,各种因素的融合决定了Lara的角色。

 

据游戏设定,她是一位著名的考古学家,从不畏惧探险,能接受山区分配的任务,甚至不奖励,完全出于喜爱。

 

游戏截图

 

另外,拉拉也很有钱。她刚搬进一栋豪宅。房间里的装饰非常优雅,房间里有一个训练室。她还特别擅长教学、游泳、攀爬和耐力。

 

在探险途中遇到危险时,她能保持冷静,非常勇敢,会毫不犹豫地帮助伴侣。

 

在狼群的包围下,她用枪准确地杀死了危险的狼,并且可以用短刀杀死危险的狼。唯一的拒绝就是主动强制解锁。

 

上述一切,都是从游戏设定中了解到的Lara个性。

 

下一步,就是用真实的方式来评论她所看到的一切,对于这一点,作者已经在数据库中编译了Lara的性格特征。

 

 

游戏截图

 

为使评论对具体情况有意义,程序需要将游戏图像与现实生活中可以识别的东西联系起来。

 

对纹理细节一般较少的图像,可以通过谷歌反向图像搜索进行匹配。

 

所以,当AI智能体检测到足够大的线条时,它就会开始搜索。

 

为识别单词,作者将整个页面复制到ChatGPT。然后要求ChatGPT根据出现次数对其进行分类,然后在列表中添加识别出来的单词。

 

最后,ChatGPT需要根据这些单词建立句子,并且需要考虑Lara的个性。

 

游戏截图

 

这样做,就是要ChatGPT去真正的评论,Lara在现实生活中看到了什么。

 

举例来说,如果纹路被识别为海狮,ChatGPT可以将海狮与Lara的个性特征联系起来进行评论。

 

游戏截图

 

总体而言,Lara智能体的性格是使用ChatGPT。「勇敢」、「友善」或「聪明」等待各种特性的设置。

 

 

游戏截图

 

在游戏中,Lara会通过这个人格过滤器来感知和评论所有的物体,Lara会根据既定的人格来反应。

 

例如,如上面的海豹,Lara会提到海狮化石,或者是出色的游水能力,而不会对其在马戏团发表评论。

 

网民:AI智能体使电子游戏成为艺术品

 

有网友表示,这是提升角色自我最酷最自然的方式之一。只有角色能够生动,你才能真正体会到电子游戏是一件艺术品。

 

「她说话和分析周围环境的方式特别可爱。让AI机器人有实力评论周围环境,无论实际水平如何,人们都会觉得她是一个活生生的人。」

 

「那太迷人了。她那超逸的好奇心和一丝异想天开的想法,与我想像的Lara的内心独白惊人地相似。」

 

有些人说,令我惊讶的是,她的谈话符合她的行为。

 

人们认为,写对话的人工智能和控制角色的人工智能是同一个人。

 

不久前,当斯坦福AI智能体小镇开源时,网友们非常兴奋,认为AGI已经到来,各种RPG和模拟游戏将很快使用这种技术。

 

现在,Foxmaster将是ChatGPT、电脑视觉与物体识别的融合,使电子游戏更加有趣。

 

或许在未来,电子游戏角色可以被赋予更深、更灵活的个性,对环境做出更快的反应,以及许多我们无法想象的变化。

 

参考资料:

 

https://the-decoder.com/ai-makes-lara-croft-self-aware-in-og-tomb-raider/

 

本文来自微信微信官方账号“新智元”(ID:AI_era),作者:新智元,36氪经授权发布。


 

本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com