Agent、前OpenAI高管全面解读 斯坦福顶尖学者综述
"探索智能体,解读未来智能." 智能体是人工智能的前沿领域。(AI Agent)正在逐渐成为焦点。到底是怎么建造的?还有什么能力?本文将在深入解读之前进行解读 OpenAI 高级管理人员和斯坦福顶级专家的总结,为您揭开智能体的神秘面纱,展示其在模拟人类行为等方面的巨大潜力。
(Lilian Weng 界定的 Agent 结构图)
智能体(AI Agent)= 大模型(LLM) 记忆(Memory) 规划(Planning) 工具使用(Tool Use)
LLM(AI 大模型)是 Agent 属于“中枢”模型的大脑,要求如下 3 种能力:
planning skills:拆解问题以获得解决方案,既进行任务规划
tool use:对自己需要的工具进行评估,选择工具,生成调用工具请求
memory:短期记忆包括工具的返回值和完成的推理路径;长期记忆包括可访问的外部长期存储,如知识库。
斯坦福大学 由谷歌顶尖学者发布《Generative Agents: Interactive Simulacra of Human Behavior》中做了一个 AI 小镇,内置了类似“模拟生活”的沙盒环境。 25 个 Agent。
顾客可观察和干涉 Agent 规划他们的日常生活,分享新闻,建立关系,协调团队活动。本文要解决的问题是如何创建能够模拟人类行为的形成。 Agent,这些 Agent 可用于互动应用,如沉浸式环境、人际交往排练工具原型设计工具等。
架构
本论文提出了解决人类行为模拟问题的生成代理结构。具体而言,
记忆流:首先,论文描述了一个叫做记忆流的长期记忆模块,它以自然语言的形式记录了代理人的所有经历。记忆对象包括自然语言描述、建立时间戳和最新访问时间戳。
搜索函数:为了决定代理人的下一步行动,论文实现了一个搜索函数,该函数根据代理人目前的情况回到了记忆流的子集。搜索函数考虑了三个主要部件:
新意:最近访问的回忆目标得分较高。
重要性:代理人认为重要的记忆目标得分较高。
相关性:与当前情况相关的回忆目标得分较高。
反思:其次,论文引入了反思的概念,这是代理商定期生成的更先进的思维。反思是通过查询最新的记忆记录,从语言模型中获得相关的记忆来生成的。
计划和反应:最后,论文描述了计划和反应的过程。计划描述了代理商未来的行动序列,帮助维持行为的一致性。反应是代理商在感知环境变化时采取的行动。对话的产生是基于代理商之间的记忆。
试验
本文通过在类似“模拟生活”的沙盒环境中实现生成代理来检验其结构。具体而言,
环境:沙盒环境称为沙盒环境 Smallville,有一个小镇,包括一个小镇, 25 一个独特的代理人。每一个代理人都有一个简单的精灵头像表示,初始记忆包括一段自然语言描述。
用户控制:用户可以通过自然语言与代理商互动,指定一个角色来感知代理商。用户还可以直接指示一个代理商,使其更像是代理商的“心声”。
环境交互:代理商在沙盒世界中移动,并与环境中的目标交互。用户可以改变代理商的环境状态,比如把厨房炉子从“打开”变成“燃烧”。结果
可控性评估:在可控性评估中,论文通过“访谈”代理来测试其在自我认知、记忆、计划、反应和反思方面的优势。结果表明,完整的代理结构产生的行为是最可靠的,删除某一部分后性能会下降。
端到端评估:在端到端评估中,论文被观察到 25 一个代理人在两天内自发行为。资料表明,代理商之间形成了信息传递、关系建立和协调。具体而言,有关 Sam 市长竞选的信息传递范围从 1 人类(4%)增加到 8 关于人类(32%) Isabella 从情人节派对的信息传递范围来看 1 人类(4%)增加到 13 人(52%)。
总结
智能体(AI Agent)可以说是一个高效运行的服务机器人。该机器人由以下关键部件组成:
大语言模型(LLM):相当于机器人大脑。它负责处理和理解语言信息,就像人脑处理思维、理解和交流一样。大语言模型促使机器人理解指令,回答问题,与人类进行流畅的对话。
记忆(Memory):相当于机器人存储系统。它允许机器人记住过去的互动和经验,以便在未来的任务中使用它。就像人类根据记忆做出决定一样,智能体可以通过记忆提高处理问题的能力。
规划(Planning):相当于机器人导航系统。它帮助机器人制定行动计划,以实现设定的目标。就像我们在旅行前规划路线一样,智能体通过规划决定如何执行任务。
工具使用(Tool Use):相当于机器人的手。它使机器人能够使用各种工具来帮助他们实现目标。就像人类使用工具来提高工作效率一样,智能机器可以通过使用工具来扩展其功能,处理更复杂的问题。
因此智能体(AI Agent)正如一位具有高级思维能力、丰富经验、优秀计划和实际操作能力的服务机器人,能够有效地完成各种复杂的任务。
本文由大家都是产品经理作者[陈宇明],微信微信官方账号:[码蛋],原创 / 授权 发布于每个人都是产品经理,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




