科技巨头疯狂地卷入“智能体”,大模型终于长出了“大家”?
这些天,备受关注 OpenAI 新项目又有了新消息。
The Information 援引内部新闻报道称,OpenAI 今年秋天,计划将尽快推出号码。「草莓(Strawberry)」的全新 AI,它拥有前所未有的东西「推理」能力,能处理复杂的数学和编程任务,甚至能体现在日常生活中的非技术问题上。
另外,报告还指出,这项技术对于未来 AI 特别是商品,旨在解决多步任务「智能体(Agent)」意义重大。
也是智能体。
在 2022 年年末 ChatGPT 大火之后,「智能体」很快就从故纸堆中跳出来,引起了整个行业的极大关注。而且从开源项目开始 AutoGPT 到 OpenAI 官方推出的 GPTs 和 GPT 商店,作为「原型」,而且都在一定程度上表现出来 AI 智能体的潜力和必要性。
但如果说在 2023 2008年,人工智能产业的发展和竞争更多地集中在模型本身,智能体探索才刚刚迈出第一步。那就是 2024 年,从 Google 从阿里巴巴、字节跳动到百度, OpenAI,智能体的落地步伐在国内外明显加快。
都在说「智能体」,但是究竟是什么呢?
日常生活中要注意 AI 在这个领域,我相信读者一定会看到或听到很多「智能体」这个词。但是什么是智能体呢?也许很难理解。
实际上,在 1995 在2008年出版的《未来之路》一书中,微软创始人比尔·盖茨提到「智能体」概念。但是最近三十年,「智能体」这个概念显然发生了很大的变化,尤其是在 ChatGPT 后来基于大型模型「智能体」。

图/ OpenAI
而且时至今日,学术界对于「智能体」而且没有一个比较统一的概念。但一般认为,「智能体」它是一个智能实体,可以独立感知环境,制定计划,执行任务,而非「副驾驶」,而是主驾。
还可以用一个比较直观的公式来表达:
Agent(智能体)= LLM(大模型) Planning(规划) Feedback(反馈) Tool use(使用工具)
以人类借助 ChatGPT 以写一篇文章为例,如果我们想要保证文章的质量,我们通常需要先确定一个主题,然后让它 AI 协助生成文章大纲,然后通过 AI 分析、调查搜索能力,然后让搜索能力进行调查, AI 生成第一个版本,最后是通过不断的反馈来优化内容,并且得到最后一个版本。

而 AI 通过独立的规划、反馈和工具使用能力,智能体在模型的基础上,进一步减少了人工介入的操作。更加具体地说,AI 智能体可以独立使用数据搜索、阅读理解、数值计算等工具,然后通过规划「提纲-搜索、分析、调查-原稿-反馈再优化」实现多步任务「人类的一句话,AI 跑断腿」的效果。
简言之,AI 通过迭代和对话的方式工作,智能体不再是简单的指令实施者,而是能够进行自我反省、规划和调整的参与者。
智能体是大模型中长出的“大家”
「智能体不仅会改变每个人与计算机互动的方式。它们还会颠覆软件行业,带来从输入指令到点击图标的最大计算革命。」
去年 11 比尔·盖茨在他的个人网站上发表了一篇名为《月亮》的文章。《AI 博文将彻底改变计算机的使用方式,感觉 AI 智能体(AI Agent)今后五年将颠覆大家使用计算机的方式。
坚定看好 AI 比尔·盖茨绝对不是唯一一个聪明的人。
吴恩达演讲,图// YouTube
今年 3 月亮,斯坦福大学教授吴恩达指出,他们的研究是基于 GPT-3.5 构建的智能体工作流在应用中的表现可比 GPT-4 要好,基于 GPT-4 构建智能体的工作流效果当然可以更好。所以他还说,AI 今年(2024年)智能体 年)推动 AI 大规模进步:
也有可能超越下一代基础模型的影响。
到 7 在每月举行的世界人工智能大会上,基于大模型的智能体成为绝对焦点。蚂蚁集团董事长兼董事长 CEO 井贤栋在演讲中表示,从实践来看,专业智能体是大型严谨行业的有效途径。百度创始人李彦宏甚至明确表示,智能体是百度最有前途的人工智能技术发展方向。
与此同时,谷歌也推出了 AI 智能体平台 Oscar,使开发者能够通过一定的设备生成各种各样的设备。 AI 智能体。但是相似的 AI 不仅仅是谷歌的智能体平台:
百度文心有 AgentBuilder,字节跳动有一个按钮(Coze)以及 HiAgent,阿里巴巴拥有百炼智能体和钉钉智能体,腾讯微信云开发 AI 智能体...智能体平台慢慢开始成为一种大型模型制造商。「标配」。而且百度也大喊大叫「每个人都是开发者」的口号。
图/钮扣
也许,在经历中 2023 经过一年的思考和探索,AI 智能体在 2024 2008年已成为人工智能产业的新共识。
智能体让AI从技术卷向情景。
去年底,OpenAI 推出了 GPTs 和 GPT 商店,允许用户建立自己的版本,无需编码。 GPT。但 GPTs 依旧是充当「副驾驶」角色,只是多了一些个性化定制的可能性,无法拆解任务,并且一步一步地计算和执行。
事实上,今天很多标榜都是 AI Agent 的「智能体」,实际上还是比较多的 ChatBot(聊天机器人),反而是钉钉的。 AI 助理(英语名称) AI Agent)更加接近实质性的智能体。
怎样判断并不难,核心在于任务过程中人工介入的程度,以及大型模型在规划、决策等方面的参与程度,这样就能判断出一个名义。「智能体」到底是更接近真正的智能体,还是接近常规? AI 聊天器人。
图/钉钉
但是必须指出,从「副驾驶」到「主驾」,目前智能体在技术上还有很大的进步空间,并没有带来颠覆性的感觉。但更重要的是,在未来,与以聊天为交互形式的聊天机器人相比,AI 要想更深入地生活,改变生活,就必须让人 AI 具有更强的自主性。
理想情况下,AI 智能体可以根据各种条件智能地做出决策和计划。比如在制定旅游计划时,可以独立搜索旅游的交通住宿和各种旅游信息,充分考虑用户的历史喜好和习惯,多次补充和修改差距。
例如下班后的夏夜,用户将拖着疲惫的身心回家,AI 应能够根据汽车或手机的位置提前感知,并根据位置和时间智能地开启空调、扫地机器人、灯光等设备。
就像盖茨的想法一样,在未来,我们不再需要将不同的任务转化为不同的应用程序,我们需要用普通的语言告诉电脑和手机我们想做什么,然后智能机构会根据客户愿意分享的数据采取个性化的行动。
写在最后
本质上,智能体实际上是在实质上。 AI 在此基础上,借鉴人的思维方式,构建更专业的推理与管理能力,从而提供更智能的体验。所以,AI 智能体相比 ChatGPT 更进一步。
但是可以想象,单一的智能体并不能满足很多人的无数需求,所以井贤栋认为未来的智能体验需要很多专业的智能体来参与和履行自己的职责,李彦宏认为未来会有数百万的智能体。
下一个平台的竞争,势不可挡。
就像移动时代一样 App Store,随着智能体的兴起,AI Agent Store 也逐渐成为竞争的焦点。因此,除了场景竞争之外,生态是智能体发展的核心之一,也是具有基本大模型的大厂商的战略要地。
这篇文章来自“雷科技”,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




