大型工厂围猎AI智能体

05-07 10:39

大模型的战斗还没有结束,一场关于AI的比赛。 Agent(智能体)的围猎对决再次打开。


被称为“全球首款真正的AI通用AI” Agent”据报道,Manus最近完成了一轮7500万美元的融资,融资后估值达到5亿美元,比以前增加了大约5倍。距离3月初上线只有一两个月了。


而且这可能只是对决的结束。最近,字节跳动悄然推出了“纽扣空间”内测。;百度在开发者大会上推出“心响”App;在Qwen3开源模式下,阿里云点燃了技术圈;OpenAI豪赌编程Agent;MCP 协议成为行业的“通用插座”…在Agent跑道上,大厂正在展开一场生态暗战,决定未来十年的话语权。


AI 什么是Agent,和人们日常使用的大模型有什么区别?为什么这么受欢迎?大厂商在这场比赛中如何竞争?


01「战场不敢错过」


3月6日,一夜之间,Manus成名了,它生动地诠释了AI。 Agent的概念:通过大模型的感知推理能力,可以独立拆解任务链,调用知识库、网络搜索、软件工具等资源,执行复杂任务,完成闭环操作。


以简历筛选为例,Manus不仅可以减压文件,浏览简历,还可以给出排名意见和评价标准,最后以电子表格的形式呈现结果,就像一个负责招聘的实习生一样。



*图源互联网


目前大家主要是通过Chatbot(聊天机器人)与大模型互动,Chatbot属于能言善辩,但不做实事的人。Agent可以独立调用工具,在每个人的生活和工作中实际执行一些常见的任务,也就是说,它可以真正工作。


这一跨越从对话响应到任务执行,开启了远远超越Chatbot的商业想象空间。


Anthropic CEO Dario Amodei曾经肯定,在未来2~3年内,AI可能会超越人类的大部分任务,智能体将在五年内渗透到90%的公司工作流程中。和Markets一样 & 2024年全球AIMarkets计算 在2030年,Agent市场规模约为51亿美元,预计将增长到471亿美元,复合增长率达到44.8%。


面对AI 国内外AI厂商都加快了Agent的巨大潜力布局。


OpenAI于4月17日推出了o3和o4推理模型,具有更强的Agent能力。-mini,并且预测到2029年,AI Agent和其它新产品的销售额将超过ChatGPT,2030年总收入将达到1250亿美元,总收入将达到1740亿美元。


在Manus流行之后,字节跳动刺激了许多团队开发不同的Agent产品,并在最近的内部测试中推出了“纽扣空间”,为AI通用见习提供多项技能。



*图源百度


百度李彦宏曾经说过:“Agent是我们最看好的AI应用发展方向。四月二十五日,在Create2025百度AI开发者大会上,百度发布了4.5文心大模型 X1模型Turbo和深度思维模型 除了Turbo两种新型号外,还发布了多种AI应用产品,其中还包括官方定位于通用超级智能理论的心响App。


4月29日,在评估模型Agent能力的BFCL评估中,阿里云开源了Qwen3系列模型,创下了70.8分的新高,超越Gemini2.5-Pro、OpenAI-o1等顶级模型,这将大大降低Agent调用工具的门槛,为即将到来的智能体和大型应用的爆发提供更好的支持。


02「VS数字员工个人版“贾维斯”」


各大厂商对Agent的探索方向已经分离——有的走通用路线,有的走专业垂直路线;有些人选择To C突破,扮演钢铁侠的“贾维斯”,争夺个人助理入口;有的则选择To B 深度培育,嵌入公司工作流程,打造数字员工。


目前百度和OpenAI都在走。 C路线。ChatGPTOpenAI是一个长期的头部应用程序,每月活跃用户已经达到5亿。有了这个超级入口,OpenAI自然希望通过ChatGPT来构建一个认知引擎,可以适应任何情况。


另外,OpenAI也强调下注编程Agent。之前发布的“”Operator“可以使智能体接管客户的计算机操作,例如自动编写代码并调试操作。日前,OpenAI又发布了一个名为Codex的公告。 开源轻量化CLI编程Agent,可采用OpenAI模型,接管当地计算机终端命令界面,直接编写代码。OpenAI还强调,未来将发布一系列编程工具,重新定义AI时代的编程。


另一方面,百度专门开发了Agent应用程序——心跳App,定位用户的智慧生活助手,目前安卓已经上线,苹果iOS系统正在审核中,也将在不久的将来上线。为了降低使用门槛,激发客户对新使用的启发,智能App专门预设了常规任务、城市旅游、AI相亲、AI绘本、钓鱼游戏、深度研究、法律咨询、健康咨询、智能图表、试题讲解等十大应用领域。


以AI绘本为例,用户只需要输入一个简单的主题,比如“狐狸的电话亭”,就可以根据用户对角色设置、配音、风格的喜好,主动连接百度图书馆的AI助手,完成绘本大纲,直到最后生成绘本视频。操作很简单。据透露,目前心脏App支持200多种任务类型,未来计划将扩展到10万。 使用场景。



*图源心响


不像上面两个家庭,微软和字节更愿意通过B端办公需求进行切入。在Officee中,微软将Copilot植入、产品矩阵,如Teams,试图将智能体转化为企业工作流程的“隐形中心”。据统计,截至今年4月,超过10万家企业使用Copilot Studio,每天处理超过1亿个任务。微软预测,2025年Agent业务收入将占AI总收入的35%。



*图片源纽扣空间


"和Agent一起开始你的工作""纽扣空间是你和AI。 最好的Agent协同办公室,这是字节按钮空间的产品定位。像微软一样,它试图将通用的Agent概念嵌入到工作流中,帮助用户处理文件检索、表格制作、报告生成等任务。字节的协同办公应用——飞书的多维表格、飞书文档等服务也可以访问,进一步增强了按钮空间作为数字员工的业务能力。


在不断加强C端产品夸克能力的同时,阿里在B端钉钉上重点构建AI。 Agent应用平台。当前AI助手已聚合AI客户服务,HR、多种工具,如AI销小帮、行政搭子、代码设计大师等,构建全链路公司服务矩阵。


现在看来,面对C端Agent,除非像ChatGPT那样拥有庞大的用户基础,否则是一个巨大的挑战。最大的问题是普通用户对Agent的概念不多,缺乏明确的使用目的,很多只是为了早点尝试和玩。如果使用体验不完美,不能给用户带来惊喜,用户粘性就很难维持。Manus从来没有手机,百度心响App无疑有以身作则的气魄。但是,作为一个全新的应用,心响App完全没有客户积累,需要从0开始,百度必须投入巨大的资源。


而且面向B端,因企业降本只需要明确,情景垂直,而且因为普通企业可能会建立自己的知识库,办公Agent的任务更有针对性,交付效果无疑会更好。另外,在商业化方面,微软Copilot、钉钉和飞书也都有现成的盈利方式,比C端会员收费自然多了,估计发展会比较顺利。


03「生态学和标准暗战」


除智能体外,目前AI领域最热门的概念是MCP。而且MCP和智能体之间有着密切的联系。


“MCP让AI更了解外部世界,更容易获取信息,更自由地调用工具,这是AI发展的一大步。”李彦宏在Create MCP在2025百度AI开发者大会上多次强调其重要性,现在基于MCP开发智能体,就像2010年开发移动APP一样。


无论大模型的性能有多好,它都不是万能的。为了处理复杂多环节的任务,Agent需要与外部工具或服务互动。然而,在MCP出现之前,互动缺乏统一的标准。比喻形象就像秘书联系不同的部门,需要转换不同的沟通方式,比如电话、邮件、微信、钉钉、飞书等。,这自然是无效的。



*图源互联网


去年11月,Anthropic提出并开源了MCP,即模型前后协议,旨在提供一个可以理解为AI世界的统一标准的USB。-C,使Agent能够像积木一样调用航班查询、地图导航等服务。举例来说,在旅游规划测试中,接入MCP的Agent可以依次调用航班、酒店、地图接口,任务结束效率是传统API对接的5倍。


在Anthropic的推动下,特别是在OpenAI和Google等巨头相继明确表示支持之后,MCP正在从一个有前途的建议中加速,这已经成为一个广泛接受的标准。根据MCP社区PulseMCP的统计,全球已有4000多台MCP服务器上线,而且这个数字仍在快速增长。


最近,国内AI制造商积极支持MCP。四月二十五日,百度宣布,公司所有商品都拥抱MCP,不仅包括网页搜索、百度图书馆、百度网盘等应用,还包括文心基础大模型和百度智能云千帆平台;字节扣空间还集成了飞书云文档、多维表格、高德地图等MCP拓展;阿里集成了MCP协议,最新发布在支付宝等产品中。Qwen3系列模型也支持MCP。


MCP的普及为Agent生态的构建和运行提供了重要渠道。国内外AI厂商基本都推出了自己的MCP平台,邀请了更多的开发者和应用服务提供商入驻。例如,360旗下的纳米AI最近推出了“万能工具箱”,拥有100多个自主研发和首选MCP工具,更多的第三方MCP工具正在落户。


智能体开发正进入“乐高积木”时代,MCP打破工具调用堡垒。这次战斗的输赢关键已经从技术突破转变为生态建设能力。就像移动互联网催生APP经济一样,AI Agent正在开启智能体经济的黄金十年。


本文来自微信微信官方账号“青澄财经”,作者:青沐,编辑:六子,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com