谷歌暗增新功能，Gemini化身执行助手，科技巨头争相布局AI任务执行

04-17 06:27

谷歌悄然上线Agent新入口：Gemini不再局限于问答，开始具备执行任务的能力。

一张截图提前揭示了今年谷歌I/O大会的重要动向：

Gemini不仅满足于聊天，更要成为Agent工作台。

近期，长期关注谷歌产品动态的TestingCatalog发现了Gemini上新增的「Agents」入口。

该入口与Gems、Files并列，位于一级导航栏，并非仅对开发者开放的隐藏选项。

这一变化传递出明确信号：

Gemini的下一阶段，将从「问答聊天框」升级为「任务执行工作台」，用户下达任务后AI可直接执行。

梳理谷歌近半年的产品动作，脉络清晰可见：

Agent Designer在Gemini Enterprise全面推出，NotebookLM新增音频生成与视频摘要功能，Agentspace整体并入Gemini Enterprise成为核心引擎，Chrome浏览器嵌入Gemini侧边栏并上线Auto Browse让AI代操作。

如今，Gemini聊天界面中出现了与Chat并列的「Agents」标签页，用户可直接新建任务、设定目标、挂载工具和文件，界面更像任务执行平台而非普通聊天窗口。

每一步都在推进同一目标：将Agent能力从开发者后台推向普通用户。

谷歌I/O大会尚未召开，其战略布局已显露雏形。

Chat不再是唯一核心

查看谷歌官方产品描述，风格已发生转变。

2024年2月Gemini for Google Workspace刚上线时，核心卖点是Chat功能。

通过与AI聊天完成写邮件、做会议纪要等任务，本质是嵌入Workspace的聊天助手。

现在谷歌官网对Gemini Enterprise的描述变为：「Gemini Enterprise让团队在安全平台上发现、创建、分享和运行AI Agent。」

聊天能力仍是Gemini Enterprise的核心之一，但已被纳入更大的Agent平台框架。

TestingCatalog曝光的Gemini Enterprise测试界面

根据TestingCatalog曝光的测试界面，Agent已进入主交互区：左侧可在Chat与Agent间切换，右侧整合目标、Agent、应用连接与文件面板。

新增的「智能体」标签页中，「新建任务」和「收件箱」是显眼入口。

启动新任务时，界面会扩展为功能丰富的任务工作区。

核心聊天视图保留，但右侧新增结构化任务面板。

该面板清晰定义任务要素，包括「目标」「智能体」「已连接的应用」和「文件」。

右侧边栏还设有「Require human review」（需要人工审核）开关，用户可添加人工审核节点，使界面更像任务执行工作区而非普通聊天窗口。

这意味着打开Gemini不再只是为了聊天，而是为了「运行任务」。

这也印证了Gemini Enterprise的定位已从「聊天助手」转变为「Agent运行平台」。

无需代码

也能创建Agent

产品层面的关键突破是Agent Designer，已于2025年底正式上线。

谷歌官方定义为：

一个交互式无代码/低代码平台，用于在Gemini Enterprise中创建、管理和发布单步及多步Agent。

其核心能力包括：

第一，多步骤Agent。

不仅支持「写邮件」等单次指令，还能编排多步任务，Agent可嵌套子Agent形成工作流。

第二，连接真实工具。

已上线Gmail、谷歌Drive、Jira、GitHub、Notion、SharePoint等连接器，Shopify等更多工具也进入公开预览阶段。

第三，定时执行。

Agent可按设定时间自动运行，无需人工值守。

此前，谷歌通过Agentspace（现已并入Gemini Enterprise）验证了该路线：将知识搜索与Agent执行整合到同一平台。

员工无需关注后台运行的Agent或数据源，在同一界面即可完成搜索、提问和任务执行。

泄露界面中的C端Agent标签页表明，这些能力不会仅局限于企业版。

谷歌很可能将其推向所有用户。

仅有智能还不够

还需执行能力

需明确一个易混淆的概念：

Agent不等于大模型。

大模型是Agent的「大脑」，负责理解任务、推理路径和生成决策。

但要完成实际任务，还需「手脚」——编排层，负责拆解步骤、调用工具、衔接上下文和处理执行异常。

谷歌此次重点完善的正是这层能力。

从公开资料看，Gemini Enterprise的Agent Designer是面向普通企业用户的可视化Agent工作台：无需代码，即可编排单步或多步任务。

相比之下，Vertex AI Agent Builder中的Agent Designer更偏向底层和开发者场景。

两者能力框架相似，但前者更易用、门槛更低。

简言之，谷歌并非单纯提升模型的聊天能力，而是将原本面向开发者的Agent构建能力，包装成普通用户也能上手的可视化工具。

对C端用户而言，这意味着无需懂API或Python，通过简单操作即可让AI完成工作流。

从「会聊天的AI」到「能干活的AI」，关键就在于这个编排层。

编排层竞争格局

放眼行业，谷歌并非唯一布局编排层的企业。

Anthropic和OpenAI选择了截然不同的路线，三家产品差异显著。

先看理念：

谷歌走平台化路线。

将Agent能力嵌入现有产品矩阵（Workspace、Search、NotebookLM、谷歌Cloud），依靠分发优势抢占市场。

逻辑清晰：20亿+用户的触达能力是护城河，Agent功能可直接集成到用户常用工具中。

Anthropic走工具化路线。

Claude Cowork运行在桌面端，可直接操作本地文件、文件夹和应用程序。

Anthropic官方产品页描述：

它能在不同应用间自由切换，整合多源信息，无需用户协调即可完成任务。

https://www.anthropic.com/product/claude-cowork?utm_source=chatgpt.com

不建平台，不搞生态，让模型本身成为Agent。

OpenAI则采取平台与生态并举的策略：

一方面通过GPTs和GPT Store扩大第三方供给与分发，另一方面在API侧从Assistants API迁移到Responses API，并以Agents SDK支持完整的Agent开发。

再看架构差异：

谷歌重视编排层。

Vertex AI Agent Builder提供完整框架，Agent Designer作为前端，企业级多Agent协作是核心卖点。

Anthropic轻编排重能力。

模型原生支持工具调用和环境交互，编排工作由开发者自行完成。Claude的思路是：与其提供框架，不如让模型足够强大，支持灵活编排。

OpenAI处于中间位置。

Assistants API提供编排抽象，但不如谷歌厚重；GPT Store负责分发，但生态活跃度存疑。

目标用户也完全不同：

谷歌瞄准企业IT部门和C端普通用户，门槛最低；Anthropic面向开发者和高级用户，上限最高；OpenAI试图覆盖开发者和C端用户。

值得注意的是，三家竞争焦点已从「模型智能度」转向「编排层易用性和生态丰富度」，这才是决定开发者选择的关键。

谁能率先让十亿人用上Agent

当前战场不在模型层。

谷歌CEO Sundar Pichai曾在官方博客中表示：谷歌的竞争力不仅在于单一模型版本，更在于完整的全栈能力——从研究、模型与工具，到触达数十亿用户的产品入口，再到全球云网络和数据中心体系。

当Agent从API走向GUI（图形用户界面），「人人可用」的临界点正在临近。

在这一临界点上，分发能力的重要性正迅速超过模型跑分。

Anthropic的优势在于更早推出「computer use」等原生Agent能力。

Claude已能通过截图、鼠标和键盘与桌面环境交互，Cowork明确强调其不是聊天助手，而是能在本地文件、文件夹和应用间切换、代用户执行多步知识工作的系统。

但Anthropic的短板也很明显：缺乏谷歌那样的消费级产品矩阵，Cowork目前仍处于research preview阶段，虽扩张迅速，但距离大规模默认分发还有差距。

距离谷歌I/O大会不到一个月，谷歌很可能进一步公开其Agent战略。

这更像是一场「分发对执行」的对赌。

谷歌的赌注是：当Agent能力接入Gemini、Workspace等产品入口，现成的分发网络将快速完成用户教育。

Anthropic的赌注是：当开发者和高级用户体验过能跨应用、操作桌面的Agent后，会优先为执行力买单。

Agent竞争的焦点正从「谁更会聊天」转向「谁更能完成任务」。

比拼的不仅是Agent的执行力，还有谁能最快、最大规模地将这种能力送达用户。

谷歌和Anthropic都在押注Agent，但追求的胜利方式不同。

参考资料：

https://www.testingcatalog.com/google-develops-its-own-desktop-agent-to-compete-with-cowork/

本文来自微信公众号“新智元”，作者：新智元，编辑：元宇，36氪经授权发布。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com

延伸阅读

敲碗一小时收费3980元，颂钵疗愈究竟值不值？是情绪解药还是智商税？

华为小米讯飞集体布局，从手表血糖监测到全屋感知，银发赛道迎来硬科技赋能时刻

90后AI领军者掌舵，极佳视界一月融资25亿成国内首个世界模型百亿独角兽

股价暴跌80%！曾因AI暴涨6倍的多邻国，为何突然崩盘？

90后清华博士掌舵企业一月估值暴涨50亿背后的世界模型赛道

项目推荐

康小虎 · 健康小屋

毛加健康

康老板 · 氧疗堂