字节扣空间,这次扣紧了吗?
昨天(4月19日),字节推出通用AI。 Agent平台按钮扣空间(Coze Space),目的是让用户和AI Agent高效合作,完成各种复杂的任务。
核心能力有三个:任务自动化、专家Agent生态、MCP拓展集成;据说开发者平台将在未来开放,支持开发者向纽扣空间发布应用程序。
01
拿到推荐码,赶紧试试。创建两项新任务,一项整理内容,另一项生成调查报告。
对内容进行整理,选择探索模式。
上传四个文档,都是Word文档,告诉他们:帮我整理一下这些文档中的内容。它开始工作,这个任务分为三个步骤。
第一步,它告诉我,把这些文件的内容混合在一起,输出一个新文件;第二步,它说文件格式已经转换,Excel已经转换成CSV,Word已经转换成Markdown,然后Markdown已经转换成TXT。
步骤三,它说已经提取了重要的信息,对文档的核心观点进行了梳理,现在要对逻辑顺序进行梳理,导出成Markdown格式文档。
大约需要30秒才能完成整个过程。
提及优点,整理内容结构清晰,可以清楚地看到报告的基本框架。比如:简介、特色、市场定位、目标、未来规划都非常明确。
缺点也很明显,内容不够详细,专而精,重要物品压根就没有提及。如果我想了解更多,再和它发消息,它又开始了一轮探索,这有点尴尬。
相比之下,Kimi、Grok或Qwen整理出来的内容更加完整,还可以继续提问、提升,效率似乎更高。那是我对探索模式的体验。
再次谈到规划方法。
我告诉它:现在我想写一篇关于纽扣空间的文章。然后请帮我计划一下,告诉我应该从哪些方面入手。第一步让我满意,提炼需求,整理成提示词。
还说:第一步是先收集信息,第二步是规划文章逻辑,第三步是整理逻辑,最后一步是结构化导出。我可以改变这些提示,也可以直接点击开始。

执行步骤也相当清楚,按照上面的提示一步一步来;但整个过程时间较长,由于规划步骤较多,大约需要13分钟。
在13分钟内,我可以清楚地看到它每一步都在深入思考。我也可以看到它是如何思考的。比如它会浏览各种网站,比如产品经理、钛媒体、腾讯新闻等等。
然而,与智谱GLMM相比,搜索范围和深度、Kimi的探索版本,Grok3要差一些。我问了一个问题,它匆匆调取了三到五个信息源,结束了总结。
每个回合结束后,它都会生成一个Markdown格式文档来保存。在此过程中可点击右侧直接查看,它还提供了直接下载的代码模式,相当透明。
最终完成后,它将形成一份Markdown文档,并且还包含一份.gsx文档。我可以直接下载前者,后者可以在网站上打开。
说说它的优点。首先,内容非常全面。文档约8000字,前后记忆模型还不错。第二,它可以独立规划和生成网站,具有很强的可视化能力。
缺点也很明显,内容深度不够,抓取信息,生成文本都比较表面,纯理论,废话多,没有加入具体的研究案例。
还有一点就是目前支持多任务同步进行。创建一个新任务,返回主页重建一个任务,它仍然可以同步运行。这就是我对规划方法的整体感受。
总而言之:可以跑通过过程,但是还有很大的提升空间。
02
体验结束后,我感觉MCP平台是否卷错了方向。
MCP(Model Context Protocol)该平台的核心是重新定义AI应用与外部系统如何合作,并使用标准化协议。
以前,各种任务系统之间的对接非常麻烦。
钉钉审批流程应单独对接CRM、ERP系统,开发成本高,更新缓慢;在百度千帆AppBuilder访问企业数据库之前,它必须是MySQL。、MongoDB各自开发界面。在使用MCP后,直接调用预设的“MCP SQL Server",可以完成不同数据库的对接。
高德地图服务采用字节扣空间,采用MCP协议,本质上也是为了缩短开发工具等调用时间。
再次看开发与维护费用,MCP是零部件资产化和生态复用,开发任务系统,从「手工作坊」升级成「工业生产」的过程。
比如支付功能集成,传统方式需要5个人天,MCP可能只需要0.5个人天;跨平台数据同步,传统方式需要8个人天,MCP只需要1个人天。
MCP属于开放合作生态,「人在环路」机制。
这是什么意思?
当任务执行到重要节点时,系统会自动触发人工确定;比如合同审核,最后你要签字,这样不仅可以利用自动化效率,还可以在关键时刻规避风险,平衡两者。
这一机制使MCP通过协议中立工具等可插拔性,打破了传统生态的割据,使任务系统从封闭向开放。
那么,MCP平台的本质是什么?
表面上看,这是一个任务系统。但在深层次上,它通过协议层的抽象,将任务执行从“工具驱动”升级为“工具驱动”「意图驱动」。
意图驱动是什么?
我想查询订单信息,获取天气数据,处理投诉等。MCP通过智能路由识别我的意图,然后根据实际情况在任务执行过程中进行调整。
若某一服务不能使用,系统可自动选择备用服务。有鉴于此,这一创新的核心价值可归结为三点:
第一,减少依赖,系统间不再紧密地绑在一起,更容易改变;第二,灵活应对:过程不固定,可以随时根据需求和资源变化进行调整;三是开放共享,打破封闭,使广大工具资源能互通复用。
说白了,这种创新就是让任务系统,「死板的执行工具」,变成「智能连接器灵活」,能够更好地满足AI能力和实际需要。
03
再次看看目前的MCP平台,是否存在“重复造轮”的问题?
现在,RESTful等传统网线端口 API和OpenAPI)已十分成熟,它们就像不同软件之间的“通信桥梁”,使用起来非常方便。
现在,MCP要求将当前的接口再次包装成一种特殊的“服务”。这样不但增加了开发成本,而且还没有解决核心交互问题。
举个例子:
事实上,直接调用接口生成数据结构(相当于将数据包装成标准格式)更简单,而MCP协议层的抽象可能有点“过度设计”。
再次查看函数调用机制。MCP已经完成了不同模型之间的统一调用,但在一些高频轻便的任务中,人们仍然更倾向于使用原始接口。在简单的查询场景中,函数调用仍然是最有效的。
此外,对于开发者来说,学习MCP的协议语法、工具链和调试规范(如服务器发送事件SSE的传输设备)增加了很多复杂性;只要掌握基本的网络通信技能,传统的接口调用就足够了。
更重要的是,MCP协议的可扩展性在多模态数据处理(如文字、照片、声音等复杂数据的同时处理)的场景中还需要一个问号;可以说,协议的复杂性可能已经超出了实际需求。
另外,规范化和碎片化的谬论。
目前很多大厂商都在推出自己的MCP市场,但这些服务并不适合对方。阿里巴巴云只支持通义千问模型,这就导致了一个问题:类似安卓的碎片化生态可能会形成,这与协议的初衷背道而驰。
开源社区工具(如魔塔社区)与企业级方案之间也存在技术缺陷,中小型开发者不得不面对「适应多套协议」的窘境。
此外,MCP协议的可扩展性也受到限制。目前其权限管理只能达到对话水平,不支持深层次,对金融、医疗行业有很大限制。
值得注意的是安全。MCP「人在环路」机制依赖于人工控制,但是现在许多MCP平台都希望实现自动化过程,这实际上与技术创新方向有些背道而驰。
因为在多Agent合作中,计划的有效性不足,会导致级联故障,一个小问题会造成一系列大麻烦,你无法修改;相反,客户希望参与任何不满意的环节。
对,商业化问题就更不用说了。
目前,MCP市场的应用主要集中在生活服务工具(天气查询、地图导航)上。然而,在制造业领域,像OT系统这样的访问案例仍然很少,复杂的工业协议中的MCP也没有被突破。
虽然Serverless的部署减轻了运营和维护的负担,但是像阿里云这样的平台,收费方式不够透明,长期使用的成本可能高于自建API。
所以,我个人认为,其商业价值,仍然具有验证性,将来要促进协议标准化和行业深度适应。
04
现在,问题来了,什么样的MCP平台有商业价值?还是可以被中小企业使用?
这个问题我无法从宏观的角度来回答,但是从具体的使用场景来看,我可以谈谈我的感受。
假定要用一个MCP平台来构建一个高效的工作流程,例如做PPT或做用户研究,那么我更喜欢一个叫做PPT的平台。「规划方式」的方式。
所谓规划方法,就是通过不断的交互和内容补充,将想法告知系统,系统可以记住需求,逐步帮助我规划一份可行的报告或解决方案。
这一模式是从客户的角度考虑,让用户在使用MCP平台时,感觉像是在Notion上完成了一项任务;虽然Notion本质上是一个合作的笔记管理工具,但是从底层逻辑来看,它实际上和MCP平台的使用体验是一样的。
例如:
我在Notion中输入了一个问题,用斜杠(/)调用各种工具,根据问题的内容选择合适的工具,最终完成整个工作流程;如果你把这种体验搬到MCP平台上,你实际上可以通过调用不同的AI模型或工具,在输入问题后一步步实现你的目标。
从这个角度来看,开发者应该做这些重要的事情:
第一,建立通用任务框架;开发者首先要设计一个通用的任务框架,可以适用于各种场景;第二,支持灵活互动;在客户使用过程中,最好支持暂停或改变任务策略,为未来的自动化奠定基础。
第三,提高任务的准确性;只有当任务的每一个环节都能得到准确的规划和执行时,才能实现真正的自动化。也就是说,中间过程不需要人工控制,就很难变得更聪明。
从公司的角度来看也是如此。假设我想在钉钉、飞书的生态中使用一个MCP平台,我该如何使用?
举个例子:
我是一名销售员,定期拜访客户,形成信息,最后向老板汇报。整个过程可能是这样的:
首先是信息沉淀。访问客户后,整理信息。这一步涉及AI协助写作内容;写完之后,把内容整理成可视化报告。这一步需要MCP平台调用可视化工具。最后,我想把这份报告发到领导的邮箱,调用邮箱工具。
所以,整个过程都是用MCP连接起来的:调用写作工具,调用视觉工具,调用外部邮箱,定期发送给工具。
从这个角度来看,MCP平台的作用是通过协议或API连接这些工具,形成一个完整的工作流程。
所以,一个好的MCP平台应该能够让用户像在Notion上实现目标一样轻松,同时也能为开发者提供足够的扩展和灵活性。
对比字节的按钮平台,是否紧扣客户需求?我觉得第一步是对的,但是任务过程的干扰不够灵活,需要时间来弥补生态。
上述,就是我的看法。
本文来自微信微信官方账号 “王智远”(ID:作者:王智远,36氪经授权发布,Z201440)。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




