不吹不黑,拿到推荐码一手实测Manus,还有人在0天内复制开源版。

03-08 11:08

我们记录了这篇文章 Manus 具体的使用体验,并介绍 Manus 开源复刻版。



昨天,一个叫「Manus」的通用 AI Agent 商品引起了热烈的讨论。它可以完成各种任务,如文件处理、数据分析、代码编写和内容创作,如帮助用户生成旅行计划、分析股票数据、筛选简历或开发简单的网络游戏。



可是,因为「Manus」只发了少量的推荐码,可以体验到目前这个应用的人数还是比较少的。在电商平台上,推荐码的价格一度被炒成几万块,甚至有人帮别人申请。 Manus 推荐代码业务。


一系列的行为,让很多人无法直接体验。 Manus,这也为 Manus 吸引了不少质疑的声音。


自然,每个人最关心的还是 Manus 究竟好不好用,这也是 Manus 的核心。


得到推荐码后,机器之心进行了一些测试,并且在体验过程中感受到了什么。 Manus 写出了优点和缺点。我们不做 「吹捧」语言描述风格,仅供大家参考。


另外,我们还注意到,有些执行力很强的人。 Agent 这个团队已经完成了 Manus 包括开源复刻,包括 CAMEL AI 团队开源的 OWL 和 MetaGPT 团队开源的 OpenManus。


根据机器的心观察,AI 学术 / 对于技术社区 Manus 爆红保持相对理性的态度,尤其是 Agent 该领域的专业人员。怎样看待? Manus,在了解了相关信息之后,读者可以自己判断。


下一步,我们先分享一下。 Manus 具体使用体验。


Manus 效果如何?机器之心实测


先来个基础,「写一个贪吃蛇小游戏」。是啊,提示就这么简单,看看吧, Manus 能不能给我们带来惊喜?


按下发送键后,Manus 一共执行了 5 多分钟,包括建立贪吃蛇游戏文档、实现游戏基本机制、添加用户控制功能、开发记分系统、测试游戏功能、编写游戏说明文档、包装和交付游戏等多个步骤。



下载其输出压缩包,看看效果如何。更令人费解的是,Manus 此次输出结果为双压缩包,即经过两次压缩的压缩包。


测量一下,是可玩的。Manus 确实完成了贪蛇游戏的基本逻辑和评分系统,但似乎没有设置撞墙死亡的判断,游戏只有撞到自己才会结束。另外,它的网格线设计太明显了。 —— 但是如果我们能够在提示词中给出进一步的详细描述,效果应该会更好。



下一步,我们放手 Manus 分析一下 Manus 主题的传播趋势,我们给出的提示是:「搜索网络,分析网络 Manus 主题传播趋势,并写一份汇报总结。」


这一次,Manus 思考的时间更长,实现了。 14 分分钟,同时也分为 7 步骤:搜索 Manus 主题基本信息,分析 Twitter 平台上的 Manus 主题传播趋势,搜索其它社交平台 Manus 关于提及,整合趋势分析数据,编写传播趋势汇报总结。


每一步都包含几个小步骤,比如写一个。 Python 脚本来使用 Twitter API 等等。


并且在执行过程中,我们也可以执行。「Manus 的电脑」,查看浏览网络和撰写报告的过程。



但这次,Manus 比如在表现不佳的情况下,「分析 Twitter 平台上的 Manus 主题传播趋势」这个步骤,它没有成功地使用。 Twitter API,所以找不到任何有用的信息。它给出的解释是:「我注意到在 Twitter API 在搜索中找不到 Manus 有关文章。也许是因为 Manus 这是一种较新的产品,或者需要调整搜索条件。在其他平台上我会继续搜索 Manus 提及情况,深入分析其传播趋势。」考虑到 Manus 目前的热度,这种解释显然是不正确的。


不管怎样,还是来看看报告的结果吧。如下图所示,输出结果包括三个。 Markdown 文件,分别是趋势报告、趋势分析和背景信息。总体而言,尽管没有 Twitter 输入上述相关信息,但通过对知乎文章和一些媒体报道的分析和引用,内容相当丰富详细,甚至反映出来。 Manus 在传播过程中,媒体先行的传播趋势和引发的争议。



下一步试一试 Manus 能不能帮我们省钱:「预算 6000,给我配备一个高性价比的主机,可以剪辑视频,玩游戏,把配置单发给我。」


这一次,Manus 达到了布局的任务步骤 8 步骤:研究当前 PC 零部件市场,分析视频编辑和游戏的硬件需求,分析视频编辑和游戏的硬件需求,建立详细的配置清单,验证零部件的兼容性,提高性价比,为用户准备最终的文档和发送设备。


以下动画显示 Manus 浏览网页查找相关信息的过程示例(原来的过程慢了很多,这里加速):



18 分钟后,Manus 完成这项任务,这是它给出的最终配置单。您认为这是合理的吗?



下一步,我们试着让它过去。 Manus 玩 4399 游戏。Manus 网页打开成功,但登录页面受阻。我们选择接管页面,微信登录,没问题;但是实名认证的时候出现了情况。 —— 我们不能在 Manus 在内置电脑中输入中文。下面的视频显示了这个测试的全过程。


最后,我们试图让步 Manus 按照我们提供的排版网页编写一个排版网页 Notepad 宏,方便我们的排版工作。所以,Manus 首先要对网页所提供的功能进行分析,然后再学习。 Notepad 宏的语法。


提示:把这个网页放在一起 https://www.dute.org/type-setting 这些功能被转写成一个 Notepad 的宏。



这一次,Manus 整整思考了 21 分分钟,但结果并不令人满意: Notepad 里面的实测结果显示,Manus 基本版本和完整版本都没有正确完成指定的任务,反而删除了我们的检测文本。



这一次,Manus 失败了。


在这里,我们每天的用量限制已经达到了极限,不能再进行更多的测试。



经过整体体验,可以简单总结一下。 Manus 执行任务的过程:


第一,分析问题是很自然的。


接下来,Manus 会创建代理事项,包括主要步骤和每一个主要步骤下的每一个细分任务;这通常是一个 todo.md 文档。


以后,Manus 会按照这个 todo.md 一步一步地执行文件事项。


最后,把结果整理好,发给顾客。



上述计算机配置任务已执行到第一。 6 步的 todo.md 文档


至于效果,虽然有失败,但总体来说还是挺不错的。虽然用户的体验速度很慢,但考虑到如果客户自己完成同样的任务,可能需要更多的时间,使用具有这种特性的智能身体来帮助工作应该是一个不错的选择。


开源复刻版 Manus


下一步,我们介绍两个。 Manus 开源复刻工程。


「别抢 Manus 推荐码,开源版已经在路上了。」它是国内开源平台 CAMEL AI 今早带来的好消息。


他们的 Manus 开源复刻版名称「OWL」,在 GAIA Benchmark 上性能达到 超过57.7% Huggingface 提出的 Open Deep Research 55.15% 表现,成为开源界 GAIA 性能天花板。(GAIA 这是一项基准测试,用于评估一般人工智能助手的能力,Manus 还进行了相关的测试。)



GitHub:https://github.com/camel-ai/owl


为了让 OWL 进化成真正的全自动多了 Agent 打工神器,CAMEL AI 还对 Manus 技术路线做了一波野生浪潮 Reverse Engineering(逆向工程),并顺势启动了深度复刻计划。


他们把这个计划放在这里 Manus 核心工作流被拆分为 6 步:



这个项目可以算是公开了所有的技术框架、工作流程和核心能力,所有的代码都在 GitHub 上面。有兴趣的读者可以自己跟进。


针对 Manus,CAMEL 发起人李国豪评论说,「世界上第一个我们正在提出 ChatGPT Multi-agent 框架思想也接近两年了,看见 Monica 团队把 Multi-agent 技术落地产品是一个很大的惊喜,Monica 团队的 Manus 实际上,系统设计很巧妙,尤其是它们通过文件系统来实现 Context 管理与持久,使用 Ubuntu 为了实现工具的灵活使用,虚拟机的命令行是很值得学习的工程思路,我们还在开源复现中!同时也很期待他们承诺开源。 Post Training 模型!


除了 Web 除了命令行的控制,我们对计算机、手机、机器人、车辆等各种跨平台的控制都非常有信心。会成为可能,那时候才是真正的赛博。 workforce,由于 OS 端 Agent 最大的优点之一就是更容易获得。 Verifiable 奖励信号,将来加强学习 RL 能训得飞起来,也许一年之内就会出现这种情况。 DeepSeek R1 Zero 这样的 Aha moment 出现在 OS / Web Agent 领域!遗憾的是,我们的资源有限还不能提高。 RL,很期待大家一起做开源探索!遗憾的是,我们的资源有限还不能提高。 RL,很期待大家一起做开源探索!」


OpenManus 是除了 OWL 另外一个 Manus 开源复制,允许用户创建自己的推荐码,无需推荐码。 AI 智能体。它的使用方法包括设置新的 conda 环境,克隆仓库,依靠安装 config.toml 文档中配备 API 密匙(如 OpenAI 的 API)。使用者可以通过终端输入思路,与智能体交互,智能感受使用。 LLM API 处理并产生反应。



项目地址:https://github.com/mannaandpoem/OpenManus


其中,也有一些不同之处。正如我们上面提到的,Manus 就是自己有一台云计算机, OpenManus 则直接让 Agent 操作计算机。


MetaGPT 该团队表示,目前的项目仍在开发中,计划改进包括更好的计划、即时演示、重播功能、加强微调学习模型和综合基准测试。


最后想说的是,期待 Agent 这一年可以给我们带来更多的惊喜,成为实用的商品。


本文来自微信微信官方账号 “机器之心”(ID:作者:关注智能体,36氪经授权发布,almosthuman2014)。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com