疯狂之后,我和几个硬件工程师聊天 Manus 价值与意义
在昨天拿到 Manus AI 经过几个小时的测试,有很多检测码,在手机/PC 厂家工程师/产品经理朋友,来找我。「打听」Manus AI 真正的能力是什么?
为什么硬件行业如此关注硬件行业? Manus?这个概念和目前硬件行业最受关注的概念——LAM 相关。LAM 是一个从 LLM 延伸的名词,全名为大型行动模型 (Large Action Models),又称大型智能体模型。
与 LLM 致力于「超越人类」,因此在训练方法上也常常突破人类经验的完全不同,现阶段 LAM 要做的,就是成为人类的手,成为数字世界中人类客户的代理人。
这和 Manus 核心思想有相似之处。现在,Manus AI 感觉,围绕着云端运行的感觉 Ubuntu 在操作系统虚拟机上,同时打开操作系统 Chrome 浏览器界面,在网页中或调用其它软件,以满足各种客户要求。
为满足这一要求,Manus 需求同时存在「自然语义理解和计算机视觉」,以及「顾客的行为习惯学习和场景感知」,同时拥有「自主决策的意图识别」能力,当然是最重要的,同时也是让步 Manus AI 与此前的 Computer Use 无论是体验上有明显的差异,「跨应用调用工具」的能力。
举例来说,对于普通人来说,「能不能用 Manus AI 制作一个视频」严格来说,这个问题的答案是「能够」,但 Manus AI 去制作一个视频的方式,都是通过在网络上搜索第三方 AI 录像生成工具,并在此过程中使用各种工具,以满足客户的要求。
01 LAM 真正的未来
进入 2025 年,Agent AI,或者说 LAM 在终端的着陆已经是一个明显的趋势。但是如何着陆,最终会呈现给用户的商业产品还是有很多问题的。
早在 2024 年初,当时发布的 Rabbit R1 硬件,以及相应的硬件 LAM 工具——Rabbit LAM Playground 事实上,今天我们已经展示出来了。 Manus AI 里面看到的能力原型。
官方演示中,Rabbit R1 所搭载的 LAM Playground,它可以主动帮助客户完成播放歌曲、打车等服务。其实背后的技术原理就是利用它。 LAM 通过模拟人与网站的互动技术,访问相应的服务网站,完成客户指令中的任务。

但彼时的 Rabbit Playground 受到模型和开发能力的限制,还不能像人类一样,在网络上畅通无阻。
面对人机验证这样的场景,在实际用户的测试中, Rabbit Playground 仍然很难通过,也不能使用第三方工具来完成复杂的表格生成和导出。 PPT 这种用户需求。
由于在实际使用中面临许多挑战,Rabbit R1 身为明星 AI 硬件,迅速退出主流客户的视野,AI 时过境迁的热点变化如此之快,以至于到了 2025 每年早些时候,在网上很难找到关于该产品讨论的声音。
但 LAM 作为一种可能改变人类用户与智能产品设备互动的火种,这个概念仍然作为行业中的一个重要研究方向而存在。
Manus AI 它的出现,尤其是在自然语义理解、网络访问网站时,面对各种人机识别,都可以面对各种人机识别,「畅行无阻」能力,让很多人仍然致力于 LAM 产品研发,并希望在今年推出相关检测产品的人,再一次看到机会,希望通过。 Manus AI 为了进一步完善自己的商品,现在的能力和缺点。

现在,我们正致力于开发 LAM 在硬件制造商中,商品,以提高用户对手机/电脑等商品的使用体验,系统级制造商正在做 LAM 其中,优势最为明显。
「Manus AI 这种命令执行方式对算率要求很高,但如果是浏览器或者智能手机操作系统来做,可以大大降低算率成本,通过获取更多优质数据来提高启动速度。」。
「做通用 LAM 虽然在某些场景中可能会适应一些单一的网站,但并不一定要适应。」
「ManusAI中的一些简单场景,并不需要完全移动到(云)上进行处理,而是留在端边效果更好。」根据这个面向桌面端的开发 LAM 根据应用开发者的说法,目前的端侧模型经过针对性的训练后,可以实现简单的通用网页访问和内容识别能力,可以初步完成,比如「浏览有关旅游网站,制定旅游计划」这种需求。
另外,由于端侧有更方便的文件管理系统,同时也有更强大的本地文件管理工具,遇到类似的情况「对简历进行整理分析」这种需求,端侧 LAM 同样可以达到更好的效果。
在我的实际测试中,我希望 Manus AI 帮助我生成一个 PPT 文件,它可以在计算机上自动安装相应的依赖环境,然后通过工具自动执行。 PPT 生成,尽管最终仍然完成了客户指令中的需求,但仍然大大降低了响应请求的时间。
02 如何理解 Manus 的意义
当前,Manus AI 在展示的逻辑中,已经向大众展示了 LAM 在「生产力」该领域可以带来怎样的变化,但仍有许多问题亟待解决。
其中最重要的,也是被问到最多的,也许就是商业化这个问题:很多用户对于这个问题 Manus AI 这种服务,最终会定价多少有很多猜测。
除了类似 Manus AI 通过这种方式,完全交给云运行,用户端只需要「输入命令 - 回到成果」之前提到的很多硬件厂商,其实都是以端侧/云混合运行为主流方案。
事实上,这就暗示了未来 LAM 发展,也许可以分为两个不同的主流方向;不仅仅是基于当前的硬件计算率,在端侧实现性能稍差 LAM,还有一些完全基于云的「数字代理」服务。
但是这种服务,离最终投入市场还有很长的路要走。「Manus AI 这样的服务,如果订阅的话。 20 很明显,美元(订阅费)是完全不够的。」目前在手机厂商工作,R&D。 LAM 端面应用工程师对此进行了评价。
只是整个虚拟机运行和内容串流实时同步的高成本,就足以成为目前这类服务面向普通消费市场的最大阻力。
对于以 ChatGPT 为代表的 LLM 就商品而言,近年来迅速建立了一套实用的订阅系统,客户也在建立。「每个月 20 美金」在周期往复中,建立了精确的心理预期。
如果 LAM 将来想要这样做「前端硬件 后端云服务」这种方式继续存在,同样也要经历这样一个过程,同时在这个过程中迅速降低订阅成本,最终将这种商业模式运行起来。
这是一个完整的云部署 LAM 进一步完善,我们很有可能再一次看到它。 Rabbit R1 这样,形态更加灵活。 AI 硬件配置出现:它可以是智能手表,也可以是 AI 眼镜,甚至可能是智能耳机等完全不需要屏幕的设备。
到了这个阶段,LAM 事实上,它已经演变成了 Agent UI:客户不再需要像传统手机界面、浏览器这样的客户交互界面,只需要一种方式供用户输入指令,并接受 LAM 最终交付结果的终端。

它或许不如 LLM 那种科幻,但是在现有硬件的基础上,我们可以在短时间内看到最明显、最有能力的方向,给用户和硬件的交互带来变化。
随着 Manus AI 进一步将 LAM 以及 Agent AI 能够做些什么,呈现给更多的普通用户,也许这就是 Manus AI 这次浪潮终于退去之后,给我们留下了最重要的收获。
「即使最后的赢家不是它,它也是极其重要的。」一位 LAM 产品经理这样评价 Manus AI 产业价值。
本文来自微信微信官方账号 “极客公园”(ID:geekpark),作者:张勇毅,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




