从 Manus 到 GO-1:当AI逐渐进入物理世界时,

03-11 12:03

2025年3月,中国AI领域无疑是一块投入平静湖面的巨石,激发着层层巨浪,引起了全世界的关注。首先,Manus通用AIAI Agent以“世界上第一个执行级智能体”的姿态出现,就像一道闪亮的闪电划破了科技的夜空;接着,GO - 一般具体底座大模型宣布开源,声称要“重新定义人机交互界限”,仿佛飓风席卷而来。这两种技术的碰撞和竞争让人不禁思考,当AI开始从云端走向物理世界,真正参与到现实的互动和创造中,人类离真正的智能革命还有多远?


Manus:"执行级AI Agent"降维攻击


Monicaas是一家中国初创公司。.Im开发的世界上第一个通用AI智能体的核心定位是独立执行复杂的任务并交付结果。Manus的出现意味着AI智能体从单一任务执行到复杂决策的飞跃,其名称来自拉丁文。mens et manus”,意思是“知行合一”,强调知识与行为的结合。


1. 核心能力:闭环从“思考”到“行动”

Manus的出现就像一场技术革命,打破了传统AI只是作为“工具”的属性。它不再被动地等待指令,而是拥有它从理解指令到自主拆解任务调用工具跨平台执行并且最终交付完整结果的能力,形成了一种从“思考”到“行动”完美闭环。


在金融分析领域,当用户输入“分析特斯拉股价波动”的指令时,Manus就像一个专业的金融分析师,可以自动抓取特斯拉的财务报告,与美联储的政策信息相关联。最后,生成可视化报告。这个过程不但效率高,而且准确,大大节省了金融从业人员的时间和精力。



教学场景中,教师只需上传教材,Manus就可以自动生成教案,制作PPT、写练习,甚至还可以模拟课堂互动。对教育工作者来说,这无疑是一个有效的助手,可以让他们更加专注于教学方法的创新和与学生的互动。



就企业级应用而言,某跨境电商客户使用Manus完成。竞争产品分析,广告营销,物流调度等待整个过程工作,效率提高400%。这个显著的结果充分展示了Manus在实际业务中的强大执行力和价值。



更加值得注意的是,Manus在GAIA基准测试方面的表现令人惊叹。其综合得分已经达到86.5%,远远超过OpenAI Deep 67.9%的Research。这些数据表明,AI最终从“实验室玩具”演变为“职场杀手级助手”,在日常工作中起着重要作用。



2. 技术底层:通用智能体的“灵魂三要素”

由于通用智能体的“灵魂三要素”,Manus能够拥有如此强大的能力。


Manus的一个重要特征就是多模态感知。文字,图像,语音等待多维输入,就像人类拥有多种感官一样,可以从不同的渠道获取信息,从而更全面地了解用户的需求。


Manus高效执行任务的关键在于动态规划。通过加强学习,优先实时调整任务,根据实际情况灵活安排工作流程,确保任务能以最佳方式完成。


云实现是Manus的强大后盾。依靠分布式计算网络,它可以实现7×24小时不间断工作,无论何时何地,都可以为用户提供及时、高效的服务。


正如球队核心成员季逸超所说:“Manus不是一个更聪明的AI,而是一个更像‘人’的AI。。“它的出现,使AI更接近人类的思维和行为,给人们的生活和工作带来更多的方便。


GO - 1:具身智能时代的“全能智囊团”


假设Manus代表了人工智能在工具化应用方面的突破,那么智元机器人发布的GO-1就是具体智能领域的一大飞跃。GO-第一个是世界上第一个通用具体底座大模型,它创造性地提出了Vision-Language-Latent-Action(ViLLA)结构。这个结构由VLM(多模态大模型)和MoE(混合专家)通过对人工智能技术的深入学习和生成,构成了视觉、语言和动作的深度融合。



1.ViLLA架构:从“数据模型”到“物理世界的交互接口”

ViLLA架构的核心是消除图像-文本输入和机器人执行动作之间的差距。传统的Vision-Language-Action(VLA)ViLLA通过引进Latententent来进行架构。 Action Tokens(隐式动作标记),模型显著改进动作计划与执行。在实验中,GO-1在五个不同复杂程度的任务中表现出色,通过率比目前最佳模型提高了32。



2.GO-1的四大创新

(1)人类视频学习GO-能结合因特网视频和真实人类示范进行学习,提升模型认识人类行为


(2)小样品迅速泛化当极少数甚至零样本时,GO-1能够快速对新场景和任务进行泛化,具体智能应用门大大减少。


(3)一脑多形GO-1可以灵活布署为不同类型的机器人提供多种机器人形式,展现出极高的实用性和灵活性。


(4)持续进化通过数据回流系统,GO-1能在实际使用中不断学习和提高自己的性能,越用越聪明。


3.GO-1的使用场景

GO-1的推出意味着智能向通用、开放和智能方向的快速发展。未来,机器人将不再局限于实验室,而是能够适应多变的现实世界环境。例如,在工业制造、物流运输、家政服务等领域,GO-通过视觉、语言和动作的深度融合,可以实现快速的任务执行。


产业链重构与竞争升维 以生成AI和大型模型为代表的新一轮人工智能浪潮正在从广泛的价值链中受益。例如,计算能力需求的快速增长促进了芯片和云计算产业的升级,数据成为核心生产要素,促进了数据治理和隐私计算市场。与此同时,智能应用的深化加速了制造、医疗、内容、金融等领域的转型升级。


从数据模型到物理世界的交互接口

不像Manus专注于“执行”,GO - 1主推“理解与生成",它的技术定位是成为物理世界的交互接口。其核心技术包括多模态大模型、具体推理和工具学习。


多模态大模型支持图文音频和视频即时结合分析,能像人类一样对各种信息进行综合处理,从而更准确地理解物理世界中的各种场景和指令。


通过传感器数据构建具体推理的动态环境模型,使GO - 1可以感知周围环境的变化,并且根据这些变化做出相应的决定。


工具学习则使GO - 1可调用机械臂、无人驾驶飞机等物理设备执行指令,真正实现从虚拟世界到物理世界的飞跃。


商业游戏:中国AI军团全球突围战


Manus派强调“任务导向”,通过标准化接口访问当前的工具链,适合快速商业化。它可以在短时间内为企业和客户提供高效的服务,满足市场需求。


GO - 1派通过深度硬件协作和自主决策能力,致力于“系统级智能”,构建物理世界的实时交互闭环。它更像是 “婴儿学习”—— 而不是依靠外部工具,从感知环境到动作执行全链路的自主进化。比如,GO-1 通过 AgiBot World 数百万真机数据训练可以理解人类指令,在没有预设场景的情况下完成续水、装配等精细操作,在工业质量检验、智能机器人等领域表现出颠覆性潜力。它与蘑菇车联车路云网络的融合,更是实现了从 “自行车智能” 到 “城市智能体” 越迁,为自动驾驶、低空物流等场景提供系统级解决方案。


它们之间没有优缺点。Manus占领公司服务凭借强大的执行能力和高效的任务处理能力,市场为用户提供全方位的解决方案;GO - 1深耕硬件集成通过与物理设备的深度融合,实现物理世界的智能交互。


支持AI的政策


在政策层面,中国政府非常重视人工智能的发展。2025年全国人大再次强调“人工智能” "行动,建议继续推进"人工智能 ”,更好地将数字技术与制造优势、市场优势相结合。这个政策导向将有力地支持人工智能技术的实施和应用。 从“互联网 ”到“人工智能 “AI已经成为新一轮全球科技革命和产业变革的核心内容。未来,随着技术的不断发展和政策的支持,人工智能将在更多领域取得突破,推动社会智能化发展。


AI的 “具身化” 与 “通用化”


从 Manus 的争议到 GO-1 的突破,AI 发展从来没有这么贴近现实。当智源机器人在临港工厂量产人形机器人时, Manus 预告的更新引起了期待,我们正站在新时代的门槛上:AI 不再是屏幕后面的代码,而是可以感知,思考,行动的 “数字有机体”,


就像蘑菇车联通过深度整合物理世界的实时动态AI模型一样,--MogoMind建立城市实时数字孪生基础,通感算网络已经赋能了AI自动驾驶、低空经济等领域, 基础设施支持与物理世界的深度融合。这场技术革命可能会重新定义人类与世界的互动技术。


具体化是人工智能发展的重要方向。人工智能将通过机器人、无人机等终端直接参与虚拟世界的生产和生活。这意味着人工智能将不再仅仅是人们在屏幕前使用的工具,而是真正融入人们的生活和工作,成为人们的伙伴和助手。


通用化也是AI发展的必然趋势。单个任务模型将被基础模型所取代,AI系统需要具备理解、推理和执行的综合能力。这将使AI能够更灵活地应对各种复杂的任务和场景,为人们提供更全面、更高效的服务。


这个趋势和马斯克的Optimus、特斯拉的AI战略不谋而合。当具体智能与通用智能体紧密结合时,AI可能真的会成为 “人类延伸”—— 既可以在云端运筹帷幄,又可以在现实世界中动手创造智能时代的终极景象。 —— 一个虚实交融,万物互联数字孪生的实时世界。


本文来自微信微信官方账号“山自”,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com