智谱免费发云手机和云电脑,AutoGLM体验如何?
好消息来啦!各位朋友,现在相当于村里发手机了,不过这手机不在手里,而是在云上。

当然,这可不是普通的云手机。大家有没有觉得,我们距离真正的AI助手,好像总差那么“最后一百米”。让它定个闹钟、查个天气没问题,但一遇到复杂操作,人工智能就成了“人工智障”。
比如想让Siri去饿了么上帮点奶茶,它却开始搜索饿了么门店位置;说前门楼子,它听成胯骨轴子,然后自顾自干活。


为了不浪费AI能力,去年智谱有个很棒的成果。别家大模型还在专注于问答、写代码、编音乐、画PPT时,智谱的大模型只要你说说话,就能理解想法,然后一步步操作手机获取信息。
去年就能在手机上操纵小红书查攻略,还能让大模型帮忙点奶茶,甚至我还抢到过它发的红包。


今年,智谱更进一步。直接操作手机已不能满足它,因为AI干活速度慢,会占用我们使用手机的时间。
于是今年,智谱给大家每人发了一台云手机和云电脑,它们24小时待命。我们动动嘴,它就能像真人一样在云手机上操作各种APP完成任务。
打开AutoGLM App,就能看到准备好的云手机和云电脑,安卓和iPhone用户都能免费使用。

我问过智谱的朋友,为啥产品这么豪横能免费使用。他们透露,模型用的是自研大模型,成本很低。跑一个任务成本大概0.2美元,而隔壁Manus做同样的Agent,用Claude的API,跑一个任务要花2美元,是AutoGLM的十倍。

那AutoGLM干活表现如何呢?我简单测试了一下,以点饮料为例,我说“帮我去美团上点五杯蜜雪冰城的柠檬水,并且直接下单”,云手机就开始一步步操作。
它先打开美团,在搜索框输入蜜雪冰城,进入店铺,找到柠檬水,连点五次“ + ”号把五杯柠檬水放进购物车,最后让我进行买单确认。这里的GIF为压缩大小做了加速处理。


买车票、订酒店等场景,AutoGLM也能操作,不过最后付钱还是得自己来。而且它不仅能控制单个App,还能在云手机的不同App间跳转,帮我们找出最实惠的产品。
比如我想买罗技的Mx Master鼠标,让AutoGLM去淘宝、京东、拼多多逛一圈,它会自动拆解任务,在云手机里执行,查询比价后把结果汇总给我。




虽然执行任务速度不算快,但它在专门的云手机里干活,不影响我们使用自己的手机。可以说,如果过去的大模型是提高干活效率,那现在的AutoGLM能让我们一心二用、多线程操作。
更厉害的是,智谱不把这种能力局限在自家APP里,而是开放API,把云手机、云电脑的控制权交给开发者。这意味着任何能访问网络的设备,都能通过API访问AutoGLM里的云手机。

看到这事,我想到了开源项目OpenGlass。它是个能把普通眼镜变成智能眼镜的开源小设备。

我申请了AutoGLM的API,花一晚上把它接入OpenGlass。这样不用手机,通过说话让眼镜帮我订酒店、买机票。


当然,我DIY的AI眼镜模块比不上大厂成熟产品。而且智谱已在和智能眼镜厂商对接,可能不到一年这类产品就会走进现实。
这次折腾更像一次有趣的实验,接入智谱的AutoGLM API后,我仿佛提前看到了下一代移动交互技术可能的演变方向。
自2007年初代iPhone问世,触摸交互方式被定义,苹果开启了移动互联网黄金时代。如今快20年过去,我们对滑动和点按感到麻木,下一个颠覆行业的交互方式是什么,谁会成为下一个iPhone,没人能给出确切答案。

于是我们看到一场精彩的军备竞赛:苹果推出Vision Pro试水空间计算,Meta从VR头显发展到与雷朋合作的智能眼镜,谷歌重启Project Glass,国内小米、雷鸟、Rokid等厂商也纷纷发布新款AI/AR眼镜。


或许决定下一代移动设备平台的关键,不在硬件本身,而在硬件背后的灵魂,即能真正理解我们意图并执行任务的AI。我们需要的不是戴在头上的语音问答机,而是像AutoGLM这样能调动资源解决问题的“贾维斯”。

如果这条路能走好、走顺、走稳,那你的下一个手机,可能就不只是手机了。
撰文:早起



本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com



