Gemini可与第三方App交互,谷歌打起用户数据主意
只需一句话,AI助手就能调用手机上的第三方App帮你点奶茶、订餐厅、买车票。随着AI视觉、智能体、MCP等技术和标准的出现,手机上的AI终于具备了实用性。国内Android阵营手机厂商纷纷探索AI自主操控第三方App后,谷歌也坐不住了。

01
日前消息显示,谷歌本周一更新了部署Gemini AI的新策略,Android系统将允许Gemini访问第三方应用。谷歌已通过邮件通知用户,Android近期将进行这项调整,无论是否开启或关闭Gemini的应用活动(App Activity),都将给予Gemini访问WhatsApp等第三方应用的权限。
值得注意的是,谷歌强调“人工审核员(包括服务提供商)会阅读、注释和处理”Gemini访问的数据,但未提及用户如何彻底移除Gemini集成的方式。而且谷歌在邮件中称Gemini“不会保存72小时前的活动记录”,这种模糊说法让用户对Gemini处理与第三方应用交互数据的方式心存疑虑。

针对用户疑虑,谷歌宣称:“这个更新对用户有益,现在他们可在关闭Gemini应用程序活动的情况下,用移动设备上的Gemini完成日常任务,如发送消息、拨打电话和设置计时器。当Gemini应用程序活动关闭时,其Gemini聊天不会被审查或用于改进我们的AI模型。”
有趣的是,在谷歌宣布Gemini支持与第三方应用交互前,荣耀已在MagicOS 9.0上实现一句话让AI自主操控第三方应用。不过荣耀采用纯视觉方案,无需第三方应用适配,而谷歌此次走智能体路线,通过Gemini调用第三方应用的API接口,无需每步都进行感知、决策和执行。

02
为何谷歌不用纯视觉方案?
实际上,让AI像人一样操作电脑、手机的解决方案源于Anthropic的“Computer Use”功能,但如今AI业界主流是MCP(模型上下文协议),即通过标准化协议让AI调用外部工具。放弃纯视觉方案的原因很简单,其效率远低于MCP,强行让AI适配人类交互方式得不偿失。
问题在于,AI直接通过API调用第三方应用存在明显的数据泄露风险,并非所有人都信任谷歌。经过近两年多的发展,科技巨头对AI的态度已很明确,都将摘取人工智能领域的“圣杯”——AGI(通用人工智能)作为首要任务,为获取训练更强大AI模型的基石——数据,可谓各显神通。

比如,Meta重拾因道德考量搁置的人脸识别技术,用智能眼镜采集数据;亚马逊宣布Echo智能音箱只允许用户将语音记录发送至云端,禁用本地录音隐私功能;苹果、英伟达未经授权使用YouTube视频训练AI;Anthropic用盗版图书库打造Claude大模型。
可见,各大厂商为收集数据训练更强大的AI,纷纷撕下温情面纱,几乎都在打擦边球。
Meta、亚马逊、苹果等公司都有“黑历史”,谷歌就能“出淤泥而不染”吗?事实上,谷歌在硅谷大厂中吃相较难看,违规收集用户数据被抓现行多次。本月初,谷歌就因非法收集美国加州地区1400万Android用户的移动数据信息,被判支付超3.146亿美元赔偿金。

03
尽管用户心存疑虑,但多数人可能会接受谷歌的决策,毕竟Gemini与第三方应用交互的想象空间巨大,或许能改变用户使用Android系统的方式。
2017、2018年,Android阵营掀起智能语音助手浪潮,但仅两年就过气。原因是智能语音助手效用有限,只能完成定闹钟、打电话、打开App等简单操作,面对复杂指令就会陷入困境,用户难以体验其魅力。
同理,用户对手机AI反应平淡,也是因其能力有限。比如三星手机“即圈即搜”等少数出圈的AI能力,因用户日常搜索频繁,画个圈就能搜索选中内容,所以AI带来的变化显著。

“即圈即搜”就是Gemini交互第三方应用的体现,通过视觉模型识别用户圈选内容,调用谷歌搜索的API呈现内容。试想一下,如果搭载Gemini的Android手机只需用户动动嘴,就能帮点咖啡、订餐厅、发红包、拨打微信电话、生成会议纪要、翻译文档,会带来怎样的体验。
所以,当面临数据可能被谷歌用于迭代Gemini,和允许Gemini调用第三方应用带来便捷的选择时,不少人可能会用隐私换取便利。只能说,这次谷歌真的“Copy from China”了。
本文来自微信公众号 “三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




