谷歌回答你:如何让大家都知道? AI 都独一无二

05-23 10:33

在今年 Google I/O 会议上,Sundar Pichai(Google CEO)发布了一组最新数据:


Google 的产品和 API 每月处理 token 数量已超过 480 万亿;


Gemini 超级活跃的开发者 700 万;


Gemini 现在的月活跃用户已经超过了月活跃用户 4 亿。




而且,作为这四亿分之一,我更关心的是我使用的。 AI 怎样才能更适合我?有点像买鞋,或者处理对象。Pichai 回答:他们(AI 智能体)会在每个用户的控制下代表其执行操作。 (on your behalf and under your control)。


一切的方向,是的 AI 怎样为每个不同的个体服务?想像那些曾经让你惊叹的科幻智能机器:R2D2 和天行者的父子,机器猫和野比大雄,对了,还有最暖和的。 Javis 和大白(Baymax)…他们温柔、高效、忠诚。



因此,Google 开始尝试回答这个问题:如何让每个人都有和他们一样的东西? AI 助手?


在今年 I/O 会议上,Google 三个关键字在答案中反复重复:Personal(个性化),Proactive(主动),Powerful(强大的)。


嗯,3P 原则。(...呃,我在说。 AI,你们在想什么…)



Personal:个人助理的自我修养


自动回复并不新鲜。问题是收到自动回复后的第一感觉。一定不是对方的高效率,而是来自我的冷漠——但我是一个总是背负着真诚待人思想负担的人。我该怎么办?



因此 Gmail 新发布了一个名为“个性化智能回复”的功能(夏季上线)。Gemini 能根据你过去的电子邮件和 Google 云硬盘中的信息可以制作电子邮件,让邮件自动回复更符合你的语气——这也是一个很好的机会,让你反思一下自己在网上交流的语言习惯,是温暖还是冷漠,还是喜欢怪气。


Google Meet 视频聊天中的实时语音翻译功能已经发布。它可以实时翻译你说的话,同时保留你的声音和语气,不会让你在说母语和外语的变化中感到尴尬。一开始会支持英语和西班牙语,未来几周会有更多的语言加入。


对于我来说,这个功能最大的好处,就是我那个英语专八的倒霉同事再也不能在我眼前得瑟了。



你们可能还记得去年我们在那里吗? I/O 现场对 Project Astra 你的感受?今年,期货终于成为现货——一个通往真正“世界模型”的渠道,通过手机或眼镜观察世界,模拟世界,了解世界,甚至重塑世界。这比任何简单的语音交流都更接近我们理想的个人助手。


这次,Google 把 Project Astra 放进了名叫 Gemini Live(苹果系统和安卓系统都可以使用)的应用。



Live 功能界面


在几个演示片段中:它可以实时指导你修理自行车,包括在线搜索说明书、识别维修位置的具体问题、在堆满杂物的工具之间寻找零件,甚至在有人来找你吃饭时自动停止,然后继续;你可以拿着孩子从学校带回来的手工作业,让它 Gemini 帮助您找到能够加强优化的地方;当你紧张地指向自己的影子时,当被问及有人跟踪自己时,它也可以立刻告诉你“不要害怕,那只是你的影子”,并保证不会对你翻眼…


更多的时候,你可以在开会的时候,把老板乱七八糟的板书拍进去。 Gemini,自动进入日历和笔记本,然后分心钓鱼;或者在你老婆出门前把任务纸条拍进镜头,一键生成一个周末。 to-do-list,该做的家务和该买的商品一件不落,晚上不会挨打。


根据演示展位工作人员的介绍,这种协助行为也可以个性化,重点提醒你经常面临的问题或经常被忽视的问题。


懒惰和提高效率只是一体两面,AI 也许助理也不在乎这些。


Proactive:AI 敏感而好学,人类不耻长(常)问


Google的会议,那就无法避免“搜索”。



我一直期待着,AI 能帮助我解决一个长期困扰全人类的世纪难题:今天中午吃点吗?


打开以旧算法为主的各种本地生活应用,只会日复一日地推荐你吃过的和付费推广的店铺。这种所谓的“主动推荐”让我每天中午都极度被动——理想的午餐答案一定是既需要又需要,理解我的口味,不断创新。



AI 在加持下,搜索提供了另一种积极的帮助。今年 I/O 上,Google 把一个名字叠加到自己的搜索中。 AI Mode 方法。与去年上线相比。 AI Overview,最新的 AI 方法可以承载更多的“动作”。



以我纠结的午餐难题为例:


深层搜索 (Deep Search):针对我每天不厌其烦的问题“北京大望路到底有什么午餐可吃”,AI 模式下的 Google 搜索将进行数百次搜索,整合每次收集的不同信息,并在几分钟内生成一份堪比“朝阳区打听”的餐厅清单,包括时间、价格、评估、是否外卖等。


即时功能 (Search Live):如果午饭前我太忙了,连上面的清单都懒得看,也可以用。 AI 方式搜索中 Project Astra 实时性能力-拍一张桌子窗外的马路,说:在这一范围内寻找口吃;


代理功能 (Agentic Capabilities):忙得不能出门(其实都是装给老板看的),AI 可以调用方式搜索 Project Mariner 代理能力,在选定的搜索结果中自动订购外卖,包括帮你比价、比送货时间、比较评价口味等。是天桥对面的沙县还是楼下角落的拉面?


个人情景 (Personal Context):根据我过去的搜索和消费,我可以在下单的时候自动记下更多的香莱。不要给咖啡加牛奶,多两包红薯条番茄酱(当然,这些个人历史信息的应用会得到额外的通知);


定制图表和图形:最后一个大动作,你只是选择障碍(我觉得还不够饿),那么请将上述提升结果请参考。 AI 方法拉出一个数据图,甚至做一个“如何找到午餐难题的抓手,建立一个用餐飞轮” ppt,自己订个会议厅好好分析一下,看看自己为什么会这样做…



这样折腾口吃是一种疾病。


最后,话说回来,如果你需要使用上面的所有功能来决定午餐的内容,那么你的同事已经吃完饭回来睡觉了。在这种情况下,我建议你像我一样饿。没什么。


Gemini 不要无聊或者嘲笑你,但是你自己会低血糖。


Powerful:目标是 Universal AI App



Pichai 现场提及,Gemini 最终的目标,就是成为一个 Universal AI app——或许我们可以这样理解这个名词:通用,跨平台,设备,以及真正的世界模型。


在今年 I/O 在现场发布中,也有一些新的发布反映了这一愿景:



第一,深受期待和青睐的是 Android XR 智能眼镜安卓系统的发布。多少人关于 Google Glass 怨恨终于得到了补偿:外表与苹果相似 Vision Pro 的“重型”XR 与三星、高通合作制作眼镜,编号 Project Moohan;外观类似 Rayban Meta “轻眼镜”将同时尚眼镜品牌 Gentle Monster 和 Warby Parker 联合推出。



现场“轻型版”原型机的时代体验,最大的感受就是 Gemini 与市场上现有的类似产品相比,交互流畅性的确大大优于其他产品。


其次是新发布的 Imagen4 和 Veo 其中最显著的进步是, Veo 3 成为世界上第一个支持音效、背景噪音和角色对话的视频生成模型。



在 Pichai 在演讲结束时,他举了一个“小例子”,从另一个应用角度展示了这一点。 AI帮助角色的价值:还记得去年令人震惊的加州山火吗?一款通过 Google AI 加持山火检测应用,能将火险隐患的检测范围具体到火险隐患。 270 平方英尺(约 25 平方米),响应时间从原来的 12 小时缩短为 20 分钟。



这么好的助手,要说贵,也不便宜。


但是也总有人用支使“强力助手”,偶尔做些傻事,比如我:


我在几个小时前坐下 I/O 会场,试着 Gemini 生成这篇稿子的大纲,为了快速工作,我去了展区闲逛,但最终还是推翻了它给我的六个不同版本,自己写了下来。写完之后,我看了看:嘿,这不是真的。 Gemini 给我的第一个版本差不多…


AI 当我成为一名个人助手时,我终于活成了我讨厌的老板。


因此,AI 助理不容易,对吧?本人打算给它一个名字,算一个表现,以资助鼓励。


本文来源于微信微信官方账号“果核”(ID:作者:Guokr42:Gemini,卧虫,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com