谷歌回答你：如何让大家都知道？ AI 都独一无二

2025-05-23

在今年 Google I/O 会议上，Sundar Pichai（Google CEO）发布了一组最新数据：

Google 的产品和 API 每月处理 token 数量已超过 480 万亿；

Gemini 超级活跃的开发者 700 万；

Gemini 现在的月活跃用户已经超过了月活跃用户 4 亿。

而且，作为这四亿分之一，我更关心的是我使用的。 AI 怎样才能更适合我？有点像买鞋，或者处理对象。Pichai 回答：他们（AI 智能体)会在每个用户的控制下代表其执行操作。（on your behalf and under your control）。

一切的方向，是的 AI 怎样为每个不同的个体服务？想像那些曾经让你惊叹的科幻智能机器：R2D2 和天行者的父子，机器猫和野比大雄，对了，还有最暖和的。 Javis 和大白（Baymax）…他们温柔、高效、忠诚。

因此，Google 开始尝试回答这个问题：如何让每个人都有和他们一样的东西？ AI 助手？

在今年 I/O 会议上，Google 三个关键字在答案中反复重复：Personal(个性化)，Proactive(主动)，Powerful(强大的)。

嗯，3P 原则。(...呃，我在说。 AI，你们在想什么…)

Personal：个人助理的自我修养

自动回复并不新鲜。问题是收到自动回复后的第一感觉。一定不是对方的高效率，而是来自我的冷漠——但我是一个总是背负着真诚待人思想负担的人。我该怎么办？

因此 Gmail 新发布了一个名为“个性化智能回复”的功能(夏季上线)。Gemini 能根据你过去的电子邮件和 Google 云硬盘中的信息可以制作电子邮件，让邮件自动回复更符合你的语气——这也是一个很好的机会，让你反思一下自己在网上交流的语言习惯，是温暖还是冷漠，还是喜欢怪气。

Google Meet 视频聊天中的实时语音翻译功能已经发布。它可以实时翻译你说的话，同时保留你的声音和语气，不会让你在说母语和外语的变化中感到尴尬。一开始会支持英语和西班牙语，未来几周会有更多的语言加入。

对于我来说，这个功能最大的好处，就是我那个英语专八的倒霉同事再也不能在我眼前得瑟了。

你们可能还记得去年我们在那里吗？ I/O 现场对 Project Astra 你的感受？今年，期货终于成为现货——一个通往真正“世界模型”的渠道，通过手机或眼镜观察世界，模拟世界，了解世界，甚至重塑世界。这比任何简单的语音交流都更接近我们理想的个人助手。

这次，Google 把 Project Astra 放进了名叫 Gemini Live(苹果系统和安卓系统都可以使用)的应用。

Live 功能界面

在几个演示片段中:它可以实时指导你修理自行车，包括在线搜索说明书、识别维修位置的具体问题、在堆满杂物的工具之间寻找零件，甚至在有人来找你吃饭时自动停止，然后继续；你可以拿着孩子从学校带回来的手工作业，让它 Gemini 帮助您找到能够加强优化的地方；当你紧张地指向自己的影子时，当被问及有人跟踪自己时，它也可以立刻告诉你“不要害怕，那只是你的影子”，并保证不会对你翻眼…

更多的时候，你可以在开会的时候，把老板乱七八糟的板书拍进去。 Gemini，自动进入日历和笔记本，然后分心钓鱼；或者在你老婆出门前把任务纸条拍进镜头，一键生成一个周末。 to-do-list，该做的家务和该买的商品一件不落，晚上不会挨打。

根据演示展位工作人员的介绍，这种协助行为也可以个性化，重点提醒你经常面临的问题或经常被忽视的问题。

懒惰和提高效率只是一体两面，AI 也许助理也不在乎这些。

Proactive：AI 敏感而好学，人类不耻长(常)问

Google的会议，那就无法避免“搜索”。

我一直期待着，AI 能帮助我解决一个长期困扰全人类的世纪难题：今天中午吃点吗？

打开以旧算法为主的各种本地生活应用，只会日复一日地推荐你吃过的和付费推广的店铺。这种所谓的“主动推荐”让我每天中午都极度被动——理想的午餐答案一定是既需要又需要，理解我的口味，不断创新。

AI 在加持下，搜索提供了另一种积极的帮助。今年 I/O 上，Google 把一个名字叠加到自己的搜索中。 AI Mode 方法。与去年上线相比。 AI Overview，最新的 AI 方法可以承载更多的“动作”。

以我纠结的午餐难题为例：

深层搜索（Deep Search）：针对我每天不厌其烦的问题“北京大望路到底有什么午餐可吃”，AI 模式下的 Google 搜索将进行数百次搜索，整合每次收集的不同信息，并在几分钟内生成一份堪比“朝阳区打听”的餐厅清单，包括时间、价格、评估、是否外卖等。

即时功能（Search Live）：如果午饭前我太忙了，连上面的清单都懒得看，也可以用。 AI 方式搜索中 Project Astra 实时性能力-拍一张桌子窗外的马路，说：在这一范围内寻找口吃；

代理功能（Agentic Capabilities）：忙得不能出门(其实都是装给老板看的)，AI 可以调用方式搜索 Project Mariner 代理能力，在选定的搜索结果中自动订购外卖，包括帮你比价、比送货时间、比较评价口味等。是天桥对面的沙县还是楼下角落的拉面？

个人情景（Personal Context）：根据我过去的搜索和消费，我可以在下单的时候自动记下更多的香莱。不要给咖啡加牛奶，多两包红薯条番茄酱(当然，这些个人历史信息的应用会得到额外的通知)；

定制图表和图形：最后一个大动作，你只是选择障碍(我觉得还不够饿)，那么请将上述提升结果请参考。 AI 方法拉出一个数据图，甚至做一个“如何找到午餐难题的抓手，建立一个用餐飞轮” ppt，自己订个会议厅好好分析一下，看看自己为什么会这样做…

这样折腾口吃是一种疾病。

最后，话说回来，如果你需要使用上面的所有功能来决定午餐的内容，那么你的同事已经吃完饭回来睡觉了。在这种情况下，我建议你像我一样饿。没什么。

Gemini 不要无聊或者嘲笑你，但是你自己会低血糖。

Powerful：目标是 Universal AI App

Pichai 现场提及，Gemini 最终的目标，就是成为一个 Universal AI app——或许我们可以这样理解这个名词：通用，跨平台，设备，以及真正的世界模型。

在今年 I/O 在现场发布中，也有一些新的发布反映了这一愿景：

第一，深受期待和青睐的是 Android XR 智能眼镜安卓系统的发布。多少人关于 Google Glass 怨恨终于得到了补偿：外表与苹果相似 Vision Pro 的“重型”XR 与三星、高通合作制作眼镜，编号 Project Moohan；外观类似 Rayban Meta “轻眼镜”将同时尚眼镜品牌 Gentle Monster 和 Warby Parker 联合推出。

现场“轻型版”原型机的时代体验，最大的感受就是 Gemini 与市场上现有的类似产品相比，交互流畅性的确大大优于其他产品。

其次是新发布的 Imagen4 和 Veo 其中最显著的进步是， Veo 3 成为世界上第一个支持音效、背景噪音和角色对话的视频生成模型。

在 Pichai 在演讲结束时，他举了一个“小例子”，从另一个应用角度展示了这一点。 AI帮助角色的价值：还记得去年令人震惊的加州山火吗？一款通过 Google AI 加持山火检测应用，能将火险隐患的检测范围具体到火险隐患。 270 平方英尺(约 25 平方米)，响应时间从原来的 12 小时缩短为 20 分钟。