Kimi使用浏览器插件落地AI:比网页更方便,但是功能有限

2024-07-12

创业公司月之暗面旗下的 Kimi 智能化助手,也许是国内最大的大型模型市场之一。「黑马」,几乎从今年春节开始,一路飙升,很快成为二级市场和二级市场。 AI 圈内讨论的焦点。


即使到了 6 月,Kimi 网站流量在 AIGCRank 在统计数据方面仍然远远领先于其他统计数据 AI 聊天机器人和 AI 搜索引擎,包括百度文心一言和秘塔 AI 搜索等一众 ,在国内排名第一。


更为重要的是,凭借长文本处理的优点,产品层面的尝试和免费使用,Kimi 得到用户的认可和青睐:


从长达 80 电视剧《甄嬛传》剧本 90 万字的“三体”原本是提炼和总结的,可以快速总结和回答从链接到各种格式文档的问题。越来越多的普通用户日常使用。 Kimi 用于工作、学习和娱乐,并在社交网络上分享。


但是真正深入到用户场景中,虽然网页版的产品形式有其优势和局限性,尤其是对于需要高频使用的前台应用。所以最近,Kimi 官方浏览器插件终于推出:


Kimi 浏览助手。


Chrome 扩展商店截图,图/雷科技


Kimi 浏览助手可以避免许多繁琐的步骤,不仅不需要跳转到 Kimi 首页可以进行一系列的询问和处理,也可以直接在正在浏览的网页中选择相关文本,这样可以 Kimi 进行解释或扩展等处理。


那不是第一个 Kimi 以前有开发者基于浏览器插件。 Kimi 网页开发了第三方浏览器插件,例如, Kimi 阅读助手等。但 Kimi 这位官员一直没有采取行动,一度让人觉得官方并不乐观,或者已经放弃了浏览器插件的开发计划。


但在体验完 Kimi 在浏览器助手之后,坦白说,并没有看到太多的惊喜。小雷从来没有期望它能像网页版本一样提供完整的能力,但是作为网页浏览的助手,即使与第三方插件相比,Kimi 浏览助手还有许多需要改进的地方。


用好 Kimi,从浏览助手开始


首先要指出的是,现在, Kimi 基于浏览助手,浏览助手只支持 Chromium 发动机浏览器,如 Google Chrome。换言之,Safari、Firefox 等待其它引擎的浏览器不支持。(再次提到:Chrome 对于 Chromium,就如 Android 对于 AOSP。)


但是考虑到现在大多数浏览器都是围绕着浏览器的 Chromium 设计发动机,大多数发动机 Kimi 网页版本的用户仍然可以安装应用程序, Kimi 找到主页的侧栏「浏览器助手」然后按照指导安装即可。


图/Kimi


此外,从介绍页面,也可以看到。 Kimi 浏览助手的核心功能-选字解释,文章总结,以及侧栏方式。在这里独立讲下侧栏的方法,其实有很多。 ChatGPT 这种交互设计早就被用于相关插件,包括微软。 Copilot 系统级的侧栏交互甚至可以实现。


由于可以与正在浏览的网页平行,侧栏的对话模式实际上变成了各种各样的网页 AI 必须使用聊天机浏览器插件。


不过 Kimi 对于侧栏的观点可能有些不同。就应用领域而言,Kimi 在介绍时,浏览器助手更强调在写作时,使用侧栏进行持续的对话和搜索。


图/Kimi


其他场景中,Kimi 更加尊重另一种方式。


就插件配置而言,可以看到 Kimi 默认情况下,浏览器助手打开「选用文字后显示 Kimi 按键」以及「Kimi 悬浮按钮」,与此同时,窗口显示默认是「全局浮窗」而非「侧栏」,从侧面解释 Kimi 浏览助手在设计上的偏好和想法。


Kimi 浏览助手设置页面,图/雷科技


但是这些功能和交互设计,到底用起来怎么样,才是关键。


浏览助手,让 Kimi 有没有更好的使用?


Kimi 浏览助手的用法很简单,你可以直接把它当作一个 Kimi 通过快捷键或点击浏览器右下角的悬浮按钮,对话启动器可以呼出。 Kimi 对话窗口。


Kimi 浏览助手启动界面,图/雷技术


这儿的对话窗口很简单,核心是「输入框」和「总结全文」,另外还可以一键跳转 Kimi 首页,看到快捷键呼出对话窗口。


然后,你可以问 Kimi 各种各样的问题,比如 Kimi 为何要推出 Kimi 浏览助手的插件,甚至调用 Kimi 推出各种智能体。但显然,与网页版的完整对话窗口不同,你不能在这里上传各种文档,所以你必须回到官网首页进行处理。


不过,Kimi 浏览助手的产品定位决定了它不仅仅是一个「启动器」,也不需要「全能」。


实际上,Kimi 浏览助手的核心在于浏览助手。「浏览助手」,这是基于用户正在浏览的网页。例如,最近备受关注的罐车运输混乱,在阅读相关信息时,可以呼出。 Kimi 对话窗口,一键总结文章内容。



图/雷科技


顾客当然也可以单独选择。「煤制油」或其他不懂的单词或句子,然后点击出现的单词或句子。 Kimi 按键,Kimi 然后结合上下文对这个普通人不太熟悉的概念进行解释。


图/雷科技


但是在解释之后,选择部分的文本也会留下。「下横线」,只需将光标移至下横线部分,就会弹出前后。 Kimi 的对话。


与此同时,作为雷科技的编辑,小雷也经常需要了解很多以前不知道的信息,尤其是涉及外语材料的时候,通常需要花费大量的时间。


比如最近有 AMD 前员工在 X(原 Twitter)上面分享了他的存在 AMD 工作期间的经历,其中就谈到了 AMD 这个故事几乎和英伟达合并了。当你找到最初的信息来源时,你可以先通过插件呼出。 Kimi 对话窗口,让 Kimi「总结全文」,用中文总结十多篇英文文章:


将翻译、阅读、梳理等步骤直接省略,节省时间,提高效率。


但是确定他已经提到了 AMD 在几乎收购了英伟达之后,我还可以继续让它。 Kimi 进行讲讲 AMD 几乎收购了英伟达的部分,以便更详细地了解。



图/雷科技


就答案而言,Kimi 而且确实给出了令人满意的答案,不但完整包括 AMD 以前员工共享的相关资料,也将其整理成「AMD 的收购试着」「市场地位与战略」等 6 部分,方便理解故事背景。


即使不需要总结全文,也可以让 Kimi 跳到这个阶段直接处理。


不过,Kimi 浏览助手的协助也仅限于正在浏览的网页。比如上面提到的卡车事件的报道,如果问到文章中没有涉及的问题,Kimi 便开始「答非所问」了:


图/雷科技


连编辑都不想编辑。


相反,如果链接是在网页版本中丢失的, Kimi 再次询问,先不谈答案的质量,但至少可以得到相应的答案。现在看来,Kimi 浏览助手应该限制大模型。「信息来源」,将其控制在浏览页面上。


图/雷科技


但 Kimi 这一策略,浏览器助手,并不能满足客户的实际需要,当我们在浏览网页时遇到问题时,需要的答案不太可能完全被一篇文章所覆盖,一般需要发挥更广泛的大模型。「知识积累」和「联网能力」。


相比之下,如果是长篇大论的话。 PDF 有效地获取文档甚至一组文章中的信息,可能需要大模型「信息来源」在上传文件中控制。


此外,Kimi 还有很多地方可以改进浏览器助手。


比如上面已经提到了与网页相比的版本,Kimi 浏览器助手对话窗口功能不全,能力有限。小雷在使用过程中多次想跳转到网页版本。但在实际使用中,只要打开对话,就再也看不到初始界面一键浏览。 Kimi 网站的快捷方式,当然更不支持在网页版本中打开对话。


例如,在同一个网页中,如果在多个地方选择解释,实际上就会产生。 N 一个对话,分散在文章的各个部分,即使点击浏览器右下角。「Kimi 悬浮按钮」,以前的对话目录也没有办法快速回顾。


总体而言,与第三方相比, Kimi 浏览器插件,官网推出这款。 Kimi 浏览助手的定位更加差异化。核心功能是快速总结文章,简单解释文章中不理解的概念和单词,不鼓励用户进行多轮对话,从而深刻理解和研究一个主题。


写在最后


经常尝试各种各样的东西 AI 读者应该不难发现,在这一轮中, AI 潮流中,很多产品的逻辑发生了变化,移动时代「App 先行」到了 AI 时代已经变成了摇身一「Web 先行」,从 ChatGPT 到谷歌 Gemini,由百度文心一言以蔽之 Kimi、阿里通义:


概莫能外。


理解原因其实并不难。以 AI 以聊天机器人为例,日常办公和学习是当前最核心的应用场景,从这个角度来看,PC 终端无疑是一个比手机更重要的平台。与此同时 PC 终端,浏览器是最核心的软件,浏览网页也是最核心的软件, PC 顾客最重要的需求之一。


所以,浏览器插件就变成了 AI 聊天机器人是提高用户体验、增加用户使用次数的关键途径之一。Kimi 为了满足这一需求,浏览器助手的推出,核心是进一步简化用户在浏览网页时处理数据、获取信息的过程。



Kimi 图/雷科技第三方浏览器插件


但在 ChatGPT 目前官方浏览器插件尚未推出,AI 浏览器插件在聊天机器人中的本质仍处于草莽阶段,第三方和官方也没有形成一套认可和可行的交互设计。


对于 Kimi 尽管这次尝试并没有带来太多的惊喜, Kimi 浏览器助手「轻微使用」产品定位,对于很多产品定位, Kimi 对于用户来说,仍然是一种提高日常使用体验的手段。


这篇文章来自“雷科技”,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com