豆包紧追不舍,Kimi要靠Kimi「深入推理」抵制AI巨头的冲击
大约一个月前,OpenAI 推出了 o1 该模型不仅展示了强大的语言生成能力,而且通过引入强化学习,完成了更深层次的推理和自我纠正能力。
9 月 16 日、月暗面(旗下) Kimi)在天津大学宣怀学校,创始人杨植麟做了一次分享,尤其提到 OpenAI 发布的 o1 通用智能模型,意味着模型(AGI)变化范式,下一种范式,「这是通过加强学习来完成的。」
也许在那个时候,也许早些时候,月亮的暗面已经投入到了强化学习的新范式中。
但是无论如何,依据「大厂青年」最近公众号爆料,月之暗面有团队,在国庆期间「一直疯狂地追赶进度」,这主要是为了一个即将上线的人。「很牛的功能」。
爆料进一步指出,该功能与模型深度推理有关,预计将在下一个版本上线,并将在搜索入口下方添加一个。「深入推理」功能开关,能回答简单搜索无法解决的问题,甚至能反思自己。
这是 Kimi 的 o1?
接力 OpenAI o1,通用智能新范式的一次转移
在 OpenAI o1 之前,AI 大型模型的表现一般局限于「迅速应答」,也就是说,通过预测下一个词来生成答案。这种方法效率高,但思维方式单一,缺乏深入推理和自我反思复杂问题的能力。

图/ OpenAI
但随着 OpenAI 推出的 o1 模型,这种局限性开始被突破。o1 强化学习机制的引入是关键的变化,在回应问题之前,模型会花更多的时间去思考问题,从而进行深入的推理和自我纠正。
这种思维类似于大脑慢思维-一种叫做「系统 2」的能力,o1 具有学习和提高思维过程的能力,可以尝试不同的策略,认识到自己的错误。这种能力的提高对 AI 智能化带来了显著的影响。一般来说,传统模型只会给用户输入一个简单的直线答案,而不是「思考」工艺的多样性和深度。
例如,在处理复杂的数学问题或法律案例时,模型只依靠大量数据的模式来预测。o1 加强学习,让步 AI 可以进行多步推理,类似于人类解决问题时的思维路径——首先提出假设,逐步验证推理,在这个过程中不断纠正自己的错误。
通过这种缓慢的思考方式,AI 它不仅能给出更准确的答案,还能在面对不确定性时进行自我反思,在一定程度上防止过去常见的模型。「幻觉」。
在天津大学的演讲中,杨植麟也提到过,AI 只有通过学习人类的思维过程,我们才能获得更好的泛化能力,通过这个过程,我们才能产生更多自然不存在的数据,处理更多未知的问题。

图/上海创新创业青年 50 人论坛
对最终用户体验也有很大的影响。对普通用户而言,推理能力的提升代表着和谐。 AI 互动时,可以得到更深层次、更有逻辑的答案。
在 ChatGPT 中应用 o1-preview 在许多情况下,模型可以明显地感觉到,不再需要简单地将问题转化为多个小问题,而是可以直接提出复杂的问题,AI 通过多步推理,可以给出综合解决方案。
更为重要的是,引入了自我反省。 AI 能像人类一样在这个过程中发现自己的错误。
这种自我反省能力不仅可以大大降低错误率,而且可以提高用户对错率。 AI 的信任感。AI 不再是机械回答者,而更像是一个有机械回答者。「思考」能力智能助手,能够理解前后文章,深入分析问题,甚至在发现自己的错误时及时调整,从而为用户提供更高质量的答案。
所以不难理解,为什么 Kimi 要做「深入推理」。事实上,国内大模型也在向这种趋势靠拢, 9 一些大型企业和研究机构在月底举行的阿里云栖大会上达成了一定的共识,即 OpenAI 推出的 o1-preview 它代表了通用智能新进化模式的开始。

通用智能圆桌对话,图/云栖大会
但是趋势属于趋势,Kimi 对于「深入推理」中国市场面临的竞争态势正在发生变化,功能的急切。
随着假期的进展,豆包给Kimi的压力越来越大。
不管什么是新功能,不难看出,顶着国庆假期赶进度,在一定程度上反映出来。 Kimi 团队的紧迫感。而且这些压力,主要来自于国内其它大型企业的残酷竞争。
经常看 B 站内朋友应该会发现,以前一直出现在站内广告中的朋友。 Kimi,存在感已经很弱了,取代它的是满屏的。「豆包」。而且字节跳动的豆包,无疑是国内的 AI 智能化助手的领导者。
公开数据显示,5 自从月亮上线以来,豆包已经占据了好几个月。 App Store 免费排行榜的前列位置,6 月份更是长达一个月占据第一。即使到了 10 每个月,豆包仍然排在第四位。优秀的产品体验和大量的推广,豆包可以说在短时间内迅速吸引了大量的用户,也占据了市场。

图/苹果
a16z 公布的全球 AI 商品前 100 在榜单中,豆包同时出现在网页端和移动端之前。 50 这份名单显示了它在全球市场的知名度。与之相比,Kimi 这个列表中没有任何痕迹。
不只是豆包。同样是大型创业公司的 MiniMax 同时也迎来了爆发。从 9 月亮到现在,旗下 AI 智能化助手-海螺 AI 数据爆发式增长,月浏览量增加超过 8 倍,月活客户接近 500 万。
另一方面,Kimi 过去最知名的优点是长文本的处理能力,可以支持大量数据的快速处理。但是随着技术的迭代,各种大模型的前后处理量都有了很大的进步,谷歌 Gemini、阿里通义、腾讯元宝和月亮的暗面 Kimi,都支持了 1000 万 Token/字长前后文。
而且在那之后,Kimi 最明显的「优势」不再明显,与此同时,各个家庭的竞争也开始多样化,甚至更加注重产品功能。这一阶段,Kimi 不能让用户感知到其它更明显的优势,也很难保持下去。 AI 智能助手「当红炸子鸡」市场地位。
这样的背景,Kimi 面临的难题是显而易见的。
对抗巨头冲击波,Kimi 需要「深入推理」
Kimi 正在开发的「深入推理」功能,无疑是一剂强心剂。在激烈的竞争中推出「深入推理」功能性,不但有利于 Kimi 在竞争激烈的市场中,提供能与领先者竞争的差异化功能和能力,再次站稳脚跟。
更加重要的是,「深入推理」这不仅意味着能得到更复杂的答案,也意味着能得到更复杂的问题。 AI 能在长时间的对话中进行深入的思考和自我反省,将大大提高用户的使用能力。 Kimi 过程中的感觉,特别是面对复杂任务的场景。
这也符合 Kimi 长期以来,用户画像——学生、大学生、见习生、工作人员,而客户则更加关注教学、办公辅助。相比之下,无论是豆包还是海螺。 AI 事实上,角色扮演更多,交流定位更多。

图/ Kimi
而且对现在来说 AI 对于智能助手用户来说,生成简单的答案已经不足以满足他们的需求。越来越多的用户期望 AI 不只是简单地回答问题,还能帮助复杂的工作目标和日常内容创作,甚至在推理过程中自我纠正。
伴随用户对 AI 要求不断提高,Kimi「深入推理」或许可以帮助用户更好地应对自己面临的更多实际问题和更困难的任务,创造更强的用户粘性。与此同时,「深入推理」对于团队本身的提振作用也不容忽视。
总得来说,Kimi 的「深入推理」对功能来说,也许是一个关键的升级, Kimi 同时也是一种强心剂,它不仅是在激烈的市场竞争中重拾自身的竞争优势,也是通用智能范式转变的基础。
或许以后,「深入推理」它不仅仅是一种功能,而是一种功能 Kimi 大模型背后的底层能力。但是在国产大模型和 AI 在智能助手中,目前看来,Kimi 也许是第一个迈出这一步的厂商。
这篇文章来自“雷科技”,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




