豆包进军输入法领域,能否在竞争红海突围?
正所谓“趁你病要你命”,国内输入法赛道的领军者搜狗输入法陷入“病毒”争议之际,字节跳动旗下的AI助手豆包似乎打算涉足输入法领域。近日有爆料称,豆包输入法iOS版已开启内测,主打豆包同款的AI语音识别,以及越用越准的智能联想功能。

实际上,“AI + 输入法”是国内互联网厂商在探索AI大模型技术落地时就曾有过的尝试。早在2023年秋季,百度输入法宣布全面升级,打造行业首个“基于大模型的输入法原生应用”,并从“输入工具”全面转型为“AI创作工具”,立志成为用户的全场景“AI创作助手”。
到了2024年夏季,腾讯宣布微信输入法升级,上线基于混元大模型打造的“一键AI问答”功能,为用户提供智能交互体验。用户在微信聊天框输入内容后添加“=”符号,就能快速获得AI的智能回答。随后搜狗输入法也宣布AI功能上新,带来AI帮写、AI对话、快捷问答、AI宠物、AI自拍表情等多种功能。
当时互联网大厂看重输入法,是因为那个时期的AI大模型主要是文生文、文生图,而输入法则是关联这两种能力的最佳载体之一。通过输入法,能让用户习惯AIGC,从而潜移默化地完成市场教育。可惜后来可灵、即梦等AI视频产品迅速成熟,更新奇、更具表现力的AI视频应用很快抢走了AI输入法的风头。

当然,“AI + 输入法”这一组合最大的问题在于交互逻辑存在缺陷。为实现效率最大化,输入法界面过于紧凑,所能呈现的信息量极为有限,而AIGC的特点是内容丰富、而非简洁明了。以至于DeepSeek出现后,AI助手产品迅速取代了AI输入法的生态位。
如此看来,豆包似乎没有做输入法的必要,但这次字节跳动的产品经理找到了一个特殊的细分赛道。此次豆包输入法主打语音输入,而非拼音、手写,并强调拥有“豆包同款语音识别”。
用过豆包的人应该对它的语音识别能力印象深刻,其基于语音识别模型Seed - ASR实现的智能添加标点表现十分出色。
所以豆包输入法的定位关键在于语音。那么哪些人需要更高效的语音输入法呢?答案是饱受数字鸿沟困扰的银发一族。
“数字鸿沟(Digital Divide)”这一在1999年提出的概念,简洁地指出了这样一个现象:不同人群对信息技术的掌握程度,决定了他们在数字化生存成为现实的今天的日常体验。

英国作家道格拉斯·亚当斯说:“任何在我35岁之后诞生的科技,都是违反自然规律要遭天谴的”,这句话简明地指出了中老年人陷入数字鸿沟的根源。他们对新生事物接受程度低,在信息时代遇到诸多麻烦,因此互联网行业依据《互联网应用适老化及无障碍改造专项行动方案》对旗下产品进行适老化改造。
在这轮适老化改造中,各大厂商除了为自家产品增大字体、移除繁杂冗余功能,以适应老年人视力下降和思维能力放缓的生理特点,去除广告和各种诱导下载的入口外,语音输入功能也是重点。原因很简单,在计算机上“打字”也是一项需要学习的技能。

早期的五笔输入法需要额外学习,且学习曲线陡峭,而智能输入法诞生较晚,所以现在的银发一族在输入内容时更倾向于手写和语音输入法,这也是长辈常在微信上发60秒语音的原因。然而截至目前,一众输入法的语音输入功能都不尽如人意。
因此,如何精准呈现用户想要表达的内容,是当下语音输入面临的最大挑战,而这也给了豆包输入法异军突起的机会。据悉,豆包的语音识别模型通过上下文感知来提高识别准确性,在公开测试集中的错误率较国内同类模型最高可降低40%,支持普通话及粤语、上海话、四川话等多种方言识别,还具备低延迟的特性。

在众多AI大模型中,豆包的语音识别能力最为精确,即便识别有误,也能猜出用户真正想表达的内容,这正好击中了银发一族的痛点。所说即所得,这就是豆包输入法的核心竞争力。
对于如今缺乏使用场景和用户的AI应用来说,能满足特定用户的需求可谓可遇而不可求,这也是我们认为豆包输入法有可能在竞争红海中突出重围的关键因素。
本文来自微信公众号“三易生活”(ID:IT - 3eLife),作者:三易菌,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com

