世界上第一个宠物翻译器,上线爆红
近日,谷歌推出 DolphinGemma 大模型, 据说它会让人类理解海豚的语言,实现人类和海豚在水下的实时交流。去年6月,中国团队开发的另一个面向全球英语用户的人狗交流应用程序Traini出现了,成为世界上第一个实现人类宠物语言翻译的AI原生应用程序。AI正在进入跨物种交流领域,拓宽人们对非人类语言逻辑的界限。
联系特尼的首席执行官孙邻家是一位80后、中国人,他的家乡在吉林长白山。我们和他聊了聊AI新技术对人宠交流的影响,从0到1的探索过程中的挑战,以及他三年来在行业内的经历。
此外,我们还想知道:当人类暂时离开语言的中心,开始构建与非人类语言平等对话的可能性,在新奇之后,AI 跨越物种交流对我们意味着什么?
注意:AI原生应用(AI-Native Application):指以人工智能为核心推动力设计开发的应用,而不是简单地将AI作为附加功能嵌入现有架构。
翻译狗语的准确率超过80%

80后孙邻家,吉林长白山人
著名投资银行高盛最近的一份报告显示,中国的宠物数量首次超过 4 年龄以下婴幼儿总数。 同时 根据艾媒咨询的数据, 2023 年中国宠物经济产业规模 就已经达到 5928 亿元。
根据《2025年宠物品牌在线名人营销生态报告》,以年轻人为代表的宠物饲养者大多将宠物视为“儿童”和“朋友”,表现出情感消费和拟人饲养宠物的趋势。
这种需求也催生了相关行业。比如几年前备受争议的宠物灵媒,他们通过相关物品与宠物进行跨物种精神交流,通过人类语言传达宠物的情况和言语。
在这种情况下,作为世界上第一个AI人狗翻译器,孙邻家和其他三位中国人开发的Traini一上线就引起了国内外网友的好奇和关注。

Trainini试用海外客户
AI人狗交流应用的发展理念源于孙邻家创业过程中的一项用户调查。
2018年,孙邻家来到美国,为当地亚洲人提供亚洲餐外卖平台,随后开始扩大狗粮交付业务。
在一项由2200名用户反馈的狗粮交付业务调查结果中,他发现76%的用户对了解自己的宠物狗的行为感兴趣,大多数人还花钱给狗狗上了相关的行为纠正课程。
孙邻家现在还记得一条信息。那是在癌狗的临终时刻,它的主人告诉他,他真的很想理解宠物狗的声音,想知道它最终想对自己说什么。
他还在夏威夷的一家餐馆遇到了一位当地的老人。老人的小狗头发亮金色,性格安静,很少吠叫,总是睁着一双水汪汪的大眼睛盯着它。时间长了,老人特别想知道他每天都在想什么。
这也让他想起了小时候在吉林长白山老家养狗的经历。在当时还是个孩子的眼里,当地的小狗在说话。“从个人角度来说,与狗交流也是为了实现小时候与狗交谈的美好愿望”。

应用界面Traini
经过两年的研发,蒂娜诞生了。人们可以上传宠物狗的叫声、图片和视频,了解到狗包含12种情绪和衍生行为,如快乐、恐惧和更小的情绪,并获得一个结合人类语音和文字的同理心口语翻译。
孙邻家告诉我们,狗的语言分为精神语言和社会语言。“精神语言大多是基因带来的,可以直接翻译回来;社会语言就像我们小时候学习语言一样,与狗的教育程度有关。”
另外,还与狗的品种有关,“比如边牧可能学得更快,词汇量也会更大”。
通过与动物行为专家的合作和模型训练的交叉验证,将宠物狗行为翻译成人类语言的准确性已经达到了81.5%。
但是在把人类语言翻译成犬吠方向的时候,每个人都可以把“看我”、18个短句如“一起走”转化为犬吠,这部分宠物狗的反应程度各不相同。
在国内社交平台上,也有好奇的宠物主人试图自己的狗。他们中的一些人幽默地吐槽:“我不明白,是因为我没有上英语课吗?”
孙邻家解释说狗有方言。换句话说,完全有可能它不理解中国狗,主要是针对英语客户的AI原生应用。
“当然,还有一种可能,那就是狗明白了,但它不想做。就像一个孩子在玩游戏一样,你告诉他不要玩游戏,做作业。孩子明白了,但他就是不想。”
模型从0到1突破,模拟情绪最难

孙邻家在 国际消费类电子产品展览会(CES)上 CES被称为全球科技创新和消费电子产业的“方向标”
在更早的约 20 几年前,依靠机器学习技术的人宠交流已经初步尝试。
当时,日本声学专家铃木松美创造了一个可以单向解读家犬情绪的“宠物狗翻译器”,通过收集东京某宠物诊所的5000多个吠叫样本,并根据其声调、长度等特点解读情绪。
如今,随着人工智能技术的不断进步,AI 人与人之间的交流正在成为一个新的探索方向。孙邻家成了第一批踩在这风口上的人。
OpenAI于2022年发布ChatGPT,大型语言模型(LLM,它是一种基于Transformer结构的深度学习模式,通过自我监督学习从海量文本数据中捕捉语言规律,生成符合人类语言习惯的文本,并具有翻译、对话、推理等多种能力)进入公众视野。一年后,GPT实现了文本、图像和音频的多模态处理,拓展了LLM的使用场景。
LLM向孙邻居展示了人与宠物沟通在技术层面的概率——“我认为我们应该以这种形式满足用户,但基本上没有人做动物,更没有人做宠物”。

在美国华人科技组织华源科技协会,孙邻家(右)和合伙人Jason(左)(HYSTA)Traini在2024年的年会上获得了该协会颁发的深受用户喜爱的奖项。(Audience Choice Award)
2023年,孙邻家在硅谷的一次创业活动中认识了目前公司的人工智能主管和合作伙伴Jason。他曾经是OpenAI的中国工程师。
鉴于之前企业不满意的几次产品研发尝试,以及同样是宠物爱好者的新尝试,Jason被AI技术吸引,将宠物行为和情感与人类语言形象化,最终加入。
目前,这种由团队自主研发的宠物行为翻译共情模式被称为“宠物情绪和行为智能”(PEBI)”。
简单来说,就像训练其他AI模型一样,把不同品种、不同地区的狗的声音、表情、行为等多种模式数据喂给PEBI,最终模型就能理解狗的语言。
与科学家根据犬类行为分析和解读情绪和意图不同,PEBI模型也可以根据现有数据库预测下一秒宠物狗的情绪波动。“如果预测成功,最好是人与宠物的共情和互动体验。”
从同理心的角度来看,根据宠物狗行为翻译的人类语言,不仅要尽可能准确地传达意思,还要尽可能准确地反映人与宠物狗之间强烈而独特的情感,这是自研发以来最大的难点。
“其实很多养宠物的狗都是孩子的形象,都是个性化的,独一无二的。”如果你想模拟这种对“毛孩子”说话的方式,你也应该模拟孩子的说话情况和语言习惯,创造一种角色代入感。
因此,孙邻家和团队成员在声音克隆阶段尝试了机器语音,并与合作伙伴一起尝试了录制,但他们发现声音效果和说话方式都达不到预期的效果。直到一个合作伙伴的孩子在一次会议上偶然发言,他们突然发现了他们想要的声音。基于孩子录制的语料材料,他们可以确定第一版的语气和语调。

Traini还能理解狗的面部情绪、身体行为等语言。
粗话也成为影响情感共鸣的考虑因素。狗不高兴,它能不能爆粗口?
孙邻家认为,既然狗被认为是和人类一样的家庭成员,虽然它们不能真正说出人类的语言,但当把它们的愤怒翻译成语言时,它们可能会尝试扩展语义,并在情绪失控时加入一些粗话。
"当人们生气时,有时也会说那些话,这更符合我们的现实生活。"
此外,如何获取更丰富、更多的数据并标记数据是实现人与宠物交流的第二大难点。如果数据样本不足,很难保证翻译的准确性。 Traini 信息来源主要来自应用平台的用户社区,覆盖用户社区 120 狗的品种。
不仅仅是种类,宠物狗的地域差异、与人交流的水平等因素都影响着狗狗行为和情感表达的多样性。这意味着即使是同一品种的宠物狗也可能有不同的行为表达方式。如果只用单一因素进行翻译解读,结果可能不准确。
目前,TrainiPEBI模型收集的大量宠物狗数据来自北美、欧洲等重要用户群体上传的宠物信息。该地区和类型的包含范围不够全面,翻译的准确性仍需加强。
如果人类暂时离开语言中心

相对于2022年开始探索人宠交流,孙邻家觉得周围的环境发生了很大的变化。
起初,每个人都会问他市场是否需要了解宠物的行为,但现在每个人都更渴望了——“他们会说,Wow,每个人都很酷,他们还能做什么,他们能成为一只猫吗?”
今年5月初,国家知识产权局也公布了百度的动物语言转换专利。类似于Traini的尝试,该专利利用大模型、多模式等人工智能前沿技术,通过分析动物的声音、表情、动作等数据来识别情绪和情绪,并将结果转化为人类语言。
但是AI更广泛 在动物福利和养殖方面,跨物种交流领域,借助AI技术对猪、羊的情绪和情况进行了研究。

近年来,越来越多的科学家将人工智能应用于野生动物研究,探索理解动物行为的新边界,开辟动物保护和生态修复的新途径。
在今年的“世界海豚日”中,谷歌推出了一款即将在夏季开源的“DolphinGemma“AI大模型,说这个模型可以实现与海豚的水下实时交流,并且可以预测它们的下一个声音。
值得注意的是,即使DolphinGemma吸收了30年的海豚研究数据,它也只有400M大小,适合在手机上使用,这也给研究人员的研究带来了方便。

同时,一个由国际科学家团队发起,国家地理支持的项目 “ 鲸鱼翻译计划 ”( Project CETI) 同样在进行。
本项目的一项研究将在人工智能领域采用自然语言理解系统。(NLP)分析抹香鲸的40亿交流代码,破解抹香鲸的对话内容。未来,研究小组还计划开发和部署可以与野外抹香鲸交流的互动聊天机器人。
“听不见的大自然”(The Sounds of Life: How Digital Technology Is Bringing Us Closer to the Worlds of Animals and Plants)一书中,作者兼牛津大学环境地理学博士凯伦·巴克也谈到了吸引珊瑚幼虫通过AI模拟健康珊瑚礁的声音来修复珊瑚礁的概率。
书中提到,由于生物声学、人工智能等数字技术的进步,人们会听到和理解越来越多的“非人类声音”,建立动物语言数据库,未来“动物谷歌翻译”可能真的会诞生。
凯伦·巴克在与美国科技媒体Recode的对话中解释了为什么要追求跨物种的交流:
“人类例外论在科学体系和公共话语中仍然存在。我们希望相信人类在许多方面是独一无二的...也许当我们完善对非人类语言的理解时,我们会对语言有一个更包容的定义。”
本文来自微信微信官方账号“一条”(ID:yitiaotv),编辑:蓝雨约,责编:鲁雨涵,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




