谷歌的动物版本翻译?Nature:使用AI解码野性呼唤
海豚的哨声,大象的隆隆声,鸟鸣的颤音,都有传递信息的方式和结构。对于人类来说,这些细微的东西可能很难识别和理解,但寻找方法是AI擅长的领域。
每种动物都有其独特的历史。
来自加拿大的Carleton 鲸鱼生物学家,UniversityShaneer Gero,试着了解鲸鱼是如何沟通的,花了20年时间。

举例来说,同一家族的鲸鱼会发出特定的声音,抹香鲸在不同的地区会发出特定的声音。(Physeter macrocephalus)有自己的「方言」。

海豚的哨声,大象的隆隆声,鸟鸣的抖音,都有特定的方法和结构。
对人类而言,这些细微之处也许很难识别和理解,但是寻找方法正是AI所擅长的领域。
在过去的一年里,AI不断帮助研究人员「解码」这些声音在自然界。
密码破译者
鲸鱼以氏族的形式聚集在一起,每个氏族都有独特的饮食、社会行为和栖息地。一个氏族可以包含成千上万的鲸鱼,每个家庭都以雌鲸为首。
鲸鱼大部分时间都在海洋深处寻找食物,最远可以到达海洋以下2公里。阳光照射不到那里,他们通过回声定位寻找猎物。
而且在不需要回声定位的水面上,它们也会被称为尾音。(codas)与其它鲸鱼保持联系的一系列咔嗒声,每次持续3-40次。

不同氏族的鲸鱼使用尾音的节奏和间歇性不同,「方言」这意味着氏族之间的「文化界线」。
Gero和他的同事们在加勒比水域花了数千个小时,收集了30多个鲸鱼家庭的数据,他们住在附近。
为了了解尾声的节奏和速度,团队手动创建了鲸鱼声音记录频谱图,可视化了音量和频率的特点。

Gero说,这项任务非常耗时。交给机器学习算法后,工作速度大大加快,有助于区分哪种声音来自哪种动物。
另外,人工智能也使研究走得更远。
手工操作基本上只能对单个单词进行分类,但是AI可以处理相当于句子甚至整个对话的结束。「机器学习很善于发现标准统计方法难以捕捉的方法。」。
研究人员收集了8,719个数据集,在AI的帮助下发现了8,719个数据集。「抹香鲸音标」,它是鲸鱼之间共享复杂信息的基础。
Call me by my name
抹 用特定的声音来识别自己的生物并非唯一的香鲸。 曾经在科罗拉多州立大学工作的生态学家Mickey Pardo,野生非洲象通过AI找到了自己的名字。

在不同的情况下(长距离、零距离、或亲子互动),小象用低沉的隆隆声相互交流,声音也会有所不同。
Pardo和他的同事发现,小象会对某些叫声做出反应,而忽略了其他叫声。

研究人员训练了AI模型来学习这些模型。「呼叫」根据新呼叫的特点,对接受者进行声学特征的预测。
最终,该模型以27.5%的准确率与呼叫者相匹配——尽管看起来分数不高,但是人家小象并非每次都打电话。「直呼其名」。
另外一个被AI发现了「真名」动物是下面这个哥们:猴子(Callithrix jacchus)。

除预测名称外,Pardo还试图使用AI解码其他名称。「小象词汇」,比如位置术语。
当大象招呼合作伙伴移动到特定的地方时,会发出特殊的声音。模型识别这些声音的含义,研究人员播放声音,验证大象的去向。

Pardo在另一项关于大象的研究中发现,肯尼亚两个物种中大象的叫声存在明显差异。
所以,在进行濒危物种保护时,不能简单地把个人和其它同类放在一起,因为「新手」面临着语言障碍的麻烦。
此外,大象的叫声还包括性别、年龄、生理状况等信息。科学家可以通过梳理这些信息,使用被动声学监测来了解特定大象的情况。

Carolinee加州大学的动物行为生态学家 Casey,象海豹在博士论文中得到证明(Mirounga spp)还会给自己起个名字。
Casey认为,使用基于AI的分类器来解释动物的叫声可以减少研究中的人为偏见,但另一方面,人类直觉的价值不应该被忽视。
「人脑可以整合我们对自己世界的理解和运作模式,并利用它来帮助解释动物的行为。」。
泛化到秃鹫

Olivier机器学习专家 地球物种项目Pietquin(Earth Species Project)目前,AI研究总监、项目团队正在使用AI解码动物物种进行交流。
Pietquin希望使用神经网络从一个数据泛化到另一个数据集的能力,在训练模型时,不仅可以使用大量来自不同动物的声音,还可以使用其它声学数据(包括人类语音和音乐)。
「在建立理解和识别动物发声特征之前,计算机可以先推导出一些声音的基本特征。这和人脸图片上训练的图像识别算法学习像素的一些基本特征是一样的。」
像素首先描述椭圆形,然后描述眼睛。因此,即使使用人脸作为大多数训练数据,AI模型仍然可以使用这些基本知识来识别猫的脸。
「利用人类的语音数据,我们可以想象它可以转移到任何其它有喉咙的动物身上。」
这样训练模型有利于识别哪些声音传达了信息,哪些只是噪音。当然,为了找出这些声音的实际方向,人类仍然需要观察动物的行为,并为计算机识别的内容添加标签。

研究人员已建立了一个名为Voxaboxen的神经网络,并将其应用于秃鹫交流的研究。
西班牙北部的腐肉秃鹫物种不同于其他欧洲地区的同类物种(Corvus corone)共同承担照顾小孩的责任。一群乌鸦会轮流守护巢穴,清洁巢穴,照顾雏鸟。他们必须通过语音交流和协调来完成这些任务。
研究人员在秃鹫的尾羽上贴上标签,包括一个微型麦克风、一个加速度计和一个磁力计来测量鸟类的运动和叫声。标签可以收集大约六天的数据,然后落地并发出信号,方便工作人员检索和研究这些信息。

虽然有抹香鲸、非洲草原象、猴子、海象和秃鹰的例子,但它们是由AI制成的。「谷歌动物版翻译」还是为了时尚早。
动物能否进行超出基本水平的交流——即有无语言的构成,尚未得到公认的定义。
Pardo说,他的主要目标不是与野生动物和宠物交谈,而是了解他们的想法,以及他们如何看待自己和世界。
例如,一些动物似乎有名字的事实表明,它们可以将其他个体视为实体并给出标签,这表明它们具有复杂的抽象思维水平。
If he could talk to the elephants, he would want to ask them how they feel about the way that humans treat them.
「If it were possible for humans to hear from other animals in their own words, ‘Hey, stop fucking killing us’, maybe people would actually do that.」
参考资料:
https://www.nature.com/immersive/d41586-024-04050-5/index.html
本文来自微信微信官方账号“新智元”,作者:新智元,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




