借助AI 人类能听懂动物的“喜怒哀乐”？

发布时间: 2022-05-09 11:26:32
来源：科技日报作者：华凌

目前来看，相关研究仅仅只是在一定程度上实现了人与动物之间简单的信息传递，离实现真正的跨物种交流，恐怕还有很长的一段路要走。从短期来看，要想实现跨物种交流还很难，但越来越多的研究无疑正在为其打开一扇扇大门。

谭茗洲远望智库人工智能事业部部长、图灵机器人首席战略官

在《安徒生童话》等文学作品，以及不少优秀的影视作品中都反映了同一个主题——人与动物的交流互动。如今，世界各地的学者们试图通过人工智能等途径打破人与动物的语言屏障，真正实现跨物种的沟通，甚至情感交流。

近日，一个由丹麦哥本哈根大学、瑞士苏黎世联邦理工学院，以及法国国家农业、食品和环境研究所等研究人员组成的国际研究小组，开发出一款人工智能产品，可以翻译家猪在各种场景中发出的声音，成功解码了其叫声中所传递的“喜怒哀乐”。该研究成果发表在最新一期的《科学报道》期刊上。那么，人工智能是否可以实现人与动物的沟通?算法具体是如何分辨动物情绪的?目前，人类要通过AI理解动物语言，还需克服哪些困难?

已通过算法研究多种动物语言

动物和人一样也会有自己的情绪。它们会快乐、难过、恐惧、愤怒，但受限于语言和表达方式，动物的情绪较难为人所知。其实，在我们听起来大同小异的动物叫声中，或许隐藏着它们不一样的情绪。

上述论文显示，研究人员为了训练AI翻译猪的语言，专门录下了411头家猪发生于19种不同场景中的7000多次叫声。算法执行结果表明，猪积极情绪的呼叫声比负面情绪的呼叫声更短且振幅更低。研究人员称，这种算法的准确率高达92%，可以基本准确地从猪叫声中辨别其情绪。

无独有偶，此前剑桥大学一个科研团队让AI仅根据绵羊的面部表情来识别这只羊是否处于困境之中。AI系统首先根据绵羊疼痛的面部表情，列出与不同疼痛程度相关的几个“面部动作单元”(AU)，然后在480张绵羊照片中标记了这些AU——鼻孔变形、每只耳朵的旋转和眼睛的缩小等，以此来判断绵羊的处境。

“其实，借助算法研究动物的语言，以及人与动物之间的沟通，早有先例。之前就有研究宠物狗、猫的项目，这些研究的目的在于让人类便于跟它们更好地相处。”5月4日，远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲在接受科技日报记者采访时指出。

例如，为了实现人宠沟通，日本著名声学专家铃木松美博士利用基于机器学习的动物翻译技术，曾经发明过一款“宠物狗翻译器”。宠物主人只需要将一枚迷你麦克风别在衣领上，所收集到的宠物叫声便会传输到翻译器中进行语音识别和转换，进而向主人传达宠物想要表达的意思，了解它们的情绪。

“此外，还有研究人员研究简单动物的群体智慧，如蜜蜂、蚂蚁的沟通方式，这些研究对于军事战术、设备等有一定的仿生借鉴意义;还有对海豚、鲸鱼这类动物组织化能力的跨学科研究，这类研究对于探究生物进化史非常有价值。”谭茗洲进一步解释。

不懂语言也能获得翻译能力

动物有自己的语言吗?如果有的话，它们会聊些什么?了解动物可以说是人类的一个长久研究课题，目前AI正在帮我们探寻答案。谭茗洲表示：“动物没有人类所特有的语言系统，所以研究人员可以通过结合它们的叫声、行为、习性来分析其诉求，以便更好地了解它们。”

一位研究人员曾经旁听了两只位置相对静止的抹香鲸之间断断续续长达40分钟的“对话”，它们的“对话”几乎每一句都不重样，并且伴有各种动作。这令人不禁猜测：是否这两只母鲸在“拉家常”、分享育儿心得?对抹香鲸“对话”内容的研究，正是近几年由国际科学家团队发起、《国家地理》支持的“鲸语翻译计划”(Project CETI)中的研究内容之一。据报道，研究人员正在使用自然语言处理系统(NLP)分析抹香鲸的40亿个交流代码。NLP是人工智能的一个子领域，专注于处理人类的书面和口头语言。研究团队计划让人工智能将每个声音与特定的背景联系起来，这一过程预计至少需要5年时间。如果该团队实现了这些目标，下一步将是开发和部署一个互动聊天机器人，与生活在野外的抹香鲸进行对话。

发表在《自然》期刊的科学研究证明，人工智能在破译古代人类语言方面非常有效。这为使用AI探索动物语言开辟了可能性。该研究称，机器学习技术提供了新的工具，可以帮助考古学家更快地了解过去，特别是在破译古代文字时。该AI系统采用了古希腊语言和整个古代地中海世界的铭文进行训练，训练数据来自相关人文学院提供的最大的希腊铭文数字数据集，而且这些铭文中的每一条都标注了元数据，其中描述了由历史学家考察出来的铭文的书写地点和时间。有了这些数据，AI就能在这些信息中寻找模式和规律，并利用复杂的数学模型来对这些信息进行编码，然后进一步使用这些推测出的信息来对其他铭文的内容、编写地点和年限进行推断。研究显示，该AI在修复受损文字方面达到了62%的准确率。这也为翻译动物语言提供了灵感。

人工智能在破解古文字和翻译动物语言上往往遵循同样的方法和准则。谭茗洲表示：“在翻译这一经典任务上，机器不需要理解语言，而是仅靠单一语言的语料，即可掌握该语言的句法、语法等关键要素。也就是说，深度学习不懂英语和中文，但是通过大量学习语料即可获得中英互译的能力。”

“归根到底，AI能够翻译、理解动物语言，其背后依然是基于人类对语言进行的有效解读。” 谭茗洲说。

实现跨物种交流尚有很长的路要走

“人类的语言有规律可循，因而不同国家的语言是可以遵循规律去学习的。但动物的语言规则存在未知壁垒，因此AI要实现跨物种语言翻译，尚有一段很长的路要走，需要克服一些困难。”谭茗洲表示。

首先，事实证明，利用受人为偏见影响的数据进行训练的算法很容易将结果导向“歧途”。比如，狗会发出急促的叫声，可能是因为想要向主人乞食，也可能是因为提醒主人警惕陌生人，还可能是对主人不陪自己玩的责怪。但如果研究人员仅基于自己的认知，在对这种叫声数据进行标记的时候，认为这种叫声只表达宠物向主人要食物的需求，从而对数据进行单一标记处理，那么人工智能在学习数据、翻译的时候往往就会产生很大的局限性。这种翻译很容易导致人和宠物的沟通障碍，从而丧失宠语翻译的意义。

“在研究中，科研人员需要去‘人类中心’，也就是说，借助于算法实现的跨物种沟通，需要算法避免人类某些偏见。”谭茗洲指出。

其次，通过AI算法将人类语言与动物语言对应，需要大量、广泛、完善的数据采集和场景训练，以完成对动物语言的解读，实现对“规则”的总结。这需要广泛同步采集动物叫声和脑电波数据并进行比对，再将其纳入数据库。然而不同犬种声带特点不同，面对同一场景的发声表现也不同，而这样的场景和叫声的组合有无数个，这为数据采集工作带来了巨大的挑战。

谭茗洲说，在技术方面，一个AI翻译产品做到精确翻译至少需攻破几个难题：在形式端，如果使用拍译的形式要攻克图像识别相关问题，同声翻译形式则要攻克语音识别相关问题;在内容端，AI翻译产品还要攻克文本语言分析、大数据采集等问题。由于AI缺乏对视觉场景、听觉场景、自然语言处理的常识判断，这还需要AI发展到能够极为精确地处理这些问题的阶段。

此外，有学者指出，动物语言和人语之间的代沟是客观存在的，AI所能做的，只能是不断改进自身的功能，用科学手段完善数据库、内容、语料和场景;形式和内容双管齐下，才能将这条横亘在动物和人之间的语言鸿沟填平，在坚实的地基上实现人和动物的有效沟通。

“尽管有些研究也曾获得了很大的进展，但是其中的问题也无法被忽视。目前来看，相关研究仅仅只是在一定程度上实现了人与动物之间简单的信息传递，离实现真正的跨物种交流，恐怕还有很长的一段路要走。从短期来看，要想实现跨物种交流还很难，但越来越多的研究无疑正在为其打开一扇扇大门。”谭茗洲表示。