教学参考-40

来自cslt Wiki
跳转至: 导航搜索

教学目标

  • 了解蝙蝠听声辨位的生理结构,特别是耳动的特点
  • 了解仿生耳朵的基本方案
  • 了解解析仿生耳信号的困难,理解神经网络模型在解析这些信号上的优势
  • 引导学生思考仿生学+人工智能的巨大潜力

教学内容

生活中的听声辨位

  • 当你步行在校园中时,突然听到有人喊你的名字,你往往都能在第一时间找到发音人的方向,根据声音的大小还能大概判断出发音人离你的距离远近。这就是我们生活中常见的听声辨位。
  • 人耳的听声辨位能力利用了空间和频率两种信息:首先,我们有两个耳朵,不同方向的声源到达我们双耳的时间和压强都有所不同,基于此可以判断声音的前后左右(水平定位);同时,我们的耳廓有特殊的结构,这些结构对不同方向来的信号具有特定的频率响应,这可以让我们进一步分辨不同方向的声音,特别是声音的上下方位(垂直定位)。
  • 利用这些信息,人类能达到2度左右的水平定位和3.5度左右的垂直定位。

蝙蝠的听声辨位

  • 数千种动物依靠回声定位。以蝙蝠为例,它们用喉咙发出超声波,通过嘴和鼻子同时将超声波发射出去,再通过耳朵接收返回的声波。研究表明,蝙蝠可以在一秒钟内发出超过250组的超声波,同时准确地接收和分析同等数量的回声。通过分析这些返回的声音,它们可以轻松确定障碍物或猎物的尺寸、质地、距离和方向。
  • 实验表明,通过发出超声波并接收其反射波,蝙蝠可实现1.6度的水平定位和3度的垂直定位。这一超能力使它们在完全黑暗的环境中依然可以自由飞行。
  • 蝙蝠的这种听音辨位能力和它强大的耳朵是分不开的。首先,它们通常具有比较大的外耳。大耳蝠的耳朵长度甚至超过了体长的3/4,堪称兽类中耳朵最大的动物。一些蝙蝠还具有称为“耳屏”的特殊装置,以加强对回声的接收和分析能力。
  • 除了这些形态上的特征,蝙蝠的耳廓还可以运动。以马蹄蝙蝠为例,其外耳在100毫秒内可发生高达20%的相对于耳朵总长度的形变。动起来的耳廓对声源产生了相对速度,进而形成了一种称为“多普勒效应”的声学现象。利用这一现象,蝙蝠可以更有效地判断障碍物的位置和状态。

多普勒效应

  • 如果我们站在一列迎面开来的列车前,会感到火车的汽笛声会变得尖锐;反之,如果列车远离,汽笛声会变得低沉。这是因为我们和列车之间存在相对速度,相对速度的存在会使接收到的声波发生频率偏移,这就是多普勒效应。
  • 蝙蝠的耳朵里同样产生了多普勒效应,特别是,当耳朵动起来后,在耳廓的不同位置耳朵与声源的相对速度是不同的,因此产生的多普勒偏移也不同。蝙蝠通过解析在耳廓不同位置的多普勒偏移,可实现非常精准的声源定位。

仿生耳朵

  • 研究者借鉴了蝙蝠的动耳听声能力,研制成功了一款仿生耳朵,如图所示。这款耳朵模拟蝙蝠的耳廓结构,并通过马达牵动耳廓产生周期运动来模仿蝙蝠的耳廓运动能力。
  • 利用这款仿生耳朵接收超声波时,不同方位接收到的信息确实是不同的。但是,这些信号本身非常复杂,要从这些信号中解析出方向信息,还是非常困难的。

AI解析声源方位

  • 为了从观测信号中检测出方向信息,研究者提出基于深度卷积神经网络(CNN)的方向预测模型。他们将仿生耳接收到的原始信号提取频谱之后输入到一个CNN,利用CNN强大的学习能力提出信号中和方向相关的显著特征,并利用这些特征来预测信号的方向。
  • 实验表明,即使只用一只仿生耳朵,也可实现0.5度的定位精度,不仅超过人耳,也超过了蝙蝠的耳朵。