教学参考-20

来自cslt Wiki
2022年8月9日 (二) 02:35Cslt讨论 | 贡献的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索

教学目标

  • 了解人脸识别基本流程
  • 了解早期基于人为特征的人脸识别方法和现代基于神经网络的人脸识别方法
  • 讨论人脸识别技术可能带来的风险


教学内容

人脸识别的概念和基本流程

  • 让机器从众多人脸中找出目标人脸,或判断两张人脸是否为同一个人。人脸识别在安防、金融、公开安全领域有广泛应用。
  • 人脸识别大概分为如下几个步骤:(1)摄像头采集人像;(2)从人脸中分离出人脸区域;(3)对人脸进行特征提取;(4)对人脸进行识别
  • 人脸识别是个统称,实际场景中可分为“确认”和“辨认”两种方案。在确认任务中,识别的目的是比对两张人脸照片是否属于同一个人,有时也叫1:1对比任务。例如在宾馆入住时,需要对比身份证上的照片是否与客人实际人脸相符。在辨认任务中,有一个人脸库,机器需要在把当前人脸在人脸库中进行比对,看是不是在人脸库中,并判断是人脸库中哪张脸。例如抓逃犯时,有个嫌疑人库,需要判断那些出现的人脸是否是某个嫌疑人。


深度神经网络训练

  • 研究者很早就意识到多层神经网络具有更强的学习能力,然而在实验中,多层网络并没有表现出比三层网络更好的性能,一个重要原因是多层网络的训练非常困难。
  • 原则上,反向传播算法可以训练任意深度的神经网络,然而实际情况却并不乐观。这是因为神经网络非常复杂,训练过程中会遇到很多马鞍点和局部小点,要想避开这些点,并不容易。
  • 2006年,多伦多大学的杰弗里·辛顿提出了一种预训练方法,先训练浅层网络,再一层层叠加起来,最终得到深层网络。辛顿发现,通过这种预训练得到的深层网络具有比浅层网络更好的性能。
  • 在此之后,众多学者投入到这一研究方向,深度学习成为人工智能最活跃的方向和代表性技术。因在深度学习研究中的突出贡献,约书亚·本吉奥、杰弗里·辛顿、杨立昆共同荣获2018年图灵奖。


抽象特征学习:深度神经网络的秘密

  • 深度神经网络之所以如此强大,一个很重要的原因在于它可以通过层次性处理逐渐提取抽象特征。在网络底层,神经元被一些简单的线条所激发,但到了网络高层,激发神经元的将是一些有代表性的图案。这说明网络以一种层次性的方式对特征进行提取,越到后面得到的特征越高级,越抽象。因此,深度学习也常被称为表示学习。
  • 对抽象特征的学习具有重要意义,可以带来更强的可扩展性。例如,我们把一张人脸照片加入各种变化,如噪点,缩放、旋转,这时低层特征会发生显著变化,但人脸依然是人脸,在抽象的概念层次不会发生变化。这种不变性是实现可扩展性的基础。
  • 抽象特征学习可以从原始数据开始,不需要人为的特征设计。这一强大能力使得研究者不再需要专门设计特征提取过程,只要数据足够,机器可以自动从数据中提取出有价值的特征。自动特征学习不仅简化了模型设计与构造,也避免了人为设计特征可能存在的缺陷。
  • 最后,人们发现深度学习和人类的信息处理方式很相似。人类处理信息是层次性的,深层网络的处理方式和人类大脑里的处理方式很像。

深度神经网络与现代人工智能

  • 深度神经网络兴起之后,在机器视觉、机器听觉、自然语言处理、机器人等众多领域取得极大成功。现在我们知道,辛顿当初提出的预训练方案并不是必要的,只要数据量足够大,计算资源足够丰富,就可以成功训练一个强大的深度神经网络模型。从这个角度上看,与其说是深度学习多么强大,不如说是大量数据的积累和计算机性能的提高使得大规模机器学习成为可能。
  • 最后,开源成为研究界的共识,出现了大量开源的代码、数据和论文。这些开源资源的出现极大促进了技术交流和技术进步,为当前人工智能浪潮打上了独特的历史烙印。