语音信号数字处理

来自cslt Wiki
2018年6月15日 (五) 09:06Cslt讨论 | 贡献的版本

跳转至: 导航搜索

语音信号数字处理(Speech Signal Digital Processing)

授课对象:研究生选修课(计算机系)

授课老师

郑方研究员

王东 副研究员

内容简介

《语音信号数字处理》主要介绍语音信号处理的基本概念及基本方法,内容包括:语音信号处理的基础知识,语音的产生机理与生成模型,线性预测编码,特征提取(包括倒谱系数和线谱对),矢量量化和聚类算法,隐马尔可夫模型(HMM)等。我们还将讨论语音识别、说话人识别及语音合成方向的前沿方法和技术。

2018年春季学期课表

周次	日期	主讲	教学内容	备注
1	2018/02/26	郑方	第1章-绪论;
第2章-语音产生机理与语音生成模型	
2	2018/03/05	郑方	第3章-语音的线性预测编码; 
第4章-倒谱和线谱对	
3	2018/03/12	王东	第5章-静态语音信号分析(1) PCA, NMF及信号分离	
4	2018/03/19	王东	第6章-静态语音信号分析(2) GMM,SVM及神经网络	
5	2018/03/26	郑方	第7章-动态语音信号分析-DTW动态时间匹配;HMM模型基础	
6	2018/04/02	郑方	第8章-HMM 高级话题; 孤立词语音识别系统	
7	2018/04/09	王东	第9章-现代语音识别技术 (1)	
8	2018/04/16	王东	第10章-现代语音识别技术 (2)	
9	2018/04/23	王东	第11章-现代说话人识别技术 (1)	
10	2018/04/30		《五一节假期》	
11	2018/05/07	 王东	第12章-现代说话人识别技术 (2)	
12	2018/05/14	王东	第13章-现代语音合成技术 (1)	
13	2018/05/21	王东	第14章-现代语音合成技术 (2)	
14	2018/05/28		外请报告	讲座
15	2018/06/04		外请报告	讲座
16	2018/06/11		实验一	实验
17	2018/06/18		《端午节假期》	
18	2018/06/25		实验二	实验


教材及参考书

  • 现代机器学习技术导论,王东(http://cslt.riit.tsinghua.edu.cn/mediawiki/index.php/Machine_Learning_Book)
  • Spring Handbook of Speech Processing, Ed. Jacob Benesty, M. Mohan Sondhi, Yiteng Huang
  • Spoken Language Processing, X.D. Huang,
  • Introduction to Digital Signal Processing, Lawrence R. Rabiner and Ronald W. Schafer
  • Spring Topics in Signal Processing, Microphone Array Processing, Benesty, J.; Chen, J.; Huang, Y