“Xingsong-meeting-minutues-2016-05-12”版本间的差异
来自cslt Wiki
第15行: | 第15行: | ||
− | 3. 麦克风阵列研究 | + | 3. 麦克风阵列研究 ([[xinsong-beamforming-result|测试结果页]]) |
*缺省beamforming | *缺省beamforming |
2016年5月12日 (四) 02:55的最后版本
项目进展
语音识别系统
1. 数据准备
- 麦克风阵列采集完成三轮
- 标注与切分方法确定
- 继续采集30-50小时数据
2. 基线系统
- 基线识别系统完成
3. 麦克风阵列研究 (测试结果页)
- 缺省beamforming
- Beamforming算法研究
- delay & sum (DS)
- super direction (SD)
- MVDR
- DAE算法
- single channel
- multi channel
- BM+DAE
4. 模型适应
- 字模型+领域相关词模型测试完成,识别结果与大规模词模型相似
语义理解系统
- 语义理解,对话管理模块bug fix
- 语音容错对应处理开始
系统实现
- 系统主要模块完成
- 等待NLP和Android client模块集成
5月工作计划
ASR系统性能优化(CSLT)
- beamforming数据采集
- noisy training
- dark knowledge training
- multi-channel DNN training
- similar-pair LM
基于ASR的NLP实验
- example output generation (Sion + CSLT),before 5/18
- ASR-oriented NLP (CS)
系统集成
- prototype system with NLP (Sino+CS)
- NLP submodule ready before 5/30
- NLP output structure deliver before 5/16
- Xinsong develop Android application 6/10