Xingsong-meeting-minutues-2016-05-12

来自cslt Wiki
2016年5月12日 (四) 02:55Cslt讨论 | 贡献的版本

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索

项目进展

语音识别系统

1. 数据准备

  1. 麦克风阵列采集完成三轮
  2. 标注与切分方法确定
  3. 继续采集30-50小时数据


2. 基线系统

  1. 基线识别系统完成


3. 麦克风阵列研究 (测试结果页)

  • 缺省beamforming
  • Beamforming算法研究
  • delay & sum (DS)
  • super direction (SD)
  • MVDR
  • DAE算法
  • single channel
  • multi channel
  • BM+DAE


4. 模型适应

  1. 字模型+领域相关词模型测试完成,识别结果与大规模词模型相似


语义理解系统

  1. 语义理解,对话管理模块bug fix
  2. 语音容错对应处理开始

系统实现

  1. 系统主要模块完成
  2. 等待NLP和Android client模块集成


5月工作计划

ASR系统性能优化(CSLT)

  • beamforming数据采集
  • noisy training
  • dark knowledge training
  • multi-channel DNN training
  • similar-pair LM

基于ASR的NLP实验

  • example output generation (Sion + CSLT),before 5/18
  • ASR-oriented NLP (CS)

系统集成

  • prototype system with NLP (Sino+CS)
  • NLP submodule ready before 5/30
  • NLP output structure deliver before 5/16
  • Xinsong develop Android application 6/10