“FreeNeb status Report 2018-11-19”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
 
(7位用户的9个中间修订版本未显示)
第6行: 第6行:
 
本周:
 
本周:
 
* 工程化
 
* 工程化
# 完成ivector-based声纹识别引擎开发
+
# local VPR engine:
* 服务器维护
+
## 实现StatisticalPooling component,以实现对x-vector的支持
# 备份了/freeneb/release目录
+
* 项目
+
# roobo口语打分
+
## 按照roobo的需求,增加了输出phone串,和phone级别打分的接口函数,更新了word级别打分的算法。
+
 
||
 
||
 
下周:
 
下周:
 
* 工程化
 
* 工程化
 
# local VPR engine:
 
# local VPR engine:
## 实现StatisticalPooling component,以实现对x-vector的支持
+
## 更新nnet3-to-nnet1转换程序,支持statisticsPooling component
 +
## 优化cmvn
 +
## 实现PLDA打分模块
  
 
||
 
||
第39行: 第37行:
 
|Yang Wei ||
 
|Yang Wei ||
 
本周:
 
本周:
* vad引擎部分测试
+
* 测试vad引擎
 +
* 测试使用tdnn-f chain模型的asr引擎rt
 
||
 
||
 
下周:
 
下周:
 
* 完成vad引擎测试
 
* 完成vad引擎测试
* TDNN-F chain 模型rt测试
+
* 测试i-vector vpr引擎
  
 
||
 
||
第50行: 第49行:
 
|Zhenlong Han||
 
|Zhenlong Han||
 
本周:
 
本周:
# 再测试汽车之家
+
# 汽车之家反馈最新结果
# 整理秒针数据完成,正在训练完成
+
# 整理项目工具框架
 
# 跟进国网标注,分析训练问题
 
# 跟进国网标注,分析训练问题
 
# 双猴京华项目支持
 
# 双猴京华项目支持
# 马老师本地识别项目支持
+
# 发布分音塔本地中文模型
 +
 
 
||
 
||
 
下周:
 
下周:
# 发布秒针模型
 
 
# 分音塔项目
 
# 分音塔项目
 
# 国网项目
 
# 国网项目
第67行: 第66行:
 
本周:
 
本周:
 
#. vad engine 修改功能需求
 
#. vad engine 修改功能需求
 +
#. none打包
 
||
 
||
 
下周:
 
下周:
 
#. vad engine
 
#. vad engine
 +
#. socket server
 
||
 
||
  
第78行: 第79行:
 
|Yanchi Jin||
 
|Yanchi Jin||
 
本周:
 
本周:
# 处理训练国网数据。
+
# 支持roobo语音识别项目,更新v3.6模型。
# 支持预演项目。
+
# 评估分音塔标准测试集
 +
# 分析国网训练模型提升效果
 
||
 
||
 
下周:
 
下周:
# 整理所有项目测试集
+
# 优化分音塔日语识别模型
 
||
 
||
 
||
 
||
第103行: 第105行:
 
|Dong Wang||
 
|Dong Wang||
 
本周:
 
本周:
#. ML book通过出版社审查,准备签定合同。
+
#. DataX中文名确定:未来数据科技有限公司
#. ICASSP论文提交。
+
#. 黄淮学院AI实验室资金、场地等通过校方审核
#. 黄淮学院AI实验室进展顺利。
+
#. 参加APSIPA 2018.
#. DataX场所、启动资金、数据库采集方案等完成,近期开始采集声纹。
+
#. DataX代FreeNeb收集文本和网上数据。
+
 
||
 
||
 
下周:
 
下周:
#. 参加ICASSP会议
+
#. 讨论BP相关内容
 +
#. 处理实习生研究课题
 
||
 
||
 
|-
 
|-
第116行: 第117行:
 
||
 
||
 
上周:
 
上周:
1. 口语打分交付计划,及 phone/word 参考 likelihood 生成;
+
Attended APSIPA.
2. ICASSP 论文查写;
+
3. FreeNeb Logo 设计与整理。
+
 
||
 
||
 
本周:
 
本周:
1. 模型压缩方法调研与实现;
+
1. Deep compression 调研与实现.
2. pair-wise 后端设计
+
2. pair-wise 后端设计.
 +
 
 
||
 
||
  
第129行: 第129行:
 
|Lantian Li||
 
|Lantian Li||
 
上周:
 
上周:
# 完成 ICASSP 论文
+
# 支持秒针声纹项目 @zs
# 完成 x-vector 模型的 解码调参(chunk_size)
+
# 完成 i/d/x-vector 的 CMN 验证
# 完成 d-vector 模型的 训练调参(nnet_structure, dropout, batch_size)
+
# 支持 @zmy x-vector 工程化
# 跟进 声纹明星-微信小程序
+
# 开展若干声纹产品原型设计
# 支持 秒针声纹项目
+
# 组织实习生学习讨论
 
||
 
||
 
本周:
 
本周:
 
# 开启 d-x-vector 模型的 串行训练
 
# 开启 d-x-vector 模型的 串行训练
 
# 尝试 xi-vector 模型实现
 
# 尝试 xi-vector 模型实现
# 阅览 ICASSP18 论文
 
 
||
 
||
  
第145行: 第144行:
 
|Yating Peng||
 
|Yating Peng||
 
上周:
 
上周:
*汇总十月账,做账,报税,发工资;
+
*看政府2019年科技计划和基金,可报2019年中关村国家自主创新示范区科技型小微企业研发费用支持资金和国际合作研发项目,在找性价比高的可靠代理中,希望本周能确定下来;
*公司布置;
+
*去社区开租房发票;
 +
*日常财务报销处理。
  
  
 
||
 
||
 
本周:
 
本周:
*准备19年政府资金支持项目,物色合适代理;
+
*准备政府资金支持材料;
*去社区开租房发票,继续完善公司布置;
+
*完善员工档案excel;
*日常财务报销。
+
 
 
||
 
||
 
||
 
||
第159行: 第159行:
 
|Shiying||
 
|Shiying||
 
上周:
 
上周:
* 汉语大模型noise training(no skip)
+
* 参加APSIPA 2018会议,两份口头报告
* 汉语大模型( clean skip)
+
 
* 熟悉fnscore代码
+
* 完善汉语模型release
+
* rnnlm
+
 
||
 
||
 
本周
 
本周
* 启动汉语rnnlm训练
+
* local ASR model  (context 为3的倍数的ASR model)
* 继续熟悉fnscore代码
+
* ASR model 综合测试
 
||
 
||
 
||
 
||
第181行: 第178行:
 
||
 
||
 
本周:
 
本周:
* roobo打分模型更新
+
* roobo口语打分模型更新
  
 
||
 
||

2018年11月19日 (一) 04:36的最后版本

This Week:

People Last Week This Week Meet Minutes Task Tracing(DeadLine)
Mengyuan Zhao

本周:

  • 工程化
  1. local VPR engine:
    1. 实现StatisticalPooling component,以实现对x-vector的支持

下周:

  • 工程化
  1. local VPR engine:
    1. 更新nnet3-to-nnet1转换程序,支持statisticsPooling component
    2. 优化cmvn
    3. 实现PLDA打分模块
Zhiyong Zhang

本周:

  1. TTS-化学论文摘要合成
  2. release目录model整理
  3. TTS-前端/模型训练调研

下周:

  1. ASR-decoder重置
  2. TTS-海峡研究院特定说话人语音合成
  3. TTS-大规模数据训练
Yang Wei

本周:

  • 测试vad引擎
  • 测试使用tdnn-f chain模型的asr引擎rt

下周:

  • 完成vad引擎测试
  • 测试i-vector vpr引擎
Zhenlong Han

本周:

  1. 汽车之家反馈最新结果
  2. 整理项目工具框架
  3. 跟进国网标注,分析训练问题
  4. 双猴京华项目支持
  5. 发布分音塔本地中文模型

下周:

  1. 分音塔项目
  2. 国网项目
Shuai Zhang

本周:

  1. . vad engine 修改功能需求
  2. . none打包

下周:

  1. . vad engine
  2. . socket server


Yanchi Jin

本周:

  1. 支持roobo语音识别项目,更新v3.6模型。
  2. 评估分音塔标准测试集
  3. 分析国网训练模型提升效果

下周:

  1. 优化分音塔日语识别模型
Rong Liu

上周 1. 黄淮学院AI实验室沟通,待细节协议确定 2. 国网数据结构化分析,解析出客服(1.6k)、客户(9.7W)、及对应地区(分布)标签,可用于声纹 3. 配合誉为科技windows离线输入法联调,基本完成

下周: 1. 推动黄淮学院AI实验室协议确定,启动招标流程 2. 京华电子合同签订 3. 嵌入式语音产品调研

Dong Wang

本周:

  1. . DataX中文名确定:未来数据科技有限公司
  2. . 黄淮学院AI实验室资金、场地等通过校方审核
  3. . 参加APSIPA 2018.

下周:

  1. . 讨论BP相关内容
  2. . 处理实习生研究课题
Zhiyuan Tang

上周: Attended APSIPA.

本周: 1. Deep compression 调研与实现. 2. pair-wise 后端设计.

Lantian Li

上周:

  1. 支持秒针声纹项目 @zs
  2. 完成 i/d/x-vector 的 CMN 验证
  3. 支持 @zmy x-vector 工程化
  4. 开展若干声纹产品原型设计
  5. 组织实习生学习讨论

本周:

  1. 开启 d-x-vector 模型的 串行训练
  2. 尝试 xi-vector 模型实现
Yating Peng

上周:

  • 看政府2019年科技计划和基金,可报2019年中关村国家自主创新示范区科技型小微企业研发费用支持资金和国际合作研发项目,在找性价比高的可靠代理中,希望本周能确定下来;
  • 去社区开租房发票;
  • 日常财务报销处理。


本周:

  • 准备政府资金支持材料;
  • 完善员工档案excel;
Shiying

上周:

  • 参加APSIPA 2018会议,两份口头报告

本周

  • local ASR model (context 为3的倍数的ASR model)
  • ASR model 综合测试
Wenqiang Du

上周:

  • 完成新一轮中文8K的chain模型训练
  • 处理了日语静音测试结果过差问题(text文本中有一部分数据没分词)
  • 实习生demo的整理

本周:

  • roobo口语打分模型更新