“FreeNeb status Report 2018-12-24”版本间的差异

来自cslt Wiki
跳转至: 导航搜索
 
(7位用户的7个中间修订版本未显示)
第17行: 第17行:
 
|Zhiyong Zhang||
 
|Zhiyong Zhang||
 
本周:
 
本周:
# TTS-海峡研究院特定说话人语音合成--16k-TTS train and adaptation done, 已发送demo语音给海峡
+
# 新嵌入式板子验证及串口输出测试;
# MVS-AP82 EVB板带录音demo已跑通,可烧进板子测试
+
# 归档英语/日语模型整理,已完成英语
# 自有嵌入式代码已在板子上编译通过,下一步待烧进板子测试
+
# 国网语音切分工具部署--虚拟机模式
  
 
||
 
||
 
下周:
 
下周:
 
# ASR-decoder重置
 
# ASR-decoder重置
# 浮点运算ASR 板子性能测试
+
# 嵌入式语音识别板子测试
# 嵌入式模型结构探索
+
# 归档日语模型
  
 
||
 
||
第58行: 第58行:
 
|Shuai Zhang||
 
|Shuai Zhang||
 
本周:
 
本周:
# asr服务端更换模型
+
# asr服务器升级
# release x-vector Demo
+
# 门禁 Demo
# vad engine 需求更新修改
+
# vad engine bug修改
 +
# 打分EnglishParrot服务端
 +
# 打分EnglishParrot客户端
 
||
 
||
 
下周:
 
下周:
# vad engine bug修改
+
# 打分EnglishParrot服务端
# 所有demo更新引擎
+
# 打分EnglishParrot客户端
 +
# 打分FnParrot服务端
 +
# 打分FnParrot客户端
 
# 助残项目计划
 
# 助残项目计划
 
||
 
||
第74行: 第78行:
 
|Yanchi Jin||
 
|Yanchi Jin||
 
本周:
 
本周:
* 持续完成分音塔月度计划
+
* 完成初版自适应训练平台,lm训练部分
# 完成105h数据的声学模型训练,对以往结果进行对比。
+
* 支持日本同方vpr server部署
* 完成训练平台语言模型、声学模型、造graph流程
+
  
 
||
 
||
 
下周:
 
下周:
 
* 持续完成分音塔月度计划
 
* 持续完成分音塔月度计划
# 完成最新标注的30h数据的声学模型训练+标注文本的语言模型训练。
+
# 中文最终测试集整理,确定
* 完成训练平台前端接口,完善训练平台流程
+
# 第二批次中文100h训练
 +
* 国家电网
 +
# datax第5、6批次标注数据整理
 +
# 数据分发
 
||
 
||
 
||
 
||
第88行: 第94行:
 
|Rong Liu||
 
|Rong Liu||
 
上周
 
上周
1. 京华合同落地
+
1. 国网项目汇报,协助华源做ppt
2. 需求沟通,友杰智新离线asr和语种识别;海天瑞声的离线asr匹配
+
2. 得意声纹合作项目,泰康声纹项目初期沟通资料
3. 国网项目沟通,结项情况推进;提供维语语音识别相关项目资料
+
3. 友杰智新沟通,待提供商业报价方案
4. 智能助残demo需求确定,开发对接禹为,初步方案确定
+
4. 智能助残demo开发,设备调试完,待测试整个流程
 
||
 
||
 
下周:
 
下周:
第104行: 第110行:
 
|Dong Wang||
 
|Dong Wang||
 
本周:
 
本周:
#. Free宝、债转股、年终奖分配方案基本完成。
+
# Free宝、债转股、年终奖分配方案,合作公司方案计划确定。
#.日本中兴、智能管家等项目方案和进展讨论。
+
# 《机器学习》引用检查完成 @云麒
#.得意音通、中科汇联、深圳硬件公司合作方案讨论。
+
# Attention系统设计@蓝天@嘉威
#.《机器学习》合同签署完成,整理bib。
+
# 基于VAE的说话人特征提取设计
 
||
 
||
 
下周:
 
下周:
#. 《机器学习》交稿
+
#. 基于VAE的说话人特征提取方案确定
#. 确定Free宝、债转股等方案
+
#. 语音识别手册:《说话人自适应》和《环境鲁棒性》两章完成
  
 
||
 
||
第118行: 第124行:
 
||
 
||
 
上周:
 
上周:
1. PyTorch/TensorFlow 工具探索和使用;
+
1. PyTorch tdnn/cnn 探索和使用;
2. 歌词生成(古风)进一步落实;
+
2. ASR 技术报告;
3. ASR 技术报告准备(delayed)。
+
3. 口语打分专利答疑;
 +
4. roobo 口语打分测试集初步评测(可用)。
 
||
 
||
 
本周:
 
本周:
1. PyTorch/TensorFlow Speech Recipe 整理上传;
+
1. PyTorch tdnn/cnn recipe 整理;
2. 歌词生成进一步推动;
+
2. 口语打分测试集评测和系统调参。
3. 技术报告。
+
  
 
||
 
||
第133行: 第139行:
 
|Lantian Li||
 
|Lantian Li||
 
上周:
 
上周:
# 完成 Nnet-vad 和 Energy-vad 的训练与对比测试
+
# 开展 Nnet-vad 优化
# 完成九天微联声纹测试(嵌入式)
+
# 完成模型压缩测试
# 调研当前市场声纹 API 发布情况
+
# 撰写声纹合同专利
# 开展模型压缩测试
+
# 微信小程序开发测试
 
||
 
||
 
本周:
 
本周:
# Nnet-vad 优化
+
# 提交专利
# 完成模型压缩测试
+
# 开启 group training
 +
# 加入 三阶 + 四阶信息
 
||
 
||
  
第159行: 第166行:
 
|Shiying||
 
|Shiying||
 
上周:
 
上周:
* local ASR 结果release(am: clean chain model  graph: graph1e-5 graph1e-6 graph1e-7 graph1e-9)
+
* 16k-8k工具检查流程梳理
* 14000h 中文数据clean up(预计还需要超过一周的时间)
+
* 1万4千小时 data clean up
* 与勇哥一起做语音识别小模型探索(目前最小的模型:1.2M  10种命令词识别结果为:8.81%)
+
 
||
 
||
 
本周
 
本周
* 继续中文14000h 中文数据clean up
+
* 探究网络减枝方法,确定减枝方案,并在汉语大模型上得到初步结果
* 语音识别小模型(尽量将模型控制在1M以内)
+
 
||
 
||
 
||
 
||

2018年12月24日 (一) 04:23的最后版本

This Week:

People Last Week This Week Meet Minutes Task Tracing(DeadLine)
Mengyuan Zhao

本周:

  • 工程化
  1. 熟悉语音分割流程

下周:

  • 工程化
  1. 继续梳理demo list,并上线。
Zhiyong Zhang

本周:

  1. 新嵌入式板子验证及串口输出测试;
  2. 归档英语/日语模型整理,已完成英语
  3. 国网语音切分工具部署--虚拟机模式

下周:

  1. ASR-decoder重置
  2. 嵌入式语音识别板子测试
  3. 归档日语模型
Yang Wei

本周:

  • 外包声纹demo分数问题定位

下周:

  • 完成外包声纹demo测试
  • 新版asr socket server部署测试
Zhenlong Han

本周:

  1. 整理项目工具框架
  2. 跟进国网标注
  3. 双猴京华项目支持
  4. 分音塔标注检查

下周:

  1. 训练国网模型
  2. 整理工具脚本
Shuai Zhang

本周:

  1. asr服务器升级
  2. 门禁 Demo
  3. vad engine bug修改
  4. 打分EnglishParrot服务端
  5. 打分EnglishParrot客户端

下周:

  1. 打分EnglishParrot服务端
  2. 打分EnglishParrot客户端
  3. 打分FnParrot服务端
  4. 打分FnParrot客户端
  5. 助残项目计划


Yanchi Jin

本周:

  • 完成初版自适应训练平台,lm训练部分
  • 支持日本同方vpr server部署

下周:

  • 持续完成分音塔月度计划
  1. 中文最终测试集整理,确定
  2. 第二批次中文100h训练
  • 国家电网
  1. datax第5、6批次标注数据整理
  2. 数据分发
Rong Liu

上周 1. 国网项目汇报,协助华源做ppt 2. 得意声纹合作项目,泰康声纹项目初期沟通资料 3. 友杰智新沟通,待提供商业报价方案 4. 智能助残demo开发,设备调试完,待测试整个流程

下周: 1. 品牌共享+自适应产品推进 2. 友杰智新需求和合作模式沟通 3. 智能助残demo完成

Dong Wang

本周:

  1. Free宝、债转股、年终奖分配方案,合作公司方案计划确定。
  2. 《机器学习》引用检查完成 @云麒
  3. Attention系统设计@蓝天@嘉威
  4. 基于VAE的说话人特征提取设计

下周:

  1. . 基于VAE的说话人特征提取方案确定
  2. . 语音识别手册:《说话人自适应》和《环境鲁棒性》两章完成
Zhiyuan Tang

上周: 1. PyTorch tdnn/cnn 探索和使用; 2. ASR 技术报告; 3. 口语打分专利答疑; 4. roobo 口语打分测试集初步评测(可用)。

本周: 1. PyTorch tdnn/cnn recipe 整理; 2. 口语打分测试集评测和系统调参。

Lantian Li

上周:

  1. 开展 Nnet-vad 优化
  2. 完成模型压缩测试
  3. 撰写声纹合同专利
  4. 微信小程序开发测试

本周:

  1. 提交专利
  2. 开启 group training
  3. 加入 三阶 + 四阶信息
Yating Peng

上周:

  • 财务:参加海淀税务组织的新个税法培训;
  • 行政:设计制作公司名片、总结会议纪要、续费、报销、合同盖章处理;

本周:

  • 确定年会地点;
  • 收羽绒服
Shiying

上周:

  • 16k-8k工具检查流程梳理
  • 1万4千小时 data clean up

本周

  • 探究网络减枝方法,确定减枝方案,并在汉语大模型上得到初步结果
Wenqiang Du

上周:

  • 8K数据(9400h)chain模型训练(预计最快还要11天)
  • 日语graph以及大小语言模型解码
  • 日语的chain模型做区分性训练(问题排查中)
  • 16k-8k的数据各项测试(结果持续更新到bugdb上)

本周:

  • 继续8K数据大模型训练
  • 16k-8k方法验证