Hulan-2015-04-09

来自cslt Wiki
跳转至: 导航搜索

实验室后续研究方向:

长期任务

目标: 每3-5个月, 智能化(性能指标)/自动化(人工依赖)程度有阶段性提高。


检索优化 骆天一/刘荣 在线学习 骆天一 基于百度企业知道数据的关系抽取和模板扩充 东旭+新工程师 sempre工具研究(自然语言->查询表达式) 骆天一


近期任务

  • 自然语言问句到语义表达式(模板)的映射及语义变量(提问对象)的提取 (包含:语义表达式中基本符号定义,基于人工标注数据自动实现大规模问答对(2015年会达到百万量级)的自动标注)

责任人: 王老师 计划:下周开会讨论

  • 同义词自动扩展(系统级和租户级, 不同级别不同confidence, 自动发现作为未来长期任务)
  • 责任人: 邢超 4.17


  • 句法分析树选型和验证(LTP/复旦/HanLP/Stanford etc)
  • 责任人: 刘荣 4.17


  • 多租户场景下租户数据库对接方案(性能测试)
  • 责任人: 汇联


  • 复旦指代消解功能的集成
  • 责任人:刘荣 4.17 验证结果


  • 语义归一化 (时间、数字)
  • 责任人:刘荣 4.17 验证结果


  • 在线学习算法简介
  • 责任人:天一 4.10