2014-11-18
来自cslt Wiki
拼写检查功能模块的测试报告如下: author CaoLi date:2014 11.17
1)先对测试集进行自动分词后再手动改错业务词,进行测试.条数:200条.详细结果见test-model-RESULT.txt
测试集为:测试集(.\corpus\20141016凉山州\3文本\testJ.txt)前200条,注意是只取每一条对应的问题. 使用的语言模型:使用训练集<凉山州政务知识训练集1016.xls>中的<标准问题 答案>训练的3-gram语言模型 测试结果的评价标准:
正确率=正确识别出需要修改的个体总数/识别出需要修改的个体总数 召回率=正确识别出需要修改的个体总数/测试集中存在的需要修改的个体总数 准确率=修改对的个体总数/个体总数
RESULT: 需要修改:正确率:173/191 = 0.905759 召回率: 173/373 = 0.463806
不要修改:正确率:1010/1210 = 0.834710召回率:1010/1028 = 0.982490
准确率:1134/1401 = 0.809422
2) 先对测试集进行自动分词后再手动改错业务词,进行测试.条数:200条.详细结果见language-model-RESULT.txt
测试集为:测试集(..\corpus\20141016凉山州\3文本\testJ.txt)前200条,注意是只取每一条对应的问题. 使用的语言模型:换用language-model语言模型 测试结果的评价标准: 正确率=正确识别出需要修改的个体总数/识别出需要修改的个体总数 召回率=正确识别出需要修改的个体总数/测试集中存在的需要修改的个体 总数 准确率=修改对的个体总数/个体总数
RESULT: 需要修改:正确率:193/212 = 0.910377 召回率:193/373 = 0.517426
不要修改:正确率:1009/1189 = 0.848612召回率:1009/1028 = 0.981517
准确率:1185/1401 = 0.845824