共 5 条
Web新闻语料分词和标注错误分析
被引:6
作者:
张永奎
[1
]
张彦
[1
]
安增波
[2
]
刘睿
[1
]
机构:
[1] 山西大学计算机与信息技术学院
[2] 中国人民解放军部队自动化工作站
来源:
关键词:
中文信息处理;
分词;
词性标注;
错误类型;
Web突发事件新闻语料库;
D O I:
暂无
中图分类号:
TP393.09 [];
学科分类号:
080402 ;
摘要:
通过分析Web突发事件语料库文本的加工统计得出11类错误类型,并对其中的一些错误提出了解决方案。研究结果不仅对语料库加工初期分词、标注方法的改进有启发作用,而且对中文的自动校对方法,提供一定的借鉴。
引用
收藏
页码:166 / 169
页数:4
相关论文