汉语语料库词性标注自动校对方法研究

被引:1
作者
张虎
郑家恒
刘江
机构
[1] 山西大学计算机与信息技术学院,山西大学计算机与信息技术学院,山西大学计算机与信息技术学院山西太原,山西太原,山西太原
关键词
聚类; 词性标注; 自动校对;
D O I
暂无
中图分类号
H085 [机器翻译];
学科分类号
050211 ;
摘要
从聚类和分类的角度入手,对大规模语料库中的词性标注的自动校对问题作了分析,提出了语料库词性标注正确性检查和自动校对的新方法。该方法利用聚类和分类的思想,对范例进行聚类并求出阈值,根据阈值,判定词性标注的正误;对标注错误的词性,按靠近各词性类别重心的原则归类,给出一个校对词性,进而提高汉语语料库词性标注的准确率。
引用
收藏
页码:17 / 19+24 +24
页数:4
相关论文
共 5 条
[1]   基于统计的汉语词性标注方法的分析与改进 [J].
魏欧 ;
吴健 ;
孙玉芳 ;
sonata.iscas.ac.cn .
软件学报, 2000, (04) :473-480
[2]   统计与规则并举的汉语词性自动标注算法 [J].
张民 ;
李生 ;
赵铁军 ;
张艳风 .
软件学报, 1998, (02) :55-59
[3]  
现代模式识别.[M].孙即祥等编著;.国防科技大学出版社.2002,
[4]  
计算语言学基础.[M].冯志伟著;.商务印书馆.2001,
[5]  
中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,