基于统计的纠错建议给出算法及其实现

被引:8
作者
张仰森
曹元大
徐波
机构
[1] 北京理工大学计算机系,北京理工大学计算机系,中国科学院自动化所模式识别国家重点实验室 北京
[2] 山西大学计算机系,太原
[3] 中国科学院自动化所模式识别国家重点实验室,北京,北京,北京
关键词
纠错建议; 词典构造; 排序算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
介绍了为自动校对系统检测出的错误字串提供有效纠错建议的算法。该算法针对音同、音近、形似或编码键位相近的错误产生特点,构造了字驱动的双向词典和近似字词典,并利用模糊匹配算法为错误字串提供纠错建议,然后对所有建议根据上下文信息和统计频率进行排序。通过在Windows环境下所实现的系统试验,表明正确建议的召回率达到91.8%,而前5选建议的正确率为76.4%。
引用
收藏
页码:106 / 109
页数:4
相关论文
共 4 条
[1]   一种英文单词拼写自动侦错与纠错的方法──骨架键法 [J].
张仰森 ;
丁冰青 ;
龙一飞 .
电脑开发与应用, 1999, (02) :9-10
[2]   一种混合的中文文本校对方法 [J].
于勐 ;
姚天顺 ;
不详 .
中文信息学报 , 1998, (02) :32-37
[3]  
Delphi 5程序员指南.[M].蒋方帅;潇湘工作室编著;.人民邮电出版社.2000,
[4]  
轻松掌握Delphi 4.[M].(美)[K.赖斯多夫]KentReisdorph著;罗少双等译;.电子工业出版社.1999,