交集型歧义字段切分方法研究

被引:23
作者
闫引堂
周晓强
机构
[1] 山西大学!太原
关键词
汉语; 自动分词; 汉字切分; 交集型; 歧义; 独立成词能力频次;
D O I
暂无
中图分类号
G254 [文献标引与编目];
学科分类号
1205 ; 120501 ;
摘要
本文通过动态建立独立成词能力频次库的方法以及基于词语 /词性搭配的规则库 ,对交集型歧义字段进行处理 ,大大提高了切分正确率。在 4万语料的开放测试中 ,交集型歧义字段的切分正确率可达 98%以上。
引用
收藏
页码:637 / 643
页数:7
相关论文
共 2 条
[1]   高频最大交集型歧义切分字段在汉语自动分词中的作用 [J].
孙茂松 ;
左正平 ;
邹嘉彦 .
中文信息学报, 1999, (01) :28-35
[2]  
中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,