基于机器学习的无需人工编制词典的切词系统

被引:23
作者
黄萱菁
吴立德
王文欣
叶丹瑾
机构
[1] 复旦大学计算机科学系
关键词
贝努里概型; 相关度; 广义似然比; 查全率; 查准率;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
本文介绍了一个基于自学习的无需人工编制词典的切词系统.首先用统计方法建立起附有相关度的切词词典.然后,提出将切词问题转化为一个有向图中求解最大加权路径问题,并提出利用词典中的相关度信息切分文本的一个新算法.最后,我们对词典和切词的质量都作了系统的分析,并与其他方法作了性能比较.
引用
收藏
页码:297 / 303
页数:7
相关论文
共 4 条
[1]   基于神经网络的分词方法 [J].
徐秉铮 ;
詹剑 ;
贺前华 .
中文信息学报, 1993, (02) :36-44
[2]   汉语计算机自动分词知识 [J].
梁南元 .
中文信息学报, 1990, (02) :29-33
[3]   基于规则的汉语自动分词系统 [J].
姚天顺 ;
张桂平 ;
吴映明 ;
不详 .
中文信息学报 , 1990, (01) :37-43
[4]  
概率论[M]. 高等教育出版社 , 复旦大学 编, 1979