最少分词问题及其解法

被引:32
作者
王晓龙
王开铸
李仲荣
白小华
机构
[1] 哈尔滨工业大学
[2] 哈尔滨电工仪表研究所
关键词
信息处理; 算法分析; 汉语分词;
D O I
暂无
中图分类号
学科分类号
摘要
<正> 一、最少分词问题 由于汉语中词与词之间没有空格,在中文信息处理中会遇到词的确认或切分这一问题。 人们理解自然语言的过程可分为下面几个层次:组字成诃,组词成短语,组短语成语句……。由于后面的处理层次所需考虑的因素多、难度大,尽可能在第一层次即分词层做较多的信息处理,有助于减少整个语言理解过程的开销。换句话说,对字符串分词后得到的词数越少越易于对该字符串的理解。这称为最少分词原则。如何分词使分词后得到的词数最少这一问题
引用
收藏
页码:1030 / 1032
页数:3
相关论文
共 3 条
[1]   书面汉语自动分词系统—CDWS [J].
梁南元 .
中文信息学报, 1987, (02) :44-52
[2]   汉语处理的基础工程——现代汉语词频统计 [J].
刘源 ;
梁南元 .
中文信息学报, 1986, (01) :17-25
[3]   汉字自动统计系统CWSS [J].
关英春 ;
秦蓓 .
计算机研究与发展, 1985, (12) :4-9