一种规则与统计相结合的汉语分词方法

被引:32
作者
赵伟
戴新宇
尹存燕
陈家骏
机构
[1] 南京大学计算机科学与技术系软件新技术国家重点实验室,南京大学计算机科学与技术系软件新技术国家重点实验室,南京大学计算机科学与技术系软件新技术国家重点实验室,南京大学计算机科学与技术系软件新技术国家重点实验室江苏南京,江苏南京,江苏南京,江苏南京
关键词
中文信息处理; 分词; 语料库; 交集型歧义;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。
引用
收藏
页码:23 / 25
页数:3
相关论文
共 8 条
[1]   基于SVM和k-NN结合的汉语交集型歧义切分方法 [J].
李蓉 ;
刘少辉 ;
叶世伟 ;
史忠植 .
中文信息学报, 2001, (06) :13-18
[2]   一种基于EM非监督训练的自组织分词歧义解决方案 [J].
王伟 ;
钟义信 ;
孙建 ;
杨力 .
中文信息学报, 2001, (02) :38-44
[3]   基于最长次长匹配的汉语自动分词 [J].
黄德根 ;
朱和合 ;
王昆仑 ;
杨元生 ;
钟万勰 .
大连理工大学学报, 1999, (06) :831-835
[4]   汉语分词系统中的信息集成和最佳路径搜索方法 [J].
沈达阳 ;
孙茂松 ;
黄昌宁 .
中文信息学报, 1997, (02) :34-47
[5]   利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].
孙茂松 ;
黄昌宁 ;
邹嘉彦 ;
陆方 ;
沈达阳 .
计算机研究与发展 , 1997, (05) :14-21
[6]   基于邻接知识的汉语自动分词系统 [J].
王锡江 ;
王启祥 ;
陈家骏 .
计算机研究与发展, 1992, (11) :54-58
[7]   基于规则的汉语自动分词系统 [J].
姚天顺 ;
张桂平 ;
吴映明 ;
不详 .
中文信息学报 , 1990, (01) :37-43
[8]  
中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,