一种规则与统计相结合的汉语分词方法

被引：32

作者：

赵伟

戴新宇

尹存燕

陈家骏

机构：

[1] 南京大学计算机科学与技术系软件新技术国家重点实验室,南京大学计算机科学与技术系软件新技术国家重点实验室,南京大学计算机科学与技术系软件新技术国家重点实验室,南京大学计算机科学与技术系软件新技术国家重点实验室江苏南京,江苏南京,江苏南京,江苏南京

来源：

计算机应用研究 | 2004年 / 03期

关键词：

中文信息处理; 分词; 语料库; 交集型歧义;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。

引用

页码：23 / 25

页数：3

共 8 条

[1] 基于SVM和k-NN结合的汉语交集型歧义切分方法 [J].

李蓉 ;

刘少辉 ;

叶世伟 ;

史忠植 .

中文信息学报, 2001, (06) :13-18

[2] 一种基于EM非监督训练的自组织分词歧义解决方案 [J].

王伟 ;

钟义信 ;

孙建 ;

杨力 .

中文信息学报, 2001, (02) :38-44

[3] 基于最长次长匹配的汉语自动分词 [J].

黄德根 ;

朱和合 ;

王昆仑 ;

杨元生 ;

钟万勰 .

大连理工大学学报, 1999, (06) :831-835

[4] 汉语分词系统中的信息集成和最佳路径搜索方法 [J].

沈达阳 ;

孙茂松 ;

黄昌宁 .

中文信息学报, 1997, (02) :34-47

[5] 利用汉字二元语法关系解决汉语自动分词中的交集型歧义 [J].

孙茂松 ;

黄昌宁 ;

邹嘉彦 ;

陆方 ;

沈达阳 .

计算机研究与发展 , 1997, (05) :14-21

[6] 基于邻接知识的汉语自动分词系统 [J].

王锡江 ;

王启祥 ;

陈家骏 .

计算机研究与发展, 1992, (11) :54-58

[7] 基于规则的汉语自动分词系统 [J].

姚天顺 ;

张桂平 ;

吴映明 ;

不详 .

中文信息学报 , 1990, (01) :37-43

[8]

中文文本自动分词和标注.[M].刘开瑛著;.商务印书馆.2000,

← 1 →