基于中文文本分类的分词方法研究

被引:21
作者
湛燕
陈昊
袁方
王熙照
机构
[1] 河北大学数学与计算机科学学院
[2] 河北大学数学与计算机科学学院 保定
[3] 保定
关键词
文本分类; 分词; 查询; 数据库; 主题词;
D O I
暂无
中图分类号
TP391.12 [];
学科分类号
081203 ; 0835 ;
摘要
文本分类有助于用户有选择地阅读和处理海量文本,因此其预备工作分词系统的研究是很有意义的。该文主要提出了一种基于中文文本分类的分词方法,区别于常用的基于字符串匹配等方法,并利用数据库特有的查询技术设计和实现了该分词系统,旨在通过新的分词方法提供更加准确的分词率,同时提高系统实现效率。
引用
收藏
页码:87 / 88+91 +91
页数:3
相关论文
共 5 条
[1]   基于示例的文本标题分类机制 [J].
林鸿飞 .
计算机研究与发展, 2001, (09) :1132-1136
[2]   基于字表的中文搜索引擎分词系统的设计与实现 [J].
丁承 ;
邵志清 .
计算机工程, 2001, (02) :191-193
[3]   文本数据的数据挖掘算法 [J].
陈玉泉 ;
朱锡钧 ;
陆汝占 .
上海交通大学学报, 2000, (07) :936-938
[4]   中文搜索引擎现状与展望 [J].
都云程 ;
卢献华 .
中文信息学报, 1999, (03) :62-66
[5]  
机器翻译原理[M]. 哈尔滨工业大学出版社 , 赵铁军等编著, 2000