一个基于概念的中文文本分类模型

被引:20
作者
苏伟峰
李绍滋
李堂秋
机构
[1] 厦门大学计算机科学系
[2] 厦门大学计算机科学系 厦门
[3] 厦门
关键词
文本分类; 概念; 《知网》; 全信息;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文章提出一个电子文档的自动分类的模型:基于《知网》之上,经过对文档的关键词的抽取和排歧,进而得到关键词的概念,再对关键词的概念进行综合而得到该文本所属的类别,实验证明该模型有较好的效果。
引用
收藏
页码:193 / 195
页数:3
相关论文
共 2 条
[1]   全信息理论在自动文摘系统中的应用 [J].
李蕾 ;
钟义信 ;
郭祥昊 .
计算机工程与应用, 2000, (01) :4-7
[2]   基于汉字字频向量的中文文本自动分类系统 [J].
曹素丽 ;
曾伏虎 ;
曹焕光 .
山西大学学报(自然科学版), 1999, (02) :44-49