一种基于《知网》的中文文本聚类算法的研究

被引:7
作者
赵鹏 [1 ]
蔡庆生 [2 ]
机构
[1] 安徽大学计算智能与信号处理教育部重点实验室
[2] 中国科学技术大学计算机系
关键词
向量空间模型; 本体论; 知网;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
针对基于关键词集的中文文本聚类算法中存在的问题,将《知网》引入到中文文本的特征表示中,并在此基础上提出了一种基于《知网》的中文文本聚类算法。该算法在中文文本表示中加入了基于《知网》的概念特征,实验结果表明该算法能够更好地将语义相关的中文文档聚集在一起,与传统的基于关键词集的中文文本聚类算法相比,聚类质量得到了较大提高。
引用
收藏
页码:162 / 163
页数:2
相关论文
共 4 条
[1]   基于Bayes潜在语义模型的半监督Web挖掘 [J].
宫秀军 ;
史忠植 .
软件学报, 2002, (08) :1508-1514
[2]   基于模糊概念图的文档聚类及其在Web中的应用 [J].
陈宁 ;
陈安 ;
周龙骧 ;
贾维嘉 ;
罗三定 .
软件学报, 2002, (08) :1598-1605
[3]   一种概念空间自生成方法 [J].
傅伟鹏 ;
吴斌 ;
何清 ;
史忠植 ;
不详 .
计算机工程与应用 , 2002, (07) :63-65+88
[4]   基于义原同现频率的汉语词义排歧方法 [J].
杨尔弘 ;
张国清 ;
张永奎 .
计算机研究与发展, 2001, (07) :833-838