共 4 条
一种基于《知网》的中文文本聚类算法的研究
被引:7
作者:
赵鹏
[1
]
蔡庆生
[2
]
机构:
[1] 安徽大学计算智能与信号处理教育部重点实验室
[2] 中国科学技术大学计算机系
来源:
关键词:
向量空间模型;
本体论;
知网;
D O I:
暂无
中图分类号:
TP301.6 [算法理论];
学科分类号:
081202 ;
摘要:
针对基于关键词集的中文文本聚类算法中存在的问题,将《知网》引入到中文文本的特征表示中,并在此基础上提出了一种基于《知网》的中文文本聚类算法。该算法在中文文本表示中加入了基于《知网》的概念特征,实验结果表明该算法能够更好地将语义相关的中文文档聚集在一起,与传统的基于关键词集的中文文本聚类算法相比,聚类质量得到了较大提高。
引用
收藏
页码:162 / 163
页数:2
相关论文