共词分析中的词语贡献度特征选择研究

被引:15
作者
胡昌平
陈果
机构
[1] 武汉大学信息资源研究中心
关键词
共词分析; 聚类; 词语贡献度; 特征选择; 数字图书馆;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
从数据降维的角度来看,传统共词分析中以高频词构建共词矩阵的方法有较大的改进空间。将共词分析与文本分类、聚类、检索等方法进行对比归一,引入词语贡献度作为新的特征词选择方法,并给出算法描述。从聚类效果层面将新方法与传统方法进行对比,通过实证验证基于词语贡献度的特征选择方法对共词分析有改进作用。
引用
收藏
页码:89 / 93
页数:5
相关论文
共 11 条
[1]  
中文文本聚类中特征选择算法的研究.[D].龚静.湘潭大学.2006, 08
[2]  
用共关键词网络揭示领域知识结构的实验研究.[J].叶鹰;张力;赵星;Ronald Rousseau;.情报学报.2012, 12
[3]   文本分类中的特征降维方法研究 [J].
张玉芳 ;
万斌候 ;
熊忠阳 .
计算机应用研究, 2012, 29 (07) :2541-2543
[4]   2000—2009年我国数字图书馆研究主题领域分析——基于CSSCI关键词统计数据 [J].
苏新宁 ;
夏立新 .
中国图书馆学报, 2011, 37 (04) :60-69
[6]   一种高效的用于文本聚类的无监督特征选择算法 [J].
刘涛 ;
吴功宜 ;
陈正 ;
不详 .
计算机研究与发展 , 2005, (03) :381-386
[7]  
文本分类中的特征降维方法综述.[J].陈涛;谢阳群;.情报学报.2005, 06
[8]  
文本分类中特征选择技术的研究.[D].王博.国防科学技术大学.2009, 04
[9]  
聚类分析中若干关键技术的研究.[D].杨小兵.浙江大学.2005, 04
[10]   A co-word analysis of digital library field in China [J].
Liu, Gao-Yong ;
Hu, Ji-Ming ;
Wang, Hui-Ling .
SCIENTOMETRICS, 2012, 91 (01) :203-217