基于类信息的文本聚类中特征选择算法

被引:7
作者
严莉莉
张燕平
机构
[1] 安徽大学智能计算与信号处理重点实验室
基金
安徽省自然科学基金;
关键词
文本聚类; 特征选择; 密度聚类算法;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
文本聚类属于无监督的学习方法,由于缺乏类信息还很难直接应用有监督的特征选择方法,因此提出了一种基于类信息的特征选择算法,此算法在密度聚类算法的聚类结果上使用信息增益特征选择法重新选择最有分类能力的特征,实验验证了算法的可行性和有效性。
引用
收藏
页码:144 / 146+217 +217
页数:4
相关论文
共 7 条
[1]   一种高效的用于文本聚类的无监督特征选择算法 [J].
刘涛 ;
吴功宜 ;
陈正 ;
不详 .
计算机研究与发展 , 2005, (03) :381-386
[2]   一种基于参考点和密度的快速聚类算法 [J].
马帅 ;
王腾蛟 ;
唐世渭 ;
杨冬青 ;
高军 .
软件学报, 2003, (06) :1089-1095
[3]   Web文本信息的特征获取算法 [J].
刘明吉 ;
王秀峰 ;
饶一梅 ;
黄亚楼 .
小型微型计算机系统, 2002, (06) :683-686
[4]   基于信息增益的最佳属性集发现方法 [J].
钟宁 ;
尹旭日 ;
陈世福 .
小型微型计算机系统, 2002, (04) :444-446
[5]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101
[6]   隐含语义索引及其在中文文本处理中的应用研究 [J].
周水庚 ;
关佶红 ;
胡运发 .
小型微型计算机系统, 2001, (02) :239-243
[7]  
文本分类中的特征降维方法综述[J]. 陈涛,谢阳群.情报学报. 2005 (06)