K-Means聚类算法的研究

被引:136
作者
周爱武
于亚飞
机构
[1] 安徽大学计算机科学与技术学院
关键词
K-Means算法; 初始聚类中心; 孤立点;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
K-Means算法是一种经典的聚类算法,有很多优点,也存在许多不足。比如初始聚类数K要事先指定,初始聚类中心选择存在随机性,算法容易生成局部最优解,受孤立点的影响很大等。文中主要针对K-Means算法初始聚类中心的选择以及孤立点问题加以改进,首先计算所有数据对象之间的距离,根据距离和的思想排除孤立点的影响,然后提出了一种新的初始聚类中心选择方法,并通过实验比较了改进算法与原算法的优劣。实验表明,改进算法受孤立点的影响明显降低,而且聚类结果更接近实际数据分布。
引用
收藏
页码:62 / 65
页数:4
相关论文
共 9 条
[1]   基于K均值聚类和概率松弛法的图像区域分割 [J].
周卫星 ;
廖欢 .
计算机技术与发展, 2010, 20 (02) :68-70+74
[2]   基于K-means聚类算法的研究 [J].
步媛媛 ;
关忠仁 .
西南民族大学学报(自然科学版), 2009, 34 (01) :198-200
[3]   基于划分的K-均值初始聚类中心优化算法 [J].
苏锦旗 ;
薛惠锋 ;
詹海亮 .
微电子学与计算机, 2009, 26 (01) :8-11
[4]   一种改进的K-means聚类算法 [J].
连凤娜 ;
吴锦林 ;
唐琦 .
电脑与信息技术, 2008, (01) :38-40
[5]   一种改进的k-means算法 [J].
李业丽 ;
秦臻 .
北京印刷学院学报, 2007, (02) :63-65
[6]   基于距离的孤立点检测研究 [J].
陆声链 ;
林士敏 ;
不详 .
计算机工程与应用 , 2004, (33) :73-75+94
[7]  
数据挖掘[M]. 中国科学技术大学出版社 , 朱明编著, 2002
[8]   SELF-ORGANIZED FORMATION OF TOPOLOGICALLY CORRECT FEATURE MAPS [J].
KOHONEN, T .
BIOLOGICAL CYBERNETICS, 1982, 43 (01) :59-69
[9]  
STING: A statistical information grid approach to spatial data mining. Wang W, Yang J, Muntz RR. Proceedings of the 23rd International Conference on Very Large Data Bases . 1997