基于近邻传播与密度相融合的进化数据流聚类算法

被引:35
作者
邢长征
刘剑
机构
[1] 辽宁工程技术大学研究生院
关键词
离群点; 数据流聚类; 近邻传播; 微簇;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对目前数据流离群点不能很好地被处理、数据流聚类效率较低以及对数据流的动态变化不能实时检测等问题,提出一种基于近邻传播与密度相融合的进化数据流聚类算法(I-APDen Stream)。此算法使用传统的两阶段处理模型,即在线与离线聚类两部分。不仅引进了能够体现数据流动态变化的微簇衰减密度以及在线动态维护微簇的删减机制,而且在对模型采用扩展的加权近邻传播(WAP)聚类进行模型重建时,还引进了异常点检测删除机制。通过在两种类型数据集上的实验结果表明,所提算法的聚类准确率基本能保持在95%以上,其纯度对比实验等其他相关测试都有较好结果,能够高实效、高质量、高效率地处理数据流数据聚类。
引用
收藏
页码:1927 / 1932+1949 +1949
页数:7
相关论文
共 5 条
[1]   基于密度与近邻传播的数据流聚类算法 [J].
张建朋 ;
陈福才 ;
李邵梅 ;
刘力雄 .
自动化学报, 2014, 40 (02) :277-288
[2]  
一种基于密度的空间数据流在线聚类算法[J]. 于彦伟,王沁,邝俊,何杰.自动化学报. 2012(06)
[3]   一种基于时态密度的倾斜分布数据流聚类算法 [J].
杨宁 ;
唐常杰 ;
王悦 ;
陈瑜 ;
郑皎凌 .
软件学报, 2010, 21 (05) :1031-1041
[4]   基于密度的混合属性数据流聚类算法 [J].
黄德才 ;
吴天虹 .
控制与决策, 2010, 25 (03) :416-421
[5]   Stream Data Clustering Based on Grid Density and Attraction [J].
Tu, Li ;
Chen, Yixin .
ACM TRANSACTIONS ON KNOWLEDGE DISCOVERY FROM DATA, 2009, 3 (03)