基于直方图和FP增长的高维空间离群点挖掘

被引:2
作者
李龙姣
程国达
机构
[1] 南京财经大学信息工程学院
关键词
数据挖掘; KNN距离; 直方图; FP增长; 离群维关联;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
高维空间离群点的检测和分析是数据挖掘的研究难点之一,针对现有方法存在的问题,提出基于直方图和FP增长的高维空间离群点的挖掘方法。该方法首先计算每一维上数据点的KNN(K-Nearest Neighbors)距离,形成直方图,利用直方图判定数据每一维上的离群点,然后用FP增长算法挖掘频繁离群维之间的关联规则,用于解释离群点在离群维之间的关系。实验证明所提方法不仅有效,而且具有实际意义。
引用
收藏
页码:47 / 52
页数:6
相关论文
共 19 条
[1]  
Distance-based detection and prediction of outliers. ANGIULLI F,BASTA S,PIZZUTI C. IEEE Transactions on Knowledge and Data Engineering . 2006
[2]   基于粗糙集的高维空间离群点发现算法研究 [J].
许龙飞 ;
熊君丽 .
计算机工程与应用, 2004, (07) :58-60+77
[3]  
Risk Analysis for Large Projects: Models, Methods and Cases. Chapman CB,Cooper DF. . 1987
[4]  
Outlier detection for high dimensional data. Aggarwal CC,Yu P. Proceedings of the ACM SIGMOD International Conference on Management of Data . 2001
[5]   离群点挖掘方法综述 [J].
薛安荣 ;
姚林 ;
鞠时光 ;
陈伟鹤 ;
马汉达 .
计算机科学, 2008, (11) :13-18+27
[6]  
LOF: identifying density-based local outliers. Breunig M M,Kreigel H P,Ng R T,et al. Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data . 2000
[7]  
A genetic approach for efficient outlier detection in projected space. Bandyopadhyay S,Santra S. Pattern Recognition . 2008
[8]  
Outlier Mining in Large High-Dimensional Data Sets. Fabrizio Angiulli,Clara Pizzuti. IEEE Transaction On Knowledge And Data Engineer . 2005
[9]  
Re-designing Distance Functions and Distance-based Applications for High Dimensional Data. Aggarwal C C. SIGMOD Re-cord Date . 2001
[10]  
Data clustering[J] . A. K. Jain,M. N. Murty,P. J. Flynn. &nbspACM Computing Surveys (CSUR) . 1999 (3)