从多角度分析现有聚类算法(英文)

被引:54
作者
钱卫宁
周傲英
机构
[1] 复旦大学计算机科学系
[2] 复旦大学智能信息处理开放实验室 上海
关键词
数据挖掘; 聚类分析; 算法;
D O I
10.13328/j.cnki.jos.2002.08.006
中图分类号
TP311.12 [];
学科分类号
081202 ; 0835 ;
摘要
聚类是数据挖掘中研究的重要问题之一.聚类分析就是把数据集分成簇,以使得簇内数据尽量相似,簇间数据尽量不同.不同的聚类方法采用不同的相似测度和技术.从以下3个角度分析现有流行聚类算法: (1)聚类尺度; (2)算法框架; (3)簇的表示.在此基础上,分析了一些综合或概括了一些其他方法的算法.由于分析从3个角度进行,所提出的方法能够涵盖,并区分绝大多数现有聚类算法.所做的工作是自调节聚类方法以及聚类基准测试研究的基础.
引用
收藏
页码:1382 / 1394
页数:13
相关论文
共 2 条
[1]  
Density-Based Clustering in Spatial Databases: The Algorithm GDBSCAN and Its Applications[J] . Data Mining and Knowledge Discovery . 1998 (2)
[2]   Extensions to the k-means algorithm for clustering large data sets with categorical values [J].
Huang, ZX .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304