一种非对称距离下的层次聚类算法

被引:11
作者
韩忠明
陈妮
张慧
杨伟杰
机构
[1] 北京工商大学计算机与信息工程学院
关键词
非对称距离; 层次聚类; 数据挖掘;
D O I
10.16451/j.cnki.issn1003-6059.2014.05.003
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
层次聚类算法在数据挖掘领域有着广泛应用,现有的层次聚类算法都依赖于对称距离定义.针对聚类对象的非对称距离下的层次聚类展开研究,提出完整的非对称距离下的层次聚类算法,给出聚类对象选择因子,并定义相应的计算方法.文中提出不同簇之间的合并方法,形成非对称距离下的单连接、全连接等算法.采集社会化书签系统中的热点标签,基于共现次数定义非对称距离,对所提出的算法进行大量实验,实验结果表明聚类结果与实际结果具有较高的一致性.对算法进行量化指标分析的结果也表明非对称层次聚类算法具有良好性能.
引用
收藏
页码:410 / 416
页数:7
相关论文
共 12 条
[1]   基于隐主题分析和文本聚类的微博客中新闻话题的发现 [J].
路荣 ;
项亮 ;
刘明荣 ;
杨青 .
模式识别与人工智能, 2012, 25 (03) :382-387
[2]   基于流形距离的量子进化聚类算法 [J].
李阳阳 ;
石洪竺 ;
焦李成 ;
马文萍 .
电子学报, 2011, 39 (10) :2343-2347
[3]   一种结合词项语义信息和TF-IDF方法的文本相似度量方法 [J].
黄承慧 ;
印鉴 ;
侯昉 .
计算机学报, 2011, 34 (05) :856-864
[4]   从链接密度遍历序列中挖掘网络社团的层次结构 [J].
黄健斌 ;
孙鹤立 ;
Dustin BORTNER ;
刘亚光 .
软件学报, 2011, 22 (05) :951-961
[5]   基于主题的自适应、在线网络热点发现方法及新闻推荐系统 [J].
吴永辉 ;
王晓龙 ;
丁宇新 ;
徐军 ;
郭鸿志 .
电子学报, 2010, 38 (11) :2620-2624
[6]   一种基于语料特性的聚类算法 [J].
曾依灵 ;
许洪波 ;
吴高巍 ;
白硕 .
软件学报, 2010, 21 (11) :2802-2813
[7]   基于词聚类特征的统计中文组块分析模型 [J].
孙广路 ;
王晓龙 ;
刘秉权 ;
关毅 .
电子学报, 2008, 36 (12) :2450-2453+2399
[8]   一种基于数据场的层次聚类方法 [J].
淦文燕 ;
李德毅 ;
王建民 .
电子学报, 2006, (02) :258-262
[9]   Solving non-uniqueness in agglomerative hierarchical clustering using multidendrograms [J].
Fernandez, Alberto ;
Gomez, Sergio .
JOURNAL OF CLASSIFICATION, 2008, 25 (01) :43-65
[10]  
Asymmetric Agglomerative Hierarchical Clustering Algorithms and Their Evaluations[J] . Akinobu Takeuchi,Takayuki Saito,Hiroshi Yadohisa.Journal of Classification . 2006 (1)