基于HMT和哈希树的Apriori并行算法研究

被引:4
作者
曾志勇
杨辉
余建坤
机构
[1] 云南财经大学信息学院
关键词
数据挖掘; Apriori; 哈希树; 并行; 关联规则;
D O I
10.16208/j.issn1000-7024.2012.01.049
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为了进一步提高基于HMT和哈希树的Apriori算法的性能,提出了一种基于独立内存并行环境的并行化方案,充分利用空闲的计算资源来提高关联规则数据挖掘的效率。将原始数据集平均分配到并行环境中的各个子计算节点中,在各个子计算节点中并行地进行关联规则支持度计数,并从各个子计算节点中收集合并支持度计数的结果,得到目标频繁项集,进而实现Apriori算法的并行化。实验结果表明,该并行化方案可以很好地提高原算法的效率。
引用
收藏
页码:214 / 218
页数:5
相关论文
共 8 条
[1]  
并行计算导论.[M].张林波[等]编著;.清华大学出版社.2006,
[2]   负载均衡的FP-growth并行算法研究 [J].
曾志勇 ;
杨呈智 ;
陶冶 .
计算机工程与应用 , 2010, (04) :125-126+229
[3]   挖掘最大频繁项集的事务集迭代算法 [J].
陈波 ;
王乐 ;
董鹏 .
计算机工程与应用, 2009, (06) :141-144
[4]   高效的关联规则快速更新算法 [J].
谭军 ;
卜英勇 ;
杨勃 .
计算机工程与应用, 2009, (04) :146-148
[5]   网格的数据挖掘 [J].
侯文国 ;
傅秀芬 ;
谢翠萍 .
计算机应用研究, 2004, (10) :241-243
[6]  
The WEKA data mining software.[J].Mark Hall;Eibe Frank;Geoffrey Holmes;Bernhard Pfahringer;Peter Reutemann;Ian H. Witten.ACM SIGKDD Explorations Newsletter.2009, 1
[7]   Computing frequent itemsets in parallel using partial support trees [J].
Souliou, Dora ;
Pagourtzis, Aris ;
Drosinos, Nikolaos ;
Tsanakas, Panaylotis .
JOURNAL OF SYSTEMS AND SOFTWARE, 2006, 79 (12) :1735-1743
[8]  
Mining data streams.[J].Mohamed Medhat Gaber;Arkady Zaslavsky;Shonali Krishnaswamy.ACM SIGMOD Record.2005, 2