云计算下的海量数据挖掘研究

被引:26
作者
王鄂 [1 ]
李铭 [2 ]
机构
[1] 大连理工大学软件学院
[2] 英国南安普顿大学
关键词
云计算; 数据挖掘; Hadoop; SPRINT; MapReduce;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
云计算的出现为愈来愈多的中小企业分析海量数据提供廉价的解决方案。在介绍基于云计算的Hadoop集群框架和数据挖掘技术中的SPRINT分类算法的基础上,详细描述SPRINT并行算法在Hadoop中的MapReduce编程模型上的执行流程,并利用分析出的决策树模型对输入数据进行分类。
引用
收藏
页码:22 / 25+50 +50
页数:5
相关论文
共 4 条
[1]  
基于Hadoop的海量数据处理模型研究和应用.[D].朱珠.北京邮电大学.2008, 11
[2]   改进SPRINT算法及其在分布式环境下的研究 [J].
于蕾 ;
刘大有 ;
高滢 ;
田野 .
吉林大学学报(理学版), 2008, 46 (06) :1119-1124
[3]   基于SPRINT方法的并行决策树分类研究 [J].
魏红宁 .
计算机应用, 2005, (01) :39-41
[4]  
云计算.[M].(美) 米勒 (Miller;M.) ; 著.机械工业出版社.2009,