基于云计算的物联网数据挖掘

被引:14
作者
张海江
赵建民
朱信忠
徐慧英
机构
[1] 浙江师范大学数理与信息工程学院
基金
浙江省自然科学基金;
关键词
云计算; 物联网; 数据挖掘; Map/Reduce; 关联规则; 副本策略;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
物联网是一个巨大的、分布广泛的物与物相连的网络,其上产生的海量数据通常是与时间和空间相关的,具有动态、异构、分布的特性,因此对这些数据的挖掘非常困难,而且耗费时间和内存,效率低下。为了解决这些问题,提出了一种基于云计算的物联网数据挖掘系统:将这些海量数据转化为PML数据文件,并存储在HDFS中,同时把挖掘任务分配到多台节点服务器上并行处理。采用Hadoop平台,将关联规则Apriori算法Map/Reduce化,提高了挖掘的效率。另外,采用副本策略将计算向存储迁移,将失效节点的计算迁移到副本数据存储节点就地执行,降低了数据传输的时间,大为提高了挖掘的效率。
引用
收藏
页码:10 / 13
页数:4
相关论文
共 5 条
[1]   云计算下的海量数据挖掘研究 [J].
王鄂 ;
李铭 .
现代计算机(专业版), 2009, (11) :22-25+50
[2]   一种基于RFID数据集的物品工作流挖掘方法 [J].
顿海强 ;
赵文 ;
邓鹏鹏 ;
张世琨 ;
王立福 ;
谭杰 .
电子学报, 2008, 36(S1) (S1) :86-93
[3]  
基于MapReduce模型的并行计算平台的设计与实现.[D].万至臻.浙江大学.2008, 07
[4]  
云计算的关键技术与应用实例.[M].王鹏著.人民邮电出版社.2010,
[5]  
云计算.[M].刘鹏; 主编.电子工业出版社.2010,