海量半结构化数据采集、存储及分析——基于实时空气质量数据处理的实践

被引:25
作者
黄恒君 [1 ]
漆威 [2 ]
机构
[1] 兰州商学院统计学院
[2] 兰州商学院金融学院
关键词
大数据; 数据挖掘; 空气质量; 函数型;
D O I
10.19343/j.cnki.11-1302/c.2014.05.002
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
大数据现象及处理引起了社会各界的关注。本文以大数据宏观层面理论为依据,试图从微观层面讨论一类大数据的具体处理,归纳提出一种基于开源架构的海量半结构化数据采集、存储及分析自动化解决方案,并分析解决方案的开放性、融合性和经济性的特点,指出解决方案的可拓展方面。同时,结合海量空气质量实时数据,分析解决方案的具体开发细节,给出解决方案运行的经验做法,讨论分析过程的大数据压缩机制。
引用
收藏
页码:10 / 16
页数:7
相关论文
共 6 条
[1]   基于B-样条基底展开的曲线聚类方法 [J].
黄恒君 .
统计与信息论坛, 2013, 28 (09) :3-8
[2]   网络大数据:现状与展望 [J].
王元卓 ;
靳小龙 ;
程学旗 .
计算机学报, 2013, 36 (06) :1125-1138
[3]   大数据管理:概念、技术与挑战 [J].
孟小峰 ;
慈祥 .
计算机研究与发展, 2013, (01) :146-169
[4]   大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考 [J].
李国杰 ;
程学旗 .
中国科学院院刊, 2012, 27 (06) :647-657
[5]   架构大数据:挑战、现状与展望 [J].
王珊 ;
王会举 ;
覃雄派 ;
周烜 .
计算机学报, 2011, 34 (10) :1741-1752
[6]   大数据分析——RDBMS与MapReduce的竞争与共生 [J].
覃雄派 ;
王会举 ;
杜小勇 ;
王珊 .
软件学报, 2012, 23 (01) :32-45