架构大数据:挑战、现状与展望

被引:626
作者
王珊 [1 ,2 ]
王会举 [1 ,2 ]
覃雄派 [1 ,2 ]
周烜 [1 ,2 ]
机构
[1] 数据工程与知识工程教育部重点实验室(中国人民大学)
[2] 中国人民大学信息学院
关键词
大数据; 大规模可扩展; MapReduce; 并行数据库; 深度分析;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点.为了设计适合大数据分析的数据仓库架构,文中列举了大数据分析平台需要具备的几个重要特性,对当前的主流实现平台——并行数据库、MapReduce及基于两者的混合架构进行了分析归纳,指出了各自的优势及不足,同时也对各个方向的研究现状及作者在大数据分析方面的努力进行了介绍,对未来研究做了展望.
引用
收藏
页码:1741 / 1752
页数:12
相关论文
共 4 条
[1]  
MapReduce and parallel DBMSs[J] . Michael Stonebraker,Daniel Abadi,David J. DeWitt,Sam Madden,Erik Paulson,Andrew Pavlo,Alexander Rasin.Communications of the ACM . 2010 (1)
[2]  
Database parallel-ismchoices greatlyi mpact scalability .2 Madden S,De Witt D J,Stonebraker M. DatabaseColumn Blog.http://www.databasecolumn.com/2007/10/database-paral-lelism-choices.ht ml .
[3]  
A latency and fault-tolerance optimizer for online parallel query plans .2 Upadhyaya P,Kwon Y C,Balazinska M. Proceedings of the ACM SIGMOD International Conference on Management of Data (SIGMOD.11) . 2011
[4]  
http://hive.apache.org .