大数据可用性的研究进展

被引:67
作者
李建中
王宏志
高宏
机构
[1] 哈尔滨工业大学计算机科学与技术学院
关键词
大数据; 数据可用性; 数据质量; 数据清洗; 数据管理;
D O I
10.13328/j.cnki.jos.005038
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
信息技术的迅速发展,催生了大数据时代的到来.大数据已经成为信息社会的重要财富,为人们更深入地感知、认识和控制物理世界提供了前所未有的丰富信息.然而随着数据规模的扩大,劣质数据也随之而来,导致大数据质量低劣,极大地降低了大数据的可用性,严重困扰着信息社会.近年来,数据可用性问题引起了学术界和工业界的共同关注,展开了深入的研究,取得了一系列研究成果.介绍了数据可用性的基本概念,讨论数据可用性的挑战与研究问题,综述了数据可用性方面的研究成果,探索了大数据可用性的未来研究方向.
引用
收藏
页码:1605 / 1625
页数:21
相关论文
共 39 条
[1]   数据质量多种性质的关联关系研究 [J].
丁小欧 ;
王宏志 ;
张笑影 ;
李建中 ;
高宏 .
软件学报, 2016, 27 (07) :1626-1644
[2]   概率数据库中近似函数依赖挖掘算法 [J].
苗东菁 ;
刘显敏 ;
李建中 .
计算机研究与发展, 2015, 52 (12) :2857-2865
[3]   数据时效性修复问题的求解算法 [J].
李默涵 ;
李建中 .
计算机研究与发展, 2015, (09) :1992-2001
[4]   不一致数据上查询结果的一致性估计 [J].
刘雪莉 ;
李建中 .
计算机学报, 2015, 38 (09) :1727-1738
[5]   基于任务合并的并行大数据清洗过程优化 [J].
杨东华 ;
李宁宁 ;
王宏志 ;
李建中 ;
高宏 .
计算机学报, 2016, 39 (01) :97-108
[6]   基于实体的相似性连接算法 [J].
刘雪莉 ;
王宏志 ;
李建中 ;
高宏 .
软件学报, 2015, 26 (06) :1421-1437
[7]   一种扩展条件函数依赖的发现算法 [J].
刘显敏 ;
李建中 .
计算机研究与发展, 2015, 52 (01) :130-140
[8]   大数据上基于Hadoop的不一致数据检测与修复算法 [J].
张安珍 ;
门雪莹 ;
王宏志 ;
李建中 ;
高宏 .
计算机科学与探索, 2015, 9 (09) :1044-1055
[9]   数据完整性的评估方法 [J].
刘永楠 ;
邹兆年 ;
李建中 ;
王海洁 .
计算机研究与发展 , 2013, (S1) :230-238
[10]   大数据的一个重要方面:数据可用性 [J].
李建中 ;
刘显敏 .
计算机研究与发展, 2013, 50 (06) :1147-1162