大数据的一个重要方面:数据可用性

被引:263
作者
李建中
刘显敏
机构
[1] 哈尔滨工业大学计算机科学与技术学院
基金
国家自然科学基金重点项目;
关键词
大数据; 数据可用性; 数据一致性; 数据完整性; 数据精确性; 数据时效性; 实体同一性;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着信息技术的发展,特别是物理信息系统、互联网、云计算和社交网络等技术的突飞猛进,大数据普遍存在,正在成为信息社会的重要财富,同时也带来了巨大的挑战.数据可用性问题就是大数据的重要挑战之一.随着数据的爆炸性增长,劣质数据也随之而来,数据可用性受到严重影响,对信息社会形成严重威胁,引起了学术界和工业界的共同关注.近年来,学术界和工业界开始研究数据可用性问题,取得了一些的研究成果,但是针对大数据可用性问题的研究工作还很少.介绍了大数据可用性的基本概念,讨论大数据可用性的挑战,探讨大数据可用性方面的研究问题,并综述数据可用性方面的研究成果.
引用
收藏
页码:1147 / 1162
页数:16
相关论文
共 28 条
[1]  
Mining frequent subgraphs over uncertain graph databases under probabilistic semantics[J] . Jianzhong Li,Zhaonian Zou,Hong Gao.The VLDB Journal . 2012 (6)
[2]   Determining the Currency of Data [J].
Fan, Wenfei ;
Geerts, Floris ;
Wijsen, Jef .
ACM TRANSACTIONS ON DATABASE SYSTEMS, 2012, 37 (04)
[3]   Efficient Similarity Joins for Near-Duplicate Detection [J].
Xiao, Chuan ;
Wang, Wei ;
Lin, Xuemin ;
Yu, Jeffrey Xu ;
Wang, Guoren .
ACM TRANSACTIONS ON DATABASE SYSTEMS, 2011, 36 (03)
[4]   XML with Incomplete Information [J].
Barcelo, Pablo ;
Libkin, Leonid ;
Poggi, Antonella ;
Sirangelo, Cristina .
JOURNAL OF THE ACM, 2010, 58 (01)
[5]  
Development and user experiences of an open source data cleaning, deduplication and record linkage system[J] . Peter Christen.ACM SIGKDD Explorations Newsletter . 2009 (1)
[6]   Creating probabilistic databases from duplicated data [J].
Hassanzadeh, Oktie ;
Miller, Renee J. .
VLDB JOURNAL, 2009, 18 (05) :1141-1166
[7]  
Generic entity resolution with negative rules[J] . Steven Euijong Whang,Omar Benjelloun,Hector Garcia-Molina.The VLDB Journal . 2009 (6)
[8]   Conditional functional dependencies for capturing data inconsistencies [J].
Fan, Wenfei ;
Geerts, Floris ;
Jia, Xibei ;
Kementsietsidis, Anastasios .
ACM TRANSACTIONS ON DATABASE SYSTEMS, 2008, 33 (02)
[9]  
Swoosh: a generic approach to entity resolution[J] . Omar Benjelloun,Hector Garcia-Molina,David Menestrina,Qi Su,Steven Euijong Whang,Jennifer Widom.The VLDB Journal . 2009 (1)
[10]   Representing and querying XML with incomplete information [J].
Abiteboul, Serge ;
Segoufin, Luc ;
Vianu, Victor .
ACM TRANSACTIONS ON DATABASE SYSTEMS, 2006, 31 (01) :208-254