大数据环境下面向知识服务的数据清洗研究

被引:46
作者
蒋勋 [1 ,2 ]
刘喜文 [1 ]
机构
[1] 南京大学信息管理学院
[2] 无锡城市职业技术学院电子信息工程系
关键词
大数据; 知识服务; 知识库; 数据清洗; 非清洁数据; 清洁度;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
大数据既丰富了知识的内涵,也增添了知识显式化的障碍。对大数据进行数据清洗是最终获取知识的有效途径。由大数据的特点对知识服务重新提出要求,不仅要提高数据的使用价值,更要使数据严密的关联,这些要求一方面通过数据清洗满足数据质量的提高,另一方面容忍非清洁数据实现知识服务效率与水平的同步提高。文章给出了数据清洗的基本框架模型及其局限,从而进一步提出非清洁数据的清洁度的机制。
引用
收藏
页码:16 / 21
页数:6
相关论文
共 8 条
[1]   大数据管理:概念、技术与挑战 [J].
孟小峰 ;
慈祥 .
计算机研究与发展, 2013, (01) :146-169
[2]   数据清洗及其一般性系统框架 [J].
曹建军 ;
刁兴春 ;
陈爽 ;
邵衍振 .
计算机科学, 2012, 39(S3) (S3) :207-211
[3]   劣质数据库上阈值相似连接结果大小估计 [J].
张岩 ;
杨龙 ;
王宏志 .
计算机学报, 2012, 35 (10) :2159-2168
[4]   中文数据清洗研究综述 [J].
叶鸥 ;
张璟 ;
李军怀 .
计算机工程与应用 , 2012, (14) :121-129
[5]   一种非清洁数据库的数据模型 [J].
王宏志 ;
李建中 ;
高宏 .
软件学报, 2012, 23 (03) :539-549
[6]   相似重复记录清理方法研究综述 [J].
叶焕倬 ;
吴迪 .
现代图书情报技术, 2010, (09) :56-66
[7]   不确定性数据管理技术研究综述 [J].
周傲英 ;
金澈清 ;
王国仁 ;
李建中 .
计算机学报, 2009, 32 (01) :1-16
[8]   数据清洗研究综述 [J].
王曰芬 ;
章成志 ;
张蓓蓓 ;
吴婷婷 .
现代图书情报技术, 2007, (12) :50-56