一种可交互的数据清洗系统

被引:7
作者
王咏梅
陈家琪
耿玉良
机构
[1] 上海理工大学计算机工程系,上海理工大学计算机工程系,上海理工大学计算机工程系上海,上海,上海
关键词
数据质量; 数据清洗; 可交互式;
D O I
10.16208/j.issn1000-7024.2005.04.036
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
对于各个领域的信息资源而言,数据质量一直是一个非常关键的问题,而现实世界中的数据往往存在着各种各样的质量问题,从简单的拼写错误到复杂的语义不一致错误。数据清洗的目标就是检测并去除数据中存在的各种错误和不一致,提高数据质量。在归纳总结数据质量问题和数据清洗相关研究的现状的基础上提出一个可交互的数据清洗框架的定义。系统提供了方便、易用的可视化的数据清洗流程定义环境。
引用
收藏
页码:955 / 957
页数:3
相关论文
共 2 条
[1]   数据质量和数据清洗研究综述 [J].
郭志懋 ;
周傲英 .
软件学报, 2002, (11) :2076-2082
[2]   一种检测多语言文本相似重复记录的综合方法 [J].
俞荣华 ;
田增平 ;
周傲英 .
计算机科学, 2002, (01) :118-121