基于杂度增益与层次聚类的数据匿名方法

被引:6
作者
熊平 [1 ]
朱天清 [2 ]
机构
[1] 中南财经政法大学信息与安全工程学院
[2] 武汉工业学院计算机与信息工程系
关键词
隐私保护; 数据匿名; 准标识符; 层次聚类; 信息损失;
D O I
暂无
中图分类号
TP309 [安全保密];
学科分类号
081201 ; 0839 ; 1402 ;
摘要
数据匿名是发布数据时对隐私信息进行保护的重要手段之一.对数据匿名的基本概念和应用模型进行了介绍,探讨了数据匿名结果应该满足的要求.为了抵制背景知识攻击,提出了一种基于杂度增益与层次聚类的数据匿名方法,该方法以杂度来度量敏感属性随机性,并以概化过程中信息损失最小、杂度增益最大的条件约束来控制聚类的合并过程,可以使数据匿名处理后的数据集在满足k-匿名模型和l-多样模型的同时,使数据概化的信息损失最小且敏感属性的取值均匀化.在实验部分,提出了一种对数据匿名结果进行评估的方法,该方法将匿名结果和原始数据进行对比,并从平均信息损失和平均杂度2个方面来评估数据匿名的质量.实验结果验证了以上方法的有效性.
引用
收藏
页码:1545 / 1552
页数:8
相关论文
共 2 条
[1]   一种基于聚类的数据匿名方法 [J].
王智慧 ;
许俭 ;
汪卫 ;
施伯乐 .
软件学报, 2010, 21 (04) :680-693
[2]  
Security-control methods for statistical databases: a comparative study[J] . Nabil R. Adam,John C. Worthmann.ACM Computing Surveys (CSUR) . 1989 (4)