数据发布中面向多敏感属性的隐私保护方法

被引:58
作者
杨晓春
王雅哲
王斌
于戈
机构
[1] 东北大学信息科学与工程学院
[2] 东北大学信息科学与工程学院 沈阳
关键词
数据发布; 数据隐私; 多敏感属性; 有损连接; l-多样性;
D O I
暂无
中图分类号
TP309 [安全保密];
学科分类号
081201 ; 0839 ; 1402 ;
摘要
现有的隐私数据发布技术通常关注单敏感属性数据,直接应用于多敏感属性数据会导致大量隐私信息的泄漏.文中首次对多敏感属性数据发布问题进行详细研究,继承了基于有损连接对隐私数据进行保护的思想,提出了针对多敏感属性隐私数据发布的多维桶分组技术——MSB(Multi-Sensitive Bucketization).为了避免高复杂性的穷举方法,首先提出3种不同的线性时间的贪心算法:最大桶优先算法(MBF)、最大单维容量优先算法(MSDCF)和最大多维容量优先算法(MMDCF).另外,针对实际应用中发布数据的重要性差异,提出加权多维桶分组技术.实际数据集上的大量实验结果表明,所提出的前3种算法的附加信息损失度为0.04,而隐匿率都低于0.06.加权多维桶分组技术对数据拥有者定义的重要信息的可发布性达到70%以上.
引用
收藏
页码:574 / 587
页数:14
相关论文
共 2 条
[1]   支持多约束的K-匿名化方法 [J].
杨晓春 ;
刘向宇 ;
王斌 ;
于戈 .
软件学报, 2006, (05) :1222-1231
[2]  
K-anonymization as spatial in-dexing:Toward scalable and incremental anonymization .2 Lwuchukwu T,Naughton J. Proceedings of the33rd International Conference on Very Large Data Bases . 2007