基于敏感属性熵的微聚集算法

被引:14
作者
杨静
王超
张健沛
机构
[1] 哈尔滨工程大学计算机科学与技术学院
基金
高等学校博士学科点专项科研基金;
关键词
隐私保护; 编码层次树; 微聚集; p-敏感k-匿名; 敏感属性熵;
D O I
暂无
中图分类号
TP309 [安全保密];
学科分类号
081201 ; 0839 ; 1402 ;
摘要
在聚类过程中,不合适的距离度量会导致匿名过程中不必要的信息损失,因此对于不同类型的属性定义一个适当的距离度量一直是个难以解决的问题.本文提出语义属性的概念,并提出编码层次树来表示语义属性,有效地降低了匿名过程中的信息损失.在p-敏感k-匿名模型中,敏感属性值在聚类结果中分布不均匀会导致敏感信息泄露,因此本文提出一种基于敏感属性熵的微聚集算法,并提出匿名保护指数来描述隐私保护程度,在聚类过程中通过保证匿名保护指数最大,来提高敏感属性在聚类结果中分布的均匀程度,以应对背景知识攻击,降低隐私泄漏的风险.最后,通过实验验证了算法的合理性和有效性.
引用
收藏
页码:1327 / 1337
页数:11
相关论文
共 13 条
[1]   一种基于最小选择度优先的多敏感属性个性化l-多样性算法 [J].
杨静 ;
王波 .
计算机研究与发展, 2012, 49 (12) :2603-2610
[2]   基于杂度增益与层次聚类的数据匿名方法 [J].
熊平 ;
朱天清 .
计算机研究与发展, 2012, 49 (07) :1545-1552
[3]   一种基于逆聚类的个性化隐私匿名方法 [J].
王波 ;
杨静 .
电子学报, 2012, 40 (05) :883-890
[4]   半监督聚类的匿名数据发布 [J].
杨高明 ;
杨静 ;
张健沛 .
哈尔滨工程大学学报, 2011, 32 (11) :1489-1494
[5]   面向数值型敏感属性的分级l-多样性模型 [J].
韩建民 ;
于娟 ;
虞慧群 ;
贾泂 .
计算机研究与发展, 2011, 48 (01) :147-158
[6]   面向查询服务的数据隐私保护算法 [J].
朱青 ;
赵桐 ;
王珊 .
计算机学报, 2010, 33 (08) :1315-1323
[7]   面向敏感值的个性化隐私保护 [J].
韩建民 ;
于娟 ;
虞慧群 ;
贾泂 .
电子学报, 2010, 38 (07) :1723-1728
[8]   一种基于聚类的数据匿名方法 [J].
王智慧 ;
许俭 ;
汪卫 ;
施伯乐 .
软件学报, 2010, 21 (04) :680-693
[9]   面向数据库应用的隐私保护研究综述 [J].
周水庚 ;
李丰 ;
陶宇飞 ;
肖小奎 .
计算机学报, 2009, 32 (05) :847-861
[10]   数据表k-匿名化的微聚集算法研究 [J].
韩建民 ;
岑婷婷 ;
虞慧群 .
电子学报, 2008, (10) :2021-2029