共 13 条
基于敏感属性熵的微聚集算法
被引:14
作者:
杨静
王超
张健沛
机构:
[1] 哈尔滨工程大学计算机科学与技术学院
来源:
基金:
高等学校博士学科点专项科研基金;
关键词:
隐私保护;
编码层次树;
微聚集;
p-敏感k-匿名;
敏感属性熵;
D O I:
暂无
中图分类号:
TP309 [安全保密];
学科分类号:
081201 ;
0839 ;
1402 ;
摘要:
在聚类过程中,不合适的距离度量会导致匿名过程中不必要的信息损失,因此对于不同类型的属性定义一个适当的距离度量一直是个难以解决的问题.本文提出语义属性的概念,并提出编码层次树来表示语义属性,有效地降低了匿名过程中的信息损失.在p-敏感k-匿名模型中,敏感属性值在聚类结果中分布不均匀会导致敏感信息泄露,因此本文提出一种基于敏感属性熵的微聚集算法,并提出匿名保护指数来描述隐私保护程度,在聚类过程中通过保证匿名保护指数最大,来提高敏感属性在聚类结果中分布的均匀程度,以应对背景知识攻击,降低隐私泄漏的风险.最后,通过实验验证了算法的合理性和有效性.
引用
收藏
页码:1327 / 1337
页数:11
相关论文