聚类的(α,k)-匿名数据发布

被引:15
作者
杨高明
杨静
张健沛
机构
[1] 哈尔滨工程大学计算机科学与技术学院
基金
黑龙江省自然科学基金;
关键词
数据发布; k-匿名; l-多样性; 隐私保护; 聚类;
D O I
暂无
中图分类号
TP309.2 [数据安全];
学科分类号
081201 ; 0839 ; 1402 ;
摘要
为更好的抵御背景知识攻击和同质攻击,保护特定的敏感值或全部敏感值,定义了单敏感值(,αk)-匿名模型和多敏感值(,αk)-匿名模型,并分别设计了两个聚类算法予以实现,同时分析了算法的正确性和复杂性.对于即包含连续属性又包含分类属性的数据集,给出了数据集的详细映射与处理方法,使数据集中点的距离可以方便的计算,彻底避免了把数据点距离和信息损失混淆的情况.详细的理论分析和大量的实验评估表明算法有较小的信息损失和较快的执行时间.
引用
收藏
页码:1941 / 1946
页数:6
相关论文
共 6 条
[1]   面向敏感值的个性化隐私保护 [J].
韩建民 ;
于娟 ;
虞慧群 ;
贾泂 .
电子学报, 2010, 38 (07) :1723-1728
[2]   一种基于聚类的数据匿名方法 [J].
王智慧 ;
许俭 ;
汪卫 ;
施伯乐 .
软件学报, 2010, 21 (04) :680-693
[3]   数据表k-匿名化的微聚集算法研究 [J].
韩建民 ;
岑婷婷 ;
虞慧群 .
电子学报, 2008, (10) :2021-2029
[4]   Achieving Anonymity via Clustering [J].
Aggarwal, Gagan ;
Feder, Tomas ;
Kenthapadi, Krishnaram ;
Khuller, Samir ;
Panigrahy, Rina ;
Thomas, Dilys ;
Zhu, An .
ACM TRANSACTIONS ON ALGORITHMS, 2010, 6 (03)
[5]  
( α , k )-anonymous data publishing[J] . Raymond Wong,Jiuyong Li,Ada Fu,Ke Wang.Journal of Intelligent Information Systems . 2009
[6]   Extensions to the k-means algorithm for clustering large data sets with categorical values [J].
Huang, ZX .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304