CN109948365A - 一种基于交错路径的快速k度匿名化方法 - Google Patents
一种基于交错路径的快速k度匿名化方法 Download PDFInfo
- Publication number
- CN109948365A CN109948365A CN201910228275.3A CN201910228275A CN109948365A CN 109948365 A CN109948365 A CN 109948365A CN 201910228275 A CN201910228275 A CN 201910228275A CN 109948365 A CN109948365 A CN 109948365A
- Authority
- CN
- China
- Prior art keywords
- vertex
- degree
- anonymous
- condition
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000013503 de-identification Methods 0.000 title claims abstract description 12
- 238000013480 data collection Methods 0.000 claims description 5
- 241000182341 Cubitermes group Species 0.000 claims description 3
- 238000010586 diagram Methods 0.000 abstract description 4
- 238000012986 modification Methods 0.000 abstract description 2
- 230000004048 modification Effects 0.000 abstract description 2
- 230000000717 retained effect Effects 0.000 abstract 1
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及计算机图论领域,特指一种基于交错路径的快速k度匿名化方法,其包括以下内容:(1)构建社交网络的简单匿名图;(2)根据指定的k值将满足条件的顶点加入待处理分组;(3)计算分组内顶点所需达到的匿名度数;(4)使用增加边、删除边、交换边等方式使组内顶点的度均等于匿名度数;(5)重复上述(2)‑(4)步骤,形成满足条件的k度匿名图。本发明引入交错路径的概念,通过对边的直接修改使得每个顶点的度均满足图的k度匿名化的要求,避免了后期的度序列可图性判断,计算效率高且计算量小,使得大型社交网络图数据集也可以在较优的时间内取得较优解;能在有效保护社交网络中个体隐私安全的同时,保留数据的可用性。
Description
技术领域
本发明隶属于计算机图论的技术领域,具体指一种基于交错路径的快速k度匿名化方法。
背景技术
在社交网络高速发展的今天,越来越多的社交数据得到有效地利用,充分发挥了大数据时代的数据优势,但同时也引发了隐私泄露问题。如何在充分保护用户个人隐私的前提下有效利用数据成为一个重要的研究方向。基于社交网络建模的图包括两个重要内容:顶点的隐私信息和图的拓扑结构,单纯地剔除顶点信息并不足以有效保护个人隐私,因此有必要对图的拓扑结构进行处理使其满足一定的匿名化要求。Liu和Terzi在标题为Towards identity anonymization on graphs(Proceedings of the 2008 ACM SIGMODinternational conference on management of data,2008:93–106)的文献中引入了图论中的k度匿名化概念,并提出了一种动态规划方法以获得k度匿名图;Lu等人在标题为Fastidentity anonymization on graphs(International Conference on Database andExpert Systems Applications,2012:281–295)的文献中提出了一种快速贪心方法,通过同步操作度序列的匿名化和边的添加来对原始图进行匿名化;Casas-Roma等人在标题为k-Degree anonymity and edge selection:improving data utility in large networks(Knowledge and Information Systems,50(2),2017:447-474)的文献中的引入了基于单变量微聚集的k度匿名方法,用于无向的无标记图,在修改边(包含边的添加、删除、交换)的同时考虑了边的相关性,以减少匿名化过程中相关图拓扑结构信息的损失,从而保证数据的可用性。本方法基于k度匿名方法,在总结前人方法的基础上,做了进一步研究,提出一种基于交错路径的快速k度匿名方法。在基于同步进行度匿名化和边添加的快速k匿名方法的基础上,引入删除、交换策略和交错路径,使得图数据集的可用性在匿名化过程中得到充分保护。具有易实现、干扰小、匹配方便等特点。在一些评价指标和图数据集上具有一定的优势,能够有效地保护个体的隐私。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出一种基于交错路径的快速k度图匿名化方法,交错路径指在交换边的过程中若找不到满足条件的边,则选取合适的点以边增减交替的方式交换边。
一种基于交错路径的快速k度匿名化方法,包括如下步骤:
(1)构建待发布社交网络的简单匿名图G;
(2)根据指定的k值将满足条件的顶点加入待处理分组;
(3)计算分组内顶点所需达到的匿名度数;
(4)使用增加边、删除边、交换边等方式使组内顶点的度均等于匿名度数;
(5)重复上述(2)-(4),形成满足条件的k度匿名图。
所述的步骤(1)中,对于待发布的社交网络数据集,可以建模为一个无向图G0,其中的每个顶点表示一个个体,任意两点间的连线表示两个个体之间存在一定的关系,顶点的属性信息代表个体的属性。删除各顶点的身份信息,删除自环和重边,得到简单匿名图G(V,E),V表示点集合,E表示边集合,v表示按度非递增排列的顶点序列,di表示v中第i个顶点vi的度数,(vi,vj)表示点vi,vj之间的边,n=|E|,i=0;
所述的步骤(2)中,首先从序列v中取出第i个顶点vi,进行如下检查:
a.在v中从前往后依序搜索第一个满足dj<di的顶点vj,若找到,执行步骤b;否则,na←n-i,执行步骤(3);
b.如果di=di-1(若i=0,则比较di与dn-1),执行步骤c;否则,执行步骤d;
c.如果n-j<k,则na←n-i;否则na←j-i;执行步骤(3);
d.如果n-i<2k或n-j<k,则na←n-i;否则na←max(k,j-i);执行步骤(3)。
所述的步骤(3)中,计算v中从第i到第(i+na-1)个顶点的平均度数,向上取整或者向下取整(取其中方差较小的)作为该组的匿名度数da;
所述的步骤(4)中,使用增加边、删除边、交换边等方式使分组内顶点的度数等于该组的匿名度数da,依次进行以下步骤(以下的vi,vj,vk,vl,vm表示互不相同的顶点):
a.如果组内顶点要减少的总度数大于要增加的总度数,重复执行以下步骤,直至以上条件不满足或找不到满足条件的顶点:搜索组内所有满足的顶点组合vi,vj,分别搜索vi和vj各自的邻居顶点vk和vl,找出满足的所有组合,选取所构成的各个组合(vi,vj,vk,vl)中组内邻域中心性最小的,删除(vi,vk)与(vj,vl),添加(vk,vl),di←di-1,dj←dj-1;
b.如果组内顶点要减少的总度数小于要增加的总度数,重复执行以下步骤,直至以上条件不满足或找不到满足条件的顶点:搜索组内所有满足的组合vi,vj,选取邻域中心性最小的组合,添加(vi,vj),di←di+1,dj←dj+1;
c.若组内顶点度数仍不等于该组的匿名度数,重复执行以下步骤,直至找不到满足条件的顶点:选取组内任一满足di>da,dj<da的两点vi,vj,①搜索所有满足的vi的邻居顶点vk,选取邻域中心性最小的组合(vi,vj,vk),删除(vi,vk),添加(vj,vk);②若找不到满足条件的邻居顶点vk,则引入交错路径进行处理,即寻找一个离vj的距离大于2且满足的顶点vl,且vl可以找到一个邻居顶点vm满足删除(vi,vk)及(vl,vm),添加(vk,vl),(vj,vm),di←di-1,dj←dj+1。
d.若经过以上步骤交替处理匿名组内仍有顶点不等于匿名度数da,可适当放宽条件,从图中未匿名的顶点内选取一个顶点与组内的一个顶点组队进行处理。如仍不满足,i←0,重新进行匿名化,执行步骤(2)。
所述的步骤(5)中,经过步骤(4),该组内顶点度数均满足条件,i←i+na,重复上述(2)-(4),直至i=n,此时所有顶点均已处理完毕,图的度序列中的任一元素在该序列中至少出现k次,得到满足条件的k度匿名图。
本发明具有以下有益的效果:
(1)本发明提出的方法吸收了已有方法的优点,避免了后期的度序列可图性判断。
(2)在图的匿名化过程中引入了交错路径的概念,使得大部分的匿名组在组内即可完成匿名化操作,无需影响非组内顶点的度数。
(3)方法便于实现,能在较优的时间内运行完毕并得到较优解。
附图说明
图1是本发明实施例的整体流程图;
图2是本发明实施例的基本操作示意图。
具体实施方式
为了更具体地描述本发明,下面结合具体实施方式及附图对本发明作进一步详细说明。
如图1和图2所示,一种基于交错路径的快速k度匿名化方法,包括如下步骤:
(1)构建待发布社交网络的简单匿名图G;
对于待发布的社交网络数据集,可以建模为一个无向图G0,其中的每个顶点表示一个个体,任意两点间的连线表示两个个体之间存在一定的关系,顶点的属性信息代表个体的属性。删除各顶点的身份信息,删除自环和重边,得到简单匿名图G(V,E),V表示点集合,E表示边集合,v表示按度非递增排列的顶点序列,di表示v中第i个顶点vi的度数,(vi,vj)表示点vi,vj之间的边,n=|E|,i=0;
(2)根据指定的k值将满足条件的顶点加入待处理分组;
首先从序列v中取出第i个顶点vi,进行如下检查:
a.在v中从前往后依序搜索第一个满足dj<di的顶点vj,若找到,执行步骤b;否则,na←n-i,执行步骤(3);
b.如果di=di-1(若i=0,则比较di与dn-1),执行步骤c;否则,执行步骤d;
c.如果n-j<k,则na←n-i;否则na←j-i;执行步骤(3);
d.如果n-i<2k或n-j<k,则na←n-i;否则na←max(k,j-i);执行步骤(3)。
(3)计算分组内顶点所需达到的匿名度数;
计算v中从第i到第(i+na-1)个顶点的平均度数,向上取整或者向下取整(取其中方差较小的)作为该组的匿名度数da;
(4)使用增加边、删除边、交换边等方式使组内顶点的度均等于匿名度数;
使用增加边、删除边、交换边等方式使分组内顶点的度数等于该组的匿名度数da,依次进行以下步骤(以下的vi,vj,vk,vl,vm表示互不相同的顶点):
a.如果组内顶点要减少的总度数大于要增加的总度数,重复执行以下步骤,直至以上条件不满足或找不到满足条件的顶点:搜索组内所有满足的顶点组合vi,vj,分别搜索vi和vj各自的邻居顶点vk和vl,找出满足的所有组合,选取所构成的各个组合(vi,vj,vk,vl)中组内邻域中心性最小的,删除(vi,vk)与(vj,vl),添加(vk,vl),di←di-1,dj←dj-1;
b.如果组内顶点要减少的总度数小于要增加的总度数,重复执行以下步骤,直至以上条件不满足或找不到满足条件的顶点:搜索组内所有满足的组合vi,vj,选取邻域中心性最小的组合,添加(vi,vj),di←di+1,dj←dj+1;
c.若组内顶点度数仍不等于该组的匿名度数,重复执行以下步骤,直至找不到满足条件的顶点:选取组内任一满足di>da,dj<da的两点vi,vj,①搜索所有满足的vi的邻居顶点vk,选取邻域中心性最小的组合(vi,vj,vk),删除(vi,vk),添加(vj,vk);②若找不到满足条件的邻居顶点vk,则引入交错路径进行处理,即寻找一个离vj的距离大于2且满足的顶点vl,且vl可以找到一个邻居顶点vm满足删除(vi,vk)及(vl,vm),添加(vk,vl),(vj,vm),di←di-1,dj←dj+1。
d.若经过以上步骤交替处理匿名组内仍有顶点不等于匿名度数da,可适当放宽条件,从图中未匿名的顶点内选取一个顶点与组内的一个顶点组队进行处理。如仍不满足,i←0,重新进行匿名化,执行步骤(2)。
(5)重复上述(2)-(4),形成满足条件的k度匿名图。
经过步骤(4),该组内顶点度数均满足条件,i←i+na,重复上述(2)-(4),直至i=n,此时所有顶点均已处理完毕,图的度序列中的任一元素在该序列中至少出现k次,得到满足条件的k度匿名图。
以上对本发明实施例所提供的技术方案进行了详细介绍,本文中应用了具体个例对本发明实施例的原理以及实施方式进行了阐述,以上实施例的说明只适用于帮助理解本发明实施例的原理;同时,对于本领域的一般技术人员,依据本发明实施例,在具体实施方式以及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (6)
1.一种基于交错路径的快速k度匿名化方法,其特征在于,包括如下步骤:
(1)构建待发布社交网络的简单匿名图G;
(2)根据指定的k值将满足条件的顶点加入待处理分组;
(3)计算分组内顶点所需达到的匿名度数;
(4)使用增加边、删除边、交换边等方式使组内顶点的度均等于匿名度数;
(5)重复上述(2)-(4)步骤,形成满足条件的k度匿名图。
2.根据权利要求1所述的一种基于交错路径的快速k度匿名化方法,其特征在于:所述步骤(1)中,对于待发布的社交网络数据集,可以建模为一个无向图G0,其中的每个顶点表示一个个体,任意两点间的连线表示两个个体之间存在一定的关系,顶点的属性信息代表个体的属性;删除各顶点的身份信息,删除自环和重边,得到简单匿名图G(V,E),V表示点集合,E表示边集合,v表示按度非递增排列的顶点序列,di表示v中第i个顶点vi的度数,(vi,vj)表示点vi,vj之间的边,n=|E|,i=0。
3.根据权利要求1所述的一种基于交错路径的快速k度匿名化方法,其特征在于:所述步骤(2)中,首先从序列v中取出第i个顶点vi,进行如下检查:
a.在v中从前往后依序搜索第一个满足dj<di的顶点vj,若找到,执行步骤b;否则,na←n-i,执行步骤(3);
b.如果di=di-1(若i=0,则比较di与dn-1),执行步骤c;否则,执行步骤d;
c.如果n-j<k,则na←n-i;否则na←j-i;执行步骤(3);
d.如果n-i<2k或n-j<k,则na←n-i;否则na←max(k,j-i);执行步骤(3)。
4.根据权利要求1所述的一种基于交错路径的快速k度匿名化方法,其特征在于:所述步骤(3)中,计算v中从第i到第(i+na-1)个顶点的平均度数,向上取整或者向下取整(取其中方差较小的)作为该组的匿名度数da。
5.根据权利要求1所述的一种基于交错路径的快速k度匿名化方法,其特征在于:所述步骤(4)中,使用增加边、删除边、交换边等方式使分组内顶点的度数等于该组的匿名度数da,依次进行以下步骤(以下陈述的vi,vj,vk,vl,vm表示互不相同的顶点):
a.如果组内顶点要减少的总度数大于要增加的总度数,重复执行以下步骤,直至以上条件不满足或找不到满足条件的顶点:搜索组内所有满足di>da,dj>da,的顶点组合vi,vj,分别搜索vi和vj各自的邻居顶点vk和vl,找出满足的所有组合,选取所构成的各个组合(vi,vj,vk,vl)中组内邻域中心性最小的,删除(vi,vk)与(vj,vl),添加(vk,vl),di←di-1,dj←dj-1;
b.如果组内顶点要减少的总度数小于要增加的总度数,重复执行以下步骤,直至以上条件不满足或找不到满足条件的顶点:搜索组内所有满足di<da,dj<da,的组合vi,vj,选取邻域中心性最小的组合,添加(vi,vj),di←di+1,dj←dj+1;
c.若组内顶点度数仍不等于该组的匿名度数,重复执行以下步骤,直至找不到满足条件的顶点:选取组内任一满足di>da,dj<da的两点vi,vj,①搜索所有满足的vi的邻居顶点vk,选取邻域中心性最小的组合(vi,vj,vk),删除(vi,vk),添加(vj,vk);②若找不到满足条件的邻居顶点vk,则引入交错路径进行处理,即寻找一个离vj的距离大于2且满足的顶点vl,且vl可以找到一个邻居顶点vm满足删除(vi,vk)及(vl,vm),添加(vk,vl),(vj,vm),di←di-1,dj←dj+1;
d.若经过以上步骤交替处理匿名组内仍有顶点不等于匿名度数da,可适当放宽条件,从图中未匿名的顶点内选取一个顶点与组内的一个顶点组队进行处理。如仍不满足,i←0,重新进行匿名化,执行步骤(2)。
6.根据权利要求1所述的一种基于交错路径的快速k度匿名化方法,其特征在于:所述步骤(5)中,经过步骤(4),该组内顶点度数均满足条件,i←i+na,重复上述(2)-(4),直至i=n,此时所有顶点均已处理完毕,得到满足条件的k度匿名图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910228275.3A CN109948365A (zh) | 2019-03-25 | 2019-03-25 | 一种基于交错路径的快速k度匿名化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910228275.3A CN109948365A (zh) | 2019-03-25 | 2019-03-25 | 一种基于交错路径的快速k度匿名化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109948365A true CN109948365A (zh) | 2019-06-28 |
Family
ID=67010847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910228275.3A Pending CN109948365A (zh) | 2019-03-25 | 2019-03-25 | 一种基于交错路径的快速k度匿名化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109948365A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378150A (zh) * | 2019-09-11 | 2019-10-25 | 南京邮电大学 | 一种基于度序列最佳分组进行图结构修改的网络匿名方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218397A (zh) * | 2013-03-12 | 2013-07-24 | 浙江大学 | 一种基于无向图修改的社交网络隐私保护方法 |
CN103279713A (zh) * | 2013-06-08 | 2013-09-04 | 广西师范大学 | 一种优化的社交网络图数据发布隐私保护方法 |
CN106203172A (zh) * | 2016-07-25 | 2016-12-07 | 浙江工业大学 | 网络最短路径上的加权敏感边隐私保护方法 |
CN106778352A (zh) * | 2017-01-13 | 2017-05-31 | 广西师范大学 | 集值数据和社会网络数据联合发布的多源隐私保护方法 |
CN107729767A (zh) * | 2017-10-26 | 2018-02-23 | 广西师范大学 | 基于图基元的社会网络数据隐私保护方法 |
CN108696418A (zh) * | 2017-04-06 | 2018-10-23 | 腾讯科技(深圳)有限公司 | 一种社交网络中隐私保护方法及装置 |
-
2019
- 2019-03-25 CN CN201910228275.3A patent/CN109948365A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103218397A (zh) * | 2013-03-12 | 2013-07-24 | 浙江大学 | 一种基于无向图修改的社交网络隐私保护方法 |
CN103279713A (zh) * | 2013-06-08 | 2013-09-04 | 广西师范大学 | 一种优化的社交网络图数据发布隐私保护方法 |
CN106203172A (zh) * | 2016-07-25 | 2016-12-07 | 浙江工业大学 | 网络最短路径上的加权敏感边隐私保护方法 |
CN106778352A (zh) * | 2017-01-13 | 2017-05-31 | 广西师范大学 | 集值数据和社会网络数据联合发布的多源隐私保护方法 |
CN108696418A (zh) * | 2017-04-06 | 2018-10-23 | 腾讯科技(深圳)有限公司 | 一种社交网络中隐私保护方法及装置 |
CN107729767A (zh) * | 2017-10-26 | 2018-02-23 | 广西师范大学 | 基于图基元的社会网络数据隐私保护方法 |
Non-Patent Citations (2)
Title |
---|
兰丽辉等: "社会网络发布中敏感边的隐私保护", 《吉林大学学报(信息科学版)》 * |
兰丽辉等: "社会网络发布中敏感边的隐私保护", 《吉林大学学报(信息科学版)》, no. 04, 15 July 2011 (2011-07-15), pages 324 - 331 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378150A (zh) * | 2019-09-11 | 2019-10-25 | 南京邮电大学 | 一种基于度序列最佳分组进行图结构修改的网络匿名方法 |
WO2021046950A1 (zh) * | 2019-09-11 | 2021-03-18 | 南京邮电大学 | 一种基于度序列最佳分组进行图结构修改的网络匿名方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Atallah et al. | Computing all skyline probabilities for uncertain data | |
Gupta et al. | Top-k interesting subgraph discovery in information networks | |
Tai et al. | Privacy-preserving social network publication against friendship attacks | |
CN106021541B (zh) | 区分准标识符属性的二次k‑匿名隐私保护算法 | |
CN109117669B (zh) | MapReduce相似连接查询的隐私保护方法及系统 | |
WO2022151654A1 (zh) | 一种基于随机贪心算法的横向联邦梯度提升树优化方法 | |
CN104317904B (zh) | 一种带权重社会网络的泛化方法 | |
Madan et al. | k-DDD measure and mapreduce based anonymity model for secured privacy-preserving big data publishing | |
Xu et al. | Efficient high utility negative sequential patterns mining in smart campus | |
Yin et al. | An industrial dynamic skyline based similarity joins for multidimensional big data applications | |
Liu et al. | Strong social graph based trust-oriented graph pattern matching with multiple constraints | |
CN105825147A (zh) | 基于云服务的社交网络相似分组匿名方法 | |
CN109948365A (zh) | 一种基于交错路径的快速k度匿名化方法 | |
Goyal et al. | Lossy conservative update (LCU) sketch: Succinct approximate count storage | |
CN103761298B (zh) | 一种基于分布式架构的实体匹配方法 | |
CN115438227A (zh) | 一种基于差分隐私和紧密度中心性的网络数据发布方法 | |
CN107832633B (zh) | 关系事务数据发布的隐私保护方法 | |
Guo et al. | Parallelizing the extraction of fresh information from online social networks | |
He et al. | An efficient ciphertext retrieval scheme based on homomorphic encryption for multiple data owners in hybrid cloud | |
Likhyani et al. | Label constrained shortest path estimation | |
JP2007073063A (ja) | 空間インデックス方法 | |
Bai et al. | Generalized and Multiple‐Queries‐Oriented Privacy Budget Strategies in Differential Privacy via Convergent Series | |
Yang et al. | Anti-data mining on group privacy information | |
Abul-Basher et al. | TGDB: towards a benchmark for graph databases | |
CN111767567A (zh) | 社交信息安全管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20240227 |
|
AD01 | Patent right deemed abandoned |