CN114218602B - 一种基于垂直分割的差分隐私异构多属性数据发布方法 - Google Patents
一种基于垂直分割的差分隐私异构多属性数据发布方法 Download PDFInfo
- Publication number
- CN114218602B CN114218602B CN202111508267.8A CN202111508267A CN114218602B CN 114218602 B CN114218602 B CN 114218602B CN 202111508267 A CN202111508267 A CN 202111508267A CN 114218602 B CN114218602 B CN 114218602B
- Authority
- CN
- China
- Prior art keywords
- hidden
- attribute
- data
- privacy
- hidden tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 230000011218 segmentation Effects 0.000 title claims abstract description 11
- 238000009826 distribution Methods 0.000 claims abstract description 50
- 230000035945 sensitivity Effects 0.000 claims abstract description 19
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 238000005070 sampling Methods 0.000 claims abstract description 4
- 230000008569 process Effects 0.000 claims description 14
- 230000007246 mechanism Effects 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 4
- 230000002457 bidirectional effect Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于垂直分割的差分隐私异构多属性数据发布方法,数据拥有者Pi根据局部数据集Di的数据敏感性和隐私属性暴露概率计算隐私预算εi;数据拥有者Pi利用隐树模型学习算法构建隐树结构,使构建的Τi满足εi1‑差分隐私,同时基于Τi计算的Θi满足εi2‑差分隐私;Pi将Τi和Θi发送给第三方,第三方通过隐树模型学习算法构建整合数据集的隐树结构Τ,同时更新参数Θ;根据隐树结构Τ和加噪Θ,采样每个属性的条件分布,生成扰动数据集D',并对外发布。本发明能以较低的通信和计算成本提供理想的数据效用。
Description
技术领域
本发明属于计算机软件领域,具体涉及一种基于垂直分割的差分隐私异构多属性数据发布方法。
背景技术
网络信息技术的快速发展,推动了互联网应用的逐步普及,在提供便利的同时,大量数据信息通过个人用户、企业单位、研究机构等源源不断地产生,并被各种智能设备收集。通过对这些收集到的数据进行分析和处理,可以进一步挖掘其潜在的价值,创造巨大的社会效益。在现实生活中,大量的数据往往收集于不同的智能设备,即同一个体的不同属性集数据被收集于不同组织或机构,从而单个个体的数据被多方以垂直方式分割。多方协作发布整合数据集,可以使数据使用者更充分地挖掘不同数据潜在的关联,为制定决策提供更好的支持。例如,某地区的医院和银行拥有同一组市民的医疗数据R1和金融数据R2,其中R1记录市民的医疗信息,R2记录市民的金融信息。毫无疑问,整合市民的医疗数据和金融数据,对用户医疗水平和经济水平进行关联性分析,可以帮助政府部门制定更好的卫生政策。然而,由于每一方持有的数据中通常蕴含大量的个人敏感信息(例如,医疗数据中的患者医疗记录、金融数据中的市民工资记录等),简单地整合多方数据并直接对外发布会导致严重的个人隐私泄露。因此,基于垂直分割的整体数据发布需要保证各方的隐私数据不被泄露。
在K-匿名模型下,已经有许多关于垂直分割数据发布的研究。但已有的研究采用的K-匿名模型或其扩展容易受到属性连接、背景知识等多种隐私攻击,而且无法提供很好的隐私保护效果。与K-匿名等传统隐私保护模型不同,差分隐私可以为数据发布隐私保护提供理论分析,同时可以抵御背景知识、属性连接等攻击。在尝试正式定义数据发布的隐私需求后,差分隐私已经成为最广泛接受的数据发布隐私保护模型。
从已有的研究可以看出,差分隐私在单方数据发布方面做了诸多努力,但关于垂直分割的多方数据发布的研究还相对较少。DistDiffGen方法是最早使用差分隐私技术来解决垂直分割数据发布隐私保护问题。然而,DistDiffGen是为分类任务量身定制的,且仅适用于两方发布场景,不具备可扩展性。DPLT方案的提出是为了发布满足差分隐私保护的垂直分割数据,在DPLT中,多个数据拥有者和第三方在差分隐私保护下共同构建一棵隐树,利用隐树模型近似生成发布数据集。
上述方法对于分布式设置的处理均是固定隐私预算分配,即对所有数据拥有者提供相同级别的隐私保护,这显然是不合理的。当多个数据拥有者联合发布数据时,出于各自的隐私风险控制考虑,各方的隐私需求肯定是不完全相同的,相同强度的隐私保护会导致要么没有充分保护高敏感的数据拥有方,要么低敏感数据拥有方的数据信息的过度丢失。
发明内容
发明目的:本发明提供一种基于垂直分割的差分隐私异构多属性数据发布方法,降低了属性联合分布中注入的噪声量,保证了每个本地数据集的数据隐私。
技术方案:本发明所述的一种基于垂直分割的差分隐私异构多属性数据发布方法,包括以下步骤:
(1)自适应隐私预算分配:数据拥有者Pi根据局部数据集Di的数据敏感性和隐私属性暴露概率计算隐私预算εi;
(2)提出隐树模型参数和结构学习相统一的满足差分隐私的隐树模型学习:数据拥有者Pi利用隐树模型学习算法构建隐树结构,使构建的Τi满足εi1-差分隐私,同时基于Τi计算的Θi满足εi2-差分隐私;Pi将Τi和Θi发送给第三方,第三方通过隐树模型学习算法构建整合数据集的隐树结构Τ,同时更新参数Θ;
(3)合成数据发布:根据隐树结构Τ和加噪Θ,采样每个属性的条件分布,生成扰动数据集D',并对外发布。
进一步地,所述步骤(1)实现过程如下:
自适应隐私预算分配参数由数据敏感性SD和隐私属性暴露概率Lpb两部分组成;
其中,Senattr表示敏感属性,Senval表示敏感属性的值,η和σ分别为数据敏感度和隐私泄露概率的权重,η+σ=1,权重的分配由数据拥有者根据具体数据隐私保护要求确定,对不同的隐私保护需求可以调节数据敏感度和隐私泄露概率的权重来进行自适应隐私预算分配,实现不同的隐私保护强度。
进一步地,步骤(2)所述的隐树模型参数学习实现过程如下:
基于双向推理算法计算隐属性Y的联合条件分布,当Yj的孩子节点不是显属性时,βj的计算需要从叶节点开始向上传递,计算每个隐属性节点Yj∈Y的βj,具体公式如下:
其中,{Yc}是Yj的孩子节点集合;
从根节点开始自上而下推理,计算每个隐属性节点Yj∈Y的αj:
其中,{Ys:YP(s)=YP(j),Ys≠Yj}是Yj的兄弟节点集合;
对于任意隐属性节点Yj∈Y,计算边缘条件分布Pr(Yj,YP(i)|X(n)):
其中,{Ys:YP(s)=YP(j),Ys≠Yj}是Yj的兄弟节点集合;
当Yj的孩子节点为显属性或者Yj为根节点Yr时,βj和αj计算为βj=Pr(Xin(j)|Yj),αj=Pr(Yj|Xout(j)),可以得到条件分布
进一步地,步骤(2)所述的隐树模型结构学习实现过程如下:
首先初始化隐树结构,隐属性集合/>,初始化模型参数/>,将未加入Τi的显属性Xj∈X\Τ和隐属性集合Y加入候选集合Ω,使用指数机制从候选集合Ω中选取使模型参数Θi的对数似然增量最大的属性对(Aj1,Aj2)加入隐树结构Τi,若有生成隐属性,同时将隐属性加入集合Y;基于更新的隐树结构Τi,计算联合条件分布,更新隐树参数Θi;重复执行上述隐树结构Τi和隐树参数Θi的更新操作,直到将初始的平凡树森林合并为一棵隐树。
进一步地,所述步骤(3)实现过程如下:
数据拥有者Pi根据自适应隐私预算分配参数Ai计算隐私预算大小εi=Ai×ε,并保证隐树参数学习的计算过程满足εi-差分隐私保护要求;在本地学习得到隐树结构之后,数据拥有者将隐树结构Τi和参数Θi发送给第三方;第三方根据接收到隐树森林,学习新的隐树结构Τ,同时更新隐树参数Θ;利用学习到的隐树的结构Τ和参数Θ,第三方可以估算原始整合数据的联合分布;根据该联合分布,第三方生成一组新的整合数据;
为了保证Θi的隐私性,为每个属性在给定其父节点的条件下的概率分布添加拉普拉斯噪声Lap((2(d+m))/(|Di|ε2)),其中概率分布的全局敏感度△f=2/|Di|。
有益效果:与现有技术相比,本发明的有益效果:单方整体数据通过自适应隐私保护强度机制,实现隐私预算的自适应分配,在增加数据效用的情况下满足不同隐私需求的差分隐私保护;本发明提出的隐树模型参数和结构学习相统一的满足差分隐私的启发式学习算法,通过将模型结构和参数学习目标统一为最大化模型参数的对数条件似然增益,该算法能进一步提高隐树模型学习效率;本发明提出的自适应隐私保护强度机制、启发式隐私模型学习等技术提高了隐树学习效率,降低了属性联合分布中注入的噪声量,保证了每个本地数据集的数据隐私。
附图说明
图1为本发明的流程图;
图2是双向推理算法示例图。
具体实施方式
下面结合附图对本发明做进一步详细说明。
本发明提出一种基于垂直分割的差分隐私异构多属性数据发布方法,如图1所示,具体包括以下步骤:
步骤1:自适应隐私预算分配:数据拥有者Pi根据局部数据集Di的数据敏感性和隐私属性暴露概率计算隐私预算εi。
数据敏感性代表数据的敏感程度,数据越敏感意味着原始数据隐私程度越高,潜在隐私泄露风险越大,即数据隐私风险随着数据敏感性的增高而增加。为了方便自适应分配参数的计算,规定SD的取值范围为0≤SD≤1。SD的大小与隐私保护强度成正比,即SD的值越大,需要的隐私保护程度越高,相应分配的隐私预算越小。
隐私属性暴露概率(Lpb)表示敏感属性中包含敏感属性值的概率,计算公式为:
其中,Senattr表示敏感属性,Senval表示敏感属性的值,Lpb的大小与隐私暴露概率成正比,即Lpb的值越小,攻击者根据其背景知识推断出受害者敏感属性值的概率越小,需要的隐私保护程度也就越低,相应分配的隐私预算也就越大,反之亦然。
利用数据敏感性和隐私属性暴露露概率计算自适应隐私预算参数:
步骤2:隐树模型学习:数据拥有者Pi利用隐树模型学习算法构建隐树结构,使构建的Τi满足εi1-差分隐私,同时基于Τi计算的Θi满足εi2-差分隐私。Pi将Τi和Θi发送给第三方,第三方通过隐树模型学习算法构建整合数据集的隐树结构Τ,同时更新参数Θ。
隐树模型学习是满足差分隐私的启发式学习算法,统一隐树模型参数学习和结构学习的目标,通过最大化模型参数的对数似然增益迭代更新隐树结构。隐树模型学习分为本地隐树构建和整体隐树构建两部分。具体来说,数据拥有者根据满足差分隐私的启发式隐树学习算法学习本地数据集的隐树模型,同时以动态隐私预算分配的方式对隐树参数添加拉普拉斯噪声扰动,并将隐树结构Τi和参数Θi发送到第三方。第三方根据收到的隐树森林,利用启发式隐树学习算法学习新的隐树结构Τ,并同步计算噪声隐树参数Θ。
满足差分隐私的启发式隐树学习算法具体描述如下:给定数据集D={X(1),…,X(n)},通过最大化似然估计Γ学习隐树参数和隐树结构,其中利用指数机制从候选节点中选择使Γ最大的加入隐树结构Τ,同时更新隐树参数Θ。隐树参数更新和结构更新交替进行,直到Γ停止增加。
(1)隐树参数学习:
在隐树参数学习过程中,假设隐树结构是给定的。借助EM算法,利用联合条件分布q(n)最大化期望对数似然以更新模型参数Θ:
q(n)=Pr(Y1,…,Ym|X(n)). (1)
其中,Y1,…,Ym为隐属性,V={X,Y}={V1,…,Vd+m}为隐树节点集合,X={X1,…,Xd}为显属性集合,Y={Y1,…,Ym}为隐属性集合,X(n)为多属性数据集D={X(1),…,X(N)}中的数据。
q(n)可以通过成对的边缘条件分布Pr(Yj,YP(i)|X(n))计算,其中P(j)表示节点Yj的父节点。对于根节点Yr和叶子节点Xi,相应的边缘条件分布表示为Pr(Yr|X(n))和Pr(YP(i)|X(n))。条件分布的计算利用双向推理算法实现,即自上而下和自下而上推理。
对于每个隐属性节点Yj∈Y,该推理算法定义内部显属性集Xin(j)={Xi:Xi∈S isdescendant of Yj},外部显属性集Xout(j)={Xi:Xi∈S is not descendant of Yj},其中S为是显属性集X的任意子集。
如图2所示,基于双向推理算法计算隐属性Y的联合条件分布,当Yj的孩子节点不是显属性时,βj的计算需要从叶节点开始向上传递,计算每个隐属性节点Yj∈Y的βj,具体公式如下:
其中,{Yc}是Yj的孩子节点集合。
从根节点开始自上而下推理,计算每个隐属性节点Yj∈Y的αj:
其中,{Ys:YP(s)=YP(j),Ys≠Yj}是Yj的兄弟节点集合。
对于任意隐属性节点Yj∈Y,计算边缘条件分布Pr(Yj,YP(i)|X(n)):
其中,{Ys:YP(s)=YP(j),Ys≠Yj}是Yj的兄弟节点集合。
当Yj的孩子节点为显属性或者Yj为根节点Yr时,βj和αj计算为βj=Pr(Xin(j)|Yj),αj=Pr(Yj|Xout(j)),可以得到条件分布
(2)隐树结构学习:
隐树结构学习自平凡树的初始森林开始,迭代更新隐树结构,其中所有的显属性Xi∈X均独立。在初始的森林中,X的联合对数似然等于指定隐树的对数似然之和。结构学习中涉及两种图形编辑操作:1)在两个现有节点之间添加边;2)根据现有节点产生新的父节点。与操作1)相比,操作2)对模型复杂性的影响更大,会更大程度地增加模型复杂性。因此,在迭代更新树结构的过程中,优先评估操作1)。
本地隐树模型学习自平凡树的初始森林开始,首先初始化隐树结构隐属性集合/>,初始化模型参数/>。将未加入Τi的显属性Xj∈X\Τ和隐属性集合Y加入候选集合Ω,使用指数机制从候选集合Ω中选取使模型参数Θi的对数似然增量最大的属性对(Aj1,Aj2)加入隐树结构Τi,若有生成隐属性,同时将隐属性加入集合Y。基于更新的隐树结构Τi,计算联合条件分布,更新隐树参数Θi。重复执行上述隐树结构Τi和隐树参数Θi的更新操作,直到将初始的平凡树森林合并为一棵隐树。
隐树结构迭代更新的过程就是将包含d棵平凡树的原始森林通过图形编辑操作生成一棵隐树Τ。在对隐树结构进行图形编辑时,需要满足两个正则化约束条件:1)保持树形结构;2)对于新添加节点Yj'的所有兄弟节点{Ys'},条件概率Pr(Xin(s)|Xout(s))的差值必须大于设定的阈值,避免树结构的不健康修改。
指数机制通过计算(Aj1,Aj2)对模型参数Θ的增益,决定其加入Τ的概率。在给定父节点的条件下计算概率分布的全局敏感度△u=2/|Di|,一共需要执行d-1次,因此被选择的概率为:
步骤3:合成数据发布:根据隐树结构Τ和加噪Θ,采样每个属性的条件分布,生成扰动数据集D',并对外发布。
数据拥有者Pi根据自适应隐私预算分配参数Ai计算隐私预算大小εi=Ai×ε,并保证隐树参数学习的计算过程满足εi-差分隐私保护要求。在本地学习得到隐树结构之后,数据拥有者将隐树结构Τi和参数Θi发送给第三方。第三方根据接收到隐树森林,学习新的隐树结构Τ,同时更新隐树参数Θ。利用学习到的隐树的结构Τ和参数Θ,第三方可以估算原始整合数据的联合分布。根据该联合分布,第三方生成一组新的整合数据。
为了保证Θi的隐私性,为每个属性在给定其父节点的条件下的概率分布添加拉普拉斯噪声Lap((2(d+m))/(|Di|·ε2))。考虑到不同属性携带的信息量不同,从而对攻击者推理目标对象隐私信息的贡献不同,本文借助属性归一化风险熵OE,以动态隐私预算分配方式实现噪声扰动。
借助公式(7),以属性风险熵为权重分配隐私预算,实现属性异构保护。其中概率分布的全局敏感度△f=2/|Di|,由此可得显属性Xj中注入的拉普拉斯噪声量为公式(6)所示。根据差分隐私性质1,数据拥有者Pi执行PrivVPLT算法满足εi-差分隐私,其中εi=εi1+εi2。
综上所述,本发明主要包括三个阶段,即自适应隐私预算分配、隐树模型学习和合成数据发布。首先,根据数据拥有方本地数据集的敏感性和隐私属性暴露概率计算自适应分配隐私预算参数,该参数是数据发布隐私保护强度的重要依据。单方整体数据通过自适应隐私保护强度机制,实现隐私预算的自适应分配,在增加数据效用的情况下满足不同隐私需求的差分隐私保护。其次,提出隐树模型参数和结构学习相统一的满足差分隐私的启发式学习算法,通过将模型结构和参数学习目标统一为最大化模型参数的对数条件似然增益,该算法能进一步提高隐树模型学习效率。最后,多个数据拥有者和第三方在满足差分隐私的条件下共同构建一棵隐私模型,该模型用于度量整合数据的所有属性之间的联合分布,利用联合分布可以生成新的合成数据集。本发明具有以下优点:一方面自适应隐私保护强度机制可以降低属性联合分布中注入的噪声量,保证每个本地数据集的个性化数据隐私;另一方面,启发式差分隐私隐树模型学习可以提高隐树学习效率,减少算法时间开销。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (3)
1.一种基于垂直分割的差分隐私异构多属性数据发布方法,其特征在于,包括以下步骤:
(1)自适应隐私预算分配:数据拥有者Pi根据局部数据集Di的数据敏感性和隐私属性暴露概率计算隐私预算εi;
(2)提出隐树模型参数和结构学习相统一的满足差分隐私的隐树模型学习:数据拥有者Pi利用隐树模型学习算法构建隐树结构,使构建的Τi满足εi1-差分隐私,同时基于Τi计算的Θi满足εi2-差分隐私;Pi将Τi和Θi发送给第三方,第三方通过隐树模型学习算法构建整合数据集的隐树结构Τ,同时更新参数Θ;
(3)合成数据发布:根据隐树结构Τ和加噪Θ,采样每个属性的条件分布,生成扰动数据集D',并对外发布;
所述步骤(1)实现过程如下:
自适应隐私预算分配参数由数据敏感性SD和隐私属性暴露概率Lpb两部分组成;
其中,Senattr表示敏感属性,Senval表示敏感属性的值,η和σ分别为数据敏感度和隐私泄露概率的权重,η+σ=1,权重的分配由数据拥有者根据具体数据隐私保护要求确定,对不同的隐私保护需求可以调节数据敏感度和隐私泄露概率的权重来进行自适应隐私预算分配,实现不同的隐私保护强度;
步骤(2)所述的隐树模型参数和结构学习实现过程如下:
基于双向推理算法计算隐属性Y的联合条件分布,当Yj的孩子节点不是显属性时,βj的计算需要从叶节点开始向上传递,计算每个隐属性节点Yj∈Y的βj,具体公式如下:
其中,{Yc}是Yj的孩子节点集合;
从根节点开始自上而下推理,计算每个隐属性节点Yj∈Y的αj:
其中,{Ys:YP(s)=YP(j),Ys≠Yj}是Yj的兄弟节点集合;
对于任意隐属性节点Yj∈Y,计算边缘条件分布Pr(Yj,YP(i)|X(n)):
其中,{Ys:YP(s)=YP(j),Ys≠Yj}是Yj的兄弟节点集合;
当Yj的孩子节点为显属性或者Yj为根节点Yr时,βj和αj计算为βj=Pr(Xin(j)|Yj),αj=Pr(Yj|Xout(j)),可以得到条件分布
2.根据权利要求1所述的基于垂直分割的差分隐私异构多属性数据发布方法,其特征在于,步骤(2)所述的隐树模型结构学习实现过程如下:
首先初始化隐树结构隐属性集合/>初始化模型参数/>将未加入Τi的显属性Xj∈X\Τ和隐属性集合Y加入候选集合Ω,使用指数机制从候选集合Ω中选取使模型参数Θi的对数似然增量最大的属性对(Aj1,Aj2)加入隐树结构Τi,若有生成隐属性,同时将隐属性加入集合Y;基于更新的隐树结构Τi,计算联合条件分布,更新隐树参数Θi;重复执行上述隐树结构Τi和隐树参数Θi的更新操作,直到将初始的平凡树森林合并为一棵隐树。
3.根据权利要求1所述的基于垂直分割的差分隐私异构多属性数据发布方法,其特征在于,所述步骤(3)实现过程如下:
数据拥有者Pi根据自适应隐私预算分配参数Ai计算隐私预算大小εi=Ai×ε,并保证隐树参数学习的计算过程满足εi-差分隐私保护要求;在本地学习得到隐树结构之后,数据拥有者将隐树结构Τi和参数Θi发送给第三方;第三方根据接收到隐树森林,学习新的隐树结构Τ,同时更新隐树参数Θ;利用学习到的隐树的结构Τ和参数Θ,第三方可以估算原始整合数据的联合分布;根据该联合分布,第三方生成一组新的整合数据;
为了保证Θi的隐私性,为每个属性在给定其父节点的条件下的概率分布添加拉普拉斯噪声其中概率分布的全局敏感度Δf=2/|Di|。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111508267.8A CN114218602B (zh) | 2021-12-10 | 2021-12-10 | 一种基于垂直分割的差分隐私异构多属性数据发布方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111508267.8A CN114218602B (zh) | 2021-12-10 | 2021-12-10 | 一种基于垂直分割的差分隐私异构多属性数据发布方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114218602A CN114218602A (zh) | 2022-03-22 |
CN114218602B true CN114218602B (zh) | 2024-06-07 |
Family
ID=80700973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111508267.8A Active CN114218602B (zh) | 2021-12-10 | 2021-12-10 | 一种基于垂直分割的差分隐私异构多属性数据发布方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114218602B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB202207384D0 (en) * | 2022-05-19 | 2022-07-06 | Hazy Ltd | Synthetic generation of data with many to many relationships |
CN115329898B (zh) * | 2022-10-10 | 2023-01-24 | 国网浙江省电力有限公司杭州供电公司 | 基于差分隐私策略的多属性数据发布方法及系统 |
CN117313135B (zh) * | 2023-08-02 | 2024-04-16 | 东莞理工学院 | 一种基于属性划分的可高效重构的个人隐私保护方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109784091A (zh) * | 2019-01-16 | 2019-05-21 | 福州大学 | 一种融合差分隐私gan和pate模型的表格数据隐私保护方法 |
WO2019237840A1 (zh) * | 2018-06-14 | 2019-12-19 | 中兴通讯股份有限公司 | 数据集生成方法及装置 |
CN110602631A (zh) * | 2019-06-11 | 2019-12-20 | 东华大学 | Lbs中抵御推测攻击的位置数据的处理方法和处理装置 |
CN111737740A (zh) * | 2020-06-15 | 2020-10-02 | 山东大学 | 一种满足差分隐私的多方序列数据发布方法及系统 |
CN112131604A (zh) * | 2020-09-24 | 2020-12-25 | 合肥城市云数据中心股份有限公司 | 基于贝叶斯网络属性聚类分析技术的高维隐私数据发布方法 |
CN113094751A (zh) * | 2021-04-21 | 2021-07-09 | 山东大学 | 一种个性化隐私数据处理方法、装置、介质及计算机设备 |
CN113111383A (zh) * | 2021-04-21 | 2021-07-13 | 山东大学 | 一种垂直分割数据的个性化差分隐私保护方法及系统 |
-
2021
- 2021-12-10 CN CN202111508267.8A patent/CN114218602B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019237840A1 (zh) * | 2018-06-14 | 2019-12-19 | 中兴通讯股份有限公司 | 数据集生成方法及装置 |
CN109784091A (zh) * | 2019-01-16 | 2019-05-21 | 福州大学 | 一种融合差分隐私gan和pate模型的表格数据隐私保护方法 |
CN110602631A (zh) * | 2019-06-11 | 2019-12-20 | 东华大学 | Lbs中抵御推测攻击的位置数据的处理方法和处理装置 |
CN111737740A (zh) * | 2020-06-15 | 2020-10-02 | 山东大学 | 一种满足差分隐私的多方序列数据发布方法及系统 |
CN112131604A (zh) * | 2020-09-24 | 2020-12-25 | 合肥城市云数据中心股份有限公司 | 基于贝叶斯网络属性聚类分析技术的高维隐私数据发布方法 |
CN113094751A (zh) * | 2021-04-21 | 2021-07-09 | 山东大学 | 一种个性化隐私数据处理方法、装置、介质及计算机设备 |
CN113111383A (zh) * | 2021-04-21 | 2021-07-13 | 山东大学 | 一种垂直分割数据的个性化差分隐私保护方法及系统 |
Non-Patent Citations (6)
Title |
---|
Auto-FedAvg:Learnable Federated Averaging for Multi-Institutional Medical Image Segmentation;Yingda Xia 等;Image and Video Processing;20210420;1-11 * |
The QoS-Ensured Vertical Handoff Decision in Heterogeneous Wireless Networks;Yulong Shen 等;Journal of Information Science and Engineering;20191231;1-18 * |
一种基于隐树模型的满足差分隐私的高维数据发布算法;苏炜航 等;小型微型计算机系统;20180415;第39卷(第04期);681-685 * |
基于属性分割的差分隐私异构多属性数据发布;张小玉 等;计算机系统应用;20220707;第第31卷卷(第第10期期);225-235 * |
基于差分隐私的决策树发布技术研究;陈杨 等;计算机与现代化;20170315(第03期);59-64 * |
基于差分隐私的数据匿名化隐私保护方法;宋健 等;计算机应用;20161010;第36卷(第10期);2753-2757 * |
Also Published As
Publication number | Publication date |
---|---|
CN114218602A (zh) | 2022-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114218602B (zh) | 一种基于垂直分割的差分隐私异构多属性数据发布方法 | |
Huang et al. | DP-FL: a novel differentially private federated learning framework for the unbalanced data | |
Fan et al. | Privacy preserving classification on local differential privacy in data centers | |
Yu et al. | Outlier-eliminated k-means clustering algorithm based on differential privacy preservation | |
Sun et al. | Differential privacy for data and model publishing of medical data | |
Zhang et al. | An efficient federated learning scheme with differential privacy in mobile edge computing | |
CN112765653B (zh) | 一种多隐私策略组合优化的多源数据融合隐私保护方法 | |
Sangogboye et al. | A framework for privacy-preserving data publishing with enhanced utility for cyber-physical systems | |
Xin et al. | Federated synthetic data generation with differential privacy | |
Lei et al. | Image segmentation algorithm based on improved fuzzy clustering | |
Zhang et al. | Efficient privacy-preserving classification construction model with differential privacy technology | |
Liu et al. | Face image publication based on differential privacy | |
Hu et al. | Privacy-preserving personalized federated learning | |
Ni et al. | Federated learning model with adaptive differential privacy protection in medical IoT | |
Dong et al. | PADP-FedMeta: A personalized and adaptive differentially private federated meta learning mechanism for AIoT | |
Jiang et al. | Differential privacy in privacy-preserving big data and learning: Challenge and opportunity | |
Cui et al. | Boosting accuracy of differentially private federated learning in industrial IoT with sparse responses | |
Xu et al. | Privacy preserving online matching on ridesharing platforms | |
Shah-Hosseini | Improving K-means clustering algorithm with the intelligent water drops (IWD) algorithm | |
Zhang et al. | Asymptotic behaviour of a reaction–diffusion model with a quiescent stage | |
Li et al. | A Differentially private hybrid decomposition algorithm based on quad-tree | |
Ling et al. | Efficient federated learning privacy preservation method with heterogeneous differential privacy | |
Lin et al. | PTA: An efficient system for transaction database anonymization | |
Ning et al. | Dp-agm: a differential privacy preserving method for binary relationship in mobile networks | |
Zhang et al. | A personalized federated learning framework using side information for heterogeneous data classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |