CN113094751B - 一种个性化隐私数据处理方法、装置、介质及计算机设备 - Google Patents

一种个性化隐私数据处理方法、装置、介质及计算机设备 Download PDF

Info

Publication number
CN113094751B
CN113094751B CN202110431729.4A CN202110431729A CN113094751B CN 113094751 B CN113094751 B CN 113094751B CN 202110431729 A CN202110431729 A CN 202110431729A CN 113094751 B CN113094751 B CN 113094751B
Authority
CN
China
Prior art keywords
data
marginal distribution
attributes
privacy
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN202110431729.4A
Other languages
English (en)
Other versions
CN113094751A (zh
Inventor
郭山清
唐朋
胡程瑜
白兴涛
刘高源
张芷源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202110431729.4A priority Critical patent/CN113094751B/zh
Publication of CN113094751A publication Critical patent/CN113094751A/zh
Application granted granted Critical
Publication of CN113094751B publication Critical patent/CN113094751B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本发明属于数据安全与隐私保护领域,提供了一种个性化隐私数据处理方法、装置、介质及计算机设备。其中,该方法包括基于局部数据集计算数据拥有者的给定属性的计数向量;对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;根据包含噪音的聚合结果,计算属性的边际分布;根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。

Description

一种个性化隐私数据处理方法、装置、介质及计算机设备
技术领域
本发明属于数据安全与隐私保护领域,尤其涉及一种个性化隐私数据处理方法、装置、介质及计算机设备。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
分布式场景下,在共同利用多组水平分割数据,计算给定属性(或属性集合)的全局边际分布的过程中,存在数据隐私保护问题。其中,水平分割数据指的是数据拥有相同的属性,但包含不同的个体,如多组医疗数据。
数据中往往包含大量的个人敏感信息,由于数据分布、数据中个体的不同,不同的局部数据集隐私强度要求往往不同。因此,在实际利用水平分割数据计算属性(或属性集合)的边际分布的过程中,需要考虑如何满足数据拥有者不同强度的隐私保护需求,同时考虑如何最大限度的减少隐私保护对统计结果带来的精度损失的问题。现有隐私数据处理的过程为:对原始数据集中记录进行采样,得到采样数据集,接着利用采样数据集计算属性(或属性集合)的边际分布,并在计算结果中加入适量噪音以满足差分隐私保护要求。以上方法相当于对关于原始数据集的统计信息进行了随机扰动以达到隐私保护目的。其随机性来自于两方面,一方面是随机采样对原始数据集中每条记录带来的随机性,另一方面是差分隐私中噪音对采样数据集中每条记录带来的随机性。在差分隐私中的噪音对采样数据集中每条记录带来的随机性相同的条件下,通过对原始数据集中记录进行不同概率的采样,即隐私强度需求大的被选中的概率小,隐私强度需求小的被选中的概率大,以调整采样方法对原始数据集中不同隐私强度需求的记录带来的随机性大小,进而从整体上满足原始数据集中不同记录的隐私保护强度需求。然而,发明人发现,对于利用水平分割数据计算属性的边际分布统计结果精度来讲,以上方法会对统计结果精度带来两方面误差,一方面是差分隐私中噪音带来的误差,一方面是采样带来的误差,这将影响统计结果精度,这样无法准确分析不同属性数据之间的关联关系以及保证每个局部数据集的个性化隐私保护。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种个性化隐私数据处理方法、装置、介质及计算机设备,其采用加权聚合技术和基于混合多项分布的校正技术,在为每一方提供个性化的差分隐私保护的同时,能够正确计算属性(或属性集合)在水平分割数据中全局边际分布,能够准确出分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护的目的。为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种个性化隐私数据处理方法。
一种个性化隐私数据处理方法,其包括:
基于局部数据集计算数据拥有者的给定属性的计数向量;
对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;
根据包含噪音的聚合结果,计算属性的边际分布;
根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。
进一步地,所述计数向量采用数据拥有者在本地基于局部数据集计算的给定属性或属性组合的直方图信息来表示。
进一步地,对数据拥有者的计数向量进行加权聚合的过程中,每个局部数据集的权重为相应局部数据集的隐私预算与所有局部数据集的隐私预算最大值的比值。
进一步地,每个局部数据集的隐私预算为公开信息。
进一步地,在聚合结果中注入拉普拉斯噪音的过程是在密文下进行的。
进一步地,拉普拉斯噪音η=-λ·sgn(u)·ln(1-2|u|),其中,u为区间
Figure BDA0003031632260000031
内服从均匀分布的连续的随机变量,λ为常系数。
进一步地,利用最大期望算法校正属性的边际分布之前,还包括构造似然函数,利用似然函数将数据集边界的问题转换为有约束最大化问题。
本发明的第二个方面提供一种个性化隐私数据处理装置。
一种个性化隐私数据处理装置,其包括:
计数向量计算模块,其用于基于局部数据集计算数据拥有者的给定属性的计数向量;
加权聚合模块,其用于对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;
边际分布计算模块,其用于根据包含噪音的聚合结果,计算属性的边际分布;
边际分布校正模块,其用于根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。
本发明的第三个方面提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的个性化隐私数据处理方法中的步骤。
本发明的第四个方面提供一种计算机设备。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的个性化隐私数据处理方法中的步骤。
与现有技术相比,本发明的有益效果是:
本发明采用了加权聚合技术和基于混合多项分布的校正技术,在为每一方提供个性化的差分隐私保护的同时,正确计算属性(或属性集合)在水平分割数据中全局边际分布,最终准确出分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明实施例的个性化隐私数据处理方法流程图;
图2是本发明实施例的水平分割数据示例;
图3是本发明实施例的个性化隐私数据处理计算过程;
图4(a)是本发明实施例在数据集NLTCS的方法比对图;
图4(b)是本发明实施例的在数据集BR2000的方法比对图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
现有K家医院,每家医院拥有一组用户的医疗数据,每一家医院可以看作一个局部数据集。这些局部数据集为水平分割数据,具体如图2所示。现在欲利用这K组数据共同计算某一药物用药量这一属性和药效这一属性之间的联合分布(也就是两个属性的边际分布),以便于分析药量和药效之间的关联关系,同时保证计算结果对每家医院满足εk-差分隐私保护要求。具体过程如下:
如图1和图3所示,本实施例的个性化隐私数据处理方法,其包括:
S101:基于局部数据集计算数据拥有者的给定属性的计数向量。
例如:每一个数据拥有者Pk在本地基于局部数据集Dk计算给定属性(或属性组合)的直方图信息(即计数向量)。将给定属性(或属性组合)记为X,其取值空间记为ΩX,取值空间大小记为l,即l=|ΩX|。数据拥有者Pk在本地局部数据集Dk中统计X每一种取值对应的记录的条数,记为ck1,ck2,…,ckl
S102:对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求。
具体步骤如下:
步骤S1021:将区间
Figure BDA0003031632260000061
内服从均匀分布的连续的随机变量u离散化。这样做的合理性是因为数据在计算机中是按照二进制形式存储的。
步骤S1022:每一个数据拥有者Pk在本地生成一个长度为L的0-1串<vk1,…,vkL>。由于双精度浮点数长度为8字节,即64位,因此,L往往取值为64。每一位vkl为随机变量,取值空间为{0,1},且取每一种值的概率均为
Figure BDA0003031632260000062
Figure BDA0003031632260000063
步骤S1023:对于任意一个l∈{1,…,L},数据拥有者和聚合服务器利用门限同态加密技术计算:
Figure BDA0003031632260000064
当<v1l,…,vKl>中1的个数为奇数,
Figure BDA0003031632260000065
当其中1的个数为偶数,
Figure BDA0003031632260000066
因此,
Figure BDA0003031632260000067
其中,
Figure BDA0003031632260000068
表示异或运算。
步骤S1024:分别计算u的正负符号sgn(u)和u的绝对值|u|:
Figure BDA0003031632260000069
为了防止数据拥有者或聚合服务器窃取sgn(u)和|u|的信息,sgn(u)以密文的形式存储,(1-2|u|)被拆分成K项的乘积,即
Figure BDA00030316322600000610
并将sk分配给数据拥有者PK
步骤S1025:基于sgn(u)和|u|数据拥有者和聚合服务器计算拉普拉斯噪音
Figure BDA0003031632260000071
η被分解成K项的和,并分别分配给每一个数据拥有者。
以上过程需要在密文下进行,具体的过程如下:
1)每一个数据拥有者PK在本地随机生成一个0-1向量vk=<vk1,…,vkL>,其中对于任意的1≤l≤L,
Figure BDA0003031632260000072
2)数据拥有者共同计算
Figure BDA0003031632260000073
并将计算结果发送给聚合服务器;
3)对于任意的l∈{1,…,L-1},聚合服务器计算
Figure BDA0003031632260000074
Figure BDA0003031632260000075
为了描述方便,将
Figure BDA0003031632260000076
记为ul
4)聚合服务器计算
Figure BDA0003031632260000077
Figure BDA0003031632260000078
Figure BDA0003031632260000079
5)聚合服务器将
Figure BDA00030316322600000710
Figure BDA00030316322600000711
发送给数据拥有者,其中
Figure BDA00030316322600000712
6)每一个数据拥有者Pk在本地生成一个随机数rk
7)所有的数据拥有者共同计算
Figure BDA00030316322600000713
并将计算结果发送给聚合服务器;
8)数据拥有者和聚合服务器共同解密
Figure BDA00030316322600000714
从而得到
Figure BDA00030316322600000715
数据拥有者P1,…,PK-1,PK分别拥有
Figure BDA00030316322600000716
Figure BDA00030316322600000717
其中
Figure BDA00030316322600000718
9)每一个数据拥有者Pk生成一个随机数r′k并计算
Figure BDA00030316322600000719
Figure BDA00030316322600000720
计算结果被发送给聚合服务器;
10)聚合服务器计算
Figure BDA00030316322600000721
Figure BDA0003031632260000081
11)数据拥有者和聚合服务器共同解密
Figure BDA0003031632260000082
从而得到
Figure BDA0003031632260000083
数据拥有者P1,…,PK-1,PK分别拥有η1=-r′1,…,ηK-1=-r′K-1,
Figure BDA0003031632260000084
其中,
Figure BDA0003031632260000085
Figure BDA0003031632260000086
数据拥有者Pk(其中1≤k≤K)在本地计算wkckik,并将计算结果发送给聚合服务器。其中,wk为每一方局部数据集Dk的权重;
确定每一方局部数据集Dk的权重wk。具体包括如下子步骤:
确定隐私预算最大值,即计算εmax=max{ε1,ε2,…,εK};
其中,每一方局部数据集Dk的隐私预算εk可视为公开信息,因此,该步计算不涉及到数据隐私。
每一个数据拥有者Pk分别计算局部数据集Dk的权重
Figure BDA0003031632260000087
聚合服务器接受数据拥有者发送的信息,并计算聚合结果,即c′=(c′1,c′2,…,c′l),其中
Figure BDA0003031632260000088
S103:根据包含噪音的聚合结果,计算属性的边际分布。
聚合服务器根据包含噪音的聚合结果,计算属性(或属性集合)的边际分布。对于任意一项xi∈ΩX
Figure BDA0003031632260000089
S104:根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。
具体包括如下子步骤:
步骤S1041:构造似然函数
给定属性集合X,其在任意一个加权局部数据集
Figure BDA0003031632260000091
中服从多项式分布,该多项式分布记为{μ1k,μ2k,…,μlk},其中l表示属性集合X取值空间的大小,即l=|Ωx|,且
Figure BDA0003031632260000092
另外,混合多项分布中任意一项(即局部数据集)先验概率为
Figure BDA0003031632260000093
利用加权局部数据集,数据拥有者和聚合服务器可以计算属性集合X的任意一种取值xi(其中i∈{1,2,…,l})的个数ci。接着数据拥有者和聚合服务器可以计算似然函数:
Figure BDA0003031632260000094
其对应的对数似然函数可以表示为:
Figure BDA0003031632260000095
注意到
Figure BDA0003031632260000096
Figure BDA0003031632260000097
因此参数求解问题可以看作有约束最大化问题。
步骤S1042:利用EM算法计算相关系数αk和μij
首先引入拉格朗日余子式λj(其中0≤j≤K,K表示局部数据集的数量),将有约束最值问题转化为无约束最值问题:
Figure BDA0003031632260000098
接着,为了计算αk,可以对L关于αk求导,并令导数等于0,从而得到:
Figure BDA0003031632260000099
进而可以得到:
Figure BDA00030316322600000910
其中
Figure BDA00030316322600000911
另外,由于
Figure BDA00030316322600000912
因此可以得到:
Figure BDA0003031632260000101
因此,计算得出αk为:
Figure BDA0003031632260000102
与以上过程类似,可以计算μik为:
Figure BDA0003031632260000103
步骤S1043:重构属性(或属性组合)的边际分布
由于属性(或属性集合)X在加权数据集
Figure BDA0003031632260000104
中的边际分布等于其在原始局部数据集Dk中的边际分布,即
Figure BDA0003031632260000105
因此,基于步骤S1044中计算的μik,聚合服务器可以重构属性(或属性集合)X的边际分布:
Figure BDA0003031632260000106
为了更直观说明本实施例中的该方法的优势,将本实施例中方法在两种公开的数据集NLTCS和BR2000与现有方法进行对比。对比方法包括直接根据隐私保护强度要求最大的一方加入噪音、基于采样的统计方法和基于加权的统计方法。实验结果表明,本实施例计算出的边际分布具有更高的精度,具体参见图4(a)和图4(b),其中MM表示本实施例的方法,即基于混合多项分布的边际分布计算方法,MH表示直接根据隐私保护强度要求最大的一方加入噪音,SAH表示基于采样的统计方法,STH表示基于加权的统计方法。
实施例二
本实施例提供了一种个性化隐私数据处理装置,其具体包括如下模块:
计数向量计算模块,其用于基于局部数据集计算数据拥有者的给定属性的计数向量;
加权聚合模块,其用于对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;
边际分布计算模块,其用于根据包含噪音的聚合结果,计算属性的边际分布;
边际分布校正模块,其用于根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。
此处需要说明的是,本实施例的个性化隐私数据处理装置中的各个模块,与实施例一中的个性化隐私数据处理方法的各个步骤一一对应,其具体实施过程相同,此处不再累述。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的个性化隐私数据处理方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的个性化隐私数据处理方法中的步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种个性化隐私数据处理方法,其特征在于,用于对水平分割数据进行带差分隐私保护的全局边际分布计算,包括:
基于局部数据集计算数据拥有者的给定属性的计数向量;
对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;
根据包含噪音的聚合结果,计算属性的边际分布;
根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护;
所述计数向量采用数据拥有者在本地基于局部数据集计算的给定属性或属性组合的直方图信息来表示;
对数据拥有者的计数向量进行加权聚合的过程中,每个局部数据集的权重为相应局部数据集的隐私预算与所有局部数据集的隐私预算最大值的比值。
2.如权利要求1所述的个性化隐私数据处理方法,其特征在于,每个局部数据集的隐私预算为公开信息。
3.如权利要求1所述的个性化隐私数据处理方法,其特征在于,在聚合结果中注入拉普拉斯噪音的过程是在密文下进行的。
4.如权利要求1所述的个性化隐私数据处理方法,其特征在于,拉普拉斯噪音η=-λ·sgn(u)·ln(1-2|u|),其中,u为区间
Figure FDA0003796981240000011
内服从均匀分布的连续的随机变量,λ为常系数。
5.如权利要求1所述的个性化隐私数据处理方法,其特征在于,利用最大期望算法校正属性的边际分布之前,还包括构造似然函数,利用似然函数将数据集边界的问题转换为有约束最大化问题。
6.一种个性化隐私数据处理系统,其特征在于,采用如权利要求1-5任一项所述的一种个性化隐私数据处理方法,包括:
计数向量计算模块,其用于基于局部数据集计算数据拥有者的给定属性的计数向量;
加权聚合模块,其用于对数据拥有者的计数向量进行加权聚合,并在聚合结果中注入拉普拉斯噪音,以满足差分隐私保护要求;
边际分布计算模块,其用于根据包含噪音的聚合结果,计算属性的边际分布;
边际分布校正模块,其用于根据属性的边际分布,利用最大期望算法校正属性的边际分布,以用于分析不同属性数据之间的关联关系且同时保证每个局部数据集的个性化隐私保护。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的个性化隐私数据处理方法中的步骤。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一项所述的个性化隐私数据处理方法中的步骤。
CN202110431729.4A 2021-04-21 2021-04-21 一种个性化隐私数据处理方法、装置、介质及计算机设备 Expired - Fee Related CN113094751B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110431729.4A CN113094751B (zh) 2021-04-21 2021-04-21 一种个性化隐私数据处理方法、装置、介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110431729.4A CN113094751B (zh) 2021-04-21 2021-04-21 一种个性化隐私数据处理方法、装置、介质及计算机设备

Publications (2)

Publication Number Publication Date
CN113094751A CN113094751A (zh) 2021-07-09
CN113094751B true CN113094751B (zh) 2022-09-30

Family

ID=76679106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110431729.4A Expired - Fee Related CN113094751B (zh) 2021-04-21 2021-04-21 一种个性化隐私数据处理方法、装置、介质及计算机设备

Country Status (1)

Country Link
CN (1) CN113094751B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512247A (zh) * 2015-11-30 2016-04-20 上海交通大学 基于一致性特征的非交互式差分隐私发布模型的优化方法
CN107451618A (zh) * 2017-08-10 2017-12-08 中国人民大学 一种密度峰值聚类算法的差分隐私保护方法
CN110727959A (zh) * 2019-10-15 2020-01-24 南京航空航天大学 一种基于聚类的差分隐私轨迹数据保护方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104601596B (zh) * 2015-02-05 2017-09-22 南京邮电大学 一种分类数据挖掘系统中数据隐私保护方法
CN110334757A (zh) * 2019-06-27 2019-10-15 南京邮电大学 面向大数据分析的隐私保护聚类方法及计算机存储介质
CN110866276A (zh) * 2019-11-13 2020-03-06 电子科技大学广东电子信息工程研究院 一种混合云环境下数据的隐私保护方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512247A (zh) * 2015-11-30 2016-04-20 上海交通大学 基于一致性特征的非交互式差分隐私发布模型的优化方法
CN107451618A (zh) * 2017-08-10 2017-12-08 中国人民大学 一种密度峰值聚类算法的差分隐私保护方法
CN110727959A (zh) * 2019-10-15 2020-01-24 南京航空航天大学 一种基于聚类的差分隐私轨迹数据保护方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
满足差分隐私的多方数据发布技术研究;唐朋;《中国博士学位论文全文数据库 信息科技辑》;20190815;第四章 *

Also Published As

Publication number Publication date
CN113094751A (zh) 2021-07-09

Similar Documents

Publication Publication Date Title
CN111931950B (zh) 一种基于联邦学习进行模型参数更新的方法及系统
Ye et al. Heterogeneous federated learning: State-of-the-art and research challenges
Deng et al. Low-rank structure learning via nonconvex heuristic recovery
Zhang et al. Linear convergence with condition number independent access of full gradients
Vizitiu et al. Applying deep neural networks over homomorphic encrypted medical data
KR20220113714A (ko) 분할 데이터 및 분할 알고리즘에 대한 효율적인 계산을 위한 시스템 및 방법
Heikkilä et al. Differentially private bayesian learning on distributed data
JP7119865B2 (ja) 情報処理方法及び装置、並びに情報検出方法及び装置
WO2017171726A1 (en) Distributed data clustering using an untrusted mediator
Dai et al. Privacy preserving federated big data analysis
Chu et al. A privacy-preserving bipartite graph matching framework for multimedia analysis and retrieval
Tang et al. Bayesian variable selection and estimation in semiparametric joint models of multivariate longitudinal and survival data
Goldberg et al. Support vector regression for right censored data
CN112131322A (zh) 时间序列分类方法及装置
Tian et al. Aggregating private sparse learning models using multi-party computation
He et al. Transfer learning in high‐dimensional semiparametric graphical models with application to brain connectivity analysis
CN116776155B (zh) 一种基于联邦学习的模型训练方法、装置、设备和介质
CN113094751B (zh) 一种个性化隐私数据处理方法、装置、介质及计算机设备
Wang et al. Robust PCA via non-convex half-quadratic regularization
CN109922227B (zh) 一种可逆元胞自动机图像加密的相似性度量方法
Adjei-Mensah et al. Cov-Fed: Federated learning-based framework for COVID-19 diagnosis using chest X-ray scans
CN115481415A (zh) 基于纵向联邦学习的通信成本优化方法、系统、设备及介质
CN113159202B (zh) 图像分类方法、装置、电子设备及存储介质
Pirogov et al. Contact processes on general spaces. Models on graphs and on manifolds
Silva et al. Privacy-preserving multi-party clustering: An empirical study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220930

CF01 Termination of patent right due to non-payment of annual fee