CN109492429B - 一种数据发布的隐私保护方法 - Google Patents

一种数据发布的隐私保护方法 Download PDF

Info

Publication number
CN109492429B
CN109492429B CN201811273045.0A CN201811273045A CN109492429B CN 109492429 B CN109492429 B CN 109492429B CN 201811273045 A CN201811273045 A CN 201811273045A CN 109492429 B CN109492429 B CN 109492429B
Authority
CN
China
Prior art keywords
data
query
packet
vector
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811273045.0A
Other languages
English (en)
Other versions
CN109492429A (zh
Inventor
范冰冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Bingo Software Co Ltd
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201811273045.0A priority Critical patent/CN109492429B/zh
Publication of CN109492429A publication Critical patent/CN109492429A/zh
Application granted granted Critical
Publication of CN109492429B publication Critical patent/CN109492429B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种数据发布的隐私保护方法,为数据的开放共享发布提供了一种新型隐私保护发布方法,本发明主要是对数据库进行批量查询操作后得到的具有一定统计特性的数据,通过对数据精确有效地添加满足ε‑差分隐私保护预算的随机噪声,最后将噪声扰动结果通过直方图发布的方式返回给用户。本发明在差分隐私保护预算ε前提下,保证了数据中包含的个体隐私几乎不可能被泄露,同时所发布的数据基本保持原有的统计特性,具有更高的可用性,对发布数据进一步实现挖掘学习利用和价值发现。

Description

一种数据发布的隐私保护方法
技术领域
本发明属于数据开放和隐私保护技术领域,具体涉及一种数据发布的隐私保护方法。
背景技术
随着数据开放成为大数据时代的必然趋势,普遍认为隐私保护是数据开放中不可避免的关键问题之一。差分隐私直方图发布方法作为隐私保护数据发布的一种重要形式,通过对原始数据的统计结果添加噪声扰动,使得攻击者在统计意义上无论拥有多少背景知识,都无法有效地获取个体隐私。另外,该技术使个体敏感数据失真的同时,又能基本保持数据的全局统计特性,故而保留了数据受隐私保护发布后的价值。
差分隐私直方图方法是一种非交互式的隐私保护数据发布机制,该机制通常首先对数据库进行常见的批量查询操作(如计数查询),然后对结果(批量数据)进行加噪处理,加噪结果以直方图的形式展示给用户。在数据开放中,批量数据是发布得最多的数据种类。早期是采用匿名机制对批量数据中包含的用户隐私进行抑制或擦除,而目前常见的差分隐私直方图发布方法则是采用噪声扰动的方式对批量数据直接添加噪声扰动后进行发布。
目前,现有差分隐私直方图发布方法不能较好地应用于数据开放中的隐私保护数据发布,一方面是数据种类繁多,没有统一的发布业务流程;另一方面,直接添加噪声的发布方法发布的数据相对原始数据噪声扰动过大,降低了再次利用挖掘学习的价值。
因此,需要一种数据发布的隐私保护方法,针对批量数据这种应用场景,实现可用性更高的隐私保护数据发布。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种数据发布的隐私保护方法,是面向批量数据的差分隐私直方图发布方法,可以根据用户向数据开放平台提交的批量查询请求,从数据库中获取相应的批量数据,并对批量数据添加满足给定的差分隐私保护要求的随机噪声,最后将噪声扰动结果通过直方图发布的方式返回给用户,可以有效地保护数据中包含的个体隐私不被泄露,同时提高返回的直方图发布的结果的可用性。
为了达到上述目的,本发明采用以下技术方案:本发明公开了一种数据发布的隐私保护方法,其特征在于,包括下述步骤:
P1:计算全局敏感度,获取用户的批量查询请求,形成一个查询函数集F,求得查询函数集F的全局敏感度S(F);
所述查询函数集F由用户提交的所有批量查询请求对应的查询函数f组成;所述全局敏感度是查询函数集F中局部敏感度Δf的最大值,所述局部敏感度Δf指的是增加或减少数据库中任意一条记录后查询函数f输出的最大值,即
Figure BDA0001846399930000021
其中D1和D2为数据库中相差一条记录的任意两个子集;所述批量查询请求,为数据库常见的聚类查询请求,所述聚类查询请求包含聚类计数查询和聚类平均查询;
P2:获取初始批量数据,将查询函数集F作用于数据开放平台中的目标数据库,得到结果集R,将所述结果集R的每个元素表示为一个向量T,所述向量T作为待发布的批量数据;
P3:对批量数据加噪排序,设定系统的差分隐私保护预算ε,取一半差分隐私保护预算
Figure BDA0001846399930000031
对待发布批量数据的所有分量进行噪声添加后排序;
P4:对排序后的批量数据进行分组重构,使用基于回溯策略的贪心聚类方法对排序后的批量数据的所有分量进行分组,将每个分组的平均值替换组内的每个分量;
P5:对分组重构后的批量数据进行二次加噪,取剩余的一半差分隐私保护预算
Figure BDA0001846399930000032
生成随机噪声,添加到每个分组的分量上;
P6:将二次加噪后的批量数据表示成直方图的形式,返回给用户。
作为优选的技术方案,在步骤P2中,所述的初始批量数据是查询函数f的输出结果T,用一个向量T=<x1,x2,...,xn>表示,后续对向量各分量的操作能根据下标快速计算,其中包含对向量各分量的加噪、排序、分组和重构操作。
作为优选的技术方案,所述查询函数集F是动态更新的,其中包含的每个查询函数f对应用户提交的一个批量查询请求,查询函数的输入是查询请求指定的数据库的任意一个子集,查询函数的输出是一个n维的实数向量T,其中n小于数据库的记录数。
作为优选的技术方案,在步骤P3中,所述批量数据加噪排序包括下述步骤:
P31:设定系统的差分隐私保护预算ε,根据向量T的维度生成随机噪声向量Y=<Y1,Y2,...,Yn>,Y的每个分量均为一个独立的随机变量;
P32:向量T添加随机噪声向量Y,得到加噪的向量<x1+Y1,x2+Y2,...,xn+Yn>;
P33:将向量<x1+Y1,x2+Y2,...,xn+Yn>进行升序排序得到
Figure BDA0001846399930000033
所述批量数据加噪排序过程消耗一半差分隐私保护预算。
作为优选的技术方案,在步骤P31中,所述独立的随机变量为拉普拉斯变量η,其概率密度函数为
Figure BDA0001846399930000034
其中
Figure BDA0001846399930000035
作为优选的技术方案,在步骤P4中,对排序后的批量数据进行分组重构的具体步骤为:
P41:初始化一个空的分组C1,将
Figure BDA0001846399930000041
的第一个分量
Figure BDA0001846399930000042
作为分组C1的第一个元素,当前分组Ci=C1,当前待划分的分量
Figure BDA0001846399930000043
P42:计算当前分组Ci的分组误差err(Ci),计算当前分量
Figure BDA0001846399930000044
不划分到当前分组Ci而产生的误差下界
Figure BDA0001846399930000045
假设当前分量
Figure BDA0001846399930000046
划分到当前分组Ci,计算新的分组误差
Figure BDA0001846399930000047
判断
Figure BDA0001846399930000048
是否满足,若满足,则进行步骤P43;否则进行步骤P44;
P43:更新当前分组
Figure BDA0001846399930000049
更新当前待划分的分量
Figure BDA00018463999300000410
判断j>n是否满足,若满足,进行步骤P47;否则继续步骤P42,其中j表示某分组,n表示数据组的向量上限;
P44:初始化空的分组Ci+1,分量
Figure BDA00018463999300000411
作为分组Ci+1的第一个元素,更新当前分组Ci=Ci+1,更新当前待划分的分量
Figure BDA00018463999300000412
判断当前分组编号i>2是否满足,若满足,进行步骤P45;否则进行P42,其中i表示当前分组编号;
P45:计算Ci-2的分组误差err(Ci-2),计算上一个分组第一个元素
Figure BDA00018463999300000413
的实际误差
Figure BDA00018463999300000414
假设该分量
Figure BDA00018463999300000415
划分到Ci-2,计算新的分组误差
Figure BDA00018463999300000416
判断
Figure BDA00018463999300000417
是否满足,若满足,则进行步骤P46;否则进行步骤P42;
P46:更新当前待划分的分量
Figure BDA00018463999300000418
更新当前分组Ci=Ci-2;继续步骤P43;
P47:用组平均值代替组内每个元素的值,将所有分组Ci的元素进行重构,即更新
Figure BDA00018463999300000419
中所有的分量
Figure BDA00018463999300000420
作为优选的技术方案,所述分组误差,其计算方法为取平均值重构产生的误差与添加拉普拉斯噪声产生的误差的和,即为
Figure BDA0001846399930000051
作为优选的技术方案,在步骤P42中,所述误差下界是对当前分量
Figure BDA0001846399930000052
其中一种最优分组而产生的误差的最低估计,假定在所述当前分量其后分量与所述当前分量相等且分到一组时产生,此时所述当前分量的误差为
Figure BDA0001846399930000053
本发明与现有技术相比,具有如下优点和有益效果:
(1)本发明和差分隐私保护的传统方法相比较,本方法提出的回溯分组方法和实现技术,在划分分组上更具精确与合理性,达到了更小的误差效果,较好解决了数据开放中差分隐私保护的误差问题。
(2)在隐私保护系统中使用本方法的实际实现,在差分隐私保护一定预算ε前提下,本方法可实现每个批量数据分量的噪声扰动更小,更接近原始数据,从而使发布数据的可用性更高。
附图说明
图1是根据本发明一个实施例的数据发布的隐私保护方法流程图;
图2是根据本发明一个实施例的对批量数据进行加噪排序流程图;
图3是根据本发明一个实施例的对加噪排序后数据进行分组重构流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本实施例一种数据发布的隐私保护方法,具体包括下述步骤:
P1:计算全局敏感度,获取用户的批量查询请求,形成一个查询函数集F,求得查询函数集F的全局敏感度S(F);所述查询函数集F由用户提交的所有批量查询请求对应的查询函数f组成;所述全局敏感度是查询函数集F中局部敏感度Δf的最大值,所述局部敏感度Δf指的是增加或减少数据库中任意一条记录对查询函数f输出的最大值,即
Figure BDA0001846399930000061
其中D1和D2为数据库中相差一条记录的任意两个子集;所述批量查询请求,为数据库常见的聚类查询请求,如聚类计数查询和聚类平均查询等等;
P2:获取批量数据,首先将查询函数集F作用于数据开放平台中的目标数据库,得到的结果集R,将结果集的每个元素表示为一个向量T,作为待发布的批量数据;所述批量数据是查询函数f的输出结果T,用一个向量T=<x1,x2,...,xn>表示;
P3:对批量数据加噪排序,设定系统的差分隐私保护预算ε,取一半差分隐私保护预算
Figure BDA0001846399930000062
对批量数据(向量T)的所有分量进行噪声添加后排序;
如图2所示,对批量数据进行加噪排序的具体步骤为:
P31:设定系统的差分隐私保护预算ε,根据向量T的维度生成随机噪声向量Y=<Y1,Y2,...,Yn>,Y的每个分量均为一个独立的拉普拉斯随机变量η,其概率密度函数为
Figure BDA0001846399930000063
其中
Figure BDA0001846399930000064
P32:向量T添加随机噪声向量Y,得到加噪的向量<x1+Y1,x2+Y2,...,xn+Yn>;
P33:将向量<x1+Y1,x2+Y2,...,xn+Yn>进行升序排序得到
Figure BDA0001846399930000071
此加噪排序过程恰好消耗了一半差分隐私保护预算。
P4:对排序后的批量数据进行分组重构,使用基于回溯策略的贪心聚类方法对排序后的批量数据的所有分量进行分组,将每个分组的平均值替换组内的每个分量;
如图3所示,步骤P4中对加噪排序后数据进行分组重构的具体步骤为:
P41:初始化一个空的分组C1,将
Figure BDA0001846399930000072
的第一个分量
Figure BDA0001846399930000073
作为分组C1的第一个元素,当前分组Ci=C1,当前待划分的分量
Figure BDA0001846399930000074
P42:计算当前分组Ci的分组误差err(Ci),计算当前分量
Figure BDA0001846399930000075
不划分到当前分组Ci而产生的误差下界
Figure BDA0001846399930000076
假设当前分量
Figure BDA0001846399930000077
划分到当前分组Ci,计算新的分组误差
Figure BDA0001846399930000078
判断
Figure BDA0001846399930000079
是否满足,若满足,则进行步骤P43;否则进行步骤P44;所述分组误差的计算公式为
Figure BDA00018463999300000710
其中
Figure BDA00018463999300000711
所述的误差下界计算公式为
Figure BDA00018463999300000712
P43:更新当前分组
Figure BDA00018463999300000713
更新当前待划分的分量
Figure BDA00018463999300000714
判断j>n是否满足,若满足,进行步骤P47,;否则继续步骤P42;
P44:初始化空的分组Ci+1,分量
Figure BDA00018463999300000715
作为分组Ci+1的第一个元素,更新当前分组Ci=Ci+1,更新当前待划分的分量
Figure BDA00018463999300000716
判断当前分组编号i>2是否满足,若满足,进行步骤P45;否则进行P42;
P45:计算Ci-2的分组误差err(Ci-2),计算上一个分组第一个元素
Figure BDA00018463999300000717
的实际误差
Figure BDA00018463999300000718
假设该分量
Figure BDA00018463999300000719
划分到Ci-2,计算新的分组误差
Figure BDA00018463999300000720
判断
Figure BDA00018463999300000721
是否满足,若满足,则进行步骤P46;否则进行步骤P42;
P46:更新当前待划分的分量
Figure BDA0001846399930000081
更新当前分组Ci=Ci-2;继续步骤P43;
P47:用组平均值代替组内每个元素的值,将所有分组Ci的元素进行重构,即更新
Figure BDA0001846399930000082
中所有的分量
Figure BDA0001846399930000083
P5:对分组重构后的批量数据进行二次加噪,取剩余的一半差分隐私保护预算
Figure BDA0001846399930000084
生成随机噪声,添加到每个分组的分量上;
P6:将二次加噪后的批量数据表示成直方图的形式,返回给用户。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (7)

1.一种数据发布的隐私保护方法,其特征在于,包括下述步骤:
P1:计算全局敏感度,获取用户的批量查询请求,形成一个查询函数集F,求得查询函数集F的全局敏感度S(F);
所述查询函数集F由用户提交的所有批量查询请求对应的查询函数f组成;所述全局敏感度是查询函数集F中局部敏感度Δf的最大值,所述局部敏感度Δf指的是增加或减少数据库中任意一条记录后查询函数f输出的最大值,即
Figure FDA0002624647560000011
其中D1和D2为数据库中相差一条记录的任意两个子集;所述批量查询请求,为数据库常见的聚类查询请求,所述聚类查询请求包含聚类计数查询和聚类平均查询;
P2:获取初始批量数据,将查询函数集F作用于数据开放平台中的目标数据库,得到结果集R,将所述结果集R的每个元素表示为一个向量T,所述向量T作为待发布的批量数据;
P3:对批量数据加噪排序,设定系统的差分隐私保护预算ε,取一半差分隐私保护预算
Figure FDA0002624647560000012
对待发布批量数据的所有分量进行噪声添加后排序;
P4:对排序后的批量数据进行分组重构,使用基于回溯策略的贪心聚类方法对排序后的批量数据的所有分量进行分组,将每个分组的平均值替换组内的每个分量;
对排序后的批量数据进行分组重构的具体步骤为:
P41:初始化一个空的分组C1,将
Figure FDA0002624647560000013
的第一个分量
Figure FDA0002624647560000014
作为分组C1的第一个元素,当前分组Ci=C1,当前待划分的分量
Figure FDA0002624647560000015
P42:计算当前分组Ci的分组误差err(Ci),计算当前分量
Figure FDA0002624647560000016
不划分到当前分组Ci而产生的误差下界
Figure FDA0002624647560000017
假设当前分量
Figure FDA0002624647560000018
划分到当前分组Ci,计算新的分组误差
Figure FDA0002624647560000019
判断
Figure FDA00026246475600000110
是否满足,若满足,则进行步骤P43;否则进行步骤P44;
P43:更新当前分组
Figure FDA00026246475600000111
更新当前待划分的分量
Figure FDA00026246475600000112
判断j>n是否满足,若满足,进行步骤P47;否则继续步骤P42,其中j表示当前分量编号,n表示数据组的向量上限;
P44:初始化空的分组Ci+1,分量
Figure FDA0002624647560000021
作为分组Ci+1的第一个元素,更新当前分组Ci=Ci+1,更新当前待划分的分量
Figure FDA0002624647560000022
判断当前分组编号i>2是否满足,若满足,进行步骤P45;否则进行P42,其中i表示当前分组编号;
P45:计算Ci-2的分组误差err(Ci-2),计算上一个分组第一个元素
Figure FDA0002624647560000023
的实际误差
Figure FDA0002624647560000024
假设该分量
Figure FDA0002624647560000025
划分到Ci-2,计算新的分组误差
Figure FDA0002624647560000026
判断
Figure FDA0002624647560000027
是否满足,若满足,则进行步骤P46;否则进行步骤P42;
P46:更新当前待划分的分量
Figure FDA0002624647560000028
更新当前分组Ci=Ci-2;继续步骤P43;
P47:用组平均值代替组内每个元素的值,将所有分组Ci的元素进行重构,即更新
Figure FDA0002624647560000029
中所有的分量
Figure FDA00026246475600000210
P5:对分组重构后的批量数据进行二次加噪,取剩余的一半差分隐私保护预算
Figure FDA00026246475600000211
生成随机噪声,添加到每个分组的分量上;
P6:将二次加噪后的批量数据表示成直方图的形式,返回给用户。
2.根据权利要求1所述的数据发布的隐私保护方法,其特征在于,在步骤P2中,所述的初始批量数据是查询函数f的输出结果T,用一个向量T=<x1,x2,...,xn>表示,后续对向量各分量的操作能根据下标快速计算,其中包含对向量各分量的加噪、排序、分组和重构操作。
3.根据权利要求1所述的数据发布的隐私保护方法,其特征在于,所述查询函数集F是动态更新的,其中包含的每个查询函数f对应用户提交的一个批量查询请求,查询函数的输入是查询请求指定的数据库的任意一个子集,查询函数的输出是一个n维的实数向量T,其中n小于数据库的记录数。
4.根据权利要求1所述的数据发布的隐私保护方法,其特征在于,在步骤P3中,所述批量数据加噪排序包括下述步骤:
P31:设定系统的差分隐私保护预算ε,根据向量T的维度生成随机噪声向量Y=<Y1,Y2,...,Yn>,Y的每个分量均为一个独立的随机变量;
P32:向量T添加随机噪声向量Y,得到加噪的向量<x1+Y1,x2+Y2,...,xn+Yn>;
P33:将向量<x1+Y1,x2+Y2,...,xn+Yn>进行升序排序得到
Figure FDA0002624647560000031
所述批量数据加噪排序过程消耗一半差分隐私保护预算。
5.根据权利要求4所述的数据发布的隐私保护方法,其特征在于,在步骤P31中,所述独立的随机变量为拉普拉斯变量η,其概率密度函数为
Figure FDA0002624647560000032
其中
Figure FDA0002624647560000033
6.根据权利要求1所述数据发布的隐私保护方法,其特征在于,所述分组误差,其计算方法为取平均值重构产生的误差与添加拉普拉斯噪声产生的误差的和,即为
Figure FDA0002624647560000034
7.根据权利要求1所述的数据发布的隐私保护方法,其特征在于,在步骤P42中,所述误差下界是对当前分量
Figure FDA0002624647560000035
其中一种最优分组而产生的误差的最低估计,假定在所述当前分量其后分量与所述当前分量相等且分到一组时产生,此时所述当前分量的误差为
Figure FDA0002624647560000036
CN201811273045.0A 2018-10-30 2018-10-30 一种数据发布的隐私保护方法 Active CN109492429B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811273045.0A CN109492429B (zh) 2018-10-30 2018-10-30 一种数据发布的隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811273045.0A CN109492429B (zh) 2018-10-30 2018-10-30 一种数据发布的隐私保护方法

Publications (2)

Publication Number Publication Date
CN109492429A CN109492429A (zh) 2019-03-19
CN109492429B true CN109492429B (zh) 2020-10-16

Family

ID=65693396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811273045.0A Active CN109492429B (zh) 2018-10-30 2018-10-30 一种数据发布的隐私保护方法

Country Status (1)

Country Link
CN (1) CN109492429B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135180B (zh) * 2019-05-15 2021-04-06 苏州大学 满足节点差分隐私的度分布直方图发布方法
CN111506924B (zh) * 2020-06-08 2023-10-13 Oppo广东移动通信有限公司 一种差分隐私保护方法、装置及计算机可读存储介质
CN111737744B (zh) * 2020-06-22 2022-09-30 安徽工业大学 一种基于差分隐私的数据发布方法
CN114611127B (zh) * 2022-03-15 2022-10-28 湖南致坤科技有限公司 一种数据库数据安全管理系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279713A (zh) * 2013-06-08 2013-09-04 广西师范大学 一种优化的社交网络图数据发布隐私保护方法
CN104809408A (zh) * 2015-05-08 2015-07-29 中国科学技术大学 一种基于差分隐私的直方图发布方法
CN105989161A (zh) * 2015-03-04 2016-10-05 华为技术有限公司 一种处理大数据的方法和装置
CN106991335A (zh) * 2017-02-20 2017-07-28 南京邮电大学 一种基于差分隐私保护的数据发布方法
CN107766740A (zh) * 2017-10-20 2018-03-06 辽宁工业大学 一种Spark 框架下的基于差分隐私保护的数据发布方法
CN107832631A (zh) * 2017-11-13 2018-03-23 上海斐讯数据通信技术有限公司 一种数据发布的隐私保护方法和系统
CN108197492A (zh) * 2017-12-29 2018-06-22 南京邮电大学 一种基于差分隐私预算分配的数据查询方法及系统
CN108537055A (zh) * 2018-03-06 2018-09-14 南京邮电大学 一种数据查询隐私保护的隐私预算分配和数据发布方法及其系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9471791B2 (en) * 2011-08-18 2016-10-18 Thomson Licensing Private decayed sum estimation under continual observation

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279713A (zh) * 2013-06-08 2013-09-04 广西师范大学 一种优化的社交网络图数据发布隐私保护方法
CN105989161A (zh) * 2015-03-04 2016-10-05 华为技术有限公司 一种处理大数据的方法和装置
CN104809408A (zh) * 2015-05-08 2015-07-29 中国科学技术大学 一种基于差分隐私的直方图发布方法
CN106991335A (zh) * 2017-02-20 2017-07-28 南京邮电大学 一种基于差分隐私保护的数据发布方法
CN107766740A (zh) * 2017-10-20 2018-03-06 辽宁工业大学 一种Spark 框架下的基于差分隐私保护的数据发布方法
CN107832631A (zh) * 2017-11-13 2018-03-23 上海斐讯数据通信技术有限公司 一种数据发布的隐私保护方法和系统
CN108197492A (zh) * 2017-12-29 2018-06-22 南京邮电大学 一种基于差分隐私预算分配的数据查询方法及系统
CN108537055A (zh) * 2018-03-06 2018-09-14 南京邮电大学 一种数据查询隐私保护的隐私预算分配和数据发布方法及其系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
《Towards Accurate Histogram Publication under Differential Privacy》;Xiaojian Zhang;《SIAM international conference on data mining》;20140426;第965-973页 *
《基于桶划分的差分隐私直方图发布贪心算法》;孙岚等;《厦门大学学报(自然科学版)》;20131130;第52卷(第6期);第770-775页 *
《差分隐私下一种精确直方图发布方法》;张啸剑等;《计算机研究与发展》;20161231;第53卷(第5期);第1106-1117页 *

Also Published As

Publication number Publication date
CN109492429A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN109492429B (zh) 一种数据发布的隐私保护方法
WO2023097929A1 (zh) 一种基于改进型kgat模型的知识图谱推荐方法及系统
CN106126700B (zh) 一种微博谣言传播的分析方法
US8108367B2 (en) Constraints with hidden rows in a database
EP3690677A1 (en) Differentially private query budget refunding
CN109409128B (zh) 一种面向差分隐私保护的频繁项集挖掘方法
US8078642B1 (en) Concurrent traversal of multiple binary trees
CN107249035B (zh) 一种等级动态可变的共享重复数据存储和读取方法
CN109726587B (zh) 一种基于差分隐私的空间数据划分方法
EP3356951B1 (en) Managing a database of patterns used to identify subsequences in logs
CN108280366B (zh) 一种基于差分隐私的批量线性查询方法
CN107633257B (zh) 数据质量评估方法及装置、计算机可读存储介质、终端
CN111127233A (zh) 一种社交网络无向有权图中用户核值计算方法
CN112417500A (zh) 一种隐私保护的数据流统计发布方法
CN113157198A (zh) 管理缓存的方法、设备和计算机程序产品
Chen et al. Privacy-preserving hierarchical federated recommendation systems
CN117407921A (zh) 基于必连和勿连约束的差分隐私直方图发布方法及系统
US20170134484A1 (en) Cost-effective reuse of digital assets
CN103473368A (zh) 一种基于计数排序的虚拟机实时迁移方法及系统
CN106156317A (zh) 一种基于属性划分的数据安全存储方法
WO2022134946A1 (zh) 模型训练方法、装置、存储介质及设备
Chang et al. Dynamic analysis and optimal control of ISCR rumor propagation model with nonlinear incidence and time delay on complex networks
US20070220026A1 (en) Efficient caching for large scale distributed computations
CN113158088A (zh) 一种基于图神经网络的位置推荐方法
Sakouhi et al. Hammer lightweight graph partitioner based on graph data volumes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230614

Address after: Building G1, No. 17, Software Road, Tianhe District, Guangzhou, Guangdong 510660

Patentee after: GUANGZHOU BINGO SOFTWARE CO.,LTD.

Address before: 510631 School of computer science, South China Normal University, 55 Zhongshan Avenue West, Tianhe District, Guangzhou City, Guangdong Province

Patentee before: SOUTH CHINA NORMAL University

TR01 Transfer of patent right