CN112417500B - 一种隐私保护的数据流统计发布方法 - Google Patents
一种隐私保护的数据流统计发布方法 Download PDFInfo
- Publication number
- CN112417500B CN112417500B CN202011294795.3A CN202011294795A CN112417500B CN 112417500 B CN112417500 B CN 112417500B CN 202011294795 A CN202011294795 A CN 202011294795A CN 112417500 B CN112417500 B CN 112417500B
- Authority
- CN
- China
- Prior art keywords
- data
- histogram
- divided
- privacy
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000006467 substitution reaction Methods 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 11
- 230000035945 sensitivity Effects 0.000 claims description 6
- 238000010187 selection method Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 claims description 2
- 230000003213 activating effect Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开一种隐私保护的数据流统计发布方法,应用于数据流中的统计数据发布。该方法包括:利用固定大小的滑动窗口对数据流选取一定时间长度的数据,实时计算前一个发布与当前时刻的数据点的差异度;自适应地循环分配隐私预算,确定直方图的发布方式;使用轮盘赌选择排序算法,对当前时刻的数据进行排序,得到排序后的直方图数据;对排序后的直方图数据进行基于贪心思想聚类划分操作,得到多个分组;对得到的多个分组进行均值替代后添加噪声,发布对应的加噪直方图。本发明通过将轮盘赌选择与贪心聚类分组方法结合对直方图数据进行快速精确的排序分组,降低直方图数据的发布误差,有效保证数据流发布的数据可用性。
Description
技术领域
本发明属于数据开放共享与隐私保护技术领域,具体涉及一种隐私保护的数据流统计发布方法。
背景技术
数据开放共享能产生巨大的经济和社会价值:促进数据资源流通,提升政府治理能力和社会监管能力。而数据流的统计数据含有公民的个人信息,直接其发布到平台上进行开放共享会容易造成公民隐私泄露。有关数据流发布的隐私保护技术研究比较少。传统的隐私保护数据发布技术如数据匿名以及数据加密等无法满足数据流发布的隐私保护需求:数据匿名需要特殊的攻击假设和一定的背景知识,而且匿名处理后的数据被泛化为更概括性的值导致可用性较低;数据加密技术更适合用于数据传输方面的隐私保护,其计算开销较大,很少应用在数据开放共享领域中。
新颖的差分隐私技术能提供严谨的隐私保护强度定量分析和数学论证,能无视攻击者的最大背景知识,仍能保证记录的隐私信息不被泄露,同时保留数据的统计不变性。差分隐私技术一般用于静态数据发布中,动态数据流发布的应用研究接近一片空白;直接运用处理静态数据的差分隐私发布技术会为每个滑动窗口设定固定的隐私预算,添加定量的噪声,容易令窗口内积累的噪声过大导致数据的发布误差过大,数据失真度过高,降低发布数据的可用性;当需要根据数据特点调整窗口大小时会因为固定分配的隐私预算造成预算过早耗尽,缺少加噪的部分发布数据容易泄露用户隐私信息。当动态数据的更新频次超过给定阈值,差分隐私保护机制容易因预算耗尽而失败,发布数据的隐私信息便缺少有效保护。
为了在一定程度上克服现有技术存在的问题于与不足,本发明提供一种隐私保护的数据流统计发布方法。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种隐私保护的数据流统计发布方法,能够较好的满足流式数据发布的隐私保护需求。
本发明的目的是通过下述技术方案实现的:
一种隐私保护的数据流统计发布方法,包括以下步骤:
步骤一:利用固定大小的滑动窗口对数据流选取一定时间长度的数据,实时计算前一个发布与当前时刻的数据点的差异度;
步骤二:自适应地循环分配隐私预算,确定直方图的发布方式;
步骤三:使用轮盘赌选择排序算法,对当前时刻的数据进行排序,得到排序后的直方图数据;
步骤四:对所述排序后的直方图数据进行基于贪心思想的聚类划分操作,得到多个分组;
步骤五:对得到的多个分组进行均值替代后添加噪声,发布对应的加噪直方图;
优选的,在所述步骤一中,所述利用固定大小的滑动窗口对数据流选取一定时间长度的数据,实时计算前一个发布与当前时刻的数据点的差异度包括:
给定一个无限生成的数据流表示为T={D1,D2,…,Di-1,Di,…},其中,数据点Di表示为在时间区间[i-1,i)下,数据流中所有用户发生事件xi1、xi2、…、xid等的记录的统计数序列,Di={xi1,xi2,…,xid},其中,xij,j=1,2,…d为数据流在第i个时间戳下,发生了事件xj的记录{xj=1,0,…,0}的频数,对于任意时间戳i,激活一个w时间长度的滑动窗口覆盖i-w+1到i时间戳上的数据集,截选部分数据Tw={Di-w+1,Di-w+2,…,Di};
实时计算前一个发布与当前时刻的数据点的差异度其计算方式为:其中,表示在时间戳i-1下发布的加噪直方图对应的数据,k=1,2,…,d是指i-1时刻发布的加噪直方图中的事件k的桶计数。
优选的,在所述步骤二中,所述的自适应地循环分配隐私预算,确定直方图的发布方式包括:
计算数据点Di的待分配隐私预算εi,若当前时刻i小于窗口长度w,令否则,其中,ε代表总的隐私预算,εk为k时刻发布的数据点已分配的预算大小;
将前一个发布与当前时刻的数据点的差异度与待添加的噪声规模比较大小,如果差异度小于待添加的噪声规模,用前一个发布的直方图作为当前时刻数据点的发布,不分配隐私预算;
如果差异度大于待添加的噪声规模,给当前时刻的数据点分配隐私预算εi,用于后续发布,其中,待添加的噪声是指服从拉普拉斯分布的随机变量S(F)为全局敏感度,噪声规模是指它的方差
优选的,所述步骤三中,轮盘赌选择排序算法包括以下步骤:
(3.1).将待发布的数据点转换为对应的直方图,从直方图中选择最小的桶计数ht作为选择条件,初始化一个空的排序队列,将ht从直方图中移除后加入到排序队列中;
(3.2).根据给出的选择条件,计算直方图中剩余桶计数的适应度;
(3.3).计算直方图中每个桶计数的选择概率和累计概率,然后用轮盘赌选择方法从中选择出一个桶计数hj,作为选择条件ht的下一个取值,将hj从直方图中移除后加入到排序队列的末端,更新选择条件的值为桶计数hj,即令ht=hj;
(3.4).重复执行步骤(3.2)和步骤(3.3),直至直方图为空集,得到所述排序队列即为排序后的直方图数据。
优选的,所述桶计数的适应度和所述选择概率包括:
任意桶计数hi的适应度用fi表示,计算方式为其中,隐私预算εi1是待分配隐私预算εi的组成部分,εi=εi1+εi2,u(H,hi)为效用函数,u(H,hi)=-|ht-hi|,Δu为效用函数的全局敏感度;
所述的选择概率是指从直方图H中选择出桶计数hi的概率P(H,hi),其计算方式为:
优选的,所述轮盘赌选择排序算法是一个随机算法,其输出范围为所述排队序列,每次选择以正比于的概率选择出桶计数hj作为下一个桶计数,满足基于指数机制的εi1-差分隐私保护。
优选的,所述用轮盘赌选择方法从中选择出一个桶计数hj是指:使用均匀分布在[0,1]区间的随机变量生成一个随机数r,从直方图中选择一个桶计数hk,使得Qk-1<r≤Qk,k=1,2,…,n成立,更新桶计数hj的值为hk,其中,累计概率Q0=0,Qn=1。
优选的,在所述步骤四中,所述对排序后的直方图数据进行基于贪心思想的聚类划分操作,得到多个分组包括:
(4.1).创建一个空分组作为待划分分组,将所述排序后的直方图的第一个桶计数作为待划分分组的第一个元素,令排序后的直方图的第二个桶计数为待划分分量;
(4.2).计算待划分分组的分组误差、待划分分量的误差下界与分组合并误差;
(4.3).如果所述误差下界与所述分组误差的和大于所述分组合并误差,将待划分分量添加到待划分分组,更新待划分分量为排序后直方图的下一个桶计数;否则,当前待划分分组完成划分,初始化一个空分组为待划分分组,继续判断待划分分量是否加入到待划分分组中;
(4.4)重复步骤(4.2)和(4.3),直至排序后的直方图所有元素完成划分,得到多个分组。
优选的,在所述步骤四中,所述待划分分组误差的、待划分分量的误差下界与分组合并误差的计算方式如下:
和其中,分组合并误差与分组误差的计算方式相同,是待划分分量,εi2=εi-εi1;Gi为当前待划分分组,|Gi|表示第i个分组Gi包含的桶计数数量,表示分组Gi的桶计数平均值,分组误差下界是指令待划分分组Gi达到分组误差最小的效果,对待划分分量与后续所有元素划分至同一分组生成最小近似误差与噪声误差的保守估计值。
优选的,在所述步骤五中,所述对得到的多个分组进行均值替代后添加噪声,发布对应的加噪直方图包括:
对得到的直方图的多个分组,用其分组的计数平均值替换分组内的各个桶计数,然后添加服从拉普拉斯分布的随机变量Lap(1/εi2),发布满足ε-差分隐私保护的加噪直方图
本发明与现有技术相比所具有的优点与有益效果如下:
(1).本发明通过将相邻时刻的数据分布差异和噪声扰动比较,选择直方图的发布方式,根据不同的发布方式自适应地使用二分法对滑动窗口内的数据分配剩余的隐私预算,确保任意滑动窗口的累计隐私预算不超过总预算ε,满足差分隐私保护机制,数据流统计信息的发布的隐私性得到有效保证。
(2).本发明在根据发布方式不同,节省的隐私预算越多,后续时刻发布的数据可用预算更多,需要添加的噪声更少,整体的发布误差也就越少;结合本发明中的选择排序和聚类分组方法,将直方图的数据高效而准确的分组,有效降低数据的分组误差,令发布的数据更接近真实值,数据发布的可用性得到保证。
附图说明
附图1是根据本发明一个实施例的隐私保护的数据流统计发布方法流程图;
附图2是基于滑动窗口模型的数据流统计数据直方图发布示例图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
如图1所示,本发明提供一种隐私保护的数据流统计发布方法,包括以下步骤:
步骤一:设定总隐私预算ε,用预设固定大小为w的滑动窗口,从实时产生的数据流T={D1,D2,…,Di-1,Di,…}中获取部分数据Tw={Di-w+1,Di-w+2,…,Di},实时计算前一个发布与当前时刻的数据点的差异度其计算方式为:其中,数据集Di表示在时间区间[i-1,i)内原始数据集属性上的计数序列Di={xi1,xi2,…,xid},d是属性取值的个数,表示在时间戳i-1下发布的加噪直方图对应的数据,以表示,k=1,2,…是指i-1时刻发布的直方图中的事件k的桶计数。
步骤二:自适应地循环分配隐私预算,计算数据点Di的待分配隐私预算εi,若处于发布早期,数据流积累的时间长度小于窗口长度,即i<w,令对窗口内w个数据点预先均分剩余隐私预算,使得ε以平稳的速度进行分配;否则,其中,ε代表总的隐私预算,ε可以取0.01,0.1,ln2,ln3,1.0等值,为k时刻发布的数据点已分配的预算大小。
将前一个发布与当前时刻的数据点的差异度与待添加的噪声规模λi 2比较,确定直方图的发布方式。如果差异度用前一个发布作为Di的伪发布,即εi=0;
如果差异度给当前时刻数据集Di分配隐私预算εi,用于后续发布其中,噪声是指服从拉普拉斯分布的随机变量其均值为0,标准差为方差为S(F)是指全局敏感度,计数查询下,S(F)=1;
步骤三:使用轮盘赌选择排序算法,对当前时刻的数据进行排序,得到排序后的直方图数据,其具体步骤为:
(3.1).待发布的数据点Di={xi1,xi2,…,xid}转换为对应的直方图Hi={h1,h2,…,hn}。其中,xi1=h1,xi2=h2,…,xid=hn,d=n。从Hi中选择最小的桶计数作为ht,将ht从Hi中移除后加入到排序队列Hsorted中;
(3.2).将ht作为下一个桶计数的选择条件,计算Hi中剩余桶计数的适应度。其中,直方图Hi={h1,h2,…,hn}中的任意桶计数hi的适应度用fi表示,隐私预算εi1是εi的组成部分,εi1建议取0.1εi、0.3εi、0.5εi等值。u(H,hi)为效用函数,其计算方式为u(H,hi)=-|ht-hi|。Δu为效用函数的全局敏感度。计数查询下,Δu=1。
(3.3).计算直方图中每个桶计数的选择概率和累计概率,选择概率是指从直方图Hi中选择出桶计数hi的概率P(H,hi),其计算方式为
其中分母表示为所有个体的适应度之和,分子表示个体hi的适应度。累计概率Qi的计算方式为然后用轮盘赌选择方法从中选择出一个桶计数hj,即使用均匀分布在[0,1]区间的随机变量生成一个随机数r,从样本集合Hsample选出一个桶计数hk,令hj=hk,使得Qk-1<r≤Qk,k=1,2,…,θ成立。其中,Q0=0,Qθ=1。作为选择条件ht的下一个取值,将hj从Hi移除后加入到排序队列Hsorted的末端,令ht=hj;
(3.4).重复执行步骤(3.2)和步骤(3.3),直至直方图Hi为空集。得到排序后的直方图数据Hsorted={c1,c2,…cn}。
步骤四:对所述排序后的直方图数据进行基于贪心思想的聚类划分操作,得到多个分组。其过程如下:
(4.1).创建一个空分组令当前待划分分组Gi=G1。将所述排序后的直方图Hsorted={c1,c2,…cn}中的第一个元素c1添加到分组Gi中。令当前待划分变量
(4.2).计算分组Gi的分组误差Error(Gi): 计算分组误差下界 计算加入到分组Gi的合并分组误差其中,隐私预算εi2是分配给当前时刻数据集的隐私预算εi的部分,εi2=εi-εi1。|Gi|表示第i个分组Gi包含的桶计数个数,表示分组的计数平均值;分组误差下界是指令当前分组Gi达到分组误差最小的效果,对待划分分量与后续所有元素划分至同一组生成最小近似误差与噪声误差的保守估计,分组误差由近似误差与噪声误差组成;。
(4.3)比较合并分组误差和分组误差Error(Gi)与分组误差下界的和的大小,如果则待划分分量加入到分组Gi中,下标j前移;否则,当前分组Gi完成划分,下标i前移,判断待划分分量是否加入到新的当前分组Gi中。
(4.4).重复步骤(4.2)和(4.3),直至直方图Hsorted={c1,c2,…cn}所有元素被划分形成m个分组G={G1,G2,…,Gm}。
步骤五:对得到的直方图G={G1,G2,…,Gm}每个分组内的桶计数ci,用分组的计数平均值进行替代,然后添加服从拉普拉斯分布的随机变量Lap(1/εi2)。即发布满足ε-差分隐私保护的加噪直方图
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (7)
1.一种隐私保护的数据流统计发布方法,其特征在于,包括以下步骤:
步骤一:利用固定大小的滑动窗口对数据流选取一定时间长度的数据,实时计算前一个发布与当前时刻的数据点的差异度;具体为:
给定一个无限生成的数据流表示为T={D1,D2,...,Di-1,Di,...},其中,数据点Di表示为在时间区间[i-1,i)下,数据流中所有用户发生事件xi1、xi2、...、xid的记录的统计数序列,Di={xi1,xi2,...,xid},其中,xij,j=1,2,...d为数据流在第i个时间戳下,发生了事件xj的记录{xj=1,0,...,0}的频数,对于任意时间戳i,激活一个w时间长度的滑动窗口覆盖i-w+1到i时间戳上的数据集,截选部分数据Tw={Di-w+1,Di-w+2,...,Di};
实时计算前一个发布与当前时刻的数据点的差异度其计算方式为:其中,表示在时间戳i-1下发布的加噪直方图对应的数据,是指i-1时刻发布的加噪直方图中的事件k的桶计数;
步骤二:自适应地循环分配隐私预算,确定直方图的发布方式;具体为:
计算数据点Di的待分配隐私预算εi,若当前时刻i小于窗口长度w,令 否则,其中,ε代表总的隐私预算,εk为k时刻发布的数据点已分配的预算大小;
将前一个发布与当前时刻的数据点的差异度与待添加的噪声规模比较大小,如果差异度小于待添加的噪声规模,用前一个发布的直方图作为当前时刻数据点的发布,不分配隐私预算;
如果差异度大于待添加的噪声规模,给当前时刻的数据点分配隐私预算εi,用于后续发布,其中,待添加的噪声是指服从拉普拉斯分布的随机变量S(F)为全局敏感度,噪声规模是指它的方差
步骤三:使用轮盘赌选择排序算法,对当前时刻的数据进行排序,得到排序后的直方图数据;具体为:
轮盘赌选择排序算法包括以下步骤:
(3.1).将待发布的数据点转换为对应的直方图,从直方图中选择最小的桶计数ht作为选择条件,初始化一个空的排序队列,将ht从直方图中移除后加入到排序队列中;
(3.2).根据给出的选择条件,计算直方图中剩余桶计数的适应度;
(3.3).计算直方图中每个桶计数的选择概率和累计概率,然后用轮盘赌选择方法从中选择出一个桶计数hj,作为选择条件ht的下一个取值,将hj从直方图中移除后加入到排序队列的末端,更新选择条件的值为桶计数hj,即令ht=hj;
(3.4).重复执行步骤(3.2)和步骤(3.3),直至直方图为空集,得到所述排序队列即为排序后的直方图数据;
步骤四:对所述排序后的直方图数据进行基于贪心思想的聚类划分操作,得到多个分组;
步骤五:对得到的多个分组进行均值替代后添加噪声,发布对应的加噪直方图。
2.根据权利要求1所述的隐私保护的数据流统计发布方法,其特征在于,所述桶计数的适应度和所述选择概率包括:
任意桶计数hi的适应度用fi表示,计算方式为其中,隐私预算εi1是待分配隐私预算εi的组成部分,εi=εi1+εi2,u(H,hi)为效用函数,u(H,hi)=-|ht-hi|,Δu为效用函数的全局敏感度;
所述的选择概率是指从直方图H中选择出桶计数hi的概率P(H,hi),其计算方式为:
3.根据权利要求1所述的隐私保护的数据流统计发布方法,其特征在于,所述轮盘赌选择排序算法是一个随机算法,其输出范围为排队序列,每次选择以正比于的概率选择出桶计数hj作为下一个桶计数,满足基于指数机制的εi1-差分隐私保护。
4.根据权利要求1所述的隐私保护的数据流统计发布方法,其特征在于,所述用轮盘赌选择方法从中选择出一个桶计数hj是指:使用均匀分布在[0,1]区间的随机变量生成一个随机数r,从直方图中选择一个桶计数hk,使得Qk-1<r≤Qk,k=1,2,...,n成立,更新桶计数hj的值为hk,其中,累计概率Q0=0,Qn=1。
5.根据权利要求1所述的隐私保护的数据流统计发布方法,其特征在于,在所述步骤四中,对排序后的直方图数据进行基于贪心思想的聚类划分操作,得到多个分组包括:
(4.1).创建一个空分组作为待划分分组,将所述排序后的直方图的第一个桶计数作为待划分分组的第一个元素,令排序后的直方图的第二个桶计数为待划分分量;
(4.2).计算待划分分组的分组误差、待划分分量的误差下界与分组合并误差;
(4.3).如果所述误差下界与所述分组误差的和大于所述分组合并误差,将待划分分量添加到待划分分组,更新待划分分量为排序后直方图的下一个桶计数;否则,当前待划分分组完成划分,初始化一个空分组为待划分分组,继续判断待划分分量是否加入到待划分分组中;
(4.4)重复步骤(4.2)和(4.3),直至排序后的直方图所有元素完成划分,得到多个分组。
6.根据权利要求5所述的隐私保护的数据流统计发布方法,其特征在于,在所述步骤四中,所述待划分分组的分组误差、待划分分量的误差下界与分组合并误差的计算方式如下:
和 其中,分组合并误差与分组误差的计算方式相同,是待划分分量,εi2=εi-εi1;Gi为当前待划分分组,|Gi|表示第i个分组Gi包含的桶计数数量,表示分组Gi的桶计数平均值,分组误差下界是指令待划分分组Gi达到分组误差最小的效果,对待划分分量与后续所有元素划分至同一分组生成最小近似误差与噪声误差的保守估计值。
7.根据权利要求6所述的隐私保护的数据流统计发布方法,其特征在于,在所述步骤五中,所述对得到的多个分组进行均值替代后添加噪声,发布对应的加噪直方图包括:
对得到的直方图的多个分组,用其分组的计数平均值替换分组内的各个桶计数,然后添加服从拉普拉斯分布的随机变量Lap(1/εi2),发布满足ε-差分隐私保护的加噪直方图
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011294795.3A CN112417500B (zh) | 2020-11-18 | 2020-11-18 | 一种隐私保护的数据流统计发布方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011294795.3A CN112417500B (zh) | 2020-11-18 | 2020-11-18 | 一种隐私保护的数据流统计发布方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112417500A CN112417500A (zh) | 2021-02-26 |
CN112417500B true CN112417500B (zh) | 2024-07-19 |
Family
ID=74773380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011294795.3A Active CN112417500B (zh) | 2020-11-18 | 2020-11-18 | 一种隐私保护的数据流统计发布方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112417500B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113672979B (zh) * | 2021-08-19 | 2024-02-09 | 安徽工业大学 | 基于桶结构划分的差分隐私非等距直方图发布方法和装置 |
CN113779633B (zh) * | 2021-09-16 | 2024-04-09 | 咪咕文化科技有限公司 | 一种数据处理方法、装置及设备 |
CN114780974B (zh) * | 2022-04-07 | 2024-10-29 | 中南民族大学 | 基于二分裂变的差分隐私直方图发布方法、系统及设备 |
CN115329898B (zh) * | 2022-10-10 | 2023-01-24 | 国网浙江省电力有限公司杭州供电公司 | 基于差分隐私策略的多属性数据发布方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046160A (zh) * | 2015-07-21 | 2015-11-11 | 东华大学 | 一种基于直方图的面向数据流差分隐私发布方法 |
CN108763956A (zh) * | 2018-05-24 | 2018-11-06 | 辽宁工业大学 | 一种基于分形维数的流式数据差分隐私保护发布方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101139409B1 (ko) * | 2008-12-16 | 2012-04-27 | 한국전자통신연구원 | 다수의 데이터 릴리즈를 지원하는 프라이버시 보존 데이터 클러스터링 방법 |
WO2013066573A1 (en) * | 2011-11-02 | 2013-05-10 | Thomson Licensing | Privacy auction mechanism |
CN104090952B (zh) * | 2014-07-02 | 2017-09-26 | 华中科技大学 | 一种估算滑动窗口下的数据流平均值的方法与系统 |
-
2020
- 2020-11-18 CN CN202011294795.3A patent/CN112417500B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046160A (zh) * | 2015-07-21 | 2015-11-11 | 东华大学 | 一种基于直方图的面向数据流差分隐私发布方法 |
CN108763956A (zh) * | 2018-05-24 | 2018-11-06 | 辽宁工业大学 | 一种基于分形维数的流式数据差分隐私保护发布方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112417500A (zh) | 2021-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112417500B (zh) | 一种隐私保护的数据流统计发布方法 | |
Jiang et al. | Model pruning enables efficient federated learning on edge devices | |
WO2021179462A1 (zh) | 基于改进量子蚁群算法的Spark平台任务调度方法 | |
Gaber et al. | A framework for resource-aware knowledge discovery in data streams: a holistic approach with its application to clustering | |
CN113515351B (zh) | 一种基于能耗与QoS协同优化的资源调度实现方法 | |
CN109885397B (zh) | 一种边缘计算环境中时延优化的负载任务迁移算法 | |
CN107249035B (zh) | 一种等级动态可变的共享重复数据存储和读取方法 | |
Zhang et al. | Optimization of image transmission in cooperative semantic communication networks | |
Balakrishnan et al. | Diverse client selection for federated learning: Submodularity and convergence analysis | |
CN116050540B (zh) | 一种基于联合双维度用户调度的自适应联邦边缘学习方法 | |
CN111488981A (zh) | 基于高斯分布估计选取深度网络参数稀疏阈值的方法 | |
CN110704371A (zh) | 大规模数据管理与数据分发系统及方法 | |
Qu et al. | Stochastic cumulative DNN inference with RL-aided adaptive IoT device-edge collaboration | |
CN117112871B (zh) | 基于fcm聚类算法模型的数据实时高效融合处理方法 | |
CN117056089B (zh) | 一种服务动态分配系统及方法 | |
CN114756352B (zh) | 一种调度服务器计算资源的方法、装置及介质 | |
CN115310873B (zh) | 面向元宇宙的数字资源调配方法、系统及存储介质 | |
CN109522915B (zh) | 病毒文件聚类方法、装置及可读介质 | |
Ge et al. | Accelerate distributed deep learning with cluster-aware sketch quantization | |
Xian et al. | H-ps: A heterogeneous-aware parameter server with distributed neural network training | |
CN114723071A (zh) | 一种基于客户端分类和信息熵的联邦学习方法及装置 | |
He et al. | Client selection and resource allocation for federated learning in digital-twin-enabled industrial Internet of Things | |
Su et al. | Expediting In-Network Federated Learning by Voting-Based Consensus Model Compression | |
CN110602569A (zh) | 一种基于带宽趋势的带宽复用方法和系统 | |
CN115018085B (zh) | 一种面向数据异构性的联邦学习参与设备选择方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |