CN109376549A - 一种基于差分隐私保护的电力交易大数据发布方法 - Google Patents

一种基于差分隐私保护的电力交易大数据发布方法 Download PDF

Info

Publication number
CN109376549A
CN109376549A CN201811247679.9A CN201811247679A CN109376549A CN 109376549 A CN109376549 A CN 109376549A CN 201811247679 A CN201811247679 A CN 201811247679A CN 109376549 A CN109376549 A CN 109376549A
Authority
CN
China
Prior art keywords
data
data set
query
privacy
undetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811247679.9A
Other languages
English (en)
Other versions
CN109376549B (zh
Inventor
杜龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Ruichang Technology Co Ltd
Guangzhou Electric Power Trading Center LLC
Original Assignee
Beijing Zhongke Ruichang Technology Co Ltd
Guangzhou Electric Power Trading Center LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Ruichang Technology Co Ltd, Guangzhou Electric Power Trading Center LLC filed Critical Beijing Zhongke Ruichang Technology Co Ltd
Priority to CN201811247679.9A priority Critical patent/CN109376549B/zh
Publication of CN109376549A publication Critical patent/CN109376549A/zh
Application granted granted Critical
Publication of CN109376549B publication Critical patent/CN109376549B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于差分隐私保护的电力交易大数据发布方法,包括:利用MICFS对电力交易的原始数据集的相关性进行特征选择,并选取相关性低的数据记录生成待定数据集B;利用聚类算法对B进行K‑区块划分,得到属性相互独立的多个子数据块;计算子数据块中删除某一条记录后,查询函数f询问原始数据集的敏感度GSD以及询问B的敏感度GSB;根据差分隐私并行组合性质,进行Laplace噪声的添加,得满足差分隐私的训练样本查询集将满足GSB≤GSD的B的查询集与为机器学习训练样本集;训练Lasso回归算法生成预测模型,并将原始数据集输入该模型,输出D的查询集。本发明数据发布准确性、安全性;减少计算开销和隐私预算。

Description

一种基于差分隐私保护的电力交易大数据发布方法
技术领域
本发明涉及信息技术安全领域,具体涉及一种基于差分隐私保护的电力交易大数据发布方法。
背景技术
随着智能电网及大数据技术的发展,利用发布的电力系统大数据对电力行业的状态进行数据挖掘和分析的数据共享模式,已成为电力信息化时代的发展潮流。然而,数据共享带来便捷的同时也伴随着个人隐私数据泄露的风险,因此隐私保护数据发布受到广泛关注。
传统的隐私保护数据发布模型,如k-匿名、l-多样性、t-近似等模型,它们根据原始数据的特性,将全部数据记录泛化成为若干组记录,不仅使得每一组中的各个记录无法相互区分;而且,由于缺乏对隐私保护程度的量化和对攻击者能力的清楚界定,这些模型仍然有隐私泄露风险,需不断地针对新的泄露风险提出修补方案。
差分隐私保护作为一种更强隐私保护模型,它对隐私泄露风险给出了严格的、定量化的表示和证明,从根本上解决了传统的隐私保护方法无法量化隐私保护程度和缺少对攻击模型的定义等问题。现有的差分隐私技术主要应用于交互式数据发布中,通过向查询结果中添加随机噪声保护敏感数据,以达到保护用户隐私的目的。
但是,在大数据时代,如果要实现在差分隐私的约束下提供准确的非交互式发布结果,则需要解决两个关键问题:
(1)如何减少大量查询集之间的相关性;
(2)如何对新的查询进行预测。
因为,在非交互式数据保护应用场景中,需要满足一次性对大数据集设计发布大量差分隐私的查询,而现有的基于差分隐私的非交互式数据保护技术在数据高度相关时,由于大数据集中数据间的高相关性与差分隐私的噪声机制紧密相关,高相关性会导致大量的随机噪声引入到查询结果中,使查询发布数据时无法提供准确的查询结果,导致发布数据失去应有的效用性,直接制约了差分隐私在非交互式系统中的应用。
有鉴于此,亟需解决现有差分隐私技术在非交互式数据保护应用场景中,由于大量查询集之间的高度相关性,致使查询发布数据时无法提供准确的查询结果的问题。
发明内容
本发明所要解决的技术问题是现有差分隐私技术在非交互式数据保护应用场景中,由于大量查询集之间的高度相关性,致使查询发布数据时无法提供准确的查询结果的问题。
为了解决上述技术问题,本发明所采用的技术方案是提供一种基于差分隐私保护的电力交易大数据发布方法,包括步骤如下:
步骤S10、利用基于最大信息系数的特征选择方法MICFS对电力交易的原始数据集中数据记录之间的相关性进行特征选择,统计数据集的相关性,并从原始大数据集中选取相关性低的数据记录生成待定数据集B;
步骤S20、利用聚类算法对待定数据集B进行K-区块划分,得到具有相互独立属性的k个子数据块;计算每个子数据块Di(i=1,2,...,k)中删除某一条记录j后,查询函数f询问原始数据集D的敏感度GSD以及询问待定数据集B的敏感度GSB
步骤S30、根据差分隐私并行组合性质,利用查询函数f询问待定数据集B的敏感度,进行Laplace噪声的添加,获得满足差分隐私的训练样本查询集ε为总的隐私预算;
步骤S40、将满足GSB≤GSD的待定数据集B的查询集f(B)与待定数据集B满足差分隐私的训练样本查询集作为机器学习的训练样本集并利用训练样本集T训练Lasso回归算法模型,生成预测模型M;
步骤S50、将原始数据集输入到预测模型M中,输出满足差分隐私原始数据集D的查询集并对该查询集进行最终数据发布。
在上述方法中,步骤S10具体包括以下步骤:
步骤S11、初始化包含所有变量n的原始数据集D及待定数据集B,待定数据集B初始状态为空集;
步骤S12、从原始数据集D中选取候选变量fi,计算fi与因变量C之间的最大信息系数MIC(fi,C);
步骤S13、对计算出的最大信息系数排序,并选择最大的最大信息系数值作为初始变量,则D=D-{fi},B=B+{fi};
步骤S14、使用贪婪算法(Greedy Algorithm)进行特征选择,直到选定变量的数目达到预设数量ρ;
步骤S15、输出包含所有选定变量的待定数据集B。
在上述方法中,计算查询函数f询问数据的敏感度GS的方法为:
B={D1,D2,...,Dk}为k-区块划分数据集,其中,是数据集Di与删除数据集Di的第j条数据后产生的数据集之间的不同数据记录;则查询函数f的敏感度计算公式为:
其中,
v(xj)表示数据记录xj的值,g(·)表示数据xj与它的相关记录之间的依赖关系;
定义差分隐私为其中,为隐私机制,ε为总的隐私预算。
在上述方法中,最大信息系数MIC(fi,C)计算公式为:
互信息P(fi,C)为两个变量的联合概率分布,B(n)=n0.6
在上述方法中,步骤S14具体为:
计算选择变量fB与候选变量fi之间的最大信息系数MIC(fB,fi);
选择最大值以下的评估函数的变量作为下一个变量,则
循环以上两个步骤直到选定变量的数目达到预设数目ρ。
在上述方法中,利用训练样本机器训练Lasso回归算法模型,生成预测模型M的方法为:
应用Lasso回归模型,通过输入变量的固定非线性函数的线性组合获得预测模型M;
其中μ是的均值,u是预先定义参数用来控制基函数的可伸缩性;
当生成模型M时,新查询答案由M生成且不消耗任何隐私预算。
与现有技术相比,本发明具有以下有益效果:
(1)将非交互式的差分隐私数据发布问题转化成具有差分隐私约束的机器学习问题,利用基于最大信息系数的特征选择方法重新构造相关数据的依赖关系,提高了查询函数敏感度的准确性,有效地解决了引入噪声过大导致准确性降低的问题;
(2)实现大数据集数据记录的整体隐私保护会消耗过多的计算资源和隐私预算,该方法通过将大数据集分块处理,对少量数据记录应用机器学习方法实现差分隐私,然后根据差分隐私的并行组合性质,实现整个大数据集上的隐私保护,减少计算开销和隐私预算;
(3)应用Lasso回归算法训练样本产生预测模型,通过预测模型发布满足差分隐私的数据集,而不是直接从原始数据集得出,这使得攻击者无法通过对比发布数据差异来获得用户信息,安全性进一步提高。
(4)预测模型的隐私级别由在训练时消耗的隐私预算εi确定,这使得添加的噪声不会过小,能满足数据保护的目的;也不会过大,能保障数据的准确性,即最大限度的保护数据不被泄露的同时,维持数据的准确性及平衡性。
附图说明
图1为本发明提供的一种基于差分隐私保护的电力交易大数据发布方法的流程图;
图2为本发明中步骤S10的具体流程图。
具体实施方式
本发明提出一种基于差分隐私保护的电力交易大数据发布方法,旨在非交互式差分隐私框架下,保证电力交易大数据中个人敏感数据的安全性的同时确保发布数据的可用性。
为了解决现有差分隐私技术在非交互式数据保护应用场景中,由于大量查询集之间的高度相关性,致使查询发布数据时无法提供准确的查询结果的问题,本发明在不考虑攻击者拥有什么样的背景知识的情况下,利用机器学习与差分隐私技术实现隐私保护数据发布,通过有效地选取相关性较低的查询数据集作为训练样本,并利用Lasso回归算法训练样本生成预测模型;再利用预测模型回答当前提交的查询,以及预测来自数据集的新查询的结果。与传统方法相比,本发明中生成的预测模型有效的提高了非交互式数据发布查询结果的准确性,并确保了发布数据的可用性。
如图1所示,一种基于差分隐私保护的电力交易大数据发布方法,包括步骤如下:
一、相关性较低的训练样本选择。
步骤S10、利用基于最大信息系数的特征选择方法MICFS(Feature Select basedon Maximal Information Coefficient)对电力交易的原始数据集(图1中电力交易大数据集D,包含不同IDi的子数据集,每个子数据集包括n条数据记录)中数据记录之间的相关性进行特征选择,统计原始数据集的相关性,并从原始大数据集中选取相关性低的数据记录生成待定数据集B,作为机器学习训练样本。
二、实现训练样本的差分隐私。
步骤S20、利用聚类算法(k-means)对待定数据集B进行K-区块划分,得到具有相互独立属性的k个子数据块,即B={D1,D2,...,Dk},且子数据块D1∪D2∪,..∪Dk=B相互独立;计算每个子数据块Di(i=1,2,...,k)中删除某一条记录j后查询函数f询问原始数据集D的敏感度GSD以及查询函数f询问待定数据集B中每个子数据块Di的敏感度GSB
在本发明中,计算查询函数f询问数据集的敏感度GS方法为:
B={D1,D2,...,Dk}为k-区块划分数据集,Di(i=1,2,...k)其中,是数据集Di与删除数据集Di的第j条数据后产生的数据集之间的不同数据记录;查询函数f的敏感度GS(包括查询函数f询问原始数据集D的敏感度GSD和查询函数f询问原始数据集B的敏感度GSB)计算公式为:
其中,
v(xj)表示数据记录xj的值,g(·)表示数据xj与它的相关记录之间的依赖关系;
所定义差分隐私为其中,为隐私机制,ε为总的隐私预算。
步骤S30、根据差分隐私并行组合性质,利用查询函数f询问待定数据集B的敏感度,进行Laplace噪声的添加,获得满足差分隐私的训练样本查询集。在本发明中,对于待定数据集B={D1,D2,...,Dk},要每个子数据块Di满足差分隐私的顺序组合性质,则需要每个数据块Di满足εi-差分隐私,即待定数据集B满足其中εi为每个数据块Di的隐私预算,得到满足差分隐私的训练样本查询集 其中,f(B)为待定数据集B的查询集,为待定数据集B满足差分隐私的训练样本查询集。
三、生成预测模型。
步骤S40、根据上述步骤获取的低相关性数据集(待定数据集),将满足GSB≤GSD的待定数据集B的查询集f(B)与待定数据集B满足差分隐私的训练样本查询集作为机器学习的训练样本集利用训练样本集T训练Lasso回归算法模型,生成预测模型M;其中GSB为查询函数f询问原始数据集B的敏感度,GSD为查询函数f询问原始数据集D的敏感度。
四、大数据的发布。
步骤S50、将原始数据集输入到预测模型M中,输出满足差分隐私原始数据集D的查询集并进行最终数据发布。
在本发明中,如图2所示,步骤S10包括以下步骤:
步骤S11、初始化包含所有变量n的原始数据集D及待定数据集B,待定数据集B初始状态为空集;
步骤S12、从原始数据集D中选取候选变量fi,计算fi与因变量C之间的最大信息系数MIC(fi,C);最大信息系数MIC(fi,C)计算公式为:
互信息P(fi,C)为两个变量的联合概率分布,B(n)=n0.6
步骤S13、对计算出的最大信息系数排序,并选择最大的最大信息系数值作为初始变量,则D=D-{fi},B=B+{fi};
步骤S14、使用贪婪算法(Greedy Algorithm)进行特征选择,直到选定变量的数目达到预设数量ρ;
在本发明中,步骤S14具体为:
a)计算选择变量fB与候选变量fi之间的最大信息系数MIC(fB,fi);
b)选择最大值以下的评估函数的变量作为下一个变量,则
循环以上两个步骤直到选定变量的数目达到预设数目ρ;
步骤S15、输出包含所有选定变量的待定数据集B,作为相关性低的待定数据集。
在本发明中,利用训练样本机器训练Lasso回归算法模型,生成预测模型M的方法为:
应用Lasso回归模型,通过输入变量的固定非线性函数的线性组合获得预测模型M,其中 μ是的均值,u是预先定义参数用来控制基函数的可伸缩性。当生成模型M时,新查询答案由M生成且不消耗任何隐私预算。
预测模型M的性能受噪声误差EN与模型误差EM两类误差的影响,其中,噪声误差EN由添加到训练样本集中的噪声引起,模型误差EM由学习模型的弱精确度引起。
在本发明中,训练样本集的选择有两个准则,满足这两个准则可以有效地减少上述的两类误差,产生性能良好的预测模型M:
a)数据的独立性:由于数据集B是在相关性低的数据中选取,因此数据集B中数据间的独立性较高,在对数据集B进行分块处理后的每个数据块Di(i=1,2,...,k)之间相互独立,数据之间独立性与灵敏度高度相关,选择高度独立的数据作为训练集会有效的降低噪声误差EN及查询函数的敏感度,减少添加到数据集中的噪声,从而确保发布数据的效用性;
b)变量的选取范围:模型误差EM由训练集中包含的变量数量决定,如果训练集不能覆盖某些变量或一个查询涵盖所有变量,都会导致很高的模型误差EM。因此训练集应由具有最大覆盖范围的查询生成,并且保证这些查询之间具有最小的相关性,从而降低由学习模型的弱精确度引起的模型误差EM
应用满足上述两种选择标准训练产生的差分隐私预测模型,将原始数据集中的数据记录输入到预测模型M中,输出满足差分隐私的查询集最终发布数据集,不仅准确性,并确保了发布数据的可用性。
本发明并不局限于上述最佳实施方式,任何人应该得知在本发明的启示下做出的结构变化,凡是与本发明具有相同或相近的技术方案,均落入本发明的保护范围之内。

Claims (6)

1.一种基于差分隐私保护的电力交易大数据发布方法,其特征在于,包括步骤如下:
步骤S10、利用最大信息系数的特征选择方法MICFS对电力交易的原始数据集中数据记录之间的相关性进行特征选择,统计数据集的相关性,并从原始大数据集中选取相关性低的数据记录生成待定数据集B;
步骤S20、利用聚类算法对待定数据集B进行K-区块划分,得到具有相互独立属性的k个子数据块;计算每个子数据块Di(i=1,2,...,k)中删除某一条记录j后,查询函数f询问原始数据集D的敏感度GSD以及询问待定数据集B的敏感度GSB
步骤S30、根据差分隐私并行组合性质,利用查询函数f询问待定数据集B的敏感度,进行Laplace噪声的添加,获得满足差分隐私的训练样本查询集ε为总的隐私预算;
步骤S40、将满足GSB≤GSD的待定数据集B的查询集f(B)与待定数据集B满足差分隐私的训练样本查询集作为机器学习的训练样本集T=<f(B),并利用训练样本集T训练Lasso回归算法模型,生成预测模型M;
步骤S50、将原始数据集输入到预测模型M中,输出满足差分隐私原始数据集D的查询集对该查询集进行最终数据发布。
2.如权利要求1所述的方法,其特征在于,步骤S10具体包括以下步骤:
步骤S11、初始化包含所有变量n的原始数据集D及待定数据集B,待定数据集B初始状态为空集;
步骤S12、从原始数据集D中选取候选变量fi,计算fi与因变量C之间的最大信息系数MIC(fi,C);
步骤S13、对计算出的最大信息系数排序,并选择最大的最大信息系数值作为初始变量,则D=D-{fi},B=B+{fi};
步骤S14、使用贪婪算法进行特征选择,直到选定变量的数目达到预设数量ρ;
步骤S15、输出包含所有选定变量的待定数据集B。
3.如权利要求1所述的方法,其特征在于,计算查询函数f询问数据的敏感度GS的方法为:
B={D1,D2,...,Dk}为k-区块划分数据集,其中,是数据集Di与删除数据集Di的第j条数据后产生的数据集之间的不同数据记录;则查询函数f的敏感度计算公式为:
其中,
v(xj)表示数据记录xj的值,g(·)表示数据xj与它的相关记录之间的依赖关系;
定义差分隐私为其中,为隐私机制,ε为隐私预算。
4.如权利要求2所述的方法,其特征在于,最大信息系数MIC(fi,C)计算公式为:
互信息P(fi,C)为两个变量的联合概率分布,B(n)=n0.6
5.如权利要求2所述的方法,其特征在于,步骤S14具体为:
计算选择变量fB与候选变量fi之间的最大信息系数MIC(fB,fi);
选择最大值以下的评估函数的变量作为下一个变量,则
循环以上两个步骤直到选定变量的数目达到预设数目ρ。
6.如权利要求1所述的方法,其特征在于,利用训练样本机器训练Lasso回归算法模型,生成预测模型M的方法为:
应用Lasso回归模型,通过输入变量的固定非线性函数的线性组合获得预测模型M;
其中μ是的均值,u是预先定义参数用来控制基函数的可伸缩性;
当生成模型M时,新查询答案由M生成且不消耗任何隐私预算。
CN201811247679.9A 2018-10-25 2018-10-25 一种基于差分隐私保护的电力交易大数据发布方法 Expired - Fee Related CN109376549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811247679.9A CN109376549B (zh) 2018-10-25 2018-10-25 一种基于差分隐私保护的电力交易大数据发布方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811247679.9A CN109376549B (zh) 2018-10-25 2018-10-25 一种基于差分隐私保护的电力交易大数据发布方法

Publications (2)

Publication Number Publication Date
CN109376549A true CN109376549A (zh) 2019-02-22
CN109376549B CN109376549B (zh) 2021-09-10

Family

ID=65401435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811247679.9A Expired - Fee Related CN109376549B (zh) 2018-10-25 2018-10-25 一种基于差分隐私保护的电力交易大数据发布方法

Country Status (1)

Country Link
CN (1) CN109376549B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993212A (zh) * 2019-03-06 2019-07-09 西安电子科技大学 社交网络图片分享中的位置隐私保护方法、社交网络平台
CN110059501A (zh) * 2019-04-16 2019-07-26 广州大学 一种基于差分隐私的安全外包机器学习方法
CN110198302A (zh) * 2019-04-26 2019-09-03 华中科技大学 一种针对智能电表数据发布的隐私保护方法及系统
CN110334546A (zh) * 2019-07-08 2019-10-15 辽宁工业大学 基于主成分分析优化的差分隐私高维数据发布保护方法
CN111625572A (zh) * 2019-02-27 2020-09-04 第四范式(北京)技术有限公司 在数据隐私保护下执行机器学习的方法和系统
CN111709532A (zh) * 2020-05-26 2020-09-25 重庆大学 基于与模型无关局部解释的在线购物代表性样本选择系统
CN112214788A (zh) * 2020-08-28 2021-01-12 国网江西省电力有限公司信息通信分公司 一种基于差分隐私的泛在电力物联网动态数据发布方法
CN112783951A (zh) * 2021-02-23 2021-05-11 合肥工业大学 一种基于抽样的大数据交易系统及方法
CN113010917A (zh) * 2021-03-16 2021-06-22 国网福建省电力有限公司 一种面向同期线损管理系统具有隐私保护的降损分析处理方法
CN115329898A (zh) * 2022-10-10 2022-11-11 国网浙江省电力有限公司杭州供电公司 基于差分隐私策略的分布式机器学习方法及系统
CN115622797A (zh) * 2022-11-16 2023-01-17 北京国电通网络技术有限公司 基于隐私保护的用电信息生成套件和用电信息生成方法
CN116305292A (zh) * 2023-05-17 2023-06-23 中国电子科技集团公司第十五研究所 基于差分隐私保护的政务数据发布方法及系统
WO2023193703A1 (en) * 2022-04-04 2023-10-12 Huawei Cloud Computing Technologies Co., Ltd. Systems, methods, and computer-readable media for secure and private data valuation and transfer
CN117910046A (zh) * 2024-03-18 2024-04-19 青岛他坦科技服务有限公司 基于差分隐私保护的电力大数据发布方法
CN117910046B (zh) * 2024-03-18 2024-06-07 国网河南省电力公司经济技术研究院 基于差分隐私保护的电力大数据发布方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8838437B1 (en) * 2011-06-30 2014-09-16 Google Inc. Language classifiers for language detection
CN104135362A (zh) * 2014-07-21 2014-11-05 南京大学 一种基于差分隐私发布的数据的可用性计算方法
CN105718948A (zh) * 2016-01-20 2016-06-29 江南大学 基于信息浓缩的隐私保护svm分类方法
CN106294131A (zh) * 2016-07-26 2017-01-04 南京航空航天大学 一种蕴含相关性特征面向系统测试用的仿真流式大数据生成方法
CN106778314A (zh) * 2017-03-01 2017-05-31 全球能源互联网研究院 一种基于k‑means的分布式差分隐私保护方法
CN107609421A (zh) * 2017-09-25 2018-01-19 深圳大学 隐私保护协同Web服务质量预测的基于邻域的协同过滤方法
CN107679415A (zh) * 2017-09-25 2018-02-09 深圳大学 隐私保护协同Web服务质量预测的基于模型的协同过滤方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8838437B1 (en) * 2011-06-30 2014-09-16 Google Inc. Language classifiers for language detection
CN104135362A (zh) * 2014-07-21 2014-11-05 南京大学 一种基于差分隐私发布的数据的可用性计算方法
CN105718948A (zh) * 2016-01-20 2016-06-29 江南大学 基于信息浓缩的隐私保护svm分类方法
CN106294131A (zh) * 2016-07-26 2017-01-04 南京航空航天大学 一种蕴含相关性特征面向系统测试用的仿真流式大数据生成方法
CN106778314A (zh) * 2017-03-01 2017-05-31 全球能源互联网研究院 一种基于k‑means的分布式差分隐私保护方法
CN107609421A (zh) * 2017-09-25 2018-01-19 深圳大学 隐私保护协同Web服务质量预测的基于邻域的协同过滤方法
CN107679415A (zh) * 2017-09-25 2018-02-09 深圳大学 隐私保护协同Web服务质量预测的基于模型的协同过滤方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KUNG, SUN-YUAN等: "Discriminant component analysis for privacy protection and visualization of big data", 《MULTIMEDIA TOOLS AND APPLICATIONS 》 *
张啸剑: "面向数据发布和分析的差分隐私保护", 《计算机学报》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625572B (zh) * 2019-02-27 2023-01-06 第四范式(北京)技术有限公司 在数据隐私保护下执行机器学习的方法和系统
CN111625572A (zh) * 2019-02-27 2020-09-04 第四范式(北京)技术有限公司 在数据隐私保护下执行机器学习的方法和系统
CN109993212A (zh) * 2019-03-06 2019-07-09 西安电子科技大学 社交网络图片分享中的位置隐私保护方法、社交网络平台
CN110059501A (zh) * 2019-04-16 2019-07-26 广州大学 一种基于差分隐私的安全外包机器学习方法
CN110198302A (zh) * 2019-04-26 2019-09-03 华中科技大学 一种针对智能电表数据发布的隐私保护方法及系统
CN110198302B (zh) * 2019-04-26 2020-05-19 华中科技大学 一种针对智能电表数据发布的隐私保护方法及系统
CN110334546B (zh) * 2019-07-08 2021-11-23 辽宁工业大学 基于主成分分析优化的差分隐私高维数据发布保护方法
CN110334546A (zh) * 2019-07-08 2019-10-15 辽宁工业大学 基于主成分分析优化的差分隐私高维数据发布保护方法
CN111709532A (zh) * 2020-05-26 2020-09-25 重庆大学 基于与模型无关局部解释的在线购物代表性样本选择系统
CN111709532B (zh) * 2020-05-26 2023-09-22 重庆大学 基于与模型无关局部解释的在线购物代表性样本选择系统
CN112214788B (zh) * 2020-08-28 2023-07-25 国网江西省电力有限公司信息通信分公司 一种基于差分隐私的泛在电力物联网动态数据发布方法
CN112214788A (zh) * 2020-08-28 2021-01-12 国网江西省电力有限公司信息通信分公司 一种基于差分隐私的泛在电力物联网动态数据发布方法
CN112783951A (zh) * 2021-02-23 2021-05-11 合肥工业大学 一种基于抽样的大数据交易系统及方法
CN113010917A (zh) * 2021-03-16 2021-06-22 国网福建省电力有限公司 一种面向同期线损管理系统具有隐私保护的降损分析处理方法
WO2023193703A1 (en) * 2022-04-04 2023-10-12 Huawei Cloud Computing Technologies Co., Ltd. Systems, methods, and computer-readable media for secure and private data valuation and transfer
CN115329898A (zh) * 2022-10-10 2022-11-11 国网浙江省电力有限公司杭州供电公司 基于差分隐私策略的分布式机器学习方法及系统
CN115622797A (zh) * 2022-11-16 2023-01-17 北京国电通网络技术有限公司 基于隐私保护的用电信息生成套件和用电信息生成方法
CN115622797B (zh) * 2022-11-16 2023-04-07 北京国电通网络技术有限公司 基于隐私保护的用电信息生成套件和用电信息生成方法
CN116305292A (zh) * 2023-05-17 2023-06-23 中国电子科技集团公司第十五研究所 基于差分隐私保护的政务数据发布方法及系统
CN116305292B (zh) * 2023-05-17 2023-08-08 中国电子科技集团公司第十五研究所 基于差分隐私保护的政务数据发布方法及系统
CN117910046A (zh) * 2024-03-18 2024-04-19 青岛他坦科技服务有限公司 基于差分隐私保护的电力大数据发布方法
CN117910046B (zh) * 2024-03-18 2024-06-07 国网河南省电力公司经济技术研究院 基于差分隐私保护的电力大数据发布方法

Also Published As

Publication number Publication date
CN109376549B (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
CN109376549A (zh) 一种基于差分隐私保护的电力交易大数据发布方法
Bifet et al. New ensemble methods for evolving data streams
Ajdari et al. An adaptive exploration-exploitation algorithm for constructing metamodels in random simulation using a novel sequential experimental design
CN105120955B (zh) 使用集成模型的放射治疗计划
WO2021128679A1 (zh) 基于数据决策的测试数据生成方法、装置、计算机设备
US10504005B1 (en) Techniques to embed a data object into a multidimensional frame
CN105354595A (zh) 一种鲁棒视觉图像分类方法及系统
TW201734837A (zh) 一種多重抽樣模型訓練方法及裝置
CN113449048B (zh) 数据标签分布确定方法、装置、计算机设备和存储介质
KR102227593B1 (ko) 학습-기반 그룹 태깅을 위한 시스템 및 방법
Chen et al. Identification of λ-fuzzy measures using sampling design and genetic algorithms
Sänger et al. Trust and big data: a roadmap for research
Ma et al. Parallel auto-encoder for efficient outlier detection
CN111597348A (zh) 用户画像方法、装置、计算机设备和存储介质
CN105138527B (zh) 一种数据分类回归方法及装置
Solanas et al. A variable-MDAV-based partitioning strategy to continuous multivariate microaggregation with genetic algorithms
Park et al. Exploring promising technology in ICT sector using patent network and promising index based on patent information
Zhang et al. A differentially private method for reward-based spatial crowdsourcing
Ma et al. Cluster‐reliability‐induced OWA operators
US11429582B2 (en) Techniques for creating and utilizing multidimensional embedding spaces
Li et al. Decision tree based station-level rail transit ridership forecasting
Asmild et al. Do efficiency scores depend on input mix? A statistical test and empirical illustration
He Ideological and political teaching resource sharing method based on edge computing
Beh et al. Non‐symmetrical correspondence analysis with concatenation and linear constraints
Fu et al. ProjPert: Projection-Based Perturbation for Label Protection in Split Learning Based Vertical Federated Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210910