CN115687501A - 基于差分隐私计算保护下的电力数据关联规则挖掘方法 - Google Patents

基于差分隐私计算保护下的电力数据关联规则挖掘方法 Download PDF

Info

Publication number
CN115687501A
CN115687501A CN202211397646.9A CN202211397646A CN115687501A CN 115687501 A CN115687501 A CN 115687501A CN 202211397646 A CN202211397646 A CN 202211397646A CN 115687501 A CN115687501 A CN 115687501A
Authority
CN
China
Prior art keywords
vector
privacy
data
association rule
item set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211397646.9A
Other languages
English (en)
Inventor
胡聪
蒋明
王双
张翠翠
孙佳丽
刘翠玲
张庭曾
王鹏
张昀晔
卢锐轩
朱新华
雷沁怡
徐超
孙琦
程伟
赵林燕
张良培
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Information and Telecommunication Branch of State Grid Anhui Electric Power Co Ltd
Original Assignee
Information and Telecommunication Branch of State Grid Anhui Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Information and Telecommunication Branch of State Grid Anhui Electric Power Co Ltd filed Critical Information and Telecommunication Branch of State Grid Anhui Electric Power Co Ltd
Priority to CN202211397646.9A priority Critical patent/CN115687501A/zh
Publication of CN115687501A publication Critical patent/CN115687501A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于差分隐私计算保护下的电力数据关联规则挖掘方法,其特征在于,所述方法包括以下步骤:步骤1:使用向量A={ai}(i=1…n)和B={bi}(i=1…n)表示用户A和用户B的某一个属性对应的属性列;步骤2:使用瑞丽散度对属性列{A,B}的元素进行混淆,得到{A′,B′};步骤3:搜索两个分布式数据库A和B的频繁项集;步骤4:用户A和B生成随机保密向量R和R′以隐藏数据隐私,并输出对应的强关联规则;本发明可实现在不共享精确数据的条件下,获取准确的数据关系。对于需要保持多方隐私安全的分布式数据库,该方案既可用于搜索频繁项集,又能保持各方数据的隐私。

Description

基于差分隐私计算保护下的电力数据关联规则挖掘方法
技术领域
本发明具体涉及到一种基于差分隐私计算保护下的电力数据关联规则挖掘方法,属于数据安全领域。
背景技术
近年来,为了打造创新协同开放的数字生态,拓展内外部数据资源维度,构建电力大数据应用体系,开辟数据增值服务新空间,以电网数据为核心的电力数据开放共享已成为大势所趋。然而,由于电力数据包含较多的隐私信息,电力数据的开放共享将面临数据权益归属不清晰、数据开放共享义务不明、数据流通机制不完善、数据质量标准不统一、数据安全保护缺乏监管等现实性问题。一方面,电力数据的直接共享可能会导致电力用户数据和企业机密流失和泄露。另一方面,电力数据可能会被合作机构缓存甚至二次销售,进而对业务造成重大影响。因此,在电力数据共享领域,急需一种隐私保护和关联规则挖掘技术,能够实现在不共享精确数据的前提下,获取准确的数据关系。
发明内容
本发明正是针对现有技术中存在的问题,提供一种基于差分隐私计算保护下的电力数据关联规则挖掘方法,该方法解决了传统数据共享方式有可能造成隐私泄露的问题。
该方法主要利用瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。一种基于差分隐私计算保护下的电力数据关联规则挖掘方法,各数据持有者通过瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。本专利可实现在不共享精确数据的条件下,获取准确的数据关系。所述方法包括以下几个步骤:
步骤1:使用向量A={ai}(i=1…n)和B={bi}(i=1…n)表示用户A和用户B的某一个属性对应的属性列;
步骤2:使用瑞丽散度对属性列{A,B}的元素进行混淆,得到{A′,B′};
步骤3:搜索两个分布式数据库A和B的频繁项集;
步骤4:用户A和B生成随机保密向量R和R′以隐藏数据隐私,并输出对应的强关联规则。
该方法主要利用瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。
作为优选,所述的步骤2具体为,设噪声分布为z(x;μ),式中x代表该分布的随机变量,μ代表该分布的期望,定义ru为噪声分布z(x;μ)定义域内第u次随机选取的值,则加噪过程表示为:A′=A+{z(r1;μ),z(r2;μ),z(r3;μ),…,z(ru;μ),…,z(rn;μ)}。
作为优选,所述的步骤3具体包括以下子步骤:
3-1:设向量X={xi}(i=1…n)和Y={yi}(i=1…n)分别构造数据库A和B内部的所有项集。
3-2:由
Figure BDA0003934255140000021
Figure BDA0003934255140000022
生成数据库A、B中的频繁1-项集L1_A、L1_B
3-3:分别用向量X和Y构造A和B内部的所有项集,其中xi=Πjaij,yi=Πjbij;并且aij∈L(k-1)A和bij∈L(k-1)B。根据
Figure BDA0003934255140000023
Figure BDA0003934255140000024
Figure BDA0003934255140000025
生成A、B内部的频繁项集Lk_A和Lk_B
3-4:由安全点积判断X·Y≥min_sup生成A、B间的频繁项集Lk_AB,其中安全点积的公式为:
Figure BDA0003934255140000031
作为优选,所述的步骤4具体包括以下子步骤:
4-1:A产生随机保密向量R=[Ri],B产生随机保密向量R′=[Ri′],A与B共享系数矩阵C=[ci,j];
4-2:B将向量R从r个分量扩充为n个分量,即
Figure BDA0003934255140000032
B计算向量
Figure BDA0003934255140000033
将向量Y′和R传给A;
4-3:A计算向量
Figure BDA0003934255140000034
并将向量R分成r组,求各组的和以形成新的向量
Figure BDA0003934255140000035
计算点积R·Y′,并将向量X′、
Figure BDA0003934255140000036
和R·Y′传给B;
4-4:B分别计算点积
Figure BDA0003934255140000037
X′·Y和最终结果
Figure BDA0003934255140000038
Figure BDA0003934255140000039
将结果传给A;
4-5:若最终结果X·Y≥min_sup,则将最终结果X·Y以及频繁项集Lk_AB作为强关联规则的输出。
相对于现有技术,本发明的优点如下:本发明可实现在不共享各方精确数据的条件下,获取准确的数据强关联规则关系,同时规避电力用户数据和企业机密流失和泄露、合作机构缓存甚至二次销售等问题。对于需要保持多方隐私安全的分布式数据库,该方案既可用于搜索频繁项集,又能保持各方数据不被披露。
具体实施方式
为了加深对本发明的认识和理解,下面结合实施方式进一步介绍该技术方案。
实施例1:基于差分隐私计算保护下的电力数据关联规则挖掘方法,主要利用瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。具体包括以下步骤:
步骤1:使用向量A={ai}(i=1…n)和B={bi}(i=1…n)表示用户A和用户B的某一个属性对应的属性列;
步骤2:使用瑞丽散度对属性列{A,B}的元素进行混淆,得到{A′,B′}。其中,对属性列A进行混淆的具体操作如下,属性列B同理;
具体如下:设噪声分布为z(x;μ),式中x代表该分布的随机变量,μ代表该分布的期望,定义ru为噪声分布z(x;μ)定义域内第u次随机选取的值,则加噪过程表示为:A′=A+{z(r1;μ),z(r2;μ),z(r3;μ),…,z(ru;μ),…,z(rn;μ)};
步骤3:搜索两个分布式数据库A和B的频繁项集,具体步骤为:
3-1:设向量X={xi}(i=1…n)和Y={yi}(i=1…n)分别构造数据库A和B内部的所有项集;
3-2:由
Figure BDA0003934255140000041
Figure BDA0003934255140000042
生成数据库A、B中的频繁1-项集L1_A、L1_B
3-3:分别用向量X和Y构造A和B内部的所有项集,其中xi=Пjaij,yi=Пjbij;并且aij∈L(k-1)A和bij∈L(k-1)B。根据
Figure BDA0003934255140000043
Figure BDA0003934255140000044
Figure BDA0003934255140000045
生成A、B内部的频繁项集Lk_A和Lk_B
3-4:由安全点积判断X·Y≥min_sup生成A、B间的频繁项集Lk_AB,其中安全点积的公式为:
Figure BDA0003934255140000051
步骤4:用户A和B生成随机保密向量R和R′以隐藏数据隐私,并输出对应的强关联规则。具体步骤为:
4-1:A产生随机保密向量R=[Ri],B产生随机保密向量R′=[Ri′],A与B共享系数矩阵C=[ci,j];
4-2:B将向量R从r个分量扩充为n个分量,即
Figure BDA0003934255140000052
B计算向量
Figure BDA0003934255140000053
将向量Y′和R传给A;
4-3:A计算向量
Figure BDA0003934255140000054
并将向量R分成r组,求各组的和以形成新的向量
Figure BDA0003934255140000055
计算点积R·Y′,并将向量X′、
Figure BDA0003934255140000056
和R·Y′传给B;
4-4:B分别计算点积
Figure BDA0003934255140000057
X′·Y和最终结果
Figure BDA0003934255140000058
Figure BDA0003934255140000059
将结果传给A;
4-5:若最终结果X·Y≥min_sup,则将最终结果X·Y以及频繁项集Lk_AB作为强关联规则的输出。
本方案中,主要利用瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。发明可实现在不共享精确数据的条件下,获取准确的数据关系。对于需要保持多方隐私安全的分布式数据库,该方案既可用于搜索频繁项集,又能保持各方数据的隐私。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。

Claims (4)

1.基于差分隐私计算保护下的电力数据关联规则挖掘方法,其特征在于,所述方法包括以下步骤:
步骤1:使用向量A={ai}(i=1…n)和B={bi}(i=1…n)表示用户A和用户B的某一个属性对应的属性列;
步骤2:使用瑞丽散度对属性列{A,B}的元素进行混淆,得到{A′,B′};
步骤3:搜索两个分布式数据库A和B的频繁项集;
步骤4:用户A和B生成随机保密向量R和R′以隐藏数据隐私,并输出对应的强关联规则。
2.根据权利要求1所述的基于差分隐私计算保护下的电力数据关联规则挖掘方法,其特征在于,所述步骤2具体为,设噪声分布为z(x;μ),式中x代表该分布的随机变量,μ代表该分布的期望,定义ru为噪声分布z(x;μ)定义域内第u次随机选取的值,则加噪过程表示为:A′=A+{z(r1;μ),z(r2;μ),z(r3;μ),…,z(ru;μ),…,z(rn;μ)}。
3.根据权利要求2所述的基于差分隐私计算保护下的电力数据关联规则挖掘方法,其特征在于,所述步骤3具体如下:
3-1:设向量Y={xi}(i=1…n)和Y={yi}(i=1…n)分别构造数据库A和B内部的所有项集;
3-2:由
Figure FDA0003934255130000011
Figure FDA0003934255130000012
生成数据库A、B中的频繁1-项集L1_A、L1_B
3-3:分别用向量X和Y构造A和B内部的所有项集,其中xi=Πj aij,yi=Πj bij;并且aij∈L(k-1)A和bij∈L(k-1)B,根据
Figure FDA0003934255130000013
Figure FDA0003934255130000014
生成A、B内部的频繁项集Lk_A和Lk_B
3-4:由安全点积判断Y·Y≥min_sup生成A、B间的频繁项集Lk_AB,其中安全点积的公式为:
Figure FDA0003934255130000021
4.根据权利要求3所述的基于差分隐私计算保护下的电力数据关联规则挖掘方法,其特征在于,所述步骤4具体如下:
4-1:A产生随机保密向量R=[Ri],B产生随机保密向量R′=[Ri′],A与B共享系数矩阵C=[ci,j];
4-2:B将向量R从r个分量扩充为n个分量,即
Figure FDA0003934255130000022
B计算向量
Figure FDA0003934255130000023
将向量Y′和R传给A;
4-3:A计算向量
Figure FDA0003934255130000024
并将向量R分成r组,求各组的和以形成新的向量
Figure FDA0003934255130000025
计算点积R·Y′,并将向量
Figure FDA0003934255130000026
和R·Y′传给B;
4-4:B分别计算点积
Figure FDA0003934255130000027
X′·Y和最终结果
Figure FDA0003934255130000028
Figure FDA0003934255130000029
将结果传给A;
4-5:若最终结果X·Y≥min_sup,则将最终结果X·Y以及频繁项集Lk_AB作为强关联规则的输出。
CN202211397646.9A 2022-11-09 2022-11-09 基于差分隐私计算保护下的电力数据关联规则挖掘方法 Pending CN115687501A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211397646.9A CN115687501A (zh) 2022-11-09 2022-11-09 基于差分隐私计算保护下的电力数据关联规则挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211397646.9A CN115687501A (zh) 2022-11-09 2022-11-09 基于差分隐私计算保护下的电力数据关联规则挖掘方法

Publications (1)

Publication Number Publication Date
CN115687501A true CN115687501A (zh) 2023-02-03

Family

ID=85050577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211397646.9A Pending CN115687501A (zh) 2022-11-09 2022-11-09 基于差分隐私计算保护下的电力数据关联规则挖掘方法

Country Status (1)

Country Link
CN (1) CN115687501A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364372A (zh) * 2020-10-27 2021-02-12 重庆大学 一种有监督矩阵补全的隐私保护方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364372A (zh) * 2020-10-27 2021-02-12 重庆大学 一种有监督矩阵补全的隐私保护方法

Similar Documents

Publication Publication Date Title
KR101679156B1 (ko) 블룸 필터를 숨기는 콘텐츠에 의한 안전한 개인 데이터베이스 쿼링
Liu et al. SMC: A practical schema for privacy-preserved data sharing over distributed data streams
CN106921674A (zh) 抗后量子攻击的代理重加密语义可搜索加密方法
CN106559422A (zh) 基于密钥协商的多维密文区间查询方法
US20170163424A1 (en) Secure information retrieval based on hash transforms
US20190156057A1 (en) Efficiently querying databases while providing differential privacy
CN106934301A (zh) 一种支持密文数据操作的关系型数据库安全外包数据处理方法
CN115687501A (zh) 基于差分隐私计算保护下的电力数据关联规则挖掘方法
CN106326666A (zh) 一种健康档案信息管理服务系统
CN106980796A (zh) 云环境下基于mdb+树的多域连接关键词的搜索方法
Kim et al. A privacy-preserving k-means clustering algorithm using secure comparison protocol and density-based center point selection
Gahi et al. Privacy preserving scheme for location-based services
Ou et al. An Efficient and Privacy‐Preserving Multiuser Cloud‐Based LBS Query Scheme
CN110443069B (zh) 一种移动社交网络隐私保护的方法、系统及设备
CN114254344A (zh) 一种基于区块链的共享数据库的隐私数据范围查询方法
Zhang et al. A dynamic searchable symmetric encryption scheme for multiuser with forward and backward security
CN108170753A (zh) 一种共有云中Key-Value数据库加密与安全查询的方法
CN105897419B (zh) 一种多用户动态关键词可搜索加密方法
JPWO2016203555A1 (ja) 類似性秘匿検索システム、類似性秘匿検索方法
Muhammad et al. A secure data outsourcing scheme based on Asmuth–Bloom secret sharing
Calviño et al. Privacy-preserving distributed statistical computation to a semi-honest multi-cloud
CN117454432B (zh) 一种分布式环境下的隐私保护关联规则挖掘方法
Chandrakar et al. Privacy Preserving Big Data mining using Pseudonymization and Homomorphic Encryption
Guo et al. Privacy preserving weighted similarity search scheme for encrypted data
Deng et al. Log‐Harnack inequalities for Markov semigroups generated by non‐local Gruschin type operators

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination