CN115687501A - 基于差分隐私计算保护下的电力数据关联规则挖掘方法 - Google Patents
基于差分隐私计算保护下的电力数据关联规则挖掘方法 Download PDFInfo
- Publication number
- CN115687501A CN115687501A CN202211397646.9A CN202211397646A CN115687501A CN 115687501 A CN115687501 A CN 115687501A CN 202211397646 A CN202211397646 A CN 202211397646A CN 115687501 A CN115687501 A CN 115687501A
- Authority
- CN
- China
- Prior art keywords
- vector
- privacy
- data
- association rule
- item set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于差分隐私计算保护下的电力数据关联规则挖掘方法,其特征在于,所述方法包括以下步骤:步骤1:使用向量A={ai}(i=1…n)和B={bi}(i=1…n)表示用户A和用户B的某一个属性对应的属性列;步骤2:使用瑞丽散度对属性列{A,B}的元素进行混淆,得到{A′,B′};步骤3:搜索两个分布式数据库A和B的频繁项集;步骤4:用户A和B生成随机保密向量R和R′以隐藏数据隐私,并输出对应的强关联规则;本发明可实现在不共享精确数据的条件下,获取准确的数据关系。对于需要保持多方隐私安全的分布式数据库,该方案既可用于搜索频繁项集,又能保持各方数据的隐私。
Description
技术领域
本发明具体涉及到一种基于差分隐私计算保护下的电力数据关联规则挖掘方法,属于数据安全领域。
背景技术
近年来,为了打造创新协同开放的数字生态,拓展内外部数据资源维度,构建电力大数据应用体系,开辟数据增值服务新空间,以电网数据为核心的电力数据开放共享已成为大势所趋。然而,由于电力数据包含较多的隐私信息,电力数据的开放共享将面临数据权益归属不清晰、数据开放共享义务不明、数据流通机制不完善、数据质量标准不统一、数据安全保护缺乏监管等现实性问题。一方面,电力数据的直接共享可能会导致电力用户数据和企业机密流失和泄露。另一方面,电力数据可能会被合作机构缓存甚至二次销售,进而对业务造成重大影响。因此,在电力数据共享领域,急需一种隐私保护和关联规则挖掘技术,能够实现在不共享精确数据的前提下,获取准确的数据关系。
发明内容
本发明正是针对现有技术中存在的问题,提供一种基于差分隐私计算保护下的电力数据关联规则挖掘方法,该方法解决了传统数据共享方式有可能造成隐私泄露的问题。
该方法主要利用瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。一种基于差分隐私计算保护下的电力数据关联规则挖掘方法,各数据持有者通过瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。本专利可实现在不共享精确数据的条件下,获取准确的数据关系。所述方法包括以下几个步骤:
步骤1:使用向量A={ai}(i=1…n)和B={bi}(i=1…n)表示用户A和用户B的某一个属性对应的属性列;
步骤2:使用瑞丽散度对属性列{A,B}的元素进行混淆,得到{A′,B′};
步骤3:搜索两个分布式数据库A和B的频繁项集;
步骤4:用户A和B生成随机保密向量R和R′以隐藏数据隐私,并输出对应的强关联规则。
该方法主要利用瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。
作为优选,所述的步骤2具体为,设噪声分布为z(x;μ),式中x代表该分布的随机变量,μ代表该分布的期望,定义ru为噪声分布z(x;μ)定义域内第u次随机选取的值,则加噪过程表示为:A′=A+{z(r1;μ),z(r2;μ),z(r3;μ),…,z(ru;μ),…,z(rn;μ)}。
作为优选,所述的步骤3具体包括以下子步骤:
3-1:设向量X={xi}(i=1…n)和Y={yi}(i=1…n)分别构造数据库A和B内部的所有项集。
3-4:由安全点积判断X·Y≥min_sup生成A、B间的频繁项集Lk_AB,其中安全点积的公式为:
作为优选,所述的步骤4具体包括以下子步骤:
4-1:A产生随机保密向量R=[Ri],B产生随机保密向量R′=[Ri′],A与B共享系数矩阵C=[ci,j];
4-5:若最终结果X·Y≥min_sup,则将最终结果X·Y以及频繁项集Lk_AB作为强关联规则的输出。
相对于现有技术,本发明的优点如下:本发明可实现在不共享各方精确数据的条件下,获取准确的数据强关联规则关系,同时规避电力用户数据和企业机密流失和泄露、合作机构缓存甚至二次销售等问题。对于需要保持多方隐私安全的分布式数据库,该方案既可用于搜索频繁项集,又能保持各方数据不被披露。
具体实施方式
为了加深对本发明的认识和理解,下面结合实施方式进一步介绍该技术方案。
实施例1:基于差分隐私计算保护下的电力数据关联规则挖掘方法,主要利用瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。具体包括以下步骤:
步骤1:使用向量A={ai}(i=1…n)和B={bi}(i=1…n)表示用户A和用户B的某一个属性对应的属性列;
步骤2:使用瑞丽散度对属性列{A,B}的元素进行混淆,得到{A′,B′}。其中,对属性列A进行混淆的具体操作如下,属性列B同理;
具体如下:设噪声分布为z(x;μ),式中x代表该分布的随机变量,μ代表该分布的期望,定义ru为噪声分布z(x;μ)定义域内第u次随机选取的值,则加噪过程表示为:A′=A+{z(r1;μ),z(r2;μ),z(r3;μ),…,z(ru;μ),…,z(rn;μ)};
步骤3:搜索两个分布式数据库A和B的频繁项集,具体步骤为:
3-1:设向量X={xi}(i=1…n)和Y={yi}(i=1…n)分别构造数据库A和B内部的所有项集;
3-4:由安全点积判断X·Y≥min_sup生成A、B间的频繁项集Lk_AB,其中安全点积的公式为:
步骤4:用户A和B生成随机保密向量R和R′以隐藏数据隐私,并输出对应的强关联规则。具体步骤为:
4-1:A产生随机保密向量R=[Ri],B产生随机保密向量R′=[Ri′],A与B共享系数矩阵C=[ci,j];
4-5:若最终结果X·Y≥min_sup,则将最终结果X·Y以及频繁项集Lk_AB作为强关联规则的输出。
本方案中,主要利用瑞丽散度进行差分隐私计算隐藏数据隐私,利用较多未知随机量无法从较少联立方程中逆推的原理保证安全性,搜寻多方数据库中的所有频繁项集,从而找到具有给定最小支持度和最小置信度的强关联规则。发明可实现在不共享精确数据的条件下,获取准确的数据关系。对于需要保持多方隐私安全的分布式数据库,该方案既可用于搜索频繁项集,又能保持各方数据的隐私。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。
Claims (4)
1.基于差分隐私计算保护下的电力数据关联规则挖掘方法,其特征在于,所述方法包括以下步骤:
步骤1:使用向量A={ai}(i=1…n)和B={bi}(i=1…n)表示用户A和用户B的某一个属性对应的属性列;
步骤2:使用瑞丽散度对属性列{A,B}的元素进行混淆,得到{A′,B′};
步骤3:搜索两个分布式数据库A和B的频繁项集;
步骤4:用户A和B生成随机保密向量R和R′以隐藏数据隐私,并输出对应的强关联规则。
2.根据权利要求1所述的基于差分隐私计算保护下的电力数据关联规则挖掘方法,其特征在于,所述步骤2具体为,设噪声分布为z(x;μ),式中x代表该分布的随机变量,μ代表该分布的期望,定义ru为噪声分布z(x;μ)定义域内第u次随机选取的值,则加噪过程表示为:A′=A+{z(r1;μ),z(r2;μ),z(r3;μ),…,z(ru;μ),…,z(rn;μ)}。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211397646.9A CN115687501A (zh) | 2022-11-09 | 2022-11-09 | 基于差分隐私计算保护下的电力数据关联规则挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211397646.9A CN115687501A (zh) | 2022-11-09 | 2022-11-09 | 基于差分隐私计算保护下的电力数据关联规则挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115687501A true CN115687501A (zh) | 2023-02-03 |
Family
ID=85050577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211397646.9A Pending CN115687501A (zh) | 2022-11-09 | 2022-11-09 | 基于差分隐私计算保护下的电力数据关联规则挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115687501A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364372A (zh) * | 2020-10-27 | 2021-02-12 | 重庆大学 | 一种有监督矩阵补全的隐私保护方法 |
-
2022
- 2022-11-09 CN CN202211397646.9A patent/CN115687501A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364372A (zh) * | 2020-10-27 | 2021-02-12 | 重庆大学 | 一种有监督矩阵补全的隐私保护方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101679156B1 (ko) | 블룸 필터를 숨기는 콘텐츠에 의한 안전한 개인 데이터베이스 쿼링 | |
Liu et al. | SMC: A practical schema for privacy-preserved data sharing over distributed data streams | |
CN106921674A (zh) | 抗后量子攻击的代理重加密语义可搜索加密方法 | |
CN106559422A (zh) | 基于密钥协商的多维密文区间查询方法 | |
US20170163424A1 (en) | Secure information retrieval based on hash transforms | |
US20190156057A1 (en) | Efficiently querying databases while providing differential privacy | |
CN106934301A (zh) | 一种支持密文数据操作的关系型数据库安全外包数据处理方法 | |
CN115687501A (zh) | 基于差分隐私计算保护下的电力数据关联规则挖掘方法 | |
CN106326666A (zh) | 一种健康档案信息管理服务系统 | |
CN106980796A (zh) | 云环境下基于mdb+树的多域连接关键词的搜索方法 | |
Kim et al. | A privacy-preserving k-means clustering algorithm using secure comparison protocol and density-based center point selection | |
Gahi et al. | Privacy preserving scheme for location-based services | |
Ou et al. | An Efficient and Privacy‐Preserving Multiuser Cloud‐Based LBS Query Scheme | |
CN110443069B (zh) | 一种移动社交网络隐私保护的方法、系统及设备 | |
CN114254344A (zh) | 一种基于区块链的共享数据库的隐私数据范围查询方法 | |
Zhang et al. | A dynamic searchable symmetric encryption scheme for multiuser with forward and backward security | |
CN108170753A (zh) | 一种共有云中Key-Value数据库加密与安全查询的方法 | |
CN105897419B (zh) | 一种多用户动态关键词可搜索加密方法 | |
JPWO2016203555A1 (ja) | 類似性秘匿検索システム、類似性秘匿検索方法 | |
Muhammad et al. | A secure data outsourcing scheme based on Asmuth–Bloom secret sharing | |
Calviño et al. | Privacy-preserving distributed statistical computation to a semi-honest multi-cloud | |
CN117454432B (zh) | 一种分布式环境下的隐私保护关联规则挖掘方法 | |
Chandrakar et al. | Privacy Preserving Big Data mining using Pseudonymization and Homomorphic Encryption | |
Guo et al. | Privacy preserving weighted similarity search scheme for encrypted data | |
Deng et al. | Log‐Harnack inequalities for Markov semigroups generated by non‐local Gruschin type operators |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |