CN110222092A - 一种基于差分隐私保护技术的多方统计查询方法 - Google Patents
一种基于差分隐私保护技术的多方统计查询方法 Download PDFInfo
- Publication number
- CN110222092A CN110222092A CN201910498896.3A CN201910498896A CN110222092A CN 110222092 A CN110222092 A CN 110222092A CN 201910498896 A CN201910498896 A CN 201910498896A CN 110222092 A CN110222092 A CN 110222092A
- Authority
- CN
- China
- Prior art keywords
- numerical value
- value
- party
- secret protection
- method based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6209—Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于差分隐私保护技术的多方统计查询方法,包括:在多方环境下进行求和计算包括:确定参与所述多方环境下的n个各方,在所述各方中分别确定第一数值,并且在所述各方中选择第一数值和第二数值,在所述各方中生成n‑1个满足所述第一数值和所述第二数值的拉普拉斯分布的不同数值,选择所述各方中任意的参与方,根据所述不同数值进行数据交换计算得到第三数值,计算所述任意参与方的第三数值的总和;在多方环境下进行最大值计算包括:确定参与所述多方环境下的n个各方,在所述各方中分别确定多个第四数值,并对其转化成二进制数值,将所述输出值根据所述求和计算过程按照次序得出各方的最大值。
Description
技术领域
本发明涉及多方安全计算,具体涉及一种基于差分隐私保护技术的多方统计查询方法。
背景技术
随着信息技术的进一步发展,不同组织或个人之间的合作计算变的越来越重要。不同的数据拥有者需要通过合作计算交流信息并得到更全面更有价值的计算结果。随着合作双赢的理念日益深入人心,计算机学科里的分布式计算研究也拥有了越来越重要的地位。然而,数据安全与隐私保护问题制约着合作计算的进行,甚至在一些情况下参与各方不得不放弃合作来确保私有数据的安全。为解决该问题,越来越多的研究者投入到安全多方计算(SecureMulti-party Computation,SMC)的研究当中,力求设计分布式协议在不泄漏各方私有信息的条件下完成合作计算。目前,安全多方计算研究已经取得了一定的成果,并且成为现代密码学乃至整个计算机学科的重点研究课题之一。
在商业应用领域,竞争关系的多个商家往往为了决策需要合作进行数据挖掘来了解整个市场的情况。例如,不同的手机运营商需要通过合作计算来了解整个地区用户的手机使用情况。此时,各个商家拥有的数据是商家的私有信息不能让竞争方知道,或者商家拥有的数据本身不宜公开(如用户通话记录)。在这种情况下,多方需要在合作进行数据挖掘的同时保证各方的私有数据不被泄漏。该问题是保护私有信息的数据挖掘问题(Private-preserving DataMining,PPDM),也是安全多方计算的一个特定应用方向。
安全多方计算使不公开私有信息的合作计算成为可能,其研究促进了各个组织或个人之间的信息流通并且在各个领域拥有广阔的应用前景。然而,由于基础理论研究的复杂性和应用问题的多样性,基于传统的安全多方计算协议设计的过于复杂,不易操作。
差分隐私技术建立在坚实的数学基础之上,对隐私保护进行了严格的定义并提供了量化评估方法,使得不同参数处理下的数据集所提供的隐私保护水平具有可比较性。因此,差分隐私理论迅速被业界认可。
发明内容
本发明设计开发了一种基于差分隐私保护技术的多方统计查询方法,本发明的发明目的是在多方环境下的数据库统计查询方法,通过计算表明,这种方法可以极大地提高查询速度。
本发明提供的技术方案为:
一种基于差分隐私保护技术的多方统计查询方法,包括如下步骤:
在多方环境下进行求和计算包括:确定参与所述多方环境下的n个各方,在所述各方中分别确定第一数值,并且在所述各方中选择第一数值和第二数值,在所述各方中生成n-1个满足所述第一数值和所述第二数值的拉普拉斯分布的不同数值,选择所述各方中任意的参与方,根据所述不同数值进行数据交换计算得到第三数值,计算所述任意参与方的第三数值的总和;以及
在多方环境下进行最大值计算包括:确定参与所述多方环境下的n个各方,在所述各方中分别确定多个第四数值,并对其转化成二进制数值,将输出值根据所述求和计算过程按照次序得出各方的最大值。
优选的是,在所述求和计算中所述数据交换包括通过安全通道或者通过标准加密方法进行发送和接收。
优选的是,所述第三数值的计算过程包括:
Yi=xi-(xi,1+xi,2+…+xi,n-1)+(x1,i+x2,i+…+xn,i);
式中,xi为所述各方中拥有的数值,xi,1,xi,2,...,xi,n-1为Pi发送给各方Pj的数值,x1,i,x2,i,…,xn,i为参与方Pj发送给Pi的数值;其中,1≤j≤n,j≠i。
优选的是,所述第一数值为0.0001。
优选的是,当所述第四数值中存在非正整数时,将所述多个第四数值进行转化,使所述第四数值均为正整数。
优选的是,所述转化过程包括将所述第四数值同时乘以一个整数,使所述第四数值转化为正整数。
优选的是,所述转化成二进制数值时不足最长位数的前面数值补0使转化后的输出值位数相等。
优选的是,将所述输出值根据所述求和计算过程按照次序得出各方的最大值过程包括:
从高位开始依次比较,从第1位增加到所述二进制后最长位数,通过所述求和计算得到总和,如果总和等于0,则输出变量为0,如果总和不小于0,则输出变量为1,并且所述各方中的参与方的其中一位为0时,将其后面到最长位数都归为0,最后把输出变量按照输出次序得出最大值。
本发明与现有技术相比较所具有的有益效果:目前为止,一般认为差分隐私保护技术难以做到准确的数据查询,而本发明可以用差分隐私这种方法来实现在多方参与情况下数据准确统计查询,本发明使用的安全性是基于差分隐私保护这种机制,具有安全性保证;从查询速度来说,数据交换方法是相同,因此通信量是一致的,查询速度是一样的。
附图说明
图1为本发明实施例1中所述的数据交换的示意图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
本发明提供一种基于差分隐私保护技术的多方统计查询方法,本发明是基于差分隐私保护技术,提出一个在多方环境下的数据库统计查询方法,通过计算表明,这种方法可以极大地提高查询速度,在很多情形下超过目前其他各种方法。
本发明技术方案如下分成二个部分:
第一部分,多方环境下求和协议:
步骤一、参与的各方(P1,P2,…,Pn),各有一个值xi,各自选择一个比较小的正数∈和一个实数u;
步骤二、各方Pi生成了n-1个xi,1,xi,2,…,xi,n-1,,满足拉普拉斯分布f(u,b),
步骤三、任意的参与方Pi(1≤i≤n),通过安全通道或者通过加密方法,发送xi,j到参与方Pj(1≤j≤n,i≠j);
步骤四、任意的参与方Pi,计算
Yi=xi-(xi,1+xi,2+…+xi,n-1)+(x1,i+x2,i+…+xn,i),并公布Yi的值;
式中,xi为所述各方中拥有的数值,xi,1,xi,2,...,xi,n-1为Pi发送给各方Pj(1≤j≤n,j≠i)的数值,x1,i,x2,i,…,xn,i为参与方Pj(1≤j≤n,j≠i)发送给Pi的数值;
步骤五:参与的各方Pi,根据各方的公布值Yi,计算总和ΣiYi。
在另一种实施例中,在步骤一中,∈取正比较小的实数;u可以是任意实数;在本实施例中,作为一种优选,本条件安全性要求高,要求参数∈选取的越小,一般而言,0.0001已经比较小即足够安全,因此∈取值为0.0001,u取值为-3。
在另一种实施例中,在步骤一中,u取值为4。
在另一种实施例中,在步骤三中,使用的加密要求发送分与接受方能正常安全的加密解密就可以,保证其余人收到信息后无法解密,比如RSA算法1024位秘钥,发送方用对方的公钥加密发送给对方就可以做到。
第二部分,多方环境下求最大值协议:
步骤一、参与的各方(P1,P2,…,Pn),各有一个值xi,设其值都是正整数,如果不是,可以做一个转化;
步骤二、参与的各方Pi(1≤i≤n)将其转成二进制Zi,其中,二进制最长位数是m位;
步骤三:参与的各方Pi(1≤i≤n)二进制长度补足为m位,不足m位的前面补0;
步骤四:从高位开始依次比较,比如j等于从第1位增加到第m位
{
调用上述的求和计算第j位Yi[j]总和
如果总和sj=0,输出变量tj=0;
如果总和sj≥1,输出变量tj=1;参与计算的某一方的第j位Yi[j]如果是0,将其j位到第m位都置0;
}
步骤五:把输出变量按照输出次序t1,t2,…,tm输出即为参与的各方(P1,P2,…,Pn)的最大值。
在另一种实施例中,在步骤一中,如果设定的值不是正整数时,将各参与方的数值都乘以一个整数,使得各参与方能够通过其整数部分来区分大小即可。
实施例1
假设参与有4方,P1,P2,P3,P4;
步骤一、设P1,P2,P3,P4四个参与方各一个数x1=3,x2=4,x3=6,x4=7,同时假设选定的∈=0.01,u=0;
步骤二、设参与方P1,P2,P3,P4各生成三个满足拉普拉斯f(100,0)此处的b=100由获得的参数为
x1,2=3.5,x1,3=121.2,x1,4=-129.2,x2,1=-2.5,x2,3=87.5,x2,4=-12.5,x3,1=-21.4,x3,2=176.4,x3,4=44.5,x4,1=-12.3,x4,2=20.4,x4,3=78.6;
步骤三、如图1所示,进行数据交换:
各参与方Pi,将其生成的n-1个数分别发送给其余的n-1方,同时又从其余的n-1方各接收一个数字;然后更新自己手中的数值:减去发送出去的n-1个数字,加上接收的n-1个数字,具体如下:
P1给P2的数字是3.5,P1给P3的数字是121.2,P1给P4的数字是-129.2;
P2给P1的数字是-2.5,P2给P3的数字是87.5,P2给P4的数字是-12.5;
P3给P1的数字是-21.4,P3给P2的数字是176.4,P3给P4的数字是44.5;
P4给P1的数字是-12.3,P4给P2的数字是20.4,P4给P3的数字是78.6;
步骤四、根据公式Yi=xi-(xi,1+xi,2+…+xi,n-1)+(x1,i+x2,i+…+xn,i)
P1计算如下:Y1=3-(3.5+121.2-129.2)+(-2.5-21.4-12.3)=-28.7;
P2计算如下:Y2=4-(-2.5+87.5-12.5)+(3.5+176.4+20.4)=131.8;
P3计算如下:Y3=6-(-21.4+176.4+44.5)+(121.2+87.5+78.6)=93.8;
P4计算如下:Y4=7-(-12.3+20.4+78.6)+(-129.2-12.5+44.5)=-176.9;
步骤五、计算Y1+Y2+Y3+Y4=20即总和。
实施例2
假设参与有4方,P1,P2,P3,P4;
步骤一、设P1,P2,P3,P4四个参与方各一个数x1=3,x2=4,x3=6,x4=7,各方的值都已经是整数,不许要作转化;
步骤二、将x1,x2,x3,x4转化成二进制数:11,100,110,111;
步骤三、对x1,x2,x3,x4转化后的二进制数根据m等于3位进行补齐:011,100,110,111;
步骤四、从高位开始依次比较,j等于从第1位增加到第3位:
j=1调用第一个求和协议,计算出s等于3,s大于等于1,输出值t1=1,同时将补齐后P1的二进制其后面的二个1全部置0;
j=2调用求和协议,计算出s等于2,s大于等于1,输出值t2=1,同时将补齐后P2的二进制其后面的位全部置0;
j=3调用求和协议,计算出s等于1,s大于等于1,输出值t3=1,同时将补齐后P3的二进制其后面的位全部置0;
步骤五:得出x1,x2,x3,x4的最大值是(111)2=7。
实施例3
假设参与有4方,P1,P2,P3,P4;
步骤一、设P1,P2,P3,P4四个参与方各一个数x1=1.1,x2=2.4,x3=2.6,x4=0.3,为了消除小数位,各方根据小数位数都乘以10,此时各方的数字变成11,24,26,3;
步骤二、将x1,x2,x3,x4转化成二进制数:1011,11000,11010,11;
步骤三、对x1,x2,x3,x4转化后的二进制数根据m等于3位进行补齐:01011,11000,11010,00011;
步骤四、从高位开始依次比较,j等于从第1位增加到第5位
j=1调用求和协议,计算出s等于2,s大于等于1,输出值t1=1,同时P1,P4将其后面的1全部置0;
j=2调用求和协议,计算出s等于2,s大于等于1,输出值t2=1;
j=3调用求和协议,计算出s等于0,输出值t3=0;
j=4调用求和协议,计算出s等于1,s大于等于1,输出值t4=1,同时P2后面的1全部置为0;
j=5调用求和协议,计算出s等于0,输出值t5=0;
步骤五、得出x1,x2,x3,x4的最大值是(11010)2=26。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (8)
1.一种基于差分隐私保护技术的多方统计查询方法,其特征在于,包括如下步骤:
在多方环境下进行求和计算包括:确定参与所述多方环境下的n个各方,在所述各方中分别确定第一数值,并且在所述各方中选择第一数值和第二数值,在所述各方中生成n-1个满足所述第一数值和所述第二数值的拉普拉斯分布的不同数值,选择所述各方中任意的参与方,根据所述不同数值进行数据交换计算得到第三数值,计算所述任意参与方的第三数值的总和;以及
在多方环境下进行最大值计算包括:确定参与所述多方环境下的n个各方,在所述各方中分别确定多个第四数值,并对其转化成二进制数值,将输出值根据所述求和计算过程按照次序得出各方的最大值。
2.如权利要求1所述的一种基于差分隐私保护技术的多方统计查询方法,其特征在于,在所述求和计算中所述数据交换包括通过安全通道或者通过标准加密方法进行发送和接收。
3.如权利要求2所述的一种基于差分隐私保护技术的多方统计查询方法,其特征在于,所述第三数值的计算过程包括:
Yi=xi-(xi,1+xi,2+…+xi,n-1)+(x1,i+x2,i+…+xn,i);
式中,xi为所述各方中拥有的数值,xi,1,xi,2,...,xi,n-1为Pi发送给各方Pj的数值,x1,i,x2,i,…,xn,i为参与方Pj发送给Pi的数值;其中,1≤j≤n,j≠i。
4.如权利要求3所述的一种基于差分隐私保护技术的多方统计查询方法,其特征在于,所述第一数值为0.0001。
5.如权利要求1所述的一种基于差分隐私保护技术的多方统计查询方法,其特征在于,当所述第四数值中存在非正整数时,将所述多个第四数值进行转化,使所述第四数值均为正整数。
6.如权利要求5所述的一种基于差分隐私保护技术的多方统计查询方法,其特征在于,所述转化过程包括将所述第四数值同时乘以一个整数,使所述第四数值转化为正整数。
7.如权利要求6所述的一种基于差分隐私保护技术的多方统计查询方法,其特征在于,所述转化成二进制数值时不足最长位数的前面数值补0使转化后的输出值位数相等。
8.如权利要求7所述的一种基于差分隐私保护技术的多方统计查询方法,其特征在于,将所述输出值根据所述求和计算过程按照次序得出各方的最大值过程包括:
从高位开始依次比较,从第1位增加到所述二进制后最长位数,通过所述求和计算得到总和,如果总和等于0,则输出变量为0,如果总和不小于0,则输出变量为1,并且所述各方中的参与方的其中一位为0时,将其后面到最长位数都归为0,最后把输出变量按照输出次序得出最大值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910498896.3A CN110222092B (zh) | 2019-06-11 | 2019-06-11 | 一种基于差分隐私保护技术的多方统计查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910498896.3A CN110222092B (zh) | 2019-06-11 | 2019-06-11 | 一种基于差分隐私保护技术的多方统计查询方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110222092A true CN110222092A (zh) | 2019-09-10 |
CN110222092B CN110222092B (zh) | 2021-04-23 |
Family
ID=67816099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910498896.3A Active CN110222092B (zh) | 2019-06-11 | 2019-06-11 | 一种基于差分隐私保护技术的多方统计查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110222092B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110633402A (zh) * | 2019-09-20 | 2019-12-31 | 东北大学 | 一种带有差分隐私机制的三维时空信息传播预测方法 |
CN111026359A (zh) * | 2019-12-17 | 2020-04-17 | 支付宝(杭州)信息技术有限公司 | 多方联合判定隐私数据的数值范围的方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160170996A1 (en) * | 2014-08-21 | 2016-06-16 | Affectomatics Ltd. | Crowd-based scores for experiences from measurements of affective response |
CN106778314A (zh) * | 2017-03-01 | 2017-05-31 | 全球能源互联网研究院 | 一种基于k‑means的分布式差分隐私保护方法 |
-
2019
- 2019-06-11 CN CN201910498896.3A patent/CN110222092B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160170996A1 (en) * | 2014-08-21 | 2016-06-16 | Affectomatics Ltd. | Crowd-based scores for experiences from measurements of affective response |
CN106778314A (zh) * | 2017-03-01 | 2017-05-31 | 全球能源互联网研究院 | 一种基于k‑means的分布式差分隐私保护方法 |
Non-Patent Citations (1)
Title |
---|
王峥等: "基于公钥加密的安全多方求和协议", 《计算机应用研究》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110633402A (zh) * | 2019-09-20 | 2019-12-31 | 东北大学 | 一种带有差分隐私机制的三维时空信息传播预测方法 |
CN110633402B (zh) * | 2019-09-20 | 2021-05-04 | 东北大学 | 一种带有差分隐私机制的三维时空信息传播预测方法 |
CN111026359A (zh) * | 2019-12-17 | 2020-04-17 | 支付宝(杭州)信息技术有限公司 | 多方联合判定隐私数据的数值范围的方法和装置 |
CN111026359B (zh) * | 2019-12-17 | 2021-10-15 | 支付宝(杭州)信息技术有限公司 | 多方联合判定隐私数据的数值范围的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110222092B (zh) | 2021-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109495465B (zh) | 基于智能合约的隐私集合交集方法 | |
CN104601596B (zh) | 一种分类数据挖掘系统中数据隐私保护方法 | |
CN109033865A (zh) | 一种空间众包中隐私保护的任务分配方法 | |
CN111984984B (zh) | 基于集合运算的保密统计数据共享方法及系统 | |
CN110011784A (zh) | 支持隐私保护的knn分类服务系统及方法 | |
CN114239032A (zh) | 基于安全多方计算的多方数据交互方法及系统 | |
CN109214201A (zh) | 一种数据共享方法、终端设备及计算机可读存储介质 | |
CN112532383B (zh) | 一种基于秘密分享的隐私保护计算方法 | |
CN115189878B (zh) | 一种基于秘密分享的共享数据排序方法及电子设备 | |
Li et al. | SPFM: Scalable and privacy-preserving friend matching in mobile cloud | |
CN112765664B (zh) | 一种具有差分隐私的安全多方k-means聚类方法 | |
CN110222092A (zh) | 一种基于差分隐私保护技术的多方统计查询方法 | |
CN111104968A (zh) | 一种基于区块链的安全svm训练方法 | |
CN114386089A (zh) | 一种基于多方条件检索的隐私集合求交方法 | |
CN114584294A (zh) | 不经意分散排列方法及装置 | |
CN115051791A (zh) | 一种基于密钥协商的高效三方隐私集合求交方法及系统 | |
CN116361649A (zh) | 一种基于布隆过滤器及哈希的高效非平衡psi | |
CN108259185A (zh) | 一种群组通信中抗泄漏的群密钥协商系统及方法 | |
CN113055902B (zh) | 一种智能化的移动通信网络系统 | |
CN114282692A (zh) | 一种纵向联邦学习的模型训练方法及系统 | |
CN117171779B (zh) | 基于交集保护的数据处理装置 | |
Zhao et al. | VFLR: An efficient and privacy-preserving vertical federated framework for logistic regression | |
CN117353912A (zh) | 基于双线性映射的三方隐私集合交集基数计算方法及系统 | |
CN115510502B (zh) | 一种隐私保护的pca方法及系统 | |
Li et al. | Perturbation-based private profile matching in social networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |