CN112804045B - 云计算环境下使用全同态加密进行安全统计分析的方法 - Google Patents

云计算环境下使用全同态加密进行安全统计分析的方法 Download PDF

Info

Publication number
CN112804045B
CN112804045B CN202011630607.XA CN202011630607A CN112804045B CN 112804045 B CN112804045 B CN 112804045B CN 202011630607 A CN202011630607 A CN 202011630607A CN 112804045 B CN112804045 B CN 112804045B
Authority
CN
China
Prior art keywords
ciphertext
plaintext
cloud server
analysis
homomorphic encryption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011630607.XA
Other languages
English (en)
Other versions
CN112804045A (zh
Inventor
陈小璐
郑培嘉
刘红梅
方艳梅
骆伟祺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202011630607.XA priority Critical patent/CN112804045B/zh
Publication of CN112804045A publication Critical patent/CN112804045A/zh
Application granted granted Critical
Publication of CN112804045B publication Critical patent/CN112804045B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Complex Calculations (AREA)

Abstract

本发明提出一种云计算环境下使用全同态加密进行安全统计分析的方法,涉及云计算信息安全的技术领域,解决了在计算外包时,云端不可信的情况下如何进行统计计算,保证数据计算精度的问题,本发明基于本地、用户客户端与云服务器构成的三方系统,首先明确参与安全统计分析的用户客户端,从隐私保护的角度出发,基于全同态加密的乘法协议、加法协议及整数比较协议,对用户客户端的统计数据进行同态加密,加密后上传至云服务器,云端环境下直接对密文状态下的数据进行计算,在不泄露隐私的情况下完成计算,得到相应的统计量分析、统计结果检验及一元线性回归拟合,实现了真正的计算外包,而且基于全同态加密技术保证了计算精度。

Description

云计算环境下使用全同态加密进行安全统计分析的方法
技术领域
本发明涉及云计算信息安全的技术领域,更具体地,涉及一种云计算环境下使用全同态加密进行安全统计分析的方法。
背景技术
近年来,随着海量数据的涌入和时代的发展,各类业务都需要更多的数据存储空间和更强的数据处理能力,在数据处理方面,单一的计算引擎已经满足不了用户的需求,云计算和大数据技术应运而生,随着云计算和大数据技术的快速发展,云服务器的存储空间和计算能力使得云中进行数据挖掘和统计处理成为可能,但是在云服务模式下如何保证用户的隐私安全成为其推广和应用中面临的首要问题。
为了防止数据泄露事件的发生,对数据加密后再存储在云平台上是公认最有效的方法,但这带来了一个新的问题:加密后的密文毫无特征,云平台无法对其进行有效处理,丧失了它在大数据处理方面的优势,而一旦将数据解密又极易造成隐私数据泄露,甚至带来严重的灾难性后果,在云端进行数据挖掘和统计分析的过程中,既要保证数据的隐私性,又要保证其准确性,全同态加密技术作为解决这一问题的关键手段,是一种可以对密文进行操作但仍可以恢复明文的加密算法,如2019年2月12日中国专利(公布号:CN109327304A)中公开了一种云计算中实现隐私保护的轻量级同态加密方法,在不解密的情况下实现运算,有效解决了云环境下数据上传服务器端,云端不可信的问题,但在保证隐私的同时,无法对数据进行统计分析,因此不能确定计算结果的准确性,无法保证数据计算精度。
发明内容
为解决在计算外包时,云端不可信的情况下如何进行统计计算,保证数据计算精度的问题,本发明提出一种云计算环境下使用全同态加密进行安全统计分析的方法,在保证数据隐私的同时,对数据进行统计分析,从而确定计算结果的准确性,保证数据的计算精度。
为了达到上述技术效果,本发明的技术方案如下:
一种云计算环境下使用全同态加密进行安全统计分析的方法,至少包括:
S1.明确参与安全统计分析的用户客户端;
S2.在本地生成公钥pk和私钥sk并保存,将公钥pk告知云服务器,私钥sk告知私有服务器;
S3.利用公钥pk对用户客户端的统计数据进行同态加密,加密后上传至云服务器;
S4.云服务器通过全同态加密的乘法协议、加法协议及整数比较协议,在加密域下进行用户客户端的统计量分析、统计结果检验及一元线性回归拟合;
S5.云服务器将加密的统计量分析及统计结果检验返回至本地,本地利用私钥sk对统计量分析、统计结果检验及一元线性回归拟合结果进行解密。
在本技术方案中,首先基于本地、用户客户端与云服务器构成的三方系统,明确参与安全统计分析的用户客户端,然后从隐私保护的角度出发,基于全同态加密的乘法协议、加法协议及整数比较协议,对用户客户端的统计数据进行同态加密,加密后上传至不受信任的云服务器,结合统计学方法,在云端环境下,直接对密文状态下的数据进行计算,在不泄露隐私的情况下完成计算,得到相应的统计量分析、统计结果检验及一元线性回归拟合,实现了真正的计算外包,而且基于全同态加密技术可以保证计算精度。
优选地,步骤S2所述在本地生成公钥pk和私钥sk的过程为:
S21.设置正整数q及t,其中,q表示密文模用于约减密文多项式的系数;t表示明文模用于约减明文多项式的系数;q>>t;
S22.令[q/t],定义R=Z/(Xn+1),Rq=Zq[x]/(Xn+1)以及Rt=Zt[x]/(Xn+1);其中,Z表示具有整数系数的多项式,Zq[x]表示一组具有整数系数的多项式集,整数系数范围为[0,q-1),χ表示一个离散的高斯误差分布;
S23.令
Figure BDA0002876274260000021
e←χn,其中,s为私钥sk,a、e均视为Rq中的元素,n总为2的幂次方,且n个系数独立于给定的分布采样,Uk表示在Z∩[-k/2,k/2)上的随机分布,公钥pk表示为:
Figure BDA0002876274260000022
其中,[.]q表示约减密文多项式的系数。
在此,t通常为质数。
优选地,步骤S3中所述利用公钥pk对用户客户端的统计数据进行同态加密的过程包括:
设用户客户端的统计数据矩阵为X,统计数据矩阵X中的任意一个明文元素设为m,使用公钥pk对统计数据矩阵X中的每一个明文元素m进行加密,将s、a、ei视为Rq中的元素,
Figure BDA0002876274260000031
e1,e2←χn;创建的加密密文表示为:
ct=a·pk+(m+e1,e2)。
优选地,步骤S4所述的全同态加密的乘法协议为:
S411.令Q=q2,设s’←s2,在Rq上均匀选取元素a’,在高斯分布χ上选取误差e’,将执行密钥设置为
Figure BDA0002876274260000032
其中,b’=[-a’s+e’+qs’]Q
S412.将明文m1及明文m2分别同态加密为密文ct1=(c0,c1)及密文ct2=(d0,d1),其中,c0、c1为密文ct1的两个成员,d0、d1为密文ct2的两个成员;并发送给云服务器;
S413.密文ct1=(c0,c1)及密文ct2=(d0,d1)在云服务器中进行乘法运算ct1×ct2,得到(x0,x1,x2)=([c0d0]q,[c0d1+c1d0]q,[c1d1]q),其中x0,x1,x2为乘积密文的三个成员;
S414.云服务器将乘积结果
Figure BDA0002876274260000033
返回本地,本地解密后得到明文域的乘积结果。
优选地,步骤S4所述的全同态加密的加法协议为:
S401.将明文m1及明文m2分别同态加密为密文ct1=(c0,c1)及密文ct2=(d0,d1),其中,c0、c1为密文ct1的两个成员,d0、d1为密文ct2的两个成员;并发送给云服务器;
S402.密文ct1=(c0,c1)及密文ct2=(d0,d1)在云服务器中进行加法运算,即:
Figure BDA0002876274260000034
S403.云服务器得到明文m1及明文m2的加密域求和结果ctsum=[ct1+ct2]q并返回本地,本地解密后得到明文域的加法结果。
优选地,步骤S4所述的全同态加密的整数比较协议为:
S421.由一位加密x与一位加密y,得到([[x]],[[y]]);
S422.判断x是否小于y,若是,返回[[1]];否则,不变;
S423.对于b=(xl-1<yl-1)∨((xl-1=yl-1)∧(xl-2<yl-2)).....∨((xl-1=yl-1)(xl-2=yl-2)....(xl=yl)(x0<y0)),l表示下标参数,满足(xi<yi)=(1-xi)(yi),且
Figure BDA0002876274260000041
优选地,步骤S4所述用户客户端的统计量分析包括:均值分析、方差分析及中位数分析,统计结果检验包括:
t-检验,检验用户客户端统计数据的总体方差未知、正态分布或近似正态分布单样本的均值是否与已知的总体均值相等;
2*2列联表χ2检验,检验用户客户端两个及两个以上的统计数据样本率以及两个分类变量的关联性;
单因素方差分析及两样本wilcoxon-秩和检验,所述两样本wilcoxon-秩和检验与t检验相对应。
在此,2*2列联表χ2检验根本思想在于比较理论频数和实际频数的吻合程度或拟合优度问题,单因素方差分析是将所有测量值间的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义,两样本wilcoxon-秩和检验用于不满足正态分布的小样本中,检验两独立样本之间的差异是否显著。
优选地,步骤S4所述的一元线性回归拟合为用户客户端的统计数据中两个变量之间相关关系的拟合,设自变量为x,因变量为y,自变量x与因变量y之间的一元线性回归方程为:
y=β01x+ε
其中,β0和β1均表示未知参数,β0为回归常数,β1为回归系数;ε表示其他随机因素的影响;
利用最小二乘准则进行参数估计:
Figure BDA0002876274260000042
其中,yi表示第i次观测,因变量的观测值;
Figure BDA0002876274260000043
表示第i次观测,因变量的预测值。
优选地,自变量x与因变量y之间的一元线性回归方程的斜率为:
Figure BDA0002876274260000044
其中,
Figure BDA0002876274260000045
表示自变量x的均值,
Figure BDA0002876274260000046
表示自变量y的均值;
Figure BDA0002876274260000047
表示解决估计量,表达式为:
Figure BDA0002876274260000051
其中,w表示自变量x或因变量y的总个数,xi表示第i个自变量;yi表示第i个因变量。
优选地,步骤S5所述本地利用私钥sk对统计量分析、统计结果检验及一元线性回归拟合结果进行解密的过程为:
设公钥pk加密后的密文为ct=(c0,c1),利用私钥s=sk对密文ct=(c0,c1)进行解密,得到解密明文m:
Figure BDA0002876274260000052
其中,
Figure BDA0002876274260000053
表示舍入到最近的整数,为取整操作。
与现有技术相比,本发明技术方案的有益效果是:
本发明提出一种云计算环境下使用全同态加密进行安全统计分析的方法,首先基于本地、用户客户端与云服务器构成的三方系统,明确参与安全统计分析的用户客户端,然后从隐私保护的角度出发,基于全同态加密的乘法协议、加法协议及整数比较协议,对用户客户端的统计数据进行同态加密,加密后上传至不受信任的云服务器,在云端环境下直接对密文状态下的数据进行计算,在不泄露隐私的情况下完成计算,得到相应的统计量分析、统计结果检验及一元线性回归拟合,实现了真正的计算外包,而且基于全同态加密技术保证了计算精度。
附图说明
图1表示本发明实施例中提出的云计算环境下使用全同态加密进行安全统计分析的方法。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好地说明本实施例,附图某些部位会有省略、放大或缩小,并不代表实际尺寸;
对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示的云计算环境下使用全同态加密进行安全统计分析的方法的流程示意图,参见图1,包括:
S1.明确参与安全统计分析的用户客户端;
S2.在本地生成公钥pk和私钥sk并保存,将公钥pk告知云服务器,私钥sk告知私有服务器;
在本地生成公钥pk和私钥sk的过程为:
S21.设置正整数q及t,其中,q表示密文模用于约减密文多项式的系数;t表示明文模用于约减明文多项式的系数;q>>t;
S22.令[q/t],定义R=Z/(Xn+1),Rq=Zq[x]/(Xn+1)以及Rt=Zt[x]/(Xn+1);其中,Z表示具有整数系数的多项式,Zq[x]表示一组具有整数系数的多项式集,整数系数范围为[0,q-1),χ表示一个离散的高斯误差分布;
S23.令
Figure BDA0002876274260000061
e←χn,其中,s为私钥sk,a、e均视为Rq中的元素,n总为2的幂次方,且n个系数独立于给定的分布采样,Uk表示在Z∩[-k/2,k/2)上的随机分布,公钥pk表示为:
Figure BDA0002876274260000062
其中,[.]q表示约减密文多项式的系数。
在此,t通常为质数。
S3.利用公钥pk对用户客户端的统计数据进行同态加密,加密后上传至云服务器;
利用公钥pk对用户客户端的统计数据进行同态加密的过程包括:
设用户客户端的统计数据矩阵为X,统计数据矩阵X中的任意一个明文元素设为m,使用公钥pk对统计数据矩阵X中的每一个明文元素m进行加密,将s、a、ei视为Rq中的元素,
Figure BDA0002876274260000063
e1,e2←χn;创建的加密密文表示为:
ct=a·pk+(m+e1,e2)。
具体的,以用户客户端Alice为例,设其统计数据矩阵X具体表示A,表达式为:
Figure BDA0002876274260000064
对A中的每一个元素m进行加密,随机选定一个正整数q,质数t,满足q>>t,则元素m加密后的密文ct,对于每一个元素加密后,上传至云服务器。
S4.云服务器通过全同态加密的乘法协议、加法协议及整数比较协议,在加密域下进行用户客户端的统计量分析、统计结果检验及一元线性回归拟合;
用户客户端的统计量分析包括:均值分析、方差分析及中位数分析,统计结果检验包括:
t-检验,检验用户客户端统计数据的总体方差未知、正态分布或近似正态分布单样本的均值是否与已知的总体均值相等;包括:
1)假设检验:
H0:样本均值与总体均值相等,H1:样本均值与总体均值不相等
2)构造t检验统计量:
Figure BDA0002876274260000071
对于要检验样本均值是否等于总体均值的双侧检验,若
Figure BDA0002876274260000072
则拒绝原假设,认为样本值与均值不等,否则不拒绝原假设;对于要检验样本均值是否比总体均值大的单侧检验,若
Figure BDA0002876274260000073
则拒绝原假设,认为样本值不大于总体均值,否则不拒绝原假设;对于要检验样本均值是否比总体均值小的单侧检验,若
Figure BDA0002876274260000074
则拒绝原假设,认为样本值不小于总体均值,否则不拒绝原假设。
2*2列联表χ2检验,检验用户客户端两个及两个以上的统计数据样本率以及两个分类变量的关联性;
单因素方差分析及两样本wilcoxon-秩和检验,所述两样本wilcoxon-秩和检验与t检验相对应。
单因素方差分析包括:
总方差(Total variation):全部测量值xij与总均数间μ的差异,
Figure BDA0002876274260000075
Figure BDA0002876274260000076
自由度为DT=N-1;
组间方差(between group variation):各组的均数μi与总均数μ间的差异,
Figure BDA0002876274260000077
自由度为DB=m-1;
组内方差(within group variation):每组的每个测量值xij与该组均数μi的差异,
Figure BDA0002876274260000078
自由为
Figure BDA0002876274260000079
其中,m表示观察组的个数,nI表示每一组的观察数,N表示总的观察数;构造F统计量进行检验,
Figure BDA0002876274260000081
当给定显著性水平为α时,F的拒绝域为
Figure BDA0002876274260000082
两样本wilcoxon-秩和检验:也叫Mann-Whitney U检验,是一种非参数检验方法,与参数检验中的t检验相对应,主要是用于不满足正态分布的小样本,检验两独立样本X和Y之间的差异是否显著,包括:
建立假设检验:
H0:X、Y的中位数相等H1:X、Y的中位数不相等
将两个样本数据X和Y混合并由小到大进行等级排列,最小的数据秩次编为1,最大的数据秩次编为n1+n2
令Ri和Rj分别为样本xi和样本点yj在混合样本中的秩,WX和WY分别为Ri和Rj的总和(秩和):
Figure BDA0002876274260000083
令W为WX和WY中较小者,即W=min(Wx,WY)称为Wilcoxon秩和统计量;把W值与秩和检验表中某α显著性水平下的临界值相比较,如果W1<W<W2,则两样本差异不显著;如果W不等于W1或W大于等于W2,则表明两样本差异显著。
具体的,步骤S4包括:
S41.设用户客户端的列向量均值
Figure BDA0002876274260000084
其中:
Figure BDA0002876274260000085
Figure BDA0002876274260000086
Figure BDA0002876274260000087
Figure BDA0002876274260000088
S42.设用户客户端的列向量方差σ2=(σ1 2,σ2 2,...,σn 2),其中:
Figure BDA0002876274260000089
Figure BDA00028762742600000810
Figure BDA0002876274260000091
Figure BDA0002876274260000092
S43.对用户客户端Alice的数据矩阵B求解中位数:
B=(x1,x2,…,xn)
S431.对B中的每一个元素m进行加密,同时将每一个元素m转化为二进制再按位加密,随机选定一个正整数q,质数t,满足q>>t,则元素m加密后的密文ct满足:
ct=a·pk+(m+e1,e2),
其中,
Figure BDA0002876274260000093
e1,e2←χn,pk为公钥,对于每一个元素加密及二进制按位加密后,上传至云服务器;
S432.使用全同态加密整数比较协议,比较相邻的元素。如果x1>x2,则二者交换;
S433.对每一对相邻元素做同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数;
S434.针对所有的元素重复步骤S433,除了最后一个;
S435.持续每次对越来越少的元素重复上面的步骤,直到没有任何一对数字需要比较;
S436.上述排序完成后,根据中位数的定义,若B中的元素个数n为偶数,则中位数为(xn/2+xn/2+1)的和,解密后的平均值;若B中的元素个数为奇数,则中位数为x(n+1)/2解密后的值。
S44.对用户客户端Alice的数据矩阵C进行t-检验,C=(x1,x2,…,xn);
S441.对C中的每一个元素m进行加密,随机选定一个正整数q,质数t,满足q>>t,则元素m加密后的密文ct满足:
ct=a·pk+(m+e1,e2),
其中,
Figure BDA0002876274260000094
e1,e2←χn,pk为公钥,对于每一个元素加密后,上传至云服务器;
S442.基本假设(总体服从正态分布,μ已知)
H0:样本均值
Figure BDA0002876274260000095
与总体均值μ相等,H1:样本均值
Figure BDA0002876274260000096
与总体均值μ相等;
S443.根据具体实施步骤S41、S42,求得样本均值
Figure BDA0002876274260000097
标准差σx,解密后,构造t检验统计量:
Figure BDA0002876274260000101
S444.若
Figure BDA0002876274260000102
则拒绝原假设,认为样本均值
Figure BDA0002876274260000103
与总体均值μ不等;反之样本均值
Figure BDA0002876274260000104
与总体均值μ相等。
S45.对表1中2*2列联表进行χ2检验:
表1
组别\属性 W Z 总和
X a b a+b
Y c d c+d
总和 a+c b+d a+b+c+d
S451.基本假设为:
H0:观察频数与期望频数没有差别;H1:观察频数与期望频数有差别。
S452.对表1每一个元素m进行全同态加密,得到矩阵,
Figure BDA0002876274260000105
各元素m加密后的密文ct满足:
ct=a·pk+(m+e1,e2),
其中,
Figure BDA0002876274260000106
e1,e2←χn,pk为公钥,对于每一个元素加密后,上传至云服务器;
S453.据全同态加密的加法、乘法协议,求解=(aenc*denc-benc*cenc)2*(a+b+c+d)enc,Q=((a+b)enc*(c+d)enc*(a+c)enc*(b+d)enc),解密后得到卡方统计量为:
Figure BDA0002876274260000107
S454.给定显著性水平α,若
Figure BDA0002876274260000108
则拒绝H0,认为“属性”和“组别”有关;反之,则无关。
S46.假设某个因素有s个分组,对应的观测值分别为:
Figure BDA0002876274260000109
Figure BDA0002876274260000111
进行单因素方差分析;
S461.基本假设
H0:μ1=μ2=…=μn H1:μ1、μ2…μn不全相等
S462.对样本数据中的每一个元素m进行加密,随机选定一个正整数q,质数t,满足q>>t,则元素m加密后的密文ct满足
ct=a·pk+(m+e1,e2)。
其中,
Figure BDA0002876274260000112
e1,e2←χn,pk为公钥,对于每一个元素加密后,上传至云服务器;
S463.根据具体实施步骤S41、S42,求得组内平方和SSW与组间平方和SSB,如下,
组内平方和:
Figure BDA0002876274260000113
自由度为n-s
组间平方和:
Figure BDA0002876274260000114
自由度为s-1
S464.解密后,构造F统计量,
Figure BDA0002876274260000115
S465.若F>F1-α(s-1,n-s),则拒绝原假设,认为μ1、μ2…μn不全相等。
S47.Wilcoxon-秩和检验考察两样本总体X=(x1,x2,...,xn)和Y=(y1,y2,...,yn)所代表的总体的中位数是否一样。
S471.基本假设:H0:MX=MYH1:MX、mY不相等
S472.对样本X的每一个数都标记为类标签0,对样本Y的每一个数都标记为类标签1,并将其混合起来。对样本数据X、Y中的每一个元素m进行加密,随机选定一个正整数q,质数t,满足q>>t,则元素m加密后的密文ct满足
ct=a·pk+(m+e1,e2)。
其中,
Figure BDA0002876274260000116
e1,e2←χn,pk为公钥,对于每一个元素加密及二进制按位加密后,上传至云服务器;
S473.根据全同态加密整数比较协议,参照具体实施步骤S43中的排序原理,将X、Y混合样本中的2n个数进行排序编秩;
S474.根据标签指示计算样本xi和样本点yj在混合样本中的秩Ri和Rj,令WX和WY分别为Ri和Rj的总和(秩和):
Figure BDA0002876274260000117
S475.令W为WX和WY中较小者,即W=min(WX,WY)称为Wilcoxon秩和统计量;
S476.把W值与秩和检验表中某α显著性水平下的临界值相比较,如果W1<W<W2,则两样本差异不显著;如果W不等于W1或W大于等于W2,则表明两样本差异显著。
S48.假设从总体中获取了n组观察值(x1,y1),(x2,y2),…,(xn,yn),使用一元线性回归方程拟合,假设方程为:
y=β01x+ε
S481.对样本数据中的每一个元素m进行加密,随机选定一个正整数q,质数t,满足q>>t,则元素m加密后的密文ct满足
ct=a·pk+(m+e1,e2)。
其中,
Figure BDA0002876274260000121
e1,e2←χn,pk为公钥,对于每一个元素加密后,上传至云服务器;
S482.求得回归方程的斜率与截距估计量:
Figure BDA0002876274260000122
S483.解密后得到一元线性回归方程
Figure BDA0002876274260000123
全同态加密加法协议包括的过程为:
S401.将明文m1及明文m2分别同态加密为密文ct1=(c0,c1)及密文ct2=(d0,d1),其中,c0、c1为密文ct1的两个成员,d0、d1为密文ct2的两个成员,并发送给云服务器;
S402.云服务器中进行加法运算
Figure BDA0002876274260000124
S403.云服务器得到明文m1及明文m2的加密域求和结果ctsum=[ct1+ct2]q并返回本地,本地解密后得到明文域的加法结果。
全同态加密乘法协议包括的过程为:
S411.令Q=q2,设s’←s2,在Rq上均匀选取元素a’,在高斯分布χ上选取误差e’,将执行密钥设置为
Figure BDA0002876274260000125
其中,b’=[-a’s+e’+qs’]Q
S412.将明文m1及明文m2分别同态加密为密文ct1=(c0,c1)及密文ct2=(d0,d1),其中,c0、c1为密文ct1的两个成员,d0、d1为密文ct2的两个成员;并发送给云服务器;
S413.密文ct1=(c0,c1)及密文ct2=(d0,d1)在云服务器中进行乘法运算ct1×ct2,得到(x0,x1,x2)=([c0d0]q,[c0d1+c1d0]q,[c1d1]q),其中x0,x1,x2为乘积密文的三个成员;
S414.云服务器将乘积结果
Figure BDA0002876274260000131
返回本地,本地解密后得到明文域的乘积结果。
全同态加密整数比较协议包括的过程为:
S421.由一位加密x与一位加密y,得到([[x]],[[y]]);
S422.判断x是否小于y,若是,返回[[1]];否则,不变;
S423.对于b=(xl-1<yl-1)∨((xl-1=yl-1)∧(xl-2<yl-2)).....∨((xl-1=yl-1)(xl-2=Yl-2)....(xl=yl)(x0<y0)),l表示下标参数,满足(xi<yi)=(1-xi)(yi),且
Figure BDA0002876274260000132
S5.云服务器将加密的统计量分析及统计结果检验返回至本地,本地利用私钥sk对统计量分析、统计结果检验及一元线性回归拟合结果进行解密。具体为:
设公钥加密后的密文为ct=(c0,c1),利用私钥s=sk对密文ct=(c0,c1)进行解密,得到解密明文m:
Figure BDA0002876274260000133
其中,
Figure BDA0002876274260000134
表示舍入到最近的整数,为取整操作。
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;显然,本发明的上述实施例仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (4)

1.一种云计算环境下使用全同态加密进行安全统计分析的方法,其特征在于,至少包括:
S1.明确参与安全统计分析的用户客户端;
S2.在本地生成公钥pk和私钥sk并保存,将公钥pk告知云服务器,私钥sk告知私有服务器;
S3.利用公钥pk对用户客户端的统计数据进行同态加密,加密后上传至云服务器;
步骤S3中所述利用公钥pk对用户客户端的统计数据进行同态加密的过程包括:
设用户客户端的统计数据矩阵为X,统计数据矩阵X中的任意一个明文元素设为m,使用公钥对统计数据矩阵X中的每一个明文元素m进行加密,将s、a、ei视为Rq中的元素,
Figure FDA0003901427520000011
e1,e2←χn;创建的加密密文表示为:
ct=a·pk+(m+e1,e2);
S4.云服务器通过全同态加密的乘法协议、加法协议及整数比较协议,在加密域下进行用户客户端的统计量分析、统计结果检验及一元线性回归拟合;
步骤S4所述的全同态加密的乘法协议为:
S411.令Q=q2,设s’←s2,在Rq上均匀选取元素a’,在高斯分布χ上选取误差e’,将执行密钥设置为
Figure FDA0003901427520000012
其中,b’=[-a’s+e’+qs’]Q
S412.将明文m1及明文m2分别同态加密为密文ct1=(c0,c1)及密文ct2=(d0,d1),其中,c0、c1为密文ct1的两个成员,d0、d1为密文ct2的两个成员,并发送给云服务器;
S413.密文ct1=(c0,c1)及密文ct2=(d0,d1)在云服务器中进行乘法运算ct1×ct2,得到(x0,x1,x2)=([c0d0]q,[c0d1+c1d0]q,[c1d1]q),其中x0,x1,x2为乘积密文的三个成员;
S414.云服务器将乘积结果
Figure FDA0003901427520000013
返回本地,本地解密后得到明文域的乘积结果;
步骤S4所述的全同态加密的加法协议为:
S401.将明文m1及明文m2分别同态加密为密文ct1=(c0,c1)及密文ct2=(d0,d1),其中,c0、c1为密文ct1的两个成员,d0、d1为密文ct2的两个成员,并发送给云服务器;
S402.密文ct1=(c0,c1)及密文ct2=(d0,d1)在云服务器中进行加法运算,即:
Figure FDA0003901427520000021
S403.云服务器得到明文m1及明文m2的加密域求和结果ctsum=[ct1+ct2]q并返回本地,本地解密后得到明文域的加法结果;
步骤S4所述的全同态加密的整数比较协议为:
S421.由一位加密x与一位加密y,得到([[x]],[[y]]);
S422.判断x是否小于y,若是,返回[[1]];否则,不变;
S423.对于b=(xl-1<yl-1)∨((xl-1=yl-1)∧(xl-2<yl-2)).....∨((xl-1=yl-1)(xl-2=yl-2)....(xl=yl)(x0<y0)),l表示下标参数,满足(xi<yi)=(1-xi)(yi),且(xi=yi)=(1⊕xi⊕yi),xi⊕yi=xi+yi-2xiyi
步骤S4所述用户客户端的统计量分析包括:均值分析、方差分析及中位数分析,统计结果检验包括:
t-检验,检验用户客户端统计数据的总体方差未知、正态分布或近似正态分布单样本的均值是否与已知的总体均值相等;
2*2列联表χ2检验,检验用户客户端两个及两个以上的统计数据样本率以及两个分类变量的关联性;
单因素方差分析及两样本wilcoxon-秩和检验,所述两样本wilcoxon-秩和检验与t检验相对应;
步骤S4所述的一元线性回归拟合为用户客户端的统计数据中两个变量之间相关关系的拟合,设自变量为x,因变量为y,自变量x与因变量y之间的一元线性回归方程为:
y=β01x+ε
其中,β0和β1均表示未知参数,β0为回归常数,β1为回归系数;ε表示其他随机因素的影响;
利用最小二乘准则进行参数估计:
Figure FDA0003901427520000022
其中,yi表示第i次观测,因变量的观测值;
Figure FDA0003901427520000023
表示第i次观测,因变量的预测值;
S5.云服务器将加密的统计量分析及统计结果检验返回至本地,本地利用私钥sk对统计量分析、统计结果检验及一元线性回归拟合结果进行解密。
2.根据权利要求1所述的云计算环境下使用全同态加密进行安全统计分析的方法,其特征在于,步骤S2所述在本地生成公钥pk和私钥sk的过程为:
S21.设置正整数q及t,其中,q表示密文模用于约减密文多项式的系数;t表示明文模用于约减明文多项式的系数;q>>t;
S22.令[q/t],定义R=Z/(Xn+1),Rq=Zq[x]/(Xn+1)以及Rt=Zt[x]/(Xn+1);其中,Z表示具有整数系数的多项式,Zq[x]表示一组具有整数系数的多项式集,整数系数范围为[0,q-1),χ表示一个离散的高斯误差分布;
S23.令
Figure FDA0003901427520000031
e←χn,其中,s为私钥sk,a、e均视为Rq中的元素,n总为2的幂次方,且n个系数独立于给定的分布采样,Uk表示在Z∩[-k/2,k/2)上的随机分布,公钥pk表示为:
Figure FDA0003901427520000032
其中,[.]q表示约减密文多项式的系数。
3.根据权利要求2所述的云计算环境下使用全同态加密进行安全统计分析的方法,其特征在于,自变量x与因变量y之间的一元线性回归方程的斜率为:
Figure FDA0003901427520000033
其中,
Figure FDA0003901427520000034
表示自变量x的均值,
Figure FDA0003901427520000035
表示自变量y的均值;
Figure FDA0003901427520000036
表示解决估计量,表达式为:
Figure FDA0003901427520000037
其中,w表示自变量x或因变量y的总个数,xi表示第i个自变量;yi表示第i个因变量。
4.根据权利要求3所述的云计算环境下使用全同态加密进行安全统计分析的方法,其特征在于,步骤S5所述本地利用私钥sk对统计量分析、统计结果检验及一元线性回归拟合结果进行解密的过程为:
设公钥pk加密后的密文为ct=(c0,c1),利用私钥s=sk对密文ct=(c0,c1)进行解密,得到解密明文m:
Figure FDA0003901427520000041
其中,
Figure FDA0003901427520000042
表示舍入到最近的整数,为取整操作。
CN202011630607.XA 2020-12-30 2020-12-30 云计算环境下使用全同态加密进行安全统计分析的方法 Active CN112804045B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011630607.XA CN112804045B (zh) 2020-12-30 2020-12-30 云计算环境下使用全同态加密进行安全统计分析的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011630607.XA CN112804045B (zh) 2020-12-30 2020-12-30 云计算环境下使用全同态加密进行安全统计分析的方法

Publications (2)

Publication Number Publication Date
CN112804045A CN112804045A (zh) 2021-05-14
CN112804045B true CN112804045B (zh) 2023-02-07

Family

ID=75808206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011630607.XA Active CN112804045B (zh) 2020-12-30 2020-12-30 云计算环境下使用全同态加密进行安全统计分析的方法

Country Status (1)

Country Link
CN (1) CN112804045B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115473699B (zh) * 2022-08-22 2024-04-30 湖北工业大学 一种基于分布式的隐私保护配对t检验方法及装置
CN115292739B (zh) * 2022-10-08 2022-12-20 江苏浚荣升新材料科技有限公司 一种金属模具设计系统的数据管理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3461054A1 (en) * 2017-09-20 2019-03-27 Universidad de Vigo System and method for secure outsourced prediction
CN110543901A (zh) * 2019-08-22 2019-12-06 阿里巴巴集团控股有限公司 图像识别方法、装置及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3461054A1 (en) * 2017-09-20 2019-03-27 Universidad de Vigo System and method for secure outsourced prediction
CN110543901A (zh) * 2019-08-22 2019-12-06 阿里巴巴集团控股有限公司 图像识别方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于云平台的加密数据计算方法;李兴鑫;《CNKI中国硕士学位论文全文数据库信息科技辑》;20180315;全文 *

Also Published As

Publication number Publication date
CN112804045A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
US11606203B2 (en) Method for faster secure multiparty inner product with SPDZ
WO2020034754A1 (zh) 多方安全计算方法及装置、电子设备
US20230087864A1 (en) Secure multi-party computation method and apparatus, device, and storage medium
EP3676986B1 (en) Single node multi-party encryption
Kim et al. Efficient privacy-preserving matrix factorization for recommendation via fully homomorphic encryption
US20200412702A1 (en) System and method for secure two-party evaluation of utility of sharing data
EP2478662B1 (en) Key generation for multi-party encryption
US20020186837A1 (en) Multiple prime number generation using a parallel prime number search algorithm
CN112804045B (zh) 云计算环境下使用全同态加密进行安全统计分析的方法
EP2742644B1 (en) Encryption and decryption method
Yang et al. Collusion-resistant privacy-preserving data mining
Biham et al. Conditional linear cryptanalysis–cryptanalysis of DES with less than 242 complexity
CN112953974B (zh) 数据碰撞方法、装置、设备及计算机可读存储介质
EP3509246A1 (en) Key exchange method and key exchange system
CN111917533A (zh) 具有减少泄漏的区间统计量的隐私保护基准分析
CN111555880A (zh) 数据碰撞方法、装置、存储介质及电子设备
Kasianchuk et al. Symmetric cryptoalgorithms in the residue number system
US11411720B2 (en) Key distribution system, terminal device, key distribution method, and program
Yadav et al. Private computation of the Schulze voting method over the cloud
US20210083840A1 (en) Using cryptographic blinding for efficient use of montgomery multiplication
CN112580071B (zh) 一种数据处理方法及装置
US20220255722A1 (en) Practical sorting on large-scale encrypted data
JP2019213092A (ja) 匿名署名システム、署名生成装置、匿名署名生成装置、検証装置、匿名署名方法及びプログラム
CN115150055B (zh) 一种基于同态加密的隐私保护岭回归方法
Sheikh et al. Secure sum computation for insecure networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant