具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种保护电子交易中消费者隐私的大数据相关性分析方法,包括以下步骤:
步骤1:数据存储;
步骤1.1:生成预处理参数;
负责选定方案所需参数,在各个数据服务器内用Pailler加密系统生成参数算法生成加密时需要的用户的公钥和私钥(pk,sk),同时选择一种签名认证方案生成验证时需要的用户的签名密钥对(pk*,sk*),并将用户的私钥和签名钥通过安全信道发送给用户;
本实施例的参数算法Gen(k)为:
随机选择两个大素数p和q,相互独立,满足乘积pq和乘积(p-1)(q-1)也互质;
计算出N=pq;
计算出(p-1)和(q-1)的最小公倍数,并将值赋给λ;
再从中选出一个生成元g,即中每一个元素都可以由g作乘方运算得到,其中是指从1-N2的整数值;
计算出μ=(L(gλ(mod N2)))-1(modN),其中mod是求余运算;
其中函数L()是如下定义的:
最后加密系统中公钥pk是(N,g),私钥sk是(λ,μ);
同时选择一种签名认证方案(本方案中不提供签名认证方案的详解,可以选择一种合适的签名认证方案,例如RSA签名认证方案),生成验证时需要的用户的签名密钥对(pk*,sk*),用于步骤3.1的用户验证阶段;
本流程结束。
步骤1.2:数据收集;
在电子交易中收集消费者留下的个人信息;
步骤1.3:数据分块;
将收集到的消费者信息随机的分成多个等长的数据版块,在本具体实施例中假设将消费者信息收集之后分成三个数据版块分别通过安全信道传输给对应的三个数据服务器(S1、S2、S3),即消费者数据的某一个敏感信息数值ρ(整数)随机地分为三个整数α、β、γ,将每个部分通过安全信道传输到对应的每个数据服务器,通过步骤1.1选定的参数对其加密并且存储在每个数据服务器;
数据分割方案本实施例不做详细介绍,选择数据分割方案的时候要保证即使只有一个数据没有被攻破,也无法还原出α、β、γ的总和ρ;
将α通过安全信道传输到数据服务器S1,数据服务器选取一个随机数 其中指从1到N的所有整数,对α进行加密(加密算法本步骤中会讲到),得到密文Cα=gαr1 N(modN2),并存放在S1;
将β通过安全信道传输到数据服务器S2,数据服务器选取一个随机数 对β进行加密,得到密文并存放在S2;
将γ通过安全信道传输到数据服务器S3,数据服务器选取一个随机数对γ进行加密,得到密文并存放在S3;
系统的加密算法Enc():
发送者发送的明文假设为m,选择一个随机数计算密文为C=gmrN(modN2);
本流程结束。
步骤2:数据统计处理;
步骤2.1:平均值处理;
在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的某一量度(单一特征)的平均值作数据处理,通过平均循环算法,实现在多个数据服务器中将明文加密并且密文相互相乘,将每一轮循环的值都存放在数据服务器S3中,即使有敌手攻破了数据服务器S3或者任何一个数据服务器,拿到用户的私钥,也只能得到部分处理过的信息,依然没有得到敏感信息,保证了在数据服务器相互数据处理过程中隐私数据的安全。在接下来的步骤3中用户查询时将会把本步骤中存储在S3的密文发送给用户。
平均值循环算法为:假设要得到n个消费者属性某一量度X=(x1,x2,x3,…,xn)的平均值,其中x1,x2,x3,…,xn表示第一个到第n个消费者的相关量度信息,将每一个数据随机分为三个部分,即xi=αi+βi+γi,i可取1到n之间任何一个整数,表示第i个消费者;
此时设一个数,Cx=1;
(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将乘积发送给S2;
(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在S2,同时将乘积发送给数据服务器S3;
(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在S3,同时发送给S1;
(4)将收集到的第二个消费者信息x2中的α2通过安全信道发送给S1,数据服务器S1选取一个随机数对α2进行加密,得到并将存放在S1,同时将乘积发送给S2;
(5)将收集到的第二个消费者信息x2中的β2通过安全信道发送给S2,数据服务器S2选取一个随机数对β2进行加密,得到并将存放在S2,同时将乘积发送给数据服务器S3;
(6)将收集到的第二个消费者信息x2中的γ2通过安全信道发送给S3,数据服务器S3选取一个随机数对γ2进行加密,得到并将存放在S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在S3,同时发送给S1;
……
重复(1)开始的上述过程,依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αi+βi+γi)加密并且相乘,将最后得到的Cx值存放在数据服务器S3;
注意每一步对应的数据服务器随机选择一个新的随机数进行运算;
本流程结束。
步骤2.2:半偏相关处理;
在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性系数作数据处理,将明文加密得到原始密文,首先通过平均循环算法对原始密文进行第一次数据处理,将每一轮循环的值都存放在数据服务器S3中,再通过乘方循环算法对原始密文进行第二次数据处理,将每一轮循环的值都存放在数据服务器S3中,最后通过相关循环算法对原始密文进行第三次数据处理,将每一轮循环的值都存放在数据服务器S3中,依然能保证数据服务器相互数据处理过程中隐私数据的安全。在接下来的步骤3中用户查询是将会把本步骤中存储在S3的密文发送给用户。
此算法具体操作为:假设n个消费者属性的三个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),(xi,yi,Ai)属于同一个消费者,即第i个消费者,并且量度A只对量度X有影响。将每一个数据随机分为三个部分,即xi=αi+βi+γi,yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,i可取1到n之间任何一个整数;
第一种数据处理:根据上述步骤2.1的方法,先在多个数据服务器的相互配合下,计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)的每个数据分成部分(xi=αi+βi+γi)的加密之后的乘积赋值给Cx,并存放在S3,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)的加密运算之后的乘积赋值给Cy和Ca,并存放在S3;
第二种数据处理:此时设一个数,
(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将发送给S2;
(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在S2,同时将乘积发送给数据服务器S3;
(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在S3,计算乘积的值,将其值存储在S3,同时发送给S1和S2;
(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的α1再进行一次加密,得到并将存放在S1,同时将乘积发送给S2;
(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的β1再进行一次加密,得到并将存放在S2,同时将乘积发送给S3;
(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的γ1再进行一次加密,得到并将存放在S3,计算乘积并将它赋值给清除掉之前的存值,将新的值存储在S3,同时发送给S1;
……
重复(1)开始的上述过程,依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αi+βi+γi)加密并且相乘,将最后得到的值存放在数据服务器S3;
注意每一步对应的数据服务器随机选择一个新的随机数进行运算;
依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)在上述加密循环运算之后的乘积赋值给和并存放在S3;
第三种数据处理:此时设一个数,Cxy=1;
(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将发送给S2;
(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在S2,同时将乘积发送给数据服务器S3;
(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在S3,计算乘积的值,将其值存储在S3,同时发送给S1和S2;
(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的α'1进行加密,得到并将存放在S1,同时将乘积发送给S2;
(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的β'1进行加密,得到并将存放在S2,同时将乘积发送给S3;
(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的γ'1进行加密,得到并将存放在S3,计算乘积并将它赋值给Cxy,清除掉之前Cxy的存值,将新的Cxy值存储在S3,同时发送给S1;
……
重复(1)开始的上述过程,依次将x1,x2,x3,…,xn和y1,y2,y3,…,yn的每个数据分成的部分(xi=αi+βi+γi,yi=αi'+βi'+γi')按顺序加密并且相乘,将最后得到的Cxy值存放在数据服务器S3;
注意每一步对应的数据服务器随机选择一个新的随机数进行运算;
依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)在上述顺序加密循环运算之后的乘积赋值给Cya,存放在S3;
计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与A=(a1,a2,...,an)的每个数据分成部分(xi=αi+βi+γi,Ai=αi″+βi″+γi″)在上述顺序加密循环运算之后的乘积赋值给Cxa存放在S3;
本流程结束。
步骤2.3:全偏相关处理;
在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的两个量度在同样的多个干扰下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文按照一定顺序进行三种数据处理,实现在多个数据服务器中将涉及到的不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在数据服务器S3中,以此保证数据服务器相互数据处理过程中隐私数据的安全。在接下来的步骤3中用户查询是将会把本步骤中存储在S3的密文发送给用户。
此算法具体操作为:假设n个消费者属性的三个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),(xi,yi,Ai)属于同一个消费者,即第i个消费者,并且量度A对量度X与Y都有影响。将每一个数据随机分为三个部分,即xi=αi+βi+γi,yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,i可取1到n之间任何一个整数;
则数据处理的三种方式与步骤2.2完全相同;
若有两个量度或者更个量度都对其有影响,比如假设n个消费者属性的四个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),
B=(b1,b2,...,bn),(xi,yi,Ai,Bi)属于同一个消费者,即第i个消费者,并且量度A,B对量度X与Y都有影响。将每一个数据随机分为三个部分,即xi=αi+βi+γi,yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′,i可取1到n之间任何一个整数;
第一种数据处理:
根据上述步骤2.2方法,先在多个数据服务器的相互配合下,计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)的每个数据分成部分(xi=αi+βi+γi)的加密之后的乘积赋值给Cx,并存放在S3,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)的加密运算之后的乘积赋值给Cy和Ca、Cb,并存放在S3;
第二种数据处理:
根据上述步骤2.2方法,同样计算出n个消费者属性的量度X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(xi=αi+βi+γi,yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在上述加密循环运算之后的乘积赋值给和并存放在S3;
第三种数据处理:
根据上述步骤2.2方法,同样计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与Y=(y1,y2,y3,…,yn)的每个数据分成部分(xi=αi+βi+γi,yi=αi'+βi'+γi')在同样顺序加密循环运算之后的乘积赋值给Cxy,存放在S3;
计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与A=(a1,a2,...,an)的每个数据分成部分(xi=αi+βi+γi,Ai=αi″+βi″+γi″)在同样顺序加密循环运算之后的乘积赋值给Cxa,存放在S3;
计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与B=(b1,b2,...,bn)的每个数据分成部分(xi=αi+βi+γi,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cxb,存放在S3;
计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)在同样顺序加密循环运算之后的乘积赋值给Cya,存放在S3;
计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cyb,存放在S3;
计算出n个消费者属性的量度A=(a1,a2,...,an)与B=(b1,b2,...,bn)的每个数据分成部分(Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cab,存放在S3;
本流程结束。
步骤2.4:复相关处理;
在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文依次进行三种数据处理,实现在多个数据服务器中将涉及到的多种不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在数据服务器S3中,以此保证数据服务器相互数据处理过程中隐私数据的安全。在接下来的步骤3中用户查询是将会把本步骤中存储在S3的密文发送给用户。
此算法具体操作为:假设n个消费者属性的三个量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn),(yi,Ai,Bi)属于同一个消费者,即第i个消费者,并且量度Y,A,B之间相互没有影响。将每一个数据随机分为三个部分,即yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′,i可取1到n之间任何一个整数;
第一种数据处理:
根据上述步骤2.3方法先在多个数据服务器的相互配合下,计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)的加密运算之后的乘积赋值给Cy和Ca、Cb,并存放在S3;
第二种数据处理:
根据上述步骤2.3方法,计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在上述加密循环运算之后的乘积赋值给和并存放在S3;
第三种数据处理:
根据上述步骤2.3方法,计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)在同样顺序加密循环运算之后的乘积赋值给Cya,存放在S3;
计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cyb,存放在S3;
计算出n个消费者属性的量度A=(a1,a2,...,an)与B=(b1,b2,...,bn)的每个数据分成部分(Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cab,存放在S3;
当有四个量度甚至多个的时候,以此类推;
本流程结束。
步骤3:访问查询;
步骤3.1:验证请求;
用户想要访问数据库时,用户用自己的身份数据属性向每个数据服务器做出请求,并且用在步骤1.1生成的用户的签名钥sk*对证书签名(具体签名认证方案在本方案中不做介绍),每个数据服务器用步骤1.1生成的验证钥pk*验证用户的身份,在每个数据服务器都通过对用户的身份之后才可以再继续接收用户发送到额命令请求,否则拒绝;
验证通过之后,用户对每一个数据服务器发送请求命令,其中包括要查询的内容,并且依然对命令进行签名;
本流程结束。
步骤3.2:数据解密;
每个数据数据服务器对用户发过来的带有签名的命令进行验证,验证完全通过之后,数据服务器S3根据用户的命令要求将存储在本数据服务器对应密文发送给用户客户端,如等;
如果用户命令对应步骤2.1,S3将返回给用户客户端Cx,以此类推;
用户用自己的私钥对收到的密文进行解密算法;
其中解密算法Dec():明文m=L(cλmodn2)*μmod n,参数见步骤1.1;
根据此加密系统的同态性质:几个密文相乘的结果最后解密得到对应的几个明文相加的结果;
经过步骤2.1的详细过程,知Cx是x1,x2,x3,…,xn的每个数据分成的部分(xi=αi+βi+γi)加密并且相乘结果,根据上述加密系统的同态性质,对Cx解密之后的结果应该是x1,x2,x3,…,xn相加,即
对应的Cy和Ca、Cb的解密结果应该是
经过步骤2.2,2.3,2.4的详细过程,知是x1,x2,x3,…,xn的每个数据分成的部分(xi=αi+βi+γi)加密循环运算之后的乘积,因为在步骤2.2第二种数据处理过程中的循环运算中(4)到(6)步中将原来的g值替换成所以根据上述Pailler加密系统的同态性质,对解密之后的结果应该是x2 1,x2 2,x2 3,…,x2 n相加,即
对应的的解密结果应该是
经过步骤2.2,2.3,2.4的详细过程,知Cxy是X=(x1,x2,x3,…,xn)与Y=(y1,y2,y3,…,yn)的每个数据分成部分(xi=αi+βi+γi,yi=αi'+βi'+γi')在对应顺序加密循环运算之后的乘积,因为在步骤2.2第三种数据处理过程中的循环运算中(4)到(6)步中将原来的g值替换成所以根据上述Pailler加密系统的同态性质,对Cxy解密之后的结果应该是x1y1,x2y2,x3y3…,xnyn相加,即
对应的Cxa、Cxb、Cya、Cyb、Cab的解密结果应该是
本流程结束。
步骤3.3:数据整合;
根据用户发出的请求命令,利用本系统中结合数学统计方法已经处理过的适合于调整过的密文进行统计运算的公式,用户在客服端对解密之后的数据进行相应的相关性统计数据整合计算,最终得到需要查询的内容。
(1)如果用户查询的是消费者属性的某一量度(单一特征)的平均值,对应步骤2.1,得到的明文是在用户客户端计算X的平局值
用户最终得到消费者属性的某一量度(单一特征)的平均值;
(2)如果用户查询的是消费者属性的一个量度在某些量度干扰下与另一量度的相关性值系数,对应步骤2.2,得到的明文是
在用户客户端计算出X与Y的相关性rXY:
同样计算出X与A的相关性rXA,Y与A的相关性rYA;
从而计算出半偏相关系数:
用户最终得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性值系数,从而判断两个量度之间是否有紧密联系;
注意这里的系数范围都是从0到1,0表示完全不相关,1表示完全相关,最后得到的值越靠近1则表示关联性越大,对于接下来涉及到的相关系数全部适用;
(3)如果用户查询的是消费者属性的两个量度在同样的多个干扰下的相关性系数,如果对应步骤2.3第一个假设,则和上述(2)一样,得出X与Y的相关性rXY,X与A的相关性rXA,Y与A的相关性rYA;
最后用户计算全偏相关系数:
如果对应步骤2.3第二个假设,得到的明文是
计算出X与Y的相关性在A的干扰下的相关性rXY.A,X与B的相关性在A的干扰下的相关性rXB.A,Y与B的相关性在A的干扰下的相关性rYB.A;
从而计算出全偏相关系数:
若出现更多的量度,以此类推;
用户最终得到消费者属性的两个量度在同样的多个干扰下的相关性值系数,从而判断两个量度之间是否有紧密联系;
(4)如果用户查询的是消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数,对应步骤2.4,得到的明文是
计算出Y与A的相关性rYA,Y与B在A的干扰下的相关性rYB.A;
从而计算复相关系数:r2 Y.AB=r2 Y.A+r2 YB.A(1-r2 Y.A);
若出现更多的量度,以此类推;
用户最终得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数,从而判断多个量度之间是否有紧密联系;
本流程结束。
请见图2,本发明提供的一种保护电子交易中消费者隐私的大数据相关性分析系统,包括数据存储模块、数据统计处理模块、访问查询模块;数据存储模块包括预处理参数生成单元、数据收集单元、数据分块单元;数据统计处理模块包括平均值处理单元、半偏相关处理单元、全偏相关处理单元、复相关处理单元;访问查询模块包括验证请求单元、数据解密单元、数据整合单元;数据存储模块用于系统初始化,将数据随机分散后加密存储到各个数据服务器;数据统计处理模块用于对相关统计分析计算进行密文的数据处理;访问查询模块用于用户通过请求之后在客户端对密文进行解密计算。
预处理参数生成单元负责选定方案所需参数,参数包括系统中生成加密时需要的用户的公钥和私钥(pk,sk),和验证时需要的用户的签名密钥对(pk*,sk*);数据收集单元在电子交易中收集消费者留下的个人信息,数据分块单元是数据收集中心将收集到的消费者信息随机的分成多个等长的数据版块,将其通过安全信道分别传输给多个数据服务器(在本具体方案中假设分成三个数据版块分别传输给对应的三个数据服务器),对其加密并存储在数据服务器中;平均处理单元负责在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的某一量度(单一特征)的平均值作数据处理,比如消费者平均年龄;半偏相关处理单元负责在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性值系数作数据处理,比如有孩子的女士买奢侈品的可能较高还是较低(此例中涉及的量度有生育、性别、购买的商品种类,“有孩子”对“女士”进行干扰,统计“女士”与“买奢侈品”的相关性);全偏相关处理单元负责在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的两个量度在同样的多个干扰下的相关性作数据处理,比如买过奢侈品的男士是否可能是买过奢侈品的爱狗人士(此例中涉及的量度有性别、爱好、购买过的商品种类,“买过奢侈品”对“男士”和“爱狗人士”都进行了干扰,统计“男士”与“爱狗人士”的相关性);复相关处理单元负责在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性作数据处理,比如女士是否爱买包包,同时是否爱养狗(此例中涉及的量度有爱好、性别、购买的商品种类,统计“女士”与“买包包”和“爱养狗”的相关性);验证请求单元是用户想要访问数据库时,用户用自己的身份数据属性向数据服务器做出请求,并且提供用户的签名和证书,数据服务器会验证用户的身份,验证通过之后再对数据服务器发出请求,其中包括要查询的内容;数据解密单元是数据服务器验证了用户的请求之后,返回给用户已经处理过的数据,由用户在客户端进行解密;数据整合单元是用户客服端对解密之后的数据进行整合,得到最后需要查询的内容。
本发明的目的在于保护电子交易系统下消费者的敏感信息安全,在这个基础上对消费者数据进行统计分析,在传统统计中,消费者的信息被存储在数据服务器,用户可以通过登录数据服务器找到消费者全部信息,这样很可能带来恶意人员出于个人目的做有损消费者利益的事情,但是对于数据的准确的统计分析是非常有必要,有助于市场正面的发展,现在急需解决这样的统计难题。本实施例通过将消费者数据通过安全信道传输并随机存放在多个数据数据服务器,每个数据服务器下分享每个不同的密钥,本实施例使用Paillier加密系统控制用户(例如管理员)访问数据,结合统计学在不损害其隐私的情况下对消费者信息进行统计分析。这样即使用户授权进入系统,也只能得到他想要知道的部分信息,所以有效的防止了内部攻击,只要系统是安全的,本实施例的统计就可以正常进行,本实施例的系统是帮助管理员分析数据,而不泄露数据。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。