CN108171076A - 保护电子交易中消费者隐私的大数据相关性分析方法及系统 - Google Patents

保护电子交易中消费者隐私的大数据相关性分析方法及系统 Download PDF

Info

Publication number
CN108171076A
CN108171076A CN201711406465.7A CN201711406465A CN108171076A CN 108171076 A CN108171076 A CN 108171076A CN 201711406465 A CN201711406465 A CN 201711406465A CN 108171076 A CN108171076 A CN 108171076A
Authority
CN
China
Prior art keywords
data
consumer
data server
stored
measurement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711406465.7A
Other languages
English (en)
Other versions
CN108171076B (zh
Inventor
张明武
陈文倩
黄嘉骏
冷文韬
阮鸥
沈华
陈效
张旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Chongqian Industry Co.,Ltd.
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN201711406465.7A priority Critical patent/CN108171076B/zh
Publication of CN108171076A publication Critical patent/CN108171076A/zh
Application granted granted Critical
Publication of CN108171076B publication Critical patent/CN108171076B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • G06Q20/3821Electronic credentials
    • G06Q20/38215Use of certificates or encrypted proofs of transaction rights
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • G06Q20/3823Payment protocols; Details thereof insuring higher security of transaction combining multiple encryption tools for a transaction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • G06Q20/3825Use of electronic signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • G06Q20/3829Payment protocols; Details thereof insuring higher security of transaction involving key management

Abstract

本发明公开了一种保护电子交易中消费者隐私的大数据相关性分析方法及系统,方法包括数据存储、数据统计处理、访问查询等步骤;系统包括数据存储模块,用于系统初始化,将数据随机分散后秘密处理转化成密文存储到各个数据服务器;数据统计处理模块,用于对密文进行相关统计分析计算的数据处理;访问查询模块,用于用户通过访问请求之后在客户端对密文进行解密计算。本发明将使用保护电子交易中消费者隐私的大数据相关性分析方法与系统,实现了在不损害消费者隐私的情况下对消费者信息进行有利于市场调节的相关性分析方法。本发明是帮助用户(例如,管理员、商家、研究人员)分析数据,而不泄露数据。

Description

保护电子交易中消费者隐私的大数据相关性分析方法及系统
技术领域
本发明属于信息安全技术领域,特别涉及一种保护电子交易中消费者隐私的大数据相关性分析方法与系统,通过结合密码学技术与统计数学,严格控制可以进入电子交易过程中消费者信息管理系统的人群,达到不泄露消费者隐私,并且可以对消费者数据进行隐私保护的相关性统计分析。
背景技术
随着互联网技术越来越全面地渗透至人类社会政治、经济、文化等各个领域,数字化商业已经成为每个人、每个组织所必须要面对的,电子商务、网络购物已经不再是一种选择,而成为一种必然。但是这样的背景下,网购过程中客户个人信息遭泄露和不法侵害的案件也随之增加。因此除了用户自己对个人信息的保管之外,电子交易平台对消费者的信息管理的安全问题也是非常值得关注的。
大部分的电子交易平台会对消费者的个人信息建立起综合数据库,并进行一定的分析,以便进行市场调查和调整,以及对消费者进行智能提醒和推荐等服务,比如一个35岁的白领女士想买一件毛衣,那么35岁、白领、女士和她过往购买的东西之间会有怎样的约束和联系,我们需要帮助商家或者研究人员分析大数据相关性,以便对这位女士进行推荐或者提供市场分类等更好的服务,所以我们需要去考虑多种因素下的相关性分析。目前,在电子交易环境当中,对于信息进行二次开发规范就当前来说还是一件比较棘手的事情,如果商家或者管理员、调研员的行为会为消费者带来相服务,如我们上述讲的正常的数据分析,那么这种二次开发就是受到消费者所青睐的,但事实上存在恶意的内部管理人员为了个人利益将消费者信息直接用来牟取利益,进而致使消费者个人信息得到泄漏增添了很多生活上的干扰。因此,一种保护电子交易中消费者隐私的大数据相关性分析方法与系统是非常有必要的。
当前的方案是通过安全信道将消费者的信息分成多个数据板块分别加密之后传输到多个数据服务器并且储存,存储在数据服务器的消费者信息是由管理员、商家、研究人员、保险公司等不同的用户共享和访问的,最后将存储在每个数据服务器的加密过的数据板块解密之后再进行统计分析,通过这种方式可以保护消费者数据在传输过程中的安全,并且只要多个数据服务器没有被同时攻破,存放在数据服务器的消费者数据就是安全的,但是还存在着一些严重的问题:在这个系统中消费者信息被存储在数据服务器,由于是对存放在每个数据服务器的加密过的数据版块解密之后再进行数据分析的,也就是说在数据处理之前已经将分散到每个数据服务器的数据版块进行了整合,所以用户(例如,管理员、商家、研究人员)是可以获得消费者的全部敏感信息的,一旦有恶意用户出于个人目的将消费者信息利用,将会造成消费者敏感信息危机。
发明内容
为了解决上述技术问题,本发明提供了一种保护电子交易中消费者隐私的大数据相关性分析方法与系统。
本发明的方法所采用的技术方案是:一种保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,包括以下步骤:
步骤1:数据存储;
步骤2:数据统计处理;
步骤3:访问查询。
本发明的系统所采用的技术方案是:一种保护电子交易中消费者隐私的大数据相关性分析系统,其特征在于:包括数据存储模块、数据统计处理模块、访问查询模块;
所述数据存储模块包括预处理参数生成单元、数据收集单元、数据分块单元;所述数据统计处理模块包括平均值处理单元、半偏相关处理单元、全偏相关处理单元、复相关处理单元;所述访问查询模块包括验证请求单元、数据解密单元、数据整合单元;
所述数据存储模块用于系统初始化,将数据随机分散后加密存储到各个数据服务器;所述数据统计处理模块用于对相关统计分析计算进行密文的数据处理;所述访问查询模块用于用户通过请求之后在客户端对密文进行解密计算。
本发明的目的是希望在不被用户得到全部的敏感隐私信息的情况下,可以对消费者数据进行大数据统计处理,并且是只针对于有利于市场调节的相关性统计分析。
本发明将消费者数据随机分成多个数据版块,使它们的和等于原始数据,通过安全信道将它们分别传输到多个数据数据服务器,在各个数据服务器对其加密后进行存放,结合统计学知识提出一种在不损害消费者隐私的情况下对消费者信息进行有利于市场调节的相关性分析方法,最后将统计结果相关处理过的密文发送给发出请求的用户(例如,管理员、商家、研究人员),由用户客户端对已经处理过的信息进行解密并且整合得到想要的数据。这样做的好处是,由于系统已经在多个服务区的相互作用下对分散的数据板块进行了数据处理,将已经处理过的信息返回给需要的用户,所以即使用户授权进入消费者管理系统,也只能得到查询的信息(比如消费者某一属性的平均值或者消费者几个属性之间的相关性等),无法得到消费者的全部敏感信息,所以有效的防止了内部攻击(恶意管理员等利用消费者敏感信息),同时即使恶意攻击者攻击了任何一个数据服务器(外部攻击),得到的也只能是统计处理过后的密文,解密后无法得到消费者敏感信息,保证了在数据服务器相互数据处理过程中隐私数据的安全,所以只要多个数据服务器没有被全部攻破,整个系统就是安全的,大数据相关性统计结果就是就可靠有效的。一种保护电子交易中消费者隐私的大数据相关性分析方法与系统是帮助用户(例如,管理员、商家、研究人员)分析数据,而不泄露数据。
附图说明
图1:本发明实施例的方法流程图;
图2:本发明实施例的系统原理图,其中(1)数据存储模块、(2)数据统计处理模块、(3)访问查询模块。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种保护电子交易中消费者隐私的大数据相关性分析方法,包括以下步骤:
步骤1:数据存储;
步骤1.1:生成预处理参数;
负责选定方案所需参数,在各个数据服务器内用Pailler加密系统生成参数算法生成加密时需要的用户的公钥和私钥(pk,sk),同时选择一种签名认证方案生成验证时需要的用户的签名密钥对(pk*,sk*),并将用户的私钥和签名钥通过安全信道发送给用户;
本实施例的参数算法Gen(k)为:
随机选择两个大素数p和q,相互独立,满足乘积pq和乘积(p-1)(q-1)也互质;
计算出N=pq;
计算出(p-1)和(q-1)的最小公倍数,并将值赋给λ;
再从中选出一个生成元g,即中每一个元素都可以由g作乘方运算得到,其中是指从1-N2的整数值;
计算出μ=(L(gλ(mod N2)))-1(modN),其中mod是求余运算;
其中函数L()是如下定义的:
最后加密系统中公钥pk是(N,g),私钥sk是(λ,μ);
同时选择一种签名认证方案(本方案中不提供签名认证方案的详解,可以选择一种合适的签名认证方案,例如RSA签名认证方案),生成验证时需要的用户的签名密钥对(pk*,sk*),用于步骤3.1的用户验证阶段;
本流程结束。
步骤1.2:数据收集;
在电子交易中收集消费者留下的个人信息;
步骤1.3:数据分块;
将收集到的消费者信息随机的分成多个等长的数据版块,在本具体实施例中假设将消费者信息收集之后分成三个数据版块分别通过安全信道传输给对应的三个数据服务器(S1、S2、S3),即消费者数据的某一个敏感信息数值ρ(整数)随机地分为三个整数α、β、γ,将每个部分通过安全信道传输到对应的每个数据服务器,通过步骤1.1选定的参数对其加密并且存储在每个数据服务器;
数据分割方案本实施例不做详细介绍,选择数据分割方案的时候要保证即使只有一个数据没有被攻破,也无法还原出α、β、γ的总和ρ;
将α通过安全信道传输到数据服务器S1,数据服务器选取一个随机数 其中指从1到N的所有整数,对α进行加密(加密算法本步骤中会讲到),得到密文Cα=gαr1 N(modN2),并存放在S1;
将β通过安全信道传输到数据服务器S2,数据服务器选取一个随机数 对β进行加密,得到密文并存放在S2;
将γ通过安全信道传输到数据服务器S3,数据服务器选取一个随机数对γ进行加密,得到密文并存放在S3;
系统的加密算法Enc():
发送者发送的明文假设为m,选择一个随机数计算密文为C=gmrN(modN2);
本流程结束。
步骤2:数据统计处理;
步骤2.1:平均值处理;
在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的某一量度(单一特征)的平均值作数据处理,通过平均循环算法,实现在多个数据服务器中将明文加密并且密文相互相乘,将每一轮循环的值都存放在数据服务器S3中,即使有敌手攻破了数据服务器S3或者任何一个数据服务器,拿到用户的私钥,也只能得到部分处理过的信息,依然没有得到敏感信息,保证了在数据服务器相互数据处理过程中隐私数据的安全。在接下来的步骤3中用户查询时将会把本步骤中存储在S3的密文发送给用户。
平均值循环算法为:假设要得到n个消费者属性某一量度X=(x1,x2,x3,…,xn)的平均值,其中x1,x2,x3,…,xn表示第一个到第n个消费者的相关量度信息,将每一个数据随机分为三个部分,即xi=αiii,i可取1到n之间任何一个整数,表示第i个消费者;
此时设一个数,Cx=1;
(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将乘积发送给S2;
(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在S2,同时将乘积发送给数据服务器S3;
(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在S3,同时发送给S1;
(4)将收集到的第二个消费者信息x2中的α2通过安全信道发送给S1,数据服务器S1选取一个随机数对α2进行加密,得到并将存放在S1,同时将乘积发送给S2;
(5)将收集到的第二个消费者信息x2中的β2通过安全信道发送给S2,数据服务器S2选取一个随机数对β2进行加密,得到并将存放在S2,同时将乘积发送给数据服务器S3;
(6)将收集到的第二个消费者信息x2中的γ2通过安全信道发送给S3,数据服务器S3选取一个随机数对γ2进行加密,得到并将存放在S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在S3,同时发送给S1;
……
重复(1)开始的上述过程,依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αiii)加密并且相乘,将最后得到的Cx值存放在数据服务器S3;
注意每一步对应的数据服务器随机选择一个新的随机数进行运算;
本流程结束。
步骤2.2:半偏相关处理;
在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性系数作数据处理,将明文加密得到原始密文,首先通过平均循环算法对原始密文进行第一次数据处理,将每一轮循环的值都存放在数据服务器S3中,再通过乘方循环算法对原始密文进行第二次数据处理,将每一轮循环的值都存放在数据服务器S3中,最后通过相关循环算法对原始密文进行第三次数据处理,将每一轮循环的值都存放在数据服务器S3中,依然能保证数据服务器相互数据处理过程中隐私数据的安全。在接下来的步骤3中用户查询是将会把本步骤中存储在S3的密文发送给用户。
此算法具体操作为:假设n个消费者属性的三个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),(xi,yi,Ai)属于同一个消费者,即第i个消费者,并且量度A只对量度X有影响。将每一个数据随机分为三个部分,即xi=αiii,yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,i可取1到n之间任何一个整数;
第一种数据处理:根据上述步骤2.1的方法,先在多个数据服务器的相互配合下,计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)的每个数据分成部分(xi=αiii)的加密之后的乘积赋值给Cx,并存放在S3,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)的加密运算之后的乘积赋值给Cy和Ca,并存放在S3;
第二种数据处理:此时设一个数,
(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将发送给S2;
(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在S2,同时将乘积发送给数据服务器S3;
(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在S3,计算乘积的值,将其值存储在S3,同时发送给S1和S2;
(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的α1再进行一次加密,得到并将存放在S1,同时将乘积发送给S2;
(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的β1再进行一次加密,得到并将存放在S2,同时将乘积发送给S3;
(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的γ1再进行一次加密,得到并将存放在S3,计算乘积并将它赋值给清除掉之前的存值,将新的值存储在S3,同时发送给S1;
……
重复(1)开始的上述过程,依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αiii)加密并且相乘,将最后得到的值存放在数据服务器S3;
注意每一步对应的数据服务器随机选择一个新的随机数进行运算;
依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)在上述加密循环运算之后的乘积赋值给并存放在S3;
第三种数据处理:此时设一个数,Cxy=1;
(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将发送给S2;
(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在S2,同时将乘积发送给数据服务器S3;
(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在S3,计算乘积的值,将其值存储在S3,同时发送给S1和S2;
(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的α'1进行加密,得到并将存放在S1,同时将乘积发送给S2;
(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的β'1进行加密,得到并将存放在S2,同时将乘积发送给S3;
(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的γ'1进行加密,得到并将存放在S3,计算乘积并将它赋值给Cxy,清除掉之前Cxy的存值,将新的Cxy值存储在S3,同时发送给S1;
……
重复(1)开始的上述过程,依次将x1,x2,x3,…,xn和y1,y2,y3,…,yn的每个数据分成的部分(xi=αiii,yi=αi'+βi'+γi')按顺序加密并且相乘,将最后得到的Cxy值存放在数据服务器S3;
注意每一步对应的数据服务器随机选择一个新的随机数进行运算;
依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)在上述顺序加密循环运算之后的乘积赋值给Cya,存放在S3;
计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与A=(a1,a2,...,an)的每个数据分成部分(xi=αiii,Ai=αi″+βi″+γi″)在上述顺序加密循环运算之后的乘积赋值给Cxa存放在S3;
本流程结束。
步骤2.3:全偏相关处理;
在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的两个量度在同样的多个干扰下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文按照一定顺序进行三种数据处理,实现在多个数据服务器中将涉及到的不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在数据服务器S3中,以此保证数据服务器相互数据处理过程中隐私数据的安全。在接下来的步骤3中用户查询是将会把本步骤中存储在S3的密文发送给用户。
此算法具体操作为:假设n个消费者属性的三个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),(xi,yi,Ai)属于同一个消费者,即第i个消费者,并且量度A对量度X与Y都有影响。将每一个数据随机分为三个部分,即xi=αiii,yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,i可取1到n之间任何一个整数;
则数据处理的三种方式与步骤2.2完全相同;
若有两个量度或者更个量度都对其有影响,比如假设n个消费者属性的四个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),
B=(b1,b2,...,bn),(xi,yi,Ai,Bi)属于同一个消费者,即第i个消费者,并且量度A,B对量度X与Y都有影响。将每一个数据随机分为三个部分,即xi=αiii,yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′,i可取1到n之间任何一个整数;
第一种数据处理:
根据上述步骤2.2方法,先在多个数据服务器的相互配合下,计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)的每个数据分成部分(xi=αiii)的加密之后的乘积赋值给Cx,并存放在S3,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)的加密运算之后的乘积赋值给Cy和Ca、Cb,并存放在S3;
第二种数据处理:
根据上述步骤2.2方法,同样计算出n个消费者属性的量度X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(xi=αiii,yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在上述加密循环运算之后的乘积赋值给并存放在S3;
第三种数据处理:
根据上述步骤2.2方法,同样计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与Y=(y1,y2,y3,…,yn)的每个数据分成部分(xi=αiii,yi=αi'+βi'+γi')在同样顺序加密循环运算之后的乘积赋值给Cxy,存放在S3;
计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与A=(a1,a2,...,an)的每个数据分成部分(xi=αiii,Ai=αi″+βi″+γi″)在同样顺序加密循环运算之后的乘积赋值给Cxa,存放在S3;
计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与B=(b1,b2,...,bn)的每个数据分成部分(xi=αiii,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cxb,存放在S3;
计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)在同样顺序加密循环运算之后的乘积赋值给Cya,存放在S3;
计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cyb,存放在S3;
计算出n个消费者属性的量度A=(a1,a2,...,an)与B=(b1,b2,...,bn)的每个数据分成部分(Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cab,存放在S3;
本流程结束。
步骤2.4:复相关处理;
在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文依次进行三种数据处理,实现在多个数据服务器中将涉及到的多种不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在数据服务器S3中,以此保证数据服务器相互数据处理过程中隐私数据的安全。在接下来的步骤3中用户查询是将会把本步骤中存储在S3的密文发送给用户。
此算法具体操作为:假设n个消费者属性的三个量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn),(yi,Ai,Bi)属于同一个消费者,即第i个消费者,并且量度Y,A,B之间相互没有影响。将每一个数据随机分为三个部分,即yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′,i可取1到n之间任何一个整数;
第一种数据处理:
根据上述步骤2.3方法先在多个数据服务器的相互配合下,计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)的加密运算之后的乘积赋值给Cy和Ca、Cb,并存放在S3;
第二种数据处理:
根据上述步骤2.3方法,计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在上述加密循环运算之后的乘积赋值给并存放在S3;
第三种数据处理:
根据上述步骤2.3方法,计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi'+βi'+γi',Ai=αi″+βi″+γi″)在同样顺序加密循环运算之后的乘积赋值给Cya,存放在S3;
计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与B=(b1,b2,...,bn)的每个数据分成部分(yi=αi'+βi'+γi',Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cyb,存放在S3;
计算出n个消费者属性的量度A=(a1,a2,...,an)与B=(b1,b2,...,bn)的每个数据分成部分(Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cab,存放在S3;
当有四个量度甚至多个的时候,以此类推;
本流程结束。
步骤3:访问查询;
步骤3.1:验证请求;
用户想要访问数据库时,用户用自己的身份数据属性向每个数据服务器做出请求,并且用在步骤1.1生成的用户的签名钥sk*对证书签名(具体签名认证方案在本方案中不做介绍),每个数据服务器用步骤1.1生成的验证钥pk*验证用户的身份,在每个数据服务器都通过对用户的身份之后才可以再继续接收用户发送到额命令请求,否则拒绝;
验证通过之后,用户对每一个数据服务器发送请求命令,其中包括要查询的内容,并且依然对命令进行签名;
本流程结束。
步骤3.2:数据解密;
每个数据数据服务器对用户发过来的带有签名的命令进行验证,验证完全通过之后,数据服务器S3根据用户的命令要求将存储在本数据服务器对应密文发送给用户客户端,如等;
如果用户命令对应步骤2.1,S3将返回给用户客户端Cx,以此类推;
用户用自己的私钥对收到的密文进行解密算法;
其中解密算法Dec():明文m=L(cλmodn2)*μmod n,参数见步骤1.1;
根据此加密系统的同态性质:几个密文相乘的结果最后解密得到对应的几个明文相加的结果;
经过步骤2.1的详细过程,知Cx是x1,x2,x3,…,xn的每个数据分成的部分(xi=αiii)加密并且相乘结果,根据上述加密系统的同态性质,对Cx解密之后的结果应该是x1,x2,x3,…,xn相加,即
对应的Cy和Ca、Cb的解密结果应该是
经过步骤2.2,2.3,2.4的详细过程,知是x1,x2,x3,…,xn的每个数据分成的部分(xi=αiii)加密循环运算之后的乘积,因为在步骤2.2第二种数据处理过程中的循环运算中(4)到(6)步中将原来的g值替换成所以根据上述Pailler加密系统的同态性质,对解密之后的结果应该是x2 1,x2 2,x2 3,…,x2 n相加,即
对应的的解密结果应该是
经过步骤2.2,2.3,2.4的详细过程,知Cxy是X=(x1,x2,x3,…,xn)与Y=(y1,y2,y3,…,yn)的每个数据分成部分(xi=αiii,yi=αi'+βi'+γi')在对应顺序加密循环运算之后的乘积,因为在步骤2.2第三种数据处理过程中的循环运算中(4)到(6)步中将原来的g值替换成所以根据上述Pailler加密系统的同态性质,对Cxy解密之后的结果应该是x1y1,x2y2,x3y3…,xnyn相加,即
对应的Cxa、Cxb、Cya、Cyb、Cab的解密结果应该是
本流程结束。
步骤3.3:数据整合;
根据用户发出的请求命令,利用本系统中结合数学统计方法已经处理过的适合于调整过的密文进行统计运算的公式,用户在客服端对解密之后的数据进行相应的相关性统计数据整合计算,最终得到需要查询的内容。
(1)如果用户查询的是消费者属性的某一量度(单一特征)的平均值,对应步骤2.1,得到的明文是在用户客户端计算X的平局值
用户最终得到消费者属性的某一量度(单一特征)的平均值;
(2)如果用户查询的是消费者属性的一个量度在某些量度干扰下与另一量度的相关性值系数,对应步骤2.2,得到的明文是
在用户客户端计算出X与Y的相关性rXY:
同样计算出X与A的相关性rXA,Y与A的相关性rYA
从而计算出半偏相关系数:
用户最终得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性值系数,从而判断两个量度之间是否有紧密联系;
注意这里的系数范围都是从0到1,0表示完全不相关,1表示完全相关,最后得到的值越靠近1则表示关联性越大,对于接下来涉及到的相关系数全部适用;
(3)如果用户查询的是消费者属性的两个量度在同样的多个干扰下的相关性系数,如果对应步骤2.3第一个假设,则和上述(2)一样,得出X与Y的相关性rXY,X与A的相关性rXA,Y与A的相关性rYA
最后用户计算全偏相关系数:
如果对应步骤2.3第二个假设,得到的明文是
计算出X与Y的相关性在A的干扰下的相关性rXY.A,X与B的相关性在A的干扰下的相关性rXB.A,Y与B的相关性在A的干扰下的相关性rYB.A
从而计算出全偏相关系数:
若出现更多的量度,以此类推;
用户最终得到消费者属性的两个量度在同样的多个干扰下的相关性值系数,从而判断两个量度之间是否有紧密联系;
(4)如果用户查询的是消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数,对应步骤2.4,得到的明文是
计算出Y与A的相关性rYA,Y与B在A的干扰下的相关性rYB.A
从而计算复相关系数:r2 Y.AB=r2 Y.A+r2 YB.A(1-r2 Y.A);
若出现更多的量度,以此类推;
用户最终得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数,从而判断多个量度之间是否有紧密联系;
本流程结束。
请见图2,本发明提供的一种保护电子交易中消费者隐私的大数据相关性分析系统,包括数据存储模块、数据统计处理模块、访问查询模块;数据存储模块包括预处理参数生成单元、数据收集单元、数据分块单元;数据统计处理模块包括平均值处理单元、半偏相关处理单元、全偏相关处理单元、复相关处理单元;访问查询模块包括验证请求单元、数据解密单元、数据整合单元;数据存储模块用于系统初始化,将数据随机分散后加密存储到各个数据服务器;数据统计处理模块用于对相关统计分析计算进行密文的数据处理;访问查询模块用于用户通过请求之后在客户端对密文进行解密计算。
预处理参数生成单元负责选定方案所需参数,参数包括系统中生成加密时需要的用户的公钥和私钥(pk,sk),和验证时需要的用户的签名密钥对(pk*,sk*);数据收集单元在电子交易中收集消费者留下的个人信息,数据分块单元是数据收集中心将收集到的消费者信息随机的分成多个等长的数据版块,将其通过安全信道分别传输给多个数据服务器(在本具体方案中假设分成三个数据版块分别传输给对应的三个数据服务器),对其加密并存储在数据服务器中;平均处理单元负责在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的某一量度(单一特征)的平均值作数据处理,比如消费者平均年龄;半偏相关处理单元负责在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性值系数作数据处理,比如有孩子的女士买奢侈品的可能较高还是较低(此例中涉及的量度有生育、性别、购买的商品种类,“有孩子”对“女士”进行干扰,统计“女士”与“买奢侈品”的相关性);全偏相关处理单元负责在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的两个量度在同样的多个干扰下的相关性作数据处理,比如买过奢侈品的男士是否可能是买过奢侈品的爱狗人士(此例中涉及的量度有性别、爱好、购买过的商品种类,“买过奢侈品”对“男士”和“爱狗人士”都进行了干扰,统计“男士”与“爱狗人士”的相关性);复相关处理单元负责在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性作数据处理,比如女士是否爱买包包,同时是否爱养狗(此例中涉及的量度有爱好、性别、购买的商品种类,统计“女士”与“买包包”和“爱养狗”的相关性);验证请求单元是用户想要访问数据库时,用户用自己的身份数据属性向数据服务器做出请求,并且提供用户的签名和证书,数据服务器会验证用户的身份,验证通过之后再对数据服务器发出请求,其中包括要查询的内容;数据解密单元是数据服务器验证了用户的请求之后,返回给用户已经处理过的数据,由用户在客户端进行解密;数据整合单元是用户客服端对解密之后的数据进行整合,得到最后需要查询的内容。
本发明的目的在于保护电子交易系统下消费者的敏感信息安全,在这个基础上对消费者数据进行统计分析,在传统统计中,消费者的信息被存储在数据服务器,用户可以通过登录数据服务器找到消费者全部信息,这样很可能带来恶意人员出于个人目的做有损消费者利益的事情,但是对于数据的准确的统计分析是非常有必要,有助于市场正面的发展,现在急需解决这样的统计难题。本实施例通过将消费者数据通过安全信道传输并随机存放在多个数据数据服务器,每个数据服务器下分享每个不同的密钥,本实施例使用Paillier加密系统控制用户(例如管理员)访问数据,结合统计学在不损害其隐私的情况下对消费者信息进行统计分析。这样即使用户授权进入系统,也只能得到他想要知道的部分信息,所以有效的防止了内部攻击,只要系统是安全的,本实施例的统计就可以正常进行,本实施例的系统是帮助管理员分析数据,而不泄露数据。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (10)

1.一种保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,包括以下步骤:
步骤1:数据存储;
步骤2:数据统计处理;
步骤3:访问查询。
2.根据权利要求1所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤1的具体实现包括以下子步骤:
步骤1.1:生成预处理参数;
选定所需参数,随机选择两个大素数p和q,在各个数据服务器内使用Pailler加密系统中的生成参数算法的要求对两个大素数p和q进行运算,生成本方案所需要的用户的公钥和私钥(pk,sk),同时选择一种签名认证方案生成验证时需要的用户的签名密钥对(pk*,sk*),并将用户的私钥和签名钥通过安全信道发送给用户;
步骤1.2:数据收集;
在电子交易中收集消费者留下的个人信息;
步骤1.3:数据分块;
将收集到的消费者信息随机的分成若干等长的数据版块,分别通过安全信道传输给电子交易系统中对应的若干数据服务器,通过步骤1.1选定的参数对其进行使用Pailler加密系统中的加密算法将其转化成密文并且将密文存储在每个数据服务器中。
3.根据权利要求1所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2的具体实现包括以下子步骤:
步骤2.1:平均值处理;
在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的某一量度的平均值作数据处理,通过平均循环算法,在多个数据服务器中将明文加密并且密文相互相乘,将每一轮循环的值都存放在同一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输;
步骤2.2:半偏相关处理;
在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性系数作数据处理,将明文加密得到原始密文,首先通过平均循环算法对原始密文进行第一次数据处理,将每一轮循环的值都存放在同一数据服务器中,再通过乘方循环算法对原始密文进行第二次数据处理,将每一轮循环的值都存放在同上一数据服务器中,最后通过相关循环算法对原始密文进行第三次数据处理,将每一轮循环的值都存放在同上一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输;
步骤2.3:全偏相关处理;
在电子交易网络中多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的两个量度在同样的多个干扰下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文按照一定顺序进行三种数据处理,实现在多个数据服务器中将涉及到的不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在同一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输;
步骤2.4:复相关处理;
在多个数据服务器的配合下对数据进行多次加密处理,为其能得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数作数据处理,将明文加密得到原始密文,通过平均循环算法、乘方循环算法、相关循环算法对原始密文按照一定顺序进行三种数据处理,实现在多个数据服务器中将涉及到的多种不同属性明文按规定的顺序加密并且相互相乘,将每一轮循环的值都存放在同一数据服务器中,此数据服务器最终会与用户客户端之间进行数据传输。
4.根据权利要求3所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2.1中所述循环算法的具体实现过程是:
假设要得到n个消费者属性某一量度X=(x1,x2,x3,…,xn)的平均值,其中x1,x2,x3,…,xn表示第一个到第n个消费者的相关量度信息,将每一个数据随机分为三个部分,即xi=αiii,i取1到n之间任何一个整数,表示第i个消费者,且对应着有三个数据服务器S1、S2、S3;
此时设一个数Cx=1;
(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将乘积发送给数据服务器S2;
(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;
(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在数据服务器S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在数据服务器S3,同时发送给数据服务器S1;
(4)将收集到的第二个消费者信息x2中的α2通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α2进行加密,得到并将存放在数据服务器S1,同时将乘积发送给数据服务器S2;
(5)将收集到的第二个消费者信息x2中的β2通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β2进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;
(6)将收集到的第二个消费者信息x2中的γ2通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ2进行加密,得到并将存放在数据服务器S3,计算乘积的值,并将它赋值给Cx,清除掉之前Cx的存值,将新的Cx值存储在数据服务器S3,同时发送给数据服务器S1;
重复执行上述(1)-(6),依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αiii)加密并且相乘,将最后得到的Cx值存放在数据服务器S3。
5.根据权利要求3所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2.2中所述循环算法的具体实现过程是:
假设n个消费者属性的三个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an);(xi,yi,Ai)属于同一个消费者,即第i个消费者,并且量度A只对量度X有影响;将每一个数据随机分为三个部分,即xi=αiii,yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,i取1到n之间任何一个整数;
第一种数据处理:先在多个数据服务器的相互配合下,计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)的每个数据分成部分(xi=αiii)的加密之后的乘积赋值给Cx,并存放在数据服务器S3,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)的加密运算之后的乘积赋值给Cy和Ca,并存放在数据服务器S3;
第二种数据处理:此时设一个数
(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在S1,同时将发送给数据服务器S2;
(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器数据服务器S3;
(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在数据服务器S3,计算乘积的值,将其值存储在数据服务器S3,同时发送给数据服务器S1和数据服务器S2;
(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的α1再进行一次加密,得到并将存放在数据服务器S1,同时将乘积发送给数据服务器S2;
(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的β1再进行一次加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;
(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息x1中的γ1再进行一次加密,得到并将存放在数据服务器S3,计算乘积 并将它赋值给清除掉之前的存值,将新的值存储在数据服务器S3,同时发送给S1;
重复上述(1)-(6)过程,依次将x1,x2,x3,…,xn的每个数据分成的部分(xi=αiii)加密并且相乘,将最后得到的值存放在数据服务器S3;
依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)在上述加密循环运算之后的乘积赋值给并存放在数据服务器S3;
第三种数据处理:此时设一个数Cxy=1;
(1)将收集到的第一个消费者信息x1中的α1通过安全信道发送给数据服务器S1,数据服务器S1选取一个随机数对α1进行加密,得到并将存放在数据服务器S1,同时将发送给数据服务器S2;
(2)将收集到的第一个消费者信息x1中的β1通过安全信道发送给数据服务器S2,数据服务器S2选取一个随机数对β1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;
(3)将收集到的第一个消费者信息x1中的γ1通过安全信道发送给数据服务器S3,数据服务器S3选取一个随机数对γ1进行加密,得到并将存放在数据服务器S3,计算乘积的值,将其值存储在数据服务器S3,同时发送给数据服务器S1和数据服务器S2;
(4)数据服务器S1选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的α′1进行加密,得到并将存放在数据服务器S1,同时将乘积发送给数据服务器S2;
(5)数据服务器S2选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的β′1进行加密,得到并将存放在数据服务器S2,同时将乘积发送给数据服务器S3;
(6)数据服务器S3选取一个随机数在乘积的基础上对收集到的第一个消费者信息y1中的γ′1进行加密,得到并将存放在数据服务器S3,计算乘积 并将它赋值给Cxy,清除掉之前Cxy的存值,将新的Cxy值存储在数据服务器S3,同时发送给数据服务器S1;
重复上述(1)-(6)过程,依次将x1,x2,x3,…,xn和y1,y2,y3,…,yn的每个数据分成的部分(xi=αiii,yi=αi′+βi′+γi′)按顺序加密并且相乘,将最后得到的Cxy值存放在数据服务器S3;
依照上述方法,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)在上述顺序加密循环运算之后的乘积赋值给Cya,存放在数据服务器S3;
计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与A=(a1,a2,...,an)的每个数据分成部分(xi=αiii,Ai=αi″+βi″+γi″)在上述顺序加密循环运算之后的乘积赋值给Cxa存放在数据服务器S3。
6.根据权利要求3所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2.3中所述循环算法的具体实现过程是:
假设n个消费者属性的三个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an);(xi,yi,Ai)属于同一个消费者,即第i个消费者,并且量度A对量度X与Y都有影响;将每一个数据随机分为三个部分,即xi=αiii,yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,i取1到n之间任何一个整数;
则数据处理的三种方式与步骤2.2完全相同;
若有两个量度或者更个量度都对其有影响,比如假设n个消费者属性的四个量度X=(x1,x2,x3,…,xn)和Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn),(xi,yi,Ai,Bi)属于同一个消费者,即第i个消费者,并且量度A,B对量度X与Y都有影响;将每一个数据随机分为三个部分,即xi=αiii,yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′,i取1到n之间任何一个整数;
第一种数据处理:
根据步骤2.2方法,先在多个数据服务器的相互配合下,计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)的每个数据分成部分(xi=αiii)的加密之后的乘积赋值给Cx,并存放在数据服务器S3,同样计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)的加密运算之后的乘积赋值给Cy和Ca、Cb,并存放在数据服务器S3;
第二种数据处理:
根据步骤2.2方法,同样计算出n个消费者属性的量度X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(xi=αiii,yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在上述加密循环运算之后的乘积赋值给并存放在数据服务器S3;
第三种数据处理:
根据步骤2.2方法,同样计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与Y=(y1,y2,y3,…,yn)的每个数据分成部分(xi=αiii,yi=αi′+βi′+γi′)在同样顺序加密循环运算之后的乘积赋值给Cxy,存放在数据服务器S3;
计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与A=(a1,a2,...,an)的每个数据分成部分(xi=αiii,Ai=αi″+βi″+γi″)在同样顺序加密循环运算之后的乘积赋值给Cxa,存放在数据服务器S3;
计算出n个消费者属性的量度X=(x1,x2,x3,…,xn)与B=(b1,b2,...,bn)的每个数据分成部分(xi=αiii,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cxb,存放在数据服务器S3;
计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)在同样顺序加密循环运算之后的乘积赋值给Cya,存放在数据服务器S3;
计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与B=(b1,b2,...,bn)的每个数据分成部分(yi=αi′+βi′+γi′,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cyb,存放在数据服务器S3;
计算出n个消费者属性的量度A=(a1,a2,...,an)与B=(b1,b2,...,bn)的每个数据分成部分(Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cab,存放在数据服务器S3。
7.根据权利要求3所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤2.4中所述循环算法的具体实现过程是:
假设n个消费者属性的三个量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn);(yi,Ai,Bi)属于同一个消费者,即第i个消费者,并且量度Y,A,B之间相互没有影响;将每一个数据随机分为三个部分,即yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′,i取1到n之间任何一个整数;
第一种数据处理:
根据步骤2.3方法先在多个数据服务器的相互配合下,计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)的加密运算之后的乘积赋值给Cy和Ca、Cb,并存放在数据服务器S3;
第二种数据处理:
根据步骤2.3方法,计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn),A=(a1,a2,...,an),B=(b1,b2,...,bn)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在上述加密循环运算之后的乘积赋值给并存放在数据服务器S3;
第三种数据处理:
根据步骤2.3方法,计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与A=(a1,a2,...,an)的每个数据分成部分(yi=αi′+βi′+γi′,Ai=αi″+βi″+γi″)在同样顺序加密循环运算之后的乘积赋值给Cya,存放在数据服务器S3;
计算出n个消费者属性的量度Y=(y1,y2,y3,…,yn)与B=(b1,b2,...,bn)的每个数据分成部分(yi=αi′+βi′+γi′,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cyb,存放在数据服务器S3;
计算出n个消费者属性的量度A=(a1,a2,...,an)与B=(b1,b2,...,bn)的每个数据分成部分(Ai=αi″+βi″+γi″,Bi=αi″′+βi″′+γi″′)在同样顺序加密循环运算之后的乘积赋值给Cab,存放在数据服务器S3;
当有四个量度甚至多个的时候,以此类推。
8.根据权利要求1所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤3的具体实现包括以下子步骤:
步骤3.1:验证请求;
用户访问数据时,用户用自己的身份数据属性向数据服务器做出请求,并且提供用户的签名和证书,数据服务器根据初始过程中产生的验证钥验证用户的身份,验证通过之后再对数据服务器发出请求,其中包括要查询的内容;
步骤3.2:数据解密;
数据服务器接收到用户的请求之后,根据用户发送的命令请求,返回给用户已经处理过的数据,用户用自己的私钥在用户客户端对数据进行解密,得到相应的统计值明文;
步骤3.3:数据整合;
根据用户发出的请求命令,利用处理过适合于处理过的密文进行统计运算的公式,用户在客服端对解密之后的数据进行相应的相关性统计数据整合计算,最终得到需要查询的内容。
9.根据权利要求8所述的保护电子交易中消费者隐私的大数据相关性分析方法,其特征在于,步骤3.3的具体实现过程是:
(1)如果用户查询的是消费者属性的某一量度的平均值,对应步骤2.1,得到的明文是在用户客户端计算X的平局值
(2)如果用户查询的是消费者属性的一个量度在某些量度干扰下与另一量度的相关性值系数,对应步骤2.2,得到的明文是
在用户客户端计算出X与Y的相关性rXY
同样计算出X与A的相关性rXA,Y与A的相关性rYA
从而计算出半偏相关系数:
用户最终得到消费者属性的一个量度在某些量度干扰下与另一量度的相关性值系数,从而判断两个量度之间是否有紧密联系;
半偏相关系数取值范围都是从0到1,0表示完全不相关,1表示完全相关,最后得到的值越靠近1则表示关联性越大,对于接下来涉及到的相关系数的取值全部适用;
(3)如果用户查询的是消费者属性的两个量度在同样的多个干扰下的相关性系数,如果对应步骤2.3第一个假设,则和上述(2)一样,得出X与Y的相关性rXY,X与A的相关性rXA,Y与A的相关性rYA
最后用户计算全偏相关系数:
如果对应步骤2.3第二个假设,得到的明文是
计算出X与Y的相关性在A的干扰下的相关性rXY.A,X与B的相关性在A的干扰下的相关性rXB.A,Y与B的相关性在A的干扰下的相关性rYB.A
从而计算出全偏相关系数:
若出现更多的量度,以此类推;
用户最终得到消费者属性的两个量度在同样的多个干扰下的相关性值系数,从而判断两个量度之间是否有紧密联系;
(4)如果用户查询的是消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数,对应步骤2.4,得到的明文是
计算出Y与A的相关性rYA,Y与B在A的干扰下的相关性rYB.A
从而计算复相关系数:r2 Y.AB=r2 Y.A+r2 YB.A(1-r2 Y.A);
若出现更多的量度,以此类推;
用户最终得到消费者属性的一个量度与多个属性在没有任何干扰的情况下的相关性系数,从而判断多个量度之间是否有紧密联系。
10.一种保护电子交易中消费者隐私的大数据相关性分析系统,其特征在于:包括数据存储模块、数据统计处理模块、访问查询模块;
所述数据存储模块包括预处理参数生成单元、数据收集单元、数据分块单元;所述数据统计处理模块包括平均值处理单元、半偏相关处理单元、全偏相关处理单元、复相关处理单元;所述访问查询模块包括验证请求单元、数据解密单元、数据整合单元;
所述数据存储模块用于系统初始化,将数据随机分散后加密存储到各个数据服务器;所述数据统计处理模块用于对相关统计分析计算进行密文的数据处理;所述访问查询模块用于用户通过请求之后在客户端对密文进行解密计算。
CN201711406465.7A 2017-12-22 2017-12-22 保护电子交易中消费者隐私的大数据相关性分析方法及系统 Active CN108171076B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711406465.7A CN108171076B (zh) 2017-12-22 2017-12-22 保护电子交易中消费者隐私的大数据相关性分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711406465.7A CN108171076B (zh) 2017-12-22 2017-12-22 保护电子交易中消费者隐私的大数据相关性分析方法及系统

Publications (2)

Publication Number Publication Date
CN108171076A true CN108171076A (zh) 2018-06-15
CN108171076B CN108171076B (zh) 2021-04-02

Family

ID=62523493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711406465.7A Active CN108171076B (zh) 2017-12-22 2017-12-22 保护电子交易中消费者隐私的大数据相关性分析方法及系统

Country Status (1)

Country Link
CN (1) CN108171076B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191095A (zh) * 2018-10-23 2019-01-11 湖北工业大学 一种可快速定位内部攻击者的电子现金分配方法及系统
CN111832068A (zh) * 2020-06-03 2020-10-27 北京沅启融安科技有限公司 一种保证数据隐私和业务保密性的分析方法
CN113222601A (zh) * 2021-05-19 2021-08-06 湖北工业大学 一种许可区块链匿名交易背书系统及方法
CN114697116A (zh) * 2022-01-27 2022-07-01 深圳市中悦科技有限公司 一种学生隐私数据的权限访问控制系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294967A (zh) * 2013-05-10 2013-09-11 中国地质大学(武汉) 大数据挖掘下的用户隐私保护方法及系统
US20150058931A1 (en) * 2013-08-23 2015-02-26 Morphotrust Usa, Llc System and Method for Identity Management
CN104778273A (zh) * 2015-04-24 2015-07-15 淘金信息科技江苏有限公司 一种用于购物网站的大数据分析系统
CN105050125A (zh) * 2015-06-23 2015-11-11 武汉虹信通信技术有限责任公司 一种面向用户体验的移动数据业务质量评测方法及装置
US20160140544A1 (en) * 2014-11-17 2016-05-19 Mastercard International Incorporated Systems and methods for effectively anonymizing consumer transaction data
CN105653981A (zh) * 2015-12-31 2016-06-08 中国电子科技网络信息安全有限公司 大数据平台的数据流通与交易的敏感数据保护系统及方法
CN106548264A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种数据分析方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294967A (zh) * 2013-05-10 2013-09-11 中国地质大学(武汉) 大数据挖掘下的用户隐私保护方法及系统
US20150058931A1 (en) * 2013-08-23 2015-02-26 Morphotrust Usa, Llc System and Method for Identity Management
US20160140544A1 (en) * 2014-11-17 2016-05-19 Mastercard International Incorporated Systems and methods for effectively anonymizing consumer transaction data
CN104778273A (zh) * 2015-04-24 2015-07-15 淘金信息科技江苏有限公司 一种用于购物网站的大数据分析系统
CN105050125A (zh) * 2015-06-23 2015-11-11 武汉虹信通信技术有限责任公司 一种面向用户体验的移动数据业务质量评测方法及装置
CN106548264A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 一种数据分析方法和装置
CN105653981A (zh) * 2015-12-31 2016-06-08 中国电子科技网络信息安全有限公司 大数据平台的数据流通与交易的敏感数据保护系统及方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JESUS DIAZ 等: "Privacy Threats in E-Shopping (Position Paper)", 《INTERNATIONAL WORKSHOP ON DATA PRIVACY MANAGEMENT》 *
QIAN WANG 等: "Learning privately: Privacy-preserving canonical correlation analysis for cross-media retrieval", 《IEEE INFOCOM 2017 - IEEE CONFERENCE ON COMPUTER COMMUNICATIONS》 *
朱光婷: "大数据环境下C2C模式中消费者行为研究", 《中国优秀硕士学位论文全文数据库》 *
梁吉业: "大数据相关分析综述", 《计算机学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109191095A (zh) * 2018-10-23 2019-01-11 湖北工业大学 一种可快速定位内部攻击者的电子现金分配方法及系统
CN111832068A (zh) * 2020-06-03 2020-10-27 北京沅启融安科技有限公司 一种保证数据隐私和业务保密性的分析方法
CN113222601A (zh) * 2021-05-19 2021-08-06 湖北工业大学 一种许可区块链匿名交易背书系统及方法
CN113222601B (zh) * 2021-05-19 2022-06-07 湖北工业大学 一种许可区块链匿名交易背书系统及方法
CN114697116A (zh) * 2022-01-27 2022-07-01 深圳市中悦科技有限公司 一种学生隐私数据的权限访问控制系统

Also Published As

Publication number Publication date
CN108171076B (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
Li et al. Privacy-preserving-outsourced association rule mining on vertically partitioned databases
JP5680725B2 (ja) 複雑性の低い装置の認証及び機密性を提供する方法及び装置
Badsha et al. Privacy preserving user-based recommender system
JP5562687B2 (ja) 第1のユーザによって第2のユーザに送信される通信の安全化
Chaudhari et al. Privacy preserving searchable encryption with fine-grained access control
JP4790731B2 (ja) 派生シード
CN107864139A (zh) 一种基于动态规则的密码学属性基访问控制方法与系统
CN108171076A (zh) 保护电子交易中消费者隐私的大数据相关性分析方法及系统
CN107256248A (zh) 云存储安全中基于通配符的可搜索加密方法
CN105610910A (zh) 面向云存储并基于全同态密码的密文全文检索方法及系统
CN110120873B (zh) 基于云外包交易数据的频繁项集挖掘方法
CN112148801A (zh) 保护数据隐私的多方联合进行业务对象预测的方法及装置
Dimitriou Key evolving RFID systems: Forward/backward privacy and ownership transfer of RFID tags
Zhu et al. Efficient and privacy-preserving online fingerprint authentication scheme over outsourced data
Yi et al. Privacy-preserving user profile matching in social networks
CN114021164B (zh) 基于区块链的征信系统隐私保护方法
Tsai et al. A chaotic map‐based anonymous multi‐server authenticated key agreement protocol using smart card
CN110474908A (zh) 交易监管方法与装置、存储介质及计算机设备
Bao et al. Privacy protection for transactions of digital goods
CN108132977A (zh) 基于垂直划分的密文数据库查询方法及系统
Suthanthiramani et al. Secured data storage and retrieval using elliptic curve cryptography in cloud.
Jadhav et al. Association rule mining methods for applying encryption techniques in transaction dataset
Akgün et al. A privacy-preserving scheme for smart grid using trusted execution environment
Kerschbaum et al. RFID-based supply chain partner authentication and key agreement
Kwecka et al. “I am Spartacus”: privacy enhancing technologies, collaborative obfuscation and privacy as a public good

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221102

Address after: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province

Patentee after: Yami Technology (Guangzhou) Co.,Ltd.

Address before: 430068 1, Lijia 1 village, Nanhu, Wuchang District, Wuhan, Hubei

Patentee before: HUBEI University OF TECHNOLOGY

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221116

Address after: 3308, Building 4, Phase II, Tian'an Yungu Industrial Park, Gangtou Community, Bantian Street, Longgang District, Shenzhen, Guangdong 518100

Patentee after: Shenzhen Chongqian Industry Co.,Ltd.

Address before: Room 801, 85 Kefeng Road, Huangpu District, Guangzhou City, Guangdong Province

Patentee before: Yami Technology (Guangzhou) Co.,Ltd.

TR01 Transfer of patent right