CN114257412B - 隐私保护的多方数据协作分箱方法、系统、设备、终端 - Google Patents

隐私保护的多方数据协作分箱方法、系统、设备、终端 Download PDF

Info

Publication number
CN114257412B
CN114257412B CN202111401352.4A CN202111401352A CN114257412B CN 114257412 B CN114257412 B CN 114257412B CN 202111401352 A CN202111401352 A CN 202111401352A CN 114257412 B CN114257412 B CN 114257412B
Authority
CN
China
Prior art keywords
data
encryption
cloud server
encrypted
box
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111401352.4A
Other languages
English (en)
Other versions
CN114257412A (zh
Inventor
朱辉
李沛凝
魏立力
王枫为
兰玮
胡国靖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
China Mobile Suzhou Software Technology Co Ltd
Original Assignee
Xidian University
China Mobile Suzhou Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University, China Mobile Suzhou Software Technology Co Ltd filed Critical Xidian University
Priority to CN202111401352.4A priority Critical patent/CN114257412B/zh
Publication of CN114257412A publication Critical patent/CN114257412A/zh
Application granted granted Critical
Publication of CN114257412B publication Critical patent/CN114257412B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Abstract

本发明属于信息安全技术领域,公开了一种隐私保护的多方数据协作分箱方法、系统、设备、终端,所述隐私保护的多方数据协作分箱方法包括:系统加密参数生成;分箱变量预处理和加密;分箱区间边界值协商;隐私保护的多方数据分箱;所述隐私保护的多方数据协作分箱系统包括:密钥分发中心、数据拥有者和云服务器。本发明对加密后的密文进行比较大小计算,实现在不泄露明文数据的前提下对明文数据大小的快速比较。本发明能够在确保分箱操作正确性前提下,实现对敏感数据的隐私保护,适用于分布式多参与方协同数据分箱场景。本发明在隐私保护的前提下,云服务器能够对密文进行高效比较大小计算,实现快速数据分箱操作,确保数据拥有者数据的安全性。

Description

隐私保护的多方数据协作分箱方法、系统、设备、终端
技术领域
本发明属于信息安全技术领域,尤其涉及一种隐私保护的多方数据协作分箱方法、系统、设备、终端。
背景技术
目前,随着社会信息化建设的不断深化,生活工作中对数据的处理需求越来越多。数据分箱作为一种数据预处理技术,可以用于减少次要观察误差的影响,在金融、医疗、交通等诸多领域得到了广泛应用。在传统的数据分箱算法中,通常需要对每个用户的特征数据值进行数据处理,进而完成分箱服务。而上述数据分箱过程的数据方,通常又不希望向对方泄露己方所拥有的数据信息。为了找出一种解决上述问题的方法,人们提出了一些解决方案,其中:
支付宝(杭州)信息技术有限公司申请的专利“基于隐私保护的数据处理方法、装置和服务器”(申请号CN202011278017.5申请公布号CN112100643B)公开了一种可以在不泄露双方所各自拥有的数据信息、保护数据隐私的前提下,安全地完成符合目标要求的特征数据的数据分箱。该发明的不足之处在于:在许多数据处理场景中,数据方是多于两方的,但是由于方案场景的限制,存在应用范围局限的问题。
南京邮电大学申请的专利“一种基于相似度分箱的空间点集数据隐私保护匹配的方法”(申请号CN202010344075.7申请公布号CN111460513A)公开了一种基于相似度等距分箱的空间点集数据隐私保护匹配的方法。该发明的不足之处在于:点集数据的处理需要复杂的数学运算,所提方法通过交换双方点集数据的相似度,对相似度值范围进行分箱,存在计算量大,以及精确性不足的问题。因此,亟需一种新的隐私保护的多方数据协作分箱方法、系统、设备、终端,以期能够弥补现有技术存在的缺陷,确保数据安全。
通过上述分析,现有技术存在的问题及缺陷为:
(1)现有的隐私保护的数据分箱方案,仅存在两方数据方的应用场景,不能支持多方数据协作分箱的需求,存在应用场景范围局限的问题,不能适应多个数据拥有者的场景。
(2)现有的隐私保护的数据分箱方案,由于安全性的考虑,存在计算复杂、精确度不高的问题。
解决以上问题及缺陷的难度为:现有隐私保护方案计算开销大,且存在安全性与可用性相互制约的问题。同时,现存数据分箱方案难以实现在分布式计算场景下,提供多个数据方有效隐私保护。
解决以上问题及缺陷的意义为:针对分布式场景中的数据分箱问题,设计隐私保护的多方数据协作分箱算法,能够在不泄露各方拥有的数据信息、保护数据隐私的前提下,完成对敏感特征数据的数据分箱操作,为多方分布式场景中的数据安全处理和分析提供支持。
发明内容
针对现有技术存在的问题,本发明提供了一种隐私保护的多方数据协作分箱方法、系统、设备、终端。
本发明是这样实现的,一种隐私保护的多方数据协作分箱方法,所述隐私保护的多方数据协作分箱方法包括以下步骤:
步骤一,系统加密参数生成,密钥分发中心选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥,为加密系统提供密钥支持;
步骤二,分箱变量预处理和加密,各数据拥有者分别计算所拥有数据的最大值和最小值,并使用加密参数对本地的最大值和最小值进行加密计算,然后将加密后的密文发送给云服务器,为数据分箱的边界值计算做准备;
步骤三,分箱区间边界值协商,云服务器对收到的各参与方发送的最大值和最小值的密文,使用加密数据比较算法计算所有参与方数据最大值和最小值的密文,然后公开;所有参与方共同协商分箱区间长度,对最大值到最小值的区间等距分割,获得每个区间的边界值,完成数据分箱操作前的边界值计算;
步骤四,隐私保护的多方数据分箱,各参与方使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器;云服务器通过加密算法比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
进一步,步骤一中,所述系统加密参数生成,包括:
(1)密钥分发中心选择一个数据空间Zr={0,1,...,r-1};其中r是一个正整数,假设数据空间比较小,因此r比较小;
(2)密钥分发中心选择两个大素数p和q使得r|(p-1),
Figure BDA0003364796360000031
并且gcd(r,q-1)=1,计算n=pq,φ=(p-1)(q-1);
(3)密钥分发中心选择
Figure BDA0003364796360000032
满足yφ/r≠1mod n,gcd(s,r)=1并且gcd(s,φ/r)=1,然后随机选择一个哈希函数h(·);
(4)密钥分发中心计算数据集
Figure BDA0003364796360000033
(5)密钥分发中心生成公共参数(y,n,h(.),U),将分布式数据加密密钥s发送每个数据参与方,数据比较密钥φ发送给云服务器方。
进一步,步骤二中,所述分箱变量预处理和加密,包括:
(1)参与方Pi拥有的数据表示为
Figure BDA0003364796360000034
本地计算其中最大值和最小值分别表示为
Figure BDA0003364796360000035
以及
Figure BDA0003364796360000036
然后对最大值和最小值进行加密计算:
Figure BDA0003364796360000041
Figure BDA0003364796360000042
其中,u1,u2为在
Figure BDA0003364796360000043
中选取的随机数,之后将
Figure BDA0003364796360000044
Figure BDA0003364796360000045
发送给云服务器;
(2)针对每一个参与方数据的最大值,云服务器通过密文比较算法,计算
Figure BDA0003364796360000046
如果c=1,则
Figure BDA0003364796360000047
如果h(c)属于数据集U,则
Figure BDA0003364796360000048
反之h(c-1)属于数据集U,
Figure BDA0003364796360000049
通过两两比较所有参与方的最大值
Figure BDA00033647963600000410
Figure BDA00033647963600000411
得到所有参与方数据的最大值为cxmax,同理计算所有参与方数据的最小为cxmin
进一步,步骤三中,所述分箱区间边界值协商,包括:
(1)所有参与方共同协商区间长度t,并对最大值和最小值的对应明文区间(xmin,xmax)等距分割,获得每个区间的边界值(xmin,xmin+t,xmin+2t,...,xmax),然后参与方在本地对每个区间边界进行加密计算:
Figure BDA00033647963600000412
Figure BDA00033647963600000413
Figure BDA00033647963600000414
Figure BDA0003364796360000051
其中,u1,u2,...,ul为在
Figure BDA0003364796360000052
中选取的随机数,将加密后的每个区间边界值(cxmin,cxmin+t,cxmin+2t,...,cxmax)发送给云服务器。
进一步,步骤四中,所述隐私保护的多方数据分箱,包括:
(1)参与方Pi对拥有数据
Figure BDA0003364796360000053
依次执行计算
Figure BDA0003364796360000054
其中ul为在
Figure BDA0003364796360000055
中选取的随机数,得到加密后的数据
Figure BDA0003364796360000056
并将加密CX(i)发送给云服务器;
(2)针对收到的每一个参与方的加密数据
Figure BDA0003364796360000057
云服务器通过密文比较算法,计算
Figure BDA0003364796360000058
如果c=1,则
Figure BDA0003364796360000059
如果h(c)属于数据集U,则
Figure BDA00033647963600000510
反之h(c-1)属于数据集U,
Figure BDA00033647963600000511
通过依次比较参与方的加密数据
Figure BDA00033647963600000512
和加密后的每个区间边界值(cxmin,cxmin+t,cxmin+2t,...,cxmax)的大小关系,找到满足
Figure BDA00033647963600000513
的区间(cxmin+kt,cxmin+(k+1)t),进而完成参与方的加密数据
Figure BDA00033647963600000514
的分箱操作。
本发明的另一目的在于提供一种应用所述的隐私保护的多方数据协作分箱方法的隐私保护的多方数据协作分箱系统,所述隐私保护的多方数据协作分箱系统包括:
密钥分发中心,用于选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
数据拥有者,用于计算所拥有数据的最大值和最小值,使用加密参数对本地的最大值和最小值进行加密计算,并将加密后的密文发送给云服务器;共同协商分箱区间长度,对最大值和最小值的区间等距分割,获得每个区间的边界值;使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器;
云服务器,用于对收到的各数据拥有者的最大值和最小值的密文,使用数据比较算法计算并公开所有参与方数据的最大值和最小值的密文;比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
进一步,所述密钥分发中心,包括:
系统参数生成模块,用于完成系统初始化,选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
多方密钥分发模块,用于公开加密系统公共参数,并将参与方的数据加密密钥及云服务器方的数据比较密钥分别分发给各数据拥有者与云服务器。
进一步,所述数据拥有者,包括:
特征值本地预处理模块,用于使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器。
分箱区间边界协商模块,用于计算所拥有数据的最大值和最小值,使用加密参数对本地的最大值和最小值进行加密计算,并将加密后的密文发送给云服务器;共同协商分箱区间长度,对最大值和最小值的区间等距分割,获得每个区间的边界值;
进一步,所述云服务器,包括:
特征值比较计算模块,用于对收到的各参与方的最大值和最小值的密文,使用数据比较算法计算所有参与方数据的最大值和最小值,然后公开;
隐私保护数据分箱模块,用于比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
系统加密参数生成,密钥分发中心选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;分箱变量预处理和加密,各数据拥有者分别计算所拥有数据的最大值和最小值,并使用加密参数对本地的最大值和最小值进行加密计算,然后将加密后的密文发送给云服务器;
分箱区间边界值协商,云服务器对收到的各参与方发送的最大值和最小值的密文,使用加密数据比较算法计算所有参与方数据最大值和最小值的密文,然后公开;所有参与方共同协商分箱区间长度,对最大值到最小值的区间等距分割,获得每个区间的边界值;隐私保护的多方数据分箱,各参与方使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器;云服务器通过加密算法比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的隐私保护的多方数据协作分箱系统。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的隐私保护的多方数据协作分箱方法,基于隐私保护的多方数据协作分箱方法的场景适应性和隐私保护性两方面进行改进。
(1)场景适应性
本发明通过对现有的隐私保护的数据分箱算法的分析,针对原方案中两方数据拥有者的交互计算存在应用范围的局限,将两方的数据拥有者模型改进为分布式云服务器模型,云服务器为各参与方提供数据分箱服务,而参与方不必参与数据分箱的过程,这种模型将可以适应多个参与方的场景,应用范围更广。
(2)隐私保护性
本发明通过对数据分箱上隐私保护方法的分析,设计了基于保序加密的多方数据协作分箱方案,利用保序加密技术,各参与方可以在本地加密数据并发送给云服务器,云服务器利用保序加密的性质对加密后的数据进行数据分箱过程,在整个过程中,云服务器不能获得参与方的明文数据,保障了参与方数据的安全性。
针对分布式场景中的数据分箱问题,本发明设计得到的隐私保护的多方数据协作分箱算法,能够在不泄露各方拥有的数据信息、保护数据隐私的前提下,完成对敏感特征数据的数据分箱操作,为多方分布式场景中的数据安全处理和分析提供支持。本发明实现了分箱操作过程中敏感数据的隐私保护,数据拥有者的本地数据在发送给云服务器之前,通过加密技术进行加密,使得各数据拥有者的特征信息不被泄露,确保了数据拥有者数据的安全性。
本发明能对加密后的密文进行比较大小计算,实现在不泄露明文数据的前提下,对明文数据大小的比较。本发明可用于分布式场景中多方数据协同分箱,能够在确保分箱操作正确性的前提下,实现对敏感数据的隐私保护。本发明在隐私保护的前提下,云服务器能够对加密后的密文进行比较大小计算。云服务器可以通过密文比较操作,实现对密文的数据分箱操作。本发明适用于分布式的多参与方协同数据分箱场景。将加密技术与数据分箱技术进行了结合,提出了适用于多方数据协同分箱算法,能够解决分布式场景中数据处理的安全问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的隐私保护的多方数据协作分箱方法流程图。
图2是本发明实施例提供的隐私保护的多方数据协作分箱方法原理图。
图3是本发明实施例提供的隐私保护的多方数据协作分箱系统结构示意图;
图中:1、密钥分发中心;2、参与方;3、云服务器。
图4是本发明实施例提供的隐私保护的多方数据协作分箱系统原理示意图。
图5是本发明实施例提供的系统初始化子流程图。
图6是本发明实施例提供的密文数据处理与数据分箱子流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例在分布式多参与方协同数据分箱场景下,通过对隐私数据使用一种隐私保护的加密方法进行加密,进而云服务器与数据拥有者之间进行加密分箱区间边界值的协商,最后数据拥有者比较加密后的隐私数据与分箱区间的大小,实现对密文的数据分箱操作。
本发明实施例可以用于梯度渐进回归树GBDT模型的特征选择过程中的变量分箱,通过使用数据分箱的方法选出相对重要的特征用于构建分类器。本发明实施例是等距分段,变量分箱是由连续变量离散化实现,进而减少了训练的时间,而且GBDT模型的拟合能力也不会出现很大的降低。
实现一种隐私保护的多方数据协作分箱方法、系统、设备、终端,所述隐私保护的多方数据协作分箱方法包括:系统加密参数生成;分箱变量预处理和加密;分箱区间边界值协商;隐私保护的多方数据分箱;所述隐私保护的多方数据协作分箱系统包括:密钥分发中心、数据拥有者和云服务器。本发明能对加密后的密文进行比较大小计算,实现在不泄露明文数据的前提下对明文数据大小的比较。本发明能够在确保分箱操作正确性前提下,实现对敏感数据的隐私保护,适用于分布式多参与方协同数据分箱场景。本发明在隐私保护的前提下,云服务器能够对加密后的密文进行比较大小计算;云服务器可以通过密文比较操作,实现对密文的数据分箱操作,确保数据拥有者数据的安全性。
针对现有技术存在的问题,本发明提供了一种隐私保护的多方数据协作分箱方法、系统、设备、终端,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的隐私保护的多方数据协作分箱方法包括以下步骤:
S101,系统加密参数生成,密钥分发中心选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
S102,分箱变量预处理和加密,各数据拥有者分别计算所拥有数据的最大值和最小值,并使用加密参数对本地的最大值和最小值进行加密计算,然后将加密后的密文发送给云服务器;
S103,分箱区间边界值协商,云服务器对收到的各参与方发送的最大值和最小值的密文,使用加密数据比较算法计算所有参与方数据最大值和最小值的密文,然后公开;所有参与方共同协商分箱区间长度,对最大值到最小值的区间等距分割,获得每个区间的边界值;
S104,隐私保护的多方数据分箱,各参与方使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器;云服务器通过加密算法比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
本发明实施例提供的隐私保护的多方数据协作分箱方法原理图如图2所示。
如图3所示,本发明实施例提供的隐私保护的多方数据协作分箱系统包括:
密钥分发中心1,用于选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
数据拥有者2,用于计算所拥有数据的最大值和最小值,使用加密参数对本地的最大值和最小值进行加密计算,并将加密后的密文发送给云服务器;共同协商分箱区间长度,对最大值和最小值的区间等距分割,获得每个区间的边界值;使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器;
云服务器3,用于对收到的各数据拥有者的最大值和最小值的密文,使用数据比较算法计算并公开所有参与方数据的最大值和最小值;比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
本发明实施例提供的密钥分发中心1包括:
系统参数生成模块,用于完成系统初始化,选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
多方密钥分发模块,用于公开加密系统公共参数,并将参与方的数据加密密钥及云服务器方的数据比较密钥分别分发给各数据拥有者与云服务器。
本发明实施例提供的数据拥有者2包括:
特征值本地预处理模块,用于使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器。
分箱区间边界协商模块,用于计算所拥有数据的最大值和最小值,使用加密参数对本地的最大值和最小值进行加密计算,并将加密后的密文发送给云服务器;共同协商分箱区间长度,对最大值和最小值的区间等距分割,获得每个区间的边界值;
本发明实施例提供的云服务器3包括:
特征值比较计算模块,用于对收到的各参与方的最大值和最小值的密文,使用数据比较算法计算所有参与方数据的最大值和最小值,然后公开;
隐私保护数据分箱模块,用于比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
本发明实施例提供的隐私保护的多方数据协作分箱系统原理图如图4所示。
下面结合具体实施例对本发明的技术方案作进一步描述。
本发明实施例提供的隐私保护的多方数据协作分箱方法,包括以下步骤:
步骤1,系统加密参数生成,密钥分发中心选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
步骤2,分箱变量预处理和加密,各数据拥有者分别计算所拥有数据的最大值和最小值,并使用加密参数对本地的最大值和最小值进行加密计算,然后将加密后的密文发送给云服务器;
步骤3,分箱区间边界值协商,云服务器对收到的各参与方发送的最大值和最小值的密文,使用加密数据比较算法计算所有参与方数据最大值和最小值的密文,然后公开;所有参与方共同协商分箱区间长度,对最大值到最小值的区间等距分割,获得每个区间的边界值;
步骤4,隐私保护的多方数据分箱,各参与方使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器;云服务器通过加密算法比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
如图4所示,本发明实施例提供的隐私保护的多方数据协作分箱系统包括:密钥分发中心,数据拥有者以及云服务器三个组成部分,其中:
密钥分发中心,用于选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
数据拥有者,计算所拥有数据的最大值和最小值,并使用加密参数对本地的最大值和最小值进行加密计算,然后将加密后的密文发送给云服务器;共同协商分箱区间长度,对最大值和最小值的区间等距分割,获得每个区间的边界值;使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器;
云服务器,用于对收到的各数据拥有者的最大值和最小值的密文,使用数据比较算法计算所有参与方数据的最大值和最小值,然后公开;比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
本发明实施例提供的隐私保护的多方数据协作分箱方法,包括系统加密参数生成,密钥分发中心生成加密系统参数、分布式数据加密密钥和云服务器数据比较密钥;分箱变量预处理和加密,加密分箱区间边界值协商,云服务器计算所有参与方数据的最大值和最小值,参与方共同协商区间长度,计算区间边界值;参与方加密所有数据发送给云服务器,云服务器比较数据与区间边界值,完成数据分箱。本发明可用于分布式场景中多方数据协作分箱,能够在确保多方数据协作分箱的同时,实现对多参与方数据的隐私保护。
如图2所示,本发明实施例提供的隐私保护的多方数据协作分箱方法,包括如下步骤:
步骤一,系统加密参数生成。
1.1)密钥分发中心选择一个数据空间Zr={0,1,...,r-1};其中r是一个正整数,假设数据空间比较小,因此r比较小;
1.2)密钥分发中心选择两个大素数p和q使得r|(p-1),
Figure BDA0003364796360000131
并且gcd(r,q-1)=1,计算n=pq,φ=(p-1)(q-1);
1.3)密钥分发中心选择
Figure BDA0003364796360000132
满足yφ/r≠1mod n,gcd(s,r)=1并且gcd(s,φ/r)=1,然后随机选择一个哈希函数h(·);
1.4)密钥分发中心计算数据集
Figure BDA0003364796360000133
1.5)密钥分发中心生成公共参数(y,n,h(.),U),将分布式数据加密密钥s发送每个数据参与方,数据比较密钥φ发送给云服务器方。
步骤二,分箱变量预处理和加密。
2.1)参与方Pi拥有的数据表示为
Figure BDA0003364796360000141
本地计算其中最大值和最小值分别表示为
Figure BDA0003364796360000142
以及
Figure BDA0003364796360000143
然后对最大值和最小值进行加密计算:
Figure BDA0003364796360000144
Figure BDA0003364796360000145
其中,u1,u2为在
Figure BDA0003364796360000146
中选取的随机数,之后将
Figure BDA0003364796360000147
Figure BDA0003364796360000148
发送给云服务器;
2.2)针对每一个参与方数据的最大值,云服务器通过密文比较算法,计算
Figure BDA0003364796360000149
如果c=1,则
Figure BDA00033647963600001410
如果h(c)属于数据集U,则
Figure BDA00033647963600001411
反之h(c-1)属于数据集U,
Figure BDA00033647963600001412
通过两两比较所有参与方的最大值
Figure BDA00033647963600001413
Figure BDA00033647963600001414
得到所有参与方数据的最大值为cxmax,同理计算所有参与方数据的最小为cxmin
步骤三,加密分箱区间边界值协商。
3.1)所有参与方共同协商区间长度t,并对最大值和最小值的对应明文区间(xmin,xmax)等距分割,获得每个区间的边界值(xmin,xmin+t,xmin+2t,...,xmax),然后参与方在本地对每个区间边界进行加密计算:
Figure BDA00033647963600001415
Figure BDA00033647963600001416
Figure BDA0003364796360000151
Figure BDA0003364796360000152
其中,u1,u2,...,ul为在
Figure BDA0003364796360000153
中选取的随机数,将加密后的每个区间边界值(cxmin,cxmin+t,cxmin+2t,...,cxmax)发送给云服务器。
步骤四,隐私保护的多方数据分箱。
4.1)参与方Pi对拥有数据
Figure BDA0003364796360000154
依次执行计算
Figure BDA0003364796360000155
其中ul为在
Figure BDA0003364796360000156
中选取的随机数,得到加密后的数据
Figure BDA0003364796360000157
并将加密CX(i)发送给云服务器;
4.2)针对收到的每一个参与方的加密数据
Figure BDA0003364796360000158
云服务器通过密文比较算法,计算
Figure BDA0003364796360000159
如果c=1,则
Figure BDA00033647963600001510
如果h(c)属于数据集U,则
Figure BDA00033647963600001511
反之h(c-1)属于数据集U,
Figure BDA00033647963600001512
通过依次比较参与方的加密数据
Figure BDA00033647963600001513
和加密后的每个区间边界值(cxmin,cxmin+t,cxmin+2t,...,cxmax)的大小关系,找到满足
Figure BDA00033647963600001514
的区间(cxmin+kt,cxmin+(k+1)t),进而完成参与方的加密数据
Figure BDA00033647963600001515
的分箱操作。
本发明实施例提供的系统初始化子流程图如图5所示,本发明实施例提供的密文数据处理与数据分箱子流程图如图6所示。
下面结合测试对本发明的技术效果作详细的描述。
本实施例实验的仿真测试系统是由Java语言实现的,测试环境是IDEA。具体进行测试时,参与方、第三方和云服务器之间的通信由进程间的通信来完成,通过socket完成进程之间的通信实现。各个模块均使用Java开发,所涉及的密码学操作都是独立设计,没有使用加密库。
上述系统实现的基础上,对本实施例进行了仿真测试,验证了方案的正确性。
在系统初始化阶段,生成随机密钥组其中包括公钥和私钥,并生成加密器和比较器,用于加密参与方的数据并对加密后的数据进行大小比较。这里设计了使用加密器和比较器完成的数据排序算法并进行了测试。测试结果,随机生成两个数,用于测试加密器与比较器的正确性,其比较结果输出为1,多次测试结果均正确。并随机生成十个大整数,并通过加密器和比较器对它们的密文比较排序,输出结果也是正确的。
进一步测试了参与方、云服务器以及第三方通信的过程,这里假设有三个参与方,一个云服务器。首先在系统初始化阶段,第三方与参与方通信并传输密钥,第三方接受参与方的连接请求,然后第三方与云服务器通信并传输密钥。然后进行数据拥有者与云服务器连接,数据拥有者将加密数据发送给云服务器进行比较大小以及分箱操作。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种隐私保护的多方数据协作分箱方法,其特征在于,所述隐私保护的多方数据协作分箱方法包括以下步骤:
步骤一,系统初始化,密钥分发中心选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
步骤二,加密分箱区间边界值协商,各数据拥有者分别计算所拥有数据的最大值和最小值,并使用加密参数对本地的最大值和最小值进行加密计算,然后将加密后的密文发送给云服务器;
步骤三,云服务器对收到的各参与方发送的最大值和最小值的密文,使用加密数据比较算法计算所有参与方数据最大值和最小值的密文,所有参与方共同协商分箱区间长度,对最大值到最小值的区间等距分割,获得每个区间的边界值;
步骤四,云服务器密文数据分箱,各参与方使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器;云服务器通过加密算法比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作;
步骤二中,所述加密分箱区间边界值协商,包括:
(1)参与方Pi拥有的数据表示为
Figure FDA0003740996500000011
本地计算其中最大值和最小值分别表示为
Figure FDA0003740996500000012
以及
Figure FDA0003740996500000013
然后对最大值和最小值进行加密计算:
Figure FDA0003740996500000014
Figure FDA0003740996500000015
其中,u1,u2为在
Figure FDA0003740996500000016
中选取的随机数,之后将
Figure FDA0003740996500000017
Figure FDA0003740996500000018
发送给云服务器;
(2)针对每一个参与方数据的最大值,云服务器通过密文比较算法,计算
Figure FDA0003740996500000021
如果c=1,则
Figure FDA0003740996500000022
如果h(c)属于数据集U,则
Figure FDA0003740996500000023
反之h(c-1)属于数据集U,
Figure FDA0003740996500000024
通过两两比较所有参与方的最大值
Figure FDA0003740996500000025
Figure FDA0003740996500000026
得到所有参与方数据的最大值为cxmax,同理计算所有参与方数据的最小为cxmin
(3)所有参与方共同协商区间长度t,并对最大值和最小值的对应明文区间(xmin,xmax)等距分割,获得每个区间的边界值(xmin,xmin+t,xmin+2t,...,xmax),然后参与方在本地对每个区间边界进行加密计算:
Figure FDA0003740996500000027
Figure FDA0003740996500000028
Figure FDA0003740996500000029
Figure FDA00037409965000000210
其中,u1,u2,...,ul为在
Figure FDA00037409965000000211
中选取的随机数,将加密后的每个区间边界值(cxmin,cxmin+t,cxmin+2t,...,cxmax)发送给云服务器。
2.如权利要求1所述的隐私保护的多方数据协作分箱方法,其特征在于,步骤一中,所述系统初始化,包括:
(1)密钥分发中心选择一个数据空间Zr={0,1,...,r-1};其中r是一个正整数,假设数据空间比较小,因此r比较小;
(2)密钥分发中心选择两个大素数p和q使得r|(p-1),
Figure FDA0003740996500000031
并且gcd(r,q-1)=1,计算n=pq,φ=(p-1)(q-1);
(3)密钥分发中心选择
Figure FDA0003740996500000032
满足yφ/r≠1 mod n,gcd(s,r)=1并且gcd(s,φ/r)=1,然后随机选择一个哈希函数h(·);
(4)密钥分发中心计算数据集
Figure FDA0003740996500000033
(5)密钥分发中心·公共参数(y,n,h(.),U),将分布式数据加密密钥s发送每个数据参与方,数据比较密钥φ发送给云服务器方。
3.如权利要求1所述的隐私保护的多方数据协作分箱方法,其特征在于,步骤四中,所述云服务器密文数据分箱,包括:
(1)参与方Pi对拥有数据
Figure FDA0003740996500000034
依次执行计算
Figure FDA0003740996500000035
其中ul为在
Figure FDA0003740996500000036
中选取的随机数,得到加密后的数据
Figure FDA0003740996500000037
并将加密CX(i)发送给云服务器;
(2)针对收到的每一个参与方的加密数据
Figure FDA0003740996500000038
云服务器通过密文比较算法,计算
Figure FDA0003740996500000039
如果c=1,则
Figure FDA00037409965000000310
如果h(c)属于数据集U,则
Figure FDA00037409965000000311
反之h(c-1)属于数据集U,
Figure FDA00037409965000000312
通过依次比较参与方的加密数据
Figure FDA00037409965000000313
和加密后的每个区间边界值(cxmin,cxmin+t,cxmin+2t,...,cxmax)的大小关系,找到满足
Figure FDA0003740996500000041
的区间(cxmin+kt,cxmin+(k+1)t),进而完成参与方的加密数据
Figure FDA0003740996500000042
的分箱操作,将加密后的每个区间边界值(cxmin,cxmin+t,cxmin+2t,...,cxmax)发送给云服务器。
4.一种实施权利要求1~3任意一项所述的隐私保护的多方数据协作分箱方法的隐私保护的多方数据协作分箱系统,其特征在于,所述隐私保护的多方数据协作分箱系统包括:
密钥分发中心,用于选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
数据拥有者,用于计算所拥有数据的最大值和最小值,使用加密参数对本地的最大值和最小值进行加密计算,并将加密后的密文发送给云服务器;共同协商分箱区间长度,对最大值和最小值的区间等距分割,获得每个区间的边界值;使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器;
云服务器,用于对收到的各数据拥有者的最大值和最小值的密文,使用数据比较算法计算所有参与方数据的最大值和最小值,公开;比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作,将加密后的每个区间边界值(cxmin,Cxmin+t,cxmin+2t,...,cxmax)发送给云服务器。
5.如权利要求4所述的隐私保护的多方数据协作分箱系统,其特征在于,所述密钥分发中心,包括:
加密参数生成模块,用于完成系统初始化,选择数据处理过程中数据空间大小,结合加密参数生成算法,为加密系统生成公共参数;同时生成各数据拥有者的数据加密密钥,以及云服务器方的数据比较密钥;
密钥分发模块,用于公开加密系统公共参数,并将参与方的数据加密密钥及云服务器方的数据比较密钥分别分发给各数据拥有者与云服务器。
6.如权利要求4所述的隐私保护的多方数据协作分箱系统,其特征在于,所述数据拥有者,包括:
分箱区间协商模块,用于计算所拥有数据的最大值和最小值,使用加密参数对本地的最大值和最小值进行加密计算,并将加密后的密文发送给云服务器;共同协商分箱区间长度,对最大值和最小值的区间等距分割,获得每个区间的边界值;
本地数据加密模块,用于使用加密参数对拥有的所有数据进行加密计算,并将加密后的数据发送给云服务器。
7.如权利要求4所述的隐私保护的多方数据协作分箱系统,其特征在于,所述云服务器,包括:
安全计算模块,用于对收到的各参与方的最大值和最小值的密文,使用数据比较算法计算所有参与方数据的最大值和最小值,然后公开;
安全分箱模块,用于比较收到的每个加密数据与加密后的区间边界的大小关系,依次进行分箱操作。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~3任意一项所述的隐私保护的多方数据协作分箱方法。
9.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求4~7任意一项所述的隐私保护的多方数据协作分箱系统,将加密后的每个区间边界值(cxmin,cxmin+t,cxmin+2t,...,cxmax)发送给云服务器。
CN202111401352.4A 2021-11-19 2021-11-19 隐私保护的多方数据协作分箱方法、系统、设备、终端 Active CN114257412B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111401352.4A CN114257412B (zh) 2021-11-19 2021-11-19 隐私保护的多方数据协作分箱方法、系统、设备、终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111401352.4A CN114257412B (zh) 2021-11-19 2021-11-19 隐私保护的多方数据协作分箱方法、系统、设备、终端

Publications (2)

Publication Number Publication Date
CN114257412A CN114257412A (zh) 2022-03-29
CN114257412B true CN114257412B (zh) 2022-10-14

Family

ID=80793151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111401352.4A Active CN114257412B (zh) 2021-11-19 2021-11-19 隐私保护的多方数据协作分箱方法、系统、设备、终端

Country Status (1)

Country Link
CN (1) CN114257412B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111402095A (zh) * 2020-03-23 2020-07-10 温州医科大学 一种基于同态加密联邦学习来检测学生行为与心理的方法
CN111507479A (zh) * 2020-04-15 2020-08-07 深圳前海微众银行股份有限公司 特征分箱方法、装置、设备及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8812873B2 (en) * 2012-09-26 2014-08-19 Intel Corporation Secure execution of a computer program using binary translators
CN103793593B (zh) * 2013-11-15 2018-02-13 吴一兵 一种获取大脑状态客观定量指标的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111402095A (zh) * 2020-03-23 2020-07-10 温州医科大学 一种基于同态加密联邦学习来检测学生行为与心理的方法
CN111507479A (zh) * 2020-04-15 2020-08-07 深圳前海微众银行股份有限公司 特征分箱方法、装置、设备及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《基于云服务器集群的云监控系统设计与实现》;沈青等;《计算机工程与科学》;20121031;全文 *
基于联邦学习的企业数据共享探讨;何雯等;《信息与电脑(理论版)》;20200425(第08期);全文 *

Also Published As

Publication number Publication date
CN114257412A (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
US20210143987A1 (en) Privacy-preserving federated learning
Wang et al. Privacy-preserving public auditing for data storage security in cloud computing
CN113033828B (zh) 模型训练方法、使用方法、系统、可信节点及设备
CN112131316B (zh) 应用于区块链系统的数据处理方法及装置
CN113162752B (zh) 基于混合同态加密的数据处理方法和装置
CN112906044A (zh) 多方安全计算方法、装置、设备及存储介质
Hassan et al. An efficient outsourced privacy preserving machine learning scheme with public verifiability
JP2023500570A (ja) コールドウォレットを用いたデジタルシグニチャ生成
CN112383550B (zh) 一种基于隐私保护的动态权限访问控制方法
KR20210139344A (ko) 데이터 기반 활동을 수행하는 방법 및 장치
CN112953700B (zh) 一种提升安全多方计算效率的方法、系统及存储介质
CN113434898B (zh) 一种非交互式的隐私保护逻辑回归联邦训练方法及系统
CN113922957B (zh) 一种基于隐私保护计算的虚拟云钱包系统
CN113660197A (zh) 混淆数据聚合隐私保护方法、系统、设备、介质、终端
CN114301677B (zh) 秘钥协商方法、装置、电子设备及存储介质
CN115664629A (zh) 一种基于同态加密的智慧物联平台数据隐私保护方法
CN115913537A (zh) 基于隐私保护的数据求交方法、系统及相关设备
CN117349685A (zh) 一种通信数据的聚类方法、系统、终端及介质
CN114257412B (zh) 隐私保护的多方数据协作分箱方法、系统、设备、终端
CN115065465A (zh) 一种基于零知识证明的个人数据处理方法及装置
Wang et al. FRNet: an MCS framework for efficient and secure data sensing and privacy protection in IoVs
TW202312055A (zh) 區塊鏈錢包的非互動式批核系統及其方法
Li et al. Efficient and traceable data sharing for the Internet of Things in smart cities
CN112865968B (zh) 数据密文托管方法、系统、计算机设备及存储介质
An et al. Efficient and privacy-preserving outsourcing of 2D-DCT and 2D-IDCT

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant