CN113987559B - 保护数据隐私的双方联合进行数据处理的方法及装置 - Google Patents
保护数据隐私的双方联合进行数据处理的方法及装置 Download PDFInfo
- Publication number
- CN113987559B CN113987559B CN202111601087.4A CN202111601087A CN113987559B CN 113987559 B CN113987559 B CN 113987559B CN 202111601087 A CN202111601087 A CN 202111601087A CN 113987559 B CN113987559 B CN 113987559B
- Authority
- CN
- China
- Prior art keywords
- vector
- party
- original
- result
- comprehensive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 182
- 238000000034 method Methods 0.000 title claims abstract description 108
- 239000013598 vector Substances 0.000 claims abstract description 794
- 239000011159 matrix material Substances 0.000 claims abstract description 248
- 238000004364 calculation method Methods 0.000 claims abstract description 121
- 238000013507 mapping Methods 0.000 claims abstract description 85
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 57
- 238000000354 decomposition reaction Methods 0.000 claims description 35
- 230000000873 masking effect Effects 0.000 claims description 21
- 239000002131 composite material Substances 0.000 claims description 19
- 239000012634 fragment Substances 0.000 claims description 19
- 230000008569 process Effects 0.000 description 48
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 8
- 238000002955 isolation Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 101000651200 Dictyostelium discoideum Sphingosine kinase B Proteins 0.000 description 1
- 241000820057 Ithone Species 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/008—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Storage Device Security (AREA)
Abstract
本说明书实施例提供一种保护数据隐私的双方联合进行数据处理的方法及装置,第一方持有隐私数据构成的原始矩阵,第二方持有隐私数据构成的n个原始向量,该方法包括:第一方从第二方接收加密综合向量,加密综合向量是使用第二方的公钥,利用同态加密算法对综合向量加密得到的,综合向量是,n个原始向量在对应的n个计算空间中的映射结果的组合,n个计算空间彼此不同且互相隔离;利用原始矩阵以及加密综合向量,确定加密结果向量;至少基于加密结果向量,确定数据处理结果,并将数据处理结果发送至第二方,使得第二方根据数据处理结果,获得原始矩阵与n个原始向量的相乘计算结果。
Description
技术领域
本说明书涉及数据安全技术领域,尤其涉及一种保护数据隐私的双方联合进行数据处理的方法及装置。
背景技术
在大数据背景下,常常需要将不同数据方的业务数据进行综合处理。例如,在基于机器学习的商户分类分析场景中,电子支付平台拥有商户的交易流水数据,电子商务平台存储有商户的销售数据,银行机构拥有商户的借贷数据,而模型方拥有建模的参数数据。在对多方数据进行联合处理的过程中,数据隐私的保护和安全性成为值得关注的问题。
在对多方数据进行联合处理的过程中,很多场景中需要对多方数据进行乘法计算,例如,在一个场景下,A方持有待处理的用户样本特征数据,B方持有数据处理模型,在通过该数据处理模型对样本特征数据实施处理时,需要对用户样本特征数据与该数据处理模型模型参数进行乘法计算。如果A方将样本数据直接发送至B方,会导致用户样本的特征取值被暴露,泄露用户隐私;如果B方将数据处理模型提供至A方进行使用,会导致数据处理模型的模型参数被暴露。
因此,希望提供改进的方案,在多方联合进行数据处理的过程中,保护各方隐私数据的安全。
发明内容
本说明书一个或多个实施例提供了一种保护数据隐私的双方联合进行数据处理的方法及装置,以实现保护各方隐私数据的安全的同时,降低计算量。
根据第一方面,提供一种保护数据隐私的双方联合进行数据处理的方法,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述方法通过所述第一方执行,所述方法包括:
从所述第二方接收加密综合向量,所述加密综合向量是使用所述第二方的公钥,利用同态加密算法对综合向量加密得到的,所述综合向量是,所述n个原始向量在对应的n个计算空间中的映射结果的组合,所述n个计算空间彼此不同且互相隔离;
利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;
至少基于所述加密结果向量,确定数据处理结果,并将所述数据处理结果发送至所述第二方,使得所述第二方根据所述数据处理结果,获得所述原始矩阵与所述n个原始向量的相乘计算结果。
在一种可实施方式中,所述n个计算空间的空间大小,至少根据所述原始矩阵与各个原始向量中元素乘积的最大有效位宽而确定。
在一种可实施方式中,所述至少基于所述加密结果向量,确定数据处理结果,包括:
生成n个随机向量,并将其相反数作为所述相乘计算结果的n个第一方分片;
将所述n个随机向量在所述n个计算空间的映射结果进行组合,得到综合随机向量;
基于所述综合随机向量以及所述加密结果向量,确定所述数据处理结果,使得所述第二方获得所述相乘计算结果的n个第二方分片。
在一种可实施方式中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述将所述n个随机向量在所述n个计算空间的映射结果进行组合,包括:
将所述n个随机向量中的第i随机向量的各个元素扩展第i空间对应的位数,得到第i随机映射结果;
基于各随机映射结果的加和,确定所述综合随机向量。
在一种可实施方式中,所述第i空间相较于第i-1空间的位数之差,根据所述原始矩阵与第i-1原始向量中元素乘积的最大有效位宽,以及针对所述n个随机向量预设的超额掩盖位宽而确定。
在一种可实施方式中,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述确定加密结果向量,包括:
利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量。
在一种可实施方式中,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述确定加密结果向量,包括:
利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量;
所述得到综合随机向量,包括:
利用所述中国剩余定理确定所述综合随机向量,使得所述综合随机向量满足,针对第i空间对应的第i模值取值的余数结果为第i随机向量。
在一种可实施方式中,所述第i模值的位宽,根据所述第i原始矩阵与第i原始向量中元素乘积的最大有效位宽,以及针对所述n个随机向量预设的超额掩盖位宽而确定。
在一种可实施方式中,所述基于所述综合随机向量以及所述加密结果向量,确定所述数据处理结果,包括:
生成目标随机向量,所述目标随机向量中各元素的位宽,根据所述最大有效位宽,所述超额掩盖位宽以及原始矩阵个数而确定;
将所述目标随机向量与所述n个模值连乘,并将所得的连乘结果叠加至所述综合随机向量,得到扩展随机向量;
将所述扩展随机向量,同态叠加至所述加密结果向量,得到所述数据处理结果。
根据第二方面,提供一种保护数据隐私的双方联合进行数据处理的方法,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述方法通过所述第二方执行,所述方法包括:
将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量,所述n个计算空间彼此不同且互相隔离;
使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方;
从所述第一方接收数据处理结果,所述数据处理结果是,所述第一方至少基于加密结果向量确定的,所述加密结果向量是基于所述原始矩阵以及所述加密综合向量确定的;
对所述数据处理结果进行解密,并将其分解到所述n个计算空间,根据分解结果获得所述原始矩阵与所述n个原始向量的相乘计算结果。
在一种可实施方式中,所述n个计算空间的空间大小,至少根据所述原始矩阵与各个原始向量中元素乘积的最大有效位宽而确定。
在一种可实施方式中,所述数据处理结果是,所述第一方基于所述加密结果向量以及综合随机向量确定的,所述综合随机向量是,所述第一方将n个随机向量在所述n个计算空间的映射结果进行组合而得到的,所述n个随机向量的相反数作为所述相乘计算结果的n个第一方分片;
所述根据分解结果获得所述原始矩阵与所述n个原始向量的相乘计算结果,包括:
将分解结果中的n个向量作为所述相乘计算结果的n个第二方分片。
在一种可实施方式中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述得到综合向量,包括:
将所述n个原始向量中的第i原始向量的各个元素扩展第i空间对应的位数,得到第i向量映射结果;
基于各向量映射结果的加和,得到所述综合向量。
在一种可实施方式中,所述第一方持有n个原始矩阵;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述得到综合向量,包括:
利用中国剩余定理确定所述综合向量,所述综合向量满足,针对第i空间对应的第i模值取模的余数结果为第i原始向量。
在一种可实施方式中,所述第二方持有原始向量集,所述n个原始向量是所述原始向量集中的部分向量,使得对应的所述n个计算空间的空间总和不大于所述同态加密算法对应的同态明文空间大小。
根据第三方面,提供一种保护数据隐私的双方联合进行数据处理的方法,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述方法包括:
所述第二方将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量;使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方,所述n个计算空间彼此不同且互相隔离;
所述第一方接收所述加密综合向量,利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;至少基于所述加密结果向量,确定数据处理结果,并将所述数据处理结果发送至所述第二方;
所述第二方接收所述数据处理结果;对所述数据处理结果进行解密,并将其分解到所述n个计算空间,根据分解结果获得所述原始矩阵与所述n个原始向量的相乘计算结果。
在一种可选实施方式,所述至少基于所述加密结果向量,确定数据处理结果,包括:
生成n个随机向量,并将其相反数作为所述相乘计算结果的n个第一方分片;
将所述n个随机向量在所述n个计算空间的映射结果进行组合,得到综合随机向量;
基于所述综合随机向量以及所述加密结果向量,确定所述数据处理结果;
所述根据分解结果获得所述原始矩阵与所述n个原始向量的相乘计算结果,包括:
将所述分解结果中的n个向量作为所述相乘计算结果的n个第二方分片。
在一种可选实施方式,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述第二方得到综合向量,包括:
将所述n个原始向量中的第i原始向量的各个元素扩展第i空间对应的位数,得到第i向量映射结果;
基于各向量映射结果的加和,得到所述综合向量;
所述第一方将所述n个随机向量在所述n个计算空间的映射结果进行组合,包括:
将所述n个随机向量中的第i随机向量的各个元素扩展第i空间对应的位数,得到第i随机映射结果;
基于各随机映射结果的加和,确定所述综合随机向量。
在一种可选实施方式,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述第二方得到综合向量,包括:
将所述n个原始向量中的第i原始向量的各个元素扩展第i空间对应的位数,得到第i向量映射结果;
基于各向量映射结果的加和,得到所述综合向量。
在一种可选实施方式,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述第二方得到综合向量,包括:
利用中国剩余定理确定所述综合向量,所述综合向量满足,针对第i空间对应的第i模值取模的余数结果为第i原始向量;
所述第一方确定加密结果向量,包括:
利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量。
根据第四方面,提供一种保护数据隐私的双方联合进行数据处理的装置,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述装置部署在所述第一方,所述装置包括:
第一接收模块,被配置为从所述第二方接收加密综合向量,所述加密综合向量是使用所述第二方的公钥,利用同态加密算法对综合向量加密得到的,所述综合向量是,所述n个原始向量在对应的n个计算空间中的映射结果的组合,所述n个计算空间彼此不同且互相隔离;
第一确定模块,被配置为利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;
第二确定模块,被配置为至少基于所述加密结果向量,确定数据处理结果,并将所述数据处理结果发送至所述第二方,使得所述第二方根据所述数据处理结果,获得所述原始矩阵与所述n个原始向量的相乘计算结果。
根据第五方面,提供一种保护数据隐私的双方联合进行数据处理的装置,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述装置部署在所述第二方,所述装置包括:
组合模块,被配置为将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量,所述n个计算空间彼此不同且互相隔离;
加密模块,被配置为使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方;
第二接收模块,被配置为从所述第一方接收数据处理结果,所述数据处理结果是,所述第一方至少基于加密结果向量确定的,所述加密结果向量是基于所述原始矩阵以及所述加密综合向量确定的;
解密获得模块,被配置为对所述数据处理结果进行解密,并将其分解到所述n个计算空间,根据分解结果获得所述原始矩阵与所述n个原始向量的相乘计算结果。
根据第六方面,提供一种保护数据隐私的双方联合进行数据处理的系统,所述系统包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,其中:
所述第二方,被配置为将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量,所述n个计算空间彼此不同且互相隔离;使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方;
所述第一方,被配置为接收所述加密综合向量,利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;至少基于所述加密结果向量,确定数据处理结果,并将所述数据处理结果发送至所述第二方;
所述第二方,还被配置为接收所述数据处理结果;对所述数据处理结果进行解密,并将其分解到所述n个计算空间,从而获得所述原始矩阵与所述n个原始向量的相乘计算结果。
根据第七方面,提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面所述的方法。
根据第八方面,提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第二方面所述的方法。
根据第九方面,提供一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面所述的方法。
根据第十方面,提供一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面所述的方法。
根据本说明书实施例提供的方法及装置,第二方将其持有的n个原始向量映射于n个彼此不同且相互隔离的计算空间,第二方对所得映射结果进行组合得到综合向量,实现将n个原始向量编码成1个综合向量,并将综合向量进行同态加密后发送至第一方。该相互隔离的计算空间中数据的计算过程相互隔离,该综合向量集合有映射至不同计算空间的n个原始向量,后续对该综合向量进行计算,相当于在(计算过程)相互隔离的不同计算空间,对映射至该计算空间的原始向量进行计算。后续的,第一方利用其自身的原始矩阵和该加密综合向量进行同态运算,得到加密结果向量。该加密结果向量相当于对综合向量和原始矩阵的相乘结果进行加密所得到的向量。然后,至少基于加密结果向量,确定数据处理结果,并将其发送至第二方,使得第二方基于数据处理结果,获得原始矩阵与n个原始向量的相乘计算结果。以上过程中,双方都不会泄露其原始矩阵及原始向量的明文,因而实现了安全的隐私乘法运算。并且,通过将n个原始向量编码成1个综合向量,使得双方通过一次加解密和一次交互通信,实现对原始矩阵与n个原始向量的相乘,即实现将多个乘法运算转化成一个乘法运算,降低了通信量和计算量,提升了计算效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A为相关技术中双方联合进行数据处理的过程示意图;
图1B为本说明书披露的一个实施例的实施框架示意图;
图2为双方进行矩阵相乘的示意图;
图3为在一个实施例中双方联合进行数据处理的过程示意图;
图4为在一个实施例中双方联合进行数据处理的过程示意图;
图5为在一个实施例中双方联合进行数据处理的过程示意图;
图6为对矩阵和向量进行拆分的过程示意图;
图7为实施例提供的保护数据隐私的双方联合进行数据处理的装置的一种示意性框图;
图8为实施例提供的保护数据隐私的双方联合进行数据处理的装置的另一种示意性框图;
图9为实施例提供的保护数据隐私的双方联合进行数据处理的系统的一种示意性框图。
具体实施方式
下面将结合附图,详细描述本说明书实施例的技术方案。
如前所述,在多方联合进行数据处理过程中,数据隐私安全成为目前备受关注的问题。而在多种具体的数据处理运算中,数据矩阵(包括向量)之间的乘法运算,是多方联合处理中的常用运算,同时也是隐私数据保护的一个难点。例如,当一方持有某些业务对象的特征数据构成的特征矩阵,另一方持有对这些特征数据进行处理的参数矩阵,此时,为了进行联合业务处理,就需要对上述特征矩阵和参数矩阵进行安全的乘法运算。
目前存在的安全乘法运算,一般一次安全乘法运算过程仅是针对双方各自持有的一个矩阵(称为一组矩阵)进行运算,在双方需要针对多组矩阵进行相乘时,需要多次循环执行安全乘法运算过程。其中,相关技术中一次安全乘法运算过程,如图1A所示。其中,图1A展示了甲有矩阵X,乙有向量y的计算过程。具体为:乙生成同态加密算法下的公钥和私钥对(PK,SK),利用公钥PK,采用该同态加密算法对y加密,得到ENC(y),将ENC(y)发给甲;甲首先采用明文与密文的同态运算,将明文X乘以密文ENC(y),得到密文ENC(Xy);并且,为了避免乙获得Xy的明文,使用一个随机数对Xy进行掩盖,即将所生成的随机数r同态叠加至密文ENC(Xy),得到密文ENC(Xy+r),将-r作为第一方分片,之后,甲将密文ENC(Xy+r)发送至乙。乙利用私钥SK对密文ENC(Xy+r)进行解密,得到Xy+r,即第二方分片,至此,甲、乙各获得了Xy的分片。在需要计算矩阵X分别与多个向量y的计算,或者需要多个矩阵X分别与多个向量y的计算的情况下,需要多次循环上述过程,即双方需要进行多次通信以及同态加密运算。
为此,本说明书实施例提供的处理方法,主要针对持有隐私数据的双方之间进行多矩阵(向量)的安全乘法运算的场景而设计。
图1B为本说明书披露的一个实施例的实施场景示意图。在该实施场景中,示意性示出了参与方A和B。各个参与方具体可以体现为具有计算、处理能力的设备、平台、服务器或设备集群。其中,参与方A拥有A方隐私数据构成的原始矩阵X,该原始矩阵X可以为1个或n个,参与方B拥有B方隐私数据构成的n个原始向量y,双方希望进行安全的矩阵相乘运算,也就是参与方A不泄露其原始矩阵X明文,参与方B不泄露其n个原始向量y明文,但是最终计算得到矩阵相乘的结果。
一种情况,原始矩阵X为1个,最终计算得到矩阵相乘的结果为:原始矩阵X分别与每个原始向量y的乘积,即X*y1,X*y2,…,X*yi-1,X*yi,X*yi+1,…,X*yn。
另一种情况,该原始矩阵X为n个,最终计算得到矩阵相乘的结果为:每一组的第i原始矩阵Xi与第i原始向量yi的乘积,即X1*y1,X2*y2,…,Xi-1*yi-1,Xi*yi,Xi+1*yi+1,…,Xn*yn。
在一种示例性场景中,参与方A和B分别为模型拥有方和数据拥有方,相应的,原始矩阵X和n个原始向量y中的隐私数据,分别为机器学习模型的模型参数数据和业务对象的特征数据。在另一种示例性场景中,参与方A和参与方B也可以是共同进行模型联合训练的对等方,各自拥有一部分模型参数和特征数据。或者,参与方A和参与方B也可以是其他隐私数据持有方,为了进行某种数据处理,而需要进行安全的乘法运算。
在以上各种场景中,出于隐私数据保护的目的,参与方A不能泄露其原始矩阵X,参与方B不能泄露其n个原始向量y,双方希望共同计算矩阵乘法结果,原始矩阵X分别与每个原始向量y的乘积。
为此,根据本说明书的实施例,持有n个原始向量y的参与方B,将n个原始向量y在对应的n个计算空间中的映射结果进行组合,得到综合向量Y,对该综合向量Y进行同态加密,将加密后的加密综合向量[Y]发送给参与方A。参与方A用其自身的原始矩阵X,对该加密综合向量[Y]进行同态运算,得到加密结果向量[Z];然后至少基于加密结果向量[Z],确定数据处理结果[U],并将数据处理结果[U]发送至参与方B。参与方B对数据处理结果[U]进行解密,并将其分解到n个计算空间,得到分解结果,根据分解结果,获得原始矩阵与n个原始向量的相乘计算结果,即原始矩阵与n个原始向量相乘的结果。
以上过程中,双方都不会泄露其原始矩阵及原始向量的明文,因而实现了安全的隐私乘法运算。并且,通过将n个原始向量编码成1个综合向量,使得双方通过一次加解密和一次交互通信,实现对原始矩阵与n个原始向量的相乘,即实现将多个乘法运算转化成一个乘法运算,降低了通信量和计算量,提升了计算效率。并且,将多个乘法运算转化成一个乘法运算,充分利用了同态加密算法对应的同态明文空间,提升了对该空间的利用率。
下面描述以上方案的具体实现过程。
图2示出双方进行矩阵相乘的示意图。延续图1B的示例,图2示出了参与方A和参与方B,参与方A维护有隐私数据构成的原始矩阵X;参与方B维护有隐私数据构成的n个原始向量y,各原始向量yi均为q维向量。
一种情况下,参与方A维护的原始矩阵X为1个,该原始矩阵X为p*q维矩阵,相应的,双方希望安全地计算原始矩阵X与每一原始向量y的乘积,即X*y1,X*y2,…,X*yi-1,X*yi,X*yi+1,…,X*yn,其中,X*yi均为p维的向量,此情况如图2中的场景(A)所示。
另一种情况下,参与方A维护的原始矩阵X为n个,各原始矩阵Xi均为p*q维矩阵,相应的,双方希望安全地计算每一组的第i原始矩阵Xi与第i原始向量yi的乘积,即X1*y1,…,Xi-1*yi-1,X2*y2,…,Xi*yi,Xi+1*yi+1,…,Xn*yn,其中,X*yi均为p维的向量,此情况如图2中的场景(B)所示。
图3示出在一个实施例中双方联合进行数据处理的过程示意图。
为了进行安全矩阵乘法,首先,在步骤S301,第二方将n个原始向量在n个计算空间的映射结果进行组合,得到综合向量Y。其中,上述n个计算空间需要是相互隔离的不同计算空间。在图3的例子中,第二方为参与方B。第二方B将n个原始向量中的第i原始向量映射至n个计算空间的第i空间中,以便在第i空间中针对第i原始向量进行计算。由于n个计算空间彼此不同且互相隔离,即该相互隔离的计算空间中数据的计算过程相互隔离,即在第i空间针对第i原始向量进行的计算,不影响在其他计算空间针对相应原始向量的计算,并且不受在其他计算空间针对相应原始向量的计算的影响。
第二方B将n个原始向量在n个计算空间的映射结果进行组合,即实现将映射至n个计算空间的n个原始向量,编码成一个向量,得到综合向量。该综合向量相当于集合有映射至不同计算空间的n个原始向量。结合n个计算空间彼此不同且相互隔离,即计算过程相互隔离,互不影响,使得后续对该综合向量进行计算,相当于在n个计算空间中分别对相应的各个原始向量进行计算,且在不同计算空间对各个原始向量的计算相互隔离,互不影响。一种情况中,n个计算空间的具体类型与第一方A持有的原始矩阵X的个数相关。其中,综合向量也可称为综合原始向量。
在本说明书的一种实施例中,不同计算空间是用于针对不同原始向量y进行计算的空间,该计算空间的空间大小,根据原始矩阵X与各个原始向量y的元素乘积的最大有效位宽而确定。
接着,在步骤S302,第二方B使用其持有的公钥,利用同态加密算法对综合向量加密(即同态加密),得到加密综合向量[Y]b。其中,第二方B可以选用同态加密算法E,并生成该加密算法下的公钥PK-b和私钥SK-b。然后,使用公钥PK-b,利用同态加密算法E,对综合向量Y进行同态加密,得到加密综合向量[Y]b。
在本文中,用[]表示加密,角标表示加密采用的公钥标识。可以理解,加密综合向量[Y]b中包含各个位置的密文元素,各个密文元素是对综合向量Y的对应位置的原始元素进行上述同态加密得到的。
接着,在步骤S303,第二方B将加密综合向量[Y]b发送给第一方A。由于该向量已经经过加密,因此,该步骤中的通信不会泄露参与方B中的隐私数据。
然后,在步骤S304,第一方A利用原始矩阵X以及加密综合向量[Y]b,确定加密结果向量。具体的,第一方A对其拥有的原始矩阵X中的明文元素与加密综合向量[Y]b中的密文元素,进行行列间的同态加和运算,得到加密结果向量[Z]b。在希望计算X*Y(即X与每个y)的乘积矩阵的情况下,上述行列间的同态加和运算为:用原始矩阵X中各个行的明文元素,对加密综合向量[Y]b的各个列的密文元素进行同态加和运算,得到上述加密结果向量[Z]b。
上述同态加和运算,是前述同态加密算法E对应的明文与密文之间的同态操作运算,其作用可以使得,通过明文矩阵X和密文向量[Y]b的行列间同态加和运算得到的加密结果向量[Z]b对应于,使用同样的公钥PK-b,利用同态加密算法E对明文X*Y加密得到的向量,也就是,[Z]b=[X*Y]b。这是同态加密算法的“同态性”所决定的。下面具体描述该过程。
容易验证,Paillier加密算法还满足:
上式(2)可以作为Paillier算法下,明文与密文之间的同态加和运算的基础。
例如,假定原始矩阵X包含某一行q个明文元素,加密综合向量[Y]b包含的一列q个密文元素,其中任意密文ci是对综合向量Y中对应的元素Yi加密得到,即ci=EPK-b(Yi)。那么,上述明文元素和密文元素之间的同态加和运算可以如下实现:
即,分别使用第i明文元素xi对第i密文元素ci进行幂操作,得到q个幂操作结果;基于q个幂操作结果的连乘,得到同态加和结果z,作为加密综合向量[Y]b中的一个元素。
结合上述公式(2)可以看到,上述公式(3)又可以写为:
如此,利用原始矩阵X中第j行的明文元素,与加密综合向量[Y]b中的该列密文元素进行上述同态加和运算后得到的结果,可以作为加密综合向量中第j行的元素zj,并且如公式(4)所示,该元素zj实际上等于,原始矩阵X和综合向量Y的明文X*Y中对应元素的加密值。
因此,通过明文的原始矩阵X和加密综合向量[Y]b的行列间同态加和运算得到的加密结果向量[Z]b对应于,使用同样的公钥PK-b,利用同态加密算法E对原始矩阵X和综合向量Y的乘积加密得到的向量,也就是可以得到如下公式(5):
[Z]b=[X*Y]b (5)。
以上结合Paillier算法进行了同态加和运算的描述。可以理解,已经存在多种同态加密算法,其中具有加法同态性质的加密算法均可以用于本方案中。例如,与Paillier类似的其他一些基于椭圆曲线加密的算法,也满足加法同态性。此外,Gentry算法作为一种准全同态加密算法,既满足加法同态还满足乘法同态。相应的,不同的同态加密算法具有不同的同态加和运算形式。例如,如果有同态加密算法的同态加操作对应于常规加法,上述明文元素和密文元素的同态加和运算可以对应于,明文元素与密文元素的线性组合。
如此,在以上的步骤S304,第一方A计算得到加密结果向量[Z]b。
然后,在步骤S305,第一方A至少基于加密结果向量[Z]b,确定数据处理结果[U]b。其中,数据处理结果[U]b也是使用同态加密算法加密的数据,即为密文,不会泄露第一方A和第二方B的隐私数据。
在步骤S306,第一方A将该数据处理结果[U]b发送至第二方B。
然后,在步骤S307,第二方B在接收到该数据处理结果[U]b之后,使用其私钥SK-b对该数据处理结果[U]b进行解密,得到数据处理结果明文U。
然后,在步骤S308,将数据处理结果明文U分解到n个计算空间,得到分解结果,其中分解结果包括n个分解向量,每个计算空间对应一个分解向量,每个分解向量至少根据原始矩阵X以及映射至对应计算空间的原始向量确定。
在步骤S309,第二方B根据分解结果获得原始矩阵X与n个原始向量y的相乘计算结果。在原始矩阵X为一个的情况下,第二方B可以根据该n个分解向量中的第i向量得到原始矩阵X与第i原始向量yi的相乘计算结果。在原始矩阵X为n个情况下,第二方B可以根据该n个分解向量中的第i向量,得到第i原始矩阵Xi与第i原始向量yi的相乘计算结果。对于上述根据分解结果获得原始矩阵X与n个原始向量y的相乘计算结果的验证,将在后续进行说明。
在一种情况中,在允许第二方B获得原始矩阵X与每个原始向量y的乘积明文的情况下,步骤S305可以具体设置为,将加密结果向量[Z]b,确定为数据处理结果。进一步的,在步骤S306,可以具体设置为,第一方A将数据处理结果即加密结果向量[Z]b发送至第二方B。
在步骤S307,具体设置为,第二方B接收到该加密结果向量[Z]b之后,使用其私钥SK-b对该加密结果向量[Z]b进行解密,得到结果向量Z即数据处理结果明文,即原始矩阵X与综合向量Y的乘积。
然后,在步骤S308,具体设置为,第二方B将结果向量Z分解到n个计算空间,得到分解结果。在步骤S309,具体设置为第二方B根据分解结果获得原始矩阵X与n个原始向量y的相乘计算结果。
在另一种情况中,为了保护原始矩阵X与每个原始向量y的相乘计算结果明文,以及保护第一方A和第二方B隐私数据安全,第一方A在得到加密结果向量[Z]b之后,可以使用随机向量对加密结果向量[Z]b进行掩盖,使得第二方B无法获得原始矩阵X与每个原始向量y的相乘计算结果明文。
相应的,在该情况下,在步骤S305,可以具体设置为,步骤S3051,第一方A生成n个随机向量r,并将其相反数-r作为该相乘计算结果的n个第一方分片;以便于后续结合第二方B的n个第二方分片获得相乘计算结果。
步骤S3052,第一方A将n个随机向量r在n个计算空间的映射结果进行组合,得到综合随机向量R。该步骤,将n个随机向量在n个计算空间的映射结果进行组合,即分别将n个随机向量r中的第i随机向量ri,映射至第i计算空间中,进而进行组合,以将n个随机向量编码成一个向量,得到综合随机向量R。
步骤S3053,第一方A基于综合随机向量R以及加密结果向量[Z]b,确定数据处理结果[U]b。一种实现中,第一方A使用同样的公钥PK-b,利用同态加密算法E对综合随机向量R进行同态加密,得到加密综合随机向量[R]b。随后,将加密综合随机向量[R]b同态叠加至加密结果向量[Z]b,得到数据处理结果[U]b。
相应的,在步骤S306,第一方A将该数据处理结果[U]b发送至第二方B。然后,在步骤S307,第二方B在接收到该数据处理结果[U]b之后,使用其私钥SK-b对该数据处理结果[U]b进行解密,得到数据处理结果明文U。在步骤S308,将数据处理结果明文U分解到n个计算空间,得到分解结果。在步骤S309,根据该分解结果确定n个第二方分片。如此,第一方和第二方各自得到第一方分片和第二方分片,两方分片共同作为原始矩阵和n个原始向量的相乘计算结果。
在上述实现方式中,第一方A为了保护第一方A和第二方B的隐私数据安全,而生成随机向量r,以对原始矩阵X与n个原始向量y的元素乘积进行掩盖。在此情况下,为了保证掩盖效果,需要随机向量r的有效位宽大于原始矩阵X与n个原始向量y的元素乘积的最大有效位宽。相应的,可以设置一个位宽,用于使得随机向量的位宽大于原始矩阵X与n个原始向量y的元素乘积的最大有效位宽,可以称该位宽为超额掩盖位宽。相应的,该随机向量r的有效位宽,根据原始矩阵X与各个原始向量y中元素乘积的最大有效位宽,以及该超额掩盖位宽而确定,例如,可以设置为原始矩阵X与各个原始向量y中元素乘积的最大有效位宽,以及该超额掩盖位宽的和。
其中,针对不同的随机向量r,可以设置不同的超额掩盖位宽d,即第i随机向量r对应第i超额掩盖位宽di;也可以针对所有的随机向量r设置相同的超额掩盖位宽d。以下涉及随机向量r的实施例以针对不同的随机向量r,设置的超额掩盖位宽d相同的情况为例进行说明。不同的随机向量r,可以设置的超额掩盖位宽d不同的情况的计算过程与其相似,不再进行赘述。
在本说明书的具体实施例中,计算空间的具体类型可以根据第一方所持有的原始矩阵X的个数确定。例如,在第一方A持有1个原始矩阵X,即需要计算原始矩阵X与每个原始向量y的相乘计算结果(乘积)即X*y1,X*y2,…X*yn的情况下,n个计算空间可以选取当前进制下n个不同位数的空间,以通过n个不同位数的空间,实现对n个原始向量y的计算过程的隔离。
在第一方A持有n个原始矩阵X的情况下,即需要计算n个原始矩阵X中第i原始矩阵Xi与n个原始向量y中的第i原始向量yi的乘积的情况下,n个计算空间可以选取对应于互质的n个模值的取模空间,以通过互质的n个模值的取模空间,实现对n个原始向量y的计算过程的隔离。
下面针对上述两种情况,描述实现安全矩阵乘法的并行处理的具体实施例。
图4示出在一个实施例中双方联合进行数据处理的过程示意图,其中,第一方A持有1个原始矩阵X,需要计算原始矩阵X与每个原始向量y的相乘计算结果(乘积)即X*y1,X*y2,…X*yn。
在该实施例中,选取n个计算空间为,当前进制下n个不同位数的空间。当前进制可以是任一进制,例如为二进制,十进制等。以下实施例通过e进制表示当前进制。上述n个计算空间对应的位数分别记为I1,I2,…,In。简单起见,假定I1,I2,…,In从小到大排列。如此,n个计算空间可以表示为()。
如图4所示,为了进行安全矩阵乘法,首先,在步骤S401,第二方B将n个原始向量中的第i原始向量yi的各个元素扩展n个计算空间中第i空间对应的位数Ii,得到第i映射原始向量。因此,第i映射原始向量可以表示为。
然后,在步骤S402,基于各映射原始向量的加和,确定综合向量Y。如此,可以通过如下公式(6)表示综合向量:
如前所述,n个计算空间需互相隔离,以保证将各个空间的映射结果组合在一起时,各空间的映射结果不会彼此影响。因此,对于公式(6)所示的映射和组合而言,需保证n个计算空间的位数(I1,I2,…,In)之间,具有足够大的间隔,使得各个空间满足隔离条件,即在任意的第i空间中,在后续乘以对应的矩阵元素和向量元素后(以及叠加随机向量后),不会溢出到下一空间。
在一个实施例中,人为地将上述n个计算空间的位数间隔设置为足够大,以确保满足上述隔离条件。
在一种实现方式中,根据原始矩阵X与各个原始向量中元素乘积的最大有效位宽(即位数)来确定各个计算空间的位数。例如,可以根据原始矩阵X与第i-1原始向量中元素乘积的最大有效位宽,确定第i空间相较于第i-1空间的位数之差。
进一步的,在添加随机向量r的情况下,还进一步考虑随机向量的超额掩盖位宽。具体地,在一个实施例中,可以如此设置各个空间的位数间隔:根据原始矩阵X与第i-1原始向量中元素乘积的最大有效位宽ti-1,以及针对n个随机向量预设的超额掩盖位宽d,确定第i空间相较于第i-1空间的位数之差。例如,令Ti-1=ti-1+d,可以表示乘积计算对第i-1空间的展宽影响,那么则可以根据以下公式(7)确定第i空间的位数:
Ii=Ii-1+ Ti-1 (7)
如此,在设置第1个空间的位数I1之后,可以按照上述公式(7),依次确定出I2,I3,…,In,从而确定出n个计算空间的位数。
Ii=T1+T2+…+Ti-1 (8)
如此,综合向量Y可以通过如下公式(9)表示:
在一个实施例中,为了进一步确保空间的隔离,在根据公式(7)确定第i空间的位数时,在Ti-1基础上附加额外位宽wi-1。在这样的情况下,第i空间可以表示为:,相应的,公式(9)可以进一步修改为以下公式(10):
在又一实施例中,综合考虑原始矩阵X与各个原始向量中元素乘积的最大有效位宽,以及超额掩盖位宽d和/或额外位宽w,确定位数间隔T,该位数间隔T确保各个空间中的计算都不会发生空间溢出。于是,可以将n个计算空间的位数设置为,基于该位数间隔T等间隔递增,也就是,任意第i空间相较于第i-1个空间的位数之差均为T。在这样的情况下,公式(9)可以简单地改写为公式(11):
以上举例描述了n个计算空间的多种位数设置方式。根据公式(6),通过将第i原始向量的的各元素扩展第i空间对应的位数,而将第i原始向量的各元素映射至第i空间;进一步的,通过将n个原始向量在n个计算空间的映射结果进行组合,实现将n个原始向量编码成一个向量,得到综合向量。
然后,在步骤S403,第二方B使用其持有的公钥PK-b,利用同态加密算法E对综合向量Y加密(即同态加密),得到加密综合向量[Y]b。
该综合向量Y的各元素,均包括映射于不同计算空间的原始向量y的相同位置处的元素,使得后续对该综合向量各元素的计算,相当于在不同计算空间中,对映射至该计算空间的原始向量的各元素的计算。由于,加密综合向量[Y]b中包含的各个位置的密文元素是对综合向量Y的对应位置的原始元素进行上述同态加密得到的,加密综合向量可以通过如下公式(12)表示:
接着,在步骤S404,第二方B将加密综合向量[Y]b发送给第一方A。由于该向量已经经过加密,因此,该步骤中的通信不会泄露参与方B中的隐私数据。
在步骤S405,第一方A利用原始矩阵X以及加密综合向量[Y]b,确定加密结果向量[Z]b。即第一方A用原始矩阵X中各个行的明文元素,对加密综合向量[Y]b的各个列的密文元素进行同态加和运算,得到上述加密结果向量。即相当于使用同样的公钥PK-b,利用同态加密算法E对原始矩阵X和综合向量Y的乘积加密,得到加密结果向量,也就是,[Z]b=[X*Y]b。结合公式(6)和公式(12),可得如下公式(13):
然后,在步骤S406,第一方A生成n个随机向量r1,r2…rn,并将其相反数作为所述相乘计算结果的n个第一方分片。也就是,第一方获得n个第一方分片:-r1,-r2…-rn。
在步骤S407,第一方A将n个随机向量中的第i随机向量ri的各个元素扩展第i空间对应的位数,得到第i随机映射结果<ri>。具体映射过程参见第i原始向量的映射过程,在此不再赘述。
在步骤S408,基于各随机映射结果<ri>的加和,确定综合随机向量R。其中,R可以通过如下公式(14)表示:
在步骤S409,第一方A基于综合随机向量R以及加密结果向量[Z]b,确定数据处理结果[U]b。本步骤中,第一方A使用同样的公钥PK-b,利用同态加密算法E,将综合随机向量R同态叠加至加密结果向量[Z]b,确定出数据处理结果[U]b。基于同态加密算法的同态性,数据处理结果[U]b表示为,[U]b= [Z+R]b。进而,结合公式(13)和(14),可得如下公式(15):
在步骤S410,第一方A将该数据处理结果[U]b发送至第二方B。
然后,在步骤S411,第二方B在接收到该数据处理结果[U]b之后,使用其私钥SK-b对该数据处理结果[U]b进行解密,得到数据处理结果明文U。
然后,在步骤S412,第二方B将数据处理结果明文U分解到n个计算空间,得到分解结果。本步骤中,第二方B将数据处理结果明文U进行当前进制展开,得到分解结果。将数据处理结果明文U进行当前进制展开,可以通过如下公式(16)表示:
接着,在步骤S413,第二方B将分解结果中的n个向量作为相乘计算结果的n个第二方分片。其中,第i个第二方分片即为,也即。结合第一方持有的第i个第一方分片-ri,可以得到,两方第i个分片之和,等于原始矩阵X与第i原始向量的乘积向量。
本实施例,通过将n个原始向量扩展n个彼此不同且相互隔离的计算空间对应的位数,即将第i原始向量映射至第i空间,并将各原始向量在各个计算空间的映射结果进行组合,实现将n个原始向量编码成一个向量,进而通一个矩阵和一个向量的运算,得到原始矩阵X与各个原始向量的相乘计算结果,在保证各方隐私数据的安全计算的同时,降低了通信量以及计算量,提升了计算效率。
在本说明书的另一实施例中,在第一方A不生成随机向量r的情况下,可以不执行步骤S406至S408,且在步骤S409中可以直接将加密结果向量[Z]b,确定为数据处理结果,其他步骤均相同,在此不再赘述。相应的,在该类情况下,第二方B可以直接基于数据处理结果得到原始矩阵X与各个原始向量的相乘计算结果明文。
图5示出在另一个实施例中双方联合进行数据处理过程的示意图,其中,第一方A持有n个原始矩阵X,第二方B持有n个原始向量,双方需要计算原始矩阵X中第i原始矩阵Xi与n个原始向量y中第i原始向量yi的相乘计算结果(乘积)即X1*y1,X2*y2,…Xn*yn。在一个实施例中,选取n个计算空间为,对应于n个模值的取模空间,该n个模值彼此互质。
上述n个模值可以是随机选取的n个互质整数。为了保证取模空间彼此隔离,并且在其中的计算不会溢出,该n个模值需选取的足够大,至少大于可能的各个元素乘积(以及加上可能的用于掩盖的随机向量元素)的大小。因此,一种实现方式中,在第一方A生成针对元素乘积进行掩盖的随机数向量r的情况下,n个模值中第i模值的位宽,根据第i原始矩阵Xi与第i原始向量yi的元素乘积的最大有效位宽ti,以及针对n个随机向量预设的超额掩盖位宽d而确定。在一种情况中,为了避免计算过程中所产生中间值和/或结果的溢出,可以设置第i模值的位宽Ti可以大于或者等于第i原始矩阵Xi与第i原始向量yi的元素乘积的最大有效位宽ti,以及针对n个随机向量预设的超额掩盖位宽d的和。
在另一实现方式中,在第一方A不生成随机数向量r的情况下,第i模值的位宽,根据第i原始矩阵Xi与第i原始向量yi元素乘积的最大有效位宽ti而确定。同理,在该种情况下,为了避免计算过程中所产生中间值和/或结果的溢出,可以设置第i模值的位宽Ti可以大于或者等于第i原始矩阵Xi与第i原始向量yi的元素乘积的最大有效位宽ti。
在图5所示的例子中,第一方A生成随机数向量r。为了进行安全矩阵乘法,首先,在步骤S501,第二方B利用中国剩余定理确定综合向量Y,综合向量Y满足,针对第i空间对应的第i模值取模的余数结果为n个原始向量中的第i原始向量yi。
第一方A首先可以首先根据原始矩阵(或者原始向量)的个数n,以及前述位宽要求,确定n个互质的模值,分别为p1、p2……pn,其中第i模值pi的位宽Ti满足,大于或者等于第i原始矩阵Xi与第i原始向量yi的元素乘积的最大有效位宽ti,和超额掩盖位宽d之和。
进一步的,第一方A和第二方B均可以根据中国剩余定理,确定两个操作,其中,第一个操作,即编码操作CRTEncode可以表示为:e= CRTEncode(e1,e2...en),即,已知n个模值p1、p2……pn和n个元素e1,e2...en,通过该编码操作可以确定一个综合结果e,使得该e满足,针对模值p1取模的余数结果为e1,针对模值p2取模的余数结果为e2,以此类推,针对模值pn取模的余数结果为en。在一种情况中,通过该编码操作可以得到多个满足该预设取模条件的e,为了节省计算空间,可以取位宽最小的e,作为所需的结果。
第二个操作为第一个操作的逆过程,可称为解码操作CRTDecode,可以通过如下公式表示,(e1,e2...en)= CRTDecode(e)。即,已知上述n个模值p1、p2……pn,和综合结果e,对e进行该解码操作,即得到针对模值p1取模的余数结果为e1,针对模值p2取模的余数结果e2,以此类推,针对模值pn取模的余数结果为en。
第二方B在已知上述n个模值和n个原始向量的情况下,可以利用中国剩余定理下的编码操作,确定综合向量Y,即Y= CRTEncode(y1,y2...yn),该综合向量Y满足,针对第i空间对应的第i模值pi取模的余数结果为第i原始向量yi,即综合向量Y满足针对模值p1取模的余数结果为y1,针对模值p2取模的余数结果为y2,以此类推,针对模值pn取模的余数结果为yn。因此,该综合向量Y,相当于n个原始向量映射到n个取模空间的结果的组合。
然后,在步骤S502,第二方B使用其持有的公钥PK-b,利用同态加密算法E对综合向量Y加密(即同态加密),得到加密综合向量[Y]b。
接着,在步骤S503,第二方B将加密综合向量[Y]b发送给第一方A。由于该向量已经经过加密,因此,该步骤中的通信不会泄露参与方B中的隐私数据。
在步骤S504,第一方A基于n个模值和其持有的n个原始向量,利用中国剩余定理确定综合矩阵,综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵。其中,第一方A利用与第二方针对n个原始向量相同的处理方式,对n个原始矩阵进行处理,以得到综合矩阵,即利用根据中国剩余定理下的编码操作确定综合矩阵S,S= CRTEncode(X1,X2...Xn),如此综合矩阵S满足,针对模值p1取模的余数结果为X1,针对模值p2取模的余数结果为X2,以此类推,针对模值pn取模的余数结果为Xn。
在步骤S505,第一方A基于综合矩阵S以及加密综合向量[Y]的同态运算,确定加密结果向量[Z]b。即第一方A用综合矩阵S中各个行的明文元素,对加密综合向量[Y]b的各个列的密文元素进行同态加和运算,得到上述加密结果向量。即相当于使用同样的公钥PK-b,利用同态加密算法E对综合矩阵S和综合向量Y的乘积加密,得到加密结果向量[Z]b,也就是,[Z]b=[S*Y]b。
然后,在步骤S506,第一方A生成n个随机向量r1,r2…rn,并将其相反数作为所述相乘计算结果的n个第一方分片。也就是,第一方获得n个第一方分片:-r1,-r2…-rn。
在步骤S507,第一方A利用中国剩余定理确定综合随机向量R,使得综合随机向量R满足,针对第i空间对应的第i模值pi取值的余数结果为第i随机向量ri。其中,第一方A利用与针对n个原始矩阵相同的处理方式,对n个随机向量r进行处理,以得到综合随机向量R,即利用根据中国剩余定理的编码操作确定综合随机向量R,R= CRTEncode(r1,r2...rn),如此,综合随机向量R满足,针对第i空间对应的第i模值取模的余数结果为第i随机向量。
在步骤S508,第一方A基于综合随机向量R以及加密结果向量[Z]b,确定数据处理结果[U]b。本步骤中,第一方A可以使用同样的公钥PK-b,利用同态加密算法E,将综合随机向量R同态叠加至加密结果向量[Z]b,确定出数据处理结果[U]b,也就是,[U]b= [Z+R]b,具体的可以表示为,[U]b= [S*Y+R]b。
在步骤S509,第一方A将该数据处理结果[U]b发送至第二方B。
然后,在步骤S510,第二方B在接收到该数据处理结果[U]b之后,使用其私钥SK-b对该数据处理结果[U]b进行解密,得到数据处理结果明文U。其中,U=S*Y+R。
然后,在步骤S511,第二方B将数据处理结果明文U,针对第i空间对应的第i模值pi取余,以分解到第i空间,得到分解结果。其中,第二方B可以基于上述解码操作CRTDecode,对数据处理结果明文U(S*Y+R)进行处理,将其分解到n个取模空间,以得到分解结果。
具体的,对数据处理结果明文U(S*Y+R)针对第1空间对应的第1模值p1取余,即分解到第一空间,得到X1*y1+r1(S针对第1空间对应的第1模值p1取余为X1,Y针对第1空间对应的第1模值p1取余为y1,R针对第1空间对应的第1模值p1取余为r1);对数据处理结果明文U(S*Y+R)针对第2空间对应的第2模值p2取余,即分解到第2空间,得到X2*y2+r2(S针对第2空间对应的第2模值p2取余为X2,Y针对第2空间对应的第2模值p2取余为y2,R针对第2空间对应的第2模值p2取余为r2);依次类推,对数据处理结果明文U(S*Y+R)针对第n空间对应的第n模值pn取余,即分解到第n空间,得到Xn*yn+rn(S针对第n空间对应的第n模值pn取余为Xn,Y针对第n空间对应的第n模值pn取余为yn,R针对第n空间对应的第n模值pn取余为rn)。
接着,在步骤S412,第二方B根据分解结果获得相应的第二方分片,以结合第一方分片和第二方分片获得n个原始矩阵与n个原始向量的相乘计算结果。例如结合第i个第二方分片Xi*yi+ri与第i个第一方分片-ri,确定第i原始矩阵Xi与第i原始向量yi的相乘计算结果,Xi*yi。
本实施例,通过将n个原始向量y以及n个原始矩阵X,分别映射至n个取模空间,实现将n个原始向量和n个原始矩阵编码成一个向量以及一个矩阵,进而通过一个矩阵和一个向量的运算,得到各个原始矩阵X与各个原始向量y的相乘计算结果,在保证各方隐私数据的安全计算的同时,降低了通信量以及计算量,提升了计算效率。
在本说明书的另一实施例中,为了保证随机向量对各个原始矩阵X与各个原始向量y的相乘计算结果的掩盖效果,随机向量r的位宽不小于原始矩阵X与原始向量y元素乘积的最大有效位宽。相应的,也需要保证计算过程中,随机向量r对应的中间结果对原始矩阵X与原始向量y元素乘积的中间计算结果的掩盖效果。具体的,在步骤S508,可以具体设置为:
在步骤5081,第一方A生成目标随机向量,目标随机向量中各元素的位宽,根据最大有效位宽,超额掩盖位宽以及原始矩阵个数而确定。
在步骤5082,第一方A将目标随机向量与n个模值连乘,并将所得的连乘结果叠加至综合随机向量R,得到扩展随机向量。
在步骤5083,第一方A将扩展随机向量,同态叠加至加密结果向量。
其中,在取模空间中,第i取模空间对应的第i模值的位宽为Gi(根据第i原始矩阵和第i原始向量的元素乘积的最大有效位宽以及第i随机向量的超额掩盖位宽而确定),相应的,综合矩阵S(各元素)的位宽为nGi,综合向量Y的位宽为nGi,相应的,综合矩阵S与综合向量Y的元素乘积S*Y的位宽为2nGi。相应的需要保证叠加至S*Y的向量的位宽超过2nGi。并且,考虑到计算空间的资源的节省,以及综合随机向量R的本身位宽nGi,可以根据最大有效位宽,超额掩盖位宽以及原始矩阵个数确定目标随机向量中各元素的位宽。例如,该目标随机向量中各元素的位宽可以不小于nGi。
一种情况中,扩展随机向量的得到过程,可以通过如下公式(17)表示,
K= k*p1*p2*p3... *pn + R (17)
其中,k表示目标随机向量,K表示扩展随机向量,为p维,R为前述综合随机向量。
在本说明书的另一实施例中,考虑到同态加密算法对应的同态明文空间大小有限,第一方A和第二方B之间可以预先至少基于原始矩阵与原始向量的元素乘积(在第一方A生成随机向量的情况下,还结合预设的超额掩盖位宽)的最大有效位宽,确定所有的原始矩阵与原始向量的元素乘积所需的空间。
在该所需空间大于同态明文空间大小的情况下,确定需要分批计算原始矩阵与原始向量的相乘计算结果。相应的,至少根据各个原始矩阵与原始向量的元素乘积的最大有效位宽,确定其对应的计算空间的空间大小,进而,基于各个计算空间的空间大小,从第二方B持有原始向量集中筛选出n个原始向量,即该n个原始向量是原始向量集中的部分向量,使得对应的n个计算空间的空间总和不大于同态加密算法对应的同态明文空间大小。
在本说明书的另一实施例中,在第一方A不生成随机向量r的情况下,可以不执行步骤S506至S507,且在步骤S508中可以直接将加密结果向量[Z]b,确定为数据处理结果,其他步骤均相同,在此不再赘述。相应的,在该类情况下,第二方B可以直接基于数据处理结果得到各个原始矩阵与各个原始向量的相乘计算结果明文。
在本说明书的另一实施例中,对于第一方和第二方仅联合计算一个原始矩阵和一个原始向量的相乘结果,可以是首先针对原始矩阵和原始向量进行拆分。其中,如图6所示,对原始矩阵进行横向切分,即按列切分,得到横向排列的3个子矩阵X1|X2|X3;对原始向量y进行纵向切分,即按行切分,得到纵向排列的3个子向量y1|y2|y3,则将原始矩阵*原始向量转化成计算X1*Y1+X2*Y2+X3*Y3,相应的,可以利用本说明书实施例所提供的上述保护数据隐私的双方联合进行数据处理的流程进行处理了。
在本说明书的另一实施例中,计算空间为当前进制下n个不同位数的空间,或者为对应于n个模值的n个取模空间,该n个计算空间的作用都可以看成是将多个乘法映射成一个乘法。鉴于此,在计算多个矩阵与多个向量的相乘计算结果的情况下,还可以结合使用该当前进制下n个不同位数的空间,与n个不同的取模空间,即嵌套使用该两类空间,进行相应的计算。例如:第一方A包括原始矩阵X0、X2,第二方B包括原始向量y0、y1和y2,双方需要联合计算X0*y0,X0*y1和X2*y2的相乘计算结果。具体的,第一方A和第二方B可以首先联合计算X0*y0,X0*y1,第二方B对y0的各个元素扩展第1空间对应的位数,即前述的I1(I1=0),即不对y0扩展位数,对y1的各个元素扩展第2空间对应的位数,即前述的I2,以将y0映射至第1空间,将y1映射至第2空间,进而将映射至第1空间的y0的映射结果和映射至第2空间的y1的映射结果的加和,确定为初始综合向量y,;进而利用中国剩余定理确定二次综合向量,该二次综合向量满足,针对第1空间对应的第1模值取模的余数结果为初始综合向量y,,针对第2空间对应的第2模值取模的余数结果为y2;并将二次综合向量发送至第一方A,以进行联合计算。上述过程,即实现利用上述当前进制下n个不同位数的空间,和对应于n个模值的n个取模空间共同实现乘法的安全计算。
本说明书提供如下例子对本说明书实施例所提供的数据处理流程的有益效果进行说明。假设同态加密算法对应的同态明文空间大小为600位:
对于n个计算空间为当前进制下的n个不同位数的空间的情况而言:假设原始矩阵X、原始向量y各自的有效位宽是30位,原始矩阵X的行数为1百万,并且Xy最大有效位宽t为80位,预设的超额掩盖长度d为20位,每个计算空间的位宽G=100(80+20)位。则同态明文空间至少可以并行执行600/100=6个计算空间(乘法)。并行化之后,无论是传输量、还是同态加解密的次数都是原来的1/6,虽然会多一些转化操作,但是计算量相对同态加解密的计算量可以忽略。则上述例子中,若计算6个乘法,利用本说明书实施例所提供的数据处理流程大约计算效率大约可以提升6倍。
对于n个计算空间为对应于n个模值的取模空间的情况而言:假设原始矩阵X、原始向量y各自的有效位宽是30位,原始矩阵X的行数为1百万,并且Xy最大有效位宽t为80位,预设的超额掩盖长度d为20位,每个计算空间的位宽G=200(2*(80+20))位。则同态明文空间至少可以并行执行600/2/100=3个。并行化之后,无论是传输量、还是同态加解密的次数都是原来的1/3,虽然会多一些转化操作,但是计算量相对同态加解密的计算量可以忽略。则上述例子中,若计算6个乘法,利用本说明书实施例所提供的数据处理流程大约计算效率大约可以提升3倍。
上述内容对本说明书的特定实施例进行了描述,其他实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行,并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的,或者可能是有利的。
相应于上述方法实施例,本说明书实施例,提供了一种保护数据隐私的双方联合进行数据处理的装置700,其示意性框图如图7所示,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述装置部署在所述第一方,所述装置包括:
第一接收模块710,被配置为从所述第二方接收加密综合向量,所述加密综合向量是使用所述第二方的公钥,利用同态加密算法对综合向量加密得到的,所述综合向量是,所述n个原始向量在对应的n个计算空间中的映射结果的组合,所述n个计算空间彼此不同且互相隔离;
第一确定模块720,被配置为利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;
第二确定模块730,被配置为至少基于所述加密结果向量,确定数据处理结果,并将所述数据处理结果发送至所述第二方,使得所述第二方根据所述数据处理结果,获得所述原始矩阵与所述n个原始向量的相乘计算结果。
在一种可选实施方式中,所述n个计算空间的空间大小,至少根据所述原始矩阵与各个原始向量中元素乘积的最大有效位宽而确定。
在一种可选实施方式中,所述第二确定模块730,包括:
生成单元(图中未示出),被配置为生成n个随机向量,并将其相反数作为所述相乘计算结果的n个第一方分片;
组合单元(图中未示出),被配置为将所述n个随机向量在所述n个计算空间的映射结果进行组合,得到综合随机向量;
第一确定单元(图中未示出),被配置为基于所述综合随机向量以及所述加密结果向量,确定所述数据处理结果,使得所述第二方获得所述相乘计算结果的n个第二方分片。
在一种可选实施方式中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述组合单元,被具体配置为将所述n个随机向量中的第i随机向量的各个元素扩展第i-1空间对应的位数,得到第i随机映射结果;
基于各随机映射结果的加和,确定所述综合随机向量。
在一种可选实施方式中,所述第i空间相较于第i-1空间的位数之差,根据所述原始矩阵与第i-1原始向量中元素乘积的最大有效位宽,以及针对所述n个随机向量预设的超额掩盖位宽而确定。
在一种可选实施方式中,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述第一确定模块720,被具体配置为利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量。
在一种可选实施方式中,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述第一确定模块720,被具体配置为利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量;
所述组合单元,被具体配置为利用所述中国剩余定理确定所述综合随机向量,使得所述综合随机向量满足,针对第i空间对应的第i模值取值的余数结果为第i随机向量。
在一种可选实施方式中,所述第i模值的位宽,根据所述第i原始矩阵与第i原始向量中元素乘积的最大有效位宽,以及针对所述n个随机向量预设的超额掩盖位宽而确定。
在一种可选实施方式中,所述第一确定单元,被具体配置为生成目标随机向量,所述目标随机向量中各元素的位宽,根据所述最大有效位宽,所述超额掩盖位宽以及原始矩阵个数而确定;
将所述目标随机向量与所述n个模值连乘,并将所得的连乘结果叠加至所述综合随机向量,得到扩展随机向量;
将所述扩展随机向量,同态叠加至所述加密结果向量,得到所述数据处理结果。
相应于上述方法实施例,本说明书实施例,提供了一种保护数据隐私的双方联合进行数据处理的装置800,其示意性框图如图8所示,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述装置部署在所述第二方,所述装置包括:
组合模块810,被配置为将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量,所述n个计算空间彼此不同且互相隔离;
加密模块820,被配置为使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方;
第二接收模块830,被配置为从所述第一方接收数据处理结果,所述数据处理结果是,所述第一方至少基于加密结果向量确定的,所述加密结果向量是基于所述原始矩阵以及所述加密综合向量确定的;
解密获得模块840,被配置为对所述数据处理结果进行解密,并将其分解到所述n个计算空间,根据分解结果获得所述原始矩阵与所述n个原始向量的相乘计算结果。
在一种可选实施方式中,所述n个计算空间的空间大小,至少根据所述原始矩阵与各个原始向量中元素乘积的最大有效位宽而确定。
在一种可选实施方式中,所述数据处理结果是,所述第一方基于所述加密结果向量以及综合随机向量确定的,所述综合随机向量是,所述第一方将n个随机向量在所述n个计算空间的映射结果进行组合而得到的,所述n个随机向量的相反数作为所述相乘计算结果的n个第一方分片;
所述解密获得模块840,被具体配置为将分解结果中的n个向量作为所述相乘计算结果的n个第二方分片。
在一种可选实施方式中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述组合模块810,被具体配置为将所述n个原始向量中的第i原始向量的各个元素扩展第i空间对应的位数,得到第i向量映射结果;
基于各向量映射结果的加和,得到所述综合向量。
在一种可选实施方式中,所述第一方持有n个原始矩阵;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述组合模块810,被具体配置为利用中国剩余定理确定所述综合向量,所述综合向量满足,针对第i空间对应的第i模值取模的余数结果为第i原始向量。
在一种可选实施方式中,所述第二方持有原始向量集,所述n个原始向量是所述原始向量集中的部分向量,使得对应的所述n个计算空间的空间总和不大于所述同态加密算法对应的同态明文空间大小。
相应于上述方法实施例,本说明实施例提供,一种保护数据隐私的双方联合进行数据处理的系统900,其示意性框图如图8所示,所述系统900包括第一方910和第二方920,所述第一方910持有隐私数据构成的原始矩阵,所述第二方920持有隐私数据构成的n个原始向量,其中:
所述第二方920被配置为将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量,所述n个计算空间彼此不同且互相隔离;使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方910;
所述第一方910被配置为接收所述加密综合向量,利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;至少基于所述加密结果向量,确定数据处理结果,并将所述数据处理结果发送至所述第二方920;
所述第二方920,还被配置为接收所述数据处理结果;对所述数据处理结果进行解密,并将其分解到所述n个计算空间,从而获得所述原始矩阵与所述n个原始向量的相乘计算结果。
在一种可选实施方式中,所述n个计算空间的空间大小,至少根据所述原始矩阵与各个原始向量中元素乘积的最大有效位宽而确定。
在一种可选实施方式中,所述第一方在至少基于所述加密结果向量,确定数据处理结果的过程中,被具体配置为:
生成n个随机向量,并将其相反数作为所述相乘计算结果的n个第一方分片;
将所述n个随机向量在所述n个计算空间的映射结果进行组合,得到综合随机向量;
基于所述综合随机向量以及所述加密结果向量,确定所述数据处理结果;
相应的,所述根据分解结果获得所述原始矩阵与所述n个原始向量的相乘计算结果,包括:
将所述分解结果中的n个向量作为所述相乘计算结果的n个第二方分片。
在一种可选实施方式中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述第二方得到综合向量的过程,被配置为:将所述n个原始向量中的第i原始向量的各个元素扩展第i空间对应的位数,得到第i向量映射结果;
基于各向量映射结果的加和,得到所述综合向量;
所述第一方将所述n个随机向量在所述n个计算空间的映射结果进行组合,包括:
将所述n个随机向量中的第i随机向量的各个元素扩展第i空间对应的位数,得到第i随机映射结果;
基于各随机映射结果的加和,确定所述综合随机向量。
在一种可选实施方式中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述第二方得到综合向量的过程,被配置为:将所述n个原始向量中的第i原始向量的各个元素扩展第i空间对应的位数,得到第i向量映射结果;
基于各向量映射结果的加和,得到所述综合向量。
在一种可选实施方式中,所述第i空间相较于第i-1空间的位数之差,根据所述原始矩阵与第i-1原始向量中元素乘积的最大有效位宽,以及针对所述n个随机向量预设的超额掩盖位宽而确定。
在一种可选实施方式中,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述第一方确定加密结果向量的过程,被配置为:
利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量;
相应的,所述第二方得到综合向量的过程,被配置为:
利用中国剩余定理确定所述综合向量,所述综合向量满足,针对第i空间对应的第i模值取模的余数结果为第i原始向量。
在一种可选实施方式中,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述第一方确定加密结果向量的过程,被配置为:
利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量;
所述第一方得到综合随机向量的过程,被配置为:
利用所述中国剩余定理确定所述综合随机向量,使得所述综合随机向量满足,针对第i空间对应的第i模值取值的余数结果为第i随机向量;
相应的,所述第二方得到综合向量的过程,被配置为:
利用中国剩余定理确定所述综合向量,所述综合向量满足,针对第i空间对应的第i模值取模的余数结果为第i原始向量。
在一种可选实施方式中,所述第i模值的位宽,根据所述第i原始矩阵与第i原始向量中元素乘积的最大有效位宽,以及针对所述n个随机向量预设的超额掩盖位宽而确定。
在一种可选实施方式中,所述第一方基于所述综合随机向量以及所述加密结果向量,确定所述数据处理结果的过程,被具体配置为:
生成目标随机向量,所述目标随机向量中各元素的位宽,根据所述最大有效位宽,所述超额掩盖位宽以及原始矩阵个数而确定;
将所述目标随机向量与所述n个模值连乘,并将所得的连乘结果叠加至所述综合随机向量,得到扩展随机向量;
将所述扩展随机向量,同态叠加至所述加密结果向量,得到所述数据处理结果。
上述装置、系统实施例与方法实施例相对应,具体说明可以参见方法实施例部分的描述,此处不再赘述。装置、系统实施例是基于对应的方法实施例得到,与对应的方法实施例具有同样的技术效果,具体说明可参见对应的方法实施例。
本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书所提供的第一方侧的所述保护数据隐私的双方联合进行数据处理的方法。
本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行本说明书所提供的第二方侧的所述保护数据隐私的双方联合进行数据处理的方法。
本说明书实施例还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书所提供的第一方侧的所述保护数据隐私的双方联合进行数据处理的方法。
本说明书实施例还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书所提供的第二方侧的所述保护数据隐私的双方联合进行数据处理的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于存储介质和计算设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明实施例的目的、技术方案和有益效果进行了进一步的详细说明。所应理解的是,以上所述仅为本发明实施例的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (21)
1.一种保护数据隐私的双方联合进行数据处理的方法,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述方法通过所述第一方执行,所述方法包括:
从所述第二方接收加密综合向量,所述加密综合向量是使用所述第二方的公钥,利用同态加密算法对综合向量加密得到的,所述综合向量是,所述n个原始向量在对应的n个计算空间中的映射结果的组合,所述n个计算空间彼此不同且互相隔离;
利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;
生成n个随机向量,并将其相反数作为所述原始矩阵与所述n个原始向量的相乘计算结果的n个第一方分片;
将所述n个随机向量在所述n个计算空间的映射结果进行组合,得到综合随机向量;
基于所述综合随机向量以及所述加密结果向量,确定数据处理结果,并将所述数据处理结果发送至所述第二方,使得所述第二方根据所述数据处理结果,获得所述相乘计算结果的n个第二方分片。
2.根据权利要求1所述的方法,其中,所述n个计算空间的空间大小,至少根据所述原始矩阵与各个原始向量中元素乘积的最大有效位宽而确定。
3.根据权利要求1所述的方法,其中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述将所述n个随机向量在所述n个计算空间的映射结果进行组合,包括:
将所述n个随机向量中的第i随机向量的各个元素扩展第i空间对应的位数,得到第i随机映射结果;
基于各随机映射结果的加和,确定所述综合随机向量。
4.根据权利要求3所述的方法,其中,所述第i空间相较于第i-1空间的位数之差,根据所述原始矩阵与第i-1原始向量中元素乘积的最大有效位宽,以及针对所述n个随机向量预设的超额掩盖位宽而确定。
5.根据权利要求1所述的方法,其中,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述确定加密结果向量,包括:
利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量。
6.根据权利要求1所述的方法,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述确定加密结果向量,包括:
利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量;
所述得到综合随机向量,包括:
利用所述中国剩余定理确定所述综合随机向量,使得所述综合随机向量满足,针对第i空间对应的第i模值取值的余数结果为第i随机向量。
7.根据权利要求6所述的方法,其中,所述第i模值的位宽,根据所述第i原始矩阵与第i原始向量中元素乘积的最大有效位宽,以及针对所述n个随机向量预设的超额掩盖位宽而确定。
8.根据权利要求7所述的方法,其中,所述基于所述综合随机向量以及所述加密结果向量,确定所述数据处理结果,包括:
生成目标随机向量,所述目标随机向量中各元素的位宽,根据所述最大有效位宽,所述超额掩盖位宽以及原始矩阵个数而确定;
将所述目标随机向量与所述n个模值连乘,并将所得的连乘结果叠加至所述综合随机向量,得到扩展随机向量;
将所述扩展随机向量,同态叠加至所述加密结果向量,得到所述数据处理结果。
9.一种保护数据隐私的双方联合进行数据处理的方法,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述方法通过所述第二方执行,所述方法包括:
将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量,所述n个计算空间彼此不同且互相隔离;
使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方;
从所述第一方接收数据处理结果,所述数据处理结果是,所述第一方至少基于加密结果向量以及综合随机向量确定的,所述加密结果向量是基于所述原始矩阵以及所述加密综合向量确定的;所述综合随机向量是,所述第一方将n个随机向量在所述n个计算空间的映射结果进行组合而得到的,所述n个随机向量的相反数作为所述原始矩阵与所述n个原始向量的相乘计算结果的n个第一方分片;
对所述数据处理结果进行解密,并将其分解到所述n个计算空间,根据分解结果获得所述相乘计算结果的n个第二方分片。
10.根据权利要求9所述的方法,其中,所述n个计算空间的空间大小,至少根据所述原始矩阵与各个原始向量中元素乘积的最大有效位宽而确定。
11.根据权利要求9所述的方法,其中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述得到综合向量,包括:
将所述n个原始向量中的第i原始向量的各个元素扩展第i空间对应的位数,得到第i向量映射结果;
基于各向量映射结果的加和,得到所述综合向量。
12.根据权利要求9所述的方法,其中,所述第一方持有n个原始矩阵;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述得到综合向量,包括:
利用中国剩余定理确定所述综合向量,所述综合向量满足,针对第i空间对应的第i模值取模的余数结果为第i原始向量。
13.根据权利要求9所述的方法,其中,所述第二方持有原始向量集,所述n个原始向量是所述原始向量集中的部分向量,使得对应的所述n个计算空间的空间总和不大于所述同态加密算法对应的同态明文空间大小。
14.一种保护数据隐私的双方联合进行数据处理的方法,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述方法包括:
所述第二方将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量;使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方,所述n个计算空间彼此不同且互相隔离;
所述第一方接收所述加密综合向量,利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;生成n个随机向量,并将其相反数作为所述原始矩阵与所述n个原始向量的相乘计算结果的n个第一方分片;将所述n个随机向量在所述n个计算空间的映射结果进行组合,得到综合随机向量;基于所述综合随机向量以及所述加密结果向量,确定数据处理结果,并将所述数据处理结果发送至所述第二方;
所述第二方接收所述数据处理结果;对所述数据处理结果进行解密,并将其分解到所述n个计算空间,根据分解结果获得所述相乘计算结果的n个第二方分片。
15.根据权利要求14所述的方法,其中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述第二方得到综合向量,包括:
将所述n个原始向量中的第i原始向量的各个元素扩展第i空间对应的位数,得到第i向量映射结果;
基于各向量映射结果的加和,得到所述综合向量;
所述第一方将所述n个随机向量在所述n个计算空间的映射结果进行组合,包括:
将所述n个随机向量中的第i随机向量的各个元素扩展第i空间对应的位数,得到第i随机映射结果;
基于各随机映射结果的加和,确定所述综合随机向量。
16.根据权利要求14所述的方法,其中,所述第一方持有1个原始矩阵;所述n个计算空间是,当前进制下n个不同位数的空间;
所述第二方得到综合向量,包括:
将所述n个原始向量中的第i原始向量的各个元素扩展第i空间对应的位数,得到第i向量映射结果;
基于各向量映射结果的加和,得到所述综合向量。
17.根据权利要求14所述的方法,其中,所述第一方持有的原始矩阵为n个;所述n个计算空间是,对应于n个模值的取模空间;所述n个模值互质;
所述第二方得到综合向量,包括:
利用中国剩余定理确定所述综合向量,所述综合向量满足,针对第i空间对应的第i模值取模的余数结果为第i原始向量;
所述第一方确定加密结果向量,包括:
利用中国剩余定理确定综合矩阵,所述综合矩阵满足,针对第i空间对应的第i模值取模的余数结果为第i原始矩阵;
基于所述综合矩阵以及所述加密综合向量的同态运算,得到所述加密结果向量。
18.一种保护数据隐私的双方联合进行数据处理的装置,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述装置部署在所述第一方,所述装置包括:
第一接收模块,被配置为从所述第二方接收加密综合向量,所述加密综合向量是使用所述第二方的公钥,利用同态加密算法对综合向量加密得到的,所述综合向量是,所述n个原始向量在对应的n个计算空间中的映射结果的组合,所述n个计算空间彼此不同且互相隔离;
第一确定模块,被配置为利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;
第二确定模块,包括:生成单元,被配置为生成n个随机向量,并将其相反数作为所述原始矩阵与所述n个原始向量的相乘计算结果的n个第一方分片;组合单元,被配置为将所述n个随机向量在所述n个计算空间的映射结果进行组合,得到综合随机向量;第一确定单元,被配置为基于所述综合随机向量以及所述加密结果向量,确定数据处理结果,使得根据所述数据处理结果,获得所述相乘计算结果的n个第二方分片。
19.一种保护数据隐私的双方联合进行数据处理的装置,所述双方包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,所述装置部署在所述第二方,所述装置包括:
组合模块,被配置为将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量,所述n个计算空间彼此不同且互相隔离;
加密模块,被配置为使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方;
第二接收模块,被配置为从所述第一方接收数据处理结果,所述数据处理结果是,所述第一方至少基于加密结果向量以及综合随机向量确定的,所述加密结果向量是基于所述原始矩阵以及所述加密综合向量确定的;所述综合随机向量是,所述第一方将n个随机向量在所述n个计算空间的映射结果进行组合而得到的,所述n个随机向量的相反数作为所述原始矩阵与所述n个原始向量的相乘计算结果的n个第一方分片;
解密获得模块,被配置为对所述数据处理结果进行解密,并将其分解到所述n个计算空间,根据分解结果获得所述相乘计算结果的n个第二方分片。
20.一种保护数据隐私的双方联合进行数据处理的系统,所述系统包括第一方和第二方,所述第一方持有隐私数据构成的原始矩阵,所述第二方持有隐私数据构成的n个原始向量,其中:
所述第二方,被配置为将所述n个原始向量在n个计算空间的映射结果进行组合,得到综合向量,所述n个计算空间彼此不同且互相隔离;使用第二方的公钥,利用同态加密算法对所述综合向量加密,得到加密综合向量,并将其发送至所述第一方;
所述第一方,被配置为接收所述加密综合向量,利用所述原始矩阵以及所述加密综合向量,确定加密结果向量;生成n个随机向量,并将其相反数作为所述原始矩阵与所述n个原始向量的相乘计算结果的n个第一方分片;将所述n个随机向量在所述n个计算空间的映射结果进行组合,得到综合随机向量;基于所述综合随机向量以及所述加密结果向量,确定数据处理结果,并将所述数据处理结果发送至所述第二方;
所述第二方,还被配置为接收所述数据处理结果;对所述数据处理结果进行解密,并将其分解到所述n个计算空间,从而获得所述相乘计算结果的n个第二方分片。
21.一种计算设备,包括存储器和处理器,其中,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-8或者9-13中任一项所述的方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111601087.4A CN113987559B (zh) | 2021-12-24 | 2021-12-24 | 保护数据隐私的双方联合进行数据处理的方法及装置 |
PCT/CN2022/125430 WO2023116144A1 (zh) | 2021-12-24 | 2022-10-14 | 保护数据隐私的双方联合进行数据处理的方法及装置 |
EP22909462.8A EP4343596A1 (en) | 2021-12-24 | 2022-10-14 | Method and apparatus for joint data processing by two parties for protecting data privacy |
US18/400,689 US20240137206A1 (en) | 2021-12-24 | 2023-12-29 | Methods and apparatuses for jointly processing data by two parties for data privacy protection |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111601087.4A CN113987559B (zh) | 2021-12-24 | 2021-12-24 | 保护数据隐私的双方联合进行数据处理的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113987559A CN113987559A (zh) | 2022-01-28 |
CN113987559B true CN113987559B (zh) | 2022-04-08 |
Family
ID=79734295
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111601087.4A Active CN113987559B (zh) | 2021-12-24 | 2021-12-24 | 保护数据隐私的双方联合进行数据处理的方法及装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240137206A1 (zh) |
EP (1) | EP4343596A1 (zh) |
CN (1) | CN113987559B (zh) |
WO (1) | WO2023116144A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113987559B (zh) * | 2021-12-24 | 2022-04-08 | 支付宝(杭州)信息技术有限公司 | 保护数据隐私的双方联合进行数据处理的方法及装置 |
CN114884645B (zh) * | 2022-07-11 | 2022-09-09 | 华控清交信息科技(北京)有限公司 | 一种隐私计算方法、装置和可读存储介质 |
CN115473721A (zh) * | 2022-09-06 | 2022-12-13 | 深圳壹账通智能科技有限公司 | 数据验证的处理方法、装置、计算机设备及可读存储介质 |
CN115865307B (zh) * | 2023-02-27 | 2023-05-09 | 蓝象智联(杭州)科技有限公司 | 一种用于联邦学习的数据点乘运算方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113407979A (zh) * | 2021-08-16 | 2021-09-17 | 深圳致星科技有限公司 | 用于纵向联邦逻辑回归学习的异构加速方法、装置及系统 |
CN113542228A (zh) * | 2021-06-18 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 基于联邦学习的数据传输方法、装置以及可读存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9229687B2 (en) * | 2013-09-05 | 2016-01-05 | Xerox Corporation | Private two-party computation using partially homomorphic encryption |
US10075288B1 (en) * | 2014-02-28 | 2018-09-11 | The Governing Council Of The University Of Toronto | Systems, devices, and processes for homomorphic encryption |
US11431470B2 (en) * | 2019-08-19 | 2022-08-30 | The Board Of Regents Of The University Of Texas System | Performing computations on sensitive data while guaranteeing privacy |
CN111160573B (zh) * | 2020-04-01 | 2020-06-30 | 支付宝(杭州)信息技术有限公司 | 保护数据隐私的双方联合训练业务预测模型的方法和装置 |
CN111162896B (zh) * | 2020-04-01 | 2020-06-26 | 支付宝(杭州)信息技术有限公司 | 双方联合进行数据处理的方法及装置 |
CN112507372B (zh) * | 2021-02-05 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 实现隐私保护的多方协同更新模型的方法及装置 |
CN112989368B (zh) * | 2021-02-07 | 2022-05-17 | 支付宝(杭州)信息技术有限公司 | 多方联合进行隐私数据处理的方法及装置 |
CN112906030B (zh) * | 2021-03-09 | 2023-05-16 | 浙江万里学院 | 基于多方全同态加密的数据共享方法和系统 |
CN113626841A (zh) * | 2021-08-10 | 2021-11-09 | 支付宝(杭州)信息技术有限公司 | 基于多方安全计算的选择问题处理方法 |
CN113987559B (zh) * | 2021-12-24 | 2022-04-08 | 支付宝(杭州)信息技术有限公司 | 保护数据隐私的双方联合进行数据处理的方法及装置 |
-
2021
- 2021-12-24 CN CN202111601087.4A patent/CN113987559B/zh active Active
-
2022
- 2022-10-14 EP EP22909462.8A patent/EP4343596A1/en active Pending
- 2022-10-14 WO PCT/CN2022/125430 patent/WO2023116144A1/zh active Application Filing
-
2023
- 2023-12-29 US US18/400,689 patent/US20240137206A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113542228A (zh) * | 2021-06-18 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 基于联邦学习的数据传输方法、装置以及可读存储介质 |
CN113407979A (zh) * | 2021-08-16 | 2021-09-17 | 深圳致星科技有限公司 | 用于纵向联邦逻辑回归学习的异构加速方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
US20240137206A1 (en) | 2024-04-25 |
WO2023116144A1 (zh) | 2023-06-29 |
EP4343596A1 (en) | 2024-03-27 |
CN113987559A (zh) | 2022-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113987559B (zh) | 保护数据隐私的双方联合进行数据处理的方法及装置 | |
CN111162896B (zh) | 双方联合进行数据处理的方法及装置 | |
CN111241570B (zh) | 保护数据隐私的双方联合训练业务预测模型的方法和装置 | |
JP6575532B2 (ja) | 暗号化装置、復号装置、暗号処理システム、暗号化方法、復号方法、暗号化プログラム、及び復号プログラム | |
CN111510281A (zh) | 一种同态加密方法及装置 | |
CN115276947B (zh) | 隐私数据处理方法、装置、系统及存储介质 | |
Gomathisankaran et al. | Ensure privacy and security in the process of medical image analysis | |
CN107454975B (zh) | 加密系统和密钥生成装置 | |
WO2012157279A1 (ja) | 順序保存暗号化システム、装置、方法及びプログラム | |
EP2742644A1 (en) | Encryption and decryption method | |
CN113434878A (zh) | 基于联邦学习的建模及应用方法、装置、设备及存储介质 | |
JP6607257B2 (ja) | 秘密計算システム、秘密計算装置、および、秘密計算方法 | |
CN113434886B (zh) | 联合生成用于安全计算的数据元组的方法及装置 | |
JP6053983B2 (ja) | 暗号システム、署名システム、暗号プログラム及び署名プログラム | |
CN115994546A (zh) | 矩阵乘法的安全计算方法及装置 | |
CN108124076A (zh) | 基于异构混沌和keccak哈希函数的图像加密方法 | |
Kaur et al. | A review of image encryption schemes based on the chaotic map | |
US20220094532A1 (en) | Methods and systems for homomorphic data representation and concealment powered by clifford geometric algebra | |
CN105099693A (zh) | 一种传输方法及传输装置 | |
TWI552563B (zh) | 時間擾動混沌映射加密解密系統與方法 | |
CN106683030A (zh) | 基于量子多图像模型与三维变换的量子多图加密算法 | |
JP2886517B2 (ja) | 共通鍵通信システム | |
RU2580060C1 (ru) | Способ шифрования сообщения, представленного в виде многоразрядного двоичного числа | |
CN113268707B (zh) | 一种基于行编码的密文协方差矩阵计算方法 | |
Zakasovskaya et al. | Construction of asymmetric cryptosystems using finite non-commutative algebraic groups |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |