CN115333789A - 一种非对称模式下基于大规模数据集的隐私保护交集计算方法及装置 - Google Patents

一种非对称模式下基于大规模数据集的隐私保护交集计算方法及装置 Download PDF

Info

Publication number
CN115333789A
CN115333789A CN202210857942.6A CN202210857942A CN115333789A CN 115333789 A CN115333789 A CN 115333789A CN 202210857942 A CN202210857942 A CN 202210857942A CN 115333789 A CN115333789 A CN 115333789A
Authority
CN
China
Prior art keywords
client
server
data set
data
encrypted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210857942.6A
Other languages
English (en)
Other versions
CN115333789B (zh
Inventor
阮鸥
颜昌旺
艾朝浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN202210857942.6A priority Critical patent/CN115333789B/zh
Publication of CN115333789A publication Critical patent/CN115333789A/zh
Application granted granted Critical
Publication of CN115333789B publication Critical patent/CN115333789B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • H04L63/0442Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload wherein the sending and receiving network entities apply asymmetric encryption, i.e. different keys for encryption and decryption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
    • H04L9/0643Hash functions, e.g. MD5, SHA, HMAC or f9 MAC
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/08Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
    • H04L9/0816Key establishment, i.e. cryptographic processes or cryptographic protocols whereby a shared secret becomes available to two or more parties, for subsequent use
    • H04L9/0819Key transport or distribution, i.e. key establishment techniques where one party creates or otherwise obtains a secret value, and securely transfers it to the other(s)

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Power Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种非对称模式下基于大规模数据集的隐私保护交集计算方法及装置,致力于解决拥有大规模数据集的服务器端与拥有小规模数据集的客户端的PSI问题,本发明采用布隆过滤器存储数据,ElGamal密码体制对数据进行加密,具有良好的安全性以及效率。在保护双方用户的信息安全的前提下,实现了用户双方进行数据集合之间的交集运算,并且服务器的实际运行时间不会随着服务器数据集大小的增加而增加,客户端的完整运行时间和实际运行时间主要取决于客户端的数据集大小,不会随服务器的数据集大小的增加而明显增加,当服务器数据集规模很大时,客户端依然具有很快的速率。并且当服务器数据量越来越大时,该方法的优势会越来越明显。

Description

一种非对称模式下基于大规模数据集的隐私保护交集计算方 法及装置
技术领域
本发明涉及PSI和隐私保护技术领域,尤其涉及一种非对称模式下基于大规模数据集的隐私保护交集计算方法及装置。
背景技术
随着人们越来越关注用户信息的隐私保护,要求信息在满足当前时代多元化交互且充分利用的同时保证用户信息不被泄露。而私有集合交集(PSI)作为一种较常见的信息交互方式,如聊天应用中以用户身份查询我的私人联系人的聊天账号、用户比对数据库中的基于序列来找出与基因疾病相关的基因序列等成为了众多学者研究的重要关注点。经过不断的发展以及越来越高效的研究成果出现,PSI协议也越来越高效。但大部分协议的客户端的运行时间会随着服务器端的数据量增大而明显增加,还有一些协议的客户端运行时间不会随着服务器端数据量的增大而显著变化,但是这些协议在客户端运行时间上比那些会随着服务器端数据量增大而明显变化的协议要长。
由此可知,现有技术中的方法存在计算效率不高的技术问题。
发明内容
为了解决上述的技术问题,本发明提供了一种非对称模式下基于大规模数据集的隐私保护交集计算方法,在实现拥有大规模数据集的服务器与小规模数据集的客户端求得数据交集且保证双方隐私不泄露的前提下,服务器的实际运行时间不会随着服务器数据集大小的增加而增加,客户端的完整运行时间和实际运行时间主要取决于客户端的数据集的大小,并不随服务器大小的增加而明显增加,从而保证了整体的计算效率。
本发明的方法所采用的技术方案是:
为了解决上述技术问题,本发明第一方面提供了一种非对称模式下基于大规模数据集的隐私保护交集计算方法,包括:
S1:服务器生成具有乘法同态性的ElGamal密码体制的解密密钥sk和公钥pk,并拥有数据集
Figure BDA0003754960970000011
n1是服务器数据集的大小,xi是服务器数据集合中的第i个元素;客户端拥有数据集
Figure BDA0003754960970000012
n2是客户端数据集大小,yj是客户端集合中第j个元素,n2远小于n1
S2:服务器根据数据集X的大小初始化布隆过滤器BFX,并将布隆过滤器使用公钥pk进行加密处理,再将加密后的布隆过滤器EBFX以及生成的hash函数发送给客户端;与此同时,客户端将其数据集Y中的每一个数据做数据隐藏处理;
S3:客户端基于服务器发送的加密后的布隆过滤器以及hash函数,对客户端的每一个数据进行计算,得到加密的结果Cj,然后将加密的结果转发给服务器,服务器对客户端发送的加密的结果使用解密密钥sk进行解密运算得到解密后的结果Sj,再将解密后的结果发送给客户端,客户端根据解密后的结果得出是否属于交集。
在一种实施方式中,步骤S2包括:
S2.1:服务器根据数据集
Figure BDA0003754960970000021
的大小初始化布隆过滤器BFX,得到布隆过滤器的大小m以及hash函数的个数k,并将数据集
Figure BDA0003754960970000022
通过hash函数映射到布隆过滤器BFX中,布隆过滤器的二进制表第t位的值为
Figure BDA0003754960970000023
S2.2:服务器遍历布隆过滤器BFX的二进制表,若
Figure BDA0003754960970000024
则对
Figure BDA0003754960970000025
直接进行加密:
Figure BDA0003754960970000026
Figure BDA0003754960970000027
则生成一个用于替换二进制表中第t位的值的随机数t
r1 t,并对r1 t进行加密处理得到Enc(r1 t),再用Enc(r1 t)替换原来的
Figure BDA0003754960970000028
得到布隆过滤器二进制表的第t位的加密值:
Figure BDA0003754960970000029
S2.3:客户端遍历自己的数据集
Figure BDA00037549609700000210
并生成用于与客户端的数据yj相乘的随机数
Figure BDA00037549609700000211
将yj通过服务器生成的公钥pk进行加密得到Enc(yj),将
Figure BDA00037549609700000212
通过服务器生成的公钥pk进行加密得到
Figure BDA00037549609700000213
并计算yj数据隐藏之后的结果
Figure BDA00037549609700000214
yj是客户端集合中第j个元素,n2是客户端数据集大小;
S2.4:服务器将加密后的布隆过滤器EBFX以及生成的hash函数发送给客户端。
在一种实施方式中,步骤S3包括:
S3.1:客户端基于服务器发送的加密后的布隆过滤器以及hash函数,将客户端的每一个数据yj经受每一个hash函数映射,每一个yj通过k个hash函数映射得到一组加密的结果
Figure BDA00037549609700000215
根据每一个数据的一组加密的结果计算每一个客户端的加密后的结果
Figure BDA00037549609700000216
最后将每一个客户端的加密后的结果得到结果数据集
Figure BDA00037549609700000217
并转发给服务器;
S3.2:服务器对
Figure BDA00037549609700000218
使用解密密钥sk进行解密运算得到解密后的结果Sj=Dec(Cj),再将解密后的结果构成的数据集
Figure BDA00037549609700000219
发送给客户端;
S3.3:客户端计算
Figure BDA0003754960970000031
若结果等于yj,则yj属于服务器数据集X和客户端数据集Y的交集。
基于同样的发明构思,本发明第二方面提供了一种非对称模式下基于大规模数据集的隐私保护交集计算装置,包括:
数据准备模块,用于通过服务器生成具有乘法同态性的ElGamal密码体制的解密密钥sk和公钥pk,并拥有数据集
Figure BDA0003754960970000032
n1是服务器数据集的大小,xi是服务器数据集合中的第i个元素;客户端拥有数据集
Figure BDA0003754960970000033
n2是客户端数据集大小,yj是客户端集合中第j个元素,n2远小于n1
预处理模块,用于通过服务器根据数据集X的大小初始化布隆过滤器BFX,并将布隆过滤器使用公钥pk进行加密处理,再将加密后的布隆过滤器EBFX以及生成的hash函数发送给客户端;与此同时,客户端将其数据集Y中的每一个数据做数据隐藏处理;
在线交互模块,用于通过客户端基于服务器发送的加密后的布隆过滤器以及hash函数,对客户端的每一个数据进行计算,得到加密的结果Cj,然后将加密的结果转发给服务器,服务器对客户端发送的加密的结果使用解密密钥sk进行解密运算得到解密后的结果Sj,再将解密后的结果发送给客户端,客户端根据解密后的结果得出是否属于交集。
基于同样的发明构思,本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现第一方面所述的方法。
基于同样的发明构思,本发明第四方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
相对于现有技术,本发明的优点和有益的技术效果如下:
本发明提供了一种非对称模式下基于大规模数据集的隐私保护交集计算方法,首先是数据准备阶段,服务器生成具有乘法同态性的ElGamal密码体制的解密密钥和公钥,并拥有数据集,客户端也具有对应的数据集,然后是数据预处理阶段,由服务器根据其数据集的大小初始化布隆过滤器,并进行加密处理,同时客户端将对应数据集Y中的每一个数据做数据隐藏处理。最后是在线交互阶段,客户端通过服务器发送过来的加密后的布隆过滤器以及hash函数,计算出加密的结果,然后将加密的结果转发给服务器,由服务器对结果进行解密后发送给客户端,客户端通过结果得出是否属于交集。由于本发明采用布隆过滤器存储数据,密码体制对数据进行加密,因此具有良好的安全性以及计算效率。该方法在保护双方用户的信息安全的前提下,实现了用户双方进行数据集合之间的交集运算,针对现有技术中众多的PSI协议有所创新,具体为,本发明的方法服务器的实际运行时间不会随着服务器数据集大小的增加而增加,客户端的完整运行时间和实际运行时间主要取决于客户端的数据集大小,并不随服务器的数据集大小的增加而明显增加,当服务器数据集规模很大时,客户端依然具有很快的运行速率,因此,相对于现有技术中大多数PSI协议来说,本发明的计算效率得到了较大的提升,并且当服务器数据量越来越大时,该方法的优势会越来越明显。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中非对称模式下基于大规模数据集的隐私保护交集计算方法的流程图。
具体实施方式
本发明公开了一种非对称模式下基于大规模数据集的隐私保护交集计算方法,该方法致力于解决拥有大规模数据集的服务器端与拥有小规模数据集的客户端的PSI问题,本发明的方法采用布隆过滤器存储数据,密码体制对数据进行加密,具有良好的安全性以及效率。该方法在保护双方用户的信息安全的前提下,实现了用户双方进行数据集合之间的交集运算,与此同时,还针对当前众多的PSI协议有所创新:服务器的实际运行时间不会随着服务器数据集大小的增加而增加,客户端的完整运行时间和实际运行时间主要取决于客户端的数据集大小,并不随服务器的数据集大小的增加而明显增加,当服务器数据集规模很大时,客户端依然具有很快的速率,比目前的大多数PSI协议效率都要高。并且当服务器数据量越来越大时,该方法的优势会越来越明显。。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例提供了一种非对称模式下基于大规模数据集的隐私保护交集计算方法,包括:
S1:服务器生成具有乘法同态性的ElGamal密码体制的解密密钥sk和公钥pk,并拥有数据集
Figure BDA0003754960970000051
n1是服务器数据集的大小,xi是服务器数据集合中的第i个元素;客户端拥有数据集
Figure BDA0003754960970000052
n2是客户端数据集大小,yj是客户端集合中第j个元素,n2远小于n1
S2:服务器根据数据集X的大小初始化布隆过滤器BFX,并将布隆过滤器使用公钥pk进行加密处理,再将加密后的布隆过滤器EBFX以及生成的hash函数发送给客户端;与此同时,客户端将其数据集Y中的每一个数据做数据隐藏处理;
S3:客户端基于服务器发送的加密后的布隆过滤器以及hash函数,对客户端的每一个数据进行计算,得到加密的结果Cj,然后将加密的结果转发给服务器,服务器对客户端发送的加密的结果使用解密密钥sk进行解密运算得到解密后的结果Sj,再将解密后的结果发送给客户端,客户端根据解密后的结果得出是否属于交集。
具体来说,在密码学中,ElGamal加密算法是一个基于迪菲-赫尔曼密钥交换的非对称加密算法。
步骤S3中,对客户端的每一个数据进行计算,得到每一个数据的一组加密的结果,然后通过这组加密的结果得到客户端的加密的结果,然后将每一个客户端的加密的结果Cj构成一个数据集后发送给服务器。
本发明的方法针对用户与服务器之间的数据信息集求交集的情形,用户需求是知晓自己的数据集与服务器数据集的交集数据,服务器的数据一般是大规模的,客户端的数据相比于服务器来说规模较小,本发明称这种情况为非对称,该协议针对上述情形是高效的,并安全保护了双方的隐私不被泄露。
在一种实施方式中,步骤S2包括:
S2.1:服务器根据数据集
Figure BDA0003754960970000053
的大小初始化布隆过滤器BFX,得到布隆过滤器的大小m以及hash函数的个数k,并将数据集
Figure BDA0003754960970000054
通过hash函数映射到布隆过滤器BFX中,布隆过滤器的二进制表第t位的值为
Figure BDA0003754960970000055
S2.2:服务器遍历布隆过滤器BFX的二进制表,若
Figure BDA0003754960970000056
则对
Figure BDA0003754960970000057
直接进行加密:
Figure BDA0003754960970000058
Figure BDA0003754960970000059
则生成一个用于替换二进制表中第t个数的随机数r1 t,并对r1 t进行加密处理得到Enc(r1 t),再用Enc(r1 t)替换原来的
Figure BDA00037549609700000510
得到布隆过滤器二进制表的第t位的加密值:
Figure BDA00037549609700000511
S2.3:客户端遍历自己的数据集
Figure BDA00037549609700000512
并生成用于与客户端的数据yj相乘的随机数
Figure BDA0003754960970000061
将yj通过服务器生成的公钥pk进行加密得到Enc(yj),将
Figure BDA0003754960970000062
通过服务器生成的公钥pk进行加密得到
Figure BDA0003754960970000063
并计算yj数据隐藏之后的结果
Figure BDA0003754960970000064
yj是客户端集合中第j个元素,n2是客户端数据集大小;
S2.4:服务器将加密后的布隆过滤器EBFX以及生成的hash函数发送给客户端。
具体实施过程中,服务器遍历布隆过滤器BFX的二进制表,根据二进制表中每一位的值来选择对应的加密方式,如果某一位的值为1,则直接进行加密,如果为0,则生成一个随机数对该位的值进行替换,并对生成的随机数进行加密,通过上述方式,可以得到加密后的隆过滤器。
客户端计算yj数据隐藏之后的结果wj将用于后续的计算。
在一种实施方式中,步骤S3包括:
S3.1:客户端基于服务器发送的加密后的布隆过滤器以及hash函数,将客户端的每一个数据yj经受每一个hash函数映射,每一个yj通过k个hash函数映射得到一组加密的结果
Figure BDA0003754960970000065
根据每一个数据的一组加密的结果计算每一个客户端的加密后的结果
Figure BDA0003754960970000066
最后将每一个客户端的加密后的结果得到结果数据集
Figure BDA0003754960970000067
并转发给服务器;
S3.2:服务器对
Figure BDA0003754960970000068
使用解密密钥sk进行解密运算得到解密后的结果Sj=Dec(Cj),再将解密后的结果构成的数据集
Figure BDA0003754960970000069
发送给客户端;
S3.3:客户端计算
Figure BDA00037549609700000610
若结果等于yj,则yj属于服务器数据集X和客户端数据集Y的交集。
具体实施过程中,客户端收到服务器发送的解密后的结果构成数据集
Figure BDA00037549609700000611
后,对数据集中的每一个元素(数据)与随机数
Figure BDA00037549609700000612
相除,并判断结果是否等于yj,如果等于,则yj∈X∩Y。
本发明是可以通过具体的推导过程证明该方法的完整性和正确性,并且此方法是可以充分利用的。这种非对称模式下基于大规模数据集的隐私保护交集计算方法,特征在于客户端的运行时间不会随着服务器端的数据集的规模增加而降低。该算法采用ElGamal密码体制加密,利用了该密码体制乘法同态性的特点,这种密码体制基于Zp*群上的离散对数的困难性,具有很好的安全性,同时采用布隆过滤器存储,以牺牲较小的、可接受的错误率而大大提高运行效率,具有良好的效率。
实施例二
基于同样的发明构思,本实施例提供了一种非对称模式下基于大规模数据集的隐私保护交集计算装置,包括:
数据准备模块,用于通过服务器生成具有乘法同态性的ElGamal密码体制的解密密钥sk和公钥pk,并拥有数据集
Figure BDA0003754960970000071
n1是服务器数据集的大小,xi是服务器数据集合中的第i个元素;客户端拥有数据集
Figure BDA0003754960970000072
n2是客户端数据集大小,yj是客户端集合中第j个元素,n2远小于n1
预处理模块,用于通过服务器根据数据集X的大小初始化布隆过滤器BFX,并将布隆过滤器使用公钥pk进行加密处理,再将加密后的布隆过滤器EBFX以及生成的hash函数发送给客户端;与此同时,客户端将其数据集Y中的每一个数据做数据隐藏处理;
在线交互模块,用于通过客户端基于服务器发送的加密后的布隆过滤器以及hash函数,对客户端的每一个数据进行计算,得到加密的结果Cj,然后将加密的结果转发给服务器,服务器对客户端发送的加密的结果使用解密密钥sk进行解密运算得到解密后的结果Sj,再将解密后的结果发送给客户端,客户端根据解密后的结果得出是否属于交集。
由于本发明实施例二所介绍的装置为实施本发明实施例一中非对称模式下基于大规模数据集的隐私保护交集计算方法所采用的装置,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该装置的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的装置都属于本发明所欲保护的范围。
实施例三
基于同一发明构思,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现如实施例一中所述的方法。
由于本发明实施例三所介绍的计算机可读存储介质为实施本发明实施例一中非对称模式下基于大规模数据集的隐私保护交集计算方法所采用的计算机可读存储介质,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机可读存储介质的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的计算机可读存储介质都属于本发明所欲保护的范围。
实施例四
基于同一发明构思,本申请还提供了一种计算机设备,包括存储、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述程序时实现实施例一中的方法。
由于本发明实施例四所介绍的计算机设备为实施本发明实施例一中非对称模式下基于大规模数据集的隐私保护交集计算方法所采用的计算机设备,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该计算机设备的具体结构及变形,故而在此不再赘述。凡是本发明实施例一中方法所采用的计算机设备都属于本发明所欲保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种非对称模式下基于大规模数据集的隐私保护交集计算方法,其特征在于,包括:
S1:服务器生成具有乘法同态性的ElGamal密码体制的解密密钥sk和公钥pk,并拥有数据集
Figure FDA0003754960960000011
n1是服务器数据集的大小,xi是服务器数据集合中的第i个元素;客户端拥有数据集
Figure FDA0003754960960000012
n2是客户端数据集大小,yj是客户端集合中第j个元素,n2远小于n1
S2:服务器根据数据集X的大小初始化布隆过滤器BFX,并将布隆过滤器使用公钥pk进行加密处理,再将加密后的布隆过滤器EBFX以及生成的hash函数发送给客户端;与此同时,客户端将其数据集Y中的每一个数据做数据隐藏处理;
S3:客户端基于服务器发送的加密后的布隆过滤器以及hash函数,对客户端的每一个数据进行计算,得到加密的结果Cj,然后将加密的结果转发给服务器,服务器对客户端发送的加密的结果使用解密密钥sk进行解密运算得到解密后的结果Sj,再将解密后的结果发送给客户端,客户端根据解密后的结果得出是否属于交集。
2.如权利要求1所述的非对称模式下基于大规模数据集的隐私保护交集计算方法,其特征在于,步骤S2包括:
S2.1:服务器根据数据集
Figure FDA0003754960960000013
的大小初始化布隆过滤器BFX,得到布隆过滤器的大小m以及hash函数的个数k,并将数据集
Figure FDA0003754960960000014
通过hash函数映射到布隆过滤器BFX中,布隆过滤器的二进制表第t位的值为
Figure FDA0003754960960000015
1≤t≤m;
S2.2:服务器遍历布隆过滤器BFX的二进制表,若
Figure FDA0003754960960000016
则对
Figure FDA0003754960960000017
直接进行加密:
Figure FDA0003754960960000018
Figure FDA0003754960960000019
则生成一个用于替换二进制表中第t位的值的随机数
Figure FDA00037549609600000110
并对
Figure FDA00037549609600000111
进行加密处理得到
Figure FDA00037549609600000112
再用
Figure FDA00037549609600000113
替换原来的
Figure FDA00037549609600000114
得到布隆过滤器二进制表的第t位的加密值:
Figure FDA00037549609600000115
S2.3:客户端遍历自己的数据集
Figure FDA00037549609600000116
并生成用于与客户端的数据yj相乘的随机数
Figure FDA00037549609600000117
1≤j≤n2,将yj通过服务器生成的公钥pk进行加密得到Enc(yj),将
Figure FDA00037549609600000118
通过服务器生成的公钥pk进行加密得到
Figure FDA00037549609600000119
并计算yj数据隐藏之后的结果
Figure FDA00037549609600000120
yj是客户端集合中第j个元素,n2是客户端数据集大小;
S2.4:服务器将加密后的布隆过滤器EBFX以及生成的hash函数发送给客户端。
3.如权利要求1所述的非对称模式下基于大规模数据集的隐私保护交集计算方法,其特征在于,步骤S3包括:
S3.1:客户端基于服务器发送的加密后的布隆过滤器以及hash函数,将客户端的每一个数据yj经受每一个hash函数映射,每一个yj通过k个hash函数映射得到一组加密的结果
Figure FDA0003754960960000021
1≤j≤n2,根据每一个数据的一组加密的结果计算每一个客户端的加密后的结果
Figure FDA0003754960960000022
最后将每一个客户端的加密后的结果得到结果数据集
Figure FDA0003754960960000023
并转发给服务器;
S3.2:服务器对
Figure FDA0003754960960000024
使用解密密钥sk进行解密运算得到解密后的结果Sj=Dec(Cj),再将解密后的结果构成的数据集
Figure FDA0003754960960000025
发送给客户端;
S3.3:客户端计算
Figure FDA0003754960960000026
若结果等于yj,则yj属于服务器数据集X和客户端数据集Y的交集。
4.一种非对称模式下基于大规模数据集的隐私保护交集计算装置,其特征在于,包括:
数据准备模块,用于通过服务器生成具有乘法同态性的ElGamal密码体制的解密密钥sk和公钥pk,并拥有数据集
Figure FDA0003754960960000027
n1是服务器数据集的大小,xi是服务器数据集合中的第i个元素;客户端拥有数据集
Figure FDA0003754960960000028
n2是客户端数据集大小,yj是客户端集合中第j个元素,n2远小于n1
预处理模块,用于通过服务器根据数据集X的大小初始化布隆过滤器BFX,并将布隆过滤器使用公钥pk进行加密处理,再将加密后的布隆过滤器EBFX以及生成的hash函数发送给客户端;与此同时,客户端将其数据集Y中的每一个数据做数据隐藏处理;
在线交互模块,用于通过客户端基于服务器发送的加密后的布隆过滤器以及hash函数,对客户端的每一个数据进行计算,得到加密的结果Cj,然后将加密的结果转发给服务器,服务器对客户端发送的加密的结果使用解密密钥sk进行解密运算得到解密后的结果Sj,再将解密后的结果发送给客户端,客户端根据解密后的结果得出是否属于交集。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现如权利要求1至3中任一项权利要求所述的方法。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至3中任一项权利要求所述的方法。
CN202210857942.6A 2022-07-20 2022-07-20 一种非对称模式下基于大规模数据集的隐私保护交集计算方法及装置 Active CN115333789B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210857942.6A CN115333789B (zh) 2022-07-20 2022-07-20 一种非对称模式下基于大规模数据集的隐私保护交集计算方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210857942.6A CN115333789B (zh) 2022-07-20 2022-07-20 一种非对称模式下基于大规模数据集的隐私保护交集计算方法及装置

Publications (2)

Publication Number Publication Date
CN115333789A true CN115333789A (zh) 2022-11-11
CN115333789B CN115333789B (zh) 2024-04-19

Family

ID=83918571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210857942.6A Active CN115333789B (zh) 2022-07-20 2022-07-20 一种非对称模式下基于大规模数据集的隐私保护交集计算方法及装置

Country Status (1)

Country Link
CN (1) CN115333789B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117150568A (zh) * 2023-10-31 2023-12-01 北京隐算科技有限公司 基于单向不经意哈希函数的数据集隐私求交方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130010950A1 (en) * 2011-07-08 2013-01-10 Sap Ag Public-Key Encrypted Bloom Filters With Applications To Private Set Intersection
CN107124268A (zh) * 2017-04-01 2017-09-01 中国人民武装警察部队工程大学 一种可抵抗恶意攻击的隐私集合交集计算方法
CN109951443A (zh) * 2019-01-28 2019-06-28 湖北工业大学 一种云环境下隐私保护的集合交集计算方法及系统
US10635824B1 (en) * 2015-03-20 2020-04-28 EMC IP Holding Company LLC Methods and apparatus for private set membership using aggregation for reduced communications

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130010950A1 (en) * 2011-07-08 2013-01-10 Sap Ag Public-Key Encrypted Bloom Filters With Applications To Private Set Intersection
US10635824B1 (en) * 2015-03-20 2020-04-28 EMC IP Holding Company LLC Methods and apparatus for private set membership using aggregation for reduced communications
CN107124268A (zh) * 2017-04-01 2017-09-01 中国人民武装警察部队工程大学 一种可抵抗恶意攻击的隐私集合交集计算方法
CN109951443A (zh) * 2019-01-28 2019-06-28 湖北工业大学 一种云环境下隐私保护的集合交集计算方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
OU RUAN;LIXIAO ZHANG;YUANYUAN ZHANG: "Location-sharing protocol for privacy protection in mobile online social networks", 《EURASIP JOURNAL ON WIRELESS COMMUNICATIONS AND NETWORKING》, vol. 2021, no. 1, 17 May 2021 (2021-05-17), pages 1687 - 1472, XP021290888, DOI: 10.1186/s13638-021-01999-z *
申立艳;陈小军;时金桥;胡兰兰;: "隐私保护集合交集计算技术研究综述", 计算机研究与发展, vol. 54, no. 10, 26 September 2017 (2017-09-26) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117150568A (zh) * 2023-10-31 2023-12-01 北京隐算科技有限公司 基于单向不经意哈希函数的数据集隐私求交方法和系统

Also Published As

Publication number Publication date
CN115333789B (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
Li et al. Privacy-preserving machine learning with multiple data providers
Liu et al. An efficient privacy-preserving outsourced calculation toolkit with multiple keys
CN109951443B (zh) 一种云环境下隐私保护的集合交集计算方法及系统
Liu et al. Efficient and privacy-preserving outsourced calculation of rational numbers
Liu et al. Privacy-preserving outsourced calculation toolkit in the cloud
CN107145791B (zh) 一种具有隐私保护的K-means聚类方法及系统
Teng et al. A Modified Advanced Encryption Standard for Data Security.
Liu et al. Intelligent and secure content-based image retrieval for mobile users
CN114640444B (zh) 基于国产密码算法的隐私保护集合交集获取方法及装置
Patel et al. An efficient approach for privacy preserving distributed k-means clustering based on shamir’s secret sharing scheme
Veugen et al. A framework for secure computations with two non-colluding servers and multiple clients, applied to recommendations
CN111325535A (zh) 基于椭圆曲线偏移的区块链私钥管理方法、系统及存储介质
WO2022076038A1 (en) Updatable private set intersection
Pilaram et al. A lattice-based changeable threshold multi-secret sharing scheme and its application to threshold cryptography
CN115333789B (zh) 一种非对称模式下基于大规模数据集的隐私保护交集计算方法及装置
CN110113169B (zh) 基于rsa的协同数字签名方法、装置及电子设备
CN115510502B (zh) 一种隐私保护的pca方法及系统
CN109409111B (zh) 一种面向加密图像的模糊搜索方法
CN116707766A (zh) 一种基于哈希的抗量子攻击数字签名方法
Dawson et al. Ensuring Cloud Data Security Using the Soldier Ant Algorithm
Theodouli et al. Implementing private k-means clustering using a LWE-based cryptosystem
Rajakumar et al. A novel scheme for encryption and decryption of 3D point and mesh cloud data in cloud computing
Meng et al. A secure and efficient on-line/off-line group key distribution protocol
Magons Applications and Benefits of Elliptic Curve Cryptography.
CN111614465B (zh) 基于超奇异同源秘钥封装协议的公钥生成方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant