CN115396148A - 隐私保护的名单查询方法、系统、介质、设备及终端 - Google Patents
隐私保护的名单查询方法、系统、介质、设备及终端 Download PDFInfo
- Publication number
- CN115396148A CN115396148A CN202210870854.XA CN202210870854A CN115396148A CN 115396148 A CN115396148 A CN 115396148A CN 202210870854 A CN202210870854 A CN 202210870854A CN 115396148 A CN115396148 A CN 115396148A
- Authority
- CN
- China
- Prior art keywords
- privacy
- hash
- list
- vector
- parties
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 239000013598 vector Substances 0.000 claims abstract description 60
- 238000004364 calculation method Methods 0.000 claims abstract description 33
- 230000003993 interaction Effects 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 32
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 7
- 239000000654 additive Substances 0.000 claims description 6
- 230000000996 additive effect Effects 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 241000544061 Cuculus canorus Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/008—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/02—Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
- H04L63/0227—Filtering policies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/06—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
- H04L9/0643—Hash functions, e.g. MD5, SHA, HMAC or f9 MAC
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/08—Key distribution or management, e.g. generation, sharing or updating, of cryptographic keys or passwords
- H04L9/0861—Generation of secret information including derivation or calculation of cryptographic keys or passwords
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/32—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
- H04L9/3236—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using cryptographic hash functions
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Power Engineering (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Storage Device Security (AREA)
Abstract
本发明属于隐私安全技术领域,公开了隐私保护的名单查询方法、系统、介质、设备及终端,金融机构初始名单集合的向量表;将金融机构A、B的新向量集合进行向量bAi和向量bBi的哈希和Pailliar同态加密获得公私钥,并进行布隆过滤器的构造;根据相关向量计算两金融机构的集合交集和交集基数,得出双方名单。本发明基于0‑1编码、布隆过滤器和同态加密构成主要框架,使得集合以0、1进行特殊表示,增强了双方数据集的隐私性,在源头上解决了易泄露双方消息的问题。另外,本发明使用布隆过滤器和哈希后使用同态加密来对数据进行简单加解密,提升了双方信息交互后结果的隐私性,提高了协议效率,降低了通信开销和计算开销。
Description
技术领域
本发明属于隐私安全技术领域,尤其涉及一种隐私保护的名单查询方法、系统、介质、设备及终端。
背景技术
目前,在现有的法律体系下,为了满足对客户隐私保护的要求,金融机构只能基于自己所有的信息来进行检测分析,现有的各个金融机构的监测分析还是“孤岛式”的。且在金融领域中,数据流通与数据共享在实际业务开展过程中,发挥着极为重要的作用,其数据资产带来的商业核心价值在金融机构的业务中无可估量。但是,在近些年中由于数据泄露情况时有发生,数据安全保护问题也成为社会各个领域中研究的焦点。因此,对于信息的共享且不泄露客户信息的关注程度便大幅增加。在监测分析中,名单联合查询是最重要的部分,用各自的名单来分析高危用户的违规可能,这便大大降低了违法行为。
当下,对于金融机构联合风控是金融行业的一大现实需要。除了查询自有的风控信息以外,查询其他银行的风控信息是最直接有效的方式。此时,若直接将客户的私密信息交给其他的银行查询风险信息,一方面会造成用户的个人私密信息泄露;另一方面给竞争对手(其他银行)提供了潜在客源。这极大的阻碍了银联风控数据要素的流通共享和价值挖掘。PSI技术的特点同样完美的契合联合风控的需求。只有存在风险的客户的信息会被公布给其他银行,优质客户的信息不会有任何泄露。
一种隐私保护的名单查询所需最重要的技术--PSI技术。由于PSI技术是在保护参与方数据隐私性的前提下完成数据集的交集计算,且一般在计算结束后,参与方的一方或者多方只能得到双方或多方数据集的正确交集,而不会得到交集以外其他的参与方的任何消息。在金融机构联合查询名单场景下,具有很强的应用价值,能够在保护集合隐私不泄露、保持数据控制权的基础上,实现参与方数据之间的匹配,满足在查询时的需求。但是,现有的协议在面向新型场景中构建PSI时,通过PSI协议得到的交集元素仍然是敏感信息,尤其在金融机构等隐私性要求高的场景下。目前大部分的PSI方案都是复杂的密码学操作,例如基于不经意传输、混淆电路等,计算或通信开销随数据集大小呈线性增长。因此提高现有方案的效率也成了需要改善的一大问题。
目前,两方PSI问题是关于安全两方计算模型中最基础的一类问题。理论上所有的隐私计算问题都可以使用通用的安全计算协议来解决,但是这些通用的方案需要较高的计算和通讯代价。因此,对于具体的安全计算,需要使用专门的高效协议。
通过上述分析,现有技术存在的问题及缺陷为:
(1)现有的协议在面向新型场景中构建PSI时,通过PSI协议得到的交集元素仍然是敏感信息,尤其在金融机构等隐私性要求高的场景下。
(2)目前大部分的PSI方案都是复杂的密码学操作,例如基于不经意传输、混淆电路等,计算或通信开销随数据集大小呈线性增长。
(3)现有通用的安全计算方案需要较高的计算和通讯代价。
发明内容
针对现有技术存在的问题,本发明提供了一种隐私保护的名单查询方法、系统、介质、设备及终端,尤其涉及一种两方0-1编码的基于同态加密PSI技术的隐私保护的名单联合查询方法、系统、介质、设备及终端,旨在解决现有技术在对金融机构的信息进行联合查询的用户数据安全问题。
本发明是这样实现的,一种基于0-1编码的同态加密PSI隐私保护的名单查询方法,所述隐私保护的名单查询方法包括:
金融机构初始名单集合的向量表;将金融机构A、B的新向量集合进行向量bAi和向量bBi的哈希和Pailliar同态加密获得公私钥,并进行布隆过滤器的构造;根据相关向量计算两金融机构的集合交集和交集基数,得出双方名单。
进一步,所述隐私保护的名单查询方法包括以下步骤:
步骤一,初始设置阶段:将金融机构双方的名单集合用0-1编码表示成两个新向量;以此可以很好的将双方的初始名单集合基数进行隐藏,极大的提高了初始名单的安全性。
步骤二,设置交叉点:将向量经过Pailliar同态加密和哈希运算,以此将新向量映射为固定长度的消息并且可以用来判断消息是否被篡改,再构造布隆过滤器后使用同态加密进行两方数据交互,以便提供提供一种容量大并且双重保密性的数据处理方法。
步骤三,根据相关向量计算金融机构集合交集,以此可使用向量计算交集和交集基数,且只需要对交互计算后的bi个数进行统计达到降低了计算开销和通信开销的目的。
进一步,所述隐私保护的名单查询方法还包括场景搭建,具体包括:
设金融机构A,持有的需要查询联系人的名单集合PA;非金融机构B,持有的名单的联系人名单集合PB。
进一步,所述步骤二中的Pailliar同态加密和哈希运算包括:
(1)Pailliar同态加密:
1)密钥生成:KeyGen()→(pk,sk);
随机选取两个独立的大素数p和q,且满足gcd(pq,(p-1)(q-1))=1,计算 n=pq,=lcm(p-1,q-1),随机选取g∈Zn2*,则公钥pk=(n,g),私钥sk=()。
2)加密算法:En(pk,m)→c;
随机选择r∈Zn*计算密文c=gmrn(mod n2);
3)解密算法:Dec(sk,c)→c;
将PB编码后新形成的向量bB通过Pailliar加密生成公钥Pk和私钥sk;将 PA编码后形成的向量bA用k个哈希函数{h0,...,hk-1}对每个bAi进行运算后得:
对于0-1编码中,由于明文m只有两种情况分别为0和1,当Pailliar加密时对应的密文有:
(2)哈希运算:
哈希运算就是接受一个不限长度的输入返回一个固定长度的输出。当哈希运算是安全的时,需要满足确定性、快速计算能力、原像抗力、输入微小改动时哈希值会完全不同、碰e-iωt撞抗力、解谜性。
所述步骤二中的构造布隆过滤器包括:
(1)判断规则:通过多个Hash算法为数据算出多个在bitmap中的索引位置,并将多个索引位置的值的位置置为1;若判断一个数据是否存在,转换为是否多个索引位的值是否为1;如果均为1,则存在;如果有一个不为1,则不存在。
(2)定义布隆过滤器的参数:根据两机构A、B约定的容量n,错误率P;计算布隆过滤器的长度m和hash函数的个数k,其计算公式如下:
(3)构造布隆过滤器BFy=(BFy[0],...,BF[m-1]),再用Pailliar加密得到Ci=Enpky (BFy[i])。
进一步,所述步骤三中的计算集合交集包括:
(1)加法同态加密:若PKC方案(KeyGen,En,Dec)是加法同态的,那么对于任何明文(m1,m2)还有任何私钥对(sk,pk),均存在:
Enpk(m1+m2)=Enpk(m1)×Enpk(m2);
加法同态PKC方案具有乘法性质:
Enpk(a×b)=(Enpk(a))b;
设置:
进一步,所述隐私保护的名单查询方法还包括:
在初始处理数据时,双方名单是按照某一特定顺序排列的,视为全序集;当需查询双方已确定全序集后,处理各自名单上的信息,将名单上存在的赋予1,不存在的赋予0,最后双方的集合中均只含0和1。
使用哈希函数来表示集合并加密后交互,所述名单查询时一方采用哈希函数的步骤为:将处理好的数据集合通过哈希函数映射为固定长度的消息,利用哈希判断消息是否已经被更改。
使用布隆过滤器后使用Paillar加密消息;在计算过程中得到的ebAI,对此进行解密,故bi中1的个数则为名单上双方交集的基数。
本发明的另一目的在于提供一种应用所述的隐私保护的名单查询方法的隐私保护的名单查询系统,所述隐私保护的名单查询系统包括:
初始设置模块,用于将金融机构双方名单集合用0-1编码表示成两个新向量;
交叉点设置模块,用于将向量经过Pailliar同态加密和哈希运算,再构造布隆过滤器后使用同态加密进行两方数据交互;
集合交集计算模块,用于根据相关向量计算金融机构集合交集。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的隐私保护的名单查询方法的步骤。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述的隐私保护的名单查询方法的步骤。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的隐私保护的名单查询系统。
结合上述的技术方案和解决的技术问题,请从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为:
第一、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
本发明结合了0-1编码技术、同态加密技术的优点,运用哈希函数和布隆过滤器来实现双方数据的的插入和查询,运用双方数据交互后计算集合交集来进行名单查询,设计了适合于两方之间的基于隐私保护的名单查询方案。
本发明使用基于PSI技术实现名单联合查询功能。本发明是用隐私保护集合交集,使用0-1编码来进行初始集合表示,其目的是更好的隐藏用户双方的隐私基数。为了使协议达到高效,用布隆过滤器对编码进行表示并且使用同态加密。本发明中部分的复杂计算可以提前完成,有效的降低了协议效率,并且在双方的数据在交互时不泄露各自信息。
本发明属于两方之间的安全两方计算。对于金融机构数据隐私要求高,基于0-1编码来进行集合表示,具有很好的隐藏集合基数的功能,可以增强参与双方数据隐私性。此外,机构双方数据集大,在进行初期数据处理时,利用布隆过滤器和哈希的占用空间更少并且效率更高的特点,可以在大数据集时使用来减少占用空间,大大提高效率。
本发明基于0-1编码、布隆过滤器和同态加密构成主要框架,使得集合以0、 1进行特殊表示,增强了双方数据集的隐私性,在源头上解决了易泄露双方消息的问题。另外,本发明使用布隆过滤器和哈希后使用同态加密来对数据进行简单加解密,提高协议效率,降低了通信开销和计算开销。
本发明使用0-1编码进行哈希和布隆过滤器后交互,不同于其他方案,当对双方初始信息进行编码后继续使用哈希和布隆过滤器又二次加密,使得信息有双重隐私性,增强协议性能,并且在基于同态加密下不需要任何可信第三方的参与,因此也保证了在密钥保管上的安全。
第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:
本发明对集合的表示为0-1编码,基于pailliar同态加密和布隆过滤器,使用时具有计算集合交集和交集基数的功能,其目的在于提升双方信息交互后结果的隐私性,提高协议效率,降低了通信开销和计算开销。
第三,作为本发明的权利要求的创造性辅助证据,还体现在以下几个重要方面:
本发明的技术方案转化后的预期收益和商业价值为:使用基于0-1编码的同态加密PSI技术下两方共同查询名单,可保护隐私的集合交集运算中拥有秘密集合的双方的信息和交集结果,本方法不仅仅局限于金融机构双方查询名单,降低风险等级。而且结合区块链在此隐私计算新型技术下,每个节点都可以获取到区块链中所有交互信息,且部分节点的交互信息易被更改,因此将此协议运用至区块链的智能合约层,只需要将此协议部署在各机构的数据域内,根据业务请求实时进行加密计算,实时调用。在触发该协议时可以达到去中心化且保证两方的隐私性和公平性,且本发明中的协议运用至区块链中智能合约的运行通信开销和计算开销小,且便于后续的审查和监督。因此该协议不仅可以方便金融机构查找双方名单交集并且可以使用在两方身份认证和智能合约中,应用场景较广。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的隐私保护的名单查询方法流程图;
图2是本发明实施例提供的隐私保护的名单查询方法原理图;
图3是本发明实施例提供的布隆过滤器的数据结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种隐私保护的名单查询方法、系统、介质、设备及终端,下面结合附图对本发明作详细的描述。
一、解释说明实施例。为了使本领域技术人员充分了解本发明如何具体实现,该部分是对权利要求技术方案进行展开说明的解释说明实施例。
如图1所示,本发明实施例提供的隐私保护的名单查询方法包括以下步骤:
S101,初始设置阶段:将金融机构双方的名单集合用0-1编码表示成两个新向量;
S102,设置交叉点:将向量经过Pailliar同态加密和哈希运算,再构造布隆过滤器后使用同态加密进行两方数据交互;
S103,根据相关向量计算金融机构集合交集。
本发明实施例提供的金融机构联合查询名单中,场景搭建为:
有金融机构A,持有的需要查询联系人的名单集合PA。另一方为非金融机构(税务部门等)B,持有的名单的联系人名单集合PB。
本发明实施例提供的金融机构A、B的名单集合0-1编码方法中,假设参与双方分别有集合其中的U为全序集。当其中一方将其集合Si={s1,…,sn}编码为新的向量bi={b1,…,bn},其中若bi=1,则说明Si∈U;若bi=0,则说明
例如全集为U={赵,钱,孙,李,周},P1的集合S={赵,李},那么用0-1 编码形成的向量为b={1,0,0,1,0};
利用这种表达方式本发明可以很好的隐藏集合的长度,因为其中涉及到向量长度均为n。
本发明实施例提供的Pailliar同态加密和哈希运算包括:
1)Pailliar同态加密:
(1)密钥生成:KeyGen()→(pk,sk);
随机选取两个独立的大素数p和q,且满足gcd(pq,(p-1)(q-1))=1,计算 n=pq,=lcm(p-1,q-1),随机选取g∈Zn2*。此时公钥pk=(n,g),私钥sk=()。
(2)加密算法:En(pk,m)→c;
随机选择r∈Zn*计算密文c=gmrn(mod n2);
(3)解密算法:Dec(sk,c)→c;
将PB编码后新形成的向量bB通过Pailliar加密生成公钥Pk和私钥sk;再将PA编码后形成的向量bA用k个哈希函数{h0,...,hk-1}对每个bAi进行运算后得:
对于0-1编码中,由于明文m只有两种情况分别为0和1,因此当Pailliar加密时对应的密文就有:
2)哈希运算:
哈希运算就是接受一个不限长度的输入(input)返回一个固定长度的输出(output)。当哈希运算是安全的时,需要满足确定性、快速计算能力、原像抗力、输入微小改动时哈希值会完全不同、碰e-iωt撞抗力、解谜性。
本发明实施例提供的构造布隆过滤器指:
(1)布隆过滤器的概念以及原理是指:
1)首先布隆过滤器是一种由遗传很长的二进制向量组成的,可以将其看作成一个二进制数组。那么二进制就有0和1,但是初始的默认值都为0。专门用于判断某个元素是否存在于一个很大的集合。
2)其次判断规则:通过多个Hash算法,为数据算出多个在bitmap中的索引位置,并且将这多个索引位置的值的位置置为1。若想判断一个数据是否存在,也可看是否这多个索引位的值是否为1。如果都为1,那么存在。如果有一个不为1,就说明不存在。
3)先定义布隆过滤器的参数—根据两机构A、B约定的容量n,错误率p。计算布隆过滤器的长度m和hash函数的个数k:
(2)构造布隆过滤器BFy=(BFy[0],...,BF[m-1]),然后再用Pailliar加密得到Ci=Enpky(BFy[i])。
本发明实施例提供的布隆过滤器的数据结构示意图如图3所示。
本发明实施例提供的计算集合交集是指:
(1)加法同态加密:若PKC方案(KeyGen,En,Dec)是加法同态的,那么对于任何明文(m1,m2)还有任何私钥对(sk,pk),都存在:
Enpk(m1+m2)=Enpk(m1)×Enpk(m2);
加法同态PKC方案具有乘法性质:
Enpk(a×b)=(Enpk(a))b;
因此设置:
本发明实施例提供的特殊的集合表达方式--0-1编码,该0-1编码在处理数据时,所需注意的步骤:
在初始处理数据时,双方名单是按照某一特定顺序排列的,将此视为全序集;当需查询双方已确定全序集后,处理各自名单上的信息,将名单上存在的赋予1,不存在的赋予0;因此,最后双方的集合中均只含0和1。
本发明实施例提供的使用0-1编码后让数据安全性更高,使用哈希函数来表示集合并加密后交互,所述名单查询时一方采用哈希函数的步骤为:将处理好的数据集合通过哈希函数映射为固定长度的消息。并且哈希不能用于发现原始消息的内容或者其他特征,但是可以用来判断消息是否已经被更改。
本发明实施例提供了一种容量大、保密性高的数据处理方法,该数据处理方法为使用布隆过滤器后使用Paillar加密消息。
本发明实施例提供了一种计算集合交集基数的方法,该计算集合交集基数的方法为:在计算过程中得到的ebAI,对此进行解密,因此bi中1的个数则为名单上双方交集的基数。
本发明实施例提供的隐私保护的名单查询系统包括:
初始设置模块,用于将金融机构双方名单集合用0-1编码表示成两个新向量;
交叉点设置模块,用于将向量经过Pailliar同态加密和哈希运算,再构造布隆过滤器后使用同态加密进行两方数据交互;
集合交集计算模块,用于根据相关向量计算金融机构集合交集。
作为优选实施例,如图2所示,本发明实施例提供的隐私保护的名单查询方法,具体包括以下步骤:
在此之前,有金融机构A,持有的需要查询联系人的名单集合PA。另一方为非金融机构(税务部门等)B,持有的名单的联系人名单集合PB。
首先,为初始设置阶段,金融机构初始名单集合的向量表;
其次,为交叉点设置阶段,将金融机构A、B的新向量集合进行向量bAi和向量bBi的哈希和Pailliar同态加密获得公私钥,并且进行布隆过滤器的构造;
最后根据相关向量计算两金融机构的集合交集和交集基数,得出双方名单。
一、初始设置阶段
假设全集大小为n,初始向量设置过程如下:
1、全集U的表示:两金融机构需要根据规定排序得出一份大名单来作为本次查询的全集U,在这份大名单的基础上对双方共同有的失信或违法人员进行汇总后形成“名单”。利用这种表达方式我们可以很好的隐藏集合的长度,因为其中涉及到向量长度均为n。
2、向量表示:假设参与双方分别有集合其中的U为全序集。当其中一方将其集合Si={s1,…,sn}编码为新的向量bi={b1,…,bn},其中若bi=1,则说明Si∈U;若bi=0,则说明形成的仅有0和1的向量组,用此来表示金融机构的双方提供的名单。
二、交叉点设置阶段
该阶段通过对初始向量设置后的新0-1向量进行哈希运算和同态加密并且构造布隆过滤器,得到的向量进行交叉点设置。具体的步骤如下所述:
1、生成密钥:对B中的集合PB进行初始设置后形成的集合bBi,使用Pailliar加密生成公钥PK和私钥SK。该Pailliar同态加密具体密钥生成步骤如下:
(1)密钥生成:KeyGen()→(pk,sk);
随机选取两个独立的大素数p和q,且满足gcd(pq,(p-1)(q-1))=1,计算 n=pq,=lcm(p-1,q-1),随机选取g∈Zn2*。此时公钥pk=(n,g),私钥sk=()。
(2)加密算法:En(pk,m)→c;
随机选择r∈Zn*计算密文c=gmrn(mod n2);
(3)解密算法:Dec(sk,c)→c;
2、构造BLOOMFILTER后加密:对于集合bBi构造布隆过滤器,对于哈希函数的个数同样需要权衡,当哈希函数的个数越多时,布隆过滤器bit位的1速度就越快,且布隆过滤器的效率就越低,但是如果太少的话,误报率就会变高。因此在选择合适的k和m值(k为哈希函数个数,m为布隆过滤器长度)时需满足:
且k次哈希函数某一bit位未被置为1的概率为:但是在标明某元素是否在集合中所需的k个位置都按照此方法设置为1时,该方法可能会使算法错误的认为某一原本不在集合中的元素却被检测为在该集合中,那么这个错误的概率有以下的公式:
对以上进行计算后,构造的布隆过滤器记作BFy[i]。对BFy[i]用以上所述公钥pk进行加密得到Ci,Ci满足:
Ci=Enpky(BFy[i]);
2、构造哈希函数:对集合bAi构造k个哈希函数进行运算。过程如下:
bAi={bA1,...,bAn}→{h0(bAi),...,hk-1(bAi)};
3、使用B计算后得到的Ci和其公钥pk发送给A,A在其中提取Ci*,满足以下:
Ci*={Ch0(bAi),...,Chk-1(bAi)};
4、当A得到Ci*后,对Ci*进行如下运算得到所需ebAi:
ebAi=(C*i)bAiEnpkB(0);
以下证明此公式:
A得到ebAi后,将(e1,...,en)发送给B;
5、B收到(e1,...,en)后,使用私钥sk对ei进行解密得到:
bi=Decsk(ei)。
三、计算交集基数和交集
下面结合安全性分析对本发明的应用效果作出详细的描述。
本发明中处理两方初始值时分别构造哈希函数和布隆过滤器,用此方法将数据存储于其中再进行以后的交互。由于此种方法使得双方大大提高了协议的效率和安全性,且在初始的数据处理中加密过程可以进行离线处理或者预处理,可以大大的提升该协议的计算开销,降低了交互时所用时间。并且从最后的结果可以不仅的出交集的名单部分还可得到联合名单中的人数,也就是集合交集基数。
二、应用实施例。在隐私计算下主要应用于风控和营销两个领域。首先,在风控环节,隐私计算可以帮助金融机构将自身和外部数据联合起来进行分析,从而有效的识别信用等级,降低多头信贷、欺诈等风险,有助于信贷以及保险等金融产品的精准定价;而且在多方数据的共享融合,有助于提高金融机构的甄别能力。其次,在营销环节,通过应用本发明中隐私计算技术可以利用更多维度的数据为客户做更准确的画像,从而提升精准营销的效果。因此,目前银行等金融机构也更有动力投入更多预算来应用更加计算与通信开销小且保密性高的隐私计算技术。并且在隐私计算被人熟知后,将隐私计算与区块链技术结合后,可改变更多金融下的场景,例如跨境支付、供应链金融等。
使用在为了证明本发明的技术方案的创造性和技术价值,该部分是对权利要求技术方案进行具体产品上或相关技术上的应用实施例。
三、本发明中是使用的方法基于0-1编码的同态加密PSI。由于现实情况下 PSI协议通常都需要在很大规模的集合上进行操作,因此本发明在发明过程中对之前PSI技术一系列进行优化。首先,对内存占用情况进行分析并优化。对比大集合上进行密码学原语的操作会耗费大量内存。处于这种原因,很多PSI协议若不优化会很快消耗掉所有的内存。例如基于电路的PSI会占用大量的内存空间。因此在本发明中基于Hash函数使用公钥不会占用大量的内存,这是因为它们每次只对一个元素进行处理,并且很容易做到流水线操作,因此在标准的个人电脑上也可以在百万级别的集合上运行这类的协议。其次,在PSI协议的性能在计算过程中出现时,通过将并行计算来加速计算过程也就成为了一种切实可行的加速手段。例如基于不经意传输扩展协议的PSI中若使用了布隆过滤器的方案,需要提前生成布隆过滤器,这一步是不能很好的并行化的。或者说当在使用布谷鸟哈希时,并行化也就出现瓶颈,在实际的应用场景下这一开销就较大了。本发明中为解决此类问题使用基于同态加密和0-1编码后可使用并行计算,因为元素的处理是相互独立的。最后考虑到通信开销,由于使用基于电路的PSI需要生成大量的电路门、基于OT协议的PSI运行时间较长。因此选择基于公钥加密体系的PSI,主要优势就是它拥有最低的通信复杂度,且使用0-1 编码将数据进行遮盖,协议较简洁,易于实现。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种隐私保护的名单查询方法,其特征在于,所述隐私保护的名单查询方法包括:
金融机构初始名单集合的向量表;将金融机构A、B的新向量集合进行向量bAi和向量bBi的哈希和Pailliar同态加密获得公私钥,并进行布隆过滤器的构造;根据相关向量计算两金融机构的集合交集和交集基数,得出双方名单。
2.如权利要求1所述隐私保护的名单查询方法,其特征在于,所述隐私保护的名单查询方法包括以下步骤:
步骤一,初始设置阶段:将金融机构双方的名单集合用0-1编码表示成两个新向量;
步骤二,设置交叉点:将向量经过Pailliar同态加密和哈希运算,再构造布隆过滤器后使用同态加密进行两方数据交互;
步骤三,根据相关向量计算金融机构集合交集。
4.如权利要求2所述隐私保护的名单查询方法,其特征在于,所述步骤二中的Pailliar同态加密和哈希运算包括:
(1)Pailliar同态加密:
1)密钥生成:KeyGen()→(pk,sk);
随机选取两个独立的大素数p和q,且满足gcd(pq,(p-1)(q-1))=1,计算n=pq,=lcm(p-1,q-1),随机选取g∈Zn2*,则公钥pk=(n,g),私钥sk=();
2)加密算法:En(pk,m)→c;
随机选择r∈Zn*计算密文c=gmrn(modn2);
3)解密算法:Dec(sk,c)→c;
将PB编码后新形成的向量bB通过Pailliar加密生成公钥Pk和私钥sk;将PA编码后形成的向量bA用k个哈希函数{h0,...,hk-1}对每个bAi进行运算后得:
对于0-1编码中,由于明文m只有两种情况分别为0和1,当Pailliar加密时对应的密文有:
(2)哈希运算:
哈希运算就是接受一个不限长度的输入返回一个固定长度的输出;当哈希运算是安全的时,需要满足确定性、快速计算能力、原像抗力、输入微小改动时哈希值会完全不同、碰e-iωt撞抗力、解谜性;
所述步骤二中的构造布隆过滤器包括:
(1)判断规则:通过多个Hash算法为数据算出多个在bitmap中的索引位置,并将多个索引位置的值的位置置为1;若判断一个数据是否存在,转换为是否多个索引位的值是否为1;如果均为1,则存在;如果有一个不为1,则不存在;
(2)定义布隆过滤器的参数:根据两机构A、B约定的容量n,错误率p;计算布隆过滤器的长度m和hash函数的个数k:
(3)构造布隆过滤器BFy=(BFy[0],...,BF[m-1]),再用Pailliar加密得到Ci=Enpky(BFy[i])。
6.如权利要求2所述隐私保护的名单查询方法,其特征在于,所述隐私保护的名单查询方法还包括:
在初始处理数据时,双方名单是按照某一特定顺序排列的,视为全序集;当需查询双方已确定全序集后,处理各自名单上的信息,将名单上存在的赋予1,不存在的赋予0,最后双方的集合中均只含0和1;
使用哈希函数来表示集合并加密后交互,所述名单查询时一方采用哈希函数的步骤为:将处理好的数据集合通过哈希函数映射为固定长度的消息,利用哈希判断消息是否已经被更改;
使用布隆过滤器后使用Paillar加密消息;在计算过程中得到的ebAI,对此进行解密,故bi中1的个数则为名单上双方交集的基数。
7.一种应用如权利要求1~6任意一项所述隐私保护的名单查询方法的隐私保护的名单查询系统,其特征在于,所述隐私保护的名单查询系统包括:
初始设置模块,用于将金融机构双方名单集合用0-1编码表示成两个新向量;
交叉点设置模块,用于将向量经过Pailliar同态加密和哈希运算,再构造布隆过滤器后使用同态加密进行两方数据交互;
集合交集计算模块,用于根据相关向量计算金融机构集合交集。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1~6任意一项所述隐私保护的名单查询方法的步骤。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1~6任意一项所述隐私保护的名单查询方法的步骤。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求7所述隐私保护的名单查询系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210870854.XA CN115396148B (zh) | 2022-07-22 | 2022-07-22 | 隐私保护的名单查询方法、系统、介质、设备及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210870854.XA CN115396148B (zh) | 2022-07-22 | 2022-07-22 | 隐私保护的名单查询方法、系统、介质、设备及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115396148A true CN115396148A (zh) | 2022-11-25 |
CN115396148B CN115396148B (zh) | 2024-04-12 |
Family
ID=84116341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210870854.XA Active CN115396148B (zh) | 2022-07-22 | 2022-07-22 | 隐私保护的名单查询方法、系统、介质、设备及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115396148B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130010950A1 (en) * | 2011-07-08 | 2013-01-10 | Sap Ag | Public-Key Encrypted Bloom Filters With Applications To Private Set Intersection |
CN110719159A (zh) * | 2019-09-24 | 2020-01-21 | 河南师范大学 | 抗恶意敌手的多方隐私集合交集方法 |
CN111125736A (zh) * | 2019-12-25 | 2020-05-08 | 暨南大学 | 基于隐私保护交集计算协议的致病基因检测方法 |
CN111641603A (zh) * | 2020-05-15 | 2020-09-08 | 北京青牛技术股份有限公司 | 基于同态加密的隐私集合交集数据交互方法和系统 |
CN112367305A (zh) * | 2020-10-22 | 2021-02-12 | 香港中文大学(深圳) | 一种基于隐私区块链的车联网保护方法和移动终端 |
CN113157778A (zh) * | 2021-06-09 | 2021-07-23 | 富算科技(上海)有限公司 | 分布式数据仓库的可代理查询方法、系统、设备及介质 |
CN113518092A (zh) * | 2021-07-22 | 2021-10-19 | 西安电子科技大学 | 实现多方隐私的集合交集方法 |
CN114239031A (zh) * | 2021-12-21 | 2022-03-25 | 深圳市中悦科技有限公司 | 一种用户隐私数据的处理方法及处理装置 |
CN114444124A (zh) * | 2022-01-28 | 2022-05-06 | 杭州复杂美科技有限公司 | 基于布隆过滤器的隐私集合交集方法、设备及存储介质 |
-
2022
- 2022-07-22 CN CN202210870854.XA patent/CN115396148B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130010950A1 (en) * | 2011-07-08 | 2013-01-10 | Sap Ag | Public-Key Encrypted Bloom Filters With Applications To Private Set Intersection |
CN110719159A (zh) * | 2019-09-24 | 2020-01-21 | 河南师范大学 | 抗恶意敌手的多方隐私集合交集方法 |
CN111125736A (zh) * | 2019-12-25 | 2020-05-08 | 暨南大学 | 基于隐私保护交集计算协议的致病基因检测方法 |
CN111641603A (zh) * | 2020-05-15 | 2020-09-08 | 北京青牛技术股份有限公司 | 基于同态加密的隐私集合交集数据交互方法和系统 |
CN112367305A (zh) * | 2020-10-22 | 2021-02-12 | 香港中文大学(深圳) | 一种基于隐私区块链的车联网保护方法和移动终端 |
WO2022082893A1 (zh) * | 2020-10-22 | 2022-04-28 | 香港中文大学(深圳) | 一种基于隐私区块链的车联网保护方法和移动终端 |
CN113157778A (zh) * | 2021-06-09 | 2021-07-23 | 富算科技(上海)有限公司 | 分布式数据仓库的可代理查询方法、系统、设备及介质 |
CN113518092A (zh) * | 2021-07-22 | 2021-10-19 | 西安电子科技大学 | 实现多方隐私的集合交集方法 |
CN114239031A (zh) * | 2021-12-21 | 2022-03-25 | 深圳市中悦科技有限公司 | 一种用户隐私数据的处理方法及处理装置 |
CN114444124A (zh) * | 2022-01-28 | 2022-05-06 | 杭州复杂美科技有限公司 | 基于布隆过滤器的隐私集合交集方法、设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
MIHAELA ION; BEN KREUTER; AHMET ERHAN NERGIZ; SARVAR PATEL; SHOBHIT SAXENA; KARN SETH; MARIANA RAYKOVA; DAVID: "On Deploying Secure Computing: Private Intersection-Sum-with-Cardinality", 《2020 IEEE EUROPEAN SYMPOSIUM ON SECURITY AND PRIVACY (EUROS&P)》, 2 November 2020 (2020-11-02), pages 370 - 389 * |
ZHAOMAN LIU; LEI WU; WEIZHI MENG; HAO WANG; WEI WANG: "Accurate range query with privacy preservation for outsourced location-based service in IOT", <IEEE INTERNET OF THINGS JOURNAL>, vol. 8, no. 18, 24 March 2021 (2021-03-24), pages 14322, XP011877298, DOI: 10.1109/JIOT.2021.3068566 * |
程楠;赵运磊: "一种高效的关于两方集合并/交集基数的隐私计算方法", 《密码学报》, 15 April 2021 (2021-04-15), pages 352 - 364 * |
赖成喆;赵益宁;郑东: "基于同态加密的隐私保护与可验证联邦学习方案", 《信息网络安全》, 10 January 2024 (2024-01-10), pages 93 - 105 * |
Also Published As
Publication number | Publication date |
---|---|
CN115396148B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhao et al. | Secure multi-party computation: theory, practice and applications | |
CN111008836B (zh) | 一种隐私安全转账支付方法、装置、系统及存储介质 | |
US9774578B1 (en) | Distributed key secret for rewritable blockchain | |
CN107113179B (zh) | 用于通信验证的方法、系统及非瞬时计算机可读存储介质 | |
CN110971390A (zh) | 一种用于智能合约隐私保护的全同态加密方法 | |
CN108989047A (zh) | 一种基于sm2算法的通信双方协同签名方法与系统 | |
Abid et al. | RETRACTED ARTICLE: An optimised homomorphic CRT-RSA algorithm for secure and efficient communication | |
US20220303114A9 (en) | Format-preserving encryption method based on stream cipher | |
CN110719159A (zh) | 抗恶意敌手的多方隐私集合交集方法 | |
CN112380578A (zh) | 一种基于区块链和可信执行环境的边缘计算框架 | |
US20220374544A1 (en) | Secure aggregation of information using federated learning | |
CN112073196B (zh) | 业务数据处理方法、装置、电子设备及存储介质 | |
CN115242371B (zh) | 差分隐私保护的集合交集及其基数计算方法、装置及系统 | |
Alharbi et al. | Survey on homomorphic encryption and address of new trend | |
Agrawal et al. | Game-set-MATCH: Using mobile devices for seamless external-facing biometric matching | |
Sun et al. | [Retracted] Face Security Authentication System Based on Deep Learning and Homomorphic Encryption | |
Nita et al. | Homomorphic encryption | |
CN117675270A (zh) | 面向纵向联邦学习的多模态数据加密传输方法及系统 | |
CN116915383A (zh) | 不经意键值存储编解码方法、系统、装置和介质 | |
WO2023093278A1 (zh) | 数字签名门限方法和装置 | |
CN115599959A (zh) | 数据共享方法、装置、设备及存储介质 | |
CN115396148B (zh) | 隐私保护的名单查询方法、系统、介质、设备及终端 | |
Mahmood et al. | A survey on privacy and policy aspects of blockchain technology | |
Gupta | Quantum and blockchain for computing paradigms vision and advancements | |
Rao | Paras-A Private NFT Protocol |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |