CN113489583A - 一种多方隐私求交中的数据处理方法、装置及电子设备 - Google Patents

一种多方隐私求交中的数据处理方法、装置及电子设备 Download PDF

Info

Publication number
CN113489583A
CN113489583A CN202111042975.7A CN202111042975A CN113489583A CN 113489583 A CN113489583 A CN 113489583A CN 202111042975 A CN202111042975 A CN 202111042975A CN 113489583 A CN113489583 A CN 113489583A
Authority
CN
China
Prior art keywords
result
opprf
processed
data
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111042975.7A
Other languages
English (en)
Other versions
CN113489583B (zh
Inventor
徐葳
贾晓丰
李浥东
黄熹之
李艺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huakong Tsingjiao Information Technology Beijing Co Ltd
Original Assignee
Huakong Tsingjiao Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huakong Tsingjiao Information Technology Beijing Co Ltd filed Critical Huakong Tsingjiao Information Technology Beijing Co Ltd
Priority to CN202111042975.7A priority Critical patent/CN113489583B/zh
Publication of CN113489583A publication Critical patent/CN113489583A/zh
Application granted granted Critical
Publication of CN113489583B publication Critical patent/CN113489583B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/06Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols the encryption apparatus using shift registers or memories for block-wise or stream coding, e.g. DES systems or RC4; Hash functions; Pseudorandom sequence generators
    • H04L9/065Encryption by serially and continuously modifying data stream elements, e.g. stream cipher systems, RC4, SEAL or A5/3
    • H04L9/0656Pseudorandom key sequence combined element-for-element with data sequence, e.g. one-time-pad [OTP] or Vernam's cipher
    • H04L9/0662Pseudorandom key sequence combined element-for-element with data sequence, e.g. one-time-pad [OTP] or Vernam's cipher with particular pseudorandom sequence generator
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2209/00Additional information or applications relating to cryptographic mechanisms or cryptographic arrangements for secret or secure communication H04L9/00
    • H04L2209/46Secure multiparty computation, e.g. millionaire problem

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种多方隐私求交中的数据处理方法,应用于接收方设备,该接收方设备具有的m条关键词被采用布谷鸟哈希映射到大小为L的哈希表中,包括:接收发送方设备针对m条关键词发送的L组计算数据;使用L组计算数据中的m组计算数据,分别对应哈希表中的每条关键词,计算该条关键词对应的OPPRF结果;针对m个OPPRF结果中的每个OPPRF结果,将该OPPRF结果所对应的关键词的序号作为包头,与该OPPRF结果合并为处理后结果;将得到的m个处理后结果按照包头进行排序,并按照顺序存储到结果文件中;从结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。采用本方案,提高了多方隐私求交的效率。

Description

一种多方隐私求交中的数据处理方法、装置及电子设备
技术领域
本申请涉及隐私计算技术领域,尤其涉及一种多方隐私求交中的数据处理方法、装置及电子设备。
背景技术
多方隐私求交(Multi-Party Private Set Intersection,M-PSI),是指多个参与方各自均拥有一个数据集合,多方之间通过交互求得所有数据集合的交集,并由其中一个参与方获得,且每一个参与方均无法获知其他参与方的数据集合中的数据。
例如,一个客户端和多个服务端各有一个数据集合,该客户端和该多个服务端之间,想求所有端的多个数据集合的交集,最后交集结果由客户端获得。在协议的执行中,每个服务端均无法推导得出其他任何参与方的集合数据信息,且客户端仅能够得到该多方的多个数据集合的交集结果,无法得知任何服务端数据集合中有关交集结果以外的任何信息。当仅有1个服务端的时候,多方隐私求交即为普通的隐私求交(Private SetIntersection,PSI)场景。
目前,在多方隐私求交技术中,可以基于OPPRF(不经意的可编程伪随机函数,Oblivious Programmable Pseudo-Random Function)协议完成,并且,在多方隐私求交的计算过程中,多个参与方中,每两个参与方之间均需要调用OPPRF协议。
在每一次OPPRF协议的实现过程中,其中一个参与方作为接收方设备,另一个参与方作为发送方设备,接收方设备具有多条关键词,并将该多条关键词采用布谷鸟哈希映射到一个大小为L的哈希表中,并接收发送方设备发送的L组用于计算OPPRF结果的数据,依次使用接收的每组数据,针对哈希表中对应位置存储的关键词,计算出OPPRF结果,并将计算出的OPRRF结果与本地存储的与关键词对应的伪随机数进行融合。
在上述OPPRF协议的实现过程中,在将多条关键词映射到哈希表中之后,该多条关键词所位于哈希表中的位置是随机的,不再是按照原有顺序排列的,从而使得所计算出的与多条关键词一一对应的多个OPPRF结果,也不再是按照关键词的原有顺序排列的,所以,在需要按照多条关键词的原有顺序,获取一条关键词对应的OPPRF结果,与本地存储的与该条关键词对应的伪随机数融合时,则需要从顺序混乱的多个OPPRF结果中,获取该条关键词对应的OPPRF结果。
并且,在实际应用中,接收方设备具有的多条关键词的数量往往非常大,可能是上百万级别的数量,相应的,所接收到的L组用于计算OPPRF结果的数据的数据量也非常大,计算得到的多个OPPRF结果的数据量也非常大,可能达到几GB的数据量,这些OPPRF结果无法全部存储在内存中,则只能存储在外部存储器的文件中,所以,每次获取OPPRF结果,是从外部存储器的文件中获取,由于数据量非常大,进而使得从包含顺序混乱的多个OPPRF结果的文件中,获取指定OPPRF结果所需要花费的时间较长,效率较低,进而导致多方隐私求交的效率较低。
发明内容
本申请实施例提供一种多方隐私求交中的数据处理方法、装置及电子设备,用以解决现有技术中存在的多方隐私求交的效率较低的问题。
本申请实施例提供一种多方隐私求交中的数据处理方法,应用于接收方设备,所述接收方设备具有多条关键词,所述多条关键词的数量为m,m条关键词被采用布谷鸟哈希映射到大小为L的哈希表中,L不小于m,包括:
接收发送方设备针对m条关键词发送的L组计算数据,所述计算数据用于计算OPPRF结果;
使用所述L组计算数据中的m组计算数据,分别对应所述哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,得到m个OPPRF结果;
针对m个OPPRF结果中的每个OPPRF结果,将该OPPRF结果所对应的关键词的序号作为包头,与该OPPRF结果合并为处理后结果,所述处理后结果中包头位于前部分;
将得到的m个所述处理后结果按照包头进行排序,并按照顺序存储到结果文件中;
从所述结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。
进一步的,所述使用所述L组计算数据中的m组计算数据,分别对应所述哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,包括:
按照顺序获取所述L组计算数据中的每组计算数据;
当所述哈希表中与该组计算数据对应的位置存储有关键词时,使用该组计算数据计算该条关键词对应的OPPRF结果;
当所述哈希表中与该组计算数据对应的位置未存储有关键词时,取消使用该组计算数据计算OPPRF结果。
进一步的,所述将得到的m个所述处理后结果按照包头进行排序,并按照顺序存储到结果文件中,包括:
将得到的m个所述处理后结果划分为v组,分别存储到v个中间文件中,每个所述中间文件的数据量小于内存的可用空间;
分别针对每个所述中间文件,在内存中对该中间文件包含的多个所述处理后结果按照包头进行排序,得到v个排序后中间文件;
对所述v个排序后中间文件包含的m个所述处理后结果按照包头进行排序,得到一个结果文件,所述结果文件中包含按照顺序存储的m个所述处理后结果。
进一步的,所述对所述v个排序后中间文件包含的m个所述处理后结果按照包头进行排序,得到一个结果文件,包括:
采用败者树的多路并归算法,对所述v个排序后中间文件包含的m个所述处理后结果按照包头进行排序,得到一个结果文件。
进一步的,采用如下公式计算v:
Figure 781229DEST_PATH_IMAGE001
Figure 679915DEST_PATH_IMAGE002
其中,memory_limit表示内存的可用空间,opprf_size表示一个所述处理后结果的数据量,[*]表示对*取整,U表示每个中间文件所包含的处理后结果的数量。
进一步的,L大于m且小于2m。
本申请实施例还提供一种多方隐私求交中的数据处理装置,应用于接收方设备,所述接收方设备具有多条关键词,所述多条关键词的数量为m,m条关键词被采用布谷鸟哈希映射到大小为L的哈希表中,L不小于m,包括:
数据接收模块,用于接收发送方设备针对m条关键词发送的L组计算数据,所述计算数据用于计算OPPRF结果;
结果计算模块,用于使用所述L组计算数据中的m组计算数据,分别对应所述哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,得到m个OPPRF结果;
结果合并模块,用于针对m个OPPRF结果中的每个OPPRF结果,将该OPPRF结果所对应的关键词的序号作为包头,与该OPPRF结果合并为处理后结果,所述处理后结果中包头位于前部分;
结果排序模块,用于将得到的m个所述处理后结果按照包头进行排序,并按照顺序存储到结果文件中;
数据融合模块,用于从所述结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。
进一步的,所述结果计算模块,具体用于按照顺序获取所述L组计算数据中的每组计算数据;当所述哈希表中与该组计算数据对应的位置存储有关键词时,使用该组计算数据计算该条关键词对应的OPPRF结果;当所述哈希表中与该组计算数据对应的位置未存储有关键词时,取消使用该组计算数据计算OPPRF结果。
进一步的,所述结果排序模块,具体用于将得到的m个所述处理后结果划分为v组,分别存储到v个中间文件中,每个所述中间文件的数据量小于内存的可用空间;分别针对每个所述中间文件,在内存中对该中间文件包含的多个所述处理后结果按照包头进行排序,得到v个排序后中间文件;对所述v个排序后中间文件包含的m个所述处理后结果按照包头进行排序,得到一个结果文件,所述结果文件中包含按照顺序存储的m个所述处理后结果。
进一步的,所述结果排序模块,具体用于采用败者树的多路并归算法,对所述v个排序后中间文件包含的m个所述处理后结果按照包头进行排序,得到一个结果文件。
进一步的,采用如下公式计算v:
Figure 328065DEST_PATH_IMAGE001
Figure 399926DEST_PATH_IMAGE002
其中,memory_limit表示内存的可用空间,opprf_size表示一个所述处理后结果的数据量,[*]表示对*取整,U表示每个中间文件所包含的处理后结果的数量。
进一步的,L大于m且小于2m。
本申请实施例还提供一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现上述任一多方隐私求交中的数据处理方法。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一多方隐私求交中的数据处理方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一多方隐私求交中的数据处理方法。
本申请有益效果包括:
本申请实施例提供的方法中,在使用发送方设备发送的m组计算数据,分别对应哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,得到m个OPPRF结果后,针对m个OPPRF结果中的每个OPPRF结果,将该OPPRF结果所对应的关键词的序号作为包头,与该OPPRF结果合并为处理后结果,且处理后结果中包头位于前部分,然后,将得到的m个处理后结果按照包头进行排序,并按照顺序存储到结果文件中,此时,由于按照包头进行排序相当于是按照关键词的序号进行排序,所以,结果文件中m个处理后结果的排列顺序,与m条关键词的原有顺序相同,进而可以从结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。相比现有技术中从顺序混乱的OPPRF结果中获取指定的OPPRF结果,减少了所花费的时间,进而提高了多方隐私求交的效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中:
图1为本申请实施例提供的多方隐私求交中的数据处理方法的流程图;
图2为本申请另一实施例提供的多方隐私求交中的数据处理方法的流程图;
图3为本申请实施例提供的多方隐私求交中的数据处理装置的结构示意图;
图4为本申请实施例提供的电子设备的结构示意图。
具体实施方式
为了给出提高多方隐私求交的效率的实现方案,本申请实施例提供了一种多方隐私求交中的数据处理方法、装置及电子设备,以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本申请实施例提供一种多方隐私求交中的数据处理方法,应用于接收方设备,该接收方设备具有多条关键词,该多条关键词的数量为m,m条关键词被采用布谷鸟哈希映射到大小为L的哈希表中,L不小于m,如图1所示,包括:
步骤11、接收发送方设备针对m条关键词发送的L组计算数据,计算数据用于计算OPPRF结果。
步骤12、使用L组计算数据中的m组计算数据,分别对应哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,得到m个OPPRF结果。
步骤13、针对m个OPPRF结果中的每个OPPRF结果,将该OPPRF结果所对应的关键词的序号作为包头,与该OPPRF结果合并为处理后结果,处理后结果中包头位于前部分。
步骤14、将得到的m个处理后结果按照包头进行排序,并按照顺序存储到结果文件中。
步骤15、从结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。
采用本申请实施例提供的上述多方隐私求交中的数据处理方法,由于按照处理后结果的包头进行排序,相当于是按照关键词的序号进行排序,所以,结果文件中m个处理后结果的排列顺序,与m条关键词的原有顺序相同,进而可以从结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。相比现有技术中从顺序混乱的OPPRF结果中获取指定的OPPRF结果,减少了所花费的时间,进而提高了多方隐私求交的效率。
并且,在实际应用中,由于OPPRF协议实现过程中,需要存储和处理的数据量非常大,所以,从得到的全部OPPRF结果中读取指定OPPRF结果所花费的时间,在OPPRF协议实现所花费的时间中的占比很大,因此,本申请中对处理后结果进行排序的时间,远远小于现有技术中从顺序混乱的OPPRF结果中获取指定的OPPRF结果所花费的时间,也就是说,相比现有技术,采用本申请实施例提供的上述方法,能够明显提高多方隐私求交的效率。
下面结合附图,用具体实施例对本申请提供的方法及装置进行详细描述。
本申请实施例提供一种多方隐私求交中的数据处理方法,如图2所示,具体可以包括如下步骤:
步骤21、接收方设备针对具有的m条关键词,采用布谷鸟哈希,将m条关键词映射到大小为L的哈希表中,其中,L不小于m。
L可以表示哈希表中用于存储关键词的位置的数量,一个位置存储一条关键词。
进一步的,在实际应用中,L取值越大,布谷鸟哈希成功概率越大,相应的,L取值越大,后续的计算量也越大,因此,L可以大于m,且小于2m。
当L大于m时,在将m条关键词映射到大小为L的哈希表中之后,m条关键词在哈希表中的存储位置是随机的,也就是说,m条关键词在哈希表中的存储顺序,不再是原有顺序,哈希表中有一些位置是未存储关键词的。
步骤22、发送方设备向接收方设备发送L组计算数据,该计算数据用于计算OPPRF结果。
本申请实施例中,L组计算数据的生成,可以采用可实施的各种OPPRF协议实现方法中的生成方式,在此不做限定。
步骤23、接收方设备在接收到L组计算数据之后,使用L组计算数据中的m组计算数据,分别对应哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,得到m个OPPRF结果。
本申请实施例中,L组计算数据与哈希表的L个位置,是一一对应的,每组计算数据,用于针对其在哈希表所对应位置存储的关键词,计算OPPRF结果,由于哈希表中一些位置没有存储关键词,则针对该位置计算OPPRF结果没有实际意义,所以,可以仅使用与存储有关键词的位置对应的每组计算数据,计算OPPRF结果。
本申请实施例中,在接收到L组计算数据之后,可以将这L组计算数据,对应哈希表的L个位置,顺序存储,并在需要计算OPPRF结果时,按照顺序获取L组计算数据中的每组计算数据,当哈希表中与该组计算数据对应的位置存储有关键词时,使用该组计算数据计算该条关键词对应的OPPRF结果,当哈希表中与该组计算数据对应的位置未存储有关键词时,取消使用该组计算数据计算OPPRF结果,按顺序读取下一组计算数据,开启下一组计算数据的计算。
假设关键词x(ki)经过布谷鸟哈希后,映射到哈希表中的位置是T(ki),其中,ki表示关键x(ki)的序号,1≤ki≤m,1≤T(ki)≤L。
相应的,与T(ki)对应的OPPRF结果表示为PRF(T(ki)),则m个OPPRF结果分别表示为PRF(T(k1)),PRF(T(k2)),…,PRF(T(km)),其中,1≤T(k1)<T(k2)<…<T(km)≤L,其中,k1,k2,…,km分别表示m个关键词的序号,但并非是按照从小到大顺序排列的,因为,在将m个关键词映射到哈希表中时,由于映射位置随机,因此排列顺序已经不再是原有顺序,也就是说存储在T(k1)位置的关键词,有可能是m个关键词中的任意一个,也可以理解为,关键词x(k1),x(k2),…,x(km)的排列顺序,是在哈希表中的排列顺序,而并非是m个关键词的原有顺序。
步骤24、接收方设备针对m个OPPRF结果中的每个OPPRF结果,将该OPPRF结果所对应的关键词的序号作为包头,与该OPPRF结果合并为处理后结果,处理后结果中包头位于前部分。
本申请实施例中,将关键词的序号作为包头与OPPRF结果合并,可以采用字符串连接的合并方式。
因此,顺序排列的m个OPPRF结果PRF(T(k1)),PRF(T(k2)),…,PRF(T(km)),与顺序排列的m个序号k1,k2,…,km一一对应,相应的,和后的处理后结果可以表示为k1|PRF(T(k1)),k2|PRF(T(k2)),…,km|PRF(T(km)),其中,“|”表示字符串连接。
步骤25、接收方设备将得到的m个处理后结果划分为v组,分别存储到v个中间文件中,每个中间文件的数据量小于内存的可用空间。
本申请实施例中,可以采用如下公式计算v:
Figure 449922DEST_PATH_IMAGE001
Figure 457192DEST_PATH_IMAGE002
其中,memory_limit表示内存的可用空间,opprf_size表示一个处理后结果的数据量,[*]表示对*取整,U表示每个中间文件所包含的处理后结果的数量。
相应的,在划分时,可以先按照顺序每次获取U个处理后结果,存储到一个中间文件中,最后剩余的不足U个处理后结果,存储到最后一个中间文件中。
由于在每个中间文件中尽可能多的存储处理后结果,使得每次可以在内存中对更多的处理后结果进行排序时,从而进一步的减少了所花费的时间,进一步的提高了效率。
步骤26、接收方设备分别针对每个中间文件,在内存中对该中间文件包含的多个处理后结果按照包头进行排序,得到v个排序后中间文件。
本申请实施例中,针对每个中间文件,可以按照外部排序算法,对该中间文件包含的多个处理后结果按照包头进行排序,由于每个中间文件的数据量小于内存的可用空间,因此,可以在内存中实现快速排序。
步骤27、接收方设备对该v个排序后中间文件包含的m个处理后结果按照包头进行排序,得到一个结果文件,结果文件中包含按照顺序存储的m个处理后结果。
本步骤中,也可以采用外部排序算法进行排序,进一步的,可以采用败者树的多路并归算法,对v个排序后中间文件包含的m个处理后结果按照包头进行排序,得到一个结果文件。
在该结果文件中,m个处理后结果的排列顺序是按照包头排序的,而包头是关键词的序号,所以,也就是按照序号进行排序的,即相当于按照关键词的原有顺序进行排序的。
基于上述举例,在对m个处理后结果k1|PRF(T(k1)),k2|PRF(T(k2)),…,km|PRF(T(km)),按照包头进行排序后,顺序表更为1|PRF(T(1)),2|PRF(T(2)),…,m|PRF(T(m)),也就是关键词的原有顺序。
步骤28、接收方设备从结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。
本申请实施例中,OPPRF结果对应的本地伪随机数,即为与OPPRF结果对应的关键词所对应的伪随机数。
在多方隐私求交的计算中,假设一共有n+1个参与方,其中,包括一个客户端和n个服务端,最终交集结果由客户端获得。在这n+1个参与方的多方隐私求交计算中,包括两个过程,一个是零共享过程,另一个是重构过程。
在零共享过程中,n+1个参与方中,每两个参与方之间均要执行2次OPPRF协议,在其中第1次OPPRF协议中,一个参与方作为接收方,另一个参与方作为发送方,在其中第2次OPPRF协议中,两个参与方作为接收方和发送方的角色互换。对于每个参与方而言,其执行一次OPPRF协议,其本地存储的与多条关键词对应的伪随机数,均与计算得到的OPPRF结果进行一次数据耦合,相应的,本地存储的与多条关键词对应的伪随机数即发生了更新。
在完成零共享过程后,开始执行重构过程。
在重构过程中,客户端作为接收方,分别与作为发送方的n个服务端之间执行OPPRF协议,相应的,客户端作为接后方,每次执行OPPRF协议,均将通过数据融合更新本地存储的与多条关键词对应的伪随机数,并基于最后更新得到的伪随机数与最初生成的本地存储的伪随机数进行对比,得到交集结果。
在上述多方隐私求交计算的领共享过程和重构过程中,每次参与方之间执行OPPRF协议,均可以采用本申请实施例提供的上述多方隐私求交中的数据处理方法,从而减少计算所花费的时间,提高计算效率。
基于同一发明构思,根据本申请上述实施例提供的多方隐私求交中的数据处理方法,相应地,本申请另一实施例还提供了一种多方隐私求交中的数据处理装置,应用于接收方设备,接收方设备具有多条关键词,多条关键词的数量为m,m条关键词被采用布谷鸟哈希映射到大小为L的哈希表中,L不小于m,其结构示意图如图3所示,具体包括:
数据接收模块31,用于接收发送方设备针对m条关键词发送的L组计算数据,计算数据用于计算OPPRF结果;
结果计算模块32,用于使用L组计算数据中的m组计算数据,分别对应哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,得到m个OPPRF结果;
结果合并模块33,用于针对m个OPPRF结果中的每个OPPRF结果,将该OPPRF结果所对应的关键词的序号作为包头,与该OPPRF结果合并为处理后结果,处理后结果中包头位于前部分;
结果排序模块34,用于将得到的m个处理后结果按照包头进行排序,并按照顺序存储到结果文件中;
数据融合模块35,用于从结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。
进一步的,结果计算模块32,具体用于按照顺序获取L组计算数据中的每组计算数据;当哈希表中与该组计算数据对应的位置存储有关键词时,使用该组计算数据计算该条关键词对应的OPPRF结果;当哈希表中与该组计算数据对应的位置未存储有关键词时,取消使用该组计算数据计算OPPRF结果。
进一步的,结果排序模块34,具体用于将得到的m个处理后结果划分为v组,分别存储到v个中间文件中,每个中间文件的数据量小于内存的可用空间;分别针对每个中间文件,在内存中对该中间文件包含的多个处理后结果按照包头进行排序,得到v个排序后中间文件;对v个排序后中间文件包含的m个处理后结果按照包头进行排序,得到一个结果文件,结果文件中包含按照顺序存储的m个处理后结果。
进一步的,结果排序模块34,具体用于采用败者树的多路并归算法,对v个排序后中间文件包含的m个处理后结果按照包头进行排序,得到一个结果文件。
进一步的,采用如下公式计算v:
Figure 982851DEST_PATH_IMAGE001
Figure 736699DEST_PATH_IMAGE002
其中,memory_limit表示内存的可用空间,opprf_size表示一个处理后结果的数据量,[*]表示对*取整,U表示每个中间文件所包含的处理后结果的数量。
进一步的,L大于m且小于2m。
上述各模块的功能可对应于图1和图2所示流程中的相应处理步骤,在此不再赘述。
本申请的实施例所提供的多方隐私求交中的数据处理装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的模块划分方式仅是众多模块划分方式中的一种,如果划分为其他模块或不划分模块,只要墙体彩绘打印装置具有上述功能,都应该在本申请的保护范围之内。
本申请实施例还提供一种电子设备,如图4所示,包括处理器41和机器可读存储介质42,机器可读存储介质42存储有能够被处理器41执行的机器可执行指令,处理器41被机器可执行指令促使:实现上述任一多方隐私求交中的数据处理方法。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一多方隐私求交中的数据处理方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一多方隐私求交中的数据处理方法。
上述电子设备中的机器可读存储介质可以包括随机存取存储器(Random AccessMemory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质,计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种多方隐私求交中的数据处理方法,其特征在于,应用于接收方设备,所述接收方设备具有多条关键词,所述多条关键词的数量为m,m条关键词被采用布谷鸟哈希映射到大小为L的哈希表中,L不小于m,包括:
接收发送方设备针对m条关键词发送的L组计算数据,所述计算数据用于计算OPPRF结果;
使用所述L组计算数据中的m组计算数据,分别对应所述哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,得到m个OPPRF结果;
针对m个OPPRF结果中的每个OPPRF结果,将该OPPRF结果所对应的关键词的序号作为包头,与该OPPRF结果合并为处理后结果,所述处理后结果中包头位于前部分;
将得到的m个所述处理后结果按照包头进行排序,并按照顺序存储到结果文件中;
从所述结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。
2.如权利要求1所述的方法,其特征在于,所述使用所述L组计算数据中的m组计算数据,分别对应所述哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,包括:
按照顺序获取所述L组计算数据中的每组计算数据;
当所述哈希表中与该组计算数据对应的位置存储有关键词时,使用该组计算数据计算该条关键词对应的OPPRF结果;
当所述哈希表中与该组计算数据对应的位置未存储有关键词时,取消使用该组计算数据计算OPPRF结果。
3.如权利要求1所述的方法,其特征在于,所述将得到的m个所述处理后结果按照包头进行排序,并按照顺序存储到结果文件中,包括:
将得到的m个所述处理后结果划分为v组,分别存储到v个中间文件中,每个所述中间文件的数据量小于内存的可用空间;
分别针对每个所述中间文件,在内存中对该中间文件包含的多个所述处理后结果按照包头进行排序,得到v个排序后中间文件;
对所述v个排序后中间文件包含的m个所述处理后结果按照包头进行排序,得到一个结果文件,所述结果文件中包含按照顺序存储的m个所述处理后结果。
4.如权利要求3所述的方法,其特征在于,所述对所述v个排序后中间文件包含的m个所述处理后结果按照包头进行排序,得到一个结果文件,包括:
采用败者树的多路并归算法,对所述v个排序后中间文件包含的m个所述处理后结果按照包头进行排序,得到一个结果文件。
5.如权利要求3所述的方法,其特征在于,采用如下公式计算v:
Figure 673969DEST_PATH_IMAGE001
Figure 207719DEST_PATH_IMAGE002
其中,memory_limit表示内存的可用空间,opprf_size表示一个所述处理后结果的数据量,[*]表示对*取整,U表示每个中间文件所包含的处理后结果的数量。
6.如权利要求1-5任一所述的方法,其特征在于,L大于m且小于2m。
7.一种多方隐私求交中的数据处理装置,其特征在于,应用于接收方设备,所述接收方设备具有多条关键词,所述多条关键词的数量为m,m条关键词被采用布谷鸟哈希映射到大小为L的哈希表中,L不小于m,包括:
数据接收模块,用于接收发送方设备针对m条关键词发送的L组计算数据,所述计算数据用于计算OPPRF结果;
结果计算模块,用于使用所述L组计算数据中的m组计算数据,分别对应所述哈希表中的每条关键词,计算该条关键词对应的OPPRF结果,得到m个OPPRF结果;
结果合并模块,用于针对m个OPPRF结果中的每个OPPRF结果,将该OPPRF结果所对应的关键词的序号作为包头,与该OPPRF结果合并为处理后结果,所述处理后结果中包头位于前部分;
结果排序模块,用于将得到的m个所述处理后结果按照包头进行排序,并按照顺序存储到结果文件中;
数据融合模块,用于从所述结果文件中按顺序依次获取每个处理后结果,并使用该处理后结果包含的OPPRF结果,与对应的本地伪随机数进行数据融合。
8.如权利要求7所述的装置,其特征在于,所述结果计算模块,具体用于按照顺序获取所述L组计算数据中的每组计算数据;当所述哈希表中与该组计算数据对应的位置存储有关键词时,使用该组计算数据计算该条关键词对应的OPPRF结果;当所述哈希表中与该组计算数据对应的位置未存储有关键词时,取消使用该组计算数据计算OPPRF结果。
9.一种电子设备,其特征在于,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现权利要求1-5任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一所述的方法。
CN202111042975.7A 2021-09-07 2021-09-07 一种多方隐私求交中的数据处理方法、装置及电子设备 Active CN113489583B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111042975.7A CN113489583B (zh) 2021-09-07 2021-09-07 一种多方隐私求交中的数据处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111042975.7A CN113489583B (zh) 2021-09-07 2021-09-07 一种多方隐私求交中的数据处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN113489583A true CN113489583A (zh) 2021-10-08
CN113489583B CN113489583B (zh) 2021-11-26

Family

ID=77946473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111042975.7A Active CN113489583B (zh) 2021-09-07 2021-09-07 一种多方隐私求交中的数据处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN113489583B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114722049A (zh) * 2022-05-18 2022-07-08 华控清交信息科技(北京)有限公司 一种多方数据交集计算方法、装置及电子设备
CN115065459A (zh) * 2022-06-13 2022-09-16 青岛大学 一种多方隐私集合求交方法、装置、设备及存储介质
CN117574412A (zh) * 2024-01-16 2024-02-20 国家计算机网络与信息安全管理中心天津分中心 多方隐私求交方法、装置和电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190342270A1 (en) * 2018-05-07 2019-11-07 Microsoft Technology Licensing, Llc Computing a private set intersection
CN110727960A (zh) * 2019-10-16 2020-01-24 卓尔智联(武汉)研究院有限公司 基于隐私保护的数据求交集装置、方法及可读存储介质
CN112598138A (zh) * 2020-12-22 2021-04-02 百度在线网络技术(北京)有限公司 数据处理方法、装置、联邦学习系统和电子设备
CN112632608A (zh) * 2020-12-23 2021-04-09 上海同态信息科技有限责任公司 一种基于数值计算隐私数据协同处理方法
CN112861175A (zh) * 2021-02-03 2021-05-28 华控清交信息科技(北京)有限公司 一种数据处理方法、装置和用于数据处理的装置
CN112910631A (zh) * 2021-02-08 2021-06-04 上海海洋大学 一种基于云服务器辅助的高效隐私集合交集计算方法及系统
CN113179150A (zh) * 2021-04-26 2021-07-27 杭州宇链科技有限公司 一种基于保序函数的同态隐私集合求交方法
CN113259106A (zh) * 2021-06-28 2021-08-13 华控清交信息科技(北京)有限公司 一种数据处理方法和系统
CN113312641A (zh) * 2021-06-02 2021-08-27 杭州趣链科技有限公司 多点多方的数据交互方法、系统、电子装置和存储介质
CN113343305A (zh) * 2021-06-29 2021-09-03 招商局金融科技有限公司 隐私数据的交集计算方法、装置、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190342270A1 (en) * 2018-05-07 2019-11-07 Microsoft Technology Licensing, Llc Computing a private set intersection
CN110727960A (zh) * 2019-10-16 2020-01-24 卓尔智联(武汉)研究院有限公司 基于隐私保护的数据求交集装置、方法及可读存储介质
CN112598138A (zh) * 2020-12-22 2021-04-02 百度在线网络技术(北京)有限公司 数据处理方法、装置、联邦学习系统和电子设备
CN112632608A (zh) * 2020-12-23 2021-04-09 上海同态信息科技有限责任公司 一种基于数值计算隐私数据协同处理方法
CN112861175A (zh) * 2021-02-03 2021-05-28 华控清交信息科技(北京)有限公司 一种数据处理方法、装置和用于数据处理的装置
CN112910631A (zh) * 2021-02-08 2021-06-04 上海海洋大学 一种基于云服务器辅助的高效隐私集合交集计算方法及系统
CN113179150A (zh) * 2021-04-26 2021-07-27 杭州宇链科技有限公司 一种基于保序函数的同态隐私集合求交方法
CN113312641A (zh) * 2021-06-02 2021-08-27 杭州趣链科技有限公司 多点多方的数据交互方法、系统、电子装置和存储介质
CN113259106A (zh) * 2021-06-28 2021-08-13 华控清交信息科技(北京)有限公司 一种数据处理方法和系统
CN113343305A (zh) * 2021-06-29 2021-09-03 招商局金融科技有限公司 隐私数据的交集计算方法、装置、设备及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114722049A (zh) * 2022-05-18 2022-07-08 华控清交信息科技(北京)有限公司 一种多方数据交集计算方法、装置及电子设备
CN114722049B (zh) * 2022-05-18 2022-08-12 华控清交信息科技(北京)有限公司 一种多方数据交集计算方法、装置及电子设备
CN115065459A (zh) * 2022-06-13 2022-09-16 青岛大学 一种多方隐私集合求交方法、装置、设备及存储介质
CN117574412A (zh) * 2024-01-16 2024-02-20 国家计算机网络与信息安全管理中心天津分中心 多方隐私求交方法、装置和电子设备
CN117574412B (zh) * 2024-01-16 2024-04-02 国家计算机网络与信息安全管理中心天津分中心 多方隐私求交方法、装置和电子设备

Also Published As

Publication number Publication date
CN113489583B (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN113489583B (zh) 一种多方隐私求交中的数据处理方法、装置及电子设备
CN112910631B (zh) 一种基于云服务器辅助的高效隐私集合交集计算方法及系统
US9742739B2 (en) Accumulating automata and cascaded equations automata for non-interactive and perennial secure multi-party computation
CN111008256B (zh) 一种基于安全多方计算的空间数据分布模式分析方法
CN110689349A (zh) 一种区块链中的交易哈希值存储和搜索方法及装置
US11128479B2 (en) Method and apparatus for verification of social media information
US11531778B2 (en) Privacy data reporting method and apparatus, and storage medium
CN103888449A (zh) 一种报文重组方法和装置
CN114282076B (zh) 一种基于秘密分享的排序方法和系统
CN114722049B (zh) 一种多方数据交集计算方法、装置及电子设备
CN109766724A (zh) 一种基于区块链的数据存证方法
CN111046106A (zh) 缓存数据同步方法、装置、设备及介质
Park et al. GradAlign+: Empowering gradual network alignment using attribute augmentation
CN106789147A (zh) 一种流量分析方法及装置
CN111259062B (zh) 一种能够保证分布式数据库全表查询语句结果集顺序的方法和装置
CN108389124A (zh) 数据处理方法、装置、计算机设备和存储介质
CN115361131B (zh) 一种密文数据计算方法、装置和电子设备
CN116108042A (zh) 数据处理方法、装置、电子设备、存储介质及程序产品
CN116707784A (zh) 一种基于秘密分享的多方安全计算方法和系统
CN106156169B (zh) 离散数据的处理方法和装置
CN107644055B (zh) 一种基于训练数据的通信保障能力生成方法
CN112187905B (zh) 一种负载均衡接口表维护方法、设备及系统
CN111460515B (zh) 数据匹配方法、装置和电子设备
CN115269234B (zh) 一种任务消息传输方法、装置及相关设备
CN103793440A (zh) 信息显示方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant