CN116112168B

CN116112168B - 多方隐私求交中的数据处理方法及系统

Info

Publication number: CN116112168B
Application number: CN202310373932.XA
Authority: CN
Inventors: 殷奔鑫; 屠家华; 南文捷
Original assignee: Jishu Hangzhou Technology Co ltd
Current assignee: Jishu Hangzhou Technology Co ltd
Priority date: 2023-04-10
Filing date: 2023-04-10
Publication date: 2023-06-20
Anticipated expiration: 2043-04-10
Also published as: CN116112168A

Abstract

本申请提供多方隐私求交中的数据处理方法及系统，其中所述多方隐私求交中的数据处理方法包括：在各参与方中同步预设数量的哈希函数；各参与方确定n‑1个伪随机参数，并根据n‑1个伪随机参数和业务数据集合生成各参与方对应的点对数据集合；根据各参与方对应的点对数据集合和预设数量的哈希函数，创建各参与方对应的混淆布隆过滤器；根据各参与方对应的混淆布隆过滤器，确定各参与方对应的目标交集数据集合。

Description

多方隐私求交中的数据处理方法及系统

技术领域

本申请涉及多方隐私计算技术领域，特别涉及多方隐私求交中的数据处理方法。本申请同时涉及多方隐私求交中的数据处理系统，一种计算设备，以及一种计算机可读存储介质。

背景技术

隐私集合求交技术（PrivateSet Intersection，PSI）是多方安全计算中的一个重要组成部分，被认为是跨机构数据合作的前置步骤，实现跨源数据间的安全融合，也得到了广泛的关注和落地应用。在很多的应用场景中参与方的数量大于两方，此时需要多方隐私求交技术作为前置技术。多方隐私求交（Multi-partyPrivate Set Intersection，MPSI）是指多个参与方均拥有一个数据集，多个参与方通过交互获得所有数据集的交集，并由其中一个参与方获得，且该参与方除了获得该交集外无法获得任何额外信息，其他参与方无法获得其他任何额外信息。

在已有的多方隐私求交技术中比较流行的有基于不经意的可编程伪随机函数（ObliviousProgrammablePseudo-RandomFunction，OPPRF）的方案、有基于shamir秘密分享的方案等，但是这些方案均存在大量的通信开销和计算开销，因此，亟需一种新的隐私集合求交技术来解决上述问题。

发明内容

有鉴于此，本申请实施例提供了多方隐私求交中的数据处理方法。本申请同时涉及多方隐私求交中的数据处理系统，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的上述问题。

根据本申请实施例的第一方面，提供了一种多方隐私求交中的数据处理方法，所述方法应用于数据处理系统，所述数据处理系统包括n个参与方，n为大于或等于2的整数，所述方法包括：

在各参与方中同步预设数量的哈希函数；

各参与方确定n-1个伪随机参数，并根据n-1个伪随机参数和业务数据集合生成各参与方对应的点对数据集合；

根据各参与方对应的点对数据集合和预设数量的哈希函数，创建各参与方对应的混淆布隆过滤器；

根据各参与方对应的混淆布隆过滤器，确定各参与方对应的目标交集数据集合。

根据本申请实施例的第二方面，提供了一种多方隐私求交中的数据处理系统，所述多方隐私求交中的数据处理系统包括n个参与方，n为大于或等于2的整数，所述系统包括：

第1个参与方，被配置为在各参与方中同步预设数量的哈希函数；

各参与方，被配置为确定n-1个伪随机参数，并根据n-1个伪随机参数和业务数据集合生成各参与方对应的点对数据集合；

各参与方，进一步被配置为根据各参与方对应的点对数据集合和预设数量的哈希函数，创建各参与方对应的混淆布隆过滤器；

各参与方，进一步被配置为各参与方对应的混淆布隆过滤器，确定各参与方对应的目标交集数据集合。

根据本申请实施例的第三方面，提供了一种计算设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，所述处理器执行所述计算机指令时实现所述多方隐私求交中的数据处理方法的步骤。

根据本申请实施例的第四方面，提供了一种计算机可读存储介质，其存储有计算机指令，该计算机指令被处理器执行时实现所述多方隐私求交中的数据处理方法的步骤。

本申请提供的多方隐私求交中的数据处理方法，应用于数据处理系统，所述数据处理系统包括n个参与方，n为大于或等于2的整数，所述方法包括：在各参与方中同步预设数量的哈希函数；各参与方确定n-1个伪随机参数，并根据n-1个伪随机参数和业务数据集合生成各参与方对应的点对数据集合；根据各参与方对应的点对数据集合和预设数量的哈希函数，创建各参与方对应的混淆布隆过滤器；根据各参与方对应的混淆布隆过滤器，确定各参与方对应的目标交集数据集合。

本申请一实施例实现了将零的分享结合到隐私集合求交技术中，所有的分享在各参与方的本地产生即可，极大减小了通信开销，本申请提供的方法，仅在初始阶段在所有参与方中同步一次哈希函数，后续的分享均在各参与方本地实现，分享通信复杂度较低，节省了通信开销和计算开销。

附图说明

图1是本申请一实施例提供的一种多方隐私求交中的数据处理方法的流程图；

图2是本申请一实施例提供的同步哈希函数的示意图；

图3是本申请一实施例提供的同步伪随机参数的示意图；

图4是本申请一实施例提供的待处理业务数据和初始混淆布隆过滤器中的映射关系图；

图5是本申请一实施例提供的一种应用于银行业务场景的多方隐私求交中的数据处理方法的处理流程图；

图6是本申请一实施例提供的一种多方隐私求交中的数据处理系统的结构示意图；

图7是本申请一实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本申请一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

需要说明的是，本申请所涉及的用户信息（包括但不限于用户设备信息、用户个人信息等）和数据（包括但不限于用于分析的数据、存储的数据、展示的数据等），均为经用户授权或者经过各方充分授权的信息和数据，并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准，并提供有相应的操作入口，供用户选择授权或者拒绝。

首先，对本申请一个或多个实施例涉及的名词术语进行解释。

多方隐私求交：多个参与方在不泄露任何额外信息的情况下，得到所有参与方持有数据的交集。

伪随机函数（Pseudo RandomFunction –PRF）：根据随机种子和数据本身产生随机数，如果数据和随机种子相同，则产生相同的随机数。

不经意传输（ObliviousTransfer – OT）：一个密码学协议，在这个协议中，消息发送者从一些待发送的消息中发送一条给接收者，但事后对发送了哪一条消息仍然不知道。

布隆过滤器（Bloom Filter -BF）：从形式上看是一个bit数组，也是一种概率型的数据结构，是一个很长的二进制位图和一系列随机映射函数或哈希函数。当插入某个元素时，使用多个不同的哈希函数生成不同的哈希值，并对指向的位置设置为1。特点是高效地插入和查询，可以用来告诉你“某样东西一定不存在或者可能存在”。

混淆布隆过滤器（Garbled BloomFilter - GBF）：GBF是BF的一种变体，从形式上来看也是一个bit数组，当插入某个元素时，使用多个不同的哈希函数生成不同的哈希值，并对指向的位置设置为1。GBF与BF不同的是，GBF的每个位置均包含定长的字符串，当插入某个元素时，该元素分成k份长度均为λ-bit的共享，每一份共享都被哈希函数映射到相应的位置上。

隐私集合求交技术（Private SetIntersection，PSI）被认为是跨机构数据合作的前置步骤，实现跨源数据间的安全融合，也得到了广泛的关注和落地应用。在很多的应用场景中参与方的数量大于两方，此时需要多方隐私求交技术作为前置技术。多方隐私求交（Multi-partyPrivate Set Intersection,MPSI）是指多个参与方均拥有一个数据集，多个参与方通过交互获得所有数据集的交集，并由其中一个参与方获得，且该参与方除了获得该交集外无法获得任何额外信息，其他参与方无法获得其他任何额外信息。

在已有的多方隐私求交技术中比较流行的有基于不经意的可编程伪随机函数（ObliviousProgrammablePseudo-RandomFunction，OPPRF）的方案，在计算过程中，各参与方要与其中的第一个参与方进行一次OPPRF协议，从而获得交集。有基于同态加密的方案，将自己的数据经过多层加密后获得最终交集。有基于shamir秘密分享的方案，将自己的hash表秘密分享后，通过恢复秘密求交。以上方案都存在大量的通信开销和计算开销，比如在OPPRF的方案中，需要大量的交互，OPPRF的计算量也相对较大；在同态加密方案中计算开销太大；在shamir秘密分享的方案中，分享的通信开销太大，分享和恢复的计算开销过大。

在本申请中，提供了多方隐私求交中的数据处理方法，本申请同时涉及多方隐私求交中的数据处理系统，一种计算设备，以及一种计算机可读存储介质，在下面的实施例中逐一进行详细说明。

图1示出了根据本申请一实施例提供的一种多方隐私求交中的数据处理方法的流程图，所述方法应用于数据处理系统，所述数据处理系统包括n个参与方，n为大于或等于2的整数，所述方法具体包括以下步骤：

步骤102：在各参与方中同步预设数量的哈希函数。

在实际应用中，通常会有多方来对自己的数据进行数据集合求交的需求，例如多个银行之间看有哪些人同时被拉入黑名单，在此场景下每个银行都是一个参与方，每个银行都有自己的黑名单数据，银行之间不希望其他银行知道黑名单的具体数据，但是又希望找到每个银行的黑名单中的共同的人，因此就会用到隐私集合求交技术。

基于此，参与方具体是指参与到隐私集合求交任务的主体，例如，以上述多个银行间查询共同的黑名单为例，每个银行都是一个参与方。

哈希函数时用于对业务数据进行加密的函数，哈希函数的目的是为了寻找每个业务数据在对应的混淆布隆过滤器中的位置，基于此，哈希函数对应的预设数量是基于混淆布隆过滤器的长度确定的，如果混淆布隆过滤器的长度为k，则在各参与方中共享k个哈希函数。

在实际引用中，在各参与方中同步预设数量的哈希函数，包括：

为各参与方按顺序进行编号；

第1个参与方创建预设数量的哈希函数，并将所述预设数量的哈希函数同步至各参与方，其中，所述预设数量基于混淆布隆过滤器的长度确定。

为了便于对各参与方进行管理，可以为各参与方进行编号，当有n个参与方时，可以用1-n的整数为各参与方进行编号。例如，当n=5时，则有5个参与方，分别为第1个参与方、第2个参与方、第3个参与方、第4个参与方和第5个参与方。

为了保证各参与方中的哈希函数相同，可以由其中1个参与方初始化创建预设数量的哈希函数，例如创建k个哈希函数。并将这k个哈希函数同步至各参与方中，以使各参与方都具有k个相同的哈希函数。

参见图2，图2示出了本申请一实施例提供的同步哈希函数的示意图，如图2所示，一共n个参与方，第1个参与方创建了k个哈希函数，并将这k个哈希函数同步至各参与方中，至此，参与方1、参与方2、参与方3、……参与方n中均有k个哈希函数。

在实际应用中，第1个参与方除了创建k个哈希函数之外，还需要创建一个布隆过滤器，用于在后续的处理过程中，与其他参与方进行OT传输（ObliviousTransfer，不经意传输）在本申请提供的另一具体实施方式中，所述方法还包括：

第1个参与方根据第1个参与方对应的业务数据集合和预设数量的哈希函数生成第一布隆过滤器，其中，所述第一布隆过滤器的长度为b。

为了便于后续的描述，在本申请中，用X标识各参与方对应的业务数据集合，更进一步的，对于第1个参与方，其对应的业务数据集合，可以表示为X_1，对于第2个参与方，其对应的业务数据集合可以表示为X_2，……对于第n个参与方，其对应的业务数据集合可以表示为X_n。

第1个参与方根据其对应的业务数据集合X_1和k个哈希函数，可以生成第一布隆过滤器，第一布隆过滤器是长度为b的bit数组。

步骤104：各参与方确定n-1个伪随机参数，并根据n-1个伪随机参数和业务数据集合生成各参与方对应的点对数据集合。

在同步完k个哈希函数后，对于各参与方均可以获得k个哈希函数，同时，各参与方还可以确定n-1个伪随机数，伪随机数用于在后续的计算过程中，计算每个业务数据的伪随机值，进而与每个业务数据组成点对数据。

具体的，各参与方确定n-1个伪随机参数，并根据n-1个伪随机参数和业务数据集合生成各参与方对应的点对数据集合，包括：

第i个参与方生成n-i个伪随机参数，并将第j个伪随机参数发送给第j个参与方，其中，

；

根据第i个参与方对应的业务数据集合和n-1个伪随机参数生成第i个参与方对应的点对数据集合。

在实际应用中，预先为各参与方进行了编号，各参与方只需要向编号比其大的参与方发送伪随机参数即可，例如，以一共有5个参与方为例，第1个参与方向第2、3、4、5个参与方发送伪随机参数，第2个参与方向第3、4、5发送伪随机参数，第3个参与方向第4、5个参与方发送伪随机参数，第4个参与方向第5个参与方发送伪随机参数。第5个参与方无需生成伪随机参数，至此，各参与方中，均可以获得n-1个伪随机参数。

基于此，对于的第i个参与方，只需要生成n-i个伪随机参数t即可，对于第i个参与方生成的伪随机参数可以用{t_i_i+1，t_i_i+2，t_i_n}，依然以有5个参与方为例，第1个参与方需要生成5-1=4个伪随机参数，分别为{t_1_2，t_1_3，t_1_4，t_1_5}；第2个参与方需要生成5-2=3个伪随机参数，分别为{t_2_3，t_2_4，t_2_5}；第3个参与方需要生成5-3=2个伪随机参数，分别为{t_3_4，t_3_5}；第4个参与方需要生成5-4=1个伪随机参数，分别为{t_4_5}。

对于第i个参与方，要将伪随机参数t_i_j发送至第j个参与方，其中，

，沿用上例，第1个参与方将t_1_2发送给第2个参与方，将t_1_3发送给第3个参与方，将t_1_4发送给第4个参与方，将t_1_5发送给第5个参与方，……，同样的道理，第可以依次将第i个参与方中的第t_i_j个伪随机参数发送至第j个参与方，以使各参与方中都有n-1个伪随机参数。

对于第i个参与方，其包括n-1个伪随机参数，具体的包括n-i个自己产生的伪随机参数和从其他参与方获得的i-1个种子。例如，对于第2个参与方，其包括自己生产的{t_2_3，t_2_4，t_2_5}和第1个参与方发送的t_1_2；对于第3个参与方，其包括自己生产的{ t_3_4，t_3_5}、第1个参与方发送的t_1_3、第2个参与方发送的t_2_3……。

参见图3，图3示出了本申请一实施例提供的同步伪随机参数的示意图，各参与方将自己生成的伪随机参数发送给编号大于本自身编号的参与方，从而实现各参与方都有n-1个伪随机参数。

对于任意一个参与方，在获得的n-1个伪随机参数之后，即可根据其对应的业务数据集合和n-1个伪随机参数获得每个业务数据对应的点对数据，从而获得业务数据集合对应的点对数据集合。下面，以第i个参与方为例，进一步进行解释说明：

在实际应用中，根据第i个参与方对应的业务数据集合和n-1个伪随机参数生成第i个参与方对应的点对数据集合，包括：

在所述业务数据集合中确定目标业务数据；

根据预设伪随机函数、所述目标业务数据和每个伪随机参数生成所述目标业务数据对应的目标伪随机值；

根据所述目标业务数据和所述目标伪随机值生成所述目标业务数据对应的点对数据集合。

对于第i个参与方，其对应的业务数据集合为X_i，同时第i个参与方中包括有n-1个伪随机参数，根据n-1个伪随机参数可以计算每个业务数据对应的目标伪随机值，从而生成对应的点对数据。

具体的，在业务数据集合中确定目标业务数据xi，xi∈X_i，根据预设伪随机函数F（t，x）和每个伪随机参数计算目标业务数据xi对应的目标伪随机值yi，其中t表示伪随机参数，x表示目标业务数据。

基于此，可以确定业务数据集合中，每个目标业务数据对应的目标伪随机值，从而生成第i个参与方中业务数据集合X_i对应的点对数据集合W_i{(x1，y1)，(x2，y2)，(x3，y3)……，(xm，ym)}。

更进一步的，根据预设伪随机函数、所述目标业务数据和每个伪随机参数生成所述目标业务数据对应的目标伪随机值，包括：

根据预设伪随机函数、所述目标业务数据和每个伪随机参数，生成每个伪随机参数对应的初始伪随机函数值；

对每个伪随机参数对应的初始伪随机函数值进行异或处理，生成所述目标业务数据对应的目标伪随机值。

在实际应用中，先根据预设伪随机函数、目标业务数据和每个伪随机参数生成每个伪随机参数对应的初始伪随机函数值，再对每个初始伪随机函数值进行异或处理，从而生成目标业务数据对应的目标伪随机值。

例如，对于第i个参与方，n-1个伪随机参数分别为（t_1_i、t_2_i……t_（i-1）_i、t_i_（i+1）、t_i_（i+2）……t_i_n）。对于目标业务数据x，使用预设伪随机函数F（t，x），可以分别计算每个伪随机参数对应的初始伪随机函数值，例如，伪随机参数t_1_i对应的初始伪随机函数值为F（t_1_i，x）；伪随机参数t_2_i对应的初始伪随机函数值为F（t_2_i，x）；伪随机参数t_（i-1）_i对应的初始伪随机函数值为F（t_（i-1）_i，x）……。

在确定了每个伪随机参数对应的初始伪随机参数值后，对每个初始伪随机参数值进行异或处理，获得目标业务数据对应的目标伪随机值y，具体的，y= F（t_1_i，x）⊕F（t_2_i，x）⊕F（t_（i-1）_i，x）⊕……⊕F（t_i_（i+1），x）⊕F（t_i_（i+2），x）⊕……⊕F（t_i_n，x）。

至此，每个目标业务数据x，均会产生一个对应的目标伪随机值y，从而生成目标业务数据x对应的点对数据（x，y），进而，可以获得第i个参与方对应的业务数据集合X_i对应的点对数据集合W_i{(x1，y1)，(x2，y2)，(x3，y3)……，(xm，ym)}。

步骤106：根据各参与方对应的点对数据集合和预设数量的哈希函数，创建各参与方对应的混淆布隆过滤器。

各参与方在生成各自对应的点对数据集合之后，再根据之前第1个参与方同步的预设数量的哈希函数（k个哈希函数），即可建立各参与方对应的混淆布隆过滤器（GarbledBloom Filter，GBF），GBF从形式上来看也是一个bit数组，当插入某个元素时，使用多个不同的哈希函数生成不同的哈希值，并对指向的位置设置为1。GBF与BF不同的是，GBF的每个位置均包含定长的字符串，当插入某个元素时，该元素分成k份长度均为λ-bit的共享，每一份共享都被哈希函数映射到相应的位置上。

具体的，根据各参与方对应的点对数据集合和预设数量的哈希函数，创建各参与方对应的混淆布隆过滤器，包括S10602-S10610：

S10602、确定目标参与方和所述目标参与方对应的目标点对数据集合，并在所述目标点对数据集合中确定待处理目标业务数据和待处理目标伪随机值。

在实际应用中，以第i个参与方为例，目标参与方即为第i个参与方，目标参与方对应的目标点对数据集合为W_i{(x1，y1)，(x2，y2)，(x3，y3)……，(xm，ym)}。在处理过程中，需要分别对点对数据集合中的任意一个待处理业务数据xu和其对应的yu进行相应的处理。

S10604、创建初始混淆布隆过滤器。

对于第i个参与方，先创建初始混淆布隆过滤器，即产生一个空的table表，这个空的table表即为第i个参与方对应的初始混淆布隆过滤器。

S10606、根据每个哈希函数和所述待处理目标业务数据确定每个哈希函数对应的待处理哈希值。

根据每个哈希函数和待处理业务数据即可计算出每个哈希函数对应的待处理哈希值，例如，以哈希函数有3个为例，分别为h_1、h_2、h_3。对于待处理目标业务数据xu，可以计算获得三个待处理哈希值，分别为h_1（xu）、h_2（xu）、h_3（xu）。

S10608、在所述初始混淆布隆过滤器中确定每个待处理哈希值对应的待处理位置信息。

每个待处理哈希值可以对应初始混淆布隆过滤器中的待处理位置信息，具体的，依然沿用上例，对于待处理目标业务数据xu，其对应的三个待处理哈希值分别为h_1（xu）、h_2（xu）、h_3（xu），每个哈希值可以对应初始混淆布隆过滤器中的一个待处理位置信息。

参见图4，图4示出了本申请一实施例提供的待处理业务数据和初始混淆布隆过滤器中的映射关系图，如图4所示，以哈希函数为3个为例，对于待处理业务数据xu，经过每个哈希函数计算之后，会对应到初始混淆布隆过滤器中的三个待处理位置信息r1、r2、r3。

S10610、在每个待处理位置信息中存在空位置的情况下，根据所述待处理目标伪随机值生成目标随机数，并将所述目标随机数填充至所空位置。

在确定的待处理位置信息中，存在空位置（至少一个空即可）的情况下，则可以生成目标伪随机数，并将该目标伪随机数填充至空位置。

具体的，根据所述待处理目标伪随机值生成目标随机数，包括：

获取所述待处理目标业务数据对应的每个待处理位置信息中的随机数信息；

根据所述待处理目标伪随机值和每个待处理位置信息的随机数信息生成目标随机数，以使每个待处理位置信息的随机数信息间的异或处理值为所述待处理目标伪随机值。

在实际应用中，目标随机数是根据待处理目标伪随机值生成的，具体的，是获取待处理目标业务数据对应的每个待处理位置信息中的随机数信息，生成的目标随机数要满足与其他随机数信息的异或处理后的值为所述待处理目标伪随机值。

例如，沿用上例，待处理业务数据xu在初始混淆布隆过滤器中对应的三个待处理位置信息为r1、r2、r3，其中，r1为空位置，r2和r3不为空，且r2中的随机数信息为f2，r3中的随机数信息为f3，则要为待处理位置信息r1生成目标伪随机值f1，以使f1⊕f2⊕f3=yu。

步骤108：根据各参与方对应的混淆布隆过滤器，确定各参与方对应的目标交集数据集合。

各参与方在经过上述步骤之后，均可以获得各参与方对应的混淆布隆过滤器，即第i个参与方对应一个GBF_i。

各参与方根据各自对应的GBF，即可确定各参与方中共同拥有的交集数据，进而确定目标交集数据集合。

具体的，根据各参与方对应的混淆布隆过滤器，确定各参与方对应的目标交集数据集合，包括S1082-S1086：

S1082、每个编号大于2的参与方将对应的混淆布隆过滤器发送至第2个参与方。

对于第h个参与方，其中2＜h＜n+1，将对应的GBF_h发送给第2个参与方，此时第2个参与方中包括除第1个参与方外其他参与方的GBF。

S1084、第2个参与方将每个混淆布隆过滤器中相同位置的随机数进行异或处理，获得待处理混淆布隆过滤器，并基于所述待处理混淆布隆过滤器随机生成参考混淆布隆过滤器，基于所述待处理混淆布隆过滤器和所述参考混淆布隆过滤器向第1个参与方发送比对混淆布隆过滤器。

第2个参与方根据除第1个参与方外的其他参与方的GBF，确定待处理混淆布隆过滤器（GBF_0），具体的，是将混淆布隆过滤器中相同位置的随机数进行异或处理，从而生成待处理混淆布隆过滤器。具体的，GBF_0=GBF_2⊕GBF_3⊕…⊕GBF_n。

在确定了GBF_0后，生成一个新的参考混淆布隆过滤器GBF’_0，GBF’_0的长度与GBF_0的长度相同。

在获取了待处理混淆布隆过滤器（GBF_0）和参考混淆布隆过滤器GBF’_0之后，要基于GBF_0和GBF’_0向第1个参与方发送比对混淆布隆过滤器GBF’。

具体的，基于所述待处理混淆布隆过滤器和所述参考混淆布隆过滤器向第1个参与方发送比对混淆布隆过滤器，包括：

基于不经意传输协议从所述待处理混淆布隆过滤器和所述参考混淆布隆过滤器向第1个参与方发送第m个位置的元素，以使第1个参与方生成比对混淆布隆过滤器，其中，

。

不经意传输协议（ObliviousTransfer，OT）是一个密码学协议，在这个协议中，消息发送者从一些待发送的消息中发送一条给接收者，但事后对发送了哪一条消息仍然不知道。

第1个参与方和第2个参与方要经历b次OT，b是指在第1个参与方中的第一布隆过滤器的长度。第1个参与方作为数据接收者，接收的是第w个位置的元素，第2个参与方时数据发送者，发送的数据是GBF_0和GBF’_0中第w个位置的元素。

OT的选择在第1个参与方中，第一布隆过滤器的第w个位置对应的值为BF[w]

（0，1），被选择的数为（GBF’_0[w]，GBF_0[w]）。

经过不经意传输协议的数据传输之后，第1个参与方获得比对混淆布隆过滤器GBF’。

S1086、第1个参与方根据所述比对混淆布隆过滤器和第1个参与方对应的混淆布隆过滤器确定目标交集数据集合。

在上述步骤中，第1个参与方本身有混合布隆过滤器GBF_1，接收了第2个参与方发送的比对混淆布隆过滤器GBF’，通过混合布隆过滤器GBF_1和比对混淆布隆过滤器GBF’，即可获得最终的目标交集数据集合。

具体的，第1个参与方根据所述比对混淆布隆过滤器和第1个参与方对应的混淆布隆过滤器确定目标交集数据集合，包括：

在所述第1个参与方对应的业务数据集合中确定目标待处理数据；

根据所述预设数量的哈希函数确定所述目标待处理数据对应的位置信息集合；

根据所述位置信息集合在所述比对混淆布隆过滤器和第1个参与方对应的混淆布隆过滤器中确定待比对随机数集合；

对所述待比对随机数集合中的待比对随机数进行异或处理，在异或处理结果为0的情况下，确定所述目标待处理数据为目标交集数据。

在实际应用中，第1个参与方对应的业务数据集合X_1，在X_1中确定目标待处理数据xs，并根据k个哈希函数在GBF_1中找到k个位置信息，并在GBF’中确定对应的k个位置信息，从GBF_1对应的k个位置信息和GBF’对应的k个位置信息中取出随机数，并添加到待比对随机数集合中。

将待比对随机数集合中的所有随机数进行异或处理，并获得最终的异或处理结果，当异或处理结果为0时，说明该目标待处理数据xs是各参与方都有的数据，即确定该目标待处理数据为目标交集数据。

本申请提供的多方隐私求交中的数据处理方法应用于数据处理系统，所述数据处理系统包括n个参与方，n为大于或等于2的整数，所述方法包括：在各参与方中同步预设数量的哈希函数；各参与方确定n-1个伪随机参数，并根据n-1个伪随机参数和业务数据集合生成各参与方对应的点对数据集合；根据各参与方对应的点对数据集合和预设数量的哈希函数，创建各参与方对应的混淆布隆过滤器；根据各参与方对应的混淆布隆过滤器，确定各参与方对应的目标交集数据集合。

通过本申请提供的方法，无需各参与方都与第1个参与方进行通信，极大的减小了通信开销，在最终恢复秘密的过程中，也无需交互，本地恢复即可。另外通过混淆布隆过滤器作为存储介质，可以保证数据安全，任何参与方仅能查询自己数据集内部的数据。

其次，选用不经意传输协议作为选择方案，保证了选择数据和被选择数据的安全。由于使用了混淆布隆过滤器，可以将多个参与方的不同数据集规模映射到等大的GBF中，统一了交互标准，减少了因数据集规模不同导致的计算困难。

下述结合附图5，以本申请提供的多方隐私求交中的数据处理方法在银行业务场景的应用为例，对所述多方隐私求交中的数据处理方法进行进一步说明。其中，图5示出了本申请一实施例提供的一种应用于银行业务场景的多方隐私求交中的数据处理方法的处理流程图，该方法包括5个银行方，具体包括以下步骤：

步骤502：为每个银行方进行编号。

步骤504：第1个银行方创建k个哈希函数，并将k个哈希函数同步至每个银行方。

步骤506：第i个银行方生成5-i个伪随机参数，并将第j个伪随机参数发送给第j个银行方，其中，

。

步骤508：第i个银行方根据预设伪随机函数、第i个银行方对应的黑名单数据和每个伪随机参数生成第i个银行方对应的黑名单数据的目标伪随机值。

步骤510：根据黑名单数据中每个黑名单和对应的目标伪随机值生成第i个银行方对应的点对数据集合。

步骤512：第i个银行方创建长度为k的混淆布隆过滤器GBF_i。

步骤514：第3、4、5个银行方将混淆布隆过滤器GBF_3、GBF_4、GBF_5发送给第2个银行方。

步骤516：第2个银行方将GBF_2、GBF_3、GBF_4、GBF_5中相同位置进行异或处理，获得待处理混淆布隆过滤器GBF_0，同时生成参考混淆布隆过滤器GBF’_0。

步骤518：第2个银行方根据不经意传输协议，将GBF_0和GBF’_0中的元素传输到的第1个银行方，以使第1个银行方获取到比对混淆布隆过滤器GBF。

步骤520：第1个银行方接收第2个银行方传输的比对混淆布隆过滤器GBF和自己的混淆布隆过滤器GBF_1，对第1个银行方中的黑名单数据进行比对。从而确定5个银行方中共同的黑名单。

通过本申请提供的方法，无需每个银行方都与第1个银行方进行通信，极大的减小了通信开销，在最终恢复秘密的过程中，也无需交互，本地恢复即可。另外通过混淆布隆过滤器作为存储介质，可以保证数据安全，任何银行方仅能查询自己数据集内部的数据。

其次，选用不经意传输协议作为选择方案，保证了选择数据和被选择数据的安全。由于使用了混淆布隆过滤器，可以将多个银行方的不同数据集规模映射到等大的GBF中，统一了交互标准，减少了因数据集规模不同导致的计算困难。

与上述方法实施例相对应，本申请还提供了多方隐私求交中的数据处理系统实施例，图6示出了本申请一实施例提供的一种多方隐私求交中的数据处理系统的结构示意图。如图6所示，所述多方隐私求交中的数据处理系统包括n个参与方，n为大于或等于2的整数，该系统包括：

可选的，所述同步模块，被配置为：

为各参与方按顺序进行编号；

第1个参与方，被配置为创建预设数量的哈希函数，并将所述预设数量的哈希函数同步至各参与方，其中，所述预设数量基于混淆布隆过滤器的长度确定。

可选的，第i个参与方，被配置为生成n-i个伪随机参数，并将第j个伪随机参数发送给第j个参与方，其中，

；

第i个参与方，进一步被配置为根据第i个参与方对应的业务数据集合和n-1个伪随机参数生成第i个参与方对应的点对数据集合。

可选的，第i个参与方，进一步被配置为：

在所述业务数据集合中确定目标业务数据；

可选的，第i个参与方，进一步被配置为：

可选的，各参与方，进一步被配置为：

确定目标参与方和所述目标参与方对应的目标点对数据集合，并在所述目标点对数据集合中确定待处理目标业务数据和待处理目标伪随机值；

创建初始混淆布隆过滤器；

根据每个哈希函数和所述待处理目标业务数据确定每个哈希函数对应的待处理哈希值；

在所述初始混淆布隆过滤器中确定每个待处理哈希值对应的待处理位置信息；

在每个待处理位置信息中存在空位置的情况下，根据所述待处理目标伪随机值生成目标随机数，并将所述目标随机数填充至所空位置。

可选的，各参与方，进一步被配置为：

可选的，每个编号大于2的参与方，被配置为将对应的混淆布隆过滤器发送至第2个参与方；

第2个参与方，被配置为将每个混淆布隆过滤器中相同位置的随机数进行异或处理，获得待处理混淆布隆过滤器，并基于所述待处理混淆布隆过滤器随机生成参考混淆布隆过滤器，基于所述待处理混淆布隆过滤器和所述参考混淆布隆过滤器向第1个参与方发送比对混淆布隆过滤器；

第1个参与方，被配置为根据所述比对混淆布隆过滤器和第1个参与方对应的混淆布隆过滤器确定目标交集数据集合。

可选的，所述系统还包括：

第1个参与方，被配置为根据第1个参与方对应的业务数据集合和预设数量的哈希函数生成第一布隆过滤器，其中，所述第一布隆过滤器的长度为b；

相应的，第2个参与方，进一步被配置为：

。

可选的，第1个参与方，进一步被配置为：

通过本申请提供的系统，无需各参与方都与第1个参与方进行通信，极大的减小了通信开销，在最终恢复秘密的过程中，也无需交互，本地恢复即可。另外通过混淆布隆过滤器作为存储介质，可以保证数据安全，任何参与方仅能查询自己数据集内部的数据。

上述为本实施例的一种多方隐私求交中的数据处理系统的示意性方案。需要说明的是，该多方隐私求交中的数据处理系统的技术方案与上述的多方隐私求交中的数据处理方法的技术方案属于同一构思，多方隐私求交中的数据处理系统的技术方案未详细描述的细节内容，均可以参见上述多方隐私求交中的数据处理方法的技术方案的描述。

图7示出了根据本申请一实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接，数据库750用于保存数据。

计算设备700还包括接入设备740，接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网（PSTN，PublicSwitchedTelephone Network）、局域网（LAN，Local Area Network）、广域网（WAN，WideAreaNetwork）、个域网（PAN，Personal AreaNetwork）或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口（例如，网络接口卡（NIC，networkinterface controller））中的一个或多个，诸如IEEE802.11无线局域网（WLAN，Wireless LocalArea Network）无线接口、全球微波互联接入（Wi-MAX，WorldwideInteroperability for Microwave Access）接口、以太网接口、通用串行总线（USB，Universal Serial Bus）接口、蜂窝网络接口、蓝牙接口、近场通信（NFC，NearFieldCommunication）接口，等等。

在本申请的一个实施例中，计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图7所示的计算设备结构框图仅仅是出于示例的目的，而不是对本申请范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备700可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备（例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等）、移动电话（例如，智能手机）、可佩戴的计算设备（例如，智能手表、智能眼镜等）或其他类型的移动设备，或者诸如台式计算机或个人计算机（PC，PersonalComputer）的静止计算设备。计算设备700还可以是移动式或静止式的服务器。

其中，处理器720执行所述计算机指令时实现所述的多方隐私求交中的数据处理方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的多方隐私求交中的数据处理方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述多方隐私求交中的数据处理方法的技术方案的描述。

本申请一实施例还提供一种计算机可读存储介质，其存储有计算机指令，该计算机指令被处理器执行时实现如前所述多方隐私求交中的数据处理方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的多方隐私求交中的数据处理方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述多方隐私求交中的数据处理方法的技术方案的描述。

上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random AccessMemory）、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。根据本申请的内容，可作很多的修改和变化。本申请选取并具体描述这些实施例，是为了更好地解释本申请的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种多方隐私求交中的数据处理方法，其特征在于，所述方法应用于数据处理系统，所述数据处理系统包括n个参与方，n为大于或等于2的整数，所述方法包括：

在各参与方中同步预设数量的哈希函数；

每个编号大于2的参与方将对应的混淆布隆过滤器发送至第2个参与方；

第2个参与方将每个混淆布隆过滤器中相同位置的随机数进行异或处理，获得待处理混淆布隆过滤器，并基于所述待处理混淆布隆过滤器随机生成参考混淆布隆过滤器，基于所述待处理混淆布隆过滤器和所述参考混淆布隆过滤器向第1个参与方发送比对混淆布隆过滤器；

第1个参与方根据所述比对混淆布隆过滤器和第1个参与方对应的混淆布隆过滤器确定目标交集数据集合。

2.如权利要求1所述的方法，其特征在于，在各参与方中同步预设数量的哈希函数，包括：

为各参与方按顺序进行编号；

3.如权利要求2所述的方法，其特征在于，各参与方确定n-1个伪随机参数，并根据n-1个伪随机参数和业务数据集合生成各参与方对应的点对数据集合，包括：

；

4.如权利要求3所述的方法，其特征在于，根据第i个参与方对应的业务数据集合和n-1个伪随机参数生成第i个参与方对应的点对数据集合，包括：

在所述业务数据集合中确定目标业务数据；

5.如权利要求4所述的方法，其特征在于，根据预设伪随机函数、所述目标业务数据和每个伪随机参数生成所述目标业务数据对应的目标伪随机值，包括：

6.如权利要求1所述的方法，其特征在于，根据各参与方对应的点对数据集合和预设数量的哈希函数，创建各参与方对应的混淆布隆过滤器，包括：

创建初始混淆布隆过滤器；

7.如权利要求6所述的方法，其特征在于，根据所述待处理目标伪随机值生成目标随机数，包括：

8.如权利要求1所述的方法，其特征在于，所述方法还包括：

第1个参与方根据第1个参与方对应的业务数据集合和预设数量的哈希函数生成第一布隆过滤器，其中，所述第一布隆过滤器的长度为b；

相应的，基于所述待处理混淆布隆过滤器和所述参考混淆布隆过滤器向第1个参与方发送比对混淆布隆过滤器，包括：

。

9.如权利要求1所述的方法，其特征在于，第1个参与方根据所述比对混淆布隆过滤器和第1个参与方对应的混淆布隆过滤器确定目标交集数据集合，包括：

10.一种多方隐私求交中的数据处理系统，其特征在于，所述多方隐私求交中的数据处理系统包括n个参与方，n为大于或等于2的整数，所述系统包括：

每个编号大于2的参与方，被配置为将对应的混淆布隆过滤器发送至第2个参与方；

11.一种计算设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，其特征在于，所述处理器执行所述计算机指令时实现权利要求1-9任意一项所述方法的步骤。

12.一种计算机可读存储介质，其存储有计算机指令，其特征在于，该计算机指令被处理器执行时实现权利要求1-9任意一项所述方法的步骤。