WO2023098294A1

WO2023098294A1 - 异构数据处理方法、装置及电子设备

Info

Publication number: WO2023098294A1
Application number: PCT/CN2022/124375
Authority: WO
Inventors: 严强; 廖飞强; 李昊轩; 王朝阳; 李辉忠; 张开翔; 范瑞彬
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2021-12-02
Filing date: 2022-10-10
Publication date: 2023-06-08
Also published as: CN114154196A

Abstract

本申请实施例提供一种异构数据处理方法、装置及电子设备，所述方法包括：获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合，根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合，根据匹配标识符集合以及各盲化标识符集合生成与各用户端对应的标识符记录信息，并将与各用户端对应的标识符记录信息分别发送至对应的用户端，以使用户端根据接收到的标识符记录信息进行异构数据解密计算，得到待处理业务的明文处理结果。该实施例可以降低用户信息泄露的风险，进而提高用户的使用体验。

Description

异构数据处理方法、装置及电子设备

本申请要求于2021年12月2日提交中国专利局、申请号为202111462228.9、申请名称为“异构数据处理方法、装置及电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及区块链技术领域，尤其涉及一种异构数据处理方法、装置及电子设备。

背景技术

随着互联网技术的发展，各机构之间的交互越来越频繁，在实现金融业务时，可能会涉及到不同机构之间的异构数据联合进行计算的情况。

现有技术中，在进行异构数据联合计算时，可以先通过隐私求交的方式来进行样本对齐，获得各方共有的样本记录中的明文标识信息，然后对明文标识信息对应的数据集进行安全多方计算或者联邦学习算法，实现跨机构的异构数据联合计算。

然而，在现实业务中，在进行样本对齐时，输出的为共有的明文信息，即所有参与计算的机构都可以获取其他机构与自己共有的信息，增大了用户信息泄露的风险，进而增大了合规风险，影响了用户的使用体验。

发明内容

本申请的目的在于提供一种异构数据处理方法、装置及电子设备，以降低用户信息泄露的风险。

第一方面，本申请公开了一种异构数据处理方法，应用于协作方端，包括：

获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合；

根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合；

根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息，并将与所述各用户端对应的标识符记录信息分别发送至对应的用户端，以使所述用户端根据接收到的标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。

可选的，所述根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合，包括：

对不同用户端对应的盲化标识符集合进行比对处理，确定所述不同用户端对应的盲化标识符集合的交集，得到匹配标识符集合。

可选的，所述根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息，包括：

删除所述各盲化标识符集合中与所述匹配标识符集合对应的盲化标识符，得到各用户端对应的私有标识符集合；

对所述匹配标识符集合以及所述补齐之后的各用户端对应的私有标识符集合进行混合处理，得到对齐样本集合；

针对所述对齐样本集合中的每个对齐样本，若所述对齐样本属于所述匹配标识符集合，则根据预存的第一生成规则生成与所述各用户端对应的标识符记录信息；

若所述对齐样本属于所述各用户端对应的私有标识符集合，则根据预存的第二生成规则生成与所述各用户端对应的标识符记录信息。

可选的，所述若所述对齐样本属于所述匹配标识符集合，则根据预存的第一生成规则生成与所述各用户端对应的标识符记录信息，包括：

若所述对齐样本属于所述匹配标识符集合，则随机生成一对关于数值1的第一私密分片数据；

根据所述对齐样本以及所述第一私密分片数据生成与所述各用户端对应的标识符记录信息。

可选的，所述若所述对齐样本属于所述各用户端对应的私有标识符集合，则根据预存的第二生成规则生成与所述各用户端对应的标识符记录信息，包括：

若所述对齐样本属于所述各用户端对应的私有标识符集合，则随机生成一对关于数值0的第二私密分片数据；

根据所述对齐样本以及所述第二私密分片数据生成与所述各用户端对应的标识符记录信息。

可选的，所述根据预设的补齐规则对所述各用户端对应的私有标识符集合进行补齐处理，得到补齐之后的各用户端对应的私有标识符集合，包括：

确定所述各用户端对应的私有标识符集合中私有标识符数量最多的目标私有标识符集合；

根据所述目标私有标识符集合中私有标识符的数量对所述各用户端对应的私有标识符集合中除所述目标私有标识符集合之外的其他私有标识符集合进行补齐处理，得到补齐之后的各用户端对应的私有标识符集合。

可选的，在所述根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息之后，还包括：

根据预存的哈希函数对所述与所述各用户端对应的标识符记录信息进行转换处理，得到转换之后的标识符记录信息；

将所述转换之后的标识符记录信息上传至预设的区块链中。

可选的，在所述获取各用户端发送的待处理业务盲化处理之后的盲化标识符集合之前，还包括：

根据预设的通道构建规则构建所述协作方端与所述各用户端之间的数据传输通道；

则所述获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合，包括：

通过预先构建的数据传输通道获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合。

第二方面，本申请公开了一种异构数据处理方法，应用于用户端，包括：

根据预存的盲化处理规则对待处理业务对应的标识符数据进行盲化处理，得到盲化标识符集合；

将所述盲化标识符集合发送至协作方端，以使所述协作方端根据各用户端发送的所述盲化标识符集合进行匹配处理，得到匹配标识符集合，再根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息；

接收所述协作方端发送的若干标识符记录信息，并根据所述若干标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。

可选的，所述根据预存的盲化处理规则对待处理业务对应的标识符数据进行盲化处理，得到盲化标识符集合，包括：

根据预设的盲化参数处理规则确定盲化参数；

根据预设的哈希函数对所述盲化参数以及所述待处理业务对应的标识符数据进行处理，得到初始盲化标识符集合；

根据预设的噪声生成规则生成预设数量的，且与所述初始盲化标识符集合不重复的噪声标识符；

根据所述噪声标识符和所述初始盲化标识符集合得到盲化标识符集合。

可选的，所述根据预设的盲化参数处理规则确定盲化参数，包括：

随机确定一第一初始盲化参数，同时接收其他用户端发送的第二初始盲化参数；

对所述第一初始盲化参数和所述第二初始盲化参数做异或运算，得到盲化参数。

可选的，所述标识符记录信息中包含标识符位置，所述根据所述若干标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果，包括：

针对每个所述标识符记录信息，根据所述标识符位置判断所述标识符记录信息是否为噪声标识符；

若所述标识符记录信息不是噪声标识符，则根据所述标识符位置以及所述待处理业务对应的标识符数据确定所述标识符位置对应的第一初始数据；

根据预设联合计算处理规则对所述第一初始数据以及其他用户端发送的第二初始数据联合进行处理，得到所述标识符记录信息对应的中间结果分片；

对每个所述标识符记录信息对应的中间结果分片进行聚合处理，得到中间结果，并根据预设的安全多方计算协议对所述中间结果进行解密处理，得到所述待处理业务的明文处理结果。

可选的，所述标识符记录信息中包含第一私密分片数据或第二私密分片数据生成的子私密分片数据，所述根据预设联合计算处理规则对所述第一初始数据以及其他用户端发送的第二初始数据联合进行处理，得到所述标识符记录信息对应的中间结果分片，包括：

根据预设的分片规则对所述第一初始数据进行分片处理，得到若干第一初始子数据；

将所述若干第一初始子数据中预设数量的第一初始子数据发送至其他用户端，得到第一剩余初始子数据，同时接收所述其他用户端发送的预设数量的第二外发初始子数据，其中，所述第二外发初始子数据为其他用户端中的第二子数据根据预设的分片规则进行分片处理得到的；

根据预设的私密共享协议对所述第一剩余初始子数据、所述第二外发初始子数据、第一子私密分片数据以及所述其他用户端中的第二剩余初始子数据、第一外发初始子数据和第二子私密分片数据联合进行计算，得到所述标识符记录信息对应的中间结果分片，其中，所述第一子私密分片数据为本地用户端对应的标识符记录信息中包含的子私密分片数据，所述第二子私密分片数据为所述其他用户端对应的标识符记录信息中包含的子私密分片数据。

可选的，还包括：

若所述标识符记录信息是噪声标识符，则将所述标识符位置对应的数据设置为零。

可选的，在所述得到所述待处理业务的明文处理结果之后，还包括：

根据预存的哈希函数对所述待处理业务的明文处理结果进行转换处理，得到转换之后的明文处理结果；

将所述转换之后的明文处理结果上传至预设的区块链中。

第三方面，本申请公开一种异构数据处理装置，应用于协作方端，包括：

获取模块，用于获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合；

处理模块，用于根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合；

所述处理模块，还用于根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息，并将与所述各用户端对应的标识符记录信息分别发送至对应的用户端，以使所述用户端根据接收到的标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。

第四方面，本申请公开一种异构数据处理装置，应用于用户端，包括：

处理模块，用于根据预存的盲化处理规则对待处理业务对应的标识符数据进行盲化处理，得到盲化标识符集合；

发送模块，用于将所述盲化标识符集合发送至协作方端，以使所述协作方端根据各用户端发送的所述盲化标识符集合进行匹配处理，得到匹配标识符集合，再根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息；

所述处理模块，还用于接收所述协作方端发送的所述若干标识符记录信息，并根据所述若干标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。

第五方面，本申请公开一种电子设备，包括：处理器，以及与所述处理器通信连接的存储器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，以实现如第一方面以及第二方面中任一项所述的异构数据处理方法。

第六方面，本申请公开一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，以实现如第一方面以及第二方面中任一项所述的异构数据处理方法。

第七方面，本申请公开一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时，以实现如第一方面以及第二方面中任一项所述的异构数据处理方法。

本申请实施例提供了一种异构数据处理方法、装置及电子设备，采用上述方案后，协作方端可以先获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合，然后根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合，并根据匹配标识符集合以及各盲化标识符集合生成与各用户端对应的标识符记录信息，并将与各用户端对应的标识符记录信息分别发送至对应的用户端，以使用户端根据接收到的标识符记录信息进行异构数据解密计算，得到待处理业务的明文处理结果，通过加入只处理盲化处理之后的非敏感密文数据的协作方端来实现样本对齐的方式，克服了传统的样本对齐方式中需要披露多方共有的样本标识符集合的问题，降低了用户信息泄露的风险，提高了异构数据盲化处理的安全性，降低了合规风险，进而提高了用户的使用体验。

附图说明

图1为本申请实施例提供的异构数据处理方法的应用系统的架构示意图；

图2为本申请实施例提供的异构数据处理方法的流程示意图；

图3为本申请另一实施例提供的异构数据处理方法的流程示意图；

图4为本申请实施例提供的异构数据处理装置的结构示意图；

图5为本申请实施例提供的电子设备的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例还能够包括除了图示或描述的那些实例以外的其他顺序实例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

现有技术中，可以通过不同的终端设备(可以为用户端)表示不同的机构，不同的用户端可以各自拥有不同字段的异构数据集，在不相互提供自身敏感数据明文的前提下，可以根据数据集记录的标识符执行样本对齐之后，进行聚合统计运算。例如，用户端甲方拥有100条关于敏感数据X1的记录(id，X1)，用户端乙方拥有50条关于敏感数据X2的记录(id，X2)。甲乙双方共同拥有的id集合大小为40，在进行样本对齐之后，即可以找出共同拥有的40条记录，并计算该40条记录的敏感数据积的和数Y＝SUM(X1*X2)，即可实现异构数据的联合运算。然而，在现实业务中，在进行样本对齐时，输出的为共有的明文信息，即所有参与计算的机构都可以获取其他机构与自己共有的信息，增大了用户信息泄露的风险，进而增大了合规风险，影响了用户的使用体验。

基于上述技术问题，本申请通过加入只处理盲化处理之后的非敏感密文数据的协作方端来实现样本对齐的方式，克服了传统的样本对齐方式中需要披露多方共有的样本标识符集合的问题，降低了用户信息泄露的风险，提高了异构数据盲化处理的安全性，降低了合规风险，进而提高了用户的使用体验。

图1为本申请实施例提供的异构数据处理方法的应用系统的架构示意图，如图1所示，所述应用系统可以包括：协议方端101以及不同的用户端102，其中，用户端102可以为两个、三个或多个。各用户端102可以对本地存储的待处理业务对应的标识符集合进行盲化处理，得到盲化标识符集合，然后可以将盲化标识符集合发送至协议方端101进行样本对齐处理，生成与各用户端对应的标识符记录信息。再将与各用户端对应的标识符记录信息发送至对应的用户端，以使用户端根据接收到的标识符记录信息进行异构数据解密计算，得到待处理业务的明文处理结果。

其中，协作方端101可以为单独的服务器，也可以为服务器集群。用户端102可以为单独的服务器，也可以为服务器集群，还可以为个人电脑，智能手机、平板等设备。且各用户端可以为相同的设备，也可以为不同的设备。

下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例不再赘述。

图2为本申请实施例提供的异构数据处理方法的流程示意图，本实施例的方法可以由协议方端101执行。如图2所示，本实施例的方法，可以包括：

S201：获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合。

在本实施例中，在实现待处理业务时，可以先从不同的用户端获取待处理业务对应的数据，然后根据获取到的待处理业务对应的异构数据联合进行处理，进而实现待处理业务。

然而，由于不同用户端中的数据可能有多个，在实现待处理业务时，有的数据可能会被用到，有的数据可能用不到，因此，需要对数据进行样本对齐处理，得到在实现待处理业务过程中，需要用到的相关数据。为了提高样本对齐的效率，可以增加一协议方端，通过用户端向协议方端发送代表数据的标识符集合的方式来实现样本对齐处理的过程，进而提高样本对齐过程的处理效率。

然而，在各用户端向协议方端发送标识符集合的过程中，有可能造成数据的泄露。为了降低数据泄露的风险，各用户端可以先对待处理业务对应的标识符集合进行盲化处理，得到盲化处理之后的盲化标识符集合，然后再将盲化标识符集合发送至协作方端。

其中，盲化标识符集合中可以有多个盲化标识符，每个盲化标识符为一个盲化处理之后的数据标识。示例性的，数据标识可以为数据id，盲化标识符可以为盲化处理之后的id。例如，盲化处理之前的数据标识可以为A0001，盲化处理之后的数据标识为0xAF12C3。

此外，盲化处理方式可以根据实际应用场景自定义进行设置，在此不再详细进行定义。

S202：根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合。

在本实施例中，在得到各用户端盲化处理后的盲化标识符集合之后，可以对不同用户端的盲化标识符集合进行匹配处理，得到包含不同盲化标识符集合中相同的标识符信息的匹配标识符集合。

进一步的，根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合，具体可以包括：

具体的，可以先对不同用户端对应的盲化标识符集合进行比对处理，确定不同用户端对应的盲化标识符集合中相同的标识符信息，然后可以将所有相同的标识符信息分配到一个新的集合中，得到匹配标识符集合。

S203：根据匹配标识符集合以及各盲化标识符集合生成与各用户端对应的标识符记录信息，并将与各用户端对应的标识符记录信息分别发送至对应的用户端，以使用户端根据接收到的标识符记录信息进行异构数据解密计算，得到待处理业务的明文处理结果。

在本实施例中，在得到匹配标识符集合之后，可以根据匹配标识符集合中的每个盲化标识符信息以及各盲化标识符集合中的盲化标识符信息生成与各用户端对应的标识符记录信息，然后再将与各用户端对应的标识符记录信息分别发送至对应的用户端，以使用户端根据标识符记录信息进行处理，得到待处理业务的明文处理结果。

进一步的，根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息，具体可以包括：

删除所述各盲化标识符集合中与所述匹配标识符集合对应的盲化标识符，得到各用户端对应的私有标识符集合。

具体的，可以分别将用户端对应的盲化标识符集合中匹配标识符集合对应的盲化标识符移除，得到各用户端对应的私有标识符集合。

此外，私有标识符集合的数量可以为零个，可以为一个，也可以为多个。若所有用户端中的盲化标识符集合均相同，则私有标识符集合的数量为零个。若仅有一个用户端的盲化标识符集合包含除匹配标识符集合中的盲化标识符之外的其他盲化标识符，则私有标识符集合的数量为一个。

根据预设的补齐规则对所述各用户端对应的私有标识符集合进行补齐处理，得到补齐之后的各用户端对应的私有标识符集合。

具体的，在对私有标识符集合进行补齐时，具体的处理过程可以为：

确定所述各用户端对应的私有标识符集合中私有标识符数量最多的目标私有标识符集合。

对应的，可以先从私有标识符集合中确定包含私有标识符数量最多的目标私有标识符集合，然后将其他的私有标识符集合中的私有标识符的数量补齐到与目标私有标识符集合中的私有标识符数据一致，即补齐之后的所有私有标识符集合中包含的私有标识符数量是一致的，为后续进行分析处理提供了便利性。其中，私有标识符集合中的私有标识符为盲化处理后的盲化标识符。

其中，在对私有标识符集合进行补齐处理时，可以通过现有的噪声标识符生成规则生成与现有的盲化标识符不重复的噪声标识符的方式进行补齐。

对所述匹配标识符集合以及所述补齐之后的各用户端对应的私有标识符集合进行混合处理，得到对齐样本集合。

具体的，在对私有标识符集合进行补齐之后，为了提高后续数据处理过程的安全性，可以将匹配标识符集合中的数据与补齐之后的各用户端对应的私有标识符集合中的数据随机进行混合，得到混合之后的对齐样本集合。其中，对齐样本集合中的每个对齐样本都有对应的样本编号。

通过将数据进行混合的方式来打乱之前的数据排列顺序，进一步降低了数据泄露的可能性，进而提高了数据传输的安全性。

针对所述对齐样本集合中的每个对齐样本，若所述对齐样本属于所述匹配标识符集合，则根据预存的第一生成规则生成与所述各用户端对应的标识符记录信息。

具体的，在得到混合处理之后的对齐样本集合后，可以随机从对齐样本集合中选择对齐样本，然后根据对齐样本中包含的样本标识确定对齐样本的原始来源，即确定对齐样本是属于匹配标识符集合还是各用户端对应的私有标识符集合，再根据对齐样本的原始来源来确定对应的生成规则，并根据对应的生成规则生成各用户端对应的标识符记录信息。

进一步的，若所述对齐样本属于所述匹配标识符集合，则根据预存的第一生成规则生成与所述各用户端对应的标识符记录信息，具体可以包括：

若所述对齐样本属于所述匹配标识符集合，则随机生成一对关于数值1的第一私密分片数据。

此外，若所述对齐样本属于所述各用户端对应的私有标识符集合，则根据预存的第二生成规则生成与所述各用户端对应的标识符记录信息，具体可以包括：

若所述对齐样本属于所述各用户端对应的私有标识符集合，则随机生成一对关于数值0的第二私密分片数据。

其中，关于数值1的第一私密分片数据为和为1的一组第一私密分片数据，且第一私密分片数据的数量与用户端的数量相对应。示例性的，若用户端有两个，在生成关于数值1的第一私密分片数据时，先随机生成一随机数r_w，然后再生成第一私密分片数据为selector_w＝(r_w，1–r_w)。同理，关于数值0的第二私密分片数据为和为0的一组第二私密分片数据，且第二私密分片数据的数量与用户端的数量相对应。示例性的，若用户端有两个，在生成关于数值0的第二私密分片数据时，先随机生成一随机数r_w，然后再生成第二私密分片数据为selector_w＝(r_w，–r_w)。

在得到第一私密分片数据或第二私密分片数据之后，可以根据对齐样本以及得到的第一私密分片数据或第二私密分片数据生成与各用户端相对应的标识符记录信息，即删除掉与其他用户端相关的信息之后的标识符记录信息，然后将生成的与用户端对应的标识符记录信息发送至对应的用户端。

示例性的，假定有两个用户端，分别为用户端A和用户端B，用户端A有四条数据样例，表1为用户端A的数据样例表，数据样例中分别包括标识符信息以及对应的具体数据。其中，用户端A中的具体数据为收入水平(income)。

表1用户端A的数据样例表

id	income
A0001	100
A0002	300

A0003	200
A0004	150

用户端B有六条数据样例，表2为用户端B的数据样例表，数据样例中分别包括标识符信息以及对应的具体数据。其中，用户端B中的具体数据为税收(tax_rate)。

表2用户端B的数据样例表

Id	tax_rate
A0001	0.10
A0003	0.35
A0004	0.2
A0005	0.25
A0007	0.3
A0009	0.22

然后用户端A可以对用户端A的标识符信息(即Id)进行盲化处理，得到用户端A对应的盲化标识符集合id_bn_A＝{标识符位置pos_A_i，标识符数据id_bn_A_i}。用户端B可以对用户端B的标识符信息(即Id)进行盲化处理，得到用户端B对应的盲化标识符集合id_bn_B＝{标识符位置pos_B_i,标识符数据id_bn_B_i}。然后用户端A和用户端B可以将各自的盲化标识符集合发送至协作方端C。协作方端C接收到用户端A和用户端B发送的盲化标识符集合之后，可以对用户端A和用户端B的盲化标识符集合进行比对，找到所有相同的盲化标识符，得到匹配标识符集合id_match。对应的，匹配标识符集合id_match中有三个相同的盲化标识符，即A0001、A0003和A0004盲化处理之后得到的盲化标识符0xAF12C3、0xCC6712、0x2E341B。另外，还可以得到两个私有标识符集合，即用户端A对应的私有标识符集合id_rest_A和用户端B对应的私有标识符集合id_rest_B。且协作方端C无法看到标识符明文，只能看到盲化后的标识符，降低了标识符信息泄露的风险。

进一步的，协作方端C可以选取id_rest_A与id_rest_B中较大的集合的大小size_rest_large＝max(size(id_rest_A)，size(id_rest_B))条记录，然后对应较小的集合添加不重复的噪声标识符，补齐到size_rest_large的大小，得到大小相同的补齐后的id_rest_A与id_rest_B两个集合。其中，对应的标识符位置字段pos_A_i或pos_B_i相应递增。对应的，用户端B比用户端A多2条数据，协作方端C将向id_rest_A中插入2条噪声标识符，使其数据量与id_rest_B相同。然后，协作方端C可以将id_match、id_rest_A和id_rest_B三个集合中的元素打乱混合成一个完整的对齐样本集合BAS，然后可以随机从对齐样本集合中选取第w组的对齐样本，若第w组的对齐样本来自id_match，则生成一对关于数值1的第一秘密分片数据selector_w＝(r_w，1–r_w)，其中r_w为每次独立新生成的随机数，最终得到的对齐样本为(idx_w，pos_A_i，pos_B_j，selector_w)。其中，该对齐样本也为盲化后的样本对齐集合。

另外，若第w组的对齐样本不是来自id_match，则随机从id_rest_A和id_rest_B中分别选取一组数据，生成一对关于数据0的第二秘密分片数据selector_w＝(r_w，-r_w)，其中r_w为每次独立新生成的随机数，最终得到的对齐样本为(idx_w，pos_A_i，pos_B_j，selector_w)。其中，每次数据选取为不放回的采样，下一次不会选到之前选过的数据。然后协作方端C可以根据对齐样本为(idx_w，pos_A_i，pos_B_j，selector_w)得到用户端A和用户端B对应的标识符记录信息，即用户端A对应的标识符记录信息为(idx_w，pos_A_i，selector_w[0])，用户端B对应的标识符记录信息为(idx_w，pos_B_j，selector_w[1])。协作方端C可以通过预先设置的Channel_AC向用户端A发送(idx_w，pos_A_i，selector_w[0])，可以通过预先设置的Channel_BC向用户端B发送(idx_w，pos_B_j，selector_w[1])。

更进一步的，待处理业务可以是转账、查询余额、贷款等业务。在本实施例中，待处理业务为计算纳税总额，即通过表达式SUM(income*tax_rate)来确定纳税总额。因此，用户端A和用户端B在接收到标识符记录信息之后，可以根据接收到的(idx_w，pos_A_i，selector_w[0])和(idx_w，pos_B_j，selector_w[1])来进行异构数据解密计算，得到纳税总额。

采用上述方案后，协作方端可以先获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合，然后根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到相同的标识符信息，并根据相同的标识符信息以及各盲化标识符集合得到匹配标识符集合，再根据匹配标识符集合以及各盲化标识符集合生成与各用户端对应的标识符记录信息，并将与各用户端对应的标识符记录信息分别发送至对应的用户端，以使用户端根据接收到的标识符记录信息进行异构数据解密计算，得到待处理业务的明文处理结果，通过加入只处理盲化处理之后的非敏感密文数据的协作方端来实现样本对齐的方式，克服了传统的样本对齐方式中需要披露多方共有的样本标识符集合的问题，降低了用户信息泄露的风险，提高了异构数据处理的安全性，降低了合规风险，进而提高了用户的使用体验。

基于图2的方法，本说明书实施例还提供了该方法的一些具体实施方案，下面进行说明。

此外，在另一实施例中，在根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息之后，所述还可以包括：

根据预存的哈希函数对所述与所述各用户端对应的标识符记录信息进行转换处理，得到转换之后的标识符记录信息。

将所述转换之后的标识符记录信息上传至预设的区块链中。

在本实施例中，为了提高数据的安全性，可以在得到标识符记录信息之后，将标识符记录信息上传至预设的区块链中，防止其他用户端进行篡改，支持事后审计。此外，在各用户端得到盲化后的盲化标识符集合之后，也可以根据预存的哈希函数对盲化标识符集合进行转换处理，得到转换之后的盲化标识符集合，然后可以将转换之后的盲化标识符集合上传至预设的区块链中。其中，区块链可以为通过现有方式实现的，在此不再详细进行限定。

此外，在另一实施例中，在所述获取各用户端发送的待处理业务盲化处理之后的盲化标识符集合之前，所述方法还可以包括：

根据预设的通道构建规则构建所述协作方端与所述各用户端之间的数据传输通道。

则获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合，具体可以包括：

在本实施例中，各用户端可以先获取自己的私钥与公钥，然后相互发送各自的公钥，再基于接收到的公钥构建对应的数据传输通道。示例性的，假设有用户端A和用户端B两个用户端，用户端A从权威证书颁发机构处为自己的私钥sk_A申请包含公钥pk_A的证书，用户端B从权威证书颁发机构处为自己的私钥sk_B申请包含公钥pk_B的证书，用户端A和用户端B相互发送各自公钥，并基于相关的证书核实其真实。然后用户端A和用户端B基于对方的公钥，构建一个防窃听的安全信道，即数据传输通道Channel_AB，当用户端A向用户端B发送消息m时，通过Channel_AB进行发送，即先通过B的公钥pk_B加密，然后发送给B，B收到之后，用自己的私钥sk_B解密，获得m的明文,反之亦然。此外，还可以引入第三个不经手敏感数据的协作方端C，重复上述步骤，构建对应的安全信道Channel_AC和Channel_BC，通过数据传输通道来传输数据的方式，提高了数据传输的安全性。

图3为本申请另一实施例提供的异构数据处理方法的流程示意图，本实施例的方法可以由用户端102执行。如图3所示，本实施例的方法，可以包括：

S301：根据预存的盲化处理规则对待处理业务对应的标识符数据进行盲化处理，得到盲化标识符集合。

在本实施例中，对于各用户端中待处理业务对应的至少一标识符数据，可以根据预存的盲化处理规则进行处理，得到盲化标识符集合。

进一步的，根据预存的盲化处理规则对待处理业务对应的标识符数据进行盲化处理，得到盲化标识符集合，具体可以包括：

根据预设的盲化参数处理规则确定盲化参数。

根据预设的哈希函数对所述盲化参数以及所述待处理业务对应的标识符数据进行处理，得到初始盲化标识符集合。

根据预设的噪声生成规则生成预设数量的，且与所述初始盲化标识符集合不重复的噪声标识符。

根据噪声标识符和所述初始盲化标识符集合得到盲化标识符集合。

具体的，在根据预设的盲化参数处理规则确定盲化参数时，可以随机确定一第一初始盲化参数，同时接收其他用户端发送的第二初始盲化参数。

然后对所述第一初始盲化参数和所述第二初始盲化参数做异或运算，得到盲化参数。其中，第二初始盲化参数可以为一个或多个。

此外，在根据预设的噪声生成规则生成预设数量的，且与所述初始盲化标识符集合不重复的噪声标识符时，可以先根据预设的噪声生成率生成N个与现有的初始盲化标识符集合中的盲化标识符不重复的噪声标识符，然后将N个噪声标识符加入到初始盲化标识符集合中，并打乱其顺序，得到盲化标识符集合。

示例性的，有用户端A和用户端B两个用户端，用户端A独立选取随机数b_A，将其作为盲化种子分片，通过Channel_AB发送给用户端B。用户端B独立选取随机数b_B，将其作为盲化种子分片，通过Channel_AB发送给用户端A。用户端A计算盲化参数b＝b_A XOR b_B。然后用户端A对于自己的N_A条记录中所有的id字段，可以依次计算id_b＝Hash(id,b)，获得N_A个盲化标识符集合id_b_A。例如，id_b＝Hash("A0001",b)＝一个与"A0001"对应的盲化字符串0xAF12C3，以此在样本对齐阶段避免了id明文数据的泄露。

另外，用户端A基于自己预算的噪音率rate_n，生成N_A*rate_n个与id_b_A中现有元素不重复的噪声标识符，并将生成的噪声标识符加到初始盲化标识符集合id_b_A中，然后打乱其顺序，最终获得的盲化标识符集合，记为id_bn_A＝{标识符位置pos_A_i，标识符数据id_bn_A_i}。

例如，N_A＝4，取rate_n＝50％，N_A*rate_n＝2，则向id_bn_A中加入2个噪声标识符，即盲化标识符集合中有4+2＝6条盲化标识符。

用户端B同理，可以生成自己的盲化标识符集合记为id_bn_B＝{标识符位置pos_B_i，标识符数据id_bn_B_i}。

其中，对于用户端A与用户端B共有的id，因输入相同，所以生成的盲化id值也相同。例如，id_b＝Hash("A0001"，b)＝一个与"A0001"对应的盲化字符串0xAF12C3，由此可用于后续的样本id盲化比对过程中确定匹配标识符集合。

S302：将盲化标识符集合发送至协作方端，以使协作方端根据各用户端发送的盲化标识符集合进行匹配处理，得到匹配标识符集合，再根据匹配标识符集合以及各盲化标识符集合生成与各用户端对应的标识符记录信息。

在本实施例中，用户端在得到盲化标识符集合之后，可以将盲化标识符通过预设的数据传输通道发送至协作方端。协作方端在接收到用户端发送的盲化标识符集合之后，还可以同时接收其他用户发送的盲化标识符集合，在接收到各用户端发送的盲化标识符集合之后，可以根据各用户端发送的盲化标识符集合进行处理，得到各用户端对应的若干标识符记录信息。其中，具体处理过程已在前述实施例中详细进行描述，在此不再重复进行限定。

S303：接收协作方端发送的若干标识符记录信息，并根据若干标识符记录信息进行异构数据解密计算，得到待处理业务的明文处理结果。

在本实施例中，协作方端在得到与各用户端对应的标识符记录信息之后，可以将得到的若干标识符记录信息返回至对应的用户端，用户端接收到返回的标识符记录信息之后，可以根据若干标识符记录信息进行异构数据解密计算，得到待处理业务的明文处理结果。

进一步的，标识符记录信息中包含标识符位置，则根据所述若干标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果，具体可以包括：

针对每个所述标识符记录信息，根据所述标识符位置判断所述标识符记录信息是否为噪声标识符。

若所述标识符记录信息不是噪声标识符，则根据所述标识符位置以及所述待处理业务对应的标识符数据确定所述标识符位置对应的第一初始数据。

根据预设联合计算处理规则对所述第一初始数据以及其他用户端发送的第二初始数据联合进行处理，得到所述标识符记录信息对应的中间结果分片。

具体的，每个标识符记录信息中均包含一标识符位置，即pos_A_i或pos_B_j，然后可以根据pos_A_i或pos_B_j确定是否为最初获取的数据集样例中的数据。其中，确定方式可以有多种，在此仅是列举了一种具体的实现方式，其他确定方式也在本申请的保护范围内。

更进一步的，标识符记录信息中包含第一私密分片数据或第二私密分片数据生成的子私密分片数据，所述根据预设联合计算处理规则对所述第一初始数据以及其他用户端发送的第二初始数据联合进行处理，得到所述标识符记录信息对应的中间结果分片，具体可以包括：

根据预设的分片规则对所述第一初始数据进行分片处理，得到若干第一初始子数据。

将所述若干第一初始子数据中预设数量的第一初始子数据发送至其他用户端，得到第一剩余初始子数据，同时接收所述其他用户端发送的预设数量的第二外发初始子数据，其中，所述第二外发初始子数据为其他用户端中的第二子数据根据预设的分片规则进行分片处理得到的。

具体的，其他用户端在发送第二外发初始子数据之后，剩余的数据可以称为第二剩余初始子数据。

此外，所述方法还可以包括：

示例性的，以用户端A和用户端B为例，用户端A在本地读取(idx_w，pos_A_i，selector_w[0])中的pos_A_i所指的记录相关数据，确定在最初的数据集样例中对应的income字段，具体可以为：

如果pos_A_i超出用户端A最初的数据集样例中的最大记录数，表明是协作端方C添加的噪声记录，将income设置为0。

如果pos_A_i指向用户端A原先自己添加的噪声记录，也将income设置为0。

否则，读取pos_A_i在最初的数据集样例中对应的真实income数据的字段。

此外，用户端A可以将income字段基于所选的安全多方计算协议(可选用经典的秘密共享协议)，生成一个新的随机数r_w，将income值v1_w拆分成两个随机分片集合v1_w＝(r_w，v1_w–r_w)，并将v1_w[0](即第一外发初始子数据)发送给用户端B。

用户端B在本地读取(idx_w，pos_B_j，selector_w[1])中的pos_B_j所指的记录相关数据，在最初的数据集样例中，对应tax_rate字段，具体可以为：

如果pos_B_i超出用户端B在最初的数据集样例中的最大记录数，表明是协作端方C添加的噪声记录，将tax_rate设置为0。

如果pos_B_i指向用户端B原先自己添加的噪音记录，也将tax_rate设置为0。

否则，读取pos_B_i指向包含真实tax_rate数据的字段。

此外，用户端B对tax_rate字段划分，将tax_rate值v2_w拆分成两个随机分片集合v2_w＝(r_w，v2_w–r_w)，并将v2_w[0](即第二外发初始子数据)发送给用户端A。

用户端A和用户端B基于现有的安全多方计算协议(如经典的秘密共享协议)，根据用户端A手中的分片数据v1_w[1](即第一剩余初始子数据)，v2_w[0](即第二外发初始子数据)，selector_w[0](即第一子私密分片数据)和用户端B手中的分片数据v1_w[0]， v2_w[1]，selector_w[1](即第二子私密分片数据)，在不泄露v1_w，v2_w，selector_w明文值效果下，联合计算得到v1_w*v2_w*selector_w相关的中间结果分片。

其中，只有当第w组包含正确的对齐数据时，selector_w的值才为1，此时计算将获得包含源自真实数据的密文中间结果，例如示例中A0001、A0003、A0004对应的数据，否则selector_w为0，对应密文中间结果也是0＝0*任意噪声标识符，由此消除了噪声标识符对最终结果的影响。

重复前述过程，直到完成对整个样本对齐集合的遍历，聚合每条标识符激励信息对应的中间结果分片后，基于安全多方计算协议(如经典的秘密共享协议)进行最终的解密，获得最后待处理业务的明文处理结果。

基于前述实施例，表3为样本对齐后的逻辑汇总表，具体包含用户端A和用户端B共有的标识符信息及对应的具体信息。

表3样本对齐后的逻辑汇总表

id	income	tax
A0001	100	0.10
A0003	200	0.35
A0004	150	0.2

即明文处理结果纳税总额SUM(income*tax_rate)＝100*0.10+200*0.35+150*0.2＝110。

可选的，用户端A和用户端B可以分别计算本地的分片数据的聚合Hash，并将其结果发送到区块链，进行存证。

此外，在另一实施例中，在得到所述待处理业务的明文处理结果之后，所述方法还可以包括：

根据预存的哈希函数对所述待处理业务的明文处理结果进行转换处理，得到转换之后的明文处理结果。

将所述转换之后的明文处理结果上传至预设的区块链中。

通过结合区块链的防篡改能力，对关键密码输入和最终的明文处理结果进行了链上存证，提高了数据的安全性，且支持事后审计。

基于同样的思路，本说明书实施例还提供了上述方法对应的装置，图4为本申请实施例提供的异构数据处理装置的结构示意图，应用于协作方端，如图4所示，本实施例提供的装置，可以包括：

获取模块401，用于获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合。

处理模块402，用于根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合。

在本实施例中，所述处理模块402，还用于：

所述处理模块402，还用于根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息，并将与所述各用户端对应的标识符记录信息分别发送至对应的用户端，以使所述用户端根据接收到的标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。

在本实施例中，所述处理模块402，还用于：

进一步的，所述处理模块402，还用于：

此外，所述处理模块402，还用于：

此外，所述处理模块，还用于：

此外，在另一实施例中，所述处理模块，还用于：

将所述转换之后的标识符记录信息上传至预设的区块链中。

此外，在另一实施例中，所述处理模块，还用于：

在另一实施例中，本申请还提供了另一种异构数据处理装置，应用于用户端，所述装置可以包括：

处理模块，用于根据预存的盲化处理规则对待处理业务对应的标识符数据进行盲化处理，得到盲化标识符集合。

在本实施例中，所述处理模块，还用于：

根据预设的盲化参数处理规则确定盲化参数。

进一步的，所述处理模块，还用于：

随机确定一第一初始盲化参数，同时接收其他用户端发送的第二初始盲化参数。

发送模块，用于将所述盲化标识符集合发送至协作方端，以使所述协作方端根据各用户端发送的所述盲化标识符集合进行匹配处理，得到匹配标识符集合，再根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息。

所述处理模块，还用于接收所述协作方端发送的若干标识符记录信息，并根据所述若干标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。

在本实施例中，所述标识符记录信息中包含标识符位置，所述处理模块，还用于：

进一步的，所述标识符记录信息中包含第一私密分片数据或第二私密分片数据生成的子私密分片数据，所述处理模块，还用于：

此外，所述处理模块，还用于：

此外，在另一实施例中，所述处理模块，还用于：

将所述转换之后的明文处理结果上传至预设的区块链中。

本申请实施例提供的装置，可以实现上述如图2所示的实施例的方法，其实现原理和技术效果类似，此处不再赘述。

图5为本申请实施例提供的电子设备的硬件结构示意图，如图5所示，本实施例提供的设备500包括：处理器501，以及与所述处理器通信连接的存储器。其中，处理器501、存储器502通过总线503连接。

在具体实现过程中，处理器501执行所述存储器502存储的计算机执行指令，使得处理器501执行上述方法实施例中的异构数据处理方法。

处理器501的具体实现过程可参见上述方法实施例，其实现原理和技术效果类似，本实施例此处不再赘述。

在上述的图5所示的实施例中，应理解，处理器可以是中央处理单元(英文：Central Processing Unit，简称：CPU)，还可以是其他通用处理器、数字信号处理器(英文：Digital Signal Processor，简称：DSP)、专用集成电路(英文：Application Specific Integrated Circuit，简称：ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速RAM存储器，也可能还包括非易失性存储NVM，例如至少一个磁盘存储器。

总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component Interconnect，PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现上述方法实施例的异构数据处理方法。

本申请实施例还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时，实现如上所述的异构数据处理方法。

上述的计算机可读存储介质，上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的可读存储介质耦合至处理器，从而使处理器能够从该可读存储介质读取信息，且可向该可读存储介质写入信息。当然，可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific Integrated Circuits，简称： ASIC)中。当然，处理器和可读存储介质也可以作为分立组件存在于设备中。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

一种异构数据处理方法，其特征在于，应用于协作方端，包括：

获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合；

根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合；

根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息，并将与所述各用户端对应的标识符记录信息分别发送至对应的用户端，以使所述用户端根据接收到的标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。
根据权利要求1所述的方法，其特征在于，所述根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合，包括：

对不同用户端对应的盲化标识符集合进行比对处理，确定所述不同用户端对应的盲化标识符集合的交集，得到匹配标识符集合。
根据权利要求2所述的方法，其特征在于，所述根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息，包括：

删除所述各盲化标识符集合中与所述匹配标识符集合对应的盲化标识符，得到各用户端对应的私有标识符集合；

根据预设的补齐规则对所述各用户端对应的私有标识符集合进行补齐处理，得到补齐之后的各用户端对应的私有标识符集合；

对所述匹配标识符集合以及所述补齐之后的各用户端对应的私有标识符集合进行混合处理，得到对齐样本集合；

针对所述对齐样本集合中的每个对齐样本，若所述对齐样本属于所述匹配标识符集合，则根据预存的第一生成规则生成与所述各用户端对应的标识符记录信息；

若所述对齐样本属于所述各用户端对应的私有标识符集合，则根据预存的第二生成规则生成与所述各用户端对应的标识符记录信息。
根据权利要求3所述的方法，其特征在于，所述若所述对齐样本属于所述匹配标识符集合，则根据预存的第一生成规则生成与所述各用户端对应的标识符记录信息，包括：

若所述对齐样本属于所述匹配标识符集合，则随机生成一对关于数值1的第一私密分片数据；

根据所述对齐样本以及所述第一私密分片数据生成与所述各用户端对应的标识符记录信息。
根据权利要求3或4所述的方法，其特征在于，所述若所述对齐样本属于所述各用户端对应的私有标识符集合，则根据预存的第二生成规则生成与所述各用户端对应的标识符记录信息，包括：

若所述对齐样本属于所述各用户端对应的私有标识符集合，则随机生成一对关于数值0的第二私密分片数据；

根据所述对齐样本以及所述第二私密分片数据生成与所述各用户端对应的标识符记录信息。
根据权利要求3-5任一项所述的方法，其特征在于，所述根据预设的补齐规则对所述各用户端对应的私有标识符集合进行补齐处理，得到补齐之后的各用户端对应的私有标识符集合，包括：

确定所述各用户端对应的私有标识符集合中私有标识符数量最多的目标私有标识符集合；

根据所述目标私有标识符集合中私有标识符的数量对所述各用户端对应的私有标识符集合中除所述目标私有标识符集合之外的其他私有标识符集合进行补齐处理，得到补齐之后的各用户端对应的私有标识符集合。
根据权利要求1-6任一项所述的方法，其特征在于，在所述根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息之后，还包括：

根据预存的哈希函数对所述与所述各用户端对应的标识符记录信息进行转换处理，得到转换之后的标识符记录信息；

将所述转换之后的标识符记录信息上传至预设的区块链中。
根据权利要求1-7任一项所述的方法，其特征在于，在所述获取各用户端发送的待处理业务盲化处理之后的盲化标识符集合之前，还包括：

根据预设的通道构建规则构建所述协作方端与所述各用户端之间的数据传输通道；

则所述获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合，包括：

通过预先构建的数据传输通道获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合。
一种异构数据处理方法，其特征在于，应用于用户端，包括：

根据预存的盲化处理规则对待处理业务对应的标识符数据进行盲化处理，得到盲化标识符集合；

将所述盲化标识符集合发送至协作方端，以使所述协作方端根据各用户端发送的所述盲化标识符集合进行匹配处理，得到匹配标识符集合，再根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息；

接收所述协作方端发送的若干标识符记录信息，并根据所述若干标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。
根据权利要求9所述的方法，其特征在于，所述根据预存的盲化处理规则对待处理业务对应的标识符数据进行盲化处理，得到盲化标识符集合，包括：

根据预设的盲化参数处理规则确定盲化参数；

根据预设的哈希函数对所述盲化参数以及所述待处理业务对应的标识符数据进行处理，得到初始盲化标识符集合；

根据预设的噪声生成规则生成预设数量的，且与所述初始盲化标识符集合不重复的噪声标识符；

根据所述噪声标识符和所述初始盲化标识符集合得到盲化标识符集合。
根据权利要求10所述的方法，其特征在于，所述根据预设的盲化参数处理规则确定盲化参数，包括：

随机确定一第一初始盲化参数，同时接收其他用户端发送的第二初始盲化参数；

对所述第一初始盲化参数和所述第二初始盲化参数做异或运算，得到盲化参数。
根据权利要求9-11任一项所述的方法，其特征在于，所述标识符记录信息中包含标识符位置，所述根据所述若干标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果，包括：

针对每个所述标识符记录信息，根据所述标识符位置判断所述标识符记录信息是否为噪声标识符；

若所述标识符记录信息不是噪声标识符，则根据所述标识符位置以及所述待处理业务对应的标识符数据确定所述标识符位置对应的第一初始数据；

根据预设联合计算处理规则对所述第一初始数据以及其他用户端发送的第二初始数据联合进行处理，得到所述标识符记录信息对应的中间结果分片；

对每个所述标识符记录信息对应的中间结果分片进行聚合处理，得到中间结果，并根据预设的安全多方计算协议对所述中间结果进行解密处理，得到所述待处理业务的明文处理结果。
根据权利要求12所述的方法，其特征在于，所述标识符记录信息中包含第一私密分片数据或第二私密分片数据生成的子私密分片数据，所述根据预设联合计算处理规则对所述第一初始数据以及其他用户端发送的第二初始数据联合进行处理，得到所述标识符记录信息对应的中间结果分片，包括：

根据预设的分片规则对所述第一初始数据进行分片处理，得到若干第一初始子数据；

将所述若干第一初始子数据中预设数量的第一初始子数据发送至其他用户端，得到第一剩余初始子数据，同时接收所述其他用户端发送的预设数量的第二外发初始子数据，其中，所述第二外发初始子数据为其他用户端中的第二子数据根据预设的分片规则进行分片处理得到的；

根据预设的私密共享协议对所述第一剩余初始子数据、所述第二外发初始子数据、第一子私密分片数据以及所述其他用户端中的第二剩余初始子数据、第一外发初始子数据和第二子私密分片数据联合进行计算，得到所述标识符记录信息对应的中间结果分片，其中，所述第一子私密分片数据为本地用户端对应的标识符记录信息中包含的子私密分片数据，所述第二子私密分片数据为所述其他用户端对应的标识符记录信息中包含的子私密分片数据。
根据权利要求12或13所述的方法，其特征在于，还包括：

若所述标识符记录信息是噪声标识符，则将所述标识符位置对应的数据设置为零。
根据权利要求9-14任一项所述的方法，其特征在于，在所述得到所述待处理业务的明文处理结果之后，还包括：

根据预存的哈希函数对所述待处理业务的明文处理结果进行转换处理，得到转换之后的明文处理结果；

将所述转换之后的明文处理结果上传至预设的区块链中。
一种异构数据处理装置，其特征在于，应用于协作方端，包括：

获取模块，用于获取各用户端发送的待处理业务对应的盲化处理之后的盲化标识符集合；

处理模块，用于根据预设的匹配规则对各盲化标识符集合进行匹配处理，得到匹配标识符集合；

所述处理模块，还用于根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息，并将与所述各用户端对应的标识符记录信息分别发送至对应的用户端，以使所述用户端根据接收到的标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。
一种异构数据处理装置，其特征在于，应用于用户端，包括：

处理模块，用于根据预存的盲化处理规则对待处理业务对应的标识符数据进行盲化处理，得到盲化标识符集合；

发送模块，用于将所述盲化标识符集合发送至协作方端，以使所述协作方端根据各用户端发送的所述盲化标识符集合进行匹配处理，得到匹配标识符集合，再根据所述匹配标识符集合以及所述各盲化标识符集合生成与所述各用户端对应的标识符记录信息；

所述处理模块，还用于接收所述协作方端发送的若干标识符记录信息，并根据所述若干标识符记录信息进行异构数据解密计算，得到所述待处理业务的明文处理结果。
一种电子设备，其特征在于，包括处理器和存储器；其中，

所述存储器，用于存储程序代码；

所述处理器，用于调用所述存储器中所存储的程度代码，以实现如权利要求1-8或9-15中任一项所述的异构数据处理方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当该指令在计算机上运行时，以实现如权利要求1-8或9-15中任一项所述的异构数据处理方法。
一种计算机程序，其特征在于，包括程序代码，当计算机运行所述计算机程序时，所述程序代码执行时实现如权利要求1-8或9-15中任一项所述的异构数据处理方法。