CN110162551B

CN110162551B - 数据处理方法、装置和电子设备

Info

Publication number: CN110162551B
Application number: CN201910316475.4A
Authority: CN
Inventors: 林文珍; 李漓春
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2019-04-19
Filing date: 2019-04-19
Publication date: 2020-08-14
Anticipated expiration: 2039-04-19
Also published as: WO2020211485A1; TWI728639B; TW202040399A; CN110162551A

Abstract

本说明书实施例提供一种数据处理方法、装置和电子设备。所述方法包括：以标签数据集合中的标签数据为输入，与第一设备进行不经意传输，从所述第一设备输入的多个子数据中选择目标子数据，所述多个子数据基于拆分参数集合中的拆分参数得到；对选择的目标子数据进行求和处理，得到第一求和结果；接收所述第一设备发来的第二求和结果，所述第二求和结果通过对所述拆分参数集合中的拆分参数进行求和处理得到；基于所述第一求和结果和所述第二求和结果，计算统计指标。本说明书实施例提供的数据处理方法、装置和电子设备，可以使各个数据方在不泄漏自身拥有的数据的前提下共同完成数据指标的统计。

Description

数据处理方法、装置和电子设备

技术领域

本说明书实施例涉及计算机技术领域，特别涉及一种数据处理方法、装置和电子设备。

背景技术

在业务实际中，单个数据方拥有的数据并不完备，通常需要借助其它数据方的数据，共同完成一些数据指标的统计。在协作计算的过程中，往往存在数据泄漏的问题。

发明内容

本说明书实施例的目的是提供一种数据处理方法、装置和电子设备，以使各个数据方在不泄漏自身拥有的数据的前提下共同完成数据指标的统计。

为实现上述目的，本说明书中一个或多个实施例提供的技术方案如下。

根据本说明书一个或多个实施例的第一方面，提供了一种数据处理方法，应用于第一设备，包括：利用拆分参数集合中的拆分参数，将特征数据集合中的特征数据拆分为多个子数据；以所述多个子数据为输入，与第二设备进行不经意传输；对所述拆分参数集合中的拆分参数进行求和处理；向所述第二设备发送求和结果。

根据本说明书一个或多个实施例的第二方面，提供了一种数据处理装置，应用于第一设备，包括：拆分单元，用于利用拆分参数集合中的拆分参数，将特征数据集合中的特征数据拆分为多个子数据；传输单元，用于以所述多个子数据为输入，与第二设备进行不经意传输；计算单元，用于对所述拆分参数集合中的拆分参数进行求和处理；发送单元，用于向所述第二设备发送求和结果。

根据本说明书一个或多个实施例的第三方面，提供了一种电子设备，包括：存储器，用于存储计算机指令；处理器，用于执行所述计算机指令以实现如第一方面所述的方法步骤。

根据本说明书一个或多个实施例的第四方面，提供了一种数据处理方法，应用于第二设备，包括：以标签数据集合中的标签数据为输入，与第一设备进行不经意传输，从所述第一设备输入的多个子数据中选择目标子数据，所述多个子数据基于拆分参数集合中的拆分参数得到；对选择的目标子数据进行求和处理，得到第一求和结果；接收所述第一设备发来的第二求和结果，所述第二求和结果通过对所述拆分参数集合中的拆分参数进行求和处理得到；基于所述第一求和结果和所述第二求和结果，计算统计指标。

根据本说明书一个或多个实施例的第五方面，提供了一种数据处理装置，应用于第二设备，包括：传输单元，用于以标签数据集合中的标签数据为输入，与第一设备进行不经意传输，从所述第一设备输入的多个子数据中选择目标子数据，所述多个子数据基于拆分参数集合中的拆分参数得到；第一计算单元，用于对选择的目标子数据进行求和处理，得到第一求和结果；接收单元，用于接收所述第一设备发来的第二求和结果，所述第二求和结果通过对所述拆分参数集合中的拆分参数进行求和处理得到；第二计算单元，用于基于所述第一求和结果和所述第二求和结果，计算统计指标。

根据本说明书一个或多个实施例的第六方面，提供了一种电子设备，包括：存储器，用于存储计算机指令；处理器，用于执行所述计算机指令以实现如第四方面所述的方法步骤。

由以上本说明书实施例提供的技术方案可见，本说明书实施例中，第一设备和第二设备可以在不泄漏自身拥有的数据的前提下，进行协作计算，完成数据指标的统计。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书实施例一种数据处理系统的功能结构示意图；

图2为本说明书实施例一种数据处理方法的流程图；

图3为本说明书实施例一种不经验传输方法的流程图；

图4为本说明书实施例一种数据处理方法的示意图；

图5为本说明书实施例一种数据处理方法的流程图；

图6为本说明书实施例一种数据处理方法的流程图；

图7为本说明书实施例一种数据处理装置的功能结构示意图；

图8为本说明书实施例一种电子设备的功能结构示意图；

图9为本说明书实施例一种数据处理装置的功能结构示意图。

具体实施方式

下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。值得注意的是，本文中的“第一”、“第二”等描述，是用于区分不同的消息、设备、模块等，不代表先后顺序，也不限定“第一”和“第二”是不同的类型。

请参阅图1。本说明书实施例提供一种数据处理系统。

在一些实施例中，所述数据处理系统可以包括第一设备。所述第一设备可以为服务器、手机、平板电脑、或个人电脑等设备；或者，也可以为由多台设备组成的系统，例如由多个服务器组成的服务器集群。所述第一设备可以提供有特征数据集合。所述特征数据集合在所述第一设备中的存储方式包括但不限于数组、向量、矩阵、线性表等。所述特征数据集合可以包括至少一个特征数据，所述特征数据可以用于反映业务对象的特征。例如，所述业务对象可以为用户，所述特征数据可以为用户的借贷金额、或用户缴纳社保的基数等。

在一些实施例中，所述数据处理系统还可以包括第二设备。所述第二设备可以为服务器、手机、平板电脑、或个人电脑等设备；或者，也可以为由多台设备组成的系统，例如由多个服务器组成的服务器集群。所述第二设备可以提供有标签数据集合。所述标签数据集合在所述第二设备中的存储方式包括但不限于数组、向量、矩阵、线性表等。所述标签数据集合可以包括至少一个标签数据，所述标签数据可以用于反映业务对象的类型。例如，所述业务对象可以为用户，所述标签数据可以用于标识用户是否为学生、用户是否为失信者、用户是否缴纳社保、用户是否有借贷记录等。所述标签数据的取值可以为二元值。例如，所述标签数据的取值可以取自0和1，取值0用于标识用户为失信者，取值1用户标识用户不是失信者。值的注意的是，此处的0和1仅为示例，根据业务实际的需要，所述标签数据的取值还可以为其它值。例如，所述标签数据的取值可以取自0和-1，取值0用于标识用户为失信者，取值-1用于标识用户不是失信者。

在一些实施例中，单个数据方拥有的数据并不完备，需要借助其它数据方的数据，共同完成一些数据指标的统计。为了保护隐私，参与统计的各个数据方不能够泄漏自身拥有的数据。具体在本实施例中，在不泄漏自身拥有的数据的前提下，所述第一设备和所述第二设备可以进行协作计算，完成一些数据指标的统计。例如，所述第一设备可以拥有特征数据集合，所述特征数据集合中的特征数据可以为用户的借贷金额。所述第二设备可以拥有标签数据集合，所述标签数据集合中的标签数据可以用于标识用户是否缴纳社保。所述第一设备和所述第二设备可以进行协作计算，对缴纳社保用户的借贷金额之和进行统计。

为了便于统计，可以建立所述特征数据集合中的特征数据和所述标签数据集合中的标签数据之间的对应关系。具有对应关系的特征数据和标签数据针对的是同一业务对象。在实际应用中可以根据业务对象的标识符建立所述对应关系。具体地，所述特征数据集合中的特征数据和所述标签数据集合中的标签数据均可以对应有业务对象的标识符。如此可以将对应相同标识符的标签数据和特征数据之间建立对应关系。例如，所述业务对象可以为用户，所述标识符可以为用户的手机号或用户的账户等等。在一个场景示例中，所述特征数据集合可以表示为向量X＝[x₁,x₂,...,x_i,...,x_n]。所述标签数据集合可以表示为向量Y＝[y₁,y₂,...,y_i,...,y_n]。x_i表示特征数据，y_i表示标签数据，1≤i≤n，n表示数据数量。特征数据x_i和标签数据y_i对应了相同的标识符，例如均对应某一用户的手机号。因而特征数据x_i和标签数据y_i之间具有对应关系。当然，在实际应用中还可以采用其它方式建立特征数据和标签数据之间的对应关系，本说明书对此并不做具体限定。

基于所述数据处理系统，本说明书提供数据处理方法的一个实施例。请一并参阅图2和图3。该实施例可以包括以下步骤。

步骤S101：第一设备利用拆分参数集合中的拆分参数，将特征数据集合中的特征数据拆分为多个子数据。

在一些实施例中，所述拆分参数集合可以是由所述第一设备生成的。所述拆分参数集合在所述第一设备中的存储方式包括但不限于数组、向量、矩阵、线性表等。所述拆分参数集合可以包括至少一个拆分参数。所述拆分参数可以为随机数，用于对特征数据进行拆分。

所述拆分参数集合中的拆分参数和所述特征数据集合中的特征数据之间可以具有对应关系，以便于利用拆分参数集合中的拆分参数对特征数据集合中的特征数据进行拆分。延续前面的场景示例，所述拆分参数集合可以表示为向量R＝[r₁,r₂,...,r_i,...,r_n]，r_i表示拆分参数。特征数据r_i和标签数据x_i之间可以具有对应关系。

在一些实施例中，针对所述特征数据集合中的每个特征数据，所述第一设备可以利用所述拆分参数集合中与该特征数据相对应的拆分参数，将该特征数据拆分为多个子数据，例如可以将该特征数据拆分为2、3或4个子数据。在实际应用中，所述第一设备可以将特征数据和拆分参数进行求和处理，可以将求和结果拆分为多个子数据；从而实现利用该拆分参数将该特征数据拆分为多个子数据。延续前面的场景示例，所述第一设备可以利用拆分参数r_i将特征数据x_i拆分为子数据x_i+r_i和子数据r_i+0等2个子数据。

步骤S103：第一设备以所述多个子数据为输入，第二设备以标签数据集合中的标签数据为输入，进行不经意传输。

在一些实施例中，不经意传输(Oblivious Transfer，OT)，又称为茫然传输，是一种可以保护隐私的双方通信协议，能够使通信双方以一种选择模糊化的方式传递数据。发送方可以具有多个数据。经由不经意传输接收方能够获得所述多个数据中的一个或多个数据。在此过程中，发送方不知晓接收方接收的是哪些数据；而接收方不能够获得其所接收数据之外的其它任何数据。具体在本实施例中，第一设备可以以所述特征数据中每个特征数据拆分后所得到的多个子数据为输入，第二设备可以以标签数据集合中与该特征数据相对应的标签数据为输入，进行不经意传输。通过不经意传输可以实现：第二设备从所述第一设备输入的多个子数据中选择目标子数据。其中，该特征数据拆分后所得到的多个子数据可以视作第一设备在不经意传输过程中输入的秘密信息，与该特征数据相对应的标签数据可以视作第二设备在不经意传输过程中输入的选择信息，这样便可以实现第二设备选择目标子数据。根据不经意传输的特性，所述第一设备并不知晓所述第二设备具体选择哪个子数据作为目标子数据，所述第二设备也不能够知晓除了所选择的目标子数据以外的其它子数据。

延续前面的场景示例，以下介绍本场景示例中所述第一设备与所述第二设备进行不经意传输的过程。在本场景示例中，特征数据x_i拆分后所得到的子数据包括x_i+r_i和r_i+0。子数据x_i+r_i和r_i+0可以视作第一设备在不经意传输过程中输入的秘密信息。标签数据y_i可以视作第二设备在不经意传输过程中输入的选择信息。标签数据y_i的取值可以取自0和1。通过不经意传输可以实现：当标签数据y_i的取值为0时，所述第二电子设备选择子数据r_i+0作为目标子数据；当标签数据y_i的取值为1时，所述第二电子设备选择子数据x_i+r_i作为目标子数据。此外，本领域技术人员应当能够理解，此处的不经意传输过程仅为示例，在实际应用中不经意传输过程还可以有其它的变形或变化，这些变形或变化也在本说明书公开和保护的范围内。请参阅图4。不经意传输过程可以包括以下步骤。

步骤S1031：第一设备生成公钥pk和私钥sk；生成随机数m₀和随机数m₁。

所述公钥pk和所述私钥sk可以为具有对应关系的公私钥对。

步骤S1032：第一设备向第二设备发送公钥pk、随机数m₀和随机数m₁。

步骤S1033：第二设备接收随机数m₀和随机数m₁；生成密钥key；根据标签数据y_i的取值从随机数m₀和随机数m₁中选取随机数；将选取的随机数记为m_b。

当标签数据y_i的取值为0时，所述第二设备可以选取随机数m₀；可以将选取的随机数m₀记为m_b。当标签数据y_i取值为1时，所述第二设备可以选取随机数m₁；可以将选取的随机数m₁记为m_b。

步骤S1034：第二设备利用公钥pk对密钥key进行加密；利用随机数m_b对密钥key的密文进行盲化处理。

所述第二设备可以利用公钥pk对密钥key进行加密，得到密钥key的密文；可以计算v＝d+m_b，从而实现盲化处理。其中，v表示盲化处理结果；d表示密钥key的密文。

步骤S1035：第二设备向第一设备发送盲化处理结果v。

步骤S1036：第一设备接收盲化处理结果v；利用随机数m₀和随机数m₁分别对盲化处理结果v进行去盲化处理，得到v-m₀和v-m₁；利用私钥sk分别对v-m₀和v-m₁进行解密，得到解密结果key₀和key₁。

第一设备可以计算v-m₀，以实现利用利用随机数m₀对盲化处理结果v进行去盲化处理；可以计算v-m₁，以实现利用随机数m₁对盲化处理结果v进行去盲化处理；可以利用私钥sk对v-m₀进行解密，得到解密结果key₀；可以利用私钥sk对v-m₁进行解密，得到解密结果key₁。

步骤S1037：第一设备利用解密结果key₀加密子数据r_i+0；利用解密结果key₁加密子数据x_i+r_i。

步骤S1038：第一设备分别向第二设备发送子数据r_i+0的密文和子数据x_i+r_i的密文。

步骤S1039：第二设备分别接收子数据r_i+0的密文和子数据x_i+r_i的密文；尝试利用密钥key分别对子数据r_i+0的密文和子数据x_i+r_i的密文进行解密。

当标签数据y_i的取值为0时，m_b＝m₀。因此所述第二设备可以利用密钥key对子数据r_i+0的密文进行成功解密，得到子数据r_i+0；而无法利用密钥key对子数据x_i+r_i的密文进行成功解密。这样便实现了当标签数据y_i的取值为0时，所述第二电子设备选择子数据r_i+0作为目标子数据。当标签数据y_i的取值为1时，m_b＝m₁。因此所述第二设备可以利用密钥key对子数据x_i+r_i的密文进行成功解密，得到子数据x_i+r_i；而无法利用密钥key对子数据r_i+0的密文进行成功解密。这样便实现了当标签数据y_i的取值为1时，所述第二电子设备选择子数据x_i+r_i作为目标子数据。

步骤S105：第二设备对选择的目标子数据进行求和处理，得到第一求和结果。

在一些实施例中，通过步骤S103，针对所述标签数据集合中的每个标签数据，所述第二设备可以选择得到一个目标子数据。这样所述第二设备选择的目标子数据的数量可以与所述标签数据集合中标签数据的数量相同。所述第二设备可以对选择的目标子数据进行求和处理，得到第一求和结果。

步骤S107：第一设备对所述拆分参数集合中的拆分参数进行求和处理，向所述第二设备发送求和结果。

延续前面的场景示例，所述第一设备可以计算

步骤S109：第二设备接收所述第一设备发来的求和结果，作为第二求和结果。

步骤S111：第二设备基于所述第一求和结果和所述第二求和结果，计算统计指标。

在一些实施例中，所述第二设备可以对所述第一求和结果和所述第二求和结果进行求差值处理，得到统计指标。当然，此处的求差值处理仅为示例，在实际应用中所述第二设备还可以采用其它方式来计算统计指标。所述统计指标可以用于反映所述标签数据集合中特定标签数据所对应的特征数据之和。所述统计指标可以作为计算参数供后续处理过程所使用。例如，在分箱场景中，所述第一设备可以根据所述统计指标并结合其它信息一起计算分箱指标，所述分箱指标可以包括信息价值(Information Value，IV)和证据权重(Weight of Evidence，Woe)等等。

延续前面的场景示例，由于子数据x_i+r_i和子数据r_i+0中均包含拆分参数r_i，因此无论第二设备选择子数据x_i+r_i作为目标子数据，或者，选择子数据r_i+0作为目标子数据，目标子数据中均包含拆分参数r_i。因此，通过对所述第一求和结果和所述第二求和结果进行求差值处理所获得的统计指标，可以用于反映所述标签数据集合中取值为1的标签数据所对应的特征数据之和。例如，所述特征数据集合中的特征数据可以为用户的借贷金额。所述标签数据集合中的标签数据可以用于反映用户是否缴纳社保。标签数据的取值0用于标识用户没有缴纳社保；标签数据的取值1用于标识用户缴纳社保。那么，所述统计指标可以用于反映所有缴纳社保的用户的借贷金额之和。

本说明书实施例的数据处理方法，第一设备可以利用拆分参数集合中的拆分参数，将特征数据集合中的特征数据拆分为多个子数据。第一设备以所述多个子数据为输入，第二设备以标签数据集合中的标签数据为输入，进行不经意传输。所述第二设备可以对选择的目标子数据进行求和处理，得到第一求和结果。所述第一设备可以对所述拆分参数集合中的拆分参数进行求和处理，向所述第二设备发送求和结果。所述第二设备可以接收求和结果作为第二求和结果；可以基于所述第一求和结果和所述第二求和结果，计算统计指标。这样第一设备和第二设备可以在不泄漏自身拥有的数据的前提下，进行协作计算，完成数据指标的统计。

请参阅图5。本说明书还提供数据处理方法的另一个实施例。该实施例以第一设备为执行主体，可以包括以下步骤。

步骤S21：利用拆分参数集合中的拆分参数，将特征数据集合中的特征数据拆分为多个子数据。

在一些实施例中，所述拆分参数集合可以是由所述第一设备生成的。所述拆分参数集合可以包括至少一个拆分参数。所述拆分参数可以为随机数，用于对特征数据进行拆分。所述特征数据集合可以包括至少一个特征数据，所述特征数据可以用于反映业务对象的特征。

在一些实施例中，针对所述特征数据集合中的每个特征数据，所述第一设备可以利用所述拆分参数集合中与该特征数据相对应的拆分参数，将该特征数据拆分为多个子数据，例如可以将该特征数据拆分为2、3或4个子数据。

步骤S23：以所述多个子数据为输入，与第二设备进行不经意传输。

在一些实施例中，所述第二设备可以提供有标签数据集合。所述标签数据集合可以包括至少一个标签数据，所述标签数据可以用于反映业务对象的类型。所述第一设备可以以所述多个子数据为输入，所述第二设备可以以标签数据集合中的标签数据为输入，进行不经意传输。具体地，所述第一设备可以以所述特征数据中每个特征数据拆分后所得到的多个子数据为输入，所述第二设备可以以标签数据集合中与该特征数据相对应的标签数据为输入，进行不经意传输。通过不经意传输可以实现：第二设备从所述第一设备输入的多个子数据中选择目标子数据。其中，该特征数据拆分后所得到的多个子数据可以视作第一设备在不经意传输过程中输入的秘密信息，与该特征数据相对应的标签数据可以视作第二设备在不经意传输过程中输入的选择信息，这样便可以实现第二设备选择目标子数据。根据不经意传输的特性，所述第一设备并不知晓所述第二设备具体选择哪个子数据作为目标子数据，所述第二设备也不能够知晓除了所选择的目标子数据以外的其它子数据。

步骤S25：对所述拆分参数集合中的拆分参数进行求和处理。

步骤S27：向所述第二设备发送求和结果。

本实施例的数据处理方法，第一设备可以利用拆分参数集合中的拆分参数，将特征数据集合中的特征数据拆分为多个子数据；可以以所述多个子数据为输入，与第二设备进行不经意传输；可以对所述拆分参数集合中的拆分参数进行求和处理；可以向所述第二设备发送求和结果。这样第一设备可以在不泄漏自身拥有的数据的前提下，向第二设备传输进行数据指标统计时所需的数据。

请参阅图6。本说明书还提供数据处理方法的另一个实施例。该实施例以第二设备为执行主体，可以包括以下步骤。

步骤S31：以标签数据集合中的标签数据为输入，与第一设备进行不经意传输，从所述第一设备输入的多个子数据中选择目标子数据。

在一些实施例中，所述多个子数据可以基于拆分参数集合中的拆分参数得到，具体过程可以参见前面的实施例。所述第一设备可以以所述多个子数据为输入，所述第二设备可以以标签数据集合中的标签数据为输入，进行不经意传输。具体地，所述第一设备可以以特征数据中每个特征数据拆分后所得到的多个子数据为输入，所述第二设备可以以标签数据集合中与该特征数据相对应的标签数据为输入，进行不经意传输。通过不经意传输可以实现：第二设备从所述第一设备输入的多个子数据中选择目标子数据。其中，该特征数据拆分后所得到的多个子数据可以视作第一设备在不经意传输过程中输入的秘密信息，与该特征数据相对应的标签数据可以视作第二设备在不经意传输过程中输入的选择信息，这样便可以实现第二设备选择目标子数据。根据不经意传输的特性，所述第一设备并不知晓所述第二设备具体选择哪个子数据作为目标子数据，所述第二设备也不能够知晓除了所选择的目标子数据以外的其它子数据。

步骤S33：对选择的目标子数据进行求和处理，得到第一求和结果。

在一些实施例中，针对所述标签数据集合中的每个标签数据，所述第二设备可以选择得到一个目标子数据。这样所述第二设备选择的目标子数据的数量可以与所述标签数据集合中标签数据的数量相同。所述第二设备可以对选择的目标子数据进行求和处理，得到第一求和结果。

步骤S35：接收所述第一设备发来的第二求和结果。

在一些实施例中，所述第一设备可以对所述拆分参数集合中的拆分参数进行求和处理；可以向所述第二设备发送求和结果。所述第二设备可以接收所述第一设备发来的求和结果，作为第二求和结果。

步骤S37：基于所述第一求和结果和所述第二求和结果，计算统计指标。

在一些实施例中，所述第二设备可以对所述第一求和结果和所述第二求和结果进行求差值处理，得到统计指标。所述统计指标可以用于反映所述标签数据集合中特定标签数据所对应的特征数据之和。所述统计指标可以作为计算参数供后续处理过程所使用。例如，在分箱场景中，所述第一设备可以根据所述统计指标并结合其它信息一起计算分箱指标，所述分箱指标可以包括信息价值(Information Value，IV)和证据权重(Weight ofEvidence，Woe)等。

本实施例的数据处理方法，第二设备可以以标签数据集合中的标签数据为输入，与第一设备进行不经意传输，从所述第一设备输入的多个子数据中选择目标子数据；可以对选择的目标子数据进行求和处理，得到第一求和结果；可以接收所述第一设备发来的第二求和结果；可以基于所述第一求和结果和所述第二求和结果，计算统计指标。这样第二设备可以在不泄漏自身拥有的数据的前提下，利用第一设备传输过来的数据，完成数据指标的统计。

请参阅图7。本说明书还提供数据处理装置的另一个实施例。该实施例可以应用于第一设备，具体可以包括以下单元。

拆分单元41，用于利用拆分参数集合中的拆分参数，将特征数据集合中的特征数据拆分为多个子数据；

传输单元43，用于以所述多个子数据为输入，与第二设备进行不经意传输；

计算单元45，用于对所述拆分参数集合中的拆分参数进行求和处理；

发送单元47，用于向所述第二设备发送求和结果。

下面介绍本说明书电子设备的一个实施例。图8是该实施例中一种电子设备的硬件结构示意图。如图8所示，所述电子设备可以包括一个或多个(图中仅示出一个)处理器、存储器和传输模块。当然，本领域普通技术人员可以理解，图8所示的硬件结构仅为示意，其并不对上述电子设备的硬件结构造成限定。在实际中所述电子设备还可以包括比图8所示更多或者更少的组件单元；或者，具有与图8所示不同的配置。

所述存储器可以包括高速随机存储器；或者，还可以包括非易失性存储器，例如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。当然，所述存储器还可以包括远程设置的网络存储器。所述远程设置的网络存储器可以通过诸如互联网、企业内部网、局域网、移动通信网等网络连接至所述电子设备。所述存储器可以用于存储应用软件的程序指令或模块，例如本说明书图4所对应实施例的程序指令或模块。

所述处理器可以按任何适当的方式实现。例如，所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific IntegratedCircuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以读取并执行所述存储器中的程序指令或模块。

所述传输模块可以用于经由网络进行数据传输，例如经由诸如互联网、企业内部网、局域网、移动通信网等网络进行数据传输。

请参阅图9。本说明书还提供数据处理装置的另一个实施例。该实施例可以应用于第二设备，具体可以包括以下单元。

传输单元51，用于以标签数据集合中的标签数据为输入，与第一设备进行不经意传输，从所述第一设备输入的多个子数据中选择目标子数据，所述多个子数据基于拆分参数集合中的拆分参数得到；

第一计算单元53，用于对选择的目标子数据进行求和处理，得到第一求和结果；

接收单元55，用于接收所述第一设备发来的第二求和结果，所述第二求和结果通过对所述拆分参数集合中的拆分参数进行求和处理得到；

第二计算单元57，用于基于所述第一求和结果和所述第二求和结果，计算统计指标。

所述存储器可以包括高速随机存储器；或者，还可以包括非易失性存储器，例如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。当然，所述存储器还可以包括远程设置的网络存储器。所述远程设置的网络存储器可以通过诸如互联网、企业内部网、局域网、移动通信网等网络连接至所述电子设备。所述存储器可以用于存储应用软件的程序指令或模块，例如本说明书图5所对应实施例的程序指令或模块。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同或相似的部分互相参见即可，每个实施例重点说明的都是与其它实施例的不同之处。尤其，对于装置实施例和电子设备实施例而言，由于其基本相似于数据处理方法实施例，所以描述的比较简单，相关之处参见数据处理方法实施例的部分说明即可。

另外，可以理解的是，本领域技术人员在阅读本说明书文件之后，可以无需创造性劳动想到将本说明书列举的部分或全部实施例进行任意组合，这些组合也在本说明书公开和保护的范围内。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片2。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。

本说明书可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

虽然通过实施例描绘了本说明书，本领域普通技术人员知道，本说明书有许多变形和变化而不脱离本说明书的精神，希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims

1.一种数据处理方法，应用于第一设备，包括：

利用拆分参数集合中的拆分参数r_i，将特征数据集合中的特征数据x_i拆分为多个子数据；所述多个子数据包括x_i+r_i和r_i+0，1≤i≤n，n表示数据数量；

以所述多个子数据为输入，与第二设备进行不经意传输；

对所述拆分参数集合中的拆分参数进行求和处理；

向所述第二设备发送求和结果。

2.如权利要求1所述的方法，所述拆分参数集合中的拆分参数和所述特征数据集合中的特征数据之间具有对应关系；

相应地，所述将特征数据集合中的特征数据拆分为多个子数据，包括：

针对所述特征数据集合中的每个特征数据，利用所述拆分参数集合中与该特征数据相对应的拆分参数，将该特征数据拆分为多个子数据。

3.如权利要求1或2所述的方法，所述拆分参数为随机数。

4.一种数据处理装置，应用于第一设备，包括：

拆分单元，用于利用拆分参数集合中的拆分参数r_i，将特征数据集合中的特征数据x_i拆分为多个子数据；所述多个子数据包括x_i+r_i和r_i+0，1≤i≤n，n表示数据数量；

传输单元，以所述多个子数据为输入，与第二设备进行不经意传输；

计算单元，用于对所述拆分参数集合中的拆分参数进行求和处理；

发送单元，用于向所述第二设备发送求和结果。

5.一种电子设备，包括：

存储器，用于存储计算机指令；

处理器，用于执行所述计算机指令以实现如权利要求1-3中任一项所述的方法步骤。

6.一种数据处理方法，应用于第二设备，包括：

以标签数据集合中的标签数据为输入，与第一设备进行不经意传输，从所述第一设备输入的特征数据x_i的多个子数据中选择目标子数据，所述多个子数据包括x_i+r_i和r_i+0，r_i表示拆分参数，1≤i≤n，n表示数据数量；

对选择的目标子数据进行求和处理，得到第一求和结果；

接收所述第一设备发来的第二求和结果，所述第二求和结果通过对所述拆分参数集合中的拆分参数进行求和处理得到；

基于所述第一求和结果和所述第二求和结果，计算统计指标。

7.如权利要求6所述的方法，所述统计指标用于反映所述标签数据集合中的特定标签数据在特征数据集合中所对应的特征数据之和。

8.如权利要求6所述的方法，所述从所述第一设备输入的多个子数据中选择目标子数据，包括：

针对所述标签数据集合中的每个标签数据，以该标签数据为输入，与第一设备进行不经意传输，从所述第一设备输入的与该标签数据相对应的多个子数据中选择目标子数据；其中，与该标签数据相对应的多个子数据通过对与该标签数据相对应的特征数据进行拆分得到。

9.如权利要求6所述的方法，计算统计指标，包括：

对所述第一求和结果和所述第二求和结果进行求差值处理，得到统计指标。

10.一种数据处理装置，应用于第二设备，包括：

传输单元，用于以标签数据集合中的标签数据为输入，与第一设备进行不经意传输，从所述第一设备输入的特征数据x_i的多个子数据中选择目标子数据，所述多个子数据包括x_i+r_i和r_i+0，r_i表示拆分参数，1≤i≤n，n表示数据数量；

第一计算单元，用于对选择的目标子数据进行求和处理，得到第一求和结果；

接收单元，用于接收所述第一设备发来的第二求和结果，所述第二求和结果通过对所述拆分参数集合中的拆分参数进行求和处理得到；

第二计算单元，用于基于所述第一求和结果和所述第二求和结果，计算统计指标。

11.一种电子设备，包括：

存储器，用于存储计算机指令；

处理器，用于执行所述计算机指令以实现如权利要求6-9中任一项所述的方法步骤。