CN111160573B

CN111160573B - 保护数据隐私的双方联合训练业务预测模型的方法和装置

Info

Publication number: CN111160573B
Application number: CN202010251506.5A
Authority: CN
Inventors: 陈超超; 王力; 王磊; 周俊
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-04-01
Filing date: 2020-04-01
Publication date: 2020-06-30
Anticipated expiration: 2040-04-01
Also published as: CN111160573A; WO2021197035A1

Abstract

本说明书实施例提供一种保护数据隐私的双方联合训练业务预测模型的方法和装置，其中双方各自拥有一部分特征数据。在模型迭代过程中，双方通过安全矩阵乘法，得到总的特征矩阵X与总的参数矩阵W的乘积结果的加密分片。由拥有标签的第二方汇总这两个加密分片，得到加密的乘积结果Z。第二方基于该乘积结果Z与加密的标签Y，得到加密的误差E，并对其进行同态加密下的秘密分享。于是，双方各自得到误差分片。然后双方基于误差分片和各自的特征矩阵，通过秘密分享和安全矩阵乘法，得到对应的梯度分片。然后，第一方利用其梯度分片更新其维护的参数分片，第二方利用其梯度分片更新其维护的参数分片。如此实现保护数据隐私的安全联合训练。

Description

保护数据隐私的双方联合训练业务预测模型的方法和装置

技术领域

本说明书一个或多个实施例涉及数据安全和机器学习领域，具体地，涉及双方联合训练业务预测模型的方法和装置。

背景技术

机器学习所需要的数据往往会涉及到多个领域。例如在基于机器学习的商户分类分析场景中，电子支付平台拥有商户的交易流水数据，电子商务平台存储有商户的销售数据，银行机构拥有商户的借贷数据。数据往往以孤岛的形式存在。由于行业竞争、数据安全、用户隐私等问题，数据整合面临着很大阻力，将分散在各个平台的数据整合在一起训练机器学习模型难以实现。在保证数据不泄露的前提下，使用多方数据联合训练机器学习模型变成目前的一大挑战。

常用的机器学习模型包括，逻辑回归模型，线性回归模型，以及神经网络模型等，其中逻辑回归模型可以有效地执行样本分类预测等任务，线性回归模型可以有效地预测样本的回归值，神经网络模型可以通过多层神经元的组合，执行各种预测任务。以上这些模型的训练过程中，都会涉及利用特征数据与模型参数数据之间的运算得到预测结果，以及根据预测结果确定出梯度，进而调整模型参数的过程。在多方共同训练机器学习模型的情况下，如何在不泄露各方隐私数据，包括特征数据和模型参数数据，的情况下，协同进行上述各个阶段的运算，是实际要解决的问题。

因此，希望提供改进的方案，在双方联合训练业务预测模型的情况下，保证各方的隐私数据不泄露，确保数据安全。

发明内容

本说明书一个或多个实施例描述了双方联合训练业务预测模型的方法和装置，其中通过迭代过程中参数分片的方式，保证数据隐私不泄露，确保联合训练中隐私数据的安全。

根据第一方面，提供了一种保护数据隐私的双方联合训练业务预测模型的方法，所述双方包括第一方和第二方，所述第一方存储有多个业务对象的第一特征部分构成的第一特征矩阵X_A；所述第二方存储有所述多个业务对象的第二特征部分构成的第二特征矩阵X_B，以及标签值构成的标签向量Y；所述方法应用于所述第二方，该方法包括，多次迭代执行模型参数更新，其中每次迭代包括：

基于本地维护的第一参数第二分片和第二参数第二分片，通过本地矩阵乘法以及与所述第一方的安全矩阵乘法运算，计算得到同态加密的第二加密乘积分片，并从所述第一方接收第一加密乘积分片；其中，第一参数第二分片是用于处理所述第一特征部分的第一参数部分W_A的第二分片；第二参数第二分片是用于处理所述第二特征部分的第二参数部分W_B的第二分片；

对所述第一加密乘积分片和第二加密乘积分片进行同态加和，得到加密乘积结果Z，其对应于，第一特征矩阵X_A与第一参数部分W_A相乘的第一乘积，和第二特征矩阵X_B与第二参数部分W_B相乘的第二乘积之和的加密值；

基于所述加密乘积结果Z和所述标签向量Y的加密值进行同态运算，得到加密误差向量E，对该加密误差向量E进行秘密分享，得到第二误差分片；

对该加密误差向量E和第二特征矩阵X_B进行同态操作下的矩阵相乘，得到第二加密梯度，对该第二加密梯度进行秘密分享，得到第二梯度第二分片；

用所述第二误差分片，与所述第一方中的第一特征矩阵X_A进行安全矩阵乘法，得到第一梯度第二部分的第二分片；

根据所述第二梯度第二分片，更新所述第二参数第二分片；根据所述第一梯度第二部分的第二分片，更新所述第一参数第二分片。

根据一个实施例，在执行多次迭代执行模型参数更新之前，还包括：初始化所述第二参数部分W_B，通过秘密分享将其拆分为第二参数第一分片和第二参数第二分片，保留所述第二参数第二分片，将所述第二参数第一分片发送给第一方；从第一方接收对所述第一参数部分W_A秘密分享的第一参数第二分片。

在一个实施例中，在执行所述多次迭代执行模型参数更新之后，还包括：将最后一次迭代中更新后的所述第一参数第二分片发送给所述第一方，并从所述第一方接收更新后的第二参数第一分片；将最后一次迭代中更新后的第二参数第二分片，和所接收的第二参数第一分片进行组合，得到所述业务预测模型训练后的第二参数部分W_B。

在不同实施例中，业务对象可以包括以下之一：用户，商户，商品，事件；所述业务预测模型用于预测所述业务对象的分类或回归值。

根据一个实施例，所述业务预测模型为线性回归模型；在这样的情况下，可以计算所述加密乘积结果Z和所述标签向量Y的同态差值，作为所述加密误差向量E。

根据另一实施例，所述业务预测模型为逻辑回归模型；在这样的情况下，可以根据sigmoid函数的泰勒展开形式，基于所述加密乘积结果Z得到加密预测结果，对加密预测结果和所述标签向量Y的加密值进行同态差值运算，得到所述加密误差向量E。

进一步的，在一个例子汇总，在得到加密误差向量E之前，还包括，至少根据所述第一乘积分片和所述第二乘积分片，计算加密多阶乘积；如此，可以根据sigmoid函数的多阶泰勒展开形式，基于所述加密乘积结果Z和所述加密多阶乘积得到加密预测结果，对加密预测结果和所述标签向量Y的加密值进行同态差值运算，得到所述加密误差向量E。

在一个具体实施例中，通过以下方式计算得到同态加密的第二乘积分片：用所述第一参数第二分片，与所述第一方中的第一特征矩阵X_A进行安全矩阵乘法，得到第一特征第二处理结果的第二分片；本地计算第二特征矩阵X_B与第二参数第二分片的乘积，得到第二特征第一处理结果；用所述第二特征矩阵X_B，与所述第一方中的第二参数第一分片进行安全矩阵乘法，得到第二特征第二处理结果的第二分片；对所述第一特征第二处理结果的第二分片，所述第二特征第一处理结果，所述第二特征第二处理结果的第二分片进行加和，并用所述第一方的公钥对加和结果进行同态加密，得到所述第二加密乘积分片。

在一个实施例中，通过以下方式更新所述第二参数第二分片，即，通过减去所述第二梯度第二分片与预设步长的乘积，更新所述第二参数第二分片。

根据第二方面，提供了一种保护数据隐私的双方联合训练业务预测模型的方法，该方法应用于前述第一方，该方法包括：多次迭代执行模型参数更新，其中每次迭代包括：

基于本地维护的第一参数第一分片和第二参数第一分片，通过本地矩阵乘法运算以及与所述第二方的安全矩阵乘法运算，计算得到同态加密的第一加密乘积分片；其中，所述第一参数第一分片是用于处理所述第一特征部分的第一参数部分W_A的第一分片；第二参数第一分片是用于处理所述第二特征部分的第二参数部分W_B的第一分片；

将该第一加密乘积分片发送给第二方，使得第二方将该第一加密乘积分片与其计算的第二加密乘积分片进行同态加和，以得到加密乘积结果Z，其对应于，第一特征矩阵X_A与第一参数部分W_A相乘的第一乘积，和第二特征矩阵X_B与第二参数部分W_B相乘的第二乘积之和的加密值；

从第二方接收对加密误差向量E秘密分享的第一误差分片，其中加密误差向量E基于所述加密乘积结果Z和标签向量Y的加密值的同态运算确定；

将所述第一误差分片的转置与第一特征矩阵X_A进行本地乘法操作，得到第一梯度第一部分；

用所述第一特征矩阵X_A，与第二方中保留的第二误差分片进行安全矩阵乘法，得到第一梯度第二部分的第一分片；

从第二方接收对第二加密梯度秘密分享的第二梯度第一分片；

根据所述第一梯度第一部分和第一梯度第二部分的第一分片，更新第一参数第一分片；根据所述第二梯度第一分片，更新第二参数第一分片。

根据一种实施方式，在执行多次迭代执行模型参数更新之前，还包括：初始化所述第一参数部分W_A，通过秘密分享将其拆分为第一参数第一分片和第一参数第二分片，保留所述第一参数第一分片，将所述第一参数第二分片发送给第二方；从所述第二方接收对第二参数部分W_B秘密分享的第二参数第一分片。

根据一种实施方式，在多次迭代执行模型参数更新之后，还包括：将最后一次迭代中更新后的所述第二参数第一分片发送给所述第二方，并从所述第二方接收更新后的第一参数第二分片；将最后一次迭代中更新后的第一参数第一分片，和所接收的第一参数第二分片进行组合，得到所述业务预测模型训练后的第一参数部分W_A。

在一个具体实施例中，通过以下方式计算得到同态加密的第一乘积分片：本地计算第一特征矩阵X_A与第一参数第一分片的乘积，得到第一特征第一处理结果；用所述第一特征矩阵X_A，与所述第二方中的第一参数第二分片进行安全矩阵乘法，得到第一特征第二处理结果的第一分片；用所述第二参数第一分片，与所述第二方中的第二特征矩阵X_B进行安全矩阵乘法，得到第二特征第二处理结果的第一分片；对所述第一特征第一处理结果，所述第一特征第二处理结果的第一分片，所述第二特征第二处理结果的第一分片进行加和，并用所述第一方的公钥对加和结果进行同态加密，得到所述第一加密乘积分片。

根据一个实施例，通过以下方式更新所述第一参数第一分片：将所述第一梯度第一部分和第一梯度第二部分的第一分片之和与预设步长的乘积，作为调整量，通过减去所述调整量，更新所述第一参数第一分片。

根据第三方面，提供了一种保护数据隐私的双方联合训练业务预测模型的装置，所述双方包括第一方和第二方，所述第一方存储有多个业务对象的第一特征部分构成的第一特征矩阵X_A；所述第二方存储有所述多个业务对象的第二特征部分构成的第二特征矩阵X_B，以及标签值构成的标签向量Y；所述装置部署于所述第二方，该装置包括，用于多次迭代执行模型参数更新的迭代单元，其进一步包括：

乘积分片计算单元，配置为基于本地维护的第一参数第二分片和第二参数第二分片，通过本地矩阵乘法以及与所述第一方的安全矩阵乘法运算，计算得到同态加密的第二加密乘积分片，并从所述第一方接收第一加密乘积分片；其中，第一参数第二分片是用于处理所述第一特征部分的第一参数部分W_A的第二分片；第二参数第二分片是用于处理所述第二特征部分的第二参数部分W_B的第二分片；

乘积结果确定单元，配置为对所述第一加密乘积分片和第二加密乘积分片进行同态加和，得到加密乘积结果Z，其对应于，第一特征矩阵X_A与第一参数部分W_A相乘的第一乘积，和第二特征矩阵X_B与第二参数部分W_B相乘的第二乘积之和的加密值；

误差向量确定单元，配置为基于所述加密乘积结果Z和所述标签向量Y的加密值进行同态运算，得到加密误差向量E，对该加密误差向量E进行秘密分享，得到第二误差分片；

第一梯度确定单元，配置为对该加密误差向量E和第二特征矩阵X_B进行同态操作下的矩阵相乘，得到第二加密梯度，对该第二加密梯度进行秘密分享，得到第二梯度第二分片；

第二梯度确定单元，配置为用所述第二误差分片，与所述第一方中的第一特征矩阵X_A进行安全矩阵乘法，得到第一梯度第二部分的第二分片；

参数更新单元，配置为根据所述第二梯度第二分片，更新所述第二参数第二分片；根据所述第一梯度第二部分的第二分片，更新所述第一参数第二分片。

根据第四方面，提供了一种保护数据隐私的双方联合训练业务预测模型的装置，部署于前述第一方中，该装置包括：用于多次迭代执行模型参数更新的迭代单元，其进一步包括：

乘积分片计算单元，配置为基于本地维护的第一参数第一分片和第二参数第一分片，通过本地矩阵乘法运算以及与所述第二方的安全矩阵乘法运算，计算得到同态加密的第一加密乘积分片；其中，所述第一参数第一分片是用于处理所述第一特征部分的第一参数部分W_A的第一分片；第二参数第一分片是用于处理所述第二特征部分的第二参数部分W_B的第一分片；

乘积分片发送单元，配置为将该第一加密乘积分片发送给第二方，使得第二方将该第一加密乘积分片与其计算的第二加密乘积分片进行同态加和，以得到加密乘积结果Z，其对应于，第一特征矩阵X_A与第一参数部分W_A相乘的第一乘积，和第二特征矩阵X_B与第二参数部分W_B相乘的第二乘积之和的加密值；

误差分片接收单元，配置为从第二方接收对加密误差向量E秘密分享的第一误差分片，其中加密误差向量E基于所述加密乘积结果Z和标签向量Y的加密值的同态运算确定；

第一梯度确定单元，配置为将所述第一误差分片的转置与第一特征矩阵X_A进行本地乘法操作，得到第一梯度第一部分；

第二梯度确定单元，配置为用所述第一特征矩阵X_A，与第二方中保留的第二误差分片进行安全矩阵乘法，得到第一梯度第二部分的第一分片；

第三梯度确定单元，配置为从第二方接收对第二加密梯度秘密分享的第二梯度第一分片；

参数更新单元，配置为根据所述第一梯度第一部分和第一梯度第二部分的第一分片，更新第一参数第一分片；根据所述第二梯度第一分片，更新第二参数第一分片。

根据第五方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面或第二方面的方法。

根据第六方面，提供了一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面或第二方面的方法。

根据本说明书实施例提供的方法和装置，参与联合训练的双方各自拥有一部分特征数据。在联合训练的迭代过程中，双方不仅不进行特征数据的明文交换，其模型参数部分也拆分为参数分片，各自只维护分片参数的迭代更新，直到迭代结束，才会重构得到模型参数。由于迭代过程中各方仅维护参数的分片，交换一些分片结果，而基于这些分片结果几乎不可能反推出隐私数据的有用信息，如此，极大地增强了联合训练过程中，隐私数据的安全性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本说明书披露的一个实施例的实施场景示意图；

图2示出在一个实施例中同态加密下的秘密分享方案；

图3示出在一个实施例中安全矩阵乘法的实现方案；

图4示出根据一个实施例的双方联合训练线性回归模型的过程示意图；

图5示出在一个实施例中第一子阶段的部分实施过程；

图6示出根据一个实施例的双方联合训练逻辑回归模型的过程示意图；

图7示出根据一个实施例的部署在第二方中的联合训练装置的示意性框图；

图8示出根据一个实施例的部署在第一方中的联合训练装置的示意性框图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

如前所述，典型的机器学习模型的训练过程包括，利用特征数据与模型参数数据之间的运算得到预测结果，根据预测结果确定出梯度，进而根据梯度调整模型参数的过程。

具体地，假设用于训练机器学习模型的训练数据集有n个样本，每个样本的样本特征表示为x（x可以是一个向量），标签表示为y，则该训练数据集可表示为：

通过各个样本的样本特征x与模型参数w的运算，可以得到对该样本的预测值

。如果机器学习模型为线性回归模型，预测值可表示为:

；如果机器学习模型为逻辑回归模型，预测值可表示为:

。

在使用最大似然概率及随机梯度下降方式的情况下，得到的梯度可以表示为：

(1)

其中，

为预测值，y为标签值，上标T表示转置，x为特征；于是，可以根据该梯度，更新参数w，从而实现模型训练。

从以上过程可以看到，训练过程包含几项核心的运算：计算样本特征x与模型参数w的乘积xw，该乘积xw用于确定出预测值

；通过

得到预测误差E；然后根据预测误差E与x的乘积，得到梯度。

在单方独立训练模型的情况下，可以容易地进行上述的运算。但是在多方联合训练机器学习模型的情况下，同一样本的特征可能分布在不同参与方中，每个参与方维护模型的一部分参数，如何在不泄露各方明文数据的情况下，实施上述各项运算，是实现联合训练中数据隐私保护的核心挑战。

针对上述问题，发明人提出，在双方联合训练机器学习模型的场景下，将各方模型参数拆解为安全的参数分片，借助于秘密分享，同态加密和安全矩阵乘法，将以上各项运算也相应拆解为安全而秘密的分片运算，通过双方对分片运算结果的交互和联合计算，实现上述各项运算，从而实现安全的协同训练。

图1为本说明书披露的一个实施例的实施场景示意图。如图1所示，双方联合训练的场景涉及参与方A和参与方B，或称为第一方和第二方。各个参与方可以实现为任何具有计算、处理能力的设备、平台、服务器或设备集群。双方要在保护数据隐私的情况下，联合训练一个业务预测模型。

第一方A存储有训练样本集中n个业务对象的一部分特征，称为第一特征部分。假定每个业务对象的第一特征部分为d1维向量，那么n个业务对象的第一特征部分构成一个n*d1维的第一特征矩阵X_A。第二方B存储有该n个业务对象的第二特征部分。假定每个业务对象的第二特征部分为d2维向量，那么n个业务对象的第二特征部分构成一个n*d2维的第二特征矩阵X_B。假定第二方中还存储有n个业务对象的标签值，n个标签值构成一个标签向量Y。

例如，在一个示例性场景中，上述第一方A和第二方B为电子支付平台和银行机构，双方需要联合训练一个业务预测模型，来评估用户的信用等级。此时，业务对象即为用户。双方可以各自维护用户的一部分特征数据，例如，电子支付平台维护用户的电子支付和转账相关特征，构成上述的第一特征矩阵；银行机构维护用户的信贷记录方面的相关特征，构成上述的第二特征矩阵。此外，银行机构还具有用户信用等级的标签Y。

在另一个示例中，上述第一方A和第二方B为电子商务平台和电子支付平台，双方需要联合训练一个业务预测模型，来评估商户的欺诈风险。此时，业务对象即为商户。双方可以各自维护商户的一部分特征数据，例如，电子商务平台存储样本商户的销售数据作为一部分样本特征，该部分样本特征构成上述第一特征矩阵；电子支付平台维护商户的交易流水数据作为另一部分样本特，构成第二特征矩阵。电子支付平台还维护样本商户的标签（是或不是欺诈商户的标记），构成标签向量Y。

在其他场景示例中，业务对象还可以是待评估的其他对象，比如商品，交互事件（例如交易事件，登录事件，点击事件，购买事件），等等。相应的，参与方可以是维护有上述业务对象的不同特征部分的不同业务方。业务预测模型可以是针对相应业务对象进行分类预测或回归预测的模型。

需要理解，双方各自维护的业务对象特征属于隐私数据，在联合训练过程中，不可以进行明文交换，以保护隐私数据安全。并且，最终，第一方A希望训练得到用于处理第一特征部分的模型参数部分，称为第一参数部分W_A；第二方希望训练得到用于处理第二特征部分的第二参数部分W_B，这两部分参数共同构成业务预测模型。

为了在不泄露隐私数据的情况下，进行模型的联合训练，根据本说明书的实施例，如图1所示，第一方A和第二方B将初始化生成、有待训练的第一参数部分W_A和第二参数部分W_B进行秘密分享，拆解为参数分片，于是，第一方得到第一参数第一分片<W_A>₁和第二参数第一分片<W_B>₁，第二方得到第一参数第二分片<W_A>₂和第二参数第二分片<W_B>₂。

在模型迭代训练过程中，双方通过安全矩阵乘法，得到总的特征矩阵X与总的参数矩阵W的乘积结果的加密分片Z₁，Z₂。由具有标签的第二方将这两个加密分片进行汇总，得到加密的乘积结果Z。第二方基于该乘积结果Z与加密的标签向量Y，得到加密的误差向量E，并对其进行同态加密下的秘密分享。于是，双方各自得到误差分片E₁和E₂。进一步地，双方基于误差分片和各自的特征矩阵，通过秘密分享和安全矩阵乘法，得到对应的梯度分片G₁和G₂。然后，第一方利用其梯度分片G₁，更新其维护的参数分片<W_A>₁和<W_B>₁，第二方利用其梯度分片G₂，更新其维护的参数分片<W_A>₂和<W_B>₂。

直到整个迭代过程结束，双方交换其参数分片，进行参数重构。于是第一方基于其自身维护的第一参数第一分片<W_A>₁和第二方发送的第一参数第二分片<W_A>₂，重构得到训练后的第一参数部分W_A；第二方基于其自身维护的第二参数第二分片<W_B>₂和第一方发送的第二参数第一分片<W_B>₁，重构得到训练后的第二参数部分W_B。

在整个训练过程中，双方不仅不进行特征数据的明文交换，其模型参数部分也拆分为参数分片，各自只维护分片参数的迭代更新，直到迭代结束，才会重构得到模型参数。如此，极大地增强了联合训练过程中，隐私数据的安全性。

可以看到，在以上训练方式中，需要利用同态加密下的秘密分享方案，以及安全矩阵乘法方案。下面首先对这两种方案进行简单描述。

图2示出在一个实施例中同态加密下的秘密分享方案。在图2的示例场景中，第一方A拥有用于同态加密的公钥PK-a和对应的私钥SK-a，第二方B拥有公钥PK-b和对应的私钥SK-b。假定当前要对矩阵Z进行秘密分享，且该矩阵Z已经用第一方A的公钥PK-a进行了同态加密。

在本文上下文中，用方括号[]表示加密，角标表示加密所用的公钥。如此，待分享的矩阵记为[Z]_a。

为了对同态加密的矩阵[Z]_a进行秘密分享，第二方B本地随机生成第二分片<Z>₂。

在本文上下文中，用尖括号<>表示秘密分享的分片，角标表示该分片的持有方。

然后，第二方B用第一方A的公钥PK-a和同样的同态加密算法，对该第二分片<Z>₂进行加密，得到第二加密分片[<Z>₂]_a。

接着，第二方B对矩阵[Z]_a和第二加密分片[<Z>₂]_a进行同态减法操作，得到第一加密分片[<Z>₁]_a=[Z]_a-[<Z>₂]_a。

这里利用了同态加密算法的同态性，即，对明文进行运算后再加密，与加密后对密文进行相应的运算，结果是等价的。例如，用同样的公钥PK加密

和

得到

和

，如果满足：

那么则认为，该加密算法满足加法同态，其中

为对应的同态加操作。实践中，

操作可以对应于常规的加法，乘法等。例如，在Paillier算法中，

对应于常规乘法。

以上计算第一加密分片时的同态减法，即为同态加操作的对应减操作。

然后，第二方B将上述第一加密分片[<Z>₁]_a发送给第一方A。由于该第一加密分片是采用第一方A的公钥加密的，第一方可以用对应的私钥SK-a对其进行解密，得到第一分片<Z>₁。

于是，最终，第一方A拥有第一分片<Z>₁，第二方B拥有第二分片<Z>₂，并且根据以上的同态性，两个分片之和为原矩阵Z：<Z>₁+<Z>₂=Z。如此，实现了双方在同态加密下的秘密分享。

图3示出在一个实施例中安全矩阵乘法的实现方案。在图3的示例场景中，第一方A拥有矩阵X，第二方B拥有矩阵Y，双方希望共同计算乘积矩阵X*Y，而不泄露各自的矩阵明文。为此，可以采用基于同态加密的安全矩阵乘法。

具体地，第一方A可以采用其公钥PK-a，利用同态加密算法，对其原始矩阵X加密，得到加密矩阵[X]_a，并将该加密矩阵发送给第二方B。

第二方B将加密矩阵[X]_a中的密文元素，与其矩阵Y中的明文元素，进行行列间的同态加和运算，得到一个加密乘积矩阵[Z]_a=[X]_a*Y。根据加密算法的同态性，该加密乘积矩阵[Z]_a对应于，使用A方公钥PK-a，利用同态加密算法对原始矩阵X和Y的乘积矩阵X*Y加密得到的矩阵，即，[Z]_a=[X*Y]_a。

然后，将上述加密乘积矩阵[Z]_a作为图2中同态加密的待分享矩阵[Z]_a，进行同态加密下的秘密分享。于是最终，第一方A拥有第一分片<Z>₁，第二方B拥有第二分片<Z>₂，并且，两个分片之和即为乘积矩阵X*Y：<Z>₁+<Z>₂=X*Y。

如此，实现了双方之间的安全矩阵乘法。

需要理解，图3是安全矩阵乘法的一种实现示例。还存在其他的安全矩阵乘法实现方式，例如基于秘密分享的矩阵乘法等，在此不一一详述。

利用同态加密下的秘密分享，和安全矩阵乘法，可以实现图1中所示的模型联合训练。下面描述双方联合进行模型训练的具体过程。

图4示出根据一个实施例的双方联合训练线性回归模型的过程示意图。图4场景中的第一方A和第二方B的数据持有状况与图1相同，不再赘述。并且，第一方A和第二方B可以彼此向对方发送自己的公钥PK-a和PK-b。在图4的场景中，双方联合训练一个线性回归模型作为业务预测模型。

首先，在模型初始化阶段，第一方A和第二方B对模型参数初始化，并进行秘密分享，各自维持参数分片。

具体地，在步骤S11，第一方A初始化用于处理第一特征部分的第一参数部分W_A。该第一参数部分W_A可以通过随机生成的方式初始化得到。然后，在S12，第一方A对上述第一参数部分进行秘密分享，即将其拆分为第一参数第一分片<W_A>₁和第一参数第二分片<W_A>₂，自己持有第一参数第一分片<W_A>₁，将第一参数第二分片<W_A>₂发送给第二方B。可以理解，两个参数分片之和为第一参数部分，即：W_A=<W_A>₁+<W_A>₂。

相应地，在步骤S13，第二方B初始化用于处理第二特征部分的第二参数部分W_B。该第二参数部分W_B可以通过随机生成的方式初始化得到。然后，在S14，第二方A对上述第二参数部分进行秘密分享，将其拆分为第二参数第一分片<W_B>₁和第二参数第二分片<W_B>₂，自己持有第二参数第二分片<W_B>₂，将第二参数第一分片<W_B>₁发送给第一方A。相应的，这两个参数分片之和为第二参数部分，即：W_B=<W_B>₁+<W_B>₂。

需要理解，步骤S11-S12，以及步骤S13-S14之间，可以并行执行，或者以任意先后顺序执行，在此不做限定。

在进行上述初始化和秘密分享之后，第一方A维持有第一参数第一分片<W_A>₁和第二参数第一分片<W_B>₁，第二方B维持有第一参数第二分片<W_A>₂和第二参数第二分片<W_B>₂。

接下来，进入模型迭代阶段，该阶段一般包含多次迭代过程。在一个实施例中，迭代次数为预先设定的超参数。在另一实施例中，迭代次数并不预先设定，而是在满足一定收敛条件时，停止迭代。上述收敛条件例如可以是，误差足够低，梯度足够小，等等。

每次迭代过程可以包括4个子阶段：计算总特征矩阵X与总参数W的乘积；计算误差向量E；计算梯度G；更新参数。下面分别描述各个子阶段的具体执行方式。

在第一子阶段，在步骤S21，第一方A和第二方B，各自基于本地矩阵乘法运算以及双方的安全矩阵乘法运算，分别计算得到第一乘积分片<Z>₁和第二乘积分片<Z>₂，使得两个分片之和对应于总特征矩阵X与总参数W的乘积，也就是等于，第一特征矩阵X_A与第一参数部分W_A相乘的第一乘积，和第二特征矩阵X_B与第二参数部分W_B相乘的第二乘积之和。

图5示出在一个实施例中第一子阶段的部分实施过程。

具体地，在步骤S211，第一方A本地计算第一特征矩阵X_A与第一参数第一分片<W_A>₁的乘积，得到第一特征第一处理结果<Z_A>₁，即：

<Z_A>₁=X_A˙<W_A>₁

在步骤S212，第一方A用其持有的第一特征矩阵X_A，与第二方B持有的第一参数第二分片<W_A>₂进行安全矩阵乘法。安全矩阵乘法可以采用图3所示的方式实现，或采用其他安全计算方式实现。第一特征矩阵X_A与第一参数第二分片<W_A>₂的乘积记为第一特征第二处理结果<Z_A>₂，即：

<Z_A>₂=X_A˙<W_A>₂

在本文上下文中，将用本地参数处理的结果称为第一处理结果，将通过安全矩阵乘法采用对方参数进行处理的结果称为第二处理结果。

则通过步骤S212的安全矩阵乘法，第一方A得到第一特征第二处理结果<Z_A>₂的第一分片<<Z_A>₂>₁，第二方B得到第一特征第二处理结果<Z_A>₂的第二分片<<Z_A>₂>₂，两个分片之和为第一特征第二处理结果。

在步骤S213，第二方B本地计算第二特征矩阵X_B与第二参数第二分片<W_B>₂的乘积，得到第二特征第一处理结果<Z_B>₁，即：

<Z_B>₁=X_B˙<W_B>₂

在步骤S214，第二方B用其持有的第二特征矩阵X_B，与第一方A持有的第二参数第一分片<W_B>₁进行安全矩阵乘法，乘积记为第二特征第二处理结果<Z_B>₂，即：

<Z_B>₂=X_B˙<W_B>₁

通过步骤S214的安全矩阵乘法，第一方A得到第二特征第二处理结果<Z_B>₂的第一分片<<Z_B>₂>₁，第二方B得到第二特征第二处理结果<Z_B>₂的第二分片<<Z_B>₂>₂，两个分片之和为第二特征第二处理结果。

需要理解，以上的各个步骤S211-S214，可以以任意的先后顺序执行。

然后，在步骤S215，第一方A对以上运算得到的各个处理结果的分片进行加和，也就是，对第一特征第一处理结果<Z_A>₁，第一特征第二处理结果的第一分片<<Z_A>₂>₁，第二特征第二处理结果的第一分片<<Z_B>₂>₁进行加和，得到第一乘积分片<Z>₁，即：

<Z>₁=<Z_A>₁+<<Z_A>₂>₁+<<Z_B>₂>₁

相应地，在步骤S216，第二方B对其得到的各个处理结果的分片进行加和，也就是，对第一特征第二处理结果的第二分片<<Z_A>₂>₂，第二特征第一处理结果<Z_B>₁，第二特征第二处理结果的第二分片<<Z_B>₂>₂进行加和，得到第二乘积分片<Z>₂，即：

<Z>₂=<Z_B>₁+<<Z_A>₂>₂+<<Z_B>₂>₂

可以验证，第一乘积分片<Z>₁和第二乘积分片<Z>₂之和，为总特征矩阵X与总参数W的乘积，即为第一特征矩阵X_A与第一参数部分W_A相乘的第一乘积，和第二特征矩阵X_B与第二参数部分W_B相乘的第二乘积之和：

<Z>₁+<Z>₂

=<Z_A>₁+<<Z_A>₂>₁+<<Z_B>₂>₁+<Z_B>₁+<<Z_A>₂>₂+<<Z_B>₂>₂

=<Z_A>₁+(<<Z_A>₂>₁+<<Z_A>₂>₂)+<Z_B>₁+(<<Z_B>₂>₁+<<Z_B>₂>₂)

=X_A˙<W_A>₁+X_A˙<W_A>₂+X_B˙<W_B>₁+X_B˙<W_B>₂

=X_A˙W_A+X_B˙W_B

至此第一方A和第二方B分别计算得到了第一乘积分片<Z>₁和第二乘积分片<Z>₂。

回到图4的第一子阶段。由于第二方B拥有标签数据，且为了保护数据隐私安全，在图4的步骤S22，第一方A用其公钥PK-a，对上述第一乘积分片<Z>₁进行同态加密，得到第一加密乘积分片[<Z>₁]_a，并将该第一加密乘积分片[<Z>₁]_a发送给第二方B。

在步骤S23，第二方B也用上述第一方的公钥PK-a，对其计算得到的第二乘积分片<Z>₂进行同态加密，得到第二加密乘积分片[<Z>₂]_a。

然后，在步骤S24，第二方B对第一加密乘积分片[<Z>₁]_a和第二加密乘积分片[<Z>₂]_a进行同态加和，得到加密乘积结果[Z]_a：

[Z]_a=[<Z>₁]_a+[<Z>₂]_a

根据加密算法的同态性，以及上述第一乘积分片和第二乘积分片的关系可以确定，如此得到的加密乘积结果[Z]_a对应于，第一特征矩阵X_A与第一参数部分W_A相乘的第一乘积，和第二特征矩阵X_B与第二参数部分W_B相乘的第二乘积之和的加密值，即[X_A˙W_A+X_B˙W_B]_a，或者说，总特征矩阵X与总参数W的乘积的加密值。

如此，在迭代的第一子阶段，通过双方共同进行的安全计算，第二方B得到了加密乘积结果[Z]_a，其对应于总特征矩阵X与总参数W的乘积的加密值。于是，进入第二子阶段，计算误差向量E。

在第二子阶段的步骤S31，第二方B基于上述加密乘积结果[Z]_a和标签向量Y的加密值进行同态运算，得到加密误差向量[E]_a。

在图4所示的线性回归模型的场景下，预测值

，因此，预测误差

可表示为，特征矩阵与模型参数的乘积结果X*W，与标签向量Y的差值。而目前获得的乘积结果为加密形式[Z]_a，因此，可以首先对标签向量Y也进行同态加密，得到[Y]_a,然后计算加密乘积结果[Z]_a和标签向量加密值[Y]_a的同态差值，作为加密误差向量[E]_a，即：

[E]_a=[Z]_a-[Y]_a

然后，在步骤S32，采用例如图2所示的同态加密下的秘密分享，对该加密误差向量[E]_a进行秘密分享。通过该秘密分享，第一方A得到第一误差分片<E>₁，第二方B得到第二误差分片<E>₂,并且，<E>₁+<E>₂=E。

接着，进入迭代的第三子阶段，计算梯度。根据之前的公式（1），梯度计算涉及误差向量与特征矩阵的相乘。然而，误差向量和特征矩阵依然分布在第一方A和第二方B双方之间，因此，仍需采用分片计算的方式，得到各个梯度分片。

具体的，在步骤S41，第二方B本地对该加密误差向量[E]_a和第二特征矩阵X_B进行同态操作下的矩阵相乘，得到第二加密梯度[G_B]_a，即：

[G_B]_a=[E]_a ^T˙X_B

其中，[E]_a ^T表示[E]_a的转置，且[E]_a ^T与X_B之间的运算，是[E]_a ^T中各行的密文元素与X_B中各列的明文元素之间的同态加和运算，与图3安全矩阵乘法过程中的同态矩阵相乘相似。

然后，在步骤S42，第二方B对该第二加密梯度[G_B]_a进行同态加密下的秘密分享，例如使用图2的方式。通过该秘密分享，第一方A得到第二梯度第一分片<G_B>₁，第二方B得到第二梯度第二分片<G_B>₂，且分片之和为第二梯度G_B=E^T˙X_B。

在步骤S43，第一方A将上述第一误差分片<E>₁的转置与第一特征矩阵X_A进行本地乘法操作，得到第一梯度第一部分<G_A>₁，即：

<G_A>₁=<E>₁ ^T˙X_A

以上运算为第一方的本地运算。

然后，在步骤S44，第一方用第一特征矩阵X_A，与第二方中的第二误差分片<E>₂进行安全矩阵乘法，相乘的结果记为第一梯度第二部分<G_A>₂，即：

<G_A>₂=<E>₂ ^T˙X_A

通过上述安全矩阵乘法，第一方A得到第一梯度第二部分的第一分片<<G_A>₂>₁，第二方B得到第一梯度第二部分的第二分片<<G_A>₂>₂。

至此，实现了对于梯度分片的计算。接着，进入迭代的第四子阶段，参数更新。在该阶段中，各方根据自己得到的梯度分片，更新自己维护的参数分片。参数更新阶段包括以下步骤。

在步骤S51，第一方A根据步骤S43计算的第一梯度第一部分<G_A>₁和步骤S44得到的第一梯度第二部分的第一分片<<G_A>₂>₁，更新第一参数第一分片<W_A>₁。

具体地，将第一梯度第一部分<G_A>₁和第一梯度第二部分的第一分片<<G_A>₂>₁之和与预设步长α的乘积，作为调整量，通过减去该调整量，更新第一参数第一分片<W_A>₁，这可以表示为：

<W_A>₁← <W_A>₁-α(<G_A>₁+<<G_A>₂>₁)

在步骤S52，第一方A根据步骤S42得到的第二梯度第一分片<G_B>₁，更新第二参数第一分片<W_B>₁，这可以表示为：

<W_B>₁ ← <W_B>₁-α<G_B>₁

在步骤S53，第二方B根据步骤S44得到的第一梯度第二部分的第二分片<<G_A>₂>₂，更新第一参数第二分片<W_A>₂，这可以表示为：

<W_A>₂ ← <W_A>₂-α<<G_A>₂>₂

在步骤S54，第二方B根据步骤S42得到的第二梯度第二分片<G_B>₂，更新第二参数第二分片<W_B>₂，这可以表示为：

<W_B>₂ ← <W_B>₂-α<G_B>₂

即，在原分片值基础上，减去预设步长α与对应梯度分片的乘积，从而更新各个参数分片。可以理解，以上的步骤S51-S54之间，可以以任意的先后顺序执行，或者并行执行。

可以看到，对于第一参数部分W_A的更新由双方共同完成，其中第一方A更新第一参数第一分片<W_A>₁，第二方B更新第一参数第二分片<W_A>₂，两方共同更新的总和为：

<G_A>₁+<<G_A>₂>₁+<<G_A>₂>₂

=<G_A>₁+<G_A>₂

=<E>₁ ^T˙X_A+<E>₂ ^T˙X_A

=E^T˙X_A

即，误差向量（的转置）与第一特征矩阵X_A的乘积。

对于第二参数部分W_B的更新也是由双方共同完成，其中第一方A更新第二参数第一分片<W_B>₁，第二方B更新第二参数第二分片<W_B>₂，两方共同更新的总和为：

<G_B>₁+<G_B>₂

=G_B =E^T˙X_B

即，误差向量（的转置）与第二特征矩阵X_B的乘积。

但是，在每轮迭代后，双方无需交换更新后的参数分片，而是继续进行下一轮迭代，也就是回到步骤S21，基于更新后的参数分片，再次执行第一子阶段。如此，在迭代过程中，任意一方都不具有完整的模型参数，也不交换特征矩阵的明文信息，高强度确保了隐私数据的安全。

直到整个迭代过程结束，例如达到了预设迭代次数，或达到了预定收敛条件，进入模型重构阶段。

在模型重构阶段，第一方A将其迭代维护的第二参数第一分片<W_B>₁发送给第二方B；第二方B将其迭代维护的第一参数第二分片<W_A>₂发送给第一方A。

第一方A基于其自身维护的第一参数第一分片<W_A>₁和第二方发送的第一参数第二分片<W_A>₂，重构得到训练后的第一参数部分W_A。

第二方B基于其自身维护的第二参数第二分片<W_B>₂和第一方发送的第二参数第一分片<W_B>₁，重构得到训练后的第二参数部分W_B。

至此，第一方A和第二方B共同完成了线性回归模型的训练，分别各自得到了用于处理其对应特征部分的模型参数部分W_A和W_B。

回顾整个训练过程可以看到，双方不仅不进行特征数据的明文交换，其模型参数部分也拆分为参数分片，各自只维护分片参数的迭代更新，直到迭代结束，才会重构得到模型参数。由于迭代过程中各方仅维护参数的分片，交换一些分片结果，而基于这些分片结果几乎不可能反推出隐私数据的有用信息，如此，极大地增强了联合训练过程中，隐私数据的安全性。

以上结合图4线性回归模型的联合训练进行了详细描述。下面描述逻辑回归模型的场景。本领域技术人员了解，在使用逻辑回归模型作为业务预测模型的情况下，预测值可表示为:

。可以看到，逻辑回归模型的预测值是基于非线性的sigmoid函数的，而非线性函数不利于同态加密等安全计算。

因此，在逻辑回归模型的情况下，为了便于进行线性计算，可以将其中的sigmoid函数进行泰勒Taylor展开。具体的，sigmod函数 1 / (1 + e^x)可以进行以下泰勒分解：

（2）

相应的，逻辑回归预测值可以展开为：

（3）

将以上预测值展开式代入公式（1）中可以得到梯度的形式，比如1阶展开下，梯度形式为

（4）

三阶展开的梯度形式为

（5）

如此，通过泰勒Taylor展开，将逻辑回归的预测值转换成了可以使用同态加密的方案。于是，可以对图4所示的方案过程稍作修改，使得训练过程适用于逻辑回归模型。

图6示出根据一个实施例的双方联合训练逻辑回归模型的过程示意图。图6的训练过程与图4基本相同，只是在步骤S31，计算加密误差向量时，根据sigmoid函数的泰勒展开形式，基于加密乘积结果[Z]_a得到加密预测结果，对加密预测结果和标签向量Y的加密值进行同态差值运算，得到加密误差向量E。

在采用1阶泰勒展开的情况下，根据公式（4），预测结果可以表示为（0.5+Z/4），相应的可以将误差项拆分为(0.5-Y)和Z/4。因此，可以通过以下运算，得到逻辑回归下的近似加密误差向量[E]_a：

[E]_a=[0.5-Y]_a-[Z]_a/4

其他训练步骤均与图4相同。

在采用多阶泰勒展开的情况下，还需要进一步得到wx的多阶计算结果，即多阶乘积结果Z^k的加密值[Z^k]_a。在计算加密误差向量[E]_a时，基于加密乘积结果[Z]_a和加密多阶乘积[Z^k]_a得到加密预测结果，对加密预测结果和标签向量Y的加密值进行同态差值运算，才能得到加密误差向量。

具体的，例如采用3阶展开的情况下，即k=3，则需要进一步获得[Z³]_a。为此，可以在图6中S21双方各自计算得到第一乘积分片<Z>₁和第二乘积分片<Z>₂基础上，进行高阶运算和结果交换，得到[Z³]_a。例如可以通过下式，计算得到3阶乘积结果的加密值[Z³]_a。

之后，可以根据公式（5），基于[Z]_a，[Z³]_a和加密标签向量Y的同态运算，计算加密误差向量[E]_a。

可以理解，泰勒展开的阶数越高，结果越准确，但是计算的复杂度越高。但是原则上，高阶乘积结果可以基于低阶的分片来计算得到。如此，对于用逻辑回归模型实现的业务预测模型，通过以上描述的方式，实现保护数据隐私的双方联合训练。

以上训练方式也适用于通过神经网络实现的业务预测模型。对于典型的前馈全连接神经网络而言，每个神经元与其前一层的各个神经元以不同的权重相连接。于是，前一层各个神经元的输出可以视为特征数据，特征数据分布于双方之中；连接权重可以视为模型参数部分，用于以线性组合的方式，处理对应的特征数据。从而，可以将前述训练过程应用于神经网络中每个神经元的参数训练，实现神经网络模型的双方联合安全训练。

总体而言，对于各种以特征数据与模型参数之间的线性组合为基础的业务预测模型，都可以采用以上描述的训练方式。在该训练方式中，通过参数的分片维护，高强度确保了隐私数据不会被泄露或反推，保证了数据安全。

根据另一方面的实施例，提供了一种保护数据隐私的双方联合训练业务预测模型的装置，所述双方包括第一方和第二方，该装置可以部署在其中的第二方中。其中，第一方存储有多个业务对象的第一特征部分构成的第一特征矩阵X_A；第二方存储有所述多个业务对象的第二特征部分构成的第二特征矩阵X_B，以及标签值构成的标签向量Y。第二方可以实现为任何具有计算、处理能力的设备、平台或设备集群。图7示出根据一个实施例的部署在第二方中的联合训练装置的示意性框图。如图7所示，该装置700包括迭代单元710，用于多次迭代执行模型参数更新。该迭代单元710进一步包括：

乘积分片计算单元711，配置为基于本地维护的第一参数第二分片和第二参数第二分片，通过本地矩阵乘法以及与所述第一方的安全矩阵乘法运算，计算得到同态加密的第二加密乘积分片，并从所述第一方接收第一加密乘积分片；其中，第一参数第二分片是用于处理所述第一特征部分的第一参数部分W_A的第二分片；第二参数第二分片是用于处理所述第二特征部分的第二参数部分W_B的第二分片；

乘积结果确定单元712，配置为对所述第一加密乘积分片和第二加密乘积分片进行同态加和，得到加密乘积结果Z，其对应于，第一特征矩阵X_A与第一参数部分W_A相乘的第一乘积，和第二特征矩阵X_B与第二参数部分W_B相乘的第二乘积之和的加密值；

误差向量确定单元713，配置为基于所述加密乘积结果Z和所述标签向量Y的加密值进行同态运算，得到加密误差向量E，对该加密误差向量E进行秘密分享，得到第二误差分片；

第一梯度确定单元714，配置为对该加密误差向量E和第二特征矩阵X_B进行同态操作下的矩阵相乘，得到第二加密梯度，对该第二加密梯度进行秘密分享，得到第二梯度第二分片；

第二梯度确定单元715，配置为用所述第二误差分片，与所述第一方中的第一特征矩阵X_A进行安全矩阵乘法，得到第一梯度第二部分的第二分片；

参数更新单元716，配置为根据所述第二梯度第二分片，更新所述第二参数第二分片；根据所述第一梯度第二部分的第二分片，更新所述第一参数第二分片。

在一个实施例中，上述装置700还包括初始化单元720，配置为：

初始化所述第二参数部分W_B，通过秘密分享将其拆分为第二参数第一分片和第二参数第二分片，保留所述第二参数第二分片，将所述第二参数第一分片发送给第一方；

从第一方接收对所述第一参数部分W_A秘密分享的第一参数第二分片。

根据一种实施方式，上述装置700还包括参数重构单元730，配置为：将最后一次迭代中更新后的所述第一参数第二分片发送给所述第一方，并从所述第一方接收更新后的第二参数第一分片；

将最后一次迭代中更新后的第二参数第二分片，和所接收的第二参数第一分片进行组合，得到所述业务预测模型训练后的第二参数部分W_B。

在不同实施例中，前述业务对象包括以下之一：用户，商户，商品，事件；所述业务预测模型用于预测所述业务对象的分类或回归值。

在一个具体实施例中，所述业务预测模型为线性回归模型；此时，误差向量确定单元713配置为，计算所述加密乘积结果Z和所述标签向量Y的同态差值，作为所述加密误差向量E。

在另一具体实施例中，所述业务预测模型为逻辑回归模型；此时，误差向量确定单元713配置为，根据sigmoid函数的泰勒展开形式，基于所述加密乘积结果Z得到加密预测结果，对加密预测结果和所述标签向量Y的加密值进行同态差值运算，得到所述加密误差向量E。

进一步的，在一个例子中，乘积结果确定单元712还配置为，至少根据所述第一乘积分片和所述第二乘积分片，计算加密多阶乘积；相应的，误差向量确定单元713配置为，根据sigmoid函数的多阶泰勒展开形式，基于所述加密乘积结果Z和所述加密多阶乘积得到加密预测结果，对加密预测结果和所述标签向量Y的加密值进行同态差值运算，得到所述加密误差向量E。

在一个具体实施例中，上述乘积分片计算单元711具体配置为：用所述第一参数第二分片，与所述第一方中的第一特征矩阵X_A进行安全矩阵乘法，得到第一特征第二处理结果的第二分片；本地计算第二特征矩阵X_B与第二参数第二分片的乘积，得到第二特征第一处理结果；用所述第二特征矩阵X_B，与所述第一方中的第二参数第一分片进行安全矩阵乘法，得到第二特征第二处理结果的第二分片；对所述第一特征第二处理结果的第二分片，所述第二特征第一处理结果，所述第二特征第二处理结果的第二分片进行加和，并用所述第一方的公钥对加和结果进行同态加密，得到所述第二加密乘积分片。

在一个具体例子中，上述参数更新单元716配置为，通过减去所述第二梯度第二分片与预设步长的乘积，更新所述第二参数第二分片。

根据又一方面的实施例，提供了一种双方联合训练业务预测模型的装置，该装置可以部署在前述的第一方中，该第一方可以实现为任何具有计算、处理能力的设备、平台或设备集群。如前所述，第一方中存储有多个业务对象的第一特征部分构成的第一特征矩阵X_A；第二方存储有所述多个业务对象的第二特征部分构成的第二特征矩阵X_B，以及标签值构成的标签向量Y。图8示出根据一个实施例的部署在第一方中的联合训练装置的示意性框图。如图8所示，该装置800包括迭代单元810，用于多次迭代执行模型参数更新。该迭代单元810进一步包括：

乘积分片计算单元811，配置为基于本地维护的第一参数第一分片和第二参数第一分片，通过本地矩阵乘法运算以及与所述第二方的安全矩阵乘法运算，计算得到同态加密的第一加密乘积分片；其中，所述第一参数第一分片是用于处理所述第一特征部分的第一参数部分W_A的第一分片；第二参数第一分片是用于处理所述第二特征部分的第二参数部分W_B的第一分片；

乘积分片发送单元812，配置为将该第一加密乘积分片发送给第二方，使得第二方将该第一加密乘积分片与其计算的第二加密乘积分片进行同态加和，以得到加密乘积结果Z，其对应于，第一特征矩阵X_A与第一参数部分W_A相乘的第一乘积，和第二特征矩阵X_B与第二参数部分W_B相乘的第二乘积之和的加密值；

误差分片接收单元813，配置为从第二方接收对加密误差向量E秘密分享的第一误差分片，其中加密误差向量E基于所述加密乘积结果Z和标签向量Y的加密值的同态运算确定；

第一梯度确定单元814，配置为将所述第一误差分片的转置与第一特征矩阵X_A进行本地乘法操作，得到第一梯度第一部分；

第二梯度确定单元815，配置为用所述第一特征矩阵X_A，与第二方中保留的第二误差分片进行安全矩阵乘法，得到第一梯度第二部分的第一分片；

第三梯度确定单元816，配置为从第二方接收对第二加密梯度秘密分享的第二梯度第一分片；

参数更新单元817，配置为根据所述第一梯度第一部分和第一梯度第二部分的第一分片，更新第一参数第一分片；根据所述第二梯度第一分片，更新第二参数第一分片。

在一个实施例中，装置800还包括初始化单元820，配置为：初始化所述第一参数部分W_A，通过秘密分享将其拆分为第一参数第一分片和第一参数第二分片，保留所述第一参数第一分片，将所述第一参数第二分片发送给第二方；从所述第二方接收对第二参数部分W_B秘密分享的第二参数第一分片。

根据一种实施方式，装置800还包括参数重构单元830，配置为：将最后一次迭代中更新后的所述第二参数第一分片发送给所述第二方，并从所述第二方接收更新后的第一参数第二分片；将最后一次迭代中更新后的第一参数第一分片，和所接收的第一参数第二分片进行组合，得到所述业务预测模型训练后的第一参数部分W_A。

根据一个具体实施例，乘积分片计算单元811具体配置为：本地计算第一特征矩阵X_A与第一参数第一分片的乘积，得到第一特征第一处理结果；用所述第一特征矩阵X_A，与所述第二方中的第一参数第二分片进行安全矩阵乘法，得到第一特征第二处理结果的第一分片；用所述第二参数第一分片，与所述第二方中的第二特征矩阵X_B进行安全矩阵乘法，得到第二特征第二处理结果的第一分片；对所述第一特征第一处理结果，所述第一特征第二处理结果的第一分片，所述第二特征第二处理结果的第一分片进行加和，并用所述第一方的公钥对加和结果进行同态加密，得到所述第一加密乘积分片。

在一个实施例中，上述参数更新单元817至少配置为，将所述第一梯度第一部分和第一梯度第二部分的第一分片之和与预设步长的乘积，作为调整量，通过减去所述调整量，更新所述第一参数第一分片。

通过以上部署在第一方和第二方中的装置，实现双方的保护数据隐私的安全联合训练。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图4到图5所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图4到图5所述的方法。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

1.一种保护数据隐私的双方联合训练业务预测模型的方法，所述双方包括第一方和第二方，所述第一方存储有多个业务对象的第一特征部分构成的第一特征矩阵X_A；所述第二方存储有所述多个业务对象的第二特征部分构成的第二特征矩阵X_B，以及标签值构成的标签向量Y；所述方法应用于所述第二方，该方法包括，多次迭代执行模型参数更新，其中每次迭代包括：

基于本地维护的第一参数第二分片和第二参数第二分片，通过采用在本地直接执行的矩阵乘法运算，以及采用在所述第二方与所述第一方之间进行的安全矩阵乘法运算，计算得到同态加密的第二加密乘积分片，并从所述第一方接收第一加密乘积分片；其中，第一参数第二分片是用于处理所述第一特征部分的第一参数部分W_A的第二分片；第二参数第二分片是用于处理所述第二特征部分的第二参数部分W_B的第二分片；

基于所述加密乘积结果Z和所述标签向量Y的加密值进行同态差值运算，得到加密误差向量E，对该加密误差向量E进行秘密分享，得到第二误差分片；

用所述第二误差分片，与所述第一方中的第一特征矩阵X_A进行安全矩阵乘法运算，得到第一梯度第二部分的第二分片；

2.根据权利要求1所述的方法，在多次迭代执行模型参数更新之前，还包括：

3.根据权利要求1所述的方法，在多次迭代执行模型参数更新之后，还包括：

将最后一次迭代中更新后的所述第一参数第二分片发送给所述第一方，并从所述第一方接收更新后的第二参数第一分片；

4.根据权利要求1所述的方法，其中，所述业务对象包括以下之一：用户，商户，商品，事件；所述业务预测模型用于预测所述业务对象的分类或回归值。

5.根据权利要求1所述的方法，其中，所述业务预测模型为线性回归模型；

所述基于所述加密乘积结果Z和所述标签向量Y的加密值进行同态差值运算，得到加密误差向量E，包括：

计算所述加密乘积结果Z和所述标签向量Y的同态差值，作为所述加密误差向量E。

6.根据权利要求1所述的方法，其中，所述业务预测模型为逻辑回归模型；

根据sigmoid函数的泰勒展开形式，基于所述加密乘积结果Z得到加密预测结果，对加密预测结果和所述标签向量Y的加密值进行同态差值运算，得到所述加密误差向量E。

7.根据权利要求6所述的方法，其中，在得到加密误差向量E之前，还包括，至少根据所述第一乘积分片和所述第二乘积分片，计算加密多阶乘积；

所述得到加密误差向量E，包括：

根据sigmoid函数的多阶泰勒展开形式，基于所述加密乘积结果Z和所述加密多阶乘积得到加密预测结果，对加密预测结果和所述标签向量Y的加密值进行同态差值运算，得到所述加密误差向量E。

8.根据权利要求1所述的方法，其中，计算得到同态加密的第二加密乘积分片，包括：

用所述第一参数第二分片，与所述第一方中的第一特征矩阵X_A进行安全矩阵乘法运算，得到第一特征第二处理结果的第二分片；

本地计算第二特征矩阵X_B与第二参数第二分片的乘积，得到第二特征第一处理结果；

用所述第二特征矩阵X_B，与所述第一方中的第二参数第一分片进行安全矩阵乘法运算，得到第二特征第二处理结果的第二分片；

对所述第一特征第二处理结果的第二分片，所述第二特征第一处理结果，所述第二特征第二处理结果的第二分片进行加和，并用所述第一方的公钥对加和结果进行同态加密，得到所述第二加密乘积分片。

9.根据权利要求1所述的方法，其中，根据所述第二梯度第二分片，更新所述第二参数第二分片，包括：通过减去所述第二梯度第二分片与预设步长的乘积，更新所述第二参数第二分片。

10.一种保护数据隐私的双方联合训练业务预测模型的方法，所述双方包括第一方和第二方，所述第一方存储有多个业务对象的第一特征部分构成的第一特征矩阵X_A；所述第二方存储有所述多个业务对象的第二特征部分构成的第二特征矩阵X_B，以及标签值构成的标签向量Y；所述方法应用于所述第一方，该方法包括：多次迭代执行模型参数更新，其中每次迭代包括：

基于本地维护的第一参数第一分片和第二参数第一分片，通过采用在本地直接执行的矩阵乘法运算，以及采用在所述第一方与所述第二方之间进行的安全矩阵乘法运算，计算得到同态加密的第一加密乘积分片；其中，所述第一参数第一分片是用于处理所述第一特征部分的第一参数部分W_A的第一分片；第二参数第一分片是用于处理所述第二特征部分的第二参数部分W_B的第一分片；

从第二方接收对加密误差向量E秘密分享的第一误差分片，其中加密误差向量E基于所述加密乘积结果Z和标签向量Y的加密值的同态差值运算确定；

用所述第一特征矩阵X_A，与第二方中保留的第二误差分片进行安全矩阵乘法运算，得到第一梯度第二部分的第一分片；

11.根据权利要求10所述的方法，在多次迭代执行模型参数更新之前，还包括：

初始化所述第一参数部分W_A，通过秘密分享将其拆分为第一参数第一分片和第一参数第二分片，保留所述第一参数第一分片，将所述第一参数第二分片发送给第二方；

从所述第二方接收对第二参数部分W_B秘密分享的第二参数第一分片。

12.根据权利要求10所述的方法，在多次迭代执行模型参数更新之后，还包括：

将最后一次迭代中更新后的所述第二参数第一分片发送给所述第二方，并从所述第二方接收更新后的第一参数第二分片；

将最后一次迭代中更新后的第一参数第一分片，和所接收的第一参数第二分片进行组合，得到所述业务预测模型训练后的第一参数部分W_A。

13.根据权利要求10所述的方法，其中，计算得到同态加密的第一加密乘积分片，包括：

本地计算第一特征矩阵X_A与第一参数第一分片的乘积，得到第一特征第一处理结果；

用所述第一特征矩阵X_A，与所述第二方中的第一参数第二分片进行安全矩阵乘法运算，得到第一特征第二处理结果的第一分片；

用所述第二参数第一分片，与所述第二方中的第二特征矩阵X_B进行安全矩阵乘法运算，得到第二特征第二处理结果的第一分片；

对所述第一特征第一处理结果，所述第一特征第二处理结果的第一分片，所述第二特征第二处理结果的第一分片进行加和，并用所述第一方的公钥对加和结果进行同态加密，得到所述第一加密乘积分片。

14.根据权利要求10所述的方法，其中，根据所述第一梯度第一部分和第一梯度第二部分的第一分片，更新所述第一参数第一分片，包括：将所述第一梯度第一部分和第一梯度第二部分的第一分片之和与预设步长的乘积，作为调整量，通过减去所述调整量，更新所述第一参数第一分片。

15.一种保护数据隐私的双方联合训练业务预测模型的装置，所述双方包括第一方和第二方，所述第一方存储有多个业务对象的第一特征部分构成的第一特征矩阵X_A；所述第二方存储有所述多个业务对象的第二特征部分构成的第二特征矩阵X_B，以及标签值构成的标签向量Y；所述装置部署于所述第二方，该装置包括，用于多次迭代执行模型参数更新的迭代单元，其进一步包括：

乘积分片计算单元，配置为基于本地维护的第一参数第二分片和第二参数第二分片，通过采用在本地直接执行的矩阵乘法运算，以及采用在所述第二方与所述第一方之间进行的安全矩阵乘法运算，计算得到同态加密的第二加密乘积分片，并从所述第一方接收第一加密乘积分片；其中，第一参数第二分片是用于处理所述第一特征部分的第一参数部分W_A的第二分片；第二参数第二分片是用于处理所述第二特征部分的第二参数部分W_B的第二分片；

误差向量确定单元，配置为基于所述加密乘积结果Z和所述标签向量Y的加密值进行同态差值运算，得到加密误差向量E，对该加密误差向量E进行秘密分享，得到第二误差分片；

第二梯度确定单元，配置为用所述第二误差分片，与所述第一方中的第一特征矩阵X_A进行安全矩阵乘法运算，得到第一梯度第二部分的第二分片；

16.根据权利要求15所述的装置，还包括初始化单元，配置为：

17.根据权利要求15所述的装置，还包括参数重构单元，配置为：将最后一次迭代中更新后的所述第一参数第二分片发送给所述第一方，并从所述第一方接收更新后的第二参数第一分片；

18.一种保护数据隐私的双方联合训练业务预测模型的装置，所述双方包括第一方和第二方，所述第一方存储有多个业务对象的第一特征部分构成的第一特征矩阵X_A；所述第二方存储有所述多个业务对象的第二特征部分构成的第二特征矩阵X_B，以及标签值构成的标签向量Y；所述装置部署于所述第一方，该装置包括：用于多次迭代执行模型参数更新的迭代单元，其进一步包括：

乘积分片计算单元，配置为基于本地维护的第一参数第一分片和第二参数第一分片，通过采用在本地直接执行的矩阵乘法运算，以及采用在所述第一方与所述第二方之间进行的安全矩阵乘法运算，计算得到同态加密的第一加密乘积分片；其中，所述第一参数第一分片是用于处理所述第一特征部分的第一参数部分W_A的第一分片；第二参数第一分片是用于处理所述第二特征部分的第二参数部分W_B的第一分片；

误差分片接收单元，配置为从第二方接收对加密误差向量E秘密分享的第一误差分片，其中加密误差向量E基于所述加密乘积结果Z和标签向量Y的加密值的同态差值运算确定；

第二梯度确定单元，配置为用所述第一特征矩阵X_A，与第二方中保留的第二误差分片进行安全矩阵乘法运算，得到第一梯度第二部分的第一分片；

19.根据权利要求18所述的装置，还包括初始化单元，配置为：

20.根据权利要求18所述的装置，还包括参数重构单元，配置为：

21.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-14中任一项的所述的方法。

22.一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-14中任一项所述的方法。