WO2021022707A1

WO2021022707A1 - 一种混合联邦学习方法及架构

Info

Publication number: WO2021022707A1
Application number: PCT/CN2019/117518
Authority: WO
Inventors: 程勇; 董苗波; 刘洋; 陈天健
Original assignee: 深圳前海微众银行股份有限公司
Priority date: 2019-08-06
Filing date: 2019-11-12
Publication date: 2021-02-11
Also published as: CN110490738A

Abstract

本发明公开了一种混合联邦学习方法及架构，该方法适用于具有多组参与者的联邦学习模型训练；其中方法为：针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型；对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者；针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。上述方法应用于金融科技(Fintech)时，可以提升联邦学习模型的准确率。

Description

一种混合联邦学习方法及架构

相关申请的交叉引用

本申请要求在2019年08月06日提交中国专利局、申请号为201910720373.9、申请名称为“一种混合联邦学习方法及架构”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及金融科技(Fintech)领域和联邦学习领域，尤其涉及一种混合联邦学习方法及架构。

背景技术

随着计算机技术的发展，越来越多的技术(大数据、分布式、区块链(Blockchain)、人工智能等)应用在金融领域，传统金融业正在逐步向金融科技(Fintech)转变。目前，金融科技领域中许多金融策略的调整都依赖于对大量金融交易数据进行联邦学习的结果，相应金融策略的调整很可能对金融机构的盈亏造成影响。因此，对一个金融机构来说，其联邦学习模型的精确性至关重要。

然而，目前应用联邦学习的场景中，经常会遇到参与者A和B拥有的数据虽然能形成互补，可以联合构建机器学习模型，但是参与者A和B拥有的数据量仍然非常少，构建的联合模型的性能难以达到预期指标，从而联合模型的精确度也不够高。因此，现有技术中，联邦学习得到的联合模型的精确度不够高是一个亟待解决的问题。

发明内容

本申请实施例提供一种混合联邦学习方法及架构，解决了现有技术中联邦学习模型不够精确的问题。

第一方面，本申请实施例提供一种混合联邦学习方法，该方法适用于具有多组参与者的联邦模型训练，其中，同一组内的参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组间的参与者的数据集之间包含有相同的样本特征及不同的样本对象；所述方法包括：针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者；针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。

上述方法中，获得的至少一个纵向联邦学习模型中，由于第一联邦学习模型是组内每个参与者在训练过程中根据组内其他参与者训练的中间结果确定的，因此每组的第一联邦学习模型已经进行了一轮优化，再对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集得到更新后的第一联邦学习模型，因此获取到的适用于各组参与者的联邦学习模型充分考虑了各个第一联邦学习模型，在各组的第一联邦学习模型基础上进一步优化，因此通过上述方法可以大幅提高联邦学习的扩展性，结合了考虑了更多参与者的数据，实现对海量数据的联邦学习，从而增加了联邦学习的精确性。

一种可选实施方式中，所述模型训练结束的预设终止条件包括以下至少一项：所述第二联邦学习模型的参数收敛；所述第二联邦学习模型的更新次数大于或等于预设训练次数；所述第二联邦学习模型的训练时间大于或等于预设训练时长。

上述方法中，提供了训练结束的具体终止条件，当满足以上一项或多项时就停止训练，从而避免因为训练联邦学习模型不停止而消耗资源。

一种可选实施方式中，每个组包括组内协调者，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果，包括：针对任一组的任一参与者，执行以下训练过程得到所述第一联邦学习模型，包括：针对任一组的任一参与者，执行以下训练过程得到所述第一联邦学习模型，包括：所述参与者将根据所述参与者的数据集训练的初始模型的中间结果发送给其他参与者；所述参与者根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，并发送给所述组内协调者；所述组内协调者根据各参与者的训练结果，确定更新参数并发送给各参与者；所述参与者根据所述更新参数更新所述初始模型，得到所述第一联邦学习模型。

上述方法中，参与者将根据所述参与者的数据集训练的初始模型的中间结果发送给其他参与者；所述参与者根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，也就是说参与者的训练结果充分考虑了组内其它参与者的中间结果，训练结果更加精确，而且所述组内协调者根据各参与者的训练结果，确定更新参数并发送给各参与者；所述参与者根据所述更新参数更新所述初始模型，得出了更精确的第一联邦学习模型。

一种可选实施方式中，所述对各组的第一联邦学习模型进行融合得到第二联邦学习模型，包括：将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值。

上述方式下，通过将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，得到第二联邦学习模型中该参数的值，从而按权重决定每个参数，使得第二联邦学习中的参数值更加精确。

一种可选实施方式中，所述对各组的第一联邦学习模型进行融合得到第二联邦学习模型，包括：通过组间协调者，将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值；通过组间协调者，将所述第二联邦学习模型发送给各组内协调者；所述组内协调者将所述第二联邦学习模型发送给组内参与者。

上述方式下，通过组间协调者将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值，从而避免了组内协调者之间频繁交互学习模型的通信，进一步提升了联邦学习模型的获取效率。

第二方面，本申请提供一种混合联邦学习架构，包括：多组第一联邦学习系统和协调者；其中，每组第一联邦学习系统包括多个参与者；同组第一联邦学习系统内的各参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组第一联邦学习系统间的各参与者的数据集之间包含有相同的样本特征及不同的样本对象；任一参与者，用于，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；所述协调者，用于对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者。

一种可选实施方式中，所述协调者为各第一联邦学习系统内的组内协调者；或所述协调者为各第一联邦学习系统间的组间协调者。

一种可选实施方式中，所述参与者，用于将根据所述参与者的数据集训练的初始模型的中间结果发送给其他参与者；所述参与者，还用于根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，并发送给所述组内协调者；所述组内协调者，还用于根据各参与者的训练结果确定更新参数并发送给各参与者；所述参与者，还用于根据所述更新参数更新所述初始模型，得到所述第一联邦学习模型。

一种可选实施方式中，所述对各组的第一联邦学习模型进行融合得到第二联邦学习模型，包括：通过组间协调者，将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值；通过所述组间协调者，将所述第二联邦学习模型发送给各组内协调者。

上述第二方面及第二方面各个实施例的有益效果，可以参考上述第一方面及第一方面各个实施例的有益效果，这里不再赘述。

第三方面，本申请实施例提供一种计算机设备，包括程序或指令，适用于具有多组参与者的联邦模型训练，其中，同一组内的参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组间的参与者的数据集之间包含有相同的样本特征及不同的样本对象；所述计算机设备包括程序或指令，当所述程序或指令被执行时，实现如下步骤：针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者；针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。

一种可选实施方式中，每个组包括组内协调者，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果，包括：针对任一组的任一参与者，执行以下训练过程得到所述第一联邦学习模型，包括：所述参与者将根据所述参与者的数据集训练的初始模型的中间结果发送给其他参与者；所述参与者根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，并发送给所述组内协调者；所述组内协调者根据各参与者的训练结果，确定更新参数并发送给各参与者；所述参与者根据所述更新参数更新所述初始模型，得到所述第一联邦学习模型。

第四方面，本申请实施例提供一种存储介质，包括程序或指令，适用于具有多组参与者的联邦模型训练，其中，同一组内的参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组间的参与者的数据集之间包含有相同的样本特征及不同的样本对象；所述存储介质包括程序或指令，当所述程序或指令被执行时，实现如下步骤：针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者；针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。

附图说明

图1为本申请实施例提供的一种混合联邦学习架构的示意图；

图2为本申请实施例提供的一种混合联邦学习架构的任一组第一联邦学习系统中获得第一联邦学习模型的示意图；

图3为本申请实施例提供的一种混合联邦学习架构的具体示意图；

图4为本申请实施例提供的一种混合联邦学习架构的具体示意图；

图5为本申请实施例提供的一种混合联邦学习方法的步骤流程示意图；

图6为本申请实施例提供的一种混合联邦学习架构中获得第二联邦学习模型的示意图。

具体实施方式

为了更好的理解上述技术方案，下面将结合说明书附图及具体的实施方式对上述技术方案进行详细的说明，应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明，而不是对本申请技术方案的限定，在不冲突的情况下，本申请实施例以及实施例中的技术特征可以相互结合。

在金融机构(银行机构、保险机构或证券机构)在进行业务(如银行的贷款业务、存款业务等)运转过程中，许多金融策略的调整都依赖于对大量金融交易数据进行联邦学习的结果，相应金融策略的调整很可能对金融机构的盈亏造成影响。因此，对一个金融机构来说，其联邦学习模型的精确性至关重要。

联邦学习(federated learning)是指通过联合不同的参与者(participant，或者party，也称为数据拥有者(data owner)，或者客户(client))进行机器学习的方法。在联邦学习中，参与者并不需要向其它参与者和协调者(coordinator，也称为参数服务器(parameter server)，或者聚合服务器(aggregation server))暴露自己拥有的数据，因而联邦学习可以很好的保护用户隐私和保障数据安全。

现有技术中，目前应用联邦学习的场景中，经常会遇到参与者A和B拥有的数据虽然能形成互补，可以联合构建机器学习模型，但是参与者A和B拥有的数据量仍然非常少，构建的联合模型的性能难以达到预期指标，从而联合模型的精确度也不够高。这种情况也会导致联邦学习得到的联合模型的精确度不够高。这种情况不符合银行等金融机构的需求，无法保证金融机构各项业务的高效运转。

为此，本申请实施例提供了一种混合联邦学习架构，如图1所示，为本申请实施例提供一种混合联邦学习架构的示意图。

图1示出的混合联邦学习架构包括：多组第一联邦学习系统和协调者；其中，每组第一联邦学习系统包括多个参与者；同组第一联邦学习系统内的各参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组第一联邦学习系统间的各参与者的数据集之间包含有相同的样本特征及不同的样本对象。需要说明的是，图1示出的混合联邦学习架构中，是以每个第一联邦学习系统中参与者的数目为2为例说明，包括参与者Aj和Bj(j为小于或等于K的正整数，K为正整数)。而且，第一联邦学习系统中参与者的数目并不限于2，每个第一联邦学习系统中参与者的数目可相同，也可不同。

任一参与者，用于，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果。

所述协调者，用于对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者。

需要说明的是，图1示出的混合联邦学习架构的目标是训练出的是一个联邦学习模型，最终训练的适用于各组参与者的联邦学习模型为：最后一轮训练得到的第二联邦学习模型。而除了最后一轮训练得到的第二联邦学习模型外，从训练开始至训练结束过程是联邦学习模型的参数优化过程，而第一联邦学习模型和第二联邦学习模型均为处于不同训练阶段的联邦学习模型，是中间训练过程中出现的联邦学习模型，不是最终输出的联邦学习模型，不同训练阶段的联邦学习模型参数会更新变化。最终输出的是一个联邦学习模型，即为最后一轮训练得到的第二联邦学习模型。

图1示出的架构中，所述协调者为各第一联邦学习系统内的组内协调者；或所述协调者为各第一联邦学习系统间的组间协调者。

如图2所示，第一参与者为任一组第一联邦学习系统中任一参与者，第一参与者和组内协调者可以用于按照以下方式(下文中称为第一联邦学习方式)得到第一联邦学习模型：

(1)第一参与者将根据第一参与者的数据集训练的初始模型的中间结果发送给其他参与者。(2)第一参与者根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，并发送给所述组内协调者。(3)组内协调者根据各参与者的训练结果确定更新参数并发送给各参与者。(4)第一参与者根据所述更新参数更新所述初始模型，得到所述第一联邦学习模型。需要说明的是，图2示出的获得第一联邦学习模型的示意图中，仅以第一联邦学习系统中参与者数目为2为例说明该过程，图2中的第一联邦学习系统中参与者仅包括第一参与者和第二参与者(即其他参与者)，第二参与者与第一参与者的所执行的步骤相同。本申请中，第一联邦学习系统中参与者数目不做限定，在此不再赘述。

图2示出的训练过程为图1示出的架构训练出适用于各组参与者的联邦学习模型过程的一个子训练过程，这里的第一联邦学习模型是该子训练过程得到的一个阶段性的联邦学习模型。

第一联邦学习过程适用于参与者的数据特征重叠较小，而用户重叠较多的情况下，取出参与者用户相同而用户数据特征不同的那部分用户及数据进行联合机器学习训练。比如有属于同一个地区的两个参与者A和B，其中参与者A是一家银行，参与者B是一个电商平台。参与者A和B在同一地区拥有较多相同的用户，但是A与B的业务不同，记录的用户数据特征是不同的。特别的，A和B记录的用户数据特征可能是互补的。在这样的场景下，可以使用第一联邦学习方法来帮助A和B构建联合机器学习预测模型，帮助A和B向客户提供更好的服务。

为了帮助A和B联合建模，需要协调者C参与。第一部分：参与者A和B实现加密样本对齐例。由于两家企业A和B的用户群体并非完全重合，系统利用基于加密的用户样本对齐技术，在A和B不公开各自数据的前提下确认双方的共有用户，并且不暴露不互相重叠的用户，以便联合这些用户的特征进行建模。

第一联邦学习的加密模型训练过程如下(以下步骤仅以梯度下降算法为例说明训练过程)：

在确定共有用户群体后，就可以利用这些数据训练机器学习模型。为了保证训练过程中数据的保密性，需要借助协调者C进行加密训练。以线性回归模型为例，训练过程可分为以下4步。第①步，协调者C把公钥分发给A和B，用以对训练过程中需要交换的数据进行加密。第②步，参与者A和B之间以加密形式交互用于计算梯度的中间结果。第③步：参与者A和B分别基于加密的梯度值进行计算，同时参与者B根据其标签数据计算损失函数，并把结果汇总给协调者C。协调者C通过汇总结果计算总梯度值并将其解密。第④步：协调者C将解密后的梯度分别回传给参与者A和B，参与者A和B根据梯度更新各自模型的参数。参与者和协调者迭代上述步骤直至损失函数收敛或者是模型参数收敛或者是达到最大迭代次数或者是达到最大训练时间，这样就完成了整个模型训练过程。

需要注意的是，在第一联邦学习和第二联邦学习过程中，加密操作和加密传输都是可选的，是需要根据具体应用场景的来决定的，并不是所有的应用场景都需要加密操作和加密传输。

实际应用过程中，经常会遇到参与者A和B拥有的数据虽然能形成互补，可以联合构建机器学习模型，但是参与者A和B拥有的数据量都非常少，构建的联合模型的性能不能达到预期指标。特别的，深度学习(deep learning)的强大功能是建立在海量数据的基础之上的。同样，集成学习(ensemble learning)的性能，例如，XGboost，也是建立在海量数据基础之上的。在实际应用场景中，利用纵向联邦学习技术构建深度学习模型或者集成学习模型时，就需要解决参与者A和B拥有的数据量太小的问题。

具体来说，通过图1示出的混合联邦学习架构，得到适用于各组参与者的联邦学习模型的具体过程可以如下：

首先需要说明的是，同组第一联邦学习系统间的各参与者的数据集之间包含有相同的样本特征及不同的样本对象。比如有两家不同地区的银行，它们的用户群体分别来自各自所在的地区，相互的交集很小。但是它们的业务很相似，记录的用户数据特征很大部分是相同的。可以使用对各组的第一联邦学习模型进行融合得到第二联邦学习模型，来帮助两家银行构建联合模型来预测他们的客户行为。

如果参与者A1、B1、A2、B2拥有的数据量过少，那么通过纵向联邦学习获得的模型M1和M2的性能可能都会比较差，达不到预期指标。而通过联合协调者C1和C2并进行横向联邦学习构建的模型M，性能就很可能有较大的提升，能够满足预期要求。

这里举例说明可能的实际应用场景。例如，参与者(Ai,Bi)联合拥有的数据与和(Aj,Bj)联合拥有的数据的数据特征相同(same feature space)，但是用户不同(non-overlapping sample/ID space)。而参与者Aj和Bj拥有的数据的用户相同(same sample/ID space)，但是数据特征不同(different feature space)。即实际应用场景可以是参与者(Ai,Bi)和(Aj,Bj)可以联合进行横向联邦学习；参与者Aj和Bj可以联合进行纵向联邦学习。其中，i,j＝1,2，i≠j。

当协调者为各第一联邦学习系统内的组内协调者时，如图3所示，一种可能的实施方式中，混合联邦学习架构包括2个第一联邦学习系统(仅以图3示出的2个第一联邦学习系统为例说明，但第一联邦学习系统数量不限于2个)，协调者C1和协调者C2为组内协调者，由协调者C1和协调者C2，对各组的第一联邦学习模型进行融合得到第二联邦学习模型，具体如下：

(a)协调者C1和参与者A1、B1训练第一联邦学习模型M1；与此同时，协调者C2和参与者A2、B2训练第一联邦学习模型M2。具体第一联邦学习模型训练过程可以参考图2所示例的纵向联邦学习的架构和流程。

(b)协调者C1和C2分别将第一联邦学习模型M1和M2发送给对方。

(c)协调者C1和C2分别进行模型融合，例如，对模型M1和M2参数的值的加权平均值，作为第二联邦学习模型M的对应参数值。

(d)协调者C1和C2分别将第二联邦学习模型M分发给参与者A1、B1、A2、B2。

(e)协调者C1和参与者A1、B1在第二联邦学习模型M的基础上继续训练第一联邦学习模型，并更新第一联邦学习模型M1；与此同时，协调者C2和参与者A2、B2在第二联邦学习模型M的基础上继续训练模型，并更新第一联邦学习模型M2。该过程也可以图2所示例的纵向联邦学习的架构和流程。

迭代以上过程(a)-(e)直到第二联邦学习模型M收敛或者达到最大迭代次数或者达到最大模型训练时间。

在训练好第二联邦学习模型M后，协调者C1将第二联邦学习模型M分发给参与者A1和B1，协调者C2将第二联邦学习模型M分发给参与者A2和B2。参与者A1、B1、A2、B2最终获得的是相同的第二联邦学习模型M。

当只有两个第一联邦学习系统时，两个第一联邦学习系统的协调者可以直接交换第一联邦学习模型Mj，不需要第三方的参与，可以节省系统资源和开销。

图3示出的架构中，目标是训练出一个联邦学习模型，不断优化更新联邦学习模型的参数。最终输出的是最后一轮训练得到的M，而在每一轮训练中都对M1、M2和M参数做更新，除了最后一轮输出的M外，每一轮训练中的M1、M2和M均为中间训练阶段的学习模型。

当协调者为各第一联邦学习系统间的组间协调者时，如图4所示，一种可能的实施方式中，混合联邦学习架构包括K个第一联邦学习系统，K为大于或等于2的整数，由组内协调者C1～CK以及组间协调者C0，对各组的第一联邦学习模型进行融合得到第二联邦学习模型，具体如下：

(a)协调者Cj和参与者Aj、Bj训练第一联邦学习模型Mj，j＝1,2，…,K。具体过程可以参考图2所示例的架构和流程。

(b)协调者Cj将第一联邦学习模型Mj发送给组间协调者C0，j＝1,2,…,K。

(c)组间协调者C0对收到的第一联邦学习模型Mj进行模型融合，例如，对第一联邦学习模型M1～Mj参数的值的加权平均值，获得适用于各组参与者的第二联邦学习模型M。

(d)组间协调者C0将第二联邦学习模型更新M分发给各个协调者Cj，j＝1,2,…,K。另一种可能的实现方式是，组间协调者C0将第二联邦学习模型更新M直接分发给参与者Aj和Bj，j＝1,2,…,K。

(e)协调者Cj将第二联邦学习模型更新M转发给参与者Aj和Bj，j＝1,2,…,K。

(f)协调者Cj和参与者Aj、Bj在第二联邦学习模型M的基础上继续训练第一联邦学习模型，并更新第一联邦学习模型Mj，j＝1,2,…,K。具体过程可以参考图2所示例的联邦学习架构和模型训练流程。

迭代以上过程(a)-(f)直到第二联邦学习模型M收敛或者达到最大迭代次数或者达到最大训练时间。

在训练好第二联邦学习模型M后，组间协调者C0将训练好的第二联邦学习模型M分发给协调者Cj，再由协调者Cj将第二联邦学习模型M分发给参与者Aj和Bj，j＝1,2,…,K。参与者Aj和Bj最终获得的是相同的第二联邦学习模型M，j＝1,2,…,K。另一种可能的实现方式是，组间协调者C0直接将训练好的第二联邦学习模型M分发给参与者Aj和Bj，j＝1,2,…,K。

图4示出的架构中，目标是训练出一个联邦学习模型，不断优化更新联邦学习模型的参数。最终输出的是最后一轮训练得到的M，每一轮训练中都对多个Mj和M参数做更新，除了最后一轮输出的M外，每一轮训练中的Mj和M均为中间训练阶段的学习模型。

上述协调者为各第一联邦学习系统内的组内协调者或各第一联邦学习系统间的组间协调者的实施方式中，包括两种混合联邦学习系统的分级联邦学习模型训练：(1)参与者与组内协调者组成第一联邦学习子系统，训练第一联邦学习模型Mj；再由两个组内协调者组成训练第二联邦学习模型M；(2)由多个组内协调者与组间协调者共同训练第二联邦学习模型M。(1)(2)两种方式中均由组内协调者或者组间协调者分发训练好的第二联邦学习模型给参与者。参与者最后获得的和使用的是各个第一联邦学习子系统训练的第二联邦学习模型。

当有多个第一联邦学习系统时，可以由组间协调者将全局模型直接分发给各个参与者，不需要第一联邦学习子系统的协调者的中转，节省了通信开销，降低了通信时延，可以加快模型训练。

本申请实施例中，混合联邦学习的第一联邦学习系统中可以包括2个或者2个以上参与者。而且，参与者与协调者、参与者和参与者之间、协调者和全局协调者之间消息传输都可以是加密的消息传输，例如，使用同态加密技术，也可以是不加密的消息传输。所述消息传输包括数据相关信息传输、梯度信息传输、模型参数更新传输、模型性能测试结果传输、模型训练触发命令传输等。

结合图1示出的架构，下面通过图5，说明本申请提出的一种混合联邦学习方法。该方法适用于具有多组参与者的联邦模型训练，其中，同一组内的参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组间的参与者的数据集之间包含有相同的样本特征及不同的样本对象；该方法步骤如下：

步骤501：针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型。

步骤502：对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内的参与者。

步骤503：针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。

需要说明的是，步骤501～步骤503的目标是训练出一个联邦学习模型，即为最后一轮输出的第二联邦学习模型。返回步骤502直至训练结束的过程是不断优化更新联邦学习模型的参数的过程。在步骤501～步骤503过程中产生的联邦学习模型均是为了得到最后一轮输出的第二联邦学习模型的中间产物。

步骤501中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果。针对任一组的任一参与者，执行以下训练过程得到所述第一联邦学习模型的过程具体包括：

所述参与者将根据所述参与者的数据集训练的初始模型的中间结果发送给其他参与者；所述参与者根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，并发送给所述组内协调者；所述组内协调者根据各参与者的训练结果，确定更新参数并发送给各参与者；所述参与者根据所述更新参数更新所述初始模型，得到所述第一联邦学习模型。

步骤502中，可以方式为，将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值。

另一种可能实现的方式中，通过组间协调者，将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值；通过所述组间协调者，将所述第二联邦学习模型发送给各组内协调者；所述组内协调者将所述第二联邦学习模型发送给组内参与者。

具体可通过第二联邦学习方式来进行：

第二联邦学习适用于各个参与者的数据特征重叠较多，而用户重叠较少的情况下，取出参与者数据特征相同而用户不完全相同的那部分数据进行联合机器学习。比如有两家不同地区的银行，它们的用户群体分别来自各自所在的地区，相互的交集很小。但是它们的业务很相似，记录的用户数据特征很大部分是相同的。可以使用横向联邦学习来帮助两家银行构建联合模型来预测他们的客户行为。

如图6所示例的联邦学习系统架构，第①步，当一个组内协调者A在本地完成模型参数更新后，组内协调者A可以向组间协调者发送组内协调者A在本地获得的模型参数更新。组内协调者A可以通过加密的方式，例如，使用同态加密技术，向组间协调者发送模型参数更新。所述模型参数可以是联邦学习模型的参数，例如，神经网络的节点之间连接的权重参数；或者，所述联合模型参数也可以是联邦学习模型的梯度信息，例如，神经网络梯度下降算法中的梯度信息。第②步，组间协调者将所收到的来自不同组内协调者的模型参数更新进行融合，例如，求取加权平均。第③步，组间协调者将融合后的第二联邦学习模型参数更新(也称为全局模型参数)再分发给各个组内协调者。组间协调者也可以通过加密的方式传输第二联邦学习模型参数。第④步，组内协调者可以将收到的第二联邦学习模型参数用作本地模型训练的起始模型(starting point)或者是作为第一联邦学习模型的最新模型参数，以便开始训练或者是在第一联邦学习模型的基础上继续训练。

组内协调者和组间协调者迭代上述步骤直至损失函数收敛或者是模型参数收敛或者是达到最大迭代次数或者是达到最大训练时间，这样就完成了整个模型训练过程。

需要说明的是，步骤503中，所述模型训练结束的预设终止条件包括以下至少一项：所述第二联邦学习模型的参数收敛；所述第二联邦学习模型的更新次数大于或等于预设训练次数；所述第二联邦学习模型的训练时间大于或等于预设训练时长。

本申请提出的混合联邦学习方法及架构中，通过分级进行联邦学习模型训练：先训练得到各第一联邦学习系统的第一联邦学习模型，再根据各第一联邦学习模型进行横向融合，得到第二联邦学习模型。因此，可以通过本申请中的方法及架构来使用多个参与者拥有的数据，而且第一联邦学习系统的扩展性较好，可以有效解决参与者拥有的数据量太小的问题。

本申请实施例提供一种计算机设备，包括程序或指令，适用于具有多组参与者的联邦模型训练，其中，同一组内的参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组间的参与者的数据集之间包含有相同的样本特征及不同的样本对象；所述计算机设备包括程序或指令，当所述程序或指令被执行时，实现如下步骤：针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者；针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。

本申请实施例提供一种存储介质，包括程序或指令，适用于具有多组参与者的联邦模型训练，其中，同一组内的参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组间的参与者的数据集之间包含有相同的样本特征及不同的样本对象；所述存储介质包括程序或指令，当所述程序或指令被执行时，实现如下步骤：针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者；针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。

最后应说明的是：本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种混合联邦学习方法，其特征在于，适用于具有多组参与者的联邦模型训练，其中，同一组内的参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组间的参与者的数据集之间包含有相同的样本特征及不同的样本对象；所述方法包括：

针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者；针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。
如权利要求1所述的方法，其特征在于，所述模型训练结束的预设终止条件包括以下至少一项：所述第二联邦学习模型的参数收敛；所述第二联邦学习模型的更新次数大于或等于预设训练次数；所述第二联邦学习模型的训练时间大于或等于预设训练时长。
如权利要求1所述的方法，其特征在于，每个组包括组内协调者，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果，包括：

针对任一组的任一参与者，执行以下训练过程得到所述第一联邦学习模型，包括：

所述参与者将根据所述参与者的数据集训练的初始模型的中间结果发送给其他参与者；

所述参与者根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，并发送给所述组内协调者；

所述组内协调者根据各参与者的训练结果，确定更新参数并发送给各参与者；

所述参与者根据所述更新参数更新所述初始模型，得到所述第一联邦学习模型。
如权利要求1-3任一所述的方法，其特征在于，所述对各组的第一联邦学习模型进行融合得到第二联邦学习模型，包括：

将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值。
如权利要求1-3任一所述的方法，其特征在于，所述对各组的第一联邦学习模型进行融合得到第二联邦学习模型，包括：

通过组间协调者，将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值；

通过所述组间协调者，将所述第二联邦学习模型发送给各组内协调者。
一种混合联邦学习架构，其特征在于，包括：多组第一联邦学习系统和协调者；其中，每组第一联邦学习系统包括多个参与者；同组第一联邦学习系统内的各参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组第一联邦学习系统间的各参与者的数据集之间包含有相同的样本特征及不同的样本对象；

任一参与者，用于根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；

所述协调者，用于对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者。
如权利要求6所述的架构，其特征在于，所述协调者为各第一联邦学习系统内的组内协调者；或所述协调者为各第一联邦学习系统间的组间协调者。
如权利要求7所述的架构，其特征在于，所述参与者，用于将根据所述参与者的数据集训练的初始模型的中间结果发送给其他参与者；

所述参与者，还用于根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，并发送给所述组内协调者；

所述组内协调者，还用于根据各参与者的训练结果确定更新参数并发送给各参与者；

所述参与者，还用于根据所述更新参数更新所述初始模型，得到所述第一联邦学习模型。
如权利要求6-8任一所述的架构，其特征在于，所述协调者具体用于：

将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值。
如权利要求6-8任一所述的架构，其特征在于，所述协调者具体用于：

通过组间协调者，将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值；

通过所述组间协调者，将所述第二联邦学习模型发送给各组内协调者。
一种计算机设备，其特征在于，适用于具有多组参与者的联邦模型训练，其中，同一组内的参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组间的参与者的数据集之间包含有相同的样本特征及不同的样本对象；所述计算机设备包括程序或指令，当所述程序或指令被执行时，实现如下步骤：

针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者；针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。
如权利要求11所述的计算机设备，其特征在于，所述模型训练结束的预设终止条件包括以下至少一项：所述第二联邦学习模型的参数收敛；所述第二联邦学习模型的更新次数大于或等于预设训练次数；所述第二联邦学习模型的训练时间大于或等于预设训练时长。
如权利要求11所述的计算机设备，其特征在于，每个组包括组内协调者，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果，包括：

针对任一组的任一参与者，执行以下训练过程得到所述第一联邦学习模型，包括：

所述参与者将根据所述参与者的数据集训练的初始模型的中间结果发送给其他参与者；

所述参与者根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，并发送给所述组内协调者；

所述组内协调者根据各参与者的训练结果，确定更新参数并发送给各参与者；

所述参与者根据所述更新参数更新所述初始模型，得到所述第一联邦学习模型。
如权利要求11-13任一所述的计算机设备，其特征在于，所述对各组的第一联邦学习模型进行融合得到第二联邦学习模型，包括：

将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值。
如权利要求11-13任一所述的计算机设备，其特征在于，所述对各组的第一联邦学习模型进行融合得到第二联邦学习模型，包括：

通过组间协调者，将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值；

通过所述组间协调者，将所述第二联邦学习模型发送给各组内协调者。
一种存储介质，其特征在于，适用于具有多组参与者的联邦模型训练，其中，同一组内的参与者的数据集之间包含有相同的样本对象及不同的样本特征；不同组间的参与者的数据集之间包含有相同的样本特征及不同的样本对象；所述存储介质包括程序或指令，当所述程序或指令被执行时，实现如下步骤：

针对每个组，根据组内参与者的数据集联合训练每组的第一联邦学习模型；其中，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果；对各组的第一联邦学习模型进行融合得到第二联邦学习模型，并将所述第二联邦学习模型发送给每个组内参与者；针对每个组，根据所述第二联邦学习模型及所述组内参与者的数据集训练得到更新后的第一联邦学习模型，返回对各组的第一联邦学习模型进行融合得到第二联邦学习模型的步骤，直至模型训练结束。
如权利要求16所述的存储介质，其特征在于，所述模型训练结束的预设终止条件包括以下至少一项：所述第二联邦学习模型的参数收敛；所述第二联邦学习模型的更新次数大于或等于预设训练次数；所述第二联邦学习模型的训练时间大于或等于预设训练时长。
如权利要求16所述的存储介质，其特征在于，每个组包括组内协调者，训练所述第一联邦学习模型的过程中组内每个参与者都与组内其他参与者交换了训练的中间结果，包括：

针对任一组的任一参与者，执行以下训练过程得到所述第一联邦学习模型，包括：

所述参与者将根据所述参与者的数据集训练的初始模型的中间结果发送给其他参与者；

所述参与者根据所述其他参与者反馈的中间结果，得到所述初始模型的训练结果，并发送给所述组内协调者；

所述组内协调者根据各参与者的训练结果，确定更新参数并发送给各参与者；

所述参与者根据所述更新参数更新所述初始模型，得到所述第一联邦学习模型。
如权利要求16-18任一所述的存储介质，其特征在于，所述对各组的第一联邦学习模型进行融合得到第二联邦学习模型，包括：

将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值。
如权利要求16-18任一所述的存储介质，其特征在于，所述对各组的第一联邦学习模型进行融合得到第二联邦学习模型，包括：

通过组间协调者，将所述各组的第一联邦学习模型中同一参数的参数值进行加权平均，作为所述第二联邦学习模型中该参数的值；

通过所述组间协调者，将所述第二联邦学习模型发送给各组内协调者。