WO2024099109A1

WO2024099109A1 - 一种联邦学习模型训练方法、装置、设备及存储介质

Info

Publication number: WO2024099109A1
Application number: PCT/CN2023/127265
Authority: WO
Inventors: 艾博轩; 杨燕明; 高鹏飞; 郑建宾
Original assignee: 中国银联股份有限公司
Priority date: 2022-11-11
Filing date: 2023-10-27
Publication date: 2024-05-16
Also published as: TW202420136A; CN115660115A

Abstract

本申请公开了一种联邦学习模型训练方法、装置、设备及存储介质，用以提高联邦学习模型的收敛速度及精度。本申请中服务器可以基于各客户端发送的本轮全局子参数梯度与上一轮本地参数控制变量之间的差值等，综合确定下一轮全局参数控制变量，各客户端可以基于服务器发送的本轮全局参数控制变量，来确定客户端本地参数梯度，进而确定客户端本轮输出的本地模型参数，基于此，本申请各客户端之间可以互相约束，每个客户端可以参考其他客户端在迭代训练过程中的参数更新方向等，来对客户端本地的联邦学习子模型的参数进行调整，从而可以有效解决客户端漂移问题，可以提高训练完成的联邦学习模型的精度，并可以显著提高联邦学习模型的收敛速度。

Description

一种联邦学习模型训练方法、装置、设备及存储介质

相关申请的交叉引用

本申请要求在2022年11月11日提交中国专利局、申请号为202211414446.X、申请名称为“一种联邦学习模型训练方法、装置、设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及模型训练技术领域，尤其涉及一种联邦学习模型训练方法、装置、设备及存储介质。

背景技术

联邦学习是一种将数据和模型解耦合的分布式框架，可以解决数据孤岛和隐私保护难题。基于联邦学习进行模型训练时，可以在数据不离开参与方本地的情况下，实现各参与方的联合建模。训练好的联邦学习模型(也可称为全局模型)可以在各参与方之间共享和部署。联邦学习在智慧医疗、金融保险和智能物联网等领域有广泛的应用前景。

然而，联邦学习面临着数据非独立同分布问题所带来的严峻挑战，数据非独立同分布问题即每个参与方所拥有的数据分布与全局分布并不一致，这种数据的不一致可能会导致模型收敛速度过慢，并可能会使得模型的精度受损。

因此，基于非独立同分布数据，如何提高联邦学习模型的收敛速度及精度是目前亟需解决的一个技术问题。

发明内容

本申请提供了一种联邦学习模型训练方法、装置、设备及存储介质，用以提高联邦学习模型的收敛速度及精度。

第一方面，本申请提供了一种联邦学习模型训练方法，应用于客户端，所述方法包括：

在参与对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：

接收服务器发送的待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

采用所述本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新；

基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，基于所述本地参数梯度，确定本轮输出的本地模型参数；并基于所述更新后的本地模型参数，确定全局子参数梯度；

确定所述本轮输出的本地模型参数与所述本轮全局模型参数之间的第一差值；并确定所述全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将所述第一差值及第二差值发送给所述服务器，使所述服务器基于各客户端发送的第一差值和第二差值，确定下一轮全局模型参数以及下一轮全局参数控制变量。

在一种可能的实施方式中，所述基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，包括：

基于更新后的本地模型参数及样本数据，确定损失值；

基于当前保存的上一轮本地参数控制变量及所述本轮全局参数控制变量，对所述损失值进行校正；

基于校正后的损失值，确定所述本地参数梯度。

在一种可能的实施方式中，所述基于当前保存的上一轮本地参数控制变量及所述本轮全局参数控制变量，对所述损失值进行校正，包括：

确定所述上一轮本地参数控制变量与所述本轮全局参数控制变量的第三差值；

基于所述第三差值及设定的损失值调整率，对所述损失值进行校正。

在一种可能的实施方式中，基于所述本地参数梯度，确定本轮输出的本地模型参数，包括：

基于当前保存的上一轮本地参数控制变量及所述本轮全局参数控制变量，对所述本地参数梯度进行校正；

基于校正后的本地参数梯度以及所述更新后的本地模型参数，确定本轮输出的本地模型参数。

在一种可能的实施方式中，所述基于当前保存的上一轮本地参数控制变量及所述本轮全局参数控制变量，对所述本地参数梯度进行校正，包括：

基于所述第三差值与设定的漂移调整率，对所述本地参数梯度进行校正。

在一种可能的实施方式中，基于校正后的本地参数梯度以及所述更新后的本地模型参数，确定本轮输出的本地模型参数，包括：

确定校正后的本地参数梯度与设定的本地学习率的乘积；基于该乘积以及所述更新后的本地模型参数，确定本轮输出的本地模型参数。

在一种可能的实施方式中，所述方法还包括：

将所述全局子参数梯度，确定为本轮本地参数控制变量。

第二方面，本申请提供了一种联邦学习模型训练方法，应用于服务器，所述方法包括：

在对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：

若接收到各客户端发送的上一轮输出的本地模型参数与上一轮全局模型参数之间的第一差值，以及各客户端的上一轮全局子参数梯度与上两轮客户端本地参数控制变量之间的第二差值，基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

将所述本轮全局模型参数以及本轮全局参数控制变量，发送给每个客户端。

在一种可能的实施方式中，所述基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量，包括：

基于各第一差值以及设定的全局学习率，对上一轮全局模型参数进行校正，得到所述本轮全局模型参数；

基于各第二差值，对上一轮全局参数控制变量进行校正，得到所述本轮全局参数控制变量。

第三方面，本申请提供了一种联邦学习模型训练系统，所述系统包括：

服务器，用于在对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：若接收到各客户端发送的上一轮输出的本地模型参数与上一轮全局模型参数之间的第一差值，以及各客户端的上一轮全局子参数梯度与上两轮客户端本地参数控制变量之间的第二差值，基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；将所述本轮全局模型参数以及本轮全局参数控制变量，发送给每个客户端；

所述每个客户端，用于在参与对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：接收所述服务器发送的所述本轮全局模型参数以及本轮全局参数控制变量；采用所述本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新；基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，基于所述本地参数梯度，确定本轮输出的本地模型参数；并基于所述更新后的本地模型参数，确定全局子参数梯度；确定所述本轮输出的本地模型参数与所述本轮全局模型参数之间的第一差值；并确定所述全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将所述第一差值及第二差值发送给所述服务器。

第四方面，本申请提供了一种联邦学习模型训练装置，所述装置包括：

接收模块，用于在参与对联邦学习模型的每轮迭代训练过程中，接收服务器发送的待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

更新模块，用于采用所述本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新；

第一确定模块，用于基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，基于所述本地参数梯度，确定本轮输出的本地模型参数；并基于所述更新后的本地模型参数，确定全局子参数梯度；

第一发送模块，用于确定所述本轮输出的本地模型参数与所述本轮全局模型参数之间的第一差值；并确定所述全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将所述第一差值及第二差值发送给所述服务器，使所述服务器基于各客户端发送的第一差值和第二差值，确定下一轮全局模型参数以及下一轮全局参数控制变量。

在一种可能的实施方式中，所述第一确定模块，具体用于：

基于更新后的本地模型参数及样本数据，确定损失值；

基于校正后的损失值，确定所述本地参数梯度。

在一种可能的实施方式中，所述第一确定模块，具体用于：

在一种可能的实施方式中，所述第一确定模块，还用于：

将所述全局子参数梯度，确定为本轮本地参数控制变量。

第五方面，本申请提供了一种联邦学习模型训练装置，所述装置包括：

第二确定模块，用于在对联邦学习模型的每轮迭代训练过程中，若接收到各客户端发送的上一轮输出的本地模型参数与上一轮全局模型参数之间的第一差值，以及各客户端的上一轮全局子参数梯度与上两轮客户端本地参数控制变量之间的第二差值，基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

第二发送模块，用于将所述本轮全局模型参数以及本轮全局参数控制变量，发送给每个客户端。

在一种可能的实施方式中，所述第二确定模块，具体用于：

第六方面，本申请提供了一种电子设备，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述方法的步骤。

第七方面，本申请提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一所述方法的步骤。

第八方面，本申请提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序代码，当所述计算机程序代码在计算机上运行时，使得计算机执行如上述任一所述方法的步骤。

由于本申请服务器可以基于各客户端发送的本轮全局子参数梯度与上一轮本地参数控制变量之间的差值，来综合确定下一轮全局参数控制变量，其中，本地参数控制变量也可以称为客户端模型参数更新方向，或者联邦学习子模型参数更新方向，全局参数控制变量也可以称为联邦学习模型参数更新方向，或者服务器模型参数更新方向，也就是说，本申请服务器可以基于各客户端发送的本轮全局子参数梯度与上一轮客户端模型的模型参数更新方向，来综合确定联邦学习模型的下一轮模型参数更新方向；本申请中各客户端可以基于服务器发送的本轮全局参数控制变量，来确定客户端本地参数梯度，也就是说，各客户端可以基于服务器发送的本轮全局模型参数更新方向，来确定客户端本地参数梯度，进而确定客户端本轮输出的本地模型参数，基于此，相较于相关技术中各客户端之间互相独立地对本地的联邦学习子模型进行训练，容易出现客户端漂移(client-drift)问题而言，本申请各客户端之间可以互相约束，每个客户端可以参考其他客户端在迭代训练过程中的参数更新方向等，来对客户端本地的联邦学习子模型的参数进行调整，从而可以有效解决客户端漂移问题，可以提高训练完成的联邦学习模型的精度。

另外，基于本轮全局参数控制变量等进行联邦学习训练时，可以使得客户端中的联邦学习子模型在每次迭代训练的更新过程中，可以被拉回到理想的更新路径附近进行更新，可以显著减少客户端和服务器的通信次数以及联邦学习模型的迭代训练轮数，显著提高联邦学习模型的收敛速度。

附图说明

为了更清楚地说明本申请实施例或相关技术中的实施方式，下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1示出了一些实施例提供的第一种联邦学习模型训练过程示意图；

图2示出了一些实施例提供的第二种联邦学习模型训练过程示意图；

图3示出了一些实施例提供的第三种联邦学习模型训练过程示意图；

图4示出了一些实施例提供的第四种联邦学习模型训练过程示意图；

图5示出了一些实施例提供的一种联邦学习模型训练系统示意图；

图6示出了一些实施例提供的一种联邦学习模型训练装置示意图；

图7示出了一些实施例提供的另一种联邦学习模型训练装置示意图；

图8示出了一些实施例提供的一种电子设备结构示意图。

具体实施方式

为了提高联邦学习模型的收敛速度及精度，本申请提供了一种联邦学习模型训练方法、装置、设备及介质。

为使本申请的目的和实施方式更加清楚，下面将结合本申请示例性实施例中的附图，对本申请示例性实施方式进行清楚、完整地描述，显然，描述的示例性实施例仅是本申请一部分实施例，而不是全部的实施例。

需要说明的是，本申请中对于术语的简要说明，仅是为了方便理解接下来描述的实施方式，而不是意图限定本申请的实施方式。除非另有说明，这些术语应当按照其普通和通常的含义理解。

本申请中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明。应该理解这样使用的用语在适当情况下可以互换。

术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的所有组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

图1示出了一些实施例提供的第一种联邦学习模型训练过程示意图，该方法应用于客户端，示例性的，客户端可以是PC、移动终端等电子设备。如图1所示，客户端在参与对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：

S101：接收服务器发送的待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量。

在一种可能的实施方式中，为了提高联邦学习模型的收敛速度及精度，在对联邦学习模型的任意一轮(如第r轮)迭代训练过程中，服务器可以确定联邦学习模型在本轮的模型参数(为方便描述，称为本轮全局模型参数，用表示)，以及在本轮的参数控制变量(为方便描述，称为本轮全局参数控制变量，用表示)，并将确定的本轮全局模型参数和本轮全局参数控制变量发送给参与本轮训练的每个客户端(也可称为参与方)。其中，针对服务器如何确定本轮全局模型参数和本轮全局参数控制变量在下文进行介绍，在此先不赘述。其中，联邦学习模型也可以称为服务器模型，全局参数控制变量也可以称为联邦学习模型参数更新方向，或者服务器模型参数更新方向。相应的，本轮全局参数控制变量也可称为本轮联邦学习模型参数更新方向，或者本轮服务器模型参数更新方向。

针对参与本轮训练的每个客户端，均可以接收到服务器发送的本轮全局模型参数和本轮全局参数控制变量

S102：采用本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新。

为方便描述，将保存在每个客户端中的模型称为联邦学习子模型。针对任一客户端，接收到服务器发送的本轮全局模型参数和本轮全局参数控制变量之后，可以采用本轮全局模型参数对当前保存的联邦学习子模型的参数(为方便描述，称为本地模型参数，用表示)进行更新。也就是说，参与本轮训练的每个客户端均可以将保存在客户端自身本地中的联邦学习子模型的参数(也可称为权重)更新为本轮全局模型参数

S103：基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，基于所述本地参数梯度，确定本轮输出的本地模型参数；并基于所述更新后的本地模型参数，确定全局子参数梯度。

在一种可能的实施方式中，针对任一客户端，采用本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新之后，可以基于更新后的本地模型参数也即本轮全局模型参数及本轮全局参数控制变量确定本地参数梯度(为方便理解，用表示)。

在一种可能的实施方式中，基于更新后的本地模型参数及本轮全局参数控制变量确定本地参数梯度的过程可以包括：

基于更新后的本地模型参数及样本数据，确定损失值；

基于校正后的损失值，确定所述本地参数梯度。

具体的，针对任一客户端，该客户端在本轮迭代训练过程中，采用的训练联邦学习子模型的样本数据集用D_i表示，样本数据集中包含若干个样本数据i，可以基于更新后的本地模型参数及样本数据i，确定损失值(也可称为损失函数，为方便理解，用表示)。示例性的，确定损失值时，可以是将样本数据i输入联邦学习子模型中，获得联邦学习子模型的识别结果，基于样本数据i对应的样本标签与该识别结果的差异等，来确定损失值，在此不再赘述。在一种可能的实施方式中，在参与对联邦学习模型的每一轮迭代训练过程，每个客户端均可以基于样本数据对本地的联邦学习子模型进行若干次(为方便描述，称为K次)子训练，可以基于K次子训练过程中每个样本数据对应的损失值的和值，来确定本轮训练的损失值。为方便描述，将获得的本轮训练的损失值用表示。

在一种可能的实施方式中，为了有效解决客户端漂移问题，提高联邦学习模型的收敛速度及精度，针对任一客户端，可以基于该客户端当前保存的上一轮本地参数控制变量(为方便理解，用表示)以及本轮全局参数控制变量对损失值进行校正。在一种可能的实施方式中，客户端基于当前保存的上一轮本地参数控制变量及本轮全局参数控制变量对损失值进行校正时，可以是先确定上一轮本地参数控制变量与本轮全局参数控制变量的第三差值，即

其中，客户端中的联邦学习子模型也可以称为客户端模型，本地参数控制变量也可以称为客户端模型参数更新方向，或者联邦学习子模型参数更新方向。相应的，上一轮本地参数控制变量也可称为上一轮客户端模型参数更新方向，或者上一轮联邦学习子模型参数更新方向。在一种可能的实施方式中，为了有效解决客户端漂移问题，可以将上一轮本地参数控制变量与本轮全局参数控制变量的差值，即第三差值作为客户端漂移值，基于客户端漂移值对损失值进行校正，进而实现基于客户端漂移值对客户端的本地参数梯度进行校正，从而可以使得每个客户端可以参考其他客户端在迭代训练过程中的参数更新方向等，来对客户端本地的联邦学习子模型的参数进行调整，从而可以有效解决客户端漂移问题，提高训练完成的联邦学习模型的精度，并显著提高联邦学习模型的收敛速度。

在一种可能的实施方式中，在基于当前保存的上一轮本地参数控制变量及本轮全局参数控制变量对损失值进行校正时，可以基于第三差值及设定的损失值调整率(为方便理解，称为β)，对损失值进行校正。

示例性的，基于第三差值及设定的损失值调整率β，对损失值进行校正时，可以是先确定在上一轮迭代训练过程中接收到的上一轮全局模型参数(为方便理解，称为)与上述第三差值之间的差值(为方便描述，称为第四差值)，即另外，还可以确定更新后的本地模型参数与第四差值之间的差值(为方便描述，称为第五差值)，即：

确定第五差值的平方与损失值调整率β的乘积，即：

在一种可能的实施方式中，可以基于第五差值的平方与损失值调整率β的乘积，准确地对损失值进行校正，示例性的，可以将校正前的损失值与该乘积的和，确定为校正后的损失值，校正后的损失值(为方便理解，将校正后的损失值称为本地更新函数，用表示)，其中：

在一种可能的实施方式中，可以基于校正后的损失值，确定本地参数梯度在一种可能的实施方式中，可以通过本地更新函数对本地模型参数求导数，获得本地参数梯度即：

针对任一客户端，该客户端获得了本地参数梯度后，可以基于本地参数梯度确定该客户端本轮输出的本地模型参数。在一种可能的实施方式中，基于本地参数梯度确定本轮输出的本地模型参数时，可以是先基于当前保存的上一轮本地参数控制变量及本轮全局参数控制变量对本地参数梯度进行校正。示例性的，对本地参数梯度进行校正时，可以是先确定上一轮本地参数控制变量与本轮全局参数控制变量的第三差值，即然后基于该第三差值与设定的漂移调整率α，对本地参数梯度进行校正。示例性的，可以确定第三差值与漂移调整率α的乘积，将本地参数梯度与该乘积的差值，作为校正后的本地参数梯度，即校正后的本地参数梯度为：

在一种可能的实施方式中，可以基于校正后的本地参数梯度以及更新后的本地模型参数，确定本轮输出的本地模型参数。示例性的，确定本轮输出的本地模型参数时，可以是确定校正后的本地参数梯度与设定的本地学习率(为方便理解，用η_local表示)的乘积，然后基于该乘积以及更新后的本地模型参数，确定本轮输出的本地模型参数，示例性的，可以确定更新后的本地模型参数与该乘积的差值，将该差值确定为本轮输出的本地模型参数，即本轮输出的本地模型参数可以为：

在一种可能的实施方式中，客户端还可以基于更新后的本地模型参数，确定本轮的全局子参数梯度(为方便理解，用表示)。示例性的，客户端可以基于更新后的本地模型参数，也即可以基于服务器发送的本轮全局模型参数确定损失值，其中，确定损失值的过程与上述实施例中确定损失值的过程相同，在此不再赘述。其中，获得的本轮训练的损失值也可以用表示，可称为服务器端更新子函数可以通过服务器端更新子函数对本地模型参数求导数，获得全局子参数梯度即：

在一种可能的实施方式中，可以将本轮获得的全局子参数梯度确定为本轮本地参数控制变量以供客户端在下一轮迭代训练过程中使用，在此先不赘述。

S104：确定所述本轮输出的本地模型参数与所述本轮全局模型参数之间的第一差值；并确定所述全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将所述第一差值及第二差值发送给所述服务器，使所述服务器基于各客户端发送的第一差值和第二差值，确定下一轮全局模型参数以及下一轮全局参数控制变量。

在一种可能的实施方式中，为了提高联邦学习模型的收敛速度及精度，客户端可以确定本轮输出的本地模型参数与本轮全局模型参数之间的第一差值，即另外，客户端还可以确定全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值，即

在一种可能的实施方式中，针对本轮参与迭代训练的每个客户端，该客户端可以将该客户端的第一差值和第二差值发送给服务器。服务器接收到每个客户端分别发送的第一差值和第二差值之后，如果联邦学习模型还未满足设定的收敛条件，服务器可以基于各客户端发送的第一差值和第二差值，确定下一轮迭代训练的全局模型参数(为方便理解，称为下一轮全局模型参数，用表示)以及全局参数控制变量(为方便理解，称为下一轮全局参数控制变量，用表示)。

在一种可能的实施方式中，服务器基于各客户端发送的第一差值和第二差值，确定下一轮全局模型参数以及下一轮全局参数控制变量时，可以是基于各客户端的第一差值以及设定的全局学习率(为方便理解，用η_global表示)，对本轮全局模型参数进行校正，从而得到下一轮全局模型参数

示例性的，假设本轮参与训练的客户端集合用N_trains表示，本轮参与训练的客户端的数量用|N_clients|表示，可以先确定每个客户端发送的第一差值的平均值：然后确定全局学习率η_global与各第一差值的平均值的乘积：可选的，可以将本轮全局模型参数与该乘积的和值，确定为下一轮全局模型参数，即：

在一种可能的实施方式中，服务器可以基于各客户端发送的第二差值对本轮全局参数控制变量进行校正，从而得到下一轮全局参数控制变量。示例性的，服务器可以先确定每个客户端发送的第二差值的平均值：然后将本轮全局参数控制变量与该平均值的和值，确定为下一轮全局参数控制变量即：

另外，本申请中的上一轮本地参数控制变量与本轮全局参数控制变量的差值可以作为客户端漂移值，基于客户端漂移值对客户端的本地参数梯度进行校正时，可以使得每个客户端可以参考其他客户端在迭代训练过程中的参数更新方向信息等，来对客户端本地的联邦学习子模型的参数进行调整，从而可以有效解决客户端漂移问题，提高训练完成的联邦学习模型的精度，并显著提高联邦学习模型的收敛速度。

另外，本申请还可以基于设定的漂移调整率，对客户端的本地参数梯度进行校正，可以有效防止过度调整或者调整力度过小所导致的调整不当等，可以有效解决客户端漂移问题，提高训练完成的联邦学习模型的精度，并显著提高联邦学习模型的收敛速度。

另外，本申请还可以基于设定的损失值调整率，对客户端的损失值进行校正，可以有效防止过度调整或者调整力度过小所导致的调整不当等，可以有效解决客户端漂移问题，提高训练完成的联邦学习模型的精度，并显著提高联邦学习模型的收敛速度。

为方便理解，下面通过一个具体实施例对本申请提供的联邦学习模型训练过程进行解释说明。

在训练开始时，服务器获取全局模型参数的设定初始值(初始值可以为0等)，将全局模型参数的设定初始值，作为第一轮的全局模型参数另外，服务器还可以获取全局参数控制变量的设定初始值(初始值可以为0等)，将全局参数控制变量的设定初始值，作为第一轮的全局参数控制变量同样的，客户端可以获取本地参数控制变量的设定初始值(初始值可以为0等)，将本地参数控制变量的设定初始值，作为上一轮的本地参数控制变量

在第一轮迭代训练过程中，服务器将第一轮的全局模型参数第一轮的全局参数控制变量发送给每一个客户端。针对每个客户端，该客户端将当前保存的联邦学习子模型的本地模型参数更新为第一轮的全局模型参数并基于更新后的本地模型参数以及样本数据等，确定校正后的损失值，校正后的损失值可以通过对本地模型参数求导数，获得本地参数梯度即：

针对每个客户端，该客户端在第一轮输出的本地模型参数可以为：

另外，针对每个客户端，还可以获得该客户端在第一轮的全局子参数梯度：

针对客户端，将该客户端的第一差值以及第二差值均发送给服务器。

另外，客户端可以将确定为第一轮的本地参数控制变量

服务器接收到各客户端发送的第一差值和第二差值之后，可以对各客户端的子模型的参数等进行整合，基于第一差值和第二差值，确定对联邦学习模型进行第二轮训练时采用的全局模型参数以及第二轮全局参数控制变量

其中，

在第二轮迭代训练过程中，服务器将第二轮的全局模型参数第一轮的全局参数控制变量发送给每一个客户端。针对每个客户端，该客户端将当前保存的联邦学习子模型的本地模型参数更新为第二轮的全局模型参数并基于更新后的本地模型参数以及样本数据等，确定校正后的损失值：可以通过对本地模型参数求导数，获得本地参数梯度即：

针对每个客户端，该客户端在第二轮输出的本地模型参数可以为：

另外，针对每个客户端，还可以获得该客户端在第二轮的全局子参数梯度：

另外，客户端可以将确定为第二轮的本地参数控制变量

服务器接收到各客户端发送的第一差值和第二差值之后，可以对各客户端的子模型的参数等进行整合，基于第一差值和第二差值，确定对联邦学习模型进行第三轮训练时采用的全局模型参数以及第三轮全局参数控制变量其中，服务器确定第三轮全局模型参数以及第三轮全局参数控制变量的过程，以及客户端接收到第三轮全局模型参数以及第三轮全局参数控制变量之后的训练过程与上述第一轮和第二轮训练过程类似，在此不再赘述。

假设经过N轮迭代训练后，服务器中的联邦学习模型满足收敛条件，则服务器可以将训练好的联邦学习模型发送给每个客户端，每个客户端接收并使用该联邦学习模型。

为方便理解，下面再通过一个具体实施例对本申请提供的联邦学习过程进行解释说明。参阅图2，图2示出了一些实施例提供的第二种联邦学习模型训练过程示意图，该过程包括以下步骤：

S201：服务器向各客户端发送本轮全局模型参数以及本轮全局参数控制变量。

S202：每个客户端分别采用本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新。

S203：每个客户端分别基于更新后的本地模型参数及本轮全局参数控制变量，确定本地参数梯度，基于本地参数梯度，确定本轮输出的本地模型参数。另外，每个客户端还可以分别基于更新后的本地模型参数，确定全局子参数梯度。

S204：每个客户端确定本轮输出的本地模型参数与本轮全局模型参数之间的第一差值；并确定全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将第一差值及第二差值发送给服务器，使得服务器基于各客户端发送的第一差值和第二差值，确定待训练的联邦学习模型的下一轮全局模型参数以及下一轮全局参数控制变量，并返回循环执行S201。

为方便理解，下面再通过一个具体实施例对本申请提供的联邦学习过程进行解释说明。参阅图3，图3示出了一些实施例提供的第三种联邦学习模型训练过程示意图，该过程包括以下步骤：

S301：服务器向各客户端发送本轮全局模型参数以及本轮全局参数控制变量。

S302：每个客户端分别采用本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新。

S303：每个客户端分别基于更新后的本地模型参数及样本数据，确定损失值；确定当前保存的上一轮本地参数控制变量与本轮全局参数控制变量的第三差值；基于第三差值及设定的损失值调整率，对损失值进行校正；基于校正后的损失值，确定本地参数梯度。

S304：每个客户端分别确定上一轮本地参数控制变量与本轮全局参数控制变量的第三差值；基于第三差值与设定的漂移调整率，对本地参数梯度进行校正；并确定校正后的本地参数梯度与设定的本地学习率的乘积；基于该乘积以及更新后的本地模型参数，确定本轮输出的本地模型参数。

S305：每个客户端分别基于更新后的本地模型参数，确定全局子参数梯度；确定本轮输出的本地模型参数与本轮全局模型参数之间的第一差值；并确定全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将第一差值及第二差值发送给服务器，使得服务器基于各客户端发送的第一差值和第二差值，确定待训练的联邦学习模型的下一轮全局模型参数以及下一轮全局参数控制变量，并返回循环执行S301。

基于相同的技术构思，本申请还提供了一种联邦学习模型训练方法，该方法应用于服务器，图4示出了一些实施例提供的第四种联邦学习模型训练过程示意图，如图4所示，在对联邦学习模型的每轮迭代训练过程中，该过程至少包括以下步骤：

S401：若接收到各客户端发送的上一轮输出的本地模型参数与上一轮全局模型参数之间的第一差值，以及各客户端的上一轮全局子参数梯度与上两轮客户端本地参数控制变量之间的第二差值，基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量。

在一种可能的实施方式中，以第三轮迭代训练为例，服务器接收到各客户端发送的第二轮输出的本地模型参数与第二轮全局模型参数之间的第一差值以及第二轮全局子参数梯度与第一轮客户端本地参数控制变量之间的第二差值之后，服务器可以基于各客户端发送的第一差值和第二差值，确定对联邦学习模型进行第三轮训练时采用的全局模型参数以及第三轮全局参数控制变量

其中，确定本轮全局模型参数及本轮全局参数控制变量的过程与上述实施例相同。例如：

第三轮全局模型参数可以采用如下公式计算获得：

第三轮全局参数控制变量可以采用如下公式计算获得：

在此不再赘述。

S402：将所述本轮全局模型参数以及本轮全局参数控制变量，发送给每个客户端。

基于相同的技术构思，本申请还提供了一种联邦学习模型训练系统，图5示出了一些实施例提供的一种联邦学习模型训练系统示意图，如图5所示，该系统包括：

服务器51，用于在对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：若接收到各客户端52发送的上一轮输出的本地模型参数与上一轮全局模型参数之间的第一差值，以及各客户端的上一轮全局子参数梯度与上两轮客户端本地参数控制变量之间的第二差值，基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；将所述本轮全局模型参数以及本轮全局参数控制变量，发送给每个客户端52；

所述客户端52，用于在参与对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：接收所述服务器发送的所述本轮全局模型参数以及本轮全局参数控制变量；采用所述本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新；基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，基于所述本地参数梯度，确定本轮输出的本地模型参数；并基于所述更新后的本地模型参数，确定全局子参数梯度；确定所述本轮输出的本地模型参数与所述本轮全局模型参数之间的第一差值；并确定所述全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将所述第一差值及第二差值发送给所述服务器51。

在一种可能的实施方式中，所述服务器51，具体用于：

在一种可能的实施方式中，所述客户端52，具体用于：

基于更新后的本地模型参数及样本数据，确定损失值；

基于校正后的损失值，确定所述本地参数梯度。

在一种可能的实施方式中，所述客户端52，具体用于：

在一种可能的实施方式中，所述客户端52，还用于：

将所述全局子参数梯度，确定为本轮本地参数控制变量。

基于相同的技术构思，本申请提供了一种联邦学习模型训练装置，图6示出了一些实施例提供的一种联邦学习模型训练装置示意图，如图6所示，所述装置包括：

接收模块61，用于在参与对联邦学习模型的每轮迭代训练过程中，接收服务器发送的待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

更新模块62，用于采用所述本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新；

第一确定模块63，用于基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，基于所述本地参数梯度，确定本轮输出的本地模型参数；并基于所述更新后的本地模型参数，确定全局子参数梯度；

第一发送模块64，用于确定所述本轮输出的本地模型参数与所述本轮全局模型参数之间的第一差值；并确定所述全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将所述第一差值及第二差值发送给所述服务器，使所述服务器基于各客户端发送的第一差值和第二差值，确定下一轮全局模型参数以及下一轮全局参数控制变量。

在一种可能的实施方式中，所述第一确定模块63，具体用于：

基于更新后的本地模型参数及样本数据，确定损失值；

基于校正后的损失值，确定所述本地参数梯度。

在一种可能的实施方式中，所述第一确定模块63，还用于：

将所述全局子参数梯度，确定为本轮本地参数控制变量。

基于相同的技术构思，本申请还提供了一种联邦学习模型训练装置，图7示出了一些实施例提供的另一种联邦学习模型训练装置示意图，如图7所示，所述装置包括：

第二确定模块71，用于在对联邦学习模型的每轮迭代训练过程中，若接收到各客户端发送的上一轮输出的本地模型参数与上一轮全局模型参数之间的第一差值，以及各客户端的上一轮全局子参数梯度与上两轮客户端本地参数控制变量之间的第二差值，基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

第二发送模块72，用于将所述本轮全局模型参数以及本轮全局参数控制变量，发送给每个客户端。

在一种可能的实施方式中，所述第二确定模块71，具体用于：

基于相同的技术构思，本申请还提供了一种电子设备，图8示出了一些实施例提供的一种电子设备结构示意图，如图8所示，电子设备包括：处理器81、通信接口82、存储器83和通信总线84，其中，处理器81，通信接口82，存储器83通过通信总线84完成相互间的通信；

所述存储器83中存储有计算机程序，当所述程序被所述处理器81执行时，使得所述处理器81执行如下步骤：

在一种可能的实施方式中，所述处理器81，具体用于：

基于更新后的本地模型参数及样本数据，确定损失值；

基于校正后的损失值，确定所述本地参数梯度。

在一种可能的实施方式中，所述处理器81，具体用于：

在一种可能的实施方式中，所述处理器81，还用于：

将所述全局子参数梯度，确定为本轮本地参数控制变量。

基于相同的技术构思，本申请还提供了一种电子设备，仍参阅图8所示，电子设备包括：处理器81、通信接口82、存储器83和通信总线84，其中，处理器81，通信接口82，存储器83通过通信总线84完成相互间的通信；

在一种可能的实施方式中，所述处理器81，具体用于：

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口82用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述处理器可以是通用处理器，包括中央处理器、网络处理器(Network Processor，NP)等；还可以是数字指令处理器(Digital Signal Processing，DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

基于相同的技术构思，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有可由电子设备执行的计算机程序，当所述程序在所述电子设备上运行时，使得所述电子设备执行时实现如下步骤：

基于更新后的本地模型参数及样本数据，确定损失值；

基于校正后的损失值，确定所述本地参数梯度。

在一种可能的实施方式中，所述方法还包括：

将所述全局子参数梯度，确定为本轮本地参数控制变量。

基于相同的技术构思，本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有可由电子设备执行的计算机程序，当所述程序在所述电子设备上运行时，使得所述电子设备执行时实现如下步骤：

上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD)等。

基于相同的技术构思，本申请提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序代码，当所述计算机程序代码在计算机上运行时，使得计算机执行时实现上述应用于电子设备的任一方法实施例所述的方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令，在计算机上加载和执行所述计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种联邦学习模型训练方法，应用于客户端，所述方法包括：

在参与对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：

接收服务器发送的待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

采用所述本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新；

基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，基于所述本地参数梯度，确定本轮输出的本地模型参数；并基于所述更新后的本地模型参数，确定全局子参数梯度；

确定所述本轮输出的本地模型参数与所述本轮全局模型参数之间的第一差值；并确定所述全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将所述第一差值及第二差值发送给所述服务器，使所述服务器基于各客户端发送的第一差值和第二差值，确定下一轮全局模型参数以及下一轮全局参数控制变量。
根据权利要求1所述的方法，其中，所述基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，包括：

基于更新后的本地模型参数及样本数据，确定损失值；

基于当前保存的上一轮本地参数控制变量及所述本轮全局参数控制变量，对所述损失值进行校正；

基于校正后的损失值，确定所述本地参数梯度。
根据权利要求2所述的方法，其中，所述基于当前保存的上一轮本地参数控制变量及所述本轮全局参数控制变量，对所述损失值进行校正，包括：

确定所述上一轮本地参数控制变量与所述本轮全局参数控制变量的第三差值；

基于所述第三差值及设定的损失值调整率，对所述损失值进行校正。
根据权利要求1所述的方法，其中，基于所述本地参数梯度，确定本轮输出的本地模型参数，包括：

基于当前保存的上一轮本地参数控制变量及所述本轮全局参数控制变量，对所述本地参数梯度进行校正；

基于校正后的本地参数梯度以及所述更新后的本地模型参数，确定本轮输出的本地模型参数。
根据权利要求4所述的方法，其中，所述基于当前保存的上一轮本地参数控制变量及所述本轮全局参数控制变量，对所述本地参数梯度进行校正，包括：

确定所述上一轮本地参数控制变量与所述本轮全局参数控制变量的第三差值；

基于所述第三差值与设定的漂移调整率，对所述本地参数梯度进行校正。
根据权利要求4所述的方法，其中，基于校正后的本地参数梯度以及所述更新后的本地模型参数，确定本轮输出的本地模型参数，包括：

确定校正后的本地参数梯度与设定的本地学习率的乘积；基于该乘积以及所述更新后的本地模型参数，确定本轮输出的本地模型参数。
根据权利要求1所述的方法，所述方法还包括：

将所述全局子参数梯度，确定为本轮本地参数控制变量。
一种联邦学习模型训练方法，应用于服务器，所述方法包括：

在对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：

若接收到各客户端发送的上一轮输出的本地模型参数与上一轮全局模型参数之间的第一差值，以及各客户端的上一轮全局子参数梯度与上两轮客户端本地参数控制变量之间的第二差值，基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

将所述本轮全局模型参数以及本轮全局参数控制变量，发送给每个客户端。
根据权利要求8所述的方法，其中，所述基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量，包括：

基于各第一差值以及设定的全局学习率，对上一轮全局模型参数进行校正，得到所述本轮全局模型参数；

基于各第二差值，对上一轮全局参数控制变量进行校正，得到所述本轮全局参数控制变量。
一种联邦学习模型训练系统，所述系统包括：

服务器，用于在对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：若接收到各客户端发送的上一轮输出的本地模型参数与上一轮全局模型参数之间的第一差值，以及各客户端的上一轮全局子参数梯度与上两轮客户端本地参数控制变量之间的第二差值，基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；将所述本轮全局模型参数以及本轮全局参数控制变量，发送给每个客户端；

所述每个客户端，用于在参与对联邦学习模型的每轮迭代训练过程中，至少执行以下步骤：接收所述服务器发送的所述本轮全局模型参数以及本轮全局参数控制变量；采用所述本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新；基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，基于所述本地参数梯度，确定本轮输出的本地模型参数；并基于所述更新后的本地模型参数，确定全局子参数梯度；确定所述本轮输出的本地模型参数与所述本轮全局模型参数之间的第一差值；并确定所述全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将所述第一差值及第二差值发送给所述服务器。
一种联邦学习模型训练装置，所述装置包括：

接收模块，用于在参与对联邦学习模型的每轮迭代训练过程中，接收服务器发送的待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

更新模块，用于采用所述本轮全局模型参数对当前保存的联邦学习子模型的本地模型参数进行更新；

第一确定模块，用于基于更新后的本地模型参数及所述本轮全局参数控制变量，确定本地参数梯度，基于所述本地参数梯度，确定本轮输出的本地模型参数；并基于所述更新后的本地模型参数，确定全局子参数梯度；

第一发送模块，用于确定所述本轮输出的本地模型参数与所述本轮全局模型参数之间的第一差值；并确定所述全局子参数梯度与当前保存的上一轮本地参数控制变量之间的第二差值；将所述第一差值及第二差值发送给所述服务器，使所述服务器基于各客户端发送的第一差值和第二差值，确定下一轮全局模型参数以及下一轮全局参数控制变量。
一种联邦学习模型训练装置，所述装置包括：

第二确定模块，用于在对联邦学习模型的每轮迭代训练过程中，若接收到各客户端发送的上一轮输出的本地模型参数与上一轮全局模型参数之间的第一差值，以及各客户端的上一轮全局子参数梯度与上两轮客户端本地参数控制变量之间的第二差值，基于各第一差值及第二差值，确定待训练的联邦学习模型的本轮全局模型参数以及本轮全局参数控制变量；

第二发送模块，用于将所述本轮全局模型参数以及本轮全局参数控制变量，发送给每个客户端。
一种电子设备，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-9任一所述方法的步骤。
一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-9任一所述方法的步骤。