CN116187473B

CN116187473B - 联邦学习方法、装置、电子设备和计算机可读存储介质

Info

Publication number: CN116187473B
Application number: CN202310097788.1A
Authority: CN
Inventors: 刘吉; 马北辰; 窦德景
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2023-01-19
Filing date: 2023-01-19
Publication date: 2024-02-06
Anticipated expiration: 2043-01-19
Also published as: CN116187473A

Abstract

本公开提供了一种联邦学习方法、装置、电子设备和计算机可读存储介质，涉及人工智能技术领域，尤其涉及联邦学习、图像处理等领域。具体实现方案为：基于本设备的当前模型进行参数优化，得到本地更新模型；基于多个邻居模型以及本地更新模型，得到新的当前模型；其中，多个邻居模型中的第一邻居模型是根据接收到的来自第一邻居设备的相关信息确定的；在多个邻居设备中进行随机选择，得到目标邻居设备；向目标邻居设备发送当前模型的相关信息。本公开降低了单一设备的工作量，且大幅减少了通信消耗。

Description

联邦学习方法、装置、电子设备和计算机可读存储介质

技术领域

本公开涉及人工智能技术领域，尤其涉及联邦学习、图像处理等领域。

背景技术

近年来，联邦学习(Federated Learning，FL)取得了重大进展，它可以利用边缘设备上的分布式数据进行协作式模型训练。联邦学习通常利用分布式架构，在设备和集中式服务器之间传输梯度或模型，而不是原始数据，以解决安全或隐私问题。采用集中式服务器的分布式联邦学习会在服务器上产生严重的通信或计算工作量。

发明内容

本公开提供了一种联邦学习方法、装置、电子设备和计算机可读存储介质。

根据本公开的一方面，提供了一种联邦学习方法，包括：

基于本设备的当前模型进行参数优化，得到本地更新模型；

基于多个邻居模型以及本地更新模型，得到新的当前模型；其中，多个邻居模型中的第一邻居模型是根据接收到的来自第一邻居设备的相关信息确定的；

在多个邻居设备中进行随机选择，得到目标邻居设备；

向目标邻居设备发送当前模型的相关信息。

根据本公开的另一方面，提供了一种联邦学习装置，包括：

本地更新模块，用于基于本设备的当前模型进行参数优化，得到本地更新模型；

聚合模块，用于基于多个邻居模型以及本地更新模型，得到新的当前模型；其中，多个邻居模型中的第一邻居模型是根据接收到的来自第一邻居设备的相关信息确定的；

第一选择模块，用于在多个邻居设备中进行随机选择，得到目标邻居设备；

信息发送模块，用于向目标邻居设备发送当前模型的相关信息。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与该至少一个处理器通信连接的存储器；其中，

该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行本公开实施例中任一的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。

本公开实施例通过去中心化的分散式FL以及随机发送模型，降低了单一设备的工作量，且大幅减少了通信消耗。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是本公开实施例的联邦学习方法的示例性应用场景的示意图；

图2是根据本公开一实施例的联邦学习方法的流程示意图；

图3是本公开实施例中联邦学习方法的一个应用示例的示意图；

图4是本公开实施例中联邦学习方法的另一个应用示例的示意图；

图5是本公开实施例中联邦学习方法的又一个应用示例的示意图；

图6是本公开一实施例提供的联邦学习装置的示意性框图；

图7是本公开另一实施例提供的联邦学习装置的示意性框图；

图8是本公开另一实施例提供的联邦学习装置的示意性框图；

图9是本公开另一实施例提供的联邦学习装置的示意性框图；

图10是用来实现本公开实施例的联邦学习方法的电子设备的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

为了便于理解本公开的技术方案，以下对本公开实施例的相关技术进行说明，以下相关技术作为可选方案与本公开实施例的技术方案可以进行任意结合，其均属于本公开实施例的保护范围。

分布式FL训练过程通常由多个边缘设备中的每个设备上的本地训练模型和服务器上的模型聚合组成。服务器可以选择可用的设备，并将全局模型广播给选定的设备。然后，每个选定设备根据设备内的本地数据更新模型，这被称为本地训练。在接收到来自选定设备的更新模型之后，服务器将其与全局模型汇总并生成一个新的全局模型，这被称为模型汇总或者模型聚合。

上述训练过程可以是同步的或异步的。在同步FL机制下，服务器在收到所有选定设备的更新模型后进行模型聚合。在异步FL机制下，服务器收到部分模型时，就可以进行模型聚合。由于边缘设备通常是异构的，具有不同的计算或通信能力，因此同步分布式FL的效率较低。而异步FL可能会导致较差的精度，甚至无法收敛在非独立同分布数据分布下。并且集中式FL在服务器上产生严重的通信或计算工作量，成为瓶颈，容易导致低效率和单点故障。特别是图像处理领域，图像或视频数据常分布在多个设备上，例如，用于目标检测的多个摄像头的视频数据分别由不同的边缘设备采集。通过FL协同训练图像处理模型，可使得各设备无需上传图像或视频数据，减少通信成本并保护用户的隐私数据。然而受限于分布式FL在服务器端产生的瓶颈，实际并不能达到期望的通信成本降低效果。

本公开实施例的联邦学习方法，用于解决上述技术问题中的至少一个。图1是本公开实施例的联邦学习方法的一个示例性的应用场景的示意图。如图1所示，FL环境中包括多个用于协作训练的电子设备110，图1中以设备0～设备7作为示例。电子设备110可以是终端、服务器、服务器集群或其他处理设备。其中，终端可以为个人计算机、移动设备、个人数字助理(Personal Digital Assistant，PDA)、手持设备、车载设备、可穿戴设备等用户设备(User Equipment，UE)。服务器或服务器集群可以是云中心服务器或边缘服务器等。需要说明的是，在该FL环境中，各电子设备110在没有中央服务器的情况下实现协作训练过程。其中，各电子设备110可与邻居设备进行通信。根据本公开实施例的联邦学习方法，各电子设备110基于本地数据集进行本地模型更新，并在多个邻居设备中随机选择邻居设备进行模型的发送。例如图1的示例中，设备0可以与设备1、设备2以及设备4通信，并向设备2发送更新的模型；设备5可以与设备6、设备7以及设备1通信，并向设备1发送更新的模型。

可选地，在该FL环境中还包括协调器120。虽然部署有集中的协调器120，但它只管理每个设备的索引和心跳，不参与FL的训练过程。例如，每个电子设备110都连接到协调器120，并从协调器获取设备索引，以进行联邦学习。示例性地，协调器也可以是终端、服务器、服务器集群或其他处理设备。

图2示出了根据本公开一实施例的联邦学习方法的流程示意图。示例性地，该方法可以应用于联邦学习系统中的各电子设备，例如图1中的各电子设备110。如图2所示，该方法可以包括：

步骤S210、基于本设备的当前模型进行参数优化，得到本地更新模型；

步骤S220、基于多个邻居模型以及本地更新模型，得到新的当前模型；其中，多个邻居模型中的第一邻居模型是根据接收到的来自第一邻居设备的相关信息确定的；

步骤S230、在多个邻居设备中进行随机选择，得到目标邻居设备；

步骤S240、向目标邻居设备发送当前模型的相关信息。

示例性地，在本公开实施例中，当前模型是指电子设备中本地训练的训练对象，邻居模型是指电子设备缓存的与联邦学习系统中的其他设备对应的模型。

根据上述方法，在当前模型的一次更新过程中，电子设备首先对当前模型进行参数优化，例如基于本地数据集，采用随机梯度下降法(Stochastic Gradient Descent，SGD)对当前模型进行参数优化，得到本地更新模型；然后，电子设备基于缓存的多个邻居模型与本地更新模型，得到新的当前模型。

实际应用中，电子设备可以对当前模型进行多次更新，每次更新得到新的当前模型后，向目标邻居设备发送当前模型的相关信息，并执行下一次更新。也就是说，上述步骤S210～步骤S240可以是迭代执行的。

可以理解，目标邻居设备作为联邦学习系统中的另一电子设备，根据接收到的上述相关信息，可以确定一个邻居模型，用于结合该电子设备的本地更新模型，更新该电子设备的当前模型。

根据上述方法，联邦学习系统中的各电子设备可以有多个邻居设备，在每次更新当前模型之后，各电子设备随机选择目标邻居设备，向目标邻居设备发送当前模型的相关信息，其中，该相关信息可以用于指示当前模型的参数。如此，各电子设备随机接收到其他设备发送的相关信息，并根据相关信息确定本设备中的邻居模型，基于该邻居模型对本设备的当前模型进行更新。经过多次更新后，可使得各电子设备中的当前模型融合了联邦学习系统中的其他各设备的当前模型的信息，从而使各电子设备的当前模型的参数趋向相同，各电子设备可采用本设备的当前模型进行模型推理。相比于中心服务器将每次更新的模型发送到所有参与联邦学习的电子设备，或者各设备将本设备的当前模型发送至所有邻居模型的方式，本公开实施例的方法通过去中心化的分散式联邦学习以及随机发送模型，降低了单一设备的工作量，且大幅减少了通信消耗。

下面采用一具体的应用示例对上述联邦学习方法进行说明。该应用示例可以在图1所示的场景中实现。具体地，联邦学习系统中的设备i的本地数据集其中x_i和y_i表示一个样本，例如，x_i表示样本图像，y_i代表该样本图像对应的监督标签；s_i表示设备i上的样本数量。

在该应用示例中，联邦学习的模型训练目标可以采用以下公式(1)表示：

公式(1)

其中，其中，f(m_i,x_i,y_i)为设备i的本地损失函数，用于衡量设备i中的当前模型m_i在数据{x_i,y_i}上的误差。/>表示定义，即F_i(m_i)定义为设备i中的当前模型针对各样本的平均损失。此外，m表示全局模型，例如m可包括全局模型中的各参数。可选地，若在联邦学习方法中各电子设备对模型进行修剪，则m表示未修剪时的全局模型。s表示系统中的样本总数。n为系统中的设备数量。即/>定义为各设备的平均损失。上述模型训练目标可以理解为全局损失达到最小。

在该应用示例中，各电子设备之间可采用指数拓扑结构连接，每个设备有O个邻居设备，O＝log(n)，以下表示为O(log(n))，n为系统中的设备数量。采用w_i,j表示从设备j传输信息到设备i的权重，则指数拓扑结构中的w_i,j可以基于以下公式(2)确定：

公式(2)

其中，表示整数集。公式(2)表示当i＝j+2^k时，w_i,j>0，即设备j可以传输信息到设备i，相应地，设备i可以接收设备j发送的设备j的当前模型的相关信息，并确定与设备j对应的邻居模型。当i≠j且i≠j+2^k时，w_i,j＝0，表示设备j不可以传输信息到设备i。

进一步地，可定义拓扑矩阵其中Rⁿ×n表示n行n列的矩阵，w_i,j为矩阵中第i行第i列的元素，该元素表示从设备j传输信息到设备i的权重。通过该拓扑矩阵可以体现联邦学习系统中任意两个设备之间是否可传输信息。

根据以上定义，每个设备从协调器获取设备索引，然后各设备(以设备i为例)执行模型更新，之后，各设备将其更新的模型发送给一个随机选择的邻居设备。各设备的模型更新以及发送步骤重复执行，直至满足预定条件时，视为达到训练目标。预定条件例如是每个设备上的模型更新的次数(即迭代次数)达到第一预定值，或者各设备的当前模型的共识距离小于第二预定值。共识距离可基于设备的当前模型和邻居模型之间的差异确定。例如，共识距离被定义为任何两个设备之间当前模型的平均差异。

在上述应用示例中，虽然每个设备都有O(log(n))个邻居，但通过随机选择来进行模型扩散，可以大幅减少通信开销。为了提高效率，本地更新和模型扩散可以平缓地执行。此外，每个设备的本地更新和模型扩散是异步的，因此是独立的。异步训练可以很好地缓解设备的异质性所带来的低效率。

在上述方法的基础上，各设备的当前模型可以为图像处理模型。可选地，步骤S210、基于本设备的当前模型进行参数优化，得到本地更新模型，可以包括：基于当前模型对样本图像进行处理，得到图像处理结果；基于图像处理结果，确定当前模型对应的损失；基于损失，对本设备的当前模型进行参数优化，得到本地更新模型。

示例性地，当前模型可以为目标检测模型，则对应的图像处理结果为目标检测框的位置信息。基于图像处理结果以及样本图像对应的监督标签，可以确定当前模型对应的损失。基于该损失可以采用随机梯度下降法(SGD)对本设备的当前模型进行参数优化，得到本地更新模型。该过程可以采用以下公式(3)表示：

公式(3)

其中，表示第t_i次更新得到的新的当前模型；/>表示学习率；/> 表示当前模型/>对应的损失；/>表示SGD中梯度；/>表示对/>进行参数优化得到的本地更新模型。即上述公式(3)表示基于学习率以及当前模型的梯度对当前模型进行参数优化，得到本地更新模型。

上述可选实施例中，各设备针对图像处理模型进行联邦学习，可使得各设备无需上传图像或视频数据到中心服务器，减少通信成本并保护用户的隐私数据。并且，通过异步分散式联邦学习以及随机选择邻居设备进行模型发送，进一步降低了通信成本，有利于达到期望效果。

可选地，步骤S220、基于多个邻居模型以及本地更新模型，得到新的当前模型，可以包括：对多个邻居模型中的至少部分模型以及本地更新模型进行聚合，得到新的当前模型。

示例性地，可以采用在多个邻居模型中选取的部分邻居模型或者采用全部邻居模型，与本地更新模型进行聚合，得到新的当前模型。聚合的方式可以是针对当前模型中的各参数，利用本地更新模型和邻居模型中的对应参数进行求平均或者加权求和，得到新的当前模型中的各参数。

上述可选方式通过聚合方式实现基于邻居模型与本地更新模型得到新的当前模型，有利于使当前模型融合各邻居模型与本地更新模型的信息，结合随机发送当前模型的方式，实现模型的扩散。如此，有利于提升联邦学习效率。

根据上述步骤S210、S220的可选实现方式，图3示出了一个应用示例的示意图。参考图3，该应用示例中，以设备i的第t_i次的模型更新为例，执行一次模型更新的过程包括：

S31、本地训练。示例性地，图3中的模型表示设备i中经t_i-1轮次的模型更新确定的当前模型。在本地训练步骤中，采用随机梯度下降法对模型/>进行参数优化，得到本地更新模型/>

S32、模型聚合。示例性地，图3中的模型表示在执行t_i轮次的模型更新时的第一个邻居模型，模型/>表示在执行t_i轮次的模型更新时的第二个邻居模型，模型/>表示在执行t_i轮次的模型更新时的第M个邻居模型，M为设备i的邻居模型的总数。在模型聚合过程中，设备i基于模型/>以及模型/>至模型/>得到模型/>即经t_i轮次的模型更新得到的新的当前模型/>

可选地，如图3所示，设备i执行一次模型更新的过程还可以包括：

S33、模型修剪。示例性地，该步骤用于对模型进行修剪，得到用于传输至邻居设备的模型，以减少模型的大小，进一步降低通信开销。

可以理解，在执行S31～S33后，可以创建另一个当前模型的副本，重新执行S31～S33，以继续更新当前模型。

在上述方法中，在各电子设备中有多个缓存的邻居模型，例如以指数拓扑结构连接的n个电子设备中，每个电子设备有O(log(n))个缓存的邻居模型，其中，每个邻居模型对应于一个其他设备的当前模型。可选地，上述联邦学习方法还包括各邻居模型的确定方式。具体地，上述联邦学习还包括：初始化多个邻居模型；响应于接收到来自第一邻居设备的相关信息，基于相关信息，更新与第一邻居设备对应的第一邻居模型。

示例性地，各电子设备可基于本设备的当前模型所对应的初始化模型，初始化多个邻居模型，即本设备的当前模型和多个邻居模型均采用相同的初始化模型。之后，电子设备根据接收到的其他设备发送的相关信息更新缓存模型。例如，设备i是设备j的邻居，即w_i,j＞0，当设备j将其模型m_i,j发送到设备i，则在设备i上与设备j对应的缓存邻居模型被更新。这个过程是原子式的，以确保整个模型可用于模型聚合。

根据上述方式，由于初始化了多个邻居模型，可以保证在模型训练初期就已缓存有各个邻居模型，避免训练初期随机接收到的邻居模型在训练过程中产生过大的影响，从而有利于提升模型精度。

可选地，上述联邦学习方法还可以包括：将多个邻居模型存储在图形处理单元(GPU)的内存中；在GPU的内存达到预设条件的情况下，将多个邻居模型存储在本设备的内存中。

由于一个模型可能需要很多内存空间，因此，缓存的邻居模型可以放在GPU的内存上，也可以放在设备的内存上。当模型放置在设备的内存中时，在模型聚合过程中，可能需要额外的时间将模型移动到GPU上。因此，在上述可选方式中，默认选择GPU的内存存储多个邻居模型。当GPU内存达到预设条件例如内存空间小于预定值，即GPU不够用时，将设备的内存空间用于缓存模型。如此，可以充分兼顾模型训练效率以及资源利用率。

如前述说明，在模型聚合过程中，可以基于多个邻居模型中的至少部分模型与本地更新模型进行聚合。下面提供一种示例性的确定该至少部分模型的方式。

具体地，联邦学习方法还可以包括：基于优先权神经网络，确定多个邻居模型中各模型的选取概率，其中，优先权神经网络是基于启发式方式以及预设规则进行预训练得到的；根据各模型的选取概率，在多个邻居模型中选取至少部分模型。

也就是说，在该示例性方式中，采用基于启发式方式以及预设规则进行预训练得到的优先权神经网络，在多个邻居模型中选取至少部分邻居模型。示例性地，该预设规则可以是前一次用于聚合的模型不用于当前次的模型聚合中。

根据上述示例性方式，采用启发式方式进行预训练，所得到的优先权神经网络可以学习到该预设规则的相关知识，从而使优先权神经网络的输出以该预设规则为参考。基于此，可以根据实际需求灵活设置预设规则，调整该至少部分邻居模型的选取效果，从而提升聚合效果以及最终的模型精度。

可选地，上述联邦学习方法还可以包括：基于当前模型对应的损失，对优先权神经网络进行参数优化。示例性地，可以采用强化学习的方式对优先权神经网络进行参数优化。具体地，将当前模型对应的损失作为奖励值，基于该奖励值采用强化学习的方式更新优先权神经网络中的参数。

根据上述可选方式，在模型训练过程中，还对优先权神经网络进行参数优化，提升了至少部分邻居模型的选取准确性，从而提升聚合效果以及最终的模型精度。

图4示出了上述联邦学习方法的另一个应用示例的示意图。该应用示例包含基于强化学习的模型选择方式。如图4所示，基于强化学习的模型选择器400由两个模块实现。第一个模块是一个由长短期记忆(LSTM)网络和两个全连接层(FC)组成的优先级神经网络410。优先级神经网络的输出是选择每个邻居模型的可能性，即每个邻居模型的选取概率。第二个模块是优先权转换器420，它根据选择每个邻居模型的可能性来选择邻居模型。选择的邻居模型将应用于模型聚合，并影响本地损失。在模型训练过程中，将强化学习的奖励值定义为基于本地损失函数计算的当前模型对应的损失。示例性地，可根据以下公式(4)更新优先权神经网络：

公式(4)

其中，表示设备i上的优先级神经网络在第t次本地训练时的参数；η'是学习率；log(n)是缓存的邻居模型的数量；c_m表示邻居模型m是否被选中，相应地，c_(m-1):1表示邻居模型1至邻居模型(m-1)是否被选中；/>是奖励值；l_i是偏差的常数，例如设备i上最近若干次本地训练的平均损失。优先权神经网络410的输入包括邻居模型是否已被聚合、邻居模型的滞后性(例如邻居模型的更新次数与当前模型的更新次数之间的差异)、邻居模型的损失等。优先权神经网络410可以采用启发式方式进行预训练，例如，已经聚合的模型不应该被选用于模型聚合。

在上述各示例的基础上，作为一种示例性的实施方式，对多个邻居模型中的至少部分模型以及本地更新模型进行聚合，得到新的当前模型，可以包括：基于至少部分模型以及本地更新模型中各模型的训练信息，确定各模型的权重；基于各模型的权重，对至少部分模型以及本地更新模型进行聚合，得到新的当前模型。

也就是说，在本公开实施例中，可以基于待聚合的各模型的训练信息确定各模型的权重，即根据模型的训练动态调整各模型的权重，从而基于动态调整的权重进行聚合，得到新的当前模型。

根据该实施方式，可以根据各模型的呆滞性和训练状态调整各模型的权重，从而提升聚合得到的当前模型的精度，并提升联邦学习效率。

示例性地，至少部分模型中的第二邻居模型的训练信息包括以下至少之一：第二邻居模型的模型更新次数与当前模型的模型更新次数之间的差异；第二邻居模型对应的损失；第二邻居模型对应的样本数量。其中，第二邻居模型可以是基于来自第二邻居设备的相关信息确定的。该相关信息可以包括第二邻居模型的参数，还可以包括第二邻居模型对应的模型更新次数、损失以及样本数量。

相应地，本地更新模型的训练信息可以包括以下至少之一：本地更新模型的模型更新次数与当前模型的模型更新次数之间的差异；当前模型对应的损失；本设备的样本数量。实际应用中，可以采用一固定值，例如1或1/2作为本地更新模型的模型更新次数与当前模型的模型更新次数之间的差异。从而可利用相同方式确定本地更新模型的权重以及各邻居设备的权重。

由于训练过程是异步的，因此，每个设备内缓存的多个邻居模型都有不同的版本。例如，设备i是设备j和j′的邻居设备之一。那么，设备j和j′的缓存模型是和/>其中t_j和t_j′分别代表设备i在收到/>和/>时，/>和/>对应的模型更新次数。不同的模型更新次数对于模型聚合的影响不同。例如，用t_i来表示设备i上的模型更新次数，则当t_j<<t_i时，缓存模型/>在设备i的模型聚合中可能没有好处。基于此，上述方式根据模型更新次数的差异确定各模型在模型聚合阶段的权重，可以使权重更好地表征各模型对模型聚合的影响程度。此外，各模型的损失和样本数量也对模型的精度有影响，因此，结合各模型的损失和样本数量确定权重，也有利于提升模型聚合的效果。

可选地，上述基于至少部分模型中各模型的训练信息，确定各模型的权重，可以包括：基于当前模型对应的损失，对控制变量进行更新；基于至少部分模型中的第二邻居模型的训练信息以及控制变量，确定第二邻居模型的权重。

也就是说，在确定权重时，还可以设置一个可以根据模型训练过程中的损失动态调整的控制变量，使得在模型训练过程中，逐渐优化该控制变量，从而优化权重的准确性，有利于提升模型聚合的效果，从而提升模型精度和联邦学习效率。

图5示出了上述联邦学习方法的又一应用示例的示意图。该应用示例包含上述根据动态调整的权重进行模型聚合的过程。

具体地，在该应用示例中，由于引入动态调整的权重，可将公式(1)的模型训练目标表述为双级优化问题。具体地，模型训练目标可采用以下公式(5)表示：

公式(5)

其中，agg(m_i,w_i)表示模型聚合过程；表示在模型聚合过程中，设备i上所有本地模型和邻居模型的权重的集合，即f(agg(m_i,w_i),x_i,y_i)表示基于权重集合w_i进行聚合得到的模型m_i在样本集上的损失。相比公式(1)，该公式表示模型训练目标为最小化基于权重和模型确定的损失，即将影响模型训练目标的变量扩展到权重。

如图5所示，在该应用示例中，根据动态调整的权重进行模型聚合的过程包括：

S51、模型选择。具体地，可以参考前述采用优先权神经网络的应用示例进行模型选择。如图5所示，可以从模型至模型/>中选择出模型/>以及/>等进行下一步骤。

S52、确定权重。具体地，可以针对等邻居模型以及本地更新模型分别确定权重。

S53、模型聚合。具体地，根据步骤S52确定的权重，对等邻居模型以及本地更新模型/>进行聚合。

在该应用示例的步骤S52中，可以利用公式(6)计算各邻居模型的重要程度：

公式(6)

其中，代表在第t_i次模型更新时，设备j对应的邻居模型在设备i上的重要程度；s_j是样本数量；/>是动态更新的控制变量；/>代表当前模型的模型更新次数t_i和设备j对应的邻居模型在设备j上更新时的模型更新次数之间的差异，/>可以很好地代表设备j对应的邻居模型在设备i上的滞后性；/>表示设备j上的模型损失。

相应地，本地更新模型的重要程度也可以根据公式(6)进行计算，其中，采用预设的固定值作为模型更新次数的差异。即i＝j时，为预设的固定值。

根据公式(7)对各模型的重要程度进行归一化，可得到各模型的权重：

公式(7)

其中，表示在第t_i次本地更新中来自设备j对设备i的邻居模型的权重；/>表示邻居模型的集合。当j＝i时，/>表示本地更新模型的权重。

示例性地，上述控制变量的更新方法可采用公式(8)表示：

公式(8)

其中，η_λ表示控制变量的学习率，表示第t_i-1次模型更新时采用的控制变量；表示第t_i次模型更新时采用的控制变量。/>表示当前模型对应的损失关于控制变量/>的偏导数，可根据以下公式(9)计算：

公式(9)

其中，s_j为设备j的样本数量，为设备j在本轮更新之前的最新的损失，g_i表示设备i上模型/>的梯度，上标T表示转置。

在该应用示例的步骤S53中，可以利用公式(10)对各模型进行聚合：

公式(10)

其中，为聚合后新的当前模型。

综上所述，在本公开实施例中，联邦学习算法由多个局部更新组成。在每个局部更新中，用SGD方法更新局部模型(即各设备的当前模型)。然后，对于邻居模型集合M中的每个模型，控制变量被更新，相应的权重值被更新。之后，根据公式(10)对全模型结构中的每个参数进行本地模型和邻居模型的汇总。

可选地，上述联邦学习方法还可以包括：基于当前模型的参数以及当前模型的训练信息，得到当前模型的相关信息。

也就是说，当前模型的相关信息可以包括当前模型对应的损失、当前模型对应的样本数量、模型更新次数等信息，便于邻居模型基于训练信息确定本设备的当前模型的权重，从而有利于提升聚合的模型的精度以及联邦学习效率。

根据本公开实施例，本公开还提供了一种联邦学习装置。图6示出了本公开一实施例提供的联邦学习装置的示意性框图。如图6所示，该装置包括：

本地更新模块610，用于基于本设备的当前模型进行参数优化，得到本地更新模型；

聚合模块620，用于基于多个邻居模型以及本地更新模型，得到新的当前模型；其中，多个邻居模型中的第一邻居模型是根据接收到的来自第一邻居设备的相关信息确定的；

第一选择模块630，用于在多个邻居设备中进行随机选择，得到目标邻居设备；

信息发送模块640，用于向目标邻居设备发送当前模型的相关信息。

可选地，参考图7，本地更新模块610可以包括：

图像处理单元710，用于基于当前模型对样本图像进行处理，得到图像处理结果；

损失计算单元720，用于基于图像处理结果，确定当前模型对应的损失；

参数优化单元730，用于基于损失，对本设备的当前模型进行参数优化，得到本地更新模型。

可选地，参考图8，联邦学习装置还可以包括：

初始化模块810，用于初始化多个邻居模型；

邻居模型更新模块820，用于响应于接收到来自第一邻居设备的相关信息，基于相关信息，更新与第一邻居设备对应的第一邻居模型。

可选地，参考图8，联邦学习装置还可以包括：

第一缓存模块830，用于将多个邻居模型存储在图形处理单元GPU的内存中；

第二缓存模块840，用于在GPU的内存达到预设条件的情况下，将多个邻居模型存储在本设备的内存中。

可选地，上述聚合模块用于：

对多个邻居模型中的至少部分模型以及本地更新模型进行聚合，得到新的当前模型。

可选地，参考图8，联邦学习装置还可以包括：

概率确定模块850，用于基于优先权神经网络，确定多个邻居模型中各模型的选取概率；其中，优先权神经网络是基于启发式方式以及预设规则进行预训练得到的；

第二选择模块860，用于根据各模型的选取概率，在多个邻居模型中选取至少部分模型。

可选地，参考图8，联邦学习装置还可以包括：

选择优化模块870，用于基于当前模型对应的损失，对优先权神经网络进行参数优化。

可选地，参考图9，聚合模块可以包括：

权重确定单元910，用于基于至少部分模型以及本地更新模型中各模型的训练信息，确定各模型的权重；

模型聚合单元920，用于基于各模型的权重，对至少部分模型以及本地更新模型进行聚合，得到新的当前模型。

可选地，至少部分模型中的第二邻居模型的训练信息包括以下至少之一：

第二邻居模型的模型更新次数与当前模型的模型更新次数之间的差异；

第二邻居模型对应的损失；

第二邻居模型对应的样本数量。

可选地，权重确定单元用于：

基于当前模型对应的损失，对控制变量进行更新；

基于至少部分模型中的第二邻居模型的训练信息以及控制变量，确定第二邻居模型的权重。

可选地，参考图9，联邦学习装置还可以包括：

信息确定模块930，用于基于当前模型的参数以及当前模型的训练信息，得到当前模型的相关信息。

本公开实施例的装置的各模块、子模块的具体功能和示例的描述，可以参见上述方法实施例中对应步骤的相关描述，在此不再赘述。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图10示出了可以用来实施本公开的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图10所示，电子设备1000包括计算单元1001，其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序，来执行各种适当的动作和处理。在RAM 1003中，还可存储设备1000操作所需的各种程序和数据。计算单元1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。

电子设备1000中的多个部件连接至I/O接口1005，包括：输入单元1006，例如键盘、鼠标等；输出单元1007，例如各种类型的显示器、扬声器等；存储单元1008，例如磁盘、光盘等；以及通信单元1009，例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理，例如联邦学习方法。例如，在一些实施例中，联邦学习方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1008。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM 1003并由计算单元1001执行时，可以执行上文描述的联邦学习方法的一个或多个步骤。备选地，在其他实施例中，计算单元1001可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行联邦学习方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种联邦学习方法，包括：

基于本设备的当前模型进行参数优化，得到本地更新模型；

基于多个邻居模型以及所述本地更新模型，得到新的当前模型；其中，所述多个邻居模型中的第一邻居模型是根据接收到的来自第一邻居设备的相关信息确定的，所述新的当前模型应用于图像处理；

在多个邻居设备中进行随机选择，得到目标邻居设备；

向所述目标邻居设备发送所述新的当前模型的相关信息；

其中，所述基于多个邻居模型以及所述本地更新模型，得到新的当前模型，包括：

基于优先权神经网络，确定所述多个邻居模型中各模型的选取概率；其中，所述优先权神经网络包括长短期记忆网络和两个全连接层；

根据所述各模型的选取概率，在所述多个邻居模型中选取至少部分模型；

对所述至少部分模型以及所述本地更新模型进行聚合，得到新的当前模型。

2.根据权利要求1所述的方法，其中，所述基于本设备的当前模型进行参数优化，得到本地更新模型，包括：

基于所述当前模型对样本图像进行处理，得到图像处理结果；

基于所述图像处理结果，确定所述当前模型对应的损失；

基于所述损失，对本设备的当前模型进行参数优化，得到所述本地更新模型。

3.根据权利要求1或2所述的方法，还包括：

初始化多个邻居模型；

响应于接收到来自所述第一邻居设备的相关信息，基于所述相关信息，更新与所述第一邻居设备对应的第一邻居模型。

4.根据权利要求1或2所述的方法，还包括：

将所述多个邻居模型存储在图形处理单元GPU的内存中；

在所述GPU的内存达到预设条件的情况下，将所述多个邻居模型存储在本设备的内存中。

5.根据权利要求1或2所述的方法，还包括：

基于所述当前模型对应的损失，对所述优先权神经网络进行参数优化。

6.根据权利要求1或2所述的方法，其中，所述对所述至少部分模型以及所述本地更新模型进行聚合，得到新的当前模型，包括：

基于所述至少部分模型以及所述本地更新模型中各模型的训练信息，确定所述各模型的权重；

基于所述各模型的权重，对所述至少部分模型以及所述本地更新模型进行聚合，得到新的当前模型。

7.根据权利要求6所述的方法，其中，所述至少部分模型中的第二邻居模型的训练信息包括以下至少之一：

所述第二邻居模型的模型更新次数与所述当前模型的模型更新次数之间的差异；

所述第二邻居模型对应的损失；

所述第二邻居模型对应的样本数量。

8.根据权利要求6所述的方法，其中，所述基于所述至少部分模型以及所述本地更新模型中各模型的训练信息，确定所述各模型的权重，包括：

基于所述当前模型对应的损失，对控制变量进行更新；

基于所述至少部分模型中的第二邻居模型的训练信息以及所述控制变量，确定所述第二邻居模型的权重。

9.根据权利要求1或2所述的方法，还包括：

基于所述当前模型的参数以及所述当前模型的训练信息，得到所述当前模型的相关信息。

10.一种联邦学习装置，包括：

聚合模块，用于基于多个邻居模型以及所述本地更新模型，得到新的当前模型；其中，所述多个邻居模型中的第一邻居模型是根据接收到的来自第一邻居设备的相关信息确定的，所述新的当前模型应用于图像处理；

信息发送模块，用于向所述目标邻居设备发送所述新的当前模型的相关信息；

其中，所述装置还包括：

概率确定模块，用于基于优先权神经网络，确定所述多个邻居模型中各模型的选取概率；其中，所述优先权神经网络包括长短期记忆网络和两个全连接层；

第二选择模块，用于根据所述各模型的选取概率，在所述多个邻居模型中选取至少部分模型；

其中，所述聚合模块用于对所述至少部分模型以及所述本地更新模型进行聚合，得到新的当前模型。

11.根据权利要求10所述的装置，其中，所述本地更新模块包括：

图像处理单元，用于基于所述当前模型对样本图像进行处理，得到图像处理结果；

损失计算单元，用于基于所述图像处理结果，确定所述当前模型对应的损失；

参数优化单元，用于基于所述损失，对本设备的当前模型进行参数优化，得到所述本地更新模型。

12.根据权利要求10或11所述的装置，还包括：

初始化模块，用于初始化多个邻居模型；

邻居模型更新模块，用于响应于接收到来自所述第一邻居设备的相关信息，基于所述相关信息，更新与所述第一邻居设备对应的第一邻居模型。

13.根据权利要求10或11所述的装置，还包括：

第一缓存模块，用于将所述多个邻居模型存储在图形处理单元GPU的内存中；

第二缓存模块，用于在所述GPU的内存达到预设条件的情况下，将所述多个邻居模型存储在本设备的内存中。

14.根据权利要求10或11所述的装置，还包括：

选择优化模块，用于基于所述当前模型对应的损失，对所述优先权神经网络进行参数优化。

15.根据权利要求10或11所述的装置，其中，所述聚合模块包括：

权重确定单元，用于基于所述至少部分模型以及所述本地更新模型中各模型的训练信息，确定所述各模型的权重；

模型聚合单元，用于基于所述各模型的权重，对所述至少部分模型以及所述本地更新模型进行聚合，得到新的当前模型。

16.根据权利要求15所述的装置，其中，所述至少部分模型中的第二邻居模型的训练信息包括以下至少之一：

所述第二邻居模型对应的损失；

所述第二邻居模型对应的样本数量。

17.根据权利要求15所述的装置，其中，所述权重确定单元用于：

基于所述当前模型对应的损失，对控制变量进行更新；

18.根据权利要求10或11中任一项所述的装置，还包括：

信息确定模块，用于基于所述当前模型的参数以及所述当前模型的训练信息，得到所述当前模型的相关信息。

19.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-9中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-9中任一项所述的方法。

21.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-9中任一项所述的方法。