WO2023098546A1

WO2023098546A1 - 一种联邦学习方法及相关设备

Info

Publication number: WO2023098546A1
Application number: PCT/CN2022/133861
Authority: WO
Inventors: 李银川; 邵云峰; 吴骏
Original assignee: 华为技术有限公司
Priority date: 2021-12-02
Filing date: 2022-11-24
Publication date: 2023-06-08
Also published as: CN116227630A; EP4365785A1

Abstract

本申请实施例公开了一种联邦学习方法及相关设备，应用在联邦学习过程中，该方法具体包括: 服务器向多个终端下发随机量化指令，多个终端根据随机量化指令对训练更新数据进行随机量化后上传给服务器，其中量化可以实现降低通信量，随机的量化可以引入扰动来实现保护用户隐私，而服务器对随机量化后的训练更新数据进行聚合后可以消除随机量化引入的额外量化误差，从而实现在联邦学习在降低其通信量的情况下满足准确性和隐私性。

Description

一种联邦学习方法及相关设备

本申请要求于2021年12月02日提交中国专利局、申请号为202111463299.0、发明名称为“一种联邦学习方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及机器学习领域，尤其涉及一种联邦学习方法及相关设备。

背景技术

随着人工智能技术的不断发展，联邦学习(federated learning)作为一种新兴的人工智能技术，应用范围越来越广。联邦学习是针对“数据孤岛”的存在而提出的一种机器学习框架，能够有效帮助各参与方在无需共享数据资源，即训练数据不出本地的情况下，进行联合训练，建立共享的机器学习模型。

但是由于联邦学习的过程需要客户端上传本地模型，恶意攻击者可以从上传的本地模型中反推数据分布，这可能会泄露客户端的数据隐私。因此，联邦学习技术需要和隐私保护技术相结合，从而防止恶意攻击者得到客户端的数据分布。另一方面，由于联邦学习过程需要各客户端和云服务器频繁通信以传输模型，较大的通信量会增大开销，因此还需要在进行传输时降低通信量。基于上述问题，可以使用差分隐私技术、多方安全计算技术或同态加密技术实现隐私保护，还可以使用量化技术降低通信量。

但是传统的量化方法虽然可以降低联邦学习过程中的通信量，但是在对于模型数据进行量化的时候，模型数据的分布几乎没有变化，无法保护用户隐私。而差分隐私技术在噪声引入过程中带来了额外的误差，同态加密技术和多方安全计算技术引入了额外的计算开销，因此无法实现在联邦学习在降低其通信量的情况下满足准确性和隐私性。

发明内容

本申请实施例提供一种联邦学习方法及相关设备，用于在联邦学习在降低其通信量的情况下满足准确性和隐私性。本申请实施例还提供了相应的服务器、终端、计算机可读存储介质及计算机设备等。

本申请第一方面提供一种联邦学习方法，包括：服务器向多个终端下发全局模型，全局模型包括多个本地模型，多个本地模型与多个终端一一对应；服务器向多个终端下发随机量化指令；服务器接收多个终端发送的编码数据，并对编码数据进行解码得到多个终端的量化模型更新量，多个终端的量化模型更新量为多个终端根据随机量化指令对多个终端的模型更新量进行量化得到的，多个终端的模型更新量为多个终端对多个本地模型进行训练得到的；服务器对多个终端的量化模型更新量进行聚合得到新的全局模型，并向多个终端下发新的全局模型进行迭代更新，直至全局模型收敛。

本申请中的服务器可以是云服务器，每个终端可以看作一个客户端，每个终端都有对应自身的一个本地模型。

本申请中的随机量化指令由服务器下发，多个终端可以根据不同的随机量化指令确定不同的随机量化方式。

本申请中的多个终端利用本地数据对自身的本地模型训练后，根据服务器下发的随机量化指令对模型更新量进行量化和编码，实现降低通信量，服务器聚合后可以消除量化带来的误差，得到新的全局模型，并重复上述步骤进行迭代更新，完成联邦学习。

该第一方面，在进行联邦学习时，服务器向多个终端下发随机量化指令，多个终端根据随机量化指令对训练更新数据进行随机量化后上传给服务器，其中量化可以实现降低通信量，随机的量化可以引入扰动来实现保护用户隐私，而服务器对随机量化后的训练更新数据进行聚合后可以消除随机量化引入的额外量化误差，从而实现联邦学习在降低其通信量的情况下满足准确性和隐私性。

在第一方面的一种可能的实现方式中，随机量化指令包括随机步长量化指令和/或随机量化器指令，多个终端的量化模型更新量为多个终端根据随机步长量化指令和/或随机量化器指令对多个终端的模型更新量使用随机步长量化方法和/或随机量化器得到的。

该种可能的实现方式中，随机量化指令具体可以为随机步长量化指令、随机量化器指令或随机步长量化指令结合随机量化器指令，提升了方案的可实现性。

在第一方面的一种可能的实现方式中，随机步长量化方法使用的随机量化步长满足随机均匀分布。

该种可能的实现方式中，当随机量化步长满足随机均匀分布时，可以消除引入的量化误差，提升了数据传输的准确性。

在第一方面的一种可能的实现方式中，随机量化器包括向上量化器和向下量化器，向上量化器和向下量化器的数量相同。

该种可能的实现方式中，当向上量化器和向下量化器的数量相同时，可以消除引入的量化误差，提升了数据传输的准确性。

在第一方面的一种可能的实现方式中，在迭代更新中使用的随机量化指令为多种。

该种可能的实现方式中，在迭代更新中每次使用的随机量化指令都可以不同，提升了方案的可实现性。

本申请第二方面提供一种联邦学习方法，包括：终端接收服务器下发的本地模型和随机量化指令；终端对本地模型进行训练得到模型更新量；终端根据随机量化指令对模型更新量进行随机量化，得到量化模型更新量；终端对量化模型更新量进行编码得到编码数据，并将编码数据发送给服务器；终端接收服务器下发的新的本地模型和新的随机量化指令进行迭代更新，直至全局模型收敛，新的本地模型为服务器对多个终端的量化模型更新量进行聚合得到的，多个终端的量化模型更新量为服务器对多个终端发送的编码数据进行解码得到的。

该第二方面，在进行联邦学习时，多个终端接收服务器下发的本地模型和随机量化指令，并根据随机量化指令对训练更新数据进行随机量化后上传给服务器，其中量化可以实现降低通信量，随机的量化可以引入扰动来实现保护用户隐私，而服务器对随机量化后的训练更新数据进行聚合后可以消除随机量化引入的额外量化误差，从而实现联邦学习在降低其通信量的情况下满足准确性和隐私性。

在第二方面的一种可能的实现方式中，随机量化指令包括随机步长量化指令和/或随机量化器指令，多个终端的量化模型更新量为多个终端根据随机步长量化指令和/或随机量化器指令对多个终端的模型更新量使用随机步长量化方法和/或随机量化器得到的。

该种可能的实现方式中，

在第二方面的一种可能的实现方式中，随机步长量化方法使用的随机量化步长满足随机均匀分布。

在第二方面的一种可能的实现方式中，随机量化器包括向上量化器和向下量化器，向上量化器和向下量化器的数量相同。

在第二方面的一种可能的实现方式中，在迭代更新中使用的随机量化指令为多种。

本申请第三方面，提供了一种服务器，用于执行上述第一方面或第一方面的任意可能的实现方式中的方法。具体地，该服务器包括用于执行上述第一方面或第一方面的任意可能的实现方式中的方法的模块或单元，如：第一下发单元、第二下发单元、接收单元和聚合单元。

本申请第四方面，提供了一种终端，用于执行上述第二方面或第二方面的任意可能的实现方式中的方法。具体地，该终端包括用于执行上述第二方面或第二方面的任意可能的实现方式中的方法的模块或单元，如：第一接收单元、训练单元、量化单元、编码单元和第二接收单元。

本申请第五方面提供一种计算机设备，包括：处理器、通信接口和存储器，存储器用于存储程序代码，处理器用于调用存储器中的程序代码以使得控制器执行第一方面或第一方面的任意可能的实现方式中的方法。

本申请第六方面提供一种计算机设备，包括：处理器、通信接口和存储器，存储器用于存储程序代码，处理器用于调用存储器中的程序代码以使得控制器执行第二方面或第二方面的任意可能的实现方式中的方法。

本申请第七方面提供一种计算机可读存储介质，存储有指令，当指令在计算机上运行时，使得计算机执行如第一方面或第一方面的任意可能的实现方式中的方法。

本申请第八方面提供一种计算机可读存储介质，存储有指令，当指令在计算机上运行时，使得计算机执行如第二方面或第二方面的任意可能的实现方式中的方法。

本申请第九方面提供一种存储一个或多个计算机执行指令的计算机程序产品，当计算机执行指令被处理器执行时，处理器执行如上述第一方面或第一方面任意一种可能的实现方式的方法。

本申请第十方面提供一种存储一个或多个计算机执行指令的计算机程序产品，当计算机执行指令被处理器执行时，处理器执行如上述第二方面或第二方面任意一种可能的实现方式的方法。

本申请第十一方面提供了一种芯片系统，该芯片系统包括至少一个处理器和接口，该接口用于接收数据和/或信号，至少一个处理器用于支持计算机设备实现上述第一方面或第一方面任意一种可能的实现方式中所涉及的功能。在一种可能的设计中，芯片系统还可以包括存储器，存储器，用于保存计算机设备必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。

本申请第十二方面提供了一种芯片系统，该芯片系统包括至少一个处理器和接口，该接口用于接收数据和/或信号，至少一个处理器用于支持计算机设备实现上述第二方面或第二方面任意一种可能的实现方式中所涉及的功能。在一种可能的设计中，芯片系统还可以包括存储器，存储器，用于保存计算机设备必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。

本申请实施例中，在进行联邦学习时，服务器向多个终端下发随机量化指令，多个终端根据随机量化指令对训练更新数据进行随机量化后上传给服务器，其中量化可以实现降低通信量，随机的量化可以引入扰动来实现保护用户隐私，而服务器对随机量化后的训练更新数据进行聚合后可以消除随机量化引入的额外量化误差，从而实现在联邦学习在降低其通信量的情况下满足准确性和隐私性。

附图说明

图1为本申请实施例提供的联邦学习框架图；

图2为本申请实施例提供的联邦学习方法一个实施例示意图；

图3为本申请实施例提供的随机步长量化指令的量化示意图；

图4为本申请实施例提供的随机量化器指令的量化例示意图；

图5为本申请实施例提供的随机步长量化指令和随机量化器指令结合的量化示意图；

图6为本申请实施例提供的服务器的一个实施例示意图；

图7为本申请实施例提供的终端的一个实施例示意图；

图8为本申请实施例提供的计算机设备的一实施例示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。本领域普通技术人员可知，随着技术发展和新场景的出现，本申请实施例提供的技术方案对于类似的技术问题，同样适用。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本申请，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本申请同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本申请的主旨。

下面对本申请实施例提到或涉及的概念进行解释：

联邦学习：假设一个联邦学习系统存在一个服务器和K个终端，其训练的主要步骤如下所示：

步骤一：在某一时刻t,各终端接收服务器下发的全局模型W _t，该模型可为神经网络参数模型，也可以为其他机器学习模型参数，作为各终端的本地模型

其中k表示为第k个终端；

步骤二：各终端根据本地数据更新本地模型，得到新一轮的本地模型

各终端将新一轮的本地模型

或者模型更新量

上传到服务器；

步骤三：服务器接收各终端的本地模型或者模型更新量，进行模型聚合得到新一轮的全局模型。

对于各终端上传本地模型的情况，服务器更新为：

对于各终端上传本地模型更新量的情况，服务器更新为：

其中，α _k表示权重系数,重复此过程直到全局模型收敛。

量化：量化技术指的是将连续的信号取值离散化为有限多个取值的过程，通过量化可以将数据映射到预先定义的数据网格上。在联邦学习中，各终端将模型数据进行量化并编码，并上传服务器，量化编码过程可以表示为：

其中，Q _k为量化器，可为任意一种量化器，Encode为编码运算，其可以为任意一种编码方法，得到编码后的数据

相比于上传整个模型，上传编码数据降低了通信量。

差分隐私：差分隐私技术指的是通过对数据添加干扰噪声的方式保护所发布数据中潜在的用户隐私信息。在联邦学习中，各参与方通过对模型添加噪声的方法防止恶意攻击者从模型反推参与方的数据分布，在模型上传时，对模型添加差分噪声，得到：

其中，

表示均值为0，方差为σ ²的高斯噪声，该方法通过了对模型添加高斯噪声实现了隐私保护。

多方安全计算：多方安全计算技术是为了一组互不信任的参与方之前在保护隐私信息及没有可信第三方的前提下协同计算问题而提出的理论框架。

同态加密：同态加密技术是一种基于数学难题的计算复杂性理论的密码学技术。在联邦学习中，各参与方对模型进行同态加密上传，云服务器进行模型聚合并下发，参与方进行解密得到输出。该加密技术可以保证在加密解密过程不影响模型聚合，因此可以保证全局模型的收敛。

如图1所示，在本申请实施例提供的联邦学习架构中，每个终端可以看作一个客户端，例如存在客户端1、客户端2和客户端3，此外还可以设置更多客户端，服务器可以为云服务器，存储有全局模型，可以执行全局模型的聚合和下发，并配置每个客户端的量化指令，每个客户端根据对应的量化指令选择相应的量化方式，对训练后的本地模型进行量化。

下面结合上述概念的描述和学习框架对本申请实施例提供的连邦学习方法进行描述。

如图2所示，本申请实施例提供的联邦学习方法的一实施例包括：

201、服务器向多个终端下发全局模型。

202、服务器向多个终端下发随机量化指令。

203、终端对本地模型进行训练得到模型更新量。

服务器下发的全局模型包括多个本地模型，其中多个本地模型与多个终端一一对应，即每个终端都有对应自身的一个本地模型，例如全局模型包括本地模型1和本地模型2，服务器将本地模型1下发给终端1，将本地模型2下发给终端2。服务器具体可以为云服务器，终端可以体现为客户端。

在t时刻，终端接收服务器下发的全局模型和随机量化指令，即接收服务器下发的对应的本地模型和针对该本地模型的量化指令。具体的，每个终端都利用本地数据经过τ次训练以进行更新，其中τ为大于或等于1的正整数，则模型更新量可以表示为：

其中，

表示第k个终端在t时刻的本地模型，

为经过τ次训练后的本地模型。

需要说明的是，步骤102和步骤103的执行顺序可以调换，即终端可以完成训练得到模型更新量后再收到随机量化指令，本申请实施例对此不作限制。

204、终端根据随机量化指令对模型更新量进行随机量化，得到量化模型更新量。

205、终端对量化模型更新量进行编码得到编码数据。

206、服务器接收多个终端发送的编码数据。

207、服务器对编码数据进行解码得到多个终端的量化模型更新量。

多个终端的量化模型更新量为多个终端根据随机量化指令对多个终端的模型更新量进行量化得到的，多个终端的模型更新量为多个终端对多个本地模型进行训练得到的；

208、服务器对多个终端的量化模型更新量进行聚合得到新的全局模型。

209、服务器向多个终端下发新的全局模型进行迭代更新，直至全局模型收敛。

每个终端得到模型更新量后，根据自身接收到的随机量化指令对模型更新量进行随机量化，其中随机量化指令可以有多种类型，以下分别进行说明：

一、随机量化指令为随机步长量化指令：

终端k根据服务器的量化控制器下发的量化步长的均值

以

为均值的随机分布中采样得到随机步长

对模型更新量进行量化，得到量化模型更新量为：

其中，Q表示为通用的就近量化器，

表示为该随机量化方式引入的额外误差，起到隐私保护的作用。

然后各个终端对量化模型更新量进行编码得到编码数据：

服务器接收各个终端发送的编码数据，并对编码数据进行解码得到多个终端的量化模型更新量，即各个终端的本地模型：

最后服务器对解码后的梯度，即对多个终端的量化模型更新量进行聚合，得到新的全局模型：

其中，α _k表示学习率,对于每个终端使用的随机量化步长是随机均匀分布的，当参与联邦学习的终端足够多时，随机量化步长方法引入的额外误差满足

其中

表示终端集合，因此在模型聚合后可以有效消除随机量化方法引入的额外量化误差，不会影响全局模型的收敛。模型聚合后，服务器将最新的全局模型下给各终端，并为各终端配置新的量化指令并下发给客户端，该量化指令包含选取随机步长量化方式的指令，以及新一轮迭代的量化步长均值

然后各终端根据该量化指令进行新一轮的量化，直至全局模型收敛。

具体的，如图3所示，传统的就近量化方法，即图3左侧上部分图表示16个终端所需上传的原始数据，左侧下部分图表示16个终端量化后上传的数据，两者分布相似，差异性很小，隐私保护效果差。图3右侧为引入随机量化步长的方法，引入随机量化步长后，可以有效的保护数据隐私，16个终端采用左侧图传统量化技术聚合后得到的均值数据和采用右侧图分布式随机量化技术聚合后得到的均值数据相同，但右侧图的分布式随机量化技术隐私保护效果更好。

二、随机量化指令为随机量化器指令：

服务器首先生成随机量化器集合

随机量化器包括向上量化器和向下量化器，使用的向上量化器和向下量化器的数量相同。

向上量化器将连续数据映射到数据上方的网格点，表示为Q(x)＝d×ceil(x/d)，其中ceil表示为向上取整。向下量化器：将连续数据映射到数据下方的网格点，表示为Q(x)＝d×floor(x/d)，其中floor表示向下取整。

终端k根据随机量化器指令在量化器集合中选择的量化器对模型更新量进行量化，得到量化模型更新量为：

其中，Q _k表示为终端k随机选取的量化器，随机量化器引入了随机扰动，可以代替差分隐私方法。

然后各个终端对量化模型更新量进行编码得到编码数据：

其中，α _k表示学习率。如图4所示，对于随机量化器选取的量化方法，向上量化和向下量化的方法分别引入额外的误差e _u和e _d来进行隐私保护，当终端数量足够大时，并且满足使用向上量化器的终端数量

和使用向下量化器的终端数量

相等，假设模型数据是随机均匀分布的，因此误差项满足

因此全局模型聚合可减少量化器带来的随机扰动，从而减少精度损失。

模型聚合后，服务器将最新的全局模型下给各终端，并为各终端配置新的量化指令并下发给终端，该量化指令为量化器索引值，用于指导各终端根据该索引从随机量化器集合中选择随机量化器对本地模型进行量化。例如，如果量化器集合的基数为J，服务器为某一个终端配置的量化方式为第j个量化器，那么服务器将索引j的二进制表示作为量化指令下发给该终端。

三、随机量化指令为随机步长量化指令和随机量化器指令：

终端k引入随机量化步长，对模型梯度进行随机扰动，得到扰动后的模型梯度，然后对扰动后的模型梯度进行随机量化器量化得到量化模型更新量为：

其中，Q _k表示为终端k随机选取的量化器，

表示为该随机量化方式引入的额外误差，结合了上述两种方式中的隐私保护方法，从而更好的实现隐私保护。

然后各个终端对量化模型更新量进行编码得到编码数据：

如图5所示，用户对应终端，类似上述两种方式，模型聚合可以减少随机量化步长和随机量化器量化引入的量化误差，不会影响全局模型的收敛。

需要说明的是，在迭代更新中使用的随机量化指令为多种，即在进行每一轮的迭代更新时，服务器下发给终端的随机量化指令都可以不同，例如对应终端1来说，服务器在第一轮下发的随机量化指令为随机步长量化指令，聚合模型后，第二轮下发的随机量化指令为随机步长量化指令和随机量化器指令，聚合模型后，在第三轮下发的随机量化指令为随机量化器指令，聚合模型后，在第三轮下发的随机量化指令为随机量化器指令，直至全局模型收敛。

此外，上述三种方式对量化模型更新量的编码方式可以采用字典矩阵编码，即将量化模型更新量

乘以一个字典矩阵后进行上传，从而可以引入扰动，服务器与终端有同样的矩阵字典，服务器令矩阵字典索引作为指令下发给终端，终端根据索引选择字典矩阵引入扰动。例如，矩阵字典存储了不同的随机量化步长d，服务器可以将字典索引作为量化指令下发给终端，终端根据索引以及矩阵字典配置本轮的量化步长d。

在服务器对聚合全局模型后，可以设置是否达到停止条件的判断，若达到，则输出当前聚合后的全局模型，若未达到，则继续下发全局模型以进行迭代更新。其中，停止条件可以是迭代更新的轮数达到用户设定的预设值，即迭代更新了预设次数就停止。停止条件还可以是全局模型是否收敛，即当前的全局模型的输出值和目标值的差值是否小于预设值，若小于则停止。

本申请实施例在进行联邦学习时，服务器向多个终端下发随机量化指令，多个终端根据随机量化指令对训练更新数据进行随机量化后上传给服务器，其中量化可以实现降低通信量，随机的量化可以引入扰动来实现保护用户隐私，而服务器对随机量化后的训练更新数据进行聚合后可以消除随机量化引入的额外量化误差，从而实现在联邦学习在降低其通信量的情况下满足准确性和隐私性。

如图6所示，本申请实施例提供的服务器600的一实施例包括：

第一下发单元601，用于向多个终端下发全局模型，全局模型包括多个本地模型，多个本地模型与多个终端一一对应；该第一下发单元601可以执行上述方法实施例中的步骤201。

第二下发单元602，用于向多个终端下发随机量化指令；该第二下发单元602可以执行上述方法实施例中的步骤202。

接收单元603，用于接收多个终端发送的编码数据，并对编码数据进行解码得到多个终端的量化模型更新量，多个终端的量化模型更新量为多个终端根据随机量化指令对多个终端的模型更新量进行量化得到的，多个终端的模型更新量为多个终端对多个本地模型进行训练得到的；该接收单元603可以执行上述方法实施例中的步骤206和步骤207。

聚合单元604，用于对多个终端的量化模型更新量进行聚合得到新的全局模型，并向多个终端下发新的全局模型进行迭代更新，直至全局模型收敛。该聚合单元604可以执行上述方法实施例中的步骤208。

本申请实施例在进行联邦学习时，服务器600向多个终端下发随机量化指令，多个终端根据随机量化指令对训练更新数据进行随机量化后上传给服务器600，其中量化可以实现降低通信量，随机的量化可以引入扰动来实现保护用户隐私，而服务器600对随机量化后的训练更新数据进行聚合后可以消除随机量化引入的额外量化误差，从而实现在联邦学习在降低其通信量的情况下满足准确性和隐私性。

可选的，随机量化指令包括随机步长量化指令和/或随机量化器指令，多个终端的量化模型更新量为多个终端根据随机步长量化指令和/或随机量化器指令对多个终端的模型更新量使用随机步长量化方法和/或随机量化器得到的。

可选的，随机步长量化方法使用的随机量化步长满足随机均匀分布。

可选的，随机量化器包括向上量化器和向下量化器，向上量化器和向下量化器的数量相同。

可选的，在迭代更新中使用的随机量化指令为多种。

如图7所示，本申请实施例提供的终端700的一实施例包括：

第一接收单元701，用于接收服务器下发的本地模型和随机量化指令；该第一接收单元701可以执行上述方法实施例中的步骤201和步骤202。

训练单元702，用于对本地模型进行训练得到模型更新量；该训练单元702可以执行上述方法实施例中的步骤203。

量化单元703，用于据随机量化指令对模型更新量进行随机量化，得到量化模型更新量；该量化单元703可以执行上述方法实施例中的步骤204。

编码单元704，用于对量化模型更新量进行编码得到编码数据，并将编码数据发送给服务器；该编码单元704可以执行上述方法实施例中的步骤205。

第二接收单元705，用于接收服务器下发的新的本地模型和新的随机量化指令进行迭代更新，直至全局模型收敛，新的本地模型为服务器对多个终端的量化模型更新量进行聚合得到的，多个终端的量化模型更新量为服务器对多个终端发送的编码数据进行解码得到的。该第二接收单元705可以执行上述方法实施例中的步骤209。

本申请实施例在进行联邦学习时，服务器向多个终端700下发随机量化指令，多个终端700根据随机量化指令对训练更新数据进行随机量化后上传给服务器，其中量化可以实现降低通信量，随机的量化可以引入扰动来实现保护用户隐私，而服务器对随机量化后的训练更新数据进行聚合后可以消除随机量化引入的额外量化误差，从而实现在联邦学习在降低其通信量的情况下满足准确性和隐私性。

可选的，随机量化指令包括随机步长量化指令和/或随机量化器指令，量化单元703具体用于根据随机步长量化指令和/或随机量化器指令对模型更新量使用随机步长量化方法和/或随机量化器进行随机量化。

可选的，在迭代更新中使用的随机量化指令为多种。

如图8计算机设备所示，为本申请的实施例提供的计算机设备800的一种可能的逻辑结构示意图。计算机设备800包括：处理器801、通信接口802、存储系统803以及总线804。处理器801、通信接口802以及存储系统803通过总线804相互连接。在本申请的实施例中，处理器801用于对计算机设备800的动作进行控制管理，例如，处理器801用于执行图上述实施例所描述的服务器或终端执行的联邦学习方法。通信接口802用于支持计算机设备800进行通信。存储系统803，用于存储计算机设备800的程序代码和数据。

其中，该计算机设备800具体可以为上述实施例中的服务器或终端，处理器801可以是中央处理器单元，通用处理器，数字信号处理器，专用集成电路，现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器801也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，数字信号处理器和微处理器的组合等等。总线804可以是外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

在本申请的另一实施例中，还提供一种计算机可读存储介质，计算机可读存储介质中存储有计算机执行指令，当设备的至少一个处理器执行该计算机执行指令时，设备执行上述实施例所描述的联邦学习方法。

在本申请的另一实施例中，还提供一种计算机程序产品，该计算机程序产品包括计算机执行指令，该计算机执行指令存储在计算机可读存储介质中；设备的至少一个处理器可以从计算机可读存储介质读取该计算机执行指令，至少一个处理器执行该计算机执行指令使得设备执行上述实施例所描述的联邦学习方法。

在本申请的另一实施例中，还提供一种芯片系统，该芯片系统包括至少一个处理器和接口，该接口用于接收数据和/或信号，至少一个处理器用于支持实现上述实施例所描述的联邦学习方法。在一种可能的设计中，芯片系统还可以包括存储器，存储器，用于保存计算机设备必要的程序指令和数据。该芯片系统，可以由芯片构成，也可以包含芯片和其他分立器件。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，read-only memory)、随机存取存储器(RAM，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

一种联邦学习方法，其特征在于，包括：

服务器向多个终端下发全局模型，所述全局模型包括多个本地模型，所述多个本地模型与所述多个终端一一对应；

所述服务器向所述多个终端下发随机量化指令；

所述服务器接收所述多个终端发送的编码数据，并对所述编码数据进行解码得到所述多个终端的量化模型更新量，所述多个终端的量化模型更新量为所述多个终端根据所述随机量化指令对所述多个终端的模型更新量进行量化得到的，所述多个终端的模型更新量为所述多个终端对所述多个本地模型进行训练得到的；

所述服务器对所述多个终端的量化模型更新量进行聚合得到新的全局模型，并向所述多个终端下发新的所述全局模型进行迭代更新，直至所述全局模型收敛。
根据权利要求1所述的方法，其特征在于，所述随机量化指令包括随机步长量化指令和/或随机量化器指令，所述多个终端的量化模型更新量为所述多个终端根据所述随机步长量化指令和/或随机量化器指令对所述多个终端的模型更新量使用随机步长量化方法和/或随机量化器得到的。
根据权利要求2所述的方法，其特征在于，所述随机步长量化方法使用的随机量化步长满足随机均匀分布。
根据权利要求2所述的方法，其特征在于，所述随机量化器包括向上量化器和向下量化器，所述向上量化器和所述向下量化器的数量相同。
根据权利要求1-4中任一项所述的方法，其特征在于，在所述迭代更新中使用的所述随机量化指令为多种。
一种联邦学习方法，其特征在于，包括：

终端接收服务器下发的本地模型和随机量化指令；

所述终端对所述本地模型进行训练得到模型更新量；

所述终端根据所述随机量化指令对所述模型更新量进行随机量化，得到量化模型更新量；

所述终端对所述量化模型更新量进行编码得到编码数据，并将所述编码数据发送给所述服务器；

所述终端接收所述服务器下发的新的本地模型和新的随机量化指令进行迭代更新，直至所述全局模型收敛，新的所述本地模型为所述服务器对多个所述终端的量化模型更新量进行聚合得到的，多个所述终端的量化模型更新量为所述服务器对多个所述终端发送的所述编码数据进行解码得到的。
根据权利要求6所述的方法，其特征在于，所述随机量化指令包括随机步长量化指令和/或随机量化器指令，所述终端根据所述随机量化指令对所述模型更新量进行随机量化包括：

所述终端根据所述随机步长量化指令和/或随机量化器指令对所述模型更新量使用随机步长量化方法和/或随机量化器进行随机量化。
根据权利要求7所述的方法，其特征在于，所述随机步长量化方法使用的随机量化步长满足随机均匀分布。
根据权利要求7所述的方法，其特征在于，所述随机量化器包括向上量化器和向下量化器，所述向上量化器和所述向下量化器的数量相同。
根据权利要求6-9中任一项所述的方法，其特征在于，在所述迭代更新中使用的所述随机量化指令为多种。
一种服务器，其特征在于，包括：

第一下发单元，用于向多个终端下发全局模型，所述全局模型包括多个本地模型，所述多个本地模型与所述多个终端一一对应；

第二下发单元，用于向所述多个终端下发随机量化指令；

接收单元，用于接收所述多个终端发送的编码数据，并对所述编码数据进行解码得到所述多个终端的量化模型更新量，所述多个终端的量化模型更新量为所述多个终端根据所述随机量化指令对所述多个终端的模型更新量进行量化得到的，所述多个终端的模型更新量为所述多个终端对所述多个本地模型进行训练得到的；

聚合单元，用于对所述多个终端的量化模型更新量进行聚合得到新的全局模型，并向所述多个终端下发新的所述全局模型进行迭代更新，直至所述全局模型收敛。
根据权利要求11所述的服务器，其特征在于，所述随机量化指令包括随机步长量化指令和/或随机量化器指令，所述多个终端的量化模型更新量为所述多个终端根据所述随机步长量化指令和/或随机量化器指令对所述多个终端的模型更新量使用随机步长量化方法和/或随机量化器得到的。
根据权利要求12所述的服务器，其特征在于，所述随机步长量化方法使用的随机量化步长满足随机均匀分布。
根据权利要求12所述的服务器，其特征在于，所述随机量化器包括向上量化器和向下量化器，所述向上量化器和所述向下量化器的数量相同。
根据权利要求11-14中任一项所述的服务器，其特征在于，在所述迭代更新中使用的所述随机量化指令为多种。
一种终端，其特征在于，包括：

第一接收单元，用于接收服务器下发的本地模型和随机量化指令；

训练单元，用于对所述本地模型进行训练得到模型更新量；

量化单元，用于据所述随机量化指令对所述模型更新量进行随机量化，得到量化模型更新量；

编码单元，用于对所述量化模型更新量进行编码得到编码数据，并将所述编码数据发送给所述服务器；

第二接收单元，用于接收所述服务器下发的新的本地模型和新的随机量化指令进行迭代更新，直至所述全局模型收敛，新的所述本地模型为所述服务器对多个所述终端的量化模型更新量进行聚合得到的，多个所述终端的量化模型更新量为所述服务器对多个所述终端发送的所述编码数据进行解码得到的。
根据权利要求16所述的终端，其特征在于，所述随机量化指令包括随机步长量化指令和/或随机量化器指令，所述终端根据所述随机量化指令对所述模型更新量进行随机量化包括：

所述终端根据所述随机步长量化指令和/或随机量化器指令对所述模型更新量使用随机步长量化方法和/或随机量化器进行随机量化。
根据权利要求17所述的终端，其特征在于，所述随机步长量化方法使用的随机量化步长满足随机均匀分布。
根据权利要求17所述的终端，其特征在于，所述随机量化器包括向上量化器和向下量化器，所述向上量化器和所述向下量化器的数量相同。
根据权利要求16-19中任一项所述的终端，其特征在于，在所述迭代更新中使用的所述随机量化指令为多种。
一种计算机设备，包括：处理器、通信接口和存储器，所述存储器用于存储程序代码，所述处理器用于调用所述存储器中的程序代码以使得所述处理器执行如权利要求1至5或6至10中任一项所述的方法。
一种计算机可读存储介质，存储有指令，当所述指令在计算机上运行时，使得计算机执行如权利要求1至5或6至10中任一项所述的方法。