CN112383396A

CN112383396A - 一种联邦学习模型训练方法及系统

Info

Publication number: CN112383396A
Application number: CN202110020651.7A
Authority: CN
Inventors: 邵俊; 向爱平; 洪城
Original assignee: Shenzhen Suoxinda Data Technology Co ltd; Soxinda Beijing Data Technology Co ltd
Current assignee: Shenzhen Suoxinda Data Technology Co ltd; Soxinda Beijing Data Technology Co ltd
Priority date: 2021-01-08
Filing date: 2021-01-08
Publication date: 2021-02-19
Anticipated expiration: 2041-01-08
Also published as: CN112383396B

Abstract

本发明公开了一种联邦学习模型训练方法及系统，其中方法包括：中央服务器将初始参数发送至各个节点设备；各个节点设备基于初始参数和本地数据集进行模型训练，并获得梯度值；中央服务器生成密钥对，并将公钥发送给各个节点设备；各节点设备采用所述公钥对梯度值进行加密，获得加密梯度；各节点设备通过点对点方式计算加密梯度和，并将加密梯度和发送至中央服务器；中央服务器通过私钥对所述加密梯度和进行解密，获得梯度和，并发送至各个节点设备；节点设备基于所述梯度和更新模型的参数，根据更新的参数以及本地数据集进行下一轮模型训练，直到满足训练停止条件，该方法能够保证所有参与方的隐私数据以及保证了模型训练的精度。

Description

一种联邦学习模型训练方法及系统

技术领域

本申请涉及信息技术领域，尤其涉及一种联邦学习模型训练方法及系统。

背景技术

联邦学习致力于解决多用户在不公开各自数据集的情形下，协同完成模型训练的问题。例如在医疗大数据建模场景中，各家医院拥有不同的病人样本数据。由于各家医院拥有的数据量有限，如果仅仅基于自身的数据来训练模型，受样本规模的限制，模型效果难以达到预期。如果能将各家数据聚合来训练，则可以大幅提升模型精度。然而出于医院之间的竞争以及对病人数据隐私保护的要求，医院不可能将自身的客户数据向任何第三方发布，直接将各家数据聚合到一起建模是行不通的。因此，联邦学习技术应运而生，给医疗机构在不泄露自身原始数据的情形下，共同训练机器学习模型提供了可能。

共同训练的模型可以是机器学习模型或神经网络模型，通过协同训练来找到模型合适的参数，使得总损失函数最小。通常会使用梯度下降方法来更新模型参数，即在给定了模型初始参数后，通过梯度信息一步步更新参数，直到损失函数的值达到最小。通过联邦学习，参与方之间不需要共享原始数据，而只需要基于自身数据建模，并将梯度信息传送出去，通过各家梯度信息更新参数即可完成模型训练。

然而虽然各成员之间不会共享数据，而仅仅通过将梯度值传给中央服务器，并由中央服务器计算出梯度和并传送给各节点，以完成模型训练。然而该中央服务器存在通过这些梯度值反推出节点原始信息的可能性。

传统的差分隐私办法会让每个参与方在自身的梯度值上叠加一个噪声再传递给中央服务器，然而如果该噪声过大，则模型精度会急剧下降，而如果噪声过小，又起不到保护隐私的作用。该方法始终存在着精度与隐私性难以权衡的问题。

发明内容

为解决现有的联邦学习方法存在的精度与隐私性难以权衡的问题，本发明提供了一种联邦学习模型训练方法及系统。

一种联邦学习模型训练方法，包括：

中央服务器将初始参数发送至各个节点设备；

各个节点设备基于所述初始参数和本地数据集进行模型训练，并获得梯度值；

中央服务器生成密钥对，并将公钥发送给各个节点设备；

各节点设备采用所述公钥对梯度值进行加密，获得加密梯度；

各节点设备通过点对点方式计算加密梯度和，并将加密梯度和发送至中央服务器；

中央服务器通过私钥对所述加密梯度和进行解密，获得梯度和，并发送至各个节点设备；

节点设备基于所述梯度和更新模型的参数，根据更新的参数以及本地数据集进行下一轮模型训练，直到满足训练停止条件。

进一步地，节点设备基于初始参数或者更新的参数以及本地数据集进行模型训练，获得梯度值，包括：

节点设备基于所述初始参数或者更新的参数，以及本地数据集计算损失函数值，计算过程中获得梯度下降产生的梯度值。

进一步地，所述中央服务器基于同态加密算法生成密钥对。

进一步地，各节点设备通过点对点方式计算加密梯度和，包括：

首节点设备生成噪声值，将所述噪声值与生成的加密梯度进行叠加，并发送至下一节点设备；

各节点设备接收到上一节点设备发送的叠加加密梯度之后，将自身生成的加密梯度叠加到所述叠加加密梯度上，并发送至下一节点设备；

最后一个节点设备将叠加加密梯度发送至所述首节点设备，首节点设备将接收到的叠加加密梯度减去噪声值，获得所述加密梯度和。

进一步地，所述首节点设备将所述加密梯度和发送至中央服务器。

进一步地，所述训练停止条件为：

超过预设数量的节点设备的模型收敛。

进一步地，所述节点设备的模型收敛的条件为损失函数值的变化值小于预设值。

一种联邦学习模型训练系统，包括中央服务器和N个节点设备，其中，N为大于1的整数；

所述中央服务器将初始参数发送至各个节点设备；

各个所述节点设备基于所述初始参数和本地数据集进行模型训练，并获得梯度值；

所述中央服务器生成密钥对，并将公钥发送给各个节点设备；

各所述节点设备采用所述公钥对梯度值进行加密，获得加密梯度；

各所述节点设备通过点对点方式计算加密梯度和，并将加密梯度和发送至中央服务器；

所述中央服务器通过私钥对所述加密梯度和进行解密，获得各节点设备的梯度和，并发送至各个节点设备；

所述节点设备基于所述梯度和更新模型的参数，根据更新的参数以及本地数据集进行下一轮模型训练，直到满足训练停止条件。

进一步地，所述N个节点设备依次通信连接，首节点设备生成噪声值，将所述噪声值与生成的加密梯度进行叠加，并发送至下一节点设备；各节点设备接收到上一节点设备发送的叠加加密梯度之后，将自身生成的加密梯度叠加到所述叠加加密梯度上，并发送至下一节点设备；最后一个节点设备将叠加加密梯度发送至所述首节点设备，首节点设备将接收到的叠加加密梯度减去噪声值，获得所述加密梯度和。

进一步地，所述训练停止条件为：超过预设数量的节点设备的模型收敛；所述节点设备的模型收敛的条件为损失函数值的变化值小于预设值。

本发明提供的联邦学习模型训练方法及系统，至少包括如下有益效果：

上述实施例提供的联邦学习模型训练方法，至少包括如下有益效果：

（1）在协同训练的过程中，中央服务器无法获知任意节点设备的梯度值，任意节点设备也无法获知其他节点设备的梯度值，保证了所有参与方的隐私数据，同时，各节点设备基于梯度值和更新参数，保证了模型训练的精度；

（2）节点设备之间通过点对点的方式计算加密梯度和，首节点设备加入了噪声值进行计算，使得任意一个节点设备都无法获知其他节点设备的加密梯度，以防止节点设备和中央服务器串谋获取其他节点设备的数据，进一步保证所有参与方的数据隐私。

附图说明

图1为本发明提供的联邦学习模型训练方法一种实施例的结构示意图。

图2为本发明提供的联邦学习模型训练方法中加密梯度和计算一种实施例的流程图。

图3为本发明提供的联邦学习模型训练方法中加密梯度和计算一种实施例的示意图。

图4为本发明提供的联邦学习模型训练系统一种实施例的结构示意图。

图5为本发明提供的联邦学习模型训练系统另一种实施例的结构示意图。

具体实施方式

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。

参考图1，在一些实施例中，提供一种联邦学习模型训练方法，包括：

S1、中央服务器将初始参数发送至各个节点设备；

S2、各个节点设备基于所述初始参数和本地数据集进行模型训练，并获得梯度值；

S3、中央服务器生成密钥对，并将公钥发送给各个节点设备；

S4、各节点设备采用所述公钥对梯度值进行加密，获得加密梯度；

S5、各节点设备通过点对点方式计算加密梯度和，并将加密梯度和发送至中央服务器；

S6、中央服务器通过私钥对所述加密梯度和进行解密，获得梯度和，并发送至各个节点设备；

S7、节点设备基于所述梯度和更新模型的参数，根据更新的参数以及本地数据集进行下一轮模型训练，直到满足训练停止条件。

具体地，系统包括中央服务器和N个节点设备，其中N为大于1的整数。

本实施例中所述的模型包括神经网络模型。

步骤S1中，中央服务器与各个节点设备建立通信连接，在训练开始时，中央服务器生成初始参数发送给各个节点设备。

步骤S2中，节点设备接收到初始参数后，基于初始参数以及本地数据集进行模型训练，获得梯度值，包括：

节点设备基于所述初始参数以及本地数据集计算损失函数值，计算过程中获得梯度下降产生的梯度值。

具体地，第i个节点设备生成的梯度值，记为

。

步骤S3中，中央服务器基于同态加密算法生成密钥对。

同态加密算法是一种对称加密算法，包括密钥生成算法、加密算法和解密算法，同态加密包括两种基本的同态类型，即乘法同态和加法同态。同态加密保证了数据处理方无法知道所处理的数据的明文信

息，可以直接对数据的密文进行相应的处理，这样一来，数据可以得到相应的安全保障。

步骤S4中，各节点设备采用所述公钥对梯度值进行加密，获得加密梯度，第i个节点设备的加密梯度记为

。

参考图2，步骤S5中，各节点设备通过点对点方式计算加密梯度和，包括：

S51、首节点设备生成噪声值，将所述噪声值与生成的加密梯度进行叠加，并发送至下一节点设备；

S52、各节点设备接收到上一节点设备发送的叠加加密梯度之后，将自身生成的加密梯度叠加到所述叠加加密梯度上，并发送至下一节点设备；

S53、最后一个节点设备将叠加加密梯度发送至所述首节点设备，首节点设备将接收到的叠加加密梯度减去噪声值，获得所述加密梯度和。

参考图3，以下以具体的应用场景对步骤S5的方法步骤做进一步说明。

系统包括中央服务器和n个节点设备，n个节点设备编号分别为1、2、3、……n，n个节点设备依次通信连接，编号为1的节点设备作为首节点设备，首节点设备1生成噪声值e，将噪声值e与自身生成的加密梯度进行叠加，记为

，发送至节点设备2，节点设备2接收到首节点设备1发送的叠加加密梯度

之后，将自身生成的加密梯度

进行叠加，记为

，发送至下一节点设备，以此类推，最后一个节点设备n接收到的叠加加密梯度

，再叠加自身的加密梯度

，记为

，发送至首节点设备1，首节点设备1再减去噪声值e，获得加密梯度和，记为

。

首节点设备1将加密梯度和发送至中央服务器。

节点设备之间通过点对点的方式计算加密梯度，首节点设备加入了噪声值进行计算，使得任意一个节点设备都无法获知其他节点设备的加密梯度，以防止节点设备和中央服务器串谋获取其他节点设备的数据。

步骤S6中，中央服务器接收到加密梯度和，采用私钥进行解密，获得梯度和并发送至各个节点设备，中央服务器无法获知任意一个节点设备的梯度值，因此可以有效保护节点设备的隐私。

步骤S7中，各个节点设备基于接收到的梯度和更新模型的参数，根据更新的模型参数和本地数据集，计算损失函数值，计算过程中获得梯度下降产生的梯度值。

当损失函数值的变化值小于预设值，则该节点设备的模型收敛。

训练过程中，模型收敛的节点设备，接收到中央服务器发送的梯度和之后不再更新模型，但与其他节点设备以及中央服务器的通信依然继续，加密梯度设为0。

超过预设数量的节点设备的模型收敛，则满足训练停止条件。

预设数量可以根据需要设定，例如可以是总的节点数量的70%至80%。

在一些实施例中，参考图4，还提供一种联邦学习模型训练系统，包括中央服务器100和N个节点设备200，其中N为大于1的整数；

中央服务器100将初始参数发送至各个节点设备200；

各个节点设备200基于初始参数和本地数据集进行模型训练，并获得梯度值；

中央服务器100生成密钥对，并将公钥发送给各个节点设备；

各节点设备200采用所述公钥对梯度值进行加密，获得加密梯度；

各节点设备200通过点对点方式计算加密梯度和，并将加密梯度和发送至中央服务器100；

中央服务器100通过私钥对所述加密梯度和进行解密，获得各节点设备的梯度和，并发送至各个节点设备200；

各个节点设备200基于梯度和更新模型的参数，根据更新的参数以及本地数据集进行下一轮模型训练，直到满足训练停止条件。

具体地，参考图5，中央服务器100包括初始参数生成模块101、密钥生成模块102、发送模块103以及解密模块104。

节点设备200包括接收模块201、训练模块202、加密模块203以及和计算模块204。

中央服务器100的初始参数生成模块101在模型开始训练时，生成初始参数，并通过发送模块103发送至各个节点设备200，节点设备200中的接收模块201接收该初始参数，训练模块202基于初始参数和本地数据集进行模型训练，并获得梯度值。中央服务器100的密钥生成模块102基于同态加密算法生成密钥对，并将公钥通过发送模块103发送至各个节点设备200，各个节点设备200的接收模块201接收该公钥，加密模块203采用所述公钥对梯度值进行加密，获得加密梯度；和计算模块204通过点对点方式计算加密梯度和，并将加密梯度和发送至中央服务器100，中央服务器100的解密模块105接收该加密梯度和，并通过私钥对其进行解密，获得梯度和，通过发送模块103将梯度和发送至节点设备100，节点设备100的接收模块接收该梯度和，训练模块202基于梯度和更新模型的参数，根据更新的参数以及本地数据集进行下一轮模型训练，直到满足训练停止条件。

进一步地，N个节点设备100依次通信连接，首节点设备的和计算模块204还用于生成噪声值，首节点设备生成噪声值，将所述噪声值与生成的加密梯度进行叠加，并发送至下一节点设备；各节点设备的和计算模块204接收到上一节点设备发送的叠加加密梯度之后，将自身生成的加密梯度叠加到所述叠加加密梯度上，并发送至下一节点设备；最后一个节点设备的和计算模块204将叠加加密梯度发送至所述首节点设备，首节点设备的和计算模块204将接收到的叠加加密梯度减去噪声值，获得所述加密梯度和。首节点设备的和计算模块204将加密梯度和发送至中央服务器100。

上述实施例提供的联邦学习模型训练系统，至少包括如下有益效果：

以下通过具体的应用场景对上述实施例提供的联邦学习模型训练方法做进一步说明。

系统包括中央服务器和5个节点设备，第一轮训练开始时，中央服务器将初始参数发送至各个节点设备；各个节点设备基于所述初始参数和本地数据集进行模型训练，计算损失函数值，计算过程中获得梯度下降产生的梯度值。

记神经网络模型原始自变量为

标签为y，y的取值为0或1，1表示正类，0表示负类。神经网络参数为

其中M为隐层数量，

表示第i个隐层的变量个数，记神经网络模型的输出为

，表示该样本为正例的概率

那么损失函数如下表示：

，其中

每个参数的梯度值即为上述损失函数对每个参数的偏导数。

中央服务器生成密钥对，并将公钥发送给各个节点设备；各节点设备采用所述公钥对梯度值

进行加密，得到加密梯度

。

各节点设备通过点对点方式计算加密梯度和，并将加密梯度和发送至中央服务器，加密梯度和为

。

节点设备基于所述梯度和更新模型的参数，根据更新的参数以及本地数据集进行下一轮模型训练，计算损失函数值，计算过程中获得梯度下降产生的梯度值，当损失函数值与上一轮的变化值小于预设值，则该节点设备的模型收敛，当5个节点设备的模型都收敛，则训练停止。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种联邦学习模型训练方法，其特征在于，包括：

中央服务器将初始参数发送至各个节点设备；

中央服务器生成密钥对，并将公钥发送给各个节点设备；

2.根据权利要求1所述的方法，其特征在于，节点设备基于初始参数或者更新的参数以及本地数据集进行模型训练，获得梯度值，包括：

3.根据权利要求1所述的方法，其特征在于，所述中央服务器基于同态加密算法生成密钥对。

4.根据权利要求1所述的方法，其特征在于，各节点设备通过点对点方式计算加密梯度和，包括：

5.根据权利要求4所述的方法，其特征在于，所述首节点设备将所述加密梯度和发送至中央服务器。

6.根据权利要求2所述的方法，其特征在于，所述训练停止条件为：

超过预设数量的节点设备的模型收敛。

7.根据权利要求6所述的方法，其特征在于，所述节点设备的模型收敛的条件为损失函数值的变化值小于预设值。

8.一种联邦学习模型训练系统，其特征在于，包括中央服务器和N个节点设备，其中，N为大于1的整数；

所述中央服务器将初始参数发送至各个节点设备；

9.根据权利要求8所述的联邦学习模型训练系统，其特征在于，所述N个节点设备依次通信连接，首节点设备生成噪声值，将所述噪声值与生成的加密梯度进行叠加，并发送至下一节点设备；各节点设备接收到上一节点设备发送的叠加加密梯度之后，将自身生成的加密梯度叠加到所述叠加加密梯度上，并发送至下一节点设备；最后一个节点设备将叠加加密梯度发送至所述首节点设备，首节点设备将接收到的叠加加密梯度减去噪声值，获得所述加密梯度和。

10.根据权利要求8所述的联邦学习模型训练系统，其特征在于，所述训练停止条件为：超过预设数量的节点设备的模型收敛；所述节点设备的模型收敛的条件为损失函数值的变化值小于预设值。