CN113704779A

CN113704779A - 加密的分布式机器学习训练方法

Info

Publication number: CN113704779A
Application number: CN202110803353.5A
Authority: CN
Inventors: 林博; 王涛; 张豫元; 董科雄; 石培泽
Original assignee: Hangzhou Yikang Huilian Technology Co ltd
Current assignee: Hangzhou Yikang Huilian Technology Co ltd
Priority date: 2021-07-16
Filing date: 2021-07-16
Publication date: 2021-11-26

Abstract

本申请公开了一种加密的分布式机器学习训练方法，包括：S1见证方设备创建加密数据，将加密数据中的公钥分别发送至第一训练方设备和第二训练方设备；S2第一训练方设备和第二训练方设备分别在本地进行机器学习模型的训练，得到它们各自的梯度参数数据和损失参数数据并发送至见证方设备；S3见证方设备利用加密数据进行解密，并将第一训练方设备和第二训练方设备的梯度参数数据和损失参数数据合并，然后再次加密后发分别送至第一训练方设备和第二训练方设备；S4重复以上步骤S2、S3直至机器学习模型训练完毕。本申请的有益之处在于提供一种可以基于多方协助进行模型训练的同时又能保证数据隐私安全的加密的分布式机器学习训练方法。

Description

加密的分布式机器学习训练方法

技术领域

本申请涉及机器学习领域，具体而言，涉及一种加密的分布式机器学习训练方法。

背景技术

不久的将来医疗行业将融入更多人工智能、传感技术等高科技，使医疗服务走向真正意义的智能化，推动医疗事业的繁荣发展。在中国新医改的大背景下，智慧医疗正在走进寻常百姓的生活。医疗行业数据存在隐私保护的需要，因此将人工智能应用于医疗领域进行研究、模型训练和数据预测时，往往需要多个医疗机构通过联网和数据协同的方式进行。

但是现有技术方案并无法保证模型和数据的隐私性。

发明内容

为了解决现有技术的不足之处，本申请提供了一种加密的分布式机器学习训练方法，该方法包括如下步骤：S1见证方设备创建加密数据，将加密数据中的公钥分别发送至第一训练方设备和第二训练方设备；S2所述第一训练方设备和所述第二训练方设备分别在本地进行机器学习模型的训练，得到它们各自的梯度参数数据和损失参数数据并利用所述公钥进行加密后发送至所述见证方设备；S3所述见证方设备利用所述加密数据进行解密，并将所述第一训练方设备和所述第二训练方设备的梯度参数数据和损失参数数据合并，然后再次加密后发分别送至所述第一训练方设备和所述第二训练方设备；S4重复以上步骤S2、S3直至所述机器学习模型训练完毕。

进一步地，所述机器学习模型训练完毕的条件为所述见证方法设备中的所述机器学习模型收敛。

进一步地，所述见证方设备创建加密数据时生成私钥并存储以解密回转的梯度参数数据和损失参数数据。

进一步地，所述见证方设备创建加密数据对其存储的机器学习模型的模板和参数进行加密。

进一步地，所述见证方设备将加密后的机器学习模型的模板和参数分别发送到所述第一训练方设备和第二训练方设备。

进一步地，所述见证方设备分别为所述第一训练方设备和第二训练方设备生成相异的加密数据。

进一步地，所述见证方设备每次向所述第一训练方设备发送数据均会生成唯一的加密数据。

进一步地，所述见证方设备每次向所述第二训练方设备发送数据均会生成唯一的加密数据。

进一步地，所述第一训练方通过所述见证方设备向所述第二训练方发起协助训练的请求。

进一步地，所述加密数据的加密方法为paillier加密算法。

本申请的有益之处在于：提供一种可以基于多方协助进行模型训练的同时又能保证数据隐私安全的加密的分布式机器学习训练方法。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解，使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请一种实施例的加密的分布式机器学习训练方法的步骤示意图框图；

图2是根据本申请一种实施例的加密的分布式机器学习训练方法所适用系统的架构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

参照图1和图2所示，本申请的加密的分布式机器学习训练方法，该方法包括如下步骤：S1见证方设备创建加密数据，将加密数据中的公钥分别发送至第一训练方设备和第二训练方设备；S2第一训练方设备和第二训练方设备分别在本地进行机器学习模型的训练，得到它们各自的梯度参数数据和损失参数数据并利用公钥进行加密后发送至见证方设备；S3见证方设备利用加密数据进行解密，并将第一训练方设备和第二训练方设备的梯度参数数据和损失参数数据合并，然后再次加密后发分别送至第一训练方设备和第二训练方设备；S4重复以上步骤S2、S3直至机器学习模型训练完毕。

具体而言，机器学习模型训练完毕的条件为见证方法设备中的机器学习模型收敛。

具体而言，见证方设备创建加密数据时生成私钥并存储以解密回转的梯度参数数据和损失参数数据。见证方设备创建加密数据对其存储的机器学习模型的模板和参数进行加密。

具体而言，见证方设备将加密后的机器学习模型的模板和参数分别发送到第一训练方设备和第二训练方设备。

具体而言，见证方设备分别为第一训练方设备和第二训练方设备生成相异的加密数据。见证方设备每次向第一训练方设备发送数据均会生成唯一的加密数据。见证方设备每次向第二训练方设备发送数据均会生成唯一的加密数据。这样可以提高加密的安全性。作为更进一步地方案，加密数据的加密方法为paillier加密算法。

作为扩展方案，第一训练方设备通过见证方设备向第二训练方设备发起协助训练的请求。这样可以将见证方设备构造成一个服务器从而实现一个实现以上方法的系统平台。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种加密的分布式机器学习训练方法，其特征在于：

所述加密的分布式机器学习训练方设备法包括如下步骤：

S1见证方设备创建加密数据，将加密数据中的公钥分别发送至第一训练方设备和第二训练方设备；

S2所述第一训练方设备和所述第二训练方设备分别在本地进行机器学习模型的训练，得到它们各自的梯度参数数据和损失参数数据并利用所述公钥进行加密后发送至所述见证方设备；

S3所述见证方设备利用所述加密数据进行解密，并将所述第一训练方设备和所述第二训练方设备的梯度参数数据和损失参数数据合并，然后再次加密后发分别送至所述第一训练方设备和所述第二训练方设备；

S4重复以上步骤S2、S3直至所述机器学习模型训练完毕。

2.根据权利要求1所述的加密的分布式机器学习训练方法，其特征在于：

所述机器学习模型训练完毕的条件为所述见证方法设备中的所述机器学习模型收敛。

3.根据权利要求2所述的加密的分布式机器学习训练方法，其特征在于：

所述见证方设备创建加密数据时生成私钥并存储以解密回转的梯度参数数据和损失参数数据。

4.根据权利要求3所述的加密的分布式机器学习训练方法，其特征在于：

所述见证方设备创建加密数据对其存储的机器学习模型的模板和参数进行加密。

5.根据权利要求4所述的加密的分布式机器学习训练方法，其特征在于：

所述见证方设备将加密后的机器学习模型的模板和参数分别发送到所述第一训练方设备和第二训练方设备。

6.根据权利要求5所述的加密的分布式机器学习训练方法，其特征在于：

所述见证方设备分别为所述第一训练方设备和第二训练方设备生成相异的加密数据。

7.根据权利要求6所述的加密的分布式机器学习训练方法，其特征在于：

所述见证方设备每次向所述第一训练方设备发送数据均会生成唯一的加密数据。

8.根据权利要求7所述的加密的分布式机器学习训练方法，其特征在于：

所述见证方设备每次向所述第二训练方设备发送数据均会生成唯一的加密数据。

9.根据权利要求8所述的加密的分布式机器学习训练方法，其特征在于：

所述第一训练方通过所述见证方设备向所述第二训练方发起协助训练的请求。

10.根据权利要求9所述的加密的分布式机器学习训练方法，其特征在于：

所述加密数据的加密方法为paillier加密算法。