WO2021120676A1

WO2021120676A1 - 联邦学习网络下的模型训练方法及其相关设备

Info

Publication number: WO2021120676A1
Application number: PCT/CN2020/111428
Authority: WO
Inventors: 何安珣; 王健宗; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-06-30
Filing date: 2020-08-26
Publication date: 2021-06-24
Also published as: CN111814985B; CN111814985A

Abstract

一种联邦学习网络下的模型训练方法及其相关设备，建立包括中央客户端和多个节点的联邦学习网络，控制节点接收初始化模型作为本地模型，控制节点使用本地数据训练本地模型获得梯度信息；控制中央客户端根据梯度信息生成全局信息；控制节点根据全局信息获得其他节点的梯度信息，使用梯度信息对当前节点的本地模型进行测试，获得准确率，根据准确率调整全局信息，更新当前节点的本地模型；直至模型收敛,获得结果模型；将节点接收的用户数据输入节点对应的结果模型中，获得结果模型输出的推荐信息。各节点的梯度信息可存储于区块链节点中。该方法实现不同节点的本地模型的个性化训练。

Description

联邦学习网络下的模型训练方法及其相关设备

本申请以2020年6月30日提交的申请号为202010622524.X，名称为“联邦学习网络下的模型训练方法及其相关设备”的中国发明专利申请为基础，并要求其优先权。

技术领域

本申请涉及人工智能技术领域，尤其涉及联邦学习网络下的模型训练方法及其相关设备。

背景技术

联邦学习(Federated machine learning)，是指一种机器学习框架，能有效帮助多个节点在满足数据隐私保护和数据安全的要求下，进行数据使用和机器学习建模。

目前，联邦学习的优化方法有FedSGD，FedAvg，FedProx，FedMA，SCAFFOLD等。发明人发现这些方法均是在中央客户端进行模型更新，各参与者最后训练的模型基本一致，无法做到个性化训练；在Non-IID(独立同分布)数据分布上有一定损耗，准确率不够高，以及当有一些节点使用无意义的数据恶意参与模型训练时，难以及时有效地辨别出来，容易受到攻击。

发明内容

本申请实施例的目的在于提出一种联邦学习网络下的模型训练方法及其相关设备，实现不同节点的个性化训练，并降低无意义数据对模型训练的影响。

为了解决上述技术问题，本申请实施例提供一种联邦学习网络下的模型训练方法，采用了如下所述的技术方案：

一种联邦学习网络下的模型训练方法，包括下述步骤：

建立联邦学习网络，所述联邦学习网络包括中央客户端和多个节点，控制每个所述节点接收中央客户端下发的初始化模型，作为本地模型，每个节点分别对本地模型进行多轮更新训练；

直至更新训练后各节点对应的本地模型收敛，各节点分别获得结果模型；

控制所述节点接收用户数据，并输入到所述节点对应的所述结果模型中，获得所述结果模型输出的推荐信息；

其中，在每轮更新训练中，所述更新训练的过程包括：

控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息，并将所述梯度信息发送至所述中央客户端；

控制所述中央客户端接收并根据所述梯度信息生成全局信息，将所述全局信息发送至各节点；

控制当前节点接收并根据所述全局信息获得其他节点的梯度信息，分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率，根据所述准确率调整接收到的全局信息，获得调整后的全局信息，并使用所述调整后的全局信息更新当前节点的本地模型；以及

直至完成当前轮全部节点更新训练，判断各节点对应的本地模型是否收敛。

为了解决上述技术问题，本申请实施例还提供一种联邦学习网络下的模型训练装置，采用了如下所述的技术方案：

一种联邦学习网络下的模型训练装置，包括：

建立模块，用于建立联邦学习网络，所述联邦学习网络包括中央客户端和多个节点，控制每个所述节点接收中央客户端下发的初始化模型，作为本地模型，每个节点分别对本地模型进行多轮更新训练；

获得模块，用于直至更新训练后各节点对应的本地模型收敛，各节点分别获得结果模型；

输出模块，用于控制所述节点接收用户数据，并输入到所述节点对应的所述结果模型中，获得所述结果模型输出的推荐信息；

所述建立模块包括训练子模块、生成子模块、调整子模块和判断子模块；

其中，所述训练子模块，用于在每轮更新训练中，控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息，并将所述梯度信息发送至所述中央客户端；

所述生成子模块，用于在每轮更新训练中，控制所述中央客户端接收并根据所述梯度信息生成全局信息，将所述全局信息发送至各节点；

所述调整子模块，用于在每轮更新训练中，控制当前节点接收并根据所述全局信息获得其他节点的梯度信息，分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率，根据所述准确率调整每个节点的梯度信息在全局信息中的权重，获得调整后的全局信息，并使用所述调整后的全局信息更新当前节点的本地模型；以及

所述判断子模块，用于直至完成当前轮全部节点更新训练，判断各节点对应的本地模型是否收敛。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，采用了如下所述的技术方案：

一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如下所述的联邦学习网络下的模型训练方法的步骤：

其中，在每轮更新训练中，所述更新训练的过程包括：

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如下所述的联邦学习网络下的模型训练方法的步骤：

其中，在每轮更新训练中，所述更新训练的过程包括：

与现有技术相比，本申请实施例主要有以下有益效果：

各参与者将获得在更新过程中，能够通过准确率找到与自身数据质量比较相近的其他参与者，最终不同的节点通过个性化训练获得不同的模型；由于通过联邦学习可以达到扩充数据规模的效果，所以本申请在Non-IID(非独立同分布)数据上的效果比较好。当有一些节点使用无意义或者低质量的数据恶意参与模型训练时，通过准确率的计算，及时有效将其辨别出来，并通过降低其影响权重的方法，减少对本地模型的影响，同时提升模型的鲁棒性。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的联邦学习网络下的模型训练方法的一个实施例的流程图；

图3是根据本申请的联邦学习网络下的模型训练装置的一个实施例的结构示意图；

图4是根据本申请的计算机设备的一个实施例的结构示意图。

附图标记：200、计算机设备；201、存储器；202、处理器；203、网络接口；300、联邦学习网络下的模型训练装置；301、建立模块；302、获得模块；303、输出模块；3011、训练子模块；3012、生成子模块；3013、调整子模块；3014、判断子模块。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示，系统架构100可以包括终端设备(101、102、103)，网络104和服务器105。网络104用以在终端设备(101、102、103)和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备(101、102、103)通过网络104与服务器105交互，以接收或发送消息等。终端设备(101、102、103)上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备(101、102、103)可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备(101、102、103)上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的联邦学习网络下的模型训练方法一般由服务器/终端设备执行，相应地，联邦学习网络下的模型训练装置一般设置于服务器/终端设备中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的联邦学习网络下的模型训练方法的一个实施例的流程图。所述的联邦学习网络下的模型训练方法，包括以下步骤：

S1：建立联邦学习网络，所述联邦学习网络包括中央客户端和多个节点，控制每个所述节点接收中央客户端下发的初始化模型，作为本地模型。

在本实施例中，每个节点分别对本地模型进行多轮更新训练。节点即为联邦学习的参与者，中央客户端初始化模型并下发，各参与者利用本地数据(batch size，一次训练所抓取的数据样本数量)进行训练，获得梯度信息，并将梯度信息发回中央客户端。所有节点的梯度信息为：

在为用户提供个性化服务的场景中，主要涉及推荐产品或者服务。智能推荐涉及到的数据特征主要包括用户购买力，用户个人喜好和产品特征。在实际应用中，三个数据特征分散在三个不同的企业中。例如，用户的购买力数据存储于银行，用户个人喜好数据存储于社交网络平台，产品特征数据存储于电子商店平台。中央客户端将初始化模型分别发送给作为节点的银行、社交网络平台和电子商店平台。

在本实施例中，联邦学习网络下的模型训练方法运行于其上的电子设备(例如图1所示的服务器/终端设备)可以通过有线连接方式或者无线连接方式接收初始化模型。需要指出的是，上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultrawideband)连接、以及其他现在已知或将来开发的无线连接方式。

S2：控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息，并将所述梯度信息发送至所述中央客户端。

在本实施例中，在每轮更新训练中，控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，通过本地数据训练获得梯度信息，再将梯度信息发送至中央客户端，避免了直接传输本地数据造成的隐私泄露。银行、社交网络平台和电子商店平台分别使用本地存储的包括用户购买力，用户个人喜好和产品特征等数据对本地模型进行训练，获得梯度信息(即模型参数)。

其中，所述本地数据由训练数据和验证集数据组成，在步骤S2中，即所述控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息的步骤包括：

控制每个所述节点使用训练数据对所述本地模型进行训练，获得每个节点的梯度信息。

在本实施例中，本地数据包括训练数据和验证集；本地数据中的70％作为训练数据，30％作为验证集数据。或者本地数据中的80％作为训练数据，20％作为验证集数据。通过训练数据对本地模型进行训练，通过验证集对本地模型进行测试。

S3：控制所述中央客户端接收并根据所述梯度信息生成全局信息，将所述全局信息发送至各节点。

在本实施例中，中央客户端收到所有节点发送的梯度信息后，将全局信息

发回至各节点。所有节点将拥有本轮训练的迭代更新信息；全局信息相当于把所有节点发送来的梯度信息放在一起后传输给各节点。把银行、社交网络平台和电子商店平台传输至中央客户端的梯度信息统一生成全局信息，将全局信息分别发送给银行、社交网络平台和电子商店平台。

其中，在步骤S2中，即所述将所述梯度信息发送至所述中央客户端的步骤包括：

将所述梯度信息使用所述中央客户端预先传输的公钥进行加密；

将所述加密后的梯度信息发送至所述中央客户端；

在步骤S3中，即所述控制所述中央客户端接收并根据所述梯度信息生成全局信息的步骤包括：

控制所述中央客户端解密所述加密后的梯度信息，获得梯度信息；

根据所述梯度信息生成全局信息。

在本实施例中，通过在传输过程中设置加密的方式，以保护数据传输的安全性.中央客户端通过使用与公钥对应的私钥解密加密后的梯度信息,获得梯度信息。其中，传输给每个节点的公钥不同，避免某一个节点的公钥被破解，导致其他节点的信息也遭到泄露。

S4：控制当前节点接收并根据所述全局信息获得其他节点的梯度信息，分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率，根据所述准确率调整接收到的全局信息，获得调整后的全局信息，并使用所述调整后的全局信息更新当前节点的本地模型。

在本实施例中，通过更新本地模型，作为当前节点的一次训练完成。以银行节点来举例，分别使用社交网络平台和电子商店平台的梯度信息对银行节点的本地模型进行测试，获得对应的准确率。

将所述梯度信息使用所述中央客户端预先传输的对称密钥进行加密；

将所述加密后的梯度信息发送至所述中央客户端；

在步骤S4中，即控制当前节点接收并根据所述全局信息获得其他节点的梯度信息的步骤包括:

控制当前节点接收所述全局信息；

根据所述全局信息获得加密后的梯度信息；

使用对称密钥解密所述加密后的梯度信息，获得梯度信息。

在本实施例中，各节点接收的对称密钥是一样的。中央客户端不对梯度信息进行解密，而是由接收全局信息的节点对梯度信息进行解密，在增加数据传输安全性的同时，减小了中央客户端的负担。

其中，所述本地数据由训练数据和验证集数据组成，在步骤S4中，即所述分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率的步骤包括：

分别使用每个节点的梯度信息和验证集对当前节点的本地模型进行测试，获得准确率。

在本实施例中，分别使用每个节点的梯度信息和验证集对当前节点的本地模型进行测试，以获得各个节点的梯度信息，在当前节点对应的模型中的准确率。例如：当前节点为银行，全局信息中包括有银行、社交网络平台和电子商店平台的梯度信息；分别使用银行的梯度信息和本地验证集数据、社交网络平台的梯度信息和本地验证集数据、电子商店平台的梯度信息和本地验证集数据来测试本地模型，分别获得银行、社交网络平台和电子商店平台的准确率。具体的：验证集数据本身携带有标签，通过将模型的输出结果与标签做比较，获得各节点的梯度信息的准确率。银行中的用户购买力数据一部分作为训练数据，一部分作为验证集数据，用户购买力数据的标签包括购买力高、购买力中和购买力低，通过将银行、社交网络平台和电子商店平台的梯度信息和验证集数据输入至本地模型中，通过本地模型输出购买力的预测结果，与购买力数据标签进行比较，从而确定各节点的梯度信息的准确率。

当然本申请不限于上述场景中，还可以应用于监管等场景，在其中，比如，若本地数据为与违约相关的数据，则验证集数据携带的标签为实际是否违约的结果(违约或未违约)，通过将上述各节点的梯度信息和本地验证集数据输入本地模型中，通过本地模型输出的预测结果(违约或未违约)与实际违约结果之间的一致的数量，从而实现确定各节点的梯度信息的准确率。

进一步地，在步骤S4中，即根据所述准确率调整接收到的全局信息，获得调整后的全局信息的步骤包括：

根据所述准确率获得每个节点的梯度信息在全局信息中的权重；

将所述权重和梯度信息进行加权求和，获得调整后的全局信息。

在本实施例中，根据准确率调整梯度信息在全局信息中的权重，从而实现排除恶意参与模型训练的无意义或者低质量的数据。通过准确率调整权重，使得不真实或不合格数据自然会被过滤掉，只有提供有价值数据的节点才能从具有相似分布的群体中获益。根据获得的银行、社交网络平台和电子商店平台的梯度信息的准确率，调整梯度信息在全局信息中的权重，从而获得调整后的全局信息，用调整后的全局信息更新银行的本地模型。获得全局信息调整后的本地模型，实现了通过分别来自银行、社交网络平台和电子商店平台的用户购买力，用户个人喜好和产品特征数据进行训练。

其中，根据所述准确率获得每个节点的梯度信息在全局信息中的权重的步骤包括:

根据所述准确率计算准确率中间值，其中，所述准确率中间值为各准确率的中位数；

通过如下公式计算各节点的梯度信息的权重：

其中，

为各节点的梯度信息的权重，

为上一轮的各节点梯度信息的权重，η为学习率，

为各节点的准确率，

为准确率中间值。

在本实施例中，η为学习率(learning rate)，通过调整学习率从而调整模型的更新速度，η的数值越大，模型的更新速度越快，在实际使用过程中，η的具体数值可以根据实际情况进行调整。计算准确率中位数作为准确率中间值，根据公式分别计算银行、社交网络平台和电子商店平台的梯度信息的权重，根据权重结果和梯度信息生成新的全局信息，使用新的全局信息更新本地模型。其中，

为本轮各节点的梯度信息的权重，

为上一轮的各节点梯度信息的权重。

需要说明的是，当本轮为第一轮时，本轮各节点的梯度信息的权重的计算公式为：

i为各节点，t为本轮，t-1为上一轮。

S5：直至完成当前轮全部节点更新训练，判断各节点对应的本地模型是否收敛。

在本实施例中，在当前轮(第t轮)的所有节点的更新训练完成后，判断各节点对应的本地模型是否收敛，以确定模型训练是否完成,避免模型未收敛而结束训练,引起后续使用模型时输出结果不准确的情况。当银行、社交网络平台节点和电子商店平台都完成本轮的更新训练后,判断银行、社交网络平台节点和电子商店平台的本地模型是否收敛.

S6：直至更新训练后各节点对应的本地模型收敛，各节点分别获得结果模型。

在本实施例中，确定更新后的各节点的本地模型是否收敛，若收敛，则结束模型训练过程，分别获得各节点的结果模型，若未收敛，则继续进行迭代训练,以实现获得收敛后的模型,使得模型使用的效果好。直到银行、社交网络平台和电子商店平台的本地模型都收敛,则可以实现通过使用结果模型对用户进行个性化推荐，其中，银行、社交网络平台和电子商店平台对应的结果模型可能相同也可能不同，结果模型是否相同，由各节点提供的训练数据的情况和每轮迭代时不同节点的梯度信息对应的准确率决定。

在本实施例中，所有节点同时重复步骤S2至S4，直至所有节点全部更新完毕，进入下一轮迭代，直至各本地模型收敛。

S7:控制所述节点接收用户数据，并输入到所述节点对应的所述结果模型中，获得所述结果模型输出的推荐信息。

在本实施例中，通过涉及用户购买力，用户个人喜好和产品特征等不同维度的数据，训练得到结果模型，将用户数据输入结果模型中及能够获得针对性和准确率都较高的推荐信息，通过使用结果模型输出推荐信息，在保证模型训练过程中不同节点对应的本地数据的隐私性的同时，提升了推荐信息的准确性。本申请的训练方式和获得的结果模型，可以应用于个性化推荐信息场景中，通过将接受到的用户数据输入结果模型，获得结果模型输出的推荐信息。当然，也可以应用于政务，管理，医疗等领域，具体的，在医院场景中，通过不同节点提供的患者的不同维度的数据训练本地模型，获得结果模型，将医院的患者数据输入结果模型中，获得结果模型输出的诊断信息。

需要强调的是，为进一步保证上述梯度信息的私密和安全性，上述梯度信息还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Block chain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

本申请属于人工智能技术领域，在机器学习、深度学习中均具有较好的表现。此外，本申请也可应用于数字医疗的疾病风险评估、精准医疗和智慧医疗等技术中。本申请还可应用于智慧社区领域中，从而推动智慧城市的建设。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，该计算机可读指令可存储于一计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图3，作为对上述图2所示方法的实现，本申请提供了一种联邦学习网络下的模型训练装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，本实施例所述的联邦学习网络下的模型训练装置300包括：建立模块301、获得模块302和输出模块303，所述建立模块301包括训练子模块3011、生成子模块3012、调整子模块3013和判断子模块3014。其中：建立模块301，用于建立联邦学习网络，所述联邦学习网络包括中央客户端和多个节点，控制每个所述节点接收中央客户端下发的初始化模型，作为本地模型；训练子模块3011，用于在每轮更新训练中，控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息，并将所述梯度信息发送至所述中央客户端；生成子模块3012，用于在每轮更新训练中，控制所述中央客户端接收并根据所述梯度信息生成全局信息，将所述全局信息发送至各节点；调整子模块3013，用于在每轮更新训练中，控制当前节点接收并根据所述全局信息获得其他节点的梯度信息，分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率，根据所述准确率调整每个节点的梯度信息在全局信息中的权重，获得调整后的全局信息，并使用所述调整后的全局信息更新当前节点的本地模型。所述判断子模块3014，用于直至完成当前轮全部节点更新训练，判断各节点对应的本地模型是否收敛；获得模块302，用于直至更新训练后各节点对应的本地模型收敛，各节点分别获得结果模型；输出模块303，用于控制所述节点接收用户数据，并输入到所述节点对应的所述结果模型中，获得所述结果模型输出的推荐信息；。

在本实施例中，各参与者将获得在更新过程中，能够通过准确率找到与自身数据质量比较相近的其他参与者，最终不同的节点通过个性化训练获得不同的模型；由于通过联邦学习可以达到扩充数据规模的效果，所以本申请在Non-IID(非独立同分布)数据上的效果比较好。当有一些节点使用无意义或者低质量的数据恶意参与模型训练时，通过准确率的计算，及时有效将其辨别出来，并通过降低其影响权重的方法，减少对本地模型的影响，同时提升模型的鲁棒性。

在本实施例的一些可选的实现方式中，所述本地数据由训练数据和验证集数据组成，上述训练子模块3011进一步用于：控制每个所述节点使用训练数据对所述本地模型进行训练，获得每个节点的梯度信息。

所述训练子模块3011包括第一加密单元和第一传输单元，所述第一加密单元用于将所述梯度信息使用所述中央客户端预先传输的公钥进行加密。所述第一传输单元用于将所述加密后的梯度信息发送至所述中央客户端。所述生成子模块3012包括解密单元和生成单元，所述解密单元用于控制所述中央客户端解密所述加密后的梯度信息，获得梯度信息；所述生成单元用于根据所述梯度信息生成全局信息。

所述训练子模块3011还包括第二加密单元和第二传输单元，所述第二加密单元用于将所述梯度信息使用所述中央客户端预先传输的对称密钥进行加密；所述第二传输单元用于将所述加密后的梯度信息发送至所述中央客户端；所述调整子模块3013包括接收单元、第一获取单元和第二获取单元，所述接收单元用于控制当前节点接收所述全局信息；所述第一获取单元用于根据所述全局信息获得加密后的梯度信息；所述第二获取单元用于使用对称密钥解密所述加密后的梯度信息，获得梯度信息。

在本实施例的一些可选的实现方式中，所述本地数据由训练数据和验证集数据组成，所述调整子模块3013还用于分别使用每个节点的梯度信息和验证集对当前节点的本地模型进行测试，获得准确率。

所述调整子模块3013还包括第三获取单元和加权单元。所述第三获取单元用于根据所述准确率获得每个节点的梯度信息在全局信息中的权重；所述加权单元用于将所述权重和梯度信息进行加权求和，获得调整后的全局信息。

所述第三获取单元包括第一计算子单元和第二子计算单元，所述第一计算子单元用于根据所述准确率计算准确率中间值，其中，所述准确率中间值为各准确率的中位数。所述第二计算子单元用于通过如下公式计算各节点的梯度信息的权重：

其中，

为各节点的梯度信息的权重，

为上一轮的各节点梯度信息的权重，η为学习率，

为各节点的准确率，

为准确率中间值。。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图4，图4为本实施例计算机设备基本结构框图。

所述计算机设备200包括通过系统总线相互通信连接存储器201、处理器202、网络接口203。需要指出的是，图中仅示出了具有组件201-203的计算机设备200，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器201至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。所述计算机可读存储介质可以是非易失性，也可以是易失性。在一些实施例中，所述存储器201可以是所述计算机设备200的内部存储单元，例如该计算机设备200的硬盘或内存。在另一些实施例中，所述存储器201也可以是所述计算机设备200的外部存储设备，例如该计算机设备200上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器201还可以既包括所述计算机设备200的内部存储单元也包括其外部存储设备。本实施例中，所述存储器201通常用于存储安装于所述计算机设备200的操作系统和各类应用软件，例如联邦学习网络下的模型训练方法的计算机可读指令等。此外，所述存储器201还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器202在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器202通常用于控制所述计算机设备200的总体操作。本实施例中，所述处理器202用于运行所述存储器201中存储的计算机可读指令或者处理数据，例如运行所述联邦学习网络下的模型训练方法的计算机可读指令。

所述网络接口203可包括无线网络接口或有线网络接口，该网络接口203通常用于在所述计算机设备200与其他电子设备之间建立通信连接。

在本实施例中，不同的节点通过个性化训练获得不同的模型，降低无意义数据对模型训练的影响，本申请提供的计算机设备执行如上述的联邦学习网络下的模型训练方法的步骤时，具有与上述方法实施例提供的联邦学习网络下的模型训练方法相应的有益效果。

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如上述的联邦学习网络下的模型训练方法的步骤。

在本实施例中，不同的节点通过个性化训练获得不同的模型，降低无意义数据对模型训练的影响，本申请提供的计算机可读存储介质中存储的计算机可读指令被执行时执行如上述的联邦学习网络下的模型训练方法的步骤，具有与上述方法实施例提供的联邦学习网络下的模型训练方法相应的有益效果。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

一种联邦学习网络下的模型训练方法，包括下述步骤：

建立联邦学习网络，所述联邦学习网络包括中央客户端和多个节点，控制每个所述节点接收中央客户端下发的初始化模型，作为本地模型，每个节点分别对本地模型进行多轮更新训练；

直至更新训练后各节点对应的本地模型收敛，各节点分别获得结果模型；

控制所述节点接收用户数据，并输入到所述节点对应的所述结果模型中，获得所述结果模型输出的推荐信息；

其中，在每轮更新训练中，所述更新训练的过程包括：

控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息，并将所述梯度信息发送至所述中央客户端；

控制所述中央客户端接收并根据所述梯度信息生成全局信息，将所述全局信息发送至各节点；

控制当前节点接收并根据所述全局信息获得其他节点的梯度信息，分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率，根据所述准确率调整接收到的全局信息，获得调整后的全局信息，并使用所述调整后的全局信息更新当前节点的本地模型；以及

直至完成当前轮全部节点更新训练，判断各节点对应的本地模型是否收敛。
根据权利要求1所述的联邦学习网络下的模型训练方法，其中，根据所述准确率调整接收到的全局信息，获得调整后的全局信息的步骤包括：

根据所述准确率获得每个节点的梯度信息在全局信息中的权重；

将所述权重和梯度信息进行加权求和，获得调整后的全局信息。
根据权利要求2所述的联邦学习网络下的模型训练方法，其中，根据所述准确率获得每个节点的梯度信息在全局信息中的权重的步骤包括:

根据所述准确率计算准确率中间值，其中，所述准确率中间值为各准确率的中位数；

通过如下公式计算各节点的梯度信息的权重：

其中，
为各节点的梯度信息的权重，
为上一轮的各节点梯度信息的权重，η为学习率，
为各节点的准确率，
为准确率中间值。
根据权利要求1所述的联邦学习网络下的模型训练方法，其中，所述本地数据由训练数据和验证集数据组成，所述分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率的步骤包括：

分别使用每个节点的梯度信息和验证集对当前节点的本地模型进行测试，获得准确率。
根据权利要求1所述的联邦学习网络下的模型训练方法，其中，所述本地数据由训练数据和验证集数据组成，所述控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息的步骤包括：

控制每个所述节点使用训练数据对所述本地模型进行训练，获得每个节点的梯度信息。
根据权利要求1至5任意一项所述的联邦学习网络下的模型训练方法，其中，所述将所述梯度信息发送至所述中央客户端的步骤包括：

将所述梯度信息使用所述中央客户端预先传输的公钥进行加密；

将所述加密后的梯度信息发送至所述中央客户端；

所述控制所述中央客户端接收并根据所述梯度信息生成全局信息的步骤包括:

控制所述中央客户端解密所述加密后的梯度信息，获得梯度信息；

根据所述梯度信息生成全局信息。
根据权利要求1至5任意一项所述的联邦学习网络下的模型训练方法，其中，所述将所述梯度信息发送至所述中央客户端的步骤包括：

将所述梯度信息使用所述中央客户端预先传输的对称密钥进行加密；

将所述加密后的梯度信息发送至所述中央客户端；

所述控制当前节点接收并根据所述全局信息获得其他节点的梯度信息的步骤包括:

控制当前节点接收所述全局信息；

根据所述全局信息获得加密后的梯度信息；

使用对称密钥解密所述加密后的梯度信息，获得梯度信息。
一种联邦学习网络下的模型训练装置，包括：

建立模块，用于建立联邦学习网络，所述联邦学习网络包括中央客户端和多个节点，控制每个所述节点接收中央客户端下发的初始化模型，作为本地模型，每个节点分别对本地模型进行多轮更新训练；

获得模块，用于直至更新训练后各节点对应的本地模型收敛，各节点分别获得结果模型；

输出模块，用于控制所述节点接收用户数据，并输入到所述节点对应的所述结果模型中，获得所述结果模型输出的推荐信息；

所述建立模块包括训练子模块、生成子模块、调整子模块和判断子模块；

其中，所述训练子模块，用于在每轮更新训练中，控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息，并将所述梯度信息发送至所述中央客户端；

所述生成子模块，用于在每轮更新训练中，控制所述中央客户端接收并根据所述梯度信息生成全局信息，将所述全局信息发送至各节点；

所述调整子模块，用于在每轮更新训练中，控制当前节点接收并根据所述全局信息获得其他节点的梯度信息，分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率，根据所述准确率调整每个节点的梯度信息在全局信息中的权重，获得调整后的全局信息，并使用所述调整后的全局信息更新当前节点的本地模型；以及

所述判断子模块，用于直至完成当前轮全部节点更新训练，判断各节点对应的本地模型是否收敛。
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如下所述的联邦学习网络下的模型训练方法的步骤：

建立联邦学习网络，所述联邦学习网络包括中央客户端和多个节点，控制每个所述节点接收中央客户端下发的初始化模型，作为本地模型，每个节点分别对本地模型进行多轮更新训练；

直至更新训练后各节点对应的本地模型收敛，各节点分别获得结果模型；

控制所述节点接收用户数据，并输入到所述节点对应的所述结果模型中，获得所述结果模型输出的推荐信息；

其中，在每轮更新训练中，所述更新训练的过程包括：

控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息，并将所述梯度信息发送至所述中央客户端；

控制所述中央客户端接收并根据所述梯度信息生成全局信息，将所述全局信息发送至各节点；

控制当前节点接收并根据所述全局信息获得其他节点的梯度信息，分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率，根据所述准确率调整接收到的全局信息，获得调整后的全局信息，并使用所述调整后的全局信息更新当前节点的本地模型；以及

直至完成当前轮全部节点更新训练，判断各节点对应的本地模型是否收敛。
根据权利要求9所述的计算机设备，其中，根据所述准确率调整接收到的全局信息，获得调整后的全局信息的步骤包括：

根据所述准确率获得每个节点的梯度信息在全局信息中的权重；

将所述权重和梯度信息进行加权求和，获得调整后的全局信息。
根据权利要求10所述的计算机设备，其中，根据所述准确率获得每个节点的梯度信息在全局信息中的权重的步骤包括:

根据所述准确率计算准确率中间值，其中，所述准确率中间值为各准确率的中位数；

通过如下公式计算各节点的梯度信息的权重：

其中，
为各节点的梯度信息的权重，
为上一轮的各节点梯度信息的权重，η为学习率，
为各节点的准确率，
为准确率中间值。
根据权利要求9所述的计算机设备，其中，所述本地数据由训练数据和验证集数据组成，所述分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率的步骤包括：

分别使用每个节点的梯度信息和验证集对当前节点的本地模型进行测试，获得准确率。
根据权利要求9所述的计算机设备，其中，所述本地数据由训练数据和验证集数据组成，所述控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息的步骤包括：

控制每个所述节点使用训练数据对所述本地模型进行训练，获得每个节点的梯度信息。
根据权利要求9至13任意一项所述的计算机设备，其中，所述将所述梯度信息发送至所述中央客户端的步骤包括：

将所述梯度信息使用所述中央客户端预先传输的公钥进行加密；

将所述加密后的梯度信息发送至所述中央客户端；

所述控制所述中央客户端接收并根据所述梯度信息生成全局信息的步骤包括:

控制所述中央客户端解密所述加密后的梯度信息，获得梯度信息；

根据所述梯度信息生成全局信息。
根据权利要求9至13任意一项所述的计算机设备，其中，所述将所述梯度信息发送至所述中央客户端的步骤包括：

将所述梯度信息使用所述中央客户端预先传输的对称密钥进行加密；

将所述加密后的梯度信息发送至所述中央客户端；

所述控制当前节点接收并根据所述全局信息获得其他节点的梯度信息的步骤包括:

控制当前节点接收所述全局信息；

根据所述全局信息获得加密后的梯度信息；

使用对称密钥解密所述加密后的梯度信息，获得梯度信息。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如下所述的联邦学习网络下的模型训练方法的步骤：

建立联邦学习网络，所述联邦学习网络包括中央客户端和多个节点，控制每个所述节点接收中央客户端下发的初始化模型，作为本地模型，每个节点分别对本地模型进行多轮更新训练；

直至更新训练后各节点对应的本地模型收敛，各节点分别获得结果模型；

控制所述节点接收用户数据，并输入到所述节点对应的所述结果模型中，获得所述结果模型输出的推荐信息；

其中，在每轮更新训练中，所述更新训练的过程包括：

控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息，并将所述梯度信息发送至所述中央客户端；

控制所述中央客户端接收并根据所述梯度信息生成全局信息，将所述全局信息发送至各节点；

控制当前节点接收并根据所述全局信息获得其他节点的梯度信息，分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率，根据所述准确率调整接收到的全局信息，获得调整后的全局信息，并使用所述调整后的全局信息更新当前节点的本地模型；以及

直至完成当前轮全部节点更新训练，判断各节点对应的本地模型是否收敛。
根据权利要求16所述的计算机可读存储介质，其中，根据所述准确率调整接收到的全局信息，获得调整后的全局信息的步骤包括：

根据所述准确率获得每个节点的梯度信息在全局信息中的权重；

将所述权重和梯度信息进行加权求和，获得调整后的全局信息。
根据权利要求17所述的计算机可读存储介质，其中，根据所述准确率获得每个节点的梯度信息在全局信息中的权重的步骤包括:

根据所述准确率计算准确率中间值，其中，所述准确率中间值为各准确率的中位数；

通过如下公式计算各节点的梯度信息的权重：

其中，
为各节点的梯度信息的权重，
为上一轮的各节点梯度信息的权重，η为学习率，
为各节点的准确率，
为准确率中间值。
根据权利要求16所述的计算机可读存储介质，其中，所述本地数据由训练数据和验证集数据组成，所述分别使用每个节点的梯度信息对当前节点的本地模型进行测试，获得准确率的步骤包括：

分别使用每个节点的梯度信息和验证集对当前节点的本地模型进行测试，获得准确率。
根据权利要求16所述的计算机可读存储介质，其中，所述本地数据由训练数据和验证集数据组成，所述控制每个所述节点使用节点对应的本地数据对所述本地模型进行训练，获得每个节点的梯度信息的步骤包括：

控制每个所述节点使用训练数据对所述本地模型进行训练，获得每个节点的梯度信息。