CN110276210A

CN110276210A - 基于联邦学习的模型参数的确定方法及装置

Info

Publication number: CN110276210A
Application number: CN201910507242.2A
Authority: CN
Inventors: 范涛; 陈天健; 杨强
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2019-06-12
Filing date: 2019-06-12
Publication date: 2019-09-24
Anticipated expiration: 2039-06-12
Also published as: WO2020248537A1; CN110276210B

Abstract

本申请公开了一种基于联邦学习的模型参数的确定方法及装置。该方法中第二终端接收第一终端发送的第一加密数据，第一加密数据为第一终端根据预设加密算法对标签数据进行加密后得到的；根据第一加密数据、样本特征数据和样本特征数据的当前特征参数，采用预设算法，获取包括加密梯度值和加密损失值的第二加密数据，接收第一终端根据第二加密数据发送的第一梯度值和第一损失值；根据第一梯度值和样本特征数据的当前特征参数，采用预设特征参数算法，获取第一特征参数；若根据第一损失值，检测出第一特征参数处于收敛状态，则将第一特征参数确定为待训练的样本模型的模型参数。该方法不需要第三方的协作者，提高了训练效率。

Description

基于联邦学习的模型参数的确定方法及装置

技术领域

本申请涉及数据处理技术领域，尤其涉及一种基于联邦学习的模型参数的确定方法及装置。

背景技术

在人工智能领域，传统的数据处理模式往往是一方收集数据，再转移到另一方进行处理、清洗并建模，最后把模型卖给第三方。但随着法规完善和监控愈加严格，如果数据离开收集方或者用户不清楚模型的具体用途，运营者可能会触犯法律。数据是以孤岛的形式存在的，解决孤岛的直接方案就是把数据整合到一方进行处理。但由于法律不允许运营者粗暴地进行数据聚合，故为解决此困境，人们研究提出了“联邦学习”。

联邦学习利用技术算法加密建造的模型，联邦双方在不用给出己方数据的情况下，也可进行模型训练得到模型参数，联邦学习通过加密机制下的参数交换方式保护用户数据隐私，而数据和模型本身不会进行传输，也不能反向破解对方数据，因此在数据层面不存在泄露的可能，能够在较高程度保持数据完整性的同时，保障数据隐私。

传统的联邦学习在联邦A，B双方进行模型训练时，为了保证训练过程中数据的保密性，需要借助第三方的协作者C进行加密训练。

然而，发明人发现传统的联邦学习都需要先找寻可信的协作者C，若没有协作者C，则传统的联邦学习的使用将被限制，降低了用户体验。

发明内容

本申请实施例提供一种基于联邦学习的模型参数的确定方法及装置，解决了现有技术中传统的联邦学习的使用将被限制的问题，提高了用户体验。

第一方面，提供了一种基于联邦学习的模型参数的确定方法，该方法可以包括：

第二终端A接收第一终端B发送的第一加密数据，所述第一加密数据为所述第一终端B根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端B中任一样本的样本数据，所述标签数据是描述样本行为达到的程度的数据；

根据所述第一加密数据、所述第二终端的样本特征数据和所述样本特征数据的当前特征参数，采用预设算法，获取第二加密数据，所述第二加密数据包括加密梯度值和加密损失值，所述预设算法包括预设梯度值算法和预设损失值算法，所述样本特征数据是样本行为的特征数据；

向所述第一终端B发送所述第二加密数据；

接收所述第一终端B根据所述第二加密数据发送的第一梯度值和第一损失值；

根据所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法，获取第一特征参数；

若根据所述第一损失值，检测出所述第一特征参数处于收敛状态，则将所述第一特征参数确定为待训练的样本模型的模型参数。

在一个可选的实现中，所述方法还包括：

若根据所述第一损失值，检测出第一特征参数未处于收敛状态，则将获取的所述第一特征参数确定为新的当前特征参数；

根据所述第一加密数据、样本特征数据和所述新的当前特征参数，采用预设算法，获取新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值；

向所述第一终端B发送所述新的第二加密数据；

接收所述第一终端B根据所述新的第二加密数据发送的第二梯度值和第二损失值；

根据所述第二梯度值和所述新的当前特征参数，采用预设特征参数算法，获取第二特征参数；

若根据所述第一损失值与所述第二损失值的差值，检测所述第二特征参数处于收敛状态，则将所述第二特征参数确定为所述待训练的样本模型的模型参数。

在一个可选的实现中，根据所述第一加密数据、样本特征数据和所述样本特征数据的当前特征参数，采用预设算法，获取所述样本标识对应的第二加密数据，包括：

根据所述第一加密数据、样本特征数据、所述样本特征数据的当前特征参数和预设随机数，采用预设算法，获取第二加密数据，所述预设随机数包括所述预设梯度值算法对应的第一随机数和所述预设损失值算法对应的第二随机数；

接收所述第一终端B根据所述第二加密数据发送的第一梯度值和第一损失值之后，所述方法还包括：

根据所述预设随机数、第一梯度值和第一损失值，获取新的第一梯度值和新的第一损失值，之后执行获取第一特征参数的步骤。

在一个可选的实现中，将所述第一特征参数确定为所述待训练的样本模型的模型参数之后，所述方法还包括：

接收第一终端B发送的预测请求，所述预测请求包括样本标识U1；

根据所述样本标识对应的样本特征数据和所述样本特征数据的当前特征参数，获取所述样本标识对应的样本预测分数；

向第一终端B发送所述样本预测分数。

第二方面，提供了一种基于联邦学习的模型参数的确定方法，该方法可以包括：

第一终端B向第二终端A发送第一加密数据，所述第一加密数据为所述第一终端B根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端B中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

接收所述第二终端A根据所述第一加密数据发送的所述样本的第二加密数据，所述第二加密数据包括加密梯度和加密损失值；

采用所述预设解密算法，分别对所述加密梯度和所述加密损失值进行解密，得到第一梯度值和第一损失值，所述预设加密算法和所述预设解密算法为互逆算法；

向所述第二终端A发送所述第一梯度值和第一损失值。

在一个可选的实现中，所述方法还包括：

若所述第二终端A根据所述第一损失值，检测出第一特征参数未处于收敛状态，则第一终端B接收第二终端A发送的所述样本的新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值，所述新的第二加密数据为所述第二终端A根据所述第一加密数据、所述第二终端的样本特征数据和新的当前特征参数，采用预设算法获取的，所述新的当前特征参数为所述第二终端A根据所述第一损失值对应的所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法获取的，所述样本特征数据是样本行为的特征数据；

采用所述预设解密算法，分别对所述新的加密梯度值和所述新的加密损失值进行解密，得到第二第一终端B向第二终端A发送第一加密数据，所述第一加密数据为所述第一终端B根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端B中任一样本的样本数据；

接收所述第二终端A根据所述第一加密数据发送的第二加密数据，所述第二加密数据包括加密梯度和加密损失值；

向所述第二终端A发送所述第一梯度值和第一损失值。

在一个可选的实现中，所述方法还包括：

若所述第二终端A根据所述第一损失值，检测出第一特征参数未处于收敛状态，则接收第二终端A发送的新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值，所述新的第二加密数据为所述第二终端A根据所述第一加密数据、样本特征数据和新的当前特征参数，采用预设算法获取的，所述新的当前特征参数为所述第二终端A根据所述第一损失值对应的所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法获取的；

采用所述预设解密算法，分别对所述新的加密梯度值和所述新的加密损失值进行解密，得到第二梯度值和第二损失值；

向所述第二终端A发送所述第二梯度值和第二损失值。

在一个可选的实现中，向第二终端A发送所述第一梯度值和第一损失值之后，所述方法还包括：

向第二终端A发送预测请求，所述预测请求包括样本标识；

接收所述第二终端A发送的所述样本标识对应的样本预测分数，所述样本预测分数是第二终端A根据所述样本标识对应的样本特征数据和所述样本特征数据的当前特征参数获得的；

根据所述样本预测分数和预设测试算法，获取所述样本模型的模型分数；

若所述模型分数小于预设分数阈值，则确定所述样本模型为正常样本模型。梯度值和第二损失值；

向所述第二终端A发送所述第二梯度值和第二损失值。

第一终端B向第二终端A发送预测请求，所述预测请求包括样本标识；

接收所述第二终端A发送的所述样本标识对应的样本预测分数，所述样本预测分数是第二终端A根据所述样本标识U1对应的样本特征数据和所述样本特征数据的当前特征参数获得的；

若所述模型分数小于预设分数阈值，则确定所述样本模型为正常样本模型。

第三方面，提供了一种基于联邦学习的模型参数的确定装置，该装置可以包括：

接收单元、获取单元、发送单元和确定单元；

所述接收单元，用于接收第一终端B发送的第一加密数据，所述第一加密数据为所述第一终端B根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端B中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

所述获取单元，用于根据所述第一加密数据、所述第二终端的样本特征数据和所述样本特征数据的当前特征参数，采用预设算法，获取第二加密数据，所述第二加密数据包括加密梯度值和加密损失值，所述预设算法包括预设梯度值算法和预设损失值算法，所述样本特征数据是样本行为的特征数据；

所述发送单元，用于向所述第一终端B发送所述第二加密数据；

所述接收单元，还用于接收所述第一终端B根据所述第二加密数据发送的第一梯度值和第一损失值；

所述获取单元，还用于根据所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法，获取第一特征参数；

所述确定单元，用于若根据所述第一损失值，检测出所述第一特征参数处于收敛状态，则将所述第一特征参数确定为待训练的样本模型的模型参数。

在一个可选的实现中，所述确定单元，还用于若根据所述第一损失值，检测出第一特征参数未处于收敛状态，则将获取的所述第一特征参数确定为新的当前特征参数；

所述获取单元，还用于根据所述第一加密数据、样本特征数据和所述新的当前特征参数，采用预设算法，获取新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值；

所述发送单元，还用于向所述第一终端B发送所述新的第二加密数据；

所述接收单元，还用于接收所述第一终端B根据所述新的第二加密数据发送的第二梯度值和第二损失值；

所述获取单元，还用于根据所述第二梯度值和所述新的当前特征参数，采用预设特征参数算法，获取第二特征参数；

所述确定单元，还用于若根据所述第一损失值与所述第二损失值的差值，检测所述第二特征参数处于收敛状态，则将所述第二特征参数确定为所述待训练的样本模型的模型参数。

在一个可选的实现中，所述获取单元，还用于根据所述第一加密数据、样本特征数据、所述样本特征数据的当前特征参数和预设随机数，采用预设算法，获取所述样本的第二加密数据，所述预设随机数包括所述预设梯度值算法对应的第一随机数和所述预设损失值算法对应的第二随机数；

在一个可选的实现中，所述接收单元，还用于接收第一终端B发送的预测请求，所述预测请求包括样本标识；

所述获取单元，还用于根据所述样本标识对应的样本特征数据和所述样本特征数据的当前特征参数，获取所述样本标识对应的样本预测分数；

所述发送单元，还用于向第一终端B发送所述样本预测分数。

第四方面，提供了一种基于联邦学习的模型参数的确定装置，该装置可以包括：发送单元、接收单元和解密单元；

所述发送单元，用于向第二终端A发送第一加密数据，所述第一加密数据为所述第一终端B根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端B中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

所述接收单元，用于接收所述第二终端A根据所述第一加密数据发送的第二加密数据，所述第二加密数据包括加密梯度和加密损失值；

所述解密单元，用于采用所述预设解密算法，分别对所述加密梯度和所述加密损失值进行解密，得到第一梯度值和第一损失值，所述预设加密算法和所述预设解密算法为互逆算法；

所述发送单元，还用于向所述第二终端A发送所述第一梯度值和第一损失值。

在一个可选的实现中，所述接收单元，还用于若所述第二终端A根据所述第一损失值，检测出第一特征参数未处于收敛状态，则接收第二终端A发送的新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值，所述新的第二加密数据为所述第二终端A根据所述第一加密数据、所述第二终端的样本特征数据和新的当前特征参数，采用预设算法获取的，所述新的当前特征参数为所述第二终端A根据所述第一损失值对应的所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法获取的，所述样本特征数据是样本行为的特征数据；

所述解密单元，还用于采用所述预设解密算法，分别对所述新的加密梯度值和所述新的加密损失值进行解密，得到第二梯度值和第二损失值；

所述发送单元，还用于向所述第二终端A发送所述第二梯度值和第二损失值。

在一个可选的实现中，所述装置还包括获取单元和确定单元；

所述发送单元，还用于向第二终端A发送预测请求，所述预测请求包括样本标识；

所述接收单元，还用于接收所述第二终端A发送的所述样本标识对应的样本预测分数，所述样本预测分数是第二终端A根据所述样本标识对应的样本特征数据和所述样本特征数据的当前特征参数获得的；

所述获取单元，用于根据所述样本预测分数和预设测试算法，获取所述样本模型的模型分数；

所述确定单元，用于若所述模型分数小于预设分数阈值，则确定所述样本模型为正常样本模型。

第五方面，提供了一种终端，该终端包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述第一方面中任一所述的方法步骤或上述第二方面中任一项上所述的方法步骤。

第六方面，提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤或上述第二方面中任一所述的方法步骤。

本发明上述实施例提供的方法中第二终端A接收第一终端B发送的第一加密数据，第一加密数据为所述第一终端B根据预设加密算法对标签数据进行加密后得到的；标签数据为第一终端B中任一样本的样本数据；根据第一加密数据、样本特征数据和所述第二终端的样本特征数据的当前特征参数，采用预设算法，获取第二加密数据，第二加密数据包括加密梯度值和加密损失值，预设算法包括预设梯度值算法和预设损失值算法；向第一终端B发送第二加密数据；接收第一终端B根据第二加密数据发送的第一梯度值和第一损失值；根据第一梯度值和样本特征数据的当前特征参数，采用预设特征参数算法，获取第一特征参数；若根据第一损失值，检测出第一特征参数处于收敛状态，则将第一特征参数确定为待训练的样本模型的模型参数。与现有技术相比，该方法在不需要第三方的协作者C，以及第一终端与第二终端不存在重叠特征数据的情况下，实现了模型参数的确定，有效的保护了自身的隐私数据，提高了训练效率。

附图说明

图1为本发明实施例提供的一种基于联邦学习的模型参数的确定方法应用的场景构架示意图；

图2为本发明实施例提供的一种基于联邦学习的模型参数确定方法的流程示意图；

图3为本发明实施例提供的一种基于联邦学习的模型参数的确定装置的结构示意图；

图4为本发明实施例提供的另一种基于联邦学习的模型参数的确定装置的结构示意图；

图5为本发明实施例提供的一种终端的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，并不是全部的实施例。基于本申请实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本发明实施例提供的基于联邦学习的模型参数的确定方法可以应用在图1所示的场景构架中，该场景构架可以包括至少一个终端，每个终端为一个数据拥有方。至少一个终端间通过联邦学习系统建立模型，训练模型参数。

终端可以是移动电话、智能电话、笔记本电脑、数字广播接收器、个人数字助理(PDA)、平板电脑(PAD)等用户设备(User Equipment，UE)、手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备、移动台(Mobile station，MS)等。

其中，每个数据拥有方各自所持有的数据集，其可以用一个矩阵来表示。矩阵的每一行代表一个样本，每一列代表一种样本的特征。同时，某些数据集可能还包含标签数据。如果要对用户行为建立预测模型，就必须要有标签数据。设样本的特征数据为X，样本的标签数据为Y。例如，在金融领域，标签数据Y是用户的信用；在营销领域，标签数据Y是用户的购买愿望；在教育领域，标签数据Y是学生掌握知识的程度。标签数据是描述样本行为达到的程度的数据，样本特征数据是样本行为的特征数据；

以包含两个数据拥有方，A方和B方的场景为例，假设A方和B方想联合训练一个机器学习模型，它们的业务系统分别拥有各自用户的相关数据。

本申请通过加密的样本对齐技术，获取A方和B方存在的共有样本，其中，A方的样本数据中仅拥有样本特征数据X，B方的样本数据中仅拥有模型需要预测的标签数据Y。为了数据隐私和安全考虑，A方和B方无法直接进行数据交换。此时，可使用联邦学习系统建立模型，并训练模型参数。

A方持有的数据集可以如表1所示，B方持有的数据集可以如表2所示。

表1

样本标识	特征数据X1	特征数据X2	特征数据X3
				U1	9	8000	A
U2	4	5000	C
				U3	2	3500	C
U4	10	10000	A

表1中，A方包括样本标识为U1-U4的样本，每种样本包括三个特征数据。其中，样本标识U1对应的X1的当前特征参数为9、X2的当前特征参数为8000和X3的当前特征参数为A；样本标识U2对应的X1的当前特征参数为4、X2的当前特征参数为5000和X3的当前特征参数为C；样本标识U3对应的X1的当前特征参数为2、X2的当前特征参数为3500和X3的当前特征参数为C；样本标识U4对应的X1的当前特征参数为10、X2的当前特征参数为10000和X3的当前特征参数为A。

表2

样本标识	标签数据Y
		U1	0
U2	1
		U3	1
U4	0

表2中，B方包括样本标识为U1-U4的样本，每种样本仅包括标签数据。其中，样本标识U1对应的标签数据Y为0；样本标识U2对应的标签数据Y1；样本标识U3对应的标签数据Y为1；样本标识U4对应的标签数据Y为0。

下面以A方为第二终端A，B方为第一终端B为例进行模型参数确定。

图2为本发明实施例提供的一种基于联邦学习的模型参数确定方法的流程示意图。如图2所示，该方法可以包括：

步骤210、第一终端B向第二终端A发送第一加密数据。

在执行该步骤之前，第一终端B生成加密的公钥和私钥，并采用预设加密算法对标签数据中的标签数据进行加密，即使用公钥对标签数据中的标签数据进行加密，得到第一加密数据。其中，标签数据为第一终端B中任一样本的样本数据，如标签数据为样本标识U1对应的样本数据或标签数据为样本标识U2对应的样本数据。其中，预设加密算法可以是同态加密算法。

若标签数据为y，第一加密数据可以是[[Ny]]，N为非零数，如N＝1时，第一加密数据为[[y]]；N＝-1/2时，第一加密数据为[[-1/2y]]。

步骤220、第二终端A根据第一加密数据、第二终端的样本特征数据和样本特征数据的当前特征参数，采用预设算法，获取样本的第二加密数据。

结合表1，以样本标识U1为例，样本标识U1对应的样本特征数据分别为X1、X2和X3，样本特征数据的当前特征参数分别为9、8000、A。预设算法可以包括预设梯度值算法和预设损失值算法。

预设梯度值算法的公式可以表示为：

又可以表示为：

预设损失值算法的公式可以表示为：

其中，w为特征参数。

在第一加密数据为[[-1/2y]]时，根据第一加密数据、样本特征数据和样本特征数据的当前特征参数，采用预设算法，获取样本标识U1对应的包括加密梯度值和加密损失值的第二加密数据。

加密梯度值的公式可以表示为：

加密损失值的公式可以表示为：

可选地，为了进一步提高A方和B方间数据传输的安全性，第二终端A可以获取预设随机数，预设随机数包括预设梯度值算法对应的第一随机数r1和预设损失值算法对应的第二随机数r2。

第二终端A根据第一加密数据、样本特征数据、样本特征数据的当前特征参数和预设随机数，采用预设算法，获取包括加密梯度值和加密损失值的第二加密数据。

此时，加密梯度值的公式可以表示为：

加密损失值的公式可以表示为：

步骤230、第二终端A向第一终端B发送第二加密数据。

步骤240、第一终端B采用预设解密算法，对第二加密数据进行解密，得到第一梯度值和第一损失值。

第一终端B采用预设解密算法，分别对加密梯度和加密损失值进行解密，即采用私钥进行解密，得到第一梯度值和第一损失值。预设加密算法和预设解密算法为互逆算法，故预设解密算法可以是同态解密算法。

步骤250、第一终端B向第二终端A发送第一梯度值和第一损失值。

步骤260、第二终端A根据第一损失值对应的第一梯度值和样本特征数据的当前特征参数，采用预设特征参数算法，获取第一特征参数。

第二终端A根据第一损失值l对应的第一梯度值g和样本特征数据的当前特征参数w₀，采用预设特征参数算法，获取第一梯度值g对应的样本特征数据的第一特征参数w₁。

预设特征参数算法可以表示为：

W_n+1＝w_n-η*g；

其中，g为梯度值，W_n+1为梯度值g对应的特征参数，w_n为当前特征参数，η为预设系数。

可选地，若第二加密数据是第二终端A根据第一加密数据、样本特征数据、样本特征数据的当前特征参数w₀和预设随机数采用预设算法得到的，则第二终端A根据预设随机数、第一梯度值和第一损失值，获取新的第一梯度值和新的第一损失值。

例如，设第一随机数r1、第二随机数r2、第一梯度值g’和第一损失值l’，则新的第一梯度值l为l’/r2；新的第一损失值g为g’/r1。

之后，第二终端A根据新的第一损失值对应的新的第一梯度值和样本特征数据的当前特征参数w₀，采用预设特征参数算法，获取新的第一梯度值对应的样本特征数据的第一特征参数w₁。

步骤270、第二终端A根据第一特征参数是否处于收敛状态，确定模型参数。

第二终端A根据第一损失值，检测第一特征参数是否处于收敛状态。其中，若第一损失值小于预设损失阈值，则确定第一特征参数处于收敛状态，或者，若第一特征参数己达到最大迭代次数，则确定第一特征参数收敛。其中，用户或者运维人员可根据需要设置预设损失阈值的大小，本实施例不做限制。

若根据第一损失值，检测出第一特征参数处于收敛状态，则将第一特征参数确定为待训练的样本模型的模型参数，以使第二终端A训练样本模型。

若根据第一损失值，检测出第一特征参数未处于收敛状态，则将第一特征参数确定为新的当前特征参数；返回执行步骤260。

具体为，第二终端A根据第一加密数据、样本特征数据和新的当前特征参数w₂，采用预设算法，获取样本的新的第二加密数据，新的第二加密数据包括新的加密梯度值和新的加密损失值；

第二终端A向第一终端B发送新的第二加密数据，以使第一终端B对新的第二加密数据进行解密，得到第二梯度值和第二损失值；

之后，第二终端A接收第一终端B根据新的第二加密数据发送的第二梯度值和第二损失值；

第二终端A根据第二梯度值和新的当前特征参数w₂，采用预设特征参数算法，获取第二特征参数w₃。

根据所述第一损失值与所述第二损失值的差值，检测所述第二特征参数处于收敛状态。若第一损失值与所述第二损失值的差值小于预设损失阈值，则确定第二特征参数w₂处于收敛状态，或者，第二特征参数w₂己达到最大迭代次数，则确定第二特征参数收敛。

之后，将第二特征参数w₂确定为待训练的样本模型的模型参数，以使第二终端A训练样本模型。

可选地，为了检测训练的样本U1的样本模型的准确性，在执行该步骤之后，第一终端B可以向第二终端A发送预测请求，预测请求包括样本标识，如UI；

第二终端A根据样本标识U1，获取相应的样本特征数据和样本特征数据的当前特征参数，获取样本标识对应的样本预测分数；

第二终端A中样本U1的样本预测分数可以表示为：

之后，第二终端A向第一终端B发送样本标识对应的样本预测分数。

第一终端B接收第二终端A发送的样本预测分数，并根据样本预测分数和预设测试算法，获取样本模型的模型分数；

预设测试算法的公式可以表示为：

由于故第一终端B可以获取到样本模型的模型分数P，若模型分数P小于预设分数阈值，则确定样本模型为正常样本模型。

本发明上述实施例提供的方法中第二终端A接收第一终端B发送的第一加密数据，第一加密数据为第一终端B根据预设加密算法对标签数据进行加密后得到的；标签数据为第一终端B中任一样本的样本数据；根据第一加密数据、所述第二终端的样本特征数据和样本特征数据的当前特征参数，采用预设算法，获取第二加密数据，第二加密数据包括加密梯度值和加密损失值，预设算法包括预设梯度值算法和预设损失值算法；向第一终端B发送第二加密数据；接收第一终端B根据第二加密数据发送的第一梯度值和第一损失值；根据第一梯度值和样本特征数据的当前特征参数，采用预设特征参数算法，获取第一特征参数；若根据第一损失值，检测出第一特征参数处于收敛状态，则将第一特征参数确定为待训练的样本模型的模型参数。与现有技术相比，该方法在不需要第三方的协作者C，以及第一终端与第二终端不存在重叠特征数据的情况下，实现了模型参数的确定，有效的保护了自身的隐私数据，提高了训练效率。

与上述方法对应的，本发明实施例还提供一种基于联邦学习的模型参数的确定装置，如图3所示，该装置包括：接收单元310、获取单元320、发送单元330和确定单元340；

接收单元310，用于接收第一终端B发送的第一加密数据，所述第一加密数据为所述第一终端B根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端B中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

获取单元320，用于根据所述第一加密数据、所述第二终端的样本特征数据和所述样本特征数据的当前特征参数，采用预设算法，获取第二加密数据，所述第二加密数据包括加密梯度值和加密损失值，所述预设算法包括预设梯度值算法和预设损失值算法，所述样本特征数据是样本行为的特征数据；

发送单元330，用于向所述第一终端B发送所述第二加密数据；

接收单元310，还用于接收所述第一终端B根据所述第二加密数据发送的第一梯度值和第一损失值；

获取单元320，还用于根据所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法，获取第一特征参数；

确定单元340，用于若根据所述第一损失值，检测出所述第一特征参数处于收敛状态，则将所述第一特征参数确定为待训练的样本模型的模型参数。

在一个可选的实现中，确定单元340，还用于若根据所述第一损失值，检测出第一特征参数未处于收敛状态，则将获取的所述第一特征参数确定为新的当前特征参数；

获取单元320，还用于根据所述第一加密数据、样本特征数据和所述新的当前特征参数，采用预设算法，获取新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值；

发送单元330，还用于向所述第一终端B发送所述新的第二加密数据；

接收单元310，还用于接收所述第一终端B根据所述新的第二加密数据发送的第二梯度值和第二损失值；

获取单元320，还用于根据所述第二梯度值和所述新的当前特征参数，采用预设特征参数算法，获取第二特征参数；

确定单元340，还用于若根据所述第一损失值与所述第二损失值的差值，检测所述第二特征参数处于收敛状态，则将所述第二特征参数确定为所述待训练的样本模型的模型参数。

在一个可选的实现中，获取单元320，还用于根据所述第一加密数据、样本特征数据、所述样本特征数据的当前特征参数和预设随机数，采用预设算法，获取所述样本的第二加密数据，所述预设随机数包括所述预设梯度值算法对应的第一随机数和所述预设损失值算法对应的第二随机数；

在一个可选的实现中，接收单元310，还用于接收第一终端B发送的预测请求，所述预测请求包括样本标识；

获取单元320，还用于根据所述样本标识对应的样本特征数据和所述样本特征数据的当前特征参数，获取所述样本标识对应的样本预测分数；

发送单元330，还用于向第一终端B发送所述样本预测分数。

本发明上述实施例提供的基于联邦学习的模型参数的确定装置的各功能单元的功能，可以通过上述各方法步骤来实现，因此，本发明实施例提供的基于联邦学习的模型参数的确定装置中的各个单元的具体工作过程和有益效果，在此不复赘述。

与上述方法对应的，本发明实施例还提供一种基于联邦学习的模型参数的确定装置，如图4所示，该装置包括：发送单元410、接收单元420和解密单元430；

发送单元410，用于向第二终端A发送第一加密数据，所述第一加密数据为所述第一终端B根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端B中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

接收单元420，用于接收所述第二终端A根据所述第一加密数据发送的第二加密数据，所述第二加密数据包括加密梯度和加密损失值；

解密单元430，用于采用所述预设解密算法，分别对所述加密梯度和所述加密损失值进行解密，得到第一梯度值和第一损失值，所述预设加密算法和所述预设解密算法为互逆算法；

发送单元410，还用于向所述第二终端A发送所述第一梯度值和第一损失值。

在一个可选的实现中，接收单元420，还用于若所述第二终端A根据所述第一损失值，检测出第一特征参数未处于收敛状态，则接收第二终端A发送的新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值，所述新的第二加密数据为所述第二终端A根据所述第一加密数据、所述第二终端的样本特征数据和新的当前特征参数，采用预设算法获取的，所述新的当前特征参数为所述第二终端A根据所述第一损失值对应的所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法获取的，所述样本特征数据是样本行为的特征数据；

解密单元430，还用于采用所述预设解密算法，分别对所述新的加密梯度值和所述新的加密损失值进行解密，得到第二梯度值和第二损失值；

发送单元410，还用于向所述第二终端A发送所述第二梯度值和第二损失值。

在一个可选的实现中，所述装置还包括获取单元440和确定单元450；

发送单元410，还用于向第二终端A发送预测请求，所述预测请求包括样本标识；

接收单元420，还用于接收所述第二终端A发送的所述样本标识对应的样本预测分数，所述样本预测分数是第二终端A根据所述样本标识对应的样本特征数据和所述样本特征数据的当前特征参数获得的；

获取单元440，用于根据所述样本预测分数和预设测试算法，获取所述样本模型的模型分数；

确定单元450，用于若所述模型分数小于预设分数阈值，则确定所述样本模型为正常样本模型。

本发明实施例还提供了一种终端，如图5所示，包括处理器510、通信接口520、存储器530和通信总线540，其中，处理器510，通信接口520，存储器530通过通信总线540完成相互间的通信。

存储器530，用于存放计算机程序；

处理器510，用于执行存储器530上所存放的程序时，实现如下步骤：

接收第一终端发送的第一加密数据，所述第一加密数据为所述第一终端根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

向所述第一终端发送所述第二加密数据；

接收所述第一终端根据所述第二加密数据发送的第一梯度值和第一损失值；

在一个可选的实现中，所述方法还包括：

向所述第一终端发送所述新的第二加密数据；

接收所述第一终端根据所述新的第二加密数据发送的第二梯度值和第二损失值；

接收所述第一终端根据所述第二加密数据发送的第一梯度值和第一损失值之后，所述方法还包括：

接收第一终端发送的预测请求，所述预测请求包括样本标识；

向第一终端发送所述样本预测分数。

或者，执行以下步骤：

向第二终端发送第一加密数据，所述第一加密数据为所述第一终端根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端中任一样本的样本数据；

接收所述第二终端根据所述第一加密数据发送的所述样本的第二加密数据，所述第二加密数据包括加密梯度和加密损失值；

向所述第二终端发送所述第一梯度值和第一损失值。

在一个可选的实现中，所述方法还包括：

若所述第二终端根据所述第一损失值，检测出第一特征参数未处于收敛状态，则第一终端接收第二终端发送的所述样本的新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值，所述新的第二加密数据为所述第二终端根据所述第一加密数据、样本特征数据和新的当前特征参数，采用预设算法获取的，所述新的当前特征参数为所述第二终端根据所述第一损失值对应的所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法获取的；

采用所述预设解密算法，分别对所述新的加密梯度值和所述新的加密损失值进行解密，得到第二第一终端向第二终端发送第一加密数据，所述第一加密数据为所述第一终端根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端中任一样本的样本数据；

接收所述第二终端根据所述第一加密数据发送的第二加密数据，所述第二加密数据包括加密梯度和加密损失值；

向所述第二终端发送所述第一梯度值和第一损失值。

在一个可选的实现中，所述方法还包括：

若所述第二终端根据所述第一损失值，检测出第一特征参数未处于收敛状态，则接收第二终端发送的新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值，所述新的第二加密数据为所述第二终端根据所述第一加密数据、样本特征数据和新的当前特征参数，采用预设算法获取的，所述新的当前特征参数为所述第二终端根据所述第一损失值对应的所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法获取的；

向所述第二终端发送所述第二梯度值和第二损失值。

在一个可选的实现中，向第二终端发送所述第一梯度值和第一损失值之后，所述方法还包括：

向第二终端发送预测请求，所述预测请求包括样本标识；

接收所述第二终端发送的所述样本标识对应的样本预测分数，所述样本预测分数是第二终端根据所述样本标识对应的样本特征数据和所述样本特征数据的当前特征参数获得的；

向所述第二终端发送所述第二梯度值和第二损失值。

向第二终端发送预测请求，所述预测请求包括样本标识；

上述提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

由于上述实施例中终端的各器件解决问题的实施方式以及有益效果可以参见图2所示的实施例中的各步骤来实现，因此，本发明实施例提供的终端的具体工作过程和有益效果，在此不复赘述。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的基于联邦学习的模型参数的确定方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的基于联邦学习的模型参数的确定方法。

本领域内的技术人员应明白，本申请实施例中的实施例可提供为方法、系统、或计算机程序产品。因此，本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请实施例中是参照根据本申请实施例中实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例中的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。

显然，本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样，倘若本申请实施例中实施例的这些修改和变型属于本申请实施例中权利要求及其等同技术的范围之内，则本申请实施例中也意图包含这些改动和变型在内。

Claims

1.一种基于联邦学习的模型参数的确定方法，其特征在于，所述方法包括：

第二终端接收第一终端发送的第一加密数据，所述第一加密数据为所述第一终端根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

向所述第一终端发送所述第二加密数据；

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

向所述第一终端发送所述新的第二加密数据；

3.如权利要求1所述的方法，其特征在于，根据所述第一加密数据、样本特征数据和所述样本特征数据的当前特征参数，采用预设算法，获取所述样本标识对应的第二加密数据，包括：

4.如权利要求1所述的方法，其特征在于，将所述第一特征参数确定为所述待训练的样本模型的模型参数之后，所述方法还包括：

向第一终端发送所述样本预测分数。

5.一种基于联邦学习的模型参数的确定方法，其特征在于，所述方法包括：

第一终端向第二终端发送第一加密数据，所述第一加密数据为所述第一终端根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

向所述第二终端发送所述第一梯度值和第一损失值。

6.如权利要求5所述的方法，其特征在于，所述方法还包括：

若所述第二终端根据所述第一损失值，检测出第一特征参数未处于收敛状态，则接收第二终端发送的新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值，所述新的第二加密数据为所述第二终端根据所述第一加密数据、所述第二终端的样本特征数据和新的当前特征参数，采用预设算法获取的，所述新的当前特征参数为所述第二终端根据所述第一损失值对应的所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法获取的，所述样本特征数据是样本行为的特征数据；

向所述第二终端发送所述第二梯度值和第二损失值。

7.如权利要求5所述的方法，其特征在于，向第二终端发送所述第一梯度值和第一损失值之后，所述方法还包括：

向第二终端发送预测请求，所述预测请求包括样本标识；

8.一种基于联邦学习的模型参数的确定装置，其特征在于，所述装置包括：接收单元、获取单元、发送单元和确定单元；

所述接收单元，用于接收第一终端发送的第一加密数据，所述第一加密数据为所述第一终端根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

所述获取单元，用于根据所述第一加密数据、样本特征数据和所述样本特征数据的当前特征参数，采用预设算法，获取第二加密数据，所述第二加密数据包括加密梯度值和加密损失值，所述预设算法包括预设梯度值算法和预设损失值算法，所述样本特征数据是样本行为的特征数据；

所述发送单元，用于向所述第一终端发送所述第二加密数据；

所述接收单元，还用于接收所述第一终端根据所述第二加密数据发送的第一梯度值和第一损失值；

9.如权利要求8所述的装置，其特征在于，

所述确定单元，还用于若根据所述第一损失值，检测出第一特征参数未处于收敛状态，则将获取的所述第一特征参数确定为新的当前特征参数；

所述发送单元，还用于向所述第一终端发送所述新的第二加密数据；

所述接收单元，还用于接收所述第一终端根据所述新的第二加密数据发送的第二梯度值和第二损失值；

10.如权利要求8所述的装置，其特征在于，所述获取单元，还用于根据所述第一加密数据、样本特征数据、所述样本特征数据的当前特征参数和预设随机数，采用预设算法，获取所述样本的第二加密数据，所述预设随机数包括所述预设梯度值算法对应的第一随机数和所述预设损失值算法对应的第二随机数；

11.如权利要求8所述的装置，其特征在于，

所述接收单元，还用于接收第一终端发送的预测请求，所述预测请求包括样本标识；

所述发送单元，还用于向第一终端发送所述样本预测分数。

12.一种基于联邦学习的模型参数的确定装置，其特征在于，所述装置包括：发送单元、接收单元和解密单元；

所述发送单元，用于向第二终端发送第一加密数据，所述第一加密数据为所述第一终端根据预设加密算法对标签数据进行加密后得到的；所述标签数据为所述第一终端中任一样本的标签数据，所述标签数据是描述样本行为达到的程度的数据；

所述接收单元，用于接收所述第二终端根据所述第一加密数据发送的第二加密数据，所述第二加密数据包括加密梯度和加密损失值；

所述发送单元，还用于向所述第二终端发送所述第一梯度值和第一损失值。

13.如权利要求12所述的装置，其特征在于，所述接收单元，还用于若所述第二终端根据所述第一损失值，检测出第一特征参数未处于收敛状态，则接收第二终端发送的新的第二加密数据，所述新的第二加密数据包括新的加密梯度值和新的加密损失值，所述新的第二加密数据为所述第二终端根据所述第一加密数据、所述第二终端的样本特征数据和新的当前特征参数，采用预设算法获取的，所述新的当前特征参数为所述第二终端根据所述第一损失值对应的所述第一梯度值和所述样本特征数据的当前特征参数，采用预设特征参数算法获取的，所述样本特征数据是样本行为的特征数据；

所述发送单元，还用于向所述第二终端发送所述第二梯度值和第二损失值。

14.如权利要求12所述的装置，其特征在于，所述装置还包括获取单元和确定单元；

所述发送单元，还用于向第二终端发送预测请求，所述预测请求包括样本标识；

所述接收单元，还用于接收所述第二终端发送的所述样本标识对应的样本预测分数，所述样本预测分数是第二终端根据所述样本标识对应的样本特征数据和所述样本特征数据的当前特征参数获得的；

15.一种终端，其特征在于，所述终端包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存储的程序时，实现权利要求1-4任一所述的方法步骤或实现权利要求5-7任一所述的方法步骤。

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤或实现权利要求5-7任一所述的方法步骤。