CN112085159B

CN112085159B - 一种用户标签数据预测系统、方法、装置及电子设备

Info

Publication number: CN112085159B
Application number: CN202010724476.5A
Authority: CN
Inventors: 公茂果; 高原; 王钊; 梁爽; 王善峰; 武越; 张明阳; 李豪
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2020-07-24
Filing date: 2020-07-24
Publication date: 2023-08-15
Anticipated expiration: 2040-07-24
Also published as: CN112085159A

Abstract

本发明公开了一种用户标签数据预测系统和方法，第一客户端获取目标用户的第一标识数据和第一特征数据组，针对每个第二客户端，预测第一特征数据组在该第二客户端的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端；利用训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值并发送给服务端；每个第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，利用训练得到的联邦学习模型参数，获得第二目标特征数据组的第二加密加权值并发送给服务端；服务端对接收到的第一加密加权值和第二加密加权值求和，对求和结果解密得到目标用户的目标标签数据并返回给第一客户端。

Description

一种用户标签数据预测系统、方法、装置及电子设备

技术领域

本发明属于隐私保护领域，具体涉及一种用户标签数据预测系统、方法、装置及电子设备。

背景技术

人工智能技术的发展和应用离不开数据的利用，但由于隐私安全和复杂的管理程序，将分散在不同机构的数据进行整合几乎是不可能的，各机构的数据以“数据孤岛”的形式存在。

在这种情况下，“联邦学习”的概念应运而生。联邦学习实际上是一种加密的分布式机器学习技术，各参与方可以在不披露底层数据的前提下共建联邦学习模型。联邦学习能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模，解决“数据孤岛”的问题。

目前，联邦学习各参与方可以利用联邦学习模型，实现对用户标签数据的预测，比如，拥有部分共有用户的两家教育机构利用纵向联邦学习模型对用户是否掌握某一知识进行预测，等等。

但是，在实际应用中，由于参与方地域和机构类型不同等原因，纵向联邦学习各个参与方的用户群体交集通常很小，各参与方共有的用户数据极其有限，在少量的共有用户数据集上训练得到的联邦学习模型对于标签数据的预测效果并不理想。

发明内容

为了有效解决使用纵向联邦学习进行用户标签数据预测时，共有用户数据集不足的问题，本发明实施例提供了一种用户标签数据预测系统、方法、装置、电子设备、存储介质以及一种联邦学习模型训练方法。

本发明要解决的技术问题通过以下技术方案实现：

本发明实施例提供了一种用户标签数据预测系统，包括第一客户端、至少一个第二客户端，以及服务端：所述第一客户端，用于获取待预测标签数据的目标用户的第一标识数据和第一特征数据组，针对每个第二客户端，利用所述第一客户端的对偶模型，预测所述第一特征数据组在该第二客户端的第二预测特征数据组，将所述第一标识数据和所述第二预测特征数据组的加密数据发送给该第二客户端；并且，利用所述第一客户端训练得到的联邦学习模型参数，获得所述第一特征数据组的第一加密加权值，并将所述第一加密加权值发送给所述服务端；每个第二客户端，用于利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得所述第二目标特征数据组的第二加密加权值，并将所述第二加密加权值发送给所述服务端；所述服务端，用于对接收到的所述第一加密加权值和所述第二加密加权值求和，并对求和结果进行解密，得到所述目标用户的目标标签数据，并将所述目标标签数据返回给所述第一客户端；其中，所述第一客户端、所述至少一个第二客户端各自拥有预先训练的对偶模型；所述服务端拥有预先训练的联邦学习模型；所述联邦学习模型是所述第一客户端和所述至少一个第二客户端作为参与训练的目标客户端，经过加密对偶训练扩展共有用户数据集后，借助所述服务端进行联邦学习得到的；且参与训练的目标客户端中，有一个目标客户端用于联邦学习模型训练的用户数据中包括标签数据。

本发明实施例提供了一种用户标签数据预测方法，所述方法包括：第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组，针对每个第二客户端，利用所述第一客户端的对偶模型，预测所述第一特征数据组在该第二客户端的第二预测特征数据组，将所述第一标识数据和所述第二预测特征数据组的加密数据发送给该第二客户端；并且，利用所述第一客户端训练得到的联邦学习模型参数，获得所述第一特征数据组的第一加密加权值，并将所述第一加密加权值发送给所述服务端；每个第二客户端利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得所述第二目标特征数据组的第二加密加权值，并将所述第二加密加权值发送给所述服务端；服务端对接收到的所述第一加密加权值和所述第二加密加权值求和，并对求和结果进行解密，得到所述目标用户的目标标签数据，并将所述目标标签数据返回给所述第一客户端；其中，所述第一客户端、所述至少一个第二客户端各自拥有预先训练的对偶模型；所述服务端拥有预先训练的联邦学习模型；所述联邦学习模型是所述第一客户端和所述至少一个第二客户端作为参与训练的目标客户端，经过加密对偶训练扩展共有用户数据集后，借助所述服务端进行联邦学习得到的；且参与训练的目标客户端中，有一个目标客户端用于联邦学习模型训练的用户数据中包括标签数据。

本发明实施例提供了另一种用户标签数据预测方法，应用于用户标签数据预测系统的第一客户端，所述系统还包括至少一个第二客户端，以及服务端，所述方法包括：获取待预测标签数据的目标用户的第一标识数据和第一特征数据组；针对每个第二客户端，利用所述第一客户端的对偶模型，预测所述第一特征数据组在该第二客户端的第二预测特征数据组；将所述第一标识数据和所述第二预测特征数据组的加密数据发送给该第二客户端；以使得每个第二客户端利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，并利用该第二客户端训练得到的联邦学习模型参数，获得所述第二目标特征数据组的第二加密加权值，并将所述第二加密加权值发送给所述服务端；利用所述第一客户端训练得到的联邦学习模型参数，获得所述第一特征数据组的第一加密加权值，并将所述第一加密加权值发送给所述服务端；以使得所述服务端对接收到的所述第一加密加权值和所述第二加密加权值求和，并对求和结果进行解密，得到所述目标用户的目标标签数据，并将所述目标标签数据返回给所述第一客户端；接收所述服务端返回的所述目标标签数据；其中，所述第一客户端、所述至少一个第二客户端各自拥有预先训练的对偶模型；所述服务端拥有预先训练的联邦学习模型；所述联邦学习模型是所述第一客户端和所述至少一个第二客户端作为参与训练的目标客户端，经过加密对偶训练扩展共有用户数据集后，借助所述服务端进行联邦学习得到的；且参与训练的目标客户端中，有一个目标客户端用于联邦学习模型训练的用户数据中包括标签数据。

本发明实施例提供了一种用户标签数据预测装置，应用于用户标签数据预测系统的第一客户端，所述系统还包括至少一个第二客户端，以及服务端，所述装置包括：获取模块，用于获取待预测标签数据的目标用户的第一标识数据和第一特征数据组；预测模块，用于针对每个第二客户端，利用所述第一客户端的对偶模型，预测所述第一特征数据组在该第二客户端的第二预测特征数据组；第一加密发送模块，用于将所述第一标识数据和所述第二预测特征数据组的加密数据发送给该第二客户端；以使得每个第二客户端利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，并利用该第二客户端训练得到的联邦学习模型参数，获得所述第二目标特征数据组的第二加密加权值，并将所述第二加密加权值发送给所述服务端；第二加密发送模块，用于利用所述第一客户端训练得到的联邦学习模型参数，获得所述第一特征数据组的第一加密加权值，并将所述第一加密加权值发送给所述服务端；以使得所述服务端对接收到的所述第一加密加权值和所述第二加密加权值求和，并对求和结果进行解密，得到所述目标用户的目标标签数据，并将所述目标标签数据返回给所述第一客户端；接收模块，用于接收所述服务端返回的所述目标标签数据；其中，所述第一客户端、所述至少一个第二客户端各自拥有预先训练的对偶模型；所述服务端拥有预先训练的联邦学习模型；所述联邦学习模型是所述第一客户端和所述至少一个第二客户端作为参与训练的目标客户端，经过加密对偶训练扩展共有用户数据集后，借助所述服务端进行联邦学习得到的；且参与训练的目标客户端中，有一个目标客户端用于联邦学习模型训练的用户数据中包括标签数据。

本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现上述第一种用户标签数据预测方法的步骤。

本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述第一种用户标签数据预测方法的步骤。

本发明实施例提供了一种联邦学习模型训练方法，所述方法包括：参与联邦学习模型训练的多个目标客户端分别获取各自的用户数据；所述用户数据包括标识数据和特征数据组，且有一个目标客户端的用户数据还包括标签数据；所述多个目标客户端确定共有用户，得到共有用户数据集；所述多个目标客户端基于所述共有用户数据集进行加密对偶学习，将各个目标客户端的标识数据增加至所述多个目标客户端的标识数据的并集，并补全各个目标客户端的特征数据组，得到所述多个目标客户端扩展的共有用户数据集；所述多个目标客户端基于所述扩展的共有用户数据集，在所述服务端的协助下，进行联邦学习模型训练，直至达到联邦学习模型收敛条件，获得训练完成的联邦学习模型。

本发明实施例提供的用户标签数据预测过程，和现有联邦学习标签数据预测过程相比，拥有联邦学习模型的所述服务端，从某个第二客户端接收到的所述第二加密加权值是，待预测方的所述第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组后，针对该第二客户端，利用所述第一客户端的对偶模型，预测所述第一特征数据组在该第二客户端的第二预测特征数据组，将所述第一标识数据和所述第二预测特征数据组的加密数据发送给该第二客户端，再由该第二客户端利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得的所述第二目标特征数据组的加密加权值。因此，可以在所述第二客户端没有目标用户的特征数据组时，利用所述第一客户端对偶预测的第二预测特征数据组作为所述第二客户端的第二目标特征数据组，即在数据缺失的情况下补充数据，增加了联邦学习模型的用户数据。

本发明实施例中，通过对偶学习的方式，可以学习双方共有用户数据之间的内在联系，通过对偶学习可以从一方准确地推断另一方加密的数据，而不泄露隐私或导致原始数据丢失。对偶模型经过训练并采用对偶交叉验证来提高补充数据的可靠性，使得训练得到的对偶模型具有一定的对偶预测准确性，可以利用独属于一方的非共有用户数据，推测另一方的用户数据，由于推测得到的用户数据在另一方中并不存在，即第二预测特征数据组在所述第二客户端中并未真实存在，因此，不会泄露所述第二客户端的用户隐私，避免了隐私泄露问题。通过对偶预测，利用一方独有的用户数据和由这部分用户数据预测的对方用户数据，可以大幅补充原有的共有用户数据集，为联邦学习模型增加可靠的样本数据，从而能够有效解决纵向联邦学习中共有用户少引发的共有用户数据集不足的问题，能够提升标签数据的预测效果，达到与非分布式学习媲美的预测准确率。而且，由于本发明实施例实施过程中数据结构几乎无损，应用该联邦对偶学习框架的用户标签预测过程可扩展到各种有效的模型，具有广泛的应用前景。

以下将结合附图及对本发明做进一步详细说明。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例所提供的一种联邦学习模型训练方法的流程示意图；

图2为本发明实施例所提供的对偶模型训练过程中数据交互示意图；

图3为本发明实施例所提供的一种用户标签数据预测系统的结构示意图；

图4为本发明实施例所提供的一种用户标签数据预测方法的流程示意图；

图5为本发明实施例所提供的另一种用户标签数据预测方法的流程示意图；

图6为本发明实施例所提供的一种用户标签数据预测装置的结构示意图；

图7为本发明实施例所提供的一种用于用户标签数据预测的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了解决使用纵向联邦学习进行用户标签数据预测时，共有用户数据集不足的问题，本发明实施例提供了一种用户标签数据预测系统、方法、装置、电子设备、存储介质以及一种联邦学习模型训练方法。

为了便于理解方案，首先对本发明实施例提供的一种联邦学习模型训练方法予以介绍。

第一方面，本发明实施例提供了一种联邦学习模型训练方法，用于后续的用户标签数据预测，请参见图1，图1为本发明实施例所提供的一种联邦学习模型训练方法的流程示意图。可以包括以下步骤：

S101，参与联邦学习模型训练的多个目标客户端分别获取各自的用户数据；

本发明实施例中，参与联邦学习模型训练的多个目标客户端之间地位平等；多个目标客户端可以为机构内部的客户端，目标客户端具体可以为一个服务器或数据库；机构可以包括政府、学校、医院、企业等等，在实际应用中，可以根据用户标签数据预测需求进行选择。

多个目标客户端分别获取各自的用户数据，可以理解的是，各个目标客户端获取的用户数据属于该目标客户端的隐私数据。

目标客户端获取用户数据的方式可以是接收用户输入的用户数据，也可以是从预设存储地址获取预先存储的用户数据等等，当然，目标客户端获取用户数据可以采用一定的加密方式，这都是合理的，在此，并不对本发明实施例中目标客户端获取用户数据的方式进行限定。

多个目标客户端获取到的用户数据包括标识数据和特征数据组，且有一个目标客户端的用户数据还包括标签数据。

其中，标识数据为区别用户身份的数据，包括ID(Identity document，身份标识号)，具体可以为数字、符号、图形、图像等形式。比如可以为用户的身份证号、姓名等。在此，并不对本发明实施例的标识数据的形式进行限制，任何可以区别用户身份的数据形式均可以作为本发明实施例的标识数据的形式。

特征数据组包括多个特征数据，每个特征数据用以表征用户的一种特征，比如用户的年龄、性别、收入等等。可以理解的是，特征数据可以以数值、向量等形式表征。

训练阶段的标签数据可以是由人工标注的，当然也可以是使用其他算法自动标注的。标签数据用于表征用户的某种属性，比如在金融领域，标签数据可以为用户的信用；在营销领域，标签数据可以为用户的购买愿望；在教育领域，标签数据可以为学生对知识的掌握程度，等等。一种常用的情况下，标签数据可以为一个概率值，比如0.5或者50％等，另一种常用的情况下，标签数据可以为一个二分类结果，比如表征用户是否具有购买意愿，用户a的标签数据为“是”，表示用户a具有购买意愿，用户b的标签数据为“否”，表示用户b不具有购买意愿。当然，标签数据也可以用数字、字母、符号、图形等表示，比如，以“1”表示是，“0”表示否，或者以“Y”表示是，以“N”表示否，或者以圆形表示是，以三角形表示否，等等，这都是合理的。

需要说明的是，多个目标客户端的用户数据中，标识数据有重叠，也就是说，多个目标客户端具有部分重叠用户，但由于各个机构的类型和业务不同，多个目标客户端的特征数据组完全不同。

S102，多个目标客户端确定共有用户，得到共有用户数据集；

可选的一种实现方式中，多个目标客户端利用加密的用户对齐技术，确定共有的标识数据；将多个目标客户端中，包含共有的标识数据的用户数据的合集，确定为共有用户数据集。

比如，针对目标客户端A和B，A的用户数据为B的用户数据为其中，x为特征数据组，y为标签数据。通过加密的用户对齐技术可以得到A和B的共有用户数据集为/>

在该步骤中，多个目标客户端在不公开各自用户数据的前提下，确认共有用户，并且不暴露不互相重叠的用户，以便联合共有用户的用户数据进行后续的训练。

当然，本发明实施例中，确定共有用户的方法不限于加密的用户对齐技术。关于加密的用户对齐技术，可以参见现有技术中的相关介绍，在此不做赘述。

S103，多个目标客户端基于共有用户数据集进行加密对偶学习，将各个目标客户端的标识数据增加至多个目标客户端的标识数据的并集，并补全各个目标客户端的特征数据组，得到多个目标客户端扩展的共有用户数据集；

现有联邦学习模型的训练过程，是直接在共有用户数据集上进行，但在实际应用中，共有用户数据集通常极其有限，无法实现较好的训练效果，且大量属于各个目标客户端独有的用户数据被浪费。

目前机器学习领域内，对偶学习广泛应用于机器翻译模型的修正，对偶学习基本思想是两个对偶的任务能形成一个闭环反馈系统，可以从未标注的数据上获得反馈信息，进而利用该反馈信息提高对偶任务中的两个机器学习模型。本发明实施例考虑是否能够在联邦学习中引入对偶学习的思想，利用对偶学习增强目标客户端的用户数据之间的内在概率联系，实现从一方预测对方的用户数据，从而扩展共有用户数据集。具体的，S103可以包括以下步骤：

S1031，多个目标客户端各自建立对偶模型；

在可选的一种实现方式中，对偶模型可以为一个由编码器和解码器组成的神经网络，在可选的其他实现方式中，对偶模型还可以为长短期记忆网络、卷积神经网络等，在此，并不对本发明实施例中的对偶模型的结构进行限定。

对偶模型用于预测本目标客户端用户的特征数据组在其他目标客户端的特征数据组。以目标客户端A和B之间的对偶预测举例说明：

针对目标客户端A的对偶模型M_A，其任务是找到一个映射函数f，实现f:x^A→x^B，即通过输入A的特征数据组x^A来计算对目标客户端B的特征数据组x^B的预测值针对目标客户端B的对偶模型M_B，其任务是找到一个映射函数g，实现g:x^B→x^A，即通过输入B的特征数据组x^B来计算对目标客户端A的特征数据组x^A的预测值/>

S1032，多个目标客户端将共有用户数据集划分为训练集和测试集，并对训练集中属于本目标客户端的用户数据进行加密，得到多个目标客户端各自的加密用户数据；

首先，多个目标客户端将共有用户数据集划分为训练集和测试集，以在训练集上进行后续的对偶模型训练，在测试集上验证对偶模型的训练效果。具体的，可以采用以下任意一种实现方式进行共有用户数据集的划分：

可选的一种实现方式中，可以将共有用户数据集任意划分为两部分，一部分为训练集，一部分为测试集；

可选的另一种实现方式中，可以将共有用户数据集平均划分为两部分，一部分为训练集，一部分为测试集；

可选的又一种实现方式中，可以将共有用户数据集平均划分为K份，其中K为大于1的自然数。将其中一份作为测试集，将其余部分作为训练集。在该种实现方式中，训练集的用户数据多于测试集的用户数据，可以保证对偶模型训练具有足够的样本数，提升训练的准确性，同时利用少量数据进行验证以简化验证的复杂度。

其次，多个目标客户端对训练集中属于本目标客户端的用户数据进行加密，得到多个目标客户端各自的加密用户数据。

如前，本发明实施例将在训练集上进行后续的对偶模型训练，因此，各个目标客户端为了后续训练过程中用户数据的隐私保护，需要将属于本目标客户端的用户数据进行加密，得到加密用户数据。加密方式可以采用归一化、标准化、基于相关性的差分加密等方式中的任意一种，当然，本发明实施例中用户数据的加密方式不限于以上。

为了简化理解，在后续步骤的对偶模型训练过程中，x^A表示目标客户端A的加密用户数据，x^B表示目标客户端B的加密用户数据。

需要补充说明的是，在涉及对偶模型的部分，针对每个对偶模型的输入数据和输出数据均进行有加密/解密操作，以保证数据传输的隐私性和安全性。

S1033，多个目标客户端迭代性地基于各自的加密用户数据和对偶模型，进行对偶预测、梯度数据计算，并加密互传各自的计算结果，更新各自的对偶模型参数，直至利用训练集和测试集进行联邦对偶交叉验证，判定满足对偶模型收敛条件时停止迭代，获得各自训练完成的对偶模型；

在本步骤中，多个目标客户端基于各自的加密用户数据和对偶模型，进行对偶预测、梯度数据计算，并加密互传各自的计算结果，更新各自的对偶模型参数，即进行对偶模型训练过程。假如仅有两个目标客户端A和B存在时，由A和B进行上述交互的对偶模型训练，更新M_A和M_B的对偶模型参数；假如有三个及三个以上的目标客户端存在时，如目标客户端D、E、F，可以两两之间进行上述交互的对偶模型训练，更新各自的对偶模型参数，也可以在D和E之间进行上述交互的对偶模型训练，并在E和F之间进行上述交互的对偶模型训练，更新各自的对偶模型参数，即保证任意一个目标客户端均参与到对偶模型训练中。当多个目标客户端均完成对偶模型参数的一次更新时，视为多个目标客户端完成一次对偶模型的训练。

可以在迭代N次上述训练过程后，执行验证过程，即利用训练集和测试集进行联邦对偶交叉验证，判定是否满足对偶模型收敛条件，如果是，则停止对偶模型的迭代训练，获得各自训练完成的对偶模型，如果否，则继续对偶模型的迭代训练，直至对偶模型收敛。其中，N为大于等于1的自然数，N可以根据需要合理选择，比如，可以在迭代3次后执行验证过程，也可以在每次迭代后均执行验证过程，这都是合理的。

为了便于理解，将步骤S1033划分为对偶模型的训练过程和验证过程。

1)针对于对偶模型的训练过程的介绍如下：

以前文的目标客户端A和B进行说明，两方对偶学习中，训练(f,g)的一个常见方法是使A和B用户数据空间中的经验风险最小化，即：

其中，Nc是共有用户数据集；i表示某个用户；f是M_A的任务函数，是A中用户i的用户数据，θ_AB是M_A的模型参数，如果M_A为神经网络则θ_AB可以为神经网络的权重；g是M_B的任务函数，/>是B中用户i的用户数据；θ_BA是M_B的模型参数，如果M_B为神经网络则θ_BA可以为神经网络的权重；l_align是直接预测的损失函数，即经验风险，用于表征对偶模型的预测值和真实值之间的差值。

然而，上述公式(1)和(2)中的损失函数没有考虑到f和g映射之间的概率对偶性，概率对偶性可以保证同一用户在双方产生的数据的内在联系，基于此，由任意一方的数据可以推测另一方的数据。概率对偶性以公式体现即为：

P(x^A)P(x^B|x^A；θ_AB)＝P(x^B)P(x^A|x^B；θ_BA)＝P(x^A,x^B) (3)

其中，P(x^A)表示x^A在A的用户数据中的概率；P(x^B)表示x^B在B的用户数据中的概率；P(x^B|x^A；θ_AB)表示在A的用户数据中出现x^A时，B的用户数据中同一用户的x^B出现的概率；P(x^A|x^B；θ_BA)表示在B的用户数据中出现x^B时，A的用户数据中同一用户的x^A出现的概率；P(x^A,x^B)表示同一用户的x^A和x^B同时出现在AB用户数据中的概率。

因此，引入公式(3)的概率对偶性作为约束条件，并利用拉格朗日乘数法将其转化为正则项，可以得到对偶损失函数的表达式为：

其中，l_dual表示对偶损失函数；表示对偶模型输出的预测值，即预测的特征数据组；/>表示B的用户数据中出现x^B时，A的用户数据中出现/>的概率；/>表示A的用户数据中出现x^A时，B的用户数据中出现的概率。

为了简便，将记为/>将/>记为/>则公式(4)可以变为：

因此，对于对偶模型M_A和M_B，各自的损失函数可以利用以下公式计算：

其中λ为加权值。

在对偶模型的训练过程中，需要最小化以上损失函数L，来提高预测数据的可靠性。以对偶模型M_A为例，其任务是通过输入x^A得到预测值可以理解的是，未经训练的模型M_A输出的预测值/>与真实值x^B之间存在误差，由于M_A的输入x^A与真实值x^B为固定值，因此，只能通过改变M_A的模型参数，来调整M_A输出的预测值/>通过将预测值/>和真实值x^B之间的误差(即模型损失)最小化，实现预测值逼近真实值的目的，以完成M_A的训练。

上述模型损失最小化的问题可以近似成一个在损失空间寻找最小值的过程，可以采用梯度下降法等方法求解，求得模型损失对于输出的梯度，即损失函数的梯度值，将其作为优化方向。因此，实际上，本发明实施例的对偶模型训练中，需要最小化的损失函数可以为：

那么，对偶模型的训练过程实际上可以为：多个目标客户端基于各自的加密用户数据和对偶模型，进行对偶预测、梯度数据计算，并加密互传各自的计算结果，分别基于接收到的计算结果，获得各自的损失函数的梯度值；分别利用各自的损失函数的梯度值，更新各自的对偶模型参数，以完成一次对偶模型的训练过程。

以下以目标客户端A和B举例说明一次对偶模型的训练过程，其中，A和B预先初始化模型参数θ_AB和θ_BA，并在共有用户数据集中的训练集上进行对偶训练。

针对A来说，具体为：

针对B来说，具体为：

其中，表示M_A的输出层的梯度，λ_B为B的加权值，可以预先由B设定,/>表示M_B的输出层的梯度，λ_A为A的加权值，可以预先由A设定。

为了便于理解，先对A和B的对偶训练过程中，M_A的一次训练过程进行说明，参见图2，图2为本发明实施例所提供的对偶模型训练过程中数据交互示意图。在图2中，仅示出了计算AB所需要交互的数据。

参见图2理解，M_A的一次训练过程具体可以包括以下步骤：

①A将x^A输入M_A中，利用M_A的函数进行计算，输出预测值/>并将/>发送给B；

②B接收到后，计算/>与自身用户数据中x^B的差值/>由于对偶模型M_A和M_B分别由A和B独立设计并保存在本地，B对M_A的网络结构并不了解，因此B只能计算出M_A输出层的梯度/>而无法得到M_A其它网络层的梯度，即B将/>对M_A的输出层/>求梯度，得到梯度/>

并且，B计算x^B的概率P(x^B)、以及的概率/>从而计算

继而，B将上述两个计算结果求和，得到

并将其发送给A；

③A计算x^A的概率P(x^A)、以及的概率/>继而计算/>但由于/>涉及到A的概率分布信息，不能直接发送给B，因此，A将其进行加法同态加密为/>并将/>发送给B；

④B接收到后，由于对加法同态加密进行乘法不会影响解密，因此B计算/>并将/>返回给A；

⑤A将接收到的解密，得到

⑥A将接收到的

和求和，得到梯度：

/>

之后A可以利用链式法则进一步计算M_A各层的梯度，在M_A中进行反向传播来更新模型参数θ_AB，完成M_A的一次训练过程。可以理解的是，M_B的一次训练过程与M_A类似。

实际上A和B是交互完成各自的对偶训练，实现双方对偶模型的参数更新。为了对双方交互过程进行整体认知，以下将AB对偶训练的数据交互过程整体进行简要介绍，具体可以包括以下步骤：

A初始化θ_AB，B初始化θ_BA；在共有用户数据集中的训练集中重复执行以下过程：

A针对每个i，输入一用户特征数据组利用/>计算得到/>并将/>发送给B；

B针对每个i，输入一用户特征数据组利用/>计算得到/>并将/>发送给A；

并且，B根据接收到的计算

并将其发送给A；

并且，B计算并加法同态加密得到/>将其发送给A；

A根据接收到的计算

并将其发送给B；

并且，A计算并加法同态加密得到/>将其发送给B；

并且，A计算将其发送给B；

B计算将其发送给A；/>

并且，B对每一个i，解密得到/>继而求和计算得到/>

A对每一个i，解密得到继而求和计算得到/>

A利用反向传播算法计算M_A每一层的梯度值，更新θ_AB；B利用反向传播算法计算M_B每一层的梯度值，更新θ_BA，至此完成A和B的一次对偶训练。

可见，在上述对偶训练中，双方进行对偶预测、梯度数据计算，加密互传各自的计算结果，获得各自损失函数的梯度值，更新各自的对偶模型参数，但并未泄露各自的隐私数据。

共有用户数据集中的训练集都训练完一次称作一个epoch，每个epoch后，可以执行验证过程。

2)针对于对偶模型的验证过程的介绍如下：

在本发明实施例中，利用训练集和测试集进行联邦对偶交叉验证，可以包括以下步骤：

多个目标客户端中，含有标签数据的目标客户端，从自身多个用户数据中选取含有标签数据，且不属于共有用户数据集的所有用户数据作为新增用户数据，利用该目标客户端的对偶模型获得新增用户数据在其余目标客户端的新增预测用户数据；

多个目标客户端基于训练集进行第一次联邦学习模型训练，并在测试集上验证标签数据的预测准确率，获得第一预测准确率；

多个目标客户端基于在训练集加入新增用户数据、新增预测用户数据之后的数据集，进行第二次联邦学习模型训练，并在测试集上验证标签数据的预测准确率，获得第二预测准确率；

多个目标客户端判断第二预测准确率与第一预测准确率的差值是否小于预设阈值，若是，则满足对偶模型收敛条件。

可以理解的是，如果第二预测准确率与第一预测准确率的差值未小于预设阈值，则重新迭代对偶模型的训练过程。

其中，预设阈值T根据经验值选取，比如T＝0.1～0.15中的任意值。

为了便于理解上述验证过程，以下举例说明：

目标客户端A和B的共有用户数据集为其中共有用户的标识数据为U₁、U₂、U₃；训练集由双方U₁、U₂对应的用户数据构成，在训练集上进行对偶训练过程；测试集由双方U₃对应的用户数据构成。B的用户中，不属于D_C用户且含有标签数据的用户仅有U₄。

⑴，B选取U₄的用户数据，作为新增用户数据利用M_B预测U₄在A的特征数据组，得到新增预测用户数据/>

⑵，基于AB的U₁、U₂用户数据构成的训练集，进行第一次联邦学习模型训练，即进行联邦学习模型M_F1的训练，并在AB的U₃用户数据构成的测试集上验证标签数据的预测准确率，获得第一预测准确率；

⑶，在训练集中加入B的新增用户数据以及B预测的A方的新增预测用户数据即为训练集补充样本，并在补充样本后的训练集上进行第二次联邦学习模型训练，即进行联邦学习模型M_F2的训练，并在测试集上验证标签数据的预测准确率，获得第二预测准确率；

⑷，判断第二预测准确率与第一预测准确率的差值是否小于预设阈值T＝0.13，若是，则满足对偶模型收敛条件。即如果使用了补充样本的联邦学习模型M_F2的训练效果比未使用补充样本的联邦学习模型M_F1的训练效果好，则可以认为对偶模型是有效的，实现收敛。

其中，预测准确率是在测试集上，比较联邦学习模型预测的标签数据与真实的标签数据的差异程度确定的，差异程度越小表示联邦学习模型的预测准确率越高。

本发明实施例中，通过联邦对偶交叉验证的方式，可以提高对偶模型预测样本的可靠性。

S1034，多个目标客户端利用各自训练完成的对偶模型进行相互预测，获得各自补充后的标识数据，补充后的标识数据为多个目标客户端的标识数据的并集；以及，通过预测本目标客户端的特征数据组在其他目标客户端的特征数据组，获得多个目标客户端各自补全的特征数据组；

可以理解的是，当步骤S1033判定满足对偶模型收敛条件后，多个目标客户端得到各自训练完成的对偶模型。此时，多个目标客户端利用各自的对偶模型进行相互预测，可以实现自身标识数据和特征数据组的补充。即通过对偶预测，多个目标客户端的标识数据补充为多个目标客户端的标识数据的并集。比如上述目标客户端A和B各自的标识数据均补充成为AB所有标识数据。

同时，预测本目标客户端的特征数据组在其他目标客户端的特征数据组，可以使得新增的用户标识数据对应的特征数据组由空白得到了补充，获得多个目标客户端各自补全的特征数据组。可见，相比于S102中确定的共有用户，在S1034后，共有的用户标识数据和特征数据组都有明显增加。

S1035，根据多个目标客户端各自的补充后的标识数据和补全的特征数据组，得到多个目标客户端扩展的共有用户数据集。

每个目标客户端的补充后的标识数据和补全的特征数据组构成该目标客户端的扩展的用户数据；由于各个目标客户端的补充后的标识数据一致，因此，集合各个目标客户端的扩展的用户数据，可以得到多个目标客户端扩展的共有用户数据集。

S104，多个目标客户端基于扩展的共有用户数据集，在服务端的协助下，进行联邦学习模型训练，直至达到联邦学习模型收敛条件，获得训练完成的联邦学习模型。

可以理解的是，通过S103步骤，获得了多个目标客户端的扩展的共有用户数据集，针对纵向联邦学习来说，共有用户的标识数据增加，有利于提高模型训练效果。之后，可以利用扩展的共有用户数据集训练纵向联邦学习模型。该过程可以参考现有技术中纵向联邦学习模型的训练过程。以下进行概要介绍。

为了保证训练过程中数据的保密性，需要借助第三方协作者进行加密训练。第三方协作者可以由政府或Intel的安全计算节点担任。

为了便于方案理解，在此以两个目标客户端A和B，以及第三方协作者C进行说明。其中，B用于训练的用户数据含有标签数据。

以线性回归模型为例，S104的联邦学习模型的训练过程可以包括以下步骤：

第一步：C把公钥分发给A和B，用以对训练过程中需要交换的数据进行加密；

第二步：A和B之间以加密形式交互用于计算梯度的中间结果；

第三步：A和B分别基于加密的梯度值进行计算，同时B根据其标签数据计算损失，并把这些结果汇总给C。C通过汇总结果计算总梯度并将其解密。

第四步：C将解密后的梯度分别回传给A和B；A和B根据梯度更新各自模型的参数。

迭代上述步骤直至损失函数收敛，则完成联邦学习模型的训练，A和B拥有训练得到的联邦学习模型参数，C中保存有训练好的联邦学习模型。

需要说明的是，本发明实施例中，联邦学习模型可以为逻辑回归模型、树形结构模型和神经网络模型等众多机器学习模型中的任意一种，在此，并不对本发明实施例中的联邦学习模型进行限制。

本发明实施例提供的联邦学习模型训练方法，在联邦学习问题中引入了对偶学习，提出一种联邦对偶学习框架。通过对偶学习准确地从一方推断另一方加密的数据，而不泄露隐私或导致原始数据丢失，并采用联邦对偶交叉验证来提高补充数据的可靠性。从而能够有效解决纵向联邦学习中共有用户少引发的共有用户数据集不足的问题，有利于后续用户标签数据预测的准确率。此外，由于本发明实施例实施过程中数据结构几乎无损，该联邦对偶学习框架可扩展到各种有效的模型，具有广泛的应用前景。

在上述训练完成的联邦学习模型基础上，第二方面，本发明实施例提供了一种用户标签数据预测系统，请参见图3，图3为本发明实施例所提供的一种用户标签数据预测系统的结构示意图。关于联邦学习模型的训练过程参见前文，在此不做赘述。

如图3所示，本发明实施例所提供的一种用户标签数据预测系统100可以包括：第一客户端110、至少一个第二客户端120，以及服务端130；第一客户端110和至少一个第二客户端120为前述的联邦学习模型训练过程中的多个目标客户端。

第一客户端110，用于获取待预测标签数据的目标用户的第一标识数据和第一特征数据组，针对每个第二客户端120，利用第一客户端110的对偶模型，预测第一特征数据组在该第二客户端120的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端120；并且，利用第一客户端110训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值，并将第一加密加权值发送给服务端130；

每个第二客户端120，用于利用接收到的加密数据，确定目标用户在该第二客户端120的第二目标特征数据组，利用该第二客户端120训练得到的联邦学习模型参数，获得第二目标特征数据组的第二加密加权值，并将第二加密加权值发送给服务端130；

服务端130，用于对接收到的第一加密加权值和第二加密加权值求和，并对求和结果进行解密，得到目标用户的目标标签数据，并将目标标签数据返回给第一客户端110；

其中，第一客户端110、至少一个第二客户端120各自拥有预先训练的对偶模型；服务端130拥有预先训练的联邦学习模型；联邦学习模型是第一客户端110和至少一个第二客户端120作为参与训练的目标客户端，经过加密对偶训练扩展共有用户数据集后，借助服务端130进行纵向联邦学习得到的；且参与训练的目标客户端中，有一个目标客户端用于联邦学习模型训练的用户数据中包括标签数据。

为了方案清楚，下面对该用户标签数据预测系统100中的各个组成部分分别进行介绍：

1)针对于第一客户端110的介绍内容如下：

本发明实施例中，第一客户端110为需要进行用户标签数据预测的机构的客户端。第一客户端110可以为训练阶段拥有标签数据的目标客户端，也可以为训练阶段不拥有标签数据的目标客户端。第一客户端110具体执行以下两个步骤：

①，第一客户端110获取待预测标签数据的目标用户的第一标识数据和第一特征数据组，针对每个第二客户端120，利用第一客户端110的对偶模型，预测第一特征数据组在该第二客户端120的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端120；

以第一客户端110为A，一个第二客户端120为B进行说明，其中，A或者B，用于联邦学习模型训练的用户数据中包括标签数据，对于其他第二客户端120，如D、E、F等，参照涉及B部分的说明，在此不做赘述。

A获取待预测标签数据的目标用户U的第一标识数据U和第一特征数据组其中，包括/>三个特征数据。A利用其对偶模型M_A，预测/>在B的第二预测特征数据组包括/>两个特征数据。

A分别对U和加密，加密方式可以采用归一化、标准化、基于相关性的差分加密等方式中的任意一种。

A将U的加密数据和的加密数据发送给B。

②，第一客户端110利用第一客户端110训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值，并将第一加密加权值发送给服务端130；

需要说明的是，第一客户端110训练得到的联邦学习模型参数为，与第一客户端110的第一特征数据组中的多个特征数据一一对应的权重；

举例说明，A训练得到的联邦学习模型参数为：与对应的权重/>与/>对应的权重/>和与/>对应的权重/>

那么，相应的，利用第一客户端110训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值，可以包括：

利用与第一客户端110的第一特征数据组中的多个特征数据一一对应的权重，对第一特征数据组中的各个特征数据对应加权，并对所有加权后的特征数据求和，得到第一加权值；对第一加权值进行同态加密，得到第一加密加权值。

举例说明：

A计算并将上述三个加权后的特征数据求和，得到第一加权值为/>

A对第一加权值进行同态加密，得到第一加密加权值[[u^A]]。

A将第一加密加权值[[u^A]]发送给服务端130。

2)针对于第二客户端120的介绍内容如下：

本发明实施例中，第二客户端120为，与第一客户端110预先完成联邦学习模型训练的其他机构的客户端。第二客户端120具体执行以下两个步骤：

①，每个第二客户端120利用接收到的加密数据，确定目标用户在该第二客户端120的第二目标特征数据组；

其中，利用接收到的加密数据，确定目标用户在该第二客户端120的第二目标特征数据组，具体可以包括：

每个第二客户端120，利用第一标识数据的加密数据，判断该第二客户端120是否存在第一标识数据；如果是，将该第二客户端120中第一标识数据对应的特征数据组确定为目标用户在该第二客户端120的第二目标特征数据组，如果否，对接收到的第二预测特征数据组的加密数据进行解密，得到第二预测特征数据组，并将第二预测特征数据组确定为目标用户在该第二客户端120的第二目标特征数据组。

以前文的A和B继续说明：

B利用U的加密数据，通过加密的用户对齐技术，确定自身的标识数据中是否有U，如果是，B将自身的用户数据中，U对应的特征数据组确定为U在B中的第二目标特征数据组，可以理解的是，/>也包括/>两个特征数据；如果否，B对接收到的/>的加密数据进行解密，得到/>并将/>确定为U在B中的第二目标特征数据组。

②，每个第二客户端120利用该第二客户端120训练得到的联邦学习模型参数，获得第二目标特征数据组的第二加密加权值，并将第二加密加权值发送给服务端130。

需要说明的是，第二客户端120训练得到的联邦学习模型参数为，与第二客户端120的特征数据组中的多个特征数据一一对应的权重；可以理解的是，第二客户端120训练得到的联邦学习模型参数与第二客户端120的第二目标特征数据组中的多个特征数据是一一对应的。

例如B训练得到的联邦学习模型参数为：与对应的权重/>与/>对应的权重/>

那么，相应的，利用该第二客户端120训练得到的联邦学习模型参数，获得第二目标特征数据组的第二加密加权值，可以包括：

利用与第二客户端120的第二目标特征数据组中的多个特征数据一一对应的权重，对第二目标特征数据组中的各个特征数据对应加权，并对所有加权后的特征数据求和，得到第二加权值；对第二加权值进行同态加密，得到第二加密加权值。

举例说明：

B计算并将上述两个加权后的特征数据求和，得到第二加权值为/>

B对第二加权值进行同态加密，得到第二加密加权值[[u^B]]。

B将第二加密加权值[[u^B]]发送给服务端130。

3)针对于服务端130的介绍内容如下：

本发明实施例中，服务端130为，协助第一客户端110、第二客户端120完成联邦学习模型训练的一个服务端，即为前文的第三方协作者C。

服务端130对接收到的第一加密加权值和第二加密加权值求和，并对求和结果进行解密，得到目标用户的目标标签数据，并将目标标签数据返回给第一客户端110。以完成对目标用户的目标标签数据的预测过程。

举例说明：服务端130，也就是C，对接收到的第一加密加权值和第二加密加权值求和，得到：

并对上述求和结果解密，得到目标用户U的目标标签数据/>并把标签数据y返回给A。至此完成目标用户U的标签数据的预测。

可选的，在第一客户端110接收到目标标签数据后，可以进行显示，也可以将目标标签数据发送给目标用户。

本发明实施例中，和现有联邦学习标签数据预测系统相比，拥有联邦学习模型的服务端，从某个第二客户端接收到的第二加密加权值是，待预测方的第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组后，针对该第二客户端，利用第一客户端的对偶模型，预测第一特征数据组在该第二客户端的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端，再由该第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得的第二目标特征数据组的加密加权值。因此，可以在第二客户端没有目标用户的特征数据组时，利用第一客户端对偶预测的第二预测特征数据组作为第二客户端的第二目标特征数据组，即在数据缺失的情况下补充数据，增加了联邦学习模型的用户数据。

本发明实施例中，通过对偶学习的方式，可以学习双方共有用户数据之间的内在联系，通过对偶学习可以从一方准确地推断另一方加密的数据，而不泄露隐私或导致原始数据丢失。对偶模型经过训练并采用对偶交叉验证来提高补充数据的可靠性，使得训练得到的对偶模型具有一定的对偶预测准确性，可以利用独属于一方的非共有用户数据，推测另一方的用户数据，由于推测得到的用户数据在另一方中并不存在，即第二预测特征数据组在第二客户端中并未真实存在，因此，不会泄露第二客户端的用户隐私，避免了隐私泄露问题。通过对偶预测，利用一方独有的用户数据和由这部分用户数据预测的对方用户数据，可以大幅补充原有的共有用户数据集，为联邦学习模型增加可靠的样本数据，从而能够有效解决纵向联邦学习中共有用户少引发的共有用户数据集不足的问题，能够提升标签数据的预测效果，达到与非分布式学习媲美的预测准确率。而且，由于本发明实施例实施过程中数据结构几乎无损，应用该联邦对偶学习框架的用户标签预测系统可扩展到各种有效的模型，具有广泛的应用前景。

在上述训练完成的联邦学习模型基础上，第三方面，本发明实施例提供了一种用户标签数据预测方法，请参见图4，图4为本发明实施例所提供的一种用户标签数据预测方法的流程示意图。关于联邦学习模型的训练过程参见前文，在此不做赘述。第一客户端和至少一个第二客户端为前述的联邦学习模型训练过程中的多个目标客户端。该方法包括以下步骤：

S401，第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组，针对每个第二客户端，利用第一客户端的对偶模型，预测第一特征数据组在该第二客户端的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端；并且，利用第一客户端训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值，并将第一加密加权值发送给服务端；

S402，每个第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得第二目标特征数据组的第二加密加权值，并将第二加密加权值发送给服务端；

S403，服务端对接收到的第一加密加权值和第二加密加权值求和，并对求和结果进行解密，得到目标用户的目标标签数据，并将目标标签数据返回给第一客户端；

其中，第一客户端、至少一个第二客户端各自拥有预先训练的对偶模型；服务端拥有预先训练的联邦学习模型；联邦学习模型是第一客户端和至少一个第二客户端作为参与训练的目标客户端，经过加密对偶训练扩展共有用户数据集后，借助服务端进行联邦学习得到的；且参与训练的目标客户端中，有一个目标客户端用于联邦学习模型训练的用户数据中包括标签数据。

可选的，利用第一客户端训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值，可以包括：

利用与第一客户端的第一特征数据组中的多个特征数据一一对应的权重，对第一特征数据组中的各个特征数据对应加权，并对所有加权后的特征数据求和，得到第一加权值；

对第一加权值进行同态加密，得到第一加密加权值。

其中，第一客户端训练得到的联邦学习模型参数为，与第一客户端的第一特征数据组中的多个特征数据一一对应的权重。

可选的，在第一客户端接收到目标标签数据后，可以进行显示，也可以将目标标签数据发送给目标用户。

可选的，利用第二客户端训练得到的联邦学习模型参数，获得第二目标特征数据组的第二加密加权值，可以包括：

利用与第二客户端的第二目标特征数据组中的多个特征数据一一对应的权重，对第二目标特征数据组中的各个特征数据对应加权，并对所有加权后的特征数据求和，得到第二加权值；

对第二加权值进行同态加密，得到第二加密加权值。

其中，第二客户端训练得到的联邦学习模型参数为，与第二客户端的第二目标特征数据组中的多个特征数据一一对应的权重。

可选的，第二客户端利用接收到的加密数据，确定目标用户在第二客户端的第二目标特征数据组，包括：

第二客户端利用第一标识数据的加密数据，判断第二客户端是否存在第一标识数据；

如果是，将第二客户端中第一标识数据对应的特征数据组确定为目标用户在第二客户端的第二目标特征数据组，如果否，对接收到的第二预测特征数据组的加密数据进行解密，得到第二预测特征数据组，并将第二预测特征数据组确定为目标用户在第二客户端的第二目标特征数据组。

关于联邦学习模型的训练过程以及其他内容，请参见前文，在此不做赘述。

本发明实施例中，和现有联邦学习标签数据预测方法相比，待预测方的第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组后，针对每个第二客户端，利用第一客户端的对偶模型，预测第一特征数据组在该第二客户端的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端，再由该第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得的第二目标特征数据组的第二加密加权值。即拥有联邦学习模型的服务端，从该第二客户端接收到的第二加密加权值是基于第一客户端的对偶预测确定的，因此，可以在第二客户端没有目标用户的特征数据组时，利用第一客户端对偶预测的第二预测特征数据组作为第二客户端的第二目标特征数据组，即在数据缺失的情况下补充数据，增加了联邦学习模型的用户数据。

本发明实施例中，通过对偶学习的方式，可以学习双方共有用户数据之间的内在联系，通过对偶学习可以从一方准确地推断另一方加密的数据，而不泄露隐私或导致原始数据丢失。对偶模型经过训练并采用对偶交叉验证来提高补充数据的可靠性，使得训练得到的对偶模型具有一定的对偶预测准确性，可以利用独属于一方的非共有用户数据，推测另一方的用户数据，由于推测得到的用户数据在另一方中并不存在，即第二预测特征数据组在第二客户端中并未真实存在，因此，不会泄露第二客户端的用户隐私，避免了隐私泄露问题。通过对偶预测，利用一方独有的用户数据和由这部分用户数据预测的对方用户数据，可以大幅补充原有的共有用户数据集，为联邦学习模型增加可靠的样本数据，从而能够有效解决纵向联邦学习中共有用户少引发的共有用户数据集不足的问题，能够提升标签数据的预测效果，达到与非分布式学习媲美的预测准确率。而且，由于本发明实施例实施过程中数据结构几乎无损，应用该联邦对偶学习框架的用户标签预测方法可扩展到各种有效的模型，具有广泛的应用前景。

在上述训练完成的联邦学习模型基础上，第四方面，本发明实施例提供了另一种用户标签数据预测方法，请参见图5，图5为本发明实施例所提供的另一种用户标签数据预测方法的流程示意图。关于联邦学习模型的训练过程参见前文，在此不做赘述。

本发明实施例所提供的一种用户标签数据预测方法，应用于用户标签数据预测系统的第一客户端，系统还包括至少一个第二客户端，以及服务端；第一客户端和至少一个第二客户端为前述的联邦学习模型训练过程中的多个目标客户端。如图5所示，该方法可以包括如下步骤：

S501，获取待预测标签数据的目标用户的第一标识数据和第一特征数据组；

S502，针对每个第二客户端，利用第一客户端的对偶模型，预测第一特征数据组在该第二客户端的第二预测特征数据组；

S503，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端；以使得每个第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，并利用该第二客户端训练得到的联邦学习模型参数，获得第二目标特征数据组的第二加密加权值，并将第二加密加权值发送给服务端；

S504，利用第一客户端训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值，并将第一加密加权值发送给服务端；以使得服务端对接收到的第一加密加权值和第二加密加权值求和，并对求和结果进行解密，得到目标用户的目标标签数据，并将目标标签数据返回给第一客户端；

S505，接收服务端返回的目标标签数据；

针对S501-S505的内容，参见第一方面的联邦学习模型的训练过程、第二方面的用户标签数据预测系统，以及第三方面的用户标签数据预测方法的相关内容，在此不做赘述。

为了对本发明实施例所提出的用户标签数据预测系统和用户标签数据预测方法进行形象理解，以风控信贷领域内，对小微企业的信贷逾期概率的预测作为一个具体应用实例进行说明。

目前，银行十分重视如何规避风险并降低小微企业借贷不良率，因此大多数银行都将白名单机制用于小微企业贷款的风险管理，而白名单是通过筛选规则和风险模型来实现的。规则和风险模型都取决于小型和微型企业及其控制者的相关数据。对于风险管理，相关数据可以包括中央银行的信用报告、税收、声誉、财务、无形资产等。但是，对银行而言，实际上只有中央银行的信用报告，拿不到其他有效信息。而使用本发明实施例所提供的预测系统/方法，通过联合企业的用户数据共同建立纵向联邦学习模型，可以避免数据泄漏，同时扩大企业和银行的共有用户数据集，提高信贷逾期概率的预测效果。

具体的，首先，拥有企业用户数据的A和银行B建立纵向联邦学习模型并完成训练。具体包括以下步骤：

(1)A和B获取各自的用户数据，如下表1所示；

A可以为拥有多个企业的用户数据的客户端，可以由企业信任的金融、税务或者政府机构承担，A的用户数据中，标识数据为企业的ID，具体为纳税人识别号。A的特征数据组包括特征数据x₁和特征数据x₂，x₁表示企业的近三个月开票金额，x₂表示企业的近六个月开票金额。

B为银行的客户端，B的用户数据中，标识数据为企业的ID，具体为纳税人识别号。B的特征数据组包括特征数据x₃，x₃表示央行征信分，B还拥有标签数据y，y表示企业的信贷逾期概率。

需要说明的是，表1中的数据仅仅作为示例，在实际中，A和B的用户数目不一定相同；A的特征数据的维度(表1示例为2)，与B的特征数据和标签数据维度之和(表1示例为2)也不一定相同。

表1企业方A和银行方B的原始用户数据

/>

(2)A和B确定共有用户，得到共有用户数据集；

A和B通过加密的用户对齐技术，确定双方共有的ID是U₁～U₄，从而确定共有用户数据集为双方U₁～U₄对应的用户数据集合，即

(3)A建立对偶模型M_A，B建立对偶模型M_B，将共有用户数据集划分为训练集和测试集，其中，训练集为双方U₁～U₃对应的用户数据集合，测试集为双方U₄对应的用户数据集合，并且A和B对训练集中的自身用户数据加密，得到各自的加密用户数据；

(4)A和B在训练集上进行对偶模型的训练过程，参见前文步骤S1033的训练过程，具体过程不再赘述。通过N次对偶模型的训练，A和B的对偶模型参数被更新，但各自的用户数据并未发生变化；

(5)A和B进行对偶模型的验证过程：

B选取不属于D_C且含有标签数据的所有用户数据，即U₅～U₇的用户数据，作为新增用户数据，即为：

Z^B＝[(U₅,600,0.90),(U₆,520,0.81),(U₇,600,0.32)]；

利用M_B预测U₅～U₇在A的特征数据x₁和x₂，得到新增预测用户数据

基于训练集，进行联邦学习模型M_F1的训练，并在测试集上验证标签数据y的预测准确率，获得第一预测准确率；

在加入Z^B以及的训练集上进行联邦学习模型M_F2的训练，并在测试集上验证标签数据y的预测准确率，获得第二预测准确率；

判断第二预测准确率与第一预测准确率的差值是否小于预设阈值T＝0.12，若是，则满足对偶模型收敛条件，若否则继续进行对偶模型训练，直至通过联邦对偶交叉验证满足对偶模型收敛条件，得到A和B训练完成的对偶模型；

(6)A和B利用各自训练完成的对偶模型互相进行对偶预测，以补充各自的标识数据和特征数据组；如表2所示，其中粗体字为预测补充的特征数据。

表2对偶预测后AB的用户数据

(7)A和B确定扩展的共有用户数据集；

如表2所示，A和B的U₁～U₁₀的用户数据即为扩展的共有用户数据集，可见，表2所示的扩展的共有用户数据集相比表1的共有用户数据集，双方共有的ID大大增加，特征数据也有明显的补充。

(8)A和B基于扩展的共有用户数据集，在服务端C的协助下，进行联邦学习模型训练，直至达到联邦学习模型收敛条件，获得训练完成的联邦学习模型。

关于该步骤的联邦学习模型训练过程，参见S104以及现有技术有关描述，在此不再赘述。训练结束后，C保存有联邦学习模型，A有联邦学习模型权重和/>分别与x₁和x₂对应，B有联邦学习模型权重/>其与x₃对应。

其次，A期望对一个新增用户U₁₁预测其信贷逾期概率y，具体过程可以包括：

A获取U₁₁的ID和第一特征数据组其中，/>包括/>两个特征数据。A利用其对偶模型M_A，预测/>在B的第二预测特征数据组/>包括特征数据/>

A分别对U₁₁和加密，并将U₁₁的加密数据和/>的加密数据发送给B；

A计算第一加权值为对其进行同态加密，得到第一加密加权值[[u^A]]，并将[[u^A]]发送给C；

B对U₁₁的加密数据利用加密的用户对齐技术，确定自身的ID中是否有U₁₁，如果是，B将自身的用户数据中，U₁₁对应的特征数据组确定为U₁₁在B中的第二目标特征数据组，如果否，B对接收到的/>的加密数据进行解密，得到/>并将/>确定为U₁₁在B中的第二目标特征数据组；

针对于表2，很显然，B中不存在U₁₁，那么，B将接收到的的加密数据进行解密，得到/>并将/>确定为U₁₁在B中的第二目标特征数据组；

B计算第二加权值为对其进行同态加密，得到第二加密加权值[[u^B]]，并将[[u^B]]发送给C；

C计算并对上述求和结果解密，得到目标用户U₁₁的标签数据/>并把标签数据y返回给A。即A得到了预测到的关于U₁₁是否信贷逾期的标签数据。比如预测到的U₁₁是否信贷逾期的标签数据为0.45，即表示U₁₁信贷逾期的概率为0.45。

当然，B也可以对表2中未出现的一个新ID进行标签数据的预测，预测过程与上述过程类似；A也可以对其不具有标签数据的一个ID进行上述预测过程，比如，ID可以为U₈～U₁₀中的一个；B也可以对其不具有标签数据的一个ID进行上述预测过程，比如ID可以为U₈～U₁₀中的一个，预测过程类似，在此不再赘述。

相应于第三方面的用户标签数据预测方法，第五方面，本发明实施例提供了一种用户标签数据预测装置，应用于用户标签数据预测系统的第一客户端，系统还包括至少一个第二客户端，以及服务端。第一客户端和至少一个第二客户端为前述的联邦学习模型训练过程中的多个目标客户端。其中，关于联邦学习模型的训练过程参见前文，在此不做赘述。

请参见图6，图6为本发明实施例所提供的一种用户标签数据预测装置的结构示意图。装置包括：

获取模块610，用于获取待预测标签数据的目标用户的第一标识数据和第一特征数据组；

预测模块620，用于针对每个第二客户端，利用第一客户端的对偶模型，预测第一特征数据组在该第二客户端的第二预测特征数据组；

第一加密发送模块630，用于将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端；以使得每个第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，并利用该第二客户端训练得到的联邦学习模型参数，获得第二目标特征数据组的第二加密加权值，并将第二加密加权值发送给服务端；

第二加密发送模块640，用于利用第一客户端训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值，并将第一加密加权值发送给服务端；以使得服务端对接收到的第一加密加权值和第二加密加权值求和，并对求和结果进行解密，得到目标用户的目标标签数据，并将目标标签数据返回给第一客户端；

接收模块650，用于接收服务端返回的目标标签数据；

针对用户标签数据预测装置各个模块的内容，参见前文的联邦学习模型的训练过程和用户标签数据预测系统，以及用户标签数据预测方法的相关内容，在此不做赘述。

可选的，第二加密发送模块640包括：

加密子模块，用于利用第一客户端训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值；

发送子模块，用于并将第一加密加权值发送给服务端。

可选的，加密子模块具体包括：

加权单元，用于利用与第一客户端的第一特征数据组中的多个特征数据一一对应的权重，对第一特征数据组中的各个特征数据对应加权，并对所有加权后的特征数据求和，得到第一加权值；

加密单元，用于对第一加权值进行同态加密，得到第一加密加权值。

本发明实施例中，和现有联邦学习标签数据预测装置相比，待预测方的第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组后，针对每个第二客户端，利用第一客户端的对偶模型，预测第一特征数据组在该第二客户端的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端，再由该第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得的第二目标特征数据组的第二加密加权值。即拥有联邦学习模型的服务端，从该第二客户端接收到的第二加密加权值是基于第一客户端的对偶预测确定的，因此，可以在第二客户端没有目标用户的特征数据组时，利用第一客户端对偶预测的第二预测特征数据组作为第二客户端的第二目标特征数据组，即在数据缺失的情况下补充数据，增加了联邦学习模型的用户数据。

本发明实施例中，通过对偶学习的方式，可以学习双方共有用户数据之间的内在联系，通过对偶学习可以从一方准确地推断另一方加密的数据，而不泄露隐私或导致原始数据丢失。对偶模型经过训练并采用对偶交叉验证来提高补充数据的可靠性，使得训练得到的对偶模型具有一定的对偶预测准确性，可以利用独属于一方的非共有用户数据，推测另一方的用户数据，由于推测得到的用户数据在另一方中并不存在，即第二预测特征数据组在第二客户端中并未真实存在，因此，不会泄露第二客户端的用户隐私，避免了隐私泄露问题。通过对偶预测，利用一方独有的用户数据和由这部分用户数据预测的对方用户数据，可以大幅补充原有的共有用户数据集，为联邦学习模型增加可靠的样本数据，从而能够有效解决纵向联邦学习中共有用户少引发的共有用户数据集不足的问题，能够提升标签数据的预测效果，达到与非分布式学习媲美的预测准确率。而且，由于本发明实施例实施过程中数据结构几乎无损，应用该联邦对偶学习框架的用户标签预测装置可扩展到各种有效的模型，具有广泛的应用前景。

相应于第三方面的用户标签数据预测方法，第六方面，本发明实施例还提供了一种电子设备，用于用户标签数据预测，请参见图7，图7为本发明实施例所提供的一种用于用户标签数据预测的电子设备的结构示意图。如图7所示，包括处理器701、通信接口702、存储器703和通信总线704，其中，处理器701，通信接口702，存储器703通过通信总线704完成相互间的通信，

存储器703，用于存放计算机程序；

处理器701，用于执行存储器703上所存放的程序时，实现如下步骤：

第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组，针对每个第二客户端，利用第一客户端的对偶模型，预测第一特征数据组在该第二客户端的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端；并且，利用第一客户端训练得到的联邦学习模型参数，获得第一特征数据组的第一加密加权值，并将第一加密加权值发送给服务端；

每个第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得第二目标特征数据组的第二加密加权值，并将第二加密加权值发送给服务端；

服务端对接收到的第一加密加权值和第二加密加权值求和，并对求和结果进行解密，得到目标用户的目标标签数据，并将目标标签数据返回给第一客户端；

具体的，该电子设备可以为：台式计算机、便携式计算机、智能移动终端、服务器等。在此不作限定，任何可以实现本发明的电子设备，均属于本发明的保护范围。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

通过上述电子设备，和现有联邦学习标签数据预测方法相比，待预测方的第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组后，针对每个第二客户端，利用第一客户端的对偶模型，预测第一特征数据组在该第二客户端的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端，再由该第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得的第二目标特征数据组的第二加密加权值。即拥有联邦学习模型的服务端，从该第二客户端接收到的第二加密加权值是基于第一客户端的对偶预测确定的，因此，可以在第二客户端没有目标用户的特征数据组时，利用第一客户端对偶预测的第二预测特征数据组作为第二客户端的第二目标特征数据组，即在数据缺失的情况下补充数据，增加了联邦学习模型的用户数据。

相应于第三方面的用户标签数据预测方法，第七方面，本发明实施例还提供了一种计算机可读存储介质，用于用户标签数据预测。该计算机可读存储介质内存储有计算机程序，计算机程序被处理器执行时，可以实现本发明实施例第三方面所提供的用户标签数据预测方法的步骤。

上述计算机可读存储介质存储在运行时，执行本发明实施例所提供的用户标签数据预测方法的应用程序，因此能够实现：和现有联邦学习标签数据预测方法相比，待预测方的第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组后，针对每个第二客户端，利用第一客户端的对偶模型，预测第一特征数据组在该第二客户端的第二预测特征数据组，将第一标识数据和第二预测特征数据组的加密数据发送给该第二客户端，再由该第二客户端利用接收到的加密数据，确定目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得的第二目标特征数据组的第二加密加权值。即拥有联邦学习模型的服务端，从该第二客户端接收到的第二加密加权值是基于第一客户端的对偶预测确定的，因此，可以在第二客户端没有目标用户的特征数据组时，利用第一客户端对偶预测的第二预测特征数据组作为第二客户端的第二目标特征数据组，即在数据缺失的情况下补充数据，增加了联邦学习模型的用户数据。

对于电子设备以及计算机可读存储介质实施例而言，由于其所涉及的方法内容基本相似于前述的方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，本发明实施例的装置、电子设备及存储介质分别是应用上述用户标签数据预测方法的装置、电子设备及存储介质，则上述用户标签数据预测方法的所有实施例均适用于该装置、电子设备及存储介质，且均能达到相同或相似的有益效果。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种用户标签数据预测系统，其特征在于，包括第一客户端、至少一个第二客户端，以及服务端：

所述第一客户端，用于获取待预测标签数据的目标用户的第一标识数据和第一特征数据组，针对每个第二客户端，利用所述第一客户端的对偶模型，预测所述第一特征数据组在该第二客户端的第二预测特征数据组，将所述第一标识数据和所述第二预测特征数据组的加密数据发送给该第二客户端；并且，利用所述第一客户端训练得到的联邦学习模型参数，获得所述第一特征数据组的第一加密加权值，并将所述第一加密加权值发送给所述服务端；

每个第二客户端，用于利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得所述第二目标特征数据组的第二加密加权值，并将所述第二加密加权值发送给所述服务端；

所述服务端，用于对接收到的所述第一加密加权值和所述第二加密加权值求和，并对求和结果进行解密，得到所述目标用户的目标标签数据，并将所述目标标签数据返回给所述第一客户端；

其中，所述第一客户端、所述至少一个第二客户端各自拥有预先训练的对偶模型；所述服务端拥有预先训练的联邦学习模型；所述联邦学习模型是所述第一客户端和所述至少一个第二客户端作为参与训练的目标客户端，经过加密对偶训练扩展共有用户数据集后，借助所述服务端进行联邦学习得到的；且参与训练的目标客户端中，有一个目标客户端用于联邦学习模型训练的用户数据中包括标签数据；

其中，所述联邦学习模型的训练过程包括：

参与联邦学习模型训练的多个目标客户端分别获取各自的用户数据；所述用户数据包括标识数据和特征数据组，且有一个目标客户端的用户数据还包括标签数据；

所述多个目标客户端确定共有用户，得到共有用户数据集；

所述多个目标客户端基于所述共有用户数据集进行加密对偶学习，将各个目标客户端的标识数据增加至所述多个目标客户端的标识数据的并集，并补全各个目标客户端的特征数据组，得到所述多个目标客户端扩展的共有用户数据集；

所述多个目标客户端基于所述扩展的共有用户数据集，在所述服务端的协助下，进行联邦学习模型训练，直至达到联邦学习模型收敛条件，获得训练完成的联邦学习模型；

其中，所述多个目标客户端基于所述共有用户数据集进行加密对偶学习，将各个目标客户端的标识数据增加至所述多个目标客户端的标识数据的并集，并补全各个目标客户端的特征数据组，得到所述多个目标客户端扩展的共有用户数据集，包括：

所述多个目标客户端各自建立对偶模型，所述对偶模型用于预测本目标客户端用户的特征数据组在其他目标客户端的特征数据组；

所述多个目标客户端将所述共有用户数据集划分为训练集和测试集，并对所述训练集中属于本目标客户端的用户数据进行加密，得到所述多个目标客户端各自的加密用户数据；

所述多个目标客户端迭代性地基于各自的加密用户数据和对偶模型，进行对偶预测、梯度数据计算，并加密互传各自的计算结果，更新各自的对偶模型参数，直至利用所述训练集和所述测试集进行联邦对偶交叉验证，判定满足对偶模型收敛条件时停止迭代，获得各自训练完成的对偶模型；

所述多个目标客户端利用各自训练完成的对偶模型进行相互预测，获得各自补充后的标识数据，所述补充后的标识数据为所述多个目标客户端的标识数据的并集；以及，通过预测本目标客户端的特征数据组在其他目标客户端的特征数据组，获得所述多个目标客户端各自补全的特征数据组；

根据所述多个目标客户端各自的所述补充后的标识数据和所述补全的特征数据组，得到所述多个目标客户端扩展的共有用户数据集。

2.根据权利要求1所述的系统，其特征在于，所述利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，包括：

每个第二客户端，利用所述第一标识数据的加密数据，判断该第二客户端是否存在所述第一标识数据；

如果是，将该第二客户端中所述第一标识数据对应的特征数据组确定为所述目标用户在该第二客户端的第二目标特征数据组，如果否，对接收到的所述第二预测特征数据组的加密数据进行解密，得到所述第二预测特征数据组，并将所述第二预测特征数据组确定为所述目标用户在该第二客户端的第二目标特征数据组。

3.根据权利要求1所述的系统，其特征在于，所述更新各自的对偶模型参数，包括：

所述多个目标客户端分别基于接收到的计算结果，获得各自的损失函数的梯度值；

所述多个目标客户端分别利用各自的损失函数的梯度值，更新各自的对偶模型参数。

4.根据权利要求3所述的系统，其特征在于，所述利用所述训练集和所述测试集进行联邦对偶交叉验证，包括：

所述多个目标客户端中，含有标签数据的目标客户端，从自身多个用户数据中选取含有标签数据，且不属于所述共有用户数据集的所有用户数据作为新增用户数据，利用该目标客户端的对偶模型获得所述新增用户数据在其余目标客户端的新增预测用户数据；

所述多个目标客户端基于所述训练集进行第一次联邦学习模型训练，并在所述测试集上验证标签数据的预测准确率，获得第一预测准确率；

所述多个目标客户端基于在所述训练集加入所述新增用户数据、所述新增预测用户数据之后的数据集，进行第二次联邦学习模型训练，并在所述测试集上验证标签数据的预测准确率，获得第二预测准确率；

所述多个目标客户端判断所述第二预测准确率与所述第一预测准确率的差值是否小于预设阈值，若是，则满足对偶模型收敛条件。

5.一种用户标签数据预测方法，其特征在于，所述方法包括：

第一客户端获取待预测标签数据的目标用户的第一标识数据和第一特征数据组，针对每个第二客户端，利用所述第一客户端的对偶模型，预测所述第一特征数据组在该第二客户端的第二预测特征数据组，将所述第一标识数据和所述第二预测特征数据组的加密数据发送给该第二客户端；并且，利用所述第一客户端训练得到的联邦学习模型参数，获得所述第一特征数据组的第一加密加权值，并将所述第一加密加权值发送给服务端；

每个第二客户端利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，利用该第二客户端训练得到的联邦学习模型参数，获得所述第二目标特征数据组的第二加密加权值，并将所述第二加密加权值发送给所述服务端；

服务端对接收到的所述第一加密加权值和所述第二加密加权值求和，并对求和结果进行解密，得到所述目标用户的目标标签数据，并将所述目标标签数据返回给所述第一客户端；

其中，所述联邦学习模型的训练过程包括：

所述多个目标客户端确定共有用户，得到共有用户数据集；

6.根据权利要求5所述的方法，其特征在于，所述利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，包括：

7.根据权利要求6所述的方法，其特征在于，所述更新各自的对偶模型参数，包括：

8.根据权利要求7所述的方法，其特征在于，所述利用所述训练集和所述测试集进行联邦对偶交叉验证，包括：

9.一种用户标签数据预测方法，其特征在于，应用于用户标签数据预测系统的第一客户端，所述系统还包括至少一个第二客户端，以及服务端，所述方法包括：

获取待预测标签数据的目标用户的第一标识数据和第一特征数据组；

针对每个第二客户端，利用所述第一客户端的对偶模型，预测所述第一特征数据组在该第二客户端的第二预测特征数据组；

将所述第一标识数据和所述第二预测特征数据组的加密数据发送给该第二客户端；以使得每个第二客户端利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，并利用该第二客户端训练得到的联邦学习模型参数，获得所述第二目标特征数据组的第二加密加权值，并将所述第二加密加权值发送给所述服务端；

利用所述第一客户端训练得到的联邦学习模型参数，获得所述第一特征数据组的第一加密加权值，并将所述第一加密加权值发送给所述服务端；以使得所述服务端对接收到的所述第一加密加权值和所述第二加密加权值求和，并对求和结果进行解密，得到所述目标用户的目标标签数据，并将所述目标标签数据返回给所述第一客户端；

接收所述服务端返回的所述目标标签数据；

其中，所述联邦学习模型的训练过程包括：

所述多个目标客户端确定共有用户，得到共有用户数据集；

10.一种用户标签数据预测装置，应用于用户标签数据预测系统的第一客户端，所述系统还包括至少一个第二客户端，以及服务端，所述装置包括：

获取模块，用于获取待预测标签数据的目标用户的第一标识数据和第一特征数据组；

预测模块，用于针对每个第二客户端，利用所述第一客户端的对偶模型，预测所述第一特征数据组在该第二客户端的第二预测特征数据组；

第一加密发送模块，用于将所述第一标识数据和所述第二预测特征数据组的加密数据发送给该第二客户端；以使得每个第二客户端利用接收到的加密数据，确定所述目标用户在该第二客户端的第二目标特征数据组，并利用该第二客户端训练得到的联邦学习模型参数，获得所述第二目标特征数据组的第二加密加权值，并将所述第二加密加权值发送给所述服务端；

第二加密发送模块，用于利用所述第一客户端训练得到的联邦学习模型参数，获得所述第一特征数据组的第一加密加权值，并将所述第一加密加权值发送给所述服务端；以使得所述服务端对接收到的所述第一加密加权值和所述第二加密加权值求和，并对求和结果进行解密，得到所述目标用户的目标标签数据，并将所述目标标签数据返回给所述第一客户端；

接收模块，用于接收所述服务端返回的所述目标标签数据；

其中，所述联邦学习模型的训练过程包括：

所述多个目标客户端确定共有用户，得到共有用户数据集；

11.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求5-8任一所述的方法步骤。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求5-8任一所述的方法步骤。

13.一种联邦学习模型训练方法，其特征在于，所述方法包括：

所述多个目标客户端确定共有用户，得到共有用户数据集；

所述多个目标客户端基于所述扩展的共有用户数据集，在服务端的协助下，进行联邦学习模型训练，直至达到联邦学习模型收敛条件，获得训练完成的联邦学习模型；