CN113159152A

CN113159152A - 基于树形结构的多标签联邦学习方法、控制器和介质

Info

Publication number: CN113159152A
Application number: CN202110392743.8A
Authority: CN
Inventors: 蔡文渊; 张坤坤; 高明; 周傲英; 徐林昊; 顾海林; 孙嘉
Original assignee: Shanghai Hipu Intelligent Information Technology Co ltd; East China Normal University
Current assignee: Shanghai Hipu Intelligent Information Technology Co ltd; East China Normal University
Priority date: 2021-04-13
Filing date: 2021-04-13
Publication date: 2021-07-23
Anticipated expiration: 2041-04-13
Also published as: CN113159152B

Abstract

本发明涉及一种基于树形结构的多标签联邦学习方法、控制器和介质，所述方法包括步骤S1、获取n个数据持有方中每一数据持有方对应的训练数据集；步骤S2、基于所述n个数据持有方的用户标签生成标签依赖关系树；步骤S3、以{X₁，X₂，...，X_n}∪G(Y_t(j))作为预测子模型M_t(j)的输入数据，以预测标签Y_t(j)作为预测子模型M_t(j)的输出数据，进行纵向联邦学习训练，并行训练生成预测子模型M_t(j)；步骤S4、待测用户的特征为{x¹，x²，...，xⁿ}，基于{x¹，x²，...，xⁿ}、标签依赖关系树和M_t(j)生成所述待测用户所有标签{y^t(1)，y^t(2)，...，y^t(n)}，y^t(j)表示待测用户对应于第t(j)个标签的预测值。本发明基于多标签之间的相互关系进行联邦学习，提高了模型精度和模型训练速度。

Description

基于树形结构的多标签联邦学习方法、控制器和介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于树形结构的多标签联邦学习方法、控制器和介质。

背景技术

纵向联邦学习指的是多个数据持有方的数据集中的用户重叠较多而用户特征重叠较少的情况下的联邦学习。纵向联邦学习的任务就是在保持数据本地化的情况下，共同训练出一个机器学习模型。多标签学习解决的是一个样本对应多个标签的机器学习的技术问题，例如：一张图片中可能即包含狗，也包含猫。相对的，传统的单标签学习解决的则是一个样本仅对应一个标签的机器学习的技术问题，例如：判断一张图片是猫的照片还是狗的照片。

传统的基于单标签的纵向联邦学习，已多有研究和应用。在多标签场景下，例如：在银行数据持有方与电商数据持有方的联邦学习场景中，电商数据持有方要预测用户是否会购买某件商品的标签，同时银行数据持有方要预测用户是否会如期还款的标签。按照现有技术的方案，可以将这个问题转化为两个独立的传统的单标签联邦学习问题：一个联邦学习模型用来预测用户是否会购买某件商品的标签；另一个联邦学习模型用来预测用户是否会如期还款的标签，两个模型互不相干。但是这样处理实际上忽略了两个标签的相互关系(如：“是否会如期还款”这个标签可能能够帮助判断“用户是否会购买某件商品”这个标签)，导致模型精度较低。由此可知，如何在模型训练过程中挖掘出多标签之间的相关关系，基于多标签之间的相互关系进行联邦学习，提高模型精度成为亟待解决的技术问题。

发明内容

本发明目的在于，提供一种基于树形结构的多标签联邦学习方法、控制器和介质，基于多标签之间的相互关系进行联邦学习，提高了模型精度和模型训练速度。

根据本发明第一方面，提供了一种基于树形结构的多标签联邦学习方法，包括：

步骤S1、获取n个数据持有方中每一数据持有方对应的训练数据集，n个数据持有方的用户是重叠的，每一数据持有方对应一个用户标签，第i数据持有方对应的第i训练数据集为(X_i,Y_i)，其中，

X_i表示i训练数据集的样本用户特征数据集，包括n_i个样本用户，每个样本用户有m_i个属性；Y_i表示i训练数据集的样本用户标签数据集，i表示数据持有方序号，i＝1,2,…,n，

y_ik∈R,k＝1,2,…,n_i；

步骤S2、基于所述n个数据持有方的用户标签生成标签依赖关系树，其中，t(j)表示第j号树节点对应的数据持有方序号，j＝1,2,…n，设置用户获取第t(j)个用户标签在所述标签依赖关系树中所有下层依赖标签集合的函数G(Y_t(j))；

步骤S3、以{X₁,X₂,…,X_n}∪G(Y_t(j))作为预测子模型M_t(j)的输入数据,以预测标签Y_t(j)作为预测子模型M_t(j)的输出数据,进行纵向联邦学习训练，并行训练生成预测子模型M_t(j)；

步骤S4、待测用户的特征为{x¹,x²,…,xⁿ}，xⁱ表示待测用户在第i个用户持有方对应的待测用户特征数据，基于{x¹,x²,…,xⁿ}、标签依赖关系树和M_t(j)生成所述待测用户所有标签{y^t(1),y^t(2),…,y^t(n)}，y^t(j)表示待测用户对应于第t(j)个标签的预测值。

根据本发明第二方面，提供一种电子设备，包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被设置为用于执行本发明第一方面所述的方法。

根据本发明第三方面，提供一种计算机可读存储介质，所述计算机指令用于执行本发明第一方面所述的方法。

本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案，本发明提供的一种基于树形结构的多标签联邦学习方法、控制器和介质可达到相当的技术进步性及实用性，并具有产业上的广泛利用价值，其至少具有下列优点：

本发明通过构建基于标签依赖树的联邦学习模型，将每一叶子节点所对应的标签数据加入到下一轮被其依赖的子模型对应的输入数据中，使得在模型训练过程中能够学习到多标签之间的相关关系，基于多标签之间的相互关系进行联邦学习，提高模型精度，且基于标签依赖树结构使得标签预测过程可以部分并行执行，提高了模型训练和模型计算的执行速度。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图,详细说明如下。

附图说明

图1为本发明实施例提供的基于n个数据持有方的用户标签生成标签依赖关系树示意图；

图2为本发明实施例提供的基于n个数据持有方的用户标签生成标签有向无环图示意图。

具体实施方式

为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例，对依据本发明提出的一种基于树形结构的多标签联邦学习方法、控制器和介质的具体实施方式及其功效，详细说明如后。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止，但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一、

本实施例提供了一种基于树形结构的多标签联邦学习方法，包括：

步骤S1、获取n个数据持有方中每一数据持有方对应的训练数据集，可以理解的是，每一数据持有方各自的训练数据集是存储在各自本地，模型训练过程中，每一数据持有方各自的训练数据集也始终存储在各自本地，n个数据持有方的用户是重叠的，每一数据持有方对应一个用户标签，第i数据持有方对应的第i训练数据集为(X_i,Y_i)，其中，

y_ik∈R,k＝1,2,…,n_i；

其中，可以理解的是，n个数据持有方的样本用户是重叠的，指的是n个数据持有方的样本用户是相同的，且样本用户是横向对齐的。n个数据持有方的数据属性数量可能相同也可能不同，同一数据持有方的每一样本用户的数据属性数量是相同的。

其中，可以随机初始化n个数据持有方的用户标签生成标签依赖关系树，也可根据每一用户标签的目标精确度来分组，目标精确度越高，标签分组越靠前。作为一种实施例，若t(1)＝5，则表示第5个数据持有方的标签对应标签依赖关系树中的第5号树节点。如图1所示用户标签生成标签依赖关系树结构，G(Y_t(2))＝{Y_t(5),Y_t(6),Y_t(7),…}。可以理解的是，图1的标签依赖关系树仅为一种示例，根据应用场景，数据等不同，构建的标签依赖关系树也不相同。

需要说明的是，联邦学习过程中，各个子模型M_t(j)是分散存储在各个数据持有方的，即，每个数据持有方只保有各个子模型M_t(j)的一部分，作为对应的本地预测子模型。以{X₁,X₂,…,X_n}∪G(Y_t(j))作为预测子模型M_t(j)的输入数据,具体指的是，在第j个子模型训练过程中，将标签依赖关系树中当前标签Y_t(j)的所有依赖标签也当作特征数据加入到训练集中，即将G(Y_t(j))中的用户标签数据加入该数据持有方对应的样本用户特征数据中，并作为M_t(j)在该数据持有方的本地预测子模型的输入数据，这样即可学习到标签之间的相互关系，且各个数据持有方的用户数据始终都存在自己的数据库中，子模型训练和使用过程中，各个数据持有方之间只传递模型更新参数。

可以理解的是，待测用户的特征也是分散存储在多个数据持有方中的，即每一数据持有方持有一部分待测用户的特征数据。

联邦学习涉及多个客户端，每一客户端可能有一个或多个标签，也可能没有标签，只有用户数据，因此，可将客户端的用户数据进行预处理，再从预处理后的数据中获取n个数据持有方中每一数据持有方对应的训练数据集，作为一种实施例，所述步骤S1可包括：

步骤S11、获取Z个客户端中每一客户端的数据，采用预设的对齐算法和隐私求交算法获取每一客户端中Z个客户端重叠的数据，作为每一客户端对应的用户数据，所述用户数据包括用户特征数据和用户标签数据；

需要说明的是，步骤S11中可以直接采用现有的对齐算法和隐私求交算法获取每一客户端中Z个客户端重叠的数据，现有的对齐算法和隐私求交算法在此不再赘述。

步骤S12、获取第z客户端数据中用户标签的类别数量W_z，并判断W_z是否大于等于2，若是，则构建W_z个第z客户端对应的数据持有方，并以所述第z客户端对应的用户数据中的每一类用户标签数据作为一个数据持有方对应的用户标签数据集，以所述第z客户端对应的用户特征数据作为每一数据持有方对应的用户特征数据集，构建W_z个训练数据集，为每一数据持有方划分一个对应的训练数据集，否则，执行步骤S13，z＝1,2，…Z；

步骤S13、构建一个第x客户端对应的数据持有方，并以第z客户端对应的用户标签数据作为用户标签数据集，以第z客户端对应的用户特征数据作为用户特征数据集，构建该数据持有方对应的训练数据集；

步骤S14、将基于所述Z个客户端数据生成的所有数据持有方的训练数据集，确定为所述n个数据持有方的训练数据集。

通过步骤S11-步骤S14即可使得n个数据持有方的训练数据集的每一数据持有方的训练数据集中的用户重叠对齐，且每一数据持有方对应一个用户标签。但可以理解的是，如果某一客户端只有用户特征数据集，没有对应的标签，也可将该客户端对应的用户特征数据集加入每轮训练的输入数据，参与训练。

作为一种实施例，步骤S2包括：

步骤S21、获取所述n个用户标签中每一用户标签的目标精确度，将n个用户标签划分为T组用户标签，其中，其中第一组用户标签包括一个目标精确度最高的用户标签，第二组用户标签至第T组用户标签中每组包括一个或多个用户标签，且第t-1组标签中目标精确度的最小值大于第t组标签中目标精确度的最大值,t＝2,3，…T；

其中，每一用户的目标精确度可根据具体应用场景来确定。

步骤S22、将第一组用户标签中的用户标签设置为所述标签依赖关系树的根节点，将第t组标签中用户标签对应设置为第t层节点，每一用户标签对应一个节点，每一第t层节点随机或根据预设的标签依赖关系连接一个第t-1层节点，生成所述标签依赖关系树，如图1所示的示例。

可以理解的是，基于标签依赖关系树，可以使得预测过程部分并行，可以加快整个标签预测的执行过程，标签预测阶段的循环次数等于标签依赖关系树的高度，因此可根据所需执行速度来设置标签依赖关系树的高度。因此，可以根据具体应用需求，在标签依赖关系树的设计的模型精度与执行速度之间达到均衡，也增加了模型的灵活性。

作为一种实施例，每一预测子模型M_t(j)包括分散存在所述n个数据持有方上的本地预测子模型

表示预测子模型M_t(j)在第i数据持有方上的本地预测子模型，所述步骤S3包括：

步骤S31、基于所述G(Y_t(j))和标签依赖关系树获取第t(j)个用户标签在所述标签依赖关系树中所有下层依赖标签集合，作为第t(j)依赖标签集合，判断所述第t(j)依赖标签集合是否为空，若是，执行步骤S32，否则，执行步骤S33；

步骤S32、将X_i作为

的输入数据，预测Y_t(j)作为M_t(j)的输出数据，进行纵向联邦学习训练，生成M_t(j)；

步骤S33、判断Y_i是否存在与所述第t(j)依赖标签集合中，若是，则

否则，

步骤S34、将

作为

的输入数据，将预测Y_t(j)作为M_t(j)的输出数据，进行纵向联邦学习训练，生成M_t(j)。

这样即可将G(Y_t(j))中的用户标签数据加入该数据持有方对应的样本用户特征数据中，并作为M_t(j)在该数据持有方的本地预测子模型的输入数据，这样即可学习到标签之间的相互关系。

当每一子模型输入数据和输出数据确认好后，可以选择预设的机器学习模型框架进行联邦学习，训练子模型，作为一种实施例，所述步骤S3中采用纵向神经网络的架构进行纵向联邦学习，生成M_t(j)，第i数据持有方上的本地预测子模型为

其中，u为第一神经网络模型深度，第t(j)数据持有方上的本地预测子模型还包括综合神经网络

其中，h为第一神经网络模型深度，所述步骤S3具体包括：

步骤S311、第i数据持有方将

对应的输入数据输入

生成对应的输出output_i,t(j)，发送给第t(j)数据持有方；

步骤S312、第t(j)数据持有方将接收到的output_i,t(j)按顺序拼接起来，生成

输入到第t(j)数据持有方的

生成

基于

Y_t(j)神经网络的损失函数获取损失值loss；

步骤S313、第t(j)数据基于loss反向计算第一梯度值并更新

并生成第i数据持有方对应的第二梯度值发送给第i数据持有方；

步骤S314、第i数据持有方基于对应的第二梯度值，继续反向传播计算

的梯度更新各个layer；

步骤S315、循环执行步骤S311-步骤S314，直至预测子模型M_t(j)收敛。

需要说明的是，步骤S315可以直接采用现有的判断模型收敛的方法判断预测子模型M_t(j)是否收敛，在此不再展开描述。

作为一种实施例，所述步骤S4可包括：

步骤S41、并行执行所述标签依赖关系树中叶子节点所对应的预测子模型；

步骤S42、将每一叶子节点所对应的预测子模型的预测输出加入到下一轮被其依赖的子模型对应的输入数据中；

步骤S43、将已经预测出的对应预测标签的叶子节点从所述标签依赖关系树中剔除，并判断当前所述标签依赖关系树是否为空，若是，则结束流程，否则，返回步骤S41。

进一步的，所述步骤S4具体可包括：

步骤S411、获取原始标签依赖关系树中原始叶子节点对应的数据持有方序号集{t(s1),t(s2),...t(sc)...}，其中，t(sc)表示第c个原始叶子节点对应的数据持有方序号，sc＝1,2,...n，c＝1,2..且c＜n，将xⁱ输入

并行执行所有M_t(sc)，生成y^t(sc)，并删除所述原始叶子节点；

步骤S412、获取当前标签依赖关系树中叶子节点对应的数据持有方序号集{t(p1),t(p2),...t(pc)...}，其中，t(pc)表示第c个当前叶子节点对应的数据持有方序号，pc＝1,2,...n，c＝1,2..且c＜n，获取原始标签依赖关系树中第t(pc)用户标签依赖节点对应的数据持有方序号集.{t(pc1),t(pc2),...t(pcd),...}以及{y^t(pc1),y^t(pc2),...y^t ^(pcd),...}，其中，t(pcd)表示第d个当前叶子节点对应的数据持有方序号，y^t(pcd)表示M_t(pcd)的预测结果，pcd＝1,2,...n，d＝1,2..且d＜n，则若i属于{t(pc1),t(pc2),...t(pcd),...}，则xⁱ＝xⁱ+y^t(pcd)，将xⁱ输入

并行执行所有M_t(pc)，生成y^t(pc)，并删除所有当前叶子节点；

步骤S413、判断当前标签依赖关系树是否为空，若是，则结束流程，否则，返回步骤S412。

通过步骤S411-步骤S413，最终生成所述待测用户所有标签{y^t(1),y^t(2),…,y^t(n)}，可以根据具体应用需要获取{y^t(1),y^t(2),…,y^t(n)}中的任意一个或多个值，作为目标数据。

本发明实施例一通过构建基于标签依赖树的联邦学习模型，将每一叶子节点所对应的标签数据加入到下一轮被其依赖的子模型对应的输入数据中，使得在模型训练过程中能够学习到多标签之间的相关关系，基于多标签之间的相互关系进行联邦学习，提高模型精度，且基于标签依赖树结构使得标签预测过程可以部分并行执行，提高了模型训练和模型计算的执行速度，标签预测阶段的循环次数等于标签依赖关系树的高度，因此可根据所需执行速度来设置标签依赖关系树的高度。因此，可以根据具体应用需求，在标签依赖关系树的设计的模型精度与执行速度之间达到均衡，也增加了模型的灵活性。

但可以理解的是，实施例一基于标签依赖树构建联邦学习模型，是适当牺牲了标签预测准确性为代价来换取标签预测速度的，以图1为例，当第t(7)数据方预测出对应标签值后，其标签会作为预测第t(2)数据方、第t(5)数据方、第t(1)数据方对应标签的输入数据特征。由于第t(7)数据方与第t(n)数据方是并行预测的，因此如果让第t(4)数据方也依赖第t(7)数据方不会影响第t(4)数据方的预测速度，且能提高整个模型的预测精度。因此，为了在提高速度的基础上，减少对模型准确度的影响，本发明进一步提出了实施例二。

实施例二、

本发明实施例还提供了一种基于多标签的联邦学习数据处理方法，包括：

步骤C1、获取n个数据持有方中每一数据持有方对应的训练数据集，可以理解的是，每一数据持有方各自的训练数据集是存储在各自本地，模型训练过程中，每一数据持有方各自的训练数据集也始终存储在各自本地，n个数据持有方的用户是重叠的，每一数据持有方对应一个用户标签，第i数据持有方对应的第i训练数据集为(X_i,Y_i)，其中，

y_ik∈R,k＝1,2,…,n_i；

步骤C2、基于所述n个数据持有方的用户标签生成标签有向无环图，其中，t(j)表示所述标签有向无环图第j号节点对应的数据持有方序号，j＝1,2,…n，设置用户获取第t(j)个用户标签在所述标签有向无环图中所有下层依赖标签集合的函数G(Y_t(j))；

其中，可以随机初始化n个数据持有方的用户标签生成标签有向无环图，也可根据每一用户标签的目标精确度来分组，目标精确度越高，标签分组越靠前。作为一种实施例，若t(1)＝5，则表示第5个数据持有方的标签对应标签有向无环图中的第5号节点。如图2所示的标签有向无环图，G(Y_t(3))＝{Y_t(5),Y_t(6),Y_t(7),…Y_t(n)}。需要说明的是，图2的标签有向无环图仅为一种示例，且并非是直接基于图1改进而来，与图1无直接关联，且根据应用场景，数据等不同，构建的标签有向无环图也不相同。

需要说明的是，联邦学习过程中，各个子模型M_t(j)是分散存储在各个数据持有方的，即，每个数据持有方只保有各个子模型M_t(j)的一部分，作为对应的本地预测子模型。以{X₁,X₂,…,X_n}∪G(Y_t(j))作为预测子模型M_t(j)的输入数据,具体指的是，在第j个子模型训练过程中，将标签有向无环图中当前标签Y_t(j)的所有依赖标签也当作特征数据加入到训练集中，即将G(Y_t(j))中的用户标签数据加入该数据持有方对应的样本用户特征数据中，并作为M_t(j)在该数据持有方的本地预测子模型的输入数据，这样即可学习到标签之间的相互关系，且各个数据持有方的用户数据始终都存在自己的数据库中，子模型训练和使用过程中，各个数据持有方之间只传递模型更新参数。

步骤C3、以{X₁,X₂,…,X_n}∪G(Y_t(j))作为预测子模型M_t(j)的输入数据,以预测标签Y_t(j)作为预测子模型M_t(j)的输出数据,进行纵向联邦学习训练，并行训练生成预测子模型M_t(j)；

步骤C4、待测用户的特征为{x¹,x²,…,xⁿ}，xⁱ表示待测用户在第i个用户持有方对应的待测用户特征数据，基于{x¹,x²,…,xⁿ}、标签有向无环图和M_t(j)生成所述待测用户所有标签{y^t(1),y^t(2),…,y^t(n)}，y^t(j)表示待测用户对应于第t(j)个标签的预测值。

联邦学习涉及多个客户端，每一客户端可能有一个或多个标签，也可能没有标签，只有用户数据，因此，可将客户端的用户数据进行预处理，再从预处理后的数据中获取n个数据持有方中每一数据持有方对应的训练数据集，作为一种实施例，所述步骤C1可包括：

步骤C11、获取Z个客户端中每一客户端的数据，采用预设的对齐算法和隐私求交算法获取每一客户端中Z个客户端重叠的数据，作为每一客户端对应的用户数据，所述用户数据包括用户特征数据和用户标签数据；

需要说明的是，步骤C11中可以直接采用现有的对齐算法和隐私求交算法获取每一客户端中Z个客户端重叠的数据，现有的对齐算法和隐私求交算法在此不再赘述。

步骤C12、获取第z客户端数据中用户标签的类别数量W_z，并判断W_z是否大于等于2，若是，则构建W_z个第z客户端对应的数据持有方，并以所述第z客户端对应的用户数据中的每一类用户标签数据作为一个数据持有方对应的用户标签数据集，以所述第z客户端对应的用户特征数据作为每一数据持有方对应的用户特征数据集，构建W_z个训练数据集，为每一数据持有方划分一个对应的训练数据集，否则，执行步骤C13，z＝1,2，…Z；

步骤C13、构建一个第x客户端对应的数据持有方，并以第z客户端对应的用户标签数据作为用户标签数据集，以第z客户端对应的用户特征数据作为用户特征数据集，构建该数据持有方对应的训练数据集；

步骤C14、将基于所述Z个客户端数据生成的所有数据持有方的训练数据集，确定为所述n个数据持有方的训练数据集。

通过步骤C11-步骤C14即可使得n个数据持有方的训练数据集的每一数据持有方的训练数据集中的用户重叠对齐，且每一数据持有方对应一个用户标签。但可以理解的是，如果某一客户端只有用户特征数据集，没有对应的标签，也可将该客户端对应的用户特征数据集加入每轮训练的输入数据，参与训练。

作为一种实施例，步骤C2包括：

步骤C21、获取所述n个用户标签中每一用户标签的目标精确度，将n个用户标签划分为T组用户标签，其中，每组用户标签包括一个或多个用户标签，且第t-1组标签中目标精确度的最小值大于第t组标签中目标精确度的最大值,t＝2,3，…T；

其中，每一用户的目标精确度可根据具体应用场景来确定。

步骤C22、将第一组用户标签中的用户标签设置为所述标签有向无环图的无被依赖节点，将第t组标签中用户标签对应设置为第t层节点，每一用户标签对应一个节点，每一第t层节点随机连接一个或多个第t-1层节点，生成所述标签有向无环图，如图2所示的示例。

可以理解的是，基于标签有向无环图，可以使得预测过程部分并行，可以加快整个标签预测的执行过程，且一个标签可以同时被多个标签依赖，既不会影响模型预测速度，又能够提高模型预测精度。标签预测阶段的循环次数等于标签有向无环图的最长依赖路径，因此可根据所需执行速度来设置标签有向无环图的最长依赖路径和标签有向无环图结构，且根据具体应用需求，可以在标签有向无环图的结构设计的模型精度与执行速度之间达到均衡，也增加了模型的灵活性。

表示预测子模型M_t(j)在第i数据持有方上的本地预测子模型，所述步骤C3包括：

步骤SC1、基于所述G(Y_t(j))和标签有向无环图获取第t(j)个用户标签在所述标签有向无环图中所有下层依赖标签集合，作为第t(j)依赖标签集合，判断所述第t(j)依赖标签集合是否为空，若是，执行步骤C32，否则，执行步骤C33；

步骤C32、将X_i作为

步骤C33、判断Y_i是否存在与所述第t(j)依赖标签集合中，若是，则

否则，

步骤C34、将

作为

当每一子模型输入数据和输出数据确认好后，可以选择预设的机器学习模型框架进行联邦学习，训练子模型，作为一种实施例，所述步骤C3中采用纵向神经网络的架构进行纵向联邦学习，生成M_t(j)，第i数据持有方上的本地预测子模型为

其中，h为第一神经网络模型深度，

具体包括：

步骤C311、第i数据持有方将

对应的输入数据输入

生成对应的输出output_i,t(j)，发送给第t(j)数据持有方；

步骤C312、第t(j)数据持有方将接收到的output_i,t(j)按顺序拼接起来，生成

输入到第t(j)数据持有方的

生成

基于

Y_t(j)神经网络的损失函数获取损失值loss；

步骤C313、第t(j)数据基于loss反向计算第一梯度值并更新

步骤SC14、第i数据持有方基于对应的第二梯度值，继续反向传播计算

的梯度更新各个layer；

步骤SC15、循环执行步骤C311-步骤C314，直至预测子模型M_t(j)收敛。

作为一种实施例，所述步骤C4包括：

步骤C41、并行执行所述标签有向无环图中无依赖节点所对应的预测子模型；

步骤C42、将每一无依赖节点所对应的预测子模型的预测输出加入到下一轮被其依赖的子模型对应的输入数据中；

步骤C43、将已经预测出的对应预测标签的无依赖节点从所述标签有向无环图中剔除，并判断当前所述标签标签有向无环图是否为空，若是，则结束流程，否则，返回步骤C41。

进一步的，所述步骤C4包括：

步骤C411、获取原始标签有向无环图中原始无依赖节点对应的数据持有方序号集{t(s1),t(s2),...t(sc)...}，其中，t(sc)表示第c个原始无依赖节点对应的数据持有方序号，sc＝1,2,...n，c＝1,2..且c＜n，将xⁱ输入

并行执行所有M_t(sc)，生成y^t(sc)，并删除所述原始无依赖节点；

步骤C412、获取当前标签有向无环图中无依赖节点对应的数据持有方序号集{t(p1),t(p2),...t(pc)...}，其中，t(pc)表示第c个当前无依赖节点对应的数据持有方序号，pc＝1,2,...n，c＝1,2..且c＜n，获取原始标签标签有向无环图中第t(pc)用户标签依赖节点对应的数据持有方序号集.{t(pc1),t(pc2),...t(pcd),...}以及{y^t(pc1),y^t ^(pc2),...y^t(pcd),...}，其中，t(pcd)表示第d个当前无依赖节点对应的数据持有方序号，y^t ^(pcd)表示M_t(pcd)的预测结果，pcd＝1,2,...n，d＝1,2..且d＜n，则若i属于{t(pc1),t(pc2),...t(pcd),...}，则xⁱ＝xⁱ+y^t(pcd)，将xⁱ输入

并行执行所有M_t(pc)，生成y^t(pc)，并删除所有当前无依赖节点；

步骤C413、判断当前标签标签有向无环图是否为空，若是，则结束流程，否则，返回步骤C412。

通过步骤C411-步骤C413，最终生成所述待测用户所有标签{y^t(1),y^t(2),…,y^t(n)}，可以根据具体应用需要获取{y^t(1),y^t(2),…,y^t(n)}中的任意一个或多个值，作为目标数据。

本发明实施例二通过构建基于标签有向无环图的联邦学习模型，将每一无依赖节点所对应的标签数据加入到下一轮被其依赖的子模型对应的输入数据中，使得在模型训练过程中能够学习到多标签之间的相关关系，基于多标签之间的相互关系进行联邦学习，提高模型精度，且基于标签有向无环图使得标签预测过程可以部分并行执行，不仅提高了模型训练和模型计算的执行速度，还基于标签有向无环图中一个标签被多个标签共同依赖的结构，进一步提高了模型精度。此外，标签预测阶段的循环次数等于标签有向无环图的最长依赖路径，因此可根据所需执行速度来设置标签有向无环图的最长依赖路径和标签有向无环图结构，且根据具体应用需求，可以在标签有向无环图的结构设计的模型精度与执行速度之间达到均衡，也增加了模型的灵活性。

本发明实施例还提供一种电子设备，包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被设置为用于执行本发明实施例一或实施例二所述的方法。

本发明实施例还提供一种计算机可读存储介质，所述计算机指令用于执行本发明实施例一或实施例二所述的方法。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明,任何熟悉本专业的技术人员，在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种基于树形结构的多标签联邦学习方法，其特征在于，包括：

步骤S1、获取n个数据持有方中每一数据持有方对应的训练数据集，n个数据持有方的用户是重叠的，每一数据持有方对应一个用户标签，第i数据持有方对应的第i训练数据集为(X_i，Y_i)，其中，

X_i表示i训练数据集的样本用户特征数据集，包括n_i个样本用户，每个样本用户有m_i个属性；Y_i表示i训练数据集的样本用户标签数据集，i表示数据持有方序号，i＝1，2，...，n，

y_ik∈R，k＝1，2，...，n_i；

步骤S2、基于所述n个数据持有方的用户标签生成标签依赖关系树，其中，t(j)表示第j号树节点对应的数据持有方序号，j＝1，2，...n，设置用户获取第t(j)个用户标签在所述标签依赖关系树中所有下层依赖标签集合的函数G(Y_t(j))；

步骤S3、以{X₁，X₂，...，X_n}∪G(Y_t(j))作为预测子模型M_t(j)的输入数据，以预测标签Y_t(j)作为预测子模型M_t(j)的输出数据，进行纵向联邦学习训练，并行训练生成预测子模型M_t(j)；

步骤S4、待测用户的特征为{x¹，x²，...，xⁿ}，xⁱ表示待测用户在第i个用户持有方对应的待测用户特征数据，基于{x¹，x²，...，xⁿ}、标签依赖关系树和M_t(j)生成所述待测用户所有标签{y^t(1)，y^t(2)，...，y^t(n)}，y^t(j)表示待测用户对应于第t(j)个标签的预测值。

2.根据权利要求1所述的方法，其特征在于，

优选的，所述步骤S1包括：

步骤S12、获取第z客户端数据中用户标签的类别数量W_z，并判断W_z是否大于等于2，若是，则构建W_z个第z客户端对应的数据持有方，并以所述第z客户端对应的用户数据中的每一类用户标签数据作为一个数据持有方对应的用户标签数据集，以所述第z客户端对应的用户特征数据作为每一数据持有方对应的用户特征数据集，构建W_z个训练数据集，为每一数据持有方划分一个对应的训练数据集，否则，执行步骤S13，z＝1，2，…Z；

3.根据权利要求1所述的方法，其特征在于，

优选的，步骤S2包括：

步骤S21、获取所述n个用户标签中每一用户标签的目标精确度，将n个用户标签划分为T组用户标签，其中，其中第一组用户标签包括一个目标精确度最高的用户标签，第二组用户标签至第T组用户标签中每组包括一个或多个用户标签，且第t-1组标签中目标精确度的最小值大于第t组标签中目标精确度的最大值，t＝2，3，…T；

步骤S22、将第一组用户标签中的用户标签设置为所述标签依赖关系树的根节点，将第t组标签中用户标签对应设置为第t层节点，每一用户标签对应一个节点，每一第t层节点随机或根据预设的标签依赖关系连接一个第t-1层节点，生成所述标签依赖关系树。

4.根据权利要求1所述的方法，其特征在于，

优选的，每一预测子模型M_t(j)包括分散存在所述个数据持有方上的本地预测子模型

步骤S32、将X_i作为

均输入数据，预测Y_t(j)作为M_t(j)的输出数据，进行纵向联邦学习训练，生成M_t(j)；

否则，

步骤S34、将

作为

5.根据权利要求4所述的方法，其特征在于，

所述步骤S3中采用纵向神经网络的架构进行纵向联邦学习，生成M_t(j)，第i数据持有方上的本地预测子模型为

其中，h为第一神经网络模型深度，所述步骤S3具体包括：

步骤S311、第i数据持有方将

对应的输入数据输入

生成对应的输出output_i，t(j)，发送给第t(j)数据持有方；

步骤S312、第t(j)数据持有方将接收到的output_i，t(j)按顺序拼接起来，生成

输入到第t(j)数据持有方的

生成

基于

Y_t(j)神经网络的损失函数获取损失值loss；

步骤S313、第t(j)数据基于loss反向计算第一梯度值并更新

并生成第_i数据持有方对应的第二梯度值发送给第i数据持有方；

的梯度更新各个layer；

6.根据权利要求1所述的方法，其特征在于，

所述步骤S4包括：

7.根据权利要求6所述的方法，其特征在于，

所述步骤S4包括：

步骤S411、获取原始标签依赖关系树中原始叶子节点对应的数据持有方序号集{t(s1)，t(s2)，...t(sc)...}，其中，t(sc)表示第c个原始叶子节点对应的数据持有方序号，sc＝1，2，...n，c＝1，2..且c＜n，将xⁱ输入

步骤S412、获取当前标签依赖关系树中叶子节点对应的数据持有方序号集{t(p1)，t(p2)，...t(pc)...}，其中，t(pc)表示第c个当前叶子节点对应的数据持有方序号，pc＝1，2，...n，c＝1，2..且c＜n，获取原始标签依赖关系树中第t(pc)用户标签依赖节点对应的数据持有方序号集.{t(pc1)，t(pc2)，...t(pcd)，...}以及{y^t(pc1)，y^t(pc2)，...y^f(pcd)，...}，其中，t(pcd)表示第d个当前叶子节点对应的数据持有方序号，y^t(pcd)表示M_t(pcd)的预测结果，pcd＝1，2，...n，d＝1，2..且d＜n，则若i属于{t(pc1)，t(pc2)，...t(pcd)，...}，则xⁱ＝xⁱ+v^t(pcd)，将xⁱ输入

8.一种电子设备，其特征在于，包括：

至少一个处理器；

以及，与所述至少一个处理器通信连接的存储器；

其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被设置为用于执行前述权利要求1-7任一项所述的方法。

9.一种计算机可读存储介质，其特征在于，存储有计算机可执行指令，所述计算机可执行指令用于执行前述权利要求1-7中任一项所述的方法。