WO2022262557A1

WO2022262557A1 - 模型训练方法及相关系统、存储介质

Info

Publication number: WO2022262557A1
Application number: PCT/CN2022/095802
Authority: WO
Inventors: 张琦; 吴天诚; 周培晨
Original assignee: 华为技术有限公司
Priority date: 2021-06-15
Filing date: 2022-05-28
Publication date: 2022-12-22
Also published as: CN115481746B; US20240119368A1; CN117494834A; CN115481746A; EP4354361A1

Abstract

本申请实施例提供一种模型训练方法及相关系统、存储介质，应用于人工智能技术领域，例如联邦学习方面，其中，所述系统包括：客户端用于根据无标签数据对第一模型进行训练，还用于向所述服务端发送所述第一模型中第一子网的参数；所述服务端用于根据所述第一子网的参数和有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述服务端还用于向所述客户端发送更新后的所述第一子网的参数以及第三子网的参数；所述客户端还用于根据来自所述服务端的所述第一子网的参数和所述第三子网的参数得到目标模型。采用该手段，保障了客户端的隐私数据的安全性，同时提高了模型在无标签数据上的特征提取能力，节省人力成本。

Description

模型训练方法及相关系统、存储介质

本申请要求于2021年6月15日提交中国专利局、申请号为202110662048.9、申请名称为“模型训练方法及相关系统、存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种模型训练方法及相关系统、存储介质。

背景技术

随着人工智能的发展，提出了“联邦学习”的概念，使得联邦双方在不用给出己方数据的情况下，也可进行模型训练得到模型参数，并且可以避免数据隐私泄露的问题。

横向联邦学习，也称为特征对齐的联邦学习(feature-alignedfederated learning)，是在各个客户端的数据特征重叠较多(即数据特征是对齐的)，而用户重叠较少的情况下，取出客户端数据特征相同而用户不完全相同的那部分数据进行联合机器学习。横向联邦学习的应用场景分为两类：标准场景和不相交场景。标准场景指的是参与模型训练的有标签数据存放于客户端，即在客户端上执行标准的有监督训练。不相交场景是指参与模型训练的有标签数据被存放在服务端中，而大量无标签数据却存放在客户端中。不相交场景主要是由于许多数据的标注工作是需要具备相关专业知识的人员来进行处理的。例如，对于瑜伽姿势矫正的手机应用软件，由于普通人难以确认自己的瑜伽姿势是否完全正确，因此，即使用户愿意为服务商标注所有的图片数据，服务商也只能聘请专业的瑜伽从业人员来对相关数据进行标注。

目前的横向联邦学习对于不相交场景，通常假设客户端有大量的有标签数据，能够保证使用横向联邦学习的训练模式进行模型训练，但是实际情况通常是客户端有少量甚至是没有有标签数据，事实上也很难要求客户端对数据进行标注，因而很难使用现有的横向联邦学习训练模式获得优质的模型。

发明内容

本申请公开了一种模型训练方法及相关系统、存储介质，可以提高模型在无标签数据上的特征提取能力。

第一方面，本申请实施例提供一种模型训练系统，所述模型训练系统包括服务端和客户端，所述服务端维护有有标签数据，所述客户端维护有无标签数据，其中：所述客户端用于根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；所述客户端还用于向所述服务端发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；所述服务端用于根据所述客户端上报的所述第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网，所述第三子网与所述第二子网对应；所述服务端还用于向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数；所述客户端还用于根据来自所述服务端的所述第一子网的参数和所述第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网。

通过本方案，客户端基于无标签数据进行训练，然后服务端基于客户端上报的第一子网的参数和有标签数据进行训练，并向客户端发送更新后的所述第一子网的参数以及第三子网的参数，进而客户端根据所述第一子网的参数以及第三子网的参数得到目标模型。采用该手段，一方面保障了客户端的隐私数据的安全性，同时提高了模型在无标签数据上的特征提取能力，节省人力成本。本方案可以实现只在服务端有有标签数据，在客户端完全没有有标签数据时，也能够进行横向联邦学习，从而适应缺乏标签数据的现实场景。

上述客户端根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数，可以理解为，客户端根据所述无标签数据对第一模型进行训练，以更新所述第一模型的参数。

作为一种可选的实现方式，上述第一子网可以用于对输入该子网的数据进行特征提取。

相较于现有技术中客户端向服务端发送训练得到的所有参数，采用本方案，由于传输的数据较少，在一定程度上可以降低训练过程中的通信开销。

作为一种可选的实现方式，在向所述服务端发送所述第一模型的参数的方面，所述客户端用于仅向所述服务端发送所述第一模型中所述第一子网的参数。

作为另一种可选的实现方式，所述客户端还用于向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。

作为一种可选的实现方式，所述客户端的数量为K个，K为大于1的整数，所述服务端还用于对来自所述K个客户端的K个第一子网的参数进行聚合处理，以得到处理后的第一子网的参数；在根据所述客户端上报的所述第一子网的参数和所述有标签数据对所述服务端的第二模型进行训练，以更新所述第二模型的参数的方面所述服务端用于根据所述处理后的第一子网的参数和所述有标签数据对所述服务端的第二模型进行训练，以更新所述第二模型的参数。

采用该手段，服务端基于多个客户端的第一子网的参数来进行训练，可以有效提高模型在无标签数据上的特征提取能力。

作为一种可选的实现方式，所述第二模型的第三子网用于输出所述第二模型的计算结果；所述第一模型的第二子网用于输出所述第一模型的计算结果，其中，所述第二模型的第三子网与所述第一模型的第二子网的结构不同。

作为一种可选的实现方式，第三子网为Classifier子网，第二子网为MLM子网等。

作为一种可选的实现方式，所述第一模型的第二子网的参数在训练前和训练后保持不变。

采用该手段，可以降低训练开销。

作为一种可选的实现方式，所述第二模型还包括第四子网，第二模型的第四子网的参数在训练前和训练后保持不变。

采用该手段，可以降低训练开销。

第二方面，本申请实施例提供一种模型训练方法，应用于服务端，所述服务端维护有有标签数据，所述方法包括：根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网；向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数。

通过本申请实施例，服务端基于客户端上报的第一子网的参数和有标签数据进行训练，然后向客户端发送更新后的所述第一子网的参数以及第三子网的参数。其中，客户端上报的第一子网的参数为客户端基于无标签数据进行训练得到的。采用该手段，一方面保障了客户端的隐私数据的安全性，同时提高了模型在无标签数据上的特征提取能力，节省人力成本。本方案可以实现只在服务端有有标签数据，在客户端完全没有有标签数据时，也能够进行横向联邦学习，从而适应缺乏标签数据的现实场景。

作为一种可选的实现方式，所述客户端的数量为K个，K为大于1的整数，所述方法还包括：对来自所述K个客户端的K个第一子网的参数进行聚合处理，以得到处理后的第一子网的参数；所述根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，包括：根据所述处理后的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。

作为一种可选的实现方式，所述服务端还维护有无标签数据，所述根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，包括：根据客户端上报的第一子网的参数和所述无标签数据对第三模型进行训练，以更新所述第三模型的参数；根据所述第三模型的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。

采用该手段，可以实现在服务端维护有有标签数据和无标签数据的场景下进行横向联邦学习，进一步提高了模型的特征提取能力，节省人力成本。

第三方面，本申请实施例提供一种模型训练方法，应用于客户端，所述客户端维护有无标签数据，所述方法包括：根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；向所述服务端发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；根据来自所述服务端的所述第一子网的参数和第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网，所述第三子网与所述第二子网对应。

通过本申请实施例，客户端基于无标签数据进行训练，并将第一子网的参数上报给服务端，并根据来自服务端的第一子网的参数和第三子网的参数得到目标模型，其中，来自服务端的第一子网的参数和第三子网的参数是服务端基于客户端上报的第一子网的参数和有标签数据进行训练得到的。采用该手段，一方面保障了客户端的隐私数据的安全性，同时提高了模型在无标签数据上的特征提取能力，节省人力成本。本方案可以实现只在服务端有有标签数据，在客户端完全没有有标签数据时，也能够进行横向联邦学习，从而适应缺乏标签数据的现实场景。

作为一种可选的实现方式，所述客户端仅向所述服务端发送所述第一模型中所述第一子网的参数，而不向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。

作为另一种可选的实现方式，所述方法还包括：向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。

作为一种可选的实现方式，进行所述无监督训练所使用的损失值是根据所述客户端的无标签数据和第一数据得到的，所述第一数据是将第二数据输入至所述第一模型进行处理得到的，所述第二数据是对所述无标签数据进行掩码处理得到的。

通过本申请实施例，客户端进行无监督训练时对无标签数据进行掩码处理，基于客户端的无标签数据和掩码处理后的数据来计算损失值。采用该手段，可以提高模型在无标签数据上的特征提取能力。

第四方面，本申请实施例提供一种模型训练方法，应用于客户端，所述客户端维护有无标签数据和有标签数据，所述方法包括：根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；根据所述第一模型的参数和所述有标签数据对第四模型进行训练，以获得所述第四模型的参数；向所述服务端发送所述第四模型中第一子网的参数和第二子网的参数；根据来自所述服务端的所述第一子网的参数和所述第二子网的参数更新所述第四模型。

采用该手段，可以实现客户端维护有有标签数据和无标签数据的场景下进行横向联邦学习，进一步提高了模型的特征提取能力，节省人力成本。

作为一种可选的实现方式，所述客户端仅向所述服务端发送所述第四模型中所述第一子网的参数和所述第二子网的参数，而不向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。

作为另一种可选的实现方式，所述方法还包括：向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。

第五方面，本申请实施例提供一种模型训练装置，所述装置包括：训练模块，用于根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网；发送模块，用于向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数。

作为一种可选的实现方式，所述客户端的数量为K个，K为大于1的整数，所述装置还包括处理模块，用于：对来自所述K个客户端的K个第一子网的参数进行聚合处理，以得到处理后的第一子网的参数；所述训练模块，还用于根据所述处理后的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。

作为一种可选的实现方式，所述训练模块，还用于：根据客户端上报的第一子网的参数和所述无标签数据对第三模型进行训练，以更新所述第三模型的参数；根据所述第三模型的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。

第六方面，本申请实施例提供一种模型训练装置，所述装置包括：训练模块，用于根据无标签数据对第一模型进行训练，以获得所述第一模型的参数；发送模块，用于向所述服务端发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；更新模块，用于根据来自所述服务端的所述第一子网的参数和第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网，所述第三子网与所述第二子网对应。

作为一种可选的实现方式，所述发送模块，还用于：向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。

作为另一种可选的实现方式，所述发送模块，用于：仅向所述服务端发送所述第一模型中所述第一子网的参数，而不向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。

第七方面，本申请实施例提供一种模型训练装置，所述装置包括：训练模块，用于根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；根据所述第一模型的参数和所述有标签数据对第四模型进行训练，以获得所述第四模型的参数；发送模块，用于向所述服务端发送所述第四模型中第一子网的参数和第二子网的参数；更新模块，用于根据来自所述服务端的所述第一子网的参数和所述第二子网的参数更新所述第四模型。

作为一种可选的实现方式，所述发送模块，还用于：向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。

作为另一种可选的实现方式，所述发送模块，用于：仅向所述服务端发送所述第四模型中所述第一子网的参数和所述第二子网的参数，而不向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。

第八方面，本申请实施例提供一种模型训练装置，包括处理器和存储器；其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行所述的方法。

第九方面，本申请提供了一种计算机存储介质，包括计算机指令，当所述计算机指令在电子设备上运行时，使得所述电子设备执行如第二方面任一种可能的实施方式和/或第三方面任一种可能的实施方式和/或第四方面任一种可能的实施方式提供的方法。

第十方面，本申请实施例提供一种计算机程序产品，当计算机程序产品在计算机上运行时，使得计算机执行如第二方面任一种可能的实施方式和/或第三方面任一种可能的实施方式和/或第四方面任一种可能的实施方式提供的方法。

可以理解地，上述提供的第一方面所述的模型训练系统、第五方面所述的模型训练装置、第六方面所述的模型训练装置、第七方面所述的模型训练装置、第八方面所述的模型训练装置、第九方面所述的计算机存储介质或者第十方面所述的计算机程序产品均用于执行第二方面任一种可能的实施方式和/或第三方面任一种可能的实施方式和/或第四方面任一种可能的实施方式提供的方法。因此，其所能达到的有益效果可参考对应方法中的有益效果，此处不再赘述。

附图说明

下面对本申请实施例用到的附图进行介绍。

图1a是本申请实施例提供的一种模型训练系统的框架示意图；

图1b是本申请实施例提供的另一种模型训练系统的框架示意图；

图2是本申请实施例提供的一种模型训练方法的交互示意图；

图3是本申请实施例提供的一种模型训练方法的流程示意图；

图4a是本申请实施例提供的一种服务端的模型训练方法的流程示意图；

图4b是本申请实施例提供的一种模型训练方法的示意图；

图5a是本申请实施例提供的一种客户端的模型训练方法的流程示意图；

图5b是本申请实施例提供的一种模型训练方法的示意图；

图6是本申请实施例提供的又一种模型训练方法的流程示意图；

图7是本申请实施例提供的一种模型训练装置的结构示意图；

图8a是本申请实施例提供的一种模型训练系统的结构示意图；

图8b是本申请实施例提供的一种模型训练装置的结构示意图；

图8c是本申请实施例提供的一种模型训练装置的结构示意图；

图8d是本申请实施例提供的一种模型训练装置的结构示意图。

具体实施方式

下面结合本申请实施例中的附图对本申请实施例进行描述。本申请实施例的实施方式部分使用的术语仅用于对本申请的具体实施例进行解释，而非旨在限定本申请。

参照图1a所示，为本申请实施例提供的一种模型训练系统的框架示意图。该系统包括服务端和客户端。其中，客户端维护有无标签数据，服务端维护有有标签数据。客户端根据无标签数据对第一模型进行训练，以获得第一模型的参数。然后，客户端向服务端发送所述第一模型中第一子网的参数。服务端根据客户端上报的所述第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。服务端向所述客户端发送更新后的所述第一子网的参数以及第三子网的参数，进而客户端根据来自所述服务端的所述第一子网的参数和所述第三子网的参数得到目标模型。

参照图1b所示，为本申请实施例提供的另一种模型训练系统的框架示意图。该系统包括服务端和客户端。其中，服务端包括联邦学习服务端(Federated LearningServer，FL-Server)模块和联邦学习工作站(Federated Learning Worker，FL-Worker)模块。FL-Server模块包括聚合单元和通信单元。FL-Server模块用于数据处理。FL-Worker模块包括模型分解单元、训练单元和通信单元。FL-Worker模块用于模型训练。客户端包括模型分解单元、训练单元、推理单元和通信单元。客户端用于模型训练和推理。

其中，客户端的模型分解单元用于将客户端的模型分解为多个子网。客户端的训练单元基于无标签数据对分解后的模型进行训练，然后客户端的通信单元将训练得到的第一子网的参数发送给FL-Server模块。

FL-Server模块的聚合单元将接收到的多个客户端发送的第一子网的参数进行聚合处理，然后将处理后的第一子网的参数发送给FL-Worker模块。FL-Worker模块的模型分解单元用于将服务端的模型分解为多个子网。FL-Worker模块的训练单元基于该处理后的第一子网的参数和有标签数据对分解后的模型进行训练，得到更新后的第一子网的参数和第三子网的参数，然后将其发送给FL-Server模块。FL-Server模块将该更新后的第一子网的参数和第三子网的参数下发给每个客户端，客户端根据来自所述服务端的所述第一子网的参数和所述第三子网的参数得到目标模型。进而，客户端的推理单元可基于该目标模型进行推理。

参照图2所示，为本申请实施例提供的一种模型训练方法的流程示意图。该方法应用于横向联邦学习的不相交场景。其中，服务端维护有有标签数据，服务端进行有监督训练。客户端维护有无标签数据，客户端进行无监督训练。

在模型参数初始化之后，客户端的无监督训练首先启动。之后，客户端的无监督训练和服务端的有监督训练交替进行。交替流程在满足预设条件后停止训练。预设条件可以是满足迭代次数，或者损失值小于预设值等，本方案对此不做具体限定。

具体地，参照图3所示，为本申请实施例提供的一种模型训练方法的流程示意图。该方法应用于模型训练系统，所述模型训练系统包括服务端和客户端。其包括步骤301-305，具体如下：

301、客户端根据无标签数据对第一模型进行训练，以获得所述第一模型的参数；

该第一模型可以是任意模型，如神经网络模型、支持向量机模型、决策树模型等。其中，该第一模型可对应图2中的模型2。

上述对第一模型进行训练，可以是进行无监督训练。

作为一种可选的实现方式，进行无监督训练所使用的损失值是根据所述客户端的无标签数据和第一数据得到的，所述第一数据是将第二数据输入至所述第一模型进行处理得到的，所述第二数据是对所述无标签数据进行掩码处理得到的。

具体地，无监督训练可包括如下步骤：

首先对无标签数据进行掩码操作。

掩码操作即为对原始的数据特征中的部分值进行替换操作，替换的值可以为特定的值，或可学习的参数。

例如，无标签数据为短信数据[特,选,进,口,高,科,技,面,膜]，对该短信数据中的“进”进行掩码操作，其中，掩码操作后的数据为[特,选,MASK,口,高,科,技,面,膜]等。

然后将掩码后的数据输入到用于无监督训练的模型中，得到模型的输出结果。

通过相似度函数(即损失函数)，比较模型的输出结果和上述无标签数据的相似性。

将比较的结果输入到优化器中，进而更新模型的参数。

通过重复执行上述步骤，直到达到该无监督训练的停止条件时停止训练。

上述仅为一种无监督训练的示例，其还可以是其他形式的无监督训练，本方案对此不做具体限定。

上述对第一模型进行训练，以获得所述第一模型的参数，可以理解为，对第一模型进行训练，以更新所述第一模型的参数。

302、所述客户端向所述服务端发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；

其中，在模型初始化时，客户端可对第一模型进行分解操作，将第一模型的各个子网的参数分别分解开来，进而进行模型训练。

其中，第一模型包括多个子网，该多个子网包括第一子网、第二子网。

上述第一子网可以是用于进行特征提取的子网。上述第二子网可以是用于输出该第一模型的计算结果的子网。

如第一模型可包括嵌入Embedding子网、轻量化的来自于变形器的双向编码表示ALBERT子网、掩码语言模型(Masked Language Model，MLM)子网、自适应矩估计Adam优化器子网等。相应地，第一子网为ALBERT子网，第二子网为MLM子网。

上述子网可以理解为子模型。例如，Embedding子模型、ALBERT子模型、MLM子模型等。

上述第一模型仅为一种示例，其还可以是由其他子网组成的模型，本方案对此不做具体限定。

作为一种可选的实现方式，所述客户端向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。

也就是说，所述客户端不仅向服务端发送所述第一模型中第一子网的参数，还发送除第一子网的参数之外的参数。例如，还发送第二子网的参数，或者还发送其他子网的参数，其还可以向服务端发送其他所有子网的参数等，本方案对此不做具体限定。

作为另一种可选的实现方式，所述客户端仅向所述服务端发送所述第一模型中所述第一子网的参数。

也就是说，客户端不向服务端发送除所述第一子网的参数之外的参数。相较于现有技术中客户端将训练得到的所有参数均传输给服务端，采用本方案，由于传输的数据较少，可以降低训练过程中的通信开销。

303、所述服务端根据所述客户端上报的所述第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网，所述第三子网与所述第二子网对应；

该第二模型可以是任意模型，如神经网络模型、支持向量机模型、决策树模型等。其中，该第二模型可对应图2中的模型1。

上述服务端根据所述客户端上报的所述第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，可以是服务端根据所述客户端上报的所述第一子网的参数对第二模型的第一子网的参数进行替换，以更新第二模型的参数；然后，根据所述有标签数据对所述更新后的第二模型进行训练，以再次更新第二模型的参数。

上述对第二模型进行训练，可以是对第二模型进行有监督训练。

作为一种可选的实现方式，服务端的训练可以参照如下操作：

将有标签数据输入到用于有监督训练的第二模型中，得到第二模型的输出结果。

通过相似度函数(即损失函数)，比较模型的输出结果和有标签数据的相似性。

将比较的结果输入到优化器中，进而得到用来更新模型的参数。

其中，若优化器自身带有参数，则优化器的参数也可进行更新。

重复执行上述步骤，直到达到该有监督训练的停止条件时停止，得到服务端更新后的第二模型的参数。

该停止条件可以是满足预设迭代次数，或者损失值满足预设要求等，本方案对此不做具体限定。

作为一种可选的实现方式，当客户端的数量为K个，K为大于1的整数，在步骤303之前，所述方法还包括：

所述服务端对来自所述K个客户端的K个第一子网的参数进行聚合处理，以得到处理后的第一子网的参数。

该聚合处理可以是按照预设权重对各个客户端发送的第一子网的参数进行加权求和，进而得到处理后的第一子网的参数。

上述方式仅为一种示例，当然，还可以是其他形式的处理，本方案对此不做具体限定。

相应地，所述服务端根据所述客户端上报的所述第一子网的参数和所述有标签数据对所述服务端的第二模型进行训练，以更新所述第二模型的参数，包括：

所述服务端根据所述处理后的第一子网的参数和所述有标签数据对所述服务端的第二模型进行训练，以更新所述第二模型的参数。

具体地，所述服务端根据所述处理后的第一子网的参数对所述服务端的第二模型的第一子网的参数进行替换，以更新所述第二模型的参数；

所述服务端根据所述有标签数据对所述更新后的所述第二模型进行训练，以再次更新所述第二模型的参数。

其中，在模型初始化时，服务端可对第二模型进行分解操作，将第二模型的各个子网的参数分别分解开来。

其中，第二模型包括多个子网，该多个子网包括所述第一子网、第三子网。

上述第一子网可以是用于进行特征提取的子网。上述第三子网可以是用于输出该第二模型的计算结果的子网。

如第二模型可包括嵌入Embedding子网、轻量化的来自于变形器的双向编码表示ALBERT子网、分类器Classifier子网、Adam优化器子网等。相应地，第三子网为Classifier子网。

上述子网可以理解为子模型。例如，Embedding子模型、ALBERT子模型、Classifier子模型等。

上述第二模型仅为一种示例，其还可以是由其他子网组成的模型，本方案对此不做具体限定。

上述第二模型的第三子网与第一模型的第二子网对应，可以理解为，两者功能是相同的，例如所述第二模型的第三子网用于输出所述第二模型的计算结果；所述第一模型的第二子网用于输出所述第一模型的计算结果。

其中，所述第二模型的第三子网与所述第一模型的第二子网的结构不同。

304、所述服务端向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数；

作为一种可选的实现方式，在步骤304之前，还可包括：

304-1、确认是否达到预设条件；

304-2、若达到所述预设条件，则执行步骤304；

304-3、若未达到所述预设条件，所述服务端向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数，所述客户端根据来自所述服务端的所述第一子网的参数更新所述第一模型，并重复执行步骤301、302、303、304-1、304-3，直到达到所述预设条件。

上述预设条件可以是重复执行步骤301、302、303、304-1、304-3的次数，其中客户端和服务端可预先确定停止次数，当达到该重复次数后，则停止训练。

上述预设条件还可以是服务端基于损失函数计算得到的损失值小于预设值等，本方案对此不做具体限定。

作为另一种可选的实现方式，若未达到所述预设条件，所述服务端仅向所述客户端发送更新后的所述第一子网的参数，所述客户端根据来自所述服务端的所述第一子网的参数更新所述第一模型，并重复执行步骤301、302、303、304-1、304-3，直到达到所述预设条件。

305、所述客户端根据来自所述服务端的所述第一子网的参数和所述第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网。

其中，目标模型可用于进行推理。

通过本方案，客户端基于无标签数据进行训练，然后服务端基于客户端上报的第一子网的参数和有标签数据进行训练，并向客户端发送更新后的所述第一子网的参数以及第三子网的参数，进而客户端根据该更新后的所述第一子网的参数以及第三子网的参数得到目标模型。采用该手段，一方面保障了客户端的隐私数据的安全性，同时提高了模型在无标签数据上的特征提取能力，节省人力成本。本方案可以实现只在服务端有有标签数据，在客户端完全没有有标签数据时，也能够进行横向联邦学习，从而适应缺乏标签数据的现实场景。

参照图4a所示，为本申请实施例提供的一种模型训练方法的流程示意图。该方法应用于服务端，所述服务端维护有有标签数据，其包括步骤401-402，具体如下：

401、根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网；

作为一种可选的实现方式，所述客户端的数量为K个，K为大于1的整数，所述方法还包括：

对来自所述K个客户端的K个第一子网的参数进行聚合处理，以得到处理后的第一子网的参数。

作为一种可选的实现方式，所述服务端可对第二模型进行有监督训练。

通过将有标签数据输入到用于有监督训练的第二模型中，得到第二模型的输出。通过相似度函数(即损失函数)，比较模型的输出和有标签数据的相似性。将比较的结果输入到优化器中，进而得到用来更新模型的参数。其中，若优化器自身带有参数，则优化器的参数也可进行更新。

重复执行上述步骤，直到达到有监督训练的停止条件时停止，得到服务端更新后的第二模型的参数。

该有监督训练的停止条件可以是满足预设迭代次数，或者损失值满足预设要求等，本方案对此不做具体限定。

作为另一种可选的实现方式，所述服务端还维护有无标签数据。也就是说，服务端可进行半监督训练。

相应地，所述根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，包括：

根据客户端上报的第一子网的参数和所述无标签数据对第三模型进行训练，以更新所述第三模型的参数；

根据所述第三模型的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。

其中，根据客户端上报的第一子网的参数和所述无标签数据对第三模型进行训练，以更新所述第三模型的参数；根据所述第三模型的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。当达到服务端半监督训练的停止条件，则执行步骤402。

若未达到上述半监督训练的停止条件，则根据所述第二模型的参数对所述第三模型的参数进行更新，并根据所述无标签数据对更新后的第三模型进行训练，以再次更新所述第三模型的参数；重复执行上述步骤，直到达到所述半监督训练的停止条件。

该半监督训练的停止条件可以是满足预设迭代次数，或者损失值满足预设要求等，本方案对此不做具体限定。

作为一种可选的实现方式，第二模型还包括第四子网，其中，所述第四子网的参数在训练前和训练后保持不变。

例如，该第四子网可以是Embedding子网。

也就是说，在初始化时下发了第二模型的第四子网的参数，训练的过程中该参数不变。

采用该手段，降低了训练的开销。

在此过程中，客户端若只有无标签数据，可进行无监督训练；若还有有标签数据，则客户端可进行半监督训练等。本方案对此不做具体限定。

402、向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数。

通过步骤402，以便客户端得到目标模型，并进行推理。

作为一种可选的实现方式，在步骤402之前，还包括：

402-1、确认是否达到预设条件；

402-2、若达到所述预设条件，则执行步骤402；

402-3、若未达到所述预设条件，所述服务端向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数，以便所述客户端根据来自所述服务端的所述第一子网的参数更新所述第一模型，并重复执行步骤401、402-1、402-3，直到达到所述预设条件。

上述预设条件可以是重复执行步骤401、402-1、402-3的次数，其中客户端和服务端可预先确定停止次数，当达到该重复次数后，则停止训练。

作为另一种可选的实现方式，若未达到所述预设条件，所述服务端仅向所述客户端发送更新后的所述第一子网的参数，并重复执行步骤401、402-1、402-3，直到达到所述预设条件。

如图4b所示，为本申请实施例提供的一种模型训练方法。其中，服务端的模型包括Embedding子网、ALBERT子网、Classifier子网和优化器子网。该实施例以短信分类业务为例进行说明。

在服务端的有监督训练中，服务端首先对短信文本进行数据预处理。这里的数据预处理可以是基于分词器进行分词操作。其中，服务端将分词器的输出结果输入到第二模型中。此外，服务端将有标签数据输入到交叉熵函数中，进而根据第二模型的输出计算得到相似度。然后将相似度输入到优化器中，进而更新第二模型的参数。

若未达到停止条件，服务端向客户端发送更新后的ALBERT子网的参数和Classifier子网的参数。然后，基于客户端发送的ALBERT子网的参数进行再次训练。直到达到停止条件，服务端向所述客户端发送更新后的ALBERT子网的参数和Classifier子网的参数，以便客户端进行推理。

由于目前服务端没有训练引擎，因此在进行训练的时候，需要搭建模型训练的模拟平台来进行模型训练。然而，例如在手机和服务端交互的真实场景中，该手段无法实现部署。

基于此，本申请实施例还提供一种服务端，所述服务端包括联邦学习服务端FL-Server模块和联邦学习工作站FL-Worker模块。参照图2所示，联邦学习服务端FL-Server模块，用于对K个客户端发送的K个第一子网的参数进行聚合处理，然后将处理后的参数发送给联邦学习工作站FL-Worker模块。FL-Worker模块用于根据该处理后的参数和服务端的有标签数据进行训练，得到更新后的所述第一子网的参数以及第三子网的参数，然后将更新后的所述第一子网的参数以及所述第三子网的参数发送至所述FL-Server模块。

采用上述手段，通过在服务端中加入联邦学习工作站FL-Worker模块，使得训练任务可以在服务端进行，实现了服务端可直接进行模型训练，提高了模型训练的效率。

通过本申请实施例，服务端基于客户端上报的第一子网的参数和有标签数据进行训练，然后向客户端发送更新后的所述第一子网的参数以及所述第三子网的参数。其中，客户端上报的第一子网的参数为客户端基于无标签数据进行训练得到的。采用该手段，一方面保障了客户端的隐私数据的安全性，同时提高了模型在无标签数据上的特征提取能力，节省人力成本。本方案可以实现只在服务端有有标签数据，在客户端完全没有有标签数据时，也能够进行横向联邦学习，从而适应缺乏标签数据的现实场景。

参照图5a所示，为本申请实施例提供的一种模型训练方法的流程示意图。该方法应用于客户端，所述客户端维护有无标签数据，其包括步骤501-503，具体如下：

501、根据无标签数据对第一模型进行训练，以获得所述第一模型的参数；

该第一模型可以是任意模型，如神经网络模型、支持向量机模型、决策树模型等。

上述对第一模型进行训练，可以是进行无监督训练。

具体地，无监督训练可包括如下步骤：

首先对无标签数据进行掩码操作。掩码操作即为对原始的数据特征中的部分值进行替换操作，替换的值可以为特定的值，或可学习的参数。

例如，无标签数据为短信数据[特,选,进,口,高,科,技,面,膜]，对该短信数据中的“进”进行掩码操作，其中，掩码操作后的数据为[特,选,MASK,口,高,科,技,面,膜]。

然后将掩码后的数据输入到用于无监督训练的模型中，得到模型的输出。

通过相似度函数(即损失函数)，比较模型的输出和上述无标签数据的相似性。

将比较的结果输入到优化器中，进而更新模型的参数。

通过重复执行上述步骤，直到达到无监督训练的停止条件时停止训练。

上述以获得所述第一模型的参数，可以理解为，对第一模型进行训练，以更新所述第一模型的参数。

502、向服务端发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；

其中，在模型初始化时，客户端可对第一模型进行分解操作，将第一模型的各个子网的参数分别分解开来。

也就是说，客户端不向服务端发送除所述第一子网的参数之外的参数。相较于现有技术中将训练得到的所有参数均传输给服务端，采用本方案，由于传输的数据较少，可以降低训练过程中的通信开销。

503、根据来自所述服务端的所述第一子网的参数和第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网，所述第三子网与所述第二子网对应。

其中，目标模型可用于进行推理。

作为一种可选的实现方式，在步骤503之前，还可包括：

503-1、确认是否达到预设条件；

503-2、若达到所述预设条件，则执行步骤503；

503-3、若未达到所述预设条件，根据来自所述服务端的所述第一子网的参数更新所述第一模型，并重复执行步骤501、502、503-1、503-3，直到达到所述预设条件。

上述预设条件可以是重复执行步骤501、502、503-1、503-3的次数，其中客户端和服务端可预先确定停止次数，当达到该重复次数后，则停止训练。

上述预设条件还可以是客户端基于损失函数计算得到的损失值小于预设值等，本方案对此不做具体限定。

如图5b所示，为本申请实施例提供的一种模型训练方法。其中，客户端的模型包括Embedding子网、ALBERT子网、MLM子网和优化器子网。该实施例以短信分类业务为例进行说明。

如图5b所示，在客户端的无监督训练任务中，客户端首先对短信文本进行数据预处理。数据预处理包括进行分词处理，然后进行掩码处理。其中，掩码处理后的结果作为模型的输入。其中，客户端还将分词处理后的结果输入到交叉熵函数中，用于和模型的输出计算相似度。然后将计算得到的相似度输入到优化器子网中，进而得到更新后的第一模型的参数。然后，客户端将ALBERT子网的参数发送给服务端。

在此过程中，服务端若只有有标签数据，则进行有监督训练；若服务端还有无标签数据，则服务端进行半监督训练。本方案对此不做具体限定。

作为一种可选的实现方式，所述第一模型还包括第五子网，所述第五子网的参数在训练前和训练后保持不变。例如，该第五子网可以是Embedding子网。

也就是说，在初始化时下发了第一模型的第五子网的参数，后面训练的过程中该参数不变。

采用该手段，在训练过程中第五子网的参数保持不变，降低了训练开销。

作为又一种可选的实现方式，所述第一模型的第二子网的参数在训练前和训练后保持不变。例如，该第二子网可以是MLM子网。

也就是说，在初始化时下发了第一模型的第二子网的参数，后面训练的过程中该参数不变。采用该手段，降低了训练开销。

上述实施例对于客户端进行无监督训练为例进行说明，其中，客户端维护有有标签数据和无标签数据时，客户端可进行半监督训练。下面对于客户端进行半监督训练进行说明。如图6所示，本申请实施例还提供一种模型训练方法，包括步骤601-604，具体如下：

601、根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；

作为一种可选的实现方式，对第一模型进行无监督训练，进行无监督训练所使用的损失值是根据所述客户端的无标签数据和第一数据得到的，所述第一数据是将第二数据输入至所述第一模型进行处理得到的，所述第二数据是对所述无标签数据进行掩码处理得到的。

具体地，无监督训练可包括如下步骤：

首先对无标签数据进行掩码操作。

掩码操作即为对原始的数据特征中的部分值进行替换操作，替换的值可以为特定的值或可学习的参数。

将比较的结果输入到优化器中，进而更新模型的参数。

602、根据所述第一模型的参数和所述有标签数据对第四模型进行训练，以获得所述第四模型的参数；

例如，客户端基于第一模型的参数对第四模型的参数进行更新。然后第四模型基于有标签数据进行有监督训练。

作为一种可选的实现方式，在步骤602之后，还包括：

6021、当达到客户端侧半监督训练的停止条件，则执行步骤603；

6022、若未达到客户端侧半监督训练的停止条件，则根据所述第四模型的参数对所述第一模型的参数进行更新，并重复执行步骤601、602、6022，直到达到所述客户端侧半监督训练的停止条件。

上述客户端侧半监督训练的停止条件，可以是重复执行步骤601、602、6022的次数等，本方案对此不做具体限定。

603、向所述服务端发送所述第四模型中第一子网的参数和第二子网的参数；

所述第四模型包括第一子网和第二子网。

作为一种可选的实现方式，向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。

作为另一种可选的实现方式，仅向所述服务端发送所述第四模型中所述第一子网的参数和所述第二子网的参数。

作为一种可选的实现方式，在步骤603之前，还包括：

6031、若未达到预设条件，根据来自所述服务端的所述第一子网的参数更新所述第一模型，根据来自所述服务端的所述第一子网的参数和所述第二子网的参数更新所述第四模型，并重复执行步骤601、602、6031，直到达到所述预设条件；

6032、若达到所述预设条件，执行步骤603。

604、根据来自所述服务端的所述第一子网的参数和所述第二子网的参数更新所述第四模型，其中，更新后的所述第四模型包括所述第一子网和所述第二子网。

通过本申请实施例，客户端基于无标签数据对第一模型进行无监督训练，并基于有标签数据对第四模型进行有监督训练，然后向服务端发送第四模型的第一子网和第二子网的参数，然后客户端基于来自服务端的所述第一子网和第二子网的参数进行更新。采用该手段，一方面保障了客户端的隐私数据的安全性，同时提高了模型在无标签数据上的特征提取能力，节省人力成本。本方案可以实现只在服务端有有标签数据，在客户端完全没有有标签数据时，也能够进行横向联邦学习，从而适应缺乏标签数据的现实场景。

如图7所示，是本申请实施例提供的一种模型训练装置的硬件结构示意图。图7所示的模型训练装置700(该装置700具体可以是一种计算机设备)包括存储器701、处理器702、通信接口703以及总线704。

其中，存储器701、处理器702、通信接口703通过总线704实现彼此之间的通信连接。

存储器701可以是只读存储器(Read Only Memory，ROM)，静态存储设备，动态存储设备或者随机存取存储器(Random Access Memory，RAM)。

存储器701可以存储程序，当存储器701中存储的程序被处理器702执行时，处理器702和通信接口703用于执行本申请实施例的模型训练方法的各个步骤。

处理器702可以采用通用的中央处理器(Central Processing Unit，CPU)，微处理器，应用专用集成电路(Application Specific Integrated Circuit，ASIC)，图形处理器(graphics processing unit，GPU)或者一个或多个集成电路，用于执行相关程序，以实现本申请实施例的模型训练装置中的单元所需执行的功能，或者执行本申请方法实施例的模型训练方法。

处理器702还可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，本申请的模型训练方法的各个步骤可以通过处理器702中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器702还可以是通用处理器、数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(ASIC)、现成可编程门阵列(Field Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器701，处理器702读取存储器701中的信息，结合其硬件完成本申请实施例的模型训练装置中包括的单元所需执行的功能，或者执行本申请方法实施例的模型训练方法。

通信接口703使用例如但不限于收发器一类的收发装置，来实现装置700与其他设备或通信网络之间的通信。例如，可以通过通信接口703获取数据。

总线704可包括在装置700各个部件(例如，存储器701、处理器702、通信接口703)之间传送信息的通路。

应注意，尽管图7所示的装置700仅仅示出了存储器、处理器、通信接口，但是在具体实现过程中，本领域的技术人员应当理解，装置700还包括实现正常运行所必须的其他器件。同时，根据具体需要，本领域的技术人员应当理解，装置700还可包括实现其他附加功能的硬件器件。此外，本领域的技术人员应当理解，装置700也可仅仅包括实现本申请实施例所必须的器件，而不必包括图7中所示的全部器件。

与上述实施例一致的，另一方面，本申请实施例还提供一种模型训练系统，如图8a所示，该模型训练系统800包括服务端801和客户端802，所述服务端801维护有有标签数据，所述客户端802维护有无标签数据，其中，所述客户端802用于根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；所述客户端802还用于向所述服务端801发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；所述服务端801用于根据所述客户端802上报的所述第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网，所述第三子网与所述第二子网对应；所述服务端801还用于向所述客户端802发送更新后的所述第一子网的参数以及所述第三子网的参数；所述客户端802还用于根据来自所述服务端801的所述第一子网的参数和所述第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网。

作为一种可选的实现方式，在向所述服务端801发送所述第一模型的参数的方面，所述客户端802用于仅向所述服务端801发送所述第一模型中所述第一子网的参数，而不向所述服务端801发送所述第一模型中除所述第一子网的参数之外的参数。

作为另一种可选的实现方式，所述客户端802还用于向所述服务端801发送所述第一模型中除所述第一子网的参数之外的参数。

作为一种可选的实现方式，所述客户端802的数量为K个，K为大于1的整数，所述服务端801还用于对来自所述K个客户端802的K个第一子网的参数进行聚合处理，以得到处理后的第一子网的参数；在根据所述客户端上报的所述第一子网的参数和所述有标签数据对所述服务端的第二模型进行训练，以更新所述第二模型的参数的方面，所述服务端801还用于根据所述处理后的第一子网的参数和所述有标签数据对所述服务端801的第二模型进行训练，以更新所述第二模型的参数。

如图8b所示，本申请实施例提供一种模型训练装置，所述装置803包括：训练模块8031和发送模块8032，其中：

训练模块8031，用于根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网；

发送模块8032，用于向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数。

作为一种可选的实现方式，所述训练模块8031，还用于：根据客户端上报的第一子网的参数和所述无标签数据对第三模型进行训练，以更新所述第三模型的参数；根据所述第三模型的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。

如图8c所示，本申请实施例还提供一种模型训练装置，所述装置804包括：训练模块8041、发送模块8042和获取模块8043，具体如下：

训练模块8041，用于根据无标签数据对第一模型进行训练，以获得所述第一模型的参数；

发送模块8042，用于向所述服务端发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；

获取模块8043，用于根据来自所述服务端的所述第一子网的参数和第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网，所述第三子网与所述第二子网对应。

作为一种可选的实现方式，所述发送模块8042，还用于：向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。

作为另一种可选的实现方式，所述发送模块8042，还用于：仅向所述服务端发送所述第一模型中所述第一子网的参数，而不向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。

如图8d所示，本申请实施例还提供一种模型训练装置，所述装置805包括：

训练模块8051，用于根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；根据所述第一模型的参数和所述有标签数据对第四模型进行训练，以获得所述第四模型的参数；

发送模块8052，用于向所述服务端发送所述第四模型中第一子网的参数和第二子网的参数；

更新模块8053，用于根据来自所述服务端的所述第一子网的参数和所述第二子网的参数更新所述第四模型。

作为一种可选的实现方式，所述发送模块8052，还用于：向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。

作为另一种可选的实现方式，所述发送模块8052，还用于：仅向所述服务端发送所述第四模型中所述第一子网的参数和所述第二子网的参数，而不向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。

本申请实施例还提供一种芯片系统，所述芯片系统应用于电子设备；所述芯片系统包括一个或多个接口电路，以及一个或多个处理器；所述接口电路和所述处理器通过线路互联；所述接口电路用于从所述电子设备的存储器接收信号，并向所述处理器发送所述信号，所述信号包括所述存储器中存储的计算机指令；当所述处理器执行所述计算机指令时，所述电子设备执行所述模型训练方法。

本申请实施例还提供一种模型训练装置，包括处理器和存储器；其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行所述模型训练方法。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机或处理器上运行时，使得计算机或处理器执行上述任一个方法中的一个或多个步骤。

本申请实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机或处理器上运行时，使得计算机或处理器执行上述任一个方法中的一个或多个步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

应理解，在本申请的描述中，除非另有说明，“/”表示前后关联的对象是一种“或”的关系，例如，A/B可以表示A或B；其中A，B可以是单数或者复数。并且，在本申请的描述中，除非另有说明，“多个”是指两个或多于两个。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b，或c中的至少一项(个)，可以表示：a，b，c，a-b，a-c，b-c，或a-b-c，其中a，b，c可以是单个，也可以是多个。另外，为了便于清楚描述本申请实施例的技术方案，在本申请的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。同时，在本申请实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念，便于理解。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，该单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地产生按照本申请实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务端或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务端或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务端、数据中心等数据存储设备。该可用介质可以是只读存储器(read-only memory，ROM)，或随机存取存储器(random access memory，RAM)，或磁性介质，例如，软盘、硬盘、磁带、磁碟、或光介质，例如，数字通用光盘(digital versatile disc，DVD)、或者半导体介质，例如，固态硬盘(solid state disk，SSD)等。

以上所述，仅为本申请实施例的具体实施方式，但本申请实施例的保护范围并不局限于此，任何在本申请实施例揭露的技术范围内的变化或替换，都应涵盖在本申请实施例的保护范围之内。因此，本申请实施例的保护范围应以所述权利要求的保护范围为准。

Claims

一种模型训练系统，所述模型训练系统包括服务端和客户端，所述服务端维护有有标签数据，所述客户端维护有无标签数据，其特征在于：

所述客户端用于根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；

所述客户端还用于向所述服务端发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；

所述服务端用于根据所述客户端上报的所述第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网，所述第三子网与所述第二子网对应；

所述服务端还用于向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数；

所述客户端还用于根据来自所述服务端的所述第一子网的参数和所述第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网。
根据权利要求1所述的系统，其特征在于，在向所述服务端发送所述第一模型的参数的方面，所述客户端用于仅向所述服务端发送所述第一模型中所述第一子网的参数。
根据权利要求1所述的系统，其特征在于，所述客户端还用于向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。
根据权利要求1至3任一项所述的系统，其特征在于，所述客户端的数量为K个，K为大于1的整数，所述服务端还用于对来自所述K个客户端的K个第一子网的参数进行聚合处理，以得到处理后的第一子网的参数；

在根据所述客户端上报的所述第一子网的参数和所述有标签数据对所述服务端的第二模型进行训练，以更新所述第二模型的参数的方面，所述服务端用于根据所述处理后的第一子网的参数和所述有标签数据对所述服务端的第二模型进行训练，以更新所述第二模型的参数。
根据权利要求1至4任一项所述的系统，其特征在于，所述第二模型的第三子网用于输出所述第二模型的计算结果；所述第一模型的第二子网用于输出所述第一模型的计算结果，其中，所述第二模型的第三子网与所述第一模型的第二子网的结构不同。
一种模型训练方法，应用于服务端，所述服务端维护有有标签数据，其特征在于，所述方法包括：

根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网；

向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数。
根据权利要求6所述的方法，其特征在于，所述客户端的数量为K个，K为大于1的整数，所述方法还包括：

对来自所述K个客户端的K个第一子网的参数进行聚合处理，以得到处理后的第一子网的参数；

所述根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，包括：

根据所述处理后的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。
根据权利要求6或7所述的方法，其特征在于，所述服务端还维护有无标签数据，所述根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，包括：

根据客户端上报的第一子网的参数和所述无标签数据对第三模型进行训练，以更新所述第三模型的参数；

根据所述第三模型的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。
一种模型训练方法，应用于客户端，所述客户端维护有无标签数据，其特征在于，所述方法包括：

根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；

向所述服务端发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；

根据来自所述服务端的所述第一子网的参数和第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网，所述第三子网与所述第二子网对应。
根据权利要求9所述的方法，其特征在于，所述客户端仅向所述服务端发送所述第一模型中所述第一子网的参数，而不向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。
根据权利要求9所述的方法，其特征在于，所述方法还包括：

向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。
一种模型训练方法，应用于客户端，所述客户端维护有无标签数据和有标签数据，其特征在于，所述方法包括：

根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；

根据所述第一模型的参数和所述有标签数据对第四模型进行训练，以获得所述第四模型的参数；

向所述服务端发送所述第四模型中第一子网的参数和第二子网的参数；

根据来自所述服务端的所述第一子网的参数和所述第二子网的参数更新所述第四模型。
根据权利要求12所述的方法，其特征在于，仅向所述服务端发送所述第四模型中所述第一子网的参数和所述第二子网的参数，而不向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。
根据权利要求12所述的方法，其特征在于，所述方法还包括：

向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。
一种模型训练装置，其特征在于，所述装置包括：

训练模块，用于根据客户端上报的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数，所述第二模型包括所述第一子网和第三子网；

发送模块，用于向所述客户端发送更新后的所述第一子网的参数以及所述第三子网的参数。
根据权利要求15所述的装置，其特征在于，所述客户端的数量为K个，K为大于1的整数，所述装置还包括处理模块，用于：

对来自所述K个客户端的K个第一子网的参数进行聚合处理，以得到处理后的第一子网的参数；

所述训练模块，还用于：

根据所述处理后的第一子网的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。
根据权利要求15或16所述的装置，其特征在于，所述训练模块，还用于：

根据客户端上报的第一子网的参数和所述无标签数据对第三模型进行训练，以更新所述第三模型的参数；

根据所述第三模型的参数和所述有标签数据对第二模型进行训练，以更新所述第二模型的参数。
一种模型训练装置，其特征在于，所述装置包括：

训练模块，用于根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；

发送模块，用于向所述服务端发送所述第一模型中第一子网的参数，所述第一模型还包括第二子网；

更新模块，用于根据来自所述服务端的所述第一子网的参数和第三子网的参数得到目标模型，其中，所述目标模型包括所述第一子网和所述第三子网，所述第三子网与所述第二子网对应。
根据权利要求18所述的装置，其特征在于，所述发送模块，用于：

仅向所述服务端发送所述第一模型中所述第一子网的参数，而不向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。
根据权利要求18所述的装置，其特征在于，所述发送模块，还用于：

向所述服务端发送所述第一模型中除所述第一子网的参数之外的参数。
一种模型训练装置，其特征在于，所述装置包括：

训练模块，用于根据所述无标签数据对第一模型进行训练，以获得所述第一模型的参数；根据所述第一模型的参数和所述有标签数据对第四模型进行训练，以获得所述第四模型的参数；

发送模块，用于向所述服务端发送所述第四模型中第一子网的参数和第二子网的参数；

更新模块，用于根据来自所述服务端的所述第一子网的参数和所述第二子网的参数更新所述第四模型。
根据权利要求21所述的装置，其特征在于，所述发送模块，用于：

仅向所述服务端发送所述第四模型中所述第一子网的参数和所述第二子网的参数，而不向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。
根据权利要求21所述的装置，其特征在于，所述发送模块，还用于：

向所述服务端发送所述第四模型中除所述第一子网的参数和所述第二子网的参数之外的参数。
一种模型训练装置，其特征在于，包括处理器和存储器；其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行如权利要求6至8任意一项所述的方法，和/或9至11任意一项所述的方法，和/或12至14任意一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现如权利要求6至8任意一项所述的方法，和/或9至11任意一项所述的方法，和/或12至14任意一项所述的方法。
一种计算机程序产品，其特征在于，当计算机程序产品在计算机上运行时，使得所述计算机执行如权利要求6至8任意一项所述的方法，和/或9至11任意一项所述的方法，和/或12至14任意一项所述的方法。