WO2021115480A1

WO2021115480A1 - 联邦学习方法、装置、设备和存储介质

Info

Publication number: WO2021115480A1
Application number: PCT/CN2020/136112
Authority: WO
Inventors: 周学立; 朱恩东; 张茜; 凌海挺
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-06-30
Filing date: 2020-12-14
Publication date: 2021-06-17
Also published as: CN111768008B; CN111768008A

Abstract

一种联邦学习方法，涉及人工智能领域，包括：获取参与目标联邦学习任务的至少两个客户端的任务配置信息；所述任务配置信息为基于所述客户端接收到的任务配置数据进行汇总得到的；根据所述任务配置信息，对所述目标联邦学习任务中的模型训练配置信息进行初始化；基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作，将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型。还涉及机器学习领域。

Description

联邦学习方法、装置、设备和存储介质

本申请要求于2020年06月30日提交中国专利局，申请号为2020106136778，申请名称为“联邦学习方法、装置、设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及机器学习技术领域，特别是涉及一种联邦学习方法、装置、设备和存储介质。

背景技术

联邦学习又名联邦机器学习，联合学习，联盟学习。联邦机器学习是一个机器学习框架，能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模。

然而，发明人意识到，传统技术在进行联邦学习时，往往需要用户针对联邦学习任务进行一系列繁琐地调试工作，例如，手动调节待训练模型的模型参数、手动进行特征工程等工作，对用户的专业知识和建模经验都有着较高的要求，易用性较差。

发明内容

根据本申请公开的各种实施例，提供一种联邦学习方法、装置、计算机设备和存储介质。

一种联邦学习方法包括：

获取参与目标联邦学习任务的至少两个客户端的任务配置信息；所述任务配置信息为基于所述客户端接收到的任务配置数据进行汇总得到的；所述任务配置数据为用户针对所述目标联邦学习任务录入的数据；

根据所述任务配置信息，对所述目标联邦学习任务中的模型训练配置信息进行初始化；

基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作；及

将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型；所述训练后的联邦学习模型用于供对应的所述客户端对接收到的用户数据进行业务处理。

一种联邦学习装置包括：

获取模块，用于获取参与目标联邦学习任务的至少两个客户端的任务配置信息；所述任务配置信息为基于所述客户端接收到的任务配置数据进行汇总得到的；所述任务配置数据为用户针对所述目标联邦学习任务录入的数据；

初始化模块，用于根据所述任务配置信息，对所述目标联邦学习任务中的模型训练配置信息进行初始化；

执行模块，用于基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作；及

更新模块，用于将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型；所述训练后的联邦学习模型用于供对应的所述客户端对接收到的用户数据进行业务处理。

一种计算机设备，包括存储器和一个或多个处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述一个或多个处理器执行以下步骤：

一个或多个存储有计算机可读指令的计算机可读存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：

上述一种联邦学习方法、装置、计算机设备和存储介质，通过获取参与目标联邦学习任务的至少两个客户端的任务配置信息；其中，该任务配置信息为基于客户端接收到的任务配置数据进行汇总得到的；任务配置数据为用户针对目标联邦学习任务录入的数据；并根据任务配置信息，对目标联邦学习任务中的模型训练配置信息进行初始化；最后，基于初始化后的模型训练配置信息，执行目标联邦学习任务的模型训练操作，并将在执行模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户可以根据该模型更新参数本地的联邦学习模型进行更新，进而得到用于供对应的客户端对接收到的用户数据进行业务处理的训练后的联邦学习模型；如此，实现了基于多方用户预先录入的任务配置数据，自动化地完成对目标联邦学习任务中的模型训练配置信息进行初始化设置进而供后续进行联邦机器学习，无需多方用户对联邦学习任务中的各个环节进行一系列繁琐地调试和设置工作，减少了在执行联邦学习任务过程中对用户的专业知识和建模经验依赖，提高了联邦学习的易用性。

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为根据一个或多个实施例中一种联邦学习方法的应用环境图；

图2为根据一个或多个实施例中一种联邦学习方法的流程示意图；

图3为另一个实施例中一种联邦学习的流程示意图；

图4为另一个实施例中一种联邦学习方法的流程示意图；

图5为根据一个或多个实施例中一种联邦学习装置的框图；

图6为根据一个或多个实施例中计算机设备的框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的一种联邦学习方法，可以应用于如图1所示的应用环境中。其中，客户端110通过网络与服务端120进行通信。其中，服务端120获取参与目标联邦学习任务的至少两个客户端110的任务配置信息；任务配置信息为至少两个客户端基于目标联邦学习任务创建得到的；服务端120根据任务配置信息，对目标联邦学习任务中的模型训练配置信息进行初始化；服务端120基于初始化后的模型训练配置信息，执行目标联邦学习任务的模型训练操作；最后，服务端120将执行模型训练操作时生成的模型更新参数发送至对应的客户端110，以使客户端110更新本地的联邦学习模型，得到各个客户端110对应的训练后的联邦学习模型；训练后的联邦学习模型用于供对应的客户端110对接收到的用户数据进行业务处理。实际应用中，客户端110可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务端120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在其中一个实施例中，如图2所示，提供了一种联邦学习方法，以该方法应用于图1中的服务端为例进行说明，包括以下步骤：

步骤S202，获取参与目标联邦学习任务的至少两个客户端的任务配置信息。

其中，任务配置信息为基于客户端接收到的任务配置数据进行汇总得到的。

其中，任务配置数据为用户针对目标联邦学习任务录入的数据。

具体实现中，客户端需要基于目标联邦学习任务创建对应的任务配置信息。具体来说，客户端可以通过响应用户的联邦学习设置操作，对目标联邦学习任务的任务配置信息进行确定并进行创建；其中，目标联邦学习任务的任务配置信息包括但不限于：任务类型、引擎框架、自动调参算法、提前终止算法、特征工程信息及方法和数据预处理方法等信息。

当客户端确定目标联邦学习任务对应的任务配置信息后，客户端将任务配置信息发送至服务端，以使服务端获取参与目标联邦学习任务的至少两个客户端的任务配置信息。由于任务配置信息不涉及数据安全隐私问题，因此，客户端可以不经加密地向服务端发送该任务配置信息。

步骤S204，根据任务配置信息，对目标联邦学习任务中的模型训练配置信息进行初始化。

其中，模型训练配置信息可以是指在对目标联邦学习任务的机器学习模型进行训练时采用的配置信息。

具体实现中，当服务端接收到任务配置信息后，服务端可以根据接收到的任务配置信息，对目标联邦学习任务中的模型训练配置信息进行初始化设置。

具体来说，服务端根据该任务配置信息，确定针对目标联邦学习任务的目标任务类型、目标引擎框架、目标自动调参算法、目标提前终止算法、目标特征工程、目标数据预处理方案和目标待训练模型等配置信息，以对目标联邦学习任务中的模型训练配置信息进行初始化设置，并完成整个训练任务队列的部署安排。

步骤S206，基于初始化后的模型训练配置信息，执行目标联邦学习任务的模型训练操作。

其中，训练后的联邦学习模型用于供对应的客户端对接收到的用户数据进行业务处理。实际应用中，训练后的联邦学习模型可以应用于广告推荐系统、视频推荐系统、用户信用预测系统等业务系统中。

其中，训练后的联邦学习模型为服务端和客户端进行联邦学习得到的合作训练模型。

当服务端完成对目标联邦学习任务中的模型训练配置信息进行初始化设置后，服务端基于初始化后的模型训练配置信息，利用自动机器学习(auto-ML)执行目标联邦学习任务的模型训练操作。具体来说，服务端可以根据初始化后的模型训练配置信息，调度各个客户端对储存在客户端本地的用户数据进行自动数据预处理和自动特征工程，得到处理后的数据样本。然后，在基于处理后的数据样本，各个客户端和服务端相互合作对待训练的模型进行联邦学习训练。

例如，自动机器学习引擎当获取到任务配置信息后，自动机器学习引擎选定本次目标联邦学习任务需要使用的训练框架、准备使用的待训练模型、模型筛选评估方式和参数模型组等信息。然后，自动机器学习引擎根据选定的训练框架和待训练模型的属性，进行数据预处理工作和特征工程工作。自动机器学习引擎根据框架配置，启动训练框架引擎对数据进行训练，并在训练的中期或者结束的位置对结果进行评估。对输出的评估信息和模型信息进行整理汇总，反馈给全局的自动机器学习引擎，从而实现执行目标联邦学习任务的模型训练操作。

步骤S208，将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型。

具体实现中，各个客户端和服务端在合作对待训练的模型进行联邦学习训练的过程中，各个客户端可以将基于服务端预先分发的公钥以加密形式交互用于计算梯度的中间结果。同时，各个客户端分别基于对上述的中间结果进行计算，并把计算结果汇总给服务端。服务端通过汇总上述的计算结果，计算出总梯度值即模型更新参数，最后将计算得到的模型更新参数发送至对应的客户端，以使各个客户端根据该模型更新参数，更新本地的联邦学习模型的模型参数。

上述联邦学习方法中，通过获取参与目标联邦学习任务的至少两个客户端的任务配置信息；其中，该任务配置信息为基于客户端接收到的任务配置数据进行汇总得到的；任务配置数据为用户针对目标联邦学习任务录入的数据；并根据任务配置信息，对目标联邦学习任务中的模型训练配置信息进行初始化；最后，基于初始化后的模型训练配置信息，执行目标联邦学习任务的模型训练操作，并将在执行模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户可以根据该模型更新参数本地的联邦学习模型进行更新，进而得到用于供对应的客户端对接收到的用户数据进行业务处理的训练后的联邦学习模型；如此，实现了基于多方用户预先录入的任务配置数据，自动化地完成对目标联邦学习任务中的模型训练配置信息进行初始化设置进而供后续进行联邦机器学习，无需多方用户对联邦学习任务中的各个环节进行一系列繁琐地调试和设置工作，减少了在执行联邦学习任务过程中对用户的专业知识和建模经验依赖，提高了联邦学习的易用性。

在其中一个实施例中，获取参与目标联邦学习任务的至少两个客户端的任务配置信息，包括：接收至少两个客户端发送的任务配置解析结果；任务配置解析结果为客户端对用户录入的任务配置数据进行解析得到的；任务配置数据为用户基于目标联邦学习任务确定的；汇总多个任务配置解析结果，得到任务配置信息。

具体实现中，服务端在获取参与目标联邦学习任务的至少两个客户端的任务配置信息的过程中，具体包括：当用户通过客户端录入的任务配置数据后，客户端对任务配置数据进行解析，得到任务配置解析结果；然后，客户端通过联邦学习通信的方式将任务配置解析结果发送至服务端。当服务端接收到至少两个客户端发送的任务配置解析结果时，汇总多个任务配置解析结果，得到任务配置信息。

举例来说，用户完成符合任务的Json配置文件填写，并将配置文件部署到客户端指定路径下。其中，配置文件包括frame(框架信息)、model_type(模型类型信息)、eval_mode(评估模式信息)和params(模型调参信息)等参数。

然后，客户端对任务进行解析，解析内容包括但不限于：启动任务的类型、需要使用的引擎框架、需要使用的自动调参算法、需要使用的提前终止算法、是否需要进行特征工程及方法等等。以上解析结果发生并存储于各个客户端本地，并由数据支向服务端进行通信汇总，汇总得到的任务配置解析结果存储于服务端，并由服务端完成整个任务队列的部署安排，储存在任务队列的任务，会依据现有环境信息(例如计算资源情况、前期训练结果等)，进行筛选或者增加，并在多方联邦学习的集群的现有队列中进行下属环节的逐个作业。

本实施例的技术方案，通过接收各个客户端对用户录入的任务配置数据进行解析得到的解析结果并进行汇总，准确地确定针对目标联邦学习任务的任务配置信息，进而便于后续为各个联邦学习参与端分配对应的计算任务，从而实现执行目标联邦学习任务的模型训练操作，进而得到与各个客户端对应的训练后的联邦学习模型。

在其中一个实施例中，基于初始化后的模型训练配置信息，执行目标联邦学习任务的模型训练操作，得到训练后的联邦学习模型，包括：在初始化后的模型训练配置信息中，确定针对模型训练操作的特征工程信息；根据特征工程信息，对储存于各个客户端本地的用户数据样本进行特征处理，得到模型训练数据样本；基于模型训练数据样本，执行目标联邦学习任务的模型训练操作，得到训练后的联邦学习模型。

其中，特征工程信息可以是在执行模型训练操作过程中所采用的目标特征工程对应的信息。

具体实现中，在用户通过客户端录入针对目标联邦学习任务的任务配置数据的过程中，用户可以针对该目标联邦学习任务，在多个候选特征工程中确定适合于客户端本地所储存的用户数据样本的目标特征工程，进而得到任务配置信息。如此，在服务端根据该任务配置信息，对目标联邦学习任务中的模型训练配置信息进行初始化时，服务端可以将模型训练配置信息中的特征工程信息设置为与用户预先录入的目标特征工程一致的特征工程信息。

然后，服务端在基于初始化后的模型训练配置信息，执行目标联邦学习任务的模型训练操作的过程中，服务端可以在初始化后的模型训练配置信息中，确定针对模型训练操作的特征工程信息；服务端根据特征工程信息，通过调度各个客户端对储存于各个客户端本地的用户数据样本进行特征处理，得到模型训练数据样本。具体地，用户数据样本进行特征的编码，离散，正则化，不同特征之间的交叉等操作。同时，在进行特征处理的过程中，还可以对多个客户端本地的用户数据样本进行交集匹配。其中，交集匹配主要涉及ID的一致性处理，RSA加密计算，通信传输等环节。

最后，基于模型训练数据样本，执行目标联邦学习任务的模型训练操作，得到训练后的联邦学习模型。

本实施例的技术方案，在进行联邦学习的模型训练操作之前，通过在初始化后的模型训练配置信息中，确定针对模型训练操作的特征工程信息，进而基于该特征工程信息，调度各个客户端对储存于本地的用户数据样本进行相应的特征处理，从而得到适用于联邦学习的模型训练数据样本，提高了联邦学习过程中的训练效率。

在其中一个实施例中，在根据初始化后的模型训练配置信息，确定针对模型训练操作的特征工程信息的步骤之前，还包括：在初始化后的模型训练配置信息中，确定针对模型训练操作的数据预处理配置信息；根据数据预处理配置信息，对储存于各个客户端本地的原始用户数据进行数据预处理，得到用户数据样本。

具体实现中，在根据初始化后的模型训练配置信息，确定针对模型训练操作的特征工程信息的步骤之前，还包括：服务端在初始化后的模型训练配置信息中，确定针对模型训练操作的数据预处理配置信息；然后，服务端根据数据预处理配置信息，调度各个客户端对储存于各个客户端本地的原始用户数据进行数据预处理，得到用户数据样本。具体来说，可以对原始用户数据进行缺失值、异常值、字符串处理等等，进而得到用于供后续进行特征工程的用户数据样本。

本实施例的技术方案，在对储存于本地的用户数据样本进行特征工程之前，通过根据初始化后的模型训练配置信息，确定针对模型训练操作的数据预处理配置信息，进而基于该数据预处理配置信息，调度各个客户端对储存于本地的原始用户数据进行相应的数据预处理，从而得到便于后续进行特征工程处理的用户数据样本。

在其中一个实施例中，目标联邦学习任务具有多个子模型训练任务，基于模型训练数据样本，执行目标联邦学习任务的模型训练操作，得到训练后的联邦学习模型，包括：获取任务处理队列；任务处理队列用于表征多个子模型训练任务的执行顺序；根据任务处理队列，执行多个子模型训练任务，以基于模型训练数据样本，对目标联邦学习任务中的联邦学习模型进行联邦学习训练，得到各个所述客户端对应的模型更新参数；其中，联邦学习模型为基于初始化后的模型训练配置信息选择得到的。

其中，目标联邦学习任务具有多个子模型训练任务。同时，各个子模型训练任务之间的执行解耦互不影响。

具体实现中，在基于模型训练数据样本，执行目标联邦学习任务的模型训练操作，得到训练后的联邦学习模型的过程中，具体包括：服务端的自动机器学习引擎启动后，获取用于表征多个子模型训练任务的执行顺序的任务处理队列；然后，根据任务处理队列，执行多个子模型训练任务；具体来说，服务端向各个客户端请求获取计算资源执行子模型训练任务；其中，子模型训练任务的表现形式为联邦学习，即机器学习的模型训练数据样本分布在不同的客户端中，数据安全不可见。各个客户端通过对中间结果的加密传输运算，同时，各个客户端分别基于对上述的中间结果进行计算，并把计算结果汇总给服务端。服务端通过汇总上述的计算结果，计算出总梯度值即模型更新参数，最后将计算得到的模型更新参数发送至对应的客户端，以使各个客户端根据该模型更新参数，更新本地的联邦学习模型的模型参数，进而实现合作完成目标联邦学习任务中的联邦学习模型的联邦学习训练，同时各个客户端对应的相关模型和数据不出客户端本地。计算任务通过处在服务端的全局进行管理调度。

本实施例的技术方案，目标联邦学习任务具有多个子模型训练任务，通过根据任务处理队列有序地对各个子模型训练任务进行调度和执行，从而高效地执行目标联邦学习任务的模型训练操作，完成目标联邦学习任务中的联邦学习模型进行联邦学习训练，得到各个参与方合作训练得到的训练后的联邦学习模型。

在其中一个实施例中，根据任务处理队列，执行多个子模型训练任务，包括：当完成执行各个子训练任务后，组合多个子训练任务返回的处理结果，得到目标联邦学习任务对应的任务处理结果；根据任务处理结果，判断训练后的联邦学习模型是否满足预设的训练终止条件；若否，则基于训练后的联邦学习模型的模型性能测试结果，调整初始化后的模型训练配置信息；基于调整后的模型训练配置信息，执行目标联邦学习任务的下一轮模型训练操作。

其中，训练终止条件包括当训练后的联邦学习模型的模型生成结果已经达到了目标需求、训练后的联邦学习模型的提升情况收敛等条件。

具体实现中，在服务端根据任务处理队列，执行多个子模型训练任务的过程中，具体包括：当服务端完成执行各个子训练任务后，服务端组合多个子训练任务返回的处理结果，得到目标联邦学习任务对应的任务处理结果；根据任务处理结果，判断训练后的联邦学习模型是否满足预设的训练终止条件；若否，则基于训练后的联邦学习模型的模型性能测试结果，调整初始化后的模型训练配置信息。具体来说，服务端可以对训练后的联邦学习模型的模型性能进行测试，进而获取训练后的联邦学习模型的模型性能测试结果(其中，模型性能测试结果包括但不限于：loss(模型损失),模型评估指标AUC(area under the curve),准确率KS指标等)；最后，服务端在基于该模型性能测试结果，重新调整初始化后的模型训练配置信息，例如，调整联邦学习模型的模型网络结构、模型训练方法、采用的损失函数、数据预处理方法、目标特征工程等。当然，服务端对汇总的任务信息进行处理，根据任务开始时的任务要求选择对应的方法。具体地，如果选择的是网格搜索法，则从任务队列中选择一则任务继续即可。如果选择的是贝叶斯、NAS等算法，则进行算法选择下一则任务并继续运行。最后，基于调整后的模型训练配置信息，执行目标联邦学习任务的下一轮模型训练操作。

举例来说，服务端的自动机器学习引擎会对训练的评估信息进行解析，判断是否要进行提前停止或者选择下一轮的任务配置信息，或者通过算法生成下一轮的任务配置信息，并重复执行上述的模型训练操作。更具体地，当完成执行各个子训练任务后，服务端中的各任务计算单元计算出各个子训练任务对应的处理结果，各计算单元将任务结果汇总传输至服务端的master；服务端的master对内存储需要的信息，并将任务参数信息及其任务处理结果传输至服务端的assistant；服务端的assistant计算并得到相应需要的下一步任务环节信息即调整初始化后的模型训练配置信息(例如，是否继续训练搜索，训练的任务参数等等)，并将调整后的模型训练配置信息传输给服务端的Master；服务端的Master将调整后的模型训练配置信息进行处理，传输进入任务处理队列之中，当某一任务在任务处理队列中被执行时，则会把该任务对应的任务参数通信传输给多方客户端对应的计算单元之内并执行任务。执行任务后继续重复本环节任务，直到任务完成或者提前终止。

另外，还可以将执行所述目标联邦学习任务的模型训练操作过程中的产生的一系列训练记录信息进行可视化展示。

举例来说，服务端在得到目标联邦学习任务对应的任务处理结果后，还可以对任务处理结果和模型评估结果并进行安全展示。其中，展示信息包括但不限于：训练任务名称，训练任务具体内容，开始时间，目前子任务环节，历史子任务完成情况，完成结果，以及自动学习线路等等。

同时，考虑到Label(标签)提供方的数据安全性，服务端可以不对除Label(标签)提供方以外的数据支持方提供Label(标签)提供方。

为了便于本领域技术人员的理解，图3提供了一种联邦学习的流程示意图。

本实施例的技术方案，通过组合多个子训练任务返回的处理结果，得到目标联邦学习任务对应的任务处理结果，并基于该任务处理结果实现对邦联学习训练效果进行评估，判断训练后的联邦学习模型是否满足预设的训练终止条件，进而及时结束联邦学习模型的训练任务；当训练后的联邦学习模型不满足预设的训练终止条件时，则基于训练后的联邦学习模型的模型性能测试结果，调整初始化后的模型训练配置信息；基于调整后的模型训练配置信息，执行目标联邦学习任务的下一轮模型训练操作，进而实现不断地调整目标联邦学习任务的训练策略，实现高效地进行联邦学习。

在其中一个实施例中，上述的方法还包括：接收至少两个客户端各自发送的样本分布差异信息；基于样本分布差异信息，确定针对目标联邦学习任务的整体样本变动值；当整体样本变动值大于预设的变动阈值时，重新生成目标联邦学习任务中的联邦学习模型；基于新增数据样本集合，对重新生成的联邦学习模型进行联邦学习训练，得到训练后的联邦学习模型。

其中，样本分布差异信息为对应的客户端在接收到新增数据样本集合时，根据历史数据样本集合和新增数据样本集合之间的分布差异得到的。

举例来说，当客户端接收到新增数据样本集合test时，客户端从历史保留信息中提取历史数据样本集合base；然后，客户端启动相应计算逻辑计算新增数据样本集合test的相关数据，并完成计算历史数据样本集合和新增数据样本集合之间的分布差异，得到样本分布差异信息PSI。其中，样本分布差异信息PSI可以表示为：

其中，i表示每个特征的第i个取值分段，P表示数量占比。其中，当特征具有多个时，可以综合考虑每一个特征对应的PSI，考虑不稳定的特征数，和整体PSI的均值作为样本分布差异信息，进而用于判定是否分层的依据。

当各个客户端计算得到样本分布差异信息PSI后，各个客户端通过联邦通信形式向服务端汇总结果；服务端基于样本分布差异信息PSI计算相应指标；例如计算出整体样本变动值。具体地，服务端可以基于样本分布差异信息PSI，确定各个客户端内部的样本稳定程度值A、基于全局的数据信息判定整体受影响的因子个数B以及整体受影响的因子占比C；最后，服务端可以根据样本稳定程度值、整体受影响的因子个数、整体受影响的因子占比进行加权求和或者加权平均等计算方式，确定整体样本变动值。

当服务端确定整体样本变动值大于预设的变动阈值时，则判定样本出现较大出入，服务端则重新生成目标联邦学习任务中的联邦学习模型；基于新增数据样本集合，对重新生成的联邦学习模型进行联邦学习训练，以实现重启自动机器学习(auto-ML)的训练逻辑，进而得到训练后的联邦学习模型。

本实施例的技术方案，通过接收至少两个客户端各自发送的样本分布差异信息，实现对客户端本地的样本数据的分布情况进行计算和监控。若计算得到的整体样本变动值大于预设的变动阈值时，则对待训练的模型组进行重新的生成，并再基于新增数据样本集合重新的最优模型学习，以保证模型业务效果的长期稳定。

在其中一个实施例中，如图4所示，提供了一种联邦学习方法，以该方法应用于图1中的服务端为例进行说明，包括以下步骤：步骤S410，接收至少两个所述客户端发送的任务配置解析结果；所述任务配置解析结果为所述客户端对所述用户录入的任务配置数据进行解析得到的结果。步骤S420，汇总多个所述任务配置解析结果，得到任务配置信息。步骤S430，根据所述任务配置信息，对所述目标联邦学习任务中的模型训练配置信息进行初始化。步骤S440，基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作；步骤S450，将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型；所述训练后的联邦学习模型用于供对应的所述客户端对接收到的用户数据进行业务处理。上述步骤的具体限定可以参见上文对一种联邦学习方法的具体限定。

应该理解的是，虽然图2和图4的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2和图4中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在其中一个实施例中，如图5所示，提供了一种联邦学习装置，包括：

获取模块510，用于获取参与目标联邦学习任务的至少两个客户端的任务配置信息；所述任务配置信息为基于所述客户端接收到的任务配置数据进行汇总得到的；所述任务配置数据为用户针对所述目标联邦学习任务录入的数据；

初始化模块520，用于根据所述任务配置信息，对所述目标联邦学习任务中的模型训练配置信息进行初始化；

执行模块530，用于基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作；及

更新模块540，用于将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型；所述训练后的联邦学习模型用于供对应的所述客户端对接收到的用户数据进行业务处理。

在其中一个实施例中，所述获取模块510，具体用于接收至少两个所述客户端发送的任务配置解析结果；所述任务配置解析结果为所述客户端对所述用户录入的任务配置数据进行解析得到的结果；及汇总多个所述任务配置解析结果，得到所述任务配置信息。

在其中一个实施例中，所述执行模块530，具体用于在所述初始化后的模型训练配置信息中，确定针对所述模型训练操作的特征工程信息；根据所述特征工程信息，对储存于各个所述客户端本地的用户数据样本进行特征处理，得到模型训练数据样本；及基于所述模型训练数据样本，执行所述目标联邦学习任务的模型训练操作，得到所述训练后的联邦学习模型。

在其中一个实施例中，所述执行模块530，具体用于在所述初始化后的模型训练配置信息中，确定针对所述模型训练操作的数据预处理配置信息；及根据所述数据预处理配置信息，对储存于各个所述客户端本地的原始用户数据进行数据预处理，得到所述用户数据样本。

在其中一个实施例中，所述目标联邦学习任务具有多个子模型训练任务，所述执行模块530，具体用于获取任务处理队列；所述任务处理队列用于表征多个所述子模型训练任务的执行顺序；及根据所述任务处理队列，执行多个所述子模型训练任务，以基于所述模型训练数据样本，对所述目标联邦学习任务中的联邦学习模型进行联邦学习训练，得到各个所述客户端对应的模型更新参数；其中，所述联邦学习模型为基于所述初始化后的模型训练配置信息选择得到的。

在其中一个实施例中，所述执行模块530，具体用于当完成执行各个所述子训练任务后，组合多个所述子训练任务返回的处理结果，得到所述目标联邦学习任务对应的任务处理结果；根据所述任务处理结果，判断所述训练后的联邦学习模型是否满足预设的训练终止条件；若否，则基于所述训练后的联邦学习模型的模型性能测试结果，调整所述初始化后的模型训练配置信息；及基于调整后的模型训练配置信息，执行所述目标联邦学习任务的下一轮模型训练操作。

在其中一个实施例中，所述联邦学习装置，还包括：接收模块，用于接收至少两个所述客户端各自发送的样本分布差异信息；所述样本分布差异信息为对应的所述客户端在接收到新增数据样本集合时，根据历史数据样本集合和新增数据样本集合之间的分布差异得到的；监控模块，用于基于所述样本分布差异信息，确定针对所述目标联邦学习任务的整体样本变动值；生成模块，用于当所述整体样本变动值大于预设的变动阈值时，重新生成所述目标联邦学习任务中的联邦学习模型；及更新模块，用于基于所述新增数据样本集合，对重新生成的联邦学习模型进行联邦学习训练，得到所述训练后的联邦学习模型。

关于联邦学习装置的具体限定可以参见上文中对于联邦学习方法的限定，在此不再赘述。上述联邦学习装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在其中一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性或易失性存储介质、内存储器。该非易失性或易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性或易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储联邦学习数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种联邦学习方法。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

一种计算机设备，包括存储器和一个或多个处理器，存储器中储存有计算机可读指令，计算机可读指令被处理器执行时，使得所述一个或多个处理器执行以下步骤：

一个或多个存储有计算机可读指令的计算机可读存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性，计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种联邦学习方法，包括：

获取参与目标联邦学习任务的至少两个客户端的任务配置信息；所述任务配置信息为基于所述客户端接收到的任务配置数据进行汇总得到的；所述任务配置数据为用户针对所述目标联邦学习任务录入的数据；

根据所述任务配置信息，对所述目标联邦学习任务中的模型训练配置信息进行初始化；

基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作；及

将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型；所述训练后的联邦学习模型用于供对应的所述客户端对接收到的用户数据进行业务处理。
根据权利要求1所述的方法，其中，所述获取参与目标联邦学习任务的至少两个客户端的任务配置信息，包括：

接收至少两个所述客户端发送的任务配置解析结果；所述任务配置解析结果为所述客户端对所述用户录入的任务配置数据进行解析得到的结果；及

汇总多个所述任务配置解析结果，得到所述任务配置信息。
根据权利要求1所述的方法，其中，所述基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作，包括：

在所述初始化后的模型训练配置信息中，确定针对所述模型训练操作的特征工程信息；

根据所述特征工程信息，对储存于各个所述客户端本地的用户数据样本进行特征处理，得到模型训练数据样本；及

基于所述模型训练数据样本，执行所述目标联邦学习任务的模型训练操作。
根据权利要求3所述的方法，其中，在所述根据所述初始化后的模型训练配置信息，确定针对所述模型训练操作的特征工程信息的步骤之前，所述方法还包括：

在所述初始化后的模型训练配置信息中，确定针对所述模型训练操作的数据预处理配置信息；及

根据所述数据预处理配置信息，对储存于各个所述客户端本地的原始用户数据进行数据预处理，得到所述用户数据样本。
根据权利要求1所述的方法，其中，所述目标联邦学习任务具有多个子模型训练任务，所述基于所述模型训练数据样本，执行所述目标联邦学习任务的模型训练操作，包括：

获取任务处理队列；所述任务处理队列用于表征多个所述子模型训练任务的执行顺序；及

根据所述任务处理队列，执行多个所述子模型训练任务，以基于所述模型训练数据样本，对所述目标联邦学习任务中的联邦学习模型进行联邦学习训练，得到各个所述客户端对应的模型更新参数；其中，所述联邦学习模型为基于所述初始化后的模型训练配置信息选择得到的。
根据权利要求5所述的方法，其中，所述根据所述任务处理队列，执行多个所述子模型训练任务，包括：

当完成执行各个所述子训练任务后，组合多个所述子训练任务返回的处理结果，得到所述目标联邦学习任务对应的任务处理结果；

根据所述任务处理结果，判断所述训练后的联邦学习模型是否满足预设的训练终止条件；

若否，则基于所述训练后的联邦学习模型的模型性能测试结果，调整所述初始化后的模型训练配置信息；及

基于调整后的模型训练配置信息，执行所述目标联邦学习任务的下一轮模型训练操作。
根据权利要求1所述的方法，其中，所述方法还包括：

接收至少两个所述客户端各自发送的样本分布差异信息；所述样本分布差异信息为对应的所述客户端在接收到新增数据样本集合时，根据历史数据样本集合和新增数据样本集合之间的分布差异得到的；

基于所述样本分布差异信息，确定针对所述目标联邦学习任务的整体样本变动值；

当所述整体样本变动值大于预设的变动阈值时，重新生成所述目标联邦学习任务中的联邦学习模型；及

基于所述新增数据样本集合，对重新生成的联邦学习模型进行联邦学习训练，得到所述训练后的联邦学习模型。
一种联邦学习装置，包括：

获取模块，用于获取参与目标联邦学习任务的至少两个客户端的任务配置信息；所述任务配置信息为基于所述客户端接收到的任务配置数据进行汇总得到的；所述任务配置数据为用户针对所述目标联邦学习任务录入的数据；

初始化模块，用于根据所述任务配置信息，对所述目标联邦学习任务中的模型训练配置信息进行初始化；

执行模块，用于基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作；及

更新模块，用于将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型；所述训练后的联邦学习模型用于供对应的所述客户端对接收到的用户数据进行业务处理。
一种计算机设备，包括存储器及一个或多个处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

获取参与目标联邦学习任务的至少两个客户端的任务配置信息；所述任务配置信息为基于所述客户端接收到的任务配置数据进行汇总得到的；所述任务配置数据为用户针对所述目标联邦学习任务录入的数据；

根据所述任务配置信息，对所述目标联邦学习任务中的模型训练配置信息进行初始化；

基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作；及

将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型；所述训练后的联邦学习模型用于供对应的所述客户端对接收到的用户数据进行业务处理。
根据权利要求9所述的计算机设备，其中，所述获取参与目标联邦学习任务的至少两个客户端的任务配置信息，所述处理器执行所述计算机可读指令时还执行以下步骤：

接收至少两个所述客户端发送的任务配置解析结果；所述任务配置解析结果为所述客户端对所述用户录入的任务配置数据进行解析得到的结果；及

汇总多个所述任务配置解析结果，得到所述任务配置信息。
根据权利要求9所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤：

在所述初始化后的模型训练配置信息中，确定针对所述模型训练操作的特征工程信息；

根据所述特征工程信息，对储存于各个所述客户端本地的用户数据样本进行特征处理，得到模型训练数据样本；及

基于所述模型训练数据样本，执行所述目标联邦学习任务的模型训练操作。
根据权利要求11所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤：

在所述初始化后的模型训练配置信息中，确定针对所述模型训练操作的数据预处理配置信息；及

根据所述数据预处理配置信息，对储存于各个所述客户端本地的原始用户数据进行数据预处理，得到所述用户数据样本。
根据权利要求9所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤：

获取任务处理队列；所述任务处理队列用于表征多个所述子模型训练任务的执行顺序；及

根据所述任务处理队列，执行多个所述子模型训练任务，以基于所述模型训练数据样本，对所述目标联邦学习任务中的联邦学习模型进行联邦学习训练，得到各个所述客户端对应的模型更新参数；其中，所述联邦学习模型为基于所述初始化后的模型训练配置信息选择得到的。
根据权利要求13所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤：

当完成执行各个所述子训练任务后，组合多个所述子训练任务返回的处理结果，得到所述目标联邦学习任务对应的任务处理结果；

根据所述任务处理结果，判断所述训练后的联邦学习模型是否满足预设的训练终止条件；

若否，则基于所述训练后的联邦学习模型的模型性能测试结果，调整所述初始化后的模型训练配置信息；及

基于调整后的模型训练配置信息，执行所述目标联邦学习任务的下一轮模型训练操作。
根据权利要求9所述的计算机设备，其中，所述处理器执行所述计算机可读指令时还执行以下步骤：

接收至少两个所述客户端各自发送的样本分布差异信息；所述样本分布差异信息为对应的所述客户端在接收到新增数据样本集合时，根据历史数据样本集合和新增数据样本集合之间的分布差异得到的；

基于所述样本分布差异信息，确定针对所述目标联邦学习任务的整体样本变动值；

当所述整体样本变动值大于预设的变动阈值时，重新生成所述目标联邦学习任务中的联邦学习模型；及

基于所述新增数据样本集合，对重新生成的联邦学习模型进行联邦学习训练，得到所述训练后的联邦学习模型。
一个或多个存储有计算机可读指令的计算机可读存储介质，所述计算机可读指令被一个或多个处理器执行时，使得所述一个或多个处理器执行以下步骤：

获取参与目标联邦学习任务的至少两个客户端的任务配置信息；所述任务配置信息为基于所述客户端接收到的任务配置数据进行汇总得到的；所述任务配置数据为用户针对所述目标联邦学习任务录入的数据；

根据所述任务配置信息，对所述目标联邦学习任务中的模型训练配置信息进行初始化；

基于初始化后的模型训练配置信息，执行所述目标联邦学习任务的模型训练操作；及

将执行所述模型训练操作时生成的模型更新参数发送至对应的所述客户端，以使所述客户端更新本地的联邦学习模型，得到各个所述客户端对应的训练后的联邦学习模型；所述训练后的联邦学习模型用于供对应的所述客户端对接收到的用户数据进行业务处理。
根据权利要求16所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

接收至少两个所述客户端发送的任务配置解析结果；所述任务配置解析结果为所述客户端对所述用户录入的任务配置数据进行解析得到的结果；及

汇总多个所述任务配置解析结果，得到所述任务配置信息。
根据权利要求16所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

在所述初始化后的模型训练配置信息中，确定针对所述模型训练操作的特征工程信息；

根据所述特征工程信息，对储存于各个所述客户端本地的用户数据样本进行特征处理，得到模型训练数据样本；及

基于所述模型训练数据样本，执行所述目标联邦学习任务的模型训练操作。
根据权利要求18所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

在所述初始化后的模型训练配置信息中，确定针对所述模型训练操作的数据预处理配置信息；及

根据所述数据预处理配置信息，对储存于各个所述客户端本地的原始用户数据进行数据预处理，得到所述用户数据样本。
根据权利要求16所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

获取任务处理队列；所述任务处理队列用于表征多个所述子模型训练任务的执行顺序；及

根据所述任务处理队列，执行多个所述子模型训练任务，以基于所述模型训练数据样本，对所述目标联邦学习任务中的联邦学习模型进行联邦学习训练，得到各个所述客户端对应的模型更新参数；其中，所述联邦学习模型为基于所述初始化后的模型训练配置信息选择得到的。
根据权利要求20所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

当完成执行各个所述子训练任务后，组合多个所述子训练任务返回的处理结果，得到所述目标联邦学习任务对应的任务处理结果；

根据所述任务处理结果，判断所述训练后的联邦学习模型是否满足预设的训练终止条件；

若否，则基于所述训练后的联邦学习模型的模型性能测试结果，调整所述初始化后的模型训练配置信息；及

基于调整后的模型训练配置信息，执行所述目标联邦学习任务的下一轮模型训练操作。
根据权利要求16所述的存储介质，其中，所述计算机可读指令被所述处理器执行时还执行以下步骤：

接收至少两个所述客户端各自发送的样本分布差异信息；所述样本分布差异信息为对应的所述客户端在接收到新增数据样本集合时，根据历史数据样本集合和新增数据样本集合之间的分布差异得到的；

基于所述样本分布差异信息，确定针对所述目标联邦学习任务的整体样本变动值；

当所述整体样本变动值大于预设的变动阈值时，重新生成所述目标联邦学习任务中的联邦学习模型；及

基于所述新增数据样本集合，对重新生成的联邦学习模型进行联邦学习训练，得到所述训练后的联邦学习模型。