CN116362894A

CN116362894A - 多目标学习方法、装置、电子设备及计算机可读存储介质

Info

Publication number: CN116362894A
Application number: CN202310358631.XA
Authority: CN
Inventors: 黎建辉
Original assignee: Ping An Bank Co Ltd
Current assignee: Ping An Bank Co Ltd
Priority date: 2023-03-27
Filing date: 2023-03-27
Publication date: 2023-06-30

Abstract

本申请实施例提供了一种多目标学习方法、装置、电子设备及计算机可读存储介质，属于机器学习技术领域。其中方法包括：获取定期理财排序场景的多个业务影响因素；根据多个业务影响因素确定初始特征数据；确定定期理财排序场景的多个目标标签；将初始特征数据输入预先构建的基于专家组合的多目标模型，通过基于专家组合的多目标模型计算各目标标签的概率。这样，引入多个专家网络和多个门控网络，通过门控网络用不同的专家组合分别去学习不同的目标，使得各个目标能被更好地学习，提高相关性较低的业务中进行多目标学习的效果。

Description

多目标学习方法、装置、电子设备及计算机可读存储介质

技术领域

本申请涉及机器学习技术领域，尤其涉及一种多目标学习方法、装置、电子设备及计算机可读存储介质。

背景技术

目前，金融科技行业在进行定期理财建模时，往往是用基于特征共享的全连接神经网络模型进行多目标建模，这种模型的结构特点是所有目标共享同一个输入，现有技术提供的多目标建模限制了各个目标拟合的自由度，在相关性较低的业务中进行多目标学习的效果不佳。

发明内容

为了解决上述技术问题，本申请实施例提供了一种多目标学习方法、装置、电子设备及计算机可读存储介质。

第一方面，本申请实施例提供了一种多目标学习方法，所述方法包括：

获取定期理财排序场景的多个业务影响因素；

根据所述多个业务影响因素确定初始特征数据；

确定所述定期理财排序场景的多个目标标签；

将所述初始特征数据输入预先构建的基于专家组合的多目标模型，通过所述基于专家组合的多目标模型计算各所述目标标签的概率。

在一实施方式中，所述初始特征数据包括稀疏特征数据及稠密特征数据，所述通过所述基于专家组合的多目标模型计算各所述目标标签的概率，包括：

通过所述基于专家组合的多目标模型对所述稀疏特征数据及所述稠密特征数据进行嵌入向量化处理，得到嵌入特征数据，对所述嵌入特征数进行计算，得到各所述目标标签的概率。

在一实施方式中，所述基于专家组合的多目标模型包括多个专家网络、多个门控网络、多个任务顶层，专家网络的数量与门控网络的数量相同；

所述对所述嵌入特征数进行计算，包括：

通过各所述专家网络对所述嵌入特征数据进行计算，得到多个第一专家输出数据；

通过各所述门控网络对所述嵌入特征数据进行计算，得到多个门控输出数据；

将各所述第一专家输出数据与对应的一个所述门控输出数据进行加权计算，得到多个第二专家输出数据；

通过各所述任务顶层对多个所述第二专家输出数据进行加权计算。

在一实施方式中，所述根据所述多个业务影响因素确定初始特征数据，包括：

分别确定各业务影响因素与各目标标签的相关度；

确定相关度大于等于预设相关阈值的候选业务影响因素；

将所述候选业务影响因素确定为所述初始特征数据。

在一实施方式中，构建所述基于专家组合的多目标模型，包括：

针对所述定期理财排序场景获取业务数据集，按照预设比例将所述业务数据集划分为业务训练集及业务验证集；

设置专家网络的数量、门控网络的数量、任务的数量；

根据所述专家网络的数量、所述门控网络的数量、所述任务的数量、多个全连接层及多个任务顶层成构建初始目标模型；

根据所述训练集对所述初始目标模型进行训练，得到修正多目标模型；

根据所述业务验证集对所述修正多目标模型进行验证，得到各目标标签的验证概率；

在各目标标签的验证概率与各目标标签的真实概率的概率误差小于等于预设概率阈值时，将所述修正多目标模型确定为所述基于专家组合的多目标模型。

第二方面，本申请实施例提供了一种多目标学习装置，所述装置包括：

获取模块，用于获取定期理财排序场景的多个业务影响因素；

第一确定模块，用于根据所述多个业务影响因素确定初始特征数据；

第二确定模块，用于确定所述定期理财排序场景的多个目标标签；

计算模块，用于将所述初始特征数据输入预先构建的基于专家组合的多目标模型，通过所述基于专家组合的多目标模型计算各所述目标标签的概率。

在一实施方式中，所述初始特征数据包括稀疏特征数据及稠密特征数据；

所述计算模块，还用于通过所述基于专家组合的多目标模型对所述稀疏特征数据及所述稠密特征数据进行嵌入向量化处理，得到嵌入特征数据，对所述嵌入特征数进行计算，得到各所述目标标签的概率。

所述计算模块，还用于通过各所述专家网络对所述嵌入特征数据进行计算，得到多个第一专家输出数据；

第三方面，本申请实施例提供了一种电子设备，包括存储器以及处理器，所述存储器用于存储计算机程序，所述计算机程序在所述处理器运行时执行第一方面提供的多目标学习方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序在处理器上运行时执行第一方面提供的多目标学习方法。

上述本申请提供的多目标学习方法、装置、电子设备及计算机可读存储介质，获取定期理财排序场景的多个业务影响因素；根据所述多个业务影响因素确定初始特征数据；确定所述定期理财排序场景的多个目标标签；将所述初始特征数据输入预先构建的基于专家组合的多目标模型，通过所述基于专家组合的多目标模型计算各所述目标标签的概率。这样，引入多个专家网络和多个门控网络，通过门控网络用不同的专家组合分别去学习不同的目标，使得各个目标能被更好地学习，提高相关性较低的业务中进行多目标学习的效果。

附图说明

为了更清楚地说明本申请的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对本申请保护范围的限定。在各个附图中，类似的构成部分采用类似的编号。

图1示出了本申请实施例提供的多目标学习方法的流程示意图之一；

图2示出了本申请实施例提供的多目标学习方法的流程示意图之二；

图3示出了本申请实施例提供的多目标学习装置的结构示意图之一；

图4示出了本申请实施例提供的电子设备的结构示意图之一。

图标：300-多目标学习装置，301-获取模块，302-第一确定模块，303-第二确定模块，304-计算模块，400-电子设备，401-收发机，402-处理器，403-存储器。

具体实施方式

下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。

通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

在下文中，可在本申请的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合，并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。

此外，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

除非另有限定，否则在这里使用的所有术语(包括技术术语和科学术语)具有与本申请的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义，除非在本申请的各种实施例中被清楚地限定。

在金融科技行业中进行定期理财建模时，往往是用基于特征共享的全连接神经网络模型进行多目标建模，这种模型结构的特点是所有目标共享同一个输入，但是此方法也会给业务带来较多的问题。这些问题主要体现在如下几个方面：因为基于特征共享的全连接神经网络模型参数的硬共享，会限制业务各个目标在建模时拟合的自由度，影响模型拟合的效果；当业务不同目标之间相关性比较低时，会容易顾此失彼，难以学好各个目标；在实际建模时，传统的多目标方法对拟合相关性较高的二分类业务目标较好，但是当业务目标需要同时考虑用户留存时长、用户下单金额等非二分类业务目标时，效果往往不佳。综上所述，现有技术提供的多目标建模限制了各个目标拟合的自由度，在相关性较低的业务中进行多目标学习的效果不佳。

实施例1

本申请实施例提供了一种多目标学习方法。

参见图1，多目标学习方法包括步骤S101至步骤S104，下面对各步骤进行说明。

步骤S101，获取定期理财排序场景的多个业务影响因素。

在金融科技行业中包括多个金融业务场景，各个金融业务场景对应有不同的业务交互流程及业务指标。银行的定期理财排序场景的指标标签包括点击率、下单率、用户在预设时段内的留存率、及下单金额等，用户在预设时段内的留存率可以设置为用户7天的留存率，其中，用户在预设时段内的留存率、及下单金额等业务指标与点击率及下单率等传统的指标标签不一定是强相关关系。

在本实施例中，对于定期理财排序场景，可以提取会影响用户点击、是否下单、下单金额、7天是否留存的因素，将提取的影响因素确定为多个业务影响因素。

步骤S102，根据所述多个业务影响因素确定初始特征数据。

在本实施例中，通过数据分析，找出与业务指标相关性较高的业务影响因素，从多个业务影响因素中选择相关性较高的业务影响因素，基于相关性较高的业务影响因素确定初始特征数据。

在本实施例中，步骤S102包括：

分别确定各业务影响因素与各目标标签的相关度；

确定相关度大于等于预设相关阈值的候选业务影响因素；

将所述候选业务影响因素确定为所述初始特征数据。

需要说明的是，主要是计算各个因素与指标标签之间的相关性系数，相关性系数值越大则相关性越高，反之，相关性系数值越小则相关性越低。

步骤S103，确定所述定期理财排序场景的多个目标标签。

本实施例中，可以根据指标标签选取目标标签，例如，可以选择点击率、下单率、用户在预设时段内的留存率、及下单金额作为4个目标标签。

步骤S104，将所述初始特征数据输入预先构建的基于专家组合的多目标模型，通过所述基于专家组合的多目标模型计算各所述目标标签的概率。

在一实施方式中，所述初始特征数据包括稀疏特征数据及稠密特征数据，步骤S104中的通过所述基于专家组合的多目标模型计算各所述目标标签的概率，包括：

需要说明的是，稀疏特征数据(sparse_feature)和稠密特征数据(dense_feature)字段类型不一样，稀疏特征数据是字符串格式、稠密特征数据是连续值。对稀疏特征数据进行嵌入(embedding)向量化处理，并且本文通过嵌入尺寸(embedding_size)设置向量化的维度；对于稠密特征数据存储具体的数值。

示范性的，对于银行的定期理财排序场景，任务数量(num_task)参数定义为4个，分为是点击、下单、下单金额、7天是否留存。

在一实施方式中，所述基于专家组合的多目标模型包括多个专家网络、多个门控网络、多个任务顶层，专家网络的数量与门控网络的数量相同；参见图2，所述对所述嵌入特征数进行计算，包括：

步骤S1041，通过各所述专家网络对所述嵌入特征数据进行计算，得到多个第一专家输出数据；

步骤S1042，通过各所述门控网络对所述嵌入特征数据进行计算，得到多个门控输出数据；

步骤S1043，将各所述第一专家输出数据与对应的一个所述门控输出数据进行加权计算，得到多个第二专家输出数据；

步骤S1044，通过各所述任务顶层对多个所述第二专家输出数据进行加权计算。

在本实施例中，需要设置专家网络的数量(num_experts)，任务的数量(num_task)，门控网络的数量等；各专家网络(_expert)可以是一层全连接层，门控网络(gate)也是一层全连接层，门控网络的数量(size)等于专家网络的数量。因为门控网络的作用是给各专家网络加权，因而需要门控网络的数量与专家网络的数量相等。初始特征数据进行嵌入向量化处理后，得到嵌入特征数据，嵌入特征数据经过各个专家网络进行计算，得到对应的第一专家输出数据，然后增加一个向量(tensor)维度，根据这个维度将第一专家输出数据拼接(concat)起来；嵌入特征数据经过各个门控网络进行计算，得到门控输出数据，然后将各门控输出数据与对应的第一专家输出数据相乘，得出加权计算后的第二专家输出数据。各任务顶层对多个第二专家输出数据进行胶圈计算，得到对应目标标签的预测概率。对于定期理财排序场景下，目标标签为点击率、下单率、下单金额、7天是否留存，则计算的概率为点击、下单、下单金额、7天是否留存的预测概率。这样，以用户对理财的多个业务指标为目标标签，不断优化定期理财业务的多目标学习，进而提升定期理财的整体业绩。

设置专家网络的数量、门控网络的数量、任务的数量；

在本实施例中，将业务数据集划分为业务训练集及业务验证集。示范性的，在定期理财排序场景中，将业务数据集的85％划分为业务训练集，业务数据集的15％划分业务验证集，验证集的目的是后续用于评估模型的效果。专家网络为全连接层，门控网络为全连接层，对于对于定期理财排序场景下，目标标签为点击率、下单率、下单金额、7天是否留存，其任务为4个，任务分别为点击率、下单率、下单金额、7天是否留存。将一个专家网络与一个门控网络进行配对，将配对的专家网络与门控网络的输出数据进行加权计算，将各加权计算的结果输入各个任务顶层，设置各任务顶层的隐藏层数及激活函数等参数，从而构建初始目标模型。采用在定期理财排序场景中下采集的业务训练集及业务验证集对初始目标模型进行训练集验证，最后得到基于专家组合的多目标模型，通过基于专家组合的多目标模型可以预测用户对定期理财的多目标概率。

本实施例提供的基于专家组合的多目标模型可以运用在银行定期理财排序场景中，与现有技术中的基于特征共享的全连接神经网络模型相比，该基于专家组合的多目标模型中的点击率、下单率、下单金额、7天留存率4个目标标签的预测概率均有不同程度的提升，平均提升3.8％左右。基于专家组合的多目标模型，引入了多个专家网络和门控网络，通过门控网络用不同的专家组合分别去学习不同的目标，使得各个目标标签能被更好地学习。专家网络是所有目标共享的，每个目标有各自的门控网络，用于确定该目标下各个专家网络的权重。

本实施例提供的多目标学习方法，获取定期理财排序场景的多个业务影响因素；根据所述多个业务影响因素确定初始特征数据；确定所述定期理财排序场景的多个目标标签；将所述初始特征数据输入预先构建的基于专家组合的多目标模型，通过所述基于专家组合的多目标模型计算各所述目标标签的概率。这样，引入多个专家网络和多个门控网络，通过门控网络用不同的专家组合分别去学习不同的目标，使得各个目标能被更好地学习，提高相关性较低的业务中进行多目标学习的效果。

实施例2

此外，本申请实施例提供了一种多目标学习装置。

如图3所示，多目标学习装置300包括：

获取模块301，用于获取定期理财排序场景的多个业务影响因素；

第一确定模块302，用于根据所述多个业务影响因素确定初始特征数据；

第二确定模块303，用于确定所述定期理财排序场景的多个目标标签；

计算模块304，用于将所述初始特征数据输入预先构建的基于专家组合的多目标模型，通过所述基于专家组合的多目标模型计算各所述目标标签的概率。

在一实施方式中，所述初始特征数据包括稀疏特征数据及稠密特征数据；所述计算模块304，还用于通过所述基于专家组合的多目标模型对所述稀疏特征数据及所述稠密特征数据进行嵌入向量化处理，得到嵌入特征数据，对所述嵌入特征数进行计算，得到各所述目标标签的概率。

所述计算模块304，还用于通过各所述专家网络对所述嵌入特征数据进行计算，得到多个第一专家输出数据；

在一实施方式中，第一确定模块302，还用于分别确定各业务影响因素与各目标标签的相关度；

确定相关度大于等于预设相关阈值的候选业务影响因素；

将所述候选业务影响因素确定为所述初始特征数据。

在一实施方式中，多目标学习装置300还包括：

构建模块，用于针对所述定期理财排序场景获取业务数据集，按照预设比例将所述业务数据集划分为业务训练集及业务验证集；

设置专家网络的数量、门控网络的数量、任务的数量；

本实施例提供的多目标学习装置300可以实现实施例1所提供的多目标学习方法，为避免重复，在此不再赘述。

本实施例提供的多目标学习装置，获取定期理财排序场景的多个业务影响因素；根据所述多个业务影响因素确定初始特征数据；确定所述定期理财排序场景的多个目标标签；将所述初始特征数据输入预先构建的基于专家组合的多目标模型，通过所述基于专家组合的多目标模型计算各所述目标标签的概率。这样，引入多个专家网络和多个门控网络，通过门控网络用不同的专家组合分别去学习不同的目标，使得各个目标能被更好地学习，提高相关性较低的业务中进行多目标学习的效果。

实施例3

此外，本申请实施例提供了一种电子设备，包括存储器以及处理器，所述存储器存储有计算机程序，所述计算机程序在所述处理器上运行时执行实施例1所提供的多目标学习方法。

具体的，参见图4，所述电子设备400包括：收发机401、总线接口及处理器402，所述处理器402，用于：获取定期理财排序场景的多个业务影响因素；

根据所述多个业务影响因素确定初始特征数据；

确定所述定期理财排序场景的多个目标标签；

在一实施方式中，所述初始特征数据包括稀疏特征数据及稠密特征数据，所述处理器402还用于：通过所述基于专家组合的多目标模型对所述稀疏特征数据及所述稠密特征数据进行嵌入向量化处理，得到嵌入特征数据，对所述嵌入特征数进行计算，得到各所述目标标签的概率。

所述处理器402还用于：通过各所述专家网络对所述嵌入特征数据进行计算，得到多个第一专家输出数据；

在一实施方式中，所述处理器402还用于：分别确定各业务影响因素与各目标标签的相关度；

确定相关度大于等于预设相关阈值的候选业务影响因素；

将所述候选业务影响因素确定为所述初始特征数据。

在一实施方式中，所述处理器402还用于：针对所述定期理财排序场景获取业务数据集，按照预设比例将所述业务数据集划分为业务训练集及业务验证集；

设置专家网络的数量、门控网络的数量、任务的数量；

在本发明实施例中，电子设备400还包括：存储器403。在图4中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器402代表的一个或多个处理器和存储器403代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。收发机401可以是多个元件，即包括发送机和接收机，提供用于在传输介质上与各种其他装置通信的单元。处理器402负责管理总线架构和通常的处理，存储器403可以存储处理器402在执行操作时所使用的数据。

本发明实施例提供的电子设备400，可以执行上述方法实施例1所提供的多目标学习方法的步骤，为避免重复，在此不再赘述。

本实施例提供的电子设备，获取定期理财排序场景的多个业务影响因素；根据所述多个业务影响因素确定初始特征数据；确定所述定期理财排序场景的多个目标标签；将所述初始特征数据输入预先构建的基于专家组合的多目标模型，通过所述基于专家组合的多目标模型计算各所述目标标签的概率。这样，引入多个专家网络和多个门控网络，通过门控网络用不同的专家组合分别去学习不同的目标，使得各个目标能被更好地学习，提高相关性较低的业务中进行多目标学习的效果。

实施例4

本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现实施例1所提供的多目标学习方法。

在本实施例中，计算机可读存储介质可以为只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

本实施例提供的计算机可读存储介质可以实现实施例1所提供的多目标学习方法，为避免重复，在此不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者终端中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种多目标学习方法，其特征在于，所述方法包括：

获取定期理财排序场景的多个业务影响因素；

根据所述多个业务影响因素确定初始特征数据；

确定所述定期理财排序场景的多个目标标签；

2.根据权利要求1所述的方法，其特征在于，所述初始特征数据包括稀疏特征数据及稠密特征数据，所述通过所述基于专家组合的多目标模型计算各所述目标标签的概率，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于专家组合的多目标模型包括多个专家网络、多个门控网络、多个任务顶层，专家网络的数量与门控网络的数量相同；

所述对所述嵌入特征数进行计算，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述多个业务影响因素确定初始特征数据，包括：

分别确定各业务影响因素与各目标标签的相关度；

确定相关度大于等于预设相关阈值的候选业务影响因素；

将所述候选业务影响因素确定为所述初始特征数据。

5.根据权利要求1所述的方法，其特征在于，构建所述基于专家组合的多目标模型，包括：

设置专家网络的数量、门控网络的数量、任务的数量；

6.一种多目标学习装置，其特征在于，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述初始特征数据包括稀疏特征数据及稠密特征数据；

8.根据权利要求7所述的装置，其特征在于，所述基于专家组合的多目标模型包括多个专家网络、多个门控网络、多个任务顶层，专家网络的数量与门控网络的数量相同；

9.一种电子设备，其特征在于，包括存储器以及处理器，所述存储器存储有计算机程序，所述计算机程序在所述处理器运行时执行权利要求1至5中任一项所述的多目标学习方法。

10.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序在处理器上运行时执行权利要求1至5中任一项所述的多目标学习方法。