CN109657696B

CN109657696B - 多任务监督学习模型训练、预测方法和装置

Info

Publication number: CN109657696B
Application number: CN201811308116.6A
Authority: CN
Inventors: 张泽邦; 李龙飞
Original assignee: Advanced New Technologies Co Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2018-11-05
Filing date: 2018-11-05
Publication date: 2023-06-30
Anticipated expiration: 2038-11-05
Also published as: CN109657696A

Abstract

本说明书实施例提供一种多任务监督学习模型训练、预测方法和装置，该方法包括：获取多个任务的共有特征数据和共有特征数据对应的标签，所述共有特征数据由所述多个任务的原始数据中所述多个任务的共有特征构成；基于迭代决策树模型对所述共有特征数据进行非线性变换处理，得到处理后共有特征数据，其中，所述迭代决策树模型基于多个共有特征样本数据和对应的标签训练得到，所述共有特征样本数据与所述共有特征数据具有同维度的特征数据；基于多个所述处理后共有特征数据和每个处理后共有特征数据对应的标签，对多任务监督学习模型进行训练。

Description

多任务监督学习模型训练、预测方法和装置

技术领域

本说明书实施例涉及计算机机器学习技术领域，尤其涉及一种多任务监督学习模型训练、预测方法和装置。

背景技术

随着互联网的蓬勃发展，时下已经步入大数据时代，商家或企业等可收集到海量的样本数据，这些样本数据中通常具有很多特征，例如，用户网络购物的金额及时间、账户间转账金额及时间、风险等级未知的账户与欺诈账户之间的关联程度等。将上述样本数据作为训练数据能够得到风险识别模型，在得到风险识别模型之后，将新的样本数据作为输入即可对新的样本数据做出风险预测，例如，预测账户的风险等级等。

这种风险识别模型对于具有关联性的多个风险识别任务的通用性和准确性较差。

发明内容

本说明书实施例提供一种多任务监督学习模型的训练、预测方法和装置，能够实现具有关联性的多任务识别的通用性训练和识别，并提高多任务监督学习模型的识别率。

本说明书实施例采用下述技术方案：

第一方面，提供了一种多任务监督学习模型训练方法，包括：

获取多个任务的共有特征数据和共有特征数据对应的标签，所述共有特征数据由所述多个任务的原始数据中所述多个任务的共有特征构成；

基于迭代决策树模型对所述共有特征数据进行非线性变换处理，得到处理后共有特征数据，其中，所述迭代决策树模型基于多个共有特征样本数据和对应的标签训练得到，所述共有特征样本数据与所述共有特征数据具有同维度的特征数据；

基于多个所述处理后共有特征数据和每个处理后共有特征数据对应的标签，对多任务监督学习模型进行训练。

第二方面，提供了一种预测方法，包括：

获取目标任务的目标共有特征数据，所述目标共有特征数据由所述目标数据的原始数据中的共有特征构成，所述共有特征为包括所述目标任务在内的多个任务的原始数据的共有特征；

将所述处理后共有特征数据输入到多任务监督学习模型中，得到对应的输出结果，所述多任务监督学习模型基于多个任务的多个共有特征数据输入所述迭代决策树模型得到的处理后共有特征数据和对应的标签训练得到。

第三方面，提供了一种多任务模型训练装置，包括：

获取模块，获取多个任务的共有特征数据和共有特征数据对应的标签，所述共有特征数据由所述多个任务的原始数据中所述多个任务的共有特征构成；

非线性变换处理模块，基于迭代决策树模型对所述共有特征数据进行非线性变换处理，得到处理后共有特征数据，其中，所述迭代决策树模型基于多个共有特征样本数据和对应的标签训练得到，所述共有特征样本数据与所述共有特征数据具有同维度的特征数据；

训练模块，基于多个所述处理后共有特征数据和每个处理后共有特征数据对应的标签，对多任务监督学习模型进行训练。

第四方面，提供了一种多任务模型预测装置，包括：

获取模块，获取目标任务的目标共有特征数据，所述目标共有特征数据由所述目标数据的原始数据中的共有特征构成，所述共有特征为包括所述目标任务在内的多个任务的原始数据的共有特征；

预测模块，将所述处理后共有特征数据输入到多任务监督学习模型中，得到对应的输出结果，所述多任务监督学习模型基于多个任务的多个共有特征数据输入所述迭代决策树模型得到的处理后共有特征数据和对应的标签训练得到。

第五方面，提供了一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如下操作：

第六方面，提供了一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如下操作：

第七方面，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下操作：

第八方面，提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下操作：

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果：将多个任务的共有特征对应的多个初始共有特征样本数据进行非线性变换，并基于非线性变换得到处理后共有特征样本数据对多任务监督学习模型进行训练，从而能够实现具有关联性的多任务识别的训练和识别，并具有较高的识别率。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本说明书的一个实施例提供的多任务监督学习模型训练方法流程示意图；

图2为本说明书的一个实施例提供的多任务监督学习模型预测方法流程示意图；

图3为本说明书的另一个实施例提供的多任务监督学习模型训练方法流程示意图；

图4为本说明书的一个实施例提供的多任务模型训练装置结构示意图；

图5为本说明书的一个实施例提供的多任务模型预测装置结构示意图；

图6为本说明书的一个实施例提供的电子设备硬件结构示意图；

图7为本说明书的另一个实施例提供的电子设备硬件结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

如图1所示，本说明书的一个实施例提供一种多任务监督学习模型训练方法100，包括如下步骤：

S102：获取多个任务的共有特征数据和共有特征数据对应的标签，所述共有特征数据由所述多个任务的原始数据中所述多个任务的共有特征构成。

本说明书实施例的多个任务之间具有关联关系。例如，不同的账户之间交易时，通常会从与账户绑定的银行卡中转移资金，通过资金这一维度将不同的任务关联起来；又例如，账户和银行卡的真实户主均可能是同一个用户，通过用户这一维度将不同的任务关联起来。此时，该多个任务可包括账户风险识别任务和银行卡风险识别任务等等。

或者，可选地，上述多个任务还可以是对一个大的任务进行拆分从而得到的该大任务的多个子任务。例如，将一个反欺诈任务拆分成账户风险识别任务和银行卡风险识别任务，等等。

在该步骤S102中，即可根据多个任务之间的相关性，首先获取多个任务的共有特征，进而基于共有特征得到初始共有特征样本数据。

可选地，该实施例具体可以针对每一个任务得到该任务的初始共有特征样本数据。例如，首先获取得到账户风险识别任务和银行卡风险识别任务中的资金特征、用户特征等共有特征，进而针对每一个任务，获取资金特征以及用户特征对对应的初始共有特征样本数据。例如，针对账户风险识别任务，获取到的一个初始共有特征样本数据可以是样本n（数据n₁、数据n₂，…，数据n_M），上述数据n₁、数据n₂和数据n_M可以是多个共有特征分别对应的具体数值，n代表样本编号，M代表共有特征编号，具体例如，数据n₁是1000，代表样本n在日期T的交易总金额是1000元；数据n₂是5，代表样本n在日期T的总交易次数是5次；等等，上述“日期T的交易总金额”以及“日期T的总交易次数”是多个任务的共有特征。

例如，上述账户风险识别任务中，样本的特征包括但不限于：账户归属的用户的职业、性别、年龄、账号注册时间、账号注册IP、账号绑定的手机号、账号转账金额、账号转账时间等；银行卡风险识别任务中，样本的特征包括但不限于银行卡归属的用户的职业、性别、年龄、银行卡激活时间、银行卡激活网点IP、银行卡绑定的手机号、银行卡转账金额、银行卡转账时间等。在账户风险识别任务和银行卡风险识别任务中，用户特征如职业、性别、年龄、手机号等，以及资金特征如转账金额、转账时间等，可以称作是账户风险识别任务和银行卡风险识别任务的共有特征。账户风险识别任务的样本数据中职业、性别、年龄、手机号、转账金额、转账时间构成的数据，银行卡风险识别任务的样本数据中职业、性别、年龄、手机号、转账金额、转账时间构成的数据，都可以称为这两个任务的初始共有特征样本数据。

需要说明是的，以上仅仅是以账户风险识别任务和银行卡风险识别任务这两个任务进行举例说明，实际应用中上述多个任务的数量可以较多，且不局限于反欺诈的风险识别场景。

S104：基于迭代决策树模型对所述共有特征数据进行非线性变换处理，得到处理后共有特征数据，其中，所述迭代决策树模型基于多个共有特征样本数据和对应的标签训练得到，所述共有特征样本数据与所述共有特征数据具有同维度的特征数据。

应理解，所述共有特征样本数据与所述共有特征数据具有同维度的特征数据，是指共有特征样本数据中具有的特征维度与共有特征数据相同。例如，步骤S102的共有特征数据具有账户、职业、性别、年龄、手机号、转账金额、转账时间这几个特征维度，步骤S104的共有特征样本数据也具有账户、职业、性别、年龄、手机号、转账金额、转账时间这几个特征维度。二者的特征维度相同。

本说明书实施例中，迭代决策树模型是基于多个任务的共有特征样本数据和样本标签训练得到的，该迭代决策树模型可包括梯度提升决策树GBDT模型、adaboost决策树模型或XGBoost决策树模型。

具体地，步骤S104可实现为：

将所述共有特征数据输入所述迭代决策树模型，以得到所述共有特征数据在所述迭代决策树模型的各个决策树对应的叶子节点标识；

基于所述共有特征数据在所述迭代决策树模型的各个决策树对应的叶子节点标识，生成所述共有特征数据对应的处理后共有特征数据。

例如，假设某个迭代决策树模型A有三棵决策树，其顺序为A1、A2和A3，每个决策树两个叶子节点。假设共有特征数据B输入决策树A后，A1、A2、A3分别选择的叶子节点标识为“10”、“01”、“10”，则迭代决策树模型A的各个决策树对应的叶子节点标识为100110。

在基于叶子节点标识生成所述共有特征数据对应的处理后共有特征数据时，可能有多种处理方式。

例如，可以直接将叶子节点标识输出作为所述共有特征数据对应的处理后共有特征数据。

又例如，可基于所述迭代决策树模型的决策树顺序，获取所述共有特征数据在所述迭代决策树模型的各个决策树对应的叶子节点编码构成的叶子节点编码序列；

对所述叶子节点编码序列进行独热One-Hot编码，将编码后的值作为所述处理后共有特征样本数据。

通过上述One-Hot编码的操作，可以转换为多任务监督学习模型的学习算法易于利用的一种形式，便于多任务监督学习模型训练的实现。

One-Hot编码又称为一位有效编码，主要是采用N位状态寄存器来对N个状态进行编码，每个状态都由独立的寄存器位，并且在任意时候只有一位有效。

以前述迭代决策树模型A为例，其对应的叶子节点标识可能有如下8种情况：101010、101001、100110、100101、011010、011001、010110、010101。此时，可以用含有一个8比特（bit）的One-Hot编码信息表示上述叶子节点标识，每个8bit信息中只有一个1的bit，其余为零。即用00000001、00000010、00000100、00001000、00010000、00100000、01000000、10000000表示上述8种叶子节点标识。

当然，如果上述迭代决策树模型A中每个决策书的叶子节点数目为3个，则迭代决策树模型A的叶子结点标识就可能有3*3*3=27种可能，此时就需要27bit的One-Hot编码信息表示。

通过上述基于决策树模型得到处理后共有特征样本数据的操作，本说明书实施例针对多任务监督学习模型场景，创造性地实现了决策树模型和多任务监督学习模型的结合，使多任务监督学习模型具备树的非线性变换能力，可以处理更为复杂的任务。

S106：基于多个所述处理后共有特征数据和每个处理后共有特征数据对应的标签，对多任务监督学习模型进行训练。

本说明书实施例中，可通过步骤S102和S104对多个初始共有特征数据进行处理，得到多个处理后共有特征数据，作为多任务监督学习模型（multitask supervisedlearning，MTSL）的样本数据。

基于多个样本数据和样本数据对应的标签，即可对多任务监督学习模型进行训练。

在一个具体的应用场景中，多任务监督学习模型可用于识别账户的风险等级以及银行卡的风险等级。例如，将账户风险识别任务的一个初始共有特征样本数据经过如步骤S102和S104的处理后输入训练完成的多任务监督学习模型，该多任务监督学习模型即可输出1或0的预测结果，其中，1可以代表正常账户，0可以代表是风险账户。

该步骤S106中提到的多任务监督学习模型，具体可以是将步骤S102中提到的多个任务的处理后共有特征样本数据和对应的标签进行模型训练，也即同时学习上述多个任务的共性。

本说明书实施例中，通过将多个任务的共有特征对应的多个初始共有特征样本数据进行非线性变换，并基于非线性变换得到处理后共有特征样本数据对多任务监督学习模型进行训练，从而能够实现具有关联性的多任务识别的通用性训练和识别，并具有较高的识别率。

此外，本说明书实施例的多任务监督学习模型，通过非线性变换处理，还能够处理更复杂的任务。

对于上述提到的提高了多任务监督学习模型的识别率，由于本说明书实施例可以通过多任务监督学习模型联合学习多个任务，在经验上和理论上均比单独学习每个任务都有更好的表现，能够学习多个任务之间的相关性，因此可以提高训练得到的多任务监督学习模型的识别准确性。

本说明书实施例对初始共有特征样本数据进行非线性变换处理，能够变换为更抽象的高层表达。可选地，本说明书实施例的多任务监督学习模型可以是深度神经网络的多任务监督学习模型，该多任务监督学习模型能够从大量的处理后共有特征样本数据中学习到反映欺诈账户（或称高风险账户）等本质的隐性特征，相比浅层学习分类器，具有更强的可扩展性，满足反欺诈场景中的账户的风险等级以及银行卡的风险等级识别，识别准确地也更高。

通过上述深度神经网络的多任务监督学习模型，同时能够解决浅层学习模型有限的层次深度使其仅局限于解决二分类问题，难以应对复杂任务的识别问题，更容易实现解决同类问题的扩展使用。

应理解，前述步骤S104提到的迭代决策树模型可由多棵决策树组成。每个决策树对应于步骤S102中共有特征数据的一个共有特征；后一个决策树是在前一个决策树的基础上基于分裂增益优化的方向选择的共有特征进行分裂的结果。

可选地，在步骤S104之前，该方法还包括：基于多个共有特征样本数据和对应的标签训练所述迭代决策树模型。

可选地，所述迭代决策树模型在进行模型训练时，可基于每次分裂信息增益最大的原则从共有特征样本数据的多个特征中选择特征作为决策树的分裂点。

当然，在节点分裂计算增益时，为了防止少数任务主导分裂，还可加入正则项去约束树的分裂。可选地，所述迭代决策树模型在进行模型训练时，可基于特征分裂的信息增益总和经过任务平衡修正后的值最大的原则，从输入的多个特征中选择目标特征作为决策树的分裂点。

对特征分裂的信息增益总和的任务平衡修正，可能存在多种方式。

可选地，可基于特征分裂的信息增益总和减去所有特征增益的方差的预设倍数后得到的修正值，选择修正值最大的方式作为迭代决策树模型选择特征进行分裂的原则。

不妨用

表示选择某个特征值对所有任务的样本集划分后获得的增益，用

表示选择某个特征值对单个任务的样本集划分后获得的增益，用/>

表示多个任务增益的均值，用/>

表示加入正则项后获得的增益。

其中，

表示所有任务（分裂特征）增益的方差，

应理解，方差越小表示学习到越多任务的有用信息。

可选地，可基于将特征分裂的信息增益总和乘以衡量任务平衡性的信息熵，选择信息熵最大的方式作为迭代决策树模型选择特征进行分裂的原则。

应理解，原始增益

可能会出现负值，基于概率计算的需要，需要经过mapfunction映射成大于或等于0的值。

下面可以选择如下两种map 函数之一对原始增益进行映射处理：

ReLU函数：

，或Sigmoid函数：/>

。

此时，

主导这次分裂的可能性/>

可用如下公式表示:

某个特征值作为分裂点时，衡量任务平衡性的信息熵

可用如下公式表示：

其中，Z越大表示学习到越多任务的有用信息。

此时，加正则项修正后的增益可用如下公式表示：

基于增益最大的原则，进行迭代决策树模型的训练。

上述提到的作为训练数据的多个共有特征样本数据，和步骤S102中获取到的多个共有特征样本数据，这两者可以相同，也可以是不同。例如，作为训练数据的多个共有特征样本数据是日期T之前获取得到的，而步骤S102中获取到的多个共有特征样本数据是日期T之后获取得到，上述两者均是多个任务的共有特征对应的共有特征样本数据，具有具有同维度的特征数据。

通过上述基于迭代决策树模型得到处理后共有特征样本数据的操作，本说明书实施例针对多任务监督学习模型场景，创造性地实现了迭代决策树模型和多任务监督学习模型的结合，使多任务监督学习模型可以处理更为复杂的任务。

当然，应理解，在进行模型训练时，同一个共有特征数据，在不同的任务中对应的标签可能不同。例如，共有特征数据A在任务B对应的标签为有风险，在任务C对应的标签为无风险。在进行模型训练时，可基于多种方式对样本数据及其标签进行处理。例如，对于同时具有白样本和黑样本的共有特征数据，可选择抛弃这些样本。当然，还可能有其它的处理方式，本申请实施例对此不作限制。

基于前文几个实施例的多任务监督学习模型训练方法训练得到的多任务监督学习模型，本说明书实施例还提供一种多任务监督学习模型预测方法200，如图2所示，包括如下步骤：

S202：获取目标任务的目标共有特征数据，所述目标共有特征数据由所述目标数据的原始数据中的共有特征构成，所述共有特征为包括所述目标任务在内的多个任务的原始数据的共有特征。

步骤S202的具体实现，可参考前述步骤S102，不再赘述。

S204：基于迭代决策树模型对所述共有特征数据进行非线性变换处理，得到处理后共有特征数据，其中，所述迭代决策树模型基于多个共有特征样本数据和对应的标签训练得到，所述共有特征样本数据与所述共有特征数据具有同维度的特征数据。

步骤S204的具体实现，可参考前述步骤S104，不再赘述。

S206：将所述处理后共有特征数据输入到多任务监督学习模型中，得到对应的输出结果，所述多任务监督学习模型基于多个任务的多个共有特征数据输入所述迭代决策树模型得到的处理后共有特征数据和对应的标签训练得到。

在一个具体的例子中，本说明书实施例中提到的多个任务可以包括账户风险识别任务和银行卡风险识别任务，通过将账户风险识别任务或银行卡风险识别任务中的原始数据对应的共有特征数据输入到多任务监督学习模型，即可得到账户或银行卡的风险等级，从而能够识别出欺诈账户或欺诈银行卡。

本说明书实施例中，将目标任务在多个任务的共有特征对应的共有特征数据通过迭代决策树模型进行非线性变换，并基于非线性变换得到处理后共有特征数据输入多任务监督学习模型得到预测结果，从而能够处理更复杂的任务，能够获得较好的识别准确性。

当然，应理解，本说明书实施例的多任务监督学习模型的具体训练方法可参考图1所示实施例的方法，步骤S202和步骤S204的具体实现也可参考图1所示实施例中相应步骤的具体实现，不再赘述。

为详细说明本说明书实施例提供的多任务监督学习模型训练和预测方法，以下将结合一个具体的实施例为例进行介绍，如图3所示，该实施例300包括如下步骤：

S302：选择多个任务的共有特征对应的迭代决策树模型。

上述迭代决策树模型用于对多个任务的共有特征构成的共有特征数据进行非线性处理。

当然，应理解，在选择迭代决策树模型之前，还可以通过多个共有特征样本数据和对应的标签对迭代决策树模型进行训练。

S304：将共有特征数据输入迭代决策树模型，以得到处理后共有特征数据。

该步骤具体可以是针对每一个样本（共有特征数据），获取迭代决策树模型的每棵决策树的叶子节点编号index构成的叶子节点编号序列。该叶子节点编号的含义可以是一个样本的预测值，例如，具体可以代表该样本是欺诈账户的概率。在得到迭代决策树模型的决策树按照顺序排列的叶子节点编号序列后，可对叶子节点编号序列进行编码得到处理后共有特征样本数据。

例如，针对一个共有特征样本数据n（数据n₁、数据n₂，…，数据n_M），如果迭代决策树模型有100棵决策数，得到的叶子节点编号序列n（数据1、数据2，…，数据100），其中，数据1是叶子节点编号序列n在第一棵决策树的叶子节点编号的编码值；数据2是叶子节点编号序列n在第二棵决策树的叶子节点编号的编码值；…；数据100是叶子节点编号序列n在第100棵决策树的叶子节点编号的编码值。基于叶子节点编号序列n，再进行例如One-Hot编码之类的编码处理，得到的处理后共有特征样本数据。

S306：将多个处理后共有特征样本数据和对应的标签作为多任务监督学习模型的训练数据。

可选地，上述多个任务包括账户风险识别任务和银行卡风险识别任务，相应地，该多任务监督学习模型具体可以用于识别账户的风险等级以及银行卡的风险等级。

上述执行账户风险识别任务的主要目的可以是：从大量的账户中检测出高风险等级的账户，或者是预测出每一个账户的风险等级等，后续可以对高风险等级的账户采取措施，例如禁止交易、禁止登陆；执行银行卡风险识别任务的主要目的可以是：从大量的银行卡等中检测出高风险等级的银行卡等，或者是预测出每一个银行卡的风险等级等，后续可以对高风险等级的银行卡等采取措施，例如冻结资金，通知银行进行处理等。

S308：获取目标任务的目标共有特征数据。

S310，将目标共有特征数据输入迭代决策树模型，以得到处理后共有目标特征数据。

S312，将处理后共有目标特征数据输入到多任务监督学习模型，以得到预测结果。

步骤S308、S310、S312具体可以参见上述方法实施例200。

本说明书实施例在多任务监督学习模型训练时，能够同时学习多个任务的共有特征，提高隐含特征的提取效果；相应地，由于多任务监督学习模型考虑到各个任务之间的相关性，在预测时相较于单任务学习模型可以实现更高的预测精度。

另外，本说明书实施例针对多任务监督学习模型场景，创造性地实现了梯度提升决策树模型和多任务监督学习模型的结合，使多任务监督学习模型具备树的非线性变换能力，可以处理更为复杂的任务。

以上说明书部分详细介绍了多任务监督学习模型训练方法实施例，如图4所示，本说明书还提供了一种多任务模型训练装置400，如图4所示，该装置400包括：

获取模块402，获取多个任务的共有特征数据和共有特征数据对应的标签，所述共有特征数据由所述多个任务的原始数据中所述多个任务的共有特征构成；

非线性变换处理模块404，基于迭代决策树模型对所述共有特征数据进行非线性变换处理，得到处理后共有特征数据，其中，所述迭代决策树模型基于多个共有特征样本数据和对应的标签训练得到，所述共有特征样本数据与所述共有特征数据具有同维度的特征数据；

训练模块406，基于多个所述处理后共有特征数据和每个处理后共有特征数据对应的标签，对多任务监督学习模型进行训练。

本说明书实施例可以通过多任务监督学习模型联合学习多个任务，在经验上和理论上均比单独学习每个任务都有更好的表现，能够学习多个任务之间的相关性，提高了训练得到的多任务监督学习模型的识别准确性。

根据本说明书实施例的上述多任务模型训练装置400装置可以参照对应前文本说明书实施例的多任务监督学习模型训练方法100的流程，并且，该多任务模型训练装置400装置中的各个单元/模块和上述其他操作和/或功能分别为了实现多任务监督学习模型训练方法100中的相应流程，为了简洁，在此不再赘述。

如图5所示，本说明书还提供了一种多任务模型预测装置500，如图5所示，该装置500包括：

获取模块502，获取目标任务的目标共有特征数据，所述目标共有特征数据由所述目标数据的原始数据中的共有特征构成，所述共有特征为包括所述目标任务在内的多个任务的原始数据的共有特征；

非线性变换处理模块504，基于迭代决策树模型对所述共有特征数据进行非线性变换处理，得到处理后共有特征数据，其中，所述迭代决策树模型基于多个共有特征样本数据和对应的标签训练得到，所述共有特征样本数据与所述共有特征数据具有同维度的特征数据；

预测模块506，将所述处理后共有特征数据输入到多任务监督学习模型中，得到对应的输出结果，所述多任务监督学习模型基于多个任务的多个共有特征数据输入所述迭代决策树模型得到的处理后共有特征数据和对应的标签训练得到。

根据本说明书实施例的上述多任务模型预测装置500装置可以参照对应前文本说明书实施例的多任务监督学习模型训练方法200的流程，并且，该多任务模型预测装置500装置中的各个单元/模块和上述其他操作和/或功能分别为了实现多任务监督学习模型训练方法200中的相应流程，为了简洁，在此不再赘述。

图6为本说明书的一个实施例提供的电子设备硬件结构示意图。参考图6，在硬件层面，电子设备包括处理器，可选地，包括内部总线、网络接口、存储器。其中，如图6所示，存储器可能包含内存，例如高速随机存取存储器（Random-Access Memory，RAM），也可能还包括非易失性存储器（non-volatile memory），例如至少1个磁盘存储器等。当然，该电子设备还可能包括实现其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是工业标准体系结构 (Industry Standard Architecture，ISA）总线、外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构 (ExtendedIndustry Standard Architecture，EISA）总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上多任务模型训练装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

上述图1所示实施例揭示的方法、装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器（Central Processing Unit，CPU）、网络处理器（Network Processor，NP）等；还可以是数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field－Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

图6所示的电子设备还可执行图1所示实施例的方法，并实现多任务监督学习模型训练方法在图1所示实施例的功能，本说明书实施例在此不再赘述。

图7为本说明书的一个实施例提供的电子设备硬件结构示意图。参考图7，在硬件层面，电子设备包括处理器，可选地，包括内部总线、网络接口、存储器。其中，如图7所示，存储器可能包含内存，例如高速随机存取存储器（Random-Access Memory，RAM），也可能还包括非易失性存储器（non-volatile memory），例如至少1个磁盘存储器等。当然，该电子设备还可能包括实现其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是工业标准体系结构 (Industry Standard Architecture，ISA）总线、外设部件互连标准(Peripheral Component Interconnect，PCI)总线或扩展工业标准结构 (ExtendedIndustry Standard Architecture，EISA）总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上多任务模型预测装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

上述图2所示实施例揭示的方法、装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器（Central Processing Unit，CPU）、网络处理器（Network Processor，NP）等；还可以是数字信号处理器（Digital Signal Processor，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field－Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

图7所示的电子设备还可执行图2所示实施例的方法，并实现多任务监督学习模型预测装置在图2所示实施例的功能，本说明书实施例在此不再赘述。

当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

本说明书实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述各个方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器（Read-Only Memory，简称ROM）、随机存取存储器（Random Access Memory，简称RAM）、磁碟或者光盘等。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本申请是参照根据本说明书实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器 (RAM) 和/或非易失性内存等形式，如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体 (transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种多任务监督学习模型训练方法，包括：

获取多个任务的共有特征数据和共有特征数据对应的标签，所述共有特征数据由所述多个任务的原始数据中所述多个任务的共有特征构成，其中，所述多个任务包括账户风险识别任务和银行卡风险识别任务，所述共有特征数据包括银行卡转账金额和银行卡转账时间；

基于多个所述处理后共有特征数据和每个处理后共有特征数据对应的标签，对多任务监督学习模型进行训练，所述多任务监督学习模型用于识别欺诈账户和欺诈银行卡。

2.如权利要求1所述的方法，基于迭代决策树模型对所述共有特征数据进行非线性变换处理，得到处理后共有特征数据，包括：

3.如权利要求2所述的方法，

基于所述共有特征数据在所述迭代决策树模型的各个决策树对应的叶子节点标识，生成所述共有特征数据对应的处理后共有特征数据，包括：

基于所述迭代决策树模型的决策树顺序，获取所述共有特征数据在所述迭代决策树模型的各个决策树对应的叶子节点编码构成的叶子节点编码序列；

4.如权利要求1所述的方法，

所述迭代决策树模型在进行模型训练时，基于特征分裂的信息增益总和经过任务平衡修正后的值最大的原则，从输入的多个特征中选择目标特征作为决策树的分裂点。

5.如权利要求4所述的方法，对特征分裂的信息增益总和的任务平衡修正包括如下之一：

将特征分裂的信息增益总和减去所有特征增益的方差的预设倍数；

将特征分裂的信息增益总和乘以衡量任务平衡性的信息熵。

6.如权利要求1-5任一项所述的方法，所述迭代决策树模型包括：梯度提升决策树GBDT模型、adaboost决策树模型或XGBoost决策树模型。

7.一种预测方法，包括：

获取目标任务的目标共有特征数据，所述目标共有特征数据由目标数据的原始数据中的共有特征构成，所述共有特征为包括所述目标任务在内的多个任务的原始数据的共有特征，其中，所述多个任务包括账户风险识别任务和银行卡风险识别任务，所述共有特征数据包括银行卡转账金额和银行卡转账时间；

将所述处理后共有特征数据输入到多任务监督学习模型中，得到对应的输出结果，所述多任务监督学习模型基于多个任务的多个共有特征数据输入所述迭代决策树模型得到的处理后共有特征数据和对应的标签训练得到，所述多任务监督学习模型用于识别欺诈账户和欺诈银行卡。

8.一种多任务模型训练装置，包括：

获取模块，获取多个任务的共有特征数据和共有特征数据对应的标签，所述共有特征数据由所述多个任务的原始数据中所述多个任务的共有特征构成，其中，所述多个任务包括账户风险识别任务和银行卡风险识别任务，所述共有特征数据包括银行卡转账金额和银行卡转账时间；

训练模块，基于多个所述处理后共有特征数据和每个处理后共有特征数据对应的标签，对多任务监督学习模型进行训练，所述多任务监督学习模型用于识别欺诈账户和欺诈银行卡。

9.一种多任务模型预测装置，包括：

获取模块，获取目标任务的目标共有特征数据，所述目标共有特征数据由目标数据的原始数据中的共有特征构成，所述共有特征为包括所述目标任务在内的多个任务的原始数据的共有特征，其中，所述多个任务包括账户风险识别任务和银行卡风险识别任务，所述共有特征数据包括银行卡转账金额和银行卡转账时间；

非线性变换处理模块，基于迭代决策树模型对所述共有特征数据进行非线性变换处理，得到处理后共有特征数据，其中，所述迭代决策树模型基于多个共有特征样本数据和对应的标签训练得到；

预测模块，将所述处理后共有特征数据输入到多任务监督学习模型中，得到对应的输出结果，所述多任务监督学习模型基于多个任务的多个共有特征数据输入所述迭代决策树模型得到的处理后共有特征数据和对应的标签训练得到，所述多任务监督学习模型用于识别欺诈账户和欺诈银行卡。

10.一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如下操作：

11.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下操作：