CN111738534A

CN111738534A - 多任务预测模型的训练、事件类型的预测方法及装置

Info

Publication number: CN111738534A
Application number: CN202010851731.2A
Authority: CN
Inventors: 应缜哲; 王维强; 李志峰; 孟昌华
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-08-21
Filing date: 2020-08-21
Publication date: 2020-10-02
Anticipated expiration: 2040-08-21
Also published as: CN111738534B

Abstract

本说明书实施例提供一种多任务预测模型的训练、事件类型的预测方法及装置，在训练方法中，获取初始样本集。对于任意的第一样本，在前i‑1棵决策树中，获取包括第一样本的各叶子节点各自的N个分数。基于各叶子节点各自的N个分数以及第一样本的N个标签值，确定若干梯度，并执行第一融合，得到第一样本的融合梯度。对于第i棵决策树的当前节点，获取分割到当前节点的样本集中各样本的融合梯度。基于当前样本集中各样本的融合梯度，从各样本特征以及当前样本集中各样本对应于各样本特征的特征值中，分别确定出当前节点的分裂特征和特征阈值。基于当前节点的分裂特征和特征阈值，对当前样本集进行分割，生成当前节点对应的子节点，直至到达叶子节点。

Description

多任务预测模型的训练、事件类型的预测方法及装置

技术领域

本说明书一个或多个实施例涉及计算机技术领域，尤其涉及一种多任务预测模型的训练、事件类型的预测方法及装置。

背景技术

传统技术中，梯度提升决策树（Gradient boosted decision trees，GBDT）通常只能用于训练单任务预测模型。这里的单任务预测模型是指只能针对单任务进行预测。比如，单任务预测模型只能预测当前文本是否为广告，或者预测当前事件是否为欺诈事件等。

然而，在现实场景中，通常需要进行多任务预测。比如，为了实现对事件进行有效的风险管控，通常需要针对某个事件，预测其对应于各个欺诈类型的概率。基于此，就需要提供一种多任务预测模型的训练方法。

发明内容

本说明书一个或多个实施例描述了一种多任务预测模型的训练、事件类型的预测方法及装置，可以大大提升多任务预测模型的鲁棒性。

第一方面，提供了一种多任务预测模型的训练方法，包括：

获取初始样本集；所述初始样本集中的每个样本包括样本特征和对应于N个业务目标的N个标签值；

对于所述初始样本集中任意的第一样本，在前i-1棵决策树中，获取包括所述第一样本的各叶子节点各自的对应于所述N个业务目标的N个分数；i和N均为正整数；

基于所述各叶子节点各自的N个分数以及所述第一样本的N个标签值，确定所述第一样本的对应于所述N个业务目标的若干梯度；

对所述若干梯度执行第一融合，得到所述第一样本的融合梯度；

对于所述第i棵决策树的当前节点，获取分割到当前节点的当前样本集中各样本的融合梯度；

基于当前样本集中各样本的融合梯度，从各样本特征以及当前样本集中各样本对应于所述各样本特征的特征值中，分别确定出当前节点对应的分裂特征和特征阈值；

基于当前节点对应的分裂特征和特征阈值，对当前样本集进行分割，生成当前节点对应的子节点，直至到达叶子节点。

第二方面，提供了一种事件类型的预测方法，包括：

获取根据第一方面的方法训练的多任务预测模型，所述多任务业务预测模型包括多棵决策树；

获取第一事件的事件特征以及待预测欺诈类型；

将所述第一事件的事件特征分别输入所述多棵决策树，并从各棵决策树中获取包括所述第一事件的各叶子节点对应于所述待预测事件类型的第一欺诈概率；其中任意的第一叶子节点的第一欺诈概率为所述第一叶子节点的对应于N个欺诈类型的N个欺诈概率中的一个欺诈概率；

对所述各叶子节点对应于所述待预测欺诈类型的第一欺诈概率进行累加，得到目标概率；

基于所述目标概率，判断所述第一事件是否属于所述待预测欺诈类型。

第三方面，提供了一种多任务预测模型的训练装置，包括：

获取单元，用于获取初始样本集；所述初始样本集中的每个样本包括样本特征和对应于N个业务目标的N个标签值；

所述获取单元，还用于对于所述初始样本集中任意的第一样本，在前i-1棵决策树中，获取包括所述第一样本的各叶子节点各自的对应于所述N个业务目标的N个分数；i和N均为正整数；

确定单元，用于基于所述各叶子节点各自的N个分数以及所述第一样本的N个标签值，确定所述第一样本的对应于所述N个业务目标的若干梯度；

融合单元，用于对所述若干梯度执行第一融合，得到所述第一样本的融合梯度；

所述获取单元，还用于对于所述第i棵决策树的当前节点，获取分割到当前节点的当前样本集中各样本的融合梯度；

所述确定单元，还用于基于当前样本集中各样本的融合梯度，从各样本特征以及当前样本集中各样本对应于所述各样本特征的特征值中，分别确定出当前节点对应的分裂特征和特征阈值；

分割单元，应于基于当前节点对应的分裂特征和特征阈值，对当前样本集进行分割，生成当前节点对应的子节点，直至到达叶子节点。

第四方面，提供了一种事件类型的预测装置，包括：

获取单元，用于获取根据第一方面的方法训练的多任务预测模型，所述多任务业务预测模型包括多棵决策树；

所述获取单元，还用于获取第一事件的事件特征以及待预测欺诈类型；

输入单元，用于将所述第一事件的事件特征分别输入所述多棵决策树，并从各棵决策树中获取包括所述第一事件的各叶子节点对应于所述待预测事件类型的第一欺诈概率；其中任意的第一叶子节点的第一欺诈概率为所述第一叶子节点的对应于N个欺诈类型的N个欺诈概率中的一个欺诈概率；

累加单元，用于对所述各叶子节点对应于所述待预测欺诈类型的第一欺诈概率进行累加，得到目标概率；

判断单元，用于基于所述目标概率，判断所述第一事件是否属于所述待预测欺诈类型。

第五方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面或第二方面所描述的方法。

第六方面，提供了一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面或第二方面所描述的方法。

本说明书一个或多个实施例提供的多任务预测模型的训练、事件类型的预测方法及装置，在构建多任务预测模型的每棵决策树时，针对当前节点，基于分割到该当前节点的样本集中各样本的融合梯度，来确定当前节点对应的分裂特征以及特征阈值，并基于其进行样本集分割，进而生成当前节点的子节点。由于当前样本集中各样本的融合梯度，通过对对应于N个业务目标的若干梯度融合得到，从而本方案可以实现多任务学习，进而所训练得到的多任务预测模型可以进行多任务预测，由此可以提升多任务预测的效率。

附图说明

为了更清楚地说明本说明书实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本说明书提供的多任务预测模型示意图；

图2为本说明书一个实施例提供的多任务预测模型的训练方法流程图；

图3为本说明书提供的梯度融合示意图；

图4为本说明书提供的事件预测模型的训练方法流程图；

图5为本说明书一个实施例提供的事件类型的预测方法示意图；

图6为本说明书一个实施例提供的多任务预测模型的训练装置示意图；

图7为本说明书一个实施例提供的事件类型的预测装置示意图。

具体实施方式

下面结合附图，对本说明书提供的方案进行描述。

在描述本说明书提供的方案之前，先对本方案的发明构思作以下说明。

传统技术中，可以通过训练GBDT来获取单任务预测模型。这里的单任务预测模型用于针对业务对象预测回归值。其中，业务对象可以包括但不限于广告、事件以及用户和商品等。

上述训练GBDT即为构建GBDT中的多棵决策树的过程。该多棵决策树具体可以通过以下步骤构建得到：首先获取初始样本集。然后，通过决策树对初始样本集中各样本进行分割。具体地，在信息增益增大的方向上，为决策树的每个枝干节点设定分裂特征和特征阈值，通过在枝干节点处将各样本的对应特征值与特征阈值比较而将样本分割到相应的子节点中。通过这样的过程，最后将各样本分割到各叶子节点中。于是，可以得到各叶子节点的分数，即为该叶子节点中各样本的残差的均值。在此基础上，还可以在残差减小的方向继续训练进一步的决策树。且后续的每棵决策树都基于前一棵决策树的残差获得。从而可获得包括多棵决策树的GBDT。

可见，GBDT的每棵决策树的构建主要包括两部分：第一，样本集的分割。第二，叶子节点的分数的确定。因此，多任务预测模型的训练主要解决该两个部分的问题即可。

关于第一部分，本申请的发明人提出基于N个业务目标的融合梯度，为每个枝干节点设定分裂特征和特征阈值。这里的N个业务目标的融合梯度通过对对应于N个业务目标的若干梯度融合得到。从而本申请在样本分割时考虑了多个业务目标。

关于第二部分，本申请的发明人提出每个叶子节点的分数，基于分割到该叶子节点的各目标样本的对应于同一业务目标的各梯度的融合结果而确定。即每个叶子节点具有对应于N个业务目标的N个分数。

结合以上两个部分的改进，本说明书提供的针对一棵决策树的构建方案具体实现如下：

获取初始样本集。该初始样本集中的每个样本包括样本特征和对应于N个业务目标的N个标签值。对于初始样本集中任意的第一样本，在前i-1棵决策树中，获取包括第一样本的各叶子节点各自的对应于N个业务目标的N个分数。i和N均为正整数。基于各叶子节点各自的N个分数以及N个标签值，确定第一样本的对应于N个业务目标的若干梯度。对若干梯度执行第一融合，得到第一样本的融合梯度。对于第i棵决策树的当前节点，获取分割到当前节点的当前样本集中各样本的融合梯度。基于当前样本集中各样本的融合梯度，从各样本特征以及当前样本集中各样本对应于各样本特征的特征值中，分别确定出当前节点对应的分裂特征和特征阈值。基于当前节点对应的分裂特征和特征阈值，对当前样本集进行分割，生成当前节点对应的子节点，直至到达叶子节点。

总而言之，本方案在训练多任务预测模型的过程中，综合考虑了多个业务目标的梯度，从而本方案可以实现多任务学习。此外，通过本方案所构建的多任务预测模型中的每棵决策树的每个叶子节点，可以具有对应于N个业务目标的N个分数，从而本方案所构建的决策树也可以称为多个任务的同构异值树。换句话说，本方案中，多个任务之间可以共享同构异值树，且通过该同构异值树可以实现多任务预测。

以上就是本说明书提供的方案的发明构思，以下针对该发明构思进行详细说明。

图1为本说明书提供的多任务预测模型示意图。图1中，多任务预测模型可以通过依次构建多棵决策树而得到，其可以针对业务对象预测对应于多个业务目标的多个回归值，也即可以针对多个任务进行预测。具体地，输入数据（如，业务对象的特征）会同时输入到各棵决策树中，之后基于输入数据在各棵决策数据中所落入叶子节点的多个分数，可以得到对应于多个业务目标的多个回归值，也即可以得到对应于多个任务的输出结果。从图1可以看出，在本说明书中，多个任务可以共享各棵决策树。

为便于理解，先对上述方法的实际应用场景进行介绍。在一个示例性场景中，业务对象为广告，多任务预测模型为广告预测模型，多个业务目标为多个质量指标，多个回归值可以为多个质量分数。其中，多个质量指标可以包括但不限于广告的点击率、转化率、展示次数以及点击量等。此外，在针对广告进行多任务预测时，上述输入数据可以包括但不限于广告主题、图像以及投放地址等。

在另一个示例性场景中，业务对象为事件，多任务预测模型为事件预测模型，多个业务目标为多个欺诈类型，多个回归值可以为多个欺诈概率。其中，多个欺诈类型可以包括但不限于刷单类型、假冒亲友类型、假冒执法机关类型以及盗卡类型等。此外，在针对事件进行多任务预测时，上述输入数据可以包括但不限于交易时间、交易地点、交易金额、交易网络环境以及交易商品信息等。

在再一个示例性场景中，业务对象为用户和商品，多任务预测模型为商品预测模型，多个业务目标为多个推荐指标，多个回归值可以为多个推荐分数。这里的推荐指标也可以理解为某用户对某商品的喜好指标，其可以包括但不限于是否点击、是否收藏以及是否转发等。此外，在针对用户进行多任务预测时，上述输入数据可以包括但不限于用户年龄、性别、收入范围、兴趣爱好、星座、生活区域、商品价格以及商品类目等。

如前所述，多任务预测模型可以通过依次构建多棵决策树而得到。由于各棵决策树的构建过程类似，因此以下以构建一棵决策树为例，对本方案进行说明。

图2为本说明书一个实施例提供的多任务预测模型的训练方法流程图。所述方法的执行主体可以为具有处理能力的设备：服务器或者系统或者装置。如图2所示，所述方法具体可以包括：

步骤202，获取初始样本集。

这里的初始样本集中的每个样本包括样本特征和对应于N个业务目标的N个标签值。

以待训练的多任务预测模型为广告预测模型为例来说，初始样本集中的各样本可以包括多条样本广告。广告特征可以包括但不限于广告主题、图像以及投放地址等。N个标签值可以包括但不限于标定点击率、标签转化率、标定展示次数以及标定点击量等。

再以待训练的多任务预测模型为事件预测模型为例来说，初始样本集中的各样本可以包括多个样本事件。事件特征可以包括但不限于交易时间、交易地点、交易金额、交易网络环境以及交易商品信息等。N个标签值可以包括但不限于标定刷单概率、标定假冒亲友概率、标定假冒执法机关概率以及标定盗卡概率等。

最后以待训练的多任务预测模型为商品预测模型为例来说，初始样本集中的各样本可以包括多个样本用户。用户特征可以包括但不限于用户年龄、性别、收入范围、兴趣爱好、星座、生活区域以及用户所喜好商品的商品特征（如，商品价格以及商品类目等）。N个标签值可以包括但不限于N个标定推荐分数。

步骤204，对于初始样本集中任意的第一样本，在前i-1棵决策树中，获取包括第一样本的各叶子节点各自的对应于N个业务目标的N个分数。

这里的i和N均为正整数。

如前所述，决策树的构建过程即为对初始样本集进行分割的过程。在一棵决策树构建完成之后，初始样本集中的每个样本均可以被分割到该决策树的一个叶子节点中。如，每条广告、每个事件或者每个用户均可以被分割到该决策树的一个叶子节点中，此外，本方案用于进行多任务学习，从而已构建的每棵决策树的每个叶子节点均具有对应于N个业务目标的N个分数。如，每个叶子节点均具有N个质量分数、N个欺诈概率或N个推荐分数。从而，步骤204即为从已构建的各棵决策树中，获取包括当前广告、当前事件或当前用户的各叶子节点的N个质量分数、N个欺诈概率或N个推荐分数。

应理解，在i为1时，上述对应于N个业务目标的N个分数均为空。

步骤206，基于各叶子节点各自的N个分数以及第一样本的N个标签值，确定第一样本的对应于N个业务目标的若干梯度。

上述确定若干梯度的步骤具体可以包括：将各叶子节点各自的N个分数中对应于同一业务目标的各分数进行累加，得到对应于N个业务目标的N个累加和。分别计算第一样本的对应于同一业务目标的标签值与累加和的差值，得到对应于N个业务目标的N个残差。基于N个残差，确定第一样本的对应于N个业务目标的若干梯度。

以业务对象为广告A为例来说，假设各叶子节点各自的N个分数分别为：点击率、转化率、展示次数以及点击量。则可以将各叶子节点的点击率进行累加，得到点击率累加和。以及可以将各叶子节点的转化率进行累加，得到转化率累加和；依次类推，直至针对每个业务目标均累加完成。之后，通过计算广告A的标定点击率与点击率累加和的差值，得到一个残差。通过计算广告A的标定转化率与转化率累加和的差值，得到另一个残差；依次类推，直至得到N个残差。

在一个示例中，对于对应于某个业务目标的残差，可以直接将其与预定系数相乘作为对应于该业务目标的梯度。应理解，在该种实现方式中，总共可以获得N个梯度。且每个梯度对应于一个业务目标。

在另一个示例中，对于对应于某个业务目标的残差，可以对其求导，得到对应于该业务目标的梯度。需要说明的是，在该种实现方式中，对应于同一业务目标的梯度可以包括两种，其中，一种为一阶梯度，其通过对残差求一阶导数得到；另一种为二阶梯度，其通过对残差求二阶导数得到。应理解，在该种实现方式中，总共可以获得2N个梯度。

步骤208，对若干梯度执行第一融合，得到第一样本的融合梯度。

若上述若干梯度为N个梯度，那么执行第一融合具体可以包括：对若干梯度执行求平均或者加权求和，得到第一样本的融合梯度。其中在加权求和时，各梯度的权重系数可以随机初始化得到。

若上述若干梯度为2N个梯度，也即每个业务目标对应一个一阶梯度和一个二阶梯度。那么可以先对各业务目标的一阶梯度（即N个一阶梯度）执行第一融合，再对各业务目标的二阶梯度（即N个二阶梯度）执行第一融合，从而可以得到两个融合梯度。

在一个例子中，在对N个一阶梯度执行第一融合时，对应于N个一阶梯度中每个一阶梯度的权重系数的确定可满足如下条件：使权重系数与对应一阶梯度的乘积尽可能服从平均值为0.05，方差为0.01的高斯分布。

在具体实施时，在按照如上的方式确定各一阶梯度的权重系数之后，对于其中的m（1≤m≤N）个一阶梯度的权重系数，还可以将其扩大10至100倍。以便于在模型训练过程中重点学习对应于该m个一阶梯度的业务目标。

此外，在对N个二阶梯度执行第一融合时，对应于N个二阶梯度中每个二阶梯度的权重系数的确定可满足如下条件：使权重系数与对应二阶梯度的乘积尽可能服从平均值为1.0，方差为0.1的高斯分布。

应理解，对应于不同的业务目标，所计算得到的一阶梯度（或二阶梯度）通常具有较大差异，本说明书中通过限定权重系数的取值条件，可以方便于N个一阶梯度（或二阶梯度）的融合。此外，由于一阶梯度和二阶梯度分别代表着两种不同的学习率，所以本说明书针对该两种梯度设定了不同的权重系数确定条件。由此可以更好地兼容对应于两种梯度的学习方式。

步骤210，对于第i棵决策树的当前节点，获取分割到当前节点的当前样本集中各样本的融合梯度。

应理解，在当前节点为根节点时，当前样本集即为上述初始样本集。在当前节点为根节点的枝干节点时，当前样本集为上述初始样本集的子集。

步骤212，基于当前样本集中各样本的融合梯度，从各样本特征以及当前样本集中各样本对应于各样本特征的特征值中，分别确定出当前节点对应的分裂特征和特征阈值。

具体地，上述确定当前节点对应的分裂特征和特征阈值的步骤具体可以包括：将各样本特征依次作为当前特征，并且对于当前特征，依次将当前样本集中各样本对应于当前特征的各特征值作为当前特征值，对当前样本集进行多次假定分割。其中每次假定分割得到两个子样本集。对于每次分割得到的两个子样本集，基于两个子样本集中各样本的融合梯度，计算与两个子样本集各自对应的两个中间梯度。将两个中间梯度之和，作为本次分割对应的最终梯度。基于各次分割对应的各最终梯度，确定当前节点对应的分裂特征和特征阈值。

对于各样本的融合梯度为一个的情况，可以直接将每个子样本集中各样本的融合梯度进行加权求和，得到对应于该子样本集的中间梯度。

对于各样本的融合梯度为两个的情况，对应于每个子样本集的中间梯度可以通过以下公式计算得到：

其中，l₁和l₂均为预先设定的常量，G某子样本集中各样本的一阶梯度之和，H为某子样本集中各样本的二阶梯度之和，x₀为当前特征的初始特征值，G’某子样本集的中间梯度。

此外，上述基于各次分割对应的各最终梯度，确定当前节点对应的分裂特征和特征阈值具体可以包括：确定各最终梯度中最小梯度对应的第j次分割，j为正整数。将第j次分割对应的当前特征和当前特征值，作为当前节点对应的分裂特征和特征阈值。

步骤214，基于当前节点对应的分裂特征和特征阈值，对当前样本集进行分割，生成当前节点对应的子节点，直至到达叶子节点。

应理解，在对当前样本集进行分割之后，就可以生成当前节点的两个子节点。其中，每个子节点对应于一个子样本集。之后，可以将该两个子节点依次作为当前节点执行上述步骤210-步骤214的处理；直至到达叶子节点。至此就完成了多任务预测模型中一棵决策树的构建。

图3为本说明书提供的梯度融合示意图。图3中，每个方框代表一个梯度，位于同一列的各方框代表同一样本的对应于N个业务目标的N个梯度。垂直方向的箭头用于表示对同一样本的各梯度执行第一融合。应理解，这里的第一融合可以是在构建每棵决策树之前执行。此外，水平方向的箭头用于表示分别将两组样本中各样本的对应于同一业务目标的各梯度执行第二融合。需要说明的是，上述第二融合是在每棵决策树构建完成之后执行的，以确定每个叶子节点的对应于N个业务目标的N个分数（具体确定过程后续说明）。

在到达叶子节点之后，对于第i棵决策树中任意的第一叶子节点，可以获取分割到第一叶子节点的各目标样本。对各目标样本的对应于同一业务目标的各梯度执行第二融合，得到N个融合结果。将N个融合结果，分别作为第一叶子节点的对应于N个业务目标的N个分数。

对于若干梯度为N个梯度的情况，上述执行第二融合可以包括：对各目标样本的对应于同一业务目标的各梯度执行求平均或者加权求和。

对于若干梯度为2N个梯度的情况，即每个业务目标对应一个一阶梯度和一个二阶梯度。上述执行第二融合可以包括：对各目标样本的对应于同一业务目标的各一阶梯度执行求平均或者加权求和。

综上，本说明书实施例提供的多任务预测模型，综合考虑了多个业务目标的梯度，从而本方案可以实现多任务学习。此外，通过本方案所构建的多任务预测模型中的每棵决策树的每个叶子节点，可以具有对应于N个业务目标的N个分数，从而本方案所构建的决策树也可以称为多个任务的同构异值树。换句话说，本方案中，多个任务之间可以共享同构异值树，且通过该同构异值树可以实现多任务预测。

以下以业务对象为事件，多任务预测模型为事件预测模型，对本说明提供的多任务预测模型的训练方法进行说明。

图4为本说明书提供的事件预测模型的训练方法流程图。如图4所示，该方法可以包括：

步骤402，获取初始样本事件集。

该初始样本事件集中的每个样本事件包括事件特征和对应于N个欺诈类型的N个标签值。其中，事件特征可以包括但不限于交易时间、交易地点、交易金额、交易网络环境以及交易商品信息等。N个欺诈类型可以包括但不限于刷单类型、假冒亲友类型、假冒执法机关类型以及盗卡类型等。相应地，N个标签值可以包括但不限于标定刷单概率、标定假冒亲友概率、标定假冒执法机关概率以及标定盗卡概率等。

步骤404，对于初始样本事件集中任意的第一样本事件，在前i-1棵决策树中，获取第一样本事件的各叶子节点各自的对应于N个欺诈类型的N个欺诈概率。

其中，i和N均为正整数。

在一个例子中，这里的N个欺诈概率可以包括但不限于刷单概率、假冒亲友概率、假冒执法机关概率以及盗卡概率等。

步骤406，基于各叶子节点各自的N个欺诈概率以及第一样本事件的N个标签值，确定第一样本事件的对应于N个欺诈类型的若干梯度。

上述确定若干梯度的步骤具体可以包括：将各叶子节点各自的N个欺诈概率中对应于同一欺诈类型的各欺诈概率进行累加，得到对应于N个欺诈类型的N个累加和。分别计算第一样本事件的对应于同一欺诈类型的标签值与累加和的差值，得到对应于N个欺诈类型的N个残差。基于N个残差，确定第一样本事件的对应于N个欺诈类型的若干梯度。

比如，可以将各叶子节点的刷单概率进行累加，得到刷单概率累加和。以及可以将各叶子节点的假冒亲友概率进行累加，得到假冒亲友概率累加和；依次类推，直至针对对应于每个欺诈类型的欺诈概率均累加完成。之后，通过计算第一样本事件的标定刷单概率与刷单概率累加和的差值，得到一个残差。通过计算第一样本事件的标定假冒亲友概率与假冒亲友概率累加和的差值，得到另一个残差；依次类推，直至得到N个残差。

此外，如前所述，这里的若干梯度可以为N个梯度，其中每个梯度对应于一个欺诈类型。也可以为2N个梯度，其中，对应于同一欺诈类型的梯度可以包括两种，其中，一种为一阶梯度，其通过对残差求一阶导数得到；另一种为二阶梯度，其通过对残差求二阶导数得到。

步骤408，对若干梯度执行第一融合，得到第一样本事件的融合梯度。

如前所述，这里的第一样本事件的融合梯度可以为一个，也可以为两个。

步骤410，对于第i棵决策树的当前节点，获取分割到当前节点的当前样本事件集中各样本事件的融合梯度。

步骤412，基于当前样本事件集中各样本事件的融合梯度，从各事件特征以及当前样本事件集中各样本事件对应于各事件特征的特征值中，分别确定出当前节点对应的分裂特征和特征阈值。

步骤414，基于当前节点对应的分裂特征和特征阈值，对当前样本事件集进行分割，生成当前节点对应的子节点，直至到达叶子节点。

应理解，在对当前样本事件集进行分割之后，就可以生成当前节点的两个子节点。其中，每个子节点对应于一个子样本事件集。之后，可以将该两个子节点依次作为当前节点执行上述步骤410-步骤414的处理；直至到达叶子节点，至此就完成了事件预测模型中一棵决策树的构建。

在到达叶子节点之后，对于第i棵决策树中任意的第一叶子节点，可以获取分割到第一叶子节点的各目标样本事件。对各目标样本事件的对应于同一欺诈类型的各梯度执行第二融合，得到N个融合结果。将N个融合结果，分别作为第一叶子节点的N个欺诈概率。

在一个示例中，上述执行第二融合可以包括：对各目标样本事件的对应于同一欺诈类型的各梯度执行求平均或者加权求和。

需要说明的是，在构建得到事件预测模型之后，基于该事件预测模型，可以针对任一事件进行事件类型预测。

还需要说明的是，通过该实施例训练的事件预测模型也可以称为同构异值树，即每棵树的每个叶子节点可以具有对应于N个欺诈类型的N个欺诈概率。从而通过该事件预测模型，针对任一事件可以预测多种不同的欺诈类型。

图5为本说明书一个实施例提供的事件类型的预测方法示意图。如图5所示，所述方法可以包括：

步骤502，获取事件预测模型。

这里所获取的事件预测模型可以是指通过图4示出的方法所训练的事件预测模型。即其可以包括多棵决策树。

步骤504，获取第一事件的事件特征以及待预测欺诈类型。

应理解，这里的第一事件是指待预测事件。这里的事件特征可以包括但不限于交易时间、交易地点、交易金额、交易网络环境以及交易商品信息等。这里的待预测欺诈类型可以为以下任一种：刷单类型、假冒亲友类型、假冒执法机关类型以及盗卡类型等。

步骤506，将第一事件的事件特征分别输入多棵决策树，并从各棵决策树中获取包括第一事件的各叶子节点对应于待预测事件类型的第一欺诈概率。

如前所述，事件预测模型中每棵决策树的每个叶子节点具有对应于N种欺诈类型的N个欺诈概率。从而上述任意的第一叶子节点的第一欺诈概率可以为第一叶子节点的对应于N个欺诈类型的N个欺诈概率中的一个欺诈概率。

步骤508，对各叶子节点对应于待预测欺诈类型的第一欺诈概率进行累加，得到目标概率。

步骤510，基于目标概率，判断第一事件是否属于待预测欺诈类型。

比如，在目标概率大于预定阈值时，则判断第一事件属于待预测欺诈类型。

应理解，本方案中，针对任一事件，通过事件预测模型可以预测多种不同的欺诈类型。

图6为本说明书一个实施例提供的多任务预测模型的训练装置示意图。该装置用于依次构建多棵决策树，其中每棵决策树的每个叶子节点具有对应于N个业务目标的N个分数。如图6所示，该装置通过其包括的以下单元构建第i棵决策树：

获取单元602，用于获取初始样本集。该初始样本集中的每个样本包括样本特征和对应于N个业务目标的N个标签值。

获取单元602，还用于对于初始样本集中任意的第一样本，在前i-1棵决策树中，获取包括第一样本的各叶子节点各自的对应于N个业务目标的N个分数，i和N均为正整数。

确定单元604，用于基于各叶子节点各自的N个分数以及第一样本的N个标签值，确定第一样本的对应于N个业务目标的若干梯度。

确定单元604具体用于：

将各叶子节点各自的N个分数中对应于同一业务目标的各分数进行累加，得到对应于N个业务目标的N个累加和。

分别计算第一样本的对应于同一业务目标的标签值与累加和的差值，得到对应于N个业务目标的N个残差。

基于N个残差，确定第一样本的对应于N个业务目标的若干梯度。

融合单元606，用于对若干梯度执行第一融合，得到第一样本的融合梯度。

融合单元606具体用于：

对若干梯度执行求平均或者加权求和，得到第一样本的融合梯度。

获取单元602，还用于对于第i棵决策树的当前节点，获取分割到当前节点的当前样本集中各样本的融合梯度。

确定单元604，还用于基于当前样本集中各样本的融合梯度，从各样本特征以及当前样本集中各样本对应于各样本特征的特征值中，分别确定出当前节点对应的分裂特征和特征阈值。

确定单元604具体可以用于：

将各样本特征依次作为当前特征，并且对于当前特征，依次将当前样本集中各样本对应于当前特征的各特征值作为当前特征值，对当前样本集进行多次假定分割。其中每次假定分割得到两个子样本集。

对于每次分割得到的两个子样本集，基于两个子样本集中各样本的融合梯度，计算与两个子样本集各自对应的两个中间梯度。将两个中间梯度之和，作为本次分割对应的最终梯度。

基于各次分割对应的各最终梯度，确定当前节点对应的分裂特征和特征阈值。

确定单元604还具体用于：

确定各最终梯度中最小梯度对应的第j次分割，j为正整数。

将第j次分割对应的当前特征和当前特征值，作为当前节点对应的分裂特征和特征阈值。

分割单元608，应于基于当前节点对应的分裂特征和特征阈值，对当前样本集进行分割，生成当前节点对应的子节点，直至到达叶子节点。

可选地，获取单元602，还用于对于第i棵决策树中任意的第一叶子节点，获取分割到第一叶子节点的各目标样本。

融合单元606，还用于对各目标样本的对应于同一业务目标的各梯度执行第二融合，得到N个融合结果。将N个融合结果，分别作为第一叶子节点的对应于N个业务目标的N个分数。

可选地，上述若干梯度为N个梯度（如，N个一阶梯度），其中每个梯度对应于一个业务目标。融合单元606还具体用于：

对各目标样本的对应于同一业务目标的各梯度执行求平均或者加权求和。

上述多任务预测模型用于针对业务对象预测多个回归值，该多个回归值分别对应于多个业务目标。

具体地，上述业务对象可以为广告，多个业务目标为多个质量指标，多个回归值为多个质量分数。或者，上述业务对象可以为事件，多个业务目标为多个欺诈类型，多个回归值为多个欺诈概率。或者，上述业务对象可以为用户和商品，多个业务目标为多个推荐指标，多个回归值为多个推荐分数。

本说明书上述实施例装置的各功能模块的功能，可以通过上述方法实施例的各步骤来实现，因此，本说明书一个实施例提供的装置的具体工作过程，在此不复赘述。

本说明书一个实施例提供的多任务预测模型的训练装置，可以大大提升多任务预测模型的鲁棒性。

图7为本说明书一个实施例提供的事件类型的预测装置示意图。如图7所示，该装置可以包括：

获取单元702，用于获取根据图2所示的方法训练的多任务预测模型，该多任务业务预测模型包括多棵决策树。

获取单元702，还用于获取第一事件的事件特征以及待预测欺诈类型。

输入单元704，用于将第一事件的事件特征分别输入多棵决策树，并从各棵决策树中获取包括第一事件的各叶子节点对应于待预测事件类型的第一欺诈概率。其中任意的第一叶子节点的第一欺诈概率为第一叶子节点的对应于N个欺诈类型的N个欺诈概率中的一个欺诈概率。

累加单元706，用于对各叶子节点对应于待预测欺诈类型的第一欺诈概率进行累加，得到目标概率。

判断单元708，用于基于目标概率，判断第一事件是否属于待预测欺诈类型。

本说明书实施例提供的事件类型的预测装置，针对任一事件，通过事件预测模型可以预测多种不同的欺诈类型。

根据另一方面的实施例，还提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行结合图2、图4或图5所描述的方法。

根据再一方面的实施例，还提供一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现结合图2、图4或图5所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于设备实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

结合本说明书公开内容所描述的方法或者算法的步骤可以硬件的方式来实现，也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成，软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外，该ASIC可以位于服务器中。当然，处理器和存储介质也可以作为分立组件存在于服务器中。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质，其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上所述的具体实施方式，对本说明书的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本说明书的具体实施方式而已，并不用于限定本说明书的保护范围，凡在本说明书的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本说明书的保护范围之内。

Claims

1.一种多任务预测模型的训练方法，所述方法包括依次构建多棵决策树，其中每棵决策树的每个叶子节点具有对应于N个业务目标的N个分数；其中构建第i棵决策树包括：

2.根据权利要求1所述的方法，还包括：

对于所述第i棵决策树中任意的第一叶子节点，获取分割到所述第一叶子节点的各目标样本；

对所述各目标样本的对应于同一业务目标的各梯度执行第二融合，得到N个融合结果；

将所述N个融合结果，分别作为所述第一叶子节点的对应于所述N个业务目标的N个分数。

3.根据权利要求2所述的方法，所述若干梯度为N个梯度，其中每个梯度对应于一个业务目标；所述对所述各目标样本的对应于同一业务目标的各梯度执行第二融合，包括：

对所述各目标样本的对应于同一业务目标的各梯度执行求平均或者加权求和。

4.根据权利要求1所述的方法，所述基于所述各叶子节点各自的N个分数以及所述第一样本的N个标签值，确定所述第一样本的对应于所述N个业务目标的若干梯度，包括：

将所述各叶子节点各自的N个分数中对应于同一业务目标的各分数进行累加，得到对应于所述N个业务目标的N个累加和；

分别计算所述第一样本的对应于同一业务目标的标签值与累加和的差值，得到对应于所述N个业务目标的N个残差；

基于所述N个残差，确定所述第一样本的对应于所述N个业务目标的若干梯度。

5.根据权利要求1所述的方法，所述对所述若干梯度执行第一融合，得到所述第一样本的融合梯度，包括：

对所述若干梯度执行求平均或者加权求和，得到所述第一样本的融合梯度。

6.根据权利要求1所述的方法，所述基于当前样本集中各样本的融合梯度，从各样本特征以及当前样本集中各样本对应于所述各样本特征的特征值中，分别确定出当前节点对应的分裂特征和特征阈值，包括：

将所述各样本特征依次作为当前特征，并且对于当前特征，依次将当前样本集中各样本对应于当前特征的各特征值作为当前特征值，对当前样本集进行多次假定分割；其中每次假定分割得到两个子样本集；

对于每次分割得到的两个子样本集，基于所述两个子样本集中各样本的融合梯度，计算与所述两个子样本集各自对应的两个中间梯度；将两个中间梯度之和，作为本次分割对应的最终梯度；

7.根据权利要求6所述的方法，所述基于各次分割对应的各最终梯度，确定当前节点对应的分裂特征和特征阈值，包括：

确定所述各最终梯度中最小梯度对应的第j次分割；j为正整数；

将所述第j次分割对应的当前特征和当前特征值，作为当前节点对应的分裂特征和特征阈值。

8.根据权利要求1所述的方法，所述多任务预测模型用于针对业务对象预测多个回归值，该多个回归值分别对应于所述多个业务目标。

9.根据权利要求8所述的方法，

所述业务对象为广告；所述多个业务目标为多个质量指标；所述多个回归值为多个质量分数；或者，

所述业务对象为事件；所述多个业务目标为多个欺诈类型；所述多个回归值为多个欺诈概率；或者，

所述业务对象为用户和商品；所述多个业务目标为多个推荐指标；所述多个回归值为多个推荐分数。

10.一种事件类型的预测方法，包括：

获取根据权利要求1的方法训练的多任务预测模型，所述多任务业务预测模型包括多棵决策树；

获取第一事件的事件特征以及待预测欺诈类型；

11.一种多任务预测模型的训练装置，所述装置用于依次构建多棵决策树，其中每棵决策树的每个叶子节点具有对应于N个业务目标的N个分数；所述装置通过其包括的以下单元构建第i棵决策树：

12.根据权利要求11所述的装置，

所述获取单元，还用于对于所述第i棵决策树中任意的第一叶子节点，获取分割到所述第一叶子节点的各目标样本；

所述融合单元，还用于对所述各目标样本的对应于同一业务目标的各梯度执行第二融合，得到N个融合结果；将所述N个融合结果，分别作为所述第一叶子节点的对应于所述N个业务目标的N个分数。

13.根据权利要求12所述的装置，所述若干梯度为N个梯度，其中每个梯度对应于一个业务目标；所述融合单元具体用于：

14.根据权利要求11所述的装置，所述确定单元具体用于：

15.根据权利要求11所述的装置，所述融合单元具体用于：

16.根据权利要求11所述的装置，所述确定单元具体用于：

17.根据权利要求16所述的装置，所述确定单元还具体用于：

18.根据权利要求11所述的装置，所述多任务预测模型用于针对业务对象预测多个回归值，该多个回归值分别对应于所述多个业务目标。

19.根据权利要求18所述的装置，

20.一种事件类型的预测装置，包括：

获取单元，用于获取根据权利要求1的方法训练的多任务预测模型，所述多任务业务预测模型包括多棵决策树；

21.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-9中任一项所述的方法或权利要求10所述的方法。

22.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-9中任一项所述的方法或权利要求10所述的方法。