WO2018166457A1

WO2018166457A1 - 神经网络模型训练、交易行为风险识别方法及装置

Info

Publication number: WO2018166457A1
Application number: PCT/CN2018/078906
Authority: WO
Inventors: 李龙飞; 周俊; 李小龙
Original assignee: 阿里巴巴集团控股有限公司; 李龙飞; 周俊; 李小龙
Priority date: 2017-03-15
Filing date: 2018-03-14
Publication date: 2018-09-20
Also published as: TWI689874B; TW201835819A; CN108629413A; CN108629413B

Abstract

一种神经网络模型训练、交易行为风险识别方法及装置。所述神经网络模型训练方法包括：将预先收集的多个样本数据输入到梯度提升决策树GBDT中，以确定每个样本数据在GBDT中对应的路径信息（S110）；根据每个样本数据在GBDT中对应的路径信息以及样本标签，对神经网络模型进行训练（S120）。所述方法首先根据GBDT来确定路径信息，之后根据路径信息以及样本标签来训练神经网络模型，而根据GBDT本身的特点可知，其一条路径信息通常会包含样本数据中多个维度的信息，由此，可以提高神经网络模型训练的效率。

Description

神经网络模型训练、交易行为风险识别方法及装置

技术领域

本申请涉及计算机技术领域，尤其涉及一种神经网络模型训练、交易行为风险识别方法及装置。

背景技术

传统技术中，在搜集到样本数据之后，直接根据样本数据以及样本数据的样本标签，来训练神经网络模型。然而，上述搜集的样本数据通常会包括多个维度的信息，这会导致神经网络模型训练的效率比较低。

发明内容

本申请描述了一种神经网络模型训练、交易行为风险识别方法及装置，可以提高神经网络模型训练的效率。

第一方面，提供了一种神经网络模型训练方法，包括：

将预先收集的多个样本数据输入到梯度提升决策树GBDT中，以确定每个样本数据在所述GBDT中对应的路径信息；所述每个样本数据具有对应的样本标签；

根据所述每个样本数据在所述GBDT中对应的路径信息以及样本标签，对神经网络模型进行训练。

第二方面，提供了一种交易行为风险识别方法，包括：

获取用户的交易行为数据；

将所述交易行为数据输入到梯度提升决策树GBDT中，以确定所述交易行为数据在所述GBDT中对应的路径信息；

将所述路径信息输入到神经网络模型中；

输出交易行为风险识别结果。

第三方面，提供了一种神经网络模型训练装置，包括：

确定单元，用于将预先收集的多个样本数据输入到梯度提升决策树GBDT中，以确定每个样本数据在所述GBDT中对应的路径信息；所述每个样本数据具有对应的样本标签；

训练单元，用于根据所述确定单元确定的所述每个样本数据在所述GBDT中对应的路径信息以及样本标签，对神经网络模型进行训练。

第四方面，提供了一种交易行为风险识别装置，包括：

获取单元，用于获取用户的交易行为数据；

确定单元，用于将所述获取单元获取的所述交易行为数据输入到梯度提升决策树GBDT中，以确定所述交易行为数据在所述GBDT中对应的路径信息；

输入单元，用于将所述确定单元确定的所述路径信息输入到神经网络模型中；

输出单元，用于输出交易行为风险识别结果。

本申请提供的神经网络模型训练、交易行为风险识别方法及装置，将预先收集的多个样本数据输入到梯度提升决策树GBDT中，以确定每个样本数据在GBDT中对应的路径信息。根据每个样本数据在GBDT中对应的路径信息以及样本标签，对神经网络模型进行训练。也即本申请首先根据GBDT来确定路径信息，之后根据路径信息以及样本标签来训练神经网络模型，而根据GBDT本身的特点可知，其一条路径信息通常会包含样本数据中多个维度的信息，由此，可以提高神经网络模型训练的效率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本申请一种实施例提供的神经网络模型训练方法流程图；

图2为本申请提供的决策树的示意图；

图3为本申请提供的训练DNN的过程示意图；

图4为本申请提供的交易行为风险识别方法示意图；

图5为本申请一种实施例提供的神经网络模型训练装置示意图；

图6为本申请另一种实施例提供的交易行为风险识别装置示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述。

本申请实施例提供的神经网络模型训练方法适用于对深度神经网络(Deep Neural Network,DNN)或者人工神经网络(Artificial Neural Network，ANN)等神经网络模型进行训练的场景。训练好的神经网络模型可以用于进行模式识别以及分类的场景，如，可以用于对交易行为进行风险识别。

图1为本申请一种实施例提供的神经网络模型训练方法流程图。所述方法的执行主体可以为具有处理能力的设备：服务器或者系统或者装置，如图1所示，所述方法具体包括：

步骤110，将预先收集的多个样本数据输入到梯度提升决策树(Gradient Boosting Decision Tree，GBDT)中，以确定每个样本数据在GBDT中对应的路径信息。

在执行步骤110之前，可以先训练好GBDT模型。具体的训练过程后续进行说明。

步骤110中，以训练的神经网络模型用于交易行为风险识别的场景为例来说，上述样本数据可以是指用户的交易行为数据。具体地，可以是从支付宝系统的后台数据库中搜集样本数据。此处，样本数据可以归属于如下五个类别的用户数据：1)用户的历史行为信息。如，a，若干天(如，180天)内用户来电次数；b，最后一次登录城市；c，最后一次登录距今时间；d，若干天(如，90天)内登录次数等。2)用户的交易信息。如，a，若干天(如，90天)平均支付金额；b，若干天(如，180天)内支付天数；c，若干天(如，180天)内支付金额；d，最后一次支付距今时间等。3)用户的基本信息。如，a，用户是否单身；b，用户是否装修；c，用户是否已婚；d，用户年龄；e，用户注册时长；f，用户教育水平等。4)用户的远程过程调用(Remote Procedure Call，RPC)行为信息。此处的RPC行为信息是指用户在使用客户端的时候，客户端与服务器之间的RPC调用。在一种实现方式中，可以搜集每个用户在最近一个给定时间窗口的这些操作。如，可以搜集用户近2天访问的RPC接口的次数变量。5)用户的统一资源定位器(Uniform Resoure Locator，URL)地址信息。

对上述收集的多个样本数据，如果某样本数据与当前用户不相关或者该样本数据能给用户带来负面影响的，则将该样本数据分类为正样本数据。如，某一交易行为由非用户本人操作的或者对用户的账户带来一定的损失且报案的，则将该交易行为数据标记为正样本数据。否则，如果某样本数据为用户本人正常的交易行为数据，则将该样本数据标记为负样本数据。

需要说明的是，通常负样本数据比较容易搜集。如，可以很容易从支付宝系统的后台数据库中搜集到正常支付行为的数据。所以，样本数据集合中负样本数据会占绝大多数的比重，如，大于99.999％。然而，当负样本数据的比重比较高时，训练的神经网络模型往往会有偏差，如，只能识别安全的交易行为，而不能识别有风险的交易行为，这影响了交易行为风险识别的准确性。

为了能提升交易行为风险识别的准确性，可以对样本数据进行预处理。在一种实现方式中，可以对正样本数据进行升采样处理；和/或，对负样本数据进行降采样处理。其中，对正样本数据进行升采样处理可以包括：通过复制等方式增加正样本数据的数量。对负样本数据进行降采样处理可以包括：通过删除等方式减小负样本数据的数量。在一个例子中，可以将正样本数据与负样本数据的比例调整为1:300。

还需要说明的是，对上述预处理后的样本数据，还可以为正、负样本数据添加对应的样本标签。具体地，为正样本数据添加正样本标签，为负样本数据添加负样本标签。

步骤110中，将预先收集的多个样本数据输入到GBDT中具体可以包括：针对每个样本数据，可以先根据该样本数据，确定多个特征对应的特征值。之后，将特征的特征值输入到GBDT的决策树中。

此处的特征可以归属于多个类别。在一种实现方式中，上述特征中的部分特征可以采用现有交易行为风险识别模型在线沉淀的模型变量，该模型变量归属于如下三个类别：1)用户的历史行为信息。2)用户的交易信息。3)用户的基本信息。

然而，上述模型变量需要根据业务数据来确定，而业务数据通常来自不同业务部门，其采集和整理需要一定的时间，所以仅通过上述模型变量不能得到用户最新的状态，从而也不能对用户最新的交易行为进行风险识别。为解决该问题，本申请中增加了归属于用户的RPC行为信息的特征和归属于用户的URL地址信息的特征。

综上，本申请的特征可以为归属于如下五个类别的特征：1)用户的历史行为信息。2)用户的交易信息。3)用户的基本信息。4)用户的RPC行为信息。5)用户的URL地址信息。其中，每个类别如上所述，在此不复赘述。

对上述设定的特征，在根据具体的样本数据，确定其对应的特征值之后，就可以将特征值输入到GBDT中。此处的GBDT可以由多棵决策树组成，每棵决策树包括多个节点，每个节点与一个特征相对应。以一棵决策树为例来说，该决策树可以如图2所示，图2中，节点1、节点2和节点3分别与特征：“用户性别是否是男”、“用户年龄大于20岁”以及“交易金额是否超过1000元”相对应。在将特征的特征值输入决策树之后，就可以在决策树中确定出多条路径信息。如，假设样本数据包含用户性别是男，用户年龄大于20岁，交易金额超过1000元时，确定出的路径信息可以如图2中的粗线所示。

作为示例性说明，图2中只是展示了一条路径信息，实际上样本数据输入GBDT时，可以确定出多条路径信息，本申请在此不复赘述。

需要说明的是，本申请中，在将该特征值输入到GBDT之前，还可以将该特征值表示为one-hot形式的特征向量。在还确定特征值对应的特征向量的情况下，上述将特征值输入到GBDT中可以替换为：将特征值对应的特征向量输入到决策树中，以确定相应的路径信息。其中，确定特征值的特征向量的过程可以举例如下：

以特征为“用户性别”为例来说，如果用户性别为男，也即特征的特征值为“男”，则该特征值对应的特征向量可以为：[0 1]。如果用户性别为女，也即特征的特征值为“女”，则该特征值对应的特征向量可以为：[1 0]。

再以特征为用户的RPC行为信息为例来说，其特征值对应的特征向量的确定可以通过如下两种方式来实现：第一种实现方式中，首先设定规则：出现过则标识为1，否则为0。具体地，假设预设的RPC行为信息为：a，b和c。而某个样本数据包含用户两天内的RPC行为信息为：a，a和b，也即特征值为：a，a和b。则对应的特征向量可以为：[1 1 0]。在另一种实现方式中，可以设定规则：统计预设的RPC行为信息的频次，然后归一化。具体地，假设预设的RPC行为信息为：a，b和c。而某个样本数据包含用户两天内的RPC行为信息为：a，a，b，b和c，也即特征值为：a，a，b，b和c。则对应的特征向量可以为：2,2和1。因为需要归一化，所以最终的特征向量为：[0.4 0.4 0.2]。

需要说明的是，上述将特征值表示为特征向量属于传统常规技术，在此不复赘述。

需要说明的是，为了提升神经网络模型的准确性，本申请中设定了比较多的特征，从而会确定多个特征值。对于越来越多的特征值，其处理往往需要花费很多的时间，受限于同时观察的特征值的个数，人很难对多个特征值之间的关系进行深入的分析，并手工生成新的特征值。而本申请通过将样本数据输入GBDT，来得到路径信息，该路径信息由于包含了多个特征值。从而可以大大减小特征值的数量，由此可以显著地减少人工的工作。

步骤120，根据每个样本数据对应的路径信息以及样本标签，对神经网络模型进行训练。

此处的神经网络模型可以包括DNN或者ANN等。其中，DNN最近几年发展迅速，相比传统使用的浅层模型(如，逻辑回归(Logistic Regression，LR),随机森林(Random forest，RF))，DNN有着其特有的先进性：模型表达能力强大，适合大数据和分布式训练。因此，本说明书中，以训练DNN为例进行说明。

本申请中，DNN的训练过程可以如图3所示，图3中，DNN的输入层用于输入GBDT中的各条路径信息，而输出层即可输出第一预测结果。可以理解的是，针对每个样本数据，即在将该样本数据对应的路径信息输入到DNN之后，DNN都会输出相应的第第一预测结果。对样本集合中的多个样本数据，若第第一预测结果与样本数据的样本标签相符合的概率达到预设阈值，此处的预设阈值可以根据经验值设定，则可以认为已经得到了优化的DNN。

可以理解的是，随着路径信息的个数的不同，图3中DNN的层数是可以改动的。

通过实验发明，本申请训练得到的神经网络模型会比其它模型(LR或者RF)的效果都好。同时特征处理的时间大大的减少了，整体建模流程变快了很多。

以下对如何训练GBDT模型进行说明：

在根据每个样本数据，确定多个特征对应的特征值之后，可以将多个特征对应的特征值输入GBDT的各个决策树中。之后将各个决策树的结论累加起来以确定第二预测结果。可以理解的是，针对每个样本数据，GBDT模型都会输出相应的第二预测结果。对样本集合中的多个样本数据，若第二预测结果与样本数据的样本标签相符合的概率达到预设阈值，此处的预设阈值可以根据经验值设定，则可以认为已经得到了优化的GBDT模型。而若第二预测结果与样本数据的样本标签相符合的概率未达到预设阈值，则可以通过调整决策树的数目、决策树的深度以及正则化项(用于表示特征)来继续执行上述输入和输出的操作，直至达到预设阈值为止。

综上，本申请具有如下几方面的优点：

1)由于本申请的特征包括了类别为用户RPC行为信息的特征，因此本申请训练的神经网络模型能够满足时效性要求，也即能够识别用户最新的交易行为。

2)本申请训练的神经网络模型的准确性比传统的浅层模型高。

3)通过将样本数据输入GBDT，获得了路径信息。而一条路径信息由多个特征值组合而成，也即一条路径信息包含了样本数据的多个维度的信息，由此，可以极大地减小DNN输入层输入的数据量，从而可以提高神经网络模型训练的效率。

需要说明的是，在通过图1所示的各步骤训练得到神经网络模型之后，就可以将该神经网络模型部署到线上，并对用户的交易行为进行风险识别了。

图4为本申请提供的交易行为风险识别方法的过程示意图。如图4所示，该方法可以包括：

步骤410，获取用户的交易行为数据。

此处的交易行为数据与上述样本数据的定义相同，在此不复赘述。

步骤420，将交易行为数据输入到梯度提升决策树GBDT中，以确定交易行为数据在GBDT中对应的路径信息。

上述GBDT由多棵决策树组成，每棵决策树包括多个节点，每个节点与一个特征相对应。步骤420中将交易行为数据输入到梯度提升决策树GBDT中，以确定交易行为数据在GBDT中对应的路径信息的步骤具体可以包括：根据交易行为数据，确定多个特征对应的特征值；根据特征值，在决策树中确定路径信息。其中，确定路径信息的过程可以参照图2，在此不复赘述。

步骤430，将路径信息输入到神经网络模型中。

即将步骤420中确定的路径信息输入DNN的输入层中。

步骤440，输出交易行为风险识别结果。

具体地，由DNN的输出层输出交易行为风险识别结果。此处，如果识别结果为风险的交易行为，则可以发起报警。在支付场景下，若识别结果为风险的支付行为，则可以冻结该用户账户以防止财产流失。与上述神经网络模型训练方法对应地，本申请实施例还提供的一种神经网络模型训练装置，如图5所示，该装置包括：

确定单元501，用于将预先收集的多个样本数据输入到梯度提升决策树GBDT中，以确定每个样本数据在GBDT中对应的路径信息。

此处，每个样本数据具有对应的样本标签。

训练单元502，用于根据确定单元501确定的每个样本数据在GBDT中对应的路径信息以及样本标签，对神经网络模型进行训练。

可选地，GBDT由多棵决策树组成，每棵决策树包括多个节点，每个节点与一个特征相对应。

确定单元501具体用于：

对多个样本数据中的每个样本数据，根据样本数据，确定多个特征对应的特征值。

此处，特征可以包括：用户的远程过程调用RPC行为信息和/或用户的统一资源定位器URL地址信息。

根据特征值，在决策树中确定路径信息。

可选地，样本标签可以包括：正样本标签和负样本标签。上述装置还可以包括：

处理单元503，用于对样本标签为正样本标签的样本数据进行升采样处理；和/或，

对样本标签为负样本标签的样本数据进行降采样处理。

本申请实施例装置的各功能模块的功能，可以通过上述方法实施例的各步骤来实现，因此，本申请提供的装置的具体工作过程，在此不复赘述。

本申请提供的神经网络模型训练装置，确定单元501将预先收集的多个样本数据输入到梯度提升决策树GBDT中，以确定每个样本数据在GBDT中对应的路径信息。训练单元502根据每个样本数据在GBDT中对应的路径信息以及样本标签，对神经网络模型进行训练。由此，可以提高神经网络模型训练的效率。

与上述交易行为风险识别方法对应地，本申请实施例还提供的一种交易行为风险识别装置，如图6所示，该装置包括：

获取单元601，用于获取用户的交易行为数据。

确定单元602，用于将获取单元601获取的交易行为数据输入到梯度提升决策树GBDT中，以确定交易行为数据在GBDT中对应的路径信息。

输入单元603，用于将确定单元602确定的路径信息输入到神经网络模型中。

输出单元604，用于输出交易行为风险识别结果。

可选地，GBDT由多棵决策树组成，每棵决策树包括多个节点，每个节点与一个特征相对应；

确定单元602具体用于：

根据交易行为数据，确定多个特征对应的特征值。

根据特征值，在决策树中确定路径信息。

其中，特征可以包括：用户的远程过程调用RPC行为信息和/或用户的统一资源定位器URL地址信息。

本申请提供的交易行为风险识别装置，可以提高交易行为风险识别的效率和准确性。

本领域技术人员应该可以意识到，在上述一个或多个示例中，本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时，可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的技术方案的基础之上，所做的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

Claims

一种神经网络模型训练方法，其特征在于，包括：

将预先收集的多个样本数据输入到梯度提升决策树GBDT中，以确定每个样本数据在所述GBDT中对应的路径信息；所述每个样本数据具有对应的样本标签；

根据所述每个样本数据在所述GBDT中对应的路径信息以及样本标签，对神经网络模型进行训练。
根据权利要求1所述的方法，其特征在于，所述GBDT由多棵决策树组成，每棵决策树包括多个节点，每个节点与一个特征相对应；

所述将预先收集的多个样本数据输入到梯度提升决策树GBDT中，以确定每个样本数据在GBDT中对应的路径信息，包括：

对所述多个样本数据中的每个样本数据，根据所述样本数据，确定多个特征对应的特征值；

根据所述特征值，在所述决策树中确定所述路径信息。
根据权利要求1或2所述的方法，其特征在于，所述样本标签包括：正样本标签和负样本标签；

在所述将预先收集的多个样本数据输入到梯度提升决策树GBDT中之前，还包括：

对样本标签为正样本标签的样本数据进行升采样处理；和/或，

对样本标签为负样本标签的样本数据进行降采样处理。
根据权利要求2所述的方法，其特征在于，所述特征包括：

用户的远程过程调用RPC行为信息和/或用户的统一资源定位器URL地址信息。
一种交易行为风险识别方法，其特征在于，包括：

获取用户的交易行为数据；

将所述交易行为数据输入到梯度提升决策树GBDT中，以确定所述交易行为数据在所述GBDT中对应的路径信息；

将所述路径信息输入到神经网络模型中；

输出交易行为风险识别结果。
根据权利要求5所述的方法，其特征在于，所述GBDT由多棵决策树组成，每棵决策树包括多个节点，每个节点与一个特征相对应；

所述将所述交易行为数据输入到梯度提升决策树GBDT中，以确定所述交易行为数据在所述GBDT中对应的路径信息，包括：

根据所述交易行为数据，确定多个特征对应的特征值；

根据所述特征值，在所述决策树中确定所述路径信息。
根据权利要求6所述的方法，其特征在于，所述特征包括：

用户的远程过程调用RPC行为信息和/或用户的统一资源定位器URL地址信息。
一种神经网络模型训练装置，其特征在于，包括：

确定单元，用于将预先收集的多个样本数据输入到梯度提升决策树GBDT中，以确定每个样本数据在所述GBDT中对应的路径信息；所述每个样本数据具有对应的样本标签；

训练单元，用于根据所述确定单元确定的所述每个样本数据在所述GBDT中对应的路径信息以及样本标签，对神经网络模型进行训练。
根据权利要求8所述的装置，其特征在于，所述GBDT由多棵决策树组成，每棵决策树包括多个节点，每个节点与一个特征相对应；

所述确定单元具体用于：

对所述多个样本数据中的每个样本数据，根据所述样本数据，确定多个特征对应的特征值；

根据所述特征值，在所述决策树中确定所述路径信息。
根据权利要求8或9所述的装置，其特征在于，所述样本标签包括：正样本标签和负样本标签；所述装置还包括：

处理单元，用于对样本标签为正样本标签的样本数据进行升采样处理；和/或，

对样本标签为负样本标签的样本数据进行降采样处理。
根据权利要求9所述的装置，其特征在于，所述特征包括：

用户的远程过程调用RPC行为信息和/或用户的统一资源定位器URL地址信息。
一种交易行为风险识别装置，其特征在于，包括：

获取单元，用于获取用户的交易行为数据；

确定单元，用于将所述获取单元获取的所述交易行为数据输入到梯度提升决策树GBDT中，以确定所述交易行为数据在所述GBDT中对应的路径信息；

输入单元，用于将所述确定单元确定的所述路径信息输入到神经网络模型中；

输出单元，用于输出交易行为风险识别结果。
根据权利要求12所述的装置，其特征在于，所述GBDT由多棵决策树组成，每棵决策树包括多个节点，每个节点与一个特征相对应；

所述确定单元具体用于：

根据所述交易行为数据，确定多个特征对应的特征值；

根据所述特征值，在所述决策树中确定所述路径信息。
根据权利要求13所述的装置，其特征在于，所述特征包括：

用户的远程过程调用RPC行为信息和/或用户的统一资源定位器URL地址信息。