CN114723269A

CN114723269A - 一种事件的风险防控方法、装置及设备

Info

Publication number: CN114723269A
Application number: CN202210334912.7A
Authority: CN
Inventors: 李志峰; 朱预立; 崔世文; 孟昌华; 王维强
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2022-07-08

Abstract

本说明书实施例公开了一种事件的风险防控方法、装置及设备，该方法包括：获取目标事件的待处理的事件数据，然后，基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，所述第一风控模型是由所述目标事件对应的风控策略构建的模型，最终，可以基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，并将所述事件数据对应的初始风险信息和所述事件数据输入到所述目标事件对应的第二风控模型中，得到所述事件数据对应的风险信息，所述第二风控模型是通过所述目标事件对应的事件数据样本进行模型训练得到的模型。

Description

一种事件的风险防控方法、装置及设备

技术领域

本文件涉及计算机技术领域，尤其涉及一种事件的风险防控方法、装置及设备。

背景技术

随着网络技术的不断发展，通过网络办理某些业务已经成为当前业务办理的重要途径，随着业务量和数据量的不断加大，数据风险也随之加剧，这样就需要对很多线上业务进行风险防控，以避免用户出现信息泄露，甚至资源损失。

在风险防控系统中，通常可以通过风控策略和风控模型等方式来实现风险防控处理，但是，对于风控模型的情况，风控模型依赖于训练样本，由于被风险防控系统拒绝的训练样本无法获取其真实的标签信息，因此，在模型训练时，会将上述训练样本剔除，这样，就造成了剔除后剩余的训练样本的数据分布与实际数据或剔除前的训练样本的数据分布不一致，并且被剔除的训练样本往往是存在风险的概率较高的训练样本，从而造成了训练风控模型的训练样本存在偏置，此外，上述训练样本中的正样本的数量往往比较少，从而使得风控模型难以训练。对于风控策略的情况，风控策略是风控专家的知识经验的体现，风控策略往往覆盖率低，但是其精准率较高，为此，需要提供一种泛化性更优、风险防控的准确率更高的风险防控方案。

发明内容

本说明书实施例的目的是提供一种泛化性更优、风险防控的准确率更高的风险防控方案。

为了实现上述技术方案，本说明书实施例是这样实现的：

本说明书实施例提供的一种事件的风险防控方法，所述方法包括：获取目标事件的待处理的事件数据。基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，所述第一风控模型是由所述目标事件对应的风控策略构建的模型。基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，并将所述事件数据对应的初始风险信息和所述事件数据输入到所述目标事件对应的第二风控模型中，得到所述事件数据对应的风险信息，所述第二风控模型是通过所述目标事件对应的事件数据样本进行模型训练得到的模型。

本说明书实施例提供的一种事件的风险防控装置，所述装置包括：数据获取模块，获取目标事件的待处理的事件数据。第一风险检测模块，基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，所述第一风控模型是由所述目标事件对应的风控策略构建的模型。风险确定模块，基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，并将所述事件数据对应的初始风险信息和所述事件数据输入到所述目标事件对应的第二风控模型中，得到所述事件数据对应的风险信息，所述第二风控模型是通过所述目标事件对应的事件数据样本进行模型训练得到的模型。

本说明书实施例提供的一种事件的风险防控设备，所述事件的风险防控设备包括：处理器；以及被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：获取目标事件的待处理的事件数据。基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，所述第一风控模型是由所述目标事件对应的风控策略构建的模型。基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，并将所述事件数据对应的初始风险信息和所述事件数据输入到所述目标事件对应的第二风控模型中，得到所述事件数据对应的风险信息，所述第二风控模型是通过所述目标事件对应的事件数据样本进行模型训练得到的模型。

本说明书实施例还提供了一种存储介质，所述存储介质用于存储计算机可执行指令，所述可执行指令在被处理器执行时实现以下流程：获取目标事件的待处理的事件数据。基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，所述第一风控模型是由所述目标事件对应的风控策略构建的模型。基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，并将所述事件数据对应的初始风险信息和所述事件数据输入到所述目标事件对应的第二风控模型中，得到所述事件数据对应的风险信息，所述第二风控模型是通过所述目标事件对应的事件数据样本进行模型训练得到的模型。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书一种事件的风险防控方法实施例；

图2为本说明书一种事件的风险防控系统的结构示意图；

图3为本说明书另一种事件的风险防控过程的示意图；

图4为本说明书一种事件的风险防控装置实施例；

图5为本说明书一种事件的风险防控设备实施例。

具体实施方式

本说明书实施例提供一种事件的风险防控方法、装置及设备。

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

实施例一

如图1所示，本说明书实施例提供一种事件的风险防控方法，该方法的执行主体可以为终端设备或服务器，其中，该终端设备可以如手机、平板电脑等移动终端设备，还可以如笔记本电脑或台式电脑等计算机设备，或者，也可以为IoT设备(具体如智能手表、车载设备等)等，该服务器可以是一个独立的服务器，也可以是由多个不同的服务器构成的服务器集群。本实施例中以服务器作为执行主体进行详细说明，对于执行主体为终端设备的情况，可以基于下述内容执行，在此不再赘述。该方法具体可以包括以下步骤：

在步骤S102中，获取目标事件的待处理的事件数据。

其中，目标事件可以是任意的需要进行风险防控的事件，例如目标事件可以为支付事件、转账事件或某数据的访问事件等，具体可以根据实际情况设定，本说明书实施例对此不做限定。

在实施中，随着网络技术的不断发展，通过网络办理某些业务已经成为当前业务办理的重要途径，随着业务量和数据量的不断加大，数据风险也随之加剧，这样就需要对很多线上业务进行风险防控，以避免用户出现信息泄露，甚至资源损失。

在风险防控系统中，通常可以通过风控策略和风控模型等方式来实现风险防控处理，但是，对于风控模型的情况，风控模型依赖于训练样本，由于被风险防控系统拒绝的训练样本无法获取其真实的标签信息，因此，在模型训练时，会将上述训练样本剔除，这样，就造成了剔除后剩余的训练样本的数据分布与实际数据或剔除前的训练样本的数据分布不一致，并且被剔除的训练样本往往是存在风险的概率较高的训练样本，从而造成了训练风控模型的训练样本存在偏置，此外，上述训练样本中的正样本的数量往往比较少，从而使得风控模型难以训练。对于风控策略的情况，风控策略是风控专家的知识经验的体现，风控策略往往覆盖率低，但是其精准率较高，为此，需要提供一种泛化性更优、风险防控的准确率更高的风险防控方案。本说明书实施例提供一种可实现的实现方式，具体可以参见下述内容：

当需要对目标事件进行风险防控时，可以实时获取用户执行目标事件时产生的事件数据，可以将获取的事件数据作为目标事件的待处理的事件数据，具体如，以目标事件为转账事件为例，如图2所示，当某用户通过其终端设备中安装的指定应用程序向服务器发送转账请求时，服务器可以对该转账请求进行分析，可以从中提取转账方的账户信息、转账金额、转账的目标账户的信息，此外，还可以获取与上述转账事件相关的数据，如转账方的相关数据(如投诉或被投诉的相关数据等)、目标账户的相关数据(如投诉或被投诉的相关数据等)、转账方与目标账户的用户之间的关联关系等，具体可以根据实际情况设定。可以将上述获取的数据作为转账事件的待处理的事件数据。

在步骤S104中，基于上述事件数据和目标事件对应的第一风控模型，确定第一风控模型对应的风险检测结果，第一风控模型是由目标事件对应的风控策略构建的模型。

其中，风险检测结果可以是对某事件数据中是否存在风险进行检测的结果，风险检测结果可以包括多个，相应的，第一风控模型也可以包括多个，每个第一风控模型均可以对上述事件数据进行风险检测，得到相应的风险检测结果。风控策略可以是风控专家通过专家经验知识设定的用于进行风险防控的策略，风控策略可以是一个，也可以是多个，风控策略中可以由一个或多个不同的条件构成，例如，风控策略中可以包括不超过18岁和在线时长超过2小时等，具体可以根据实际情况设定。

在实施中，考虑到风控策略是风控专家的知识经验的体现，其精准率较高等优点，可以基于风控策略构建相应的模型(即第一风控模型)，具体地，由于风控策略通常由多个不同的条件通过预设的逻辑运算关系组成，风控策略中的每个条件可以包含三个要素，分别为：特征、比较值和逻辑运算符，例如，下述风控策略：(feture1>1or feautre1<0)andfeautre2！＝-1and feature3>0，上述风控策略由4个条件(即feture1>1、feautre1<0、feautre2！＝-1和eature3>0)和3个逻辑运算关系(即or、and和and)组成，每个条件都包含特征(即feture1、feture1、feture2和feture3)、比较值(1、0、-1和0)和逻辑运算符(>、<、！＝和>)，可以基于风控策略的上述特点，可以将每个风控策略转换为一个分类模型，该分类模型可以通过预设的分类算法构建，例如可以通过贝叶斯分类算法、神经网络算法、k-近邻算法或支持向量机SVM(Support Vector Machine)等算法构建分类模型，构建的分类模型可以作为第一风控模型，可以基于分类算法和每个风控策略中的条件(包括特征、比较值和逻辑运算符)，为每个风控策略构建一个分类模型(即第一风控模型)，这样，对于目标事件对应的多个风控策略，可以得到多个第一风控模型。

可以使用每个风控策略分别对上述事件数据进行匹配，即可以将上述事件数据分别输入到每个第一风控模型中，得到每个第一风控模型输出的风险检测结果，例如，风控策略包括风控策略1、风控策略2和风控策略3，每个风控策略对应一个第一风控模型，可以将上述事件数据输入到风控策略1对应的第一风控模型中，得到相应的风险检测结果，同理，可以将上述事件数据输入到风控策略2对应的第一风控模型中，得到相应的风险检测结果，可以将上述事件数据输入到风控策略3对应的第一风控模型中，得到相应的风险检测结果。

在步骤S106中，基于第一风控模型对应的风险检测结果确定上述事件数据对应的初始风险信息，并将该事件数据对应的初始风险信息和该事件数据输入到目标事件对应的第二风控模型中，得到该事件数据对应的风险信息，第二风控模型是通过目标事件对应的事件数据样本进行模型训练得到的模型。

其中，第二风控模型可以是通过训练样本对使用某算法构建的第二风控模型进行模型训练后得到。初始风险信息可以是是否存在风险的信息，也可以是存在风险的概率数值或评分值等，具体可以根据实际情况设定，本说明书实施例对此不做限定。风险信息可以是否存在风险的信息，也可以是存在风险的概率值或评分值等。

在实施中，考虑到风控策略的覆盖率较小，可以使用数据驱动的第二风控模型继续进行风险防控，从而可以使得正样本数量在一定范围内，同时训练样本是无偏置的，有利于模型的泛化性，具体地，可以预先设定风险防控算法，通过该风险防控算法构建第二风控模型的模型架构，该模型架构中可以包括待确定的模型参数。其中，该风险防控算法可以包括多种，例如神经网络算法、生成对抗网络算法、分类算法等，具体可以根据实际情况设定，本说明书实施例对此不做限定。

可以根据实际情况为第二风控模型设定相应的损失函数，并可以获取某时间段内，针对目标事件产生的事件数据，可以将获取的上述事件数据作为目标事件对应的事件数据样本，然后，可以通过事件数据样本、预先为事件数据样本设定的初始风险信息(或风险初值)和设定的损失函数，对第二风控模型的模型架构进行训练，直到第二风控模型收敛为止，最终可以得到训练后的第二风控模型。

通过上述步骤S104的处理，可以得到一个或多个风险检测结果，如果上述得到的风险检测结果包括一个，则可以将该风险检测结果确定为上述事件数据对应的初始风险信息，如果上述得到的风险检测结果包括多个，则可以预先设定初始风险信息的确定规则，该规则可以包括多种，例如，可以将风险检测结果中数值最大的风险检测结果作为初始风险信息，或者，可以将风险检测结果中数值的大小处于所有风险检测结果的数值的中间位置的风险检测结果作为初始风险信息等，具体可以根据实际情况设定。

通过上述方式可以得到上述事件数据对应的初始风险信息，可以将该初始风险信息作为上述事件数据的风险初值，然后，可以将上述事件数据的风险初值和该事件数据输入到训练后的第二风控模型中，得到该事件数据对应的风险信息，如果该风险信息指示该事件数据存在风险，则可以拒绝执行目标事件，并可以向相应的用户发送相应的通知消息，如果该风险信息指示该事件数据不存在风险，则可以允许执行目标事件。

本说明书实施例提供一种事件的风险防控方法，通过获取目标事件的待处理的事件数据，然后，基于该事件数据和目标事件对应的第一风控模型，确定第一风控模型对应的风险检测结果，其中，第一风控模型是由目标事件对应的风控策略构建的模型，最终，可以基于第一风控模型对应的风险检测结果确定该事件数据对应的初始风险信息，并将该事件数据对应的初始风险信息和该事件数据输入到目标事件对应的第二风控模型中，得到该事件数据对应的风险信息，第二风控模型是通过目标事件对应的事件数据样本进行模型训练得到的模型，这样，利用两阶段的过程，分别利用风控策略和风控模型(包括第一风控模型和第二风控模型)，最终形成一个统一的模型，在第一阶段，利用了专家知识(即风控策略)，从而解决了小样本问题，并且不存在数据偏置的情况，在第二阶段，以上一阶段的模型输出作为初始风险信息，继续训练模型，由于两个阶段是分开的，因此，如果风控策略发生改变，只需要调整第一阶段的模型即可，从而使得最终的模型融合引入了专家知识，解决正样本较少的问题，同时训练模型的样本数据是无偏置的，有利于模型的泛化性。

实施例二

如图3所示，本说明书实施例提供一种事件的风险防控方法，该方法的执行主体可以为终端设备或服务器，其中，该终端设备可以如手机、平板电脑等移动终端设备，还可以如笔记本电脑或台式电脑等计算机设备，或者，也可以为IoT设备(具体如智能手表、车载设备等)等，该服务器可以是一个独立的服务器，也可以是由多个不同的服务器构成的服务器集群。本实施例中以服务器作为执行主体进行详细说明，对于执行主体为终端设备的情况，可以基于下述内容执行，在此不再赘述。该方法具体可以包括以下步骤：

在步骤S302中，获取目标事件对应的风控策略，该风控策略包括一个或多个。

在实施中，可以通过多种不同的方式获取目标事件对应的风控策略，例如，针对目标事件，可以由一个或多个专家根据实际情况设置相应的风控策略，设置完成后，可以将其上传至目标事件对应的风控策略的集合中，从而获取到目标事件对应的风控策略。

此外，上述步骤S302的处理是在构建第一风控模型时执行的，在实际应用中，上述步骤S302的处理可以通过多种方式触发，以下提供一种可选的处理方式，具体可以包括以下内容：当检测到目标事件对应的风控策略发生变化时，获取目标事件对应的风控策略。

在实施中，可以定时或不定时的检测目标事件对应的风控策略，如果检测到风控策略增加或某风控策略的内容发生了修改等变化，则获取目标事件对应的风控策略。

在步骤S304中，基于每个风控策略构建第一风控模型。

其中，第一风控模型基于决策树算法构建。

在实施中，由于风控策略通常由多个不同的条件通过预设的逻辑运算关系组成，风控策略中的每个条件可以包含三个要素，分别为：特征、比较值和逻辑运算符，可以基于风控策略的上述特点，可以基于决策树算法将每个风控策略转换为一棵决策树，这样，多个不同的风控策略可以构建多棵决策树，可以将上述构建的每棵决策树作为第一风控模型，这样，对于目标事件对应的多个风控策略，可以得到多个第一风控模型。

在步骤S306中，获取目标事件对应的事件数据样本。

在实施中，可以通过多种不同的方式获取目标事件对应的事件数据样本，例如，针对目标事件，每当用户触发执行目标事件时，可以存储执行目标事件过程中产生的事件数据，当需要获取事件数据时，可以从存储的上述事件数据中获取预设时间段内产生的事件数据，或者，可以从指定的数据库中获取目标事件的事件数据等，可以将通过上述方式获取的事件数据作为目标事件对应的事件数据样本。

在步骤S308中，将上述事件数据样本输入到第一风控模型中，并分别以是否为存在风险、是否被风控策略命中和目标事件是否执行失败作为标签信息，得到第一风控模型输出的针对每个标签信息的样本输出结果。

在实施中，针对每个第一风控模型(即每棵决策树)，可以分别以是否为存在风险、是否被风控策略命中和目标事件是否执行失败作为每个事件数据的标签信息，将上述事件数据输入到每棵决策树中，得到每棵决策树中每个叶子节点对应的针对每个标签信息的样本输出结果，这样，每个叶子节点均可以得到3个标签信息的样本输出结果，上述输出结果即为第一风控模型输出的针对每个标签信息的样本输出结果。

在步骤S310中，基于每个标签信息对应的权重，对样本输出结果进行加权计算，得到第一风控模型对应的样本风险检测结果，并对多个风险检测结果进行聚合处理，得到该事件数据样本对应的初始风险信息。

在实施中，针对任意一棵决策树中的任一叶子节点，可以通过下述公式

将每个叶子节点的3个标签信息的样本输出结果进行加权计算，得到第一风控模型对应的样本风险检测结果，其中，υ_ij表示由第i个风控策略转换的决策树中第j个叶子节点对应的样本风险检测结果，

表示以是否被风控策略命中为标签信息，由第i个风控策略转换的决策树中第j个叶子节点对应的样本风险检测结果，

表示以目标事件是否执行失败为标签信息，由第i个风控策略转换的决策树中第j个叶子节点对应的样本风险检测结果，

表示以是否为存在风险为标签信息，由第i个风控策略转换的决策树中第j个叶子节点对应的样本风险检测结果，α、β、γ分别为以是否被风控策略命中、目标事件是否执行失败和是否为存在风险的标签信息对应的权重。

通过上述处理，对于某一个事件，可以通过m(m大于或等于1)棵决策树进行预测，得到m个样本风险检测结果，然后，可以对多个风险检测结果进行聚合处理，具体地，可以对多个风险检测结果进行如下处理：取平均值、取最大值、取中位数等聚合处理，得到一个输出结果，可以将该输出结果作为该事件数据样本对应的初始风险信息。

在步骤S312中，基于该事件数据样本对应的初始风险信息和该事件数据样本中携带有标签信息为存在风险或标签信息为不存在风险的数据样本对第二风控模型进行训练，得到训练后的第二风控模型。

其中，第二风控模型可以基于提升算法Boosting构建，具体如，可以基于梯度提升决策树算法(即GBDT(Gradient Boosting Decision Tree)算法)构建等。

在实施中，第一风控模型主要是利用了风控策略，然而，风控策略具有覆盖低但是精准率高的特点，不能覆盖全部的事件数据样本，因此，需要利用数据来驱动，去继续学习未被风控策略命中的事件数据样本，这样就需要训练第二风控模型，基于此，可以以上述风控策略阶段(或者称为知识融合阶段)的输出结果作为事件数据样本的初始风险信息(具体可以是初始风险值)，使用以存在风险或不存在风险为标签信息的数据样本，对梯度提升决策树算法构建的第二风控模型的模型架构继续训练，产生第二阶段的模型，即训练后的第二风控模型。

需要说明的是，在对第二风控模型进行训练的过程中，基于预设的节点分裂增益确定第二风控模型的最佳分裂点，其中，节点分裂增益通过第二风控模型中左子树叶子节点的事件数据样本一阶梯度的累加、第二风控模型中左子树叶子节点的事件数据样本二阶梯度的累加、第二风控模型中右子树叶子节点的事件数据样本一阶梯度的累加、第二风控模型中右子树叶子节点的事件数据样本二阶梯度的累加、用于调节被风控策略命中对叶子节点的分裂的影响的超参数、正则化系数、第二风控模型中左子树叶子节点中被风控策略命中的事件数据样本数量、第二风控模型中左子树叶子节点中事件数据样本的数量、第二风控模型中右子树叶子节点中被风控策略命中的事件数据样本数量、第二风控模型中右子树叶子节点中事件数据样本的数量、第二风控模型中需要分裂的节点的事件数据样本一阶导数的累加、第二风控模型中需要分裂的节点的事件数据样本二阶导数的累加确定。

在实施中，在训练第二风控模型的过程中，与通常的基于梯度提升决策树算法构建模型，并训练模型的处理过程存在以下不同：一是需要第一风控模型对应的初始风险信息作为初始风险值，二是在计算第二风控模型的梯度提升决策树的最佳分裂点时需要考虑被风控策略命中的影响，以XGBoost算法构建第二风控模型为例，结点分裂增益可以为：

其中，G_L表示左子树叶子节点的事件数据样本一阶梯度的累加，H_L表示左子树叶子节点的事件数据样本二阶梯度的累加，G_R表示右子树叶子节点的事件数据样本一阶梯度的累加，H_R表示右子树叶子节点的事件数据样本二阶梯度的累加，α为超参数，用于调节被风控策略命中对叶子节点的分裂的影响，λ为正则化系数，

表示左子树叶子节点中被风控策略命中的事件数据样本数量，C_L表示左子树叶子节点中事件数据样本的数量，

表示右子树叶子节点中被风控策略命中的事件数据样本数量，C_R表示右子树叶子节点中事件数据样本的数量，G表示需要分裂的节点的事件数据样本一阶导数的累加，H表示需要分裂的节点的事件数据样本二阶导数的累加。

相比通常的XGBoost算法的增益函数，增加了最后一项，这一项的主要目的是，如果叶子节点中被风控策略命中的事件数据样本比例较多，则叶子节点的输出值应该尽可能大于0,这样，在模型训练过程中就保留了风控策略。而如果叶子节点中被风控策略命中事件数据样本的比例为0，则最后一项也为0，即叶子节点的输出值完全是基于事件数据样本的。

基于上述处理，可以得到第一风控模型和第二风控模型，当获取到目标事件的待处理的事件数据后，可以基于第一风控模型和第二风控模型对目标事件进行风险检测，具体可以包括以下步骤S314～步骤S322的处理。

在步骤S314中，获取目标事件的待处理的事件数据。

在步骤S316中，将上述事件数据输入到目标事件对应的第一风控模型中，并分别以是否为存在风险、是否被风控策略命中和目标事件是否执行失败作为标签信息，得到第一风控模型输出的针对每个标签信息的输出结果。

在步骤S318中，基于每个标签信息对应的权重，对第一风控模型输出的针对每个标签信息的输出结果进行加权计算，得到第一风控模型对应的风险检测结果。

在步骤S320中，对多个风险检测结果进行聚合处理，得到聚合结果，将聚合结果确定为事件数据对应的初始风险信息。

在步骤S322中，将上述事件数据对应的初始风险信息和该事件数据输入到目标事件对应的第二风控模型中，得到该事件数据对应的风险信息。

实施例三

以上为本说明书实施例提供的事件的风险防控方法，基于同样的思路，本说明书实施例还提供一种事件的风险防控装置，如图4所示。

该事件的风险防控装置包括：数据获取模块401、第一风险检测模块402和风险确定模块403，其中：

数据获取模块401，获取目标事件的待处理的事件数据；

第一风险检测模块402，基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，所述第一风控模型是由所述目标事件对应的风控策略构建的模型；

风险确定模块403，基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，并将所述事件数据对应的初始风险信息和所述事件数据输入到所述目标事件对应的第二风控模型中，得到所述事件数据对应的风险信息，所述第二风控模型是通过所述目标事件对应的事件数据样本进行模型训练得到的模型。

本说明书实施例中，所述第一风控模型基于决策树算法构建，所述第二风控模型基于提升算法Boosting构建。

本说明书实施例中，所述第一风险检测模块402，包括：

结果输出单元，将所述事件数据输入到所述目标事件对应的第一风控模型中，并分别以是否为存在风险、是否被风控策略命中和所述目标事件是否执行失败作为标签信息，得到所述第一风控模型输出的针对每个所述标签信息的输出结果；

风险检测单元，基于每个所述标签信息对应的权重，对所述第一风控模型输出的针对每个所述标签信息的输出结果进行加权计算，得到所述第一风控模型对应的风险检测结果。

本说明书实施例中，所述目标事件对应的风控策略包括多个，所述第一风控模型包括多个，所述风险确定模块，对多个所述风险检测结果进行聚合处理，得到聚合结果，将所述聚合结果确定为所述事件数据对应的初始风险信息。

本说明书实施例中，所述装置还包括：

策略获取模块，获取所述目标事件对应的风控策略，所述风控策略包括一个或多个；

第一模型构建模块，基于每个所述风控策略构建所述第一风控模型。

本说明书实施例中，所述策略获取模块，当检测到所述目标事件对应的风控策略发生变化时，获取所述目标事件对应的风控策略。

本说明书实施例中，所述装置还包括：

样本获取模块，获取所述目标事件对应的事件数据样本；

样本输出结果确定模块，将所述事件数据样本输入到所述第一风控模型中，并分别以是否为存在风险、是否被风控策略命中和所述目标事件是否执行失败作为标签信息，得到所述第一风控模型输出的针对每个所述标签信息的样本输出结果；

初始风险信息确定模块，基于每个所述标签信息对应的权重，对所述样本输出结果进行加权计算，得到所述第一风控模型对应的样本风险检测结果，并对多个所述风险检测结果进行聚合处理，得到所述事件数据样本对应的初始风险信息；

模型训练模块，基于所述事件数据样本对应的初始风险信息和所述事件数据样本中携带有标签信息为存在风险或标签信息为不存在风险的数据样本对所述第二风控模型进行训练，得到训练后的所述第二风控模型。

本说明书实施例中，所述装置还包括：

分裂点确定模块，在对所述第二风控模型进行训练的过程中，基于预设的节点分裂增益确定所述第二风控模型的最佳分裂点，其中，节点分裂增益通过所述第二风控模型中左子树叶子节点的事件数据样本一阶梯度的累加、所述第二风控模型中左子树叶子节点的事件数据样本二阶梯度的累加、所述第二风控模型中右子树叶子节点的事件数据样本一阶梯度的累加、所述第二风控模型中右子树叶子节点的事件数据样本二阶梯度的累加、用于调节被风控策略命中对叶子节点的分裂的影响的超参数、正则化系数、所述第二风控模型中左子树叶子节点中被风控策略命中的事件数据样本数量、所述第二风控模型中左子树叶子节点中事件数据样本的数量、所述第二风控模型中右子树叶子节点中被风控策略命中的事件数据样本数量、所述第二风控模型中右子树叶子节点中事件数据样本的数量、所述第二风控模型中需要分裂的节点的事件数据样本一阶导数的累加、所述第二风控模型中需要分裂的节点的事件数据样本二阶导数的累加确定。

本说明书实施例提供一种事件的风险防控装置，通过获取目标事件的待处理的事件数据，然后，基于该事件数据和目标事件对应的第一风控模型，确定第一风控模型对应的风险检测结果，其中，第一风控模型是由目标事件对应的风控策略构建的模型，最终，可以基于第一风控模型对应的风险检测结果确定该事件数据对应的初始风险信息，并将该事件数据对应的初始风险信息和该事件数据输入到目标事件对应的第二风控模型中，得到该事件数据对应的风险信息，第二风控模型是通过目标事件对应的事件数据样本进行模型训练得到的模型，这样，利用两阶段的过程，分别利用风控策略和风控模型(包括第一风控模型和第二风控模型)，最终形成一个统一的模型，在第一阶段，利用了专家知识(即风控策略)，从而解决了小样本问题，并且不存在数据偏置的情况，在第二阶段，以上一阶段的模型输出作为初始风险信息，继续训练模型，由于两个阶段是分开的，因此，如果风控策略发生改变，只需要调整第一阶段的模型即可，从而使得最终的模型融合引入了专家知识，解决正样本较少的问题，同时训练模型的样本数据是无偏置的，有利于模型的泛化性。

实施例四

以上为本说明书实施例提供的事件的风险防控装置，基于同样的思路，本说明书实施例还提供一种事件的风险防控设备，如图5所示。

所述事件的风险防控设备可以为上述实施例提供终端设备或服务器等。

事件的风险防控设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器501和存储器502，存储器502中可以存储有一个或一个以上存储应用程序或数据。其中，存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括对事件的风险防控设备中的一系列计算机可执行指令。更进一步地，处理器501可以设置为与存储器502通信，在事件的风险防控设备上执行存储器502中的一系列计算机可执行指令。事件的风险防控设备还可以包括一个或一个以上电源503，一个或一个以上有线或无线网络接口504，一个或一个以上输入输出接口505，一个或一个以上键盘506。

具体在本实施例中，事件的风险防控设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对事件的风险防控设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

获取目标事件的待处理的事件数据；

基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，所述第一风控模型是由所述目标事件对应的风控策略构建的模型；

基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，并将所述事件数据对应的初始风险信息和所述事件数据输入到所述目标事件对应的第二风控模型中，得到所述事件数据对应的风险信息，所述第二风控模型是通过所述目标事件对应的事件数据样本进行模型训练得到的模型。

本说明书实施例中，所述基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，包括：

将所述事件数据输入到所述目标事件对应的第一风控模型中，并分别以是否为存在风险、是否被风控策略命中和所述目标事件是否执行失败作为标签信息，得到所述第一风控模型输出的针对每个所述标签信息的输出结果；

基于每个所述标签信息对应的权重，对所述第一风控模型输出的针对每个所述标签信息的输出结果进行加权计算，得到所述第一风控模型对应的风险检测结果。

本说明书实施例中，所述目标事件对应的风控策略包括多个，所述第一风控模型包括多个，所述基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，包括：

对多个所述风险检测结果进行聚合处理，得到聚合结果，将所述聚合结果确定为所述事件数据对应的初始风险信息。

本说明书实施例中，还包括：

获取所述目标事件对应的风控策略，所述风控策略包括一个或多个；

基于每个所述风控策略构建所述第一风控模型。

本说明书实施例中，所述获取所述目标事件对应的风控策略，包括：

当检测到所述目标事件对应的风控策略发生变化时，获取所述目标事件对应的风控策略。

本说明书实施例中，还包括：

获取所述目标事件对应的事件数据样本；

将所述事件数据样本输入到所述第一风控模型中，并分别以是否为存在风险、是否被风控策略命中和所述目标事件是否执行失败作为标签信息，得到所述第一风控模型输出的针对每个所述标签信息的样本输出结果；

基于每个所述标签信息对应的权重，对所述样本输出结果进行加权计算，得到所述第一风控模型对应的样本风险检测结果，并对多个所述风险检测结果进行聚合处理，得到所述事件数据样本对应的初始风险信息；

基于所述事件数据样本对应的初始风险信息和所述事件数据样本中携带有标签信息为存在风险或标签信息为不存在风险的数据样本对所述第二风控模型进行训练，得到训练后的所述第二风控模型。

本说明书实施例中，还包括：

在对所述第二风控模型进行训练的过程中，基于预设的节点分裂增益确定所述第二风控模型的最佳分裂点，其中，节点分裂增益通过所述第二风控模型中左子树叶子节点的事件数据样本一阶梯度的累加、所述第二风控模型中左子树叶子节点的事件数据样本二阶梯度的累加、所述第二风控模型中右子树叶子节点的事件数据样本一阶梯度的累加、所述第二风控模型中右子树叶子节点的事件数据样本二阶梯度的累加、用于调节被风控策略命中对叶子节点的分裂的影响的超参数、正则化系数、所述第二风控模型中左子树叶子节点中被风控策略命中的事件数据样本数量、所述第二风控模型中左子树叶子节点中事件数据样本的数量、所述第二风控模型中右子树叶子节点中被风控策略命中的事件数据样本数量、所述第二风控模型中右子树叶子节点中事件数据样本的数量、所述第二风控模型中需要分裂的节点的事件数据样本一阶导数的累加、所述第二风控模型中需要分裂的节点的事件数据样本二阶导数的累加确定。

本说明书实施例提供一种事件的风险防控设备，通过获取目标事件的待处理的事件数据，然后，基于该事件数据和目标事件对应的第一风控模型，确定第一风控模型对应的风险检测结果，其中，第一风控模型是由目标事件对应的风控策略构建的模型，最终，可以基于第一风控模型对应的风险检测结果确定该事件数据对应的初始风险信息，并将该事件数据对应的初始风险信息和该事件数据输入到目标事件对应的第二风控模型中，得到该事件数据对应的风险信息，第二风控模型是通过目标事件对应的事件数据样本进行模型训练得到的模型，这样，利用两阶段的过程，分别利用风控策略和风控模型(包括第一风控模型和第二风控模型)，最终形成一个统一的模型，在第一阶段，利用了专家知识(即风控策略)，从而解决了小样本问题，并且不存在数据偏置的情况，在第二阶段，以上一阶段的模型输出作为初始风险信息，继续训练模型，由于两个阶段是分开的，因此，如果风控策略发生改变，只需要调整第一阶段的模型即可，从而使得最终的模型融合引入了专家知识，解决正样本较少的问题，同时训练模型的样本数据是无偏置的，有利于模型的泛化性。

实施例五

进一步地，基于上述图1到图3所示的方法，本说明书一个或多个实施例还提供了一种存储介质，用于存储计算机可执行指令信息，一种具体的实施例中，该存储介质可以为U盘、光盘、硬盘等，该存储介质存储的计算机可执行指令信息在被处理器执行时，能实现以下流程：

获取目标事件的待处理的事件数据；

本说明书实施例中，还包括：

基于每个所述风控策略构建所述第一风控模型。

本说明书实施例中，还包括：

获取所述目标事件对应的事件数据样本；

本说明书实施例中，还包括：

本说明书实施例提供一种存储介质，通过获取目标事件的待处理的事件数据，然后，基于该事件数据和目标事件对应的第一风控模型，确定第一风控模型对应的风险检测结果，其中，第一风控模型是由目标事件对应的风控策略构建的模型，最终，可以基于第一风控模型对应的风险检测结果确定该事件数据对应的初始风险信息，并将该事件数据对应的初始风险信息和该事件数据输入到目标事件对应的第二风控模型中，得到该事件数据对应的风险信息，第二风控模型是通过目标事件对应的事件数据样本进行模型训练得到的模型，这样，利用两阶段的过程，分别利用风控策略和风控模型(包括第一风控模型和第二风控模型)，最终形成一个统一的模型，在第一阶段，利用了专家知识(即风控策略)，从而解决了小样本问题，并且不存在数据偏置的情况，在第二阶段，以上一阶段的模型输出作为初始风险信息，继续训练模型，由于两个阶段是分开的，因此，如果风控策略发生改变，只需要调整第一阶段的模型即可，从而使得最终的模型融合引入了专家知识，解决正样本较少的问题，同时训练模型的样本数据是无偏置的，有利于模型的泛化性。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程欺诈案例的串并设备的处理器以产生一个机器，使得通过计算机或其他可编程欺诈案例的串并设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程欺诈案例的串并设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程欺诈案例的串并设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种事件的风险防控方法，所述方法包括：

获取目标事件的待处理的事件数据；

2.根据权利要求1所述的方法，所述第一风控模型基于决策树算法构建，所述第二风控模型基于提升算法Boosting构建。

3.根据权利要求2所述的方法，所述基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，包括：

4.根据权利要求1-3中任一项所述的方法，所述目标事件对应的风控策略包括多个，所述第一风控模型包括多个，所述基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，包括：

5.根据权利要求2所述的方法，所述方法还包括：

基于每个所述风控策略构建所述第一风控模型。

6.根据权利要求5所述的方法，所述获取所述目标事件对应的风控策略，包括：

7.根据权利要求5或6所述的方法，所述方法还包括：

获取所述目标事件对应的事件数据样本；

8.根据权利要求7所述的方法，所述方法还包括：

9.一种事件的风险防控装置，所述装置包括：

数据获取模块，获取目标事件的待处理的事件数据；

第一风险检测模块，基于所述事件数据和所述目标事件对应的第一风控模型，确定所述第一风控模型对应的风险检测结果，所述第一风控模型是由所述目标事件对应的风控策略构建的模型；

风险确定模块，基于所述第一风控模型对应的风险检测结果确定所述事件数据对应的初始风险信息，并将所述事件数据对应的初始风险信息和所述事件数据输入到所述目标事件对应的第二风控模型中，得到所述事件数据对应的风险信息，所述第二风控模型是通过所述目标事件对应的事件数据样本进行模型训练得到的模型。

10.一种事件的风险防控设备，所述事件的风险防控设备包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：

获取目标事件的待处理的事件数据；

11.一种存储介质，所述存储介质用于存储计算机可执行指令，所述可执行指令在被处理器执行时实现以下流程：

获取目标事件的待处理的事件数据；