CN113313575B

CN113313575B - 一种风险识别模型的确定方法及装置

Info

Publication number: CN113313575B
Application number: CN202110640452.6A
Authority: CN
Inventors: 李志峰; 孟昌华; 崔世文; 王维强
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2021-06-08
Filing date: 2021-06-08
Publication date: 2022-06-03
Anticipated expiration: 2041-06-08
Also published as: CN113313575A

Abstract

本说明书一个或多个实施例提供了一种风险识别模型的确定方法及装置，其中，该方法包括：获取目标业务对应的模型训练样本数据和针对目标业务所配置的风控策略信息；基于该模型训练样本数据和用于风险识别的分类模型，对各风控策略信息对应的策略权重进行更新，得到更新后的策略权重；基于该模型训练样本数据和更新后的策略权重，对该分类模型的模型参数进行更新，得到更新后的分类模型；若更新后的分类模型满足预设模型优化终止条件，则将该更新后的分类模型确定为训练后的风险识别模型；若更新后的分类模型不满足预设模型优化终止条件，则将该分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型。

Description

一种风险识别模型的确定方法及装置

技术领域

本文件涉及互联网技术领域，尤其涉及一种风险识别模型的确定方法及装置。

背景技术

目前，随着互联网时代的到来，互联网在人们日常的学习、工作和生活中得到广泛的应用。人们日常的各种事务都可以通过互联网来处理和呈现。同时，可疑分子为了谋取私利，常常通过非法手段通过互联网发起欺诈交易等，因此，需要对目标业务下的业务行为事件进行风险识别，进而对风险事件进行管控。

当前，主要通过基于模型训练样本对风险识别模型进行训练，再利用风险识别模型对当前的业务行为事件进行风险识别，进而对识别出存在风险的业务行为事件进行管控；然而，由于模型训练样本有限，以及大量可能为风险事件的业务行为事件被管控策略过滤掉，从而导致模型训练样本存在偏置，导致当前训练得到的风险识别模型的准确度低，为此，需要提供一种准确度更高的风险识别模型。

发明内容

本说明书一个或多个实施例的目的是提供一种风险识别模型的确定方法。该风险识别模型的确定方法包括：

获取目标业务对应的模型训练样本数据和针对所述目标业务所配置的风控策略信息；

基于所述模型训练样本数据和用于风险识别的分类模型，对各所述风控策略信息对应的策略权重进行更新，得到更新后的策略权重；

基于所述模型训练样本数据和更新后的所述策略权重，对所述分类模型的模型参数进行更新，得到更新后的所述分类模型；

若更新后的所述分类模型满足预设模型优化终止条件，则将所述分类模型确定为训练后的风险识别模型；

若更新后的所述分类模型不满足预设模型优化终止条件，则将所述分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型。

本说明书一个或多个实施例的目的是提供一种风险识别模型的确定装置。该风险识别模型的确定装置包括：

信息获取模块，其获取目标业务对应的模型训练样本数据和针对所述目标业务所配置的风控策略信息；

策略权重更新模块，其基于所述模型训练样本数据和用于风险识别的分类模型，对各所述风控策略信息对应的策略权重进行更新，得到更新后的策略权重；

模型参数更新模块，其基于所述模型训练样本数据和更新后的所述策略权重，对所述分类模型的模型参数进行更新，得到更新后的所述分类模型；

第一确定模块，其若更新后的所述分类模型满足预设模型优化终止条件，则将所述分类模型确定为训练后的风险识别模型；

第二确定模块，其若更新后的所述分类模型不满足预设模型优化终止条件，则将所述分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型。

本说明书一个或多个实施例的目的是提供一种风险识别模型的确定设备，包括：处理器；以及被安排成存储计算机可执行指令的存储器。

所述计算机可执行指令在被执行时使所述处理器获取目标业务对应的模型训练样本数据和针对所述目标业务所配置的风控策略信息；

本说明书一个或多个实施例的目的是提供一种存储介质，用于存储计算机可执行指令。所述可执行指令在被处理器执行时获取目标业务对应的模型训练样本数据和针对所述目标业务所配置的风控策略信息；

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书一个或多个中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书一个或多个实施例提供的风险识别模型的确定方法的第一种流程示意图；

图2为本说明书一个或多个实施例提供的风险识别模型的确定方法的第二种流程示意图；

图3为本说明书一个或多个实施例提供的风险识别模型的确定方法的第三种流程示意图；

图4为本说明书一个或多个实施例提供的风险识别模型的确定方法的第四种流程示意图；

图5为本说明书一个或多个实施例提供的风险识别模型的确定方法的第五种流程示意图；

图6为本说明书一个或多个实施例提供的风险识别模型的确定装置的模块组成示意图；

图7为本说明书一个或多个实施例提供的风险识别模型的确定设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书一个或多个中的技术方案，下面将结合本说明书一个或多个实施例中的附图，对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一个或多个一部分实施例，而不是全部的实施例。基于本说明书一个或多个中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本文件的保护范围。

需要说明的是，在不冲突的情况下，本说明书中的一个或多个实施例以及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本说明书一个或多个实施例。

本说明书一个或多个实施例提供了一种风险识别模型的确定方法及装置，在对风险识别模型进行训练的过程中，不仅使用带标签训练样本，还引入风险识别策略，并且基于各风险识别策略的最新的策略权重，对风险识别模型进行训练，得到更新后的风险识别模型，再基于更新后的风险识别模型的输出结果，对风险识别模型的策略权重进行更新，得到更新后的策略权重，即对模型参数和策略权重进行反复迭代更新，并且对风险识别模型的模型参数进行更新时参考上一轮更新后的策略权重，以及对风险识别策略的策略权重进行更新时参考上一轮更新后的风险识别模型，直到训练后的风险识别模型满足预设模型优化终止条件，这样能够同时兼顾风险识别模型的识别准确度和风险事件的覆盖率，从而提高风险事件的拦截准确度，进而实现不仅能够确保用户的交易安全性，还能够提升用户使用体验。

图1为本说明书一个或多个实施例提供的风险识别模型的确定方法的第一种流程示意图，图1中的方法能够由本地服务器或者云端服务器执行，如图1所示，该方法至少包括以下步骤：

S102，获取目标业务对应的模型训练样本数据和针对目标业务所配置的风控策略信息；

其中，上述模型训练样本数据至少包括有标签样本数据，还可以包括无标签训练样本数据，该有标签样本数据可以是基于预设风险管控方式确定为通过，但被投诉的业务行为数据(即黑样本数据)，还可以是基于预设风险管控方式确定为通过，且未被投诉的业务行为数据(即白样本数据)；该无标签训练样本数据还可以称为未知标签训练样本数据，即通过预设风险管控方式所拦截的业务行为数据，具体的，由于该业务行为数据对应的业务行为事件已被拦截处理，但可能存在误拦截的情况，因此，无法获知该业务行为事件是否为风险事件，从而该业务行为事件对应的业务行为数据的标签为未知；其中，上述预设风险管控方式可以是基于风险识别模型的管控方式、基于风控策略信息的管控方式中至少一项。

其中，上述目标业务包括：线上交易业务、或者线下支付业务，例如，可以是境内转账业务，也可以是境外转账业务，又可以是跨境支付业务，上述风控策略信息包括：风控专家制定的风险管控规则，每个风险管控规则可以包括多个子风险管控规则，例如，单笔交易金额大于X，预设时间段内交易次数大于N，账号当前登录地址为非常用地址等等。

S104，基于上述模型训练样本数据和用于风险识别的分类模型，对各风控策略信息对应的策略权重进行更新，得到更新后的策略权重；

其中，上述分类模型可以是提升树模型，也可以是二分类模型、或者其他多分类模型；针对先策略权重训练再模型参数训练且首轮对策略权重进行更新的情况，上述用于风险识别的分类模型可以是初始分类模型，即模型参数的取值为迭代训练前的初始值，针对非首轮对策略权重进行更新、或者先模型参数训练再策略权重训练且首轮对策略权重进行更新的情况，上述用于风险识别的分类模型为上一轮基于策略权重对分类模型进行模型参数更新得到的分类模型，即模型参数的取值为经过至少一轮迭代训练后的目标值。

S106，基于上述模型训练样本数据和更新后的策略权重，对上述分类模型的模型参数进行更新，得到更新后的分类模型；

其中，针对先模型参数训练再策略权重训练且首轮对模型参数进行更新的情况，上述策略权重可以是初始策略权重，即策略权重的取值为迭代训练前的初始值，针对非首轮对模型参数进行更新、或者先策略权重训练再模型参数训练且首轮对分类模型的模型参数进行更新的情况，上述策略权重为上一轮基于模型参数进行策略权重更新得到的策略权重，即策略权重的取值为经过至少一轮迭代训练后的目标值。

具体的，每次基于更新后的分类模型对策略权重进行更新之后，再基于更新后的策略权重，对分类模型的模型参数进行更新，依次类推，经过多轮策略权重和模型参数的迭代训练后，得到训练好的分类模型，并将该训练好的分类模型作为风险识别模型；其中，由于在风险识别模型的确定过程，不仅考虑有标签样本数据，还考虑了风控策略信息，从而使得未知标签样本数据也能够作为训练样本数据集，进而消除了训练样本数据集合的偏置问题，因此，经过多轮策略权重和模型参数的迭代训练得到的训练好的分类模型既能够符合模型训练样本数据的真实标签，又能够符合风控策略信息的约束条件(即在各模型训练样本上的风险概率符合风控策略信息的约束)。

在具体实施时，可以采用总目标函数的方式，对策略权重和模型参数进行迭代训练，得到训练好的风险识别模型，其中，该总目标函数包括与模型训练样本相关的第一损失函数、以及与风控策略信息相关的第二目标函数；具体的，针对策略权重的训练过程中，将模型参数作为已知参数(即基于上一轮更新后的分类模型的模型参数所确定)且策略权重作为变量，对总目标函数取最小化，得到更新后的策略权重；对应的，针对模型参数的训练过程中，将策略权重作为已知参数(即基于上一轮更新后的各风控策略信息的策略权重所确定)且模型参数作为变量，对总目标函数取取最小化，得到更新后的模型参数，依次类推，经过多轮模型参数和策略权重的迭代训练，得到训练好的分类模型，此时该训练好的分类模型既能够符合模型训练样本数据的真实标签，又能够符合风控策略信息的约束条件。

在具体实施时，还可以采用多目标函数的方式，对策略权重和模型参数进行迭代训练，得到训练好的风险识别模型；具体的，将模型训练样本数据的真实标签作为一个目标，也将风控策略信息是否命中模型训练样本数据作为另一个目标，利用多目标学习方法，对分类模型进行多目标学习，得到训练好的分类模型，即使得该训练好的分类模型既能够符合模型训练样本数据的真实标签，又能够符合风控策略信息的约束条件。

S108，判断更新后的分类模型是否满足预设模型优化终止条件；其中，该预设模型优化终止条件可以包括：分类模型满足预设收敛条件、预设模型评估参数的参数值大于预设阈值中至少一项；

具体的，在每次基于风控策略信息的最新的策略权重对模型参数进行训练更新后，先判断模型参数更新后的分类模型是否达标，若达标，则停止策略权重和模型参数的迭代训练，若不达标，则继续执行下一轮策略权重和模型参数的迭代训练。

若判断结果为是，则执行S110，将更新后的分类模型确定为训练后的风险识别模型；

具体的，针对更新后的分类模型满足预设模型优化终止条件的情况，说明该分类模型的识别准确度已达标，能够用于风险识别，因此，停止策略权重和模型参数的迭代训练，并将代入最新的模型参数的分类模型作为对实时产生的业务行为数据进行风险识别，进而基于风险识别结果对当前业务行为事件进行相应的管控。

若判断结果为否，则将更新后的分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型，并继续执行上述S104。

具体的，针对更新后的分类模型不满足预设模型优化终止条件的情况，说明该分类模型的识别准确度未达标，因此，需要继续触发下一轮策略权重的更新过程，进而再基于更新后的策略权重，对分类模型的模型参数进行更新，直到更新后的分类模型满足预设模型优化终止条件。

本说明书一个或多个实施例中，在对风险识别模型进行训练的过程中，不仅使用带标签训练样本，还引入风险识别策略，并且基于各风险识别策略的最新的策略权重，对风险识别模型进行训练，得到更新后的风险识别模型，再基于更新后的风险识别模型的输出结果，对风险识别模型的策略权重进行更新，得到更新后的策略权重，即对模型参数和策略权重进行反复迭代更新，并且对风险识别模型的模型参数进行更新时参考上一轮更新后的策略权重，以及对风险识别策略的策略权重进行更新时参考上一轮更新后的风险识别模型，直到训练后的风险识别模型满足预设模型优化终止条件，这样能够同时兼顾风险识别模型的识别准确度和风险事件的覆盖率，从而提高风险事件的拦截准确度，进而实现不仅能够确保用户的交易安全性，还能够提升用户使用体验。

其中，针对基于更新后的风险识别模型的输出结果，对风险识别模型的策略权重进行更新，得到更新后的策略权重的过程，如图2所示，上述S104，基于上述模型训练样本数据和用于风险识别的分类模型，对各风控策略信息对应的策略权重进行更新，得到更新后的策略权重，具体包括：

S1042，针对每个模型训练样本数据，利用用于风险识别的分类模型，对该模型训练样本数据进行风险识别，得到相应的风险识别结果；

其中，上述风险识别结果可以是用于表征模型训练样本数据存在风险的概率值，也可以是用于表征模型训练样本数据是否存在风险的二分类结果，例如，若模型训练样本数据为风险数据，则风险识别结果为1，否则为0，还可以是用于表征模型训练样本数据存在风险的打分结果；具体的，将模型训练样本数据输入至用于风险识别的分类模型，该分类模型的输出即为该模型训练样本数据对应的风险识别结果。

S1044，针对每个模型训练样本数据，基于各风控策略信息，确定用于表征该模型训练样本数据是否命中该风控策略信息的策略命中特征向量；

其中，每个风控策略信息可以包括：风控专家制定的风险管控规则，每个风险管控规则可以包括多个子风险管控规则，例如，单笔交易金额大于X，预设时间段内交易次数大于N，账号当前登录地址为非常用地址等等；上述策略命中特征向量也可以称为模型训练样本数据对应的策略命中信息，具体的，若策略命中特征向量为M维特征向量，每个维度对应于一个子风险管控规则，针对每个维度，若模型训练样本数据中对应的属性信息与该维度下的子风险管控规则相匹配，则策略命中特征向量中该维度下对应的取值为1，否则为 0，例如，某一维度下的子风险管控规则为单笔交易金额大于X，若模型训练样本数据中用于表征单笔交易金额的属性信息为X+5，则策略命中特征向量中与单笔交易金额大于X的子风险管控规则对应的取值为1；又如，某一维度下的子风险管控规则为账号当前登录地址为非常用地址，若模型训练样本数据中用于表征账号当前登录地址是否为非常有地址的属性信息为否，则策略命中特征向量中与账号当前登录地址为非常用地址的子风险管控规则对应的取值为0，即将模型训练样本数据中的各属性信息与对应的子风险管控规则进行比对，若匹配，则对应的特征值为1，若不匹配，则对应的特征值为0，得到一个M维特征向量，即策略命中特征向量。

S1046，基于上述风险识别结果、策略命中特征向量、以及总目标函数，对各风控策略信息对应的策略权重进行更新，得到更新后的策略权重。

其中，上述总目标函数包括：分类模型在有标签样本数据上的第一损失函数、以及风控策略信息对应的第二损失函数；该第一损失函数仅与模型参数有关，即第一损失函数与策略权重无关，因此，以策略权重作为自变量，对总目标函数进行最小化处理时，对第一损失函数进行求导等于0；该第二损失函数是与风险识别结果、策略命中特征向量、策略权重有关的函数，因此，以策略权重作为自变量，对总目标函数进行最小化处理时，即为对第二损失函数进行求导，得到策略权重的取值，即将该策略权重的取值确定为更新后的策略权重。

在具体实施时，考虑到风控策略信息的个数比较多，如果采用多目标学习方法进行模型训练的话，需要的目标函数的数量也比较大，从而导致增加了多目标学习方法进行模型训练的复杂度，而对于采用总目标函数方式进行模型训练的话，模型训练的目标只有一个，即样本是否为黑样本，学习模型对样本的输出的风险概率，同时，在各模型训练样本生的风险概率符合策略专家制定的风控策略约束，因此，优选地，采用总目标函数的方式，对策略权重和模型参数进行迭代训练，得到训练好的风险识别模型。

具体的，在利用更新后的风险识别模型对模型训练样本数据进行风险识别，并输出相应的风险识别结果后，再基于该风险识别结果对策略权重进行更新，具体的，上述S1046，基于上述风险识别结果、策略命中特征向量、以及总目标函数，对各风控策略信息对应的策略权重进行更新，得到更新后的策略权重，具体包括：

步骤一，基于上述风险识别结果和策略命中特征向量，确定在各模型训练样本下风控策略信息成立的目标概率；

具体的，将风险识别结果和策略命中特征向量代入用于表征在模型训练样本下风控策略信息成立的目标概率的表达式，即可得到各模型训练样本数据对应的目标概率。

步骤二，将各模型训练样本数据对应的目标概率代入总目标函数，得到待优化的总目标函数；其中，上述模型训练样本数据包括：多个有标签样本数据，上述总目标函数包括：用于风险识别的分类模型在该有标签样本数据上的第一损失函数和风控策略信息对应的第二损失函数；

具体的，由于上述第二损失函数为目标概率与策略权重之间的关系表达式，而目标概率又为风险识别结果和策略命中特征向量之间的关系表达式，因此，该第二损失函数是与风险识别结果、策略命中特征向量、策略权重有关的函数，基于此，在具体实施时，可以先针对每个模型训练样本，基于风险识别结果和策略命中特征向量，确定在该模型训练样本下各风控策略信息成立的目标概率；再将该目标概率代入总目标函数，此时总目标函数即为以策略权重为自变量的函数表达式。

步骤三，以策略权重为自变量，对总目标函数中的第二损失函数进行最小化处理，得到更新后的策略权重。

具体的，由于分类模型的模型参数、上述目标概率均已知，因此，固定模型参数(即上一轮更新后的分类模型的模型参数)、以及固定用于表征在各模型训练样本下风控策略信息成立的目标概率，对总目标函数进行最小化处理，此时，第一损失函数为常数，即其导数等于零，并且，第二损失函数中仅有策略权重为未知参数，因此，以策略权重为自变量，将第二损失函数的导数等于零，求解得到更新后的策略权重。

具体的，针对确定用于表征在各模型训练样本下风控策略信息成立的目标概率的过程，可以采用预设分段函数作为目标概率的计算公式，其中，该预设分段函数为风险识别结果和策略命中特征向量之间的关系表达式，基于此，上述步骤一，基于上述风险识别结果和策略命中特征向量，确定在各模型训练样本下风控策略信息成立的目标概率，具体包括：

基于上述风险识别结果、策略命中特征向量、以及预设分段函数，确定在各模型训练样本下风控策略信息成立的目标概率；

其中，上述预设分段函数为

表示在序号为i的模型训练样本数据下序号为j的风控策略信息成立的目标概率，h_ij表示序号为i的模型训练样本数据命中序号为j的风控策略信息的特征值(即对应的策略命中特征向量对应的特征值)，p_i表示用于表征序号为i的模型训练样本数据为风险事件的概率的风险识别结果，例如，p_i可以是用于表征模型训练样本数据i为黑样本的概率。

具体的，针对有标签样本数据中的黑样本而言，p_i＝1，若序号为i的模型训练样本数据命中序号为j的风控策略信息，则h_ij＝1，对应的，

若序号为i的模型训练样本数据未命中序号为j的风控策略信息，则h_ij＝0，对应的，

针对有标签样本数据中的白样本而言，p_i＝0，若序号为i的模型训练样本数据命中序号为j的风控策略信息，则h_ij＝1，对应的，

针对未知标签样本数据而言，若序号为i的模型训练样本数据命中序号为j的风控策略信息，则h_ij＝1，对应的，

在具体实施时，可以采用马尔可夫随机场作为风控策略对分类模型的约束表达式，对应的，上述第二损失函数包括：用于表征策略对模型的约束的马尔可夫随机场概率；还可以采用条件随机场作为风控策略对分类模型的约束表达式，对应的，上述第二损失函数包括：用于表征策略对模型的约束的分布随机场概率。

其中，考虑到马尔可夫随机场就是概率无向图模型，它是一个可以用无向图表示联合概率分布，联合概率分布满足成对马尔可夫性、局部马尔可夫性和全局马尔可夫性这三个中的任意一个，在具体实施时，可以结合实际需要，调整风控策略对分类模型的目标约束程度，并选取与该目标约束程度对应的联合概率分布，即马尔可夫随机场概率对应的联合概率分布类型与策略对模型的目标约束程度相对应，这样能够满足在不同应用场景下，对风控策略对分类模型的约束程度进行动态调整的个性化需求，因此，优选地，采用马尔可夫随机场，作为风控策略对分类模型的约束表达式。

进一步的，上述第二损失函数即为用于表征风控策略对分类模型的约束表达式，其中，可以采用马尔科夫随机场作为风控策略对分类模型的约束表达式，基于此，上述第二损失函数包括：用于表征策略对模型的约束的马尔可夫随机场概率；

对应的，上述步骤三，以策略权重为自变量，对总目标函数中的第二损失函数进行最小化处理，得到更新后的策略权重，具体包括：

以策略权重为自变量，对总目标函数中的马尔可夫随机场概率进行求导处理，得到马尔可夫随机场概率的导数；

基于上述马尔可夫随机场概率的导数，对该马尔可夫随机场概率进行最大化处理，得到更新后的策略权重；

其中，上述总目标函数Loss＝L1(X，Y)+L2(X，Y)，L1(X，Y)表示第一损失函数，L2(X，Y) 表示第二损失函数，L2(X，Y)＝-αlogP，α表示融合系数，P表示马尔可夫随机场概率，

Z表示归一化函数，R表示风控策略信息的数量，N表示模型训练样本数据的数量，w_j表示序号为j的风控策略信息对应的策略权重，

表示在序号为i的模型训练样本数据下序号为j的风控策略信息成立的目标概率。

具体的，上述第一损失函数L1(X，Y)仅与模型参数有关，因此，以策略权重w_j为自变量，对第一损失函数L1(X，Y)进行求导等于0，上述第二损失函数L2(X，Y)是与目标概率

策略权重w_j有关的函数，其中，目标概率

为已知参数，即将风险识别结果p_i和策略命中特征向量h_ij代入上述预设分段函数

即可得到目标概率

因此，以策略权重w_j作为自变量，对总目标函数Loss＝L1(X，Y)+L2(X，Y)进行最小化处理时，即为对第二损失函数L2(X，Y)＝-αlogP进行最小化处理，也即对马尔可夫随机场概率

进行最大化处理，得到更新后的策略权重w_j，具体的，以策略权重w_j作为自变量，对马尔可夫随机场概率P进行求导，并将马尔可夫随机场概率P的导数设置为零，求解得到策略权重w_j。

其中，针对基于各风险识别策略的最新的策略权重，对风险识别模型进行训练，得到更新后的风险识别模型的过程，如图3所示，上述S106，基于上述模型训练样本数据和更新后的策略权重，对上述分类模型的模型参数进行更新，得到更新后的分类模型，具体包括：

S1062，基于上述模型训练样本数据、更新后的策略权重、以及总目标函数，对上述分类模型的模型参数进行更新，得到更新后的分类模型；其中，上述模型训练样本数据包括：多个有标签样本数据，上述总目标函数包括：分类模型在该有标签样本数据上的第一损失函数和风控策略信息对应的第二损失函数。

具体的，上述第一损失函数仅与模型参数有关，即第一损失函数与策略权重无关，上述第二损失函数是与风险识别结果、策略命中特征向量、策略权重有关的函数，其中，风险识别结果是利用最新的分类模型对模型训练样本数据进行风险识别得到的，因此，风险识别结果是与模型参数有关的函数(例如，可以是使用第一损失函数表示，也可以使用第一损失函数的变形式表示)，即第二损失函数是与模型参数、策略命中特征向量、策略权重有关的函数，其中，策略命中特征向量可以利用上述S1044的步骤确定，策略权重是上一轮训练得到的更新后的策略权重，基于此，以模型参数作为自变量，对总目标函数进行最小化处理时，即为对第一损失函数与第二损失函数之和进行求导，得到模型参数的取值，即基于该模型参数的取值得到的分类模型为更新后的分类模型。

具体的，上述S1062，基于上述模型训练样本数据、更新后的策略权重、以及总目标函数，对上述分类模型的模型参数进行更新，得到更新后的分类模型，具体包括：

步骤一，将更新后的策略权重代入总目标函数，得到待优化的总目标函数；

具体的，由于上述第一损失函数与仅与模型参数有关，与策略权重无关，因此，仅需将更新后的策略权重的取值代入第二损失函数，第一损失函数与代入策略权重的第二损失函数之和即为待优化的总目标函数。

具体的，由于上述第二损失函数为目标概率与策略权重之间的关系表达式，而目标概率又为风险识别结果和策略命中特征向量之间的关系表达式，风险识别结果是与模型参数有关的函数，因此，第二损失函数是与模型参数、策略命中特征向量、策略权重有关的函数，基于此，可以先针对每个模型训练样本，利用上述s1044的步骤确定策略命中特征向量，并将该策略命中特征向量、以及上一轮训练得到的更新后的策略权重代入第二损失函数，将第一损失函数与参数代入后的第二损失函数之和即为待优化的总目标函数，此时总目标函数即为以模型参数为自变量的函数表达式。

步骤二，以上述分类模型的模型参数为自变量，对总目标函数进行最小化处理，得到更新后的模型参数；

具体的，由于上述策略命中特征向量、策略权重均已知，因此，固定策略权重(即上一轮更新后的风控策略信息的策略权重)、以及策略命中特征向量，对总目标函数进行最小化处理，此时，第一损失函数为以模型参数为自变量的函数，并且，第二损失函数也是以模型参数为自变量的函数，因此，以模型参数为自变量，将第一损失函数的导数与第二损失函数的导数之和等于零，求解得到更新后的模型参数。

步骤三，基于更新后的模型参数，确定更新后的用于风险识别的分类模型。

具体的，上述步骤二，以上述分类模型的模型参数为自变量，对总目标函数进行最小化处理，得到更新后的模型参数，具体包括：

步骤二a，以上述分类模型的模型参数为自变量，对第一损失函数和第二损失函数进行求导，得到总目标函数的导数；具体的，总目标函数的导数为第一损失函数对模型参数的导数与第二损失函数对模型参数的导数之和。

步骤二b，基于上述总目标函数的导数，对总目标函数进行最小化处理，得到更新后的模型参数；具体的，将第一损失函数对模型参数的导数与第二损失函数对模型参数的导数之和等于零，求解得到更新后的模型参数。

对应的，上述步骤二a，以上述分类模型的模型参数为自变量，对第一损失函数和第二损失函数进行求导，得到总目标函数的导数，具体包括：

步骤二a1，以上述分类模型的模型参数为自变量，对第一损失函数进行求导，得到第一损失函数的导数；以及，

步骤二a2，以上述分类模型的模型参数为自变量，对马尔可夫随机场概率的倒数的log 值进行求导，得到第二损失函数的导数；

步骤二a3，基于上述第一损失函数的导数与第二损失函数的导数之和，确定总目标函数的导数；

表示在序号为i的模型训练样本数据下序号为j的风控策略信息成立的目标概率，该目标概率为预设分段函数

具体的，上述第一损失函数L1(X，Y)仅与模型参数有关，因此，以模型参数为自变量，对第一损失函数L1(X，Y)进行求导，得到第一损失函数的导数，上述第二损失函数L2(X，Y)是与目标概率

策略权重w_j有关的函数，其中，目标概率

为与策略命中特征向量h_ij和风险识别结果p_i有关的预设分段函数，其中策略命中特征向量h_ij为已知参数，风险识别结果p_i是与模型参数有关的函数，模型参数为未知参数，即将策略命中特征向量h_ij代入上述预设分段函数

即可得到以模型参数为自变量的目标概率

并且将参数代入后的目标概率

和策略权重w_j代入马尔可夫随机场概率P，此时，第二损失函数L2(X，Y)＝-αlogP为以模型参数为未知参数的函数，因此，以模型参数作为自变量，对总目标函数Loss＝L1(X，Y)+L2(X，Y)进行最小化处理时，即为将第一损失函数的导数与第二损失函数的导数之和设置为零，求解得到模型参数，其中，对第二损失函数L2(X，Y)＝ -αlogP求导，也即对马尔可夫随机场概率

的倒数的log值求导，具体的，以模型参数作为自变量，对第一损失函数进行求导，得到第一损失函数的导数，以及对第二损失函数中的马尔可夫随机场概率P的倒数的log值求导，得到第二损失函数的导数，并将第一损失函数的导数与第二损失函数的导数之和设置为零，求解得到模型参数。

进一步的，在每次基于风控策略信息的最新的策略权重对模型参数进行训练更新后，先判断模型参数更新后的分类模型是否达标，若达标，则停止策略权重和模型参数的迭代训练，若不达标，则继续执行下一轮策略权重和模型参数的迭代训练，如图4所示，上述S108，判断更新后的分类模型是否满足预设模型优化终止条件，具体包括：

S1082，确定更新后的用于风险识别的分类模型对应的预设模型评估参数的参数值；

S1084，判断上述预设模型评估参数的参数值是否大于预设阈值；其中，该预设模型评估参数可以是分类模型的评价指标auc、ks中至少一项。

若判断结果为是，则确定更新后的分类模型满足预设模型优化终止条件，以及执行上述S110，将更新后的分类模型确定为训练后的风险识别模型；

若判断结果为否，则确定更新后的分类模型不满足预设模型优化终止条件，将最新更新后的分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型，并继续执行上述S104，基于上述模型训练样本数据和用于风险识别的分类模型，对各风控策略信息对应的策略权重进行更新，得到更新后的策略权重。

进一步的，在对策略权重与模型参数执行多轮迭代训练后，得到满足预设模型优化终止条件的分类模型后，利用该分类模型对在执行目标业务时所产生的业务行为事件进行风险识别，进而对识别为异常事件的业务行为进行相应的管控，具体的，如图5所示，在上述S110，将最新更新后的分类模型确定为训练后的风险识别模型之后，还包括：

S112，获取在执行目标业务时所产生的业务行为事件对应的待识别的业务行为数据；

S114，基于上述业务行为数据，并利用训练后的风险识别模型对当前待响应的业务行为事件进行风险识别，得到相应的风险识别结果；

具体的，将业务行为数据中的各个属性信息转换成特征向量，并将该特征向量输入至训练后的风险识别模型，该风险识别模型的输出结果即为针对当前待响应的业务行为事件进行风险识别的结果，其中，该风险识别的结果可以是用于表征业务行为事件存在风险的概率值，也可以是用于表征业务行为事件是否存在风险的二分类结果，例如，若存在风险，则风险识别结果为1，否则为0，还可以是用于表征业务行为事件存在风险的打分结果。

S116，基于上述风险识别结果，对上述业务行为事件进行管控处理；具体的，若风险识别结果为存在风险，则对当前待响应的业务行为事件进行拦截处理、或者进行风险提示处理。

本说明书一个或多个实施例中的风险识别模型的确定方法，在对风险识别模型进行训练的过程中，不仅使用带标签训练样本，还引入风险识别策略，并且基于各风险识别策略的最新的策略权重，对风险识别模型进行训练，得到更新后的风险识别模型，再基于更新后的风险识别模型的输出结果，对风险识别模型的策略权重进行更新，得到更新后的策略权重，即对模型参数和策略权重进行反复迭代更新，并且对风险识别模型的模型参数进行更新时参考上一轮更新后的策略权重，以及对风险识别策略的策略权重进行更新时参考上一轮更新后的风险识别模型，直到训练后的风险识别模型满足预设模型优化终止条件，这样能够同时兼顾风险识别模型的识别准确度和风险事件的覆盖率，从而提高风险事件的拦截准确度，进而实现不仅能够确保用户的交易安全性，还能够提升用户使用体验。

对应上述图2至图5描述的风险识别模型的确定方法，基于相同的技术构思，本说明书一个或多个实施例还提供了一种风险识别模型的确定装置，图6为本说明书一个或多个实施例提供的风险识别模型的确定装置的模块组成示意图，该装置用于执行图2至图5描述的风险识别模型的确定方法，如图6所示，该装置包括：

信息获取模块602，其获取目标业务对应的模型训练样本数据和针对所述目标业务所配置的风控策略信息；

策略权重更新模块604，其基于所述模型训练样本数据和用于风险识别的分类模型，对各所述风控策略信息对应的策略权重进行更新，得到更新后的策略权重；

模型参数更新模块606，其基于所述模型训练样本数据和更新后的所述策略权重，对所述分类模型的模型参数进行更新，得到更新后的所述分类模型；

第一确定模块608，其若更新后的所述分类模型满足预设模型优化终止条件，则将所述分类模型确定为训练后的风险识别模型；

第二确定模块710，其若更新后的所述分类模型不满足预设模型优化终止条件，则将所述分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型。

可选地，所述策略权重更新模块604，其：

针对每个所述模型训练样本数据，利用用于风险识别的分类模型，对该模型训练样本数据进行风险识别，得到相应的风险识别结果；

针对每个所述模型训练样本数据，基于各所述风控策略信息，确定用于表征该模型训练样本数据是否命中所述风控策略信息的策略命中特征向量；

基于所述风险识别结果、所述策略命中特征向量、以及总目标函数，对各所述风控策略信息对应的所述策略权重进行更新，得到更新后的策略权重。

可选地，所述策略权重更新模块604，其：

基于所述风险识别结果和所述策略命中特征向量，确定在所述模型训练样本下所述风控策略信息成立的目标概率；

将各所述模型训练样本数据对应的所述目标概率代入总目标函数，得到待优化的总目标函数；其中，所述模型训练样本数据包括：多个有标签样本数据，所述总目标函数包括：所述分类模型在所述有标签样本数据上的第一损失函数和所述风控策略信息对应的第二损失函数；

以所述策略权重为自变量，对所述总目标函数中的所述第二损失函数进行最小化处理，得到更新后的策略权重。

可选地，所述策略权重更新模块604，其：

基于所述风险识别结果、所述策略命中特征向量、以及预设分段函数，确定在所述模型训练样本下所述风控策略信息成立的目标概率；

其中，所述预设分段函数为

表示在序号为i的模型训练样本数据下序号为j的风控策略信息成立的目标概率，h_ij表示序号为i的模型训练样本数据命中序号为j的风控策略信息的特征值，p_i表示用于表征序号为i的模型训练样本数据为风险事件的概率的风险识别结果。

可选地，所述第二损失函数包括：用于表征策略对模型的约束的马尔可夫随机场概率；所述策略权重更新模块604，其：

以所述策略权重为自变量，对所述总目标函数中的所述马尔可夫随机场概率进行求导处理，得到所述马尔可夫随机场概率的导数；

基于所述马尔可夫随机场概率的导数，对所述马尔可夫随机场概率进行最大化处理，得到更新后的策略权重；

其中，所述总目标函数Loss＝L1(X，Y)+L2(X，Y)，L1(X，Y)表示第一损失函数，L2(X，Y) 表示第二损失函数，L2(X，Y)＝-αlogP，α表示融合系数，P表示马尔可夫随机场概率，

可选地，所述模型参数更新模块606，其：

基于所述模型训练样本数据、更新后的所述策略权重、以及总目标函数，对所述分类模型的模型参数进行更新，得到更新后的所述分类模型；其中，所述模型训练样本数据包括：多个有标签样本数据，所述总目标函数包括：所述分类模型在所述有标签样本数据上的第一损失函数和所述风控策略信息对应的第二损失函数。

可选地，所述模型参数更新模块606，其：

将更新后的所述策略权重代入总目标函数，得到待优化的总目标函数；

以所述分类模型的模型参数为自变量，对所述总目标函数进行最小化处理，得到更新后的模型参数；

基于所述更新后的模型参数，确定更新后的用于风险识别的分类模型。

可选地，所述模型参数更新模块606，其：

以所述分类模型的模型参数为自变量，对所述第一损失函数和所述第二损失函数进行求导，得到所述总目标函数的导数；

基于所述总目标函数的导数，对所述总目标函数进行最小化处理，得到更新后的模型参数。

可选地，所述第二损失函数包括：用于表征策略对模型的约束的马尔可夫随机场概率；所述模型参数更新模块606，其：

以所述分类模型的模型参数为自变量，对所述第一损失函数进行求导，得到第一损失函数的导数；以及，

以所述分类模型的模型参数为自变量，对所述马尔可夫随机场概率的倒数的lo_g值进行求导，得到第二损失函数的导数；

基于所述第一损失函数的导数与所述第二损失函数的导数之和，确定所述总目标函数的导数；

可选地，所述装置还包括：模型训练判断模块，其：

确定更新后的所述分类模型对应的预设模型评估参数的参数值，并判断所述预设模型评估参数的所述参数值是否大于预设阈值；

若判断结果为是，则确定更新后的所述分类模型满足预设模型优化终止条件；

若判断结果为否，则确定更新后的所述分类模型不满足预设模型优化终止条件。

可选地，所述装置还包括：风险识别模块，其：

获取在执行所述目标业务时所产生的业务行为事件对应的待识别的业务行为数据；

基于所述业务行为数据，并利用训练后的所述风险识别模型对所述业务行为事件进行风险识别，得到相应的风险识别结果；

基于所述风险识别结果，对所述业务行为事件进行管控处理。

本说明书一个或多个实施例中的风险识别模型的确定装置，在对风险识别模型进行训练的过程中，不仅使用带标签训练样本，还引入风险识别策略，并且基于各风险识别策略的最新的策略权重，对风险识别模型进行训练，得到训练后的风险识别模型，再基于更新后的风险识别模型的输出结果，对风险识别模型的策略权重进行更新，得到更新后的策略权重，即对模型参数和策略权重进行反复迭代更新，并且对风险识别模型的模型参数进行更新时参考上一轮更新后的策略权重，以及对风险识别策略的策略权重进行更新时参考上一轮更新后的风险识别模型，直到训练后的风险识别模型满足预设模型优化终止条件，这样能够同时兼顾风险识别模型的识别准确度和风险事件的覆盖率，从而提高风险事件的拦截准确度，进而实现不仅能够确保用户的交易安全性，还能够提升用户使用体验。

需要说明的是，本说明书中关于风险识别模型的确定装置的实施例与本说明书中关于风险识别模型的确定方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的风险识别模型的确定方法的实施，重复之处不再赘述。

进一步地，对应上述图2至图5所示的方法，基于相同的技术构思，本说明书一个或多个实施例还提供了一种风险识别模型的确定设备，该设备用于执行上述的风险识别模型的确定方法，如图7所示。

风险识别模型的确定设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器701和存储器702，存储器702中可以存储有一个或一个以上存储应用程序或数据。其中，存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括对风险识别模型的确定设备中的一系列计算机可执行指令。更进一步地，处理器701可以设置为与存储器702通信，在风险识别模型的确定设备上执行存储器702中的一系列计算机可执行指令。风险识别模型的确定设备还可以包括一个或一个以上电源703，一个或一个以上有线或无线网络接口704，一个或一个以上输入输出接口705，一个或一个以上键盘706等。

在一个具体的实施例中，风险识别模型的确定设备包括有存储器，以及一个或一个以上的程序，其中一个或者一个以上程序存储于存储器中，且一个或者一个以上程序可以包括一个或一个以上模块，且每个模块可以包括对风险识别模型的确定设备中的一系列计算机可执行指令，且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令：

本说明书一个或多个实施例中的风险识别模型的确定设备，在对风险识别模型进行训练的过程中，不仅使用带标签训练样本，还引入风险识别策略，并且基于各风险识别策略的最新的策略权重，对风险识别模型进行训练，得到训练后的风险识别模型，再基于更新后的风险识别模型的输出结果，对风险识别模型的策略权重进行更新，得到更新后的策略权重，即对模型参数和策略权重进行反复迭代更新，并且对风险识别模型的模型参数进行更新时参考上一轮更新后的策略权重，以及对风险识别策略的策略权重进行更新时参考上一轮更新后的风险识别模型，直到训练后的风险识别模型满足预设模型优化终止条件，这样能够同时兼顾风险识别模型的识别准确度和风险事件的覆盖率，从而提高风险事件的拦截准确度，进而实现不仅能够确保用户的交易安全性，还能够提升用户使用体验。

需要说明的是，本说明书中关于风险识别模型的确定设备的实施例与本说明书中关于风险识别模型的确定方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的风险识别模型的确定方法的实施，重复之处不再赘述。

进一步地，对应上述图2至图5所示的方法，基于相同的技术构思，本说明书一个或多个实施例还提供了一种存储介质，用于存储计算机可执行指令，一种具体的实施例中，该存储介质可以为U盘、光盘、硬盘等，该存储介质存储的计算机可执行指令在被处理器执行时，能实现以下流程：

本说明书一个或多个实施例中的存储介质存储的计算机可执行指令在被处理器执行时，在对风险识别模型进行训练的过程中，不仅使用带标签训练样本，还引入风险识别策略，并且基于各风险识别策略的最新的策略权重，对风险识别模型进行训练，得到训练后的风险识别模型，再基于更新后的风险识别模型的输出结果，对风险识别模型的策略权重进行更新，得到更新后的策略权重，即对模型参数和策略权重进行反复迭代更新，并且对风险识别模型的模型参数进行更新时参考上一轮更新后的策略权重，以及对风险识别策略的策略权重进行更新时参考上一轮更新后的风险识别模型，直到训练后的风险识别模型满足预设模型优化终止条件，这样能够同时兼顾风险识别模型的识别准确度和风险事件的覆盖率，从而提高风险事件的拦截准确度，进而实现不仅能够确保用户的交易安全性，还能够提升用户使用体验。

需要说明的是，本说明书中关于存储介质的实施例与本说明书中关于风险识别模型的确定方法的实施例基于同一发明构思，因此该实施例的具体实施可以参见前述对应的风险识别模型的确定方法的实施，重复之处不再赘述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable GateArray， FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、 CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language) 等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书一个或多个时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书一个或多个的实施例可提供为方法、系统、或计算机程序产品。因此，本说明书一个或多个可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书一个或多个是参照根据本说明书一个或多个实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/ 或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书一个或多个的实施例可提供为方法、系统或计算机程序产品。因此，本说明书一个或多个可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书一个或多个可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书一个或多个的实施例而已，并不用于限制本说明书一个或多个。对于本领域技术人员来说，本说明书一个或多个可以有各种更改和变化。凡在本说明书一个或多个的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书一个或多个的权利要求范围之内。

Claims

1.一种风险识别模型的确定方法，包括：

获取目标业务对应的模型训练样本数据和针对所述目标业务所配置的风控策略信息，所述目标业务包括线上交易业务或者线下支付业务，所述风控策略信息包括风控专家制定的风险管控规则，所述风险管控规则包括与交易相关的多个子风险管控规则；

若更新后的所述分类模型不满足预设模型优化终止条件，则将所述分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型；

其中，所述基于所述模型训练样本数据和用于风险识别的分类模型，对各所述风控策略信息对应的所述策略权重进行更新，得到更新后的策略权重，包括：

2.根据权利要求1所述的方法，其中，所述基于所述风险识别结果和所述策略命中特征向量，确定在所述模型训练样本下所述风控策略信息成立的目标概率，包括：

其中，所述预设分段函数为Φ_ij＝min{1-h_ij+p_i,1}，Φ_ij表示在序号为i的模型训练样本数据下序号为j的风控策略信息成立的目标概率，h_ij表示序号为i的模型训练样本数据命中序号为j的风控策略信息的特征值，p_i表示用于表征序号为i的模型训练样本数据为风险事件的概率的风险识别结果。

3.根据权利要求1所述的方法，其中，所述第二损失函数包括：用于表征策略对模型的约束的马尔可夫随机场概率；

所述以所述策略权重为自变量，对所述总目标函数中的所述第二损失函数进行最小化处理，得到更新后的策略权重，包括：

其中，所述总目标函数Loss＝L1(X,Y)+L2(X,Y)，L1(X,Y)表示第一损失函数，L2(X,Y)表示第二损失函数，L2(X,Y)＝-αlogP，α表示融合系数，P表示马尔可夫随机场概率，

z表示归一化函数，R表示风控策略信息的数量，N表示模型训练样本数据的数量，w_j表示序号为j的风控策略信息对应的策略权重，Φ_ij表示在序号为i的模型训练样本数据下序号为j的风控策略信息成立的目标概率。

4.根据权利要求1所述的方法，其中，所述基于所述模型训练样本数据和更新后的所述策略权重，对所述分类模型的模型参数进行更新，得到更新后的所述分类模型，包括：

5.根据权利要求4所述的方法，其中，所述基于所述模型训练样本数据、更新后的所述策略权重、以及总目标函数，对所述分类模型的模型参数进行更新，得到更新后的所述分类模型，包括：

6.根据权利要求5所述的方法，其中，所述以所述分类模型的模型参数为自变量，对所述总目标函数进行最小化处理，得到更新后的模型参数，包括：

7.根据权利要求6所述的方法，其中，所述第二损失函数包括：用于表征策略对模型的约束的马尔可夫随机场概率；

所述以所述分类模型的模型参数为自变量，对所述第一损失函数和所述第二损失函数进行求导，得到所述总目标函数的导数，包括：

以所述分类模型的模型参数为自变量，对所述马尔可夫随机场概率的倒数的log值进行求导，得到第二损失函数的导数；

8.根据权利要求1所述的方法，其中，在基于所述模型训练样本数据和更新后的所述策略权重，对所述分类模型的模型参数进行更新，得到更新后的所述分类模型之后，还包括：

9.根据权利要求1所述的方法，其中，在将所述分类模型确定为训练后的风险识别模型之后，还包括：

10.一种风险识别模型的确定装置，包括：

信息获取模块，其获取目标业务对应的模型训练样本数据和针对所述目标业务所配置的风控策略信息，所述目标业务包括线上交易业务或者线下支付业务，所述风控策略信息包括风控专家制定的风险管控规则，所述风险管控规则包括与交易相关的多个子风险管控规则；

第二确定模块，其若更新后的所述分类模型不满足预设模型优化终止条件，则将所述分类模型作为下一轮策略权重更新所用的用于风险识别的分类模型；

其中，所述策略权重更新模块，其：

11.一种风险识别模型的确定设备，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：

12.一种存储介质，用于存储计算机可执行指令，所述可执行指令在被处理器执行时实现以下方法：