CN111899027A

CN111899027A - 一种反欺诈模型的训练方法及装置

Info

Publication number: CN111899027A
Application number: CN202010772833.5A
Authority: CN
Inventors: 刘正夫; 王铖骅
Original assignee: 4Paradigm Beijing Technology Co Ltd
Current assignee: 4Paradigm Beijing Technology Co Ltd
Priority date: 2020-08-04
Filing date: 2020-08-04
Publication date: 2020-11-06
Anticipated expiration: 2040-08-04
Also published as: CN111899027B

Abstract

本发明公开了一种反欺诈模型的训练方法及装置，主要技术方案包括：将已标注交易样本集划分成N份样本，每份样本中分别包括正样本和/或负样本；使用当前获取的N份样本分别训练N个二分类模型；使用训练后的N个二分类模型分别对各未标注交易数据进行预测，得到各未标注交易数据在每一个训练后的二分类模型中的预测分值；基于各未标注交易数据在每一个训练后的二分类模型中的预测分值，从各未标注交易数据中选取至少一个未标注交易数据推送给标注终端；当训练后的N个二分类模型未收敛时，获取标注终端完成标注的已标注交易数据集确定为下一次训练N个二分类模型所需的N份样本的样本来源，继续迭代训练N个二分类模型。

Description

一种反欺诈模型的训练方法及装置

技术领域

本发明涉及计算机技术领域，特别是涉及一种反欺诈模型的训练方法及装置。

背景技术

互联网技术的发展，金融领域的交易行为越来越多的依赖于互联网进行，但是相伴而生的骗贷、违约、转账等欺诈性行为逐渐渗入到互联网中，为了保证交易行为的安全，对于金融机构而言，针对反欺诈识别监控成为抵御金融风险的重要工作之一。

目前，通常通过机器学习算法而得的机器学习模型进行反欺诈监控已经是大势所趋。在训练机器学习模型时，通常需要有标注的样本来进行训练，样本的标注通常由人力完成。在反欺诈场景中，大量的交易数据都是正常的交易数据，只有极少部分的交易数据为欺诈行为的交易数据。若采用人力一个接一个对交易数据进行标注，将耗费大量的标注人力。而若为了减少人力标注投入，采用随机抽取交易数据进行标注的方式来标注，那么得到合法行为的样本较多，而得到欺诈行为的样本较少，这种样本分布将不利用模型学习，导致反欺诈识别的效果较差。

发明内容

有鉴于此，本发明提出了一种反欺诈模型的训练方法及装置，主要目的在于在减少训练反欺诈模型的人工标注成本的同时，提高反欺诈识别的效果。

第一方面，本发明提供了一种反欺诈模型的训练方法，该方法包括：

将已标注交易样本集划分成N份样本，其中，每份样本中分别包括至少一个正样本和/或至少一个负样本，所述正样本为已被标注为欺诈行为的交易数据，所述负样本为已被标注为合法行为的交易数据，N大于或等于2；

使用当前获取的所述N份样本分别训练N个二分类模型，其中，所述N个二分类模型组成反欺诈模型；

使用训练后的N个二分类模型分别对各未标注交易数据进行预测，得到各所述未标注交易数据在每一个训练后的二分类模型中的预测分值；

基于各所述未标注交易数据在每一个训练后的二分类模型中的预测分值，从各所述未标注交易数据中选取至少一个未标注交易数据推送给标注终端，以供标注员标注；

当所述训练后的N个二分类模型未收敛时，获取所述标注终端完成标注的已标注交易数据集确定为下一次训练N个二分类模型所需的N份样本的样本来源，继续迭代训练N个二分类模型。

第二方面，本发明提供了一种反欺诈模型的训练装置，该装置包括：

划分单元，用于将已标注交易样本集划分成N份样本，其中，每份样本中分别包括至少一个正样本和/或至少一个负样本，所述正样本为已被标注为欺诈行为的交易数据，所述负样本为已被标注为合法行为的交易数据，N大于或等于2；

训练单元，用于使用当前获取的所述N份样本分别训练N个二分类模型，其中，所述N个二分类模型组成反欺诈模型；

预测单元，用于使用训练后的N个二分类模型分别对各未标注交易数据进行预测，得到各所述未标注交易数据在每一个训练后的二分类模型中的预测分值；

推送单元，用于基于各所述未标注交易数据在每一个训练后的二分类模型中的预测分值，从各所述未标注交易数据中选取至少一个未标注交易数据推送给标注终端，以供标注员标注；

第一确定单元，用于当所述训练后的N个二分类模型未收敛时，获取所述标注终端完成标注的已标注交易数据集确定为下一次训练N个二分类模型所需的N份样本的样本来源，继续迭代训练N个二分类模型。

第三方面，本发明提供了一种计算机可读存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行第一方面所述的反欺诈模型的训练方法。

第四方面，本发明提供了一种存储管理设备，所述存储管理设备包括：

存储器，用于存储程序；

处理器，耦合至所述存储器，用于运行所述程序以执行第一方面所述的反欺诈模型的训练方法。

借由上述技术方案，本发明提供的反欺诈模型的训练方法及装置，将已标注交易样本集划分成两份及以上数量份数的样本，使用各份样本分别训练反欺诈模型中的一个二分类模型。使用训练后的各二分类模型分别对各未标注交易数据进行预测，然后根据各未标注交易数据在每一个训练后的二分类模型中的预测分值，选取有较高标注价值的未标注交易数据推送给标注终端以标注员仅对标注价值较高的样本进行标注，从而提高标注员标注的人工标注效率。另外，为了优化反欺诈模型的欺诈识别效果，则需要获取标注终端完成标注的已标注交易数据集，以让反欺诈模型能够不断的学习新标注的样本，从而使反欺诈模型的欺诈识别效果能够不断提升，从而更好的对交易数据中的欺诈行为进行准确识别。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本发明一个实施例提供的一种反欺诈模型的训练方法的流程图；

图2示出了本发明另一个实施例提供的一种反欺诈模型的训练方法的流程图；

图3示出了本发明一个实施例提供的一种反欺诈模型的训练装置的结构示意图；

图4示出了本发明另一个实施例提供的一种反欺诈模型的训练装置的结构示意图。

具体实施方式

下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

如图1所示，本发明实施例提供了一种反欺诈模型的训练方法，该方法主要包括：

101、将已标注交易样本集划分成N份样本，其中，每份样本中分别包括至少一个正样本和/或至少一个负样本，所述正样本为已被标注为欺诈行为的交易数据，所述负样本为已被标注为合法行为的交易数据，N大于或等于2。

在实际应用中，欺诈行为往往隐藏在金融领域的交易过程中，故金融领域的在互联网等媒介中的交易行为所产生的数据中包括有大量的欺诈行为相关的特征，而这些特征可以作为反欺诈模型的训练基础，因此，可采用经过标注员等具有标注经验的标注专家标注过的已标注交易数据作为样本来训练反欺诈模型。在训练反欺诈模型时，需要获取已标注交易样本集，其中，已标注交易样本集中的一个样本为一个已标注交易数据。该已标注交易样本集中包括至少一个正样本和至少一个负样本，其中，正样本为已被标注为欺诈行为的交易数据，而负样本为已被标注为合法行为的交易数据。需要说明的是，为了保证基于已标注交易样本集训练而得的反欺诈模型能够在大量的未标注交易数据，识别出欺诈行为的交易数据，则已标注交易样本集中的负样本数量和正样本数量之间的比值应为一个特定比值，该比值本实施例中不做具体限定，可以基于具体的业务需求设定。示例性的，该负样本数量大于正样本数量，该比值为大于1的数值。

已标注交易样本集的来源与反欺诈模型的迭代训练次数有关，因此，已标注交易样本集的来源至少存在如下三种：

第一种，当首先训练反欺诈模型时，获取标注终端完成标注的已标注交易数据，并将所获取的已标注交易数据确定为样本，使用所确定的样本组成已标注交易样本集。

第二种，当非首次训练反欺诈模型，也就是说，在当前次训练反欺诈模型之前，该反欺诈模型已被迭代训练至少一次，则获取标注终端完成标注的已标注交易数据，并确定为样本。其中，标注终端完成标注的已标注交易数据基于上一次训练的反欺诈模型向标注终端推送的未标注交易数据标注而得。将当前确定的样本，作为已标注交易样本集。

此种方式，能够不断更新迭代训练反欺诈模型所需的已标注交易样本集，能够使反欺诈模型不断学习新标注的样本，从而不断的优化反欺诈模型对欺诈行为的识别效果。

第三种，当非首次训练反欺诈模型，也就是说，在当前次训练反欺诈模型之前，该反欺诈模型已被迭代训练至少一次，则获取标注终端完成标注的已标注交易数据，并确定为样本。其中，标注终端完成标注的已标注交易数据基于上一次训练的反欺诈模型向标注终端推送的未标注交易数据标注而得。将上一次训练反欺诈模型所使用的已标注交易样本集中的所有样本和当前确定的样本，作为已标注交易样本集。

此种方式，不仅能够不断更新迭代训练反欺诈模型所需的已标注交易样本集，而且其不断的在上一次训练所使用的已标注交易样本集的基础上不断的增加训练所用的已标注交易样本集中样本的数量，因此在每次训练反欺诈模型时，不仅能够让反欺诈模型不断的学习到新标注的样本，而且能够不断学习到更为全面的特征，从而不断的优化反欺诈模型对欺诈行为的识别效果。

本实施例中所提及的反欺诈模型由N个二分类模型组成，N为大于或等于2的数值。其中，N个二分类模型可以为同种类型的二分类模型，也可以为不同种类型的二分类模型。若N个二分类模型为同类类型的二分类模型，各二分类模型采用相同的评价指标对未标注交易数据进行预测。若N个二分类模型为不同类型的二分类模型，各二分类模型能够分别发挥出其特有的分类优势，在一定程度上能够提高反欺诈模型对未标注交易数据的预测效果。需要说明的是，无论N个二分类模型是同类型的二分类模型还是不同类型的二分类模型，二分类模型的具体类型本实施例均不作具体限定，在实际应用中可以基于具体业务需求确定。示例性的，N个二分类模型为同类型的二分类模型，且均为GBDT(GradientBoosting Decision Tree，梯度提升迭代决策树)模型。

由于反欺诈模型是由N个二分类模型组成，因此在获取到已标注交易样本集之后，需要将该已标注交易样本集划分为N份样本，以便每一个二分类均有一份对应的样本，由其对那份样本对其进行训练。下面对如何将已标注交易样本集划分成N份样本进行说明，该划分方法至少包括如下两种：

第一种，将已标注交易样本集所包括的样本切分为M个样本组，其中，每个所述样本组由至少一个样本组成，其中，M等于N。在对已标注交易样本集所包括的样本切分后，利用M个样本组生成所述N份样本，其中，形成的每份样本分别缺少M个样本组中的一个样本组，且不同份样本缺少的样本组不同。

此种方式中，在对已标注交易样本集切分后所形成的N份样本中，每份样本中可能包括的样本均为正样本，也可能所包括的样本均为负样本，也可能所包括的样本既包括正样本又包括负样本。

第二种，将已标注交易样本集所包括的样本切分为M个样本组，其中，每个所述样本组由至少一个样本组成，其中，M大于N；在对已标注交易样本集所包括的样本切分后，利用M个样本组生成所述N份样本，其中，每份样本中分别缺少M个样本组中的至少一个样本组，且不同份样本缺少的所述至少一个样本组中至少存在一个样本组不同。

下面对上述第一种和第二种将已标注交易样本集划分成N份样本的方法中所涉及的将已标注交易样本集所包括的样本切分为M个样本组的具体过程进行说明，该过程为：

按照已标注交易样本集中样本的存在顺序，将已标注交易样本集中的样本均分为M个样本组，其中，每个样本组包括的样本如下述公式所示：

其中，i表征样本组是第几个样本组；D_i表征所述M个样本组中的第i个样本组；p表征所述已标注交易样本集中的样本总量；m表征所述M个样本组的总组数；d表征所述M个样本组中的第i个样本组中的样本；

表征所述M个样本组中的第i个样本组中的各样本在所述已标注交易样本集中的存在顺序。

若采用上述方法形成M个样本组之后，且M与N相同时，则利用M个样本组生成N份样本时，每份样本包括的样本如下述公式所示：

N_i＝M-M_i

其中，N_i表征N份样本中的第i份样本；M表征所有的M个样本组；M_i表征M样本组中的第i份样本。

通过上述第一种和第二种将已标注交易样本集划分成N份样本的方法，能够保证每份样本中的样本都存在一定差别，从而保证N个二分类模型中的每个二分类模型能够学习到不同的特征，从而产生不同的反欺诈识别效果，使得各二分类模型针对反欺诈识别能够形成一定的互补，从而提高整体的反欺诈模型的识别效果。

102、使用当前获取的所述N份样本分别训练N个二分类模型，其中，所述N个二分类模型组成反欺诈模型。

在实际应用，在训练各二分类模型时，针对每一个二分类模型均执行：使用该二分类模型对应的那份样本对该二分类模型的进行训练。

由于N个二分类模型中的每个二分类模型分别使用不同份的样本进行序列，因此各二分类模型能够学习到不同的特征，从而各二分类模型能够产生不同的反欺诈识别效果，从而各二分类模型针对反欺诈识别能够形成一定的互补，从而提高整体的反欺诈模型的识别效果。

103、使用训练后的N个二分类模型分别对各未标注交易数据进行预测，得到各所述未标注交易数据在每一个训练后的二分类模型中的预测分值。

在使用N个二分类模型对各末标注交易数据进行预测时，可以对全量的未标注交易数据进行识别，也可以对全量未标注交易数据中的部分未标注交易数据进行识别。

在对各未标注交易数据进行预测时，针对每一个未标注交易数据均执行：使用各二分类模型分别对该未标注交易数据进行预测。在预测后，每一个二分类模型针对该未标注交易数据均产生了一个预测分值，预测分值能够反映出二分类模型预测该未标注交易数据为欺诈行为的概率。预测分值通常为0-1之间的数值，或为0，或为1，其中，该预测分值越接近于1，则说明该未标注交易数据为欺诈行为的交易数据概率越高，为合法行为的交易数据越低。该预测分值越接近于0，则说明该未标注交易数据为合法行为的交易数据概率越高，为欺诈行为的交易数据概率越低。

104、基于各所述未标注交易数据在每一个训练后的二分类模型中的预测分值，从各所述未标注交易数据中选取至少一个未标注交易数据推送给标注终端，以供标注员标注。

在实际应用中，在基于预测分值向标注终端推送未标注交易数据的具体过程为如下步骤一至步骤三：

步骤一、基于各所述未标注交易数据在每一个所述二分类模型中的预测分值，确定各所述未标注交易数据的平均预测分值。

具体的，针对每一个未标注交易数据均执行：将该未标注交易数据在每一个二分类模型中的预测分值求和，将该求和与二分类模型的总量的比值确定为该未标注交易数据的平均预测分值。

由于各未标注交易数据的平均预测分值，是基于各二分类模型中的预测分值平均而得，因此该平均预测分值更能反正出该未标注交易数据是欺诈行为的交易数据还是合法行为的数据。

步骤二、根据各所述未标注交易数据的平均预测分值的大小，对各所述未标注交易数据进行排序。

步骤三、基于排序结果选取所述至少一个未标注交易数据推送给所述标注终端。

具体的，推送给标注终端的未标注交易数据的选取方法为：按照各未标注交易数据的平均预测分值由大到小的顺序的进行排序，选取排序位于前K位的未标注交易数据推送给标注终端，以供标注员标注，其中，K大于或等于1。

平均预测分值越大，则说明未标注交易数据为欺诈行为的交易数据的概率越大，而欺诈行为的交易数据正是需要被标注出的交易数据，因此选取排序位于前K位的未标注交易数据推送给标注终端。这种基于平均预测分值的方式能够对未标注交易数据进行有选择的提供给标注终端，以供标注终端对应的标注员能够对标注价值较高的样本进行优先标注，这种选取出标注价值较高的未标注交易数据供标注员标注的方式，能够保证标注员标注的人工标注效率。

进一步的，为了使反欺诈模型能够不断迭代训练，不断的在迭代训练中学习新样本中的特征，则除了选取排序位于前K位的未标注交易数据推送给标注终端，还可以选取排序位于后T位的未标注交易数据推送给标注终端。其中后T位的未标注交易数据为合法行为的交易数据的概率越大。

具体的，为了保证基于已标注交易样本集训练而得的反欺诈模型能够在大量的未标注交易数据，识别出欺诈行为的交易数据，已标注交易样本集中的负样本数量和正样本数量之间的比值应为一个特定比值，则T为K与预设数值的乘积，预设数值为所述N份样本所涉及的所有负样本的条数与所有正样本的条数的比值。

进一步的，在将未标注交易数据提送给标注终端之后，为了能够完成对反欺诈模型的迭代训练，则需要获取标注终端完成标注的已标注交易数据集，以利用该已标注交易数据集完整后的反欺诈模型的迭代训练过程。

105、当所述训练后的N个二分类模型未收敛时，获取所述标注终端完成标注的已标注交易数据集确定为下一次训练N个二分类模型所需的N份样本的样本来源，继续迭代训练N个二分类模型。

在实际应用中，确定训练后的N个二分类模型是否收敛的方法至少包括如下几种：

第一种，判断标注员对推送给所述标注终端的各未标注交易数据的标注结果与训练后的N个二分类模型对推送给所述标注终端的各未标注交易数据的预测分值之间的偏差是否在预设范围内；若不在预设范围内，确定所述训练后的N个二分类模型未收敛。若在预设范围内，则说明训练后的N个二分类模型已经具有反欺诈效果，则停止对N个二分类模型的迭代训练，利用该N个二分类模型可完成剩余未标注交易数据的欺诈行为识别。

示例性的，比如对于推送给标注终端的未标注交易数据1，标注员标注后，确定该未标注交易数据为欺诈行为的交易数据，对应的预测分值为1。而N个二分类模型对该未标注交易数据的平均预测分值为0.4，则说明N个二分类模型预测该未标注交易数据1与标注员的标注结果之间的偏差不再预设范围内，则确定N个二分类模型未收敛。

第二种，判断标注员对推送给所述标注终端的各未标注交易数据的标注结果与训练后的N个二分类模型对推送给所述标注终端的各未标注交易数据的预测分值之间的偏差，相对于前S次训练时标注员对推送给所述标注终端的各未标注交易数据的标注结果与训练后的N个二分类模型对推送给所述标注终端的各未标注交易数据的预测分值之间的偏差，是否有缩小，且若有缩小时，缩小程度是否在预设缩小范围内。若未缩小或缩小了，但缩小程度未在预设缩小范围内，则确定所述训练后的N个二分类模型未收敛。若缩小了，且缩小程度在预设缩小范围内，则说明训练后的N个二分类模型已经具有反欺诈效果，则停止对N个二分类模型的迭代训练，利用该N个二分类模型可完成剩余未标注交易数据的欺诈行为识别。其中，S大于或等于1。

本发明实施例提供的反欺诈模型的训练方法，将已标注交易样本集划分成两份及以上数量份数的样本，使用各份样本分别训练反欺诈模型中的一个二分类模型。使用训练后的各二分类模型分别对各未标注交易数据进行预测，然后根据各未标注交易数据在每一个训练后的二分类模型中的预测分值，选取有较高标注价值的未标注交易数据推送给标注终端以标注员仅对标注价值较高的样本进行标注，从而提高标注员标注的人工标注效率。另外，为了优化反欺诈模型的欺诈识别效果，则需要获取标注终端完成标注的已标注交易数据集，以让反欺诈模型能够不断的学习新标注的样本，从而使反欺诈模型的欺诈识别效果能够不断提升，从而更好的对交易数据中的欺诈行为进行准确识别。

进一步的，根据图1所示的方法，本发明的另一个实施例还提供了一种反欺诈模型的训练方法，如图2所示，所述方法主要包括：

201、获取已标注交易样本集。

在实际应用中，无论反欺诈模型是首次训练还是非首次训练，获取的已标注交易样本集均是来自于全量的未标注交易数据中，已被标注员标注过的交易数据。

示例性的，以首次训练反欺诈模型为例，存在如表-1中所有获取的交易数据，该表-1中存在有已被标注员标注过的交易数据，其中，已被标注过的数据的交易类型为欺诈行为或合法行为，其中，欺诈行为的交易数据的标签label为1，而合法行为的交易数据的标签为0。表-1中未标注交易数据的交易类型为未知行为。表-1中交易行为id表征交易数据的id。

表-1

可见，表-1中的t1-t3交易数据已被标注过，故获取如表-2所示的已标注交易样本集。

表-2

交易行为id	用户id	交易类型(label)
			t1	u0	欺诈行为(1)
t2	u1	合法行为(0)
			t3	u2	合法行为(0)
t4	u3	未知行为
			t5	u4	未知行为
t6	u4	未知行为
			t7	u5	未知行为
t8	u6	未知行为
			t9	u7	未知行为
t10	u8	未知行为
			t11	u9	未知行为
t12	u10	未知行为
			t13	u11	未知行为
t14	u12	未知行为

202、判断所述已标注交易样本集中的样本的特征是否满足预设的特征需求；若满足所述特征需求，执行204；否则，执行203。

在实际应用中，为了使反欺诈模型能够学习到有用的信息，且使训练得到的反欺诈模型可以精确的对欺诈行为和合法行为进行识别，则已标注交易样本集中的各样本中需要含有丰富的与欺诈行为相关的特征和/或与合法行为相关的特征。通常样本包含的特征存在如下两类：一是，用户类特征，该类特征主要描述用户的特征的用户基本信息，比如，用户年龄、用户性别、用户存款余额、家庭成员数据等特征；二是，用户行为类特征，该类特征主要描述用户交易行为相关的信息，比如，用户深夜转账金额、用户ATM取钱比数、用户一个月信用卡消费次数等。由于上述的这些特征可以作为反欺诈模型的训练基础，这些特征直接关系到反欺诈模型对欺诈行为的识别效果。因此，在将已标注交易样本集划分为N份样本之前，需要判断已标注交易样本集中的样本的特征是否满足预设的特征需求。

满足预设的特征需求判定的方法至少可以包括如下中的至少一种：一是、样本的特征数量是否达到预设的特征数量，在样本的特征数量达到预设的特征数量时，则满足特征需求，反之，则未满足特征需求；二是，样本的特征的种类是否包括预设的特征种类，在样本的特征的种类包括有预设的特征种类，则满足特征需求，反之，若存在至少一个预设的特征种类未包括在样本的特征的种类中，则未满足特征需求。

在已标注交易样本集中的样本的特征满足预设的特征需求时，则直接执行将已标注交易样本集所包括的样本切分为M个样本组。在已标注交易样本集中的样本的特征未满足预设的特征需求时，则需要进行样本的特征衍生和/或拼接，则执行203。

203、对各所述样本中的特征进行拼接和/或衍生处理，其中，所述样本中的特征包括用户基本信息特征和/或用户行为信息特征。

在实际应用中，拼接处理是直接将两个或两个以上的特征拼接在一起。而衍生处理是直接依据现有的一个或多个特征衍生出新的特征。示例性的，比如，存在每天信用卡消费金额，则能够衍生出一个月信用卡的消费金额。

示例性的，比如对表-2样本进行特征处理，得到如表-3。

表-3

204、将所述已标注交易样本集所包括的样本切分为M个样本组，其中，每个所述样本组由至少一个样本组成，其中，M大于或等于N。

示例性的，通过表-3可以了解已标注交易样本集中包括有3个样本，则按照该已标注交易样本集中样本的存在顺序每一个样本分别切分为一个样本组。切分结果为：M1为t1，M2为t2，M3为t3。

205、利用所述M个样本组生成所述N份样本，其中，每份样本中分别缺少M个样本组中的至少一个样本组，且不同份样本缺少的所述至少一个样本组中至少存在一个样本组不同。

示例性的，根据如下公式，将3个样本组生成3份样本。公式如下所示：

N_i＝M-M_i

其中，第一份样本为N1＝{t1，t2，t3}-t1＝N1＝{t2，t3}，如表-4所示。

表-4

其中，第二份样本为N2＝{t1，t2，t3}-t2＝N2＝{t1，t3}，如表-5所示。

表-5

其中，第三份样本为N3＝{t1，t2，t3}-t2＝N2＝{t1，t2}，如表-6所示。

表-6

206、使用当前获取的所述N份样本分别训练N个二分类模型。

示例性的，反欺诈模型有三个二分类模型组成，则分别使用一份样本训练一个二分类模型。比如，二分类模型存在model1，model2，model3。则，使用第一份样本训练model1，使用第二份样本训练model2，使用第三份样本训练model3。

207、使用训练后的N个二分类模型分别对各未标注交易数据进行预测，得到各所述未标注交易数据在每一个训练后的二分类模型中的预测分值。

示例性的，使用训练后的三个二分类模型分别对表-1各未标注交易数据进行预测，得到如表-7所示的预测结果。

表-7

208、基于各所述未标注交易数据在每一个所述二分类模型中的预测分值，确定各所述未标注交易数据的平均预测分值。

示例性的，对表-7占用各未标注交易数据在每一个所述二分类模型中的预测分值，确定各未标注交易数据的平均预测分值，得到如表-8。其中，平均预测分值的计算公式为：(model1+model2+model3)/3。

表-8

209、根据各所述未标注交易数据的平均预测分值的大小，对各所述未标注交易数据进行排序。

示例性的，基于表-8所示，按照各未标注交易数据的平均预测分值由大到小的顺序，对各未标注交易数据进行排序的结果如表-9所示。

表-9

210、选取排序位于前K位的未标注交易数据推送给所述标注终端，其中，所述排序结果为按照各所述未标注交易数据的平均预测分值由大到小的排序结果，其中，K大于或等于1。

在实际应用中，K值的选择可根据标注员的人工资源确定，比如，在人工资源充分时，K值可取的较大，在人工资源不足时，则K值可取的较小。

另外，该K指的可根据已标注交易样本集中的负样本条数和正样本条数的比值确定。示例性的，表-3中正样本条数为1，负样本条数为2，则负样本条数和正样本条数之间的比值为2，因此，将K设置为1，则将排序号为1的t13推送给标注终端，以供标注员标注。

211、选取排序位于后T位的未标注交易数据推送给所述标注终端，其中，T为K与预设数值的乘积，所述预设数值为所述N份样本所涉及的所有负样本的条数与所有正样本的条数的比值。

在实际应用中，为了保证基于已标注交易样本集训练而得的反欺诈模型能够在大量的未标注交易数据，识别出欺诈行为的交易数据，则已标注交易样本集中的负样本数量和正样本数量之间的比值应为一个特定比值，因此在将前K位的未标注交易数据推送给标注终端后，还需要将选取排序位于后T位的未标注交易数据推送给标注终端。

示例性的，表-3中正样本条数为1，负样本条数为2，则负样本条数和正样本条数之间的比值为2，因此，将T设置为2，将t11和t14推送给标注终端，以供标注员标注。

在将所选取的未标注交易数据推送给标注终端后，无论是了为了了解标注员对未标注交易数据的标注结果，还是将标注员已标注交易数据作为下一次迭代训练反欺诈模型所需的已标注交易样本集，均需要获取标注终端的完成标注的已标注交易数据集。

示例性的，如表-10，为标注员对t13、t11和t14标注的结果。

表-10

212、判断所述标注员对推送给所述标注终端的各未标注交易数据的标注结果与所述训练后的N个二分类模型对推送给所述标注终端的各未标注交易数据的预测分值之间的偏差是否在预设范围内；若在所述预设范围内，执行215；若不在所述预设范围内，执行213。

示例性的，t11的平均预测分值0.15与标注员对该交易数据的标注结果“合法行为”之间的偏差在预设范围内。t13的平均预测分值0.51与标注员对该交易数据的标注结果“欺诈行为”之间的偏差在预设范围内。t14的平均预测分值0.29与标注员对该交易数据的标注结果“欺诈行为”之间的偏差未在预设范围内。综上，判断标注员对推送给标注终端的各未标注交易数据的标注结果与所述训练后的各个二分类模型对推送给标注终端的各未标注交易数据的预测分值之间的偏差，在在预设范围内，则确定训练后的三个二分类模型未收敛。

213、确定所述训练后的N个二分类模型未收敛，获取所述标注终端完成标注的已标注交易数据集确定为下一次训练N个二分类模型所需的N份样本的样本来源，并将标注终端完成标注的已标注交易数据集确定为样本。

214、将上一次训练所述N个二分类模型所使用的N份样本中的所有样本和当前确定的样本，作为所述已标注交易样本集，并继续执行201。

示例性的，形成了如表-11所示的已标注交易样本集，以继续执行步骤201，直至三个二分类模型收敛为止。

表-11

215、确定所述训练后的N个二分类模型收敛。

进一步的，依据上述方法实施例，本发明的另一个实施例还提供了一种反欺诈模型的训练装置，如图3所示，所述装置包括：

划分单元31，用于将已标注交易样本集划分成N份样本，其中，每份样本中分别包括至少一个正样本和/或至少一个负样本，所述正样本为已被标注为欺诈行为的交易数据，所述负样本为已被标注为合法行为的交易数据，N大于或等于2；

训练单元32，用于使用当前获取的所述N份样本分别训练N个二分类模型，其中，所述N个二分类模型组成反欺诈模型；

预测单元33，用于使用训练后的N个二分类模型分别对各未标注交易数据进行预测，得到各所述未标注交易数据在每一个训练后的二分类模型中的预测分值；

推送单元34，用于基于各所述未标注交易数据在每一个训练后的二分类模型中的预测分值，从各所述未标注交易数据中选取至少一个未标注交易数据推送给标注终端，以供标注员标注；

第一确定单元35，用于当所述训练后的N个二分类模型未收敛时，获取所述标注终端完成标注的已标注交易数据集确定为下一次训练N个二分类模型所需的N份样本的样本来源，继续迭代训练N个二分类模型。

本发明实施例提供的反欺诈模型的训练装置，将已标注交易样本集划分成两份及以上数量份数的样本，使用各份样本分别训练反欺诈模型中的一个二分类模型。使用训练后的各二分类模型分别对各未标注交易数据进行预测，然后根据各未标注交易数据在每一个训练后的二分类模型中的预测分值，选取有较高标注价值的未标注交易数据推送给标注终端以标注员仅对标注价值较高的样本进行标注，从而提高标注员标注的人工标注效率。另外，为了优化反欺诈模型的欺诈识别效果，则需要获取标注终端完成标注的已标注交易数据集，以让反欺诈模型能够不断的学习新标注的样本，从而使反欺诈模型的欺诈识别效果能够不断提升，从而更好的对交易数据中的欺诈行为进行准确识别。

可选的，如图4所示，所述划分单元31包括：

切分模块311，用于将所述已标注交易样本集所包括的样本切分为M个样本组，其中，每个所述样本组由至少一个样本组成，其中，M大于或等于N；

生成模块312，用于利用所述M个样本组生成所述N份样本，其中，每份样本中分别缺少M个样本组中的至少一个样本组，且不同份样本缺少的所述至少一个样本组中至少存在一个样本组不同。

可选的，如图4所示，当M等于N时，生成模块312生成的每份样本分别缺少M个样本组中的一个样本组，且不同份样本缺少的样本组不同。

可选的，如图4所示，所述切分模块311，用于按照所述已标注交易样本集中样本的存在顺序，将所述已标注交易样本集中的样本均分为M个样本组，其中，每个所述样本组包括的样本如下述公式所示：

可选的，如图4所示，所述装置还包括：

第二确定单元36，用于当非首次训练所述N个二分类模型时，获取所述标注终端完成标注的已标注交易数据确定为样本，其中，所述已标注交易数据基于上一次训练的N个二分类模型向所述标注终端推送的未标注交易数据标注而得；将上一次训练所述N个二分类模型所使用的N份样本中的所有样本和/或当前确定的样本，作为所述已标注交易样本集。

可选的，如图4所示，所述推送单元34包括：

确定模块341，用于基于各所述未标注交易数据在每一个所述二分类模型中的预测分值，确定各所述未标注交易数据的平均预测分值；

排序模块342，用于根据各所述未标注交易数据的平均预测分值的大小，对各所述未标注交易数据进行排序；

推送模块343，用于基于排序结果选取所述至少一个未标注交易数据推送给所述标注终端。

可选的，如图4所示，所述推送模块343，用于选取排序位于前K位的未标注交易数据推送给所述标注终端，其中，所述排序结果为按照各所述未标注交易数据的平均预测分值由大到小的排序结果，其中，K大于或等于1。

可选的，如图4所示，所述推送模块343，还用于选取排序位于后T位的未标注交易数据推送给所述标注终端，其中，T为K与预设数值的乘积，所述预设数值为所述N份样本所涉及的所有负样本的条数与所有正样本的条数的比值。

可选的，如图4所示，所述装置还包括：

第一判断单元37，用于在所述推送单元34从各所述未标注交易数据选取至少一个未标注交易数据推送给标注终端之后，判断所述标注员对推送给所述标注终端的各未标注交易数据的标注结果与所述训练后的N个二分类模型对推送给所述标注终端的各未标注交易数据的预测分值之间的偏差是否在预设范围内；若不在所述预设范围内，确定所述训练后的N个二分类模型未收敛。

可选的，如图4所示，所述装置还包括：

第二判断单元38，用于在所述划分单元31将已标注交易样本集划分成N份样本之前，判断所述已标注交易样本集中的样本的特征是否满足预设的特征需求；若不满足所述特征需求，触发处理单元对各所述样本中的特征进行拼接和/或衍生处理，其中，所述样本中的特征包括用户基本信息特征和/或用户行为信息特征。

本发明实施例提供的反欺诈模型的训练装置中，各个功能模块运行过程中所采用的方法详解可以参见图1、图2方法实施例的对应方法详解，在此不再赘述。

进一步的，依据上述实施例，本发明的另一个实施例还提供了一种计算机可读存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的反欺诈模型的训练方法。

进一步的，依据上述实施例，本发明的另一个实施例还提供了一种存储管理设备，所述存储管理设备包括：

存储器，用于存储程序；

处理器，耦合至所述存储器，用于运行所述程序以执行上述中任意一项所述的反欺诈模型的训练方法。

本发明实施例公开了：

A1.一种反欺诈模型的训练方法，包括：

A2.根据A1所述的方法，将已标注交易数据集划分成N份样本，包括：

将所述已标注交易样本集所包括的样本切分为M个样本组，其中，每个所述样本组由至少一个样本组成，其中，M大于或等于N；

利用所述M个样本组生成所述N份样本，其中，每份样本中分别缺少M个样本组中的至少一个样本组，且不同份样本缺少的所述至少一个样本组中至少存在一个样本组不同。

A3.根据A2所述的方法，当M等于N时，每份样本分别缺少M个样本组中的一个样本组，且不同份样本缺少的样本组不同。

A4.根据A2所述的方法，将所述已标注交易样本集所包括的样本切分为M个样本组，包括：

按照所述已标注交易样本集中样本的存在顺序，将所述已标注交易样本集中的样本均分为M个样本组，其中，每个所述样本组包括的样本如下述公式所示：

A5.根据A1所述的方法，所述方法还包括：

当非首次训练所述N个二分类模型时，获取所述标注终端完成标注的已标注交易数据确定为样本，其中，所述已标注交易数据基于上一次训练的N个二分类模型向所述标注终端推送的未标注交易数据标注而得；

将上一次训练所述N个二分类模型所使用的N份样本中的所有样本和/或当前确定的样本，作为所述已标注交易样本集。

A6.根据A1所述的方法，基于各所述未标注交易数据在每一个所述二分类模型中的预测分值，从各所述未标注交易数据选取至少一个未标注交易数据推送给标注终端，包括：

基于各所述未标注交易数据在每一个所述二分类模型中的预测分值，确定各所述未标注交易数据的平均预测分值；

根据各所述未标注交易数据的平均预测分值的大小，对各所述未标注交易数据进行排序；

基于排序结果选取所述至少一个未标注交易数据推送给所述标注终端。

A7.根据A6所述的方法，基于排序结果选取所述至少一个未标注交易数据推送给所述标注终端，包括：

选取排序位于前K位的未标注交易数据推送给所述标注终端，其中，所述排序结果为按照各所述未标注交易数据的平均预测分值由大到小的排序结果，其中，K大于或等于1。

A8.根据A7所述的方法，所述方法还包括：

选取排序位于后T位的未标注交易数据推送给所述标注终端，其中，T为K与预设数值的乘积，所述预设数值为所述N份样本所涉及的所有负样本的条数与所有正样本的条数的比值。

A9.根据A1-A8中任一所述的方法，在从各所述未标注交易数据选取至少一个未标注交易数据推送给标注终端之后，所述方法还包括：

判断所述标注员对推送给所述标注终端的各未标注交易数据的标注结果与所述训练后的N个二分类模型对推送给所述标注终端的各未标注交易数据的预测分值之间的偏差是否在预设范围内；

若不在所述预设范围内，确定所述训练后的N个二分类模型未收敛。

A10.根据A1-A8中任一所述的方法，在将已标注交易样本集划分成N份样本之前，所述方法还包括：

判断所述已标注交易样本集中的样本的特征是否满足预设的特征需求；

若不满足所述特征需求，对各所述样本中的特征进行拼接和/或衍生处理，其中，所述样本中的特征包括用户基本信息特征和/或用户行为信息特征。

B1.一种反欺诈模型的训练装置，包括：

B2.根据B1所述的装置，所述划分单元包括：

切分模块，用于将所述已标注交易样本集所包括的样本切分为M个样本组，其中，每个所述样本组由至少一个样本组成，其中，M大于或等于N；

生成模块，用于利用所述M个样本组生成所述N份样本，其中，每份样本中分别缺少M个样本组中的至少一个样本组，且不同份样本缺少的所述至少一个样本组中至少存在一个样本组不同。

B3.根据B2所述的装置，当M等于N时，所述生成模块生成的每份样本分别缺少M个样本组中的一个样本组，且不同份样本缺少的样本组不同。

B4.根据B2所述的装置，所述切分模块，用于按照所述已标注交易样本集中样本的存在顺序，将所述已标注交易样本集中的样本均分为M个样本组，其中，每个所述样本组包括的样本如下述公式所示：

B5.根据B1所述的装置，所述装置还包括：

第二确定单元，用于当非首次训练所述N个二分类模型时，获取所述标注终端完成标注的已标注交易数据确定为样本，其中，所述已标注交易数据基于上一次训练的N个二分类模型向所述标注终端推送的未标注交易数据标注而得；将上一次训练所述N个二分类模型所使用的N份样本中的所有样本和/或当前确定的样本，作为所述已标注交易样本集。

B6.根据B1所述的装置，所述推送单元包括：

确定模块，用于基于各所述未标注交易数据在每一个所述二分类模型中的预测分值，确定各所述未标注交易数据的平均预测分值；

排序模块，用于根据各所述未标注交易数据的平均预测分值的大小，对各所述未标注交易数据进行排序；

推送模块，用于基于排序结果选取所述至少一个未标注交易数据推送给所述标注终端。

B7.根据B6所述的装置，所述推送模块，用于选取排序位于前K位的未标注交易数据推送给所述标注终端，其中，所述排序结果为按照各所述未标注交易数据的平均预测分值由大到小的排序结果，其中，K大于或等于1。

B8.根据B7所述的装置，所述推送模块，还用于选取排序位于后T位的未标注交易数据推送给所述标注终端，其中，T为K与预设数值的乘积，所述预设数值为所述N份样本所涉及的所有负样本的条数与所有正样本的条数的比值。

B9.根据B1-B8中任一所述的装置，所述装置还包括：

第一判断单元，用于在所述推送单元从各所述未标注交易数据选取至少一个未标注交易数据推送给标注终端之后，判断所述标注员对推送给所述标注终端的各未标注交易数据的标注结果与所述训练后的N个二分类模型对推送给所述标注终端的各未标注交易数据的预测分值之间的偏差是否在预设范围内；若不在所述预设范围内，确定所述训练后的N个二分类模型未收敛。

B10.根据B1-B8中任一所述的装置，所述装置还包括：

第二判断单元，用于在所述划分单元将已标注交易样本集划分成N份样本之前，判断所述已标注交易样本集中的样本的特征是否满足预设的特征需求；若不满足所述特征需求，触发处理单元对各所述样本中的特征进行拼接和/或衍生处理，其中，所述样本中的特征包括用户基本信息特征和/或用户行为信息特征。

C1.一种计算机可读存储介质，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行A1至A10中任意一项所述的反欺诈模型的训练方法。

D1.一种存储管理设备，所述存储管理设备包括：

存储器，用于存储程序；

处理器，耦合至所述存储器，用于运行所述程序以执行A1至A10中任意一项所述的反欺诈模型的训练方法。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

可以理解的是，上述方法及装置中的相关特征可以相互参考。另外，上述实施例中的“第一”、“第二”等是用于区分各实施例，而并不代表各实施例的优劣。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的深度神经网络模型的运行方法、装置及框架中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种反欺诈模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，将已标注交易数据集划分成N份样本，包括：

3.根据权利要求2所述的方法，其特征在于，当M等于N时，每份样本分别缺少M个样本组中的一个样本组，且不同份样本缺少的样本组不同。

4.根据权利要求2所述的方法，其特征在于，将所述已标注交易样本集所包括的样本切分为M个样本组，包括：

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，基于各所述未标注交易数据在每一个所述二分类模型中的预测分值，从各所述未标注交易数据选取至少一个未标注交易数据推送给标注终端，包括：

7.根据权利要求6所述的方法，其特征在于，基于排序结果选取所述至少一个未标注交易数据推送给所述标注终端，包括：

8.一种反欺诈模型的训练装置，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行权利要求1至权利要求7中任意一项所述的反欺诈模型的训练方法。

10.一种存储管理设备，其特征在于，所述存储管理设备包括：

存储器，用于存储程序；

处理器，耦合至所述存储器，用于运行所述程序以执行权利要求1至权利要求7中任意一项所述的反欺诈模型的训练方法。