CN110942248B

CN110942248B - 交易风控网络的训练方法及装置、交易风险检测方法

Info

Publication number: CN110942248B
Application number: CN201911171026.1A
Authority: CN
Inventors: 肖凯
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2019-11-26
Filing date: 2019-11-26
Publication date: 2022-05-31
Anticipated expiration: 2039-11-26
Also published as: CN110942248A

Abstract

本公开涉及机器学习领域，具体提供了一种交易风控网络的训练方法及装置、交易风险检测方法。交易风控网络包括第一风险预测网络和第二风险预测网络，第一风险预测网络为决策树网络，训练方法包括：获取第二时间段内采集到的最新的交易数据集；将最新的交易数据集输入已训练的第一风险预测网络，得到第一风险预测网络预测输出的各交易样本对应的第一训练特征和第二训练特征；将第一训练特征和第二训练特征输入已训练的第二风险预测网络，根据第二风险预测网络预测输出的交易风险分值和标签信息的损失，对第二风险预测网络中第一训练特征对应的网络参数进行调整，得到调整后的第二风险预测网络。本公开方法可有效解决风控网络的概念漂移。

Description

交易风控网络的训练方法及装置、交易风险检测方法

技术领域

本公开涉及机器学习领域，具体涉及一种交易风控网络的训练方法及装置、交易风险检测方法。

背景技术

机器学习算法是人工智能领域的核心，在使用机器学习算法构建深度学习网络时有一个重要假设，即训练时的数据分布和应用时的数据分布基本一致，从而通过样本训练实现准确预测。然而在一些场景下，学习网络随着时间的推移，往往会出现新的数据分布与已有数据分布不一致的情况，这种新数据分布与旧有数据分布存在不一致的现象称为概念漂移(Concept Drift)，处理应对概念漂移的方法称为模型自适应。

以风控领域为例，交易风控网络在应用中，随着时间推移，一方面由于网络本身对用户行为进行干预，进而会影响了后续的数据。另一方面，非法交易的作案者也会想办法绕过风控模型的稽核系统，行为也不会稳定。因此导致交易风控网络在上线一段时间后性能会逐渐下降，造成风险案件疏漏。因此，如何应对模型的概念漂移问题成为风控领域的重要问题。

发明内容

为解决交易风控网络的概念漂移问题，本公开提供了一种交易风控网络的训练方法及装置。

同时，为解决交易风控网络由于概念漂移导致对风险案件疏漏的技术问题，本公开提供了一种交易风险检测方法。

第一方面，本公开提供了一种交易风控网络的训练方法，所述交易风控网络包括第一风险预测网络和第二风险预测网络，所述第一风险预测网络为决策树网络，所述方法包括：

获取第二时间段内采集到的最新的交易数据集，所述交易数据集包括各交易样本的特征信息和标签信息，所述标签信息表征各交易样本的交易风险；

将最新的交易数据集输入已训练的所述第一风险预测网络，得到所述第一风险预测网络预测输出的各交易样本对应的第一训练特征和第二训练特征，所述第一训练特征为各交易样本对应的第一风险预测网络中的叶子节点标识，所述第二训练特征表示各交易样本对应的交易风险分值；

将所述第一训练特征和所述第二训练特征输入已训练的第二风险预测网络，根据所述第二风险预测网络预测输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整，得到调整后的第二风险预测网络。

在一些实施方式中，在所述获取第二时间段内采集到的最新的交易数据集之前，还包括：

获取第一时间段内采集到的历史交易数据集，所述历史交易数据集包括各交易样本的所述特征信息和所述标签信息；

基于所述历史交易数据集的特征信息，训练得到所述第一风险预测网络；

将所述历史交易数据集输入已训练的所述第一风险预测网络，得到所述第一风险预测网络预测输出的各交易样本对应的所述第一训练特征和所述第二训练特征；

将所述第一训练特征和所述第二训练特征输入待训练的第二风险预测网络，根据所述第二风险预测网络输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整，得到所述已训练的第二风险预测网络。

在一些实施方式中，所述根据所述第二风险预测网络输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整，包括：

设置所述第二风险预测网络的第二训练特征对应的网络参数为1，第一训练特征对应的网络参数为待训练参数。

在一些实施方式中，所述第一风险预测网络包括：

GBDT网络；或，XGBoost网络；或，梯度提升决策树网络。

在一些实施方式中，所述第二风险预测网络为逻辑回归LR网络。

在一些实施方式中，将交易数据集输入第一风险预测网络，得到第一风险预测网络预测输出的第二训练特征，包括：

将交易数据集输入所述第一风险预测网络，得到所述第一风险预测网络预测输出的各交易样本对应的预测分值；

对所述预测分值进行logit变换，得到所述第二训练特征。

第二方面，本公开提供了一种交易风险检测方法，包括：

获取交易数据信息；

将所述交易数据信息输入已训练的交易风控网络，得到所述交易风控网络预测输出的交易分值，所述交易分值用于表征所述交易数据信息对应的交易的风险；其中，所述交易风控网络是根据第一方面任一实施方式中所述的方法训练得到的。

在一些实施方式中，所述将所述交易数据信息输入已训练的交易风控网络，得到所述交易风控网络预测输出的交易分值，包括：

将所述交易数据信息输入已训练的第一风险预测网络，得到所述第一风险预测网络预测输出的所述交易数据信息对应的交易的第一训练特征和第二训练特征；

将所述第一训练特征和所述第二训练特征输入已训练的第二风险预测网络，得到所述第二风险预测网络预测输出的所述交易分值。

在一些实施方式中，在将所述交易数据信息输入已训练的交易风控网络，得到所述交易风控网络预测输出的交易分值之后，还包括：

判断所述交易分值是否大于预设阈值；

若是，则确定所述交易数据信息对应的交易为风险交易。

第三方面，本公开提供了一种交易风控网络的训练装置，所述交易风控网络包括第一风险预测网络和第二风险预测网络，所述第一风险预测网络为决策树网络，所述装置包括：

获取模块，用于获取第二时间段内采集到的最新的交易数据集，所述交易数据集包括各交易样本的特征信息和标签信息，所述标签信息表征各交易样本的交易风险；

处理模块，用于将最新的交易数据集输入已训练的所述第一风险预测网络，得到所述第一风险预测网络预测输出的各交易样本对应的第一训练特征和第二训练特征，所述第一训练特征为各交易样本对应的第一风险预测网络中的叶子节点标识，所述第二训练特征表示各交易样本对应的交易风险分值；以及

训练模块，用于将所述第一训练特征和所述第二训练特征输入已训练的第二风险预测网络，根据所述第二风险预测网络预测输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整，得到调整后的第二风险预测网络。

在一些实施方式中，在所述获取第二时间段内采集到的最新的交易数据集之前，

所述获取模块还用于，获取第一时间段内采集到的历史交易数据集，所述历史交易数据集包括各交易样本的所述特征信息和所述标签信息；

所述处理模块还用于，基于所述历史交易数据集的特征信息，训练得到所述第一风险预测网络；将所述历史交易数据集输入已训练的所述第一风险预测网络，得到所述第一风险预测网络预测输出的各交易样本对应的所述第一训练特征和所述第二训练特征；

所述训练模块还用于，将所述第一训练特征和所述第二训练特征输入待训练的第二风险预测网络，根据所述第二风险预测网络输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整，得到所述已训练的第二风险预测网络。

在一些实施方式中，所述训练模块在用于根据所述第二风险预测网络输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整时，具体用于：

第四方面，本公开提供了一种电子设备，包括：

处理器；和

存储器，与所述处理器可通信连接，其存储有能够被所述处理器执行的计算机可读指令，在所述计算机可读指令被执行时，所述处理器执行根据第一方面任一实施方式中所述的方法，或者第二方面任一实施方式中所述的方法。

第五方面，本公开提供了一种存储介质，存储有计算机可读指令，所述计算机可读指令用于使计算机执行根据第一方面任一实施方式所述的方法，或者第二方面任一实施方式中所述的方法。

本公开任一实施方式提供的风控模型训练方法，在应对风控网络概念漂移时，利用最新的交易数据集对交易风控网络进行修正，将最新的交易数据集输入已训练的所述第一风险预测网络，得到所述第一风险预测网络预测输出的各交易样本对应的第一训练特征和第二训练特征，再利用第一风险预测网络输出的新特征和标签信息，仅需对第二风险预测网络中第一训练特征对应的网络参数进行调整，可在第一风险预测网络分值的基础上对风控网络进行优化，无需重新训练新网络，使得风控网络的修正更加方便快速。并且无需训练和维护多个网络，网络计算预测效率更高。同时由于交易风控网络保留了旧有数据信息，因此对旧风险的防控更有效。

附图说明

为了更清楚地说明本公开具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是决策树网络的网络结构示意图；

图2是根据本公开一些实施方式中交易风控网络的训练方法的流程图。

图3是根据本公开另一些实施方式中交易风控网络的训练方法的流程图。

图4是根据本公开一个具体实施方式中交易风控网络的训练方法原理图。

图5是根据本公开一个具体实施方式中交易风控网络的训练方法流程图。

图6是根据本公开另一个具体实施方式中交易风控网络的训练方法流程图。

图7是根据本公开一些实施方式中交易风险检测方法的流程图。

图8是根据本公开另一些实施方式中交易风险检测方法的流程图。

图9是根据本公开又一些实施方式中交易风险检测方法的流程图。

图10是根据本公开一些实施方式中交易风控网络训练装置的结构图。

图11是适于用来实现本公开方法的计算机系统结构示意图。

具体实施方式

下面将结合附图对本公开的技术方案进行清楚、完整地描述，显然，所描述的实施方式是本公开一部分实施方式，而不是全部的实施方式。基于本公开中的实施方式，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式，都属于本公开保护的范围。此外，下面所描述的本公开不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

第一方面，本公开提供了一种交易风控网络的训练方法，该方法适用于对风控网络进行更新，从而解决风控网络的概念漂移问题。

需要说明的是，对于金融交易提供平台而言，为了降低用户的交易风险以及对非法交易的稽核，往往需要对用户的资金交易进行风险评估，对于风险较高的交易进行阻止或异常状态处理，从而减少用户损失。而交易风控网络正是用于对用户交易行为进行风险预测的网络，通过对资金交易特征进行预测计算，输出该交易对应的风险标识，风控系统根据风险标识采取相应处理操作。

对于风控网络，一方面由于其本身会对用户的交易行为进行干预，例如风控网络认定某笔交易为风险交易，从而阻止该交易或进行异常提醒，造成用户在后续交易中改变自身行为。另一方面，在风控网络进行一段时间的使用后，非法交易的作案者也会根据网络相应调整交易行为特征，导致风控网络无法准确预测交易风险。因此风控网络在上线一段时间后就会出现概念漂移，无法有效的对用户交易进行风险预测，造成非法交易的疏漏，给用户带来损失。

为了解决风控网络的概念漂移问题，现有技术中对风控网络进行更新的方法大致包括三类。1)重新训练：指利用最新时间段内的交易数据样本集，重新训练一个新的风控网络，从而替换掉旧的网络。2)模型集成：指保留旧的风控网络，利用最新时间段内的交易数据样本集重新训练一个新的风控网络，再将新的网络和旧的网络进行集成，例如可以直接把两个网络进行加权求和，或者也可以将旧网络的预测分值输入新的网络变量中。3)模型更新修正：采用增量学习的方式对旧的风控网络进行更新。

但是以上方法均存在缺陷，例如对于方法1)，重新训练和替代部署旧网络的代价很大，而且抛弃掉旧有网络可能导致无法识别相对较老的作案手法，造成风险案件遗漏。对于方法2)，随着时间的推移，网络数量将增多，需要同时维护多个网络，增加成本，同时多个网络计算时间也会增长，降低风控网络计算效率。对于方法3)，增量学习适用性较低，仅适用于神经网络类算法，对于树类网络无法更新。

正是基于上述，本公开提供了一种交易风控网络的训练方法，该交易风控网络包括第一风险预测网络和第二风险预测网络，第一风险预测网络为决策树网络。决策树是一种树类网络，其每个内部节点表示对一个交易特征的判断，每个分支代表一个判断结果的输出，最后每个叶子节点代表一种分类结果。为便于说明，例如图1所示，图1中示出了一个树结构的分类网络，在图中，每个“○”代表节点，表示例如“金额是否大于100元”“交易频率是否超过预设值”等判断条件，每个节点对应的两分支则代表对该节点表示条件是否满足的判断，判断至最后的4、6、7、3对应的节点称为叶子节点。

图2中示出了本公开一些实施方式中训练方法的流程图。如图2所示，在一些实施方式中，本公开方法包括：

S10、获取第二时间段内采集到的最新的交易数据集。

具体而言，在对交易风控网络进行更新时，首先获取第二时间段内采集到的最新的交易样本数据集。交易数据集包括各交易样本的特征信息和标签信息，标签信息表征各交易样本的交易风险。

第二时间段可以根据风控网络概念漂移的程度周期性设置，例如以星期为单位，在对网络更新时，可获取最近一星期内的交易数据集样本进行训练。

交易数据集包括各个交易样本的特征信息和标签信息，特征信息指每笔交易对应的交易行为特征，例如每笔交易的金额、时间、类型等。标签信息可以是例如根据用户反馈或机器判断，生成的表示该笔交易风险的黑白标签。例如，对于某笔交易，若用户在预设时间内进行举报投诉，则认为该交易为风险交易，标签信息可表示为“1”。若未来预设时间内接收到用户反馈，则认为该交易为正常交易，标签信息则可表示为“0”。

S20、将最新的交易数据集输入已训练的第一风险预测网络，得到第一风险预测网络输出的各交易样本对应的第一训练特征和第二训练特征。

具体而言，将最新的交易数据集中各个交易样本对应的特征信息输入第一风险预测网络中，输出预测的第一训练特征和第二训练特征。第一风险预测网络为决策树网络，其根据交易样本的各特征信息进行计算，得到预测输出的各交易样本对应的叶子节点标识，以及决策树网络首先预测输出的各交易样本的交易风险分值。

为便于理解，在一个示例性的实施中，假设第一风险预测网络的结构如图1所示，某笔交易特征输入第一风险预测网络后，网络预测该笔交易对应的叶子节点为6，则对应的叶子节点标识可表示为“000006”，同时得到该叶子节点对应的交易风险分值。

S30、将第一训练特征和第二训练特征输入已训练的第二风险预测网络，根据第二风险预测网络预测输出的交易风险分值和标签信息的损失，对第二风险预测网络中第一训练特征对应的网络参数进行调整，得到调整后的第二风险预测网络。

具体而言，需要说明的是，通过前述可知，第一风险预测网络在出现概念漂移问题时，由于树类网络无法实现增量学习更新，因此第一风险预测网络无法利用新数据实现对第一风险预测网络的更新优化。

因此，将步骤S20中第一风险预测网络输出的第一训练特征和第二训练特征，作为新的特征输入已训练的第二风险预测网络中。根据第二风险预测网络对应输出的交易风险分值，得到预测交易风险分值和各交易样本的标签信息之间的损失，根据损失对第二风险预测网络中第一训练特征对应的网络参数进行调整，得到调整后的第二风险预测网络。

通过上述可知，本公开一些实施方式提供的训练方法，利用第二风险预测网络与第一风险预测网络进行网络融合，在对风控网络进行更新时，利用新时段的交易数据样本集对第二风险预测网络进行更新调整，而第一风险预测网络不用调整，从而实现对新数据的增量学习，有效解决概念漂移的问题，同时实现对树结构网络的增量学习。并且，在对第二风险预测网络参数进行调整时，仅针对第一训练特征对应的网络参数进行调整，相当于在第一风险预测网络预测分值的基础上，利用新数据对预测结果进一步优化修正，使得风控网络的更新修正更加方便快速。并且由于仅需利用新数据对已有的交易风控网络进行更新优化，无需重新训练新网络，因此也无需训练和维护多个网络，网络计算预测效率更高。同时由于交易风控网络保留了旧有数据信息，因此对旧风险的防控更有效。

上述对本公开一些实施方式中提供的交易风控网络的训练方法进行了说明，在一些实施方式中，在对交易风控网络进行更新优化之前，本公开训练方法还包括对交易风控网络的训练。图3中示出了对交易风控网络进行训练的过程。

如图3所示，在一些实施方式中，在获取第二时间段内采集到的最新的交易数据集之前，本公开提供的训练方法还包括：

S40、获取第一时间段内采集到的历史交易数据集。

具体而言，第一时间段可以根据风控网络概念漂移的程度周期性设置，利于可与步骤S10中第二时间段周期相同，而第一时间段表示训练初始交易风控网络的数据样本，因此第一时间段数据应早于第二时间段数据。

在一个示例性的实施方式中，时间段可以T时间为周期，第二时间段表示T时间段，第一时间段表示为T-1时间段。

历史交易数据集包括各个交易样本的特征信息和标签信息，特征信息指每笔交易对应的交易行为特征，例如每笔交易的金额、时间、类型等。标签信息可以是例如根据用户反馈或机器判断，生成的表示该笔交易风险的黑白标签。例如，对于某笔交易，若用户在预设时间内进行举报投诉，则认为该交易为风险交易，标签信息可表示为“1”。若未来预设时间内接收到用户反馈，则认为该交易为正常交易，标签信息则可表示为“0”。

S50、基于历史交易数据集的特征信息，训练得到第一风险预测网络。

具体而言，第一风险预测网络为决策树网络，由前述可知，决策树网络为树结构网络，树网络中每个节点表示对一个交易特征的判断。因此，可根据交易数据集中交易样本的特征信息，训练得到树结构网络，并对树网络进行保存。

S60、将历史交易数据集输入已训练的第一风险预测网络，得到第一风险预测网络预测输出的各交易样本对应的第一训练特征和第二训练特征。

具体而言，将历史交易数据集中各个交易样本对应的特征信息输入第一风险预测网络中，输出预测的第一训练特征和第二训练特征。第一风险预测网络根据交易样本的各特征信息进行计算，得到预测输出的各交易样本对应的叶子节点标识，以及决策树网络首先预测输出的各交易样本的交易风险分值。

在一个示例性的实施中，树网络结构如图1所示，某笔交易特征输入第一风险预测网络后，网络预测该笔交易对应的叶子节点为6，则对应的叶子节点标识可表示为“000006”，同时得到该叶子节点对应的交易风险分值。

S70、将第一训练特征和第二训练特征输入待训练的第二风险预测网络，根据第二风险预测网络输出的交易风险分值和标签信息的损失，对第二风险预测网络中第一训练特征对应的网络参数进行调整，得到已训练的第二风险预测网络。

具体而言，将步骤S60中树网络预测输出的第一训练特征和第二训练特征，作为新的特征对待训练的第二风险预测网络进行训练。根据第二风险预测网络对应输出的交易风险分值，得到预测交易风险分值和各交易样本的标签信息之间的损失，根据损失对第二风险预测网络中第一训练特征对应的网络参数进行调整，得到已训练的第二风险预测网络。

通过上述可知，本公开一些实施方式提供的训练方法，利用第二风险预测网络与第一风险预测网络进行网络融合，在对风控网络进行训练时，利用第一风险预测网络构造新特征，即第一训练特征和第二训练特征。利用新特征对第二风险预测网络进行训练，通过网络融合实现对树结构网络的增量学习，提高交易风控网络的模型自适应能力。

在一些实施方式中，第一风险预测网络为决策树网络，决策树网络可以为例如GBDT网络、XGBoost网络、梯度提升决策树网络等。第二风险预测网络可以为例如逻辑回归LR网络等，本公开对此不作限制。

在一些实施方式中，在对第二风险预测网络进行训练或更新时，由于只针对第一训练特征的参数进行调整，因此可设置第二风险预测网络的第二训练特征对应的网络参数为1，设置第一训练特征对应的网络参数为待训练参数，从而只针对第一训练特征的网络参数调整。

图4、图5中示出了本公开一个具体实施方式中对初始交易风险网络进行训练的过程。在本实施方式中，第一风险预测网络以XGBoost树结构网络为例，第二风险预测网络以逻辑回归LR网络为例。

参见图4、图5，在本实施方式中，本公开的训练方法包括：

S1、获取T-1时间段内采集到的交易数据集。

具体而言，T-1时间段表示以T为时间周期的，当前时间的上一时间周期，例如以“月”为时间周期，T时间段可表示为“当月”，T-1时间段则可表示为“上月”。

交易数据集以图4中表格所示，其包括多个交易样本数据，每一个交易样本数据包括有特征信息，即“f1”、“f2”等，特征信息指该交易样本对应的交易行为特征，例如交易的金额、时间、类型等。交易样本数据还包括有标签信息，即“label”，标签信息可以是根据用户反馈或机器判断，生成的表示该笔交易风险的黑白标签。其中，对于有风险的交易，标签信息可表示为“1”，无风险交易，标签信息表示为“0”。

S2、基于T-1时间段的交易数据集的特征信息，训练得到XGBoost网络。

具体而言，训练XGBoost网络结构时，首先以交易样本的特征信息构建树结构网络，以图4所示，树网络中每个节点表示对一个交易特征的判断，两个分支表示对该判断结果的输出，依次类推。然后将交易样本的特征信息输入XGBoost网络中，得到XGBoost网络预测输出的分值，根据各交易样本的标签信息与分值的损失，对应调整网络结构，得到训练后的XGBoost网络。

S3、将T-1时间段的交易数据集输入XGBoost网络，得到XGBoost网络输出的叶子节点标识和预测输出的交易风险分值。

具体而言，将交易数据集中各交易样本的特征信息输入XGBoost网络中，XGBoost网络根据各特征对交易样本进行判断分类，得到该交易样本对应的叶子节点标识和预测分值，预测分值表示该交易对应的交易风险。

在一个示例中，将某笔交易样本的特征输入XGBoost网络中，网络根据各特征的判断分类，得到该笔交易对应的叶子节点为6，则对应的叶子节点标识可表示为“000006”，同时得到该叶子节点对应的交易风险分值。

S4、将叶子节点标识和交易风险分值输入待训练的LR网络中，根据LR网络预测输出的交易风险分值和标签信息的损失，对叶子节点标识对应的网络参数进行调整，得到训练后的LR网络。

具体而言，将步骤S3中XGBoost网络输出的叶子节点标识和交易风险分值作为新特征，对LR网络进行训练。在对LR网络训练时，首先对XGBoost网络预测的交易风险分值进行logit变换，公式为：

式中，s表示XGBoost网络预测输出的交易风险分值。从而得到转换后的logit值，将叶子节点标识和转换后的logit值输入LR网络中，LR网络利用sigmoid函数计算预测输出交易风险分值，根据该交易风险分值与交易样本的标签信息之间的损失，对LR网络中叶子节点表示对应的网络参数进行调整，直至损失满足预设阈值，得到已训练的LR网络。

在本实施方式中，在对LR网络进行训练时，设置交易风险分值对应的网络参数为1，将叶子节点标识对应的网络参数设置为待训练参数，从而只针对叶子节点标识对应的网络参数调整。

上述步骤S1～S4即通过T-1时间段的交易数据样本训练得到初始交易风控网络。通过上述可知，本实施方式中，通过XGBoost和LR网络融合建立交易风控网络，基于梯度提升优化了风控网络的性能。在对用户交易进行预测时，直接将交易特征输入训练后的交易风控网络中，即可得到风控网络预测输出的交易分值，交易分值表示交易数据信息对应的交易的风险，风控系统可根据交易分值对该交易采取相应的操作。

当初始交易风控网络在使用一段时间后，产生概念漂移的问题，从而可利用T时间周期内的交易数据样本对交易风控网络进行优化修正。图6中示出了本实施方式中对初始交易风控网络进行优化修正的过程。

如图6所示，在本实施方式中，本公开的训练方法包括：

S5、获取T时间段内的交易数据集。

具体而言，T时间段表示以T为时间周期的当前时间周期，例如以“月”为时间周期，T时间段的交易数据集可表示当月最新的交易数据样本集。交易数据集可参照上述步骤S1描述，在此不再赘述。

S6、将交易数据集输入已训练的XGBoost网络，得到XGBoost网络输出的叶子节点标识和预测输出的交易风险分值。

具体而言，将交易数据集中各交易样本的特征信息输入初始交易风控网络中的XGBoost网络中，XGBoost网络根据各特征对交易样本进行判断分类，得到该交易样本对应的叶子节点标识和预测分值，预测分值表示该交易对应的交易风险。

S7、将叶子节点标识和交易风险分值输入已训练的LR网络中，根据LR网络预测输出的交易风险分值和标签信息的损失，对叶子节点标识对应的网络参数进行调整，得到调整后的LR网络。

具体而言，将步骤S6中XGBoost网络输出的叶子节点标识和交易风险分值作为新特征，对LR网络中的叶子节点标识对应的网络参数进行优化修正。具体修正过程与上述步骤S4即可，不再赘述。得到优化后的交易风控网络，从而解决概念漂移问题。

通过上述可知，本公开方法通过XGBoost和LR网络融合建立交易风控网络，基于梯度提升优化风控网络，在对风控网络进行更新时，可利用T时段的新数据对LR网络进行更新调整，而XGBoost树网络不用调整，从而实现对新数据的增量学习，有效解决概念漂移的问题，同时实现对树结构网络的增量学习。并且，在对LR网络参数进行调整时，仅针对叶子节点标识对应的网络参数进行调整，相当于在XGBoost网络预测分值的基础上，利用新数据对预测结果进一步优化修正，使得风控网络的更新修正更加方便快速。并且由于仅需利用新数据对已有的交易风控网络进行更新优化，无需重新训练新网络，因此也无需训练和维护多个网络，网络计算预测效率更高。同时由于交易风控网络保留了旧有数据信息，因此对旧风险的防控更有效。

需要说明的是，本公开的交易风控网络中的第一风险预测网络和第二风险预测网络不局限于本实施方式中所述网络结构，也可以是其他结构形式的网络，例如树模型网络还可以是GBDT网络、梯度提升决策树网络等，第二风险预测网络也可以是其他形式的逻辑回归网络，本领域技术人员在上述公开的基础上可以实现其他替代形式，本公开对此不作限制。

第二方面，本公开提供了一种交易风险检测方法，该方法基于第一方面任一实施方式中的交易风控网络实现对用户交易的风险预测。如图7、图8所述，在一些实施方式中，本公开的检测方法包括：

S100、获取交易数据信息。

交易数据信息包括该笔交易对应的特征信息，例如交易金额、时间、类型等。

S200、将交易数据信息输入已训练的交易风控网络，得到交易风控网络预测输出的交易分值。

具体而言，交易风控网络为本公开第一方面任一实施方式中的交易风控网络，将交易数据信息的特征信息输入风控网络中，得到风控网络预测输出的交易分值具体为：

S210、将交易数据信息输入已训练的第一风险预测网络，得到第一风险预测网络预测输出的交易数据信息对应的交易的第一训练特征和第二训练特征。

具体而言，以图5、图6实施方式为例，在步骤S210中，将交易数据信息的特征信息输入XGBoost网络中，XGBoost网络根据各特征对该交易进行判断分类，得到该交易对应的叶子节点标识和预测分值。

S220、将第一训练特征和第二训练特征输入已训练的第二风险预测网络，得到第二风险预测网络预测输出的交易分值。

具体而言，仍以图5、图6实施方式为例，在步骤S220中，将该交易对应的叶子节点标识和预测分值输入已训练的LR网络中，从而得到LR网络预测输出的交易分值。

在一些实施方式中，如图9所示，在步骤S220之后，本公开的检测方法还包括

S230、判断交易分值是否大于预设阈值。若是，执行步骤S240。若否，执行步骤S250。

S240、确定交易数据信息对应的交易为风险交易。

S250、确定交易数据信息对应的交易为非风险交易。

具体而言，在步骤S230～S250中，在得到LR网络预测输出的交易分值之后，风控系统可预先设置预设阈值，进而判断该交易的交易分值是否超过预设阈值。若交易分值超过预设阈值，则认为该交易存在较高的交易风险，为风险交易。若交易分值未超过预设阈值，则认为该交易无交易风险，为非风险交易。

在一个示例性的实施中，交易风控网络输出的预测交易分值为0.8，预设阈值为0.7，则确定该交易为风险交易。进而风控系统对该交易进行阻止或发送安全验证，避免造成用户损失。

通过上述可知，本公开提供的交易风险检测方法，可有效针对用户交易进行风险检测，且交易风控网络可利用新数据进行更新优化，避免概念漂移，对用户交易的风险检测更加准确，并且无需训练和维护多个网络，网络计算预测效率更高，同时由于交易风控网络保留了旧有数据信息，因此对旧风险的防控更有效。

第三方面，本公开提供了一种交易风控网络的训练装置，交易风控网络为第一方面任一实施方式中所述的交易风控网络。如图10所示，训练装置包括：

获取模块10，用于获取第二时间段内采集到的最新的交易数据集，交易数据集包括各交易样本的特征信息和标签信息，标签信息表征各交易样本的交易风险；

处理模块20，用于将最新的交易数据集输入已训练的第一风险预测网络，得到第一风险预测网络预测输出的各交易样本对应的第一训练特征和第二训练特征，第一训练特征为各交易样本对应的第一风险预测网络中的叶子节点标识，第二训练特征表示各交易样本对应的交易风险分值；以及

训练模块30，用于将第一训练特征和第二训练特征输入已训练的第二风险预测网络，根据第二风险预测网络预测输出的交易风险分值和标签信息的损失，对第二风险预测网络中第一训练特征对应的网络参数进行调整，得到调整后的第二风险预测网络。

在一些实施方式中，在获取第二时间段内采集到的最新的交易数据集之前，

获取模块10还用于，获取第一时间段内采集到的历史交易数据集，历史交易数据集包括各交易样本的特征信息和标签信息；

处理模块20还用于，基于历史交易数据集的特征信息，训练得到第一风险预测网络；将历史交易数据集输入已训练的第一风险预测网络，得到第一风险预测网络预测输出的各交易样本对应的第一训练特征和第二训练特征；

训练模块30还用于，将第一训练特征和第二训练特征输入待训练的第二风险预测网络，根据第二风险预测网络输出的交易风险分值和标签信息的损失，对第二风险预测网络中第一训练特征对应的网络参数进行调整，得到已训练的第二风险预测网络。

在一些实施方式中，训练模块30在用于根据第二风险预测网络输出的交易风险分值和标签信息的损失，对第二风险预测网络中第一训练特征对应的网络参数进行调整时，具体用于：

本公开提供的交易风控网络训练装置，利用第二风险预测网络与第一风险预测网络进行网络融合，在对风控网络进行更新时，利用新时段的交易数据样本集对第二风险预测网络进行更新调整，而第一风险预测网络不用调整，从而实现对新数据的增量学习，有效解决概念漂移的问题，同时实现对树结构网络的增量学习。并且，在对第二风险预测网络参数进行调整时，仅针对第一训练特征对应的网络参数进行调整，相当于在第一风险预测网络预测分值的基础上，利用新数据对预测结果进一步优化修正，使得风控网络的更新修正更加方便快速。并且由于仅需利用新数据对已有的交易风控网络进行更新优化，无需重新训练新网络，因此也无需训练和维护多个网络，网络计算预测效率更高。同时由于交易风控网络保留了旧有数据信息，因此对旧风险的防控更有效。

第四方面，本公开提供了一种电子设备，其包括：

处理器；和

存储器，与所述处理器可通信连接，其存储有能够被所述处理器执行的计算机可读指令，在所述计算机可读指令被执行时，所述处理器执行根据第一方面任一实施方式所述的方法，或者第二方面任一实施方式中所述的方法。

具体而言，图11示出了适于用来实现本公开方法或处理器的计算机系统600的结构示意图，通过图11所示系统，实现第四方面和第五方面提供的电子设备及存储介质相应功能。

如图11所示，计算机系统600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本公开的实施方式，上文方法过程可以被实现为计算机软件程序。例如，本公开的实施方式包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，计算机程序包含用于执行上述方法的程序代码。在这样的实施方式中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。

附图中的流程图和框图，图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

显然，上述实施方式仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本公开创造的保护范围之中。

Claims

1.一种交易风控网络的训练方法，所述交易风控网络包括第一风险预测网络和第二风险预测网络，所述第一风险预测网络为决策树网络，所述方法包括：

将所述第一训练特征和所述第二训练特征输入已训练的第二风险预测网络，根据所述第二风险预测网络预测输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整，得到调整后的第二风险预测网络；

所述根据所述第二风险预测网络输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整，包括：

2.根据权利要求1所述的训练方法，在所述获取第二时间段内采集到的最新的交易数据集之前，还包括：

3.根据权利要求1或2所述的训练方法，所述第一风险预测网络包括：

基于GBDT算法的网络；或，基于XGBoost算法的网络。

4.根据权利要求1或2所述的训练方法，所述第二风险预测网络为逻辑回归LR网络。

5.根据权利要求4所述的训练方法，将交易数据集输入第一风险预测网络，得到第一风险预测网络预测输出的第二训练特征，包括：

对所述预测分值进行logit变换，得到所述第二训练特征。

6.一种交易风险检测方法，包括：

获取交易数据信息；

将所述交易数据信息输入已训练的交易风控网络，得到所述交易风控网络预测输出的交易分值，所述交易分值用于表征所述交易数据信息对应的交易的风险；其中，所述交易风控网络是根据权利要求1至5任一项所述的方法训练得到的。

7.根据权利要求6所述的交易风险检测方法，所述将所述交易数据信息输入已训练的交易风控网络，得到所述交易风控网络预测输出的交易分值，包括：

8.根据权利要求6所述的交易风险检测方法，在将所述交易数据信息输入已训练的交易风控网络，得到所述交易风控网络预测输出的交易分值之后，还包括：

判断所述交易分值是否大于预设阈值；

若是，则确定所述交易数据信息对应的交易为风险交易。

9.一种交易风控网络的训练装置，所述交易风控网络包括第一风险预测网络和第二风险预测网络，所述第一风险预测网络为决策树网络，所述装置包括：

训练模块，用于将所述第一训练特征和所述第二训练特征输入已训练的第二风险预测网络，根据所述第二风险预测网络预测输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整，得到调整后的第二风险预测网络；

所述训练模块在用于根据所述第二风险预测网络输出的交易风险分值和所述标签信息的损失，对所述第二风险预测网络中第一训练特征对应的网络参数进行调整时，具体用于：

10.根据权利要求9所述的训练装置，在所述获取第二时间段内采集到的最新的交易数据集之前，

11.一种电子设备，包括：

处理器；和

存储器，与所述处理器可通信连接，其存储有能够被所述处理器执行的计算机可读指令，在所述计算机可读指令被执行时，所述处理器执行根据权利要求1至5任一项所述的方法，或者6至8任一项所述的方法。