WO2019015461A1

WO2019015461A1 - 一种基于迁移深度学习的风险识别方法以及系统

Info

Publication number: WO2019015461A1
Application number: PCT/CN2018/093413
Authority: WO
Inventors: 李旭瑞; 邱雪涛; 赵金涛; 胡奕
Original assignee: 中国银联股份有限公司
Priority date: 2017-07-18
Filing date: 2018-06-28
Publication date: 2019-01-24
Also published as: TW201909090A; CN107679859A; TWI769271B; CN107679859B

Abstract

本发明涉及基于迁移深度学习的交易风险识别方法以及系统。该方法包括：对所有可能特征经过规定预处理生成向量，将向量集作为第一RBM(即受限玻尔兹曼机)的可见层输入而由此建立一层RBM；利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行迁移加权BP调优；以及判断BP调优后的RBM是否满足规定条件，若满足则不需要增加RBM层并继续下述步骤，若不满足规定条件，则重复进行RBM构建和迁移加权BP调优。根据本发明能够建立更准确的判别模型并且更好地应对新兴的欺诈手段。

Description

一种基于迁移深度学习的风险识别方法以及系统

技术领域

本发明涉及计算机技术，更具体地涉及一种基于迁移深度学习的交易风险识别方法以及系统。

背景技术

在利用机器学习进行欺诈风险识别的环节中，目前一般采用有监督的分类算法训练侦测模型。传统的分类学习算法需要预先进行特征选择和计算。而这些用于训练模型的特征很大一部分(尤其是那些经过统计得出的特征)都是根据历史欺诈数据集中总结出的规律推演出来的，这需要大量的经验积累，并且难免疏漏。

同时，在利用历史交易数据进行欺诈风险识别模型训练的时候，存在着严重的数据不平衡性，即带有欺诈标签的样本数量远远小于非欺诈样本的数量。人们总是尝试使用多种算法和技巧来减少数据不平衡性带来的影响，总体的思想无非大多是基于欠采样(大大减少使用的非欺诈交易样本数量)和过采样(人为地扩展欺诈交易样本的数量)。这些方法总是无法避免地破坏了现实中交易数据的分布特性，这种样本失真问题会影响最终模型在现实应用中的效果。

另一方面，随着信用卡支付和移动支付的普及，欺诈手段也变得五花八门。先前的一些欺诈特征可能并不适用于当前形势，而另一部分更符合当前形势的欺诈特征却还未被发现。这在一定程度上影响了风险识别的准确率，尤其是对未知欺诈手段的交易风险识别能力较差。

可以看到在现有技术中存在以下这些弱点：

人工选取特征的不准确性；

为缓解数据不平衡性带来的样本失真；

对缺乏欺诈样本的未知欺诈类型难以识别。

发明内容

鉴于所述问题，本发明旨在提供一种能够缓解人为选取特征的复杂性并能够更好识别新型欺诈手段的基于基于迁移深度学习的交易风险识别方法以及系统。

本发明的基于迁移深度学习的交易风险识别方法，其特征在于，具备下述步骤：

RBM构建步骤，对所有可能特征经过规定预处理，每一笔交易就会被映射成为一个向量，将向量集作为第一RBM的可见层输入而由此建立一层RBM，其中，每一个RBM具有一个可见层和一个隐藏层；

BP调优步骤，利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行迁移加权BP调优；

第一判断步骤，根据上述BP调优步骤的结果判断是否满足规定条件，若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断步骤，若判断结果为不满足规定条件，则重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止；以及

第二判断步骤，判断是否隐藏层层数为奇数，若隐藏层层数为奇数，则停止构建RBM层并生成最终模型，若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止。

优选地，在所述RBM构建步骤中利用对比散度算法对新增的RBM层进行训练。

优选地，在所述BP调优步骤中，训练一层RBM就进行一次BP调优，每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优。

优选地，所述BP调优步骤包括下述子步骤：

利用已知欺诈样本进行迁移学习；

每当训练完一层RBM之后，对当前误差进行BP调优以此来优化网络参数。

优选地，在所述第一判断步骤中，当判断RBM的重构误差e _R＜ξ 的情况下则不需要增加RBM层并继续所述第二判断步骤，若判断结果为重构误差e _R＞ξ的情况下则重复进行上述RBM构建步骤和上述BP调优步骤直到满足断RBM的重构误差e _R＜ξ为止。

优选地，设训练样本个数为N，可见层的特征维度为n _v，对于每个样本

使用RBM的分布进行一次Gibbs采样后，根据概率转移公式

以及

得到经过隐藏层重构的可见层采样v ^io，由此，所述重构误差可以表示为

优选地，所述规定预处理包括：对变量进行归一化、one-hot编码、连续值的WOE变换中的一种。

本发明的基于迁移深度学习的交易风险识别系统，其特征在于，具备：

RBM构建模块，对所有可能特征经过规定预处理，每一笔交易就会被映射成为一个向量，将向量集作为第一RBM的可见层输入而由此建立一层RBM，其中，每一个RBM具有一个可见层和一个隐藏层；

BP调优模块，利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行BP调优；

第一判断模块，根据上述BP调优模块的结果判断是否满足规定条件，若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断模块执行的动作，若判断结果为不满足规定条件，则重复进行由上述RBM构建模块和上述BP调优模块执行的动作，直到满足上述规定条件为止；以及

第二判断模块，判断是否隐藏层层数为奇数，若隐藏层层数为奇数，则停止构建RBM层并生成最终模型，若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建模块和BP调优模块执行的动作，直到满足上述规定条件为止。

优选地，所述RBM构建模块利用对比散度算法对新增的RBM层进行训练。

优选地，所述BP调优模块训练一层RBM就进行一次BP调优，每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优。

优选地，所述BP调优模块利用已知欺诈样本进行迁移学习，并且，每当训练完一层RBM之后，对当前误差进行BP调优以此来优化网络参数。

优选地，所述第一判断模块当判断RBM的重构误差e _R＜ξ的情况下则不需要增加RBM层并继续所述第二判断模块执行的动作，若判断结果为重构误差e _R＞ξ的情况下则重复进行上述RBM构建模块和上述BP调优模块执行的动作直到满足断RBM的重构误差e _R＜ξ为止。优选地，所述第一判断模块中，设训练样本个数为N，可见层的特征维度为n _v，对于每个样本

使用RBM的分布进行一次Gibbs采样后，根据概率转移公式

以及

优选地，所述RBM构建模块进行的规定预处理包括：对变量进行归一化、one-hot编码、连续值的WOE变换中的一种。

本发明还提供一种计算机可读介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现上述本发明的基于迁移深度学习的交易风险识别方法的步骤。

本发明还提供一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述本发明的基于迁移深度学习的交易风险识别方法的步骤。

根据本发明的基于迁移深度学习的交易风险识别方法以及风险识别系统，能够更好地应对新兴的未知欺诈手段，能够建立更准确的判别。

附图说明

图1是本发明的基于基于迁移深度学习的交易风险识别方法的主要步骤流程图。

图2是表示逐层降维的示意图。

图3表示了构建的层RBM层的示意图。

图4是表示本发明的基于迁移深度学习的交易风险识别方法的一个实施方式的流程示意图。

图5是表示本发明的基于迁移深度学习的交易风险识别系统的构造图。

具体实施方式

下面介绍的是本发明的多个实施例中的一些，旨在提供对本发明的基本了解。并不旨在确认本发明的关键或决定性的要素或限定所要保护的范围。

首先，对于在本发明中将要提及的几个概念进行说明。

(1)受限玻尔兹曼机(Restricted Boltzmann Machine，RBM)

RBM是一种可通过输入数据集学习概率分布的随机生成神经网络。RBM是一种玻尔兹曼机的变体，但限定模型必须为二分图。模型中包含对应输入参数的可见单元(以下也称为可见层)和对应训练结果的隐藏单元(以下也称为隐藏层)，每条边必须连接一个可见单元和一个隐单元。

(2)BP算法(即误差反向传播算法)

BP算法是在有导师指导下，适合于多层神经元网络的一种学习算法，它建立在梯度下。反向传播算法主要由两个环节(激励传播、权重更新)反复循环迭代，直到网络的对输入的响应达到预定的目标范围为止。

(3)Gibbs采样

Gibbs采样方法是指，马尔可夫链蒙特卡尔理论(MCMC)中用来获取一系列近似等于指定多维概率分布(比如2个或者多个随即变量的联合概率分布)观察样本的算法。

RBM构建步骤S100：对所有可能特征经过规定预处理，每一笔交易就会被映射成为一个向量，将向量集作为第一RBM的可见层输入而由此建立一层RBM，其中，每一个RBM具有一个可见层和一个隐藏层；

BP调优步骤S200：利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行迁移加权BP调优；

第一判断步骤S300(以下也称为“重构误差判断步骤”)：根据上述BP调优步骤的结果判断重构误差是否满足规定条件，若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断步骤，若判断结果为不满足规定条件，则重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止；以及

第二判断步骤(以下也称为“隐藏层层数判断步骤”)S400：判断是否隐藏层层数为奇数，若隐藏层层数为奇数，则停止构建RBM层并生成最终模型，若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止。

以下，分别对于RBM构建步骤S100～第二判断步骤S400进行详细说明。

首先，对于RBM构建步骤进行说明。

为了进行风险识别，在选择交易特征的时候，需要对特征进行一定程度上的预处理。首先我们可以根据先前的经验，将一些较为重要的特征经过各种变换之后作为备选特征。而对于那些在交易信息中体现但是看似可有可无的一些特征，我们在这里仍然将其加入备选特征中来。这些特征在原先的有监督分类模型中一般是不予采用的，否则不仅会大大增大模型的训练难度，而且很有可能影响模型的准确性。然而，那些看似对结果无关的特征很有可能在一定程度上也会影响最终结果，而那些先前认为有用的特征却可能起到误导作用，至少有部分是冗余特征。

在本发明中，将所有可能特征进行规定预处理，这些规定预处理包括：例如对变量进行归一化、one-hot编码、连续值的WOE变换等等，由此，每一笔交易就会被映射为一个向量，将向量集作为第一个RBM的可见层输入。

我们首先采用多层受限玻尔兹曼机(RBM)进行模型预训练。每一个RBM具有一个可见层，一个隐藏层，层内无连接，层与层之间全连接。

推导一个RBM结构的方法如下：

首先，定义可见变量V和隐藏变量H的联合配置(joint configuration)的能量为：

E(V，H)＝-∑ _ijW _ijv _ih _j-∑ _ib _iv _i-∑ _ja _jh _j，

RBM的参数包括{W，a，b}，W为可见单元和隐藏单元之间的边的权重，a和b分别为可见单元和隐藏单元的偏置。这个能量的出现和可见层与隐藏层的每个节点的取值都有关系，那么这个能量的出现的概率就是V和H的联合概率密度：

采用对比散度算法(Contrastive Divergence，CD)算法来计算参数集{W，a，b}使得p(V，H)最大化。

CD算法使用Gibbs采样达到逐渐逼近的目的，而并非追求收敛，因此训练速度非常快。我们希望得到P(v)分布下的样本，而我们有训练样本，可以认为训练样本就是服从P(v)的。因此，就不需要从随机的状态开始gibbs采样，而从训练样本开始，经过k次Gibbs采样(实际中k＝1往往就足够了)后进行权值更新。

所以，最开始可见单元的状态被初始化成任意一个训练样本V ₀，并利用以下公式计算任意第j个(j∈{1，2…n _h})隐藏层单元的二值状态为1的概率：

下面开始一轮Gibbs采样：在所有隐藏单元状态确定了之后，根据下面公式来反向确定计算任意第i个(i∈{1，2…n _v})可见层单元的二值状态为1的概率，进而得到可见层的一个重构：

这时，在利用上面得到的结果再次对隐藏层进行重构：

这样就完成了一轮Gibbs采样。经过一批训练样本训练RBM网络，每给定一个样本就更新权重：

W＝W+λ[p(h ₁|v ₁)v ₁-p(h ₂|v ₂)v ₂]

a＝λ(v ₁-v ₂)

b＝λ(h ₁-h ₂)，

对于整个训练集训练完毕算一轮，达到指定轮数或者权重基本不变时优化停止。得到最优解的RBM权值矩阵之后，建立一个可见层和隐藏层之间的联合分布。然后将下层的RBM的隐藏层输出作为上层RBM的可见层的输入，再次单独训练上层的RBM。

按此方法将多层RBM堆叠起来作为一个整体的多层RBM网络。然而，简单的堆叠会出现一些问题，所以必须进行BP调优步骤S200。

接着，就对于BP调优步骤进行具体说明。在BP调优步骤S200中，利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行BP调优，其中，训练一层RBM就进行一次BP调优，每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优，具体情况如下。

对于交易风险来说，风险种类繁多，例如银行卡刷卡交易就存在伪卡、盗刷以及套现等多种欺诈。然而，金融机构并非对所有的欺诈类型都有足够多的欺诈标签样本，比如某企业拥有的10万条欺诈交易记录中，可能有9万条都是套现欺诈，而其他所有的欺诈对应的欺诈样本一共只有1万条。更为甚者，对于那些新出来的欺诈类型完全没有对应的欺诈样本，传统的手段很难应对这类问题。

不过，对于这些欺诈行为来说，它们在底层还是具有一定的相似性，例如无论对于盗刷还是套现，异常的金额波动或者异常的交易地点等对于识别这些欺诈都是具有重要作用的。

本发明利用这一点，通过组合这些底层特征形成更加抽象的高层表示(属性类别或特征)，以发现数据的分布式特征表示。因此可以利用原先训练好的对应某种欺诈侦测的多层RBM网络的较低的几层来对当前训练集进行模型再训练。而对于那些欺诈标签数据相对较少的数据来说，也可以结合其他类别的欺诈标签数据作为辅助数据进行训练。

假设选定好一批包含目标欺诈标签数据S _A：

以及按一定规则抽取的相同数目的目标正常样本T _A，辅助欺诈标签数据的数据S _B：

以及按一定规则抽取的相同数目的辅助正常样本T _B。将S _A、T _A、S _B、T _B整体作为训练样本作为有监督调优样本。

每当训练完一层RBM网络之后，我们就可以对当前误差进行BP(反向传播)优化来优化网络参数。在其顶部增加一层临时BP层。利用一个样本p进行训练后，网络的整体误差函数如下：

其中，n是输出层的节点数，d _j是j节点的期望输出，y _j是j节点的计算输出。对于二分类的欺诈来说，输出层具有2个节点，节点0的数值代表样本非欺诈的概率，节点1的数值代表样本是欺诈的概率。对于正常的样本，第0个节点的期望输出是1而第一个节点的期望输出是0。对于欺诈样本来说，第0个节点的期望输出是0而第一个节点的期望输出是1。最终网络输出的如果节点1的数值大于节点0的数值则判定该测试样本为欺诈，反之则为正常。

另外，θ _p是该样本的局部误差权重。最开始的时候，对于S _A和T _A中的所有样本权重统一初始化为1/n _A，而对于S _B和T _B中的所有样本权重统一初始化为1/n _B。一般来说，需要使用迁移算法的场景主要是目标数据缺乏标签样本，所以辅助数据都会比目标数据要大，进而辅助数据的权重就会比目标数据的权重要小，这是符合我们的期望的。

现在根据梯度下降算法来调整隐藏层和输出层之间的权值和输出层的阀值，使得该误差尽量最小。

假设取sigmoid函数

作为激活函数，则该函数的导数为f′(z)＝f(z)[1-f(z)]。

现在设节点i和节点j之间的权值为w _ij，节点j的阀值为b _j。那么，节点j的输出值y _j可以由上层所有节点的输出值、当前节点与上一层所有节点的权值和当前节点的阀值还有激活函数来实现：

其中，

现在计算误差的偏导数：

其中，其中

是节点j的期望输出值，

同理，可得

对于每一轮样本的迭代，的根据梯度下降算法可以调整参数如下：

对于输入层和隐藏层之间的权值和隐藏层的阀值调整量来说，由于中间隐藏层并不直接与样本的输出类别打交道，而是由下一层所有m个节点的误差按权重累加得到的。假设w _ki是输入层第k个节点和隐藏层第i个节点之间的权值。所以有

其中，

同理可得

根据梯度下降算法可以调整参数如下：

这样，利用整体训练数据依照以上方法进行训练迭代直至达到终止条件之后，注意这里由于每训练一层RBM就进行一次BP调优，因此每次BP调优只对最近一层隐藏层和BP层以及次近隐藏层和最近隐藏层之间的参数调优。由此，也能在一定程度上避免了多层误差反向传播过程中的梯度弥散问题。

这时，如果下文提到的深层RBM网络的重构误差e _R＞ξ，则将顶层的临时BP层移除，再增加一层RBM。注意，在每训练完一层RBM之后，还要对样本进行一次权值更新。

令

其中t代表第几次更新样本权值，它正好等于当前RBM网络的层数减1。计算现在整个网络在目标数据上的整体错误率：

其中

是样本p在当前的权重，d _pj是样本p在网络输出层第j个节点的期望输出值，y _pj是实际输出值。再令β _t＝∈ _t/(1-∈ _t)，那么可以设置更新的样本误差权重如下：

可以发现对于错分的辅助样本来说，β小于1，

这样一来，如果一个辅助样本被错误的分类了，我们认为这个样本对于当前数据是很不同的，我们就降低这个数据所占的权重，降低这个样本的误差所占的比重。也就是说，既然这个样本不符合当前的数据分布，那么它的误差大小并不重要。而对于错分的目标样本来说，∈ _t一般小于0.5，当然为避免算法停止，如果迭代过程中发现整体误差很大(∈ _t＞0.5)，则统一将∈ _t设置为0.5。这样一来β _t大于1，

当一个目标样本被错误的分类之后，我们认为这个样本是很难分类的，因此可以加大这个样本的误差权重，即更加重视该样本的预测准确度。

极端情况来说，如果对于那些新出来的欺诈类型完全没有对应的欺诈样本，完全没有任何相关标注样本，那么利用以上方法边可以只使用带标签的辅助样本来训练模型，迭代过程中会不断减小被分错的辅助样本的误差权重，最后使得跟当前目标样本分布最接近的辅助数据占据主导作用，这样得到的模型便可用于对目标测试数据进行分类。

接着，对于多层RBM网络结构优化的情况进行说明并且同时对于重构误差判断步骤和隐藏层层数判断步骤进行说明。

一般认为，增加隐藏层数和节点数能够降低网络误差，但另一方面也会使网络复杂化，从而增加了网络的训练时间和出现“过拟合”的倾向。隐藏层的节点如果设置太多起不到很好的特征提取功能，而如果节点太少的话则可能致使重要信息丢失。因此每一层隐藏层的节点个数和RBM的层数的选择会影响整个模型的好坏。

对于隐藏层的节点个数的选择，目前的现技术中没有一个最优的标准。对于传统的包含输入层、隐藏层、输出层的3层神经网络中有一些经验公式可以作为结构优化的参考。然而，对于包含多层网络的深度置信网络来说，层数的不确定性是的我们无法直接使用相应的公式。对此，本发明根据确保特征向量映射到不同特征空间时尽可能多地保留特征信息的原则，提出了以下优化网络结构的方法：

假设每个样本的初始特征有n _a维。首先，使用主成分分析法(PCA) 对初始特征进行预降维，处理后的维数为n _p维，将n _p作为深度RBM的最后一层的节点。这时，我们根据逐层降维的思想，进行隐藏层节点计算。

图2是表示逐层降维的示意图。

如图2所示，按照p _i：(1-p _i)的比例进行分割。计算可得，第1层隐藏层节点n _h1＝n _p+p ₁*(n _a-n _p)。该层隐藏层节点确定之后，则进行该层RBM网络训练。

由于直接计算损失函数困难，因此评判具体一层RBM网络的好坏一般使用重构误差。设训练样本个数为N，可视层特征维度为n _v。对于每个样本

使用RBM的分布进行一次Gibbs采样后，根据概率转移公式

以及

得到经过隐藏层重构的可视层采样v ^io。

由此，重构误差可以表示为

其中，除以Nn _v是为了方便统一度量。

在本发明中，设定一个重构误差阈值ξ，若重构误差e _R＞ξ，则增加一层RBM(重构误差判断步骤)。对于新的RBM层，以上一层RBM的结点个数和PCA结点个数b为上、下底再次进行分割，以第二层RBM为例，

n _h2＝n _p+p ₂*(n _h1-n _p)＝n _p+p ₁p ₂*(n _a-n _p)。

依次类推，可以计算得到第k层隐藏层的节点的通项公式：

其中具体每一层p _i的值根据实践调试经验在范围[1 _s，1 _e]内进行步进选择，选择重构误差最小的对应的p _i。一般建议1 _s＞0.5，步进大小step

≈0.1，这样在保证速度的同时又能实现良好的精确度。

最后，对于隐藏层层数判断步骤进行说明。根据大量的实验和经验，发明人发现隐藏层层数为奇数的网络性能在一定程度上明显优于隐藏层层数为偶数的网络。因此，倘若在重构误差判断步骤中某一层发现重构误差小于阈值，如果该层是奇数层隐藏层，则停止构建深层RBM，如果该层是偶数层隐藏层，还需删除该层隐藏层后作为预训练完成的深层RBM。这里图3表示了构建的层RBM层的示意图。

如图3所示，构建了RBM1、RBM2、RBM3三层。

如上所述，本发明的基于迁移深度学习的交易风险识别方法概括地包括下述主要内容：构建一层RBM；利用已知样本进行迁移学习调优这一层网络参数；判断是否还需要增加RBM层数，即若重构误差e _R＞ξ，则在参数更新过的RBM网络之上增加一层RBM网络，然后重新叠加一层BP层，使用权值更新过的样本对新增的RBM网络进行参数调优。依次迭代，直至重构误差e _R＜ξ为止，如果需要则继续增加一层RBM然后迁移学习调优直到满足条件为止。

如图4所示，在步骤S11判断是否有与参考底层RBM网络，若没有则继续步骤S12，若有则继续步骤S16。

在步骤S12，设置初始特征维度n _a，利用PCA对初始特征n _a进行预降维。在步骤S13中，参考黄金分割比例计算新增隐藏层节点个数n _hk。在步骤S14中，新增一层RBM层。在步骤S15中使用CD算法对新增的RBM层进行无监督训练。在步骤S16中，新增一层分类器输出。在步骤S17中，使用带权重样本进行有监督训练，并且进行BP调优。在步骤S18中，根据分类结果更新误差权重。在步骤S19，计算RBM网络的重构误差eR。在步骤S20中判断是否重构误差e _R＜ξ，若是则进入步骤S21，若否则进入步骤S23。在步骤S21中判断RBM的层数是否为奇数层，若是的话，则继续步骤S22，若否，则返回到步骤S23。在步骤S22中生成最终模型。在步骤S23中，移除当前输出层并且继续进行上述步骤S14。

如上所述，根据本发明的基于迁移深度学习的交易风险识别方法能够带来以下技术效果：

创造性地使用深度学习方法来自动学习金融交易数据的特征，不仅缓解了人为选取特征的复杂性，还能够更好地应对新兴的未知欺诈手段；

前期RBM网络采用无监督映射，可以从海量的无标签样本中学习数据分布特点，更能代表现实中交易数据，避免了人工降低数据不平衡性所带来的负面影响，从而建立更准确的判别模型；

在每一层RBM网络建立之后都使用BP层进行参数调优，优化后如果未达到期望效果则移除BP层后继续叠加RBM网络。由于每层BP层只针对最近一层隐藏层和BP层以及次近隐藏层和最近隐藏层之间的参数调优，这可以避免多层误差反向传播过程中的梯度弥散问题；

在BP参数调优的过程中，引入了人工智能领域样本迁移学习的思想，为每个样本对误差贡献的能力设定了权重。这样一来，对于那些欺诈标签数据相对较少的数据也可以结合其他类别的欺诈标签数据作为辅助数据进行训练，甚至对于那些新出来的完全没有对应的欺诈样本的欺诈类型的侦测模型也可以借助辅助数据进行训练了；

在设计深度网络的过程中实现了一套确定隐藏层层数和每层隐藏层节点个数的优化算法。该方法能够指导性的决定深度网络的结构，减少盲目尝试网络参数调节带来的时间损失及不稳定性，并且能在保证信息完备性的情况下实现良好的特征提取效果。

以上对于本发明的基于迁移深度学习的交易风险识别方法进行了说明，下面对于本发明的基于迁移深度学习的交易风险识别系统进行简单说明。

图5是表示本发明的基于迁移深度学习的交易风险识别系统的构造图。如图5所示，本发明的基于迁移深度学习的交易风险识别系统具备：RBM构建模块100，对所有可能特征经过规定预处理，每一笔交易就会被映射成为一个向量，将向量集作为第一RBM的可见层输入而由此建立一层RBM，其中，每一个RBM具有一个可见层和一个隐藏层；BP调优模块200，利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行BP调优；第一判断模块300，根据上述BP调优模块的结果判断是否满足规定条件，若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断模块执行的动作，若判断结果为不满足规定条件，则重复进行由上述RBM构建模块和上述BP调优模块执行的动作，直到满足上述规定条件为止；以及第二判断模块400，判断是否隐藏层层数为奇数，若隐藏层层数为奇数，则停止构建RBM层并生成最终模型，若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建模块和BP调优模块执行的动作，直到满足上述规定条件为止。

可选地，RBM构建模块100利用对比散度算法对新增的RBM层进行训练，并且述RBM构建模块100进行的规定预处理包括：对变量进行归一化、one-hot编码、连续值的WOE变换中的一种。

可选地，BP调优模块200训练一层RBM就进行一次BP调优，每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优，而且，BP调优模块200利用已知欺诈样本进行迁移学习，并且，每当训练完一层RBM之后，对当前误差进行BP调优以此来优化网络参数。

可选地，当第一判断模块300判断RBM的重构误差e _R＜ξ的情况下则不需要增加RBM层并继续所述第二判断模块执行的动作，若判断结果为重构误差e _R＞ξ的情况下则重复进行RBM构建模块100和BP调模块200执行的动作直到满足重构误差e _R＜ξ，其中，设训练样本个数为N，可见层的特征维度为n _v，对于每个样本

使用RBM的分布进行一次Gibbs采样后，根据概率转移公式

以及

再者，本发明提供一种计算机可读介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述本发明的基于迁移深度学习的交易风险识别方法的步骤。

再者，本发明提供一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述本发明的基于迁移深度学习的交易风险识别方法的步骤。

作为计算机可读介质，存在磁性记录装置、光盘、光磁记录介质、半导体存储器等。对于磁性记录装置，存在HDD、FD、磁带等。对于光盘，存在DVD(Digital Versatile Disc，数字通用光盘)、DVD-RAM、CD-ROM、CD-R(Recordable，可记录)/RW(ReWritable，可重写)等。对于光磁记录装置，存在MO(Magneto Optical disk，磁光盘)等。

以上例子主要说明了本发明的基于基于迁移深度学习的交易风险识别方法以及系统。尽管只对其中一些本发明的具体实施方式进行了描述，但是本领域普通技术人员应当了解，本发明可以在不偏离其主旨与范围内以许多其他的形式实施。因此，所展示的例子与实施方式被视为示意性的而非限制性的，在不脱离如所附各权利要求所定义的本发明精神及范围的情况下，本发明可能涵盖各种的修改与替换。

Claims

一种基于迁移深度学习的交易风险识别方法，其特征在于，具备下述步骤：

RBM构建步骤，对所有可能特征经过规定预处理，每一笔交易就会被映射成为一个向量，将向量集作为第一RBM的可见层输入而由此建立一层RBM，其中，每一个RBM具有一个可见层和一个隐藏层；

BP调优步骤，利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行迁移加权BP调优；以及

第一判断步骤，根据上述BP调优步骤的结果判断是否满足规定条件，若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断步骤，若判断结果为不满足规定条件，则重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止。
如权利要求1所述的基于迁移深度学习的交易风险识别方法，其特征在于，

在所述第一判断步骤之后还具备：

第二判断步骤，判断是否隐藏层层数为奇数，若隐藏层层数为奇数，则停止构建RBM层并生成最终模型，若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止。
如权利要求1所述的基于迁移深度学习的交易风险识别方法，其特征在于，

在所述RBM构建步骤中利用对比散度算法对新增的RBM层进行训练。
如权利要求1所述的基于迁移深度学习的交易风险识别方法，其特征在于，

在所述BP调优步骤中，训练一层RBM就进行一次BP调优，每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优。
如权利要求1所述的基于迁移深度学习的交易风险识别方法，其特征在于，

所述BP调优步骤包括下述子步骤：

利用已知欺诈样本进行迁移学习；

每当训练完一层RBM之后，对当前误差进行BP调优以此来优化网络参数。
如权利要求1所述的基于迁移深度学习的交易风险识别方法，其特征在于，

在所述第一判断步骤中，当判断RBM的重构误差e _R＜ξ的情况下则不需要增加RBM层并继续所述第二判断步骤，若判断结果为重构误差e _R＞ξ的情况下则重复进行上述RBM构建步骤和上述BP调优步骤直到满足断RBM的重构误差e _R＜ξ为止。
如权利要求5所述的基于迁移深度学习的交易风险识别方法，其特征在于，

设训练样本个数为N，可见层的特征维度为n _v，对于每个样本
使用RBM的分布进行一次Gibbs采样后，根据概率转移公式
以及
得到经过隐藏层重构的可见层采样v ^io，由此，所述重构误差可以表示为
一种基于迁移深度学习的交易风险识别系统，其特征在于，具备：

RBM构建模块，对所有可能特征经过规定预处理，每一笔交易就会被映射成为一个向量，将向量集作为第一RBM的可见层输入而由此建立一层RBM，其中，每一个RBM具有一个可见层和一个隐藏层；

BP调优模块，利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行BP调优；以及

第一判断模块，根据上述BP调优模块的结果判断是否满足规定条件，若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断模块执行的动作，若判断结果为不满足规定条件，则重复进行由上述RBM构建模块和上述BP调优模块执行的动作，直到满足上述规定条件为止。
如权利要求8所述的基于迁移深度学习的交易风险识别系统，其特征在于，还具备：

第二判断模块，判断是否隐藏层层数为奇数，若隐藏层层数为奇数，则停止构建RBM层并生成最终模型，若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建模块和BP调优模块执行的动作，直到满足上述规定条件为止。
如权利要求8所述的基于迁移深度学习的交易风险识别系统，其特征在于，

所述RBM构建模块利用对比散度算法对新增的RBM层进行训练。
如权利要求8所述的基于迁移深度学习的交易风险识别系统，其特征在于，

所述BP调优模块训练一层RBM就进行一次BP调优，每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优。
如权利要求8所述的基于迁移深度学习的交易风险识别系统，其特征在于，

所述BP调优模块利用已知欺诈样本进行迁移学习，并且，每当训练完一层RBM之后，对当前误差进行BP调优以此来优化网络参数。
如权利要求8所述的基于迁移深度学习的交易风险识别系统，其特征在于，

所述第一判断模块当判断RBM的重构误差e _R＜ξ的情况下则不需要增加RBM层并继续所述第二判断模块执行的动作，若判断结果为重构误差e _R＞ξ的情况下则重复进行上述RBM构建模块和上述BP调优模块执行的动作直到满足断RBM的重构误差e _R＜ξ为止。
如权利要求13所述的基于迁移深度学习的交易风险识别系统，其特征在于，

所述第一判断模块中，设训练样本个数为N，可见层的特征维度为n _v，对于每个样序
使用RBM的分布进行一次Gibbs采样后，根据概率转移公式
以及
得到经过隐藏层重构的可见层采样v ^io，由此，所述重构误差可以表示为
一种计算机可读介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1～7中任意一项所述方法的步骤。
一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1～7中任意一项所述方法的步骤。