CN107679859B - 一种基于迁移深度学习的风险识别方法以及系统 - Google Patents

一种基于迁移深度学习的风险识别方法以及系统 Download PDF

Info

Publication number
CN107679859B
CN107679859B CN201710584326.7A CN201710584326A CN107679859B CN 107679859 B CN107679859 B CN 107679859B CN 201710584326 A CN201710584326 A CN 201710584326A CN 107679859 B CN107679859 B CN 107679859B
Authority
CN
China
Prior art keywords
rbm
layer
tuning
module
hidden
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710584326.7A
Other languages
English (en)
Other versions
CN107679859A (zh
Inventor
李旭瑞
邱雪涛
赵金涛
胡奕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN201710584326.7A priority Critical patent/CN107679859B/zh
Publication of CN107679859A publication Critical patent/CN107679859A/zh
Priority to PCT/CN2018/093413 priority patent/WO2019015461A1/zh
Priority to TW107122212A priority patent/TWI769271B/zh
Application granted granted Critical
Publication of CN107679859B publication Critical patent/CN107679859B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computer Security & Cryptography (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)
  • Feedback Control In General (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及基于迁移深度学习的交易风险识别方法以及系统。该方法包括:对所有可能特征经过规定预处理生成向量,将向量集作为第一RBM(即受限玻尔兹曼机)的可见层输入而由此建立一层RBM;利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行迁移加权BP调优;以及判断BP调优后的RBM是否满足规定条件,若满足则不需要增加RBM层并继续下述步骤,若不满足规定条件,则重复进行RBM构建和迁移加权BP调优。根据本发明能够建立更准确的判别模型并且更好地应对新兴的欺诈手段。

Description

一种基于迁移深度学习的风险识别方法以及系统
技术领域
本发明涉及计算机技术,更具体地涉及一种基于迁移深度学习的交易风险识别方法以及系统。
背景技术
在利用机器学习进行欺诈风险识别的环节中,目前一般采用有监督的分类算法训练侦测模型。传统的分类学习算法需要预先进行特征选择和计算。而这些用于训练模型的特征很大一部分(尤其是那些经过统计得出的特征)都是根据历史欺诈数据集中总结出的规律推演出来的,这需要大量的经验积累,并且难免疏漏。
同时,在利用历史交易数据进行欺诈风险识别模型训练的时候,存在着严重的数据不平衡性,即带有欺诈标签的样本数量远远小于非欺诈样本的数量。人们总是尝试使用多种算法和技巧来减少数据不平衡性带来的影响,总体的思想无非大多是基于欠采样(大大减少使用的非欺诈交易样本数量)和过采样(人为地扩展欺诈交易样本的数量)。这些方法总是无法避免地破坏了现实中交易数据的分布特性,这种样本失真问题会影响最终模型在现实应用中的效果。
另一方面,随着信用卡支付和移动支付的普及,欺诈手段也变得五花八门。先前的一些欺诈特征可能并不适用于当前形势,而另一部分更符合当前形势的欺诈特征却还未被发现。这在一定程度上影响了风险识别的准确率,尤其是对未知欺诈手段的交易风险识别能力较差。
可以看到在现有技术中存在以下这些弱点:
人工选取特征的不准确性;
为缓解数据不平衡性带来的样本失真;
对缺乏欺诈样本的未知欺诈类型难以识别。
发明内容
鉴于所述问题,本发明旨在提供一种能够缓解人为选取特征的复杂性并能够更好识别新型欺诈手段的基于基于迁移深度学习的交易风险识别方法以及系统。
本发明的基于迁移深度学习的交易风险识别方法,其特征在于,具备下述步骤:
RBM构建步骤,对所有可能特征经过规定预处理,每一笔交易就会被映射成为一个向量,将向量集作为第一RBM的可见层输入而由此建立一层RBM,其中,每一个RBM具有一个可见层和一个隐藏层;
BP调优步骤,利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行迁移加权BP调优;
第一判断步骤,根据上述BP调优步骤的结果判断是否满足规定条件,若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断步骤,若判断结果为不满足规定条件,则重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止;以及
第二判断步骤,判断是否隐藏层层数为奇数,若隐藏层层数为奇数,则停止构建RBM层并生成最终模型,若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止。
优选地,在所述RBM构建步骤中利用对比散度算法对新增的RBM层进行训练。
优选地,在所述BP调优步骤中,训练一层RBM就进行一次BP调优,每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优。
优选地,所述BP调优步骤包括下述子步骤:
利用已知欺诈样本进行迁移学习;
每当训练完一层RBM之后,对当前误差进行BP调优以此来优化网络参数。
优选地,在所述第一判断步骤中,当判断RBM的重构误差eR<ξ的情况下则不需要增加RBM层并继续所述第二判断步骤,若判断结果为重构误差eR>ξ的情况下则重复进行上述RBM构建步骤和上述BP调优步骤直到满足断RBM的重构误差eR<ξ为止。
优选地,设训练样本个数为N,可见层的特征维度为nv,对于每个样本
Figure BDA0001353120110000031
使用RBM的分布进行一次Gibbs采样后,根据概率转移公式
Figure BDA0001353120110000032
以及
Figure BDA0001353120110000035
得到经过隐藏层重构的可见层采样vio,由此,所述重构误差可以表示为
Figure BDA0001353120110000034
优选地,所述规定预处理包括:对变量进行归一化、one-hot编码、连续值的WOE变换中的一种。
本发明的基于迁移深度学习的交易风险识别系统,其特征在于,具备:
RBM构建模块,对所有可能特征经过规定预处理,每一笔交易就会被映射成为一个向量,将向量集作为第一RBM的可见层输入而由此建立一层RBM,其中,每一个RBM具有一个可见层和一个隐藏层;
BP调优模块,利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行BP调优;
第一判断模块,根据上述BP调优模块的结果判断是否满足规定条件,若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断模块执行的动作,若判断结果为不满足规定条件,则重复进行由上述RBM构建模块和上述BP调优模块执行的动作,直到满足上述规定条件为止;以及
第二判断模块,判断是否隐藏层层数为奇数,若隐藏层层数为奇数,则停止构建RBM层并生成最终模型,若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建模块和BP调优模块执行的动作,直到满足上述规定条件为止。
优选地,所述RBM构建模块利用对比散度算法对新增的RBM层进行训练。
优选地,所述BP调优模块训练一层RBM就进行一次BP调优,每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优。
优选地,所述BP调优模块利用已知欺诈样本进行迁移学习,并且,每当训练完一层RBM之后,对当前误差进行BP调优以此来优化网络参数。
优选地,所述第一判断模块当判断RBM的重构误差eR<ξ的情况下则不需要增加RBM层并继续所述第二判断模块执行的动作,若判断结果为重构误差eR>ξ的情况下则重复进行上述RBM构建模块和上述BP调优模块执行的动作直到满足断RBM的重构误差eR<ξ为止。
优选地,所述第一判断模块中,设训练样本个数为N,可见层的特征维度为nv,对于每个样本
Figure BDA0001353120110000041
使用RBM的分布进行一次Gibbs采样后,根据概率转移公式
Figure BDA0001353120110000042
以及
Figure BDA0001353120110000043
得到经过隐藏层重构的可见层采样vio,由此,所述重构误差可以表示为
Figure BDA0001353120110000044
优选地,所述RBM构建模块进行的规定预处理包括:对变量进行归一化、one-hot编码、连续值的WOE变换中的一种。
本发明还提供一种计算机可读介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现上述本发明的基于迁移深度学习的交易风险识别方法的步骤。
本发明还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述本发明的基于迁移深度学习的交易风险识别方法的步骤。
根据本发明的基于迁移深度学习的交易风险识别方法以及风险识别系统,能够更好地应对新兴的未知欺诈手段,能够建立更准确的判别。
附图说明
图1是本发明的基于基于迁移深度学习的交易风险识别方法的主要步骤流程图。
图2是表示逐层降维的示意图。
图3表示了构建的层RBM层的示意图。
图4是表示本发明的基于迁移深度学习的交易风险识别方法的一个实施方式的流程示意图。
图5是表示本发明的基于迁移深度学习的交易风险识别系统的构造图。
具体实施方式
下面介绍的是本发明的多个实施例中的一些,旨在提供对本发明的基本了解。并不旨在确认本发明的关键或决定性的要素或限定所要保护的范围。
首先,对于在本发明中将要提及的几个概念进行说明。
(1)受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)
RBM是一种可通过输入数据集学习概率分布的随机生成神经网络。RBM是一种玻尔兹曼机的变体,但限定模型必须为二分图。模型中包含对应输入参数的可见单元(以下也称为可见层)和对应训练结果的隐藏单元(以下也称为隐藏层),每条边必须连接一个可见单元和一个隐单元。
(2)BP算法(即误差反向传播算法)
BP算法是在有导师指导下,适合于多层神经元网络的一种学习算法,它建立在梯度下。反向传播算法主要由两个环节(激励传播、权重更新)反复循环迭代,直到网络的对输入的响应达到预定的目标范围为止。
(3)Gibbs采样
Gibbs采样方法是指,马尔可夫链蒙特卡尔理论(MCMC)中用来获取一系列近似等于指定多维概率分布(比如2个或者多个随即变量的联合概率分布)观察样本的算法。
图1是本发明的基于基于迁移深度学习的交易风险识别方法的主要步骤流程图。
RBM构建步骤S100:对所有可能特征经过规定预处理,每一笔交易就会被映射成为一个向量,将向量集作为第一RBM的可见层输入而由此建立一层RBM,其中,每一个RBM具有一个可见层和一个隐藏层;
BP调优步骤S200:利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行迁移加权BP调优;
第一判断步骤S300(以下也称为“重构误差判断步骤”):根据上述BP调优步骤的结果判断重构误差是否满足规定条件,若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断步骤,若判断结果为不满足规定条件,则重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止;以及
第二判断步骤(以下也称为“隐藏层层数判断步骤”)S400:判断是否隐藏层层数为奇数,若隐藏层层数为奇数,则停止构建RBM层并生成最终模型,若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止。
以下,分别对于RBM构建步骤S100~第二判断步骤S400进行详细说明。
首先,对于RBM构建步骤进行说明。
为了进行风险识别,在选择交易特征的时候,需要对特征进行一定程度上的预处理。首先我们可以根据先前的经验,将一些较为重要的特征经过各种变换之后作为备选特征。而对于那些在交易信息中体现但是看似可有可无的一些特征,我们在这里仍然将其加入备选特征中来。这些特征在原先的有监督分类模型中一般是不予采用的,否则不仅会大大增大模型的训练难度,而且很有可能影响模型的准确性。然而,那些看似对结果无关的特征很有可能在一定程度上也会影响最终结果,而那些先前认为有用的特征却可能起到误导作用,至少有部分是冗余特征。
在本发明中,将所有可能特征进行规定预处理,这些规定预处理包括:例如对变量进行归一化、one-hot编码、连续值的WOE变换等等,由此,每一笔交易就会被映射为一个向量,将向量集作为第一个RBM的可见层输入。
我们首先采用多层受限玻尔兹曼机(RBM)进行模型预训练。每一个RBM具有一个可见层,一个隐藏层,层内无连接,层与层之间全连接。
推导一个RBM结构的方法如下:
首先,定义可见变量V和隐藏变量H的联合配置(joint configuration)的能量为:
E(V,H)=-∑ijWijvihj-∑ibivi-∑jajhj
RBM的参数包括{W,a,b},W为可见单元和隐藏单元之间的边的权重,a和b分别为可见单元和隐藏单元的偏置。这个能量的出现和可见层与隐藏层的每个节点的取值都有关系,那么这个能量的出现的概率就是V和H的联合概率密度:
Figure BDA0001353120110000061
采用对比散度算法(Contrastive Divergence,CD)算法来计算参数集{W,a,b}使得p(V,H)最大化。
CD算法使用Gibbs采样达到逐渐逼近的目的,而并非追求收敛,因此训练速度非常快。我们希望得到P(v)分布下的样本,而我们有训练样本,可以认为训练样本就是服从P(v)的。因此,就不需要从随机的状态开始gibbs采样,而从训练样本开始,经过k次Gibbs采样(实际中k=1往往就足够了)后进行权值更新。
所以,最开始可见单元的状态被初始化成任意一个训练样本V0,并利用以下公式计算任意第j个(j∈{1,2...nh})隐藏层单元的二值状态为1的概率:
Figure BDA0001353120110000071
下面开始一轮Gibbs采样:在所有隐藏单元状态确定了之后,根据下面公式来反向确定计算任意第i个(i∈{1,2...nv})可见层单元的二值状态为1的概率,进而得到可见层的一个重构:
Figure BDA0001353120110000072
这时,在利用上面得到的结果再次对隐藏层进行重构:
Figure BDA0001353120110000073
这样就完成了一轮Gibbs采样。经过一批训练样本训练RBM网络,每给定一个样本就更新权重:
W=W+λ[p(h1|v1)v1-p(h2|v2)v2]
a=λ(v1-v2)
b=λ(h1-h2),
对于整个训练集训练完毕算一轮,达到指定轮数或者权重基本不变时优化停止。得到最优解的RBM权值矩阵之后,建立一个可见层和隐藏层之间的联合分布。然后将下层的RBM的隐藏层输出作为上层RBM的可见层的输入,再次单独训练上层的RBM。
按此方法将多层RBM堆叠起来作为一个整体的多层RBM网络。然而,简单的堆叠会出现一些问题,所以必须进行BP调优步骤S200。
接着,就对于BP调优步骤进行具体说明。在BP调优步骤S200中,利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行BP调优,其中,训练一层RBM就进行一次BP调优,每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优,具体情况如下。
对于交易风险来说,风险种类繁多,例如银行卡刷卡交易就存在伪卡、盗刷以及套现等多种欺诈。然而,金融机构并非对所有的欺诈类型都有足够多的欺诈标签样本,比如某企业拥有的10万条欺诈交易记录中,可能有9万条都是套现欺诈,而其他所有的欺诈对应的欺诈样本一共只有1万条。更为甚者,对于那些新出来的欺诈类型完全没有对应的欺诈样本,传统的手段很难应对这类问题。
不过,对于这些欺诈行为来说,它们在底层还是具有一定的相似性,例如无论对于盗刷还是套现,异常的金额波动或者异常的交易地点等对于识别这些欺诈都是具有重要作用的。
本发明利用这一点,通过组合这些底层特征形成更加抽象的高层表示(属性类别或特征),以发现数据的分布式特征表示。因此可以利用原先训练好的对应某种欺诈侦测的多层RBM网络的较低的几层来对当前训练集进行模型再训练。而对于那些欺诈标签数据相对较少的数据来说,也可以结合其他类别的欺诈标签数据作为辅助数据进行训练。
假设选定好一批包含目标欺诈标签数据SA
Figure BDA0001353120110000081
以及按一定规则抽取的相同数目的目标正常样本TA,辅助欺诈标签数据的数据SB
Figure BDA0001353120110000082
以及按一定规则抽取的相同数目的辅助正常样本TB。将SA、TA、SB、TB整体作为训练样本作为有监督调优样本。
每当训练完一层RBM网络之后,我们就可以对当前误差进行BP(反向传播)优化来优化网络参数。在其顶部增加一层临时BP层。利用一个样本p进行训练后,网络的整体误差函数如下:
Figure BDA0001353120110000083
其中,n是输出层的节点数,dj是j节点的期望输出,yj是j节点的计算输出。对于二分类的欺诈来说,输出层具有2个节点,节点0的数值代表样本非欺诈的概率,节点1的数值代表样本是欺诈的概率。对于正常的样本,第0个节点的期望输出是1而第一个节点的期望输出是0。对于欺诈样本来说,第0个节点的期望输出是0而第一个节点的期望输出是1。最终网络输出的如果节点1的数值大于节点0的数值则判定该测试样本为欺诈,反之则为正常。
另外,θp是该样本的局部误差权重。最开始的时候,对于SA和TA中的所有样本权重统一初始化为1/nA,而对于SB和TB中的所有样本权重统一初始化为1/nB。一般来说,需要使用迁移算法的场景主要是目标数据缺乏标签样本,所以辅助数据都会比目标数据要大,进而辅助数据的权重就会比目标数据的权重要小,这是符合我们的期望的。
现在根据梯度下降算法来调整隐藏层和输出层之间的权值和输出层的阀值,使得该误差尽量最小。
假设取sigmoid函数
Figure BDA0001353120110000091
作为激活函数,则该函数的导数为f′(z)=f(z)[1-f(z)]。
现在设节点i和节点j之间的权值为wij,节点j的阀值为bj。那么,节点j的输出值yj可以由上层所有节点的输出值、当前节点与上一层所有节点的权值和当前节点的阀值还有激活函数来实现:
Figure BDA0001353120110000092
其中,
Figure BDA0001353120110000093
现在计算误差的偏导数:
Figure BDA0001353120110000094
其中,其中
Figure BDA0001353120110000095
是节点j的期望输出值,
Figure BDA0001353120110000096
同理,可得
Figure BDA0001353120110000097
对于每一轮样本的迭代,的根据梯度下降算法可以调整参数如下:
Figure BDA0001353120110000098
Figure BDA0001353120110000099
对于输入层和隐藏层之间的权值和隐藏层的阀值调整量来说,由于中间隐藏层并不直接与样本的输出类别打交道,而是由下一层所有m个节点的误差按权重累加得到的。假设wki是输入层第k个节点和隐藏层第i个节点之间的权值。所以有
Figure BDA0001353120110000101
其中,
Figure BDA0001353120110000102
同理可得
Figure BDA0001353120110000103
根据梯度下降算法可以调整参数如下:
Figure BDA0001353120110000104
Figure BDA0001353120110000105
这样,利用整体训练数据依照以上方法进行训练迭代直至达到终止条件之后,注意这里由于每训练一层RBM就进行一次BP调优,因此每次BP调优只对最近一层隐藏层和BP层以及次近隐藏层和最近隐藏层之间的参数调优。由此,也能在一定程度上避免了多层误差反向传播过程中的梯度弥散问题。
这时,如果下文提到的深层RBM网络的重构误差eR>ξ,则将顶层的临时BP层移除,再增加一层RBM。注意,在每训练完一层RBM之后,还要对样本进行一次权值更新。
Figure BDA0001353120110000106
其中t代表第几次更新样本权值,它正好等于当前RBM网络的层数减1。计算现在整个网络在目标数据上的整体错误率:
Figure BDA0001353120110000107
其中
Figure BDA0001353120110000108
是样本p在当前的权重,dpj是样本p在网络输出层第j个节点的期望输出值,ypj是实际输出值。再令βt=∈t/(1-∈t),那么可以设置更新的样本误差权重如下:
Figure BDA0001353120110000111
可以发现对于错分的辅助样本来说,β小于1,
Figure BDA0001353120110000112
这样一来,如果一个辅助样本被错误的分类了,我们认为这个样本对于当前数据是很不同的,我们就降低这个数据所占的权重,降低这个样本的误差所占的比重。也就是说,既然这个样本不符合当前的数据分布,那么它的误差大小并不重要。而对于错分的目标样本来说,∈t一般小于0.5,当然为避免算法停止,如果迭代过程中发现整体误差很大(∈t>0.5),则统一将∈t设置为0.5。这样一来βt大于1,
Figure BDA0001353120110000113
当一个目标样本被错误的分类之后,我们认为这个样本是很难分类的,因此可以加大这个样本的误差权重,即更加重视该样本的预测准确度。
极端情况来说,如果对于那些新出来的欺诈类型完全没有对应的欺诈样本,完全没有任何相关标注样本,那么利用以上方法边可以只使用带标签的辅助样本来训练模型,迭代过程中会不断减小被分错的辅助样本的误差权重,最后使得跟当前目标样本分布最接近的辅助数据占据主导作用,这样得到的模型便可用于对目标测试数据进行分类。
接着,对于多层RBM网络结构优化的情况进行说明并且同时对于重构误差判断步骤和隐藏层层数判断步骤进行说明。
一般认为,增加隐藏层数和节点数能够降低网络误差,但另一方面也会使网络复杂化,从而增加了网络的训练时间和出现“过拟合”的倾向。隐藏层的节点如果设置太多起不到很好的特征提取功能,而如果节点太少的话则可能致使重要信息丢失。因此每一层隐藏层的节点个数和RBM的层数的选择会影响整个模型的好坏。
对于隐藏层的节点个数的选择,目前的现技术中没有一个最优的标准。对于传统的包含输入层、隐藏层、输出层的3层神经网络中有一些经验公式可以作为结构优化的参考。然而,对于包含多层网络的深度置信网络来说,层数的不确定性是的我们无法直接使用相应的公式。对此,本发明根据确保特征向量映射到不同特征空间时尽可能多地保留特征信息的原则,提出了以下优化网络结构的方法:
假设每个样本的初始特征有na维。首先,使用主成分分析法(PCA)对初始特征进行预降维,处理后的维数为np维,将np作为深度RBM的最后一层的节点。这时,我们根据逐层降维的思想,进行隐藏层节点计算。
图2是表示逐层降维的示意图。
如图2所示,按照pi:(1-pi)的比例进行分割。计算可得,第1层隐藏层节点nh1=np+p1*(na-np)。该层隐藏层节点确定之后,则进行该层RBM网络训练。
由于直接计算损失函数困难,因此评判具体一层RBM网络的好坏一般使用重构误差。设训练样本个数为N,可视层特征维度为nv。对于每个样本
Figure BDA0001353120110000121
使用RBM的分布进行一次Gibbs采样后,根据概率转移公式
Figure BDA0001353120110000122
以及
Figure BDA0001353120110000123
得到经过隐藏层重构的可视层采样vio
由此,重构误差可以表示为
Figure BDA0001353120110000124
其中,除以Nnv是为了方便统一度量。
在本发明中,设定一个重构误差阈值ξ,若重构误差eR>ξ,则增加一层RBM(重构误差判断步骤)。对于新的RBM层,以上一层RBM的结点个数和PCA结点个数b为上、下底再次进行分割,以第二层RBM为例,
nh2=np+p2*(nh1-np)=np+p1p2*(na-np)。
依次类推,可以计算得到第k层隐藏层的节点的通项公式:
Figure BDA0001353120110000125
其中具体每一层pi的值根据实践调试经验在范围[ls,le]内进行步进选择,选择重构误差最小的对应的pi。一般建议ls>0.5,步进大小step≈0.1,这样在保证速度的同时又能实现良好的精确度。
最后,对于隐藏层层数判断步骤进行说明。根据大量的实验和经验,发明人发现隐藏层层数为奇数的网络性能在一定程度上明显优于隐藏层层数为偶数的网络。因此,倘若在重构误差判断步骤中某一层发现重构误差小于阈值,如果该层是奇数层隐藏层,则停止构建深层RBM,如果该层是偶数层隐藏层,还需删除该层隐藏层后作为预训练完成的深层RBM。这里图3表示了构建的层RBM层的示意图。如图3所示,构建了RBM1、RBM2、RBM3三层。
如上所述,本发明的基于迁移深度学习的交易风险识别方法概括地包括下述主要内容:构建一层RBM;利用已知样本进行迁移学习调优这一层网络参数;判断是否还需要增加RBM层数,即若重构误差eR>ξ,则在参数更新过的RBM网络之上增加一层RBM网络,然后重新叠加一层BP层,使用权值更新过的样本对新增的RBM网络进行参数调优。依次迭代,直至重构误差eR<ξ为止,如果需要则继续增加一层RBM然后迁移学习调优直到满足条件为止。
图4是表示本发明的基于迁移深度学习的交易风险识别方法的一个实施方式的流程示意图。
如图4所示,在步骤S11判断是否有与参考底层RBM网络,若没有则继续步骤S12,若有则继续步骤S16。
在步骤S12,设置初始特征维度na,利用PCA对初始特征na进行预降维。在步骤S13中,参考黄金分割比例计算新增隐藏层节点个数nhk。在步骤S14中,新增一层RBM层。在步骤S15中使用CD算法对新增的RBM层进行无监督训练。在步骤S16中,新增一层分类器输出。在步骤S17中,使用带权重样本进行有监督训练,并且进行BP调优。在步骤S18中,根据分类结果更新误差权重。在步骤S19,计算RBM网络的重构误差eR。在步骤S20中判断是否重构误差eR<ξ,若是则进入步骤S21,若否则进入步骤S23。在步骤S21中判断RBM的层数是否为奇数层,若是的话,则继续步骤S22,若否,则返回到步骤S23。在步骤S22中生成最终模型。在步骤S23中,移除当前输出层并且继续进行上述步骤S14。
如上所述,根据本发明的基于迁移深度学习的交易风险识别方法能够带来以下技术效果:
创造性地使用深度学习方法来自动学习金融交易数据的特征,不仅缓解了人为选取特征的复杂性,还能够更好地应对新兴的未知欺诈手段;
前期RBM网络采用无监督映射,可以从海量的无标签样本中学习数据分布特点,更能代表现实中交易数据,避免了人工降低数据不平衡性所带来的负面影响,从而建立更准确的判别模型;
在每一层RBM网络建立之后都使用BP层进行参数调优,优化后如果未达到期望效果则移除BP层后继续叠加RBM网络。由于每层BP层只针对最近一层隐藏层和BP层以及次近隐藏层和最近隐藏层之间的参数调优,这可以避免多层误差反向传播过程中的梯度弥散问题;
在BP参数调优的过程中,引入了人工智能领域样本迁移学习的思想,为每个样本对误差贡献的能力设定了权重。这样一来,对于那些欺诈标签数据相对较少的数据也可以结合其他类别的欺诈标签数据作为辅助数据进行训练,甚至对于那些新出来的完全没有对应的欺诈样本的欺诈类型的侦测模型也可以借助辅助数据进行训练了;
在设计深度网络的过程中实现了一套确定隐藏层层数和每层隐藏层节点个数的优化算法。该方法能够指导性的决定深度网络的结构,减少盲目尝试网络参数调节带来的时间损失及不稳定性,并且能在保证信息完备性的情况下实现良好的特征提取效果。
以上对于本发明的基于迁移深度学习的交易风险识别方法进行了说明,下面对于本发明的基于迁移深度学习的交易风险识别系统进行简单说明。
图5是表示本发明的基于迁移深度学习的交易风险识别系统的构造图。如图5所示,本发明的基于迁移深度学习的交易风险识别系统具备:RBM构建模块100,对所有可能特征经过规定预处理,每一笔交易就会被映射成为一个向量,将向量集作为第一RBM的可见层输入而由此建立一层RBM,其中,每一个RBM具有一个可见层和一个隐藏层;BP调优模块200,利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行BP调优;第一判断模块300,根据上述BP调优模块的结果判断是否满足规定条件,若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断模块执行的动作,若判断结果为不满足规定条件,则重复进行由上述RBM构建模块和上述BP调优模块执行的动作,直到满足上述规定条件为止;以及第二判断模块400,判断是否隐藏层层数为奇数,若隐藏层层数为奇数,则停止构建RBM层并生成最终模型,若隐藏层层数为偶数否则删除当前隐藏层并重复进行上述RBM构建模块和BP调优模块执行的动作,直到满足上述规定条件为止。
可选地,RBM构建模块100利用对比散度算法对新增的RBM层进行训练,并且述RBM构建模块100进行的规定预处理包括:对变量进行归一化、one-hot编码、连续值的WOE变换中的一种。
可选地,BP调优模块200训练一层RBM就进行一次BP调优,每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优,而且,BP调优模块200利用已知欺诈样本进行迁移学习,并且,每当训练完一层RBM之后,对当前误差进行BP调优以此来优化网络参数。
可选地,当第一判断模块300判断RBM的重构误差eR<ξ的情况下则不需要增加RBM层并继续所述第二判断模块执行的动作,若判断结果为重构误差eR>ξ的情况下则重复进行RBM构建模块100和BP调模块200执行的动作直到满足重构误差eR<ξ,其中,设训练样本个数为N,可见层的特征维度为nv,对于每个样本
Figure BDA0001353120110000141
使用RBM的分布进行一次Gibbs采样后,根据概率转移公式
Figure BDA0001353120110000142
以及
Figure BDA0001353120110000143
得到经过隐藏层重构的可见层采样vio,由此,所述重构误差可以表示为
Figure BDA0001353120110000151
再者,本发明提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述本发明的基于迁移深度学习的交易风险识别方法的步骤。
再者,本发明提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述本发明的基于迁移深度学习的交易风险识别方法的步骤。
作为计算机可读介质,存在磁性记录装置、光盘、光磁记录介质、半导体存储器等。对于磁性记录装置,存在HDD、FD、磁带等。对于光盘,存在DVD(Digital Versatile Disc,数字通用光盘)、DVD-RAM、CD-ROM、CD-R(Recordable,可记录)/RW(ReWritable,可重写)等。对于光磁记录装置,存在MO(Magneto Optical disk,磁光盘)等。
以上例子主要说明了本发明的基于基于迁移深度学习的交易风险识别方法以及系统。尽管只对其中一些本发明的具体实施方式进行了描述,但是本领域普通技术人员应当了解,本发明可以在不偏离其主旨与范围内以许多其他的形式实施。因此,所展示的例子与实施方式被视为示意性的而非限制性的,在不脱离如所附各权利要求所定义的本发明精神及范围的情况下,本发明可能涵盖各种的修改与替换。

Claims (10)

1.一种基于迁移深度学习的交易风险识别方法,其特征在于,具备下述步骤:
RBM构建步骤,对所有可能特征经过规定预处理,每一笔交易就会被映射成为一个向量,将向量集作为第一RBM的可见层输入而由此建立一层RBM,其中,每一个RBM具有一个可见层和一个隐藏层;
BP调优步骤,利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行迁移加权BP调优;以及
第一判断步骤,根据上述BP调优步骤的结果判断是否满足规定条件,若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断步骤,若判断结果为不满足规定条件,则重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止,
其中,在所述BP调优步骤中,训练一层RBM就进行一次BP调优,每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优,其中,在所述第一判断步骤之后还具备:
第二判断步骤,判断是否隐藏层层数为奇数,若隐藏层层数为奇数,则停止构建RBM层并生成最终模型,若隐藏层层数为偶数则删除当前隐藏层并重复进行上述RBM构建步骤和BP调优步骤直到满足上述规定条件为止。
2.如权利要求1所述的基于迁移深度学习的交易风险识别方法,其特征在于,
在所述RBM构建步骤中利用对比散度算法对新增的RBM层进行训练。
3.如权利要求1所述的基于迁移深度学习的交易风险识别方法,其特征在于,
所述BP调优步骤包括下述子步骤:
利用已知欺诈样本进行迁移学习;
每当训练完一层RBM之后,对当前误差进行BP调优以此来优化网络参数。
4.如权利要求1所述的基于迁移深度学习的交易风险识别方法,其特征在于,
在所述第一判断步骤中,当判断RBM的重构误差eR<ξ的情况下则不需要增加RBM层并继续所述第二判断步骤,若判断结果为重构误差eR>ξ的情况下则重复进行上述RBM构建步骤和上述BP调优步骤直到满足断RBM的重构误差eR<ξ为止,其中,ξ为重构误差阈值。
5.一种基于迁移深度学习的交易风险识别系统,其特征在于,具备:
RBM构建模块,对所有可能特征经过规定预处理,每一笔交易就会被映射成为一个向量,将向量集作为第一RBM的可见层输入而由此建立一层RBM,其中,每一个RBM具有一个可见层和一个隐藏层;
BP调优模块,利用已知欺诈样本进行迁移学习对所述RBM构建步骤建立的RBM层进行BP调优;以及
第一判断模块,根据上述BP调优模块的结果判断是否满足规定条件,若判断结果为满足规定条件则不需要增加RBM层并继续下述第二判断模块执行的动作,若判断结果为不满足规定条件,则重复进行由上述RBM构建模块和上述BP调优模块执行的动作,直到满足上述规定条件为止,
所述BP调优模块训练一层RBM就进行一次BP调优,每次BP调优仅对最近一层隐藏层以及次近隐藏层和最近隐藏层之间的参数调优,其中,还具备:
第二判断模块,判断是否隐藏层层数为奇数,若隐藏层层数为奇数,则停止构建RBM层并生成最终模型,若隐藏层层数为偶数则删除当前隐藏层并重复进行上述RBM构建模块和BP调优模块执行的动作,直到满足上述规定条件为止。
6.如权利要求5所述的基于迁移深度学习的交易风险识别系统,其特征在于,
所述RBM构建模块利用对比散度算法对新增的RBM层进行训练。
7.如权利要求5所述的基于迁移深度学习的交易风险识别系统,其特征在于,
所述BP调优模块利用已知欺诈样本进行迁移学习,并且,每当训练完一层RBM之后,对当前误差进行BP调优以此来优化网络参数。
8.如权利要求5所述的基于迁移深度学习的交易风险识别系统,其特征在于,
所述第一判断模块当判断RBM的重构误差eR<ξ的情况下则不需要增加RBM层并继续所述第二判断模块执行的动作,若判断结果为重构误差eR>ξ的情况下则重复进行上述RBM构建模块和上述BP调优模块执行的动作直到满足断RBM的重构误差eR<ξ为止,其中,ξ为重构误差阈值。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1~4中任意一项所述方法的步骤。
10.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~4中任意一项所述方法的步骤。
CN201710584326.7A 2017-07-18 2017-07-18 一种基于迁移深度学习的风险识别方法以及系统 Active CN107679859B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201710584326.7A CN107679859B (zh) 2017-07-18 2017-07-18 一种基于迁移深度学习的风险识别方法以及系统
PCT/CN2018/093413 WO2019015461A1 (zh) 2017-07-18 2018-06-28 一种基于迁移深度学习的风险识别方法以及系统
TW107122212A TWI769271B (zh) 2017-07-18 2018-06-28 基於遷移深度學習的風險識別方法以及系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710584326.7A CN107679859B (zh) 2017-07-18 2017-07-18 一种基于迁移深度学习的风险识别方法以及系统

Publications (2)

Publication Number Publication Date
CN107679859A CN107679859A (zh) 2018-02-09
CN107679859B true CN107679859B (zh) 2020-08-25

Family

ID=61134123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710584326.7A Active CN107679859B (zh) 2017-07-18 2017-07-18 一种基于迁移深度学习的风险识别方法以及系统

Country Status (3)

Country Link
CN (1) CN107679859B (zh)
TW (1) TWI769271B (zh)
WO (1) WO2019015461A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679859B (zh) * 2017-07-18 2020-08-25 中国银联股份有限公司 一种基于迁移深度学习的风险识别方法以及系统
CN108492197A (zh) * 2018-03-15 2018-09-04 北京百度网讯科技有限公司 保险的出险预测方法、装置及服务器
CN108629593B (zh) * 2018-04-28 2022-03-01 招商银行股份有限公司 基于深度学习的欺诈交易识别方法、系统及存储介质
CN108596630B (zh) * 2018-04-28 2022-03-01 招商银行股份有限公司 基于深度学习的欺诈交易识别方法、系统及存储介质
CN108683658B (zh) * 2018-05-11 2020-11-03 上海交通大学 基于多rbm网络构建基准模型的工控网络流量异常识别方法
CN109003089B (zh) * 2018-06-28 2022-06-10 中国工商银行股份有限公司 风险识别方法及装置
CN109165940B (zh) * 2018-06-28 2022-08-09 创新先进技术有限公司 一种防盗方法、装置及电子设备
CN109359793B (zh) * 2018-08-03 2020-11-17 创新先进技术有限公司 一种针对新场景的预测模型训练方法及装置
CN108960833B (zh) * 2018-08-10 2022-03-11 哈尔滨工业大学(威海) 一种基于异构金融特征的异常交易识别方法,设备及存储介质
CN109102126B (zh) * 2018-08-30 2021-12-10 燕山大学 一种基于深度迁移学习的理论线损率预测模型
CN109242107B (zh) * 2018-09-11 2019-08-30 北京芯盾时代科技有限公司 基于迁移学习的反欺诈模型训练方法、系统和反欺诈方法
CN109272398B (zh) * 2018-09-11 2020-05-08 北京芯盾时代科技有限公司 一种操作请求处理系统
CN110895705B (zh) * 2018-09-13 2024-05-14 富士通株式会社 异常样本检测装置及其训练装置和训练方法
CN109684476B (zh) * 2018-12-07 2023-10-17 中科恒运股份有限公司 一种文本分类方法、文本分类装置及终端设备
CN110210625B (zh) * 2019-05-20 2023-04-07 平安科技(深圳)有限公司 基于迁移学习的建模方法、装置、计算机设备和存储介质
CN110263294B (zh) * 2019-05-23 2020-08-04 阿里巴巴集团控股有限公司 损失函数取值的确定方法、装置和电子设备
US10956597B2 (en) 2019-05-23 2021-03-23 Advanced New Technologies Co., Ltd. Loss function value determination method and device and electronic equipment
CN110414718A (zh) * 2019-07-04 2019-11-05 上海工程技术大学 一种深度学习下的配电网可靠性指标优化方法
CN110458572B (zh) * 2019-07-08 2023-11-24 创新先进技术有限公司 用户风险的确定方法和目标风险识别模型的建立方法
CN110400082B (zh) * 2019-07-29 2022-12-13 中国工商银行股份有限公司 异常交易企业的识别方法和装置
CN112581250B (zh) * 2019-09-30 2023-12-29 深圳无域科技技术有限公司 模型生成方法、装置、计算机设备和存储介质
TWI786346B (zh) * 2019-11-14 2022-12-11 財團法人資訊工業策進會 遷移式模型訓練系統以及方法
CN111582502B (zh) * 2020-05-12 2023-07-25 度小满科技(北京)有限公司 一种样本迁移学习方法和装置
CN113256422B (zh) * 2021-06-09 2021-11-19 深圳华锐金融技术股份有限公司 分仓账户识别方法、装置、计算机设备和存储介质
CN114549001A (zh) * 2022-02-08 2022-05-27 支付宝(杭州)信息技术有限公司 训练风险交易识别模型、识别风险交易的方法和装置
CN115187266B (zh) * 2022-06-29 2023-08-25 山东大学 基于记忆力变分自编码模型的信用卡欺诈检测方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679777A (zh) * 2013-12-02 2015-06-03 中国银联股份有限公司 一种用于检测欺诈交易的方法及系统

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI448978B (zh) * 2011-06-24 2014-08-11 Univ Nat Taiwan Normal 異常辨識系統訓練方法
CN104035996B (zh) * 2014-06-11 2017-06-16 华东师范大学 基于Deep Learning的领域概念抽取方法
CN104408483B (zh) * 2014-12-08 2017-08-25 西安电子科技大学 基于深度神经网络的sar纹理图像分类方法
KR20160112186A (ko) * 2015-03-18 2016-09-28 삼성전자주식회사 뉴럴 네트워크에서 이벤트에 기반한 학습 방법 및 장치
CN104809502A (zh) * 2015-05-19 2015-07-29 重庆大学 一种受限玻尔兹曼机隐含层节点动态调整方法
CN105224985B (zh) * 2015-09-28 2017-10-31 南京航空航天大学 一种基于深度重构模型的功率放大器行为建模方法
CN105335816A (zh) * 2015-10-13 2016-02-17 国网安徽省电力公司铜陵供电公司 基于深度学习的电力通信网运行趋势与业务风险分析方法
US9552548B1 (en) * 2016-07-01 2017-01-24 Intraspexion Inc. Using classified text and deep learning algorithms to identify risk and provide early warning
CN107679859B (zh) * 2017-07-18 2020-08-25 中国银联股份有限公司 一种基于迁移深度学习的风险识别方法以及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104679777A (zh) * 2013-12-02 2015-06-03 中国银联股份有限公司 一种用于检测欺诈交易的方法及系统

Also Published As

Publication number Publication date
WO2019015461A1 (zh) 2019-01-24
TW201909090A (zh) 2019-03-01
TWI769271B (zh) 2022-07-01
CN107679859A (zh) 2018-02-09

Similar Documents

Publication Publication Date Title
CN107679859B (zh) 一种基于迁移深度学习的风险识别方法以及系统
Dastile et al. Statistical and machine learning models in credit scoring: A systematic literature survey
CN110263227B (zh) 基于图神经网络的团伙发现方法和系统
Xia et al. A boosted decision tree approach using Bayesian hyper-parameter optimization for credit scoring
AU2024200810A1 (en) Training tree-based machine-learning modeling algorithms for predicting outputs and generating explanatory data
Ince et al. A comparison of data mining techniques for credit scoring in banking: A managerial perspective
CN112966114A (zh) 基于对称图卷积神经网络的文献分类方法和装置
Dara et al. Feature extraction in medical images by using deep learning approach
US20200143209A1 (en) Task dependent adaptive metric for classifying pieces of data
Wu et al. Optimized deep learning framework for water distribution data-driven modeling
CN117391247A (zh) 一种基于深度学习的企业风险等级预测方法及系统
CN114240659A (zh) 一种基于动态图卷积神经网络的区块链异常节点识别方法
Owusu et al. A deep learning approach for loan default prediction using imbalanced dataset
Zhu et al. Loan default prediction based on convolutional neural network and LightGBM
Rofik et al. The Optimization of Credit Scoring Model Using Stacking Ensemble Learning and Oversampling Techniques
CN115543762A (zh) 一种磁盘smart数据扩充方法、系统及电子设备
Jakka et al. Original Research Article A novel credit scoring system in financial institutions using artificial intelligence technology
CN115907775A (zh) 基于深度学习的个人征信评级方法及其应用
Alomari et al. Loan Default Prediction and Identification of Interesting Relations between Attributes of Peer-to-Peer Loan Applications
Chandok et al. Enhancing Bankruptcy Prediction with White Shark Optimizer and Deep Learning: A Hybrid Approach for Accurate Financial Risk Assessment.
Besenbruch Fraud detection using machine learning techniques
Caplescu et al. Will they repay their debt? Identification of borrowers likely to be charged off
CN113609745A (zh) 一种超参数寻优方法、装置及电子设备和存储介质
Jeyakarthic et al. Genetic Programming with Dynamic Bayesian Network based Credit Risk Assessment Model
US20230141655A1 (en) System and Method For Loss Function Metalearning For Faster, More Accurate Training, and Smaller Datasets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1248365

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant