CN109034194A - 基于特征分化的交易欺诈行为深度检测方法 - Google Patents

基于特征分化的交易欺诈行为深度检测方法 Download PDF

Info

Publication number
CN109034194A
CN109034194A CN201810641664.4A CN201810641664A CN109034194A CN 109034194 A CN109034194 A CN 109034194A CN 201810641664 A CN201810641664 A CN 201810641664A CN 109034194 A CN109034194 A CN 109034194A
Authority
CN
China
Prior art keywords
transaction
time
exchange hour
weight
classifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810641664.4A
Other languages
English (en)
Other versions
CN109034194B (zh
Inventor
蒋昌俊
章昭辉
王鹏伟
汪立智
张晓波
周欣欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
National Dong Hwa University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201810641664.4A priority Critical patent/CN109034194B/zh
Publication of CN109034194A publication Critical patent/CN109034194A/zh
Application granted granted Critical
Publication of CN109034194B publication Critical patent/CN109034194B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Accounting & Taxation (AREA)
  • Computer Security & Cryptography (AREA)
  • Probability & Statistics with Applications (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Complex Calculations (AREA)

Abstract

本发明涉及一种基于特征分化的交易欺诈行为深度检测方法,其特征在于,提出了基于交易时间的分化特征生成方法和带有离群样本检测的欺诈交易检测方法。本发明提出的网络交易欺诈检测方法,可以有效检测网络交易中的欺诈行为,本发明提供的方法从实用性角度出发,通过分化特征生成方法和带有离群样本检测的欺诈交易检测方法,建立了网络交易欺诈检测系统,为解决欺诈交易检测提供了技术支持。

Description

基于特征分化的交易欺诈行为深度检测方法
技术领域
本发明涉及一种网络交易检测方法。
背景技术
机器学习算法在欺诈交易检测领域已经涌现了大量的研究成果,包括使用决策树、神经网络、贝叶斯网络和随机森林等分类方法的研究。2013年,Yusuf Sahin等提出了一种新的基于成本敏感的决策树检测技术,模型表现出优越于诸如SVM等的传统数据挖掘方法的性能。2014年,Kolalikhormuji等提出了利用级联人工神经网络来提高识别率并降低排斥率,设置门控网络聚合三个并行的神经网络,在巴西一家大型银行的信用卡数据上表现了不错的性能。2015年,Chengwei Liu等对比了SVM、logictic回归、KNN和随机森林四种检测方法在金融欺诈检测上的表现,研究表明随机森林模型相比其他三种模型有更高的准确性。但这些检测技术对信用卡欺诈都有着不低的FP(False Positive)和FN(FalseNegative)。近年来深度学习在欺诈交易领域也逐渐开始被应用。2015年,丁卫星提出了一个基于深度置信网络的信用卡交易欺诈侦测模型,训练生成了一个五层的DBN模型,为各银行应用深度学习技术提供了理论和实践参考。2016年,Fu Kang等提出了利用卷积神经网络来进行信用卡欺诈检测,基于经典的Lenet-5结构建立了一个欺诈交易检测框架并取得了不错的检测效果。2017年,Shuhao Wang等人应用循环神经网络(Recurrent NeuralNetworks)对京东的电子交易欺诈行为做出了初步探索,通过RNN的时间序列算法建立了CLUE检测框架,对风险用户识别的准确率超过常规机器学习算法的3倍以上。但是深度学习技术训练参数多,模型结构比较复杂,训练时间比较长,同时对于数据的维度有更高的要求。
随着互联网交易的迅猛发展,网络诈骗成为中国第三大黑色产业链,呈现出团伙性、隐蔽性等特点。网络欺诈交易的强隐蔽性会严重影响欺诈检测模型的检测效果,使用精准分类的特征是十分重要的。通常的模型只使用一些原始交易属性,比如金额、交易地点等。单一的交易并没有考虑客户的交易行为,只使用原始特征会遗漏一些重要信息,并不能有效检测欺诈行为。一些聚合策略,比如衍生基于时间窗的特征,已经被用来在获取用户近期交易中的行为特征。但是欺诈者往往会学习正常用户的行为模式来逃避检测,而且欺诈样本的特性往往会被基于统计学的方法所泛化,仅仅使用聚合策略并不能很好地分化正常交易和欺诈交易之间的差异。
样本不均衡的问题也是网络交易欺诈检测领域的一大挑战。该问题在互联网交易的场景中普遍存在,欺诈交易的比率通常小于0.1%。在此背景下,利用传统的机器学习算法开发出来的预测模型会存在偏差,易导致模型忽略对欺诈交易行为的识别和学习。原因在于机器学习的算法通常被设计为通过减少误差来提高准确率,所以它们没有考虑类别的分布以及类别的平衡。诸如决策树和Logistic回归这些标准的分类算法会偏向于数量多的类别,而占少数的类别就会被视为噪声,通常易被忽略。
传统检测欺诈交易的技术,诸如基于规则的专家系统容易理解,可解释性强,但是只能挖掘交易属性和欺诈行为的简单关系,无法检测强隐蔽性的欺诈交易,同时还有存在由于欺诈手段变化而导致规则失效的风险。近年来一些基于机器学习技术的检测技术在信用卡欺诈检测领域取得了不错的成果,包括传统的决策树,贝叶斯网络和神经网络以及新兴的深度学习。相比信用卡的欺诈交易检测,网络交易实时性强,交易频次高,在交易类型等方面呈现多元化,因此信用卡欺诈检测的方法并不完全适用于网络交易欺诈检测。
发明内容
本发明的目的是:检测网络交易中的欺诈交易。
为了达到上述目的,本发明的技术方案是提供了一种基于特征分化的交易欺诈行为深度检测方法,其特征在于,包括以下步骤:
步骤1、利用历史交易数据建立训练集,构建欺诈检测模型;
步骤2、利用分类器f(x)对训练集中的样本进行分类,对不同类别的样本分别采样;
步骤3、将采样得到的样本定义为训练交易数据,在原有交易属性特征基础上,采用基于交易时间的分化特征生成方法,衍生训练交易数据的分化特征,分化正常交易和欺诈交易之间的差异,生成输入特征集合;
步骤4、更新欺诈检测模型;
步骤5、将输入特征集合输入到欺诈检测模型中进行模型参数的训练,确定构建模型的结构和参数,在验证数据集上评估当前模型的检测性能,相比上一次评估,如果当前性能提升大于设定阈值,则对于正确预测的样本,改变其权重使得在下一次训练有更低的概率被抽取,对于错误预测的样本,改变其权重使得下一次训练由更高的概率被抽取,根据更新后的权重更新分类器f(x)后返回步骤2,如果当前性能提升小于设定阈值,则欺诈检测模型停止更新,得到可以精准检测网络欺诈交易的模型;
步骤6、采用步骤3所述的分化特征生成方法,衍生实时输入的交易数据的分化特征,生成实时输入特征集合,将实时输入特征集合输入到步骤5生成的模型,判断实时输入的交易数据对应的交易是否为欺诈交易。
优选地,将所述训练交易数据及所述实时输入的交易数据统一定义为交易记录,则所述分化特征生成方法包括以下步骤:
步骤3.1、基于时间窗聚合交易记录的特征,包括:
步骤3.1.1、设置时间窗tp,选择时间窗tp内产生的交易记录;
步骤3.1.2、考虑卡号或者账户对步骤3.1.1得到的交易记录进行分组;
步骤3.1.3、通过交易属性对分组后的交易记录进行二次分组;
步骤3.1.4、计算对应分组内的交易笔数和交易金额;
步骤3.1.5、衍生时间窗tp下的交易笔数和交易金额的特征;
步骤3.1.6、改变时间窗tp大小,重复步骤3.1.1到步骤3.1.5,直至遍历所有交易记录;
步骤3.2、建立交易时间的个体可信度ICD和群体可疑度GAD,包括:
步骤3.2.1、设置时间窗tp,考虑客户编号为的客户过去时间窗tp内的交易时间集合Time:
其中,M表示交易时间集合Time的大小;代表第l个交易记录的交易时间;代表客户编号为的客户的当前交易时间;是用来计算之间时间差的函数;表示第l个交易记录的客户编号。
步骤3.2.2、设定聚簇数k,使用K-means算法对交易时间集合Time进行聚类,得到交易时间簇timei(i=1,2,...,k);
步骤3.2.3、统计每一个交易时间簇内的交易数量numberi(i=1,2,..,k),对每一交易时间簇timei赋予权重weighti
其中,N=|Time|,表示交易时间集合中的数量;
步骤3.2.4、计算k个交易时间簇的交易时间的概率分布函数:
其中,μ(timei)表示过去时间窗tp内第i个交易时间簇timei的均值;σ(timei)表示过去时间窗tp内第i个交易时间簇timei的标准差;表示VonMises的概率分布函数。
步骤3.2.5、设置置信度α,计算每一交易时间簇timei当前客户编号为的交易时间的置信区间:
其中,表示对应的标准分数。
步骤3.2.6、观察当前实际交易时间是否在每一交易时间簇的置信区间内,若在则令pi=1,否则pi=0,计算ICD如下:
步骤3.2.7、抽取所有欺诈交易的交易时间集合,同样采取步骤3.2.2至步骤3.2.6,计算GAD如下:
其中,K是欺诈交易集合聚类的聚簇数,valuei是聚类后第i个簇被赋予的权重;
步骤3.2.8、衍生当前交易的交易时间可信度confidence:
confidence=ICD-GAD。
优选地,所述更新欺诈检测模型包括以下步骤:
输入特征集合进入模型的处理层,输出处理的结果到下一层,下一层接收上一层处理的特征信息,继续扩充下一层,当扩充一个新层后,进入所述步骤5。
优选地,所述更新分类器f(x)包括以下步骤:
步骤5.1、将训练集中每个样本的权重定为
步骤5.2、设定m个分类器,则第j个分类器为hj(x),j=1,2,3...,m;
步骤5.3、计算每个分类器加权的错误率,第j个分类器hj(x)加权的错误率为errj
步骤5.4、计算每个分类器的权值,第j个分类器hj(x)的权值为wj
步骤5.5、更新每个样本的权重βi,错误预测的样本的权重变大,正确预测的样本的权重变小;
步骤5.6、输出最终的分类器f(x):
发明的有益效果如下:
本发明提出的网络交易欺诈检测方法,可以有效检测网络交易中的欺诈行为,本发明提供的方法从实用性角度出发,通过分化特征生成方法和带有离群样本检测的欺诈交易检测方法,建立了网络交易欺诈检测系统,为解决欺诈交易检测提供了技术支持。
附图说明
图1为网络交易欺诈深度检测系统整体框架,检测系统主要由模型训练模块和欺诈检测模块两部分组成;
图2为本发明的具体流程图;
图3为基于交易时间的分化特征生成方法中基于时间窗的特征聚合策略流程图;
图4为基于交易时间的分化特征生成方法中交易时间可信度衍生流程图;
图5为带有离群样本检测的欺诈交易检测方法流程图;
图6为欺诈交易检测方法中离群样本检测机制的流程图;
图7为银行交易模拟流程图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明涉及网络交易欺诈检测方法,主要有以下三部分内容:
第1部分:网络交易欺诈检测系统。检测系统主要由模型训练模块和欺诈检测模块两部分组成。
第2部分:基于交易时间的分化特征生成方法。一方面采用基于时间窗的特征聚合策略,另一方面建立基于Von Mises分布的交易时间的个体可信度(ICD)和群体可疑度(GAD)。
第3部分:带有离群样本检测的欺诈交易检测方法。提出网络交易的欺诈交易检测方法,加入离群样本的检测机制。
本发明的技术核心在于第2部分和第3部分,在此基础上提出网络交易欺诈检测方法。在欺诈交易检测任务上,网络交易欺诈检测方法实现的关键在于两点:一方面欺诈交易的强隐蔽性会严重影响欺诈检测模型的检测效果,使用精准分类的特征对于检测欺诈交易十分重要;同时网络交易欺诈检测的样本不均衡也影响模型检测效果。针对网络交易中欺诈行为的强隐蔽性和样本不均衡性,本发明提出了基于交易时间的分化特征生成方法和带有离群样本检测的欺诈交易检测方法,建立了本发明的网络交易欺诈检测方法。
根据以上思想,建立本发明的网络欺诈交易监测方法如下:
S1模型训练
输入训练交易数据,选择检测模型结构,对检测模型进行训练,得到网络交易欺诈检测模型。具体操作步骤如下:
S101数据预处理
对输入的训练交易数据进行数据清洗、数据归一化等常规处理,提高输入模型的数据的质量。
S102分化特征处理
在原有交易属性特征基础上,采用基于交易时间的分化特征生成方法,衍生分化特征,分化正常交易和欺诈交易之间的差异。
S103构建模型结构
采用带有离群样本检测的欺诈交易检测方法,构建欺诈检测模型结构。
S104模型训练
将经过数据预处理和分化特征处理处理的交易数据,输入到构建的检测模型中进行模型参数的训练。
S105模型生成
确定构建模型的结构和参数,得到可以精准检测网络欺诈交易的模型。
S106训练结束,输出模型。
S2欺诈检测
实时输入待检测的交易数据,输入步骤S1训练好的模型,判断待检测的交易数据是否属于欺诈交易。具体操作步骤如下:
S201数据预处理
对实时输入的交易数据进行数据清洗、数据归一化等常规处理。
S202分化特征处理
采用模型训练模块的分化特征方法,生成与模型训练模块相同的输入特征集合。
S203模型检测
将待检测交易输入到模型训练模块生成的检测模型,判断交易是否为欺诈交易。
S204检测结束,输出判断结果。
在建立网络交易欺诈检测系统中,本发明首先提出了基于交易时间的分化特征生成方法,用来分化正常交易和欺诈交易的差异。该方法的具体操作步骤如下:
(1)采用基于时间窗的特征聚合策略,衍生基于交易时间的特征。
S301设置时间窗tp,选择过去tp时间内产生的交易记录。
S302考虑卡号或者账户对交易记录进行分组。
S303通过交易类型、地区或者其他交易属性对已经分组的交易记录二次分组。
S304计算对应分组内的交易笔数和交易金额。
S305衍生时间窗tp下的交易笔数和交易金额的特征。
S306改变时间窗tp大小,重复S301到S305步骤,直至遍历所有交易记录。
S307聚合特征结束。
(2)基于Von Mises分布,建立交易时间的个体可信度(ICD)和群体可疑度(GAD),计算交易时间的可信度。
S401设置时间窗tp,考虑某一客户编号为的过去tp时间内的交易时间集合Time:
其中,M表示交易时间集合Time的大小;代表第l个交易记录的交易时间;代表客户编号为的客户的当前交易时间;是用来计算之间时间差的函数;表示第l个交易记录的客户编号。
S402设定聚簇数k,使用K-means算法对Time集合进行聚类,得到交易时间簇timei(i=1,2,...,k)。
S403统计每一个交易时间簇内交易数量numberi(i=1,2,..,k),对每一交易时间簇timei赋予权重weighti
其中,N=|Time|,表示交易时间集合中的数量;。
S404计算k个簇的交易时间的概率分布函数:
其中,μ(timei)表示过去时间窗tp内第i个交易时间簇timei的均值;σ(timei)表示过去时间窗tp内第i个交易时间簇timei的标准差;表示VonMises的概率分布函数。
S405设置置信度α,计算每一交易时间簇timei当前客户编号为的交易时间的置信区间:
其中,表示表示对应的标准分数。
S406观察当前实际交易时间是否在每一交易时间簇的置信区间内,若在则令pi=1,否则pi=0。计算ICD如下:
S407抽取所有欺诈交易的交易时间集合,同样采取步骤S402-S406,计算GAD如下:
其中,K是欺诈交易集合聚类的聚簇数,valuei是聚类后第i个簇被赋予的权重。
S408衍生当前交易的交易时间可信度confidence:confidence=ICD-GAD。
S409分化特征结束。
针对欺诈检测系统中的检测模型,本发明提出了带有离群样本检测的欺诈交易检测方法,在检测方法中加入离群样本检测机制,采用了有放回和无放回结合的样本采样方式,缓解网络交易中样本不均衡带来的问题。检测方法架构流程如下:
S501选取原始交易特征和分化特征方法生成的特征作为输入特征集,输入交易数据。
S502设置模型结构,输入数据进入模型的处理层,输出处理的结果到下一层。
S503下一层接收上一层处理的特征信息,重复S502的操作,继续扩充下一层。
S504当扩充一个新层后,模型将在验证数据集上评估当前模型的检测性能。相比上一次评估,如果当前性能提升小于设定阈值,模型停止更新。
S505建模结束。
由于欺诈交易的极度不均衡性,需要重点检测的离群检测样本被有放回采样的概率存在极低的可能性,就会造成一部分交易样本无法准确检测,从而降低检测欺诈交易的效果。在此基础上,本发明在检测方法中加入离群样本检测机制。对于初始训练集中的所有交易记录赋予相同权重,也就说样本具有相同的概率被采样。之后对数据进行训练,对于正确预测的样本,改变其权重使得在下一次训练有更低的概率被抽取,对于错误预测的样本,即离群样本,改变其权重使得后面的模型更加关注这些被错误分类的样本,从而提升模型检测欺诈的精准性。具体离群样本检测算法流程如下:
S601将训练集中每个样本的权重定为
S602设定m个分类器,则第j个分类器为hj(x),j=1,2,3...,m;
S6021计算每个分类器加权的错误率,第j个分类器hj(x)加权的错误率为errj
S6022计算每个分类器的权值,第j个分类器hj(x)的权值为wj
S6023更新每个样本的权重βi,错误预测的样本的权重变大,正确预测的样本的权重变小;
S603输出最终的分类器f(x):
本发明所述的网络交易欺诈深度检测方法及系统可以应用到某银行等大规模网络服务系统中,本发明应用到国内某主流银行交易系统中进行实验验证,通过系统行为重构方法实现银行交易数据实时欺诈检测流程。具体方法描述如图7所示。
以国内某主流银行的真实的网络交易数据为例,数据集包含了银行三个月的B2C交易记录,原始可用交易属性有8维,其中大约7万多条交易被标记为欺诈交易:
S1选取前两个月交易数据作为训练集,最后一个月作为模拟测试实时交易数据。
S2数据预处理。
S3对交易数据采用分化特征生成方法衍生特征。采用基于时间窗的特征聚合策略,选择tp=3,6,12,24,72,120,168,衍生交易金额和交易笔数特征共14维特征;计算交易时间的ICD和GAD,衍生交易时间可信度特征。加上原始交易特征,输入特征集合为23维。
S4构建带有离群样本检测的欺诈交易检测模型。选择深度森林算法,引入离群样本检测机制,在深度森林的级联结构每一层设置两个随机森林和两个xgboost。输入训练集数据进行模型训练。
S5模拟测试实时交易数据输入训练好的带有离群样本检测的欺诈交易检测方法,按照图7所示的模拟交易流程进行交易检测,判断交易数据是否欺诈。

Claims (4)

1.一种基于特征分化的交易欺诈行为深度检测方法,其特征在于,包括以下步骤:
步骤1、利用历史交易数据建立训练集,构建欺诈检测模型;
步骤2、利用分类器f(x)对训练集中的样本进行分类,对不同类别的样本分别采样;
步骤3、将采样得到的样本定义为训练交易数据,在原有交易属性特征基础上,采用基于交易时间的分化特征生成方法,衍生训练交易数据的分化特征,分化正常交易和欺诈交易之间的差异,生成输入特征集合;
步骤4、更新欺诈检测模型;
步骤5、将输入特征集合输入到欺诈检测模型中进行模型参数的训练,确定构建模型的结构和参数,在验证数据集上评估当前模型的检测性能,相比上一次评估,如果当前性能提升大于设定阈值,则对于正确预测的样本,改变其权重使得在下一次训练有更低的概率被抽取,对于错误预测的样本,改变其权重使得下一次训练由更高的概率被抽取,根据更新后的权重更新分类器f(x)后返回步骤2,如果当前性能提升小于设定阈值,则欺诈检测模型停止更新,得到可以精准检测网络欺诈交易的模型;
步骤6、采用步骤3所述的分化特征生成方法,衍生实时输入的交易数据的分化特征,生成实时输入特征集合,将实时输入特征集合输入到步骤5生成的模型,判断实时输入的交易数据对应的交易是否为欺诈交易。
2.如权利要求1所述的一种基于特征分化的交易欺诈行为深度检测方法,其特征在于,将所述训练交易数据及所述实时输入的交易数据统一定义为交易记录,则所述分化特征生成方法包括以下步骤:
步骤3.1、基于时间窗聚合交易记录的特征,包括:
步骤3.1.1、设置时间窗tp,选择时间窗tp内产生的交易记录;
步骤3.1.2、考虑卡号或者账户对步骤3.1.1得到的交易记录进行分组;
步骤3.1.3、通过交易属性对分组后的交易记录进行二次分组;
步骤3.1.4、计算对应分组内的交易笔数和交易金额;
步骤3.1.5、衍生时间窗tp下的交易笔数和交易金额的特征;
步骤3.1.6、改变时间窗tp大小,重复步骤3.1.1到步骤3.1.5,直至遍历所有交易记录;
步骤3.2、建立交易时间的个体可信度ICD和群体可疑度GAD,包括:
步骤3.2.1、设置时间窗tp,考虑客户编号为的客户过去时间窗tp内的交易时间集合Time:
其中,M表示交易时间集合Time的大小;代表第l个交易记录的交易时间;代表客户编号为的客户的当前交易时间;是用来计算之间时间差的函数;表示第l个交易记录的客户编号;
步骤3.2.2、设定聚簇数k,使用K-means算法对交易时间集合Time进行聚类,得到交易时间簇timei(i=1,2,...,k);
步骤3.2.3、统计每一个交易时间簇内的交易数量numberi(i=1,2,..,k),对每一交易时间簇timei赋予权重weighti
其中,N=|Time|,表示交易时间集合中的数量;
步骤3.2.4、计算k个交易时间簇的交易时间的概率分布函数:
其中,μ(timei)表示过去时间窗tp内第i个交易时间簇timei的均值;σ(timei)表示过去时间窗tp内第i个交易时间簇timei的标准差;表示Von Mises的概率分布函数。
步骤3.2.5、设置置信度α,计算每一交易时间簇timei当前客户编号为的交易时间的置信区间:
其中,表示表示对应的标准分数。
步骤3.2.6、观察当前实际交易时间是否在每一交易时间簇的置信区间内,若在则令pi=1,否则pi=0,计算ICD如下:
步骤3.2.7、抽取所有欺诈交易的交易时间集合,同样采取步骤3.2.2至步骤3.2.6,计算GAD如下:
其中,K是欺诈交易集合聚类的聚簇数,valuei是聚类后第i个簇被赋予的权重;
步骤3.2.8、衍生当前交易的交易时间可信度confidence:
confidence=ICD-GAD。
3.如权利要求1所述的一种基于特征分化的交易欺诈行为深度检测方法,其特征在于,所述更新欺诈检测模型包括以下步骤:
输入特征集合进入模型的处理层,输出处理的结果到下一层,下一层接收上一层处理的特征信息,继续扩充下一层,当扩充一个新层后,进入所述步骤5。
4.如权利要求1所述的一种基于特征分化的交易欺诈行为深度检测方法,其特征在于,所述更新分类器f(x)包括以下步骤:
步骤5.1、将训练集中每个样本的权重定为
步骤5.2、设定m个分类器,则第j个分类器为hj(x),j=1,2,3...,m;
步骤5.3、计算每个分类器加权的错误率,第j个分类器hj(x)加权的错误率为errj
步骤5.4、计算每个分类器的权值,第j个分类器hj(x)的权值为wj
步骤5.5、更新每个样本的权重βi,错误预测的样本的权重变大,正确预测的样本的权重变小;
步骤5.6、输出最终的分类器f(x):
CN201810641664.4A 2018-06-20 2018-06-20 基于特征分化的交易欺诈行为深度检测方法 Active CN109034194B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810641664.4A CN109034194B (zh) 2018-06-20 2018-06-20 基于特征分化的交易欺诈行为深度检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810641664.4A CN109034194B (zh) 2018-06-20 2018-06-20 基于特征分化的交易欺诈行为深度检测方法

Publications (2)

Publication Number Publication Date
CN109034194A true CN109034194A (zh) 2018-12-18
CN109034194B CN109034194B (zh) 2022-03-04

Family

ID=64610474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810641664.4A Active CN109034194B (zh) 2018-06-20 2018-06-20 基于特征分化的交易欺诈行为深度检测方法

Country Status (1)

Country Link
CN (1) CN109034194B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109754258A (zh) * 2018-12-24 2019-05-14 同济大学 一种基于个体行为建模的面向线上交易欺诈检测方法
CN109829721A (zh) * 2019-02-13 2019-05-31 同济大学 基于异质网络表征学习的线上交易多主体行为建模方法
CN109858930A (zh) * 2019-01-24 2019-06-07 同济大学 基于关联图谱表征学习的线上交易欺诈检测方法
CN110084610A (zh) * 2019-04-23 2019-08-02 东华大学 一种基于孪生神经网络的网络交易欺诈检测系统
CN110113757A (zh) * 2019-05-07 2019-08-09 中国联合网络通信集团有限公司 欺诈用户识别方法及系统
CN110414780A (zh) * 2019-06-18 2019-11-05 东华大学 一种基于生成对抗网络的金融交易负样本生成方法
CN111105241A (zh) * 2019-12-20 2020-05-05 浙江工商大学 一种应用于信用卡交易反欺诈的识别方法
CN111178902A (zh) * 2019-12-12 2020-05-19 同济大学 基于自动化特征工程的网络支付欺诈检测方法
CN111260462A (zh) * 2020-01-16 2020-06-09 东华大学 一种基于异质关系网络注意力机制的交易欺诈检测方法
CN111681044A (zh) * 2020-05-28 2020-09-18 中国工商银行股份有限公司 积分兑换作弊行为处理方法及装置
CN112967061A (zh) * 2021-03-02 2021-06-15 东华大学 具有交易性格的用户行为识别方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070133768A1 (en) * 2005-12-12 2007-06-14 Sapphire Mobile Systems, Inc. Fraud detection for use in payment processing
US20130275237A1 (en) * 2012-04-16 2013-10-17 Wal-Mart Stores, Inc. Processing Online Transactions
CA2851898A1 (en) * 2013-05-08 2014-11-08 The Toronto-Dominion Bank Biometric-based transaction fraud detection
CN104679777A (zh) * 2013-12-02 2015-06-03 中国银联股份有限公司 一种用于检测欺诈交易的方法及系统
CN105005901A (zh) * 2015-07-09 2015-10-28 厦门快商通信息技术有限公司 一种面向金融领域的交易欺诈检测系统与方法
CN105095238A (zh) * 2014-05-04 2015-11-25 中国银联股份有限公司 用于检测欺诈交易的决策树生成方法
CN105787743A (zh) * 2016-02-26 2016-07-20 中国银联股份有限公司 基于样本聚类的欺诈交易检测方法
CN105843889A (zh) * 2016-03-21 2016-08-10 华南师范大学 基于可信度面向大数据及普通数据的数据采集方法和系统
CN107993139A (zh) * 2017-11-15 2018-05-04 华融融通(北京)科技有限公司 一种基于动态规则库的消费金融反欺诈系统与方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070133768A1 (en) * 2005-12-12 2007-06-14 Sapphire Mobile Systems, Inc. Fraud detection for use in payment processing
US20130275237A1 (en) * 2012-04-16 2013-10-17 Wal-Mart Stores, Inc. Processing Online Transactions
CA2851898A1 (en) * 2013-05-08 2014-11-08 The Toronto-Dominion Bank Biometric-based transaction fraud detection
CN104679777A (zh) * 2013-12-02 2015-06-03 中国银联股份有限公司 一种用于检测欺诈交易的方法及系统
CN105095238A (zh) * 2014-05-04 2015-11-25 中国银联股份有限公司 用于检测欺诈交易的决策树生成方法
CN105005901A (zh) * 2015-07-09 2015-10-28 厦门快商通信息技术有限公司 一种面向金融领域的交易欺诈检测系统与方法
CN105787743A (zh) * 2016-02-26 2016-07-20 中国银联股份有限公司 基于样本聚类的欺诈交易检测方法
CN105843889A (zh) * 2016-03-21 2016-08-10 华南师范大学 基于可信度面向大数据及普通数据的数据采集方法和系统
CN107993139A (zh) * 2017-11-15 2018-05-04 华融融通(北京)科技有限公司 一种基于动态规则库的消费金融反欺诈系统与方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
C. WHITROW.ETC: ""Transaction aggregation as a strategy for credit card fraud detection"", 《DATA MIN KNOWL DISC》 *
佘玉萍等: ""三种不同监督方法的离群值检测在欺诈交易上的比较"", 《长春大学学报》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109754258B (zh) * 2018-12-24 2023-05-12 同济大学 一种基于个体行为建模的面向线上交易欺诈检测方法
CN109754258A (zh) * 2018-12-24 2019-05-14 同济大学 一种基于个体行为建模的面向线上交易欺诈检测方法
CN109858930A (zh) * 2019-01-24 2019-06-07 同济大学 基于关联图谱表征学习的线上交易欺诈检测方法
CN109858930B (zh) * 2019-01-24 2023-06-09 同济大学 基于关联图谱表征学习的线上交易欺诈检测方法
CN109829721A (zh) * 2019-02-13 2019-05-31 同济大学 基于异质网络表征学习的线上交易多主体行为建模方法
CN109829721B (zh) * 2019-02-13 2023-06-06 同济大学 基于异质网络表征学习的线上交易多主体行为建模方法
CN110084610A (zh) * 2019-04-23 2019-08-02 东华大学 一种基于孪生神经网络的网络交易欺诈检测系统
CN110084610B (zh) * 2019-04-23 2023-06-23 东华大学 一种基于孪生神经网络的网络交易欺诈检测系统
CN110113757A (zh) * 2019-05-07 2019-08-09 中国联合网络通信集团有限公司 欺诈用户识别方法及系统
CN110414780A (zh) * 2019-06-18 2019-11-05 东华大学 一种基于生成对抗网络的金融交易负样本生成方法
CN110414780B (zh) * 2019-06-18 2023-06-23 东华大学 一种基于生成对抗网络的金融交易数据的欺诈检测方法
CN111178902B (zh) * 2019-12-12 2023-05-16 同济大学 基于自动化特征工程的网络支付欺诈检测方法
CN111178902A (zh) * 2019-12-12 2020-05-19 同济大学 基于自动化特征工程的网络支付欺诈检测方法
CN111105241B (zh) * 2019-12-20 2023-04-07 浙江工商大学 一种应用于信用卡交易反欺诈的识别方法
CN111105241A (zh) * 2019-12-20 2020-05-05 浙江工商大学 一种应用于信用卡交易反欺诈的识别方法
CN111260462B (zh) * 2020-01-16 2022-05-27 东华大学 一种基于异质关系网络注意力机制的交易欺诈检测方法
CN111260462A (zh) * 2020-01-16 2020-06-09 东华大学 一种基于异质关系网络注意力机制的交易欺诈检测方法
CN111681044A (zh) * 2020-05-28 2020-09-18 中国工商银行股份有限公司 积分兑换作弊行为处理方法及装置
CN112967061B (zh) * 2021-03-02 2022-10-18 东华大学 具有交易性格的用户行为识别方法
CN112967061A (zh) * 2021-03-02 2021-06-15 东华大学 具有交易性格的用户行为识别方法

Also Published As

Publication number Publication date
CN109034194B (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
CN109034194A (zh) 基于特征分化的交易欺诈行为深度检测方法
CN107766929B (zh) 模型分析方法及装置
CN110084610A (zh) 一种基于孪生神经网络的网络交易欺诈检测系统
CN112613552B (zh) 一种结合情感类别注意力损失的卷积神经网络情感图像分类方法
CN108681970A (zh) 基于大数据的理财产品推送方法、系统及计算机存储介质
TWI752349B (zh) 風險識別方法及裝置
CN110084609B (zh) 一种基于表征学习的交易欺诈行为深度检测方法
CN108647730A (zh) 一种基于历史行为共现的数据划分方法及系统
CN114707571B (zh) 基于增强隔离森林的信用数据异常检测方法
CN110020868B (zh) 基于线上交易特征的反欺诈模块决策融合方法
CN104850868A (zh) 一种基于k-means和神经网络聚类的客户细分方法
CN108228687A (zh) 大数据知识挖掘及精准跟踪方法与系统
CN109214444B (zh) 基于孪生神经网络和gmm的游戏防沉迷判定系统及方法
CN107622326A (zh) 用户分类、可用资源预测方法、装置及设备
CN108268886A (zh) 用于识别外挂操作的方法及系统
CN106372237A (zh) 欺诈邮件识别方法及装置
CN114663002A (zh) 一种自动化匹配绩效考核指标的方法及设备
CN104537383A (zh) 一种基于粒子群的海量组织机构数据分类方法及系统
CN110348516A (zh) 数据处理方法、装置、存储介质及电子设备
CN117408699A (zh) 一种基于银行卡数据的电信诈骗识别方法
Wang Research on bank marketing behavior based on machine learning
CN106991171A (zh) 基于智慧校园信息服务平台的话题发现方法
CN112819499A (zh) 信息发送方法、装置、服务器及存储介质
CN116821688A (zh) 基于聚类下采样技术处理信用卡欺诈交易中数据集的方法
CN111292182A (zh) 一种信贷欺诈检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant