CN115204901B - 基于多特征融合的信用卡欺诈检测方法、装置及介质 - Google Patents
基于多特征融合的信用卡欺诈检测方法、装置及介质 Download PDFInfo
- Publication number
- CN115204901B CN115204901B CN202211100976.7A CN202211100976A CN115204901B CN 115204901 B CN115204901 B CN 115204901B CN 202211100976 A CN202211100976 A CN 202211100976A CN 115204901 B CN115204901 B CN 115204901B
- Authority
- CN
- China
- Prior art keywords
- model
- transaction
- fraud
- credit card
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 122
- 230000004927 fusion Effects 0.000 title claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 66
- 239000013598 vector Substances 0.000 claims abstract description 51
- 238000003062 neural network model Methods 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 17
- 230000006399 behavior Effects 0.000 claims description 37
- 230000006870 function Effects 0.000 claims description 22
- 238000012795 verification Methods 0.000 claims description 22
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000003860 storage Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000009826 distribution Methods 0.000 claims description 12
- 238000004519 manufacturing process Methods 0.000 claims description 11
- 210000004027 cell Anatomy 0.000 claims description 10
- 238000004088 simulation Methods 0.000 claims description 9
- 239000013604 expression vector Substances 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000011835 investigation Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Security & Cryptography (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供了基于多特征融合的信用卡欺诈检测方法、装置及介质,可以有效提高欺诈交易预测的准确率、召回率,大幅降低欺诈交易的假阳性率,方法包括:采集持卡人信息数据;通过前馈神经网络模型、卷积神经网络模型、Bi‑LSTM模型分别将持卡人的基本信息数据、金融操作行为数据、信用卡交易信息数据进行嵌入表示,拼接得到样本特征表示向量;构建并训练生成对抗网络模型;利用完成训练的生成器模型生成模拟欺诈样本,合并生成新的训练集,构建并训练多个检测基模型,将完成训练的多种检测基模型与判别器模型进行组合得到信用卡欺诈检测集成模型;当持卡人发生新的交易时,通过信用卡欺诈检测集成模型预测持卡人的信用卡欺诈风险预测结果。
Description
技术领域
本发明涉及信用卡欺诈检测领域和机器学习领域,具体涉及基于多特征融合的信用卡欺诈检测方法、装置及介质。
背景技术
信用卡支付已成为人们当前使用频率最高的几种支付方式之一,它在给人们带来巨大支付便利的同时,也因频繁存在的盗刷、盗用等欺诈风险给持卡人、发卡方造成大量的财产和信誉损失。将机器学习技术应用到信用卡欺诈检测领域,能够有效降低检测机构对反欺诈专家人员及专家知识的依赖,显著提高检测效率。但不能忽略的是,若欺诈检测模型对合法交易的误判率太高,同样也会大幅增加发卡机构的人工调查成本,并给持卡人带来较为不便的用户体验,从而逐步丧失用户粘性,降低发卡方从该用户获得盈利的能力。
大多数现有的信用卡欺诈检测模型存在以下三个方面的不足:
一是只采集了持卡人交易特征数据(如交易金额、时间、余额等),而忽略了持卡人的基本特征数据(如年龄、性别、职业等)。从统计情况来看,不同年龄、不同性别的持卡人在交易行为上可能会存在较大差异,例如男性更喜欢购买电子产品,而女性更喜欢购买彩妆产品等。通过单一类型的特征数据进行模型训练时,会出现特征缺失的情况,一般难以获得较高的准确率。
二是虽然采集了交易特征和基本特征两种类型的特征数据,但只是对这两种类型的特征数据做简单的拼接,并没有挖掘不同类型特征数据间、类型虽然相同但特征不同的数据间的高维隐藏关系,从而可能出现特征表现不足的情况。
三是真实的信用卡欺诈样本数据集往往是极度不平衡的,即合法交易样本远多于欺诈交易样本,不对训练数据集进行均衡化处理往往会使得模型对欺诈交易样本学习不足,从而使得模型难以获得较高的召回率。此外,一些现有的模型虽然使用SMOTE等重采样算法对训练数据集进行均衡化处理,提高了召回率,但因为重采样过程中引入了大量的噪声样本,增大了模型的假阳性率,从使得发卡方不得不支付更多的人工调查成本。
发明内容
针对上述问题,本发明旨在提供一种基于多特征融合的信用卡欺诈检测方法、装置及介质,可以有效提高欺诈交易预测的准确率、召回率,大幅降低欺诈交易的假阳性率。
其技术方案是这样的:一种基于多特征融合的信用卡欺诈检测方法,包括以下步骤:
采集持卡人信息数据,所述持卡人信息数据包括持卡人的基本信息数据、持卡人的金融操作行为数据、持卡人的信用卡交易信息数据;
通过前馈神经网络模型将持卡人的基本信息数据进行嵌入表示,通过卷积神经网络模型将持卡人的金融操作行为数据进行嵌入表示,通过Bi-LSTM模型将持卡人的信用卡交易信息数据进行嵌入表示,拼接各个模型输出的特征向量得到样本特征表示向量;
构建生成对抗网络模型,生成对抗网络模型包括生成器模型和判别器模型,生成器模型用于生成模拟欺诈样本,判别器模型用于分辨真实欺诈样本和模拟欺诈样本,依据数据库中的合法交易样本与欺诈交易样本的比例设置样本集合中的合法交易样本与欺诈交易样本的比例,训练生成对抗网络模型;
将样本集合划分为训练集与验证集,利用完成训练的生成器模型生成模拟欺诈样本,将模拟欺诈样本与训练集合并生成新的平衡训练集,构建多个检测基模型,通过新的平衡训练集训练多个检测基模型,通过验证集对检测基模型参数进行调优;
将完成训练的多种检测基模型与判别器模型进行组合,得到信用卡欺诈检测集成模型;
当持卡人发生新的交易时,分别通过完成训练的前馈神经网络模型、卷积神经网络模型、Bi-LSTM模型对持卡人信息进行嵌入表示,拼接得到持卡人的样本特征表示向量,将持卡人的样本特征表示向量输入信用卡欺诈检测集成模型中,输出持卡人的信用卡欺诈风险预测结果。
进一步的,构建Bi-LSTM模型,所述Bi-LSTM模型包括一个前向LSTM和一个后向LSTM,按时间先后顺序对持卡人时间区间内通过信用卡进行交易的数据进行排序,得到序列,通过Bi-LSTM模型将持卡人的信用卡交易信息数据的序列嵌入转换为特征向量,
LSTM中各单元的值按照如下计算:
构建生成对抗网络模型,所述生成对抗网络模型包括生成器模型G和判别器模型D,所述生成器模型用于生成模拟欺诈样本,所述判别器模型用于分辨真实欺诈样本和模拟欺诈样本;
训练对抗网络模型包括以下步骤:
从卡交易系统生产数据库中抽取部分信用卡交易样本组成样本集合,集合包含合法交易样本子集与欺诈交易样本子集,其中;欺诈交易样本子集与合法交易样本子集之间的比例依据卡交易系统生产数据库中的合法交易与欺诈交易样本比例设置;
按比例对样本集合进行切分,分为训练集与验证集,训练集与验证集在的样本通过完成训练的前馈神经网络模型、卷积神经网络模型、Bi-LSTM模型计算样本的嵌入特征向量,拼接得到样本特征表示向量,组合成新的训练集与验证集,训练集与验证集中欺诈样本与合法样本的比例依据卡交易系统生产数据库中的合法交易与欺诈交易样本比例设置;
进一步,将训练集切分为合法样本集和欺诈样本集,使用完成训练的生成器模型G根据欺诈样本集和噪音样本z生成k个模拟样本,给每个模拟样本打上欺诈标签,得到模拟欺诈样本集合,将模拟欺诈样本集合与合法样本集和欺诈样本集合并得到新的平衡训练样本集合,。
基于统计学习方法构建多个检测基模型,检测基模型用表示,对于任意检测基模型,通过新的平衡训练集进行训练,通过验证集进行模型参数调优,其中模型的性能调优指标包括欺诈样本的准确率、召回率、合法样本的假阳性率、ROC及AUC-ROC。
进一步的,使用Bagging算法将完成训练的检测基模型与完成训练的判别器模型D进行组合,得到信用卡欺诈检测集成模型,信用卡欺诈检测集成模型包括n+1个检测基模型,其中第n+1个检测模型为判别器模型D;
当持卡人发起一笔信用卡交易时,通过完成训练的前馈神经网络模型、卷积神经网络模型、Bi-LSTM模型计算持卡人样本的嵌入特征向量,并用包括n+1个检测基模型的信用卡欺诈检测集成模型对持卡人的此次交易进行预测,预测结果表示为:
进一步的,还包括步骤:将风险预测结果发送至信用卡交易系统进行联动决策,根据预先配置的策略对当前交易是否进行干预及采用的干预级别进行决策。
若信用卡欺诈检测集成模型给出的预测结果为合法交易,则对当前交易放行,交易成功;若模型预测结果为欺诈交易,则根据配置情况、用户当前认证级别情况决定采取的干预措施,干预措施包括交易阻断和提升交易认证级别。
一种计算机装置,其包括:处理器、存储器以及程序;
所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行上述的一种基于多特征融合的信用卡欺诈检测方法。
一种计算机可读存储介质,所述计算机可读存储介质用于存储程序,所述程序用于执行上述的一种基于多特征融合的信用卡欺诈检测方法。
与现有技术相比,本发明具有以下优势:
1.本发明将持卡人的多种特征数据进行了融合表示,除了信用卡的持卡人基本信息特征、交易行为特征外,还通过三元组序列定义并使用了持卡人在不同渠道内的金融操作行为的特征,为模型提供了更为广泛、全面的特征数据,金融操作行为特征数据地引入,能够让模型构建持卡人合法操作行为基线,当某信用卡交易行为明显偏离模型基线时,能够被模型快速捕获并预警;并且,本发明分别通过前馈神经网络、生成对抗网络、Bi-LSTM模型对持卡人基本信息特征、交易行为特征及其在不同渠道内金融操作行为特征间的隐藏关系进行深度挖掘,构建了更为准确、细化的特征表示,在提升欺诈检测模型的性能的同时也有效压缩了特征数据所需的存储空间。
2.本发明利用了生成对抗网络模型有效解决训练样本中的类不均衡问题,按照数据库中原始欺诈样本的特征与分布情况生成大量类似特征分布的模拟欺诈样本,弥补现有方法的不足,大幅降低了类不均衡比率,有效避免了判别器模型向多数类样本偏移的现象。此外,与现有技术中,SMOTE等现有上采样方法不同,本发明通过生成对抗网络模型生成的模拟欺诈样本分布与真实的欺诈样本分布更为接近,能够避免在模型中引入过多的噪音样本,从而提升模型准确率。
3.本发明将多个检测基模型与生成对抗网络模型中的判别器模型进行集成,获得了信用卡欺诈检测集成模型,一方面有效避免了系统整体性能对单个基模型的过度依赖,另一方面通过对已完成训练的判别器模型的引入,能够进一步丰富检测基模型类别,提升系统整体的泛化能力。
通过以上机制综合应用,本发明显著提升了检测模型对信用卡交易欺诈的检测能力,在提高模型准确率、召回率的同时,有效降低模型的假阳性率,从而帮助持卡人、发卡机构大幅减少欺诈损失和反欺诈调查方面的人工成本。
附图说明
图1为本发明实施例中的一种基于多特征融合的信用卡欺诈检测方法的主要流程示意图;
图2为本发明实施例的方法中步骤2的通过前馈神经网络、卷积神经网络、Bi-LSTM模型获得嵌入基本特征、金融操作行为特征及交易特征的嵌入表示示意图;
图3为本发明实施例的方法中步骤3至步骤5中的通过生成对抗网络构建新的样本训练集、训练多个检测基模型并进行Bagging集成获得信用卡欺诈检测集成模型的示意图;
图4为一个实施例中计算机装置的内部结构图。
具体实施方式
见图1,本发明的一种基于多特征融合的信用卡欺诈检测方法,至少包括以下步骤:
步骤1:采集持卡人信息数据,持卡人信息数据包括持卡人的基本信息数据、持卡人的金融操作行为数据、持卡人的信用卡交易信息数据;
步骤2:通过前馈神经网络模型将持卡人的基本信息数据进行嵌入表示,通过卷积神经网络模型将持卡人的金融操作行为数据进行嵌入表示,通过Bi-LSTM模型将持卡人的信用卡交易信息数据进行嵌入表示,拼接各个模型输出的特征向量得到样本特征表示向量;
步骤3:构建生成对抗网络模型,生成对抗网络模型包括生成器模型和判别器模型,生成器模型用于生成模拟欺诈样本,判别器模型用于分辨真实欺诈样本和模拟欺诈样本,依据数据库中的合法交易样本与欺诈交易样本的比例设置样本集合中的合法交易样本与欺诈交易样本的比例,训练生成对抗网络模型;
步骤4:将样本集合划分为训练集与验证集,利用完成训练的生成器模型生成模拟欺诈样本,将模拟欺诈样本与训练集合并生成新的平衡训练集,构建多个检测基模型,通过新的平衡训练集训练多个检测基模型,通过验证集对检测基模型参数进行调优;
步骤5:将完成训练的多种检测基模型与判别器模型进行组合,得到信用卡欺诈检测集成模型;
步骤6:当持卡人发生新的交易时,分别通过完成训练的前馈神经网络模型、卷积神经网络模型、Bi-LSTM模型对持卡人信息进行嵌入表示,拼接得到持卡人的样本特征表示向量,将持卡人的样本特征表示向量输入信用卡欺诈检测集成模型中,输出持卡人的信用卡欺诈风险预测结果。
本实施例提供的方法,将持卡人的多种特征数据进行了融合表示,包括了信用卡持卡人的基本信息特征、交易行为特征和持卡人的金融操作行为的特征,为模型提供了更为广泛、全面的特征数据,金融操作行为特征数据地引入,能够让模型构建持卡人合法操作行为基线,当某信用卡交易行为明显偏离模型基线时,能够被模型快速捕获并预警;并且,分别通过前馈神经网络、生成对抗网络、Bi-LSTM模型对持卡人基本信息特征、交易行为特征及其在不同渠道内金融操作行为特征间的隐藏关系进行深度挖掘,构建了更为准确、细化的特征表示,在提升欺诈检测模型的性能的同时也有效压缩了特征数据所需的存储空间;
同时,本实施例的方法利用生成对抗网络模型有效解决训练样本中的类不均衡问题,在训练生成对抗网络模型时按照数据库中原始欺诈样本的特征与分布情况生成模拟欺诈样本,弥补现有方法的不足,大幅降低了类不均衡比率,有效避免了模型向多数类样本偏移的现象;
另外本实施例中提供的信用卡欺诈检测集成模型,将多个检测基模型与生成对抗网络模型中的判别器模型进行集成,有效避免了系统整体性能对单个基模型的过度依赖,并且通过对已完成训练的判别器模型的引入,进一步丰富检测基模型类别,提升系统整体的泛化能力。
从而,本实施例的方法显著提升了检测模型对信用卡交易欺诈的检测能力,在提高模型准确率、召回率的同时,有效降低模型的假阳性率,从而帮助持卡人、发卡机构大幅减少欺诈损失和反欺诈调查方面的人工成本。
具体在本发明的一个实施例中,在步骤1中,具体包括以下步骤:
从数据库中提取持卡人基本信息数据,持卡人基本信息数据可以包括年龄、婚姻状态、受教育程度、职业、职务等信息,持卡人基本信息数据通过集合进行表示,其中集合中的每个参数分别表示持卡人的一个基本属性,可以分别对应为年龄、婚姻状态、受教育程度、职业、职务等信息中的一个;
从数据库中提取持卡人的金融操作行为数据,具体为持卡人在不同金融渠道内的操作行为数据,可以包括网银端购买理财产品、手机端查看金融资讯等,持卡人的金融操作行为数据通过集合表示,其中分别表示持卡人在各渠道内的一次操作,每个操作用三元组表示,其中为本次操作的主标记、为操作的子标记、为操作的附言,在本实施例中,主标记、子标记为操作的ID分类,例如购买理财,主标记为购买理财的操作ID,例如1005;子标记为对应的理财产品ID,例如202;附言可以为文本,也可以为数字,例如购买理财的金额;
从数据库中提取持卡人的信用卡交易信息数据,持卡人的信用卡交易信息数据可以包括网上购物或线下POS消费的金额、时间、当前余额、30天内交易次数等,持卡人的信用卡交易信息数据,通过集合表示,其中分别表示持卡人本次交易的一个属性。
见图2,在本发明的一个实施例中,在步骤2中,具体包括以下步骤:
在步骤2中还构建了构建Bi-LSTM模型,Bi-LSTM模型包括一个前向LSTM和一个后向LSTM,按时间先后顺序对持卡人时间区间内通过信用卡进行交易的数据进行排序,得到序列,通过Bi-LSTM模型将持卡人的信用卡交易信息数据的序列嵌入转换为特征向量,
Bi-LSTM模型中,LSTM中各单元的值按照如下计算:
见图3,在本发明的一个实施例中,在步骤3中,具体包括以下步骤:
构建生成对抗网络模型,生成对抗网络模型包括生成器模型G和判别器模型D,生成器模型G主要用于模拟生成欺诈样本,判别器模型D主要用于判别输入样本的类别,例如是真实的欺诈样本还是模拟的欺诈样本。
在本实施例中,训练对抗网络模型包括以下步骤:
从卡交易系统生产数据库中抽取部分信用卡交易样本组成样本集合,集合包含合法交易样本子集与欺诈交易样本子集,其中;统计卡交易系统生产数据库中的合法交易与欺诈交易样本比例,欺诈交易样本子集与合法交易样本子集之间的比例依据卡交易系统生产数据库中的合法交易与欺诈交易样本比例设置;在本实施例中,欺诈交易样本数:合法交易样本数,则样本子集与子集之间的关系为。
其中为判别器模型D的可训练参数,通过随机梯度上升的方法对进行更新,从而使得判别器模型D的交叉熵最小,使得值最大;越大,表明判别器模型D对欺诈样本和生成样本的分辨能力越强,即对欺诈样本的预测准确率更高。
其中为生成器模型G的可训练参数,通过随机梯度下降的方法对进行更新,从而使得生成器模型G的交叉熵最小,使得值最大;越大,表明生成器模型G生成的模拟欺诈样本的伪装能力越强,以至于判别器网络D无法准确分辨真实的欺诈样本和模拟生成的欺诈样本,为判别器网络D后续的迭代训练与性能提升提供了样本数据基础;
损失函数loss的优化目标是通过训练找到最佳的参数,使得生成器模型G能够生成出与真实的欺诈样本分布十分接近的模拟欺诈样本,同时使得判别器模型D能够准确区分真实的欺诈样本与模拟欺诈样本。
在本发明的一个实施例中,在步骤4中,具体包括以下步骤:
按比例对样本集合进行切分,分为训练集与验证集,训练集与验证集在的样本通过完成训练的前馈神经网络模型、卷积神经网络模型、Bi-LSTM模型计算样本的嵌入特征向量,拼接得到样本特征表示向量,组合成新的训练集与验证集,训练集与验证集中欺诈样本与合法样本的比例,依据信用卡交易系统生产数据库中的合法交易与欺诈交易样本比例设置,其中与中欺诈样本与合法样本的比例均为1:t;
将训练集切分为合法样本集和欺诈样本集,使用完成训练的生成器模型G根据欺诈样本集和噪音样本z生成k个模拟样本,给每个模拟样本打上欺诈标签,得到模拟欺诈样本集合,将模拟欺诈样本集合与合法样本集和欺诈样本集合并得到新的平衡训练样本集合,,中欺诈样本与合法样本接近1:1,通过平衡训练样本集合弥补了现有方法的不足,大幅降低了类不均衡比率,有效避免了模型向多数类样本偏移的现象。
基于统计学习方法构建多个检测基模型,包括决策树、随机深林、多层感知机、GBDT、XGBoost、SVM、ANN、DNN等n种模型,检测基模型用表示,对于任意基模型,通过新的平衡训练集进行训练,通过验证集进行模型参数调优,其中模型的性能调优指标包括欺诈样本的准确率、召回率、合法样本的假阳性率、ROC及AUC-ROC。
在本发明的一个实施例中,在步骤5中,使用Bagging算法将完成训练的检测基模型与完成训练的判别器模型D进行组合,得到信用卡欺诈检测集成模型,信用卡欺诈检测集成模型包括n+1个检测基模型,其中第n+1个检测模型为判别器模型D;
在步骤6中,当持卡人发起一笔信用卡交易时,通过完成训练的前馈神经网络模型、卷积神经网络模型、Bi-LSTM模型计算持卡人样本的嵌入特征向量,并用包括n+1个检测基模型的信用卡欺诈检测集成模型对持卡人的此次交易进行预测,预测结果表示为:
将本实施例的方法得到的信用卡欺诈检测集成模型应用到真实的信用卡数据集进行测试,从测试结果来看,改进后的模型相较于传统模型将准确率提高了5%至8%、将召回率提高了3%至6%、将假阳性率降低了3%至8%。考虑到银行机构百万级信用卡用户、千万级信用卡交易基数,改进后的模型能够大幅减少银行机构在信用卡反欺诈方面的欺诈损失和人工调查成本,经济效益显著。
在本发明的另一个实施例中,除了步骤1至步骤6以外,还包括步骤7:将风险预测结果发送至信用卡交易系统进行联动决策,根据预先配置的策略对当前交易是否进行干预及采用的干预级别进行决策。例如,若模型预测结果为合法交易,则对当前交易放行,交易成功;若模型预测结果为欺诈交易,则可根据配置情况、用户当前认证级别情况决定采取的干预措施,如交易阻断,使得本次交易失败,或提升交易认证级别,表现为要求用户进行更高安全等级的认证,如动态验证码等。
在本发明的实施例中,还提供了一种基于多特征融合的信用卡欺诈检测装置,其包括:处理器、存储器以及程序;
程序存储在存储器中,处理器调用存储器存储的程序,以执行上述的一种基于多特征融合的信用卡欺诈检测方法。
该计算机装置可以是终端,其内部结构图可以如图4所示。该计算机装置包括通过总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机装置的处理器用于提供计算和控制能力。该计算机装置的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机装置的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现基于多特征融合的信用卡欺诈检测方法。该计算机装置的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机装置的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机装置外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
存储器可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(Programmable Read-OnlyMemory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。
处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、网络处理器(NetworkProcessor,简称:NP)等。该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机装置的限定,具体的计算机装置可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本发明的实施例中,还提供了一种计算机可读存储介质,计算机可读存储介质被配置成存储程序,程序被配置成执行上述的一种基于多特征融合的信用卡欺诈检测方法。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、计算机装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、计算机装置、或计算机程序产品的流程图和/或框图来描述的。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图和/或中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图中指定的功能。
以上对本发明所提供的在一种基于多特征融合的信用卡欺诈检测方法、计算机装置、计算机可读存储介质的应用进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种基于多特征融合的信用卡欺诈检测方法,其特征在于,包括以下步骤:
采集持卡人信息数据,所述持卡人信息数据包括持卡人的基本信息数据、持卡人的金融操作行为数据、持卡人的信用卡交易信息数据,所述持卡人的金融操作行为数据包括持卡人在不同金融渠道内的操作行为数据,所述持卡人的信用卡交易信息数据包括网上购物、线下POS消费的金额、时间、当前余额和30天内交易次数;
通过前馈神经网络模型将持卡人的基本信息数据进行嵌入表示,通过卷积神经网络模型将持卡人的金融操作行为数据进行嵌入表示,通过Bi-LSTM模型将持卡人的信用卡交易信息数据进行嵌入表示,拼接各个模型输出的特征向量得到样本特征表示向量;
构建生成对抗网络模型,生成对抗网络模型包括生成器模型和判别器模型,生成器模型用于生成模拟欺诈样本,判别器模型用于分辨真实欺诈样本和模拟欺诈样本,依据数据库中的合法交易样本与欺诈交易样本的比例设置样本集合中的合法交易样本与欺诈交易样本的比例,训练生成对抗网络模型;
将样本集合划分为训练集与验证集,利用完成训练的生成器模型生成模拟欺诈样本,将模拟欺诈样本与训练集合并生成新的平衡训练集,构建多个检测基模型,通过新的平衡训练集训练多个检测基模型,通过验证集对检测基模型参数进行调优;
将完成训练的多种检测基模型与判别器模型进行组合,得到信用卡欺诈检测集成模型;
当持卡人发生新的交易时,分别通过完成训练的前馈神经网络模型、卷积神经网络模型、Bi-LSTM模型对持卡人信息进行嵌入表示,拼接得到持卡人的样本特征表示向量,将持卡人的样本特征表示向量输入信用卡欺诈检测集成模型中,输出持卡人的信用卡欺诈风险预测结果。
3.根据权利要求2所述的一种基于多特征融合的信用卡欺诈检测方法,其特征在于:样本特征表示向量通过执行如下步骤获得:
构建Bi-LSTM模型,所述Bi-LSTM模型包括一个前向LSTM和一个后向LSTM,按时间先后顺序对持卡人时间区间内通过信用卡进行交易的数据进行排序,得到序列,通过Bi-LSTM模型将持卡人的信用卡交易信息数据的序列嵌入转换为特征向量,
LSTM中各单元的值按照如下计算:
4.根据权利要求1所述的一种基于多特征融合的信用卡欺诈检测方法,其特征在于:构建的所述生成对抗网络模型包括生成器模型G和判别器模型D,所述生成器模型用于生成模拟欺诈样本,所述判别器模型用于分辨真实欺诈样本和模拟欺诈样本;
训练对抗网络模型包括以下步骤:
从卡交易系统生产数据库中抽取部分信用卡交易样本组成样本集合,集合包含合法交易样本子集与欺诈交易样本子集,其中;欺诈交易样本子集与合法交易样本子集之间的比例依据卡交易系统生产数据库中的合法交易与欺诈交易样本比例设置;
5.根据权利要求4所述的一种基于多特征融合的信用卡欺诈检测方法,其特征在于:按比例对样本集合进行切分,分为训练集与验证集,训练集与验证集在的样本通过完成训练的前馈神经网络模型、卷积神经网络模型、Bi-LSTM模型计算样本的嵌入特征向量,拼接得到样本特征表示向量,组合成新的训练集与验证集,训练集与验证集中欺诈样本与合法样本的比例依据卡交易系统生产数据库中的合法交易与欺诈交易样本比例设置;
7.根据权利要求6所述的一种基于多特征融合的信用卡欺诈检测方法,其特征在于:使用Bagging算法将完成训练的检测基模型与完成训练的判别器模型D进行组合,得到信用卡欺诈检测集成模型,信用卡欺诈检测集成模型包括n+1个检测基模型,其中第n+1个检测模型为判别器模型D;
当持卡人发起一笔信用卡交易时,通过完成训练的前馈神经网络模型、卷积神经网络模型、Bi-LSTM模型计算持卡人样本的嵌入特征向量,并用包括n+1个检测基模型的信用卡欺诈检测集成模型对持卡人的此次交易进行预测,预测结果表示为:
8.根据权利要求7所述的一种基于多特征融合的信用卡欺诈检测方法,其特征在于:还包括步骤:将风险预测结果发送至信用卡交易系统进行联动决策,根据预先配置的策略对当前交易是否进行干预及采用的干预级别进行决策。
9.一种计算机装置,其特征在于,其包括:处理器、存储器以及程序;
所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行权利要求1所述的一种基于多特征融合的信用卡欺诈检测方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质用于存储程序,所述程序用于执行权利要求1所述的一种基于多特征融合的信用卡欺诈检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211100976.7A CN115204901B (zh) | 2022-09-09 | 2022-09-09 | 基于多特征融合的信用卡欺诈检测方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211100976.7A CN115204901B (zh) | 2022-09-09 | 2022-09-09 | 基于多特征融合的信用卡欺诈检测方法、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115204901A CN115204901A (zh) | 2022-10-18 |
CN115204901B true CN115204901B (zh) | 2022-12-06 |
Family
ID=83572180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211100976.7A Active CN115204901B (zh) | 2022-09-09 | 2022-09-09 | 基于多特征融合的信用卡欺诈检测方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115204901B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115618238B (zh) * | 2022-12-14 | 2023-03-14 | 湖南工商大学 | 基于参数偏移修正集成学习的信用卡欺诈检测方法 |
CN116433345B (zh) * | 2023-05-05 | 2024-05-24 | 意数信息技术(上海)有限公司 | 基于ai的欺诈活动分析方法及数字化金融产品服务系统 |
CN116681434B (zh) * | 2023-06-07 | 2024-08-16 | 科睿特软件集团股份有限公司 | 基于年卡防盗刷算法的行为管理系统及其方法 |
CN118379061A (zh) * | 2024-04-18 | 2024-07-23 | 华南师范大学 | 交易欺诈的检测方法、装置、计算机设备以及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242296A (zh) * | 2018-11-29 | 2020-06-05 | 激发认知有限公司 | 自动模型构建搜索空间缩减 |
CN111325619A (zh) * | 2018-12-15 | 2020-06-23 | 深圳先进技术研究院 | 一种基于联合学习的信用卡欺诈检测模型更新方法及装置 |
CN112819604A (zh) * | 2021-01-19 | 2021-05-18 | 浙江省农村信用社联合社 | 基于融合神经网络特征挖掘的个人信用评估方法与系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200065813A1 (en) * | 2018-08-24 | 2020-02-27 | Capital One Services, Llc | Methods and arrangements to detect fraudulent transactions |
US20210312528A1 (en) * | 2020-04-01 | 2021-10-07 | Capital One Services, Llc | System, method and computer-accessible medium for repeating prior purchases |
US20210374756A1 (en) * | 2020-05-29 | 2021-12-02 | Mastercard International Incorporated | Methods and systems for generating rules for unseen fraud and credit risks using artificial intelligence |
-
2022
- 2022-09-09 CN CN202211100976.7A patent/CN115204901B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242296A (zh) * | 2018-11-29 | 2020-06-05 | 激发认知有限公司 | 自动模型构建搜索空间缩减 |
CN111325619A (zh) * | 2018-12-15 | 2020-06-23 | 深圳先进技术研究院 | 一种基于联合学习的信用卡欺诈检测模型更新方法及装置 |
CN112819604A (zh) * | 2021-01-19 | 2021-05-18 | 浙江省农村信用社联合社 | 基于融合神经网络特征挖掘的个人信用评估方法与系统 |
Non-Patent Citations (2)
Title |
---|
《A Heterogeneous Ensemble Learning Model Based on Data Distribution for Credit Card Fraud Detection》;Yalong Xie等;《Wireless Communications and Mobile Computing》;20211231;全文 * |
《基于生成式对抗网络的信用卡欺诈预测模型研究》;于梦珂;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;20200815(第8期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115204901A (zh) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115204901B (zh) | 基于多特征融合的信用卡欺诈检测方法、装置及介质 | |
CN106875078B (zh) | 交易风险检测方法、装置及设备 | |
US20230360052A1 (en) | Machine learning model and narrative generator for prohibited transaction detection and compliance | |
CN111428872A (zh) | 用于将来自更复杂模型的知识融入更简单模型中的系统、方法和计算机程序产品 | |
CN111311416A (zh) | 一种基于多通道图和图神经网络的区块链洗钱节点检测方法 | |
CN106960387A (zh) | 个人信用风险评估方法及系统 | |
CN110084609B (zh) | 一种基于表征学习的交易欺诈行为深度检测方法 | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
CN109801077A (zh) | 一种套现用户检测方法、装置及设备 | |
Esakkiraj et al. | A predictive approach for fraud detection using hidden Markov model | |
Li et al. | A time attention based fraud transaction detection framework | |
CN114519508A (zh) | 基于时序深度学习和法律文书信息的信用风险评估方法 | |
Kadam et al. | Loan approval prediction system using logistic regression and CIBIL score | |
Pandey et al. | A review of credit card fraud detection techniques | |
CN111553685A (zh) | 确定交易路由通道的方法、装置、电子设备和存储介质 | |
CN116883147A (zh) | 基于tcn模型的信用卡欺诈预测方法、装置及电子设备 | |
CN113706258B (zh) | 基于组合模型的产品推荐方法、装置、设备及存储介质 | |
Xiao et al. | Explainable fraud detection for few labeled time series data | |
CN114998001A (zh) | 业务类别识别方法、装置、设备、存储介质和程序产品 | |
Ali et al. | SMOTE Based Credit Card Fraud Detection Using Convolutional Neural Network | |
Pulkkinen et al. | A multi-objective rule optimizer with an application to risk management | |
Motora et al. | Detecting Fraudulent Bank Transactions Using Deep Learning Enhanced with Genetic Programming | |
Manickam et al. | Credit Card Fraud Detection Using Machine Learning | |
US20230079513A1 (en) | Unsupervised clustering feature engineering | |
CN112967134B (zh) | 网络训练方法、风险用户识别方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |