CN116433242B - 基于注意力机制的欺诈检测方法 - Google Patents
基于注意力机制的欺诈检测方法 Download PDFInfo
- Publication number
- CN116433242B CN116433242B CN202310212558.5A CN202310212558A CN116433242B CN 116433242 B CN116433242 B CN 116433242B CN 202310212558 A CN202310212558 A CN 202310212558A CN 116433242 B CN116433242 B CN 116433242B
- Authority
- CN
- China
- Prior art keywords
- transfer
- fraud
- historical
- blacklist
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 64
- 230000007246 mechanism Effects 0.000 title claims abstract description 29
- 238000012546 transfer Methods 0.000 claims abstract description 397
- 238000009826 distribution Methods 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000012544 monitoring process Methods 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 6
- 239000013598 vector Substances 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 7
- 230000001960 triggered effect Effects 0.000 claims description 6
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 abstract description 14
- 238000012549 training Methods 0.000 abstract description 7
- 238000002372 labelling Methods 0.000 abstract description 4
- 238000010606 normalization Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 16
- 230000009286 beneficial effect Effects 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Technology Law (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供了一种基于注意力机制的欺诈检测方法,包括:步骤1:监测用户转账信息,当检测到用户有转账意向时,触发欺诈检测算法;步骤2:获取当前转账的相关信息,计算当前转账与用户的历史转账之间的相似度,并将所述相似度作为对应的历史转账的权重;步骤3:对权重进行归一化处理,得到用户历史转账集合的概率分布,根据概率分布以及历史转账对应的判断赋值序列,计算当前转账为欺诈的概率。本方法将交易欺诈预测的二分类问题重新定义为序列标注问题,并使用基于注意力机制的自回归模型对同一用户的交易序列进行建模,进一步提高模型训练和推理速度,适合转账业务场景的高计算效率需求。
Description
技术领域
本发明涉及人工智能检测技术领域,特别涉及一种基于注意力机制的欺诈检测方法。
背景技术
交易欺诈检测技术是零售金融领域,例如信用卡消费,的重要基础设施之一。该技术的主要目标是预测每一笔消费、转账、或交易为欺诈,例如信用卡盗刷,的概率,并及时采取相应措施进行止损。机器学习模型是该模块的核心部件。该类模型主要为二分类模型,即,给定某一笔交易信息,例如转账金额,时间和商户类型,输出当笔交易为欺诈的概率。传统建模方法基于独立同分布假设,使用逻辑回归模型或梯度提升决策树模型及其变体,例如XGBoost,LightGBM等,对每一笔交易进行独立预测。
但这一方法忽略了一个重要因素即,同一用户的每一笔消费、交易并非相互独立,而是应当以该用户的消费习惯为基础而相互关联起来的。为了对消费习惯进行建模,传统方法大多使用特征工程来对用户的历史消费进行统计,例如用户历史平均交易金额和最频繁的交易时间,并把衍生变量作为新的特征输入到模型中参与模型训练和预测。但该方法对建模人员的业务经验要求较高,并可能受到建模人员的主观判断影响,从而遗漏或过多输入部分变量。因为特征工程的具体方法并非基于数据驱动,因此其有效性并无法得到保证。为此本法发明提出一种基于注意力机制的欺诈检测方法解决上述问题。
发明内容
本发明提供一种基于注意力机制的欺诈检测方法,本方法将交易欺诈预测的二分类问题重新定义为序列标注问题,并使用基于注意力机制的自回归模型对同一用户的交易序列进行建模,进一步提高模型训练和推理速度,适合转账业务场景的高计算效率需求。
本发明提供一种基于注意力机制的欺诈检测方法,包括:
步骤1:监测用户转账信息,当检测到用户有转账意向时,触发欺诈检测算法;
步骤2:获取当前转账的相关信息,计算当前转账与用户的历史转账之间的相似度,并将所述相似度作为对应的历史转账的权重;
步骤3:对所述权重进行归一化处理,得到用户历史转账集合的概率分布,根据所述概率分布计算当前转账为欺诈的概率。
优选的,所述步骤1,包括:
实时监测用户线上动态,当检测到用户选择支付功能时,判断用户具有转账意向,向欺诈预警系统发送欺诈检测请求;
欺诈预警系统接收到欺诈检测请求后,基于欺诈预警系统的预警处理模块触发欺诈检测算法。
优选的,所述步骤2,包括:
获取当前转账的相关信息,更新交易序列,确定当前转账的在交易序列中的第一数字标识,生成第一转账信息向量;
获取当前转账用户对应的历史转账信息以及第二数字标识,生成多个第二转账信息向量;
基于所述第一转账信息向量以及第二转账信息向量,利用相似度函数计算当前转账与各个历史转账之间的相似度,并将所述相似度作为对应的历史转账权重。
优选的,所述获取当前转账的相关信息,更新交易序列,包括:
获取第一交易序列对应的全部历史数字标识中的最大数字标识,将所述最大数字标识对应的数值加1得到当前转账的第一数字标识;
按照交易序列存储规则,将当前转账的相关信息进行整合,获得整合信息;
根据第一数字标识对应的存储顺序,将整合信息补充至第一交易序列中更新得到第二交易序列。
优选的,所述的一种基于注意力机制的欺诈检测方法,还包括:
在得到第二交易序列后,向当前转账添加待确定欺诈标签,并根据当前转账为欺诈的概率以及实际转账情况对待确定欺诈标签进行更新。
优选的,所述步骤3,包括:
利用softmax函数对所述权重进行归一化处理,得到用户历史转账集合的概率分布;
同时,分别获取各个历史转账的欺诈标识,并根据所述欺诈标识对各个历史账户进行判断赋值,生成判断赋值序列;
根据所述概率分布以及判断赋值序列携带的数字标识的对应关系,计算当前转账为欺诈的概率。
优选的,根据所述欺诈标识对各个历史账户进行判断赋值,生成判断赋值序列,包括:
当历史转账的欺诈标识为是时,所述历史转账对应的判断赋值为1;
当历史转账的欺诈标识为否时,所述历史转账对应的判断赋值为0;
获取全部判断赋值结果,按照判断赋值结果对应的历史转账的第二数字标识顺序,生成判断赋值序列。
优选的,根据所述概率分布以及判断赋值序列携带的数字标识的对应关系,计算当前转账为欺诈的概率,具体包括:
根据概率分布中各个概率对应的历史转账的第二数字标识,分别向各个所述概率分布中的各个概率添加第三数字标识;
基于判断赋值序列中各个判断赋值对应的历史转账的第二数字标识,与所述第三数字标识之间的对应关系,获得各个概率与判断赋值的配对结果;
根据配对结果,计算各个概率与其匹配的判断赋值的乘积,将所述乘积相加得到当前转账为欺诈的概率。
优选的,所述的一种基于注意力机制的欺诈检测方法,还包括:
步骤4:根据当前转账为欺诈的概率对当前转账进行风险评价,具体包括:
当前转账为欺诈的概率小于第一阈值时,判定当前转账作为安全转账;
当前转账为欺诈的概率大于等于第一阈值小于第二阈值时,判定当前转账为有风险转账,并向用户发出一级风险提醒;
当前转账为欺诈的概率大于等于第二阈值时,判定当前转账作为高风险转账,向用户发出二级风险提醒并拦截当前转账。
优选的,所述的一种基于注意力机制的欺诈检测方法,还包括:
获取根据历史转账以及当前转账生成转账黑名单;
当在下次检测到用户有转账意向时,在触发欺诈检测算法的同时,获取下次转账对应的第一目标账户;
将第一目标账户与转账黑名单进行对比,确定第一目标账户是否为黑名单账户,若是,拦截所述转账,并终止欺诈检测算法的运行;
若不是,继续保持欺诈检测算法的运行。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明一种基于注意力机制的欺诈检测方法的示意图;
图2为本发明一种基于注意力机制的欺诈检测方法步骤1的示意图;
图3为本发明一种基于注意力机制的欺诈检测方法步骤2的示意图;
图4为本发明一种基于注意力机制的欺诈检测方法步骤3的示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本发明提供一种基于注意力机制的欺诈检测方法,如图1所示,包括:
步骤1:监测用户转账信息,当检测到用户有转账意向时,触发欺诈检测算法;
步骤2:获取当前转账的相关信息,计算当前转账与用户的历史转账之间的相似度,并将所述相似度作为对应的历史转账的权重;
步骤3:对权重进行归一化处理,得到用户历史转账集合的概率分布,根据概率分布以及历史转账对应的判断赋值序列,计算当前转账为欺诈的概率。
本实施例中,相关信息是指当前转账的交易信息,例如交易金额、时间、交易账户等。
本实施例中,相似度是指采用相似度函数计算得到的当前转账与用户的历史转账之间的相似程度。
本实施例中,历史转账是指用户在当前转账之前的全部转账。
上述实施例的有益效果:本发明监测用户转账信息,当检测到用户有转账意向时,触发欺诈检测算法,实时监测用户的转账动态,避免用户受到欺诈,尽可能降低用户个人损失;在触发欺诈检测算法后,获取当前转账的相关信息,计算当前转账与用户的历史转账之间的相似度,并将所述相似度作为对应的历史转账的权重,对所述权重进行归一化处理,得到用户历史转账集合的概率分布,根据所述概率分布计算当前转账为欺诈的概率,将交易欺诈预测的二分类问题重新定义为序列标注问题,并使用基于注意力机制的自回归模型对同一用户的交易序列进行建模,使用无参模型,不需要进行额外模型训练,进一步提高模型训练和推理速度,适合转账业务场景的高计算效率需求,相对于基于顺序自回归模型,如循环神经网络的方法有显著计算效率提升。
同时,本发明所述的基于注意力机制的欺诈检测算法具有高度的灵活性,可根据业务需求将本发明所述的无参模型扩展至有参数模型,例如计算相似度之前对交易信息使用有参数模型,如线性模型或神经网络进行投影(Projection),在新的投影空间(Projection Space)内进行相似度计算,用于对复杂相似度进行建模。
本方法还具有良好的预测准确性和鲁棒性,在内部数据集进行测试过程中,本方法(无参数版本)在曲线下面积(Area Under ROC Curve,AUC)上达到0.83,相对GBDT基线算法(生产模型)获得了超过13%的提升。同时,相对于传统模型,本方法在过拟合问题(OverFitting)上也有显著提升。训练集与测试集之间的AUC差距小于0.02;基线模型的AUC差距约为0.06。
实施例2:
在上述实施例1的基础上,所述步骤1,如图2所示,包括:
步骤101:实时监测用户线上动态,当检测到用户选择支付功能时,判断用户具有转账意向,向欺诈预警系统发送欺诈检测请求;
步骤102:欺诈预警系统接收到欺诈检测请求后,基于欺诈预警系统的预警处理模块触发欺诈检测算法。
本实施例中,线上动态是指用户的在网上的动态即用户的网络浏览情况。
本实施例中,欺诈检测请求是指在检测到用于有转账意向时触发欺诈检测算法工资的控制指令。
本实施例中,欺诈预警系统是指包含欺诈检测算法的预警系统,可用于判断当前转账的风险等级。
上述实施例的有益效果:本发明实时监测用户线上动态,当检测到用户选择支付功能时,判断用户具有转账意向,向欺诈预警系统发送欺诈检测请求,实现了实时监测用户的转账动态,降低转账风险。欺诈预警系统接收到欺诈检测请求后,基于欺诈预警系统的预警处理模块触发欺诈检测算法,避免用户受到欺诈,尽可能降低用户个人损失。
实施例3:
在上述实施例1的基础上,所述步骤2,如图3所示,包括:
步骤201:获取当前转账的相关信息,更新交易序列,确定当前转账的在交易序列中的第一数字标识,生成第一转账信息向量;
步骤202:获取当前转账用户对应的历史转账信息以及第二数字标识,生成多个第二转账信息向量;
步骤203:基于所述第一转账信息向量以及第二转账信息向量,利用相似度函数计算当前转账与各个历史转账之间的相似度,并将所述相似度作为对应的历史转账权重。
本实施例中,第一数字标识是指当前转账在交易序列中的数字标识,其中数字标识是指各个转账子在全部转账中的顺序,即该转账为用户全部转账中的第几笔转账。
本实施例中,第一转账信息向量当前转账的信息向量;第二转账信息向量是指历史转账的信息向量。
本实施例中,第二数字标识是指各个历史转账在交易序列中的数字标识。
本实施例中,获取当前转账的第二数字标识为t,则得到更新后的交易序列为x1,x2,…,xt,其对应转账信息向量序列为X1,X2,…,Xt;
其中,Xt即为第一转账信息向量;X1,X2,…,Xt-1即为第二转账信息向量,
根据余弦相似函数计算当前转账与各个历史转账之间的相似度:
wi=cos(Xt,Xi)
其中,wi表示第i个历史转账与当前转账之间的相似度;Xi表示第i个历史转账第二转账信息向量;
将所述相似度作为对应的历史转账权重,得到w={w1,w2,…,wi,…,wt-1}。
本实施例中,相似度函数不止限于余弦相似函数,可根据业务经验可使用其他相似度度量,如欧氏距离(Euclidean Distance)和马氏距离(Mahalanobis Distance)。且,距离函数(Similarity Function)同样可以使用有参模型进行训练,如线性回归模型。
上述实施例的有益效果:本发明获取当前转账的相关信息,更新交易序列,确定当前转账的在交易序列中的第一数字标识,生成第一转账信息向量;获取当前转账用户对应的历史转账信息以及第二数字标识,生成多个第二转账信息向量,基于所述第一转账信息向量以及第二转账信息向量,利用相似度函数计算当前转账与各个历史转账之间的相似度,并将所述相似度作为对应的历史转账权重将交易欺诈预测的二分类问题重新定义为序列标注问题,将同一用户的每一笔消费、交易都有当前转账进行关联,使得当前转账的欺诈概率计算更加贴合用户消费习惯更加准确。
实施例4:
在上述实施例3的基础上,所述获取当前转账的相关信息,更新交易序列,包括:
获取第一交易序列对应的全部历史数字标识中的最大数字标识,将所述最大数字标识对应的数值加1得到当前转账的第一数字标识;
按照交易序列存储规则,将当前转账的相关信息进行整合,获得整合信息;
根据第一数字标识对应的存储顺序,将整合信息补充至第一交易序列中更新得到第二交易序列。
本实施例中,第一交易序列是指在用户为进行当前转账前是历史转账构成的交易序列,例如,当历史转账的总数为k时,第一交易序列为x1,x2,…,xk。
本实施例中,历史数字标识就是第一交易序列中各个历史转账的数字标识。
本实施例中,最大数字标识是指历史数字标识中数值最大的数,例如当历史转账的总数为k,则最大数字标识即为k,则当前转账的第一数字标识为t=k+1。
本实施例中,交易序列存储规则是指交易序列存储中需要的交易信息,例如交易金额、时间等。
本实施例中,整合信息是指剔除无关信息(即交易序列存储中不需要的交易信息)的相关信息。
本实施例中,存储顺序是指各个转账对应的数字标识(包括第一数字标识和第二数字标识)数值的大小顺序。
上述实施例的有益效果:本发明获取第一交易序列对应的全部历史数字标识中的最大数字标识,将所述最大数字标识对应的数值加1得到当前转账的第一数字标识,按照交易序列存储规则,将当前转账的相关信息进行整合,获得整合信息;根据第一数字标识对应的存储顺序,将整合信息补充至第一交易序列中更新得到第二交易序列实现了当前转账数字标识的获得,实现了交易序列的更新,同时有利于按照交易序列顺序,进行相似度计算,确保计算的有序性,避免相似度计算过程中数据的遗漏。
实施例5:
在上述实施例4的基础上,所述的一种基于注意力机制的欺诈检测算法,还包括:
在得到第二交易序列后,向当前转账添加待确定欺诈标签,并根据当前转账为欺诈的概率以及实际转账情况对待确定欺诈标签进行更新。
本实施例中,待确定欺诈标签是当前转账是否为欺诈转账并不确定的欺诈标签,欺诈标签包含两种一种为是标签,一种为否标签。是标签判定该转账未欺诈,否标签判定该转账不是欺诈。
本实施例中,根据当前转账为欺诈的概率以及实际转账情况对待确定欺诈标签进行更新,具体方法包括:
获取当前转账为欺诈的概率值,当前转账为欺诈的概率大于等于第一阈值小于第二阈值时,将当前转账的待确定欺诈标签调整为是标签;
当前转账为欺诈的概率小于第一阈值时,将当前转账的待确定欺诈标签调整为否标签;
当前转账为欺诈的概率大于等于第一阈值小于第二阈值时,判断用户是否完成转账;
若完成,将当前转账的待确定欺诈标签调整标记否标签,并持续获取当前转账的目标去向的账户安全性,当当前转账的目标去被判定为诈骗账户时,将所述标记否标签修改为是标签;
否则,在预设监测时间内所述目标去向未被判定为诈骗账户时,去除所述标记否标签的标记;
若没有完成,将当前转账的待确定欺诈标签调整为是标签;
其中,目标去向是指当前转账的目标账户;账户安全性是指目标账户是否未欺诈账户;
欺诈账户是指目标账户被反诈骗部门确定为欺诈账户。
上述实施例的有益效果:本发明在得到第二交易序列后,向当前转账添加待确定欺诈标签,并根据当前转账为欺诈的概率以及实际转账情况对待确定欺诈标签进行更新,根据用户的实际转账情况对当前转账的性质进行更新,确保欺诈判定的准确性,且后续其他转账欺诈概率的计算提供可靠数据。
实施例6:
在上述实施例1的基础上,所述步骤3,如图4所示,包括:
步骤301:利用softmax函数对所述权重进行归一化处理,得到用户历史转账集合的概率分布;
步骤302:分别获取各个历史转账的欺诈标识,并根据所述欺诈标识对各个历史账户进行判断赋值,生成判断赋值序列;
步骤303:根据所述概率分布以及判断赋值序列携带的数字标识的对应关系,计算当前转账为欺诈的概率。
本实施例中,利用softmax函数对所述权重进行归一化处理,得到用户历史转账集合的概率分布p:
p=softmax(w)
其中,用户历史转账集合的概率分布p包含了全部历史转账对应的概率值。
本实施例中,判断赋值是指判断每个历史转中是否为欺诈的判断值,是为1,否为0。
本实施例中,判断赋值序列是指全部历史转账(共k笔,且k=t-1)的判断赋值构建的序列,Y={Y1,Y2,…,Yk}。
本实施例中,根据所述概率分布以及判断赋值序列携带的数字标识的对应关系,计算当前转账为欺诈的概率:
其中,Pt表示当前转账为欺诈的概率;pi表示第i个历史转账对应的概率值;Yi表示第i个历史转账的判断赋值。
上述实施例的有益效果:本发明利用softmax函数对所述权重进行归一化处理,得到用户历史转账集合的概率分布;分别获取各个历史转账的欺诈标识,并根据所述欺诈标识对各个历史账户进行判断赋值,生成判断赋值序列;根据所述概率分布以及判断赋值序列携带的数字标识的对应关系,计算当前转账为欺诈的概率,基于加法模型,使得计算过程可以轻易并行化,进一步提高模型训练和推理速度,适合转账业务场景的高计算效率需求。此方法相对于基于顺序(Sequential)自回归模型,如循环神经网络(Recurrent NeuralNetwork,RNN)的方法有显著计算效率提升。
实施例7:
在上述实施例6的基础上,根据所述欺诈标识对各个历史账户进行判断赋值,生成判断赋值序列,包括:
当历史转账的欺诈标识为是时,所述历史转账对应的判断赋值为1;
当历史转账的欺诈标识为否时,所述历史转账对应的判断赋值为0;
获取全部判断赋值结果,按照判断赋值结果对应的历史转账的第二数字标识顺序,生成判断赋值序列。
上述实施例的有益效果:本发明根据所述欺诈标识对各个历史账户进行判断赋值,生成判断赋值序列,将每个历史转账是否为欺诈的文字结果转化为数字结果,方便当前转账为欺诈的概率的计算。
实施例8:
在上述实施例6的基础上,根据所述概率分布以及判断赋值序列携带的数字标识的对应关系,计算当前转账为欺诈的概率,具体包括:
根据概率分布中各个概率对应的历史转账的第二数字标识,分别向各个所述概率分布中的各个概率添加第三数字标识;
基于判断赋值序列中各个判断赋值对应的历史转账的第二数字标识,与所述第三数字标识之间的对应关系,获得各个概率与判断赋值的配对结果;
根据配对结果,计算各个概率与其匹配的判断赋值的乘积,将所述乘积相加得到当前转账为欺诈的概率。
本实施例中,第三数字表示是指概率分布中包含的各个概率的下角标数值。
本实施例中,配对结果是指概率分布中包含的各个概率与判断赋值序列中,各个判断赋值之间的对应关系,每一个概率对应一个判断赋值。
上述实施例的有益效果:本发明根据概率分布中各个概率对应的历史转账的第二数字标识,分别向各个所述概率分布中的各个概率添加第三数字标识,基于判断赋值序列中各个判断赋值对应的历史转账的第二数字标识,与所述第三数字标识之间的对应关系,获得各个概率与判断赋值的配对结果,然后根据配对结果计算当前转账为欺诈的概率,有效避免概率分布中各个概率与判断赋值相乘导致计算结果失误的问题。
实施例9:
在上述实施例1的基础上,所述的一种基于注意力机制的欺诈检测方法,还包括:
步骤4:根据当前转账为欺诈的概率对当前转账进行风险评价,具体包括:
当前转账为欺诈的概率小于第一阈值时,判定当前转账作为安全转账;
当前转账为欺诈的概率大于等于第一阈值小于第二阈值时,判定当前转账为有风险转账,并向用户发出一级风险提醒;
当前转账为欺诈的概率大于等于第二阈值时,判定当前转账作为高风险转账,向用户发出二级风险提醒并拦截当前转账。
本实施例中,一级风险提醒是指当前转账为有风险转账时向用户发出的风险提醒。
本实施例中,二级风险提醒是指当前转账为高风险转账时向用户发出的风险提醒。
上述实施例的有益效果:本发明根据当前转账为欺诈的概率对当前转账进行风险评价,并在前转账为有风险转账,并向用户发出一级风险提醒;在当前转账作为高风险转账,向用户发出二级风险提醒并拦截当前转账,避免用户受到欺诈,尽可能降低用户个人损失。
实施例10:
在上述实施例9的基础上,所述的一种基于注意力机制的欺诈检测方法,还包括:
获取根据历史转账以及当前转账生成转账黑名单;
当在下次检测到用户有转账意向时,在触发欺诈检测算法的同时,获取下次转账对应的第一目标账户;
将第一目标账户与转账黑名单进行对比,确定第一目标账户是否为黑名单账户,若是,拦截所述转账,并终止欺诈检测算法的运行;
若不是,继续保持欺诈检测算法的运行。
本实施例中,转账黑名单是指当前存在的最新的转账黑名单,该转账黑名单包含了用户全部被确定为是欺诈的转账的目标账户。
本实施例中,第一目标账户是指下次转账的目标账户,目标账户是指用户转账的最终去向账户。
本实施例中,获取根据历史转账以及当前转账生成转账黑名单,包括:
获取交易序列中的历史转账中欺诈标签为是标签的目标历史转账对应的第二目标账户,并根据所述第二目标账户,生成第一转账黑名单;
当当前转账被判定为高风险转账时,将当前转账对应的目标去向对应的第三目标账户,并将所述第三目标账户添加至所述第一转账黑名单中生成第二转账黑名单;
当当前转账被判定为有风险转账时,将当前转账对应的第三目标账户,标记为风险账户,对所述第一黑名单进行分割生成两个黑名单序列;
将所述第一转账黑名单中的原有目标账户添加至第一序列,将所述风险账户添加至第二序列,生成第三转账黑名单;
并在当前转账的欺诈标签确定后,所述第三转账黑名单进行更新,若当前转账的欺诈标签为是标签时,合并第一序列和第二序列,生成第四转账黑名单;
若当前转账的欺诈标签为否标签时,删除第二序列,生成第五转账黑名单;
其中,有新的转账黑名单生成时,新的转账黑名单会覆盖上一转账黑名单,只保留新的转账黑名单。
本实施例中,第二目标账户是指历史转账中被判断为是欺诈的转账的目标账户。
第一转账黑名单是指根据第二目标账户生成的转账黑名单。
第三目标账户是指当前转账的目标账户。
第二转账黑名单是指当前转账的被判定为高风险转账时,将加入了第三目标账户的第一转账黑名单得到的转账黑名单。
风险账户是指欺诈性质不确定的目标账户,即当前转账被判定为有风险转账时对应的目标账户。
第一序列和第二序列为第三转账黑名单中的两个数据列,第一序列用于存储欺诈性质确定的目标账户,第一序列用于存储欺诈性质不确定的目标账户;
其中,第三转账黑名单是指包含有欺诈性质不确定的目标账户的转账黑名单。
第四转账黑名单是指当前转账的欺诈标签为是标签时,将欺诈性质不确定的目标账户更改为确定欺诈目标账户(合并第一序列和第二序列)的第三转账黑名单。
第五转账黑名单是指当前转账的欺诈标签为否标签时,删除第二序列的第三转账黑名单。
上述实施例的有益效果:本发明获取根据历史转账以及当前转账生成转账黑名单;当在下次检测到用户有转账意向时,在触发欺诈检测算法的同时,获取下次转账对应的第一目标账户;将第一目标账户与转账黑名单进行对比,确定第一目标账户是否为黑名单账户,若是,拦截所述转账,并终止欺诈检测算法的运行;若不是,继续保持欺诈检测算法的运行。根据转账黑名单快速确定转账风险,提高欺诈风险判断效率;同时,本发明根据用户的转账以及当前转账欺诈性质的确定对该转账黑名单进行更新,确保了转账黑名单中数据的准确性,提高了欺诈风险判断的准确度。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
Claims (10)
1.一种基于注意力机制的欺诈检测方法,其特征在于,包括:
步骤1:监测用户转账信息,当检测到用户有转账意向时,触发欺诈检测算法;
步骤2:获取当前转账的相关信息,计算当前转账与用户的历史转账之间的相似度,并将所述相似度作为对应的历史转账的权重;
步骤3:对权重进行归一化处理,得到用户历史转账集合的概率分布,根据概率分布以及历史转账对应的判断赋值序列,计算当前转账为欺诈的概率;
所述方法还包括:
获取根据历史转账以及当前转账生成转账黑名单;
当在下次检测到用户有转账意向时,在触发欺诈检测算法的同时,获取下次转账对应的第一目标账户;
将第一目标账户与转账黑名单进行对比,确定第一目标账户是否为黑名单账户,若是,拦截所述转账,并终止欺诈检测算法的运行;
若不是,继续保持欺诈检测算法的运行;
其中,获取根据历史转账以及当前转账生成转账黑名单,包括:
获取交易序列中的历史转账中欺诈标签为是标签的目标历史转账对应的第二目标账户,并根据所述第二目标账户,生成第一转账黑名单;
当当前转账被判定为高风险转账时,将当前转账对应的目标去向对应的第三目标账户,并将所述第三目标账户添加至所述第一转账黑名单中生成第二转账黑名单;
当当前转账被判定为有风险转账时,将当前转账对应的第三目标账户,标记为风险账户,对所述第一转账黑名单进行分割生成两个黑名单序列;
将所述第一转账黑名单中的原有目标账户添加至第一序列,将所述风险账户添加至第二序列,生成第三转账黑名单;
并在当前转账的欺诈标签确定后,所述第三转账黑名单进行更新,若当前转账的欺诈标签为是标签时,合并第一序列和第二序列,生成第四转账黑名单;
若当前转账的欺诈标签为否标签时,删除第二序列,生成第五转账黑名单;
其中,有新的转账黑名单生成时,新的转账黑名单会覆盖上一转账黑名单,只保留新的转账黑名单。
2.根据权利要求1所述的一种基于注意力机制的欺诈检测方法,其特征在于,所述步骤1,包括:
实时监测用户线上动态,当检测到用户选择支付功能时,判断用户具有转账意向,向欺诈预警系统发送欺诈检测请求;
欺诈预警系统接收到欺诈检测请求后,基于欺诈预警系统的预警处理模块触发欺诈检测算法。
3.根据权利要求1所述的一种基于注意力机制的欺诈检测方法,其特征在于,所述步骤2,包括:
获取当前转账的相关信息,更新交易序列,确定当前转账的在交易序列中的第一数字标识,生成第一转账信息向量;
获取当前转账用户对应的历史转账信息以及第二数字标识,生成多个第二转账信息向量;
基于所述第一转账信息向量以及第二转账信息向量,利用相似度函数计算当前转账与各个历史转账之间的相似度,并将所述相似度作为对应的历史转账权重。
4.根据权利要求3所述的一种基于注意力机制的欺诈检测方法,其特征在于:所述获取当前转账的相关信息,更新交易序列,包括:
获取第一交易序列对应的全部历史数字标识中的最大数字标识,将所述最大数字标识对应的数值加1得到当前转账的第一数字标识;
按照交易序列存储规则,将当前转账的相关信息进行整合,获得整合信息;
根据第一数字标识对应的存储顺序,将整合信息补充至第一交易序列中更新得到第二交易序列。
5.根据权利要求4所述的一种基于注意力机制的欺诈检测方法,其特征在于:
在得到第二交易序列后,向当前转账添加待确定欺诈标签,并根据当前转账为欺诈的概率以及实际转账情况对待确定欺诈标签进行更新。
6.根据权利要求1所述的一种基于注意力机制的欺诈检测方法,其特征在于,所述步骤3,包括:
利用softmax函数对所述权重进行归一化处理,得到用户历史转账集合的概率分布;
同时,分别获取各个历史转账的欺诈标识,并根据所述欺诈标识对各个历史账户进行判断赋值,生成判断赋值序列;
根据所述概率分布以及判断赋值序列携带的数字标识的对应关系,计算当前转账为欺诈的概率。
7.根据权利要求6所述的一种基于注意力机制的欺诈检测方法,其特征在于,根据所述欺诈标识对各个历史账户进行判断赋值,生成判断赋值序列,包括:
当历史转账的欺诈标识为是时,所述历史转账对应的判断赋值为1;
当历史转账的欺诈标识为否时,所述历史转账对应的判断赋值为0;
获取全部判断赋值结果,按照判断赋值结果对应的历史转账的第二数字标识顺序,生成判断赋值序列。
8.根据权利要求6所述的一种基于注意力机制的欺诈检测方法,其特征在于,根据所述概率分布以及判断赋值序列携带的数字标识的对应关系,计算当前转账为欺诈的概率,包括:
根据概率分布中各个概率对应的历史转账的第二数字标识,分别向各个所述概率分布中的各个概率添加第三数字标识;
基于判断赋值序列中各个判断赋值对应的历史转账的第二数字标识,与所述第三数字标识之间的对应关系,获得各个概率与判断赋值的配对结果;
根据配对结果,计算各个概率与其匹配的判断赋值的乘积,将所述乘积相加得到当前转账为欺诈的概率。
9.根据权利要求1所述的一种基于注意力机制的欺诈检测方法,其特征在于,还包括:
步骤4:根据当前转账为欺诈的概率对当前转账进行风险评价,具体包括:
当前转账为欺诈的概率小于第一阈值时,判定当前转账作为安全转账;
当前转账为欺诈的概率大于等于第一阈值小于第二阈值时,判定当前转账为有风险转账,并向用户发出一级风险提醒;
当前转账为欺诈的概率大于等于第二阈值时,判定当前转账作为高风险转账,向用户发出二级风险提醒并拦截当前转账。
10.根据权利要求1所述的一种基于注意力机制的欺诈检测方法,其特征在于,还包括:
获取根据历史转账以及当前转账生成转账黑名单;
当在下次检测到用户有转账意向时,在触发欺诈检测算法的同时,获取下次转账对应的第一目标账户;
将第一目标账户与转账黑名单进行对比,确定第一目标账户是否为黑名单账户,若是,拦截所述转账,并终止欺诈检测算法的运行;
若不是,继续保持欺诈检测算法的运行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310212558.5A CN116433242B (zh) | 2023-02-28 | 2023-02-28 | 基于注意力机制的欺诈检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310212558.5A CN116433242B (zh) | 2023-02-28 | 2023-02-28 | 基于注意力机制的欺诈检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116433242A CN116433242A (zh) | 2023-07-14 |
CN116433242B true CN116433242B (zh) | 2023-10-31 |
Family
ID=87089829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310212558.5A Active CN116433242B (zh) | 2023-02-28 | 2023-02-28 | 基于注意力机制的欺诈检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116433242B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345260A (zh) * | 2018-10-09 | 2019-02-15 | 北京芯盾时代科技有限公司 | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 |
WO2022190319A1 (en) * | 2021-03-11 | 2022-09-15 | Hitachi, Ltd. | Device, method, and system for weighted knowledge transfer |
CN115277108A (zh) * | 2022-07-05 | 2022-11-01 | 成都安恒信息技术有限公司 | 一种对去中心化应用抢跑攻击进行防御的方法及系统 |
-
2023
- 2023-02-28 CN CN202310212558.5A patent/CN116433242B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345260A (zh) * | 2018-10-09 | 2019-02-15 | 北京芯盾时代科技有限公司 | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 |
WO2022190319A1 (en) * | 2021-03-11 | 2022-09-15 | Hitachi, Ltd. | Device, method, and system for weighted knowledge transfer |
CN115277108A (zh) * | 2022-07-05 | 2022-11-01 | 成都安恒信息技术有限公司 | 一种对去中心化应用抢跑攻击进行防御的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116433242A (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nami et al. | Cost-sensitive payment card fraud detection based on dynamic random forest and k-nearest neighbors | |
US8543522B2 (en) | Automatic rule discovery from large-scale datasets to detect payment card fraud using classifiers | |
CN110390465A (zh) | 业务数据的风控分析处理方法、装置和计算机设备 | |
WO2022105525A1 (zh) | 预测用户概率的方法、装置和计算机设备 | |
CN111881722B (zh) | 一种跨年龄人脸识别方法、系统、装置及存储介质 | |
Bahnsen et al. | Detecting credit card fraud using periodic features | |
CN110751557A (zh) | 一种基于序列模型的异常资金交易行为分析方法及系统 | |
Li et al. | On performance of case-based reasoning in Chinese business failure prediction from sensitivity, specificity, positive and negative values | |
CN111325248A (zh) | 降低贷前业务风险的方法及系统 | |
CN110020868B (zh) | 基于线上交易特征的反欺诈模块决策融合方法 | |
CN105844501A (zh) | 一种消费行为的风险控制系统及方法 | |
CN114862587A (zh) | 异常交易账户的识别方法、装置及计算机可读存储介质 | |
Bhanusri et al. | Credit card fraud detection using Machine learning algorithms | |
CN113240506A (zh) | 一种基于无监督领域自适应的金融风控冷启动建模方法 | |
Bahnsen et al. | Fraud detection by stacking cost-sensitive decision trees | |
CN112950344A (zh) | 数据评估方法、装置、电子设备及存储介质 | |
Sa'adah et al. | Classification of customer actions on digital money transactions on paysim mobile money simulator using probabilistic neural network (pnn) algorithm | |
CN116433242B (zh) | 基于注意力机制的欺诈检测方法 | |
Mukherjee et al. | Detection of defaulters in P2P lending platforms using unsupervised learning | |
CN115935265B (zh) | 训练风险识别模型的方法、风险识别方法及对应装置 | |
CN116821759A (zh) | 类别标签的识别预测方法、装置和处理器及电子设备 | |
CN116361488A (zh) | 一种基于知识图谱挖掘风险对象的方法及装置 | |
CN110399818A (zh) | 一种风险预测的方法和设备 | |
CN112926989B (zh) | 一种基于多视图集成学习的银行贷款风险评估方法及设备 | |
CN114707420A (zh) | 一种信贷欺诈行为识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |