CN117593007A - 一种异常交易识别方法、装置、设备及存储介质 - Google Patents

一种异常交易识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117593007A
CN117593007A CN202311649696.6A CN202311649696A CN117593007A CN 117593007 A CN117593007 A CN 117593007A CN 202311649696 A CN202311649696 A CN 202311649696A CN 117593007 A CN117593007 A CN 117593007A
Authority
CN
China
Prior art keywords
transaction
model
characteristic information
target
super
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311649696.6A
Other languages
English (en)
Inventor
郑宇星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Bank of China
Original Assignee
Agricultural Bank of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Bank of China filed Critical Agricultural Bank of China
Priority to CN202311649696.6A priority Critical patent/CN117593007A/zh
Publication of CN117593007A publication Critical patent/CN117593007A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种异常交易识别方法、装置、设备及存储介质。该方法包括:获取待识别交易的目标交易参数,目标交易参数包括:收款方对应的交易参数和付款方对应的交易参数,交易参数包括:第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数以及第一时间段对应的账户余额中的至少一种;将待识别交易的特征参数输入目标模型,得到待识别交易对应的异常交易概率,目标模型通过目标样本集迭代训练第一模型得到;提升了模型的预测性能,获得更优的目标模型,进而获得更准确的预测结果,能够更有效的识别异常交易。

Description

一种异常交易识别方法、装置、设备及存储介质
技术领域
本发明实施例涉及异常交易识别领域,尤其涉及一种异常交易识别方法、装置、设备及存储介质。
背景技术
随着经济与科技的高度发展,异常交易案件也越来越多。异常交易给用户造成了经济和精神上的双重打击,因此必须对异常交易进行更为精准的识别与防控,从而更好地保证人民群众的财产安全。
随着计算机技术的高速发展,使用计算机来帮助人们进行判断与决策越来越流行。早期的技术基本是基于机器学习算法,通过拟合某一批样本数据来获得模型。但是这种方法需要人手工设计特征,并且随着数据量的增大,实际效果可能并不好。异常交易检测任务需要兼顾查准率和查全率,而常规模型除非修改网络结构或者修改超参数,否则很难再在这两者上有所提升。网络超参数的修改没有任何经验规律,只能靠不断地试错,采用这种方式进行提升需要耗费大量时间与人力。
发明内容
本发明实施例提供一种异常交易识别方法、装置、设备及存储介质,以实现提升了模型的预测性能,获得更优的目标模型,进而获得更准确的预测结果,能够更有效的识别异常交易。
第一方面,本发明实施例提供了一种异常交易识别方法,包括:
获取待识别交易的目标交易参数,其中,所述目标交易参数包括:收款方对应的交易参数和付款方对应的交易参数,所述交易参数包括:第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数以及第一时间段对应的账户余额中的至少一种;
将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,其中,所述目标模型通过目标样本集迭代训练第一模型得到。
可选的,将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,包括:
根据所述待识别交易的目标交易参数生成目标向量;
将所述目标向量输入第一卷积层,得到第一特征信息;
将所述第一特征信息输入第一池化层,得到第二特征信息;
将所述第二特征信息输入第二卷积层,得到第三特征信息;
将所述第三特征信息输入第二池化层,得到第四特征信息;
将所述第四特征信息输入第一全连接层,得到第五特征信息;
将所述第五特征信息输入第二全连接层,得到第六特征信息;
将所述第六特征信息输入预测层,得到所述待识别交易对应的异常交易概率。
可选的,将所述目标向量输入第一卷积层,得到第一特征信息,包括:
基于如下公式确定第一特征信息:
其中,y(p0)为第一特征信息中每个位置p0对应的输出,pn是目标向量中的第n个采样点对应的位置,Δpn为偏移量参数,w(pn)为pn对应的权重,x(·)为输入。
可选的,通过目标样本集迭代训练第一模型包括:
基于超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,得到每个超参数组对应的模型;
获取每个超参数组对应的模型的准确率和召回率;
根据每个超参数组对应的模型的准确率和召回率确定每个超参数组对应的模型的适应度;
根据每个超参数组对应的模型的适应度对超参数组集合中的超参数组对应的模型进行筛选,得到目标模型。
可选的,在基于超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,得到每个超参数组对应的模型之前,还包括:
获取第一超参数组和第二超参数组;
根据第一超参数组和第二超参数组进行交叉互换,得到第三超参数组;
根据第三超参数组与第一超参数组和/或第二超参数组进行交叉互换,得到第四超参数组;
根据所述第一超参数组、第二超参数组、第三超参数组以及第四超参数组生成超参数组集合。
可选的,所述第一模型对应的学习率基于如下公式确定:
其中,为学习率的最大值,为学习率的最小值,Tcur表示当前执行的迭代次数,Ti表示第i次热启动的总迭代次数。
第二方面,本发明实施例提供了一种异常交易识别装置,包括:
获取模块,用于获取待识别交易的目标交易参数,其中,所述目标交易参数包括:收款方对应的交易参数和付款方对应的交易参数,所述交易参数包括:第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数以及第一时间段对应的账户余额中的至少一种;
输入模块,用于将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,其中,所述目标模型通过目标样本集迭代训练第一模型得到。
可选的,输入模块,包括:
生成单元,用于根据所述待识别交易的目标交易参数生成目标向量;
第一输入单元,用于将所述目标向量输入第一卷积层,得到第一特征信息;
第二输入单元,用于将所述第一特征信息输入第一池化层,得到第二特征信息;
第三输入单元,用于将所述第二特征信息输入第二卷积层,得到第三特征信息;
第四输入单元,用于将所述第三特征信息输入第二池化层,得到第四特征信息;
第五输入单元,用于将所述第四特征信息输入第一全连接层,得到第五特征信息;
第六输入单元,用于将所述第五特征信息输入第二全连接层,得到第六特征信息;
第七输入单元,用于将所述第六特征信息输入预测层,得到所述待识别交易对应的异常交易概率。
第三方面,本发明实施例提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的异常交易识别方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的异常交易识别方法。
本发明实施例通过获取待识别交易的目标交易参数,其中,所述目标交易参数包括:收款方对应的交易参数和付款方对应的交易参数,所述交易参数包括:第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数以及第一时间段对应的账户余额中的至少一种;将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,其中,所述目标模型通过目标样本集迭代训练第一模型得到;解决了如何更有效的识别异常交易的问题,提升了模型的预测性能,获得更优的目标模型,进而获得更优异的检测效果,能够更有效的识别异常交易。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例一提供的一种异常交易识别方法的流程图;
图2为本发明实施例一提供的一种使用卷积神经网络进行异常交易预测原理图;
图3为本发明实施例一提供的一种可变形卷积采样点示意图;
图4为本发明实施例一提供的一种3×3可变形卷积计算过程图;
图5为本发明实施例二提供的一种目标样本集迭代训练第一模型的流程图;
图6为本发明实施例二提供的一种遗传算法过程图;
图7为本发明实施例三提供的一种异常交易识别装置的结构示意图;
图8示出了可以用来实施本发明的实施例的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
实施例一
图1为本发明实施例一提供的一种异常交易识别方法的流程图,本实施例可适用于对异常交易进行识别的情况,该方法可以由本发明实施例中的异常交易识别装置来执行,该装置可采用软件和/或硬件的方式实现,如图1所示,该方法具体包括如下步骤:
S110,获取待识别交易的目标交易参数,其中,所述目标交易参数包括:收款方对应的交易参数和付款方对应的交易参数,所述交易参数包括:第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数以及第一时间段对应的账户余额中的至少一种。
其中,待识别交易可以指是否为异常交易;目标交易参数可以指与待识别交易对应的交易参数;第一时间段可以指一周内、一个月内、或者一年内等等,本实施例对此具体的第一时间段不做限制。具体的,待识别交易可以包括:
1.账户资本归集呈伞状特征;如果某一账户集中转入、多头转出或者多头转入、集中转出,则这种交易可以为待识别交易。
2.短期内交易笔数突然增加且账户余额较少。
3.频繁转账、大额转账。
4.不同账户使用同一IP或者IP涉及境外地区。
5.付款方年龄较大。
交易参数可以包括收款方和付款方的第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数、第一时间段对应的账户余额以及IP地址中的至少一种。
S120,将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,其中,所述目标模型通过目标样本集迭代训练第一模型得到。
其中,目标模型可以指异常交易识别模型,异常交易识别模型可以由卷积神经网络组成;异常交易概率可以指识别为异常交易的概率;目标样本集可以指,用于训练第一模型的样本集合;第一模型可以指训练前的异常交易识别模型。具体的,所述第一模型包括:至少两层卷积层、至少两层池化层以及至少两层全连接层,可以通过目标样本集对第一模型进行迭代训练得到目标模型。示例性,图2为本发明实施例一提供的一种使用卷积神经网络进行异常交易预测原理图,如图2所示,第一模型从输入到输出方向依次包括:第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层、第二全连接层以及预测层。
本实施例中,通过获取待识别交易的目标交易参数,其中,所述目标交易参数包括:收款方对应的交易参数和付款方对应的交易参数,所述交易参数包括:第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数、第一时间段对应的账户余额以及IP地址中的至少一种;通过目标样本集对第一模型进行迭代训练得到目标模型,将待识别交易的特征参数输入异常交易识别模型,得到待识别交易对应的异常交易概率,其中,异常交易识别模型包括:至少两层卷积层、至少两层池化层以及至少两层全连接层,获得更优的异常交易识别模型,提升了模型的预测性能,进而获得更优异的检测效果,能够更有效的识别异常交易。
可选的,通过目标样本集迭代训练第一模型包括:
获取目标样本集,其中,所述目标样本集包括:交易参数样本和交易参数样本对应的异常交易概率;
将所述交易参数样本输入第一模型,得到预测异常交易概率;
根据所述交易参数样本对应的异常交易概率和所述预测异常交易概率生成的目标函数训练所述第一模型的参数;
返回执行将所述交易参数样本输入第一模型,得到预测异常交易概率的操作,直至得到目标模型。
具体的,目标样本集可以是预先设置的,目标样本集包括:交易参数样本和交易参数样本对应的异常交易概率;将目标样本集中的交易参数样本输入第一模型,可以得到与交易参数样本对应的预测异常交易概率;根据目标样本集中的交易参数样本对应的异常交易概率和通过第一模型确定的预测异常交易概率生成的目标函数,目标函数可以为损失函数,通过损失函数训练第一模型的参数;返回执行再次将交易参数样本输入第一模型,得到预测异常交易概率的操作,对第一模型进行训练,直至得到目标模型。
本实施例中,通过获取目标样本集,目标样本集包括:交易参数样本和交易参数样本对应的异常交易概率;将交易参数样本输入第一模型,得到预测异常交易概率;根据交易参数样本对应的异常交易概率和所述预测异常交易概率生成的损失函数训练第一模型的参数;返回执行将交易参数样本输入第一模型,得到预测异常交易概率的操作,直至得到目标模型;具体的,可以通过误差反向传播和梯度下降算法,经过模型不断学习之后,能够确定对不同维度特征的不同权重,获得更优的异常交易识别模型,提升了模型的预测性能,进而获得更优异的检测效果,能够更有效的识别异常交易。
可选的,将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,包括:
根据所述待识别交易的目标交易参数生成目标向量;
将所述目标向量输入第一卷积层,得到第一特征信息;
将所述第一特征信息输入第一池化层,得到第二特征信息;
将所述第二特征信息输入第二卷积层,得到第三特征信息;
将所述第三特征信息输入第二池化层,得到第四特征信息;
将所述第四特征信息输入第一全连接层,得到第五特征信息;
将所述第五特征信息输入第二全连接层,得到第六特征信息;
将所述第六特征信息输入预测层,得到所述待识别交易对应的异常交易概率。
其中,目标向量可以指与目标交易参数对应的特征向量。具体的,目标模型可以采用卷积层来自动提取数据特征;例如,可以将各取收款方、付款方最近10条数据拼接成10×9×2的三维向量,若第一时间段对应的账户没有数据,则可以用0向量进行填补。
如图2所示,本实施例中,目标模型进行异常交易识别时,首先将目标向量输入第一卷积层,采用卷积神经网络对输入特征向量进行提取,得到第一特征信息。例如,可以采用3*3卷积核,则首先会针对于第一时间段对应的交易笔数、第一时间段对应的交易最大金额和第一时间段对应的平均交易金额三个目标交易参数的特征向量进行提取,遍历上述的十个特征来提取各维度的信息,确定为第一特征信息。将第一特征信息输入第一池化层进行池化,得到第二特征信息;将第二特征信息输入第二卷积层,再次进行特征提取,得到第三特征信息;将第三特征信息输入第二池化层,再次池化得到第四特征信息;将第四特征信息输入第一全连接层进行全连接,得到第五特征信息;将第五特征信息输入第二全连接层再次进行全连接,得到第六特征信息;将第六特征信息输入预测层进行预测,通过softmax函数输出即异常交易和正常交易的概率。
可选的,将所述目标向量输入第一卷积层,得到第一特征信息,包括:
基于如下公式确定第一特征信息:
其中,y(p0)为第一特征信息中每个位置p0对应的输出,pn是目标向量中的第n个采样点对应的位置,Δpn为偏移量参数,w(pn)为pn对应的权重,x(·)为输入。
具体的,对于异常交易信息而言,需要关注的不仅仅是单独的某一维信息,例如短时间交易量,而是一个全局的信息。比如,如果网络发现某一账户短时间交易量剧增的同时还是多头转入且IP定位在境外,这种情况下模型能够更有把握来判断是否为异常交易。因此这就需要模型能够拥有更大的感受野,能够对输入特征以一个更全局的角度来进行特征提取,而非单单局限于某一维特征。
在一个实施例中,为了更好地扩大感受野,获得更全面的特征信息,可以采用可变形卷积作为第一卷积层来进行特征提取,通过在普通卷积的基础之上增加可学习的偏移量参数,对卷积核中每个采样点叠加偏移之后,原本固定的采样位置就可以发生改变。其中,偏移量可以指的是卷积神经网络中某一个卷积核中采样点的偏移,偏移量是可以学习的,即可以通过训练来不断寻找最优的偏移量。图3为本发明实施例一提供的一种可变形卷积采样点示意图,图4为本发明实施例一提供的一种3×3可变形卷积计算过程图,如图3和图4所示,可变形卷积对每一个位置加入了偏置,可以基于如下公式确定第一特征信息:
其中,y(p0)为第一特征信息中每个位置p0对应的输出,pn是目标向量中的第n个采样点对应的位置,Δpn为偏移量参数,w(pn)为pn对应的权重,x(·)为输入。进一步的,将第二特征信息输入第二卷积层,得到第三特征信息,其中第二卷积层同样采用可变形卷积,其实现方式与第一卷积层类似,例如,输入为第二特征信息,输出y(p)为第三特征信息中每个位置p对应的输出。
具体的,计算的Δpn通常为小数,可以采用双线性插值的方式将其转换成整数,其公式为:
其中,p表示计算出来的某个非整数位置的坐标,q表示特征图中的所有积分区间,积分区间为特征图上存在的离p最近的四个点。
本实施例中,在采用可变形卷积对卷积神经网络进行优化之后,目标模型就能够获得更全局的感受野。例如,原始卷积在进行特征提取时,第一次会对第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额这三个维度特征进行提取。而采用可变形卷积之后,模型会对每一个采样点产生一个偏移,因此模型可能会从原始的三个维度优化成交易笔数、账户数和IP,从而扩大感受野。通过这种采用可变形卷积的方式能够获得全局的关注信息,因此所提取到的特征相较于普通的卷积神经网络提取的特征而言会更加充分。
实施例二
图5为本发明实施例二提供的一种目标样本集迭代训练第一模型的流程图,本实施例的技术方案在上述实施例的基础上进行了进一步的细化。如图5所示,该方法包括:
S210,基于超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,得到每个超参数组对应的模型。
其中,超参数可以指神经网络开始学习过程之前设置的参数,可以包括:卷积层参数、池化层参数、学习率等。超参数组可以指模型中的卷积层参数、池化层参数等组成的超参数组;超参数组集合可以指多个超参数组的集合。
本实施例中,可以根据预先设置的超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,在每次模型训练结束之后,得到每个超参数组对应的模型。
S220,获取每个超参数组对应的模型的准确率和召回率。
其中,准确率可以指模型输出的准确性;召回率可以指通过模型检测出来异常交易的概率。
本实施例中,可以通过计算获取每个超参数组对应的模型的准确率和召回率。
S230,根据每个超参数组对应的模型的准确率和召回率确定每个超参数组对应的模型的适应度。
其中,适应度可以指个体适应环境的程度。具体的,可以将模型的网络超参数作为基因,根据每个超参数组对应的模型的准确率和召回率确定每个超参数组对应的模型的适应度,每个模型个体xi的适应度计算公式如下:
fitness(xi)=αP+(1-α)R
其中,α是权重参数,用于平衡调节准确率和召回率所占比重,例如,可以设定α为0.7。
S240,根据每个超参数组对应的模型的适应度对超参数组集合中的超参数组对应的模型进行筛选,得到目标模型。
本实施例中,可以采用轮盘赌算法,根据每个超参数组对应的模型的适应度对超参数组集合中的超参数组对应的模型进行筛选,得到目标模型,即适应度越高的个体xi被选择留下的概率越高。
具体的,可以根据预先设置的超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,在每次模型训练结束之后,得到每个超参数组对应的模型;获得的模型xi为一个个体;通过计算可以获取每个超参数组对应的模型的准确率P和召回率R,示例性的,图6为本发明实施例二提供的一种遗传算法过程图,如图6所示,可以基于第一超参数组和目标样本集迭代训练第一模型,得到第二模型;基于第二超参数组和目标样本集迭代训练第一模型,得到第三模型;根据第一超参数组和第二超参数组进行交叉互换,得到第三超参数组;基于第三超参数组和目标样本集迭代训练第一模型,得到第四模型;根据第二超参数组和第三超参数组进行交叉互换,得到第四超参数组;基于第四超参数组和目标样本集迭代训练第一模型,得到第五模型;获取第二模型、第三模型、第四模型以及第五模型的准确率和召回率;根据每个超参数组对应的模型的准确率和召回率通过适应度计算公式确定每个超参数组对应的模型的适应度;采用轮盘赌算法,根据每个超参数组对应的模型的适应度对超参数组集合中的超参数组对应的模型进行筛选,得到目标模型。
本实施例中,基于超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,得到每个超参数组对应的模型;获取每个超参数组对应的模型的准确率和召回率;根据每个超参数组对应的模型的准确率和召回率确定每个超参数组对应的模型的适应度;根据每个超参数组对应的模型的适应度对超参数组集合中的超参数组对应的模型进行筛选,得到目标模型;使得目标模型能够检测出异常交易的概率更高,漏检的会更少,更能从整体上对异常交易识别任务带来提升。
可选的,在基于超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,得到每个超参数组对应的模型之前,还包括:
获取第一超参数组和第二超参数组;
根据第一超参数组和第二超参数组进行交叉互换,得到第三超参数组;
根据第三超参数组与第一超参数组和/或第二超参数组进行交叉互换,得到第四超参数组;
根据所述第一超参数组、第二超参数组、第三超参数组以及第四超参数组生成超参数组集合。
具体的,可以随机生成第一超参数组和第二超参数组,其中,进行交叉互换可以理解为,先随机获取交叉互换位置,基于交叉互换位置对两个超参数组进行互换;例如,根据第一超参数组和第二超参数组进行交叉互换,得到第三超参数组;根据第三超参数组与第一超参数组和/或第二超参数组进行交叉互换,得到第四超参数组;根据第一超参数组、第二超参数组、第三超参数组以及第四超参数组生成超参数组集合。
可选的,所述第一模型对应的学习率基于如下公式确定:
其中,为学习率的最大值,为学习率的最小值,Tcur表示当前执行的迭代次数,Ti表示第i次热启动的总迭代次数。
其中,热启动可以指在不断电状态下进行计算机的程序启动。学习率可以指模型参数的一种,其在模型训练过程中起到了重要的作用。如果学习率过小,则在模型训练过程中收敛速度过慢,并且极易陷入局部最优解。如果学习率过大,则模型每次参数更新幅度变大,不容易达到最优解。例如,第一模型可以通过学习,发现交易笔数、交易金额和IP这三个特征是用来识别异常交易的主要因素,因此就会向这个方向继续学下去。由于学习率是固定的,因此很容易陷入马鞍面,即更加关注这三个特征的组合。但实际上可能存在另一种组合情况,例如用户年龄、IP和转入笔数,这种情况能够更具有异常交易的代表性特征。因此需要让模型能够“换一种思维”,跳出马鞍面,尝试以别的组合来进行检测,试图发现更优的特征表示方式。
通常的处理方式是在最开始的时候采用大学习率使模型快速收敛,之后再采用较小的学习率来逼近于最优解。当采用梯度下降算法进行目标函数的优化时,如果模型此时越来越接近全局损失最小值,则更应该使用更小的学习率来趋近于全局最优解。
本实施例中,在学习率的衰减过程上,可以采用余弦退火算法来优化模型。余弦函数可以很好地与学习率调节过程相匹配,从而达到学习率调节的目的。在训练过程中,先采用预热学习率和预热学习动量进行模型前几个训练,之后每一批训练之后的学习率不断减小,当学习率减小至阈值之后又将其调节至初始值后进行热启动,并且重复循环这个过程。其中,前半段学习率不断减小是通过在训练中减小学习率来达到局部最优解,后半段恢复大学习率是为了让模型有较大的参数更新从而跳出马鞍面。第一模型对应的学习率可以基于如下公式确定:
其中,为学习率的最大值,为学习率的最小值,Tcur表示当前执行的迭代次数,Ti表示第i次热启动的总迭代次数。
实施例三
图7为本发明实施例三提供的一种异常交易识别装置的结构示意图。如图7所示,该装置包括:
获取模块310,用于获取待识别交易的目标交易参数,其中,所述目标交易参数包括:收款方对应的交易参数和付款方对应的交易参数,所述交易参数包括:第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数以及第一时间段对应的账户余额中的至少一种;
输入模块320,用于将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,其中,所述目标模型通过目标样本集迭代训练第一模型得到。
可选的,输入模块320,包括:
生成单元,用于根据所述待识别交易的目标交易参数生成目标向量;
第一输入单元,用于将所述目标向量输入第一卷积层,得到第一特征信息;
第二输入单元,用于将所述第一特征信息输入第一池化层,得到第二特征信息;
第三输入单元,用于将所述第二特征信息输入第二卷积层,得到第三特征信息;
第四输入单元,用于将所述第三特征信息输入第二池化层,得到第四特征信息;
第五输入单元,用于将所述第四特征信息输入第一全连接层,得到第五特征信息;
第六输入单元,用于将所述第五特征信息输入第二全连接层,得到第六特征信息;
第七输入单元,用于将所述第六特征信息输入预测层,得到所述待识别交易对应的异常交易概率。
可选的,第一输入单元,具体用于基于如下公式确定第一特征信息:
其中,y(p0)为第一特征信息中每个位置p0对应的输出,pn是目标向量中的第n个采样点对应的位置,Δpn为偏移量参数,w(pn)为pn对应的权重,x(·)为输入。
可选的,输入模块320,具体用于:
基于超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,得到每个超参数组对应的模型;
获取每个超参数组对应的模型的准确率和召回率;
根据每个超参数组对应的模型的准确率和召回率确定每个超参数组对应的模型的适应度;
根据每个超参数组对应的模型的适应度对超参数组集合中的超参数组对应的模型进行筛选,得到目标模型。
可选的,输入模块320,具体还用于:
获取第一超参数组和第二超参数组;
根据第一超参数组和第二超参数组进行交叉互换,得到第三超参数组;
根据第三超参数组与第一超参数组和/或第二超参数组进行交叉互换,得到第四超参数组;
根据所述第一超参数组、第二超参数组、第三超参数组以及第四超参数组生成超参数组集合。
可选的,所述第一模型对应的学习率基于如下公式确定:
其中,为学习率的最大值,为学习率的最小值,Tcur表示当前执行的迭代次数,Ti表示第i次热启动的总迭代次数。
本发明实施例所提供的异常交易识别装置可执行本发明任意实施例所提供的异常交易识别方法,具备执行方法相应的功能模块和有益效果。
实施例四
图8示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图8所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如异常交易识别方法。
在一些实施例中,异常交易识别方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的异常交易识别方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行异常交易识别方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种异常交易识别方法,其特征在于,所述方法包括:
获取待识别交易的目标交易参数,其中,所述目标交易参数包括:收款方对应的交易参数和付款方对应的交易参数,所述交易参数包括:第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数以及第一时间段对应的账户余额中的至少一种;
将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,其中,所述目标模型通过目标样本集迭代训练第一模型得到。
2.根据权利要求1所述的方法,其特征在于,将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,包括:
根据所述待识别交易的目标交易参数生成目标向量;
将所述目标向量输入第一卷积层,得到第一特征信息;
将所述第一特征信息输入第一池化层,得到第二特征信息;
将所述第二特征信息输入第二卷积层,得到第三特征信息;
将所述第三特征信息输入第二池化层,得到第四特征信息;
将所述第四特征信息输入第一全连接层,得到第五特征信息;
将所述第五特征信息输入第二全连接层,得到第六特征信息;
将所述第六特征信息输入预测层,得到所述待识别交易对应的异常交易概率。
3.根据权利要求2所述的方法,其特征在于,将所述目标向量输入第一卷积层,得到第一特征信息,包括:
基于如下公式确定第一特征信息:
其中,y(p0)为第一特征信息中每个位置p0对应的输出,pn是目标向量中的第n个采样点对应的位置,Δpn为偏移量参数,w(pn)为pn对应的权重,x(·)为输入。
4.根据权利要求1所述的方法,其特征在于,通过目标样本集迭代训练第一模型包括:
基于超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,得到每个超参数组对应的模型;
获取每个超参数组对应的模型的准确率和召回率;
根据每个超参数组对应的模型的准确率和召回率确定每个超参数组对应的模型的适应度;
根据每个超参数组对应的模型的适应度对超参数组集合中的超参数组对应的模型进行筛选,得到目标模型。
5.根据权利要求4所述的方法,其特征在于,在基于超参数组集合中的每个超参数组分别通过目标样本集迭代训练第一模型,得到每个超参数组对应的模型之前,还包括:
获取第一超参数组和第二超参数组;
根据第一超参数组和第二超参数组进行交叉互换,得到第三超参数组;
根据第三超参数组与第一超参数组和/或第二超参数组进行交叉互换,得到第四超参数组;
根据所述第一超参数组、第二超参数组、第三超参数组以及第四超参数组生成超参数组集合。
6.根据权利要求4-5任一项所述的方法,其特征在于,所述第一模型对应的学习率基于如下公式确定:
其中,为学习率的最大值,为学习率的最小值,Tcur表示当前执行的迭代次数,Ti表示第i次热启动的总迭代次数。
7.一种异常交易识别装置,其特征在于,包括:
获取模块,用于获取待识别交易的目标交易参数,其中,所述目标交易参数包括:收款方对应的交易参数和付款方对应的交易参数,所述交易参数包括:第一时间段对应的交易笔数、第一时间段对应的交易最大金额、第一时间段对应的平均交易金额、第一时间段中每日交易时间段、第一时间段对应的转入账户数、第一时间段对应的转出账户数以及第一时间段对应的账户余额中的至少一种;
输入模块,用于将所述待识别交易的特征参数输入目标模型,得到所述待识别交易对应的异常交易概率,其中,所述目标模型通过目标样本集迭代训练第一模型得到。
8.根据权利要求7所述的装置,其特征在于,输入模块,包括:
生成单元,用于根据所述待识别交易的目标交易参数生成目标向量;
第一输入单元,用于将所述目标向量输入第一卷积层,得到第一特征信息;
第二输入单元,用于将所述第一特征信息输入第一池化层,得到第二特征信息;
第三输入单元,用于将所述第二特征信息输入第二卷积层,得到第三特征信息;
第四输入单元,用于将所述第三特征信息输入第二池化层,得到第四特征信息;
第五输入单元,用于将所述第四特征信息输入第一全连接层,得到第五特征信息;
第六输入单元,用于将所述第五特征信息输入第二全连接层,得到第六特征信息;
第七输入单元,用于将所述第六特征信息输入预测层,得到所述待识别交易对应的异常交易概率。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的异常交易识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-6中任一项所述的异常交易识别方法。
CN202311649696.6A 2023-12-04 2023-12-04 一种异常交易识别方法、装置、设备及存储介质 Pending CN117593007A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311649696.6A CN117593007A (zh) 2023-12-04 2023-12-04 一种异常交易识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311649696.6A CN117593007A (zh) 2023-12-04 2023-12-04 一种异常交易识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN117593007A true CN117593007A (zh) 2024-02-23

Family

ID=89919915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311649696.6A Pending CN117593007A (zh) 2023-12-04 2023-12-04 一种异常交易识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117593007A (zh)

Similar Documents

Publication Publication Date Title
CN113065614B (zh) 分类模型的训练方法和对目标对象进行分类的方法
CN115456167B (zh) 轻量级模型训练方法、图像处理方法、装置及电子设备
CN115545712A (zh) 一种交易行为的欺诈预测方法、装置、设备和存储介质
CN114463856B (zh) 姿态估计模型的训练与姿态估计方法、装置、设备及介质
WO2016016719A2 (en) Online trading systems and methods
CN113642727B (zh) 神经网络模型的训练方法和多媒体信息的处理方法、装置
CN117521768A (zh) 一种图像搜索模型的训练方法、装置、设备及存储介质
CN116228301A (zh) 一种目标用户的确定方法、装置、设备及介质
CN115759283A (zh) 一种模型解释方法、装置、电子设备以及存储介质
CN117593007A (zh) 一种异常交易识别方法、装置、设备及存储介质
CN115578583B (zh) 图像处理方法、装置、电子设备和存储介质
CN117746069B (zh) 以图搜图的模型训练方法、和以图搜图方法
CN117635300A (zh) 一种企业融资结果的预测方法、装置及电子设备
CN114037058B (zh) 预训练模型的生成方法、装置、电子设备以及存储介质
CN117934137A (zh) 一种基于模型融合的不良资产回收预测方法、装置及设备
CN117522415A (zh) 一种风险预测方法、装置和电子设备
CN115034893A (zh) 深度学习模型的训练方法、风险评估方法和装置
CN116992150A (zh) 一种研发组件推荐方法、装置、设备及存储介质
CN114092259A (zh) 用于汇率数据的处理方法、装置、设备及计算机存储介质
CN117474634A (zh) 一种产品推荐方法、装置、设备和存储介质
CN116129243A (zh) 一种雷达图像的物体检测方法、装置、设备及存储介质
CN115600129A (zh) 信息识别方法、装置、电子设备及存储介质
CN117993478A (zh) 基于双向知识蒸馏和联邦学习的模型训练方法及装置
CN117668209A (zh) 一种文档推荐方法、装置、设备以及存储介质
CN117671409A (zh) 样本生成、模型训练、图像处理方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination