CN116308792A - 异常交易数据处理方法及装置 - Google Patents
异常交易数据处理方法及装置 Download PDFInfo
- Publication number
- CN116308792A CN116308792A CN202310270379.7A CN202310270379A CN116308792A CN 116308792 A CN116308792 A CN 116308792A CN 202310270379 A CN202310270379 A CN 202310270379A CN 116308792 A CN116308792 A CN 116308792A
- Authority
- CN
- China
- Prior art keywords
- transaction
- model
- rule
- suspicious
- tensor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 80
- 238000003672 processing method Methods 0.000 title description 12
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims abstract description 42
- 238000005457 optimization Methods 0.000 claims abstract description 30
- 238000004590 computer program Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 19
- 238000012549 training Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 6
- 239000000872 buffer Substances 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004900 laundering Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供了一种异常交易数据处理方法及装置,可用于金融领域或其他领域。方法包括:获取经用户授权的交易数据及用户信息,根据预设的异常交易规则,对交易数据及用户信息进行多维度特征提取,得到交易特征数据及用户特征数据,根据交易特征数据及用户特征数据,得到模型输入张量;将随机噪声与模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量;利用可疑交易模型,对规则命中结果张量进行判别处理,得到判别结果,对可疑交易模型进行优化处理;利用优化处理后的可疑交易模型,生成与异常交易规则相对应的多个规则参数阈值。本发明提高了模型准确度,减少误报与漏报,避免无效可疑命中交易,减少工作人员的工作量,提高工作效率。
Description
技术领域
本发明涉及异常交易识别技术领域,尤指一种异常交易数据处理方法及装置。
背景技术
随着经济的发展,近年来金融交易量快速增长,各种金融机构的金融业务不断扩充,与此同时,由此产生的异常交易行为也不断增加。近年来,异常交易处罚金额、处罚力度呈上升趋势,其中,异常交易中可疑模型是至关重要的。大部分的金融机构的异常交易系统依赖于异常交易专家设定的可疑规则,然后人工对可疑报告进行审核,可疑规则的设定主要焦点是交易金额和交易次数,以及相关账户和交易主客体信息是否异常,这意味着规则的阈值设置成为关键。如果阈值设置不当,将会筛选出大量看似不正常的正常交易,这对审核的工作人员带来极大的工作量,且对可疑报告精确度产生很大影响。且根据数据显示,异常交易识别模型行业平均误报率95%,提高可疑模型准确率就显得至关重要了。
发明内容
针对现有技术中存在的问题,本发明实施例的主要目的在于提供一种异常交易数据处理方法及装置,对可疑交易模型的参数阈值进行优化,提高可疑交易模型的准确率。
为了实现上述目的,本发明实施例提供一种异常交易数据处理方法,方法包括:
获取经用户授权的交易数据及用户信息,根据预设的异常交易规则,对交易数据及用户信息进行多维度特征提取,得到交易特征数据及用户特征数据,并根据交易特征数据及用户特征数据,得到模型输入张量;
获取随机噪声,将随机噪声与模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量;
利用可疑交易模型,对规则命中结果张量进行判别处理,得到判别结果,并根据判别结果,对可疑交易模型进行优化处理;
利用优化处理后的可疑交易模型,生成与异常交易规则相对应的多个规则参数阈值。
可选的,在本发明一实施例中,方法还包括:获取待识别交易数据,并利用规则参数阈值,对待识别交易数据进行识别处理,得到异常交易识别结果。
可选的,在本发明一实施例中,可疑交易模型包括第一生成模型、第二生成模型与判别模型。
可选的,在本发明一实施例中,将随机噪声与模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量包括:将随机噪声输入至所述可疑交易模型的第一生成模型中,生成规则参数张量。
可选的,在本发明一实施例中,将随机噪声与模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量还包括:
将模型输入张量及规则参数张量输入至可疑交易模型的第二生成模型中,得到规则命中结果张量。
可选的,在本发明一实施例中,利用可疑交易模型,对规则命中结果张量进行判别处理,得到判别结果包括:
根据交易数据及用户信息,确定交易识别结果;
利用可疑交易模型的判别模型,对交易识别结果与规则命中结果张量进行判别处理,得到判别结果。
可选的,在本发明一实施例中,利用优化处理后的可疑交易模型,生成与异常交易规则相对应的多个规则参数阈值包括:
若判别结果小于预设阈值,则确定可疑交易模型完成优化处理;
利用优化处理后的可疑交易模型中的第一生成模型,生成与异常交易规则相对应的多个规则参数阈值。
本发明实施例还提供一种异常交易数据处理装置,装置包括:
特征数据模块,用于获取经用户授权的交易数据及用户信息,根据预设的异常交易规则,对交易数据及用户信息进行多维度特征提取,得到交易特征数据及用户特征数据,并根据交易特征数据及用户特征数据,得到模型输入张量;
命中结果模块,用于获取随机噪声,将随机噪声与模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量;
模型优化模块,用于利用可疑交易模型,对规则命中结果张量进行判别处理,得到判别结果,并根据判别结果,对可疑交易模型进行优化处理;
参数阈值模块,用于利用优化处理后的可疑交易模型,生成与异常交易规则相对应的多个规则参数阈值。
可选的,在本发明一实施例中,装置还包括:交易识别模块,用于获取待识别交易数据,并利用规则参数阈值,对待识别交易数据进行识别处理,得到异常交易识别结果。
可选的,在本发明一实施例中,可疑交易模型包括第一生成模型、第二生成模型与判别模型。
可选的,在本发明一实施例中,命中结果模块还用于将随机噪声输入至可疑交易模型的第一生成模型中,生成规则参数张量。
可选的,在本发明一实施例中,命中结果模块还用于将模型输入张量及规则参数张量输入至可疑交易模型的第二生成模型中,得到规则命中结果张量。
可选的,在本发明一实施例中,模型优化模块包括:
识别结果单元,用于根据交易数据及用户信息,确定交易识别结果;
判别结果单元,用于利用可疑交易模型的判别模型,对交易识别结果与规则命中结果张量进行判别处理,得到判别结果。
可选的,在本发明一实施例中,参数阈值模块包括:
优化处理单元,用于若判别结果小于预设阈值,则确定可疑交易模型完成优化处理;
规则参数单元,用于利用优化处理后的可疑交易模型中的第一生成模型,生成与异常交易规则相对应的多个规则参数阈值。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述程序时实现上述方法。
本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有由计算机执行上述方法的计算机程序。
本发明还提供一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现上述方法的步骤。
本发明利用交易数据与用户信息对可疑交易模型进行优化,得到异常交易规则对应的规则参数阈值,避免了由于不同金融机构有着不同的可疑规则,且相同规则可能有不同的阈值参数所带来的巨大工作量的问题,提高了模型准确度,减少误报与漏报,大大降低无效可疑命中交易,从而减少工作人员的工作量,提高工作效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种异常交易数据处理方法的流程图;
图2为本发明实施例中得到判别结果的流程图;
图3为本发明实施例中生成规则参数阈值的流程图;
图4为本发明一具体实施例中可疑交易模型处理示意图;
图5为本发明实施例一种异常交易数据处理装置的结构示意图;
图6为本发明另一实施例中异常交易数据处理装置的结构示意图;
图7为本发明实施例中模型优化模块的结构示意图;
图8为本发明实施例中参数阈值模块的结构示意图;
图9为本发明一实施例所提供的电子设备的结构示意图。
具体实施方式
本发明实施例提供一种异常交易数据处理方法及装置,可用于金融领域及其他领域,需要说明的是,本发明的异常交易数据处理方法及装置可用于金融领域,也可用于除金融领域之外的任意领域,本发明的异常交易数据处理方法及装置应用领域不做限定。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示为本发明实施例一种异常交易数据处理方法的流程图,本发明实施例提供的异常交易数据处理方法的执行主体包括但不限于计算机。本发明利用交易数据与用户信息对可疑交易模型进行优化,得到异常交易规则对应的规则参数阈值,避免了由于不同金融机构有着不同的可疑规则,且相同规则可能有不同的阈值参数所带来的巨大工作量的问题,提高了模型准确度,减少误报与漏报,大大降低无效可疑命中交易,从而减少工作人员的工作量,提高工作效率。图中所示方法包括:
步骤S1,获取经用户授权的交易数据及用户信息,根据预设的异常交易规则,对交易数据及用户信息进行多维度特征提取,得到交易特征数据及用户特征数据,并根据交易特征数据及用户特征数据,得到模型输入张量。
其中,经用户授权允许后,获取用户历史交易信息,具体包括交易数据与用户信息。具体的,用户信息为用户基本信息,例如个人信息等,交易数据可以包括用户购物、转账等数据。
进一步的,异常交易规则用于识别交易是否为异常交易以及异常交易类型,异常交易规则可根据实际需求进行预先设置,利用异常交易规则,对交易数据与用户信息进行多维度的特征提取。具体的,交易特征数据包括交易流水、交易方式、交易时间及交易金融等,用户特征数据包括交易主体、交易客体、交易主体类型及交易客体类型等。
进一步的,本发明中可疑交易模型采用GAN神经网络模型,采用常规方式,利用交易特征数据及用户特征数据构成模型输入张量。具体的,传统GAN神经网络模型的输入一般为图像,由此,本发明中的模型输入张量作为传统GAN神经网络模型的输入“图像”。
步骤S2,获取随机噪声,将随机噪声与模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量。
作为本发明的一个实施例,可疑交易模型包括第一生成模型、第二生成模型与判别模型。
其中,采用常规手段获取随机噪声,将随机噪声输入至可疑交易模型中的生成模型中,得到规则命中结果张量。
进一步的,传统的GAN神经网络是一种图像网络,将图像作为判别器的输入,和生成器的输出,通过判别器的卷积网络和生成器的反卷积网络,不断得到接近真实的图像。本发明中的可疑交易模型包括三个网络:两个生成器网络和一个判别器网络,即第一生成模型、第二生成模型与判别模型。
在本实施例中,将随机噪声与模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量包括:将随机噪声输入至可疑交易模型的第一生成模型中,生成规则参数张量。
在本实施例中,将随机噪声与模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量还包括:将模型输入张量及规则参数张量输入至可疑交易模型的第二生成模型中,得到规则命中结果张量。
其中,交易特征数据和随机噪声作为两个生成器的输入,命中规则的标识作为生成器最终的输出和判别模型的输入,不断训练判别器使得判别假的命中标识越来越假,不断训练第一及第二生成模型,使得第一及第二生成模型生成的命中结果标识不断接近真实命中结果,混淆判别模型的判断。
步骤S3,利用可疑交易模型,对规则命中结果张量进行判别处理,得到判别结果,并根据判别结果,对可疑交易模型进行优化处理。
其中,本发明中可疑交易模型采用GAN神经网络模型,GAN网络即生成对抗网络,是一类在无监督学习中使用的神经网络,有助于解决按文本生成图像等图像任务。GAN包括两种模型:生成模型G,判别模型D。生成器或称生成模型,可学习生成新的可用案例;判别器或称判别模型,可学习判别生成的案例与实际案例的相似度。两种模型处于一种竞争状态,生成器企图愚弄判别器,而判别器则要同时处理区分生成案例和实际案例。GAN网络一般用于图像处理较多,比如超分辨任务,语义分割等。
步骤S4,利用优化处理后的可疑交易模型,生成与异常交易规则相对应的多个规则参数阈值。
其中,利用可疑交易模型中判别模型进行判别,在此之前,利用交易数据与用户信息可预先确定真实的交易识别结果,例如经验值判断异常交易所属类型。判别模型判别真实的交易识别结果与规则命中结果张量的区别,得到判别结果。
具体的,经过步骤S2中第一及第二生成模型对判别模型判断的循环往复混淆,实现模型优化处理,即通过对抗训练得到最佳的命中结果,此时,第一生成模型的输出即为最优的规则参数矩阵,该规则参数矩阵包含了规则参数阈值及规则参数个数。此外,规则参数与异常交易规则相对应,例如异常交易规则中设置了当日累计或单笔交易金额,则可疑交易模型可生成该条规则对应的规则参数阈值。
作为本发明的一个实施例,方法还包括:获取待识别交易数据,并利用规则参数阈值,对待识别交易数据进行识别处理,得到异常交易识别结果。
其中,利用交易数据与用户信息对可疑交易模型进行优化训练后,得到的规则参数阈值可以直接用于异常交易识别。获取经用户授权的待识别交易数据,将交易数据与规则参数阈值进行比较,由此判断待识别交易数据是否为异常交易,以及该交易所属的异常交易类型,即得到异常交易识别结果。
在本实施例中,如图2所示,利用可疑交易模型,对规则命中结果张量进行判别处理,得到判别结果包括:
步骤S21,根据交易数据及用户信息,确定交易识别结果;
步骤S22,利用可疑交易模型的判别模型,对交易识别结果与规则命中结果张量进行判别处理,得到判别结果。
其中,利用交易数据与用户信息可预先确定真实的交易识别结果,例如经验值判断异常交易所属类型。判别模型判别真实的交易识别结果与规则命中结果张量的区别,得到判别结果。
在本实施例中,如图3所示,利用优化处理后的可疑交易模型,生成与异常交易规则相对应的多个规则参数阈值包括:
步骤S31,若判别结果小于预设阈值,则确定可疑交易模型完成优化处理;
步骤S32,利用优化处理后的可疑交易模型中的第一生成模型,生成与异常交易规则相对应的多个规则参数阈值。
其中,在可疑交易模型优化过程中,预设阈值用于判断模型是否优化完成,即若判别结果小于预设阈值,则说明此时第一生成器已经可以生成与真实交易识别结果相对应的规则参数阈值。此时,第一生成模型的输出即为最优的规则参数矩阵,包含了规则参数阈值及规则参数个数。
本发明基于GAN神经网络,对可疑模型参数阈值进行优化。因不同区域的金融机构有着不同的金融业务和交易场景,这意味着在扩充人行规定的金融机构应当制定的交易检测标准外,还需指定定制化的需求,也就是说不同区域的不同金融机构有着不同的可疑规则,且相同规则可能有不同的阈值参数。可疑规则的制定,以及参数阈值的设置直接关系到非正常交易的筛选,如果筛选的交易过多,将会给工作人员带来非常大的工作量,利用GAN网络的智能算法,将会大大提高特定区域内的可疑模型准确率。
在本发明一具体实施例中,如图4所示,传统GAN网络由两个网络组成:一个生成器:由噪声点生成假的图像样本点;一个判别器:真实图像和生成器生成的假图像做相似度;然后不断训练判别器,使得相似度不断提高,再不断训练生成器,使得生成的图像在判别器中相似度越来越高。
其中,GAN网络应用到反洗钱可疑模型训练中可以延展到三个网络:生成器A:由噪声点(或者初始化规则参数值)生成若干个规则参数构成的参数矩阵,比如要训练s个规则,每个规则有z个参数,那么生成器A的作用就是,由噪声点生成一个R=s*z的规则参数张量。生成器B:由A生成的规则参数和交易特征作为输入,进行训练,生成一个规则命中结果的张量。比如,每个用户有n个交易特征,有m个用户,那么生成器的输入是规则参数R=s*z,交易特征T=m*n,经过卷积网络生成一个H=m*s的规则命中结果,H的元素由0,1组成,Hij={0,1},当Hij=1表示用户i命中第j个规则,Hij=0时表示用户i没有命中第j个规则。这个生成的假的规则命中张量H在一定程度上也表示了规则参数和交易特征的关联程度。判别器C:将B生成的H规则命中结果与真实命中结果H1进行判别,判别器中的loss函数生成一个L=m*1的向量,向量的每一个元素不断接近0,说明生成器B训练的命中结果不断靠近。
在本实施例中,交易特征数据及用户特征数据的提取具体过程包括:利用预设可疑交易规则,对规则进行拆分。具体的,根据各个区域的不同,对可疑规则进行有必要的增加,比如个人用户交易规模与身份不符等。
其中,对可疑规则进行归纳,可从表1中几个方面进行交易特征以及用户信息特征作为GAN网络的特征输入张量,即传统GAN网络中的“图像”。
表1
其中,根据以上信息或者扩充的更多特征信息,对可疑交易特征较为明显的维度进行网络训练,从GAN网络的特征提取的卷积神经网络间接提取到某些关联信息比如:企业单位开户之日前后短期内工商信息是否发生变更,是否属于异常交易高危行业,账户是都存在休眠期,是否命中灰名单,手机号是否实名,是否本地,ip地址是否存在本机构多用户共用等。将这些信息维度提取之后,进行GAN网络的训练,对参数进行优化,对可疑模型进行有效分析。
进一步的,一般从金额、笔数、交易去向等多个维度对规则参数进行设置,如表2所示,提供以下几个规则参数维度参考。
表2
追溯交易天数 |
累计交易金额阈值 |
频繁交易笔数阈值 |
跨境交易笔数阈值 |
对公用户关联受益人个数 |
公转私交易金额占比 |
交易主体年龄最小值 |
交易主体年龄最大值 |
晚间交易时间交易金额占比 |
高风险地区ip登录次数阈值 |
... |
在本实施例中,GAN网络由两类神经网络构成,第一个神经网络叫做判别器(Discriminator),在本发明中可以称为C(H)。判别器网络通过输入一张网络,最终输出一个结果,这个输出值表示这个网络是否真实:当H是真实样本时,C(H)函数的值接近0,反之,当H的结果精确度越小时,C(H)函数值越接近1;
其中,另一类网络叫做生成器(Generator),或者称为G,把图一中的两个生成器网络A,B统一称作G(X,T),这个生成器的输入是噪声点X和交易特征信息T,最终生成命中规则结果H,这个生成器生成的值会被用来训练判别器C(H),训练C的过程,给它一个真实的值H1,使得判别器C(H1)函数的结果越来越接近1;再给C一个G生成的向量,让其调整参数,输出较小的C(G(X,T)),接近于0。判别器对真假样本有着较高的分辨率。另外,G生成器在训练的时候,会调整内部参数使得生成的向量(或者值)越来越接近真实的值。如此往复,生成器和判别器相对抗,不断训练,最终的目标是得到使得判别器结果近似为0的生成器A的输出结果R。
具体的,GAN神经网络做对抗训练的具体过程包括:
步骤1,构建生成器神经网络G(包含两个生成器A和B):构建生成器A,该网络生成规则参数R,假设输入是一个随机噪声X(一个矩阵),通过生成器A,生成规则参数R,如公式(1)所示。
其中,可以将R规则参数,用0补充到2n维度,做相应的矩阵变换或者卷积操作。
进一步的,构建生成器B,该网络输入m个用户的交易特征T,和规则参数R,输出命中结果H,如公式(2)所示。
其中,H的元素由0,1组成,Hij={0,1},当Hij=1表示用户i命中第j个规则,Hij=0时表示用户i没有命中第j个规则。
进一步的,生成器A和B构成整个生成器G,生成器训练的损失函数可以设为公式(3)。
LG=Η(1,C(G(x,t))) (3)
其中,G是生成器,x是生成网络的随机数,t是交易信息特征,那么G(x,t)就是生成器A和B生成的假命中规则,C(G(x,t))表示对这个假命中规则的判断,H代表交叉熵,交叉熵是一种度量两种概率分布间的差异性信息的运算。
步骤2,构建判别器C:判别器C的输入是:生成器G生成的H,以及真实m个用户对s个规则的命中情况H1,判别器通过卷积网络和sigmoid激活函数,生成一个概率值,这个概率值越接近1表示相似程度越高,判别器训练时的损失函数如公式(4)所示。
LC=Η(1,C(h1))+Η(0,C(G(x,t))) (4)
其中,h1为规则命中的真实结果,这个loss函数表示,判别网络通过训练,将真实结果归为真,生成器的假结果归为假。
分以上两步训练,先优化判别器LC,再优化生成器LG,如此往复直至结果不断逼近,此时生成器A输出的结果即为训练后最优的规则参数。也就是表2中需要的最终的参数维度的一些阈值。
其中,传统GAN神经网络多数用来图像处理,比如人脸识别,生成器输入为随机噪声,输出一个假图像,判别器判别假图像和真实图像的相似程度,不断对抗训练得到生成器的逼近的假图像。而将GAN网络的这种对抗思想应用到异常交易的可疑交易模型中,是十分有意义的。可疑交易模型具有区域化的特征,每个地方的规则参数阈值都不同,通过GAN网络结合当地交易特征和命中情况分析是比较可靠的。
其中,本发明调整GAN网络输入输出模式,应用可疑交易模型。GAN网络通过预先制定的可疑规则,筛选出特定的交易流水信息维度,用户信息维度,可疑规则命中信息作为GAN网络的‘图像’样本点,通过卷积网络更加有效的提取中间信息,使得模型更加准确有效。本发明支持参数个数以及参数阈值的同时优化。不同地域的可疑规则制定是有很大区别的,只要将交易的维度作为样本张量输入GAN网络,都会对这些相关规则制定定制化的阈值,以及进行有效筛检,通过GAN网络不仅可以有效删减参数,还可以提取更多的其他特征优化模型,比如ip地址,手机号等,多维度分析。
本发明利用交易数据与用户信息对可疑交易模型进行优化,得到异常交易规则对应的规则参数阈值,避免了由于不同金融机构有着不同的可疑规则,且相同规则可能有不同的阈值参数所带来的巨大工作量的问题,提高了模型准确度,减少误报与漏报,大大降低无效可疑命中交易,从而减少工作人员的工作量,提高工作效率。
如图5所示为本发明实施例一种异常交易数据处理装置的结构示意图,图中所示装置包括:
特征数据模块10,用于获取经用户授权的交易数据及用户信息,根据预设的异常交易规则,对交易数据及用户信息进行多维度特征提取,得到交易特征数据及用户特征数据,并根据交易特征数据及用户特征数据,得到模型输入张量;
命中结果模块20,用于获取随机噪声,将随机噪声与模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量;
模型优化模块30,用于利用可疑交易模型,对规则命中结果张量进行判别处理,得到判别结果,并根据判别结果,对可疑交易模型进行优化处理;
参数阈值模块40,用于利用优化处理后的可疑交易模型,生成与异常交易规则相对应的多个规则参数阈值。
作为本发明的一个实施例,如图6所示,装置还包括:交易识别模块50,用于获取待识别交易数据,并利用规则参数阈值,对待识别交易数据进行识别处理,得到异常交易识别结果。
作为本发明的一个实施例,可疑交易模型包括第一生成模型、第二生成模型与判别模型。
在本实施例中,命中结果模块20还用于将随机噪声输入至可疑交易模型的第一生成模型中,生成规则参数张量。
在本实施例中,命中结果模块20还用于将模型输入张量及规则参数张量输入至可疑交易模型的第二生成模型中,得到规则命中结果张量。
在本实施例中,如图7所示,模型优化模块30包括:
识别结果单元31,用于根据交易数据及用户信息,确定交易识别结果;
判别结果单元32,用于利用可疑交易模型的判别模型,对交易识别结果与规则命中结果张量进行判别处理,得到判别结果。
在本实施例中,如图8所示,参数阈值模块40包括:
优化处理单元41,用于若判别结果小于预设阈值,则确定可疑交易模型完成优化处理;
规则参数单元42,用于利用优化处理后的可疑交易模型中的第一生成模型,生成与异常交易规则相对应的多个规则参数阈值。
基于与上述一种异常交易数据处理方法相同的申请构思,本发明还提供了上述一种异常交易数据处理装置。由于该一种异常交易数据处理装置解决问题的原理与一种异常交易数据处理方法相似,因此该一种异常交易数据处理装置的实施可以参见一种异常交易数据处理方法的实施,重复之处不再赘述。
本发明利用交易数据与用户信息对可疑交易模型进行优化,得到异常交易规则对应的规则参数阈值,避免了由于不同金融机构有着不同的可疑规则,且相同规则可能有不同的阈值参数所带来的巨大工作量的问题,提高了模型准确度,减少误报与漏报,大大降低无效可疑命中交易,从而减少工作人员的工作量,提高工作效率。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行所述程序时实现上述方法。
本发明还提供一种计算机程序产品,包括计算机程序/指令,计算机程序/指令被处理器执行时实现上述方法的步骤。
本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有由计算机执行上述方法的计算机程序。
如图9所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理器130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图9中所示的所有部件;此外,电子设备600还可以包括图9中没有示出的部件,可以参考现有技术。
如图9所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种异常交易数据处理方法,其特征在于,所述方法包括:
获取经用户授权的交易数据及用户信息,根据预设的异常交易规则,对所述交易数据及用户信息进行多维度特征提取,得到交易特征数据及用户特征数据,并根据所述交易特征数据及所述用户特征数据,得到模型输入张量;
获取随机噪声,将所述随机噪声与所述模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量;
利用所述可疑交易模型,对所述规则命中结果张量进行判别处理,得到判别结果,并根据所述判别结果,对所述可疑交易模型进行优化处理;
利用优化处理后的可疑交易模型,生成与所述异常交易规则相对应的多个规则参数阈值。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取待识别交易数据,并利用所述规则参数阈值,对所述待识别交易数据进行识别处理,得到异常交易识别结果。
3.根据权利要求1所述的方法,其特征在于,所述可疑交易模型包括第一生成模型、第二生成模型与判别模型。
4.根据权利要求3所述的方法,其特征在于,将所述随机噪声与所述模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量包括:将所述随机噪声输入至所述可疑交易模型的第一生成模型中,生成所述规则参数张量。
5.根据权利要求4所述的方法,其特征在于,将所述随机噪声与所述模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量还包括:
将所述模型输入张量及所述规则参数张量输入至所述可疑交易模型的第二生成模型中,得到所述规则命中结果张量。
6.根据权利要求3所述的方法,其特征在于,利用所述可疑交易模型,对所述规则命中结果张量进行判别处理,得到判别结果包括:
根据所述交易数据及所述用户信息,确定交易识别结果;
利用所述可疑交易模型的判别模型,对所述交易识别结果与所述规则命中结果张量进行判别处理,得到所述判别结果。
7.根据权利要求3所述的方法,其特征在于,所述利用优化处理后的可疑交易模型,生成与所述异常交易规则相对应的多个规则参数阈值包括:
若所述判别结果小于预设阈值,则确定所述可疑交易模型完成优化处理;
利用优化处理后的可疑交易模型中的第一生成模型,生成与所述异常交易规则相对应的多个规则参数阈值。
8.一种异常交易数据处理装置,其特征在于,所述装置包括:
特征数据模块,用于获取经用户授权的交易数据及用户信息,根据预设的异常交易规则,对所述交易数据及用户信息进行多维度特征提取,得到交易特征数据及用户特征数据,并根据所述交易特征数据及所述用户特征数据,得到模型输入张量;
命中结果模块,用于获取随机噪声,将所述随机噪声与所述模型输入张量输入至预设的可疑交易模型中,得到规则命中结果张量;
模型优化模块,用于利用所述可疑交易模型,对所述规则命中结果张量进行判别处理,得到判别结果,并根据所述判别结果,对所述可疑交易模型进行优化处理;
参数阈值模块,用于利用优化处理后的可疑交易模型,生成与所述异常交易规则相对应的多个规则参数阈值。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有由计算机执行权利要求1至7任一项所述方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310270379.7A CN116308792A (zh) | 2023-03-20 | 2023-03-20 | 异常交易数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310270379.7A CN116308792A (zh) | 2023-03-20 | 2023-03-20 | 异常交易数据处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116308792A true CN116308792A (zh) | 2023-06-23 |
Family
ID=86816373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310270379.7A Pending CN116308792A (zh) | 2023-03-20 | 2023-03-20 | 异常交易数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116308792A (zh) |
-
2023
- 2023-03-20 CN CN202310270379.7A patent/CN116308792A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111626371B (zh) | 一种图像分类方法、装置、设备及可读存储介质 | |
WO2019179403A1 (zh) | 基于序列宽深学习的欺诈交易检测方法 | |
CN111784502A (zh) | 异常交易账户群体识别方法及装置 | |
JP2022141931A (ja) | 生体検出モデルのトレーニング方法及び装置、生体検出の方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
CN111275546A (zh) | 金融客户欺诈风险识别方法及装置 | |
Gunasekar et al. | Face detection on distorted images augmented by perceptual quality-aware features | |
CN111401906A (zh) | 转账风险检测方法及系统 | |
CN111104852B (zh) | 一种基于启发式高斯云变换的人脸识别技术 | |
CN111027400A (zh) | 一种活体检测方法及装置 | |
CN115409518A (zh) | 用户交易风险预警方法及装置 | |
CN113191787A (zh) | 电信数据的处理方法、装置电子设备及存储介质 | |
CN112884147A (zh) | 神经网络训练方法、图像处理方法、装置及电子设备 | |
CN112734565B (zh) | 流动性覆盖率预测方法及装置 | |
CN112232948A (zh) | 一种流量数据的异常检测方法及装置 | |
KR102005952B1 (ko) | 기계학습 모델링에서 잡음 데이터 제거를 위한 데이터 정제 장치 및 방법 | |
CN116308792A (zh) | 异常交易数据处理方法及装置 | |
CN115578101A (zh) | 网点用户身份识别方法及装置 | |
CN111639718B (zh) | 分类器应用方法及装置 | |
CN114240633A (zh) | 信贷风险评估方法、系统、终端设备及存储介质 | |
CN111931852A (zh) | 目标物的定价方法及装置 | |
CN112417007A (zh) | 一种数据分析方法、装置、电子设备及存储介质 | |
CN112116478A (zh) | 银行反洗钱可疑报告处理方法及装置 | |
CN112101952B (zh) | 银行可疑交易评估、数据处理方法及装置 | |
TWI786977B (zh) | 手指真偽識別方法、電子裝置及存儲介質 | |
CN113495974B (zh) | 一种声音分类处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |