CN110298663A - 基于序列宽深学习的欺诈交易检测方法 - Google Patents
基于序列宽深学习的欺诈交易检测方法 Download PDFInfo
- Publication number
- CN110298663A CN110298663A CN201810239759.3A CN201810239759A CN110298663A CN 110298663 A CN110298663 A CN 110298663A CN 201810239759 A CN201810239759 A CN 201810239759A CN 110298663 A CN110298663 A CN 110298663A
- Authority
- CN
- China
- Prior art keywords
- transaction
- vector
- learning model
- timing
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 26
- 239000013598 vector Substances 0.000 claims abstract description 103
- 230000002123 temporal effect Effects 0.000 claims abstract description 29
- 230000010354 integration Effects 0.000 claims abstract description 24
- 238000013507 mapping Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 21
- 238000012549 training Methods 0.000 claims description 11
- 238000007637 random forest analysis Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 238000003066 decision tree Methods 0.000 claims description 6
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 230000009471 action Effects 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 25
- 230000000694 effects Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 210000004218 nerve net Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241000209202 Bromus secalinus Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/389—Keeping log of transactions for guaranteeing non-repudiation of a transaction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/405—Establishing or using transaction specific rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Neurology (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Image Analysis (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明涉及一种基于序列宽深学习的欺诈交易检测方法,包括:对多笔交易数据中的每个进行特征映射处理,以生成相应的特征向量;基于第一自学习模型,将待检测交易的特征向量转换为集成特征向量;基于第二自学习模型,将至少一笔时序交易各自的特征向量分别转换为时序特征向量;将集成特征向量与对应于各时序交易的各时序特征向量进行组合,形成深度特征向量;基于第三自学习模型来分类深度特征向量,以确定待检测交易为正常交易或欺诈交易。其能够有效提高欺诈交易检测模型对欺诈交易的检测准确度。
Description
技术领域
本发明涉及电子商务技术领域,更具体地说,涉及一种基于序列宽深学习的欺诈交易检测方法。
背景技术
当前,欺诈交易时有发生,基于机器学习算法的欺诈交易检测模型正在扮演越来越重要的角色。这些欺诈交易检测方法虽然采用机器学习方法,但无论是有监督的还是无监督的,大多采用静态的训练方法。即,这些方法总是将每一笔交易作为一个独立的个体看待,算法所做的工作仅仅是将该笔交易的各个特征在横向维度上进行训练,而很少考虑交易序列之间的纵向关联。然而,这些序列之间的纵向关联因素很可能对模型的最终输出结果产生极大影响。例如,在发生大额欺诈交易之前,犯罪分子常常先进行一定数量的小额试探性交易;又或者,被盗账号短时间内的交易行为明显偏离了该账号的历史交易行为等等。
另一方面,现有的一些序列分析方法关注于序列元素之间的纵向关系,但对于序列内特征,在横向维度上的学习能力有所欠缺,这也会很大程度上影响欺诈交易检测模型的准确度。
发明内容
本发明的目的在于提供一种在横向维度特征与纵向维度特征的机器学习方面达成平衡的欺诈交易检测方法。
为实现上述目的,本发明提供一种技术方案如下:
一种基于序列宽深学习的欺诈交易检测方法,包括:a)、对多笔交易数据中的每个进行特征映射处理,以生成相应的特征向量;b)、基于第一自学习模型,将待检测交易的特征向量转换为集成特征向量;c)、基于第二自学习模型,将至少一笔时序交易各自的特征向量分别转换为时序特征向量;其中,时序交易表示待检测交易的交易账户在第一时间段内所进行的交易;d)、将集成特征向量与对应于各时序交易的各时序特征向量进行组合,形成深度特征向量;以及e)、基于第三自学习模型来分类深度特征向量,以确定待检测交易为正常交易或欺诈交易。
优选地,第二自学习模型包括第一数量的子模型,各子模型分别进行独立的训练学习,其中,第一数量与待检测交易的交易账户在第一时间段内所进行的交易的次数相一致。
优选地,在第一自学习模型与第二自学习模型之间提供特征层注意力模块,以用于主动地学习深度特征向量中时序交易对待检测交易的影响力权重。
优选地,在第二自学习模型中还包括组件层注意力模块,使得第二自学习模型能够主动地学习各时序交易分别对深度特征向量的影响力权重。
优选地,该方法还包括:在第二自学习模型与第三自学习模型之间提供一个多层神经网络,以用于将集成特征向量与各时序特征向量进行组合,并输出深度特征向量。
优选地,多层神经网络还用于控制深度特征向量的向量长度。
优选地,第一自学习模型为梯度提升决策树模型,第二自学习模型为循环神经网络模型,第三自学习模型为随机森林模型。
优选地,随机森林模型基于对欺诈样本的判定的准确率和覆盖率来调节模型的参数。
本发明还公开一种基于序列宽深学习的欺诈交易检测系统,包括:特征映射处理单元,用于对多笔交易数据进行特征映射处理,以生成相应的多组交易特征向量;第一自学习单元,与特征映射处理单元耦合,用于将待检测交易的特征向量转换为集成特征向量;第二自学习单元,与第一自学习单元耦合,用于将至少一笔时序交易各自的特征向量分别转换为时序特征向量;其中,时序交易表示待检测交易的交易账户在第一时间段内所进行的交易;时序特征组合单元,与第一自学习单元和第二自学习单元分别耦合,用于将集成特征向量与对应于各时序交易的各时序特征向量进行组合,以形成深度特征向量;以及第三自学习单元,与时序特征组合单元耦合,用于分类深度特征向量,以确定待检测交易为正常交易或欺诈交易。
本发明各实施例所公开的欺诈交易检测方法及系统,不仅在横向维度特征方面进行机器学习,也在纵向维度特征方面进行机器学习,将多种因素考虑在内,进而通过在两个维度之间达成平衡,能够有效提高欺诈交易检测模型对欺诈交易的检测准确度。同时,用户也能够对这种模型进行适当的参数调节、人工干预,使得其适用于多种场合。
附图说明
图1示出根据本发明一实施例的基于序列宽深学习的欺诈交易检测方法的流程示意图。
图2示出根据本发明一实施例的基于序列宽深学习的欺诈交易检测系统的模块结构示意图。
具体实施方式
在以下描述中提出具体细节,以便提供对本发明的透彻理解。然而,本领域的技术人员将清楚地知道,即使没有这些具体细节也可实施本发明的实施例。在本发明中,可进行具体的数字引用,例如“第一元件”、“第二装置”等。但是,具体数字引用不应当被理解为必须服从于其字面顺序,而是应被理解为“第一元件”与“第二元件”不同。
本发明所提出的具体细节只是示范性的,具体细节可以变化,但仍然落入本发明的精神和范围之内。术语“耦合”定义为表示直接连接到组件或者经由另一个组件而间接连接到组件。
以下通过参照附图来描述适于实现本发明的方法、系统和装置的优选实施例。虽然各实施例是针对元件的单个组合来描述,但是应理解,本发明包括所公开元件的所有可能组合。因此,如果一个实施例包括元件A、B和C,而第二实施例包括元件B和D,则本发明也应被认为包括A、B、C或D的其他剩余组合,即使没有明确公开。
如图1所示,本发明提供一种基于序列宽深学习的欺诈交易检测方法,该方法包括以下多个步骤S10-S14。但是,应理解,本领域技术人员在对本发明深入理解的基础上,有可能对这些步骤进行组合、省略或变更执行的顺序,包括对这些步骤中的并行执行,均应落入本发明的保护范围。
步骤S10、对多笔交易数据中的每个进行特征映射处理,以生成相应的特征向量。
具体来说,对原始交易数据进行特征映射处理,感兴趣特征可以包括消费类型、交易时间与地点、交易金额、交易频率、交易账户的类型与注册时间等。根据本发明,还需要将它们进行结合以进行进一步的统计处理。作为示例,可以进行统计工程,以统计例如当笔交易相关变量、上一笔交易相关变量、长短时统计量、以及可信特征变量等等。这些变量对应的数据都需要经过映射编码等一系列的预处理,转变为数值型变量。最终每一笔交易都被映射为多维的特征向量。
步骤S11、基于第一自学习模型,将待检测交易的特征向量转换为集成特征向量。
在该步骤中,首先使用全量的单笔交易的样本来训练好第一自学习模型,再用该模型将每一笔交易的多维特征向量都转换为集成特征向量,该集成特征向量不仅包括原多维特征向量的信息,还能够包含对它们进行统计分析所得到的额外信息。进一步地,可以将集成特征向量与一个或多个人工提取的特征向量进行组合,以形成单笔交易的组合特征。
步骤S12、基于第二自学习模型,将至少一笔时序交易各自的特征向量分别转换为时序特征向量。其中,时序交易表示待检测交易的交易账户在第一时间段内所进行的交易。
在前一步骤S11获得单笔交易的集成特征(或组合特征)之后,在该步骤S12中,根据相应交易账号的前N笔历史交易信息(即时序交易)对当前交易的集成特征(或组合特征)进行扩充,时序交易数量不足N笔的用0补足,标签为当前交易(待检测交易)对应的标签。具体来说,在进行这种扩充之后,将训练第二自学习模型,使得第二自学习模型通过学习来调节内部参数,从而能够将时序交易信息转换为时序特征向量。在学习完成之后,通过第二自学习模型,基于待检测交易对应的N个时序交易,能够获得相应数量的时序特征。
作为进一步的改进,第二自学习模型包括第一数量的子模型,各子模型分别进行独立的训练学习,其中,第一数量与待检测交易的交易账户在第一时间段内所进行的交易的次数相一致。换言之,对每个待检测交易(无论是作为学习样本还是用于实际检测)而言,其第一时序交易将利用第一子模型来进行训练学习以及检测,其第二时序交易(例如,在时间上更远离待检测交易)将利用第二子模型来进行训练学习以及检测,依次类推。
这种改进是基于如下考量:在一些应用场合,需要根据历史交易分布信息来训练多个不同时间窗口分别对应的时序子模型,而所有时序子模型的输出维度是统一的。这种情况下,在横向对比上(不同待检测交易之间对比),能够对每个待检测交易对应的特定时序交易(例如,在时间上最接近待检测交易的历史交易)进行统一尺度的计算;而在纵向对比上(某一待检测交易所对应的不同时序交易之间对比),则能够进行不同尺度的计算,以使得不同的时序交易获得不同的权重(在深度特征向量所占的权重)。
步骤S13、将集成特征向量与对应于各时序交易的各时序特征向量进行组合,形成深度特征向量。
优选情况下,在第二自学习模型与第三自学习模型之间,提供一个多层神经网络,以用于将集成特征向量与各时序特征(向量)进行组合,并向第三自学习模型输出所生成的深度特征向量。除了用于将集成特征向量与相应的时序特征向量进行组合,该多层神经网络还可以用于控制深度特征向量的向量长度。
进一步地,通过在特定位置引入“特征层”和“组件层”注意力模块,使得模型能够主动地学习到各时序特征对当前交易特征(集成特征或组合特征)的影响力权重、以及每一子模型对最后得到的深度特征向量的影响力权重,并能在一定程度上避免过拟合风险。
作为一种示例,在第一自学习模型与第二自学习模型之间提供特征层注意力模块,以用于主动地学习深度特征向量中时序交易对待检测交易的影响力权重。
作为另一示例,在第二自学习模型中还包括组件层注意力模块,使得第二自学习模型能够主动地学习各时序交易分别对深度特征向量的影响力权重。
步骤S14、基于第三自学习模型来分类深度特征向量,以确定待检测交易为正常交易或欺诈交易。
得到每笔待检测交易对应的深度特征向量之后,每一笔交易就成为彼此独立的样本。可以随机地打乱样本间的顺序,然后选取一部分数据作为训练集来训练顶层分类器。
这种先用集成学习得到宽度特征,再用序列学习对宽度特征进行深度优化,最后再用集成学习对深度特征进行宽度优化的结构模型,在本文中,称之为“宽->深->宽”结构模型。
步骤S14所采用的分类器可以有多种选择,例如,选择随机森林作为顶层分类器。训练好随机森林分类器之后,就得到了最终的欺诈交易检测模型。训练完成后,使用部分交易数据进行测试,即可验证最终的模型效果。
作为一种具体示例,上述第一自学习模型可以采用梯度提升决策树模型,而第二自学习模型可以选用循环神经网络模型。
优选情况下,步骤S14中的随机森林模型基于对欺诈样本的判定的准确率和覆盖率来调节模型自身的参数。其中,准确率表示被判别为欺诈交易而确实为欺诈交易的交易个数与被判别为欺诈交易的交易总数之间的比率。覆盖率表示被判别为欺诈交易而确实为欺诈交易的交易个数与样本中的实际欺诈交易的数量之间的比率。
以下说明第一自学习模型在特定场景下的一种更具体实现。
使用梯度提升决策树(GBDT)来生成集成特征向量,其基于集成学习中的boosting思想,每次迭代都在减少残差的梯度方向新建立一颗决策树,迭代多少次就会生成多少颗决策树。GBDT的思想使其具有天然优势可以发现多种有区分性的特征以及特征组合,省去了人工寻找特征、特征组合的步骤。GBDT前面的树,特征分裂主要体现对多数样本有区分度的特征;而后面的树,主要体现的是经过前N颗树,残差仍然较大的少数样本。优先选用在整体上有区分度的特征,再选用针对少数样本有区分度的特征,这也是本发明选用GBDT而不是随机森林来进行特征集成的原因。
以下说明上述第一实施例提供的第二自学习模型在特定场景下的一种更具体实现。
S201、选择并获取一段时间T内的欺诈样本。统计该段时间内欺诈样本对应的交易账号共有C个。
S202、从时间T内的历史交易数据中随机抽取不在欺诈集合中的正常交易账号。统计每个交易账号对应的交易笔数,如果某交易账号对应的交易笔数大于阈值(例如1000笔),将该账号从待选集合中排除。直到正常交易账号个数也达到N*C个。这里N为不平衡比。
S203、以交易账号为键,对历史交易进行组合,随后,统计每个交易账号对应的历史交易笔数。
S204、将交易账号对应的交易集合也按照每个交易账号对应的交易笔数的大小划分为k个集合,这可以用聚类的方法进行。具体地,假设单个账号在时间T内的交易笔数最小为S1笔,最大为Ek笔,那么在[Sk,Ek]的范围内根据log10转换坐标等值划分为k个集合。按范围大小从小到大依次为[S1,E1],[S2,E2],…[Sk,Ek]。对于每一个[Si,Ei]区间范围,其对应的时序子模型的时间窗口设定为左边界值Si。对于属于该集合内的账号,如果当笔交易前期存在次数大于Si笔的情况时,则根据前Si笔交易进行时序样本扩充。
作为示例,若发现对于单账户交易次数小于40次的账户数目比较多,可以将对应的账号分别对应到时间窗口递增5次的时序子模型中去。而对于单账户交易次数大于40次的账号来说,由于这类账号总数目比较少,如果对时间窗口切分太细性价比不高,因此,这里统一使用时间窗口为该区间内的最低值40的统一时序子模型。
经以上步骤S201-S204,第i个(1≤i≤k)集合中,每个交易账号都有对应的Si-Ei笔交易,将这些交易按时间从远及近的顺序进行排序。以下对该账号的每笔交易进行深度上的扩充。
S205、就某一交易账号而言,对于该账号最早的第一笔交易,原本该笔交易向量是一个n维向量X1={X11,X12,…,X1n}。目标是将每一笔交易扩充为一个固定的n*Ei+1维的向量。例如对于第1笔交易来说,前期并无交易,所以前n*Ei-1维的向量都用0填充,最后加上该笔交易是否欺诈的标签Y1,则成为{0,…0,X1,Y1}这个第1个样本。而对于第2笔交易来说,最原始的向量为X2={X21,X22,…,X2n}。对于第2笔交易来说,第1笔交易X1是其前置的交易,因此将其添加在原始向量的左侧,因此第2笔的向量被映射为{0,…0,X1,X2,Y2}这个第2个样本,其中Y2为第二笔交易是否欺诈的标签,而填充的0一共n*Ei-2维。
S206、接下来统计该交易账号在时间T内一共交易了多少笔,如果是n笔,而n<Ei,那么生成第n个样本以后就停止生成样本。而如果该账号一共正好交易了Ei笔,那么对于该账号的最近的一笔(第Ei笔)交易,该笔交易正好扩充为{X1,…,XEi-1,XEi,YEi},正好为n*Ei+1维,因此无需再用0填充,YEi为该笔交易是否欺诈的标签。
S207、利用GRU网络算法进行模型训练。由于GRU网络的层数一般不是很深,所以对于同一笔交易之间多维特征的学习能力仅仅相当于一个基本的浅层神经网络。这样一来,尽管GRU网络能够非常好地学习到特定列特征在交易与交易之间的相关性,但是对于同一笔交易的多维特征的学习能力却不是很强大。本文中,仅利用它来提取交易序列之间的时序特征。具体层数可以根据实际效果和需求进行调整,这里使用了2层GRU网络。
GRU网络算法是对循环神经网络(RNN)的方法的改进。本领域技术人员理解,长短期记忆(LSTM)模型是一种特殊的RNN,该方法使用存储单元替代了原来网络中常用的S型激活神经元,能够学习长期依赖的关系。在此基础之上,门限循环单元(GRU)将LSTM模型中的遗忘门和输入门组合成一个单个的更新门,这样一来就比LSTM少了若干矩阵乘法,因此在训练数据很大的情况下GRU的效率更高。
经过以上步骤S205-S207,已经对时序特征进行了较好的深度性学习。由于有k个集合,所以一共得到k个模型。对于每一笔交易,通过对应的模型学习转化为相应的深度特征向量,而深度特征向量对这k个模型应是尺度统一的,以便后续可以对所有深度特征向量进行统一的训练与测试。也就是说,无论第二自学习模型包含多少个时序子模型,它们最终的输出维度都是统一的,这避免了在后续使用多个RF分类器分别进行计算的繁琐。
S208、第二自学习模型的最后一个循环单元输出经过一个多层神经网络MLP后,得到待检测交易的时序特征。更好的方法是,在顶层叠加一个平均池化层(Mean Pooling),这样可以把前面每一个时序子模型的输出进行融合,再经过一个简单MLP之后生成同一维度的输出,作为当前交易的最终深度特征向量。上述“组件层”注意力模块可以插入在GRU模型与平均池化层之间,组件层”注意力模块使得平均池化层能够自动学习前面每一个子模型对深度特征向量的影响力权重。
以下说明第三自学习模型在特定场景下的一种更具体实现。
欺诈交易检测模型需要同时关注欺诈样本的准确率和覆盖率,因此,本发明使用针对欺诈类型的Fβ值来确定最终的模型参数及效果,Fβ值按如下公式计算:
其中,β代表召回率的权重是准确率的倍数。以β=1为代表,实验结果表明,上述方案在若干场景下的F1值要比单纯的集成学习模型或者深度序列学习模型都要提高10%以上。当GRU模型(第二自学习模型)处在GBDT模型(第一自学习模型)和随机森林模型(第三自学习模型)之间的时候,检测效果明显增强,有效F1值可超过0.4。
如图2所示,本发明第二实施例提供一种基于序列宽深学习的欺诈交易检测系统,其包括特征映射处理单元200、第一自学习单元210、第二自学习单元220、时序特征组合单元230以及第三自学习单元240。
具体来说,特征映射处理单元200对多笔交易数据进行特征映射处理,以生成相应的多组交易特征向量。第一自学习单元210与特征映射处理单元200通信耦合,用于将待检测交易的特征向量转换为集成特征向量。第二自学习单元220与特征映射处理单元200通信耦合(或者与第一自学习单元210耦合),用于将至少一笔时序交易各自的特征向量分别转换为时序特征向量。
时序特征组合单元230与第一自学习单元210和第二自学习单元220分别耦合,用于将集成特征向量与对应于各时序交易的各时序特征向量进行组合,以形成深度特征向量。
第三自学习单元240与时序特征组合单元230耦合,用于对深度特征向量进行分类,以确定待检测交易是正常交易或是欺诈交易,并最终输出检测结果。
在本发明的一些实施例中,系统的至少一部分可采用通信网络所连接的一组分布式计算装置来实现,或,基于“云”来实现。在这种系统中,多个计算装置共同操作,以通过使用其共享资源来提供服务。
基于“云”的实现可提供一个或多个优点,包括:开放性、灵活性和可扩展性、可中心管理、可靠性、可缩放性、对计算资源所优化、具有聚合和分析跨多个用户的信息的能力、跨多个地理区域进行连接、以及将多个移动或数据网络运营商用于网络连通性的能力。
上述说明仅针对于本发明的优选实施例,并不在于限制本发明的保护范围。本领域技术人员可能作出各种变形设计,而不脱离本发明的思想及附随的权利要求。
Claims (10)
1.一种基于序列宽深学习的欺诈交易检测方法,包括:。
a)、对多笔交易数据中的每个进行特征映射处理,以生成相应的特征向量;
b)、基于第一自学习模型,将待检测交易的所述特征向量转换为集成特征向量;
c)、基于第二自学习模型,将至少一笔时序交易各自的所述特征向量分别转换为时序特征向量;其中,所述时序交易表示所述待检测交易的交易账户在第一时间段内所进行的交易;
d)、将所述集成特征向量与对应于各所述时序交易的各所述时序特征向量进行组合,形成深度特征向量;以及
e)、基于第三自学习模型来分类所述深度特征向量,以确定所述待检测交易为正常交易或欺诈交易。
2.根据权利要求1所述的方法,其特征在于,所述第二自学习模型包括第一数量的子模型,各所述子模型分别进行独立的训练学习,其中,所述第一数量与所述待检测交易的交易账户在所述第一时间段内所进行的交易的次数相一致。
3.根据权利要求1所述的方法,其特征在于,在所述第一自学习模型与所述第二自学习模型之间提供特征层注意力模块,以用于主动地学习所述深度特征向量中所述时序交易对所述待检测交易的影响力权重。
4.根据权利要求1所述的方法,其特征在于,在所述第二自学习模型中还包括组件层注意力模块,使得所述第二自学习模型能够主动地学习各所述时序交易分别对所述深度特征向量的影响力权重。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述第二自学习模型与所述第三自学习模型之间提供一个多层神经网络,以用于将所述集成特征向量与各所述时序特征向量进行组合,并输出所述深度特征向量。
6.根据权利要求5所述的方法,其特征在于,所述多层神经网络还用于控制所述深度特征向量的向量长度。
7.根据权利要求6所述的方法,其特征在于,所述第一自学习模型为梯度提升决策树模型,所述第二自学习模型为循环神经网络模型,所述第三自学习模型为随机森林模型。
8.根据权利要求7所述的方法,其特征在于,所述随机森林模型基于对欺诈样本的判定的准确率和覆盖率来调节模型的参数。
9.根据权利要求8所述的方法,其特征在于,其中所述随机森林模型的Fβ值满足:
其中precision为所述对欺诈样本的判定的准确率,recall为对欺诈样本的判定的召回率,β表示召回率的权重是准确率的β倍。
10.一种基于序列宽深学习的欺诈交易检测系统,包括:
特征映射处理单元,用于对多笔交易数据进行特征映射处理,以生成相应的多组交易特征向量;
第一自学习单元,与所述特征映射处理单元耦合,用于将待检测交易的所述特征向量转换为集成特征向量;
第二自学习单元,与所述特征映射处理单元耦合,用于将至少一笔时序交易各自的所述特征向量分别转换为时序特征向量;其中,所述时序交易表示所述待检测交易的交易账户在第一时间段内所进行的交易;
时序特征组合单元,与所述第一自学习单元和所述第二自学习单元分别耦合,用于将所述集成特征向量与对应于各所述时序交易的各所述时序特征向量进行组合,以形成深度特征向量;以及
第三自学习单元,与所述时序特征组合单元耦合,用于分类所述深度特征向量,以确定所述待检测交易为正常交易或欺诈交易。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810239759.3A CN110298663B (zh) | 2018-03-22 | 2018-03-22 | 基于序列宽深学习的欺诈交易检测方法 |
PCT/CN2019/078577 WO2019179403A1 (zh) | 2018-03-22 | 2019-03-19 | 基于序列宽深学习的欺诈交易检测方法 |
US17/040,144 US11062199B2 (en) | 2018-03-22 | 2019-03-19 | Fraudulent transaction detection method based on sequence wide and deep learning |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810239759.3A CN110298663B (zh) | 2018-03-22 | 2018-03-22 | 基于序列宽深学习的欺诈交易检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110298663A true CN110298663A (zh) | 2019-10-01 |
CN110298663B CN110298663B (zh) | 2023-04-28 |
Family
ID=67988228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810239759.3A Active CN110298663B (zh) | 2018-03-22 | 2018-03-22 | 基于序列宽深学习的欺诈交易检测方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11062199B2 (zh) |
CN (1) | CN110298663B (zh) |
WO (1) | WO2019179403A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062416A (zh) * | 2019-11-14 | 2020-04-24 | 支付宝(杭州)信息技术有限公司 | 用户聚类及特征学习方法、设备、计算机可读介质 |
CN111127185A (zh) * | 2019-11-25 | 2020-05-08 | 北京明略软件系统有限公司 | 信贷欺诈识别模型构建方法及装置 |
CN112308566A (zh) * | 2020-09-27 | 2021-02-02 | 中智关爱通(上海)科技股份有限公司 | 一种企业欺诈识别方法 |
CN112967053A (zh) * | 2021-03-03 | 2021-06-15 | 中国银联股份有限公司 | 一种欺诈交易的检测方法及装置 |
CN113011884A (zh) * | 2021-01-29 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 账户特征的提取方法、装置、设备及可读存储介质 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11886961B2 (en) * | 2019-09-25 | 2024-01-30 | Sap Se | Preparing data for machine learning processing |
CN110749793A (zh) * | 2019-10-31 | 2020-02-04 | 杭州中恒云能源互联网技术有限公司 | 基于宽度学习干式变压器健康管理方法、系统及存储介质 |
EP4361934A3 (en) | 2020-02-12 | 2024-07-24 | Feedzai - Consultadoria e Inovação Tecnológica, S.A. | Interleaved sequence recurrent neural networks for fraud detection |
CN112215095A (zh) * | 2020-09-24 | 2021-01-12 | 西北工业大学 | 违禁品检测方法、装置、处理器和安检系统 |
US11756050B2 (en) | 2020-10-06 | 2023-09-12 | Visa International Service Association | Method, system, and computer program product for fraud prevention using deep learning and survival models |
US20220198471A1 (en) * | 2020-12-18 | 2022-06-23 | Feedzai - Consultadoria E Inovação Tecnológica, S.A. | Graph traversal for measurement of fraudulent nodes |
CN113362071A (zh) * | 2021-06-21 | 2021-09-07 | 浙江工业大学 | 一种针对以太坊平台的庞氏骗局识别方法及系统 |
CN113627950B (zh) * | 2021-06-25 | 2023-12-29 | 淮安集略科技有限公司 | 基于动态图的用户交易特征提取的方法和系统 |
US20240037228A1 (en) * | 2022-07-29 | 2024-02-01 | Capital One Services, Llc | Systems and methods for real-time cyber incident detection in data sparse environments using artificial intelligence |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095238A (zh) * | 2014-05-04 | 2015-11-25 | 中国银联股份有限公司 | 用于检测欺诈交易的决策树生成方法 |
CN105787743A (zh) * | 2016-02-26 | 2016-07-20 | 中国银联股份有限公司 | 基于样本聚类的欺诈交易检测方法 |
CN105976242A (zh) * | 2016-04-21 | 2016-09-28 | 中国农业银行股份有限公司 | 一种基于实时流数据分析的交易欺诈检测方法及系统 |
CN106033515A (zh) * | 2015-03-16 | 2016-10-19 | 阿里巴巴集团控股有限公司 | 欺诈事件的识别方法和装置 |
KR20170083330A (ko) * | 2016-01-08 | 2017-07-18 | 한국인터넷진흥원 | 머신러닝을 이용하여 이상거래를 탐지하기 위한 장치 및 그 방법 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8838755B2 (en) * | 2007-03-23 | 2014-09-16 | Microsoft Corporation | Unified service management |
CN104679777B (zh) | 2013-12-02 | 2018-05-18 | 中国银联股份有限公司 | 一种用于检测欺诈交易的方法及系统 |
CN104035751B (zh) * | 2014-06-20 | 2016-10-12 | 深圳市腾讯计算机系统有限公司 | 基于多图形处理器的数据并行处理方法及装置 |
US10834437B2 (en) * | 2017-12-12 | 2020-11-10 | Facebook, Inc. | Inserting secondary content into primary content presented by an online system |
CN110084603B (zh) * | 2018-01-26 | 2020-06-16 | 阿里巴巴集团控股有限公司 | 训练欺诈交易检测模型的方法、检测方法以及对应装置 |
US10955851B2 (en) * | 2018-02-14 | 2021-03-23 | Zoox, Inc. | Detecting blocking objects |
US10726062B2 (en) * | 2018-11-30 | 2020-07-28 | Sony Interactive Entertainment Inc. | System and method for converting image data into a natural language description |
-
2018
- 2018-03-22 CN CN201810239759.3A patent/CN110298663B/zh active Active
-
2019
- 2019-03-19 WO PCT/CN2019/078577 patent/WO2019179403A1/zh active Application Filing
- 2019-03-19 US US17/040,144 patent/US11062199B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095238A (zh) * | 2014-05-04 | 2015-11-25 | 中国银联股份有限公司 | 用于检测欺诈交易的决策树生成方法 |
CN106033515A (zh) * | 2015-03-16 | 2016-10-19 | 阿里巴巴集团控股有限公司 | 欺诈事件的识别方法和装置 |
KR20170083330A (ko) * | 2016-01-08 | 2017-07-18 | 한국인터넷진흥원 | 머신러닝을 이용하여 이상거래를 탐지하기 위한 장치 및 그 방법 |
CN105787743A (zh) * | 2016-02-26 | 2016-07-20 | 中国银联股份有限公司 | 基于样本聚类的欺诈交易检测方法 |
CN105976242A (zh) * | 2016-04-21 | 2016-09-28 | 中国农业银行股份有限公司 | 一种基于实时流数据分析的交易欺诈检测方法及系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062416A (zh) * | 2019-11-14 | 2020-04-24 | 支付宝(杭州)信息技术有限公司 | 用户聚类及特征学习方法、设备、计算机可读介质 |
CN111127185A (zh) * | 2019-11-25 | 2020-05-08 | 北京明略软件系统有限公司 | 信贷欺诈识别模型构建方法及装置 |
CN112308566A (zh) * | 2020-09-27 | 2021-02-02 | 中智关爱通(上海)科技股份有限公司 | 一种企业欺诈识别方法 |
CN113011884A (zh) * | 2021-01-29 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 账户特征的提取方法、装置、设备及可读存储介质 |
CN113011884B (zh) * | 2021-01-29 | 2023-08-04 | 腾讯科技(深圳)有限公司 | 账户特征的提取方法、装置、设备及可读存储介质 |
CN112967053A (zh) * | 2021-03-03 | 2021-06-15 | 中国银联股份有限公司 | 一种欺诈交易的检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2019179403A1 (zh) | 2019-09-26 |
CN110298663B (zh) | 2023-04-28 |
US20210027145A1 (en) | 2021-01-28 |
US11062199B2 (en) | 2021-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110298663A (zh) | 基于序列宽深学习的欺诈交易检测方法 | |
CN106021364B (zh) | 图片搜索相关性预测模型的建立、图片搜索方法和装置 | |
Shingi | A federated learning based approach for loan defaults prediction | |
CN109118013A (zh) | 一种基于神经网络的经营数据预测方法、可读存储介质和预测系统 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN110059852A (zh) | 一种基于改进随机森林算法的股票收益率预测方法 | |
CN110348608A (zh) | 一种基于模糊聚类算法改进lstm的预测方法 | |
CN108171379A (zh) | 一种用电负荷预测方法 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN113255900A (zh) | 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法 | |
CN108229750A (zh) | 一种股票收益率预测方法 | |
CN109829627A (zh) | 一种基于集成学习方案的电力系统动态安全置信评估方法 | |
CN114266289A (zh) | 一种复杂装备健康状态评估方法 | |
CN115456695A (zh) | 一种店铺选址的分析方法、装置、系统及介质 | |
CN113688960A (zh) | 基于灰狼优化ghfcm的居民电力数据聚类方法及装置 | |
CN111723523A (zh) | 一种基于级联神经网络的河口余水位预测方法 | |
CN108304975A (zh) | 一种数据预测系统及方法 | |
CN110533109A (zh) | 一种喷涂生产监测数据的存储及特征分析方法及其装置 | |
CN112241832A (zh) | 一种产品质量分级评价标准设计方法及系统 | |
CN117034060A (zh) | 基于ae-rcnn的洪水分级智能预报方法 | |
CN114819107B (zh) | 基于深度学习的混合数据同化方法 | |
CN109978406A (zh) | 一种证券下行风险评估诊断的方法及系统 | |
CN109523386A (zh) | 一种gmm与lstm结合的投资组合风险预测方法 | |
CN106128101B (zh) | 交通流量短时预测结果的可视化装置 | |
CN113554099A (zh) | 一种识别异常商户的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |