CN113011979A - 交易检测方法、模型的训练方法、装置及计算机可读存储介质 - Google Patents
交易检测方法、模型的训练方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113011979A CN113011979A CN202110334121.XA CN202110334121A CN113011979A CN 113011979 A CN113011979 A CN 113011979A CN 202110334121 A CN202110334121 A CN 202110334121A CN 113011979 A CN113011979 A CN 113011979A
- Authority
- CN
- China
- Prior art keywords
- transaction
- features
- feature
- sample
- trained
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 108
- 238000001514 detection method Methods 0.000 title claims abstract description 98
- 238000012549 training Methods 0.000 title claims abstract description 81
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 230000006870 function Effects 0.000 claims description 87
- 239000011159 matrix material Substances 0.000 claims description 19
- 239000002131 composite material Substances 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 9
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 241000820057 Ithone Species 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 7
- 230000009286 beneficial effect Effects 0.000 abstract description 5
- 238000007499 fusion processing Methods 0.000 abstract description 4
- 230000006872 improvement Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 16
- 238000012546 transfer Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 230000004927 fusion Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000004576 sand Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 208000001613 Gambling Diseases 0.000 description 2
- 238000012897 Levenberg–Marquardt algorithm Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了交易检测方法、模型的训练方法、装置及计算机可读存储介质,该交易检测模型的训练方法包括:获取交易样本集,交易样本集包括携带样本标签的多个交易样本;根据交易样本集构造人工特征以及提取深度特征,得到交易样本集的人工特征和深度特征,形成训练样本集;构建待训练模型,待训练模型至少包含待训练的特征重建网络和分类网络,基于训练样本集对待训练模型迭代地执行端到端的训练,以得到交易检测模型。利用上述方法,能够优化人工特征和深度特征的特征融合过程,从人工特征以及深度特征中自动提取利于下游的分类网络质量提升的特征,实现更好的交易检测效果。
Description
技术领域
本发明属于机器学习领域,具体涉及交易检测方法、模型的训练方法、装置及计算机可读存储介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在大数据和人工智能时代,数据驱动的金融风险防控模型构建是金融风控领域的热点研究之一。在实际的金融风控业务场景中,特征工程作为风控建模中处理和分析数据的关键步骤,直接影响后续的模型构建效果。
在交易场景中,通过大量账号之间的交易关系可以构成一张大规模的复杂交易网络。为了有效利用数据构建鲁棒性的高精度模型,通常会基于业务经验构造人工特征,以及采用机器学习方法自动化地抽取深度特征,并将这两类特征简单拼接融合作为下游任务模型的输入。然而这样会导致下游任务模型的检测效果不佳,并会造成一定程度的特征冗余。
因此,在交易检测过程中,如何有效且快速地进行特征融合是一个亟待解决的问题。
发明内容
针对上述现有技术中存在的问题,提出了交易检测模型的训练方法、交易检测方法、装置及计算机可读存储介质,利用这种方法、装置及计算机可读存储介质,能够解决上述问题。
本发明提供了以下方案。
第一方面,提供一种交易检测模型的训练方法,包括:获取交易样本集,交易样本集包括携带样本标签的多个交易样本,样本标签用于指示交易样本的异常情况;根据交易样本集构造人工特征以及提取深度特征,得到交易样本集的人工特征和深度特征,形成训练样本集;构建待训练模型,待训练模型至少包含待训练的特征重建网络和分类网络,基于训练样本集对待训练模型迭代地执行端到端的训练,以得到交易检测模型。
在一种可能的实施方式中,构建待训练模型,还包括:基于自编码器构建特征重建网络,其中,自编码器包括用于执行特征编码的编码器和用于执行特征重建的解码器,以及,根据编码器的输出数据而确定分类网络的输入数据。
在一种可能的实施方式中,构建待训练模型,还包括:基于多层感知机MLP构建分类器网络,其中,多层感知机MLP的最后一层是softmax层。
在一种可能的实施方式中,基于训练样本集对待训练模型迭代地执行端到端的训练,包括:将交易样本的人工特征和深度特征输入待训练的特征重建网络,其中,特征重建网络至少包括待训练的第一自编码器和第二自编码器,特征重建网络将人工特征和深度特征融合为综合特征,并将综合特征和人工特征输入第一自编码器,将综合特征和深度特征输入第二自编码器,第一自编码器根据综合特征和人工特征依次生成第一编码特征和第一重建特征,第二自编码器根据综合特征和深度特征依次生成第二编码特征和第二重建特征,特征重建网络根据第一编码特征和第二编码特征生成交易样本的综合编码特征。
在一种可能的实施方式中,基于训练样本集对待训练模型迭代地执行端到端的训练,还包括:将特征重建网络生成的交易样本的综合编码特征输入待训练的分类网络,得到交易样本的样本检测结果;根据第一重建特征和人工特征之间的差异程度、第二重建特征和深度特征之间的差异程度以及样本检测结果和样本标签之间的差异程度,调整待训练模型的各个参数,直至达到预设收敛条件。
在一种可能的实施方式中,调整待训练模型的各个参数,还包括:根据第一重建特征和人工特征之间的差异程度确定第一损失函数;根据第二重建特征和深度特征之间的差异程度确定第二损失函数;根据样本检测结果和样本标签之间的差异程度确定第三损失函数;根据第一损失函数、第二损失函数和第三损失函数确定综合损失函数;根据综合损失函数联合调整第一自编码器、第二自编码器以及分类网络中的各个参数。
在一种可能的实施方式中,调整待训练模型的各个参数,还包括:采用随机梯度下降的反向传播算法优化待训练模型的各个参数。
在一种可能的实施方式中,构造人工特征还包括:基于交易样本的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。
在一种可能的实施方式中,构造人工特征,还包括:对非数值类型数据进行one-hot编码。
在一种可能的实施方式中,构造深度特征还包括:基于交易样本提取交易网络图中的图结构特征作为深度特征;其中,交易网络图包括根据多个交易账户设置的多个账户节点,账户节点之间的交易边以及边权值根据多个交易账户之间的交易记录而设置;图结构特征包括以下中的一种或多种:交易样本对应的账户节点的出度、入度,其中,出度是账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。
在一种可能的实施方式中,提取交易网络图中的图结构特征,还包括:采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。
其中,N为交易样本的个数,为第i个交易样本的人工特征,为第i个交易样本的第一重建特征,为第一自编码器的编码器的变换矩阵,为第一自编码器的解码器的可优化的变换矩阵,σ为sigmoid激活函数,第i个交易样本的综合特征第i个交易样本的第一编码特征 第i个交易样本的第一重建特征
其中,N为交易样本的个数,为第i个交易样本的深度特征,为第i个交易样本的第二重建特征,为第二自编码器的编码器的变换矩阵,为第二自编码器的解码器的可优化的变换矩阵,σ为sigmoid激活函数,第i个交易样本的综合特征第i个交易样本的第二编码特征第i个交易样本的第二重建特征
在一种可能的实施方式中,分类网络采用交叉熵损失函数。
在一种可能的实施方式中,方法还包括:利用以下公式计算第三损失函数LM:
其中,N为交易样本的个数,K为样本标签个数,为第i个交易样本的样本标签;其中只有当i=j时,等于1,否则都为0;第i个交易样本的综合编码特征 是第i个交易样本的第一编码特征,是第i个交易样本的第二编码特征,是分类网络的全连接层输入的第i个特征xi的权重。
第二方面,提供一种交易检测方法,包括:接收待检测交易的原始交易数据,基于原始交易数据构造人工特征以及提取深度特征;将人工特征和深度特征输入经训练的交易检测模型,得到待检测交易的检测结果;其中,交易检测模型利用如第一方面的方法训练得到。
在一种可能的实施方式中,构造人工特征还包括:基于原始交易数据的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。
在一种可能的实施方式中,构造人工特征,还包括:对非数值类型数据进行one-hot编码。
在一种可能的实施方式中,还包括:基于原始交易数据提取交易网络图中的图结构特征,作为深度特征;其中,交易网络图包括根据多个交易账户设置的多个账户节点,账户节点之间的交易边以及边权值根据多个交易账户之间的交易记录而设置;图结构特征包括以下中的一种或多种:原始交易数据对应的账户节点的出度、入度;其中,出度是账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。
在一种可能的实施方式中,提取交易网络图中的图结构特征,还包括:采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。
第三方面,提供一种交易检测模型的训练装置,其被配置为用于执行如第一方面的方法,装置包括:获取模块,用于获取交易样本集,交易样本集包括携带样本标签的多个交易样本,样本标签用于指示交易样本的异常情况;特征模块,用于根据交易样本集构造人工特征以及提取深度特征,得到交易样本集的人工特征和深度特征,形成训练样本集;训练模块,用于构建待训练模型,待训练模型至少包含待训练的特征重建网络和分类网络,基于训练样本集对待训练模型迭代地执行端到端的训练,以得到交易检测模型。
第四方面,提供一种交易检测装置,其被配置为用于执行如第二方面的方法,装置包括:接收模块,用于接收待检测交易的原始交易数据,基于原始交易数据构造人工特征以及提取深度特征;
检测模块,用于将人工特征和深度特征输入经训练的交易检测模型,得到待检测交易的检测结果,其中,交易检测模型利用如第一方面的方法训练得到。
第五方面,提供一种交易检测模型的训练装置,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如第一方面的方法。
第六方面,提供一种交易检测装置,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如第二方面的方法。
第七方面,提供一种计算机可读存储介质,计算机可读存储介质存储有程序,当程序被多核处理器执行时,使得多核处理器执行:如第一方面的方法,和/或如第二方面的方法。
采用随机梯度下降的反向传播算法优化待训练模型的各个参数
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本实施例中,将上游的特征重建网络和下游的分类网络一起进行端到端的优化,利用下游的分类网络学习过程中生成的监督信号来指导特征重建网络的学习,优化特征融合过程,从人工特征以及深度特征中自动提取利于下游的分类网络质量提升的特征。
应当理解,上述说明仅是本发明技术方案的概述,以便能够更清楚地了解本发明的技术手段,从而可依照说明书的内容予以实施。为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举例说明本发明的具体实施方式。
附图说明
通过阅读下文的示例性实施例的详细描述,本领域普通技术人员将明白本文所述的优点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的标号表示相同的部件。在附图中:
图1为根据本发明一实施例的交易检测模型的训练方法的流程示意图;
图2为根据本发明另一实施例的交易检测模型的训练方法的流程示意图;
图3为根据本发明一实施例的交易检测模型的示意图;
图4为根据本发明一实施例的交易检测方法的流程示意图;
图5为根据本发明一实施例的交易检测模型的训练装置的结构示意图。
图6为根据本发明一实施例的交易检测装置的结构示意图;
图7为根据本发明又一实施例的交易检测模型的训练装置的结构示意图。
图8为根据本发明又一实施例的交易检测装置的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在本申请实施例的描述中,应理解,诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不旨在排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。
除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本申请中的所有代码都是示例性的,本领域技术人员根据所使用的编程语言,具体的需求和个人习惯等因素会在不脱离本申请的思想的条件下想到各种变型。
另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1是根据本申请一实施例的交易检测模型的训练方法的流程示意图,用于训练得到交易检测模型,在该流程中,从设备角度而言,执行主体可以是一个或者多个电子设备;从程序角度而言,执行主体相应地可以是搭载于这些电子设备上的程序。
如图1所示,本实施例提供的方法可以包括以下步骤S101-S103:
S101、获取交易样本集,交易样本集包括携带样本标签的多个交易样本。
其中,交易样本集中可以包括若干正交易样本和若干负交易样本,样本标签用于指示交易样本的异常情况,可以分别对应于样本标签为1和0。其中,正交易样本可以对应于非异常交易,负交易样本可以对应于异常交易。
S102、根据交易样本集构造人工特征以及提取深度特征,得到交易样本集的人工特征和深度特征,形成训练样本集。
可以基于业务经验构造出正负交易样本的人工特征。例如,人工特征可以包括:根据交易卡的账号信息、交易流水、卡标签表确定出交易卡相关的多个交易特征和属性特征(如笔数、金额、交易时间分布、交易行业分布、交易代码分布、卡品牌、性别、年龄、地域、消费周期等)
在一些可能的实施方式中,上述S102中,为了构造人工特征,还可以基于交易样本的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。
在一些可能的实施方式中,上述S102中,为了构造人工特征,还可以对非数值类型数据进行one-hot编码,可以有效地标识非数值类型数据。该one-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由独立的寄存器位,并且在任意时候只有一位有效。
可以通过机器学习方法/深度学习方法提取出正/负交易样本的深度特征。深度特征是指通过深度网络获得的可以表征正/负交易样本的隐特征。例如,大量交易卡之间的转账关系可以构成一张大规模的复杂交易网络,为了有效利用数据构建鲁棒性的高精度模型,可以采用机器学习方法自动化地从复杂交易网络中抽取出与该正/负交易样本相关的深度特征。
在一些可能的实施方式中,上述S102中,为了提取该深度特征,还可以基于交易样本提取交易网络图中的图结构特征,以作为该深度特征。
具体地,交易网络图可以包括根据多个交易账户设置的多个账户节点,该账户节点可以是用户节点、商户节点或者设备节点等中的任意一种或多种。交易网络图中的两个节点之间可能存在节点关系,例如,节点2和节点3之间可能存在转账关系、节点1和节点3之间可能存在转账关系,换言之账户节点之间的交易边以及边权值可以根据多个交易账户之间的交易记录而设置。例如,在赌博交易卡侦测场景中,可以基于大量二维码收款卡号,从的二维码流水数据表获取用户的历史交易流水和相关交易信息,若不同账号之间存在一笔以上的交易,那么构建对应的交易边,边属性比如可以为一天的交易金额、笔数、交易时间间隔等,遍历上万个账号可以构建出一个交易网络图。
在具体实施过程中,可以先获取历史交易信息,并根据历史交易信息的交易关系路径确定交易网络图。可选的,历史交易信息可以理解为预设时段内统计的历史交易信息,该预设时段可以根据经验进行设定,例如一个月、一周等,该历史交易信息可以为多条,每条历史交易信息对应至少两个节点,例如,历史交易信息1为“账户2向账户3转账”,涉及到账户节点2和账户节点3,则历史交易信息1的交易关系路径即为账户节点2和账户节点3组成的路径,根据历史交易信息中的交易关系路径,可以确定出由账户节点组成的交易网络图。
在一些可能的实施方式中,为了提取交易网络图中的图结构特征,还可以采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。
当然,还可以采用其他图结构特征提取算法,如LINE(Large-scale InformationNetwork Embedding,大规模网络信息嵌入)、TransE(Translating Embedding)等,本申请对此不做具体限定。
在一些可能的实施方式中,基于上述交易结构图,所提取的图结构特征可以包括以下中的一种或多种:交易样本对应的账户节点的出度、入度、节点度数,其中,出度是交易网络图中账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。
S103、构建待训练模型,待训练模型至少包含待训练的特征重建网络和分类网络,基于训练样本集对待训练模型迭代地执行端到端的训练,以得到交易检测模型。
其中,特征重建网络是用于融合人工特征和深度特征的网络,分类网络是用于具体执行检测异常交易的下游任务的网络。
本发明实施例中的待训练模型是一种端到端学习模型,该端到端学习模型是指使用单个模型来建模解决多步骤/模块解决的任务。可以理解,使用多步骤/多模块解决一个复杂任务的时候,一个明显的弊端是各个模块训练目标不一致,单个模块的目标函数可能与总体的宏观目标有偏差,这样训练出来的系统最终很难达到最优的性能,另一个问题是误差的累积,前一模块产生的偏差可能影响后一个模块。端到端模型仅使用一个模型、就规避了前面的多模块固有的缺陷,另外,这样还可以减少训练复杂度。
本实施例中,将上游的特征重建网络和下游的分类网络一起进行端到端的优化,在训练整个模型的过程中,特征重建和分类网络的参数同时被更新,以保证编码特征与分类任务具有较好的适应性。利用下游的分类网络学习过程中生成的监督信号来指导特征重建网络的学习,能够优化特征融合过程,从人工特征以及图结构特征中自动提取利于下游的分类网络质量提升的特征。
在一些可能的实施方式中,S103中的构建待训练模型,还可以包括:基于自编码器(autoencoder,AE)构建特征重建网络,其中,自编码器包括用于执行特征编码的编码器和用于执行特征重建的解码器,以及,根据编码器的输出数据而确定分类网络的输入数据。
具体地,自编码器是一类在半监督学习和非监督学习中使用的人工神经网络(Artificial Neural Networks,ANNs),其功能是通过将输入信息作为学习目标,对输入信息进行表征学习(representation learning)。自编码器包含编码器(encoder)和解码器(decoder)两部分。自编码器的学习过程可以如下:将初始数据输入编码器,由编码器对初始数据进行特征提取,获得数据特征,再根据该数据特征进行数据重建,然后计算重建的数据与初始数据之间的差异,并根据该差异来调整编码器的网络参数。
本实施例中,通过采用自编码器技术,可以从人工特征和深度特征中提取关键特征,减缓特征融合对模型泛化能力的影响。
在一些可能的实施方式中,S103中的构建待训练模型,还可以基于多层感知机(Multi-Layer Perception,简称MLP)构建分类器网络,其中,多层感知机MLP的最后一层可以是softmax层,可以通过softmax函数生成类别的概率值。
图2是本发明另一示例性实施例示出的交易检测模型的训练方法的流程示意图,本实施例在图1所示实施例的基础上,对模型训练的过程进一步详细描述。
在一些可能的实施方式中,上述S103中,基于训练样本集对待训练模型迭代地执行端到端的训练,如图2所示,还可以包括S201:
S201、将交易样本的人工特征和图结构特征输入待训练的特征重建网络。
参考图3,特征重建网络至少包括待训练的第一自编码器和第二自编码器,特征重建网络将人工特征和图结构特征融合为综合特征。例如,针对任意一个交易样本,将构造的人工特征和深度特征进行拼接获得融合后的综合特征xs=[xm;xg]。并将综合特征xs分别输入第一自编码器和第二自编码器,第一自编码器根据综合特征xs和人工特征xm并利用第一编码器生成第一编码特征hm,根据第一编码特征hm并利用第一解码器生成第一重建特征第二自编码器根据综合特征xs和深度特征xg并利用第二编码器生成第二编码特征hg,之后根据第二编码特征hg并利用第二解码器生成第二重建特征特征重建网络根据第一编码特征hm和第二编码特征hg生成交易样本的综合编码特征
在一些可能的实施方式中,在S201之后,基于训练样本集对待训练模型迭代地执行端到端的训练,如图2所示,还可以包括S202-S203:
S202、将特征重建网络生成的交易样本的综合编码特征输入待训练的分类网络,得到交易样本的样本检测结果。
其中,将综合编码特征hs=[hm;hg]输入到单层神经网络进行有监督学习,通过softmax函数生成类别的概率值。
S203、根据第一重建特征和人工特征之间的差异程度、第二重建特征和深度特征之间的差异程度以及样本检测结果和样本标签之间的差异程度,调整待训练模型的各个参数,直至达到预设收敛条件。
在本实施例中,通过为人工特征和深度特征分别设立用于特征重建的自编码器,并将综合特征作为自编码器的输入,可以在保证不丢失主要信息的前提下,减少融合后特征的冗余信息,加快下游任务的模型构建。
在一些可能的实施方式中,上述S203中,为了调整待训练模型的各个参数,还可以包括:步骤a、根据第一重建特征和人工特征之间的差异程度确定第一损失函数。步骤b、根据第二重建特征和深度特征之间的差异程度确定第二损失函数;步骤c、根据样本检测结果和样本标签之间的差异程度确定第三损失函数;步骤d、根据第一损失函数、第二损失函数和第三损失函数确定综合损失函数;根据综合损失函数联合调整第一自编码器、第二自编码器以及分类网络中的各个参数。换言之,在训练整个模型的过程中,特征重建和分类网络的参数同时被更新,以保证编码特征与分类任务具有较好的适应性。
在一些可能的实施方式中,上述S203中,为了调整待训练模型的各个参数,还包括:采用随机梯度下降的反向传播算法优化待训练模型的各个参数。
其中,N为交易样本的个数,为第i个交易样本的人工特征,为第i个交易样本的第一重建特征,为第一自编码器的编码器的变换矩阵,为第一自编码器的解码器的可优化的变换矩阵,σ为sigmoid激活函数,第i个交易样本的综合特征第i个交易样本的第一编码特征第i个交易样本的第一重建特征
其中,N为交易样本的个数,为第i个交易样本的深度特征,为第i个交易样本的第二重建特征,为第二自编码器的编码器的变换矩阵,为第二自编码器的解码器的可优化的变换矩阵,σ为sigmoid激活函数,第i个交易样本的综合特征第i个交易样本的第二编码特征第i个交易样本的第二重建特征
在一些可能的实施方式中,为了调整待训练模型的各个参数,分类网络可以采用交叉熵损失函数。
在一些可能的实施方式中,为了调整待训练模型的各个参数,还包括:利用以下公式(3)计算第三损失函数LM:
其中,N为交易样本的个数,K为样本标签个数,为第i个交易样本的样本标签;其中只有当i=j时,等于1,否则都为0;第i个交易样本的综合编码特征 是第i个交易样本的第一编码特征,是第i个交易样本的第二编码特征,Ws为权重矩阵,所述为第k类标签对应的权重向量。
在一些可能的实施方式中,为了调整待训练模型的各个参数,还包括:
利用以下公式(4)确定综合损失函数L:
可选地,α1和α2的取值在0到1之间。在另外的实施例中,也可以设置为其他取值区间,本申请对此不做具体限制。
在本说明书的描述中,参考术语“一些可能的实施方式”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
关于本申请实施例的方法流程图,将某些操作描述为以一定顺序执行的不同的步骤。这样的流程图属于说明性的而非限制性的。可以将在本文中所描述的某些步骤分组在一起并且在单个操作中执行、可以将某些步骤分割成多个子步骤、并且可以以不同于在本文中所示出的顺序来执行某些步骤。可以由任何电路结构和/或有形机制(例如,由在计算机设备上运行的软件、硬件(例如,处理器或芯片实现的逻辑功能)等、和/或其任何组合)以任何方式来实现在流程图中所示出的各个步骤。
本发明实施例还提供一种交易检测方法。
图4是根据本申请一实施例的交易检测方法的流程示意图,用于依据上述实施例训练得到交易检测模型进行异常交易的检测,在该流程中,从设备角度而言,执行主体可以是一个或者多个电子设备;从程序角度而言,执行主体相应地可以是搭载于这些电子设备上的程序。
如图4所示,本实施例提供的方法可以包括以下步骤:
S401、接收待检测交易的原始交易数据,基于原始交易数据构造人工特征以及提取深度特征;
S402、将人工特征和深度特征输入经训练的交易检测模型,得到待检测交易的检测结果;
其中,交易检测模型利用如以上实施例的模型训练方法得到。
在一些可能的实施方式中,上述S401中,为了构造人工特征,还可以基于原始交易数据的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。
在一些可能的实施方式中,上述S401中,为了构造人工特征,还可以对非数值类型数据进行one-hot编码,可以有效地标识非数值类型数据。该one-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由独立的寄存器位,并且在任意时候只有一位有效。
可以通过机器学习方法/深度学习方法提取出原始交易数据的深度特征。深度特征是指通过深度网络获得的可以表征原始交易数据的隐特征。例如,大量交易卡之间的转账关系可以构成一张大规模的复杂交易网络,为了有效利用数据构建鲁棒性的高精度模型,可以采用机器学习方法自动化地从复杂交易网络中抽取出与该原始交易数据相关的深度特征。
在一些可能的实施方式中,上述S401中,为了提取该深度特征,还可以基于原始交易数据提取交易网络图中的图结构特征,以作为该深度特征。
具体地,交易网络图可以包括根据多个交易账户设置的多个账户节点,该账户节点可以是用户节点、商户节点或者设备节点等中的任意一种或多种。交易网络图中的两个节点之间可能存在节点关系,例如,节点2和节点3之间可能存在转账关系、节点1和节点3之间可能存在转账关系,换言之账户节点之间的交易边以及边权值可以根据多个交易账户之间的交易记录而设置。例如,在赌博交易卡侦测场景中,可以基于大量二维码收款卡号,从的二维码流水数据表获取用户的历史交易流水和相关交易信息,若不同账号之间存在一笔以上的交易,那么构建对应的交易边,边属性比如可以为一天的交易金额、笔数、交易时间间隔等,遍历上万个账号可以构建出一个交易网络图。
在具体实施过程中,可以先获取历史交易信息,并根据历史交易信息的交易关系路径确定交易网络图。可选的,历史交易信息可以理解为预设时段内统计的历史交易信息,该预设时段可以根据经验进行设定,例如一个月、一周等,该历史交易信息可以为多条,每条历史交易信息对应至少两个节点,例如,历史交易信息1为“账户2向账户3转账”,涉及到账户节点2和账户节点3,则历史交易信息1的交易关系路径即为账户节点2和账户节点3组成的路径,根据历史交易信息中的交易关系路径,可以确定出由账户节点组成的交易网络图。
在一些可能的实施方式中,为了提取交易网络图中的图结构特征,还可以采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。
当然,还可以采用其他图结构特征提取算法,如LINE(Large-scale InformationNetwork Embedding,大规模网络信息嵌入)、TransE(Translating Embedding)等,本申请对此不做具体限定。
在一些可能的实施方式中,基于上述交易结构图,所提取的图结构特征可以包括以下中的一种或多种:原始交易数据对应的账户节点的出度、入度、节点度数,其中,出度是交易网络图中账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。
根据本发明实施例的各个方面,该交易检测方法可以从原始交易数据中提取重要信息,减缓特征融合对模型泛化能力的影响。并且,通过将上游的特征重建网络和下游的分类网络一起进行端到端的优化,利用下游的分类网络学习过程中生成的监督信号来指导特征重建网络的学习,优化特征融合过程,从人工特征以及图结构特征中自动提取利于下游的分类网络质量提升的特征,由此可以获得检测效果更好的交易检测模型,得到更好的检测效果。
需要说明的是,本申请实施例中的交易检测方法是基于前述交易检测的训练方法的实施例的各个过程而训练得到交易检测模型而执行的,因此,交易检测方法可以和前述交易检测的训练方法达到相似的效果和功能,这里不再赘述。
基于相同的技术构思,本发明实施例还提供一种交易检测模型的训练装置,用于执行上述任一实施例所提供的交易检测模型的训练方法。图5为本发明实施例提供的一种交易检测模型的训练装置结构示意图。
如图5所示,装置500包括:
获取模块501,用于获取交易样本集,交易样本集包括携带样本标签的多个交易样本,样本标签用于指示交易样本的异常情况;
特征模块502,用于根据交易样本集构造人工特征以及提取深度特征,得到交易样本集的人工特征和深度特征,形成训练样本集;
训练模块503,用于构建待训练模型,待训练模型至少包含待训练的特征重建网络和分类网络,基于训练样本集对待训练模型迭代地执行端到端的训练,以得到交易检测模型。
在一种可能的实施方式中,训练模块还用于:基于自编码器构建特征重建网络,其中,自编码器包括用于执行特征编码的编码器和用于执行特征重建的解码器,以及,根据编码器的输出数据而确定分类网络的输入数据。
在一种可能的实施方式中,训练模块还用于:基于多层感知机MLP构建分类器网络,其中,多层感知机MLP的最后一层是softmax层。
在一种可能的实施方式中,训练模块还用于:将交易样本的人工特征和深度特征输入待训练的特征重建网络,其中,特征重建网络至少包括待训练的第一自编码器和第二自编码器,特征重建网络将人工特征和深度特征融合为综合特征,并将综合特征分别输入第一自编码器和第二自编码器,第一自编码器根据综合特征生成第一编码特征和第一重建特征,第二自编码器根据综合特征生成第二编码特征和第二重建特征,特征重建网络根据第一编码特征和第二编码特征生成交易样本的综合编码特征;
将特征重建网络生成的交易样本的综合编码特征输入待训练的分类网络,得到交易样本的样本检测结果;
根据第一重建特征和人工特征之间的差异程度、第二重建特征和深度特征之间的差异程度以及样本检测结果和样本标签之间的差异程度,调整待训练模型的各个参数,直至达到预设收敛条件。
在一种可能的实施方式中,训练模块还用于:根据第一重建特征和人工特征之间的差异程度确定第一损失函数;根据第二重建特征和深度特征之间的差异程度确定第二损失函数;根据样本检测结果和样本标签之间的差异程度确定第三损失函数;根据第一损失函数、第二损失函数和第三损失函数确定综合损失函数;根据综合损失函数联合调整第一自编码器、第二自编码器以及分类网络中的各个参数。
在一种可能的实施方式中,训练模块还用于:调整待训练模型的各个参数,还包括:采用随机梯度下降的反向传播算法优化待训练模型的各个参数。
在一种可能的实施方式中,特征模块还用于:基于交易样本的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地,也可以是交易的统计特征(金额/笔数的均值、标准差、中位数等)、交易时长等。
在一种可能的实施方式中,特征模块还用于:对非数值类型数据进行one-hot编码。
在一种可能的实施方式中,特征模块还用于:基于交易样本提取交易网络图中的图结构特征作为深度特征;
其中,交易网络图包括根据多个交易账户设置的多个账户节点,账户节点之间的交易边以及边权值根据多个交易账户之间的交易记录而设置;图结构特征包括以下中的一种或多种:交易样本对应的账户节点的出度、入度、节点度数,其中,出度是账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。
在一种可能的实施方式中,特征模块还用于:采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。
其中,N为交易样本的个数,为第i个交易样本的人工特征,为第i个交易样本的第一重建特征,为第一自编码器的编码器的变换矩阵,为第一自编码器的解码器的可优化的变换矩阵,σ为sigmoid激活函数,第i个交易样本的综合特征第i个交易样本的第一编码特征第i个交易样本的第一重建特征
其中,N为交易样本的个数,为第i个交易样本的深度特征,为第i个交易样本的第二重建特征,为第二自编码器的编码器的变换矩阵,为第二自编码器的解码器的可优化的变换矩阵,σ为sigmoid激活函数,第i个交易样本的综合特征第i个交易样本的第二编码特征第i个交易样本的第二重建特征
在一种可能的实施方式中,分类网络可以采用交叉熵损失函数。
在一种可能的实施方式中,训练模块还用于利用以下公式计算第三损失函数LM:
在一些可能的实施方式中,为了调整待训练模型的各个参数,还包括:利用以下公式(3)计算第三损失函数LM:
其中,N为交易样本的个数,K为样本标签个数,为第i个交易样本的样本标签;其中只有当i=j时,等于1,否则都为0;第i个交易样本的综合编码特征 是第i个交易样本的第一编码特征,是第i个交易样本的第二编码特征,Ws为权重矩阵,所述为第k类标签对应的权重向量。
基于相同的技术构思,本发明实施例还提供一种交易检测装置,用于执行上述任一实施例所提供的交易检测方法。图6为本发明实施例提供的一种交易检测装置结构示意图。
如图6所示,装置600包括:
接收模块601,用于接收待检测交易的原始交易数据,基于原始交易数据构造人工特征以及提取深度特征;
检测模块602,用于将人工特征和深度特征输入经训练的交易检测模型,得到待检测交易的检测结果,其中,交易检测模型利用如权利要求1-13中任一项的方法训练得到。
在一种可能的实施方式中,接收模块还用于:基于原始交易数据的预设交易信息构造人工特征;预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。
在一种可能的实施方式中,接收模块还用于:对非数值类型数据进行one-hot编码。
在一种可能的实施方式中,检测模块还用于:基于原始交易数据提取交易网络图中的图结构特征,作为深度特征;其中,交易网络图包括根据多个交易账户设置的多个账户节点,账户节点之间的交易边以及边权值根据多个交易账户之间的交易记录而设置;图结构特征包括以下中的一种或多种:原始交易数据对应的账户节点的出度、入度和节点度数;其中,出度是账户节点指向的账户节点个数,入度是指向账户节点的账户节点个数。
在一种可能的实施方式中,接收模块还用于:采用图嵌入方法(node2vec)和/或图卷积网络提取交易网络图中的图结构特征。
需要说明的是,本申请实施例中的装置可以实现前述对应方法的实施例的各个过程,并达到相同的效果和功能,这里不再赘述。
图7为根据本申请一实施例的交易检测模型的训练装置,用于执行图1所示出的方法,图8为根据本申请一实施例的交易检测装置,用于执行图4所示出的方法,该装置均包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例的方法。
根据本申请的一些实施例,提供了交易检测模型的训练方法和/或交易检测方法的非易失性计算机存储介质,其上存储有计算机可执行指令,该计算机可执行指令设置为在由处理器运行时执行:上述实施例的方法。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以其描述进行了简化,相关之处可参见方法实施例的部分说明即可。
本申请实施例提供的装置、设备和计算机可读存储介质与方法是一一对应的,因此,装置、设备和计算机可读存储介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置、设备和计算机可读存储介质的有益技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (25)
1.一种交易检测模型的训练方法,其特征在于,包括:
获取交易样本集,所述交易样本集包括携带样本标签的多个交易样本,所述样本标签用于指示所述交易样本的异常情况;
根据所述交易样本集构造人工特征以及提取深度特征,得到所述交易样本集的人工特征和深度特征,形成训练样本集;
构建待训练模型,所述待训练模型至少包含待训练的特征重建网络和分类网络,基于所述训练样本集对所述待训练模型迭代地执行端到端的训练,以得到交易检测模型。
2.根据权利要求1所述的方法,其特征在于,构建待训练模型,还包括:
基于自编码器构建所述特征重建网络,其中,所述自编码器包括用于执行特征编码的编码器和用于执行特征重建的解码器,以及,根据所述编码器的输出数据而确定所述分类网络的输入数据。
3.根据权利要求1所述的方法,其特征在于,构建待训练模型,还包括:
基于多层感知机MLP构建所述分类器网络,其中,所述多层感知机MLP的最后一层是softmax层。
4.根据权利要求2所述的方法,其特征在于,基于所述训练样本集对所述待训练模型迭代地执行端到端的训练,包括:
将所述交易样本的所述人工特征和所述深度特征输入待训练的所述特征重建网络,其中,所述特征重建网络至少包括待训练的第一自编码器和第二自编码器,所述特征重建网络将所述人工特征和所述深度特征融合为综合特征,并将所述综合特征和所述人工特征输入所述第一自编码器,将所述综合特征和所述深度特征输入所述第二自编码器,所述第一自编码器根据所述综合特征和所述人工特征依次生成第一编码特征和第一重建特征,所述第二自编码器根据所述综合特征和所述深度特征依次生成第二编码特征和第二重建特征,所述特征重建网络根据所述第一编码特征和所述第二编码特征生成所述交易样本的综合编码特征。
5.根据权利要求4所述的方法,其特征在于,基于所述训练样本集对所述待训练模型迭代地执行端到端的训练,还包括:
将所述特征重建网络生成的所述交易样本的所述综合编码特征输入待训练的所述分类网络,得到所述交易样本的样本检测结果;
根据所述第一重建特征和所述人工特征之间的差异程度、所述第二重建特征和所述深度特征之间的差异程度以及所述样本检测结果和所述样本标签之间的差异程度,调整所述待训练模型的各个参数,直至达到预设收敛条件。
6.根据权利要求5所述的方法,其特征在于,调整所述待训练模型的各个参数,还包括:
根据所述第一重建特征和所述人工特征之间的差异程度确定第一损失函数;
根据所述第二重建特征和所述深度特征之间的差异程度确定第二损失函数;
根据所述样本检测结果和所述样本标签之间的差异程度确定第三损失函数;
根据所述第一损失函数、所述第二损失函数和所述第三损失函数确定综合损失函数;
根据所述综合损失函数联合调整所述第一自编码器、所述第二自编码器以及所述分类网络中的各个参数。
7.根据权利要求5所述的方法,其特征在于,调整所述待训练模型的各个参数,还包括:
采用随机梯度下降的反向传播算法优化所述待训练模型的各个参数。
8.根据权利要求1所述的方法,其特征在于,所述构造人工特征还包括:
基于所述交易样本的预设交易信息构造人工特征;
所述预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。
9.根据权利要求1所述的方法,其特征在于,所述构造人工特征,还包括:
对非数值类型数据进行one-hot编码。
10.根据权利要求1所述的方法,其特征在于,所述构造深度特征还包括:
基于所述交易样本提取交易网络图中的图结构特征作为所述深度特征;
其中,所述交易网络图包括根据多个交易账户设置的多个账户节点,所述账户节点之间的交易边以及边权值根据所述多个交易账户之间的交易记录而设置;所述图结构特征包括以下中的一种或多种:所述交易样本对应的账户节点的出度、入度,其中,所述出度是所述账户节点指向的账户节点个数,所述入度是指向所述账户节点的账户节点个数。
11.根据权利要求10所述的方法,其特征在于,所述提取交易网络图中的图结构特征,还包括:
采用图嵌入方法(node2vec)和/或图卷积网络提取所述交易网络图中的所述图结构特征。
12.根据权利要求6所述的方法,其特征在于,所述方法还包括:
其中,所述N为所述交易样本的个数,为第i个所述交易样本的人工特征,为第i个所述交易样本的第一重建特征,所述为所述第一自编码器的编码器的变换矩阵,所述为所述第一自编码器的解码器的可优化的变换矩阵,所述σ为sigmoid激活函数,第i个所述交易样本的综合特征第i个所述交易样本的第一编码特征第i个所述交易样本的第一重建特征
13.根据权利要求6所述的方法,其特征在于,所述分类网络采用交叉熵损失函数。
16.一种交易检测方法,其特征在于,包括:
接收待检测交易的原始交易数据,基于所述原始交易数据构造人工特征以及提取深度特征;
将所述人工特征和所述深度特征输入经训练的交易检测模型,得到所述待检测交易的检测结果;
其中,所述交易检测模型利用如权利要求1-15中任一项所述的方法训练得到。
17.根据权利要求16所述的方法,其特征在于,所述构造人工特征还包括:
基于所述原始交易数据的预设交易信息构造人工特征;
所述预设交易信息包括以下中的一种或多种:交易账户、交易时间、交易金额、交易地点、设备标识、账号注册时间、银行卡预留手机号归属地。
18.根据权利要求16所述的方法,其特征在于,所述构造人工特征,还包括:
对非数值类型数据进行one-hot编码。
19.根据权利要求16所述的方法,其特征在于,还包括:
基于所述原始交易数据提取交易网络图中的图结构特征,作为所述深度特征;
其中,所述交易网络图包括根据多个交易账户设置的多个账户节点,所述账户节点之间的交易边以及边权值根据所述多个交易账户之间的交易记录而设置;所述图结构特征包括以下中的一种或多种:所述原始交易数据对应的账户节点的出度、入度;其中,所述出度是所述账户节点指向的账户节点个数,所述入度是指向所述账户节点的账户节点个数。
20.根据权利要求17所述的方法,其特征在于,所述提取交易网络图中的图结构特征,还包括:
采用图嵌入方法(node2vec)和/或图卷积网络提取所述交易网络图中的所述图结构特征。
21.一种交易检测模型的训练装置,其特征在于,被配置为用于执行如权利要求1-15中任一项所述的方法,所述装置包括:
获取模块,用于获取交易样本集,所述交易样本集包括携带样本标签的多个交易样本,所述样本标签用于指示所述交易样本的异常情况;
特征模块,用于根据所述交易样本集构造人工特征以及提取深度特征,得到所述交易样本集的人工特征和深度特征,形成训练样本集;
训练模块,用于构建待训练模型,所述待训练模型至少包含待训练的特征重建网络和分类网络,基于所述训练样本集对所述待训练模型迭代地执行端到端的训练,以得到交易检测模型。
22.一种交易检测装置,其特征在于,被配置为用于执行如权利要求16-20中任一项所述的方法,所述装置包括:
接收模块,用于接收待检测交易的原始交易数据,基于所述原始交易数据构造人工特征以及提取深度特征;
检测模块,用于将所述人工特征和所述深度特征输入经训练的交易检测模型,得到所述待检测交易的检测结果,其中,所述交易检测模型利用如权利要求1-15中任一项所述的方法训练得到。
23.一种交易检测模型的训练装置,其特征在于,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如权利要求1-15中任一项所述的方法。
24.一种交易检测装置,其特征在于,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如权利要求16-20中任一项所述的方法。
25.一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被多核处理器执行时,使得所述多核处理器执行:如权利要求1-15中任一项所述的方法,和/或如权利要求16-20中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110334121.XA CN113011979B (zh) | 2021-03-29 | 2021-03-29 | 交易检测方法、模型的训练方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110334121.XA CN113011979B (zh) | 2021-03-29 | 2021-03-29 | 交易检测方法、模型的训练方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113011979A true CN113011979A (zh) | 2021-06-22 |
CN113011979B CN113011979B (zh) | 2024-10-15 |
Family
ID=76408797
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110334121.XA Active CN113011979B (zh) | 2021-03-29 | 2021-03-29 | 交易检测方法、模型的训练方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011979B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554099A (zh) * | 2021-07-27 | 2021-10-26 | 中国银联股份有限公司 | 一种识别异常商户的方法及装置 |
CN114445210A (zh) * | 2021-10-14 | 2022-05-06 | 中国工商银行股份有限公司 | 异常交易行为的检测方法及其检测装置、电子设备 |
CN116664292A (zh) * | 2023-04-13 | 2023-08-29 | 连连银通电子支付有限公司 | 一种交易异常预测模型的训练方法和交易异常预测方法 |
WO2024016303A1 (zh) * | 2022-07-22 | 2024-01-25 | 京东方科技集团股份有限公司 | 分类模型的训练方法、分类方法、装置、电子设备及介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921566A (zh) * | 2018-05-03 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 一种基于图结构模型的虚假交易识别方法和装置 |
CN109063977A (zh) * | 2018-07-12 | 2018-12-21 | 中国银联股份有限公司 | 一种无感式交易风险监测方法及装置 |
CN109753608A (zh) * | 2019-01-11 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 确定用户标签的方法、自编码网络的训练方法及装置 |
CN109934706A (zh) * | 2017-12-15 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 一种基于图结构模型的交易风险控制方法、装置以及设备 |
CN110020662A (zh) * | 2019-01-09 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 用户分类模型的训练方法和装置 |
US20190236609A1 (en) * | 2018-01-26 | 2019-08-01 | Alibaba Group Holding Limited | Fraudulent transaction detection model training |
US20190303728A1 (en) * | 2018-03-27 | 2019-10-03 | Alibaba Group Holding Limited | Risky transaction identification method and apparatus |
CN111127493A (zh) * | 2019-11-12 | 2020-05-08 | 中国矿业大学 | 基于注意力多尺度特征融合的遥感图像语义分割方法 |
CN111144499A (zh) * | 2019-12-27 | 2020-05-12 | 北京工业大学 | 基于深度神经网络的风机叶片早期结冰故障检测方法 |
CN111275098A (zh) * | 2020-01-17 | 2020-06-12 | 同济大学 | 应用于信用卡欺诈检测的Encoder-LSTM深度学习模型及其方法 |
US20200204577A1 (en) * | 2017-12-15 | 2020-06-25 | Alibaba Group Holding Limited | Graphical structure model-based prevention and control of abnormal accounts |
CN111340113A (zh) * | 2020-02-26 | 2020-06-26 | 常州工学院 | 一种基于异构特征统一深度神经网络的中国水墨画识别方法 |
CN111861756A (zh) * | 2020-08-05 | 2020-10-30 | 哈尔滨工业大学(威海) | 一种基于金融交易网络的团伙检测方法及其实现装置 |
US20210049511A1 (en) * | 2018-08-14 | 2021-02-18 | Advanced New Technologies Co., Ltd. | Classification model generation method and apparatus, and data identification method and apparatus |
WO2021031825A1 (zh) * | 2019-08-22 | 2021-02-25 | 深圳壹账通智能科技有限公司 | 网络欺诈识别方法、装置、计算机装置及存储介质 |
-
2021
- 2021-03-29 CN CN202110334121.XA patent/CN113011979B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934706A (zh) * | 2017-12-15 | 2019-06-25 | 阿里巴巴集团控股有限公司 | 一种基于图结构模型的交易风险控制方法、装置以及设备 |
US20200204577A1 (en) * | 2017-12-15 | 2020-06-25 | Alibaba Group Holding Limited | Graphical structure model-based prevention and control of abnormal accounts |
US20190236609A1 (en) * | 2018-01-26 | 2019-08-01 | Alibaba Group Holding Limited | Fraudulent transaction detection model training |
US20190303728A1 (en) * | 2018-03-27 | 2019-10-03 | Alibaba Group Holding Limited | Risky transaction identification method and apparatus |
CN108921566A (zh) * | 2018-05-03 | 2018-11-30 | 阿里巴巴集团控股有限公司 | 一种基于图结构模型的虚假交易识别方法和装置 |
CN109063977A (zh) * | 2018-07-12 | 2018-12-21 | 中国银联股份有限公司 | 一种无感式交易风险监测方法及装置 |
US20210049511A1 (en) * | 2018-08-14 | 2021-02-18 | Advanced New Technologies Co., Ltd. | Classification model generation method and apparatus, and data identification method and apparatus |
CN110020662A (zh) * | 2019-01-09 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 用户分类模型的训练方法和装置 |
CN109753608A (zh) * | 2019-01-11 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 确定用户标签的方法、自编码网络的训练方法及装置 |
WO2021031825A1 (zh) * | 2019-08-22 | 2021-02-25 | 深圳壹账通智能科技有限公司 | 网络欺诈识别方法、装置、计算机装置及存储介质 |
CN111127493A (zh) * | 2019-11-12 | 2020-05-08 | 中国矿业大学 | 基于注意力多尺度特征融合的遥感图像语义分割方法 |
CN111144499A (zh) * | 2019-12-27 | 2020-05-12 | 北京工业大学 | 基于深度神经网络的风机叶片早期结冰故障检测方法 |
CN111275098A (zh) * | 2020-01-17 | 2020-06-12 | 同济大学 | 应用于信用卡欺诈检测的Encoder-LSTM深度学习模型及其方法 |
CN111340113A (zh) * | 2020-02-26 | 2020-06-26 | 常州工学院 | 一种基于异构特征统一深度神经网络的中国水墨画识别方法 |
CN111861756A (zh) * | 2020-08-05 | 2020-10-30 | 哈尔滨工业大学(威海) | 一种基于金融交易网络的团伙检测方法及其实现装置 |
Non-Patent Citations (2)
Title |
---|
窦路路;石秀金;: "基于深度学习的银行卡交易反欺诈技术研究", 智能计算机与应用, no. 04, pages 90 - 92 * |
陈飞;杨波;: "基于机器学习的互联网金融机构信用风险识别", 金融科技时代, no. 01, 10 January 2020 (2020-01-10), pages 44 - 50 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554099A (zh) * | 2021-07-27 | 2021-10-26 | 中国银联股份有限公司 | 一种识别异常商户的方法及装置 |
CN114445210A (zh) * | 2021-10-14 | 2022-05-06 | 中国工商银行股份有限公司 | 异常交易行为的检测方法及其检测装置、电子设备 |
WO2024016303A1 (zh) * | 2022-07-22 | 2024-01-25 | 京东方科技集团股份有限公司 | 分类模型的训练方法、分类方法、装置、电子设备及介质 |
CN116664292A (zh) * | 2023-04-13 | 2023-08-29 | 连连银通电子支付有限公司 | 一种交易异常预测模型的训练方法和交易异常预测方法 |
CN116664292B (zh) * | 2023-04-13 | 2024-05-28 | 连连银通电子支付有限公司 | 一种交易异常预测模型的训练方法和交易异常预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113011979B (zh) | 2024-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113011979A (zh) | 交易检测方法、模型的训练方法、装置及计算机可读存储介质 | |
Ha et al. | Improving credit risk prediction in online peer-to-peer (P2P) lending using feature selection with deep learning | |
Kia et al. | A hybrid supervised semi-supervised graph-based model to predict one-day ahead movement of global stock markets and commodity prices | |
US20210303970A1 (en) | Processing data using multiple neural networks | |
WO2023093205A1 (zh) | 一种实体标签关联预测方法、装置及计算机可读存储介质 | |
JP2023500222A (ja) | 系列マイニングモデルの訓練方法、系列データの処理方法、系列マイニングモデルの訓練装置、系列データの処理装置、コンピュータ機器、及びコンピュータプログラム | |
US11593622B1 (en) | Artificial intelligence system employing graph convolutional networks for analyzing multi-entity-type multi-relational data | |
CN112214652B (zh) | 一种报文生成方法、装置及设备 | |
CN112819604A (zh) | 基于融合神经网络特征挖掘的个人信用评估方法与系统 | |
CN113362157A (zh) | 异常节点识别方法、模型的训练方法、装置及存储介质 | |
CN110110372B (zh) | 一种用户时序行为自动切分预测方法 | |
Sawhney et al. | Cryptocurrency bubble detection: a new stock market dataset, financial task & hyperbolic models | |
CN116485406A (zh) | 账户的检测方法及装置、存储介质和电子设备 | |
Wang et al. | Essential tensor learning for multimodal information-driven stock movement prediction | |
CN112041880A (zh) | 用于评估信用风险的深度学习方法 | |
CN117217807B (zh) | 一种基于多模态高维特征的不良资产估值方法 | |
CN116800831B (zh) | 一种业务数据推送方法、装置、存储介质及处理器 | |
Girsang | Cryptocurrency Price Prediction Based Social Network Sentiment Analysis Using LSTM-GRU and FinBERT | |
CN113705662B (zh) | 一种协同训练方法、装置及计算机可读存储介质 | |
Kumar et al. | Stocks Analysis and Prediction of Indian Oil Trading Using Big Data Analytics | |
CN111401641A (zh) | 业务数据处理方法、装置及电子设备 | |
Acheampong et al. | Data Centric Blockchain Based Evaluation Approach to Analyze E-Commerce Reviews Using Machine and Deep Learning Techniques | |
Xie et al. | Semi-supervised Learning Enabled Fault Analysis Method for Power Distribution Network Based on LSTM Autoencoder and Attention Mechanism | |
Antony et al. | Predicting of Credit Risk Using Machine Learning Algorithms | |
Etukuru | Forecasting the Stock Prices Using Machine Learning, Deep Learning, and Reinforcement Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |