CN111340506A - 交易行为的风险识别方法、装置、存储介质和计算机设备 - Google Patents
交易行为的风险识别方法、装置、存储介质和计算机设备 Download PDFInfo
- Publication number
- CN111340506A CN111340506A CN202010439808.5A CN202010439808A CN111340506A CN 111340506 A CN111340506 A CN 111340506A CN 202010439808 A CN202010439808 A CN 202010439808A CN 111340506 A CN111340506 A CN 111340506A
- Authority
- CN
- China
- Prior art keywords
- transaction behavior
- transaction
- vectors
- behavior data
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000006399 behavior Effects 0.000 claims abstract description 360
- 238000013145 classification model Methods 0.000 claims abstract description 26
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 239000013598 vector Substances 0.000 claims description 165
- 230000006870 function Effects 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 26
- 238000003062 neural network model Methods 0.000 claims description 24
- 230000004913 activation Effects 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 9
- 230000000306 recurrent effect Effects 0.000 claims description 5
- 230000001537 neural effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 208000001613 Gambling Diseases 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004900 laundering Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供了一种交易行为的风险识别方法、装置、存储介质和计算机设备。该方法包括:获取用户账户的多个交易行为数据;对所述多个交易行为数据进行预处理,生成多个交易行为序列;根据所述多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签;根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果。
Description
技术领域
本说明书实施例涉及互联网技术领域,特别涉及一种交易行为的风险识别方法、装置、存储介质和计算机设备。
背景技术
在网络支付场景中,支付机构应当具备必要的技术手段,确保支付业务的及时性、准确性和安全性,因此,支付机构需要设计合理的风控规则以实现对支付业务的风险识别。
在对交易行为进行风险识别的过程中,可疑交易行为的监控是反洗钱系统中的重要一环。当前的可疑交易行为检测主要是基于90天的交易相关统计特征和规则命中特征,用树模型进行分类检测。这就要求对每一种类的罪行单独设计一套人工特征并且单独训练一个树模型。而后,运营人员会对通过树模型进行分类的90天的交易数据进行人工审核,定位出具体的可疑交易行为,以帮助运营取证。
发明内容
有鉴于此,本说明书实施例提供了一种交易行为的风险识别方法、装置、存储介质和计算机设备,用于提高可疑交易行为识别的准确性和效率。
一方面,本说明书实施例提供了一种交易行为的风险识别方法,包括:
获取用户账户的多个交易行为数据;
对所述多个交易行为数据进行预处理,生成多个交易行为序列;
根据所述多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签;
根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果。
可选地,所述对所述多个交易行为数据进行预处理,包括:
若所述交易行为数据包括枚举型属性数据,对所述交易行为数据进行独热编码处理;或者,
若所述交易行为数据包括连续型数值数据,对所述交易行为数据进行归一化处理或者分箱处理。
可选地,所述根据所述多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签,包括:
将所述多个交易行为序列与预先学习的多个嵌入向量相乘,生成多个交易行为输入向量;
将所述多个交易行为输入向量输入神经网络模型,输出多个隐向量;
将所述多个隐向量输入注意力模型,输出交易行为输出向量;
通过第一激活函数对所述交易行为输出向量进行文本分类,生成所述交易行为分类标签。
可选地,所述神经网络模型包括双向门控循环神经网络模型或者双向长短时记忆神经模型。
可选地,所述将所述隐向量输入注意力模型,输出交易行为输出向量包括:
通过第二激活函数对所述多个隐向量进行计算,生成多个映射向量;
根据所述多个映射向量和注意力向量,生成所述多个隐向量对应的注意力权重;
根据所述多个隐向量和对应的注意力权重,生成所述交易行为输出向量。
可选地,所述根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果,包括:
若所述交易行为分类标签包括可疑交易时,从多个所述注意力权重中查询出大于设定阈值的注意力权重;
查询出大于设定阈值的注意力权重对应的隐向量;
将查询出的隐向量对应的交易行为数据的风险识别结果确定为可疑交易行为。
可选地,所述根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果,包括:
若所述交易行为分类标签包括非可疑交易时,将所述多个交易行为数据的风险识别结果确定为非可疑交易行为。
可选地,所述多个交易行为数据包括用户账户、交易账户、支付时间、支付金额、支付方式、支付创建渠道、国家IP地址、省市IP地址、收付方向和币种。
可选地,所述用户账户包括付款方账户,所述交易账户包括收款方账户,收付方向包括付款;或者,
所述用户账户包括收款方账户,所述交易账户包括付款方账户,收付方向包括收款。
可选地,所述多个交易行为数据还包括用户账户的性别、年龄、职业、收入和财产状况中之一或其任意组合。
另一方面,本说明书实施例提供了一种交易行为的风险识别装置,包括:
获取模块,用于获取用户账户的多个交易行为数据;
预处理模块,用于对所述多个交易行为数据进行预处理,生成多个交易行为序列;
确定模块,用于根据所述多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签;
生成模块,用于根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果。
可选地,所述预处理模块具体用于若所述交易行为数据包括枚举型属性数据,对所述交易行为数据进行独热编码处理;或者,若所述交易行为数据包括连续型数值数据,对所述交易行为数据进行归一化处理或者分箱处理。
可选地,所述确定模块包括:
第一计算模块,用于将所述多个交易行为序列与预先学习的多个嵌入向量相乘,生成多个交易行为输入向量;
第二计算模块,用于将所述多个交易行为输入向量输入神经网络模型,输出多个隐向量;
第三计算模块,用于将所述多个隐向量输入注意力模型,输出交易行为输出向量;
第四计算模块,用于通过第一激活函数对所述交易行为输出向量进行文本分类,生成所述交易行为分类标签。
可选地,所述第三计算模块具体用于通过第二激活函数对所述多个隐向量进行计算,生成多个映射向量;根据所述多个映射向量和注意力向量,生成所述多个隐向量对应的注意力权重;根据所述多个隐向量和对应的注意力权重,生成所述交易行为输出向量。
可选地,所述生成模块具体用于若所述交易行为分类标签包括可疑交易时,从多个所述注意力权重中查询出大于设定阈值的注意力权重;查询出大于设定阈值的注意力权重对应的隐向量;将查询出的隐向量对应的交易行为数据的风险识别结果确定为可疑交易行为。
可选地,所述生成模块具体用于若所述交易行为分类标签包括非可疑交易时,将所述多个交易行为数据的风险识别结果确定为非可疑交易行为。
另一方面,本说明书提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述交易行为的风险识别方法的步骤。
另一方面,本说明书提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行时实现上述交易行为的风险识别方法的步骤。
本说明书实施例的方案中,对获取的用户账户的多个交易行为数据进行预处理以生成多个交易行为序列,利用行为序列分类模型确定出交易行为分类标签,并根据交易行为分类标签确定出多个交易行为数据的风险识别结果,提高了可疑交易行为识别的准确性和效率。
附图说明
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书一实施例提供的一种交易行为的风险识别方法的流程图;
图2为本说明书实施例中行为序列分类模型的示意图;
图3为本说明书实施例中通过行为序列分类模型确定交易行为分类标签的流程图;
图4为本说明书实施例中及交易行为数据与注意力权重的示意图;
图5为本说明书一实施例提供的一种交易行为的风险识别装置的结构示意图;
图6是本说明书一实施例提供的一种计算机设备的示意图。
具体实施方式
为了更好的理解本说明书的技术方案,下面结合附图对本说明书实施例进行详细描述。
应当明确,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本说明书保护的范围。
在本说明书实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,甲和/或乙,可以表示:单独存在甲,同时存在甲和乙,单独存在乙这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
相关技术中,人工审核需要大量的时间和人力手动查阅过去90天的交易数据,容易造成可疑交易行为的错判漏判,从而降低了可疑交易行为识别的准确性和效率。
为解决上述技术问题,本说明书实施例中,对获取的用户账户的多个交易行为数据进行预处理以生成多个交易行为序列,利用行为序列分类模型确定出交易行为分类标签,并根据交易行为分类标签确定出多个交易行为数据的风险识别结果,相比于相关技术中通过人工审核的方式得出交易行为数据的风险识别结果的方案,本说明书实施例提高了可疑交易行为识别的准确性和效率。
图1为本说明书一实施例提供的一种交易行为的风险识别方法的流程图,如图1所示,该方法包括:
步骤102、获取用户账户的多个交易行为数据。
本说明书实施例中的各步骤可由具有数据计算和处理能力的装置、平台或设备执行。
本说明书实施例中,用户账户与交易账户之间每发生一次交易行为,即可生成一笔交易行为数据,例如:该交易行为数据可包括用户账户、交易账户、支付时间、支付金额、支付方式、支付创建渠道、国家IP地址、省市IP地址、收付方向和币种。
作为一种可选方案,交易行为数据还包括用户账户的属性信息,例如:用户账户的属性信息包括用户账户的性别、年龄、职业、收入和财产状况中之一或其任意组合。
其中,用户账户包括付款方账户,交易账户包括收款方账户,收付方向包括付款;用户账户包括收款方账户,交易账户包括付款方账户,收付方向包括收款。
例如:支付方式可包括账户余额支付、信用卡支付、储蓄卡支付、余额宝支付或者蚂蚁花呗支付。
例如:支付创建渠道可包括转账或者红包。
步骤104、对多个交易行为数据进行预处理,生成多个交易行为序列。
本说明书实施例中,在利用行为序列分类模型对交易行为进行分类之前,需要对交易行为数据进行预处理,将交易行为数据处理成能够被行为序列分类模型接收并处理的序列向量形式。
作为一种可选方案,若交易行为数据包括枚举型属性数据,则对交易行为数据进行独热编码(one hot)处理,生成交易行为序列。例如:收付方向包括枚举型属性数据,则对收付方向进行独热编码处理,得到收付方向的交易行为序列。若收付方向包括付款,则收付方向的交易行为序列包括(1,0);若收付方向包括收款,则收付方向的交易行为序列包括(0,1)。
作为另一种可选方案,若所述交易行为数据包括连续型数值数据,则对交易行为数据进行归一化处理或者分箱处理,生成交易行为序列。例如:交易金额包括连续型数值数据,则对交易金额进行归一化处理或者分箱处理,生成交易金额的交易行为序列。归一化处理是直接交易金额压缩到(0,1)区间内。分箱处理具体可包括:将交易金额分为多个箱,例如5个箱,分箱的原则可以是按所有用户账户的交易金额从高到低排序,每隔20%分一个箱;若某用户账户的交易金额排在第35%这一个箱中,那么该交易金额就属于第2个箱,则这个用户账户的交易金额可设置为(0,1,0,0,0)。
步骤106、根据多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签。
本说明书实施例中,将多个交易行为序列输入行为序列分类模型,输出多个交易行为序列的交易行为分类标签。交易行为分类标签包括可疑交易或者非可疑交易。
步骤108、根据交易行为分类标签,生成多个交易行为数据的风险识别结果。
本说明书实施例中,风险识别结果包括可交易行为或者非可疑交易行为。
本说明书实施例中,对获取的用户账户的多个交易行为数据进行预处理以生成多个交易行为序列,利用行为序列分类模型确定出交易行为分类标签,并根据交易行为分类标签确定出多个交易行为数据的风险识别结果,提高了可疑交易行为识别的准确性和效率。
图2为本说明书实施例中行为序列分类模型的示意图,如图2所示,行为序列分类模型包括嵌入层、循环网络层、注意力层和全联接层。
在嵌入层中可将多个交易行为序列与预先学习的多个嵌入向量相乘生成多个交易行为输入向量,其中,交易行为序列为稀疏(sparse)特征序列,将交易行为序列与嵌入向量相乘,可实现对交易行为序列进行降维处理。
在循环网络层中设置神经网络模型,本说明书实施例中可将所述多个交易行为输入向量输入神经网络模型,输出多个隐向量。神经网络模型可包括门控循环(GatedRecurrent Unit,简称GRU)神经网络模型。作为一种可选方案,神经网络模型可包括双向门控循环(bidirectional GRU,简称BiGRU)神经网络模型。循环神经网络是单向的,即当前序列的引向量仅和向量本身以及之前的序列有关。但是,本说明书实施例的交易行为序列中,当前交易行为是否可疑不仅仅与前面的交易行为序列有关,还与后面的交易行为序列有关,因此本说明书实施例中的神经网络模型采用BiGRU神经网络模型。BiGRU神经网络模型是由一个正向GRU层和一个反向GRU层上下叠加在一起组成的,BiGRU神经网络模型输出的隐向量hi由正向GRU层输出的状态向量hi forward和反向GRU层输出的状态向量hi reverse 纵向连接形成。作为另一种可选方案,神经网络模型还可包括双向长短时记忆神经(biLSTM)模型。作为另一种可选方案,神经网络模型还可包括Transformer encoder模型。
在注意力层中设置注意力模型,本说明书实施例中可将多个隐向量输入注意力模型,输出交易行为输出向量。通过注意力机制构建的注意力模型是为了让神经网络分类器把更多的权重分配给更重要的信息,其最早是在视觉图像领域提出,后被广泛运用于自然语言处理的机器翻译领域,取得了很好的效果。本说明书实施例中,通过注意力模型,可为循环网络层输出的不同的隐向量分配不同的注意力权重。
在全联接层中设置第一激活函数,本说明书实施例中可通过第一激活函数对交易行为输出向量进行文本分类,生成交易行为分类标签。例如:第一激活函数包括softmax函数。
本说明书实施例中,可通过历史交易行为数据对预先构建的行为序列分类模型进行训练,得到训练好的行为序列分类模型。而后,将多个交易行为序列输入行为序列分类模型,输出交易行为分类标签。进而,再根据交易行为分类标签得出多个交易行为数据的风险识别结果。下面对行为序列分类模型的训练过程进行详细描述。如图2所示,例如:序列分类模型可采用如下步骤进行训练:将用户账户的多个历史交易行为数据进行预处理生成多个历史交易行为序列;将多个历史交易行为序列与预先学习的多个嵌入向量相乘,生成多个交易行为输入向量;将多个交易行为输入向量输入神经网络模型,输出多个隐向量;将多个隐向量输入注意力模型,输出交易行为输出向量;通过第一激活函数对交易行为输出向量进行文本分类,生成交易行为分类标签;通过反向传播,在损失函数的损失减小的方向,调整模型中的参数,直至达到收敛条件,其中,损失函数可根据交易行为分类标签确定。作为一种可选方案,损失函数可包括分类损失函数,例如:交叉熵损失函数。
图3为本说明书实施例中通过行为序列分类模型确定交易行为分类标签的流程图,如图2和图3所示,步骤106具体可包括:
步骤1062、将多个交易行为序列与预先学习的多个嵌入向量相乘,生成多个交易行为输入向量。
如图3所示,在嵌入层中,多个交易行为序列包括(S1,S2,S3,……,St),多个嵌入向量包括(W1,W2,W3,……,Wt)。
图3中的S1,S2,S3,……,St中空心圆可代表0,则交易行为序列为稀疏特征序列,本步骤将多个交易行为序列与多个嵌入向量相乘,即可实现将稀疏特征序列转换为稠密向量,得到的交易行为输入向量为稠密向量,从而实现对交易行为序列进行降维处理。
本步骤具体可包括:将多个交易行为序列形成的矩阵与多个嵌入向量形成的矩阵相乘,得到多个交易行为输入向量。其中,多个交易行为序列形成的矩阵为稀疏矩阵,多个交易行为输入向量形成的矩阵为稠密矩阵。
步骤1064、将多个交易行为输入向量输入神经网络模型,输出多个隐向量。
如图3所示,将多个交易行为输入向量输入循环网络层中的BiGRU神经网络模型,输出多个隐向量(h1,h2,h3,……,ht)。
步骤1066、将多个隐向量输入注意力模型,输出交易行为输出向量。
如图3所示,将循环网络层输出的多个隐向量(h1,h2,h3,……,ht)输入注意力模型以输出交易行为输出向量。
具体地,本步骤可包括:
步骤1066a、通过第二激活函数对多个隐向量进行计算,生成多个映射向量。
作为一种可选方案,第二激活函数可包括tanh函数。
步骤1066b、根据多个映射向量和注意力向量,生成多个隐向量对应的注意力权重。
步骤1066c、根据所述多个隐向量和对应的注意力权重,生成所述交易行为输出向量。
具体地,可将多个隐向量和对应的注意力权重相乘得到多个相乘结果,并将多个相乘结果相加得到交易行为输出向量。
步骤1068、通过第一激活函数对交易行为输出向量进行文本分类,生成交易行为分类标签。
作为一种可选方案,第一激活函数可包括softmax函数。
如图3所示,在全联接层中,通过softmax函数对交易行为输出向量v进行文本分类,生成多个交易行为序列的交易行为分类标签。图3中全联接层中的空心圆可表示非可疑交易行为,实心圆可表示可疑交易行为。
本说明书实施例中,若交易行为分类标签包括可疑交易时,表明识别出多个交易行为数据的交易行为分类标签包括可疑交易。则步骤108具体可包括:
步骤1082、从多个注意力权重中查询出大于设定阈值的注意力权重。
图4为本说明书实施例中及交易行为数据与注意力权重的示意图,图4中示出了多个正常交易行为数据的注意力权重和多个赌博交易行为数据的注意力权重,多个赌博交易行为数据中存在一笔赌博交易行为数据对应的注意力权重较大。如图4所示,例如:设定阈值为0.2,则查询出的大于0.2的注意力权重为第300笔交易行为数据对应的注意力权重,该第300笔交易行为数据为赌博交易行为数据中的第300笔赌博交易行为数据。
步骤1084、查询出大于设定阈值的注意力权重对应的隐向量。
步骤1086、将查询出的隐向量对应的交易行为数据的风险识别结果确定为可疑交易行为。
本说明书实施例中,由于隐向量对应于交易行为输入向量,交易行为输入向量对应于交易行为序列,交易行为序列对应于交易行为数据,因此,隐向量对应于交易行为数据。
如图4所示,查询出的隐向量对应的交易行为数据为第300笔交易行为数据,则将多个交易行为数据中第300笔交易行为数据的风险识别结果确定为可疑交易行为。
而将多个交易行为数据中其余的交易行为数据的风险识别结果,确定为非可疑交易行为,其中,其余的交易行为数据包括多个交易行为数据中查询出的隐向量对应的交易行为数据之外的交易行为数据。如图4所示,500笔交易行为数据中第300笔交易行为数据之外的其余交易行为数据的风险识别结果均为非可疑交易行为。
本说明书实施例中,若所述交易行为分类标签包括非可疑交易时,表明识别出多个交易行为数据的交易行为分类标签包括非可疑交易。则步骤108具体可包括:将多个交易行为数据的风险识别结果确定为非可疑交易行为。此时,将多个交易行为数据中所有的交易行为数据的风险识别结果均确定为非可疑交易行为。例如:图4中的正常交易曲线所表示的500笔交易行为数据的风险识别结果均为非可疑交易行为。
本说明书实施例的技术方案中,通过双向门控循环神经网络模型、注意力模型以及softmax函数对多个交易行为序列进行分类,利用注意力权重从交易行为分类标签为可疑交易的多个交易行为数据中定位出可疑的交易行为数据,从而进一步提高了可疑交易行为识别的准确性和效率。
本说明书实施例提供的方案在保证模型精度的基础上,向运营人员提供多个交易行为数据中每笔交易行为数据的注意力权重,使得运营人员通过直接查看注意力权重而获得高危的可疑交易并取证,大大减轻了运营人工的审核负担。
本说明书实施例提供的方案中,通过多个交易行为数据进行风险识别,避免了仅通过单笔交行为数据进行风险识别造成的漏判误判问题,从而进一步提高了可疑交易行为识别的准确性。本说明书实施例中,交易行为数据中还包括了用户账户的性别、年龄、职业、收入和财产状况,使得风险识别的过程考虑了交易行为发生的背景信息,从而进一步提高了可疑交易行为识别的准确性。
图5为本说明书一实施例提供的一种交易行为的风险识别装置的结构示意图,如图5所示,该装置包括:获取模块11、预处理模块12、确定模块13和生成模块14。
获取模块11用于获取用户账户的多个交易行为数据。
预处理模块12用于对所述多个交易行为数据进行预处理,生成多个交易行为序列。
确定模块13用于根据所述多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签。
生成模块14用于根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果。
本说明书实施例中,预处理模块12具体用于若所述交易行为数据包括枚举型属性数据,对所述交易行为数据进行独热编码处理;或者,若所述交易行为数据包括连续型数值数据,对所述交易行为数据进行归一化处理或者分箱处理。
本说明书实施例中,确定模块13包括:第一计算模块131、第二计算模块132、第三计算模块133和第四计算模块134。
第一计算模块131用于将所述多个交易行为序列与预先学习的多个嵌入向量相乘,生成多个交易行为输入向量。
第二计算模块132用于将所述多个交易行为输入向量输入神经网络模型,输出多个隐向量。
第三计算模块133用于将所述多个隐向量输入注意力模型,输出交易行为输出向量。
第四计算模块134用于通过第一激活函数对所述交易行为输出向量进行文本分类,生成所述交易行为分类标签。
本说明书实施例中,第三计算模块133具体用于通过第二激活函数对所述多个隐向量进行计算,生成多个映射向量;根据所述多个映射向量和注意力向量,生成所述多个隐向量对应的注意力权重;根据所述多个隐向量和对应的注意力权重,生成所述交易行为输出向量。
本说明书实施例中,生成模块14具体用于若所述交易行为分类标签包括可疑交易时,从多个所述注意力权重中查询出大于设定阈值的注意力权重;查询出大于设定阈值的注意力权重对应的隐向量;将查询出的隐向量对应的交易行为数据的风险识别结果确定为可疑交易行为。
本说明书实施例中,生成模块14具体用于若所述交易行为分类标签包括非可疑交易时,将所述多个交易行为数据的风险识别结果确定为非可疑交易行为。
本说明书实施例中,对获取的用户账户的多个交易行为数据进行预处理以生成多个交易行为序列,利用行为序列分类模型确定出交易行为分类标签,并根据交易行为分类标签确定出多个交易行为数据的风险识别结果,提高了可疑交易行为识别的准确性和效率。
本说明书实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述交易行为的风险识别方法的实施例的各步骤,具体描述可参见上述交易行为的风险识别方法的实施例。
本说明书实施例提供了一种计算机设备,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现上述交易行为的风险识别方法的实施例的各步骤,具体描述可参见上述交易行为的风险识别方法的实施例。
图6是本说明书一实施例提供的一种计算机设备的示意图,如图6所示,该实施例的计算机设备24包括:处理器21、存储器22以及存储在存储22中并可在处理器21上运行的计算机程序23,该计算机程序23被处理器21执行时实现实施例中的应用于交易行为的风险识别方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器21执行时实现实施例中应用于交易行为的风险识别装置中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备24可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。服务器24可包括,但不仅限于,处理器21、存储器22。本领域技术人员可以理解,图6仅仅是计算机设备24的示例,并不构成对计算机设备24的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备24还可以包括输入输出设备、网络接入设备、总线等。
所称处理器21可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器22可以是计算机设备24的内部存储单元,例如计算机设备24的硬盘或内存。存储器22也可以是计算机设备24的外部存储设备,例如计算机设备24上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器22还可以既包括计算机设备24的内部存储单元也包括外部存储设备。存储器22用于存储计算机程序以及计算机设备24所需的其他程序和数据。存储器22还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本说明书所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本说明书各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本说明书各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。
Claims (18)
1.一种交易行为的风险识别方法,包括:
获取用户账户的多个交易行为数据;
对所述多个交易行为数据进行预处理,生成多个交易行为序列;
根据所述多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签;
根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果。
2.根据权利要求1所述的方法,其中,所述对所述多个交易行为数据进行预处理,包括:
若所述交易行为数据包括枚举型属性数据,对所述交易行为数据进行独热编码处理;或者,
若所述交易行为数据包括连续型数值数据,对所述交易行为数据进行归一化处理或者分箱处理。
3.根据权利要求1所述的方法,其中,所述根据所述多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签,包括:
将所述多个交易行为序列与预先学习的多个嵌入向量相乘,生成多个交易行为输入向量;
将所述多个交易行为输入向量输入神经网络模型,输出多个隐向量;
将所述多个隐向量输入注意力模型,输出交易行为输出向量;
通过第一激活函数对所述交易行为输出向量进行文本分类,生成所述交易行为分类标签。
4.根据权利要求3所述的方法,其中,所述神经网络模型包括双向门控循环神经网络模型或者双向长短时记忆神经模型。
5.根据权利要求3所述的方法,其中,所述将所述隐向量输入注意力模型,输出交易行为输出向量包括:
通过第二激活函数对所述多个隐向量进行计算,生成多个映射向量;
根据所述多个映射向量和注意力向量,生成所述多个隐向量对应的注意力权重;
根据所述多个隐向量和对应的注意力权重,生成所述交易行为输出向量。
6.根据权利要求5所述的方法,其中,所述根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果,包括:
若所述交易行为分类标签包括可疑交易时,从多个所述注意力权重中查询出大于设定阈值的注意力权重;
查询出大于设定阈值的注意力权重对应的隐向量;
将查询出的隐向量对应的交易行为数据的风险识别结果确定为可疑交易行为。
7.根据权利要求1所述的方法,其中,所述根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果,包括:
若所述交易行为分类标签包括非可疑交易时,将所述多个交易行为数据的风险识别结果确定为非可疑交易行为。
8.根据权利要求1至7任一所述的方法,其中,所述多个交易行为数据包括用户账户、交易账户、支付时间、支付金额、支付方式、支付创建渠道、国家IP地址、省市IP地址、收付方向和币种。
9.根据权利要求8所述的方法,其中,所述用户账户包括付款方账户,所述交易账户包括收款方账户,收付方向包括付款;或者,
所述用户账户包括收款方账户,所述交易账户包括付款方账户,收付方向包括收款。
10.根据权利要求8所述的方法,其中,所述多个交易行为数据还包括用户账户的性别、年龄、职业、收入和财产状况中之一或其任意组合。
11.一种交易行为的风险识别装置,包括:
获取模块,用于获取用户账户的多个交易行为数据;
预处理模块,用于对所述多个交易行为数据进行预处理,生成多个交易行为序列;
确定模块,用于根据所述多个交易行为序列,利用行为序列分类模型,确定出交易行为分类标签;
生成模块,用于根据所述交易行为分类标签,生成所述多个交易行为数据的风险识别结果。
12.根据权利要求11所述的装置,其中,所述预处理模块具体用于若所述交易行为数据包括枚举型属性数据,对所述交易行为数据进行独热编码处理;或者,若所述交易行为数据包括连续型数值数据,对所述交易行为数据进行归一化处理或者分箱处理。
13.根据权利要求11所述的装置,其中,所述确定模块包括:
第一计算模块,用于将所述多个交易行为序列与预先学习的多个嵌入向量相乘,生成多个交易行为输入向量;
第二计算模块,用于将所述多个交易行为输入向量输入神经网络模型,输出多个隐向量;
第三计算模块,用于将所述多个隐向量输入注意力模型,输出交易行为输出向量;
第四计算模块,用于通过第一激活函数对所述交易行为输出向量进行文本分类,生成所述交易行为分类标签。
14.根据权利要求11所述的装置,其中,所述第三计算模块具体用于通过第二激活函数对所述多个隐向量进行计算,生成多个映射向量;根据所述多个映射向量和注意力向量,生成所述多个隐向量对应的注意力权重;根据所述多个隐向量和对应的注意力权重,生成所述交易行为输出向量。
15.根据权利要求14所述的装置,其中,所述生成模块具体用于若所述交易行为分类标签包括可疑交易时,从多个所述注意力权重中查询出大于设定阈值的注意力权重;查询出大于设定阈值的注意力权重对应的隐向量;将查询出的隐向量对应的交易行为数据的风险识别结果确定为可疑交易行为。
16.根据权利要求11所述的装置,其中,所述生成模块具体用于若所述交易行为分类标签包括非可疑交易时,将所述多个交易行为数据的风险识别结果确定为非可疑交易行为。
17.一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至10中任意一项所述的交易行为的风险识别方法的步骤。
18.一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行时实现权利要求1至10任意一项所述的交易行为的风险识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010439808.5A CN111340506A (zh) | 2020-05-22 | 2020-05-22 | 交易行为的风险识别方法、装置、存储介质和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010439808.5A CN111340506A (zh) | 2020-05-22 | 2020-05-22 | 交易行为的风险识别方法、装置、存储介质和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111340506A true CN111340506A (zh) | 2020-06-26 |
Family
ID=71183015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010439808.5A Pending CN111340506A (zh) | 2020-05-22 | 2020-05-22 | 交易行为的风险识别方法、装置、存储介质和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111340506A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915437A (zh) * | 2020-06-30 | 2020-11-10 | 深圳前海微众银行股份有限公司 | 基于rnn的反洗钱模型的训练方法、装置、设备及介质 |
CN112508705A (zh) * | 2020-12-18 | 2021-03-16 | 北京航空航天大学 | 一种复杂关联交易中洗钱交易的检测方法和系统 |
CN113011884A (zh) * | 2021-01-29 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 账户特征的提取方法、装置、设备及可读存储介质 |
CN113052266A (zh) * | 2021-04-27 | 2021-06-29 | 中国工商银行股份有限公司 | 交易模式类型识别方法及装置 |
CN113191777A (zh) * | 2021-05-13 | 2021-07-30 | 支付宝(杭州)信息技术有限公司 | 风险识别方法和装置 |
CN113935738A (zh) * | 2020-06-29 | 2022-01-14 | 腾讯科技(深圳)有限公司 | 交易数据处理方法、装置、存储介质及设备 |
CN114707990A (zh) * | 2022-03-23 | 2022-07-05 | 支付宝(杭州)信息技术有限公司 | 一种用户行为模式的识别方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107067276A (zh) * | 2017-01-12 | 2017-08-18 | 阿里巴巴集团控股有限公司 | 确定对象影响力的方法及装置 |
CN108446907A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 安全校验方法及装置 |
CN109657890A (zh) * | 2018-09-14 | 2019-04-19 | 阿里巴巴集团控股有限公司 | 一种转账欺诈的风险确定方法及装置 |
CN111062416A (zh) * | 2019-11-14 | 2020-04-24 | 支付宝(杭州)信息技术有限公司 | 用户聚类及特征学习方法、设备、计算机可读介质 |
-
2020
- 2020-05-22 CN CN202010439808.5A patent/CN111340506A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107067276A (zh) * | 2017-01-12 | 2017-08-18 | 阿里巴巴集团控股有限公司 | 确定对象影响力的方法及装置 |
CN108446907A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 安全校验方法及装置 |
CN109657890A (zh) * | 2018-09-14 | 2019-04-19 | 阿里巴巴集团控股有限公司 | 一种转账欺诈的风险确定方法及装置 |
CN111062416A (zh) * | 2019-11-14 | 2020-04-24 | 支付宝(杭州)信息技术有限公司 | 用户聚类及特征学习方法、设备、计算机可读介质 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113935738A (zh) * | 2020-06-29 | 2022-01-14 | 腾讯科技(深圳)有限公司 | 交易数据处理方法、装置、存储介质及设备 |
CN113935738B (zh) * | 2020-06-29 | 2024-04-19 | 腾讯科技(深圳)有限公司 | 交易数据处理方法、装置、存储介质及设备 |
CN111915437A (zh) * | 2020-06-30 | 2020-11-10 | 深圳前海微众银行股份有限公司 | 基于rnn的反洗钱模型的训练方法、装置、设备及介质 |
WO2021037280A3 (zh) * | 2020-06-30 | 2021-05-27 | 深圳前海微众银行股份有限公司 | 基于rnn的反洗钱模型的训练方法、装置、设备及介质 |
CN111915437B (zh) * | 2020-06-30 | 2024-06-07 | 深圳前海微众银行股份有限公司 | 基于rnn的反洗钱模型的训练方法、装置、设备及介质 |
CN112508705A (zh) * | 2020-12-18 | 2021-03-16 | 北京航空航天大学 | 一种复杂关联交易中洗钱交易的检测方法和系统 |
CN113011884A (zh) * | 2021-01-29 | 2021-06-22 | 腾讯科技(深圳)有限公司 | 账户特征的提取方法、装置、设备及可读存储介质 |
CN113011884B (zh) * | 2021-01-29 | 2023-08-04 | 腾讯科技(深圳)有限公司 | 账户特征的提取方法、装置、设备及可读存储介质 |
CN113052266A (zh) * | 2021-04-27 | 2021-06-29 | 中国工商银行股份有限公司 | 交易模式类型识别方法及装置 |
CN113191777A (zh) * | 2021-05-13 | 2021-07-30 | 支付宝(杭州)信息技术有限公司 | 风险识别方法和装置 |
CN114707990A (zh) * | 2022-03-23 | 2022-07-05 | 支付宝(杭州)信息技术有限公司 | 一种用户行为模式的识别方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111340506A (zh) | 交易行为的风险识别方法、装置、存储介质和计算机设备 | |
CN109948704A (zh) | 一种交易监测方法与装置 | |
CN111861174B (zh) | 一种针对用户画像的信用评估方法 | |
CN111597348B (zh) | 用户画像方法、装置、计算机设备和存储介质 | |
CN111814910B (zh) | 异常检测方法、装置、电子设备及存储介质 | |
WO2020077888A1 (zh) | 贷款用户信用评分的计算方法、装置和计算机设备 | |
Lou et al. | Ponzi contracts detection based on improved convolutional neural network | |
CN109727136A (zh) | 金融资产的配置方法及装置 | |
CN111783039B (zh) | 风险确定方法、装置、计算机系统和存储介质 | |
CN110097451A (zh) | 一种银行业务的监控方法及装置 | |
CN113656690B (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
WO2024060684A1 (zh) | 模型训练方法、图像处理方法、设备及存储介质 | |
Gao et al. | Research on Default Prediction for Credit Card Users Based on XGBoost‐LSTM Model | |
CN109583826B (zh) | 申报文件生成方法、装置、服务器及可读存储介质 | |
CN113420789B (zh) | 一种预测风险账号的方法、装置、存储介质和计算机设备 | |
CN110213239B (zh) | 可疑交易报文生成方法、装置及服务器 | |
CN117094764A (zh) | 银行积分处理方法及装置 | |
CN109635289A (zh) | 词条分类方法及审计信息抽取方法 | |
CN115525739A (zh) | 供应链金融智能查重方法、装置、设备及介质 | |
CN113724017A (zh) | 基于神经网络的定价方法、装置、电子设备和存储介质 | |
CN114708073A (zh) | 一种围标串标智能检测方法、装置、电子设备及存储介质 | |
CN113011968A (zh) | 账号状态的检测方法、装置和存储介质及电子设备 | |
CN116258579B (zh) | 用户信用评分模型的训练方法及用户信用评分方法 | |
CN113837764B (zh) | 风险预警方法、装置、电子设备和存储介质 | |
JP7550418B1 (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40030947 Country of ref document: HK |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200626 |