CN113781201B - 电子金融活动的风险评估方法和装置 - Google Patents
电子金融活动的风险评估方法和装置 Download PDFInfo
- Publication number
- CN113781201B CN113781201B CN202110952753.2A CN202110952753A CN113781201B CN 113781201 B CN113781201 B CN 113781201B CN 202110952753 A CN202110952753 A CN 202110952753A CN 113781201 B CN113781201 B CN 113781201B
- Authority
- CN
- China
- Prior art keywords
- behavior
- user
- feature
- risk
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本说明书实施例提供了电子金融活动的风险评估方法和装置。根据实施例的方法,首先通过获取与待关注用户相关的历史风险行为事件和基础信息,并对该历史风险行为事件和基础信息进行特征处理。然后将特征处理后的风险行为特征和用户基础特征进行融合得到用户表征向量,进而利用该用户表征向量对该待关注用户的电子金融活动进行风险评估。如此通过历史行为模式建模的方式,能够改善利用人工经验或关联信息进行风险评估时的弊端,从而提高对电子金融活动进行风险评估的准确性。
Description
技术领域
本说明书一个或多个实施例涉及电子金融技术领域,尤其涉及电子金融活动的风险评估方法和装置。
背景技术
随着网络技术的迅猛发展,作为以网络技术为支撑的电子金融技术已经成为了一种重要的金融活动模式。
然而,有些不法分子会通过电子金融进行一些非法的金融活动,比如通过电子金融进行洗钱以及涉赌交易等。
因此,需要提供一种电子金融活动的风险评估方案。
发明内容
本说明书一个或多个实施例描述了电子金融活动的风险评估方法和装置,能够提高对电子金融活动进行风险评估的准确性,从而进一步达到降低电子金融活动风险的目的。
根据第一方面,提供了电子金融活动的风险评估方法,包括:
获取与待关注用户相关的历史风险行为事件;
对所述历史风险行为事件进行特征处理,得到风险行为特征;
获取与所述待关注用户相关的基础信息;
对所述基础信息进行特征处理,得到用户基础特征;
将所述风险行为特征和所述用户基础特征进行融合,得到用户表征向量;
利用所述用户表征向量对所述待关注用户的电子金融活动进行风险评估。
在一个实施例中,其中,所述对所述历史风险行为事件进行特征处理得到风险行为特征,包括:
对所述历史风险行为事件进行特征提取,得到至少一个初级行为特征;
利用特征交叉算法对所述至少一个初级行为特征进行处理,分别得到相应的次级行为特征;其中,每一个所述次级行为特征的特征向量的稠密程度大于与该次级行为特征所对应的初级行为特征的特征向量的稠密程度;
将各个所述次级行为特征进行融合,得到所述风险行为特征。
在一个实施例中,其中,所述对所述历史风险行为事件进行特征提取,包括:
利用循环神经网络和Transformer模型中的至少一个,对所述历史风险行为事件进行特征提取;
和/或,
所述将各个所述次级行为特征进行融合,包括:
利用卷积神经网络、注意力机制和长短时记忆网络中的至少一个将各个所述次级行为特征进行融合。
在一个实施例中,所述基础信息包括:用户基础信息和人工统计信息;
所述对所述基础信息进行特征处理得到用户基础特征,包括:将所述用户基础信息和所述人工统计信息输入第一多层感知机,得到所述用户基础特征。
在一个实施例中,其中,所述将所述风险行为特征和所述用户基础特征进行融合得到用户表征向量,包括:
将所述风险行为特征所对应的特征向量和所述用户基础特征所对应的向量进行拼接,得到初级融合向量;
利用第二多层感知机和回归分类器中的至少一种将所述初级融合向量进行融合,得到所述用户表征向量。
在一个实施例中,其中,所述对所述待关注用户的电子金融活动进行风险评估,包括:
将所述用户表征向量输入第三多层感知机、分类器和回归模型中的至少一个,得到所述目标用户未来进行具有风险的电子金融活动的概率。
在一个实施例中,其中,所述对所述待关注用户的电子金融活动进行风险评估,包括:
获取所述待关注用户的当前行为事件;
对所述当前行为事件进行特征提取,得到至少一个当前初级行为特征;
对所述至少一个当前初级行为特征进行处理,得到至少一个当前次级行为特征;
将所述用户表征向量和所述至少一个当前次级行为特征所对应的向量进行合并,得到事件风险评估特征;
将所述事件风险评估特征输入第四多层感知机,得到所述当前行为事件具有风险的概率。
在一个实施例中,其中,所述对所述至少一个当前初级行为特征进行处理,包括:
利用特征交叉算法对所述当前初级行为特征中用于表征事件类型的特征进行处理;
和/或,
利用时间编码算法对所述当前初级行为特征中用于表征时间信息的特征进行处理;
和/或,
利用文本编码算法对所述当前初级行为特征中用于表征文本类信息的特征进行处理。
在一个实施例中,其中,在得到所述当前行为事件具有风险的概率之后,进一步包括:
根据所述当前行为事件确定管控方案;
将所述管控方案进行特征提取;以及,
利用特征交叉算法进行处理,得到风险管控特征;
将所述用户表征向量和所述管控特征所对应的向量进行融合,得到风险管控融合特征;
将所述风险管控融合特征输入第五多层感知机,得到所述管控方案对风险行为事件有效性的概率。
根据第二方面,提供了电子金融活动的风险评估装置,包括:
获取模块,配置为获取与待关注用户相关的历史风险行为事件;获取与所述待关注用户相关的基础信息;
特征处理模块,配置为对所述获取模块获取到的所述历史风险行为事件进行特征处理,得到风险行为特征;对所述获取模块获取到的所述基础信息进行特征处理,得到用户基础特征;
特征融合模块,配置为将所述特征处理模块得到的所述风险行为特征和所述用户基础特征进行融合,得到用户表征向量;
风险评估模块,配置为利用所述特征融合模块得到的所述用户表征向量对所述待关注用户的电子金融活动进行风险评估。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面中任一项所述的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面中任一项所述的方法。
根据本说明书实施例提供的方法和装置,在对电子金融活动的风险进行评估时,首先通过收集与待关注用户相关的历史风险行为事件,以及获取这些待关注用户的基础信息。然后分别对历史风险行为事件和基础信息进行特征处理得到风险行为特征和用户基础特征,进一步通过将得到的风险行为特征和用户基础特征进行融合得到用户表征向量,最后即可通过该用户表征向量对待关注用户的电子金融活动进行风险评估。由此可见,本说明书实施例提供的方案通过对用户的历史行为模式进行时序建模,从而实现对用户的电子金融活动进行风险评估,进一步可以根据风险评估结果采取相应的措施,以达到降低电子金融活动的风险的目的。此外,由于本说明书实施例采用的是历史行为模式建模,因此能够改善在利用人工经验和关联信息进行风险评估时,人工经验损失和关联信息损失,以及特定的行为模式无法有效捕捉的弊端,从而提高风险评估的准确性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书一个实施例提供的电子金融活动的风险评估方法的流程图;
图2是本说明书一个实施例提供的对历史风险行为事件进行特征处理的方法的流程图;
图3是本说明书一个实施例提供的评估电子金融活动是否具有风险的方法的流程图;
图4是本说明书一个实施例提供的进行风险教育有效性的评估的方法的流程图;
图5是本说明书一个实施例提供的电子金融活动的风险评估装置的示意图。
具体实施方式
如前所述,在当今网络技术迅猛发展的时代,电子金融已经成为了一种不可或缺的金融活动模式。然而,这种依托于网络技术的金融模式往往存在着一些弊端。比如,有些不发分子可能通过网上交易进行洗钱,以及通过电子支付的方式进行涉赌交易等。因此,通过对特定人群的电子金融活动进行风险评估,有利于从中甄别出当前电子金融活动的风险性,从而采取相应的措施,以降低该该电子金融活动所带来的不良后果。
目前,在对电子金融活动进行风控时,主要是针对网上的涉赌行为进行关注和干预,所采取的方式主要包括:赌博用户分类、涉赌交易识别以及基于传统机器学习的反赌博风控算法。然而,对赌博用户进行分类的方式只刻画了赌博用户的单个侧面,模型应用面较小,不具有普适性,而且如此对赌博用户进行分类关注的方式,对该用户的正常电子交易经常无法准确识别。涉赌交易识别的方式往往只基于单个交易的特征进行判断,引入的用户相关特征较为基础和底层,对交易识别的贡献有限,从而导致所得到的识别结果准确性不高。而基于传统机器学习的反赌博风控算法由于多基于人工经验特征,由于无法捕捉专家没有关注到的行为模式,经常导致准确性不高。因此,目前所采用的电子金融活动的风控算法的精度普遍不高。
基于此,本说明书实施例考虑利用待关注用户的历史风险行为事件和该待关注用户的基础信息作为学习数据,利用历史风险行为事件和基础信息得到的特征来共同表征该用户,进而对待关注用户的电子金融活动进行风险评估,如此通过对用户历史行为模式进行建模的方式,能够极大地提高风险评估的准确性。如图1所示,本说明书实施例提供了电子金融活动的风险评估方法,可以包括如下步骤:
步骤101:获取与待关注用户相关的历史风险行为事件;
步骤103:对历史风险行为事件进行特征处理,得到风险行为特征;
步骤105:获取与待关注用户相关的基础信息;
步骤107:对基础信息进行特征处理,得到用户基础特征;
步骤109:将风险行为特征和用户基础特征进行融合,得到用户表征向量;
步骤111:利用用户表征向量对待关注用户的电子金融活动进行风险评估。
在本实施中,对电子金融活动的风险进行评估时,首先通过收集与待关注用户相关的历史风险行为事件,以及获取这些待关注用户的基础信息。然后分别对历史风险行为事件和基础信息进行特征处理得到风险行为特征和用户基础特征,进一步通过将得到的风险行为特征和用户基础特征进行融合得到用户表征向量,最后即可通过该用户表征向量对待关注用户的电子金融活动进行风险评估。由此可见,本说明书实施例提供的方案通过对用户的历史行为模式进行时序建模,从而实现对用户的电子金融活动进行风险评估,进一步可以根据风险评估结果采取相应的措施,以达到降低电子金融活动的风险的目的。此外,由于本说明书实施例采用的是历史行为模式建模,因此能够改善在利用人工经验和关联信息进行风险评估时,人工经验损失和关联信息损失,以及特定的行为模式无法有效捕捉的弊端,从而提高风险评估的准确性。
在本说明书实施例中,待关注用户可以是特定的高风险用户,也可以是任何具有电子金融活动的用户。即电子金融活动的风险评估可以是针对任何具有潜在电子金融风险的用户,例如,经常进行赌博行为的用户、有不良交易记录的用户、失信用户等。当然也可以针对所有的用户进行,例如,针对所有使用支付宝的用户进行风险评估。
在步骤101中获取与待关注用户相关的历史风险行为事件时,通过查询记录等方式获取该用户过去一段时间的相关行为事件,该历史风险行为事件可以包括:交易记录、登陆、扫码、尝试交易而被流量海关或策略UCT拦截、投诉行为、查看系统推送的反赌博相关的提醒教育等。
同时,考虑到在对待关注用户进行表征时,还可以将用户的一些基础信息以及人工经验也引入其中。因此,在步骤105中获取与该待关注用户相关的基础信息时,将待关注用户的个人画像信息和基于人工经验的统计信息进行获取,从而结合待关注用户的历史风险行为事件对待关注用户进行表征。其中,个人画像信息可以包括:年龄、性别、消费水平、职业等;基于人工经验的统计信息可以包括:金额为整百的交易次数、交易的频繁程度等。
在获取到与待关注用户相关的历史风险行为事件和基础信息之后,需要对历史风险行为事件和基础信息进行特征处理,分别得到风险行为特征和用户基础特征。在步骤103对历史风险行为事件进行特征处理,得到风险行为特征时,在一种可能的实现方式中,如图2所示,具体可以通过如下方式实现:
步骤201:对历史风险行为事件进行特征提取,得到至少一个初级行为特征;
步骤203:利用特征交叉算法对至少一个初级行为特征进行处理,分别得到相应的次级行为特征;其中,每一个次级行为特征的特征向量的稠密程度大于与该次级行为特征所对应的初级行为特征的特征向量的稠密程度;
步骤205:将各个次级行为特征进行融合,得到风险行为特征。
在本实施中,对历史风险行为事件进行特征处理时,首先需要将步骤101中获取到的历史风险行为事件进行特征提取,得到至少一个初级行为特征。然后利用特征交叉算法对得到的各个初级行为特征进行稠密化处理得到相应的次级行为特征,使得每一个次级行为特征的特征向量的稠密程度都大于与该次级行为特征所对应的初级行为特征的特征向量的稠密程度。最后,将各个次级行为特征进行融合,得到风险行为特征。如此通过将从历史风险行为事件中提取出的初级行为特征进行稠密化处理,充分考虑各个特征之间的相互关系,在进行风险评估时,能够充分利用特征之间的关联性进行多特征辅助判断,从而提高风险评估的准确性。
在步骤201对历史风险行为事件进行特征提取时,可以考虑利用循环神经网络和Transformer模型中的至少一个对历史风险行为事件进行特征提取,从而能够简洁有效的提取出与待关注用户的风险行为活动相关的特征信息。比如循环神经网络能够引入定向循环,处理输入之间具有关联的问题。因此,通过该方式能够充分利用各特征之间的关联性进行特征提取,从而得到更加有效和准确的特征信息。
在步骤201对历史风险行为事件进行特征提取,得到至少一个初级行为特征后,其得到的结果包含了一系列的原始稀疏特征,如:事件类型、发生时间、IP/LBS信息、金额(交易事件)等等。在一种可能的实现方式中,考虑利用特征交叉算法构建事件表征学习层,经过这一层的处理,事件由稀疏的特征转换为稠密的抽象特征向量,从而通过充分考虑各特征之间的关联性提高风险评估的精度。
比如某一用户进行网上交易的信息如下表1所示:
表1
是否赌博 | 类型 | 时间 | 金额 |
1 | 付款 | 20:00-06:00 | >1000 |
0 | 付款 | 06:00-20:00 | <1000 |
1 | 收款 | 20:00-06:00 | >1000 |
在上述数据进行特征交叉组合后,上述表1则变化为表2:
表2
由上述表1到表2的变化可知,经过特征交叉算法,特征之间的关联性更强,能够深入的学习到各个特征之间的隐藏关系,从而在进行风险评估时,达到提高风险评估准确性的目的。然而,在实际应用中,由于通过传统的特征交叉方法会带来数据的稀疏性,使得特征空间变大,如此在进行计算学习时会导致计算量过大,从而影响执行效率。因此在一种可能的实现方式中,在进行特征交叉计算时,考虑采用因子分解机FM算法或基于同一原理的FFM、AFM和DeepFM等算法。由于传统的特征交叉算法的特征交叉参数是独立的,比如SVM的二元特征交叉参数wij就是独立的,而FM的二元特征交叉参数是两个K维的向量vi,vj,如此<vi,vj>和<vi,vj>就不是独立的,而是相互影响的。而且由于FM算法中的系数<vi,vj>和<vi,vj>之间有共同项vi,因此所有包含xi的非零组合特征的样本都可以用来学习隐藏向量vi,从而能够解决特征空间变大的问题。因此在实际中,采用FM等特征交叉算法具有更好的效果。
在步骤203得到次级行为特征之后,将得到的各个次级行为特征进行融合,从而得到风险行为特征。在对各个次级行为特征融合时,首先可以考虑从各个次级行为特征中筛选出与待关注用户的电子金融活动关联性较强的特征,当然筛选出的特征还可以进一步是与具有较高风险的电子金融活动关联性较强的特征,然后再将筛选后的各个特征进行融合,得到风险行为特征。如此能够得到对待关注用户的风险评估更具针对性的特征信息,从而在进行风险评估时不仅能够得到更加准确的结果,而且具有更高的评估效率。其中,在一种可能的实现方式中,步骤205将各个次级行为特征进行融合时,可以考虑利用卷积神经网络、注意力机制和长短时记忆网络中的至少一个将各个次级行为特征进行融合,即可以考虑利用任意一种算法,或任意多种算法的组合从各个次级行为特征中抽取出关键信息,并生成一个单一的表征向量,以用于后续生成表征用户的用户表征向量。
在一种可能的实现方式中,步骤107对基础信息进行特征处理,得到用户基础特征时,该基础信息可以包括:用户基础信息和人工统计信息。然后考虑将用户基础信息和人工统计输入第一多层感知机,得到用户基础特征。
在本实施中,在进行机器学习时,不仅将待关注用户的历史风险行为事件作为基础数据进行学习,而且对应将该待关注用户的画像信息和人工统计信息也作为基础数据进行学习。通过利用包括年龄、职业、性别、消费水平等信息的用户基础信息和包括人工统计的交易金额为整百的次数、交易的频繁程度等信息的人工统计信息对用户进行辅助表征,从而能够使得对待关注用户进行风险评估的准确性更高。
比如,将性别作为基础信息进行学习,男性涉赌的可能性显然要大于女性,因此,将性别作为辅助判断标准,能够更加迅速和准确的得到评估结果。
再比如,将消费水平作为基础信息进行学习,当某一客户日常的消费水平处于某一稳定的水平,而某一段时间内的消费水平明显变化异常,则可能存在非正常的电子交易行为,通过将该特征信息和其他的特征信息进行综合判断,能够较为迅速地得到评估结果。
又比如,将人工统计的交易金额为整百的次数和交易的频繁程度作为基础信息进行学习。当客户存在涉赌交易时,经常会进行频繁的收入和支出,而且经常以整百进行交易。基于此,当将交易金额为整百的次数和交易的频繁程度作为基础信息对用户进行表征之后,某一段时间内该用户出现频繁的整百交易,那么该用户存在涉赌交易的可能,通过结合其他的特征信息,从而实现对该电子金融活动的风险评估。
由此,在通过对历史风险行为事件和基础信息分别进行特征处理,得到风险行为特征和用户基础特征之后,进一步需要进行步骤109将风险行为特征和用户基础特征进行融合,得到用户表征向量,从而能够进一步根据该用户表征向量对用户的电子金融活动进行风险评估。具体地,该步骤109将风险行为特征和用户基础特征进行融合得到用户表征向量时,可以通过如下方式实现:
将所述风险行为特征所对应的特征向量和所述用户基础特征所对应的向量进行拼接,得到初级融合向量;
利用第二多层感知机和回归分类器中的至少一种将所述初级融合向量进行融合,得到所述用户表征向量。
在本实施中,首先考虑将风险行为特征对应的特征向量和用户基础特征对应的向量进行合并得到初级融合向量,比如可以用concatenation的操作方法,然后利用多层感知机或分类器等对初级融合向量进行融合,从而得到能够表征与用户电子金融活动有关的用户表征向量,以进一步利用该用户表征向量对用户的电子金融活动进行风险评估。当然需要指出的是,通过对每一个用户的历史风险行为事件和基础信息进行机器学习,得到对应每一个用户的用户表征向量,因此最终得到的用户表征向量可以是包含多个用户表征向量的向量集合。
concatenation的操作方法能够将多个文本字符串连接成一个字符串,即在本实施中,通过利用concatenation的方法能够快速的将风险行为特征所对应的特征向量和用户基础特征所对应的向量连接在一起,形成一个包含风险行为特征和用户基础特征的初级融合向量,从而进一步通过该初级融合向量得到用户表征向量。此外,由于对于同一个输入,若使用不同大小的卷积核,输出不一定是不同大小,还要看步长和填充的值。通过concatenation的方法不需要考虑输入的大小,卷积核大小是否相同,其可以实现每一条混合路线出来的结果大小均是一样的,能够便捷的实现将多个特征向量进行合并。
在得到初级融合向量之后,可以考虑利用神经网络进行向量融合,即可以利用多层感知机对初级融合向量进行融合,也可以考虑利用回归分类器对初级融合向量进行融合,还可以同时利用多层感知机和回归分类器对初级融合向量进行融合。通过利用神经网络的输入层、隐藏层和输出层之间的全连接,经过不断的学习,建立输入与输出之间的联系,从而能够根据该神经网络学习的结果对用户的电子金融活动进行风险评估。
在步骤111利用用户表征向量对待关注用户的电子金融活动进行风险评估时,在一种可能的实现方式中,该风险评估可以至少包括如下三种:
第一种:对目标用户进行具有风险的电子金融活动的概率评估;
第二种:对电子金融活动是否具有风险的评估;
第三种:风险教育有效性的评估。
在本实施例中,在得到用户表征向量之后,可以利用该用户表征向量在用户层级、项目层级以及风险教育层级对电子金融活动进行评估。即可以利用该用户表征向量预测某一用户未来是否进行具有高风险的电子金融活动的概率,还可以利用该用户表征向量对某一次电子金融活动是否为高风险的电子金融活动进行评估,以及还可以利用该用户表征向量在某一时刻对用户风险教育是否有效进行评估。如此通过利用该用户表征向量在多任务框架下进行应用,通过其起到的直接或间接作用,使得本方案在面对多变的业务需求和不同的业务场景时具有更加高效和灵活的特性。
下面对上述三种风险评估任务分别进行说明:
在第一种对目标用户进行具有风险的电子金融活动的概率评估时,步骤111对待关注用户的电子金融活动进行风险评估具体是通过将用户表征向量输入第三多层感知机、分类器和回归模型中的至少一个,从而得到目标用户未来进行具有风险的电子金融活动的概率。
例如,在进行模型训练时,确定了A用户具有潜在的赌博行为。如此,通过利用A用户的历史赌博行为事件和基础信息进行训练学习得到了A用户的表征向量。那么,后续可以通过将A用户的表征向量作为神经网络的输入,从而判断出该A用户在未来会进行赌博的概率。比如,通过历史统计数据发现,A用户习惯在晚上进行赌博,在对A用户的行为事件进行学习的历史数据中可以包括该特征信息,在对A用户未来某个晚上是否会进行赌博时,基于该用户表征向量中的上述特征信息并结合其他特征信息,即可评估出A用户进行赌博的概率,从而可以通过采取相应的措施限制或降低该用户从事赌博的可能性。
在上述第一种风险评估实现方式中,实现了对用户层面的风险评估。在第二种风险评估实现方式中,还可以考虑在项目层面进行风险评估,即对事件本身进行评估预测,以判断当前的交易为具有风险的电子金融活动的概率。具体地,如图3所示,步骤111对待关注用户的电子金融活动进行风险评估可以通过如下步骤实现:
步骤301:获取待关注用户的当前行为事件;
步骤303:对当前行为事件进行特征提取,得到至少一个当前初级行为特征;
步骤305:对至少一个当前初级行为特征进行处理,得到至少一个当前次级行为特征;
步骤307:将用户表征向量和至少一个当前次级行为特征所对应的向量进行合并,得到事件风险评估特征;
步骤309:将事件风险评估特征输入第四多层感知机,得到当前行为事件具有风险的概率。
在本实施例中,当需要判断某一电子金融活动是否为具有风险的活动时,可以将该电子金融活动作为当前行为事件进行特征提取,得到至少一个当前初级行为特征,然后将该初级行为特征利用特征交叉算法进行特征处理,得到当前次级行为特征,进一步通过利用注意力机制和/或concatenation的方法将预先训练得到的用户表征向量和该当前次级行为特征进行融合,得到事件风险评估特征,最后通过将该事件风险评估特征输入到多层感知机,得到当前的电子金融活动具有风险的概率。由此可见,本实施例将用户表征向量和通过事件表征层学习的事件向量作为输入,通过特征的交叉和融合,对事件本身进行预测,也就是说,能够实现对电子金融活动的实时预测,通过预测结果进行及时干预,以降低高风险的电子金融活动所带来的损失。
例如,历史记录中的某一赌徒在当前进行了一笔支出,现需要判断该笔支出是否为赌博充值交易。那么则需要将该赌徒当前的交易支出行为作为一个行为事件,该行为事件可以是A用户于XXX时刻向YYY账户转账人民币ZZZ元。然后从该当前行为事件中提取出与赌博行为相关的特征信息,得到当前初级行为特征。比如,提取出的事件类型、交易时间、交易金额等特征分别为:“支出”、“XXX”和“ZZZ”。进一步利用特征交叉算法对得到的当前初级行为特征事件类型“支出”、交易时间“XXX”、交易金额“ZZZ”等特征进行处理,得到当前次级行为特征。具体的特征处理过程与上述历史行为事件的特征处理过程一致,此处不再进行赘述。进一步通过将该当前次级行为特征和通过机器学习得到的用户表征向量进行融合,得到用于对事件本身进行评估的事件风险评估特征,进而将该事件风险评估特征作为神经网络(即多层感知机)的输入,得到该赌徒在当前进行的交易支出为赌博充值交易的概率。如此通过实时监控这些较高风险用户的交易行为能够降低由于电子金融活动的风险较高所带来的损失。
在步骤305对至少一个当前初级行为特征进行处理时,在一种可能的实现方式中,具体可以是利用特征交叉算法对当前初级行为特征中用于表征事件类型的特征进行处理。比如事件类型可以为赌博、洗钱等。在另一种可能的实现方式中,具体可以是利用时间编码算法对所述当前初级行为特征中用于表征时间信息的特征进行处理,比如赌徒产生交易的时间等,该时间编码算法可以包括time2vec时间编码算法。在又一种可能的实现方式中,具体还可以是利用文本编码算法对当前初级行为特征中用于表征文本类信息的特征进行处理,比如,利用textcnn,bert等文本编码算法将原始的文本信息转化为特征向量。显然,容易理解的是,上述对至少一个当前初级行为特征进行处理的三种方式具体实现时可以只包括其中一种,也可以任意包括其中的两种亦或三种都包括。
在第三种风险评估的实现方式中,可以考虑进行风险教育有效性的评估。如图4所示,步骤111对待关注用户的电子金融活动进行风险评估时可以通过如下步骤实现:
步骤401:根据所述当前行为事件确定管控方案;
步骤403:将所述管控方案进行特征提取;以及,
步骤405:利用特征交叉算法进行处理,得到风险管控特征;
步骤407:将所述用户表征向量和所述管控特征所对应的向量进行融合,得到风险管控融合特征;
步骤409:将所述风险管控融合特征输入第五多层感知机,得到所述管控方案对风险行为事件有效性的概率。
为了对一些潜在的高风险用户进行风险教育,通常会指定一些管控方案,比如进行风险教育,在某时刻为用户推送一些风险教育知识。然而,在风控场景下,不同的管控手段可能对不同的用户具有不同的效果。因此本实施例通过对管控方案对风险行为事件是否有效进行评估,从而实现管控策略的精准推荐,能够有效减少具有风险的电子金融活动的目的。
具体地,在本实施中,首先需要根据当前行为事件确定管控方案,然后同历史风险行为事件一致,进行特征处理得到风险管控特征,进一步利用注意力机制和/或concatenation的操作方法等对该风险管控特征和由历史风险行为事件得到的用户表征向量进行融合,得到风险管控融合特征,最后通过将该风险管控融合特征输入到多层感知机,得到该管控方案对该当前行为事件有效的概率。由此可见,本实施例基于用户表征和管控行为的表征,可以对管控行为在当前时刻对于该用户的有效性进行打分评估,进而实现管控策略的智能推荐。
如图5所示,本说明书实施例提供了电子金融活动的风险评估装置,该装置可以包括:
获取模块501,配置为获取与待关注用户相关的历史风险行为事件;获取与待关注用户相关的基础信息;
特征处理模块502,配置为对获取模块501获取到的历史风险行为事件进行特征处理,得到风险行为特征;对获取模块501获取到的基础信息进行特征处理,得到用户基础特征;
特征融合模块503,配置为将特征处理模块502得到的风险行为特征和用户基础特征进行融合,得到用户表征向量;
风险评估模块504,配置为利用特征融合模块503得到的用户表征向量对待关注用户的电子金融活动进行风险评估。
如图5所示的电子金融活动的风险评估装置,在一种可能的实现方式中,特征处理模块502在对历史风险行为事件进行特征处理得到风险行为特征时,配置成执行如下操作:
对历史风险行为事件进行特征提取,得到至少一个初级行为特征;
利用特征交叉算法对至少一个初级行为特征进行处理,分别得到相应的次级行为特征;其中,每一个次级行为特征的特征向量的稠密程度大于与该次级行为特征所对应的初级行为特征的特征向量的稠密程度;
将各个次级行为特征进行融合,得到风险行为特征。
如图5所示的电子金融活动的风险评估装置,在一种可能的实现方式中,特征处理模块502在执行对历史风险行为事件进行特征提取的操作时,具体配置成利用循环神经网络和Transformer模型中的至少一个,对历史风险行为事件进行特征提取。
如图5所示的电子金融活动的风险评估装置,在一种可能的实现方式中,特征处理模块502在执行将各个次级行为特征进行融合的操作时,具体配置成利用卷积神经网络、注意力机制和长短时记忆网络中的至少一个将各个次级行为特征进行融合。
如图5所示的电子金融活动的风险评估装置,在一种可能的实现方式中,基础信息包括:用户基础信息和人工统计信息。特征处理模块502在对基础信息进行特征处理时,配置成将用户基础信息和人工统计信息输入第一多层感知机,得到用户基础特征。
如图5所示的电子金融活动的风险评估装置,在一种可能的实现方式中,特征融合模块503在将风险行为特征和用户基础特征进行融合得到用户表征向量时,配置成执行如下操作:
将风险行为特征所对应的特征向量和用户基础特征所对应的向量进行拼接,得到初级融合向量;
利用第二多层感知机和回归分类器中的至少一种将初级融合向量进行融合,得到用户表征向量。
如上述提到的任一一种电子金融活动的风险评估装置,在一种可能的实现方式中,风险评估模块504在对待关注用户的电子金融活动进行风险评估时,具体可以配置成将用户表征向量输入第三多层感知机、分类器和回归模型中的至少一个,得到目标用户未来进行具有风险的电子金融活动的概率。
在另一种可能的实现方式中,风险评估模块504在对待关注用户的电子金融活动进行风险评估时,具体可以配置成执行如下操作:
获取待关注用户的当前行为事件;
对当前行为事件进行特征提取,得到至少一个当前初级行为特征;
对至少一个当前初级行为特征进行处理,得到至少一个当前次级行为特征;
将用户表征向量和至少一个当前次级行为特征所对应的向量进行合并,得到事件风险评估特征;
将事件风险评估特征输入第四多层感知机,得到当前行为事件具有风险的概率。
在一种可能的实现方式中,风险评估模块504在配置执行对至少一个当前初级行为特征进行处理时,还可以具体配置成执行以下三种中的任意一种或多种:(一)利用特征交叉算法对当前初级行为特征中用于表征事件类型的特征进行处理;(二)利用时间编码算法对当前初级行为特征中用于表征时间信息的特征进行处理;(三)利用文本编码算法对当前初级行为特征中用于表征文本类信息的特征进行处理。
在又一种可能的实现方式中,风险评估模块504在对待关注用户的电子金融活动进行风险评估之后,具体还可以配置成执行如下操作:
根据当前行为事件确定管控方案;
将管控方案进行特征提取;以及,
利用特征交叉算法进行处理,得到风险管控特征;
将用户表征向量和管控特征所对应的向量进行融合,得到风险管控融合特征;
将风险管控融合特征输入第五多层感知机,得到管控方案对风险行为事件有效性的概率。
本说明书还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行说明书中任一个实施例中的方法。
本说明书还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现说明书中任一个实施例中的方法。
可以理解的是,本说明书实施例示意的结构并不构成对电子金融活动的风险评估装置的具体限定。在说明书的另一些实施例中,电子金融活动的风险评估装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本说明书方法实施例基于同一构思,具体内容可参见本说明书方法实施例中的叙述,此处不再赘述。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书所描述的功能可以用硬件、软件、挂件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本说明书描述的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (11)
1.电子金融活动的风险评估方法,包括:
获取与待关注用户相关的历史风险行为事件;其中,所述历史风险行为事件属于所述待关注用户的行为事件;
对所述历史风险行为事件进行特征处理,得到风险行为特征;
获取与所述待关注用户相关的基础信息;其中,所述基础信息包括:所述待关注用户的个人画像信息和基于人工经验的统计信息;
对所述基础信息进行特征处理,得到用户基础特征;
将所述风险行为特征和所述用户基础特征进行融合,得到用户表征向量;
利用所述用户表征向量对所述待关注用户的电子金融活动进行风险评估;
其中,所述对所述历史风险行为事件进行特征处理得到风险行为特征,包括:
对所述历史风险行为事件进行特征提取,得到至少一个初级行为特征;
利用特征交叉算法对所述至少一个初级行为特征进行处理,分别得到相应的次级行为特征;其中,每一个所述次级行为特征的特征向量的稠密程度大于与该次级行为特征所对应的初级行为特征的特征向量的稠密程度;
将各个所述次级行为特征进行融合,得到所述风险行为特征。
2.根据权利要求1所述的方法,其中,
所述对所述历史风险行为事件进行特征提取,包括:
利用循环神经网络和Transformer模型中的至少一个,对所述历史风险行为事件进行特征提取;
和/或,
所述将各个所述次级行为特征进行融合,包括:
利用卷积神经网络、注意力机制和长短时记忆网络中的至少一个将各个所述次级行为特征进行融合。
3.根据权利要求1所述的方法,其中,
所述对所述基础信息进行特征处理得到用户基础特征,包括:将所述用户基础信息和所述人工统计信息输入第一多层感知机,得到所述用户基础特征。
4.根据权利要求1所述的方法,其中,所述将所述风险行为特征和所述用户基础特征进行融合得到用户表征向量,包括:
将所述风险行为特征所对应的特征向量和所述用户基础特征所对应的向量进行拼接,得到初级融合向量;
利用第二多层感知机和回归分类器中的至少一种将所述初级融合向量进行融合,得到所述用户表征向量。
5.根据权利要求1所述的方法,其中,所述对所述待关注用户的电子金融活动进行风险评估,包括:
将所述用户表征向量输入第三多层感知机、分类器和回归模型中的至少一个,得到所述目标用户未来进行具有风险的电子金融活动的概率。
6.根据权利要求1所述的方法,其中,所述对所述待关注用户的电子金融活动进行风险评估,包括:
获取所述待关注用户的当前行为事件;
对所述当前行为事件进行特征提取,得到至少一个当前初级行为特征;
对所述至少一个当前初级行为特征进行处理,得到至少一个当前次级行为特征;
将所述用户表征向量和所述至少一个当前次级行为特征所对应的向量进行合并,得到事件风险评估特征;
将所述事件风险评估特征输入第四多层感知机,得到所述当前行为事件具有风险的概率。
7.根据权利要求6所述的方法,其中,所述对所述至少一个当前初级行为特征进行处理,包括:
利用特征交叉算法对所述当前初级行为特征中用于表征事件类型的特征进行处理;
和/或,
利用时间编码算法对所述当前初级行为特征中用于表征时间信息的特征进行处理;
和/或,
利用文本编码算法对所述当前初级行为特征中用于表征文本类信息的特征进行处理。
8.根据权利要求6至7中任一所述的方法,其中,在得到所述当前行为事件具有风险的概率之后,进一步包括:
根据所述当前行为事件确定管控方案;
将所述管控方案进行特征提取;以及,
利用特征交叉算法进行处理,得到风险管控特征;
将所述用户表征向量和所述管控特征所对应的向量进行融合,得到风险管控融合特征;
将所述风险管控融合特征输入第五多层感知机,得到所述管控方案对风险行为事件有效性的概率。
9.电子金融活动的风险评估装置,包括:
获取模块,配置为获取与待关注用户相关的历史风险行为事件;获取与所述待关注用户相关的基础信息;其中,所述历史风险行为事件属于所述待关注用户的行为事件;其中,所述基础信息包括:所述待关注用户的个人画像信息和基于人工经验的统计信息;
特征处理模块,配置为对所述获取模块获取到的所述历史风险行为事件进行特征处理,得到风险行为特征;对所述获取模块获取到的所述基础信息进行特征处理,得到用户基础特征;
特征融合模块,配置为将所述特征处理模块得到的所述风险行为特征和所述用户基础特征进行融合,得到用户表征向量;
风险评估模块,配置为利用所述特征融合模块得到的所述用户表征向量对所述待关注用户的电子金融活动进行风险评估;
所述特征处理模块在对历史风险行为事件进行特征处理得到风险行为特征时,配置成执行如下操作:
对历史风险行为事件进行特征提取,得到至少一个初级行为特征;
利用特征交叉算法对至少一个初级行为特征进行处理,分别得到相应的次级行为特征;其中,每一个次级行为特征的特征向量的稠密程度大于与该次级行为特征所对应的初级行为特征的特征向量的稠密程度;
将各个次级行为特征进行融合,得到风险行为特征。
10.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-8中任一项所述的方法。
11.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110952753.2A CN113781201B (zh) | 2021-08-19 | 2021-08-19 | 电子金融活动的风险评估方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110952753.2A CN113781201B (zh) | 2021-08-19 | 2021-08-19 | 电子金融活动的风险评估方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113781201A CN113781201A (zh) | 2021-12-10 |
CN113781201B true CN113781201B (zh) | 2023-02-03 |
Family
ID=78838281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110952753.2A Active CN113781201B (zh) | 2021-08-19 | 2021-08-19 | 电子金融活动的风险评估方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113781201B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956497A (zh) * | 2019-11-27 | 2020-04-03 | 桂林电子科技大学 | 一种电子商务平台用户重复购买行为预测方法 |
CN111563775A (zh) * | 2020-05-08 | 2020-08-21 | 北京深演智能科技股份有限公司 | 人群划分方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615454A (zh) * | 2018-10-30 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 确定用户金融违约风险的方法及装置 |
CN111818093B (zh) * | 2020-08-28 | 2020-12-11 | 支付宝(杭州)信息技术有限公司 | 用于进行风险评估的神经网络系统、方法及装置 |
CN112070506A (zh) * | 2020-08-31 | 2020-12-11 | 深圳市卡牛科技有限公司 | 风险用户识别方法、装置、服务器及存储介质 |
CN112270546A (zh) * | 2020-10-27 | 2021-01-26 | 上海淇馥信息技术有限公司 | 基于stacking算法的风险预测方法、装置和电子设备 |
-
2021
- 2021-08-19 CN CN202110952753.2A patent/CN113781201B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110956497A (zh) * | 2019-11-27 | 2020-04-03 | 桂林电子科技大学 | 一种电子商务平台用户重复购买行为预测方法 |
CN111563775A (zh) * | 2020-05-08 | 2020-08-21 | 北京深演智能科技股份有限公司 | 人群划分方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113781201A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ha et al. | Improving credit risk prediction in online peer-to-peer (P2P) lending using feature selection with deep learning | |
CN112862298B (zh) | 一种针对用户画像的信用评估方法 | |
CN110378786B (zh) | 模型训练方法、违约传导风险识别方法、装置及存储介质 | |
CN108229341A (zh) | 分类方法和装置、电子设备、计算机存储介质、程序 | |
CN111179089B (zh) | 洗钱交易识别方法、装置和设备 | |
CN111461216A (zh) | 一种基于机器学习的案件风险识别方法 | |
CN111898675B (zh) | 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备 | |
CN112561320A (zh) | 机构风险预测模型的训练方法、机构风险预测方法和装置 | |
CN115018513A (zh) | 数据巡检方法、装置、设备及存储介质 | |
US20240154975A1 (en) | Systems and methods for accelerating a disposition of digital dispute events in a machine learning-based digital threat mitigation platform | |
CN113434575B (zh) | 基于数据仓库的数据归因处理方法、装置及存储介质 | |
CN113762973A (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
Liu et al. | Analysis of Beijing Tianjin Hebei regional credit system from the perspective of big data credit reporting | |
CN117196630A (zh) | 交易风险预测方法、装置、终端设备以及存储介质 | |
CN113781201B (zh) | 电子金融活动的风险评估方法和装置 | |
CN109636627B (zh) | 基于区块链的保险产品管理方法、装置、介质及电子设备 | |
CN116664306A (zh) | 风控规则的智能推荐方法、装置、电子设备及介质 | |
CN116522131A (zh) | 对象表示方法、装置、电子设备及计算机可读存储介质 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
CN113420789A (zh) | 一种预测风险账号的方法、装置、存储介质和计算机设备 | |
Kalhotra et al. | Data mining and machine learning techniques for credit card fraud detection | |
Kumar et al. | Tax Management in the Digital Age: A TAB Algorithm-based Approach to Accurate Tax Prediction and Planning | |
Wei | Telco Customer Churn Prediction | |
CN117611224A (zh) | 客户分群方法、装置、设备、介质及程序产品 | |
CN116452225A (zh) | 对象分级方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |