CN108416663A - 评估金融违约风险的方法及装置 - Google Patents
评估金融违约风险的方法及装置 Download PDFInfo
- Publication number
- CN108416663A CN108416663A CN201810050531.XA CN201810050531A CN108416663A CN 108416663 A CN108416663 A CN 108416663A CN 201810050531 A CN201810050531 A CN 201810050531A CN 108416663 A CN108416663 A CN 108416663A
- Authority
- CN
- China
- Prior art keywords
- user
- trade company
- data set
- neural network
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Abstract
本说明书实施例提供一种评估用户的金融违约风险的方法和装置。方法包括,首先获取若干个短周期的细粒度数据集,该细粒度数据集包括用户的各种与借贷行为相关的金额信息和商户信息,利用循环神经网络处理这些数据集,得到中间处理结果。另一方面,还获取用户在长周期的粗粒度统计信息作为广度特征,利用全连接的深度神经网络进一步处理这些统计信息和以上得到的中间处理结果,从而进行最终的金融风险评估。所述装置与上述方法对应。如此,通过深度特征和广度特征结合的方式,更好地评估金融违约风险。
Description
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及评估金融违约风险的方法及装置。
背景技术
计算机和网络技术的发展使得互联网已经渗透进人们生活的方方面面,人们越来越多地利用互联网进行各种各样的操作,包括金融相关操作,例如网络购物,电子支付,电子转账,在线理财,在线借贷等。在用户的诸多网络金融操作中,有一些操作行为有一定的金融风险,例如请求先享后付类服务,采用花呗、白条等透支服务,申请借贷等。这就需要对用户的金融违约风险预先进行评估和判断。尽管已经存在诸如芝麻信用这样的信用评估系统,但是仅仅根据信用分判断金融违约风险,维度比较单一,粒度不够细致。
因此,需要更有效的方式,对用户进行全面分析,从而评估其金融违约风险。
发明内容
本说明书一个或多个实施例描述了一种方法和装置,可以全面地对用户的金融违约风险进行分析和评估。
根据第一方面,提供了一种评估金融违约风险的方法,包括:
获取数据集序列,所述数据集序列包括对应于连续的多个第一时间段、且按照时间顺序排列的多个数据集,所述多个数据集中的各个数据集包括,对应的第一时间段中,用户的与借贷行为相关的金额信息和商户信息;
利用循环神经网络处理所述数据集序列,获得第一输出结果;
获取与所述用户在第二时间段内的借贷行为相关的统计信息,所述第二时间段大于所述第一时间段;
利用全连接神经网络处理所述第一输出结果和所述统计信息,获得第二输出结果;
根据所述第二输出结果评估所述用户的金融违约风险。
在一种可能的设计中,所述商户信息包括,与所述用户的借贷行为相关的商户ID。
进一步地,在一个实施例中,与所述用户的借贷行为相关的商户ID包括以下中的一项或多项,用户申请借款的商户ID,用户借款成功的商户ID,用户借款失败的商户ID,用户履约的商户ID,用户违约的商户ID。
在一个实施例中,所述方法还包括:对所述商户信息进行预处理,所述预处理包括:通过词嵌入模型将所述商户ID转化为ID向量。
根据一个实施例,上述预处理还包括:在同一数据集中,对所述用户的同类型借贷行为所针对的商户ID的ID向量求平均,获得各类型对应的均值向量;将所述均值向量包含在预处理的商户信息中。
在一个实施例中,上述预处理还包括:对所述用户的不同类型的借贷行为中各个类型对应的所述均值向量求和,获得商户向量和;将所述商户向量和包含在预处理的商户信息中。
根据一个实施例,所述多个数据集中的各个数据集还包括,用户在对应的第一时间段内的信用信息。
在一个实施例中,所述方法还包括,获取所述用户的属性特征信息,所述利用全连接神经网络处理所述第一输出结果和所述统计信息,获得第二输出结果,包括:将所述第一输出结果、所述统计信息和所述属性特征信息输入所述全连接神经网络,获得第二输出结果。
进一步地,在一个实施例中,所述全连接神经网络为多层全连接神经网络,其中将所述第一输出结果、所述统计信息和所述属性特征信息输入所述全连接神经网络包括:将所述第一输出结果和所述属性特征信息输入所述多层全连接神经网络的第一层,将所述统计信息输入所述全连接神经网络的最后一层。
根据一种可能的设计,所述循环神经网络包括多层叠加的长短期记忆模型LSTM。
根据第二方面,提供了一种评估金融违约风险的装置,包括:
数据集获取单元,配置为获取数据集序列,包括对应于连续的多个第一时间段、且按时间顺序排列的多个数据集,所述多个数据集中的各个数据集包括,对应的第一时间段中,用户的与借贷行为相关的金额信息和商户信息;
第一处理单元,配置为利用循环神经网络处理所述数据集序列,获得第一输出结果;
统计信息获取单元,配置为获取与所述用户在第二时间段内的借贷行为相关的统计信息,所述第二时间段大于所述第一时间段;
第二处理单元,配置为利用全连接神经网络处理所述第一输出结果和所述统计信息,获得第二输出结果;
评估单元,配置为根据所述第二输出结果评估所述用户的金融违约风险。
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
通过本说明书实施例提供的方法及装置,采用了深度模型和广度模型相结合的架构分析用户的金融违约风险。具体地,采用循环神经网络作为深度模型,对用户的多个短周期中细粒度的数据集进行深度分析,反映用户的借贷状态的变化。广度模型基于用户长周期的统计特征,获取用户更为宏观的统计信息,与深度模型的分析结果进行全连接,进而全面分析用户的金融违约风险。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例的实施场景示意图;
图2示出根据一个实施例的评估金融违约风险的方法的流程图;
图3示出根据一个实施例的循环神经网络的处理示意图;
图4示出一个实施例中全连接神经网络的处理示意图;
图5示出另一实施例中全连接神经网络的处理示意图;
图6示出根据一个实施例的网络模型结构示意图;
图7示出根据一个实施例的评估装置的示意框图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
图1为本说明书披露的一个实施例的实施场景示意图。如图1所示,用户有可能通过网络,进行多种与借贷相关的行为,例如向各种商户申请借款,还款,申请延期还款等。相应地,商户对应的服务器可以记录用户的与借贷相关的行为记录。例如,用户通过支付宝下的“蚂蚁借呗”申请了一笔借款,然后每月还款,这时可以认为商户即为支付宝平台,那么在支付宝平台服务器中会记录用户的该借贷行为。用户还通过某电子借贷平台申请了一笔借款,那么该借贷平台即为对应商户,并且该借贷平台的服务器会记录用户的借贷行为。可以理解,取决于用户进行借贷的商户,记录用户借贷行为的服务器可以是集中的服务器,也可以分布式服务器,还可以是互相完全独立的多个服务器,在此不做限定。
为了对用户的金融违约风险进行评估,各个借贷平台会将用户的借贷行为数据经过整理之后提供给计算平台,由计算平台进行综合分析,确定出用户的违约风险。在说明书披露的实施例中,计算平台获取各个借贷商户所提供的用户行为相关数据之后,采用深度模型和广度模型相结合的构架,利用机器学习和循环神经网络,对这些数据进行全面分析,从而对金融风险进行评估。上述计算平台可以是任何具有计算、处理能力的装置、设备和系统,例如可以是服务器,它既可以作为独立的计算平台,也可以集成到记录用户借贷行为的某些服务器中。更具体地,计算平台一方面获取若干个短周期(例如1个月)的细粒度数据集,该细粒度数据集包括用户的各种与借贷行为相关的金额信息和商户信息,利用循环神经网络处理这些数据集,得到中间处理结果。另一方面,计算平台还获取用户在长周期的粗粒度统计信息作为广度特征,利用全连接的深度神经网络进一步处理这些统计信息和以上得到的中间处理结果,从而进行最终的金融风险评估。下面描述计算平台评估金融违约风险的具体过程。
图2示出根据一个实施例的评估金融违约风险的方法的流程图。该方法流程的执行主体可以是任何具有计算、处理能力的装置、设备和系统,例如图1中的计算平台。如图2所示,在该实施例中,评估金融违约风险的方法包括以下步骤:步骤21,获取数据集序列,包括按时间顺序排列的多个数据集,各数据集分别对应预设的第一时间段;所述多个数据集中的各个数据集包括,用户的与借贷行为相关的金额信息和商户信息;步骤22,利用循环神经网络处理所述数据集序列,获得第一输出结果;步骤23,获取与所述用户在第二时间段内的借贷行为相关的统计信息,所述第二时间段大于所述第一时间段;步骤24,利用全连接神经网络处理所述第一输出结果和所述统计信息,获得第二输出结果;以及步骤25,根据所述第二输出结果评估所述用户的金融违约风险。下面具体描述以上各个步骤的执行过程。
首先,在步骤21,获取数据集序列,其包括按时间顺序排列的多个数据集,各数据集分别对应预设的第一时间段;其中各个数据集包括,对应的第一时间段中,用户的与借贷行为相关的金额信息和商户信息。
在一个实施例中,上述第一时间段为相对较短的时间段,例如一周,半个月,一个月等。典型地,上述第一时间段为一个月。为了描述简单,在本文中又将该第一时间段称为短周期。针对这样的短周期,可以获取每个短周期内与用户的借贷行为有关的细粒度的信息,将这样的信息整理为一个数据集。具体地,针对每个短周期的细粒度数据集可以包括,对应短周期内与用户的借贷行为有关的金额信息和商户信息。
在一个实施例中,上述金额信息可以包括以下中的一项或多项:对应短周期内的新增借款金额、还款金额、订单金额、应还金额、逾期金额、总结欠金额等。例如,在3月份,用户在A借贷平台借款1万元,约定每月还款2500元,分四期完成还款;在4月份,该用户向A借贷平台还款2000元,同时还向B借贷平台借款5000元,约定每月还款1000元,分五期完成还款。那么,3月份对应的金额信息具体可以包括:新增借款金额1万元,订单金额1万,总结欠1万元;4月份对应的金额信息具体可以包括:新增借款金额5000元,还款金额2000元,订单金额15000元(1万元+5000元),应还金额2500元,逾期金额500元,总结欠金额13000元(15000-2000元)。金额信息还可以包含更多项的与借贷金额相关的数据。
此外,短周期对应的数据集还包括,对应时间段中用户的与借贷行为相关的商户信息。在一个实施例中,上述商户信息包括,与用户的借贷行为相关的商户ID。更具体地,与所述用户的借贷行为相关的商户ID可以包括以下中的一项或多项:用户申请借款的商户ID,用户借款成功的商户ID,用户借款失败的商户ID,用户履约的商户ID,用户违约的商户ID等。例如,在一个例子中,用户在3月份共向4个借贷平台A,B,C和D申请了借款,其中A,B,C平台同意了该用户的借款请求并放款,而D平台拒绝了用户的借款请求;在4月份,该用户又向E平台申请借款并成功,同时,按照约定向A,B平台还款,而对于已经借款的C平台,未能按时还款。那么针对该用户,其3月份数据集中的商户信息如下面的表1A所示,4月份的数据集中的商户信息如表1B所示。
表1A
表1B
在一个实施例中,为了便于机器模型更好地处理商户信息,对获得的商户信息进行预处理。在一个实施例中,上述预处理包括,通过词嵌入模型(embedding模型)将以上的商户ID转化为向量的形式,此处称为ID向量。
可以理解,词嵌入模型是自然语言处理NLP中用到的一种模型,用于将单个词转换为一个向量。在最简单的模型中,为每个单词构造一组特征作为其对应向量。更进一步地,为了体现单词之间的关系,例如类别关系,从属关系,可以采用各种方式训练语言模型,优化向量表达。例如,word2vec的工具中包含了多种词嵌入的方法,能够快速得到单词的向量表达,并且向量表达能够体现单词之间的类比关系。例如,单词“北京”与单词“中国”的对应向量之间的关系,与单词“巴黎”与单词“法国”的对应向量之间的关系相一致,如此,通过词向量体现对应的单词之间的类别和类比关系。还存在一些其他的词嵌入算法。
在商户信息的预处理中,可以根据需要,选取适当的词嵌入模型,将商户ID转换为对应的ID向量。如此,得到预处理的商户信息,在其中用不同的ID向量表示不同商户。例如,对于表1A和表1B所示的商户信息,通过词嵌入预处理,可以得到预处理后的商户信息,如表2A和表2B所示。
表2A
表2B
在表2A和2B中,和分别表示商户A,B,C,D,E对应的ID向量。如此,用向量的方式表征各个商户的商户ID。
在一个实施例中,对以上ID向量进行进一步处理。具体地,在同一数据集中,对所述用户的同类型借贷行为所针对的商户ID的ID向量求平均,获得各类型对应的均值向量,作为预处理的商户信息。例如,在某个数据集中,商户信息包括,用户向3个商户申请借款的行为,那么可以计算这3个商户的ID向量的平均值,作为申请借款这一类型对应的均值向量。表3A示出对表2A进行进一步处理,获取的各类型下的均值向量。
表3A
在表3A中,为ID向量的平均值,为ID向量 的平均值。如此,仅用一个向量表征一个类别下的商户ID信息。
在一个实施例中,在商户信息预处理过程中,对以上的均值向量进行进一步处理。具体地,在同一数据集中,对用户的不同类型的借贷行为中各个类型对应的均值向量求和,获得商户向量和。如前所述,经过向量均值处理,已经将用户的一个类型的借贷行为对应的商户ID处理为一个均值向量。进一步地,可以对不同类型借贷行为各自对应的均值向量进行求和,来获得商户向量和,作为预处理的商户信息。在一个例子中,将不同类型借贷行为中各个类型对应的均值向量简单求和,从而获得商户向量和。例如,对于表3A所示的商户信息,可以简单地将不同类型下的均值向量,即申请借款的商户ID的均值向量借款成功的商户ID的均值向量以及借款失败的商户ID的均值向量进行求和获得商户向量和在另一个例子中,为各个类型的借贷行为赋予一定权重,对各个类型的借贷行为对应的均值向量进行加权求和。仍以表3A为例,假定申请借款对应的权重因子为w1,借款成功对应的权重因子为w2,借款失败对应的权重因子为w3,那么在该例子中,商户向量和可以计算为通过这样的方式,用一个向量,即商户向量和,来综合地表征一个短周期内与用户的借贷行为相关的商户信息。如前所述,在词嵌入过程中,优选地使得转化的ID向量能够体现对应商户ID的类别关系。因此,对于商户ID的ID向量进行均值计算,以及进一步的求和计算,最终的结果能够从总体上反映,用户借贷行为相关的商户的平均特征和综合特征。
以上描述了对数据集中商户信息中的商户ID的处理。
在一个实施例中,商户信息还可以包括,用户的各类型借贷行为相关的商户数目。例如,基于表1A所示的3月份中各类型借贷行为对应的商户ID,可以确定出各借贷行为对应的商户数目,比如申请借款的商户数为4,借款成功的商户数为3,借款失败的商户数为1。这些有关商户数目的信息也可以包含在商户信息中。
除了以上的金额信息和商户信息,对应于短周期的数据集还可以包含更多与借贷行为相关的信息。例如,在一个实施例中,数据集中还可以包括与借贷行为相关的订单数目信息,比如借款订单数目,还款订单数据,履约订单数目等。
在一个实施例中,各个数据集还包括,用户在对应的时间段内的信用信息。该信用信息例如包括,芝麻信用分,第三方征信机构提供的信用评分,以及借贷商户可能调用的其他信用相关特征,例如交易活跃度、支付完成率等。
在更多实施例中,各个数据集还可以包括更多种细粒度的与用户借贷行为相关的数据信息。
对应于多个短周期的数据集可以构成一个具有先后时序的数据集序列。如前所述,在一个实施例中,上述数据集中的商户信息可以经过预处理,转化为不同层级的向量形式。这样的数据集序列可以输入到循环神经网络中进行处理。也就是,在步骤S22,利用循环神经网络处理多个数据集构成的数据集序列,获得中间结果,或称为第一输出结果。
可以理解,循环神经网络(RNN,Recurrent Neural Networks)是一种时间递归神经网络,可用于处理序列数据。在RNN中,一个序列当前的输出与其前面的输出相关联。具体的,RNN会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。也就是说,第t次的隐含层状态可以表示为:
St=f(U*Xt+W*St-1)
其中,Xt为第t次输入层的状态,St-1为第t-1次隐含层状态,f为计算函数,W,U为权重。如此,RNN将之前的状态循环回当前输入,考虑了历史输入的影响,因而适合于具有时序的数据序列。
在一个实施例中,在步骤22,采用多层RNN来处理上述数据集序列。
更进一步地,在一个实施例中,在RNN架构下,采用长短期记忆模型(LSTM,LongShort Term Memory)进行处理。
如前所述,在RNN中当前隐含层状态依赖于之前的状态输出,因此在处理长期记忆的情况下,需要将当前的隐含态的计算与前n次的计算关联,即St=f(U*Xt+W1*St-1+W2*St-2+…+Wn*St-n)。随着n的增大,计算量呈指数式增长,导致模型训练的时间大幅增加。为此,提出LSTM模型来解决长期依赖的问题。
在LSTM模型中,通过设置让信息选择性通过的“遗忘门”来丢弃某些不再需要的信息,如此对输入的不必要的干扰信息进行判断和屏蔽,从而更好地对长期数据进行分析处理。
在一个实施例中,采用多层叠加的LSTM模型来处理多个数据集构成的数据集序列。
图3示出根据一个实施例的循环神经网络的处理示意图。在图3的例子中,短周期采取一个月,从而可以获取每个月对应的数据集,各个数据集中包括当月用户的与借贷行为有关的信息,包括金额信息,商户信息,订单信息等。这样的连续6个月的数据集构成一个数据集序列。对于这样的数据集序列,可选地,在一个例子中,在输入层对各个数据集中的商户信息进行预处理。预处理可以包括如上所述的ID向量化,求均值向量,求商户向量和中的至少一部分,还可以包括更多的预处理方式。图中条形框中的每个圆圈示意性地对应数据集中的一项特征。经过预处理的数据集序列被输入到循环神经网络RNN进行处理。在图3的例子中,循环神经网络包括多层叠加的LSTM模型,图3示例中每一纵列的LSTM块对应于一个月的数据集。经过多层RNN的处理,可以获得中间处理结果。
除了如上所述获得各个短周期内的细粒度借贷行为数据之外,另一方面,在步骤23,还获取与用户在第二时间段内的借贷行为相关的统计信息,该第二时间段大于步骤21中的第一时间段。如果将第一时间段称为短周期的话,在本文中对应地将第二时间段称为长周期。一般地,长周期可以是短周期的若干倍数。例如,在短周期典型地为一个月的情况下,长周期可以是例如3个月,6个月,或12个月。相应地,在步骤23中,获取用户在3/6/12个月中与借贷行为相关的统计信息。这样的统计信息可以包括,借款总金额,借款总次数,还款总金额等。相比于步骤21中获得的数据集中的各种具体信息,步骤23中的统计信息是更加粗粒度的综合信息。
在此基础上,在步骤24,将步骤22获得的、循环神经网络输出的中间结果,和步骤23获得的长周期内粗粒度的统计信息,共同输入到全连接神经网络进行处理。
可以理解,在全连接神经网络中,每一个节点都与上一层的所有节点相连,用于把前边提取到的所有特征综合起来。相应地,在步骤24,利用全连接神经网络,对输入的统计信息和中间结果进行全面关联分析,从而提供全连接输出,即第二输出。
基于这样的全连接输出,在步骤25,可以确定用户的金融违约风险。在一个实施例中,全连接神经网络对输入数据进行分析处理后,可以输出该用户未来的金融违约概率。于是可以基于该金融违约概率确定用户的金融违约风险。在另一实施例中,全连接神经网络可以输出用户的各类型行为的风险指数,例如借贷风险指数,透支风险指数,购买先享后付类服务的风险指数等等。在步骤25,可以根据需要,确定用户的各类型行为的风险指数以及综合金融违约风险。在又一实施例中,全连接神经网络可以输出针对不同类型商户的风险指数。相应地,在步骤25,可以根据需要,确定针对不同商户的金融违约风险,以及综合金融违约风险。可以理解,全连接神经网络的输出结果的具体形式,取决于对全连接神经网络,以及循环神经网络的训练过程。
在一个实施例中,为了更全面地对用户进行评估,还获取上述用户的属性特征,例如年龄、性别、地域、职业、学历等等。将用户的属性特征,和上述的中间结果和统计信息一起,共同输入到全连接神经网络进行进一步处理。
图4示出一个实施例中全连接神经网络的处理示意图。在图4的示意图中,全连接神经网络的输入包含3个部分,第一部分为图3的循环神经网络所输出的中间结果,第二部分为用户长周期的统计信息,第三部分为用户的属性特征。在图4的例子中,全连接神经网络是2层全连接网络,所有数据输入到第一层,第一层的处理结果输入到第二层,第二层的每一个节点都与第一层的所有节点相连。第二层输出的结果可以用于评估用户的金融违约风险。
图5示出另一实施例中全连接神经网络的处理示意图。在图5的示意图中,全连接神经网络为多层全连接神经网络,其中,图3的循环神经网络输出的中间结果与用户的属性特征一起,输入到多层全连接神经网络的第一层,而用户的长周期的统计信息输入到该网络的最后一层。这是因为,用户的属性特征相对比较泛化,需要与别的特征结合做全连接。因此,将用户的属性特征与中间结果一起输入到网络的第一层。而用户的统计信息具有独立而明确的特征,直接将其输入到最后一层,也就是最外层,更方便全连接神经网络的训练和调试。
图6示出根据一个实施例的网络模型结构示意图。可以理解,图6将图3的循环神经网络与图5的全连接神经网络结合在一起,示出了图2方法中数据的总体处理结构。通过图6可以看到,在该实施例的方法中,采用了深度模型和广度模型相结合的架构。具体地,采用循环神经网络作为深度模型,对用户的多个短周期中细粒度的数据集进行深度分析,充分利用用户借贷行为中的时序特征,反映用户的借贷状态的变化。广度模型基于用户长周期的统计特征,获取用户更为宏观的统计信息,与深度模型的分析结果进行全连接,进而全面分析用户的金融违约风险。并且,在深度模型分析中,输入的数据集中包含商户信息的特征,从而在金融风险分析中引入了商户的风控能力和客群特征,可以增加模型对风险的区分度。
根据另一方面的实施例,还提供一种评估金融违约风险的装置。图7示出根据一个实施例的评估装置的示意框图。如图7所示,用于评估金额违约风险的装置700包括:数据集获取单元71,配置为获取数据集序列,其包括按时间顺序排列的多个数据集,各数据集分别对应预设的第一时间段;所述多个数据集中的各个数据集包括用户的与借贷行为相关的金额信息和商户信息;第一处理单元72,配置为利用循环神经网络处理所述数据集序列,获得第一输出结果;统计信息获取单元73,配置为获取与所述用户在第二时间段内的借贷行为相关的统计信息,所述第二时间段大于所述第一时间段;第二处理单元74,配置为利用全连接神经网络处理所述第一输出结果和所述统计信息,获得第二输出结果;评估单元75,配置为根据所述第二输出结果评估所述用户的金融违约风险。
在一个实施例中,所述商户信息包括,与所述用户的借贷行为相关的商户ID。
进一步地,在一个例子中,与所述用户的借贷行为相关的商户ID包括以下中的一项或多项:用户申请借款的商户ID,用户借款成功的商户ID,用户借款失败的商户ID,用户履约的商户ID,用户违约的商户ID。
在一个实施例中,装置700还包括预处理单元711,配置为对所述商户信息进行预处理,所述预处理包括:通过词嵌入模型将所述商户ID转化为ID向量。
进一步地,在一个实施例中,所述预处理单元711还配置为:在同一数据集中,对所述用户的同类型借贷行为所针对的商户ID的ID向量求平均,获得各类型对应的均值向量;将所述均值向量包含在预处理的商户信息中。
更进一步地,在一个实施例中,所述预处理单元711还配置为:对所述用户的不同类型的借贷行为中各个类型对应的所述均值向量求和,获得商户向量和;将所述商户向量和包含在预处理的商户信息中。
根据一种实施方式,在一个实施例中,商户信息还可以包括,用户的各类型借贷行为相关的商户数目。
除了以上的金额信息和商户信息,在一个实施例中,以上数据集还可以包含与借贷行为相关的订单数目信息。在另一实施例中,以上数据集还包括用户在对应的第一时间段内的信用信息。
根据一个实施例,上述装置700还包括属性特征获取单元(未示出),配置为获取所述用户的属性特征信息。相应地,第二处理单元74配置为:将所述第一输出结果、所述统计信息和所述属性特征信息输入所述全连接神经网络,获得第二输出结果。
进一步地,在一个实施例中,所述第二处理单元74还配置为:将所述第一输出结果和所述属性特征信息输入所述多层全连接神经网络的第一层,将所述统计信息输入所述全连接神经网络的最后一层。
根据一个实施例,所述循环神经网络包括多层叠加的长短期记忆模型LSTM。
可以看到,以上的装置700采用了深度模型和广度模型相结合的方式,评估用户的金融违约风险。具体地,采用循环神经网络作为深度模型,对用户的多个短周期中细粒度的数据集进行深度分析。广度模型基于用户长周期的统计特征,获取用户更为宏观的统计信息,与深度模型的分析结果进行全连接,进而全面分析用户的金融违约风险。并且,在深度模型分析中,输入的数据集中包含商户信息的特征,从而在金融风险分析中引入了商户的风控能力和客群特征,可以增加模型对风险的区分度。
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所述的方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (22)
1.一种评估金融违约风险的方法,包括:
获取数据集序列,所述数据集序列包括按照时间顺序排列的多个数据集,各数据集分别对应预设的第一时间段;所述多个数据集中的各个数据集包括用户的与借贷行为相关的金额信息和商户信息;
利用循环神经网络处理所述数据集序列,获得第一输出结果;
获取与所述用户在第二时间段内的借贷行为相关的统计信息,所述第二时间段大于所述第一时间段;
利用全连接神经网络处理所述第一输出结果和所述统计信息,获得第二输出结果;
根据所述第二输出结果评估所述用户的金融违约风险。
2.根据权利要求1所述的方法,其中所述商户信息包括,与所述用户的借贷行为相关的商户ID。
3.根据权利要求2所述的方法,其中与所述用户的借贷行为相关的商户ID包括以下中的一项或多项,用户申请借款的商户ID,用户借款成功的商户ID,用户借款失败的商户ID,用户履约的商户ID,用户违约的商户ID。
4.根据权利要求2所述的方法,还包括:对所述商户信息进行预处理,所述预处理包括:通过词嵌入模型将所述商户ID转化为ID向量。
5.根据权利要求4所述的方法,其中所述预处理还包括:
在同一数据集中,对所述用户的同类型借贷行为所针对的商户ID的ID向量求平均,获得各类型对应的均值向量;
将所述均值向量包含在预处理的商户信息中。
6.根据权利要求5所述的方法,其中所述预处理还包括:
对所述用户的不同类型的借贷行为中各个类型对应的所述均值向量求和,获得商户向量和;
将所述商户向量和包含在预处理的商户信息中。
7.根据权利要求1所述的方法,其中所述多个数据集中的各个数据集还包括,用户在对应的第一时间段内的信用信息。
8.根据权利要求1所述的方法,还包括,获取所述用户的属性特征信息,所述利用全连接神经网络处理所述第一输出结果和所述统计信息,获得第二输出结果,包括:将所述第一输出结果、所述统计信息和所述属性特征信息输入所述全连接神经网络,获得第二输出结果。
9.根据权利要求8所述的方法,其中所述全连接神经网络为多层全连接神经网络,其中将所述第一输出结果、所述统计信息和所述属性特征信息输入所述全连接神经网络包括:将所述第一输出结果和所述属性特征信息输入所述多层全连接神经网络的第一层,将所述统计信息输入所述全连接神经网络的最后一层。
10.根据权利要求1-9中任一项所述的方法,其中所述循环神经网络包括多层叠加的长短期记忆模型LSTM。
11.一种评估金融违约风险的装置,包括:
数据集获取单元,配置为获取数据集序列,所述数据集序列包括按照时间顺序排列的多个数据集,各数据集分别对应预设的第一时间段,所述多个数据集中的各个数据集包括,用户的与借贷行为相关的金额信息和商户信息;
第一处理单元,配置为利用循环神经网络处理所述数据集序列,获得第一输出结果;
统计信息获取单元,配置为获取与所述用户在第二时间段内的借贷行为相关的统计信息,所述第二时间段大于所述第一时间段;
第二处理单元,配置为利用全连接神经网络处理所述第一输出结果和所述统计信息,获得第二输出结果;
评估单元,配置为根据所述第二输出结果评估所述用户的金融违约风险。
12.根据权利要求11所述的装置,其中所述商户信息包括,与所述用户的借贷行为相关的商户ID。
13.根据权利要求12所述的装置,其中与所述用户的借贷行为相关的商户ID包括以下中的一项或多项,用户申请借款的商户ID,用户借款成功的商户ID,用户借款失败的商户ID,用户履约的商户ID,用户违约的商户ID。
14.根据权利要求12所述的装置,还包括预处理单元,配置为对所述商户信息进行预处理,所述预处理包括:通过词嵌入模型将所述商户ID转化为ID向量。
15.根据权利要求14所述的装置,其中所述预处理单元还配置为:
在同一数据集中,对所述用户的同类型借贷行为所针对的商户ID的ID向量求平均,获得各类型对应的均值向量;
将所述均值向量包含在预处理的商户信息中。
16.根据权利要求15所述的装置,其中所述预处理单元还配置为:
对所述用户的不同类型的借贷行为中各个类型对应的所述均值向量求和,获得商户向量和;
将所述商户向量和包含在预处理的商户信息中。
17.根据权利要求11所述的装置,其中所述多个数据集中的各个数据集还包括,用户在对应的第一时间段内的信用信息。
18.根据权利要求11所述的装置,还包括,属性特征获取单元,配置为获取所述用户的属性特征信息,所述第二处理单元配置为:将所述第一输出结果、所述统计信息和所述属性特征信息输入所述全连接神经网络,获得第二输出结果。
19.根据权利要求18所述的装置,其中所述第二处理单元配置为:将所述第一输出结果和所述属性特征信息输入所述多层全连接神经网络的第一层,将所述统计信息输入所述全连接神经网络的最后一层。
20.根据权利要求11-19中任一项所述的装置,其中所述循环神经网络包括多层叠加的长短期记忆模型LSTM。
21.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-10中任一项的所述的方法。
22.一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-10中任一项所述的方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810050531.XA CN108416663A (zh) | 2018-01-18 | 2018-01-18 | 评估金融违约风险的方法及装置 |
TW107144310A TW201933260A (zh) | 2018-01-18 | 2018-12-10 | 評估金融違約風險的方法及裝置 |
PCT/CN2019/071088 WO2019141125A1 (zh) | 2018-01-18 | 2019-01-10 | 评估金融违约风险的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810050531.XA CN108416663A (zh) | 2018-01-18 | 2018-01-18 | 评估金融违约风险的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108416663A true CN108416663A (zh) | 2018-08-17 |
Family
ID=63126182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810050531.XA Pending CN108416663A (zh) | 2018-01-18 | 2018-01-18 | 评估金融违约风险的方法及装置 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN108416663A (zh) |
TW (1) | TW201933260A (zh) |
WO (1) | WO2019141125A1 (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615454A (zh) * | 2018-10-30 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 确定用户金融违约风险的方法及装置 |
CN109711848A (zh) * | 2018-12-28 | 2019-05-03 | 武汉金融资产交易所有限公司 | 一种金融交易的匹配系统及其构建方法、匹配方法 |
WO2019141125A1 (zh) * | 2018-01-18 | 2019-07-25 | 阿里巴巴集团控股有限公司 | 评估金融违约风险的方法及装置 |
CN111191677A (zh) * | 2019-12-11 | 2020-05-22 | 北京淇瑀信息科技有限公司 | 用户特征数据生成方法、装置及电子设备 |
CN111723200A (zh) * | 2019-03-20 | 2020-09-29 | 京东数字科技控股有限公司 | 一种确定用户行为特征的方法及系统 |
CN112184431A (zh) * | 2020-11-09 | 2021-01-05 | 上海优扬新媒信息技术有限公司 | 用户风险确定方法和装置 |
CN112801563A (zh) * | 2021-04-14 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 风险评估方法和装置 |
CN113283583A (zh) * | 2021-05-18 | 2021-08-20 | 广州致景信息科技有限公司 | 纺织行业违约率预测方法、装置、存储介质及处理器 |
CN113516548A (zh) * | 2021-05-14 | 2021-10-19 | 牛少侠科技(山西)有限公司 | 一种基于区块链的金融借贷方法及系统 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110796240A (zh) * | 2019-10-31 | 2020-02-14 | 支付宝(杭州)信息技术有限公司 | 一种训练方法、特征提取方法、装置及电子设备 |
CN113191871B (zh) * | 2021-02-25 | 2024-01-16 | 华夏方圆信用评估有限公司 | 智能信用交易履约监控方法及系统 |
CN113159915B (zh) * | 2021-02-25 | 2023-12-01 | 华夏方圆信用评估有限公司 | 基于大数据的智能金融信用动态评估方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107153977A (zh) * | 2016-03-02 | 2017-09-12 | 阿里巴巴集团控股有限公司 | 网上交易平台中交易实体信用评估方法、装置及系统 |
CN107316198B (zh) * | 2016-04-26 | 2020-05-29 | 阿里巴巴集团控股有限公司 | 账户风险识别方法及装置 |
CN107424070A (zh) * | 2017-03-29 | 2017-12-01 | 广州汇融易互联网金融信息服务有限公司 | 一种基于机器学习的贷款用户信用评级方法及系统 |
CN108416663A (zh) * | 2018-01-18 | 2018-08-17 | 阿里巴巴集团控股有限公司 | 评估金融违约风险的方法及装置 |
-
2018
- 2018-01-18 CN CN201810050531.XA patent/CN108416663A/zh active Pending
- 2018-12-10 TW TW107144310A patent/TW201933260A/zh unknown
-
2019
- 2019-01-10 WO PCT/CN2019/071088 patent/WO2019141125A1/zh active Application Filing
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019141125A1 (zh) * | 2018-01-18 | 2019-07-25 | 阿里巴巴集团控股有限公司 | 评估金融违约风险的方法及装置 |
TWI759620B (zh) * | 2018-10-30 | 2022-04-01 | 開曼群島商創新先進技術有限公司 | 確定用戶金融違約風險的方法及裝置與電腦可讀儲存媒體及計算設備 |
WO2020088007A1 (zh) * | 2018-10-30 | 2020-05-07 | 阿里巴巴集团控股有限公司 | 确定用户金融违约风险的方法及装置 |
CN109615454A (zh) * | 2018-10-30 | 2019-04-12 | 阿里巴巴集团控股有限公司 | 确定用户金融违约风险的方法及装置 |
CN109711848A (zh) * | 2018-12-28 | 2019-05-03 | 武汉金融资产交易所有限公司 | 一种金融交易的匹配系统及其构建方法、匹配方法 |
CN111723200A (zh) * | 2019-03-20 | 2020-09-29 | 京东数字科技控股有限公司 | 一种确定用户行为特征的方法及系统 |
CN111191677A (zh) * | 2019-12-11 | 2020-05-22 | 北京淇瑀信息科技有限公司 | 用户特征数据生成方法、装置及电子设备 |
CN111191677B (zh) * | 2019-12-11 | 2023-09-26 | 北京淇瑀信息科技有限公司 | 用户特征数据生成方法、装置及电子设备 |
CN112184431A (zh) * | 2020-11-09 | 2021-01-05 | 上海优扬新媒信息技术有限公司 | 用户风险确定方法和装置 |
CN112801563B (zh) * | 2021-04-14 | 2021-08-17 | 支付宝(杭州)信息技术有限公司 | 风险评估方法和装置 |
CN112801563A (zh) * | 2021-04-14 | 2021-05-14 | 支付宝(杭州)信息技术有限公司 | 风险评估方法和装置 |
CN113516548A (zh) * | 2021-05-14 | 2021-10-19 | 牛少侠科技(山西)有限公司 | 一种基于区块链的金融借贷方法及系统 |
CN113283583A (zh) * | 2021-05-18 | 2021-08-20 | 广州致景信息科技有限公司 | 纺织行业违约率预测方法、装置、存储介质及处理器 |
Also Published As
Publication number | Publication date |
---|---|
WO2019141125A1 (zh) | 2019-07-25 |
TW201933260A (zh) | 2019-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108416663A (zh) | 评估金融违约风险的方法及装置 | |
CN109977151B (zh) | 一种数据分析方法及系统 | |
CN109345260A (zh) | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 | |
CN109410036A (zh) | 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置 | |
CN112396189B (zh) | 一种多方构建联邦学习模型的方法及装置 | |
CN108734338A (zh) | 基于lstm模型的信用风险预测方法及装置 | |
JP6098982B2 (ja) | 情報処理装置及び情報処理方法 | |
CN108399509A (zh) | 确定业务请求事件的风险概率的方法及装置 | |
CN107767021A (zh) | 一种风险控制方法及设备 | |
CN106447434A (zh) | 个人信用生态平台 | |
CN108898476A (zh) | 一种贷款客户信用评分方法和装置 | |
CN109102393A (zh) | 训练和使用关系网络嵌入模型的方法及装置 | |
CN110084603A (zh) | 训练欺诈交易检测模型的方法、检测方法以及对应装置 | |
CN108446978A (zh) | 处理交易数据的方法及装置 | |
CN111260462A (zh) | 一种基于异质关系网络注意力机制的交易欺诈检测方法 | |
TWI752349B (zh) | 風險識別方法及裝置 | |
KR102246782B1 (ko) | 상거래데이터를 이용한 ai기반의 평가모델을 포함하는 기업의 채무상환능력 평가시스템 | |
CN108985929A (zh) | 训练方法、业务数据分类处理方法及装置、电子设备 | |
CN110276679A (zh) | 一种面向深度学习的网络个人信贷欺诈行为检测方法 | |
CN110222733A (zh) | 一种高精度的多阶神经网络分类方法及系统 | |
CN110472050A (zh) | 一种团伙聚类方法和装置 | |
Eddy et al. | Credit scoring models: Techniques and issues | |
Wilcox | Organizational learning within a learning classi er system | |
CN115204901A (zh) | 基于多特征融合的信用卡欺诈检测方法、装置及介质 | |
CN110473039A (zh) | 评估用户的信用风险的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1258554 Country of ref document: HK |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180817 |