一种信用风险评估方法、装置和电子设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种信用风险评估方法、装置和电子设备。
背景技术
随着经济的快速发展,以及金融业的业务开放,个人信贷业务的需求不断增长。无论是银行、贷款公司,还是其它设置有合法信贷业务的机构,都面临着对申请信贷业务的用户的信用风险进行评估的问题。
在信用风险的评估时,需要对与用户信贷相关的数据进行充分挖掘和探索,然而,目前的信用风险评估方案中,所使用的与用户信贷相关的数据并不完整,导致信用风险评估不准确,进而造成对不良资质的用户进行授信,最终资金损失无法收回,以及对于资质良好的用户拒绝授信,导致其无法享受到信贷服务。
发明内容
本说明书实施例的目的是提供一种信用风险评估方法、装置和电子设备,用以有效提升信用风险评估准确性。
为解决上述技术问题,本说明书实施例是这样实现的:
第一方面,提出了一种信用风险评估方法,包括:
获取目标信贷产品的多个用户的历史相关数据;
基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息;
基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征,其中,所述目标节点的注意力特征用于表征所述多个用户中目标用户的信用风险评分;
基于所述信用风险评分对所述目标用户进行信用风险评估。
第二方面,提出了一种信用风险评估装置,包括:
获取模块,获取目标信贷产品的多个用户的历史相关数据;
第一确定模块,基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息;
第二确定模块,基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征,其中,所述目标节点的注意力特征用于表征所述多个用户中目标用户的信用风险评分;
评估模块,基于所述信用风险评分对所述目标用户进行信用风险评估。
第三方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取目标信贷产品的多个用户的历史相关数据;
基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息;
基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征,其中,所述目标节点的注意力特征用于表征所述多个用户中目标用户的信用风险评分;
基于所述信用风险评分对所述目标用户进行信用风险评估。
第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取目标信贷产品的多个用户的历史相关数据;
基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息;
基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征,其中,所述目标节点的注意力特征用于表征所述多个用户中目标用户的信用风险评分;
基于所述信用风险评分对所述目标用户进行信用风险评估。
由以上本说明书实施例提供的技术方案可见,采用图注意力网络对目标信贷产品的多个用户的历史相关数据进行分析,进而,得到位于图注意力网络中用于表征目标用户的信用风险评分的目标节点的注意力特征,从而,提升信用风险评估的准确性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书的一个实施例提供的信用风险评估方法的步骤示意图。
图2是本说明书的再一个实施例提供的信用风险评估方法的步骤示意图。
图3是本说明书的一个实施例提供的违约概率与签约时长的Vintage分析曲线示意图。
图4是本说明书的一个实施例提供的两种不同的注意力处理方式。
图5是本说明书的一个实施例提供的信用风险评估网络图。
图6是本说明书的一个实施例提供的电子设备的结构示意图。
图7是本说明书的一个实施例提供的信用风险评估装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
实施例一
参照图1所示,为本说明书实施例提供的信用风险评估方法的步骤示意图,所述方法可以包括以下步骤:
S102:获取目标信贷产品的多个用户的历史相关数据。
其中,所述目标信贷产品可以是银行或信贷机构向用户合法发放的贷款业务或与贷款相关的业务。
在基于目标信贷产品对目标用户进行信用风险评估时,需要从所属该目标信贷产品的多个用户(这多个用户包含目标用户)中,获取已参与该目标信贷产品后所产生的历史相关数据。
S104:基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息。
所述历史相关数据可以是与参与所述目标信贷产品的多个用户相关的数据,至少可以包括:用户特征、违约标签、关系网络、用户账龄。
其中,用户特征可以至少包括以下之一或组合:年龄、城市、登录行为、交易行为、设备特征、银行卡特征、还款能力特征、还款意愿特征等;
违约标签可以包括:申请信贷产品后是否出现逾期行为:有逾期行为是黑,即违约,无逾期行为是白,即未违约;
关系网络可以包括:用户之间是否存在关联,关联介质如:同证件、设备、资金往来、通讯录记录、手机通话、社交关系等;
用户账龄可以包括:用户当前借贷时长。
相应地,S104在基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息时,可以具体执行为:
第一步,基于所述用户特征以及所述违约标签,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息。
所述节点信息包括:节点,以及节点特征,其中,多个用户中的每个用户可以视为图注意力网络中的一个节点,而该用户的用户特征以及违约标签可以视为图注意力网络中相应节点的节点特征。
在具体实现时,可以基于多个用户中的每个用户分别确定图注意力网络中的相应节点,并基于用户特征以及违约标签,确定每个节点的节点特征。一种可实现的方式,分别从用户特征以及违约标签提取特征向量,构成预设维度的节点特征。其中,节点特征的维度根据节点对应的用户所包含的用户特征的个数确定。例如,用户特征为F-1维,那么,节点特征的维度可以为F维。当存在M个节点(即对应M个用户)时,图注意力网络中的节点特征可以为M×F维矩阵。其中,M与F均为正整数。
第二步,基于所述违约标签、所述关系网络以及所述用户账龄,确定所述目标信贷产品对应的图注意力网络中用于表征用户之间关联关系的的边信息。
可选地,所述边信息包括:边、以及边对应的权重;
相应地,该第二步在基于所述违约标签、所述关系网络以及所述用户账龄,确定所述目标信贷产品对应的图注意力网络中用于表征用户之间关联关系的的边信息时,可以具体包括:
基于所述关系网络,确定所述目标信贷产品对应的图注意力网络中的边;
基于所述违约标签以及所述用户账龄,采用账龄Vintage分析和贝叶斯估计,确定所述目标信贷产品对应的图注意力网络中的边对应的权重。
其中,可以根据目标信贷产品的多个用户中用户之间是否存在通证件关联、通讯录关联、资金关联等关联关系,确定目标信贷产品对应的图注意力网络中的边。假设,多个用户中用户A与用户B存在资金往来,那么,用户A对应的节点与用户B对应的节点之间存在边;用户B与用户C之间有通讯往来,那么,用户B对应的节点与用户C对应的节点之间也存在边。
可选地,参照图2所示,在基于所述违约标签以及所述用户账龄,采用Vintage分析和贝叶斯估计,确定所述目标信贷产品对应的图注意力网络中的边对应的权重时,可以具体包括:
S202:基于所述违约标签以及所述用户账龄,采用Vintage分析确定用户在所述用户账龄违约的先验概率。
具体实现时,可参照图3所示的违约概率与签约时长(即用户账龄)的Vintage分析曲线示意图,图中违约概率的取值范围为0-1,签约时长以月为单位,取值范围为0-12月。其实,用户账龄也可以以年或者星期等为单位。通过Vintage分析可以确定用户在不同用户账龄的违约概率,也就是所述先验概率。
S204:基于所述用户账龄以及所述先验概率,采用贝叶斯估计确定用户在所述用户账龄未违约以及所述用户账龄之后未违约的后验概率。
可选地,S204在基于所述用户账龄以及所述先验概率,采用贝叶斯估计确定用户在所述用户账龄未违约以及所述用户账龄之后未违约的后验概率时,可以具体包括:
所述后验概率等于1减去用户在所述用户账龄未违约以及所述用户账龄之后违约的概率;
其中,用户在所述用户账龄未违约以及所述用户账龄之后违约的概率,包括:1减去用户在所述用户账龄之后违约的概率的差值与所述多个用户违约的总概率的乘积,与1减去用户在所述用户账龄违约的概率的差值的比值。
例如,S204可以采用以下贝叶斯估计公式来确定用户在所述用户账龄未违约以及所述用户账龄之后未违约的后验概率:
其中,P(Y=0|Y=0,X=k)表示用户在所述用户账龄未违约以及所述用户账龄之后未违约的后验概率;Y表示用户的违约标签,这里定义Y=0表示用户未违约,Y=1表示用户违约;X表示用户账龄(假设以一年作为一个贷款周期,按月进行Vintage分析),X=k表示用户账龄为k个月,k≥1且k≤12。P(Y=1)表示全部用户总体的违约概率;P(Y=1,X=k)表示用户在第k个月的违约概率;P(Y=1,X≥k|Y=1)表示用户在第k个月以后的违约概率。
S206:将所述后验概率确定为所述目标信贷产品对应的图注意力网络中的边对应的权重。
其实,在针对每个用户,即节点,均可以确定一个后验概率,这样,所述目标信贷产品对应的图注意力网络中的任意一个边可以对应两个节点的后验概率,即一个边可以对应两个权重。而在实际使用时,一般可以关注与目标用户对应的目标节点相关联的邻居节点的后验概率。
由此,通过Vintage分析以及贝叶斯估计,对不同用户账龄的用户进行区分,从而,可以区分对待用户账龄较短的违约用户以及用户账龄较长的违约用户,避免将用户账龄较短的违约用户以及用户账龄较长的违约用户无差别的视为同一类型的白样本,规避样本不足而导致的信用风险评估不准确的问题。
S106:基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征,其中,所述目标节点的注意力特征用于表征所述多个用户中目标用户的信用风险评分。
可选地,S106在基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征时,可以具体包括:
基于所述节点信息以及所述边信息,确定与所述目标用户相关的关联用户对所述目标用户的注意力特征,其中,所述关联用户包括所述目标用户以及所述多个用户中除所述目标用户以外的其它用户;
聚合与所述目标用户相关的关联用户对所述目标用户的注意力特征,得到所述目标用户的注意力特征。
应理解,图注意力网络是一种基于注意力机制的节点分类网络,其基本思想是根据优化目标节点自动地选择有用的邻居节点,结合目标节点在其邻居节点上的注意力系数对目标节点的表示进行更新。
图注意力网络(Graph Attention Network,GAT)的核心是图注意力层(GraphAttention Layer,GAL),图注意力层的输入为上述确定的节点信息中的节点特征以及边信息中的权重,其中,节点特征可以是M*F维度的矩阵,M为节点个数,F为用户特征加上违约标签的维度;图注意力层的输出为生成的新节点特征,即M*F’维度矩阵,即本说明书实施例所希望得到的信用风险评分。
为了对输入的节点特征进行转化,可以将通过图注意力网络学习所得的权重矩阵W(该权重矩阵W不同于前面通过后验概率定义的权重)应用于每一个节点,即与相应的节点特征相乘。其中,权重矩阵的维度与节点特征的维度适配以便于可以实现矩阵相乘。基于权重矩阵W及节点特征计算可得注意力系数,注意力系数即节点j的特征在节点i上的重要性;之后,可以使用softmax函数对注意力系数进行正态化,得到注意力函数。
其中,公式2中eij表示节点j对节点i的注意力系数;a表示注意力机制;W表示权重矩阵;表示节点i的节点特征;表示节点j的节点特征。
αij=softmaxj(eij) (公式3)
其中,公式3中αij表示节点j对节点i的注意力函数;该注意力函数中softmax函数可以是e指数形式的函数,具体参照公式4,或是其它形式,本说明书并不对此进行具体限定。
在图4中,示出了两种不同的注意力处理方式,即左图所示的单头注意力和右图所示的多头注意力。
在左图所示的单头注意力机制中,以节点i作为目标节点,那么,该目标节点与节点j以及自身节点的注意力特征相关,最终输出由注意力系数以及确定的注意力特征,即
在右图所示的多头注意力机制中,以节点1作为目标节点,该目标节点与多个邻居节点2-6以及自身节点的注意力特征相关,最终输出由注意力系数 和确定的注意力特征,而且,需要说明的是,右图中的多头注意力机制中,还涉及到三种独立的计算方式,具有关联关系的节点之间通过三个曲线相连,每条曲线代表一种计算方式(其实每种计算方式对应一个注意力层)。那么,在最终确定节点1的注意力特征时,即节点1的输出节点特征时,需要分别基于每种计算方式计算得到邻居节点对目标节点的注意力特征,然后进行聚合得到
一种可实现的实施例,所述关联用户对所述目标用户的注意力特征包括:
非线性函数,与关联用户对所述目标用户在第N个注意力层的注意力函数,所述目标用户在第N个注意力层的权重矩阵,以及关联用户的节点特征矩阵的乘积;
其中,所述关联用户对所述目标用户在第N个注意力层的注意力函数,包括:
关联用户对所述目标用户在第N个注意力层的注意力系数经过正态化处理的结果;所述关联用户对所述目标用户在第N个注意力层的注意力系数是第N个注意力层的注意力机制与目标用户在第N个注意力层的权重矩阵的乘积,以及与节点特征矩阵的乘积,所述节点特征矩阵包括关联用户的节点特征矩阵与目标用户的节点特征矩阵;
关联用户的节点特征矩阵是通过所述关联用户的节点特征以及所述关联用户的后验概率所组成的矩阵;
所述N为正整数。
另一种可实现的实施例,所述关联用户对所述目标用户的注意力特征包括:
非线性函数,与关联用户的后验概率,关联用户对所述目标用户在第N个注意力层的注意力函数,所述目标用户在第N个注意力层的权重矩阵,以及关联用户在第N个注意力层的特征矩阵的乘积;
其中,所述关联用户对所述目标用户在第N个注意力层的注意力函数,包括:
关联用户对所述目标用户在第N个注意力层的注意力系数经过正态化处理的结果;所述关联用户对所述目标用户在第N个注意力层的注意力系数是第N个注意力层的注意力机制与目标用户在第N个注意力层的权重矩阵的乘积,以及与节点特征矩阵的乘积,所述节点特征矩阵包括关联用户的节点特征矩阵与目标用户的节点特征矩阵;
关联用户的节点特征矩阵是通过所述关联用户的节点特征所组成的矩阵;
所述N为正整数。
具体实现时,无论是上述哪种方式,都可以参照公式5:
其中,σ表示非线性函数,表示节点j对目标节点i在第N个注意力层的注意力函数,WN表示目标节点i在第N个注意力层的权重矩阵,表示节点j的节点特征矩阵;Pj表示节点j的后验概率。
可选地,在聚合与所述目标用户相关的关联用户对所述目标用户的注意力特征时,可具体包括:
采用连接或加权平均的方式,聚合与所述目标用户相关的关联用户对所述目标用户的注意力特征。
进一步,参照以下公式6和公式7,所述图注意力网络中目标节点的注意力特征可表示为:
其中,公式6采用了连接公式进行聚合,而公式7采用了加权均值公式进行聚合。
应理解,输出的新的节点特征,即目标节点的注意力特征可以表示信用风险评分,具体可以对该特征向量进行归一化处理。
S108:基于所述信用风险评分对所述目标用户进行信用风险评估。
在得到信用风险评分后,可以基于初始定义违约时的规则,若违约标签是1,未违约标签是0,那么,当得到的信用风险评分的分值较大时,表示高风险,反之,表示低风险。若定义违约标签是0,未违约标签是1,那么,当得到的信用风险评分的分值较大时,表示低风险,反之,表示高风险。
具体可结合图5所示的信用风险评估网络图,其中,该图中示出多个用户,其中,位于正中间位置处的用户A为目标用户,与用户A关联的有三个违约用户,以及两个1个月账龄下未违约的用户。通过该网络示意图可以更加直观的了解到用户A的信用风险较高,且与其关联的违约用户也较多,从而,可以直观、准确、全面的了解该用户网络中的用户风险以及违约情况。
通过本说明书实施例的上述技术方案,采用图注意力网络对目标信贷产品的多个用户的历史相关数据进行分析,进而,得到位于图注意力网络中用于表征目标用户的信用风险评分的目标节点的注意力特征,从而,提升信用风险评估的准确性。
实施例二
图6是本说明书的一个实施例电子设备的结构示意图。请参考图6,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成共享资源访问控制装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取目标信贷产品的多个用户的历史相关数据;
基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息;
基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征,其中,所述目标节点的注意力特征用于表征所述多个用户中目标用户的信用风险评分;
基于所述信用风险评分对所述目标用户进行信用风险评估。
上述如本说明书图1所示实施例揭示的信用风险评估装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1的方法,并实现信用风险评估装置在图1所示实施例的功能,本说明书实施例在此不再赘述。
当然,除了软件实现方式之外,本说明书实施例的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
通过本说明书实施例的上述技术方案,采用图注意力网络对目标信贷产品的多个用户的历史相关数据进行分析,进而,得到位于图注意力网络中用于表征目标用户的信用风险评分的目标节点的注意力特征,从而,提升信用风险评估的准确性。
实施例三
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下方法:
获取目标信贷产品的多个用户的历史相关数据;
基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息;
基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征,其中,所述目标节点的注意力特征用于表征所述多个用户中目标用户的信用风险评分;
基于所述信用风险评分对所述目标用户进行信用风险评估。
通过本说明书实施例的上述技术方案,采用图注意力网络对目标信贷产品的多个用户的历史相关数据进行分析,进而,得到位于图注意力网络中用于表征目标用户的信用风险评分的目标节点的注意力特征,从而,提升信用风险评估的准确性。
实施例四
图7为本说明书的一个实施例提供的信用风险评估装置700的结构示意图。请参考图7,在一种软件实施方式中,信用风险评估装置700可包括:
获取模块702,获取目标信贷产品的多个用户的历史相关数据;
第一确定模块704,基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息;
第二确定模块706,基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征,其中,所述目标节点的注意力特征用于表征所述多个用户中目标用户的信用风险评分;
评估模块708,基于所述信用风险评分对所述目标用户进行信用风险评估。
通过本说明书实施例的上述技术方案,采用图注意力网络对目标信贷产品的多个用户的历史相关数据进行分析,进而,得到位于图注意力网络中用于表征目标用户的信用风险评分的目标节点的注意力特征,从而,提升信用风险评估的准确性。
可选地,作为一个实施例,所述历史相关数据至少包括:用户特征、违约标签、关系网络、用户账龄;
所述第一确定模块704在基于所述历史相关数据,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息以及用于表征用户之间关联关系的边信息时,具体用于:
基于所述用户特征以及所述违约标签,确定所述目标信贷产品对应的图注意力网络中用于表征用户属性的节点信息;
基于所述违约标签、所述关系网络以及所述用户账龄,确定所述目标信贷产品对应的图注意力网络中用于表征用户之间关联关系的的边信息。
在本说明书实施例的一种具体实现方式中,所述边信息包括:边、以及边对应的权重;
所述第一确定模块704在基于所述违约标签、所述关系网络以及所述用户账龄,确定所述目标信贷产品对应的图注意力网络中用于表征用户之间关联关系的的边信息时,具体用于:
基于所述关系网络,确定所述目标信贷产品对应的图注意力网络中的边;
基于所述违约标签以及所述用户账龄,采用账龄Vintage分析和贝叶斯估计,确定所述目标信贷产品对应的图注意力网络中的边对应的权重。
在本说明书实施例的再一种具体实现方式中,所述第一确定模块704在基于所述违约标签以及所述用户账龄,采用Vintage分析和贝叶斯估计,确定所述目标信贷产品对应的图注意力网络中的边对应的权重时,具体用于:
基于所述违约标签以及所述用户账龄,采用Vintage分析确定用户在所述用户账龄违约的先验概率;
基于所述用户账龄以及所述先验概率,采用贝叶斯估计确定用户在所述用户账龄未违约以及所述用户账龄之后未违约的后验概率;
将所述后验概率确定为所述目标信贷产品对应的图注意力网络中的边对应的权重。
在本说明书实施例的再一种具体实现方式中,所述第一确定模块704在基于所述用户账龄以及所述先验概率,采用贝叶斯估计确定用户在所述用户账龄未违约以及所述用户账龄之后未违约的后验概率时,具体用于:
所述后验概率等于1减去用户在所述用户账龄未违约以及所述用户账龄之后违约的概率;
其中,用户在所述用户账龄未违约以及所述用户账龄之后违约的概率,包括:1减去用户在所述用户账龄之后违约的概率的差值与所述多个用户违约的总概率的乘积,与1减去用户在所述用户账龄违约的概率的差值的比值。
在本说明书实施例的一种具体实现方式中,所述第二确定模块706在基于所述节点信息以及所述边信息,确定所述图注意力网络中目标节点的注意力特征时,具体用于:
基于所述节点信息以及所述边信息,确定与所述目标用户相关的关联用户对所述目标用户的注意力特征,其中,所述关联用户包括所述目标用户以及所述多个用户中除所述目标用户以外的其它用户;
聚合与所述目标用户相关的关联用户对所述目标用户的注意力特征,得到所述目标用户的注意力特征。
在本说明书实施例的一种具体实现方式中,所述关联用户对所述目标用户的注意力特征包括:
非线性函数,与关联用户对所述目标用户在第N个注意力层的注意力函数,所述目标用户在第N个注意力层的权重矩阵,以及关联用户的节点特征矩阵的乘积;
其中,所述关联用户对所述目标用户在第N个注意力层的注意力函数,包括:
关联用户对所述目标用户在第N个注意力层的注意力系数经过正态化处理的结果;所述关联用户对所述目标用户在第N个注意力层的注意力系数是第N个注意力层的注意力机制与目标用户在第N个注意力层的权重矩阵的乘积,以及与节点特征矩阵的乘积,所述节点特征矩阵包括关联用户的节点特征矩阵与目标用户的节点特征矩阵;
关联用户的节点特征矩阵是通过所述关联用户的节点特征以及所述关联用户的后验概率所组成的矩阵;
所述N为正整数。
在本说明书实施例的再一种具体实现方式中,所述关联用户对所述目标用户的注意力特征包括:
非线性函数,与关联用户的后验概率,关联用户对所述目标用户在第N个注意力层的注意力函数,所述目标用户在第N个注意力层的权重矩阵,以及关联用户在第N个注意力层的特征矩阵的乘积;
其中,所述关联用户对所述目标用户在第N个注意力层的注意力函数,包括:
关联用户对所述目标用户在第N个注意力层的注意力系数经过正态化处理的结果;所述关联用户对所述目标用户在第N个注意力层的注意力系数是第N个注意力层的注意力机制与目标用户在第N个注意力层的权重矩阵的乘积,以及与节点特征矩阵的乘积,所述节点特征矩阵包括关联用户的节点特征矩阵与目标用户的节点特征矩阵;
关联用户的节点特征矩阵是通过所述关联用户的节点特征所组成的矩阵;
所述N为正整数。
在本说明书实施例的一种具体实现方式中,所述第二确定模块706在聚合与所述目标用户相关的关联用户对所述目标用户的注意力特征时,具体用于:
采用连接或加权平均的方式,聚合与所述目标用户相关的关联用户对所述目标用户的注意力特征。
应理解,本说明书实施例的信用风险评估装置还可执行图1中信用风险评估装置(或设备)执行的方法,并实现信用风险评估装置(或设备)在图1所示实施例的功能,在此不再赘述。
总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。