CN113487403A

CN113487403A - 一种信用风险评估系统、方法、设备及介质

Info

Publication number: CN113487403A
Application number: CN202110726751.1A
Authority: CN
Inventors: 江远强; 李兰; 李晓萍
Original assignee: Baiweijinke Shanghai Information Technology Co ltd
Current assignee: Baiweijinke Shanghai Information Technology Co ltd
Priority date: 2021-06-29
Filing date: 2021-06-29
Publication date: 2021-10-08

Abstract

本发明公开了一种信用风险评估系统、方法、设备及介质，包括用户端和服务端；所述用户端用于发起信用风险评估请求，所述服务端包括数据采集模块、样本数据库、风险评估模块和更新模块；所述数据采集模块，用于采集用户的征信特征信息X；所述样本数据库，用于存储用户样本数据；所述风险评估模块，用于根据用户的征信特征信息X评估用户的信用风险结果Y；所述更新模块，用于定期根据所述样本数据库中的用户样本数据对所述信用风险评估模型进行更新。本发明基于深度学习得到的神经网络模型评估用户的信用风险结果，相比传统固定规则的计算评估，评估效果更好，输出的信用风险结果参考性很强。

Description

一种信用风险评估系统、方法、设备及介质

技术领域

本发明属于互联网金融技术领域，尤其涉及一种信用风险评估系统、方法、设备及介质。

背景技术

近年来随着互联网金融的快速发展以及互联网所沉淀的行为数据呈现爆炸式的增长，依托于海量数据，互联网贷款业务量逐年增加。这使得用户信用风险评估变得非常必要，但目前为止的信用风险评估都是依托预定规则计算得出的，输出的信用风险结果参考性不强。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种信用风险评估策略，基于深度学习得到的神经网络模型评估用户的信用风险结果，相比传统固定规则的计算评估，评估效果更好，输出的信用风险结果参考性很强。

本发明第一方面公开了一种信用风险评估系统，包括用户端和服务端；所述用户端用于发起信用风险评估请求，所述服务端包括数据采集模块、样本数据库、风险评估模块和更新模块；

所述数据采集模块，用于根据用户端发起的信用风险评估请求,以当下时间点为参考，采集用户当下时间点之前E1个月内产生的征信特征信息X，以及从当下时间点开始随时间推移持续采集用户新产生的征信特征信息X，并将对应用户采集到的所有征信特征信息作为用户样本数据发送至样本数据库存储；

所述样本数据库，用于存储用户样本数据；

所述风险评估模块，用于根据用户的征信特征信息X评估用户的信用风险结果Y；

所述风险评估模块根据对应用户的征信特征信息X评估用户的信用风险结果时包括以下步骤：

步骤1、调取E1个月内的征信特征信息X；

步骤2、将调取的E1个月内的征信特征信息X输入预设的信用风险评估模型Y＝F₁(X)，预测用户当下时间点之后E2个月内的信用风险结果Y，Y＝0或1，当Y＝0时，代表用户低风险，当Y＝1时，代表用户高风险；

步骤3、输出预测的信用风险结果Y；

所述更新模块，用于定期根据所述样本数据库中的用户样本数据对所述信用风险评估模型Y＝F₁(X)进行更新。

上述信用风险评估系统，所述信用风险评估模型Y＝F₁(X)通过以下方法生成或更新：

Step1、生成新的训练集样本和测试集样本，以及构建脊波神经网络模型；

Step2、初始化脊波神经网络模型的初始参数，所述初始参数包括连接隐藏层神经元节点和输出层神经元节点的权重w、激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b；将训练集样本的征信特征信息X作为脊波神经网络模型的输入，将训练集样本的信用风险结果Y作为脊波神经网络模型的输出，训练脊波神经网络模型；训练完成后进入到下一步；

Step3、采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数；然后进入到下一步；

Step4、利用测试集样本对优化后的脊波神经网络模型进行误差测试，若测试通过，则进入下一步；若测试不通过，则重新执行Step1-Step3；

Step5、以优化后的脊波神经网络模型为信用风险评估模型，并输出该信用风险评估模型。

上述信用风险评估系统，所述训练集样本和测试集样本通过以下步骤生成：

Step1-1、从所述样本数据库中抽取多个用户样本数据中一个时间段内的所有信息，然后进入下一步；

Step1-2、取所述时间段中的一个时间点作为观察点；将所述时间段中在观察点之前的时期设定为观察期，将所述时间段中在观察点之后的时期设定为表现期；然后进入下一步；

Step1-3、取在观察期内的信息为对应用户的历史征信特征信息X’；取在表现期内的信息中对应用户的逾期表现信息为高风险表现结果Y’；表现期内的信息中存在逾期时，高风险表现结果Y’＝1，表现期内的信息中不存在逾期时，高风险表现结果Y’＝0，然后进入下一步；

Step1-4、将每个用户样本数据对应的历史征信特征信息X’和高风险表现结果Y’构建为一条预用样本数据；对预用样本数据进行缺失值处理、异常值剔除和归一化处理；然后进入下一步；

Step1-5、将多个所述预用样本数据中的一部分设定为训练集样本，另一部分设定为测试集样本。

上述信用风险评估系统，Step3中多元宇宙算法优化脊波神经网络模型的初始参数时，多元宇宙算法的旅行距离率

l为多元宇宙算法优化执行时的当前迭代次数，L为多元宇宙算法优化执行时的最大迭代次数，Q为常数，满足2000＜Q＜10000；

执行所述多元宇宙算法在每次迭代时，子代宇宙满足：

为第i个子代宇宙的第j个参数；

为根据轮盘机制选择的第k个父代宇宙的第j个参数；r₂、r₃和r₄分别是在[0,1]之间的随机数；X_j为当下最好宇宙的第j个参数；lb_j，ub_j为第j个变量的下边界和上边界；WEP为虫洞存在概率；ω为加权学习因子,且其值随迭代次数l增加而递减，ω∈[0,1]，且满足：

本发明第二方面公开了一种信用风险评估方法，包括以下步骤：

步骤1、获取用户发起的风险评估请求；

步骤2、根据用户端发起的信用风险评估请求,以当下时间点为参考，采集用户当下时间点之前E1个月内产生的征信特征信息X，以及从当下时间点开始随时间推移持续采集用户新产生的征信特征信息X，并将对应用户采集到的所有征信特征信息作为用户样本数据发送至样本数据库存储；

步骤3、根据用户的征信特征信息X评估用户的信用风险结果Y；具体包括：

步骤3-1、调取E1个月内的征信特征信息X；

步骤3-2、将调取的E1个月内的征信特征信息X输入预设的信用风险评估模型Y＝F₁(X)，预测用户当下时间点之后E2个月内的信用风险结果Y，Y＝0或1，当Y＝0时，代表用户低风险，当Y＝1时，代表用户高风险；

步骤3-3、输出预测的信用风险结果Y；

所述信用风险评估模型Y＝F₁(X)定期根据预设样本数据库中的样本数据进行更新。

执行所述多元宇宙算法在每次迭代时，子代宇宙满足：

为第i个子代宇宙的第j个参数；

本发明第三方面提供一种电子设备，包括：存储器和处理器，所述处理器和所述存储器连接；

所述存储器用于存储程序；

所述处理器调用存储于所述存储器中的程序，以执行上述第二方面所述方法和/或结合第二方面所述方法的任一种可能的信用风险评估方法。

本发明第四方面提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被计算机运行时执行第二方面所述方法和/或结合第二方面所述方法的任一种可能的信用风险评估方法。

本发明与现有技术相比具有以下优点：本发明通过利用用户的信用风险评估请求，采集用户E1个月内的征信特征信息X，并基于征信特征信息X利用信用风险评估模型Y＝F₁(X)评估用户的信用风险结果Y；相比传统固定规则的计算评估，基于深度学习得到的神经网络模型评估用户的信用风险结果，评估效果更好，输出的信用风险结果参考性很强。风险评估模型Y＝F₁(X)建模或更新所用的用户样本数据需要足够多，并且还需要不断的有新的用户样本数据加入，这样才能保持风险评估模型Y＝F₁(X)的表现效果优良，本发明通过将采集到的征信特征信息X可以作为用户样本数据存储，用于后期更新所述信用风险评估模型Y＝F₁(X)使用，定期更新信用风险评估模型Y＝F₁(X)，能够保持风险评估模型Y＝F₁(X)的表现效果优良。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明实施例1的系统模块框图。

图2为本发明评估用户的信用风险结果时的方法流程图。

图3为本发明信用风险评估模型生成或更新时的方法流程图。

图4为本发明实施例2的方法流程图。

具体实施方式

实施例1

如图1所示，一种信用风险评估系统，包括用户端100和服务端200；所述用户端100用于发起信用风险评估请求，所述服务端200包括数据采集模块201、样本数据库202、风险评估模块203和更新模块204；

所述数据采集模块201，用于根据用户端100发起的信用风险评估请求,以当下时间点为参考，采集用户当下时间点之前E1个月内产生的征信特征信息X，以及从当下时间点开始随时间推移持续采集用户新产生的征信特征信息X，并将对应用户采集到的所有征信特征信息作为用户样本数据发送至样本数据库202存储；

所述样本数据库202，用于存储用户样本数据；

所述风险评估模块203，用于根据用户的征信特征信息X评估用户的信用风险结果Y；

如图2所示，所述风险评估模块203根据对应用户的征信特征信息X评估用户的信用风险结果时包括以下步骤：

步骤1、调取E1个月内的征信特征信息X；

步骤3、输出预测的信用风险结果Y；

所述更新模块204，用于定期根据所述样本数据库202中的用户样本数据对所述信用风险评估模型Y＝F₁(X)进行更新。

需要说明的是，所述征信特征信息X包括用户在申请贷款时的注册信息、用户历史借贷行为关联信息、外部系统中的征信关联信息等。实际实施时，所述用户的征信特征信息X可根据实际情况而定。用户在申请贷款时的注册信息如婚姻状况、年龄、性别、个人收入、申请评分卡分数等；用户历史借贷行为关联信息指能够反映用户的还款能力和还款意愿的信息，如借款产品利率、借款期限、历史申请次数、申请金额、被拒次数、近期是否申请、最大高风险天数、最小高风险天数、贷款余额、高风险金额、提前还款次数、提款次数、提款总金额、提款金额占授信金额占比、历史违约次数、历史违约金额、违约时间间隔等；外部系统中的征信关联信息指在合规或经过客户授权下，从多方面外部系统中取得的征信关联数据，如用户在风险欺诈类软件、大数据评分类软件、多头借贷类软件、手机在网时长和状态统计类软件、司法信息类软件、工商信息类软件、电信消费记录类等软件中的征信信息等。

如图3所示，本实施例中，所述信用风险评估模型Y＝F₁(X)通过以下方法生成或更新：

需要说明的是，脊波神经网络模型(Ridegelet Neural Network，RNN)是脊波核函数和前向网络组成的，脊波核函数在小波核函数中加入方向向量构成的脊波核函数是对小波函数的改进，相对于小波网络来讲，脊波神经网络模型具有更强的非线性映射能力和更好的表征高维奇异性(线、面奇异)的性能。

脊波神经网络模型其结构与传统的前馈型神经网络相近，由输入层、隐含层和输出层构成；

需要说明的是，脊波神经网络模型的非线性映射能力体现在权重w和激活函数上，而激活函数的特性主要由函数的尺度、方向和位置，即脊波参数变量h＝(a，u，b)确定，脊波神经网络模型和传统神经网络一样，受初始参数影响，从数据点中任意选取脊波函数参数构造出来的脊波神经网络模型的，易陷入局部最优、反复震荡等问题，导致收敛速度慢和精度低，故本发明采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数，以避免此问题的出现；

对所述脊波神经网络模型训练时，采用梯度下降算法进行模型训练，当迭代次数到达规定次数，若损失函数收敛，则训练完成；若损失函数未收敛，则继续迭代直至收敛；

进一步需要说明的是，本实施例中，损失函数为

其中N表示脊波神经网络模型输出的预测值的数量，y_i表示训练数据的真实值，y_i’表示训练数据在脊波神经网络模型输出的预测值。

需要说明的是，采用多元宇宙算法优化训练后的脊波神经网络模型的初始参数的过程，是在训练完成得到的权重w和脊波参数变量h＝(a，u，b)基础上寻找损失函数MAE所能达到更小值的过程，即寻找最小MAE_min＝f₂(w，h)时的w和h；

具体地，所述多元宇宙算法执行时，随机生成在空间D中初始化宇宙种群，随机初始化n个宇宙的位置，依据每个宇宙个体间的距离自动设置宇宙上边界及下边界对应脊波神经网络模型初始参数变量区间[lbj,ubj]；宇宙个体U_i＝[x_i ¹，x_i ²，…，x_i ^m，x_i ^d-2，x_i ^d-1，x_i ^d]，(i＝1，2，…，n)，d是初始参数(变量)的个数，每个宇宙个体U_i中[x_i ¹，x_i ²，…，x_i ^m]为脊波神经网络模型中各个隐藏层神经元节点和输出层神经元节点的权重w；[x_i ^d-2，x_i ^d-1，x_i ^d]为激活函数中的尺度参数a、激活函数中的方向参数u和激活函数中的位置参数b；设多元宇宙算法执行时，最大迭代次数为L，当前迭代次数为l；

初始化后宇宙矩阵如下：

然后开始执行多元宇宙算法迭代计算MAE＝f₂(w，h)，寻找MAE_min＝f₂(w，h)时的w和h；

进一步需要说明的是，由于多元宇宙算法需要通过虫洞的随机性来保证宇宙的稳定性和多样性；所以，多元宇宙算法中设置一个适合的旅行距离率TDR可以使算法更易找到最优个体，有利于全局寻优；标准多元宇宙算法中TDR值下降速度较慢，会导致旅行距离增加的问题；为了在一定程度上对多元宇宙算法的性能进行提升，本发明将TDR的下降速度增大，使TDR以指数函数方式下降，本实施例中多元宇宙算法的旅行距离率

l为多元宇宙算法执行时的当前迭代次数，L为多元宇宙算法执行时的最大迭代次数，Q为常数，满足2000＜Q＜10000；优选Q＝5000；

在传统多元宇宙算法迭代前期，虫洞存在概率WEP以较大概率小于随机数r₂，且当前最优宇宙U_best通常远离全局最优解，过于继承U_best信息势必会导致宇宙种群过快趋于同化而不利于种群保持多样性，在迭代后期，宇宙种群代间信息继承的累积效应使得宇宙个体高度同化且差异性小，此时轮盘赌机制搜寻白洞出现的位置

学习的有效信息(信息熵)较少且难以显著改善算法局部开采能力，因此，为保证宇宙种群多样性并拓宽单一宇宙继承的有限搜索域，通过引入加权学习因子ω保证子代宇宙同时继承最优宇宙(或自身)和轮盘赌宇宙的位置信息并生成新宇宙种群，故本实施例中，执行所述多元宇宙算法在每次迭代时，子代宇宙满足：

为第i个子代宇宙的第j个参数；

需要说明的是，误差测试时，引入混淆矩阵统计测试结果如下所示：

TP：客户本身是高风险，模型判断为高风险；

TN：客户本身是低风险，模型判断为低风险；

FN：客户本身是高风险，模型判断为低风险；

FP：客户本身是低风险，模型判断为高风险；

计算脊波神经网络的召回率、准确率和F1值；当召回率、准确率和F1值均达到预设标准阈值时，预设标准阈值可自行定义；本实施例中预设标准阈值＝0.5，则认为测试通过；

召回率(recall)：recall＝TP/(TP+FN)，体现预测正确的高风险人占预测高风险人全部的比例；

准确率(Precision)：precision＝TP/(TP+FP)，体现预测正确的高风险人占实际高风险人的比例；

F1：F1＝2*(precision*recall)/(recall+precision)，体现精确率和召回率的调和平均数，同时兼顾了预测模型的准确率和召回率；

为了验证改进后的多元宇宙算法优化脊波神经网络的优越性，分别用原始脊波神经网络RNN，以及遗传算法(GA)优化、粒子群算法(PSO)优化、多元宇宙算法(MVO)与改进多元宇宙算法(IMVO)优化脊波神经网络的性能对比得到RNN、GA-RNN、PSO-RNN、MVO-RNN和IMVO-RNN中，4种优化算法的参数设置：遗传算法(GA)的交叉概率为0.8，变异概率为0.05；粒子群算法(PSO)最大速度值为0.5，最小速度值为-0.5，速度更新的两个参数都为1.49445；MVO和IMVO算法宇宙数n＝5，最大迭代次数L＝150，虫洞存在概率WEPmin＝0.2，虫洞存在最大概率WEPmax＝1，测试结果如下：

如上表可见，改进后的多元宇宙算法IMVO在实验中都获得了比GA、PSO和MVO更高的Precision、Recall和F1值，表现出极好的搜索能力和稳定性；

本实施例中，所述训练集样本和测试集样本通过以下步骤生成：

需要说明的是，训练集样本和测试集样本的生成所需的信息选取，如果距离当下时间太长，选取的信息反映的用户样本特性与当前的新增用户差异较大，容易导致训练出的模型预测当前用户效果不佳，而如果距离当下时间较短，近期用户的表征信息会不够充分，故在Step1-2中定义观察期和表现期，观察期可看做建模所需信息横跨的历史区间，表现期则为模型预测的时间长度；

本实施例中，观察期取值为6—24个月，表现期为3—12个月，表现期从执行Step1-1时的时间点向前推算；

Step1-5、将多个所述预用样本数据中的一部分设定为训练集样本，另一部分设定为测试集样本。所述训练集样本的数量和测试集样本的数量比例为7∶3。

需要说明的是，与其他传统的神经网络模型相比，脊波神经网络采用脊波函数作为网络模型隐含层中神经元的激励函数，更具方向选择性，能够使网络包含更多的维数信息，从而很好地处理更高维度的数据信息，对非线性高维函数的逼近有比较好的效果；

另外，相比遗传和粒子群等优化算法，多元宇宙算法能够有效平衡全局寻优与局部搜索之间的关系，具有较好的收敛精度、鲁棒性能和全局寻优能力；改进的多元宇宙算法通过选择适合的旅行距离率TDR，采用横向个体更新策略寻找更广的新个体潜在位置，保证宇宙种群多样性，使得最终收敛逼近于最优解；采用改进多元宇宙优化算对脊波神经网络的参数进行优化，将提高脊波神经网络的收敛速度和学习能力，具有规模小、学习和泛化能力强、网络可控性好等优点。

实施例2

如图4所示，一种信用风险评估方法，包括以下步骤：

步骤1、获取用户发起的风险评估请求；

步骤3-1、调取E1个月内的征信特征信息X；

步骤3-3、输出预测的信用风险结果Y；

进一步需要说明的是，本实施例中，损失函数为

初始化后宇宙矩阵如下：

为第i个子代宇宙的第j个参数；

TP：客户本身是高风险，模型判断为高风险；

TN：客户本身是低风险，模型判断为低风险；

FN：客户本身是高风险，模型判断为低风险；

FP：客户本身是低风险，模型判断为高风险；

需要说明的是，本实施例与实施例1中对应的部分实现原理及产生的技术效果相同，为了简要描述，未提及和详细说明的部分，可参考实施例1中相应的内容。

实施例3

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被计算机运行时执行上述实施例2中所述信用风险评估方法。

实施例4

一种电子设备，包括：存储器和处理器，所述处理器和所述存储器连接；

所述存储器用于存储程序；

所述处理器调用存储于所述存储器中的程序，以执行如实施例2中所述信用风险评估方法。

需要说明的是，所述电子设备，可以是，但不限于个人电脑(personal computer，PC)、平板电脑、移动上网设备(mobile internet device，MID)等设备。

应当注意的是，处理器、存储器以及其他可能出现于电子设备的组件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，处理器、存储器以及其他可能出现的组件相互之间可通过一条或多条通讯总线或信号线实现电性连接。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统和方法，也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，笔记本电脑,服务器，手机，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅是本发明的较佳实施例，并非对本发明作任何限制，凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化，均仍属于本发明技术方案的保护范围内。