CN114529053A

CN114529053A - 用于逾期金额预测的神经网络模型构建方法及预测系统

Info

Publication number: CN114529053A
Application number: CN202210062007.0A
Authority: CN
Inventors: 江远强
Original assignee: Baiweijinke Shanghai Information Technology Co ltd
Current assignee: Baiweijinke Shanghai Information Technology Co ltd
Priority date: 2022-01-19
Filing date: 2022-01-19
Publication date: 2022-05-24

Abstract

本发明公开了用于逾期金额预测的神经网络模型构建方法及预测系统，所述方法包括获取贷款客户名单，筛选出同一表现期内发生逾期的客户名单A和未发生逾期的客户名单B，所述客户名单A中的客户数量和客户名单B中的客户数量相同；依据客户名单A和客户名单B采集贷款客户样本数据，得到样本数据集；对样本数据集进行特征工程处理，获得特征数据集中每个特征数据D(x,y)的客户特征画像x；其中x为对应贷款客户的客户特征画像，所述客户特征画像x为客户的静态特征画像和动态特征画像直接的关联特征；y为贷款客户产生逾期金额；步骤4、利用特征数据集对预设的BiLSTM神经网络模型进行训练，训练完成后得到逾期金额预测模型。本发明使最终被构建的模型能够达到理想的效果。

Description

用于逾期金额预测的神经网络模型构建方法及预测系统

技术领域

本发明属于互联网金融技术领域，尤其涉及一种用于逾期金额预测的神经网络模型构建方法及预测系统。

背景技术

目前现有的金融系统中有很多贷款风险预测模型，目前现有的风险预测模型主要是判断客户是否会发生逾期，缺乏准确预测逾期金额的模型，另外，目前现有风险预测模型在构建时，是直接的将客户特征提取出来进行使用，没有进一步的进行特征演化，这样特征量如果过大，会导致训练模型变得难以控制，容易将一些特征丢失或被过滤，这导致使用太多的特征作为输入，最终不能获得理想的效果。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种用于逾期金额预测的神经网络模型构建方法及预测系统，在构建模型时，能够根据大量的客户特征进一步的演化，降低最终用于训练模型时的特征量，提升了特征的质量，使最终被构建的模型能够达到理想的效果。

本发明第一方面公开了一种用于逾期金额预测的神经网络模型构建方法，包括以下步骤：

步骤1、获取贷款客户名单，筛选出同一表现期内发生逾期的客户名单A和未发生逾期的客户名单B，所述客户名单A中的客户数量和客户名单B中的客户数量相同；

步骤2、依据客户名单A和客户名单B采集贷款客户样本数据，得到样本数据集；

步骤3、对样本数据集进行特征工程处理，获得特征数据集中每个特征数据D(x,y)的客户特征画像x；所述客户特征画像x为客户的静态特征画像和动态特征画像直接的关联特征；所述静态特征画像用于对客户的定性特征进行刻画，所述动态特征画像用于对客户的变性特征进行刻画；y为贷款客户产生逾期金额；

步骤4、利用特征数据集对预设的BiLSTM神经网络模型进行训练，训练完成后得到逾期金额预测模型。

上述用于逾期金额预测的神经网络模型构建方法，所述基本特征画像包括客户工作信息、客户资产信息、客户信用信息、客户收入信息和客户贷款信息；所述交易特征画像包括客户交易流水信息。

上述用于逾期金额预测的神经网络模型构建方法，所述步骤3中进行特征工程处理包括以下步骤：

步骤3-1、对客户工作信息和客户资产信息进行简易热编码处理，整合客户工作信息、客户资产信息、客户信用信息、客户收入信息和客户贷款信息，生成客户画像信息值，以时间为横轴，客户画像信息值为纵轴建立特征矩阵，对特征矩阵进行降维处理，生成基本特征集；

步骤3-2、对客户交易流水信息以时间为横轴，交易额为纵轴建立特征矩阵，对特征矩阵进行降维处理，生成交易特征集；

步骤3-3、用基本特征集作为输入集，交易特征集作为真实值集训练LSTM神经网络模型；

步骤3-4、将训练好的LSTM神经网络模型的每个节点hi的权重softmax函数映射到[0，1]之间；再将每个节点hi映射后的权重与LSTM神经网络模型隐藏层的输出结果进行加和汇总，获得客户特征画像x。

本发明第二方面公开了一种基于上述用于逾期金额预测的神经网络模型构建方法构建的逾期金额预测模型的逾期金额预测系统，包括用户端和服务端；

所述用户端，用于获取授权，采集目标客户样本数据；

所述服务端，用于对客户样本数据执行步骤3所述的特征工程处理，获取客户特征画像x；还用于将获取到的客户特征画像x输入预置的逾期金额预测模型，将预测得到的预测逾期金额返回用户端。

本发明与现有技术相比具有以下优点：本发明通过特征工程处理获得的客户特征画像x，反映了客户的静态特征画像和动态特征画像直接的关联特征，不用再使用庞杂的静态特征画像和动态特征画像直接去训练复杂的机器学习模型，而是通过利用简单LSTM神经网络模型获得静态特征画像和动态特征画像的关联特征，具体通过通过注意力机制权重进行关联特征反映；再使用客户特征画像x去训练复杂的BiLSTM神经网络模型，可以降低训练难度，并且保证了训练出的模型准确率和效率高，满足风控需求。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明神经网络模型构建方法流程图。

具体实施方式

实施例1

如图1所示，一种用于逾期金额预测的神经网络模型构建方法，包括以下步骤：

需要说明的是，筛选客户名单时，取一个时间点为观察点，将观察点之前的一段时期设定为观察期，将观察点之后的一段时期设定为表现期；在表现期内贷后还款数据中历史逾期天数大于预定天数的客户定为发生逾期的客户名单；

具体的，在筛选客户并采集样本时，考虑原始样本数据集中少数类和潜在噪声的基本分布，采用MSMOTE技术抽样；

需要说明的是，设计BiLSTM神经网络结构，隐藏层在传递到下个迭代之前，经过一个控制结构，根据时间间隔和数据波动水平，自适应调整隐藏层h_t-1保留的信息到设置循环神经网络的循环次数epoch＝200，GRU部分输入长度为m＝30，隐藏层单元数目为128，输出层使用一个网络单元数为64的linear层，linear层上的dropout设置为0.2，设定网络允许误差θ；

得到用于建模的数据时，将第一中间数据输入至预设的BiLSTM神经网络模型中，将这些数据特征化，然后在神经网络中进行处理，以对该BiLSTM神经网络进行训练，输出层输出最终的欺诈概率；在训练完成该BiLSTM神经网络之后，得到训练完成该BiLSTM神经网络后对应的逾期金额预测模型。

其中，在训练BiLSTM神经网络时，若检测到该BiLSTM神经网络满足训练停止条件，则停止训练该BiLSTM神经网络，该BiLSTM神经网络训练完成，从而得到构建完成的逾期金额预测模型。

若所述训练次数大于最大训练次数或者所述网络误差小于预设阈值，则所述BiLSTM神经网络满足训练停止条件，得到训练完成所述BiLSTM神经网络后对应的金融反欺诈模型。

利用BiLSTM神经网络对特征数据集D进行建模不仅可以充分捕捉特征数据集D中包含的关键信息，而且某些操作在业务经验上可以有对应解释。

本实施例中，所述基本特征画像包括客户工作信息、客户资产信息、客户信用信息、客户收入信息和客户贷款信息；所述交易特征画像包括客户交易流水信息。

本领域技术人员应当理解，此处所述基本特征画像还可以包括如有无贷款、旧款期限、借款金额、月还款额与月收入占比和担保方式等信息。

本实施例中，所述步骤3中进行特征工程处理包括以下步骤：

需要说明的是，步骤3-1和步骤3-2中的时间为横轴选取的时间段相同；根据时间的推移，在矩阵的纵向量表示各个时间用户所有的特征数据这势必具有一定的序列性。进行矩阵转化后，可近似为多变量序列数据，由于模型选取的特征范围广，维度高，当以时间节点为横轴建立矩阵时，必定在某个时间点上，有大量的行为数据为零，使得每一时刻的用户特征向量近似于one-hot编码；这并不利于高维度特征以及大数据场景，所以将其通过嵌入层(Embedding层)，将每个特征向量映射到一个低维空间。

LSTM是序列预测常用模型，善于挖掘数据的整体序列特征；同时，引入深度学习中的注意力机制，注意力机制可以对信息的输入和输出之间的相关性进行重要性计算，得到更加关键有效的信息。

实施例2

一种基于实施例1中所述用于逾期金额预测的神经网络模型构建方法构建的逾期金额预测模型的逾期金额预测系统，包括用户端和服务端；

所述用户端，用于获取授权，采集目标客户样本数据；具体的，采集目标客户样本数据是从银行系统中直接采集；

以上所述，仅是本发明的较佳实施例，并非对本发明作任何限制，凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化，均仍属于本发明技术方案的保护范围内。

Claims

1.一种用于逾期金额预测的神经网络模型构建方法，其特征在于，包括以下步骤：

2.按照权利要求1所述的一种用于逾期金额预测的神经网络模型构建方法，其特征在于，所述基本特征画像包括客户工作信息、客户资产信息、客户信用信息、客户收入信息和客户贷款信息；所述交易特征画像包括客户交易流水信息。

3.按照权利要求2所述的一种用于逾期金额预测的神经网络模型构建方法，其特征在于，所述步骤3中进行特征工程处理包括以下步骤：

4.一种基于如权利要求3所述用于逾期金额预测的神经网络模型构建方法构建的逾期金额预测模型的逾期金额预测系统，其特征在于，包括用户端和服务端；

所述用户端，用于获取授权，采集目标客户样本数据；