CN112634028A

CN112634028A - 一种识别人行征信报告代偿回购行为的方法

Info

Publication number: CN112634028A
Application number: CN202011603911.5A
Authority: CN
Inventors: 徐志华
Original assignee: Sichuan XW Bank Co Ltd
Current assignee: Sichuan XW Bank Co Ltd
Priority date: 2020-12-30
Filing date: 2020-12-30
Publication date: 2021-04-09

Abstract

本发明公开了一种识别人行征信报告代偿回购行为的方法，属于计算机技术领域，以解决现有技术中人为加工特征变量不仅费时费力，成本非常高，不适合工业化，并且人为加工较难设计出高分度变量，丢失一些信息的问题。本发明提供一种识别人行征信报告代偿回购行为的方法，具体步骤包括：步骤A：利用循环神经网络自动提取人行代偿回购的特征；步骤B：利用注意力机制增强网络效果，提高识别人行代偿回购的特征的效果；步骤C:在实际应用场景中基于用户的借据级别进行建立模型，当用户有一笔贷款出现代偿回购行为时，判定该用户为代偿回购用户。本发明用于识别人行征信报告代偿回购行为。

Description

一种识别人行征信报告代偿回购行为的方法

技术领域

本发明属于计算机技术领域，具体涉及一种识别人行征信报告代偿回购行为的方法。

背景技术

人行征信报告代偿回购是指当下的金融机构为了维护自身平台的活跃度，在客户有逾期的行为后平台主动替客户还款或结清的行为，由于存在这种行为，造成了客户在人行征信报告上的逾期信息被消除或被减弱。破坏了失信约束制度，危害了社会信用体系建设，甚至造成其他金融机构在错误的信息指导下发生了经济损失。因此识别人行征信报告代偿回购是非常重要且有重大意义的工作。

现有技术中，识别人行征信报告代偿回购的方法主要是根据行业经验人为地加工特征变量，然后利用特征变量建立信用模型，从而识别客户代偿与否。

现有技术中存在的问题：人为加工特征变量不仅费时费力，成本非常高，不适合工业化，并且人为加工较难设计出高分度变量，容易造成一些信息丢失。

发明内容

针对现有技术中人为加工特征变量不仅费时费力，成本非常高，不适合工业化，并且人为加工较难设计出高分度变量，丢失一些信息的问题，本发明提供一种识别人行征信报告代偿回购行为的方法，其目的在于：利用深度学习自动提取特征，通过算法来寻找特征，可以更好的区分代偿回购人群。

为了达到上述目的，本发明采用如下技术方案：

一种识别人行征信报告代偿回购行为的方法，包括：

步骤A：利用循环神经网络自动提取人行征信报告代偿回购的特征；

步骤B：利用注意力机制增强网络效果，提高识别人行征信报告代偿回购的特征的效果；

步骤C:在实际应用场景中基于用户的借据级别进行建立模型，当用户有一笔贷款出现代偿回购行为时，判定该用户为代偿回购用户。本发明利用循环神经网络提取人行征信报告中的贷款信息并加工成特征变量，然后利用注意力机制加强对人行征信报告中代偿回购的识别，基于用户的借据级别建立模型，当用户有一笔贷款出现代偿回购行为时，判定该用户为代偿回购用户。

进一步的，所述步骤A中，通过循环神经网络不断学习，得到并提取人行代偿回购的特征。本发明中人为加工特征可能会出现特征只加工有效特征，漏掉无效特征，导致特征不全，通过循环网络加工特征能够对所有特征进行加工，避免人为遗漏。

进一步的，所述步骤B中，对提取的特征计算注意力分布，利用注意力分布计算特征的加权平均。本发明中利用注意力机制精细化地提取高区分度的变量从而提高识别效果。

进一步的，所述步骤C中，所述建立模型包括：输入层、embedding层、LSTM层、Attentiong层和输出层。

进一步的，所述embedding层获取输入的特征的信息并对单词序列做预处理，将单词序列转化为向量形式，本发明中，所述单词序列为还款序列，然后利用LSTM神经网络对于时序性数据的学习能力提取相关数据特征；所述Attentiong层引入Attentiong机制，在数据特征中聚焦关键信息点。本发明充分利用时间序列数据，大幅度提高识别人行征信报告代偿回购行为的准确率和效率。

综上所述，由于采用了上述技术方案，本发明的有益效果是：本发明利用循环神经网络提取人行征信报告中的贷款信息并加工成特征变量，然后利用注意力机制加强对人行征信报告中代偿回购的识别，基于用户的借据级别建立模型。本发明中人为加工特征可能会出现特征只加工有效特征，漏掉无效特征，导致特征不全，通过循环网络加工特征能够对所有特征进行加工，避免人为疏漏。本发明中利用注意力机制精细化地提取高区分度的变量从而提高识别效果。

附图说明

图1为本发明的流程示意图。

具体实施方式

本说明书中公开的所有特征，或公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合。

下面将结合附图及具体实施方式对本发明作进一步的描述。

名词解释：

LSTM是指长短期记忆网络，是循环神经网络(RNN)的变体。传统的循环神经网络在训练过程中会出现梯度消失或梯度爆炸问题，同时还存在长期依赖问题。LSTM通过在其记忆模块中设置逻辑门(遗忘门、输入门、输出门)和记忆模块状态更新，有效解决了传统循环神经网络存在的问题，提高了神经网络的学习能力和分类精度。

Attention机制是指注意力机制，源自对人脑的注意力机制模拟。Attention的核心思想是将有限的注意力资源集中于大量信息中的关键信息点上，从而避免了平均用力导致的大量计算和较低效率。Attention通过相似度计算函数依次对查询数据和输入数据进行相似度计算，得出相似度分数。然后将查询数据与对应相似度分数进行加权求和，得出最终的关键信息点。

1.一种识别人行征信报告代偿回购行为的方法，其特征在于：包括：

所述步骤A中，通过循环神经网络不断学习，得到并提取人行征信报告代偿回购的特征。

步骤B：利用注意力机制增强网络效果，提高识别人行代偿回购的特征的效果；

所述步骤B中，对提取的特征计算注意力分布，利用注意力分布计算特征的加权平均。

步骤C:在实际应用场景中基于用户的借据级别进行建立模型，当用户有一笔贷款出现代偿回购行为时，判定该用户为代偿回购用户。

步骤C中，所述建立模型包括：输入层、embedding层、LSTM层、Attentiong层和输出层。

所述embedding层获取输入的特征的信息并对还款序列做预处理，将还款序列转化为向量形式，然后利用LSTM神经网络对于时序性数据的学习能力提取相关数据特征；所述Attentiong层引入Attentiong机制，在数据特征中聚焦关键信息点。

本发明利用循环神经网络提取人行征信报告中的贷款信息并加工成特征变量，然后利用注意力机制加强对人行征信报告中代偿回购的识别，基于用户的借据级别建立模型，当用户有一笔贷款出现代偿回购行为时，判定该用户为代偿回购用户。实现之前没法实现的一些功能大大降低人为加工特征的工作量，普遍的人为加工人行征信报告包括收入金额，近期是否存在逾期，当前社保缴费单位等等，工作量大并且细致工作无法加工，遍历不全细致的特征，本发明克服了一种特征工程的过程，解决了人为不能解决的问题。现有的人行征信报告表面上表现的是正常的，但是实际上客户已经有逾期行为，人为加工的特征非常难区别，只有通过机器加工的细致特征中体现出来的的差别才能区分出来，从而识别客户是否有还款能力。

以上仅是本发明众多具体应用范围中的代表性实施例，对本发明的保护范围不构成任何限制。凡采用变换或是等效替换而形成的技术方案，均落在本发明权利保护范围之内。

Claims

1.一种识别人行征信报告代偿回购行为的方法，其特征在于，包括：

2.根据权利要求1所述的一种识别人行征信报告代偿回购行为的方法，其特征在于：所述步骤A中，通过循环神经网络不断学习，得到并提取人行代偿回购的特征。

3.根据权利要求2所述的一种识别人行征信报告代偿回购行为的方法，其特征在于：所述步骤B中，对提取的特征计算注意力分布，利用注意力分布计算特征的加权平均。

4.根据权利要求1所述的一种识别人行征信报告代偿回购行为的方法，其特征在于：所述步骤C中，所述建立模型包括：输入层、embedding层、LSTM层、Attentiong层和输出层。

5.根据权利要求4所述的一种识别人行征信报告代偿回购行为的方法，其特征在于：所述embedding层获取输入的特征的信息并对还款序列做预处理，将还款序列转化为向量形式，然后利用LSTM神经网络对于时序性数据的学习能力提取相关数据特征；所述Attentiong层引入Attentiong机制，在数据特征中聚焦关键信息点。