CN110705638A

CN110705638A - 一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法

Info

Publication number: CN110705638A
Application number: CN201910938082.7A
Authority: CN
Inventors: 尹留志; 吴杰; 卢鹏; 镇磊; 孙英家; 李毅; 张健
Original assignee: ANHUI ZHAOYI ANLIAN TECHNOLOGY Co Ltd; Anhui Zhaoyin Information Technology Co Ltd
Current assignee: ANHUI ZHAOYI ANLIAN TECHNOLOGY Co Ltd; Anhui Zhaoyin Information Technology Co Ltd
Priority date: 2019-09-30
Filing date: 2019-09-30
Publication date: 2020-01-17

Abstract

本发明涉及一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法，与现有技术相比解决了公开数据无法满足信用评级分类需要的缺陷。本发明包括以下步骤：基础数据的获取；基础数据的预处理；构建信用评级预测网络；信用评级预测网络的训练；获取待预测对象的的信用评级数据信息；预测对象的信用评级预测分类。本发明通过公开的模糊信息模拟预测出非公开的精准信息数据，并生成信用评级分类结果，实现公开数据对非公开数据结果的有效预测分析。

Description

一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法

技术领域

本发明涉及数据预测分析技术领域，具体来说是一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法。

背景技术

信用评级指独立的第三方信用评级中介机构对债务人如期足额偿还债务本息的能力和意愿进行评价，并用简单的评级符号表示其违约风险和损失的严重程度。同时，信用评级则是对评级对象履行相关合同和经济承诺的能力和意愿的总体评价。随着大数据分析技术的成熟，信用评级已从传统的感性认识判断上升为众多数据支撑而形成的理性分析。

现有技术从数据分析角度，对大量的数据经过推算、演变等相关算法，获得相应的信用等级分析结果。如专利号为“201210201461.6”、专利名称为“基于信用等级与违约损失率匹配的信用评级系统与方法”的授权发明专利；再如专利号为“201210201114.3”、专利名称为“基于信用等级与违约损失率匹配的信用评级调整方法”的授权发明专利。

但现有技术中的信用评级预测分析均是从金融算法、统计学方法等角度提出了更为优秀、准确的评级方法，并未真正基于大数据分析、人工智能角度进行技术考虑。并且，随着企业数据安全意识的提高和相关要求，企业的基本信息、财务数据等用于信用评级的基础核心数据已不对外公开，以导致无法进行有效的信用评级分类。与此同时，预测技术已趋向成熟，在各个应用领域均取得了一定的成效。

因此，如何将预测分析技术应用在信用评级上，通过少量的公开数据预测出非公开数据并得出信用预测分类结果已经成为急需解决的技术问题。

发明内容

本发明的目的是为了解决现有技术中公开数据无法满足信用评级分类需要的缺陷，提供一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法来解决上述问题。

为了实现上述目的，本发明的技术方案如下：

一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法，包括以下步骤：

基础数据的获取：获取用于信用评级的模糊信息数据和精准信息数据，其中，模糊信息数据为企业信用评级的公开数据，精准信息数据为企业信用评级的非公开数据；

基础数据的预处理：对模糊信息数据和精准信息数据分别进行处理，分别提取出模糊信息数据、精准信息数据的定量信息、定性信息，并对定量信息进行标准化处理、定性信息进行数字化处理；

构建信用评级预测网络：构建包括学习网络和预测评级网络在内的信用评级预测网络，其中预测评级网络分为竞争分支网络与评级分类分支网络；

信用评级预测网络的训练：利用模糊信息数据和精准信息数据对信用评级预测网络进行训练；

获取待预测对象的的信用评级数据信息：获取待预测对象的待预测模糊信息数据，提取出待预测模糊信息数据内的定量信息、定性信息；

预测对象的信用评级预测分类：将待预测模糊信息数据内的定量信息标准化、定性信息数字化后输入训练后的信用评级预测网络，通过待预测模糊信息数据预测出类似精准信息数据的特征，并得到该预测对象的信用评级等级。

所述的构建信用评级预测网络包括以下步骤：

构建学习网络，设定学习网络为深度残差特征学习模型；

设定学习网络的基础部分为5个卷积模块、残差部分为3个残差模块，每一个残差模块包括2个1*3卷积和2个BN批量归一化操作以及2个relu非线性操作，残差块的输出是上述6个操作的输出加上输入，学习网络的输出是基础部分的输出加上残差部分的输出；

设定预测评级网络由竞争分支网络与评级分类分支网络构成，竞争分支网络和评级分类分支网络均由3个全连接层组成；

竞争分支网络在最后一个全连接层后加上sigmoid函数，将输出归一化到(0,1)，越接近1表示为竞争分支输入的是精准信息特征，越接近0表示竞争分支输入的是模糊信息生成的伪精准信息；

评级分类分支网络在最后一个全连接层接softmax层，输出为信用等级的分类数目，其中，网络结构的卷积模块和残差模块的个数以及残差模块里卷积、归一化和非线性的操作个数以及参数均设定通过训练进行调节。

所述的信用评级预测网络的训练包括以下步骤：

利用精准信息数据训练预测评级网络的评级分类分支网络以及学习网络的基础部分，其表达式如下：

L_{dis_p}＝L_cls(p,g)＝-logp_g，

其中，L_{dis_p}表示评级分支的分类损失，F_l表示精准信息数据通过学习网络的特征，g表示输入的精准信息数据对应的企业信用等级标签，p＝(p₀,p₁,...,p_k),p_g表示评级分支输出里对应g的等级分类概率，即使得正确等级标签所对应的概率p_g最大，此时分类损失达到最小；

根据已训练的评级分类分支网络再用模糊信息数据训练学习网络参数，其表达式如下：

其中，L_dis是训练学习网络的损失函数，主要由竞争损失L_{dis_a}和评级损失L_{dis_p}构成，模糊信息数据通过学习网络学习到的特征越类似精准信息的特征，使竞争网络分支输出越大竞争损失L_{dis_a}越小，同时信息通过学习网络学习到的特征越类似精准信息的特征，使预测评级网络分支输出对应正确信用等级标签概率p_g越大，评级损失L_{dis_p}越小，

L_dis＝w₁*L_{dis_a}+w₂*L_{dis_p}，

L_{dis_p}＝L_cls(p,g)＝-logp_g；

使用模糊信息数据和精准信息数据同时训练竞争分支网络，其表达式如下：

其中，L_a是训练竞争网络分支的损失函数，当输入是精准信息数据时，竞争网络输出

越大使得损失

越小，当输入是模糊信息数据时，竞争网络输出

越小使得损失

越小。

有益效果

本发明的一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法，与现有技术相比通过公开的模糊信息模拟预测出非公开的精准信息数据，并生成信用评级分类结果，实现公开数据对非公开数据结果的有效预测分析。

本发明通过对模糊信息数据生成类似精准信息数据的特征表示，使得模糊信息数据的特征表示与精准信息特征数据表示相近以此更易于信用等级评定；学习网络通过较前层提取深度细腻特征将容易获取私密性弱但是不利于评定等级的模糊信息特征转变成类似较难获取私密性强但是容易进行评定信用等级的精准信息的特征；具有实用性强的特点。

附图说明

图1为本发明的方法顺序图。

具体实施方式

为使对本发明的结构特征及所达成的功效有更进一步的了解与认识，用以较佳的实施例及附图配合详细的说明，说明如下：

实际应用中，企业用于信用评级的数据分为两类，其中一类是公开数据(模糊信息数据)，这类数据较容易获取，其对信用评级具有一定的意义；另一类是非公开数据(精准信息数据)，此类数据为企业机密，为严格保密的相关数据，此类数据除极其必要外通常不对外公开，但此类数据对企业的信用评级意义较大。而对于部分机构而言，由于其长期生产经营需要，积累了大量的公开数据和非公开数据，本发明思路就是从已有的公开数据和非公开数据，再利用待分析的公开数据去推算模拟出非公开数据，从而达到评级分类作用。如图1所示，本发明所述的一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法，包括以下步骤：

第一步，基础数据的获取。

获取用于信用评级的模糊信息数据和精准信息数据，在此的模糊信息数据和精准信息数据均为已有的数据信息。模糊信息数据为企业信用评级的公开数据，精准信息数据为企业信用评级的非公开数据。

第二步，基础数据的预处理。

对模糊信息数据和精准信息数据分别进行处理，分别提取出模糊信息数据、精准信息数据的定量信息、定性信息，定量信息是指一些数字信息等需要进行标准化，定性信息是指一些文字描述等需要数字化的信息。按现有技术方式，对定量信息进行标准化处理、定性信息进行数字化处理，以使得其能应用于训练网络使用。

第三步，构建信用评级预测网络：构建包括学习网络和预测评级网络在内的信用评级预测网络，其中预测评级网络分为竞争分支网络与评级分类分支网络。其具体步骤如下：

(1)构建学习网络，设定学习网络为深度残差特征学习模型；残差块学习模糊信息和精准信息间的残差表示，学习到的残差表示增强从模糊信息获取的卷积特征去近似精准信息的特征表示。设定学习网络的基础部分为5个卷积模块、残差部分为3个残差模块，每一个残差模块包括2个1*3卷积和2个BN批量归一化操作以及2个relu非线性操作，残差块的输出是上述6个操作的输出加上输入，学习网络的输出是基础部分的输出加上残差部分的输出；

(2)设定预测评级网络由竞争分支网络与评级分类分支网络构成，竞争分支网络和评级分类分支网络均由3个全连接层组成；竞争分支网络用来区分输入的是模糊信息通过生成网络生成的伪精准信息的特征表示还是真正的精准信息的特征表示，评级分类分支是直接使用生成网络生成的特征表示进行评级分类，竞争分支和评级分类分支的目的都是对自己网络的输入做分类，所以不需要再使用卷积提取特征，使用全连接层进行分类即可。

第四步，信用评级预测网络的训练，利用已有的模糊信息数据和精准信息数据对信用评级预测网络进行训练，训练后的信用评级预测网络则具有预测分类功能。其具体步骤如下：

(1)利用精准信息数据训练预测评级网络的评级分类分支网络以及学习网络的基础部分，主要目的是使用真正的精准信息通过评级网络分支构造损失函数训练评级分类分支，提高评级分类分支的评级正确率，其表达式如下：

L_{dis_c}＝L_cls(c,i)＝-logc_i，

其中，L_{dis_c}表示评级分支的分类损失，T_a表示精准信息数据通过学习网络的特征，i表示输入的精准信息数据对应的企业信用等级标签，c＝(c₀,c₁,...,c_k)表示评级分支输出里对应i的等级分类概率，即使得正确等级标签所对应的的概率最大，此时分类损失达到最小；

(2)根据已训练的评级分类分支网络再用模糊信息数据训练学习网络参数，主要目的是使用模糊信息通过竞争分支和评级分类分支构造损失函数训练学习网络分支，提高学习网络的学习能力，其表达式如下：

其中，L_dis是训练学习网络的损失函数，主要由竞争损失L_{dis_m}和评级损失L_dis__c构成，模糊信息数据通过学习网络学习到的特征越类似精准信息的特征，使竞争网络分支输出越大竞争损失L_dis__m越小，同时信息通过学习网络学习到的特征类似精准信息的特征，使预测评级网络分支输出对应正确信用等级标签概率越大评级损失L_dis__c越小，

L_dis＝λ₁*L_{dis_m}+λ₂*L_{dis_c}，

L_{dis_c}＝L_cls(c,i)＝-logc_i；

(3)使用模糊信息数据和精准信息数据同时训练竞争分支网络，主要目的是使用模糊信息和精准信息通过竞争分支网络构造损失函数，提高竞争分支网络的鉴别能力，其表达式如下：

其中，L_m是训练竞争网络分支的损失函数，当输入是精准信息数据时，竞争网络输出

越大使得损失

越小，当输入是模糊信息数据时，竞争网络输出

越小使得损失

越小。

第五步，获取待预测对象的的信用评级数据信息：获取待预测对象的待预测模糊信息数据，提取出待预测模糊信息数据内的定量信息、定性信息。

第六步，预测对象的信用评级预测分类。将待预测模糊信息数据输入训练后的信用评级预测网络，首先通过学习网络学习到类似精准信息的特征表示，然后通过预测评级网络的评级分类分支得到该预测对象的信用评级等级。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是本发明的原理，在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。