CN110705638A - 一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法 - Google Patents
一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法 Download PDFInfo
- Publication number
- CN110705638A CN110705638A CN201910938082.7A CN201910938082A CN110705638A CN 110705638 A CN110705638 A CN 110705638A CN 201910938082 A CN201910938082 A CN 201910938082A CN 110705638 A CN110705638 A CN 110705638A
- Authority
- CN
- China
- Prior art keywords
- network
- rating
- information data
- prediction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法,与现有技术相比解决了公开数据无法满足信用评级分类需要的缺陷。本发明包括以下步骤:基础数据的获取;基础数据的预处理;构建信用评级预测网络;信用评级预测网络的训练;获取待预测对象的的信用评级数据信息;预测对象的信用评级预测分类。本发明通过公开的模糊信息模拟预测出非公开的精准信息数据,并生成信用评级分类结果,实现公开数据对非公开数据结果的有效预测分析。
Description
技术领域
本发明涉及数据预测分析技术领域,具体来说是一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法。
背景技术
信用评级指独立的第三方信用评级中介机构对债务人如期足额偿还债务本息的能力和意愿进行评价,并用简单的评级符号表示其违约风险和损失的严重程度。同时,信用评级则是对评级对象履行相关合同和经济承诺的能力和意愿的总体评价。随着大数据分析技术的成熟,信用评级已从传统的感性认识判断上升为众多数据支撑而形成的理性分析。
现有技术从数据分析角度,对大量的数据经过推算、演变等相关算法,获得相应的信用等级分析结果。如专利号为“201210201461.6”、专利名称为“基于信用等级与违约损失率匹配的信用评级系统与方法”的授权发明专利;再如专利号为“201210201114.3”、专利名称为“基于信用等级与违约损失率匹配的信用评级调整方法”的授权发明专利。
但现有技术中的信用评级预测分析均是从金融算法、统计学方法等角度提出了更为优秀、准确的评级方法,并未真正基于大数据分析、人工智能角度进行技术考虑。并且,随着企业数据安全意识的提高和相关要求,企业的基本信息、财务数据等用于信用评级的基础核心数据已不对外公开,以导致无法进行有效的信用评级分类。与此同时,预测技术已趋向成熟,在各个应用领域均取得了一定的成效。
因此,如何将预测分析技术应用在信用评级上,通过少量的公开数据预测出非公开数据并得出信用预测分类结果已经成为急需解决的技术问题。
发明内容
本发明的目的是为了解决现有技术中公开数据无法满足信用评级分类需要的缺陷,提供一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法,包括以下步骤:
基础数据的获取:获取用于信用评级的模糊信息数据和精准信息数据,其中,模糊信息数据为企业信用评级的公开数据,精准信息数据为企业信用评级的非公开数据;
基础数据的预处理:对模糊信息数据和精准信息数据分别进行处理,分别提取出模糊信息数据、精准信息数据的定量信息、定性信息,并对定量信息进行标准化处理、定性信息进行数字化处理;
构建信用评级预测网络:构建包括学习网络和预测评级网络在内的信用评级预测网络,其中预测评级网络分为竞争分支网络与评级分类分支网络;
信用评级预测网络的训练:利用模糊信息数据和精准信息数据对信用评级预测网络进行训练;
获取待预测对象的的信用评级数据信息:获取待预测对象的待预测模糊信息数据,提取出待预测模糊信息数据内的定量信息、定性信息;
预测对象的信用评级预测分类:将待预测模糊信息数据内的定量信息标准化、定性信息数字化后输入训练后的信用评级预测网络,通过待预测模糊信息数据预测出类似精准信息数据的特征,并得到该预测对象的信用评级等级。
所述的构建信用评级预测网络包括以下步骤:
构建学习网络,设定学习网络为深度残差特征学习模型;
设定学习网络的基础部分为5个卷积模块、残差部分为3个残差模块,每一个残差模块包括2个1*3卷积和2个BN批量归一化操作以及2个relu非线性操作,残差块的输出是上述6个操作的输出加上输入,学习网络的输出是基础部分的输出加上残差部分的输出;
设定预测评级网络由竞争分支网络与评级分类分支网络构成,竞争分支网络和评级分类分支网络均由3个全连接层组成;
竞争分支网络在最后一个全连接层后加上sigmoid函数,将输出归一化到(0,1),越接近1表示为竞争分支输入的是精准信息特征,越接近0表示竞争分支输入的是模糊信息生成的伪精准信息;
评级分类分支网络在最后一个全连接层接softmax层,输出为信用等级的分类数目,其中,网络结构的卷积模块和残差模块的个数以及残差模块里卷积、归一化和非线性的操作个数以及参数均设定通过训练进行调节。
所述的信用评级预测网络的训练包括以下步骤:
利用精准信息数据训练预测评级网络的评级分类分支网络以及学习网络的基础部分,其表达式如下:
Ldis_p=Lcls(p,g)=-logpg,
其中,Ldis_p表示评级分支的分类损失,Fl表示精准信息数据通过学习网络的特征,g表示输入的精准信息数据对应的企业信用等级标签,p=(p0,p1,...,pk),pg表示评级分支输出里对应g的等级分类概率,即使得正确等级标签所对应的概率pg最大,此时分类损失达到最小;
根据已训练的评级分类分支网络再用模糊信息数据训练学习网络参数,其表达式如下:
其中,Ldis是训练学习网络的损失函数,主要由竞争损失Ldis_a和评级损失Ldis_p构成,模糊信息数据通过学习网络学习到的特征越类似精准信息的特征,使竞争网络分支输出越大竞争损失Ldis_a越小,同时信息通过学习网络学习到的特征越类似精准信息的特征,使预测评级网络分支输出对应正确信用等级标签概率pg越大,评级损失Ldis_p越小,
Ldis=w1*Ldis_a+w2*Ldis_p,
Ldis_p=Lcls(p,g)=-logpg;
使用模糊信息数据和精准信息数据同时训练竞争分支网络,其表达式如下:
有益效果
本发明的一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法,与现有技术相比通过公开的模糊信息模拟预测出非公开的精准信息数据,并生成信用评级分类结果,实现公开数据对非公开数据结果的有效预测分析。
本发明通过对模糊信息数据生成类似精准信息数据的特征表示,使得模糊信息数据的特征表示与精准信息特征数据表示相近以此更易于信用等级评定;学习网络通过较前层提取深度细腻特征将容易获取私密性弱但是不利于评定等级的模糊信息特征转变成类似较难获取私密性强但是容易进行评定信用等级的精准信息的特征;具有实用性强的特点。
附图说明
图1为本发明的方法顺序图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
实际应用中,企业用于信用评级的数据分为两类,其中一类是公开数据(模糊信息数据),这类数据较容易获取,其对信用评级具有一定的意义;另一类是非公开数据(精准信息数据),此类数据为企业机密,为严格保密的相关数据,此类数据除极其必要外通常不对外公开,但此类数据对企业的信用评级意义较大。而对于部分机构而言,由于其长期生产经营需要,积累了大量的公开数据和非公开数据,本发明思路就是从已有的公开数据和非公开数据,再利用待分析的公开数据去推算模拟出非公开数据,从而达到评级分类作用。如图1所示,本发明所述的一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法,包括以下步骤:
第一步,基础数据的获取。
获取用于信用评级的模糊信息数据和精准信息数据,在此的模糊信息数据和精准信息数据均为已有的数据信息。模糊信息数据为企业信用评级的公开数据,精准信息数据为企业信用评级的非公开数据。
第二步,基础数据的预处理。
对模糊信息数据和精准信息数据分别进行处理,分别提取出模糊信息数据、精准信息数据的定量信息、定性信息,定量信息是指一些数字信息等需要进行标准化,定性信息是指一些文字描述等需要数字化的信息。按现有技术方式,对定量信息进行标准化处理、定性信息进行数字化处理,以使得其能应用于训练网络使用。
第三步,构建信用评级预测网络:构建包括学习网络和预测评级网络在内的信用评级预测网络,其中预测评级网络分为竞争分支网络与评级分类分支网络。其具体步骤如下:
(1)构建学习网络,设定学习网络为深度残差特征学习模型;残差块学习模糊信息和精准信息间的残差表示,学习到的残差表示增强从模糊信息获取的卷积特征去近似精准信息的特征表示。设定学习网络的基础部分为5个卷积模块、残差部分为3个残差模块,每一个残差模块包括2个1*3卷积和2个BN批量归一化操作以及2个relu非线性操作,残差块的输出是上述6个操作的输出加上输入,学习网络的输出是基础部分的输出加上残差部分的输出;
(2)设定预测评级网络由竞争分支网络与评级分类分支网络构成,竞争分支网络和评级分类分支网络均由3个全连接层组成;竞争分支网络用来区分输入的是模糊信息通过生成网络生成的伪精准信息的特征表示还是真正的精准信息的特征表示,评级分类分支是直接使用生成网络生成的特征表示进行评级分类,竞争分支和评级分类分支的目的都是对自己网络的输入做分类,所以不需要再使用卷积提取特征,使用全连接层进行分类即可。
竞争分支网络在最后一个全连接层后加上sigmoid函数,将输出归一化到(0,1),越接近1表示为竞争分支输入的是精准信息特征,越接近0表示竞争分支输入的是模糊信息生成的伪精准信息;
评级分类分支网络在最后一个全连接层接softmax层,输出为信用等级的分类数目,其中,网络结构的卷积模块和残差模块的个数以及残差模块里卷积、归一化和非线性的操作个数以及参数均设定通过训练进行调节。
第四步,信用评级预测网络的训练,利用已有的模糊信息数据和精准信息数据对信用评级预测网络进行训练,训练后的信用评级预测网络则具有预测分类功能。其具体步骤如下:
(1)利用精准信息数据训练预测评级网络的评级分类分支网络以及学习网络的基础部分,主要目的是使用真正的精准信息通过评级网络分支构造损失函数训练评级分类分支,提高评级分类分支的评级正确率,其表达式如下:
Ldis_c=Lcls(c,i)=-logci,
其中,Ldis_c表示评级分支的分类损失,Ta表示精准信息数据通过学习网络的特征,i表示输入的精准信息数据对应的企业信用等级标签,c=(c0,c1,...,ck)表示评级分支输出里对应i的等级分类概率,即使得正确等级标签所对应的的概率最大,此时分类损失达到最小;
(2)根据已训练的评级分类分支网络再用模糊信息数据训练学习网络参数,主要目的是使用模糊信息通过竞争分支和评级分类分支构造损失函数训练学习网络分支,提高学习网络的学习能力,其表达式如下:
其中,Ldis是训练学习网络的损失函数,主要由竞争损失Ldis_m和评级损失Ldis_c构成,模糊信息数据通过学习网络学习到的特征越类似精准信息的特征,使竞争网络分支输出越大竞争损失Ldis_m越小,同时信息通过学习网络学习到的特征类似精准信息的特征,使预测评级网络分支输出对应正确信用等级标签概率越大评级损失Ldis_c越小,
Ldis=λ1*Ldis_m+λ2*Ldis_c,
Ldis_c=Lcls(c,i)=-logci;
(3)使用模糊信息数据和精准信息数据同时训练竞争分支网络,主要目的是使用模糊信息和精准信息通过竞争分支网络构造损失函数,提高竞争分支网络的鉴别能力,其表达式如下:
第五步,获取待预测对象的的信用评级数据信息:获取待预测对象的待预测模糊信息数据,提取出待预测模糊信息数据内的定量信息、定性信息。
第六步,预测对象的信用评级预测分类。将待预测模糊信息数据输入训练后的信用评级预测网络,首先通过学习网络学习到类似精准信息的特征表示,然后通过预测评级网络的评级分类分支得到该预测对象的信用评级等级。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
Claims (3)
1.一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法,其特征在于,包括以下步骤:
11)基础数据的获取:获取用于信用评级的模糊信息数据和精准信息数据,其中,模糊信息数据为企业信用评级的公开数据,精准信息数据为企业信用评级的非公开数据;
12)基础数据的预处理:对模糊信息数据和精准信息数据分别进行处理,分别提取出模糊信息数据、精准信息数据的定量信息、定性信息,并对定量信息进行标准化处理、定性信息进行数字化处理;
13)构建信用评级预测网络:构建包括学习网络和预测评级网络在内的信用评级预测网络,其中预测评级网络分为竞争分支网络与评级分类分支网络;
14)信用评级预测网络的训练:利用模糊信息数据和精准信息数据对信用评级预测网络进行训练;
15)获取待预测对象的的信用评级数据信息:获取待预测对象的待预测模糊信息数据,提取出待预测模糊信息数据内的定量信息、定性信息;
16)预测对象的信用评级预测分类:将待预测模糊信息数据内的定量信息标准化、定性信息数字化后输入训练后的信用评级预测网络,通过待预测模糊信息数据预测出类似精准信息数据的特征,并得到该预测对象的信用评级等级。
2.根据权利要求1所述的一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法,其特征在于,所述的构建信用评级预测网络包括以下步骤:
21)构建学习网络,设定学习网络为深度残差特征学习模型;
设定学习网络的基础部分为5个卷积模块、残差部分为3个残差模块,每一个残差模块包括2个1*3卷积和2个BN批量归一化操作以及2个relu非线性操作,残差块的输出是上述6个操作的输出加上输入,学习网络的输出是基础部分的输出加上残差部分的输出;
22)设定预测评级网络由竞争分支网络与评级分类分支网络构成,竞争分支网络和评级分类分支网络均由3个全连接层组成;
竞争分支网络在最后一个全连接层后加上sigmoid函数,将输出归一化到(0,1),越接近1表示为竞争分支输入的是精准信息特征,越接近0表示竞争分支输入的是模糊信息生成的伪精准信息;
评级分类分支网络在最后一个全连接层接softmax层,输出为信用等级的分类数目,其中,网络结构的卷积模块和残差模块的个数以及残差模块里卷积、归一化和非线性的操作个数以及参数均设定通过训练进行调节。
3.根据权利要求1所述的一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法,其特征在于,所述的信用评级预测网络的训练包括以下步骤:
31)利用精准信息数据训练预测评级网络的评级分类分支网络以及学习网络的基础部分,其表达式如下:
Ldis_p=Lcls(p,g)=-log pg,
其中,Ldis_p表示评级分支的分类损失,Fl表示精准信息数据通过学习网络的特征,g表示输入的精准信息数据对应的企业信用等级标签,p=(p0,p1,...,pk),pg表示评级分支输出里对应g的等级分类概率,即使得正确等级标签所对应的概率pg最大,此时分类损失达到最小;
32)根据已训练的评级分类分支网络再用模糊信息数据训练学习网络参数,其表达式如下:
其中,Ldis是训练学习网络的损失函数,主要由竞争损失Ldis_a和评级损失Ldis_p构成,模糊信息数据通过学习网络学习到的特征越类似精准信息的特征,使竞争网络分支输出越大竞争损失Ldis_a越小,同时信息通过学习网络学习到的特征越类似精准信息的特征,使预测评级网络分支输出对应正确信用等级标签概率pg越大,评级损失Ldis_p越小,
Ldis=w1*Ldis_a+w2*Ldis_p,
Ldis_p=Lcls(p,g)=-log pg;
33)使用模糊信息数据和精准信息数据同时训练竞争分支网络,其表达式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910938082.7A CN110705638A (zh) | 2019-09-30 | 2019-09-30 | 一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910938082.7A CN110705638A (zh) | 2019-09-30 | 2019-09-30 | 一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110705638A true CN110705638A (zh) | 2020-01-17 |
Family
ID=69197926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910938082.7A Pending CN110705638A (zh) | 2019-09-30 | 2019-09-30 | 一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110705638A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112686498A (zh) * | 2020-12-11 | 2021-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种基于深度卷积网络的企业信用评级方法 |
CN115170893A (zh) * | 2022-08-29 | 2022-10-11 | 荣耀终端有限公司 | 共视档位分类网络的训练方法、图像排序方法及相关设备 |
-
2019
- 2019-09-30 CN CN201910938082.7A patent/CN110705638A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112686498A (zh) * | 2020-12-11 | 2021-04-20 | 天津中科智能识别产业技术研究院有限公司 | 一种基于深度卷积网络的企业信用评级方法 |
CN115170893A (zh) * | 2022-08-29 | 2022-10-11 | 荣耀终端有限公司 | 共视档位分类网络的训练方法、图像排序方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492026B (zh) | 一种基于改进的主动学习技术的电信欺诈分类检测方法 | |
CN112905868B (zh) | 事件抽取方法、装置、设备及存储介质 | |
CN110636066B (zh) | 基于无监督生成推理的网络安全威胁态势评估方法 | |
CN112367273B (zh) | 基于知识蒸馏的深度神经网络模型的流量分类方法及装置 | |
CN114978613B (zh) | 基于数据增强和自监督特征增强的网络入侵检测方法 | |
CN111259720A (zh) | 基于自监督代理特征学习的无监督行人重识别方法 | |
WO2022143431A1 (zh) | 一种反洗钱模型的训练方法及装置 | |
CN115659966A (zh) | 基于动态异构图和多级注意力的谣言检测方法及系统 | |
CN109582974A (zh) | 一种基于深度学习的在校大学生信用评估方法及装置 | |
CN113240506A (zh) | 一种基于无监督领域自适应的金融风控冷启动建模方法 | |
CN110705638A (zh) | 一种利用深度网络学习模糊信息特征技术的信用评级预测分类方法 | |
Zhang | Application of artificial intelligence recognition technology in digital image processing | |
CN117667495B (zh) | 一种关联规则与深度学习集成的应用系统故障预测方法 | |
CN111126155A (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
CN117150528A (zh) | 基于图网络融合伪标签和后处理加密货币异常交易识别方法 | |
CN115622810A (zh) | 一种基于机器学习算法的业务应用识别系统及方法 | |
CN113705489B (zh) | 基于先验区域知识指导的遥感影像细粒度飞机识别方法 | |
CN116521863A (zh) | 一种基于半监督学习的标签抗噪文本分类方法 | |
CN115170334A (zh) | 一种反洗钱模型的训练方法及装置 | |
CN115204140A (zh) | 一种基于注意力机制与知识图谱的法律条文预测方法 | |
CN115240271A (zh) | 基于时空建模的视频行为识别方法与系统 | |
CN114840717A (zh) | 面向图数据的挖掘方法、装置、电子设备及可读存储介质 | |
CN114220145A (zh) | 人脸检测模型生成方法和装置、伪造人脸检测方法和装置 | |
CN114298715A (zh) | 一种基于自然语言处理技术的反欺诈方法、系统、设备及存储介质 | |
CN113657986A (zh) | 基于混合神经网络的企业非法集资风险预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200117 |