CN106204246A - 一种基于主成分分析法的bp神经网络信用评估方法 - Google Patents

一种基于主成分分析法的bp神经网络信用评估方法 Download PDF

Info

Publication number
CN106204246A
CN106204246A CN201610686766.9A CN201610686766A CN106204246A CN 106204246 A CN106204246 A CN 106204246A CN 201610686766 A CN201610686766 A CN 201610686766A CN 106204246 A CN106204246 A CN 106204246A
Authority
CN
China
Prior art keywords
prime
data
sample data
training
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610686766.9A
Other languages
English (en)
Inventor
詹进林
庄国强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YLZ INFORMATION TECHNOLOGY Co Ltd
Original Assignee
YLZ INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YLZ INFORMATION TECHNOLOGY Co Ltd filed Critical YLZ INFORMATION TECHNOLOGY Co Ltd
Priority to CN201610686766.9A priority Critical patent/CN106204246A/zh
Publication of CN106204246A publication Critical patent/CN106204246A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0609Buyer or seller confidence or verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明一种基于主成分分析法的BP神经网络信用评估方法,从银行数据中梳理出涉及个人的政府数据,以及结合银行对于该个人的信用评估结果,形成样本数据,对样本数据归一化处理后提高了预测性能,利用主成分分析法对样本数据进行降维,能解决复杂的指标、多维的数据类型,更符合大数据处理的需求,并将银行对于个人的信用评估结果作为训练BP神经网络模型的参考,从而构建一种基于政府大数据的信用评估模型,能克服专家打分的主观性,给企业或个人提供信用查询,也对金融机构的信用体系进行补充,具有较高的分类正确率、实用性,以及较好的评估效果。

Description

一种基于主成分分析法的BP神经网络信用评估方法
技术领域
本发明涉及一种基于主成分分析法的BP神经网络信用评估方法。
背景技术
目前,信用评估研究主要在金融机构内进行,其依据机构自身收集的业务数据,通过专业人士的分析评估,得到企业与个人的信用报告。仅仅依靠金融机构内的业务数据进行信用评估容易造成结论的片面性。当金融机构面对信息资料较少的客户时,往往不能得出有价值的信用评估。
随着大数据的到来,多方面数据融合分析成为主流,尤其是政府大数据对于征信起着举足轻重的作用。我国政府掌握80%以上的数据,但因各种局限及部门利益影响,数据不能共享,大多处于隔离和休眠状态,而基于政府数据建立的评估模型由于其数据的完整性、广泛性和隐私性,分析得出的结果更有说服力和社会价值。
政府大数据中涉及个人的数据主要包括:人社数据、教育数据、医疗卫生数据、就业数据等,存在数据维度大的特点,会造成计算复杂度的增加。
发明内容
本发明的目的在于提供一种基于主成分分析法的BP神经网络信用评估方法,能克服专家打分的主观性,具有较高的分类正确率、实用性,以及较好的评估效果,能解决复杂的指标、多维的数据类型,更符合大数据处理的需求。
本发明一种基于主成分分析法的BP神经网络信用评估方法,包括如下具体步骤:
步骤1、从银行数据中梳理出涉及个人的政府数据,以及结合银行对于该个人的信用评估结果,形成样本数据,对样本数据进行归一化处理,获得处理过的样本数据矩阵X’:
X ′ = x 11 ′ x 12 ′ ... x 1 p ′ x 21 ′ x 22 ′ ... x 2 p ′ . . . . . . . . . . . . x n 1 ′ x n 2 ′ ... x n p ′
其中,x′ij表示第i个样本数据的第j个指标;
步骤11、对于数值型的样本数据指标,采用下式进行归一化处理:
其中,i=1,2,3,…,n,该n为样本总数,j=1,2,3,…,p,该p为数值型指标总数,xij表示第i个样本数据的第j个数值型指标,max{xij}表示第i个样本数据中数值最大的指标,min{xij}表示第i个样本数据中数值最小的指标,x′ij表示归一化处理后的第i个样本数据的第j个指标;
步骤12、对于非数值型的样本数据指标,采用下式进行归一化处理:
其中,i=1,2,3,…,n,该n为样本总数,j=1,2,3,…,q,该q为非数值型指标总数,xij表示第i个样本数据的第j个非数值型指标,m对应最终的分类等级,K是指分类等级数,wm表示各分类等级m对应的权重,Nm(xij)表示样本非数值型指标xij对应分类等级m下相同属性的数量,N(xij)表示样本非数值型指标xij相同属性总的数量;
步骤2、利用PCA主成分分析法对步骤1中归一化后的样本数据矩阵进行降维处理,计算出其影响信用评估的主要因素和各因素排序,具体包括如下步骤:
步骤21、步骤1归一化处理过的样本数据矩阵X’:
X ′ = x 11 ′ x 12 ′ ... x 1 p ′ x 21 ′ x 22 ′ ... x 2 p ′ . . . . . . . . . . . . x n 1 ′ x n 2 ′ ... x n p ′
建立用于反映归一化后的样本数据之间相关关系密切程度的协方差矩阵R,如下:
R = Σ i = 1 n ( x i 1 ′ - u 1 - ) ( x i 1 ′ - u 1 - ) n - 1 Σ i = 1 n ( x i 2 ′ - u 2 - ) ( x i 1 ′ - u 1 - ) n - 1 ... Σ i = 1 n ( x i p ′ - u p - ) ( x i 1 ′ - u 1 - ) n - 1 Σ i = 1 n ( x i 1 ′ - u 1 - ) ( x i 2 ′ - u 2 - ) n - 1 Σ i = 1 n ( x i 2 ′ - u 2 - ) ( x i 2 ′ - u 2 - ) n - 1 ... Σ i = 1 n ( x i p ′ - u p - ) ( x i 2 ′ - u 2 - ) n - 1 . . . . . . . . . . . . Σ i = 1 n ( x i 1 ′ - u 1 - ) ( x i p ′ - u p - ) n - 1 Σ i = 1 n ( x i 2 ′ - u 2 - ) ( x i p ′ - u p - ) n - 1 ... Σ i = 1 n ( x i p ′ - u p - ) ( x i p ′ - u p - ) n - 1
其中,为样本数据X′中第p列的均值,所述的协方差矩阵R为实对称矩阵,即Rij=Rji
步骤22、根据协方差矩阵R计算特征值与特征向量:
解特征方程|λI-R|=0,其中I为单位矩阵,求出特征值λi,其中i=1,2,…,p,并将其按大小顺序排列;
分别求出对应于特征值λi的特征向量ei,这里要求||ei||=1,即其中eij表示特征向量ei的第j个分量;
选择m个特征向量ei组成矩阵与样本数据Xi进行相乘,得到m个主成分Fi,其中m<p,公式如下:
其中Fi1称为第i条样本xi第一主成分;
步骤23、计算主成分贡献率和累计贡献率:
由于特征值与主成分是一一对应的,第i个主成分Fi是通过第i个特征值λi对应的特征向量ei得到的,第i主成分Fi的贡献率就是通过第i个特征值λi计算得到的,则第i主成分Fi的贡献率公式如下:
累计贡献率计算公式如下:
取累计贡献率达85%~95%的m个特征值其所对应的m个主成分,其中m<p,从而得到新的训练样本F:
其中F矩阵内的值由公式1-3计算获得;
步骤3、运用BP神经网络建立个人信用评估的模型:
步骤31、设计BP神经网络拓扑结构:
根据Kolmogorov定理,建立三层BP神经网络,分别包括:输入层、隐层和输出层,该输入层节点数为步骤2中新产生的训练样本F的主成分个数m,输出层节点数为1个,隐层节点数按照Lippmann经验公式确定,训练函数为TRAINLM,适应学习函数为LEARNGDM,性能分析函数为MSE,隐层传递函数为TANSIG函数,输出层传递函数为PURELIN函数,按照Delta学习规则对各层节点之间的网络连接权值和阈值进行调整,网络全局误差E的计算公式为:
式中,p代表训练样本的数目,Et为第t个训练样本的网络训练误差,zt为第t个训练样本的网络实际输出值,ct为第t个训练样本已知的银行对于个人的信用评估结果;
步骤32、BP神经网络模型的训练:
将步骤2经过数据降维的样本数据F进行训练,选样本数据F的一部分作为训练数据,剩余的作为测试数据,设置学习率、动量因子、各层的连接权值、输出阈值赋予(-1,1)间的随机数,所述BP神经网络训练采用Delta学习规则,预置网络全局误差E精度值及训练次数,计算网络全局误差E,若网络全局误差E小于预置的精度值或训练次数达到设定值,则结束训练,得到BP神经网络模型;
步骤33、个人信用模型评估
将测试数据输入到步骤32中训练得到的BP神经网络模型中进行模型测试,若分类精度达阈值以上,则认为具有较好的分类效果,该BP神经网络模型通过评估,否则,返回步骤31,重新调整BP神经网络拓扑结构,直至经过训练的BP神经网络模型对测试数据进行信用评估时达阈值分类精度;
步骤4、将待进行信用评估的数据输入步骤3建立的个人信用评估的模型中,输出评估结果。
该政府数据中涉及个人的数据主要包括:人社数据、教育数据、医疗卫生数据、就业数据。
本发明从银行数据中梳理出涉及个人的政府数据,以及结合银行对于该个人的信用评估结果,形成样本数据,对样本数据归一化处理后提高了预测性能,利用主成分分析法对样本数据进行降维,能解决复杂的指标、多维的数据类型,更符合大数据处理的需求,并将银行对于个人的信用评估结果作为训练BP神经网络模型的参考,从而构建一种基于政府大数据的信用评估模型,能克服专家打分的主观性,给企业或个人提供信用查询,也对金融机构的信用体系进行补充,具有较高的分类正确率、实用性,以及较好的评估效果。
具体实施方式
本发明一种基于主成分分析法的BP神经网络信用评估方法,具体步骤如下:
步骤1、从银行数据中梳理出涉及个人的政府数据,以及结合银行对于该个人的信用评估结果,形成样本数据,该政府数据中涉及个人的数据主要包括:人社数据、教育数据、医疗卫生数据、就业数据,例如,个人基本信息数据包括:性别、年龄、文化程度、婚姻状况等;健康状况数据包括:医疗花费情况、是否有重大疾病等;就业情况数据包括:就业单位、就业单位性质、失业情况等;社会保障状况数据包括:社保缴纳情况等,对样本数据进行归一化处理,获得处理过的样本数据矩阵X’:
X &prime; = x 11 &prime; x 12 &prime; ... x 1 p &prime; x 21 &prime; x 22 &prime; ... x 2 p &prime; . . . . . . . . . . . . x n 1 &prime; x n 2 &prime; ... x n p &prime;
其中,x′ij表示第i个样本数据的第j个指标;
步骤11、对于数值型的样本数据指标,采用下式进行归一化处理:
其中,i=1,2,3,…,n,j=1,2,3,…,p,n为样本总数,p为数值型指标总数,xij表示第i个样本数据的第j个数值型指标,max{xij}表示第i个样本数据中数值最大的指标,min{xij}表示第i个样本数据中数值最小的指标,x′ij表示预处理后的第i个样本数据的第j个指标;
步骤12、对于非数值型的样本数据指标,采用下式进行归一化处理:
其中,i=1,2,3,…,n,j=1,2,3,…,q,n为样本总数,q为非数值型指标总数,xij表示第i个样本数据的第j个非数值型指标,m对应最终的分类等级,K是指分类等级数,例如:分类等级为优、良、中、差,则K为4,wm表示各分类等级m对应的权重,Nm(xij)表示样本非数值型指标xij对应分类等级m下相同属性的数量,N(xij)表示样本非数值型指标xij相同属性总的数量;
举例说明,对于性别这一指标,分为男、女两个属性,假定100条记录中,男为60条,女为40条,分类等级为优、良、中、差,将分类等级赋予权重,依次为0.4,0.3,0.2,0.1,若性别分男、女分别对应分类等级的数量分布如下表所示:
30 10 10 10
10 6 2 2
则:
步骤2、利用PCA主成分分析法对步骤1中归一化后的样本数据矩阵进行降维处理,计算出其影响信用评估的主要因素和各因素排序,所述PCA主成分分析法是一种数学变换的方法,通过降维的思路,把多指标转化为少数几个综合指标,它把给定的一组相关变量通过线性变换成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列,具体包括如下步骤:
步骤21、步骤1归一化处理过的样本数据矩阵X’:
X &prime; = x 11 &prime; x 12 &prime; ... x 1 p &prime; x 21 &prime; x 22 &prime; ... x 2 p &prime; . . . . . . . . . . . . x n 1 &prime; x n 2 &prime; ... x n p &prime;
建立用于反映归一化后的样本数据之间相关关系密切程度的协方差矩阵R,如下:
R = &Sigma; i = 1 n ( x i 1 &prime; - u 1 - ) ( x i 1 &prime; - u 1 - ) n - 1 &Sigma; i = 1 n ( x i 2 &prime; - u 2 - ) ( x i 1 &prime; - u 1 - ) n - 1 ... &Sigma; i = 1 n ( x i p &prime; - u p - ) ( x i 1 &prime; - u 1 - ) n - 1 &Sigma; i = 1 n ( x i 1 &prime; - u 1 - ) ( x i 2 &prime; - u 2 - ) n - 1 &Sigma; i = 1 n ( x i 2 &prime; - u 2 - ) ( x i 2 &prime; - u 2 - ) n - 1 ... &Sigma; i = 1 n ( x i p &prime; - u p - ) ( x i 2 &prime; - u 2 - ) n - 1 . . . . . . . . . . . . &Sigma; i = 1 n ( x i 1 &prime; - u 1 - ) ( x i p &prime; - u p - ) n - 1 &Sigma; i = 1 n ( x i 2 &prime; - u 2 - ) ( x i p &prime; - u p - ) n - 1 ... &Sigma; i = 1 n ( x i p &prime; - u p - ) ( x i p &prime; - u p - ) n - 1
其中,为样本数据X′中第p列的均值,所述的协方差矩阵R为实对称矩阵,即Rij=Rji
步骤22、根据协方差矩阵R计算特征值与特征向量:
解特征方程|λI-R|=0,其中I为单位矩阵,求出特征值λi,其中i=1,2,…,p,并将其按大小顺序排列,即λ1≥λ2≥…≥λp≥0;
分别求出对应于特征值λi的特征向量ei,这里要求||ei||=1,即其中eij表示特征向量ei的第j个分量;
选择m个特征向量ei组成矩阵与样本数据Xi进行相乘,得到m个主成分Fi,其中m<p,公式如下:
其中Fi1称为第i条样本xi第一主成分;
步骤23、计算主成分贡献率和累计贡献率:
由于特征值与主成分是一一对应的,第i个主成分Fi是通过第i个特征值λi对应的特征向量ei得到的,第i主成分Fi的贡献率就是通过第i个特征值λi计算得到的,则第i主成分Fi的贡献率公式如下:
累计贡献率计算公式如下:
取累计贡献率达85%~95%的特征值λ12,…,λm所对应的第1,第2,……,第m个主成分,其中m<p,从而得到新的训练样本F:
其中F矩阵内的值由公式(1-3)获得;
步骤3、运用BP神经网络建立个人信用评估的模型:
步骤31、设计BP神经网络拓扑结构:
根据Kolmogorov定理,建立三层BP神经网络,分别包括:输入层、隐层和输出层,该输入层节点数为步骤2中新产生的训练样本F的主成分个数m,输出层节点数为1个,隐层节点数按照Lippmann经验公式确定,训练函数为TRAINLM,适应学习函数为LEARNGDM,性能分析函数为MSE,隐层传递函数为TANSIG函数,输出层传递函数为PURELIN函数,按照Delta学习规则对各层节点之间的网络连接权值和阈值进行调整,网络全局误差E的计算公式为:
式中,p代表训练样本的数目,Et为第t个训练样本的网络训练误差,zt为第t个训练样本的网络实际输出值,ct为第t个训练样本已知的银行对于个人的信用评估结果;
步骤32、BP神经网络的训练:
将步骤2经过数据降维的样本数据F进行训练,选样本数据F的70%作为训练数据,剩余的30%作为测试数据,设置学习率为0.6,动量因子取0.5,各层的连接权值、输出阈值赋予(-1,1)间的随机数,所述BP神经网络训练采用Delta学习规则,预置网络全局误差E精度值为0.5或训练次数大于5000,计算网络全局误差E,若网络全局误差E小于预置的精度值或训练次数达到设定值,则结束训练,得到BP神经网络模型;
步骤33、个人信用模型评估
将测试数据输入到步骤32中训练得到的BP神经网络模型中进行模型测试,若分类精度达阈值(70%)以上,则认为具有较好的分类效果,该BP神经网络模型通过评估,否则,返回步骤31,重新调整BP神经网络拓扑结构,直至经过训练的BP神经网络模型,对测试数据进行信用评估时,达阈值分类精度;
步骤4、将待进行信用评估的数据输入步骤3建立的个人信用评估的模型中,输出评估结果。
本发明的重点在于:本发明一种基于主成分分析法的BP神经网络信用评估方法,从银行数据中梳理出涉及个人的政府数据,以及结合银行对于该个人的信用评估结果,形成样本数据,对样本数据归一化处理后提高了预测性能,利用主成分分析法对样本数据进行降维,能解决复杂的指标、多维的数据类型,更符合大数据处理的需求,并将银行对于个人的信用评估结果作为训练BP神经网络模型的参考,从而构建一种基于政府大数据的信用评估模型,能克服专家打分的主观性,给企业或个人提供信用查询,也对金融机构的信用体系进行补充,具有较高的分类正确率、实用性,以及较好的评估效果。
以上所述,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (2)

1.一种基于主成分分析法的BP神经网络信用评估方法,其特征在于包括如下具体步骤:
步骤1、从银行数据中梳理出涉及个人的政府数据,以及结合银行对于该个人的信用评估结果,形成样本数据,对样本数据进行归一化处理,获得处理过的样本数据矩阵X’:
X &prime; = x 11 &prime; x 12 &prime; ... x 1 p &prime; x 21 &prime; x 22 &prime; ... x 2 p &prime; . . . . . . . . . . . . x n 1 &prime; x n 2 &prime; ... x n p &prime;
其中,x′ij表示第i个样本数据的第j个指标;
步骤11、对于数值型的样本数据指标,采用下式进行归一化处理:
其中,i=1,2,3,…,n,该n为样本总数,j=1,2,3,…,p,该p为数值型指标总数,xij表示第i个样本数据的第j个数值型指标,max{xij}表示第i个样本数据中数值最大的指标,min{xij}表示第i个样本数据中数值最小的指标,x′ij表示归一化处理后的第i个样本数据的第j个指标;
步骤12、对于非数值型的样本数据指标,采用下式进行归一化处理:
其中,i=1,2,3,…,n,该n为样本总数,j=1,2,3,…,q,该q为非数值型指标总数,xij表示第i个样本数据的第j个非数值型指标,m对应最终的分类等级,K是指分类等级数,wm表示各分类等级m对应的权重,Nm(xij)表示样本非数值型指标xij对应分类等级m下相同属性的数量,N(xij)表示样本非数值型指标xij相同属性总的数量;
步骤2、利用PCA主成分分析法对步骤1中归一化后的样本数据矩阵进行降维处理,计算出其影响信用评估的主要因素和各因素排序,具体包括如下步骤:
步骤21、步骤1归一化处理过的样本数据矩阵X’:
X &prime; = x 11 &prime; x 12 &prime; ... x 1 p &prime; x 21 &prime; x 22 &prime; ... x 2 p &prime; . . . . . . . . . . . . x n 1 &prime; x n 2 &prime; ... x n p &prime;
建立用于反映归一化后的样本数据之间相关关系密切程度的协方差矩阵R,如下:
R = &Sigma; i = 1 n ( x i 1 &prime; - u 1 - ) ( x i 1 &prime; - u 1 - ) n - 1 &Sigma; i = 1 n ( x i 2 &prime; - u 2 - ) ( x i 1 &prime; - u 1 - ) n - 1 ... &Sigma; i = 1 n ( x i p &prime; - u p - ) ( x i 1 &prime; - u 1 - ) n - 1 &Sigma; i = 1 n ( x i 1 &prime; - u 1 - ) ( x i 2 &prime; - u 2 - ) n - 1 &Sigma; i = 1 n ( x i 2 &prime; - u 2 - ) ( x i 2 &prime; - u 2 - ) n - 1 ... &Sigma; i = 1 n ( x i p &prime; - u p - ) ( x i 2 &prime; - u 2 - ) n - 1 . . . . . . . . . . . . &Sigma; i = 1 n ( x i 1 &prime; - u 1 - ) ( x i p &prime; - u p - ) n - 1 &Sigma; i = 1 n ( x i 2 &prime; - u 2 - ) ( x i p &prime; - u p - ) n - 1 ... &Sigma; i = 1 n ( x i p &prime; - u p - ) ( x i p &prime; - u p - ) n - 1
其中,为样本数据X′中第p列的均值,所述的协方差矩阵R为实对称矩阵,即Rij=Rji
步骤22、根据协方差矩阵R计算特征值与特征向量:
解特征方程|λI-R|=0,其中I为单位矩阵,求出特征值λi,其中i=1,2,...,p,并将其按大小顺序排列;
分别求出对应于特征值λi的特征向量ei,这里要求||ei||=1,即其中eij表示特征向量ei的第j个分量;
选择m个特征向量ei组成矩阵与样本数据Xi进行相乘,得到m个主成分Fi,其中m<p,公式如下:
其中Fi1称为第i条样本xi第一主成分;
步骤23、计算主成分贡献率和累计贡献率:
由于特征值与主成分是一一对应的,第i个主成分Fi是通过第i个特征值λi对应的特征向量ei得到的,第i主成分Fi的贡献率就是通过第i个特征值λi计算得到的,则第i主成分Fi的贡献率公式如下:
累计贡献率计算公式如下:
取累计贡献率达85%~95%的m个特征值其所对应的m个主成分,其中m<p,从而得到新的训练样本F:
其中F矩阵内的值由公式1-3计算获得;
步骤3、运用BP神经网络建立个人信用评估的模型:
步骤31、设计BP神经网络拓扑结构:
根据Kolmogorov定理,建立三层BP神经网络,分别包括:输入层、隐层和输出层,该输入层节点数为步骤2中新产生的训练样本F的主成分个数m,输出层节点数为1个,隐层节点数按照Lippmann经验公式确定,训练函数为TRAINLM,适应学习函数为LEARNGDM,性能分析函数为MSE,隐层传递函数为TANSIG函数,输出层传递函数为PURELIN函数,按照Delta学习规则对各层节点之间的网络连接权值和阈值进行调整,网络全局误差E的计算公式为:
式中,p代表训练样本的数目,Et为第t个训练样本的网络训练误差,zt为第t个训练样本的网络实际输出值,ct为第t个训练样本已知的银行对于个人的信用评估结果;
步骤32、BP神经网络模型的训练:
将步骤2经过数据降维的样本数据F进行训练,选样本数据F的一部分作为训练数据,剩余的作为测试数据,设置学习率、动量因子、各层的连接权值、输出阈值赋予(-1,1)间的随机数,所述BP神经网络训练采用Delta学习规则,预置网络全局误差E精度值及训练次数,计算网络全局误差E,若网络全局误差E小于预置的精度值或训练次数达到设定值,则结束训练,得到BP神经网络模型;
步骤33、个人信用模型评估
将测试数据输入到步骤32中训练得到的BP神经网络模型中进行模型测试,若分类精度达阈值以上,则认为具有较好的分类效果,该BP神经网络模型通过评估,否则,返回步骤31,重新调整BP神经网络拓扑结构,直至经过训练的BP神经网络模型对测试数据进行信用评估时达阈值分类精度;
步骤4、将待进行信用评估的数据输入步骤3建立的个人信用评估的模型中,输出评估结果。
2.根据权利要求1所述的一种基于主成分分析法的BP神经网络信用评估方法,其特征在于:该政府数据中涉及个人的数据主要包括:人社数据、教育数据、医疗卫生数据、就业数据。
CN201610686766.9A 2016-08-18 2016-08-18 一种基于主成分分析法的bp神经网络信用评估方法 Pending CN106204246A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610686766.9A CN106204246A (zh) 2016-08-18 2016-08-18 一种基于主成分分析法的bp神经网络信用评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610686766.9A CN106204246A (zh) 2016-08-18 2016-08-18 一种基于主成分分析法的bp神经网络信用评估方法

Publications (1)

Publication Number Publication Date
CN106204246A true CN106204246A (zh) 2016-12-07

Family

ID=57522086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610686766.9A Pending CN106204246A (zh) 2016-08-18 2016-08-18 一种基于主成分分析法的bp神经网络信用评估方法

Country Status (1)

Country Link
CN (1) CN106204246A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844663A (zh) * 2017-01-23 2017-06-13 中国石油大学(华东) 一种基于数据挖掘的船舶碰撞风险评估方法及系统
CN107063349A (zh) * 2017-04-17 2017-08-18 云南电网有限责任公司电力科学研究院 一种诊断变压器故障的方法及装置
CN107273917A (zh) * 2017-05-26 2017-10-20 电子科技大学 一种基于并行化主成分分析算法的数据降维方法
CN107481135A (zh) * 2017-08-16 2017-12-15 广东工业大学 一种基于bp神经网络的个人信用评价方法及系统
CN107590737A (zh) * 2017-10-24 2018-01-16 厦门大学 个人信用评分以及信用额度测算方法
CN107633265A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 用于优化信用评估模型的数据处理方法及装置
CN108446890A (zh) * 2018-02-26 2018-08-24 平安普惠企业管理有限公司 一种审批模型训练方法、计算机可读存储介质及终端设备
CN108537397A (zh) * 2017-03-01 2018-09-14 腾讯科技(深圳)有限公司 一种互联网征信评估方法和系统
CN109191838A (zh) * 2018-09-07 2019-01-11 西北工业大学 基于人工智能的高速公路绿色通道通行管理方法及系统
CN109447574A (zh) * 2018-10-09 2019-03-08 广州供电局有限公司 基于模糊优选神经网络的资产转固项目处理方法
CN109816513A (zh) * 2018-12-21 2019-05-28 上海拍拍贷金融信息服务有限公司 用户信用评级方法及装置、可读存储介质
CN110344824A (zh) * 2019-06-25 2019-10-18 中国矿业大学(北京) 一种基于随机森林回归的声波曲线生成方法
CN110381079A (zh) * 2019-07-31 2019-10-25 福建师范大学 结合gru和svdd进行网络日志异常检测方法
CN110533528A (zh) * 2019-08-30 2019-12-03 北京市天元网络技术股份有限公司 评估企业信用的方法及设备
CN110561191A (zh) * 2019-07-30 2019-12-13 西安电子科技大学 基于pca与自编码器的数控机床刀具磨损数据处理方法
CN110957024A (zh) * 2019-10-25 2020-04-03 卫宁健康科技集团股份有限公司 一种医疗信用评估方法、装置及存储介质
CN114283023A (zh) * 2021-12-29 2022-04-05 工业云制造(四川)创新中心有限公司 一种基于云制造支撑技术的制造管理方法及系统
DE202022104425U1 (de) 2022-08-03 2022-08-09 Sayed Sayeed Ahmad Intelligentes System für die sichere Integration von Kreditwürdigkeitsprüfungen und Bankensystemen durch maschinelles Lernen
CN115795314A (zh) * 2023-02-07 2023-03-14 山东海量信息技术研究院 一种关键样本采样方法、系统、电子设备及存储介质
CN117151464A (zh) * 2023-08-23 2023-12-01 中国铁建大桥工程局集团有限公司 一种基于pso-rbf神经网络隧道塌方风险评估预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592171A (zh) * 2011-12-30 2012-07-18 南京邮电大学 基于bp神经网络的认知网络性能预测方法及装置
CN103514566A (zh) * 2013-10-15 2014-01-15 国家电网公司 一种风险控制系统及方法
CN104792522A (zh) * 2015-04-10 2015-07-22 北京工业大学 一种基于分数阶小波变换和bp神经网络的齿轮缺陷智能分析方法
CN105675807A (zh) * 2016-01-07 2016-06-15 中国农业大学 一种基于bp神经网络的莠去津残留评价方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102592171A (zh) * 2011-12-30 2012-07-18 南京邮电大学 基于bp神经网络的认知网络性能预测方法及装置
CN103514566A (zh) * 2013-10-15 2014-01-15 国家电网公司 一种风险控制系统及方法
CN104792522A (zh) * 2015-04-10 2015-07-22 北京工业大学 一种基于分数阶小波变换和bp神经网络的齿轮缺陷智能分析方法
CN105675807A (zh) * 2016-01-07 2016-06-15 中国农业大学 一种基于bp神经网络的莠去津残留评价方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘春玲等: "基于主成分分析法和BP神经网络的银行客户信用评价", 《河北工程技术高等专科学校学报》 *
宋新明等: "基于主成分分析法和BP神经网络的电力客户信用评价", 《技术经济与管理研究》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106844663B (zh) * 2017-01-23 2020-01-17 中国石油大学(华东) 一种基于数据挖掘的船舶碰撞风险评估方法及系统
CN106844663A (zh) * 2017-01-23 2017-06-13 中国石油大学(华东) 一种基于数据挖掘的船舶碰撞风险评估方法及系统
CN108537397A (zh) * 2017-03-01 2018-09-14 腾讯科技(深圳)有限公司 一种互联网征信评估方法和系统
CN107063349A (zh) * 2017-04-17 2017-08-18 云南电网有限责任公司电力科学研究院 一种诊断变压器故障的方法及装置
CN107273917A (zh) * 2017-05-26 2017-10-20 电子科技大学 一种基于并行化主成分分析算法的数据降维方法
CN107481135A (zh) * 2017-08-16 2017-12-15 广东工业大学 一种基于bp神经网络的个人信用评价方法及系统
CN107633265A (zh) * 2017-09-04 2018-01-26 深圳市华傲数据技术有限公司 用于优化信用评估模型的数据处理方法及装置
CN107633265B (zh) * 2017-09-04 2021-03-30 深圳市华傲数据技术有限公司 用于优化信用评估模型的数据处理方法及装置
CN107590737A (zh) * 2017-10-24 2018-01-16 厦门大学 个人信用评分以及信用额度测算方法
CN108446890A (zh) * 2018-02-26 2018-08-24 平安普惠企业管理有限公司 一种审批模型训练方法、计算机可读存储介质及终端设备
CN109191838A (zh) * 2018-09-07 2019-01-11 西北工业大学 基于人工智能的高速公路绿色通道通行管理方法及系统
CN109447574A (zh) * 2018-10-09 2019-03-08 广州供电局有限公司 基于模糊优选神经网络的资产转固项目处理方法
CN109816513A (zh) * 2018-12-21 2019-05-28 上海拍拍贷金融信息服务有限公司 用户信用评级方法及装置、可读存储介质
CN110344824A (zh) * 2019-06-25 2019-10-18 中国矿业大学(北京) 一种基于随机森林回归的声波曲线生成方法
CN110561191A (zh) * 2019-07-30 2019-12-13 西安电子科技大学 基于pca与自编码器的数控机床刀具磨损数据处理方法
CN110381079A (zh) * 2019-07-31 2019-10-25 福建师范大学 结合gru和svdd进行网络日志异常检测方法
CN110533528A (zh) * 2019-08-30 2019-12-03 北京市天元网络技术股份有限公司 评估企业信用的方法及设备
CN110957024A (zh) * 2019-10-25 2020-04-03 卫宁健康科技集团股份有限公司 一种医疗信用评估方法、装置及存储介质
CN114283023A (zh) * 2021-12-29 2022-04-05 工业云制造(四川)创新中心有限公司 一种基于云制造支撑技术的制造管理方法及系统
DE202022104425U1 (de) 2022-08-03 2022-08-09 Sayed Sayeed Ahmad Intelligentes System für die sichere Integration von Kreditwürdigkeitsprüfungen und Bankensystemen durch maschinelles Lernen
CN115795314A (zh) * 2023-02-07 2023-03-14 山东海量信息技术研究院 一种关键样本采样方法、系统、电子设备及存储介质
CN117151464A (zh) * 2023-08-23 2023-12-01 中国铁建大桥工程局集团有限公司 一种基于pso-rbf神经网络隧道塌方风险评估预测方法

Similar Documents

Publication Publication Date Title
CN106204246A (zh) 一种基于主成分分析法的bp神经网络信用评估方法
Yu et al. An intelligent-agent-based fuzzy group decision making model for financial multicriteria decision support: The case of credit scoring
Kao et al. A Bayesian latent variable model with classification and regression tree approach for behavior and credit scoring
Lukić Analysis if the Efficiency of Trade in Oil Derivatives in Serbia by Applying the Fuzzy AHP-TOPSIS Method
Xian et al. Interval‐valued Pythagorean fuzzy linguistic TODIM based on PCA and its application for emergency decision
Sajjad et al. Statistical and analytical approach of multi-criteria group decision-making based on the correlation coefficient under intuitionistic 2-tuple fuzzy linguistic environment
Suhartono et al. Comparison between VAR, GSTAR, FFNN-VAR and FFNN-GSTAR models for forecasting oil production
Qiu et al. Credit risk scoring analysis based on machine learning models
Rahman et al. Estimation and applications of quantile regression for binary longitudinal data
Halachev Prediction of e-learning efficiency by neural networks
Adeyemo et al. Effects of normalization techniques on logistic regression in data science
Kung et al. A fuzzy MCDM method to select the best company based on financial report analysis
CN113408908A (zh) 一种基于履约能力和行为的多维信用评价模型构建方法
Wu et al. Generating life course trajectory sequences with recurrent neural networks and application to early detection of social disadvantage
Wanjuki et al. Forecasting Commodity Price Index of Food and Beverages in Kenya Using Seasonal Autoregressive Integrated Moving Average (SARIMA) Models
Kayakuş Estimating the Changes in the Number of Visitors on the Websites of the Tourism Agencies in the COVID-19 Process by Machine Learning Methods
Finch Fitting exploratory factor analysis models with high dimensional psychological data
Shaik et al. Customer loan eligibility prediction using machine learning
Zhou et al. Comparative Analysis Of A Traditional And Machine Learning Techniques In Predicting SMMES Growth Performance
Wotaifi Mining of completion rate of higher education based on fuzzy feature selection model and machine learning techniques
Mbaluka et al. Application of principal component analysis and hierarchical regression model on Kenya macroeconomic indicators
Han Customer segmentation model based on retail consumer behavior analysis
Gao Financial Loan Default Risk Prediction Based on Big Data Analysis
Salama et al. A back propagation artificial neural network based model for detecting and predicting fraudulent financial reporting
Ahlberg Application of the Ordered Lorenz Curve in the Analysis of a Non-Life Insurance Portfolio

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Wu Liangbin

Inventor after: Zhan Jinlin

Inventor after: Chen Kunlong

Inventor after: Zhuang Guoqiang

Inventor before: Zhan Jinlin

Inventor before: Zhuang Guoqiang

COR Change of bibliographic data