CN114862563A - 基于主成分分析和神经网络的中小信贷策略模型 - Google Patents

基于主成分分析和神经网络的中小信贷策略模型 Download PDF

Info

Publication number
CN114862563A
CN114862563A CN202210696231.5A CN202210696231A CN114862563A CN 114862563 A CN114862563 A CN 114862563A CN 202210696231 A CN202210696231 A CN 202210696231A CN 114862563 A CN114862563 A CN 114862563A
Authority
CN
China
Prior art keywords
credit
loan
enterprise
index
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210696231.5A
Other languages
English (en)
Inventor
夏红卫
陈鑫
苏斌浩
卜宁川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou Institute of Technology
Original Assignee
Changzhou Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou Institute of Technology filed Critical Changzhou Institute of Technology
Priority to CN202210696231.5A priority Critical patent/CN114862563A/zh
Publication of CN114862563A publication Critical patent/CN114862563A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A10/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE at coastal zones; at river basins
    • Y02A10/40Controlling or monitoring, e.g. of flood or hurricane; Forecasting, e.g. risk assessment or mapping

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及一种中小微企业信贷策略模型,特别涉及一种基于主成分分析和神经网络的中小信贷策略模型,充分量化企业交易票据信息,建立了综合的信贷风险评判体系,运用主成分分析、粒子群算法、BP神经网络、模糊综合评判法对中小微企业进行了客观、综合的信贷决策;同时对有信贷记录的企业的数据,使用支持向量机、随机森林、BP神经网络进行信贷等级评判的对比,确定了中小微企业信贷策略模型使用的鲁棒性和有效性利用不同种类的数据得到数据间的相关矩阵,并基于相关矩阵特征值得到贷款额度分配模型的指标贡献加权系数,即评价指标加权系数来源于数据本身而不依赖于人工经验,是科学和准确并有效的。

Description

基于主成分分析和神经网络的中小信贷策略模型
技术领域
本发明涉及一种中小微企业信贷策略模型,特别涉及基于主成分分析和神经网络的中小信贷策略模型。
背景技术
近年来,因为规模相对较小的中小微企业缺乏抵押资产,所以银行通常依据信贷政策、企业的交易票据信息和上下游企业的影响力,来向经济实力强、供求关系稳定的企业提供贷款,并且对信誉高、信贷风险小的企业给予利率优惠。银行对放贷企业进行放贷,需要建立数学模型研究中小微企业的信贷策略,主要解决问题包括:量化分析有信贷记录企业的信贷风险,给出银行在年度信贷总额固定的情况下这些企业的信贷策略;量化分析无信贷记录企业的信贷风险,给出银行在年度信贷总额为常量时对这些企业的信贷策略;由于企业生产经营时会有一些突发因素,例如疫情或地震洪灾等会对不同企业的生产经营和经济效益产生不同影响;综合考虑无信贷记录企业的信贷风险和突发因素对各企业的影响,给出银行在年度信贷总额固定额度时的信贷策略调整。
中小微企业规模较小,缺少抵押资产,因此银行通常是依据企业的交易票据信息和影响力等因素制定贷款策略,并对信誉高,信贷风险小的企业给予利率优惠。目前也有学者建立一个以平均客户流失率的阈值为约束条件的银行贷款收益最优化模型,计算企业抗风险得分、资产实力得分、企业违约情况等,从而确定对企业是否放贷及贷款额度,利率和期限等信贷策略。学者对商业银行开展小微企业信贷的策略选择问题进行了研究,指出信息不对称是限制商业银行向小微企业贷款的最为关键的因素。以借款企业及其业主的相关"软信息"为贷款决策依据的关系型贷款和贷款者之间负有连带责任的团体贷款,可有效降低信息不对称问题对贷款风险的影响。强调商业银行需要在信息收集方法、营销模式、业务流程、组织架构、激励约束机制等多方面做出变革。
部分学者对宁夏银行小微企业信贷业务发展策略开展研究,指出宁夏银行坚持服务小微企业,同时加大信贷资源的配置力度,坚定不移地把小微企业作为主要服务对象和信贷支持的重点。也有学者研究了中国民生银行小微企业信贷业务扩展策略。阐述了中国小微金融就是为已摆脱贫困,并在经济成长中发挥重要作用的微型和小型企业所提供正规和现代金融服务。同时以民生银行作为小微企业融资方面的研究对象,在结合民生银行小微金融业务发展的实际情况及研究小微金融理论的基础上,通过对小微企业融资需求偏好的分析,以及对比中国工商银行、中信银行、民生银行小微金融业务发展的现状,分析影响民生银行开展小微企业信贷业务的因素,提出进一步扩展民生银行小微企业信贷业务的策略。学者们探讨了经济新常态下小微企业信贷风险成因分析和防控策略。指出小微企业不良贷款率居高不下,使商业银行对小微企业的风险防控面临着较大的压力,如何在经济新常态下对小微企业的信贷风险进行分析和识别并加强防控,是商业银行稳步推进普惠金融战略实施的关键环节。部分学者等人研究了信贷业务初期小微企业信用评估指标确权策略与方法。首先指出快速构建各种与异质小微企业群体金融需求相适应的信用评估模型,是当前信贷机构亟需解决的关键问题,其中评估指标的确权比较棘手。然后基于三标度、多专家、独立判断、多数为主兼顾少数等策略思想的3-SEIJ的确权方法,采用标度映射,判断矩阵一致性调整,以及融合计算三个关键技术,以解决实践中专家判断意见难以清晰表达、需要反复判断、以及意见分歧难以综合的问题。结果表明:在没有牺牲评估准确性能的前提下,所提出方法简化了确权操作而提升了效率,适合如信贷业务初期等数据欠缺情境下的信用评估模型的开发。其他学者对商业银行小微企业信贷经营策略进行了研究,小微企业是我国实体经济的主体,其融资需求非常旺盛。结合国内外实践,分析当前商业银行加快经营转型过程中,大力发展小微企业信贷业务的必要性,并从市场定位,市场营销,体制创新,模式创新,产品设计等方面,提出了有针对性的经营策略。部分学者以现阶段银行工作情况为基础,结合近年来小微企业发展需求,深层探索银行小微企业信贷业务发展方向,了解其中存在的问题,并提出了小微企业信贷发展策略。也有多位学者研究了中小微企业风险评估后的信贷策略问题,利用在年度信贷总额固定的前提下,作了信贷市场发展前景,采用层次分析法,Logistic回归模型,借助Excel,RStudio,Matlab数值分析软件,结合客户画像体系评估中小微企业的风险等。首先针对不同信誉评级下的客户流失度和贷款年利率,构建客户流失预警模型。其次结合函数关系图像得出不同信誉评级,不同客户流失度下的信贷额度区间和贷款年利率区间,针对一些突发因素,构建负激励的防止道德风险模型,从而对信贷风险管理中贷款人违约的道德风险进行控制,降低信贷风险产生的可能性,使得贷款双方利益最大化。最后结合现实因素,增加相关约束条件,在银行年度信贷总额固定以及信贷风险较低时,为使得银行信贷获利最大化,通过建立线性规划模型,从而得出信贷额度和信贷利率的数量关系,给出银行在年度信贷总额固定时对这些企业的信贷策略。
但是如何实现充分量化企业交易票据信息,建立综合的信贷风险评判体系,进而对中小微企业进行客观、综合的信贷决策仍一个有待解决的技术问题。
发明内容
针对背景技术中提到的问题,本发明的目的是提供一种基于主成分分析和神经网络的中小信贷策略模型,充分量化企业交易票据信息,建立了综合的信贷风险评判体系,运用主成分分析、粒子群算法、BP神经网络、模糊综合评判法对中小微企业进行了客观、综合的信贷决策;同时对有信贷记录的企业的数据,使用支持向量机、随机森林、BP神经网络进行信贷等级评判的对比,确定了中小微企业信贷策略模型使用的鲁棒性和有效性。
本发明的上述技术目的是通过以下技术方案得以实现的:一种基于主成分分析和神经网络的中小信贷策略模型,包括如下步骤:
步骤1:建模基本假设及模型符号说明;
步骤1.1模型假设建立;
步骤1.2建模符号说明:i、评价对象个数;j、评价指标;R、相关系数矩阵;Zi、企业的综合得分;W、各企业主成分贷款额度;Q、年度贷款总额;loss、损失金额;risk、贷款损失率即顾客流失率;rate、年利率;V、评语集;w、权重;x、各项指标;invoicetotal、总发票数;G、贷款总额;
步骤2:建立了基于主成分分析的贷款额度分析模型;
步骤2.1重要指标的确定原则;
信贷策略受到很多复杂的指标影响,选取不同的影响指标,最终的预测结果也不同;为了能更好的进行信贷策略的决定,重要指标的确定应按照以下规则确立:
1)探究评判企业
给出信贷策略是一个综合性问题,一方面考虑到各个企业的经济实力差距所给贷款会有所不同,另一方面也考虑到各个企业的信誉有高有低所确定的年利率也会有所不同,因此本文将进行综合分析与评价;
2)确定复合量纲因素
信贷策略受到多种因素的影响,很多指标通常无法进行对比;为了消除多种规模化因素影响,确定的重要指标要更加综合化;
3)稳定与可靠性
影响银行信贷策略的各个指标都来自于调查与统计,在处理各项指标的过程中,所用到的数据必须达到稳定性与可靠性高的标准;
步骤2.2重要指标的确立
确立重要指标体系主要用于给出信贷策略,在重要指标确定规则基础上,结合销项发票和进项发票信息数据,得到的三级评价指标;
步骤2.3主成分分析模型的确定
选取较少变量,来解释大部分数据中的变异的几个新变量,即所谓主成分,并来解释数据的综合性指标;是一种降维方法;
步骤2.4数据预处理
利用互联网并结合各个中小微企业的经济实力不同,获取有信贷记录企业的交易票据信息数据,在此基础上,对建立的银行信贷决策指标体系的指标层数据进行预处理;
对于指标:购方单位数x1、销方单位数x2,以附件中的一家企业涉及购方单位代号、销方单位代号的种类来计数;
对于指标:平均发票数,取附件中的一家企业所涉及的总发票数invoicetotal与购方单位数x1、销方单位数x2单位数总和的商,即
Figure BDA0003702649000000061
对于指标:购方税额x4、销方税额x5,取附件中一家企业购方税额与销方税额的均值来处理;
对于指标:销项加税合计x6、进项价税合计x7,取附件中一家企业的销项加税合计与进项价税合计的最大值;
对于指标:有效发票占比x8,取附件中一家企业的有效发票数与总发票数的商;
对于指标:负数发票数x9、作废发票数x10,以一家企业的负数发票数量和作废发票数量来计数;
步骤2.5指标层矩阵的建立
根据银行信贷决策指标体系及数据预处理后可以得到一个123×10的指标层矩阵R,矩阵部分如式(1)所示:
Figure BDA0003702649000000071
步骤2.6主成分分析模型求解贷款额度
1)原始数据标准化
主成分分析模型的主成分分析指标变量有10个,分别为x1,x2,…,x10,共有123个评价对象,第i个评价对象的第j个指标的取值为aij;将各指标值aij转换成标准化指标值
Figure BDA0003702649000000072
即式(2)所示
Figure BDA0003702649000000073
式(3)中:
Figure BDA0003702649000000074
即μj,sj为第j个指标的样本均值和样本标准差;
对应地,定义
Figure BDA0003702649000000081
为标准化指标变量;
2)计算相关系数矩阵
相关系数矩阵R=(rij)10×10,有
Figure BDA0003702649000000082
式(4)中:rii=1,rij=rij,rij为第i个指标与第j个指标的相关系数;
3)计算特征值和特征向量
相关系数矩阵的特征值依次是2.9927、2.2005、1.3180、0.9125、0.8656、0.7041、0.4373、0.3021、0.1388、0.1283;对应的标准化后的特征向量为:
Figure BDA0003702649000000083
其中uj=[u1j,u2j,…,u10j]T,由特征向量组成10个新的指标变量
Figure BDA0003702649000000084
4)构建主成分综合评价模型
构建主成分综合评价模型
Z=29.9274y1+22.0046y2+…+1.3884y9+1.2835y10(6)
把所有主成分代入式(6),得到123家有信贷记录企业的综合得分及排名;
步骤2.7贷款额度模型确立
基于主成分分析方法得到了主成分综合评价模型和123家有信贷记录企业的综合得分Z,由于某银行的贷款额度为10~100万元,所以建立如式(7)所示的各企业主成分贷款额度模型:
Figure BDA0003702649000000091
其中Zj是第j个企业的综合得分,Zmin是所有企业的综合得分的最小值,Zmax是所有企业的综合得分的最大值,Wj是各企业主成分贷款额度模型;
通过有信贷记录企业的信誉评级,分类汇总可以得到不同信誉评级企业的贷款总额WA、WB、WC
由此构建出不同信誉的总贷款额度如式(8)所示:
Figure BDA0003702649000000092
其中Wi,i=A,B,C是(5)式中不同信誉等级企业的贷款总额,G是银行在该年度提供的贷款总额,Qi,i=A,B,C是不同信誉等级企业的年度贷款总额;
所以各企业的年度贷款额度模型如式(9)所示:
Figure BDA0003702649000000093
将(7)式简化得到年度贷款精确模型如式(10)所示:
Figure BDA0003702649000000094
Qij为各个企业的所获贷款额度,由式(10)可以在实际房贷过程中计算得到各企业的贷款额度;
步骤2.8粒子群算法求解贷款最优年利率模型
1)最优年利率模型确立
贷款年利率、顾客流失率与企业信誉等级有关;假设顾客流失率为贷款损失率risk,当顾客流失时,所有贷款归还而未来利润丢失,则所有损失金额应为式(11)所示:
loss=∑risk×Qij×rate (11)
其中loss为损失金额,risk为贷款损失率即顾客流失率,Qij为各类企业的所获贷款额度,rate为年利率;
银行贷款后所得的利润应为贷款额度与年利率的乘积如式(12)所示:
earn=∑Qij×rate (12)
其中earn为贷款利润金额,Qij为各个企业的所获贷款额度,rate为年利率;
由此构建贷款最优年利率模型如式(13):
Figure BDA0003702649000000101
其中lossi为各信誉等级企业损失金额,ratei为各信誉等级企业的年利率,Qij为各个企业所获贷款额度;
2)粒子群算法
PSO初始化为一群随机粒子,然后通过迭代找到最优解;在每一次迭代中,粒子通过跟踪两个极值来更新自己;第一个就是粒子本身所找到的最优解,这个解称为个体极值;另一个极值是整个种群目前找到的最优解,这个极值是全局极值;另外也可以不用整个种群而只是用其中一部分作为粒子的邻居,那么在所有邻居中的极值就是局部极值;粒子群算法流程:
[7]初始化粒子群,包括确定群体规模N,每个粒子的位置xi和速度vi
[8]计算每个粒子的适应度值Fa[i];
[9]对每个粒子,用它的适应度值Fa[i]和个体极值pbest(i)比较,如果Fa[i]>pbest(i),则用Fa[i]替换掉pbest(i);
[10]对每个粒子,用它的适应度值Fa[i]和全局极值gbest比较,如果Fa[i]>pbest(i)则用Fa[i]替换掉gbest
[11]根据公式vid=wvid+c1r1(pid-xid)+c2r2(pgd-xid),xid=xid+vid更新粒子的位置xi和速度vi
[12]如果满足误差足够好或到达最大循环次数退出,否则返回[2]。
作为优选,所述步骤1.1模型假设建立中
假设有利于模型准确有效的制定中小微企业信贷策略;
1)假设所收集的123家有信贷记录企业的相关数据均真实有效;
2)假设所收集的302家无信贷记录企业的相关数据均真实有效;
3)假设银行贷款年利率与客户流失率关系的统计数据均真实有效;
4)假设缺失数据的拟合值均真实有效;
5)假设处理的数据能较全面地反应突发因素,例如新冠疫情对各企业的影响程度;
6)假设使用的数据合理有效,没有其他影响因素的干扰;
作为改进,还包括步骤2.9有信贷记录企业信贷策略模型优化解,通过式(10)、式(13)利用粒子群算法得到有信贷记录企业信贷策略模型优化解。
综上所述,本发明具有以下有益效果:
1.利用不同种类的数据得到数据间的相关矩阵,并基于相关矩阵特征值得到贷款额度分配模型的指标贡献加权系数,即评价指标加权系数来源于数据本身而不依赖于人工经验,是科学和准确并有效的。
2.充分量化了企业交易票据信息,建立了综合的信贷风险评判体系,运用主成分分析、粒子群算法、BP神经网络、模糊综合评判法对中小微企业进行了客观、综合的信贷决策。为银行信贷管理者提升银行信贷管理水平、规避信贷风险、增强银行信贷盈利能力指明了改进的方向和途径。
附图说明
图1为相关系数矩阵图;
图2为粒子群算法流程图;
图3为BP神经网络运行流程图;
图4为BP神经网络分级示意图;
图5为突发因素下的信贷决策体系;
图6为模糊综合评价模型示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
步骤1:建模基本假设及模型符号说明
步骤1.1模型假设建立
适当的假设有利于模型准确有效的制定中小微企业信贷策略。
1)假设所收集的123家有信贷记录企业的相关数据均真实有效;
2)假设所收集的302家无信贷记录企业的相关数据均真实有效;
3)假设银行贷款年利率与客户流失率关系的统计数据均真实有效;
4)假设缺失数据的拟合值均真实有效;
5)假设处理的数据能较全面地反应突发因素,例如新冠疫情对各企业的影响程度;
6)假设使用的数据合理有效,没有其他影响因素的干扰。
步骤1.2建模符号说明
为了建模的需要,对相关符号进行说明,i、评价对象个数;j、评价指标;R、相关系数矩阵;Zi、企业的综合得分;W、各企业主成分贷款额度;Q、年度贷款总额;loss、损失金额;risk、贷款损失率即顾客流失率;rate、年利率;V、评语集;w、权重;x、各项指标;invoicetotal、总发票数;G、贷款总额;
步骤2:建立了基于主成分分析的贷款额度分析模型
步骤2.1重要指标的确定原则
信贷策略受到很多复杂的指标影响,选取不同的影响指标,最终的预测结果也不同。为了能更好的进行信贷策略的决定,重要指标的确定应按照以下规则确立:
1)探究评判企业
给出信贷策略是一个综合性问题,一方面考虑到各个企业的经济实力差距所给贷款会有所不同,另一方面也考虑到各个企业的信誉有高有低所确定的年利率也会有所不同,因此本文将进行综合分析与评价。
2)确定复合量纲因素
信贷策略受到多种因素的影响,很多指标通常无法进行对比。为了消除多种规模化因素影响,确定的重要指标要更加综合化。
3)稳定与可靠性
影响银行信贷策略的各个指标都来自于调查与统计,在处理各项指标的过程中,所用到的数据必须达到稳定性与可靠性高的标准
步骤2.2重要指标的确立
确立重要指标体系主要用于给出信贷策略。在重要指标确定规则基础上,结合销项发票和进项发票信息数据,得到的三级评价指标如表1所示:
表1银行信贷决策指标体系
Figure BDA0003702649000000141
步骤2.3主成分分析模型的确定
主成分分析主要目的是希望用较少的变量去解释原来数据中的大部分变异,将手中许多相关性很高的变量转化为彼此相互独立或不相关的变量。通常是选取较少变量,来解释大部分数据中的变异的几个新变量,即所谓主成分,并来解释数据的综合性指标。实际上,主成分分析是一种降维方法。
步骤2.4数据预处理
利用互联网并结合各个中小微企业的经济实力不同,获取123家有信贷记录企业的交易票据信息等数据,在此基础上,对建立的银行信贷决策指标体系的指标层数据进行预处理。
对于指标:购方单位数x1、销方单位数x2,以附件中的一家企业涉及购方单位代号、销方单位代号的种类来计数。
对于指标:平均发票数,取附件中的一家企业所涉及的总发票数invoicetotal与购方单位数x1、销方单位数x2单位数总和的商。即
Figure BDA0003702649000000151
对于指标:购方税额x4、销方税额x5,取附件中一家企业购方税额与销方税额的均值来处理。
对于指标:销项加税合计x6、进项价税合计x7,取附件中一家企业的销项加税合计与进项价税合计的最大值。
对于指标:有效发票占比x8,取附件中一家企业的有效发票数与总发票数的商。
对于指标:负数发票数x9、作废发票数x10,以一家企业的负数发票数量和作废发票数量来计数。
步骤2.5指标层矩阵的建立
根据表1银行信贷决策指标体系及数据预处理后可以得到一个123×10的指标层矩阵R,矩阵部分如式(1)所示:
Figure BDA0003702649000000152
步骤2.6主成分分析模型求解贷款额度
1)原始数据标准化
主成分分析模型的主成分分析指标变量有10个,分别为x1,x2,…,x10,共有123个评价对象,第i个评价对象的第j个指标的取值为aij。将各指标值aij转换成标准化指标值
Figure BDA0003702649000000153
即式(2)所示
Figure BDA0003702649000000161
式(3)中:
Figure BDA0003702649000000162
即μj,sj为第j个指标的样本均值和样本标准差。
对应地,定义
Figure BDA0003702649000000163
为标准化指标变量。
2)计算相关系数矩阵
相关系数矩阵R=(rij)10×10,有
Figure BDA0003702649000000164
式(4)中:rii=1,rij=rji,rij为第i个指标与第j个指标的相关系数。
3)计算特征值和特征向量
相关系数矩阵的特征值依次是2.9927、2.2005、1.3180、0.9125、0.8656、0.7041、0.4373、0.3021、0.1388、0.1283。对应的标准化后的特征向量为:
Figure BDA0003702649000000165
其中uj=[u1j,u2j,…,u10j]T,由特征向量组成10个新的指标变量
Figure BDA0003702649000000171
4)构建主成分综合评价模型
构建主成分综合评价模型
Z=29.9274y1+22.0046y2+…+1.3884y9+1.2835y10 (6)
把所有主成分代入式(6),得到123家有信贷记录企业的综合得分及排名。
步骤2.7贷款额度模型确立
基于主成分分析方法得到了主成分综合评价模型和123家有信贷记录企业的综合得分Z,由于某银行的贷款额度为10~100万元,所以建立如式(7)所示的各企业主成分贷款额度模型:
Figure BDA0003702649000000172
其中Zj是第j个企业的综合得分,Zmin是所有企业的综合得分的最小值,Zmax是所有企业的综合得分的最大值,Wj是各企业主成分贷款额度模型。
通过123家有信贷记录企业的信誉评级,分类汇总可以得到不同信誉评级企业的贷款总额WA、WB、WC
由此构建出不同信誉的总贷款额度如式(8)所示:
Figure BDA0003702649000000173
其中Wi,i=A,B,C是(5)式中不同信誉等级企业的贷款总额,G是银行在该年度提供的贷款总额,Qi,i=A,B,C是不同信誉等级企业的年度贷款总额。
所以各企业的年度贷款额度模型如式(9)所示:
Figure BDA0003702649000000181
将(7)式简化得到年度贷款精确模型如式(10)所示:
Figure BDA0003702649000000182
Qij为各个企业的所获贷款额度,由式(10)可以在实际房贷过程中计算得到各企业的贷款额度。
步骤2.8粒子群算法求解贷款最优年利率模型
1)最优年利率模型确立
贷款年利率、顾客流失率与企业信誉等级有关。假设顾客流失率为贷款损失率risk,当顾客流失时,所有贷款归还而未来利润丢失,则所有损失金额应为式(11)所示:
loss=∑risk×Qij×rate (11)
其中loss为损失金额,risk为贷款损失率即顾客流失率,Qij为各类企业的所获贷款额度,rate为年利率。
银行贷款后所得的利润应为贷款额度与年利率的乘积如式(12)所示:
earn=∑Qij×rate (12)
其中earn为贷款利润金额,Qij为各个企业的所获贷款额度,rate为年利率。
由此构建贷款最优年利率模型如式(13):
Figure BDA0003702649000000183
其中lossi为各信誉等级企业损失金额,ratei为各信誉等级企业的年利率,Qij为各个企业所获贷款额度。
2)粒子群算法
PSO初始化为一群随机粒子,然后通过迭代找到最优解。在每一次迭代中,粒子通过跟踪两个极值来更新自己;第一个就是粒子本身所找到的最优解,这个解称为个体极值;另一个极值是整个种群目前找到的最优解,这个极值是全局极值。另外也可以不用整个种群而只是用其中一部分作为粒子的邻居,那么在所有邻居中的极值就是局部极值。粒子群算法流程:
[13]初始化粒子群,包括确定群体规模N,每个粒子的位置xi和速度vi
[14]计算每个粒子的适应度值Fa[i];
[15]对每个粒子,用它的适应度值Fa[i]和个体极值pbest(i)比较,如果Fa[i]>pbest(i),则用Fa[i]替换掉pbest(i);
[16]对每个粒子,用它的适应度值Fa[i]和全局极值gbest比较,如果Fa[i]>pbest(i)则用Fa[i]替换掉gbest
[17]根据公式vid=wvid+c1r1(pid-xid)+c2r2(pgd-xid),xid=xid+vid更新粒子的位置xi和速度vi
[18]如果满足误差足够好或到达最大循环次数退出,否则返回[2]。
步骤2.9有信贷记录企业信贷策略模型优化解
通过式(10)、式(13)利用粒子群算法得到有信贷记录企业信贷策略模型优化解如表2所示:
表2有信贷记录企业信贷策略模型优化解
Figure BDA0003702649000000191
其中G是银行年度信贷总额。如果最小贷款额度小于10万元,取银行最小贷款额度10万元,如果最大贷款额度大于100万元,取银行最大贷款额度100万元。
步骤3:建立基于BP神经网络的企业信誉等级评估模型
步骤3.1BP神经网络简介
由于曲面拟合和多面拟合只适合点个数有一定限制,料场的大小不一。如果目标要在变化平坦的地区进行拟合,并不需要人工干预,采用曲面拟合和多面拟合的方法拟合过程就会较为繁琐,故此处选择BP神经网络拟合法进行模型建立。
算法步骤:
[1]网络初始化。将区间(-1,1)内的随机数分别给各连接权值,并设定误差函数e,给定计算精度值ε和最大学习次数M。
[2]随机选取第k个输入样本x(k=(x1(k),x2(k),…,xn(k))及对应期望输出
d0(k)=(d1(k),d2(k),…,dq(k))
[3]计算隐含层各神经元的输入
Figure BDA0003702649000000201
和输出hoh(k)=f(hih(k))及输出层各神经元的输入
Figure BDA0003702649000000202
和输出yoo(k)=f(yio(k))(o=1,2,…,p)
[4]利用网络期望输出和实际输出,计算误差函数对输出层的各神经元的偏导数δo(k)。
Figure BDA0003702649000000203
Figure BDA0003702649000000204
Figure BDA0003702649000000211
[5]利用隐含层到输出层的连接权值、输出层的δo(k)和隐含层的输出计算误差函数对
隐含层各神经元的偏导数δo(k)。
Figure BDA0003702649000000212
Figure BDA0003702649000000213
Figure BDA0003702649000000214
[6]利用输出层各神经元的δo(k)和隐含层各神经元的输出来修正连接权值who(k)。
Figure BDA0003702649000000215
Figure BDA0003702649000000216
[7]利用隐含层各神经元的δo(k)和输入层各神经元的输入修正连接权who(k)。
Figure BDA0003702649000000217
Figure BDA0003702649000000218
[8]计算全局误差。
Figure BDA0003702649000000219
[9]判断网络误差是否满足要求。当误差达到预设精度或学习次数大于设定的最大次数,则结束算法。否则,选取下一个学习样本及对应的期望输出,返回到第三步,进入下一轮学习。
步骤3.2基于BP神经网络进行贷款信誉等级评级
以构建的贷款信誉评价体系指标为BP神经网络的训练指标,以123家有信贷记录企业的贷款信誉评价体系的各项指标数据作为BP神经网络的学习训练指标数据,以302家无信贷记录企业的贷款信誉评价体系的各项指标数据作为BP神经网络学校的测试集。
通过BP神经网络多次计算,最终得到如表3及图4所示的分级结果。
表3 BP神经网络分级结果
Figure BDA0003702649000000221
步骤3.3无信贷记录企业信贷策略模型优化解
通过式(10)、式(13)运用主成分分析及粒子群算法最后得到信贷策略模型优化解如表4所示:
表4无信贷记录企业信贷策略模型优化解
Figure BDA0003702649000000222
步骤4:建立基于模糊综合评判法的突发因素影响下贷款风险评估模型
步骤4.1突发因素下的信贷体系建立
为了研究突发因素对信贷策略的影响,以新冠疫情病毒为例,考虑突发因素会对不同行业、不同类别的企业会有不同的影响,利用已构建的贷款信誉评价体系指标建立标准,构建突发情况下的银行贷款评价体系,如图5所示。
步骤4.2模糊综合评价模型
因为BP神经网络是以正常情况下的企业信贷数据进行学习训练,而突发因素的训练数据样本缺少,所以此处引用模糊综合评判方法,通过众人评价法确定银行贷款评价体系指标各指标的权重,构建模糊综合评判矩阵进行评判。
模糊综合评价法是以模糊数学为基础,将不易量化的指标定量化,从而解决实际的综合评价问题。运用一级模糊综合评判进行企业在突发情况下的企业信贷的综合测评工作建立只由等级A,B,C构成的指标等级评价评语集V,如图6所示。
对于突发因素下的企业信贷问题:建立企业信贷综合评价模型所需的因素集U由测评指标体系中5个指标U1-U5组成,各指标权重w向量U由众人评价法得出。其中,w=[0.6,0.1,0.1,0.1,0.1]。
指标模糊关系矩阵中P的各项pmn,m=1,2,…,5,n=1,2,3是依据各类企业中指标排名得到的。
具体计算公式如式(14)所示:
Figure BDA0003702649000000231
其中,0≤pij≤1,w=[0.6,0.1,0.1,0.1,0.1]。某行业的评价等级以on,n=1,2,3的最大值位置确定。
步骤4.3行业分类
对各种企业进行行业分类,分类标准如表5所示:
表5行业分类
Figure BDA0003702649000000241
步骤4.4在突发因素下行业经济活力等级评级
在突发因素下的信贷体系建立的基础上,通过模糊综合评价模型计算可以得到得分矩阵O。
Figure BDA0003702649000000242
在突发因素下行业经济活力评价等级如表6所示。由表6可以总结在突发因素下,个体经商户的经济活力低,银行应谨慎给其贷款,而餐饮、日用品制造业、商业和服务业的经济活力强,银行可以加大对其贷款力度。
表6在突发因素下行业经济活力评价等级
Figure BDA0003702649000000251
步骤4.5突发情况下顾客流失率的确定
因为在突发因素下,顾客流失情况会相应改变,此处选用年利率对应顾客流失率最大值作为评价等级C的顾客流失率,顾客流失率的最小值评价等级A的顾客流失率,顾客流失率的中值作为评价等级B的顾客流失率,部分数据如表7。
表7突发情况下的顾客流失率(部分数据)
Figure BDA0003702649000000252
步骤4.6突发情况下信贷策略模型优化解
通过式(10)、式(13),运用主成分分析及粒子群算法得到的信贷策略模型优化解如表8所示。
表8突发情况下信贷策略模型优化解
Figure BDA0003702649000000261
步骤4.7正常与突发情况下的结果对比
此处列出正常情况与突发因素下的贷款额度(如表9所示)进行对比,验证模型的可信性。
表9正常与突发情况下的结果比对
Figure BDA0003702649000000262
续前表
Figure BDA0003702649000000263
Figure BDA0003702649000000271
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (3)

1.一种基于主成分分析和神经网络的中小信贷策略模型,其特征在于,包括如下步骤:
步骤1:建模基本假设及模型符号说明;
步骤1.1模型假设建立;
步骤1.2建模符号说明:i、评价对象个数;j、评价指标;R、相关系数矩阵;Zi、企业的综合得分;W、各企业主成分贷款额度;Q、年度贷款总额;loss、损失金额;risk、贷款损失率即顾客流失率;rate、年利率;V、评语集;w、权重;x、各项指标;invoicetotal、总发票数;G、贷款总额;
步骤2:建立了基于主成分分析的贷款额度分析模型;
步骤2.1重要指标的确定原则;
信贷策略受到很多复杂的指标影响,选取不同的影响指标,最终的预测结果也不同;为了能更好的进行信贷策略的决定,重要指标的确定应按照以下规则确立:
1)探究评判企业
给出信贷策略是一个综合性问题,一方面考虑到各个企业的经济实力差距所给贷款会有所不同,另一方面也考虑到各个企业的信誉有高有低所确定的年利率也会有所不同,因此本文将进行综合分析与评价;
2)确定复合量纲因素
信贷策略受到多种因素的影响,很多指标通常无法进行对比;为了消除多种规模化因素影响,确定的重要指标要更加综合化;
3)稳定与可靠性
影响银行信贷策略的各个指标都来自于调查与统计,在处理各项指标的过程中,所用到的数据必须达到稳定性与可靠性高的标准;
步骤2.2重要指标的确立
确立重要指标体系主要用于给出信贷策略,在重要指标确定规则基础上,结合销项发票和进项发票信息数据,得到的三级评价指标;
步骤2.3主成分分析模型的确定
选取较少变量,来解释大部分数据中的变异的几个新变量,即所谓主成分,并来解释数据的综合性指标;是一种降维方法;
步骤2.4数据预处理
利用互联网并结合各个中小微企业的经济实力不同,获取有信贷记录企业的交易票据信息数据,在此基础上,对建立的银行信贷决策指标体系的指标层数据进行预处理;
对于指标:购方单位数x1、销方单位数x2,以附件中的一家企业涉及购方单位代号、销方单位代号的种类来计数;
对于指标:平均发票数,取附件中的一家企业所涉及的总发票数invoicetotal与购方单位数x1、销方单位数x2单位数总和的商,即
Figure FDA0003702648990000021
对于指标:购方税额x4、销方税额x5,取附件中一家企业购方税额与销方税额的均值来处理;
对于指标:销项加税合计x6、进项价税合计x7,取附件中一家企业的销项加税合计与进项价税合计的最大值;
对于指标:有效发票占比x8,取附件中一家企业的有效发票数与总发票数的商;
对于指标:负数发票数x9、作废发票数x10,以一家企业的负数发票数量和作废发票数量来计数;
步骤2.5指标层矩阵的建立
根据银行信贷决策指标体系及数据预处理后可以得到一个123×10的指标层矩阵R,矩阵部分如式(1)所示:
Figure FDA0003702648990000031
步骤2.6主成分分析模型求解贷款额度
1)原始数据标准化
主成分分析模型的主成分分析指标变量有10个,分别为x1,x2,…,x10,共有123个评价对象,第i个评价对象的第j个指标的取值为aij;将各指标值aij转换成标准化指标值
Figure FDA0003702648990000032
即式(2)所示
Figure FDA0003702648990000033
式(3)中:
Figure FDA0003702648990000034
即μj,sj为第j个指标的样本均值和样本标准差;
对应地,定义
Figure FDA0003702648990000035
为标准化指标变量;
2)计算相关系数矩阵
相关系数矩阵R=(rij)10×10,有
Figure FDA0003702648990000041
式(4)中:rii=1,rij=rji,rij为第i个指标与第j个指标的相关系数;
3)计算特征值和特征向量
相关系数矩阵的特征值依次是2.9927、2.2005、1.3180、0.9125、0.8656、0.7041、0.4373、0.3021、0.1388、0.1283;对应的标准化后的特征向量为:
Figure FDA0003702648990000042
其中uj=[u1j,u2j,…,u10j]T,由特征向量组成10个新的指标变量
Figure FDA0003702648990000043
4)构建主成分综合评价模型
构建主成分综合评价模型
Z=29.9274y1+22.0046y2+…+1.3884y9+1.2835y10 (6)
把所有主成分代入式(6),得到123家有信贷记录企业的综合得分及排名;
步骤2.7贷款额度模型确立
基于主成分分析方法得到了主成分综合评价模型和123家有信贷记录企业的综合得分Z,由于某银行的贷款额度为10~100万元,所以建立如式(7)所示的各企业主成分贷款额度模型:
Figure FDA0003702648990000051
其中Zj是第j个企业的综合得分,Zmin是所有企业的综合得分的最小值,Zmax是所有企业的综合得分的最大值,Wj是各企业主成分贷款额度模型;
通过有信贷记录企业的信誉评级,分类汇总可以得到不同信誉评级企业的贷款总额WA、WB、WC
由此构建出不同信誉的总贷款额度如式(8)所示:
Figure FDA0003702648990000052
其中Wi,i=A,B,C是(5)式中不同信誉等级企业的贷款总额,G是银行在该年度提供的贷款总额,Qi,i=A,B,C是不同信誉等级企业的年度贷款总额;
所以各企业的年度贷款额度模型如式(9)所示:
Figure FDA0003702648990000053
将(7)式简化得到年度贷款精确模型如式(10)所示:
Figure FDA0003702648990000054
Qij为各个企业的所获贷款额度,由式(10)可以在实际房贷过程中计算得到各企业的贷款额度;
步骤2.8粒子群算法求解贷款最优年利率模型
1)最优年利率模型确立
贷款年利率、顾客流失率与企业信誉等级有关;假设顾客流失率为贷款损失率risk,当顾客流失时,所有贷款归还而未来利润丢失,则所有损失金额应为式(11)所示:
loss=2risk×Qij×rate (11)
其中loss为损失金额,risk为贷款损失率即顾客流失率,Qij为各类企业的所获贷款额度,rate为年利率;
银行贷款后所得的利润应为贷款额度与年利率的乘积如式(12)所示:
earn=∑Qij×rate (12)
其中earn为贷款利润金额,Qij为各个企业的所获贷款额度,rate为年利率;
由此构建贷款最优年利率模型如式(13):
Figure FDA0003702648990000061
其中lossi为各信誉等级企业损失金额,ratei为各信誉等级企业的年利率,Qij为各个企业所获贷款额度;
2)粒子群算法
PSO初始化为一群随机粒子,然后通过迭代找到最优解;在每一次迭代中,粒子通过跟踪两个极值来更新自己;第一个就是粒子本身所找到的最优解,这个解称为个体极值;另一个极值是整个种群目前找到的最优解,这个极值是全局极值;另外也可以不用整个种群而只是用其中一部分作为粒子的邻居,那么在所有邻居中的极值就是局部极值;粒子群算法流程:
[1]初始化粒子群,包括确定群体规模N,每个粒子的位置xi和速度vi
[2]计算每个粒子的适应度值Fa[i];
[3]对每个粒子,用它的适应度值Fa[i]和个体极值pbest(i)比较,如果Fa[i]>pbest(i),则用Fa[i]替换掉pbest(i);
[4]对每个粒子,用它的适应度值Fa[i]和全局极值gbest比较,如果Fa[i]>pbest(i)则用Fa[i]替换掉gbest
[5]根据公式vid=wvid+c1r1(pid-xid)+c2r2(pgd-xid),xid=xid+vid更新粒子的位置xi和速度vi
[6]如果满足误差足够好或到达最大循环次数退出,否则返回[2]。
2.根据权利要求1所述的基于主成分分析和神经网络的中小信贷策略模型,其特征在于,所述步骤1.1模型假设建立中
假设有利于模型准确有效的制定中小微企业信贷策略;
1)假设所收集的123家有信贷记录企业的相关数据均真实有效;
2)假设所收集的302家无信贷记录企业的相关数据均真实有效;
3)假设银行贷款年利率与客户流失率关系的统计数据均真实有效;
4)假设缺失数据的拟合值均真实有效;
5)假设处理的数据能较全面地反应突发因素,例如新冠疫情对各企业的影响程度;
6)假设使用的数据合理有效,没有其他影响因素的干扰。
3.根据权利要求1所述的基于主成分分析和神经网络的中小信贷策略模型,其特征在于,还包括步骤2.9有信贷记录企业信贷策略模型优化解,通过式(10)、式(13)利用粒子群算法得到有信贷记录企业信贷策略模型优化解。
CN202210696231.5A 2022-06-20 2022-06-20 基于主成分分析和神经网络的中小信贷策略模型 Withdrawn CN114862563A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210696231.5A CN114862563A (zh) 2022-06-20 2022-06-20 基于主成分分析和神经网络的中小信贷策略模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210696231.5A CN114862563A (zh) 2022-06-20 2022-06-20 基于主成分分析和神经网络的中小信贷策略模型

Publications (1)

Publication Number Publication Date
CN114862563A true CN114862563A (zh) 2022-08-05

Family

ID=82625722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210696231.5A Withdrawn CN114862563A (zh) 2022-06-20 2022-06-20 基于主成分分析和神经网络的中小信贷策略模型

Country Status (1)

Country Link
CN (1) CN114862563A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117114858A (zh) * 2023-10-19 2023-11-24 湖南三湘银行股份有限公司 基于aviator表达式的计算检查公式的配置化实现方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117114858A (zh) * 2023-10-19 2023-11-24 湖南三湘银行股份有限公司 基于aviator表达式的计算检查公式的配置化实现方法
CN117114858B (zh) * 2023-10-19 2024-03-19 湖南三湘银行股份有限公司 基于aviator表达式的计算检查公式的配置化实现方法

Similar Documents

Publication Publication Date Title
Huang et al. Enterprise credit risk evaluation based on neural network algorithm
CN109977151B (zh) 一种数据分析方法及系统
Fakhri et al. Comparison of Islamic and conventional banking financial performance during the covid-19 period
US7165043B2 (en) Valuation prediction models in situations with missing inputs
MXPA01008619A (es) Metodos y sistemas para optimizar el valor de devolucion y el presente.
MXPA01008622A (es) Evaluacion rapida de portafolios de activos tales como instrumentos financieros.
JP2004500646A (ja) 競争入札の収益のシミュレーション方法とシステム
JP2004500641A (ja) 自動的にクレジットスコアの評価値を推定する方法とシステム
JP2003529139A (ja) 最適なアンダーライトを行うためのポートフォリオの効率的サンプリング方法とシステム
CN111401600A (zh) 基于关联关系的企业信用风险评价方法和系统
JP2004500642A (ja) キャッシュフローのリカバリとリスクを評価する方法とシステム
Boguslauskas et al. The selection of financial ratios as independent variables for credit risk assessment
CN112613972A (zh) 基于信贷风险的中小微企业信贷决策方法
CN114862563A (zh) 基于主成分分析和神经网络的中小信贷策略模型
Zhou et al. A two-stage credit scoring model based on random forest: Evidence from Chinese small firms
CN116703563A (zh) 一种基于量化分析模型的信贷策略
Latinovic et al. A fuzzy inference system for credit scoring using Boolean consistent fuzzy logic
Wu et al. Customer churn prediction for commercial banks using customer-value-weighted machine learning models
CN115204457A (zh) 一种基于图注意力网络贷款违约风险预测方法
CN113743817A (zh) 一种基于云平台的企业信用等级评估方法
Anglekar et al. Machine learning based risk assessment analysis for smes loan grant
Liu et al. Research on the identification and prediction of default risk of online lending platform customers
Wang Data-driven Investment Decisions in P2P Lending: Strategies of Integrating Credit Scoring and Profit Scoring
Xu et al. Engineering Financial Performance Evaluation of Wireless Network Based on Intelligent Neural Network Model
Tajik et al. Presenting the smart pattern of credit risk of the real banks’ customers using machine learning algorithm.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20220805