CN112053234B - 基于宏观区域经济指数与微观因素的企业信用评级方法 - Google Patents

基于宏观区域经济指数与微观因素的企业信用评级方法 Download PDF

Info

Publication number
CN112053234B
CN112053234B CN202010920433.4A CN202010920433A CN112053234B CN 112053234 B CN112053234 B CN 112053234B CN 202010920433 A CN202010920433 A CN 202010920433A CN 112053234 B CN112053234 B CN 112053234B
Authority
CN
China
Prior art keywords
enterprise
indexes
credit
index
economic index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010920433.4A
Other languages
English (en)
Other versions
CN112053234A (zh
Inventor
尹盼盼
边松华
崔乐乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyuan Big Data Credit Management Co Ltd
Original Assignee
Tianyuan Big Data Credit Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyuan Big Data Credit Management Co Ltd filed Critical Tianyuan Big Data Credit Management Co Ltd
Priority to CN202010920433.4A priority Critical patent/CN112053234B/zh
Publication of CN112053234A publication Critical patent/CN112053234A/zh
Application granted granted Critical
Publication of CN112053234B publication Critical patent/CN112053234B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P80/00Climate change mitigation technologies for sector-wide applications
    • Y02P80/10Efficient use of energy, e.g. using compressed air or pressurized fluid as energy carrier

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于宏观区域经济指数与微观因素的企业信用评级方法,属于金融信贷领域,本发明要解决的技术问题为如何基于宏观区域经济指数与微观企业影响因素对企业的信用风险情况进行综合评估,实现全面精准的企业信用风险评分,采用的技术方案为:该方法具体如下:基于主成分分析方法PCA建立企业区域指数评估模型;基于企业区域指数评估模型预测企业的宏观区域经济指数分值;基于企业公积金及社保的数据抽取企业微观信用风险影响因素指标;将企业的宏观经济指数以及微观企业影响因素进行融合,并基于逻辑回归方法建立企业信用评估模型,同时训练企业信用评估模型。本发明还公开了一种基于宏观区域经济指数与微观因素的企业信用评级系统。

Description

基于宏观区域经济指数与微观因素的企业信用评级方法
技术领域
本发明涉及金融信贷领域,尤其涉及金融信贷领域中企业信用的评级领域,具体地说是一种基于宏观区域经济指数与微观因素的企业信用评级方法。
背景技术
企业信用评级的本质是对企业过去经营、财务、资信情况评价的基础上,对企业未来偿债能力的一种预测。企业信用评级方法包括传统的信用评价方法以及统计模型法等。其中,传统的信用评价方法包括以5C法为代表的专家判断法和以5C法为基础发展起来的综合评价法。评估人员需要根据自己的专业技能、主观判断对影响信用评估决策的某些关键因素进行权衡。而统计模型法又包括线性区别模型、线性概率模型、逻辑回归模型等。逻辑回归模型是企业信用评级最常用的机器学习模型,该模型相较于其它决策树、集成学习、神经网络模型来说模型稳定性更强、预测准确率更高并且模型可解释性更强。
区域经济是影响企业信用评级的主要宏观因素之一,某一区域的经济发展情况往往直接影响该地区企业信用评级的结果。区域经济是指在一定区域内经济发展的内部因素与外部条件相互作用而产生的生产综合体。区域经济反映不同地区内经济发展的客观规律以及内涵和外延的相互关系。而区域经济指数分析是对区域经济发展的影响因素做内在的定量分析以及经济发展趋势进行动态分析。区域经济指数的计算源于景气指数,景气是经济景气的简称,指经济总体的运行发展态势和活跃程度,是用来分析经济活跃程度的经济概念。目前国内外景气指数的编制方法有扩散指数DI方法、合成指数CI方法、主成分分析方法和S-W型景气指数法。
现有技术中,有通过数据采集、数据分析等流程并搭建区域经济发展趋势分析系统实现对区域经济的统计分析、发展规划,并进行可视化展示,实现用户端通过信号连接进行查询及便于参考规划。也有人通过选择行业发展性指标、核心团队素质指标、规范性与风险性、实力规模、偿债能力、盈利能力、运营能力、成长能力、技术与创新能力和市场与渠道指标等作为企业能力指标,并通过量化企业能力指标权重,累加每项能力指标权重与相应指标评分的乘积来获得能力指标总分,以此来定量分析企业的信用分值。
不同地市的企业由于不同地市区域经济发展情况不同,往往导致不同地市的企业其企业发展、经营稳定性、经营状况等存在差异,从而影响企业的信用风险情况。故如何基于宏观区域经济指数与微观企业影响因素对企业的信用风险情况进行综合评估,实现全面精准的企业信用风险评分是目前亟待解决的问题。
发明内容
本发明的技术任务是提供一种基于宏观区域经济指数与微观因素的企业信用评级方法,来解决如何基于宏观区域经济指数与微观企业影响因素对企业的信用风险情况进行综合评估,实现全面精准的企业信用风险评分的问题。
本发明的技术任务是按以下方式实现的,一种基于宏观区域经济指数与微观因素的企业信用评级方法,该方法是通过机器学习对区域经济指数进行量化评估,将区域经济指数作为企业的评估维度与影响企业信用风险的微观企业影响因素进行融合,并运用逻辑回归方法对企业的信用进行评价;具体如下:
基于主成分分析方法PCA建立企业区域指数评估模型;
基于企业区域指数评估模型预测企业的宏观区域经济指数分值;
基于企业公积金及社保的数据抽取企业微观信用风险影响因素指标;
将企业的宏观经济指数以及微观企业影响因素进行融合,并基于逻辑回归方法建立企业信用评估模型,同时训练企业信用评估模型。
作为优选,所述企业区域指数评估模型的构建具体如下:
针对区域指数训练样本进行标准化处理;
基于因子分析方法对标准化后的区域矩阵计算最大公因子;
基于主成分分析方法PCA以公共因子个数为参数,计算降维后的主成分向量,同时计算原始标准矩阵在降维空间中的表示向量;
基于求取的降维空间中的区域向量,以各主成分的方差贡献率作为参数,各主成分赋予分值,运用加权平均的方法计算各区域指数,对区域指数进行校准,形成最终的区域指数。
更优地,所述基于因子分析方法对标准化后的区域矩阵计算最大公因子具体如下:
计算标准矩阵的协方差矩阵;
计算协方差矩阵的特征值及对应特征向量;
计算各因子的方差贡献率及累计方差贡献率,根据累计方差贡献率是否大于95%确定公共因子的个数,进而确定最终所得公共因子的个数。
更优地,形成所述最终的区域指数具体如下:
采用标准指标矩阵降维到低维空间中的向量矩阵、各主成分方差贡献率及各主成分所附初值来计算;
通过加权计算形成初始区域指数结果;
观察所得初始指数结果,对区域指数结果进行校准,最终形成0-20之间的各区域指数值;其中,校准包括上下浮动及调整比例。
作为优选,所述企业信用评估模型的构建及训练具体如下:
抽取微观企业影响因素指标:基于企业工商、公积金、社保以及行政处罚的数据抽取企业微观影响因素指标,针对抽取指标筛选影响企业信用风险评估的入模指标;
清洗特征:针对初步筛选入模指标采用XGBoost方法进行特征重要性评估,基于特征重要性评估排序进行前向回归建模,筛选回归模型最优入模指标;
特征工程:将特征清洗后的微观影响因素指标与宏观影响因素指标相融合,基于融合特征进行WOE分箱转换处理并计算每个特征的IV值,基于IV值筛选对目标变量预测贡献度高的特征;
训练逻辑回归模型:针对微观影响指标与宏观影响指标融合后的特征并基于分箱转换结果,运用hyperopt方法寻找逻辑回归模型的最优参数,采用寻优所得最优参数训练最优逻辑回归模型,并将最优逻辑回归模型以及特征权重输出保存;
计算企业信用得分:基于最优逻辑回归模型所得的特征权重以及各特征WOE分箱的结果进行标准评分卡转换,计算训练样本的企业的信用风险得分,对信用评分进行等级划分进而评估企业信用等级。
更优地,所述特征清洗具体如下:
针对微观企业影响因素指标及训练样本,计算微观指标的同值率及缺失值;
针对缺失值大于60%的特征进行去除,针对同值率大于60%的特征进行去除;
针对微观指标中的无效值进行过滤并修正;
基于筛选的指标进行特征相关性计算,计算各特征之间的皮尔逊相关系数;
针对特征之间相关性大于80%的特征,根据特征与目标变量相关性从高到低进行排序,保留其中排序最靠前的2-3个特征。
一种基于宏观区域经济指数与微观因素的企业信用评级系统,该系统包括,
企业区域指数评估模型构建单元,用于基于主成分分析方法PCA建立企业区域指数评估模型;
预测单元,用于基于企业区域指数评估模型预测企业的宏观区域经济指数分值;
抽取单元,用于基于企业公积金及社保的数据抽取企业微观信用风险影响因素指标;
企业信用评估模型构建及训练单元,用于将企业的宏观经济指数以及微观企业影响因素进行融合,并基于逻辑回归方法建立企业信用评估模型,同时训练企业信用评估模型。
作为优选,所述企业区域指数评估模型构建单元包括,
标准化模块,用于针对区域指数训练样本进行标准化处理;
最大公因子计算模块,用于基于因子分析方法对标准化后的区域矩阵计算最大公因子;
向量计算模块,用于基于主成分分析方法PCA以公共因子个数为参数,计算降维后的主成分向量,同时计算原始标准矩阵在降维空间中的表示向量;
区域指数形成模块,用于基于求取的降维空间中的区域向量,以各主成分的方差贡献率作为参数,各主成分赋予分值,运用加权平均的方法计算各区域指数,对区域指数进行校准,形成最终的区域指数;
所述企业信用评估模型构建及训练单元包括,
微观企业影响因素指标抽取模块,用于基于企业工商、公积金、社保以及行政处罚的数据抽取企业微观影响因素指标,针对抽取指标筛选影响企业信用风险评估的入模指标;
特征清洗模块,用于针对初步筛选入模指标采用XGBoost方法进行特征重要性评估,基于特征重要性评估排序进行前向回归建模,筛选回归模型最优入模指标;
特征工程模块,用于将特征清洗后的微观影响因素指标与宏观影响因素指标相融合,基于融合特征进行WOE分箱转换处理并计算每个特征的IV值,基于IV值筛选对目标变量预测贡献度高的特征;
逻辑回归模型训练模块,用于针对微观影响指标与宏观影响指标融合后的特征并基于分箱转换结果,运用hyperopt方法寻找逻辑回归模型的最优参数,采用寻优所得最优参数训练最优逻辑回归模型,并将最优逻辑回归模型以及特征权重输出保存;
企业信用得分计算模块,用于基于最优逻辑回归模型所得的特征权重以及各特征WOE分箱的结果进行标准评分卡转换,计算训练样本的企业的信用风险得分,对信用评分进行等级划分进而评估企业信用等级。
一种电子设备,其特征在于,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上述的基于宏观区域经济指数与微观因素的企业信用评级方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行时,实现如上述的基于宏观区域经济指数与微观因素的企业信用评级方法。
本发明的基于宏观区域经济指数与微观因素的企业信用评级方法具有以下优点:
(一)本发明通过主成分分析方法对评估区域经济的指标数据进行降维构造低维空间主成分,并根据各原始成分对低维主成分的贡献度计算区域的经济指数,再通过筛选企业偿债、行业、经营、履约、营运等五个维度的信用评估指标,并融合企业区域指数评估指标,把通过主成分分析计算所得企业所在区域的宏观区域指数与企业的各微观影响因素相融合,基于逻辑回归统计方法来综合评估企业的信用等级情况,实现全面精准的企业信用风险评分;
(二)本发明旨在充分挖掘区域经济对企业信用风险情况的影响程度,通过机器学习的方法以不同区域的经济指标数据为基础,建立的区域经济指数分析模型;并将模型预测所得的济南区域经济指数作为企业信用评估的宏观因素与其他公积金、社保、工商、行政处罚等影响企业信用风险情况的微观因素进行融合,综合评估企业的信用风险情况,进而对区域经济指数进行定量评估,拓展了区域经济定量评估的评价方法及评估范围,并对区域经济指数对企业信用风险评估的影响进行定量评价,丰富了企业信用评估指标体系的内容及评价方法;
(三)本发明基于PCA主成分分析方法对企业所在区域的区域经济指数进行量化评估,并将影响企业信用风险的宏观因素(区域经济指数)与影响企业信用风险的微观因素(公积金、工商、社保、行政处罚等抽取的指标)进行融合,基于逻辑回归方法建立企业信用风险评估模型,与现有技术相比,具有如下的有益结果:
①相较与传统的区域指数制定方法,本发明应用主成分分析对筛选的区域经济指标进行量化评估,建立区域经济指数评估模型,克服了传统区域指数制定方法中人为主观因素影响较大,容易造成不同地域指数编纂误差较大的弊端;
②运用主成分分析方法这一机器学习方法建立区域指数评估模型,该模型实施非人工化且可编程自动实施,为该方法在不同地域、全国地市等范围内指数评估的应用实施提供了可能,可适用于区域数据量较多、地市数量较多的应用场景当中;
③相较于只依赖于企业微观影响因素评估企业信用风险的评估方法,本发明将企业宏观因素与微观因素相融合,并将宏观因素与微观因数进行定量分析并可实现不同因素对于企业信用风险评估重要性的量化;
④伴随企业海量数据的汇聚、大数据风控建模方法的引进、企业评估指标的不断丰富、序列特征的添加以及多种算法的融合,本发明提出的方法会更适用于包含大量企业信用宏观影响因素与微观影响因素的风控建模场景中,其应用前景极为广阔。
附图说明
下面结合附图对本发明进一步说明。
附图1为基于宏观区域经济指数与微观因素的企业信用评级方法的流程框图;
附图2为企业区域指数评估模型的构建的流程框图;
附图3为企业信用评估模型的构建及训练的流程框图;
附图4为实施例3的流程框图。
具体实施方式
参照说明书附图和具体实施例对本发明的基于宏观区域经济指数与微观因素的企业信用评级方法作以下详细地说明。
实施例1:
如附图1所示,本发明的基于宏观区域经济指数与微观因素的企业信用评级方法。该方法是通过机器学习对区域经济指数进行量化评估,将区域经济指数作为企业的评估维度与影响企业信用风险的微观企业影响因素进行融合,并运用逻辑回归方法对企业的信用进行评价;具体如下:
S1、基于主成分分析方法PCA建立企业区域指数评估模型;
S1、基于企业区域指数评估模型预测企业的宏观区域经济指数分值;
S3、基于企业公积金及社保的数据抽取企业微观信用风险影响因素指标;
S4、将企业的宏观经济指数以及微观企业影响因素进行融合,并基于逻辑回归方法建立企业信用评估模型,同时训练企业信用评估模型。
在本实施例中,如附图2所示,步骤S1中企业区域指数评估模型的构建具体如下:
S101、针对区域指数训练样本进行标准化处理;
S102、基于因子分析方法对标准化后的区域矩阵(简称标准矩阵)计算最大公因子;具体如下:
S10201、计算标准矩阵的协方差矩阵;
S10202、计算协方差矩阵的特征值及对应特征向量;
S10203、计算各因子的方差贡献率及累计方差贡献率,根据累计方差贡献率是否大于95%确定公共因子的个数,进而确定最终所得公共因子个数为8。
S103、基于主成分分析方法PCA以公共因子个数为参数,计算降维后的主成分向量,同时计算原始标准矩阵在降维空间中的表示向量;
S104、基于求取的降维空间中的区域向量,以各主成分的方差贡献率作为参数,各主成分赋予分值,运用加权平均的方法计算各区域指数,对区域指数进行校准,形成最终的区域指数;具体如下:
S10401、采用标准指标矩阵降维到低维空间中的向量矩阵、各主成分方差贡献率及各主成分所附初值(各主成分赋初值100)来计算;
S10402、通过加权计算形成初始区域指数结果;
S10403、观察所得初始指数结果,对区域指数结果进行校准,最终形成0-20之间的各区域指数值;其中,校准包括上下浮动及调整比例。
本实施例中,区域宏观经济指数建立之后,将企业区域经济指数的值与其他工商、社保、公积金等影响企业信用风险的微观因素进行融合,将企业区域经济指数作为入模向量的某一列,如附图3所示,步骤S4中企业信用评估模型的构建及训练具体如下:
S401、抽取微观企业影响因素指标:基于企业工商、公积金、社保以及行政处罚的数据抽取企业微观影响因素指标,针对抽取指标筛选影响企业信用风险评估的入模指标;
S402、清洗特征:针对初步筛选入模指标采用XGBoost方法进行特征重要性评估,基于特征重要性评估排序进行前向回归建模,筛选回归模型最优入模指标;具体如下:
S40201、针对微观企业影响因素指标及训练样本,计算微观指标的同值率及缺失值;
S40202、针对缺失值大于60%的特征进行去除,针对同值率大于60%的特征进行去除;
S40203、针对微观指标中的无效值进行过滤并修正;
S40204、基于筛选的指标进行特征相关性计算,计算各特征之间的皮尔逊相关系数;
S40205、针对特征之间相关性大于80%的特征,根据特征与目标变量相关性从高到低进行排序,保留其中排序最靠前的2-3个特征。
S403、特征工程:将特征清洗后的微观影响因素指标与宏观影响因素指标相融合,基于融合特征进行WOE分箱转换处理并计算每个特征的IV值,基于IV值筛选对目标变量预测贡献度高的特征;
S404、训练逻辑回归模型:针对微观影响指标与宏观影响指标融合后的特征并基于分箱转换结果,运用hyperopt方法寻找逻辑回归模型的最优参数,采用寻优所得最优参数训练最优逻辑回归模型,并将最优逻辑回归模型以及特征权重输出保存;
S405、计算企业信用得分:基于最优逻辑回归模型所得的特征权重以及各特征WOE分箱的结果进行标准评分卡转换,计算训练样本的企业的信用风险得分,对信用评分进行等级划分进而评估企业信用等级。
更优地,所述特征清洗
实施例2:
以济南地域为例,如附图4所示,具体如下:
(1)、通过机器学习方法对济南的区域经济指数进行量化评估;
(2)、将区域经济指数作为企业的评估维度与其他影响企业信用风险的微观企业影响因素进行融合,运用逻辑回归方法对企业的信用情况进行评价。
本发明中区域指数建模采用主成分分析方法PCA进行建模,PCA是一种常用的数据降维方法,主要用于训练样本中高纬度特征数据的降维,用于去除噪声和不重要的特征,从而实现提升数据处理速度的目的。常用的PCA降维,输入的特征矩阵行代表训练样本,行数代表训练样本的个数,列为入模特征数,列数为特征数,通过PCA这种降维方法将n维特征映射到k维上,k维是全新的正交特征被称为主成分。区域指数运用PCA方法进行区域指数建模,区域样本“特征矩阵”的行为济南的13个区域,列为区域指数的33个入模指标,通过PCA降维去除指标之间的共性,寻找潜在的指标特征,最后运用线性加权的方法,为各指标特征赋予分值,加权计算各区域的指数。
区域宏观经济指数建立之后,将企业区域经济指数的值与其他工商、社保、公积金等影响企业信用风险的微观因素进行融合,将企业区域经济指数作为入模向量的某一列,通过如下的企业信用风险建模步骤进行建模:
①、从企业覆盖的工商、社保、公积金等数据中筛选企业信用评估指标,针对评估指标进行缺失值统计、同值率统计、无效特征去除、特征相关性计算等特征预处理流程,最后得到企业微观影响因素共计12个指标;
②、针对入模的12个微观因素通过XGBoost方法进行特征重要性排序,并以特征重要性排序的结果为基础,进行前向回归建模,筛选最优入模指标,最后筛选得到10个指标;
③将筛选所得的10个微观影响因素指标与1个区域宏观指数指标进行融合,融合后的特征进行WOE分箱操作,并计算各特征的IV值,通过IV值将对目标函数预测能力特别弱的微观企业因素特征去除,共计剩余8个;
④基于训练样例WOE分箱转换之后的训练结果,训练逻辑回归模型,并通过hyperopt参数寻优方法寻找逻辑回归模型的最优参数,基于最优参数训练逻辑回归模型,将最终所得模型输出保存,将模型中各特征的权重结果输出保存;
⑤基于特征分箱的结果及训练模型所得的模型系数,针对训练样例进行标准评分卡的转换,计算训练样例的标准评分;
⑥针对企业的标准评分结果,进行分数区间划分,形成企业的信用等级划分结果。
实施例3:
本发明的基于宏观区域经济指数与微观因素的企业信用评级系统,该系统包括,
企业区域指数评估模型构建单元,用于基于主成分分析方法PCA建立企业区域指数评估模型;其中,企业区域指数评估模型构建单元包括,
标准化模块,用于针对区域指数训练样本进行标准化处理;
最大公因子计算模块,用于基于因子分析方法对标准化后的区域矩阵计算最大公因子;
向量计算模块,用于基于主成分分析方法PCA以公共因子个数为参数,计算降维后的主成分向量,同时计算原始标准矩阵在降维空间中的表示向量;
区域指数形成模块,用于基于求取的降维空间中的区域向量,以各主成分的方差贡献率作为参数,各主成分赋予分值,运用加权平均的方法计算各区域指数,对区域指数进行校准,形成最终的区域指数;
预测单元,用于基于企业区域指数评估模型预测企业的宏观区域经济指数分值;
抽取单元,用于基于企业公积金及社保的数据抽取企业微观信用风险影响因素指标;
企业信用评估模型构建及训练单元,用于将企业的宏观经济指数以及微观企业影响因素进行融合,并基于逻辑回归方法建立企业信用评估模型,同时训练企业信用评估模型。其中,企业信用评估模型构建及训练单元包括,
微观企业影响因素指标抽取模块,用于基于企业工商、公积金、社保以及行政处罚的数据抽取企业微观影响因素指标,针对抽取指标筛选影响企业信用风险评估的入模指标;
特征清洗模块,用于针对初步筛选入模指标采用XGBoost方法进行特征重要性评估,基于特征重要性评估排序进行前向回归建模,筛选回归模型最优入模指标;
特征工程模块,用于将特征清洗后的微观影响因素指标与宏观影响因素指标相融合,基于融合特征进行WOE分箱转换处理并计算每个特征的IV值,基于IV值筛选对目标变量预测贡献度高的特征;
逻辑回归模型训练模块,用于针对微观影响指标与宏观影响指标融合后的特征并基于分箱转换结果,运用hyperopt方法寻找逻辑回归模型的最优参数,采用寻优所得最优参数训练最优逻辑回归模型,并将最优逻辑回归模型以及特征权重输出保存;
企业信用得分计算模块,用于基于最优逻辑回归模型所得的特征权重以及各特征WOE分箱的结果进行标准评分卡转换,计算训练样本的企业的信用风险得分,对信用评分进行等级划分进而评估企业信用等级。
实施例4:
本发明实施例还提供了一种电子设备,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行本发明任一实施例中的基于宏观区域经济指数与微观因素的企业信用评级方法。
实施例5:
本发明实施例还提供了一种计算机可读存储介质,其中存储有多条指令,指令由处理器加载,使处理器执行本发明任一实施例中的基于宏观区域经济指数与微观因素的企业信用评级方法。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-R基于宏观区域经济指数与微观因素的企业信用评级方法M、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (7)

1.一种基于宏观区域经济指数与企业微观信用风险影响因素指标的企业信用评级方法,其特征在于,该方法是通过机器学习对宏观区域经济指数进行量化评估,将宏观区域经济指数作为企业的评估维度与影响企业信用风险的企业微观信用风险影响因素指标进行融合,并运用逻辑回归方法对企业的信用进行评价;具体如下:
基于主成分分析方法PCA建立宏观区域经济指数评估模型;宏观区域经济指数评估模型的构建具体如下:
针对宏观区域经济指数训练样本进行标准化处理;
基于因子分析方法对标准化后的区域矩阵计算最大公因子;
基于主成分分析方法PCA以公共因子个数为参数,计算降维后的主成分向量,同时计算原始标准矩阵在降维空间中的区域向量;
基于求取的降维空间中的区域向量,以各主成分的方差贡献率作为参数,各主成分赋予分值,运用加权平均的方法计算各宏观区域经济指数,对宏观区域经济指数进行校准,形成最终的宏观区域经济指数;
基于宏观区域经济指数评估模型预测企业的宏观区域经济指数分值;
将企业的宏观区域经济指数以及企业微观信用风险影响因素指标进行融合,并基于逻辑回归方法建立企业信用评估模型,同时训练企业信用评估模型;其中,企业信用评估模型的构建及训练具体如下:
抽取企业微观信用风险影响因素指标:基于企业工商、公积金、社保以及行政处罚的数据抽取企业微观信用风险影响因素指标,针对抽取指标筛选影响企业信用风险评估的入模指标;
清洗特征:针对初步筛选入模指标采用XGBoost方法进行特征重要性评估,基于特征重要性评估排序进行前向回归建模,筛选回归模型最优入模指标;
特征工程:将特征清洗后的企业微观信用风险影响因素指标与宏观区域经济指数相融合,基于融合特征进行WOE分箱转换处理并计算每个特征的IV值,基于IV值筛选对目标变量预测贡献度高的特征;
训练逻辑回归模型:针对企业微观信用风险影响因素指标与宏观区域经济指数融合后的特征并基于分箱转换结果,运用hyperopt方法寻找逻辑回归模型的最优参数,采用寻优所得最优参数训练最优逻辑回归模型,并将最优逻辑回归模型以及特征权重输出保存;
计算企业信用得分:基于最优逻辑回归模型所得的特征权重以及各特征WOE分箱的结果进行标准评分卡转换,计算训练样本的企业的信用风险得分,对信用评分进行等级划分进而评估企业信用等级。
2.根据权利要求1所述的基于宏观区域经济指数与企业微观信用风险影响因素指标的企业信用评级方法,其特征在于,所述基于因子分析方法对标准化后的区域矩阵计算最大公因子具体如下:
计算标准矩阵的协方差矩阵;
计算协方差矩阵的特征值及对应特征向量;
计算各因子的方差贡献率及累计方差贡献率,根据累计方差贡献率是否大于95%确定公共因子的个数,进而确定最终所得公共因子的个数。
3.根据权利要求1或2所述的基于宏观区域经济指数与企业微观信用风险影响因素指标的企业信用评级方法,其特征在于,形成所述最终的宏观区域经济指数具体如下:
采用标准指标矩阵降维到低维空间中的向量矩阵、各主成分方差贡献率及各主成分所附初值来计算;
通过加权计算形成初始宏观区域经济指数结果;
观察所得初始指数结果,对宏观区域经济指数结果进行校准,最终形成0-20之间的各宏观区域经济指数值;其中,校准包括上下浮动及调整比例。
4.根据权利要求1所述的基于宏观区域经济指数与企业微观信用风险影响因素指标的企业信用评级方法,其特征在于,所述特征清洗具体如下:
针对企业微观信用风险影响因素指标及训练样本,计算企业微观信用风险影响因素指标的同值率及缺失值;
针对缺失值大于60%的特征进行去除,针对同值率大于60%的特征进行去除;
针对企业微观信用风险影响因素指标中的无效值进行过滤并修正;
基于筛选的指标进行特征相关性计算,计算各特征之间的皮尔逊相关系数;
针对特征之间相关性大于80%的特征,根据特征与目标变量相关性从高到低进行排序,保留其中排序最靠前的2-3个特征。
5.一种基于宏观区域经济指数与企业微观信用风险影响因素指标的企业信用评级系统,其特征在于,该系统包括,
企业宏观区域经济指数评估模型构建单元,用于基于主成分分析方法PCA建立企业宏观区域经济指数评估模型;企业宏观区域经济指数评估模型构建单元包括,
标准化模块,用于针对宏观区域经济指数训练样本进行标准化处理;
最大公因子计算模块,用于基于因子分析方法对标准化后的区域矩阵计算最大公因子;
向量计算模块,用于基于主成分分析方法PCA以公共因子个数为参数,计算降维后的主成分向量,同时计算原始标准矩阵在降维空间中的区域向量;
宏观区域经济指数形成模块,用于基于求取的降维空间中的区域向量,以各主成分的方差贡献率作为参数,各主成分赋予分值,运用加权平均的方法计算各宏观区域经济指数,对宏观区域经济指数进行校准,形成最终的宏观区域经济指数;
预测单元,用于基于企业宏观区域经济指数评估模型预测企业的宏观区域经济指数分值;
企业信用评估模型构建及训练单元,用于将企业的宏观区域经济指数以及企业微观信用风险影响因素指标进行融合,并基于逻辑回归方法建立企业信用评估模型,同时训练企业信用评估模型;企业信用评估模型构建及训练单元包括,
企业微观信用风险影响因素指标抽取模块,用于基于企业工商、公积金、社保以及行政处罚的数据抽取企业微观信用风险影响因素指标,针对抽取指标筛选影响企业信用风险评估的入模指标;
特征清洗模块,用于针对初步筛选入模指标采用XGBoost方法进行特征重要性评估,基于特征重要性评估排序进行前向回归建模,筛选回归模型最优入模指标;
特征工程模块,用于将特征清洗后的企业微观信用风险影响因素指标与宏观区域经济指数相融合,基于融合特征进行WOE分箱转换处理并计算每个特征的IV值,基于IV值筛选对目标变量预测贡献度高的特征;
逻辑回归模型训练模块,用于针对企业微观信用风险影响因素指标与宏观区域经济指数融合后的特征并基于分箱转换结果,运用hyperopt方法寻找逻辑回归模型的最优参数,采用寻优所得最优参数训练最优逻辑回归模型,并将最优逻辑回归模型以及特征权重输出保存;
企业信用得分计算模块,用于基于最优逻辑回归模型所得的特征权重以及各特征WOE分箱的结果进行标准评分卡转换,计算训练样本的企业的信用风险得分,对信用评分进行等级划分进而评估企业信用等级。
6.一种电子设备,其特征在于,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至4任一项所述的基于宏观区域经济指数与企业微观信用风险影响因素指标的企业信用评级方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行时,实现如权利要求1至4中任一所述的基于宏观区域经济指数与企业微观信用风险影响因素指标的企业信用评级方法。
CN202010920433.4A 2020-09-04 2020-09-04 基于宏观区域经济指数与微观因素的企业信用评级方法 Active CN112053234B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010920433.4A CN112053234B (zh) 2020-09-04 2020-09-04 基于宏观区域经济指数与微观因素的企业信用评级方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010920433.4A CN112053234B (zh) 2020-09-04 2020-09-04 基于宏观区域经济指数与微观因素的企业信用评级方法

Publications (2)

Publication Number Publication Date
CN112053234A CN112053234A (zh) 2020-12-08
CN112053234B true CN112053234B (zh) 2022-09-30

Family

ID=73608359

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010920433.4A Active CN112053234B (zh) 2020-09-04 2020-09-04 基于宏观区域经济指数与微观因素的企业信用评级方法

Country Status (1)

Country Link
CN (1) CN112053234B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112734271A (zh) * 2021-01-19 2021-04-30 建信金融科技有限责任公司 成长曲线回归模型训练方法及企业评价指标生成方法
CN112734567A (zh) * 2021-01-22 2021-04-30 建信金融科技有限责任公司 宏观违约风险模型训练方法、信用评价方法及装置
CN112668945A (zh) * 2021-01-27 2021-04-16 天元大数据信用管理有限公司 一种企业信用风险评估方法及设备
CN112966913A (zh) * 2021-02-25 2021-06-15 重庆维知达科技有限公司 一种企业质量信用数据分析方法及系统
CN113643125A (zh) * 2021-08-30 2021-11-12 天元大数据信用管理有限公司 一种授信额度测算方法、设备及介质
CN114492929A (zh) * 2021-12-23 2022-05-13 江南大学 一种基于XGboost的金融信贷企业信用预测方法
CN118350691A (zh) * 2024-03-28 2024-07-16 北京清华同得科技有限公司 一种区域智能引入企业的测评方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830490A (zh) * 2018-06-21 2018-11-16 浙江盘石信息技术股份有限公司 一种利用公有区块链管理动态企业信用评分的方法
CN110322089A (zh) * 2018-03-30 2019-10-11 宗略投资(上海)有限公司 企业信用风险评估方法及其系统
CN110348999A (zh) * 2019-06-29 2019-10-18 北京淇瑀信息科技有限公司 金融风险敏感用户识别方法、装置及电子设备
CN111311030A (zh) * 2020-03-27 2020-06-19 中国工商银行股份有限公司 基于影响因素检测的用户信用风险预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322089A (zh) * 2018-03-30 2019-10-11 宗略投资(上海)有限公司 企业信用风险评估方法及其系统
CN108830490A (zh) * 2018-06-21 2018-11-16 浙江盘石信息技术股份有限公司 一种利用公有区块链管理动态企业信用评分的方法
CN110348999A (zh) * 2019-06-29 2019-10-18 北京淇瑀信息科技有限公司 金融风险敏感用户识别方法、装置及电子设备
CN111311030A (zh) * 2020-03-27 2020-06-19 中国工商银行股份有限公司 基于影响因素检测的用户信用风险预测方法及装置

Also Published As

Publication number Publication date
CN112053234A (zh) 2020-12-08

Similar Documents

Publication Publication Date Title
CN112053234B (zh) 基于宏观区域经济指数与微观因素的企业信用评级方法
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和系统
KR100914307B1 (ko) 신용 위험 모형 구축 시스템, 신용 위험 모형 구축을 통한 신용 위험 관리 방법 및 이를 기록한 기록매체
CN111951097A (zh) 企业信用风险评估方法、装置、设备及存储介质
CN110288137B (zh) 路网级道路基础设施结构综合养护决策方法及系统
CN111583012B (zh) 融合文本信息的信用债发债主体违约风险评估方法
CN108875118B (zh) 一种高炉铁水硅含量预测模型准确度评价方法和设备
CN114048436A (zh) 一种预测企业财务数据模型构建方法及构建装置
CN111539585A (zh) 一种基于随机森林的电力客户诉求敏感度监督及预警方法
CN113450009A (zh) 一种企业成长性评价的方法及系统
CN113240527A (zh) 基于可解释机器学习的债券市场违约风险预警方法
CN113065969A (zh) 企业评分模型构建方法、企业评分方法、介质和电子设备
CN113177643A (zh) 一种基于大数据的自动建模系统
CN114819777A (zh) 一种基于数字孪生技术的企业销售业务分析管理系统
CN112037006A (zh) 小微企业的信用风险识别方法及装置
CN111626855A (zh) 债券信用利差预测方法及系统
CN111507824A (zh) 风控模型入模变量最小熵分箱方法
CN114548494A (zh) 一种可视化造价数据预测智能分析系统
KR20110114181A (ko) 예측 정확성이 향상된 대출 심사 방법
CN116645014A (zh) 一种基于人工智能的供应商供应数据模型构建方法
CN115330526A (zh) 一种企业信用评分方法及装置
Asis et al. Emerging markets at risk
CN114757495A (zh) 一种基于逻辑回归的会员价值量化评估方法
CN114663102A (zh) 基于半监督模型预测发债主体违约的方法、设备及存储介质
CN114596152A (zh) 基于无监督模型预测发债主体违约的方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant