CN112053233A - 基于gra的动态中小企业信用评分方法及系统 - Google Patents

基于gra的动态中小企业信用评分方法及系统 Download PDF

Info

Publication number
CN112053233A
CN112053233A CN202010920418.XA CN202010920418A CN112053233A CN 112053233 A CN112053233 A CN 112053233A CN 202010920418 A CN202010920418 A CN 202010920418A CN 112053233 A CN112053233 A CN 112053233A
Authority
CN
China
Prior art keywords
credit
enterprise
evaluated
characteristic
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010920418.XA
Other languages
English (en)
Other versions
CN112053233B (zh
Inventor
崔光裕
边松华
崔乐乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyuan Big Data Credit Management Co Ltd
Original Assignee
Tianyuan Big Data Credit Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyuan Big Data Credit Management Co Ltd filed Critical Tianyuan Big Data Credit Management Co Ltd
Priority to CN202010920418.XA priority Critical patent/CN112053233B/zh
Publication of CN112053233A publication Critical patent/CN112053233A/zh
Application granted granted Critical
Publication of CN112053233B publication Critical patent/CN112053233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Technology Law (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于GRA的动态中小企业信用评分方法及系统,属于信用评估技术领域,本发明要解决的技术问题为针对中小企业信用状况难以准确评估的现状,如何实现运用多源中小企业信息,综合分析中小企业发展趋势,产生准确、稳健信用评分,技术方案为:该方法具体如下:获取时间序列特征数据:获取受评企业所在行业以及受评企业在采样时间点上的时间序列信用特征数据;分箱转换特征数据:运用基于决策树分类器与信息熵评价的特征分箱模型,得到每个时间序列信用特征在每个采集时间点对应的信用特征数据分箱编码结果;计算信用特征评分;计算参考序列;生成信用评判值序列;动态预测信用风险。本发明还公开了基于GRA的动态中小企业信用评分系统。

Description

基于GRA的动态中小企业信用评分方法及系统
技术领域
本发明涉及信用评估技术领域,具体地说是一种基于GRA的动态中小企业 信用评分方法及系统。
背景技术
近年来,得益于普惠金融政策支持,中小企业贷款成本降低、贷款量持续 上升。然而,由于中小企业存续时间普遍较短、财务数据不规范、容易受到宏 观环境与经济周期影响等特点,仅运用财务指标分析难以形成准确的信用评价。
信用评分是一种对客户特征数据进行严谨分析,运用特定信用评分模型计 算出一个能够反映客户履行经济责任的能力及其可信任程度的分数值的技术。 通常,信用评分模型采用企业孤立时间点上的财务指标、历史信贷记录、银行 流水信息等数据,产生针对当前时刻的信用评分。
专利号为CN110796539A公开了一种征信评估方法及装置,包括:获取待评 估企业的征信相关数据,所述征信相关数据包括多个征信指标;根据所述多个 征信指标以及各自对应的征信指标评分规则,获得所述待评估企业的征信评分; 其中,每个征信指标对应的评分规则是预设的;若判断获知所述征信评分大于 评分阈值,则将所述多个征信指标输入至征信评估模型,获得所述待评估企业 的征信评估结果;其中,所述征信评估模型是基于征信相关数据样本训练后获 得的,所述征信相关数据样本中的每个训练样本包括样本标记和所述多个征信 指标。所述装置用于执行上述方法。该技术方案一方面考虑了受评企业单个时 间点上的信用特征数据作为评价依据,但并未给出对于外部环境、企业自身发 展生命周期对中小企业信用状况影响的测算方法;另一方面,对于受评企业的 信用评价基于其过去的征信指标,未给出动态预测受评企业未来信用评价变化 的具体方法。
中小企业时间序列信用特征数据是指受评企业在连续时间上获得的一系列 采样值,这一采样方法能够捕捉信用特征与时间之间的相关性。由于采样对象 与一个采样时刻对应的是多个实数变量,因此其是一个多维时间序列。
GRA是研究系统序列间关联关系的一种量化模型,属于几何处理范畴,是 复杂系统建模的重要技术手段。基于相似性或相近性构造的GRA模型能够度量 时间序列系统内部序列之间的紧密程度,因此,该模型在信用评分领域能够被 用于刻画受评企业的历史信用状况变化趋势。在GRA基础上,运用时间序列预 测回归方法能够对受评企业的未来信用变化趋势进行预测。
有人提出一种5级评价等级标准,并构建了针对水利工程承包企业的信用 评价灰色综合评价模型,并证明了该模型对水利工程承包企业的信用评价有效 可行,但是该方法以专家经验为基础构建评价矩阵,因此具有较强主观性。也 有人详细论证了将GRA用于多维时间序列数据处理过程的理论严谨性与可行性, 并以上市公司为例进行了仿真研究,但其仿真过程并不适用于中小企业信用评 价。
故针对中小企业信用状况难以准确评估的现状,如何实现运用多源中小企 业信息,综合分析中小企业发展趋势,产生准确、稳健信用评分是目前亟待解 决的技术问题。
发明内容
本发明的技术任务是提供一种基于GRA的动态中小企业信用评分方法及系 统,来解决针对中小企业信用状况难以准确评估的现状,如何实现运用多源中 小企业信息,综合分析中小企业发展趋势,产生准确、稳健信用评分的问题。
本发明的技术任务是按以下方式实现的,基于GRA的动态中小企业信用评 分方法,该方法具体如下:
获取时间序列特征数据:获取受评企业所在行业以及受评企业在采样时间 点上的时间序列信用特征数据;
分箱转换特征数据:运用基于决策树分类器与信息熵评价的特征分箱模型, 得到每个时间序列信用特征在每个采集时间点对应的信用特征数据分箱编码结 果;
计算信用特征评分:运用逻辑回归分类器及信用评分卡模型,将受评企业 每个特征分箱编码结果转换为与其对应的信用特征评分分值;
计算参考序列:使用受评企业所在行业中各信用特征对应的信用评分最高 分值作为GRA参考序列;
生成信用评判值序列:将受评企业信用特征分值与参考序列标准化,计算 受评企业在各个采样时间点上每个信用特征分值与参考序列之间的灰色关联度, 形成受评企业信用评判值序列;
动态预测信用风险:以受评企业信用评判值序列为基础,使用 Holt-Winters三次指数平滑法拟合时间序列预测模型并仿真预测受评企业未 来三期的信用评分值。
作为优选,所述获取时间序列特征数据具体如下:
按照企业唯一标识,将属于同一受评企业的特征数据存储在同一集合中;
获取受评企业所在行业数据,存储为行业特征;其中,行业数据为该受评 企业依照GB/T 4754—2017标准对应的所在分类;
获取受评企业最近若干个采样时间点上的时间序列信用特征数据,存储为 时间序列信用特征;其中,最近若干个采样时间点为最近若干个季度,每个季 度的最后一天。
更优地,所述时间序列特征数据划分为五种类型的企业信用信息,具体如 下:
①、企业经营稳定性类:企业信用信息包括企业存续时长、企业历史变更 次数、企业经营异常次数、企业雇佣员工个数、企业公共缴费情况以及企业社 保与公积金缴纳金额;
②、企业履约状况类:企业信用信息包括企业历史贷款履约率、企业历史 履约金额、企业历史最大超期天数、企业商业往来履约率、企业合同履约率、 企业信贷类涉诉次数以及企业信贷类罚款金额;
③、企业产品信誉类:企业信用信息包括产品抽检合格率、电商产品好评 率、电商产品退货率以及店铺交易投诉比率;
④、企业财务状况类:企业信用信息包括净资产收益率、总资产报酬率、 资产负债率、速动比率、现金流负债比率、营业收入增长率以及净利润增长率;
⑤、企业纳税情况类:企业信用信息包括企业应纳税额、减免税额、增值 税已缴税额、所得税已交税额、税务开票金额、欠税金额以及税收违法与行政 处罚次数。
作为优选,构建所述基于决策树分类器与信息熵评价的特征分箱模型具体 如下:
(一)、以C4.5决策树分类器作为基础分箱模型;
(二)、使用信息熵Entrophy作为决策树分叉衡量标准;
(三)、利用python中的HyperOpt方法进行自动化的贝叶斯优化方法来调 整基础分箱模型参数,并以AUC值作为基础分箱模型的效果检验标准,生成基 于决策树分类器与信息熵评价的特征分箱模型;
(四)、将每个特征运用基于决策树分类器与信息熵评价的特征分箱模型产 生的决策树叶子节点分别对应的该特征最大值及最小值作为连续特征分箱截断 依据;
(五)、针对分箱后的特征数据,使用该特征所在分箱的WOE值作为编码代 替原始特征数据值;
其中,基于决策树分类器与信息熵评价的特征分箱模型训练具体如下:
(1)、获取归属于统一行业的中小企业样本集信用特征数据;
(2)、按照企业唯一标识,将属于同一企业的信用特征数据存储在同一集 合中;
(3)、按照信用特征数据分布特点,将属于同一集合的信用特征数据划分 为定量分析类与定性分析类;
(4)、对定性分析类信用特征进行定量化化处理;
(5)、将中小企业样本集中的特征逐个作为训练数据训练其对应的以信息 熵作为分类标准的C4.5决策树分类器;
(6)、通过HyperOpt方法调整模型参数;
(7)、判断是否满足分类性能要求:
①、若是,则执行步骤(8);
②、若否,则跳转至步骤(6);
(8)、输出每个特征对应的基于决策树分类器与信息熵评分的特征分箱模 型叶子节点作为分箱结果。
作为优选,所述计算信用特征评分具体如下:
将受评企业信用特征数据分箱编码结果依次输入逻辑回归分类器及信用评 分卡模型中,计算得到其对应的受评企业信用特征评分分值;其中,逻辑回归 分类器以加入10折交叉验证的逻辑回归算法作为数据拟合与预测模型,使用以 下评分卡转换公式计算出受评企业信用特征评分分值:
P0=A-Blog(θ0);
P0+PDO=A-Blog(2θ0);
其中,以odds表示好坏用户比率,根据预设的odds=Θ0时对应的分值P0与 比率翻番时对应的分数变化值PDO,能够解出式中的A、B:
Figure RE-GDA0002701158180000041
生成的信用评分分值具有如下表达形式:
score=A+B*ln(odds);
所述GRA参考序列具有如下形式:
Figure BDA0002666538640000051
其中,x0(k)表示该受评企业单所在行业选取的中小企业逻辑回归分类器及 信用评分卡模型样本集在建模时间点上特征k对应的最高得分值。
作为优选,所述受评企业信用特征分值与参考序列标准化采用极值标准化 法方法;其中,极值标准化方法的公式如下:
Figure BDA0002666538640000052
其中,x表示该信用特征的分值,xmin表示该信用特征在样本集中对应的最 小分值,xmax表示该信用特征在样本集中对应的最大分值;
所述受评企业在各个采样时间点上的信用评判值序列X的形式如下:
Figure BDA0002666538640000053
其中,比较序列矩阵中每个元素与参考序列的灰色关联度系数计算公式如 下:
Figure BDA0002666538640000054
其中,|x0(k)-xi(k)|表示在各个时间点上第i个受评企业对应的第k个特 征的评分分值与该受评企业对应的第k个特征的GRA参考值x0(k)之间的距离; minj∈M mink∈K|x0(k)-xi(k)|表示在各个时间点上所有受评企业的特征与其对 应的GRA参考值之间的最小距离,maxi∈M maxk∈K|x0(k)-xi(k)|表示在各个时 间点上所有受评企业的特征与其对应的GRA参考值之间的最大距离,它们共同 构成点集x0与x1的比较环境,含有点集拓扑信息;常数ρ称为分辨系数,ρ∈[0,1], 其作用在于调整比较环境大小;
基于受评企业灰色关联度系数结果,运用以下公式计算受评企业信用评判 值:
Figure BDA0002666538640000055
其中,λ(k)表示第k个特征对应的权重;
Figure BDA0002666538640000056
0≤λ(k)≤1。
更优地,所述动态预测信用风险具体如下:
将受评企业的基于采样时间点拟合的时间序列预测模型存储为模型文件, 将受评企业时间序列特征数据存储为时间序列数据集;
随着时间推移更新该数据集中的时间序列信用特征数据,并运用所述模型 文件与数据集持续更新预测受评企业信用状况的动态变化;
运用Holt-Winters三次指数平滑法动态预测所得受评企业未来第T期的信 用评分的表达式为:
Figure BDA0002666538640000061
Figure BDA0002666538640000062
Figure BDA0002666538640000063
Figure BDA0002666538640000064
其中,
Figure BDA0002666538640000065
表示第t周期的一次指数平滑值;
Figure BDA0002666538640000066
表示第t周期的二次指数平 滑值,
Figure BDA0002666538640000067
表示第t周期的三次指数平滑值。
一种基于GRA的动态中小企业信用评分系统,该系统包括,
时间序列特征数据获取模块,用于获取受评企业所在行业以及受评企业在 采样时间点上的时间序列信用特征数据;
特征数据分箱转换模块,用于运用基于决策树分类器与信息熵评价的特征 分箱模型,得到每个时间序列信用特征在每个采集时间点对应的信用特征数据 分箱编码结果;
信用特征评分计算模块,用于运用逻辑回归分类器及信用评分卡模型,将 受评企业每个特征分箱编码结果转换为与其对应的信用特征评分分值;
参考序列计算模块,用于使用受评企业所在行业中各信用特征对应的信用 评分最高分值作为GRA参考序列;
信用评判值序列生成模块,用于将受评企业信用特征分值与参考序列标准 化,计算受评企业在各个采样时间点上每个信用特征分值与参考序列之间的灰 色关联度,形成受评企业信用评判值序列;
信用风险动态预测模块,用于以受评企业信用评判值序列为基础,使用 Holt-Winters三次指数平滑法拟合时间序列预测模型并仿真预测受评企业未 来三期的信用评分值。
一种电子设备,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至 少一个处理器执行如上述的基于GRA的动态中小企业信用评分方法。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行 指令,当处理器执行所述计算机执行时,实现如上述的基于GRA的动态中小企 业信用评分方法。
本发明的基于GRA的动态中小企业信用评分方法及系统具有以下优点:
(一)针对中小企业信用状况难以准确评估的现状,本发明使用行业、经 营、履约、产品、财务、税务信息等信息作为中小企业信用特征,丰富了信息 来源,运用多源中小企业信息,综合分析中小企业发展趋势,以动态周期运动 的视角观察受评企业的信用状态,充分保障了中小企业信用评价结果随时间推 移的稳健性与准确性;同时,在评价中小企业信用状况、预测其未来信用变化 趋势时,运用本发明得到明晰、易于理解的评价结果,丰富了中小企业信用评 分的实现方法及其应用场景,保护中小企业投资者利益,提升普惠金融覆盖面, 促进企业之间商业合作积极性;
(二)本发明不仅仅考虑受评中小企业单个采样时间点上的信用特征数据, 而是采用能够刻画宏观经济环境与中小企业自身发展周期的时间序列信用特征 数据作为评价依据;
(三)本发明运用预设的、特别适用于中小企业信用特征数据处理的基于 决策树分类器与信息熵评价的特征分箱模型生成中小企业信用特征分箱,更加 适用于处理中小企业这一特定目标群体的信用特征数据的模型,克服了由于数 据质量问题造成的信用评价模型不准确问题;
(四)本发明克服了在孤立时间点上对受评企业进行评价的片面性,将可 能由宏观经济、企业生命周期影响产生的数据突变问题包含在中小企业信用评 分模型中;
(五)本发明通过运用GRA方法有效提升了中小企业信用评分结果的跨期 准确性,减少了数据获取、模型迭代调整的成本,提升了普惠金融服务效率;
(六)本发明能够通过指数平滑模型预测受评企业未来一段时间内的信用 变化,实现评分动态调整,在捕捉随时间变化的未知风险方面更加稳健与准确, 即能够动态预测受评企业未来一定时期内的信用走势,能够被用于贷前信用评 价、贷后信用监控等多种场合,提升决策效率;
(七)本发明基于具有严格理论依据的灰色关联分析法实现动态信用评分 的方法,在将受评企业信用风险特征作为评价依据的同时,在信用评价过程中 加入了几何拓扑信息,用来量化未知的外界风险;同时动态评分方法是一种事 前预测方法,其获得的评价结果具有前瞻性,并非仅仅根据更新的信用特征数 据重新计算评分,克服了评价结果滞后的问题;
(八)本发明采用了在行业内被广泛认可、完全可解释的逻辑回归分类器 及信用评分卡模型作为基础评价模型,这保障了信用评价结果的透明性,有利 于本发明的广泛运用与普及。
附图说明
下面结合附图对本发明进一步说明。
附图1为基于GRA的动态中小企业信用评分方法的流程框图;
附图2为基于决策树分类器与信息熵评价的特征分箱模型训练的流程框图。
具体实施方式
参照说明书附图和具体实施例对本发明的基于GRA的动态中小企业信用评 分方法及系统作以下详细地说明。
实施例1:
如附图1所示,本发明的基于GRA的动态中小企业信用评分方法,该方法 具体如下:
S1、获取时间序列特征数据:获取受评企业所在行业以及受评企业在/1个 采样时间点上的时间序列信用特征数据;
S2、分箱转换特征数据:运用基于决策树分类器与信息熵评价的特征分箱 模型,得到每个时间序列信用特征在每个采集时间点对应的信用特征数据分箱 编码结果;
S3、计算信用特征评分:运用逻辑回归分类器及信用评分卡模型,将受评 企业每个特征分箱编码结果转换为与其对应的信用特征评分分值;
S4、计算参考序列:使用受评企业所在行业中各信用特征对应的信用评分 最高分值作为GRA参考序列;
S5、生成信用评判值序列:将受评企业信用特征分值与参考序列标准化, 计算受评企业在各个采样时间点上每个信用特征分值与参考序列之间的灰色关 联度,形成受评企业信用评判值序列;
S6、动态预测信用风险:以受评企业信用评判值序列为基础,使用 Holt-Winters三次指数平滑法拟合时间序列预测模型并仿真预测受评企业未 来三期的信用评分值。
在本实施例中,步骤S1中获取时间序列特征数据的步骤具体如下:
S101、按照企业唯一标识,将属于同一受评企业的特征数据存储在同一集 合中;
S102、获取受评企业所在行业数据,存储为行业特征;其中,行业数据为 该受评企业依照GB/T 4754—2017标准对应的所在分类;
S103、获取受评企业最近10个采样时间点上的时间序列信用特征数据,存 储为时间序列信用特征;其中,最近10个采样时间点为最近10个季度,每个 季度的最后一天。
在本实施例中,将步骤S1中涉及的时间序列特征数据划分为五种类型的企 业信用信息,具体如下:
①、企业经营稳定性类:企业信用信息包括企业存续时长、企业历史变更 次数、企业经营异常次数、企业雇佣员工个数、企业公共缴费情况以及企业社 保与公积金缴纳金额;
②、企业履约状况类:企业信用信息包括企业历史贷款履约率、企业历史 履约金额、企业历史最大超期天数、企业商业往来履约率、企业合同履约率、 企业信贷类涉诉次数以及企业信贷类罚款金额;
③、企业产品信誉类:企业信用信息包括产品抽检合格率、电商产品好评 率、电商产品退货率以及店铺交易投诉比率;
④、企业财务状况类:企业信用信息包括净资产收益率、总资产报酬率、 资产负债率、速动比率、现金流负债比率、营业收入增长率以及净利润增长率;
⑤、企业纳税情况类:企业信用信息包括企业应纳税额、减免税额、增值 税已缴税额、所得税已交税额、税务开票金额、欠税金额以及税收违法与行政 处罚次数。
在本实施例中,步骤S2中将受评企业的时间序列信用特征数据输入到预设 的基于决策树分类器与信息熵评价的特征分箱模型中,转换为其对应的信用特 征数据分箱编码。其中,预设的基于决策树分类器与信息熵评价的特征分箱模 型的构建方法具体如下:
(一)、以C4.5决策树分类器作为基础分箱模型;
(二)、使用信息熵Entrophy作为决策树分叉衡量标准;
(三)、利用python中的HyperOpt方法进行自动化的贝叶斯优化方法来调 整基础分箱模型参数,并以AUC值作为基础分箱模型的效果检验标准,生成基 于决策树分类器与信息熵评价的特征分箱模型;
(四)、将每个特征运用基于决策树分类器与信息熵评价的特征分箱模型产 生的决策树叶子节点分别对应的该特征最大值及最小值作为连续特征分箱截断 依据;
(五)、针对分箱后的特征数据,使用该特征所在分箱的WOE值作为编码代 替原始特征数据值;
其中,如附图2所示,基于决策树分类器与信息熵评价的特征分箱模型训 练具体如下:
(1)、获取归属于统一行业的中小企业样本集信用特征数据;
(2)、按照企业唯一标识,将属于同一企业的信用特征数据存储在同一集 合中;
(3)、按照信用特征数据分布特点,将属于同一集合的信用特征数据划分 为定量分析类与定性分析类;
(4)、对定性分析类信用特征进行定量化处理;
(5)、将中小企业样本集中的特征逐个作为训练数据训练其对应的以信息 熵作为分类标准的C4.5决策树分类器;
(6)、通过HyperOpt方法调整模型参数;
(7)、判断是否满足分类性能要求:
①、若是,则执行步骤(8);
②、若否,则跳转至步骤(6);
(8)、输出每个特征对应的基于决策树分类器与信息熵评分的特征分箱模 型叶子节点作为分箱结果。
在本实施例中,步骤S3中计算信用特征评分具体如下:
将受评企业信用特征数据分箱编码结果依次输入逻辑回归分类器及信用评 分卡模型中,计算得到其对应的受评企业信用特征评分分值;其中,逻辑回归 分类器以加入10折交叉验证的逻辑回归算法作为数据拟合与预测模型,使用以 下评分卡转换公式计算出受评企业信用特征评分分值:
P0=A-Blog(θ0);
P0+PDO=A-Blog(2θ0);
其中,以odds表示好坏用户比率,根据预设的odds=Θ0时对应的分值P0与 比率翻番时对应的分数变化值PDO,能够解出式中的A、B:
Figure RE-GDA0002701158180000101
生成的信用评分分值具有如下表达形式:
score=A+B*ln(odds);
在本实施例中,步骤S4中GRA参考序列具有如下形式
Figure BDA0002666538640000112
其中,x0(k)表示该受评企业单所在行业选取的中小企业逻辑回归分类器及 信用评分卡模型样本集在建模时间点上特征k对应的最高得分值。
在本实施例中,为使受评企业信用特征分值与参考序列能够评价计算,步 骤S5中受评企业信用特征分值与参考序列标准化采用极值标准化法方法;其中, 极值标准化方法的公式如下:
Figure BDA0002666538640000113
其中,x表示该信用特征的分值,xmin表示该信用特征在样本集中对应的最 小分值,xmax表示该信用特征在样本集中对应的最大分值;
在本实施例中,步骤S5中运用受评企业在各个采样时间点上的各个信用特 征评分分值逐个构成比较序列,并计算比较序列矩阵中每个元素与参考序列的 灰色关联度系数,得出受评企业信用评判值序列;其中,受评企业信用评判值 序列X的形式如下:
Figure BDA0002666538640000114
其中,比较序列矩阵中每个元素与参考序列的灰色关联度系数计算公式如 下:
Figure BDA0002666538640000115
其中,|x0(k)-xi(k)|表示在各个时间点上第i个受评企业对应的第k个特 征的评分分值与该受评企业对应的第k个特征的GRA参考值x0(k)之间的距离;minj∈M mink∈K|x0(k)-xi(k)|表示在各个时间点上所有受评企业的特征与其对 应的GRA参考值之间的最小距离,maxi∈M maxk∈K|x0(k)-xi(k)|表示在各个时 间点上所有受评企业的特征与其对应的GRA参考值之间的最大距离,它们共同 构成点集x0与x1的比较环境,含有点集拓扑信息;常数ρ称为分辨系数,ρ∈[0,1], 其作用在于调整比较环境大小;其中,在本实施例中,ρ=0.5。
基于受评企业灰色关联度系数结果,运用以下公式计算受评企业信用评判 值:
Figure BDA0002666538640000121
其中,λ(k)代表第k个特征对应的权重,
Figure BDA0002666538640000122
0≤λ(k)≤1。
在本实施例中,步骤S6中动态预测信用风险具体如下:
S601、将受评企业的基于采样时间点拟合的时间序列预测模型存储为模型 文件,将受评企业时间序列特征数据存储为时间序列数据集;
S602、随着时间推移更新该数据集中的时间序列信用特征数据,并运用所 述模型文件与数据集持续更新预测受评企业信用状况的动态变化;
S603、运用Holt-Winters三次指数平滑法动态预测所得受评企业未来第T 期的信用评分的表达式为:
Figure BDA0002666538640000123
Figure BDA0002666538640000124
Figure BDA0002666538640000125
Figure BDA0002666538640000126
其中,
Figure BDA0002666538640000127
代表第t周期的一次指数平滑值;
Figure BDA0002666538640000128
代表第t周期的二次指数平 滑值,
Figure BDA0002666538640000129
代表第t周期的三次指数平滑值。
实施例2:
本发明的基于GRA的动态中小企业信用评分系统,该系统包括,
时间序列特征数据获取模块,用于获取受评企业所在行业以及受评企业在 采样时间点上的时间序列信用特征数据;
特征数据分箱转换模块,用于运用基于决策树分类器与信息熵评价的特征 分箱模型,得到每个时间序列信用特征在每个采集时间点对应的信用特征数据 分箱编码结果;
信用特征评分计算模块,用于运用逻辑回归分类器及信用评分卡模型,将 受评企业每个特征分箱编码结果转换为与其对应的信用特征评分分值;
参考序列计算模块,用于使用受评企业所在行业中各信用特征对应的信用 评分最高分值作为GRA参考序列;
信用评判值序列生成模块,用于将受评企业信用特征分值与参考序列标准 化,计算受评企业在各个采样时间点上每个信用特征分值与参考序列之间的灰 色关联度,形成受评企业信用评判值序列;
信用风险动态预测模块,用于以受评企业信用评判值序列为基础,使用 Holt-Winters三次指数平滑法拟合时间序列预测模型并仿真预测受评企业未 来三期的信用评分值。
实施例3:
本发明实施例还提供了一种电子设备,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至 少一个处理器执行本发明任一实施例中的基于GRA的动态中小企业信用评分方 法。
实施例4:
本发明实施例还提供了一种计算机可读存储介质,其中存储有多条指令, 指令由处理器加载,使处理器执行本发明任一实施例中的基于GRA的动态中小 企业信用评分方法。具体地,可以提供配有存储介质的系统或者装置,在该存 储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该 系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序 代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何 一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的 一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如 CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-R基于GRA的动态中小企业信用评分方 法及系统M、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可 以由通信网络从服务器计算机上下载程序代码。
此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且 可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全 部的实际操作,从而实现上述实施例中任意一项实施例的功能。
此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的 扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储 器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执 行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其 限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术 人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者 对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相 应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种基于GRA的动态中小企业信用评分方法,其特征在于,该方法具体如下:
获取时间序列特征数据:获取受评企业所在行业以及受评企业在采样时间点上的时间序列信用特征数据;
分箱转换特征数据:运用基于决策树分类器与信息熵评价的特征分箱模型,得到每个时间序列信用特征在每个采集时间点对应的信用特征数据分箱编码结果;
计算信用特征评分:运用逻辑回归分类器及信用评分卡模型,将受评企业每个特征分箱编码结果转换为与其对应的信用特征评分分值;
计算参考序列:使用受评企业所在行业中各信用特征对应的信用评分最高分值作为GRA参考序列;
生成信用评判值序列:将受评企业信用特征分值与参考序列标准化,计算受评企业在各个采样时间点上每个信用特征分值与参考序列之间的灰色关联度,形成受评企业信用评判值序列;
动态预测信用风险:以受评企业信用评判值序列为基础,使用Holt-Winters三次指数平滑法拟合时间序列预测模型并仿真预测受评企业未来三期的信用评分值。
2.根据权利要求1所述的基于GRA的动态中小企业信用评分方法,其特征在于,所述获取时间序列特征数据具体如下:
按照企业唯一标识,将属于同一受评企业的特征数据存储在同一集合中;
获取受评企业所在行业数据,存储为行业特征;
获取受评企业最近若干个采样时间点上的时间序列信用特征数据,存储为时间序列信用特征;其中,最近若干个采样时间点为最近若干个季度,每个季度的最后一天。
3.根据权利要求1或2所述的基于GRA的动态中小企业信用评分方法,其特征在于,所述时间序列特征数据划分为五种类型的企业信用信息,具体如下:
①、企业经营稳定性类:企业信用信息包括企业存续时长、企业历史变更次数、企业经营异常次数、企业雇佣员工个数、企业公共缴费情况以及企业社保与公积金缴纳金额;
②、企业履约状况类:企业信用信息包括企业历史贷款履约率、企业历史履约金额、企业历史最大超期天数、企业商业往来履约率、企业合同履约率、企业信贷类涉诉次数以及企业信贷类罚款金额;
③、企业产品信誉类:企业信用信息包括产品抽检合格率、电商产品好评率、电商产品退货率以及店铺交易投诉比率;
④、企业财务状况类:企业信用信息包括净资产收益率、总资产报酬率、资产负债率、速动比率、现金流负债比率、营业收入增长率以及净利润增长率;
⑤、企业纳税情况类:企业信用信息包括企业应纳税额、减免税额、增值税已缴税额、所得税已交税额、税务开票金额、欠税金额以及税收违法与行政处罚次数。
4.根据权利要求1所述的基于GRA的动态中小企业信用评分方法,其特征在于,构建所述基于决策树分类器与信息熵评价的特征分箱模型具体如下:
(一)、以C4.5决策树分类器作为基础分箱模型;
(二)、使用信息熵Entrophy作为决策树分叉衡量标准;
(三)、利用python中的HyperOpt方法进行自动化的贝叶斯优化方法来调整基础分箱模型参数,并以AUC值作为基础分箱模型的效果检验标准,生成基于决策树分类器与信息熵评价的特征分箱模型;
(四)、将每个特征运用基于决策树分类器与信息熵评价的特征分箱模型产生的决策树叶子节点分别对应的该特征最大值及最小值作为连续特征分箱截断依据;
(五)、针对分箱后的特征数据,使用该特征所在分箱的WOE值作为编码代替原始特征数据值;
其中,基于决策树分类器与信息熵评价的特征分箱模型训练具体如下:
(1)、获取归属于统一行业的中小企业样本集信用特征数据;
(2)、按照企业唯一标识,将属于同一企业的信用特征数据存储在同一集合中;
(3)、按照信用特征数据分布特点,将属于同一集合的信用特征数据划分为定量分析类与定性分析类;
(4)、对定性分析类信用特征进行定量化处理;
(5)、将中小企业样本集中的特征逐个作为训练数据训练其对应的以信息熵作为分类标准的C4.5决策树分类器;
(6)、通过HyperOpt方法调整模型参数;
(7)、判断是否满足分类性能要求:
①、若是,则执行步骤(8);
②、若否,则跳转至步骤(6);
(8)、输出每个特征对应的基于决策树分类器与信息熵评分的特征分箱模型叶子节点作为分箱结果。
5.根据权利要求1所述的基于GRA的动态中小企业信用评分方法,其特征在于,所述计算信用特征评分具体如下:
将受评企业信用特征数据分箱编码结果依次输入逻辑回归分类器及信用评分卡模型中,计算得到其对应的受评企业信用特征评分分值;其中,逻辑回归分类器以加入10折交叉验证的逻辑回归算法作为数据拟合与预测模型,使用以下评分卡转换公式计算出受评企业信用特征评分分值:
P0=A-Blog(θ0);
P0+PDO=A-Blog(2θ0);
其中,以odds表示好坏用户比率,根据预设的odds=Θ0时对应的分值P0与比率翻番时对应的分数变化值PDO,能够解出式中的A、B:
Figure RE-FDA0002701158170000041
生成的信用评分分值具有如下表达形式:
score=A+B*ln(odds);
所述GRA参考序列具有如下形式:
Figure RE-FDA0002701158170000042
其中,x0(k)表示该受评企业单所在行业选取的中小企业逻辑回归分类器及信用评分卡模型样本集在建模时间点上特征k对应的最高得分值。
6.根据权利要求1所述的基于GRA的动态中小企业信用评分方法,其特征在于,所述受评企业信用特征分值与参考序列标准化采用极值标准化法方法;其中,极值标准化方法的公式如下:
Figure FDA0002666538630000044
其中,x表示该信用特征的分值,xmin表示该信用特征在样本集中对应的最小分值,xmax表示该信用特征在样本集中对应的最大分值;
所述受评企业在各个采样时间点上的信用评判值序列X的形式如下:
Figure FDA0002666538630000051
其中,比较序列矩阵中每个元素与参考序列的灰色关联度系数计算公式如下:
Figure FDA0002666538630000052
其中,|x0(k)-xi(k)|表示在各个时间点上第i个受评企业对应的第k个特征的评分分值与该受评企业对应的第k个特征的GRA参考值x0(k)之间的距离;minj∈Mmink∈K|x0(k)-xi(k)|表示在各个时间点上所有受评企业的特征与其对应的GRA参考值之间的最小距离;maxi∈ Mmaxk∈K|x0(k)-xi(k)|表示在各个时间点上所有受评企业的特征与其对应的GRA参考值之间的最大距离,共同构成点集x0与x1的比较环境,含有点集拓扑信息;常数ρ称为分辨系数,ρ∈[0,1],其作用在于调整比较环境大小;
基于受评企业灰色关联度系数结果,运用以下公式计算受评企业信用评判值:
Figure FDA0002666538630000053
其中,λ(k)表示第k个特征对应的权重;
Figure FDA0002666538630000054
0≤λ(k)≤1。
7.根据权利要求1-6中任一所述的基于GRA的动态中小企业信用评分方法,其特征在于,所述动态预测信用风险具体如下:
将受评企业的基于采样时间点拟合的时间序列预测模型存储为模型文件,将受评企业时间序列特征数据存储为时间序列数据集;
随着时间推移更新该数据集中的时间序列信用特征数据,并运用所述模型文件与数据集持续更新预测受评企业信用状况的动态变化;
运用Holt-Winters三次指数平滑法动态预测所得受评企业未来第T期的信用评分的表达式为:
Figure FDA0002666538630000061
Figure FDA0002666538630000062
Figure FDA0002666538630000063
Figure FDA0002666538630000064
其中,
Figure FDA0002666538630000065
表示第t周期的一次指数平滑值;
Figure FDA0002666538630000066
表示第t周期的二次指数平滑值,
Figure FDA0002666538630000067
表示第t周期的三次指数平滑值。
8.一种基于GRA的动态中小企业信用评分系统,其特征在于,该系统包括,
时间序列特征数据获取模块,用于获取受评企业所在行业以及受评企业在采样时间点上的时间序列信用特征数据;
特征数据分箱转换模块,用于运用基于决策树分类器与信息熵评价的特征分箱模型,得到每个时间序列信用特征在每个采集时间点对应的信用特征数据分箱编码结果;
信用特征评分计算模块,用于运用逻辑回归分类器及信用评分卡模型,将受评企业每个特征分箱编码结果转换为与其对应的信用特征评分分值;
参考序列计算模块,用于使用受评企业所在行业中各信用特征对应的信用评分最高分值作为GRA参考序列;
信用评判值序列生成模块,用于将受评企业信用特征分值与参考序列标准化,计算受评企业在各个采样时间点上每个信用特征分值与参考序列之间的灰色关联度,形成受评企业信用评判值序列;
信用风险动态预测模块,用于以受评企业信用评判值序列为基础,使用Holt-Winters三次指数平滑法拟合时间序列预测模型并仿真预测受评企业未来三期的信用评分值。
9.一种电子设备,其特征在于,包括:存储器和至少一个处理器;
其中,所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至7任一项所述的基于GRA的动态中小企业信用评分方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行时,实现如权利要求1至7中所述的基于GRA的动态中小企业信用评分方法。
CN202010920418.XA 2020-09-04 2020-09-04 基于gra的动态中小企业信用评分方法及系统 Active CN112053233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010920418.XA CN112053233B (zh) 2020-09-04 2020-09-04 基于gra的动态中小企业信用评分方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010920418.XA CN112053233B (zh) 2020-09-04 2020-09-04 基于gra的动态中小企业信用评分方法及系统

Publications (2)

Publication Number Publication Date
CN112053233A true CN112053233A (zh) 2020-12-08
CN112053233B CN112053233B (zh) 2023-11-14

Family

ID=73608292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010920418.XA Active CN112053233B (zh) 2020-09-04 2020-09-04 基于gra的动态中小企业信用评分方法及系统

Country Status (1)

Country Link
CN (1) CN112053233B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112785427A (zh) * 2021-03-15 2021-05-11 国网青海省电力公司西宁供电公司 基于电力数据的企业信用分析系统
CN112861093A (zh) * 2021-04-25 2021-05-28 上海派拉软件股份有限公司 访问数据的验证方法、装置、设备及存储介质
CN112990946A (zh) * 2021-03-31 2021-06-18 建信金融科技有限责任公司 一种企业违约预测方法、装置、介质及电子设备
CN113129133A (zh) * 2021-05-17 2021-07-16 无锡航吴科技有限公司 一种融资平台企业性质分类方法和系统
CN113240224A (zh) * 2021-02-05 2021-08-10 山东齐信数据服务有限公司 一种针对政府采购的履约能力的评估方法与系统
CN114841802A (zh) * 2022-07-04 2022-08-02 天津金城银行股份有限公司 一种复合周期信贷风控策略生成方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629296A (zh) * 2012-02-29 2012-08-08 浙江工商大学 一种基于灰色模糊的企业信用评价方法
CN106779457A (zh) * 2016-12-29 2017-05-31 深圳微众税银信息服务有限公司 一种企业信用评估方法及系统
CN109754157A (zh) * 2018-11-30 2019-05-14 畅捷通信息技术股份有限公司 一种反映企业健康经营、融资增信的评分方法及系统
CN109785003A (zh) * 2019-01-17 2019-05-21 四川骏逸富顿科技有限公司 一种药品零售行业药品销售预测系统及方法
CN110322089A (zh) * 2018-03-30 2019-10-11 宗略投资(上海)有限公司 企业信用风险评估方法及其系统
CN110909963A (zh) * 2018-09-14 2020-03-24 中国软件与技术服务股份有限公司 一种信用评分卡模型训练方法及纳税人非正常风险评估方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102629296A (zh) * 2012-02-29 2012-08-08 浙江工商大学 一种基于灰色模糊的企业信用评价方法
CN106779457A (zh) * 2016-12-29 2017-05-31 深圳微众税银信息服务有限公司 一种企业信用评估方法及系统
CN110322089A (zh) * 2018-03-30 2019-10-11 宗略投资(上海)有限公司 企业信用风险评估方法及其系统
CN110909963A (zh) * 2018-09-14 2020-03-24 中国软件与技术服务股份有限公司 一种信用评分卡模型训练方法及纳税人非正常风险评估方法
CN109754157A (zh) * 2018-11-30 2019-05-14 畅捷通信息技术股份有限公司 一种反映企业健康经营、融资增信的评分方法及系统
CN109785003A (zh) * 2019-01-17 2019-05-21 四川骏逸富顿科技有限公司 一种药品零售行业药品销售预测系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LIU XIU-YING等: "The application of the grey relational analysis in the credit evaluation of group enterprises", 《2009 IEEE INTERNATIONAL CONFERENCE ON GREY SYSTEMS AND INTELLIGENT SERVICES (GSIS 2009)》, pages 236 - 241 *
安玉琢等: "基于决策树技术的企业信用风险评估", 河北工业大学学报, vol. 35, no. 06, pages 64 - 68 *
彭梦娇: "基于大数据方法的客户信用评估模式研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》, no. 12, pages 152 - 572 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113240224A (zh) * 2021-02-05 2021-08-10 山东齐信数据服务有限公司 一种针对政府采购的履约能力的评估方法与系统
CN112785427A (zh) * 2021-03-15 2021-05-11 国网青海省电力公司西宁供电公司 基于电力数据的企业信用分析系统
CN112785427B (zh) * 2021-03-15 2024-04-26 国网青海省电力公司西宁供电公司 基于电力数据的企业信用分析系统
CN112990946A (zh) * 2021-03-31 2021-06-18 建信金融科技有限责任公司 一种企业违约预测方法、装置、介质及电子设备
CN112990946B (zh) * 2021-03-31 2024-05-14 建信金融科技有限责任公司 一种企业违约预测方法、装置、介质及电子设备
CN112861093A (zh) * 2021-04-25 2021-05-28 上海派拉软件股份有限公司 访问数据的验证方法、装置、设备及存储介质
CN112861093B (zh) * 2021-04-25 2021-09-10 上海派拉软件股份有限公司 访问数据的验证方法、装置、设备及存储介质
CN113129133A (zh) * 2021-05-17 2021-07-16 无锡航吴科技有限公司 一种融资平台企业性质分类方法和系统
CN113129133B (zh) * 2021-05-17 2023-11-21 无锡航吴科技有限公司 一种融资平台企业性质分类方法和系统
CN114841802A (zh) * 2022-07-04 2022-08-02 天津金城银行股份有限公司 一种复合周期信贷风控策略生成方法和装置

Also Published As

Publication number Publication date
CN112053233B (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
Bertomeu et al. Using machine learning to detect misstatements
US20220343432A1 (en) Machine learning architecture for risk modelling and analytics
CN112053233A (zh) 基于gra的动态中小企业信用评分方法及系统
Amani et al. Data mining applications in accounting: A review of the literature and organizing framework
US20060200395A1 (en) Stock portfolio selection device, stock portfolio selection method and medium storing stock portfolio selection program
Karminsky et al. Extended modeling of banks’ credit ratings
CN111783829A (zh) 一种基于多标签学习的财务异常检测方法及装置
CN107133862A (zh) 动态产生增强信用评估的详细交易支付经历的方法和系统
WO2021257610A1 (en) Time series forecasting and visualization methods and systems
CN111626855A (zh) 债券信用利差预测方法及系统
Wei A machine learning algorithm for supplier credit risk assessment based on supply chain management
Kothandapani Applications of Robotic Process Automation in Quantitative Risk Assessment in Financial Institutions
US11995667B2 (en) Systems and methods for business analytics model scoring and selection
US20170004521A1 (en) Systems and methods for generating industry outlook scores
Niknya et al. Financial distress prediction of Tehran Stock Exchange companies using support vector machine
WO2018005708A1 (en) Systems and methods for generating industry outlook scores
Silva et al. Portfolio optimization based on the pre-selection of stocks by the Support Vector Machine model
CA3160715A1 (en) Systems and methods for business analytics model scoring and selection
Prorokowski IFRS 9 in credit risk modelling
Efat et al. Trend estimation of stock market: an intelligent decision system
Thanathamathee et al. Discovering Future Earnings Patterns through FP-Growth and ECLAT Algorithms with Optimized Discretization
Dias An equity-credit hybrid model for asset correlations
Alfonso-Sánchez et al. Optimizing credit limit adjustments under adversarial goals using reinforcement learning
KR20190093727A (ko) 지능형 징수 관리 시스템 및 지능형 징수 관리 방법
Touvras An Analytics Process for Forecasting Expected Credit Losses for the Lifetime of Loans: auto loan portfolios

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant