CN113642922A - 一种中小微企业信用评估方法及装置 - Google Patents
一种中小微企业信用评估方法及装置 Download PDFInfo
- Publication number
- CN113642922A CN113642922A CN202111003576.XA CN202111003576A CN113642922A CN 113642922 A CN113642922 A CN 113642922A CN 202111003576 A CN202111003576 A CN 202111003576A CN 113642922 A CN113642922 A CN 113642922A
- Authority
- CN
- China
- Prior art keywords
- credit
- credit evaluation
- enterprise
- index
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请实施例提供了一种中小微企业信用评估方法及装置,用以解决现有的中小微企业信用评估方法得到的评估结果不全面的技术问题。方法包括:确定待评估企业的企业类型,并根据所述企业类型确定信用评估模型;其中,所述企业类型至少包括中型企业以及小微型企业;获取所述待评估企业的信用评估数据,并通过所述信用评估数据生成所述信用评估模型对应的信用评估指标;将所述信用评估指标输入至所述信用评估模型中,以得到所述待评估企业的信用评分。本申请通过上述方法从多源数据中进行指标筛选,模型结合模糊层次分析算法以及逻辑回归算法这两种算法,全方面对企业信用进行评估,保证了评估结果的全面性及准确性。
Description
技术领域
本申请涉及信用评估技术领域,尤其涉及一种中小微企业信用评估方法及装置。
背景技术
信用风险是中小微型企业贷款过程中的主要风险,其在金融市场上是客观存在的。有效评估信用风险并对其进行有效管理规避是每家企业的核心目标。但企业与金融机构之间存在的信息不对称的问题,使企业陷入融资难的困境。建立合理的风险评估体系,有效评估企业的信用是解决问题的关键。
目前,对于中小微型企业信用的研究以单一的综合评价方法为主,这种方法容易导致得到的评价结果是片面的。
发明内容
本申请实施例提供了一种中小微企业信用评估方法及装置,用以解决现有的中小微企业信用评估方法得到的评估结果不全面的技术问题。
一方面,本申请实施例提供了一种中小微企业信用评估方法,包括:确定待评估企业的企业类型,并根据所述企业类型确定信用评估模型;其中,所述企业类型至少包括中型企业以及小微型企业;获取所述待评估企业的信用评估数据,并通过所述信用评估数据生成所述信用评估模型对应的信用评估指标;将所述信用评估指标输入至所述信用评估模型中,以得到所述待评估企业的信用评分。
在本申请的一种可能实现方式中,在根据所述企业类型确定信用评估模型之前,所述方法还包括:获取所述中型企业的信用评估数据,并基于所述信用评估数据建立适用于所述中型企业的信用评估模型;以及,获取所述小微型企业的信用评估数据,并基于所述信用评估数据建立适用于所述小微型企业的信用评估模型;其中,所述信用评估数据至少包括以下任一项或者多项:企业工商数据、纳税数据、项目合作数据、司法数据以及财务数据。
在本申请的一种可能实现方式中,基于所述信用评估数据建立适用于所述中型企业的信用评估模型,具体包括:构建所述中型企业的信用评估模型对应的信用评估指标体系;其中,所述信用评估指标体系中包括若干信用评估指标;所述信用评估指标至少包括以下任一项或者多项:企业偿债能力指标、盈利能力指标、发展能力指标、经营能力指标以及履约能力指标;获取所述信用评估指标体系对应的信用评估数据,并对所述信用评估数据进行预处理;通过预处理后的所述信用评估数据构建样本集;其中,所述样本集与所述信用评估指标相对应;基于所述样本集,通过模糊层次分析算法与逻辑回归算法进行建模。
在本申请的一种可能实现方式中,在通过预处理后的所述信用评估数据构建样本集之后,所述方法还包括:对所述信用评估指标进行筛选,具体包括:确定各个所述信用评估指标对应的样本集中同值及缺失值的个数,并在所述个数大于第一预设阈值的情况下,剔除所述信用评估指标,以完成所述信用评估指标的一轮筛选;对一轮筛选后的所述信用评估指标进行IV值计算;其中,所述IV值用于指示所述信用评估指标对所述信用评分的影响程度;剔除小于第二预设阈值的所述IV值对应的信用评估指标,以完成所述信用评估指标的二轮筛选;对二轮筛选后的所述信用评估指标进行多元共线性检验,并剔除检验结果中的VIF值大于第三预设阈值的信用评估指标,以完成所述信用评估指标的三轮筛选;对三轮筛选后的所述信用评估指标进行P值显著性检验,并保留P值小于第四预设阈值的所述信用评估指标,以完成所述信用评估指标的筛选过程;通过筛选得到的所述信用评估指标对应的样本集,对所述信用评估模型进行训练。
在本申请的一种可能实现方式中,对所述信用评估模型进行训练,具体包括:基于模糊层次分析算法建立层次分析结构;其中,所述层次分析结构包括目标层、准则层以及指标层;所述目标层用于指示企业信用评估结果,所述准则层包括所述信用评估指标,所述指标层用于指示所述信用评估指标对应的二级指标;所述二级指标基于所述待评估企业的业务数据确定;构建模糊判断矩阵,并对所述模糊判断矩阵进行一致性检验;其中,所述模糊判断矩阵中的元素用于指示所述信用评估指标对应的重要性分值;在所述模糊判断矩阵通过所述一致性检验之后,计算所述模糊判断矩阵的对应权重,并基于所述对应权重,通过预设标准分值,计算得到所述信用评估指标分别对应的综合分值。
在本申请的一种可能实现方式中,在得到所述信用评估指标分别对应的综合分值之后,所述方法还包括:将所述信用评估指标对应的样本集以及所述信用评估指标分别对应的综合分值,输入至逻辑回归算法中;通过AIC准则进行逐步回归,以完成所述信用评估模型的训练过程。
在本申请的一种可能实现方式中,所述方法还包括:将所述逐步回归过程返回的概率值,转换成标准评分;通过所述信用评估模型,输出所述标准评分。
在本申请的一种可能实现方式中,将所述信用评估指标输入至所述信用评估模型中,以得到所述待评估企业的信用评分,具体包括:将所述信用评估指标输入至所述信用评估模型的模糊层次分析算法中,得到所述信用评估指标分别对应的评分;将所述信用评估指标分别对应的评分输入至所述信用评估模型的逻辑回归算法中,得到所述待评估企业的信用评分。
在本申请的一种可能实现方式中,在得到所述待评估企业的信用评分之后,所述方法还包括:将所述信用评分与预设信用分值进行比较;其中,所述预设信用分值为所述中型企业或者所述小微型企业所能接受的最小信用分值;在所述信用评分低于所述预设信用分值的情况下,触发风险应对策略。
另一方面,本申请实施例还提供了一种中小微企业信用评估装置,包括:确定模块,用于确定待评估企业的企业类型,并根据所述企业类型确定信用评估模型;其中,所述企业类型至少包括中型企业以及小微型企业;获取模块,用于获取所述待评估企业的信用评估数据,并通过所述信用评估数据生成所述信用评估模型对应的信用评估指标;评估模块,用于将所述信用评估指标输入至所述信用评估模型中,以得到所述待评估企业的信用评分。
本申请实施例提供的一种中小微企业信用评估方法及装置,具有以下有益效果:
(1)相较于单一数据源的企业信用评估方法,本申请实施例基于企业的多源数据融合,包含全面丰富的数据维度和评估指标,从多源数据中进行指标筛选,实现全方面对企业信用进行评估。
(2)提出客群分层,针对中小微型企业之间的差异将企业区分为中型企业和小微型企业分别建立评估模型,解决了中型企业和小微型企业侧重点不同的问题,使得评估更加准确。
(3)相较于传统的专家评价法、Z-Score模型、层次分析法评估方法,本申请实施例旨在将两种不同原理的评估方法(模糊层次分析法以及逻辑回归法)进行结合,并根据企业实际情况构建信用评估模型,在一定程度上合理的评价企业的信用风险,克服了单一的综合评价方法容易导致评价结果片面的技术问题。
(4)应用大数据技术进行信用评估分析,根据企业海量的数据丰富的企业评估指标以及多种算法的融合,本申请实施例提出的评估方法会更适用于大数据海量企业数据的风控建模,其应用前景极为广阔。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种中小微企业信用评估方法流程图;
图2为本申请实施例提供的建立信用评估模型的流程图;
图3为本申请实施例提供的一种中小微企业信用评估装置内部结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
中小微型企业生命周期较短,信息透明度差,财务报表披露不完善,基本上企业主个人信用情况决定了这家企业的信用程度。另外中小微型企业实物财富较少,物偿债能力不足,违约成本较低。总之,中小微型企业信用积累不足,但其成长动力较强劲,对提供信用保证有很大需求。与中型企业相比,小微企业有很多不同的特征,既有优势也有劣势。这就说明了一般的中型企业的信用评估结果可能不适合小微型企业,因此本申请实施例中将中型与小微型企业分开构建信用评估模型。
目前的商业银行信用风险文献很多,大部分采取定性、定量相结合的方法。由于起步发展较早,已基本形成了一套较为系统完善的理论结构体系。从信用评级体系看,常见的信用风险评价模型主要有:专家评价法、Z-Score模型、层次分析法、KMV模型以及Logistic回归模型。而本申请实施例将模糊层次分析法与逻辑回归算法结合,构建信用评估模型。
模糊层次分析法(Fuzzy Analytie Hierarchy Process,FAHP)是将层次分析法和模糊数学理论相结合针对多因素非定量化的研究对象做出符合其特点的定性与定量化分析的一种分析方法,主要解决多指标、多因素问题的综合评判。模糊层次分析法既有AHP法的优点可以系统化层次化的定量化分析又能够避免层次分析法的判断矩阵因人为的主观性因素无法达到准确的一致性问题。对复杂问题进行解构分析,将其分解成组成因素的组合,然后按不同的支配关系分级别构建有层次的结构,运用两两比较的方式将各组成因素的重要性进行确定,最后结合专家的判断对各个因素的相对重要性进行总排序。模糊层次分析法主要用于不同权重风险组合、多层次的风险评价,可以对有关模糊因素的对象系统进行综合评价,同时对评价因素多、结构层次复杂的对象系统更加适宜。而逻辑回归模型作为一种常见的构建多元变量模型的方法,操作简单,可解释性强,在结果预测方面具有较高的精准度,利用Logistic回归模型可以用来度量企业的信用风险。
下面通过附图对本申请实施例提出的技术方案进行详细的说明。
图1为本申请实施例提供的一种中小微企业信用评估方法流程图。如图1所示,本申请实施例提供的评估方法,主要包括以下执行步骤:
步骤101、确定待评估企业的企业类型,并根据所述企业类型确定信用评估模型。
步骤102、获取所述待评估企业的信用评估数据,并通过所述信用评估数据生成所述信用评估模型对应的信用评估指标。
步骤103、将所述信用评估指标输入至所述信用评估模型中,以得到所述待评估企业的信用评分。
本申请实施例提出的中小微型企业的信用评估方法,在执行之前,首先建立好了针对中型企业以及小微型企业的信用评估模型,具体的建立过程参见附图2及相关描述,本申请实施例在此不作赘述。
进一步地,在某一企业想要进行信用评估时,本申请实施例首先会确定该企业输入中型企业还是属于小微型企业,具体的确定依据是现有的企业等级划分依据,且具体的确定参数主要是该企业的盈利数据、生产数据等生产经营数据。在确定出待评估企业的类型之后,就可以针对该企业的类型,选用与类型相对应的信用评估模型,以保证信用评估结果的准确性。
然后,在确定好待评估企业进行信用评估所使用的信用评估模型之后,根据该模型所需要的评估指标去获取待评估企业的信用评估数据,并将得到的信用评估数据依据上述信用评估指标输入至模型中。需要说明的是,本申请实施例中的信用评估指标指的是对待评估企业进行信用评估时所考量的内容,而信用评估数据则是上述考量内容下对应的企业数据。
最后,通过信用评估模型输出待评估企业的信用评分。在本申请的一个或多个实施例中,在得到待评估企业的信用评分之后,会将该信用评分与预设的信用分值进行对比,如果该待评估企业的信用评分低于预设信用分值,则说明该待评估企业的信用严重不良,存在信用风险。此时,会针对该待评估企业启动风险应对策略。需要说明的是,上述预设信用分值是该待评估企业所能被接收的最小信用分值。
还需要说明的是,本申请实施例中采用的信用评估模型是结合了两种算法的模型,因此,在将信用评估指标输入到该模型中时,首先是将上述信用评估指标输入至信用评估模型的第一层算法(模糊层次分析算法)中,得到信用评估指标分别对应的评分;然后再将信用评估指标分别对应的评分输入至信用评估模型的第二层算法(逻辑回归算法)中,最终得到待评估企业的信用评分。至于信用评估指标在上述两个算法中经历了怎样的计算过程,可以参见附图2及其相关部分描述,本申请实施例在此不作赘述。
图2为本申请实施例提供的建立信用评估模型的流程图。如图2所示,本申请实施例中模型的建立,主要包括以下过程:
过程1、客群分层
在模型建立之前,首先将若干个样本企业划分为中型与小微型企业。
过程2、构建指标体系
完善、合理的风险评级指标体系是取得客观公正的风险评估结果的前提,因而,指标体系的选取应该遵循一定的原则,才能实现有效的评级结果,成为信贷工作的切实有效依据。
具体地,指标体系要有全面性:应该充分考虑其与评估对象风险的相关性,并且各个指标要相互配合、互相补充,应该要能够客观全面的包含评估对象的状况影响要素。指标体系要有针对性:由于不同的评估对象有不同的特点,尤其是以小微型企业为贷款对象的小微信贷其特殊性有别于大企业,因而指标体系应该针对不同的评估对象,以符合实际的需求,确保评估结果的切实有效。指标体系要有合法性:信用评估应该遵守有关法律法规和政策要求,对宏观政策导向有所体现,同时也要能够对政府机关规定的一些指标的标准值按规定要求有所体现。
结合上述指标要求,本申请实施例中的采用包括政府数据(工商信息、纳税数据等)、项目合作方提供的特色数据、互联网采集的数据等企业数据,形成标准化的指标体系,包含企业偿债能力指标、盈利能力指标、发展能力指标、经营能力指标、履约能力指标等维度。
过程3、通过模糊层次分析法及逻辑回归算法建模
在构建完模型所用的的全部信用评估指标之后,结合模糊层次分析法及逻辑回归算法建立信用评估模型。
3.1、数据清洗
通过过程2中的指标体系,获取全部指标对应的企业数据,然后对获取到的数据进行清洗。
数据清洗是对各种脏数据进行对应方式的处理,得到标准的、干净的、连续的数据,提供给数据统计、建模使用。比如NaN、Null、‘’等均属于缺失数据;为正确统计缺失值的个数,需要将样本中的缺失值统一。
有时数据会出现重复的情况,即同一企业包含两条相同的数据,这就是数据的唯一性问题,需要去重操作;同一个指标出现多个来源的数据,且数值不一样,就需要选定较权威的数据。有时获取的数据取值远远超过正常取值,与常识不符,比如年龄小于0或大于150,此时要该数据就被当作异常值处理。
3.2、构造样本集
在将企业数据进行清洗处理之后,基于清洗后的数据,构建建模使用的样本集。
首先,剔除指标数据全部缺失的样本,因为这样的样本会成为噪音数据,影响模型效果。
然后,在构建出样本集之后,按照模型训练、模型测试、模型验证三个环节,将总样本拆分成训练样本集、测试样本集、跨时间样本集。训练样本和测试样本是由总样本按照7:3或者8:2的比例抽样得到,属于同一时间区间。跨时间样本是训练样本时间之外的样本,即距离现在时间最近的样本,用以测试模型的预测能力,确保模型正式使用的时候仍有较好的模型效果。
有时建模样本的好坏比较失衡,此时对于这种样本不均衡的问题,可采用欠采样、过采样等处理方法。欠采样是减少数量较多那一类样本(一般是好样本)的数量,使得正负样本比例均衡;过采样是增加数量较少那一类样本(一般是坏样本)的数量,使得正负样本比例均衡。选择欠采样还是过采样可以参考样本的总量情况。
需要说明的是,本申请实施例中建立的样本集是一个整体的、包含所有信用评估指标对应数据的大样本集,且在该大样本集下,会存在信用评估指标分别对应的小样本集,这样在后续进行指标筛选时,在剔除掉部分指标后,该被剔除掉的指标对应的小样本集也会被剔除掉,以不影响模型的训练过程。
3.3、指标筛选
通过指标筛选得到全量的指标集,后续模糊层次分析法及逻辑回归算法所需的指标均为该指标集的子集。
3.3.1同值缺失值统计
统计同值及缺失值的个数,分析数据质量,对于数据缺失较严重或者同值较严重的指标可剔除。
3.3.2指标IV值计算
IV值是衡量指标预测能力的最直接的标准,从公式来看的话,相当于是自变量WOE值的一个加权求和,其值的大小决定了自变量对于目标变量的影响程度,即表示该变量预测能力的强弱。在本申请实施例中,信用评估指标的IV值指示的则是该信用评估指标对后续信用评分的影响程度。
在本申请的一个或多个实施例中,IV值用于信用评估指标筛选时,将指标按IV值从高到低筛选,但一般低于0.02的指标几乎不具备预测能力,具体如下:
IV<0.02:不具有预测能力
0.02<=IV<0.1:预测能力很弱
0.1<=IV<0.3:中等程度预测能力
IV>=0.3:预测能力很强
3.3.3指标分箱及WOE转换
指标分箱是一种数据预处理技术,通过连续变量离散化、特征离散化后,对于模型有很多优点:离散化后,易于模型的快速迭代,计算结果方便存储;离散化后,特征对异常数据有很强的鲁棒性,比如一个异常数据年龄300岁会给模型造成很大的干扰,划分区间后弱化了干扰;离散化后,每个变量有单独的权重,相当于为模型引入了非线性,能够提升模型表达能力,加大拟合;离散化起到了简化模型的作用,模型会更加的稳定,降低了模型过拟合的风险。
本申请实施例在建模过程中采用基于KS的最优分箱方法,将连续变量离散化,通过WOE(证据权重)转换将Logistic回归模型转变为标准评分卡格式,达到特征分箱的目的。
3.3.4指标相关性和共线性分析
在进行Logistic回归分析之前,要对所选择的信用评估指标做相关性和共线性分析。因为各指标之间可能会存在相互关系,当指标之间存在严重的多元共线性时,直接使用会降低模型的预测结果,容易使回归系数标准差产生偏差,降低模型的可解释性。因此,要对指标进行筛选,对所选的指标变量进行相关性分析和多元共线性检验。例如,当检验结果中VIF值大于等于10时,就说明某一指标X与其余指标之间存在有严重的多元共线性,且这种多元共线性可能会过度的影响最小二乘估计值。
3.3.5指标P值显著性检验
为了模型的准确性,要剔除掉部分显著性不强的信用评估指标,本申请实施例中,认为P值小于0.05的自变量是显著的,即选取指标在5%水平具有显著差异的指标。
过程4、模型训练
4.1模糊层次分析法
4.1.1建立层次分析结构
本申请实施例中,建立的递阶层次结构包括目标层、准则层、指标层。其中,目标层为企业信用评估得分,准则层包括上述过程筛选得到的信用评估指标,即:企业偿债能力指标、盈利能力指标、发展能力指标、经营能力指标、履约能力指标中的任一项或者多项。另外,在准则层的多个一级指标下,分别设置若干二级指标,二级指标的选取需要考虑数据质量、企业业务意义等来确定,构成了指标层。
4.1.2构造模糊判断矩阵
模糊判断矩阵是指建立层次分析结构后,需要对影响某个因素的下一层次各个因素的重要性进行判定,即一个因素和另一个因素相比的重要程度的定量比较,通过对这些影响因素之间的两两比较确定一个重要性分值,得到模糊判断矩阵。本申请实施例是按0.1-0.9标度法做出因素间的数量标度,需要说明的是,上述因素即为本申请实施例上述筛选过程得到的信用评估指标。具体如下表1:
表1
4.1.3模糊判断矩阵的一致性检验
判断得到的信用评估指标的重要性权重值是否合理,需要对模糊判断矩阵进行一致性检验。对不满足一致性的模糊判断矩阵进行相应的调整,直至模糊互补判断矩阵达到一致性为止。
4.1.4计算模糊判断矩阵权重
根据上述得到的模糊判断矩阵,计算模糊判断矩阵权重值,得到某层上的指标相对上一层某相关指标的相对权重。
4.1.5计算评分
将各指标取值划分区间,然后赋值初始分,将初始分进行无量纲化,得到标准值矩阵,而指标综合分值为权重与标准化值的乘积。即得到各个信用评估指标分别对应的评分值。
4.2逻辑回归法
将指标集与模糊层次分析法得到的信用评估指标分别对应的评分输入逻辑回归算法中,通过AIC逐步回归得到最终入模的指标。
4.2.1 AIC逐步回归
AIC即赤池值,是衡量模型拟合优良性和模型复杂性的一种标准,在建立多元线性回归模型时,变量过多,且有不显著的变量时,可以使用AIC准则结合逐步回归进行变量筛选。本申请实施例中,运用前向逐步回归方法,依次计算每一个信用评估指标的AIC值,取最优AIC值对应的指标,并依次添加最优AIC值对应的指标,以此流程确定最终入模的指标。
4.2.2参数寻优
逻辑回归参数寻优过程主要是针对clf_C这一参数进行调优,通过hyperOpt参数寻优方法对参数进行寻优(限定clf_C参数的寻优范围为(0.01,1)),模型评价采用cross_val_score的均值来进行度量。通过模型参数寻优过程寻找到最优参数C。
4.3模型评分卡转换
在用逻辑回归算法进行预测时,逻辑回归返回的是一个概率值,并不是评分卡分数。评分卡可以标准化模型结果,更易于理解和使用,因此,本申请实施例中根据逻辑回归模型系数以及各特征woe转换的结果进行标准评分卡的转换。这样对于新企业申请时,参考评分卡结果,可以对该企业有一个直观的评分,并基于模型表现可以大概预计新企业的违约概率,以此在业务决策中给出决定性的意见。
过程5、模型评估与应用分析
5.1模型评估
5.1.1模型区分能力评估指标
模型风险区分能力评估指标,本申请实施例中可以采用AUC、KS实现。AUC、KS指标越大,模型的风险区分能力越强。
5.1.2模型稳定度评估指标
模型稳定度指标(Population Stability Index,PSI),可衡量测试样本及模型开发样本评分的分布差异,为最常见的模型稳定度评估指针。PSI表示的是按分数分档后,针对不同样本,或者不同时间的样本,各个分数区间内人数占总人数的占比是否有显著变化。一般PSI小于0.1可以认为模型稳定性很高;PSI在0.1-0.2之间,认为模型稳定性一般,需要进一步研究;若大于0.2可以认为模型稳定性差,建议修复。
PSI计算公式为:
PSI=sum((实际占比-预期占比)*ln(实际占比/预期占比))
5.1.3模型分Lift提升图
Lift是运用该模型和未运用该模型所得结果的比值。将打分后的样本按分数从低到高排序,取10或20等分,并对组内观测数与坏样本数进行统计。用评分卡模型捕捉到的坏客户的占比,可由该组坏样本数除以总的坏样本数计算得出;而不使用此评分卡,以随机选择的方法覆盖到的坏客户占比,等价于该组观测数占总观测数的比例(分子分母同时乘以样本整体的坏账率)。对两者取累计值,取其比值,则得到提升度Lift,即该评分卡抓取坏客户的能力是随机选择的多少倍。
5.1.4交叉验证
将中型企业模型与小微企业模型进行交叉验证,查看两个模型在同一批样本上的模型效果,若在中型企业样本上中型企业的模型效果更好,说明中型和小微型企业判断风险的指标不同,需要分开构建模型。
至此,完成信用评估模型的建立、训练及验证过程。
以上为本申请实施例提供的方法实施例,基于同样的发明构思,本申请实施例还提供了一种中小微企业信用评估装置,其结构如图3所示。
图3为本申请实施例提供的一种中小微企业信用评估装置内部结构示意图。如图3所示,装置包括:
确定模块301,用于确定待评估企业的企业类型,并根据所述企业类型确定信用评估模型;其中,所述企业类型至少包括中型企业以及小微型企业;获取模块302,用于获取所述待评估企业的信用评估数据,并通过所述信用评估数据生成所述信用评估模型对应的信用评估指标;评估模块303,用于将所述信用评估指标输入至所述信用评估模型中,以得到所述待评估企业的信用评分。
在本申请的一个或多个实施例中,装置还可以包括建模模块304,用于获取所述中型企业的信用评估数据,并基于所述信用评估数据建立适用于所述中型企业的信用评估模型;以及用于获取所述小微型企业的信用评估数据,并基于所述信用评估数据建立适用于所述小微型企业的信用评估模型;其中,所述信用评估数据至少包括以下任一项或者多项:企业工商数据、纳税数据、项目合作数据、司法数据以及财务数据。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种中小微企业信用评估方法,其特征在于,所述方法包括:
确定待评估企业的企业类型,并根据所述企业类型确定信用评估模型;其中,所述企业类型至少包括中型企业以及小微型企业;
获取所述待评估企业的信用评估数据,并通过所述信用评估数据生成所述信用评估模型对应的信用评估指标;
将所述信用评估指标输入至所述信用评估模型中,以得到所述待评估企业的信用评分。
2.根据权利要求1所述的一种中小微企业信用评估方法,其特征在于,在根据所述企业类型确定信用评估模型之前,所述方法还包括:
获取所述中型企业的信用评估数据,并基于所述信用评估数据建立适用于所述中型企业的信用评估模型;以及,
获取所述小微型企业的信用评估数据,并基于所述信用评估数据建立适用于所述小微型企业的信用评估模型;
其中,所述信用评估数据至少包括以下任一项或者多项:企业工商数据、纳税数据、项目合作数据、司法数据以及财务数据。
3.根据权利要求2所述的一种中小微企业信用评估方法,其特征在于,基于所述信用评估数据建立适用于所述中型企业的信用评估模型,具体包括:
构建所述中型企业的信用评估模型对应的信用评估指标体系;其中,所述信用评估指标体系中包括若干信用评估指标;所述信用评估指标至少包括以下任一项或者多项:企业偿债能力指标、盈利能力指标、发展能力指标、经营能力指标以及履约能力指标;
获取所述信用评估指标体系对应的信用评估数据,并对所述信用评估数据进行预处理;
通过预处理后的所述信用评估数据构建样本集;其中,所述样本集与所述信用评估指标相对应;
基于所述样本集,通过模糊层次分析算法与逻辑回归算法进行建模。
4.根据权利要求3所述的一种中小微企业信用评估方法,其特征在于,在通过预处理后的所述信用评估数据构建样本集之后,所述方法还包括:
对所述信用评估指标进行筛选,具体包括:
确定各个所述信用评估指标对应的样本集中同值及缺失值的个数,并在所述个数大于第一预设阈值的情况下,剔除所述信用评估指标,以完成所述信用评估指标的一轮筛选;
对一轮筛选后的所述信用评估指标进行IV值计算;其中,所述IV值用于指示所述信用评估指标对所述信用评分的影响程度;
剔除小于第二预设阈值的所述IV值对应的信用评估指标,以完成所述信用评估指标的二轮筛选;
对二轮筛选后的所述信用评估指标进行多元共线性检验,并剔除检验结果中的VIF值大于第三预设阈值的信用评估指标,以完成所述信用评估指标的三轮筛选;
对三轮筛选后的所述信用评估指标进行P值显著性检验,并保留P值小于第四预设阈值的所述信用评估指标,以完成所述信用评估指标的筛选过程;
通过筛选得到的所述信用评估指标对应的样本集,对所述信用评估模型进行训练。
5.根据权利要求4所述的一种中小微企业信用评估方法,其特征在于,对所述信用评估模型进行训练,具体包括:
基于模糊层次分析算法建立层次分析结构;其中,所述层次分析结构包括目标层、准则层以及指标层;所述目标层用于指示企业信用评估结果,所述准则层包括所述信用评估指标,所述指标层用于指示所述信用评估指标对应的二级指标;所述二级指标基于所述待评估企业的业务数据确定;
构建模糊判断矩阵,并对所述模糊判断矩阵进行一致性检验;其中,所述模糊判断矩阵中的元素用于指示所述信用评估指标对应的重要性分值;
在所述模糊判断矩阵通过所述一致性检验之后,计算所述模糊判断矩阵的对应权重,并基于所述对应权重,通过预设标准分值,计算得到所述信用评估指标分别对应的综合分值。
6.根据权利要求5所述的一种中小微企业信用评估方法,其特征在于,在得到所述信用评估指标分别对应的综合分值之后,所述方法还包括:
将所述信用评估指标对应的样本集以及所述信用评估指标分别对应的综合分值,输入至逻辑回归算法中;
通过AIC准则进行逐步回归,以完成所述信用评估模型的训练过程。
7.根据权利要求6所述的一种中小微企业信用评估方法,其特征在于,所述方法还包括:
将所述逐步回归过程返回的概率值,转换成标准评分;
通过所述信用评估模型,输出所述标准评分。
8.根据权利要求1所述的一种中小微企业信用评估方法,其特征在于,将所述信用评估指标输入至所述信用评估模型中,以得到所述待评估企业的信用评分,具体包括:
将所述信用评估指标输入至所述信用评估模型的模糊层次分析算法中,得到所述信用评估指标分别对应的评分;
将所述信用评估指标分别对应的评分输入至所述信用评估模型的逻辑回归算法中,得到所述待评估企业的信用评分。
9.根据权利要求1所述的一种中小微企业信用评估方法,其特征在于,在得到所述待评估企业的信用评分之后,所述方法还包括:
将所述信用评分与预设信用分值进行比较;其中,所述预设信用分值为所述中型企业或者所述小微型企业所能接受的最小信用分值;
在所述信用评分低于所述预设信用分值的情况下,触发风险应对策略。
10.一种中小微企业信用评估装置,其特征在于,所述装置包括:
确定模块,用于确定待评估企业的企业类型,并根据所述企业类型确定信用评估模型;其中,所述企业类型至少包括中型企业以及小微型企业;
获取模块,用于获取所述待评估企业的信用评估数据,并通过所述信用评估数据生成所述信用评估模型对应的信用评估指标;
评估模块,用于将所述信用评估指标输入至所述信用评估模型中,以得到所述待评估企业的信用评分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111003576.XA CN113642922A (zh) | 2021-08-30 | 2021-08-30 | 一种中小微企业信用评估方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111003576.XA CN113642922A (zh) | 2021-08-30 | 2021-08-30 | 一种中小微企业信用评估方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113642922A true CN113642922A (zh) | 2021-11-12 |
Family
ID=78424438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111003576.XA Pending CN113642922A (zh) | 2021-08-30 | 2021-08-30 | 一种中小微企业信用评估方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113642922A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115081950A (zh) * | 2022-07-28 | 2022-09-20 | 江西省智能产业技术创新研究院 | 企业成长性评估建模方法、系统、计算机及可读存储介质 |
CN115471056A (zh) * | 2022-08-31 | 2022-12-13 | 鼎翰文化股份有限公司 | 数据传输方法及数据传输系统 |
CN116384709A (zh) * | 2023-06-02 | 2023-07-04 | 国网福建省电力有限公司管理培训中心 | 基于数字赋能的企业管理系统、介质及电子设备 |
-
2021
- 2021-08-30 CN CN202111003576.XA patent/CN113642922A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115081950A (zh) * | 2022-07-28 | 2022-09-20 | 江西省智能产业技术创新研究院 | 企业成长性评估建模方法、系统、计算机及可读存储介质 |
CN115471056A (zh) * | 2022-08-31 | 2022-12-13 | 鼎翰文化股份有限公司 | 数据传输方法及数据传输系统 |
CN115471056B (zh) * | 2022-08-31 | 2023-05-23 | 鼎翰文化股份有限公司 | 数据传输方法及数据传输系统 |
CN116384709A (zh) * | 2023-06-02 | 2023-07-04 | 国网福建省电力有限公司管理培训中心 | 基于数字赋能的企业管理系统、介质及电子设备 |
CN116384709B (zh) * | 2023-06-02 | 2023-11-07 | 国网福建省电力有限公司管理培训中心 | 基于数字赋能的企业管理系统、介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113642922A (zh) | 一种中小微企业信用评估方法及装置 | |
Brauers et al. | MULTIMOORA for the EU Member States updated with fuzzy number theory | |
CN111401600A (zh) | 基于关联关系的企业信用风险评价方法和系统 | |
CN112767136A (zh) | 基于大数据的信贷反欺诈识别方法、装置、设备及介质 | |
CN111784114A (zh) | 一种客户侧分布式储能系统运行性能评估方法及系统 | |
CN113537807B (zh) | 一种企业智慧风控方法及设备 | |
CN111583012B (zh) | 融合文本信息的信用债发债主体违约风险评估方法 | |
CN111598682A (zh) | 一种针对企业的信用风险评估方法及系统 | |
CN115470962A (zh) | 一种基于LightGBM的企业失信风险预测模型构建方法 | |
CN112232377A (zh) | 一种企业esg三优信用模型构建方法及其装置 | |
Xu et al. | Application of deep learning neural network in online supply chain financial credit risk assessment | |
CN113450009A (zh) | 一种企业成长性评价的方法及系统 | |
CN116205355A (zh) | 电力负荷的预测方法、装置以及存储介质 | |
CN113837578B (zh) | 一种电力监理企业网格化监督管理评价方法 | |
CN112950048A (zh) | 基于模糊综合评价的国家高等教育体系健康评价 | |
CN114519508A (zh) | 基于时序深度学习和法律文书信息的信用风险评估方法 | |
Kun et al. | Default identification of p2p lending based on stacking ensemble learning | |
CN113450004A (zh) | 电力信用报告生成方法、装置、电子设备及可读存储介质 | |
He | Performance evaluation model and algorithm of green supply chain management based on sustainable computing | |
CN112580992B (zh) | 类金融企业的非法集资风险监测系统 | |
CN115330526A (zh) | 一种企业信用评分方法及装置 | |
CN115496364A (zh) | 幌子企业识别方法及装置、存储介质及电子设备 | |
CN115204501A (zh) | 企业评估方法、装置、计算机设备和存储介质 | |
CN114626940A (zh) | 数据分析方法、装置及电子设备 | |
Zeng | A comparison study on the era of internet finance China construction of credit scoring system model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |