CN110930250A - 企业信用风险的预测方法及系统、存储介质及电子设备 - Google Patents

企业信用风险的预测方法及系统、存储介质及电子设备 Download PDF

Info

Publication number
CN110930250A
CN110930250A CN202010089415.6A CN202010089415A CN110930250A CN 110930250 A CN110930250 A CN 110930250A CN 202010089415 A CN202010089415 A CN 202010089415A CN 110930250 A CN110930250 A CN 110930250A
Authority
CN
China
Prior art keywords
enterprise
risk
data
prediction
prediction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010089415.6A
Other languages
English (en)
Inventor
陈文�
周凡吟
沈思丞
巫源睿
曾途
吴桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Business Big Data Technology Co Ltd
Original Assignee
Chengdu Business Big Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Business Big Data Technology Co Ltd filed Critical Chengdu Business Big Data Technology Co Ltd
Priority to CN202010089415.6A priority Critical patent/CN110930250A/zh
Publication of CN110930250A publication Critical patent/CN110930250A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种企业信用风险的预测方法及系统、存储介质及电子设备,该方法包括以下步骤:获取目标企业的企业名称和若干个特征变量,并根据所述企业名称和若干个特征变量,对所述目标企业进行分类,所述类型包括大型企业和非大型企业;若所述目标企业被分类为大型企业,则提取目标企业的第一数据,并基于第一预测模型对目标企业的信用风险进行预测;若所述目标企业被分类为非大型企业,则提取目标企业的第二数据,并基于第二预测模型对目标企业的信用风险进行预测。本发明风险预测方法中,先对目标企业进行分类,然后再根据目标企业的类型有针对性地选择相应的预测模型进行预测,因此可以提高风险预测结果的准确性。

Description

企业信用风险的预测方法及系统、存储介质及电子设备
技术领域
本发明涉及数据处理技术领域,特别涉及一种企业信用风险的预测方法及系统、存储介质及电子设备。
背景技术
基于大数据时代,通过对企业运营中产生的各种数据进行收集、分析,可以有效地帮助企业自己或他人创造更多的价值。例如,通过分析产品的热销类型和购买人群,可以帮助企业做出更准确的产品营销策略。又例如,通过对企业交易数据的分析,可以帮助企业形成信用档案,有助于企业进行融资或贷款。以企业信用评估为例,传统的征信模型,通过以逻辑回归、判别分析等方法为主要的模型对企业进行信用评估,虽然能够预测企业信用风险,但是传统的信用评估模型的数据主要依赖于交易数据,针对于具有大量交易数据的大企业而言具有很好的可靠性,而对于缺乏贷款经历和交易行为的小公司,他们的信贷记录缺失或者不完整,便会自动被视为信用风险较大,继而影响其融资或贷款。换言之,目前的企业信用风险预测方法不具有针对性,导致对于部分缺乏交易数据的企业的预测准确度不高。
发明内容
本发明的目的在于改善现有技术中所存在的目前的企业信用风险预测方法不具有针对性,导致对于部分缺乏交易数据的企业的预测准确度不高的不足,提供一种企业信用风险的预测方法及系统,根据企业类型选择对应的预测模型进行风险预测,更具有针对性,可以提高预测结果的准确性。
为了实现上述发明目的,本发明实施例提供了以下技术方案:
一种企业信用风险的预测方法,包括以下步骤:
获取目标企业的企业名称和若干个特征变量,并根据所述企业名称和若干个特征变量,对所述目标企业进行分类,所述类型包括大型企业和非大型企业;
若所述目标企业被分类为大型企业,则提取目标企业的第一数据,并基于第一预测模型对目标企业的信用风险进行预测;
若所述目标企业被分类为非大型企业,则提取目标企业的第二数据,并基于第二预测模型对目标企业的信用风险进行预测。
上述方法中,先对目标企业进行分类,然后再根据目标企业的类型有针对性地选择相应的预测模型进行预测,因此可以提高风险预测结果的准确性。
所述根据所述企业名称和若干个特征变量,对所述目标企业进行分类的步骤,包括:根据所述企业名称确定该企业所属行业,并从规则库中调取出该企业所属行业的分类规则;根据调取出的分类规则和所述若干个特征变量的数值进行分类。
上述方法中,针对不同行业采用不同的分类规则,分类时先根据企业名称确定所属行业,然后再基于该行业的分类规则进行分类,相比于传统方法针对所有行业都采用企业规模这种单一划分方式,更具有准确性。基于分类后的数据进行相应的应用处理,处理结果也更具有准确性和参考性。
所述第一预测模型为若干个变量的求和模型;所述提取目标企业的第一数据,并基于第一预测模型对目标企业的信用风险进行预测的步骤,包括:提取目标企业的第一数据,所述第一数据包括预先设定的若干个第一特征变量及其数值;基于每个第一特征变量的数值,对每个第一特征变量赋予风险预测值;将每个第一特征变量的风险预测值作为变量的数据值输入第一预测模型,并基于预先设定的各个变量的权重,求和得到目标企业的信用风险预测值。
针对于大型企业,交易信息和经营信息的数据量大,基于统计分析,采用信用评分方式进行风险预测,既保障了预测结果的准确性,又减小了计算复杂度。
所述第二预测模型包括若干个不同风险类型的预测模型,一种风险类型对应一个预测模型,以及以不同风险类型的预测模型的输出作为变量的预测总模型;所述提取目标企业的第二数据,并基于第二预测模型对目标企业的信用风险进行预测的步骤,包括:
提取目标企业的第二数据,所述第二数据包括预先设定的若干个第二特征变量及其数值;分别针对预先训练得到的每种风险类型的预测模型,从第二数据中抽取出该预测模型所需的特征变量及其数值,并输入该预测模型,输出得到该预测模型下的风险预测值;将每种风险类型的预测模型输出的风险预测值作为变量的数据值,输入预先训练得到的所述预测总模型,输出得到目标企业的信用风险预测值。
针对于非大型企业,缺乏经营数据,但是通过其自身相关信息和与其关联的关联方的一些信息,并基于机器学习的方法对失信企业的多方面风险特征进行学习,因此可以保障预测结果的准确性。
所述不同风险类型的预测模型通过以下方法训练得到:构建特征库,所述特征库中包含有若干个用于预测企业信用风险的第二特征变量;根据预先定义的多种风险类型,构建训练样本集,训练样本包括黑样本和白样本;基于所述特征库和训练样本集,分别针对每一种风险类型进行训练,得到对应的预测模型。
所述预测总模型通过以下方式得到:基于逻辑回归算法对得到的若干种风险类型的预测模型进行融合,得到所述预测总模型。
所述根据调取出的分类规则和所述若干个特征变量的数值进行分类的步骤,包括:以分类条件的要求高低为参考,按种类从高到低的顺序,判断所有的特征变量的数值是否同时满足某一种类的分类条件,若同时满足则分类为该种类,若其中任一个特征变量的数值不满足该种类的分类条件,则分类为该种类的下一级种类。
另一方面,本发明实施例基于相同的发明构思,提供了一种企业信用风险的预测系统,包括:
数据收集模块,用于获得目标企业的企业名称和若干个特征变量、第一数据以及第二数据;
企业分类模块,用于根据所述企业名称和若干个特征变量,对所述目标企业进行分类,所述类型包括大型企业和非大型企业;
模型训练模块,用于基于统计分析构建第一预测模型,以及基于机器学习算法训练得到第二预测模型;
风险预测模块,用于在所述目标企业被分类为大型企业时,提取目标企业的第一数据,并基于所述第一预测模型对目标企业的信用风险进行预测;以及,在所述目标企业被分类为非大型企业时,提取目标企业的第二数据,并基于所述第二预测模型对目标企业的信用风险进行预测。
所述企业分类模块在对企业进行分类时,首先根据所述企业名称确定该企业所属行业,并从规则库中调取出该企业所属行业的分类规则;然后根据调取出的分类规则和所述若干个特征变量的数值进行分类。
所述风险预测模块在进行风险预测时,针对于大型企业,首先提取目标企业的第一数据,所述第一数据包括预先设定的若干个第一特征变量及其数值;然后基于每个第一特征变量的数值,对每个第一特征变量赋予风险预测值;最后将每个第一特征变量的风险预测值作为变量的数据值输入第一预测模型,并基于预先设定的各个变量的权重,求和得到目标企业的信用风险预测值。
所述风险预测模块在进行风险预测时,针对于非大型企业,首先提取目标企业的第二数据,所述第二数据包括预先设定的若干个第二特征变量及其数值;然后分别针对预先训练得到的每种风险类型的预测模型,从第二数据中抽取出该预测模型所需的特征变量及其数值,并输入该预测模型,输出得到该预测模型下的风险预测值;最后将每种风险类型的预测模型输出的风险预测值作为变量的数据值,输入预先训练得到的所述预测总模型,输出得到目标企业的信用风险预测值。
再一方面,本发明实施例同时提供了一种包括计算机可读指令的计算机可读存储介质,所述计算机可读指令在被执行时使处理器执行本发明实施例中所述方法中的操作。
再一方面,本发明实施例同时提供了一种电子设备,包括:存储器,存储程序指令;处理器,与所述存储器相连接,执行存储器中的程序指令,实现本发明实施例中所述方法中的步骤。
与现有技术相比,通过本发明方法或系统,提供对目标企业进行分类,继而再根据目标企业的类型有针对性地选择相应的预测模型进行预测,因此可以提高风险预测结果的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍, 应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为实施例中一种企业信用风险预测方法的流程图。
图2为实施例中企业分类方法的流程图。
图3为实施例中针对于大型企业的预测流程图。
图4为实施例中针对于非大型企业的预测流程图。
图5为实施例中第二预测模型的训练方法流程图。
图6为实施例中企业信用风险预测系统的组成框图。
图7为实施例中数据分类系统的示意图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本实施例中提供了一种企业信用风险的预测方法,包括以下步骤:
S10,获取目标企业的企业名称和若干个特征变量,并根据所述企业名称和若干个特征变量,对所述目标企业进行分类,所述类型包括大型企业和非大型企业;
S20,若所述目标企业被分类为大型企业,则提取目标企业的第一数据,并基于第一预测模型对目标企业的信用风险进行预测;
S30,若所述目标企业被分类为非大型企业,则提取目标企业的第二数据,并基于第二预测模型对目标企业的信用风险进行预测。
为了更好地理解本发明,下面将分别对上述各个步骤做更为详细的阐述。
需要说明的是,非大型企业是指被分类为大型企业以外的企业,本文中的大型企业和非大型企业是相对概念,而且非大型企业主要是指缺乏经营/交易数据的企业,而不一定是以人数规模或者注册资金或者其他方式分类的非大型企业,因此传统的按照企业人数或注册资金来进行划分的方式不够准确,由此,本实施例中针对企业信用风险预测所需,是根据目标企业的企业名称和预先设定的若干个特征变量进行分类。
请参阅图2,具体的分类步骤如下:
S101,获得目标企业的企业名称、注册资本和一度关联方数量。也就是说,本实施例中,用于企业分类的特征变量选取的是注册资本和一度关联方数量,基于不同的实施方式,可以有不同的特征变量,也可以选择更多或更少的特征变量,本实施例中仅是基于试验例而言,选取注册资本和一度关联方数量具有较好的分类效果,即基于该特征变量的分类结果可以保障信用风险预测结果的准确性。
关联方是指与企业有关联关系的一方,可以是自然人,也可以是企业,关联关系可以是任职(如高管,例如经理、总监等)、股东、投资等,一度关联即是指关联方与企业直接关联,例如公司A为公司B的投资人,又例如张三为公司B的股东。
S102,根据企业名称确定该企业所属行业,并从规则库中调取出该企业所属行业的分类规则。
本实施例中仅针对于企业信用风险预测的应用,将全行业划分为21个类别,分别为:农、林、牧、渔业,采矿业,制造业,电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业,住宿和餐饮业,信息传输、软件和信息技术服务业,金融业,房地产业,租赁和商务服务业,科学研究和技术服务业,水利、环境和公共设施管理业,居民服务、修理和其他服务业,教育业,卫生和社会工作业,文化、体育和娱乐业,公共管理、社会保障和社会组织,国际组织,其他。当然地,基于不同的应用,可以有不同的划分方式。
S103,根据调取出的分类规则和注册资本、一度关联方数量进行分类。
针对于企业信用评估的应用,分类的特征变量均是指注册资本和一度关联方数量,但是针对于不同行业采用不同的分类规则,如此才能更加准确地对数据进行分类。在进行分类时,以分类条件的要求高低为参考,按种类从高到低的顺序,首先判断注册资本和一度关联方数量是否同时满足某一种类的分类条件,若同时满足则分类为该种类,若不能同时满足,即其中任一个特征变量不满足该种类的分类条件,则分类为分类条件要求更低的种类。也就是说,针对于每一种分类,若注册资本和一度关联方数量这两个特征变量中只有一个(任一个)满足该种类的分类条件,那么分类为该种类的下一级种类。
例如,针对于农、林、牧、渔业,若注册资本大于等于2000万且一度关联方数量大于等于38,则分类为大型企业;若注册资本介于360万至2000万之间且一度关联方数量介于6至38之间,则分类为中小型企业;若注册资本小于360万且一度关联方数量小于6,则分类为小微型企业。例如,注册资本大于等于2000万但一度关联方数量介于6至38之间,则分类为中小型企业。如果,注册资本大于等于2000万但一度关联方数量小于6,则分类为中小企业。
仅基于企业信用评估的应用,本实施例中举例说明了各个行业的分类规则,如下表1a、表1b所示。
表1a
Figure 678DEST_PATH_IMAGE001
Figure 413261DEST_PATH_IMAGE002
表1b
Figure 465246DEST_PATH_IMAGE002
Figure 671032DEST_PATH_IMAGE004
表1a、表1b中的中小型和小微型企业都是指非大型企业。
请参阅图3,针对于大型企业,本实施例中的预测步骤包括:
S201,提取目标企业的第一数据,所述第一数据包括预先设定的若干个第一特征变量及其数值。
需要说明的是,本实施例中前述的用于分类的特征变量、此处的第一特征变量、以及后文的第二特征变量,三者之间是并列关系,分别指三种特征变量,分别在企业分类、针对大型企业的风险预测、针对非大型企业的风险预测时所用。
第一特征变量的个数以及特征本身的设定,本实施例中是从遵循诚实守信准则、遵纪守法规范行为等公共信用方面考虑的,如表2所示。
为了利用更多信息对大型企业的信用风险进行更多维度的预测,以提高准确性,在进一步优化的实施方案中,在表2所示第一特征变量的基础上,还可以增加表3所示的第一特征变量,从关联方信用、违约行为、动态趋势变化方面预测目标企业的信用水平。
S202,基于每个第一特征变量的数值,对每个第一特征变量赋予风险预测值。如表2或表3所示,针对于每一个第一特征变量,预先就设定了评分标准(表中是以100分制进行),在获得各个第一特征变量的数值后,即可根据评分标准对该第一特征变量进行赋值。例如,假设目标企业为上市公司,则表2中的第一个第一特征变量就赋值为10。
需要说明的是,第一特征变量以及评分标准的设定不是随意设置的,而是根据专家经验以及统计分析制定的,例如表2所示第一特征变量和评分标准即是目前常用的信用风险预测标准。
S203,将每个第一特征变量的风险预测值作为变量的数据值输入第一预测模型,并基于预先设定的各个变量的权重,求和得到目标企业的信用风险预测值。
由表2可知,第一预测模型为若干个变量的求和模型。当仅通过表2对大型企业的信用风险进行预测时,目标企业的信用风险预测值y=13x1+15x2+17x3+20x4+10x5+2x6,x表示第一特征变量。若同时通过表2和表3对大型企业的信用风险进行预测时,则需要首先分别计算出表2和表3的风险预测值,然后给计算出的两个风险预测值分配权重,最后再求和得到目标企业的信用风险预测值,例如Score=0.6* Score1+0.4*Score2,Score1为通过表2计算得出的风险预测值,Score2为通过表3计算得出的风险预测值,Score为最后得到的目标企业的信用风险预测值。
表2
Figure DEST_PATH_IMAGE005
Figure DEST_PATH_IMAGE006
表3
Figure 529017DEST_PATH_IMAGE003
Figure 259076DEST_PATH_IMAGE004
针对于非大型企业,本实施例中采用第二预测模型进行预测,第二预测模型包括若干个不同风险类型的预测模型,一种风险类型对应一个预测模型,以及以不同风险类型的预测模型的输出作为变量的预测总模型。具体地,请参阅图4,针对于非大型企业,本实施例中的预测步骤如下:
S301,提取目标企业的第二数据,所述第二数据包括预先设定的若干个第二特征变量及其数值。
S302,分别针对预先训练得到的每种风险类型的预测模型,从第二数据中抽取出该预测模型所需的特征变量及其数值,并输入该预测模型,输出得到该预测模型下的风险预测值。
本实施例中,根据企业信用风险的特征,将信用风险划分为多种风险类型,针对于每种风险通过(部分或全部)不同的第二特征变量来预测。风险类型可以参见表4所示。
S303,将每种风险类型的预测模型输出的风险预测值作为变量的数据值,输入预先训练得到的所述预测总模型,输出得到目标企业的信用风险预测值。
例如,预测总模型为Y=kAyA+kByB+kCyC+kDyD+kEyE+kFyF,其中,Y为最终输出得到的目标企业的信用风险预测值,y为不同风险类型的预测模型输出的风险预测值,k为变量对应的权重系数。
请参阅图5,不同风险类型的预测模型以及所述预测总模型通过以下步骤训练得到:
S401,构建特征库,所述特征库中存储有若干个用于预测企业信用风险的第二特征变量。
S402,根据预先设定的多种风险类型,构建训练样本集,训练样本包括黑样本和白样本。针对于每一个样本,都包含有特征库中所存储的第二特征变量的数据值,只是有可能某一个或多个第二特征变量的数据值为零或为空值。
S403,基于所述特征库和训练样本集,分别针对每一种风险类型进行训练,得到对应的预测模型。
S404,将得到的多种预测模型进行融合,得到最终的企业信用风险预测模型,即预测总模型。
更具体地,上述步骤S401中,构建特征库时,主要分为两步进行:
步骤A,基于数据库中已获得的数据以及专家经验设置第二特征变量,以及选取目前常用的一些第二特征变量,这些第二特征变量主要涉及综合实力风险、企业经营风险、企业发展风险、企业诚信风险、静态关联方风险和动态关联方风险这几个维度。
综合实力风险主要反映企业的股东背景、资本背景和资质的风险,第二特征变量可以是例如企业所属行业、是否上市、是否国企、非自然人股东里国企的数量等;企业经营风险主要反映企业的工商变更情况、人才结构合理化、舆情等方面的风险,第二特征变量可以是例如近一年内法人变更次数、本科生所占比例等;企业发展风险主要反映企业对外融资扩张、分支机构经营状况等方面的风险,第二特征变量可以是例如分公司数量等;企业诚信风险主要反映企业在法律诉讼、行政处罚、异常经营以及欠税方面的风险,第二特征变量可以是例如企业被执行总次数、企业被执行总金额等;静态关联方风险主要反映企业关联方的信誉、违法融资、法律诉讼、异常经营、行政处罚的风险,第二特征变量可以是例如自然人股东在外任职类金融公司的数量、关联方被执行的次数等;动态关联方风险主要反映企业关联方信誉、违法融资、异常经营、行政处罚的动态变化风险,第二特征变量例如可以是关联方被执行此处近一年的增长率等。
步骤B,对步骤A中初步选取的第二特征变量进行再次筛选,确定出最终所用的第二特征变量,放入特征库中。本步骤进行筛选时,基于WOE分箱处理和IV值测算进行。
WOE分箱是将取值连续的变量分为离散的多个类,避免极端数据、异常数据、缺失数据对模型的干扰,以便于提高模型的训练效率和预测准确度。分箱过程采用自动分箱。对于类别型第二特征变量,一个类别就是一个分箱;对于数值型第二特征变量,分箱数量<=4,且如果某个第二特征变量的所有数据值中,某个数据值占比超过一定比例,那么这个数据值单独作为一个分箱。
基于WOE分箱可以测算单个第二特征变量的IV值来评估单个第二特征变量的区分能力。IV值为第二特征变量对于黑白样本的区分能力,表示第二特征变量在不同取值分组中黑白样本的占比差距,IV值越大说明该第二特征变量对黑白样本有越大的鉴别能力。IV值的度量标准一般为:IV处于[0.02,0.1),第二特征变量有弱的区分能力,IV处于[0.1,0.3),第二特征变量有中等的区分能力,IV大于或等于0.3,第二特征变量有强的区分能力。因此,通过WOE分箱及IV值测算,筛选出IV值大于或等于0.3的第二特征变量。
通过上述方法筛选出来的第二特征变量具有较高的区分能力,且经过上述过程筛选后可以降低运算量,继而提高效率。
更具体地,上述步骤S402中,每一种风险类型都需要黑样本和白样本来训练得到,针对于黑样本,本实施例中将表4所示六种黑名单类型的企业都定义为黑样本,该类型以外的企业都是白样本。企业信用风险则是由这6种风险类型共同预测。
表4
Figure 384255DEST_PATH_IMAGE002
表现期是自行设定的,表现期是数据选取的时间长度(范围),例如表现期设定为一年,则针对于A类型,黑名单定义为最近一年内被吊销企业,即最近一年内被吊销企业组成黑名单,而最近一年内未被吊销企业组成白名单。
表4所示的各种风险类型,是企业信用的直接反映,因此按照表4所示定义风险类型,并基于该风险类型构建多个预测模型,有助于提高最终获得的预测模型的预测结果准确度。
上述步骤S403中,分别针对于表4中所示的6种风险类型,都采用逻辑回归算法进行训练,分别得到对应的预测模型。采用AddaptiveLasso的逻辑回归进行第二特征变量筛选和回归系数估计,一方面剔除了部分模块内高相关的和不显著的第二特征变量,另一方面保证了模型系数估计的良好统计性质。
不同风险类型对应的预测模型之间,所包含的第二特征变量的个数以及种类都可能不同,也可能会使用到相同的第二特征变量。例如,针对于A类型,其预测模型为yA=kA1x1+kA2x2+kA3x3+kA4x4+kA5x5+kA6x6+kA7x7;而对于B类型,其预测模型为yB=kB1x1+kB2x4+kB3x8+kB4x11+kB5x13;x表示第二特征变量,kAi或kBj表示第二特征变量对应的权重系数,kA1+kA2+…+kA7=1,kB1+kB2+…+kB5=1。这两个预测模型之间即包含了相同的第二特征变量x1和x4,也分别包含了不同的第二特征变量。
由于逻辑回归算法是很成熟的算法,因此本实施例中此处对具体的逻辑回归处理过程不做详细阐述。基于表4中所分类型,经过本步骤后,将得到6个预测模型。
上述步骤S404中,将得到的6个预测模型进行融合,同样也采用了逻辑回归进行权重系数分配,最终得到企业信用风险预测模型Y=kAyA+kByB+kCyC+kDyD+kEyE+kFyF
请参阅图6,本实施例中同时提供了一种企业信用风险的预测系统,包括:
数据收集模块,用于获得目标企业的企业名称和若干个特征变量、第一数据以及第二数据;
企业分类模块,用于根据所述企业名称和若干个特征变量,对所述目标企业进行分类,所述类型包括大型企业和非大型企业;
模型训练模块,用于基于统计分析构建第一预测模型,以及基于机器学习算法训练得到第二预测模型;
风险预测模块,用于在所述目标企业被分类为大型企业时,提取目标企业的第一数据,并基于所述第一预测模型对目标企业的信用风险进行预测;以及,在所述目标企业被分类为非大型企业时,提取目标企业的第二数据,并基于所述第二预测模型对目标企业的信用风险进行预测。
其中,企业分类模块在对企业进行分类时,首先根据所述企业名称确定该企业所属行业,并从规则库中调取出该企业所属行业的分类规则;然后根据调取出的分类规则和所述若干个特征变量的数值进行分类。
其中,风险预测模块在进行风险预测时,针对于大型企业,首先提取目标企业的第一数据,所述第一数据包括预先设定的若干个第一特征变量及其数值;然后基于每个第一特征变量的数值,对每个第一特征变量赋予风险预测值;最后将每个第一特征变量的风险预测值作为变量的数据值输入第一预测模型,并基于预先设定的各个变量的权重,求和得到目标企业的信用风险预测值。
其中,风险预测模块在进行风险预测时,针对于非大型企业,首先提取目标企业的第二数据,所述第二数据包括预先设定的若干个第二特征变量及其数值;然后分别针对预先训练得到的每种风险类型的预测模型,从第二数据中抽取出该预测模型所需的特征变量及其数值,并输入该预测模型,输出得到该预测模型下的风险预测值;最后将每种风险类型的预测模型输出的风险预测值作为变量的数据值,输入预先训练得到的所述预测总模型,输出得到目标企业的信用风险预测值。
由于上述风险预测系统与上述预测方法是基于相同的发明构思,因此,对于各个模块所执行的步骤,可以参见前述预测方法中的相关描述,此处不再赘述。
如图7所示,本实施例同时提供了一种电子设备,该电子设备可以包括处理器51和存储器52,其中存储器52耦合至处理器51。值得注意的是,该图是示例性的,还可以使用其他类型的结构来补充或替代该结构,实现数据提取、报告生成、通信或其他功能。
如图7所示,该电子设备还可以包括:输入单元53、显示单元54和电源55。值得注意的是,该电子设备也并不是必须要包括图7中显示的所有部件。此外,电子设备还可以包括图7中没有示出的部件,可以参考现有技术。
处理器51有时也称控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该处理器51接收输入并控制电子设备的各个部件的操作。
其中,存储器52例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其他合适装置中的一种或多种,可存储上述处理器51的配置信息、处理器51执行的指令、记录的表格数据等信息。处理器51可以执行存储器52存储的程序,以实现信息存储或处理等。在一个实施例中,存储器52中还包括缓冲存储器,即缓冲器,以存储中间信息。
输入单元53例如用于向处理器51提供各个样本的数据。显示单元54用于显示处理过程中的各种结果,例如特征库中的特征变量、得到的各个预测模型等,该显示单元例如可以为LCD显示器,但本发明并不限于此。电源55用于为电子设备提供电力。
本发明实施例还提供一种计算机可读指令,其中当在电子设备中执行所述指令时,所述程序使得电子设备执行本发明方法所包含的操作步骤。
本发明实施例还提供一种存储有计算机可读指令的存储介质,其中所述计算机可读指令使得电子设备执行本发明方法所包含的操作步骤。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成模块及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种企业信用风险的预测方法,其特征在于,包括以下步骤:
获取目标企业的企业名称和若干个特征变量,并根据所述企业名称和若干个特征变量,对所述目标企业进行分类,所述类型包括大型企业和非大型企业;
若所述目标企业被分类为大型企业,则提取目标企业的第一数据,并基于第一预测模型对目标企业的信用风险进行预测;
若所述目标企业被分类为非大型企业,则提取目标企业的第二数据,并基于第二预测模型对目标企业的信用风险进行预测。
2.根据权利要求1所述的方法,其特征在于,所述根据所述企业名称和若干个特征变量,对所述目标企业进行分类的步骤,包括:
根据所述企业名称确定该企业所属行业,并从规则库中调取出该企业所属行业的分类规则;
根据调取出的分类规则和所述若干个特征变量的数值进行分类。
3.根据权利要求1所述的方法,其特征在于,所述第一预测模型为若干个变量的求和模型;所述提取目标企业的第一数据,并基于第一预测模型对目标企业的信用风险进行预测的步骤,包括:
提取目标企业的第一数据,所述第一数据包括预先设定的若干个第一特征变量及其数值;
基于每个第一特征变量的数值,对每个第一特征变量赋予风险预测值;
将每个第一特征变量的风险预测值作为变量的数据值输入第一预测模型,并基于预先设定的各个变量的权重,求和得到目标企业的信用风险预测值。
4.根据权利要求1所述的方法,其特征在于,所述第二预测模型包括若干个不同风险类型的预测模型,一种风险类型对应一个预测模型,以及以不同风险类型的预测模型的输出作为变量的预测总模型;所述提取目标企业的第二数据,并基于第二预测模型对目标企业的信用风险进行预测的步骤,包括:
提取目标企业的第二数据,所述第二数据包括预先设定的若干个第二特征变量及其数值;
分别针对预先训练得到的每种风险类型的预测模型,从第二数据中抽取出该预测模型所需的特征变量及其数值,并输入该预测模型,输出得到该预测模型下的风险预测值;
将每种风险类型的预测模型输出的风险预测值作为变量的数据值,输入预先训练得到的所述预测总模型,输出得到目标企业的信用风险预测值。
5.根据权利要求4所述的方法,其特征在于,所述不同风险类型的预测模型通过以下方法训练得到:
构建特征库,所述特征库中包含有若干个用于预测企业信用风险的第二特征变量;
根据预先定义的多种风险类型,构建训练样本集,训练样本包括黑样本和白样本;
基于所述特征库和训练样本集,分别针对每一种风险类型进行训练,得到对应的预测模型。
6.根据权利要求5所述的方法,其特征在于,所述预测总模型通过以下方式得到:基于逻辑回归算法对得到的若干种风险类型的预测模型进行融合,得到所述预测总模型。
7.一种企业信用风险的预测系统,其特征在于,包括:
数据收集模块,用于获得目标企业的企业名称和若干个特征变量、第一数据以及第二数据;
企业分类模块,用于根据所述企业名称和若干个特征变量,对所述目标企业进行分类,所述类型包括大型企业和非大型企业;
模型训练模块,用于基于统计分析构建第一预测模型,以及基于机器学习算法训练得到第二预测模型;
风险预测模块,用于在所述目标企业被分类为大型企业时,提取目标企业的第一数据,并基于所述第一预测模型对目标企业的信用风险进行预测;以及,在所述目标企业被分类为非大型企业时,提取目标企业的第二数据,并基于所述第二预测模型对目标企业的信用风险进行预测。
8.根据权利要求7所述的系统,其特征在于,所述企业分类模块在对企业进行分类时,首先根据所述企业名称确定该企业所属行业,并从规则库中调取出该企业所属行业的分类规则;然后根据调取出的分类规则和所述若干个特征变量的数值进行分类。
9.根据权利要求7所述的系统,其特征在于,所述风险预测模块在进行风险预测时,针对于大型企业,首先提取目标企业的第一数据,所述第一数据包括预先设定的若干个第一特征变量及其数值;然后基于每个第一特征变量的数值,对每个第一特征变量赋予风险预测值;最后将每个第一特征变量的风险预测值作为变量的数据值输入第一预测模型,并基于预先设定的各个变量的权重,求和得到目标企业的信用风险预测值。
10.根据权利要求7所述的系统,其特征在于,所述风险预测模块在进行风险预测时,针对于非大型企业,首先提取目标企业的第二数据,所述第二数据包括预先设定的若干个第二特征变量及其数值;然后分别针对预先训练得到的每种风险类型的预测模型,从第二数据中抽取出该预测模型所需的特征变量及其数值,并输入该预测模型,输出得到该预测模型下的风险预测值;最后将每种风险类型的预测模型输出的风险预测值作为变量的数据值,输入预先训练得到的预测总模型,输出得到目标企业的信用风险预测值。
11.一种包括计算机可读指令的计算机可读存储介质,其特征在于,所述计算机可读指令在被执行时使处理器执行权利要求1-6任一所述方法中的操作。
12.一种电子设备,其特征在于,所述的设备包括:
存储器,存储程序指令;
处理器,与所述存储器相连接,执行存储器中的程序指令,实现权利要求1-6任一所述方法中的步骤。
CN202010089415.6A 2020-02-12 2020-02-12 企业信用风险的预测方法及系统、存储介质及电子设备 Pending CN110930250A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010089415.6A CN110930250A (zh) 2020-02-12 2020-02-12 企业信用风险的预测方法及系统、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010089415.6A CN110930250A (zh) 2020-02-12 2020-02-12 企业信用风险的预测方法及系统、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN110930250A true CN110930250A (zh) 2020-03-27

Family

ID=69854460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010089415.6A Pending CN110930250A (zh) 2020-02-12 2020-02-12 企业信用风险的预测方法及系统、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN110930250A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915155A (zh) * 2020-07-13 2020-11-10 上海冰鉴信息科技有限公司 小微企业风险等级识别方法、装置及计算机设备
CN112348353A (zh) * 2020-11-05 2021-02-09 浪潮软件股份有限公司 一种基于迁移学习的企业失信风险预测方法
CN112580992A (zh) * 2020-12-23 2021-03-30 成都数联铭品科技有限公司 类金融企业的非法集资风险监测系统
CN112750029A (zh) * 2020-12-30 2021-05-04 北京知因智慧科技有限公司 信用风险预测方法、装置、电子设备及存储介质
CN112749742A (zh) * 2020-12-30 2021-05-04 北京知因智慧科技有限公司 源发风险分值的量化方法、量化装置及电子设备
CN112907097A (zh) * 2021-03-08 2021-06-04 北京科技大学 一种深部金属矿工程开采热环境风险评价方法
CN112950344A (zh) * 2021-02-26 2021-06-11 平安国际智慧城市科技股份有限公司 数据评估方法、装置、电子设备及存储介质
CN113269433A (zh) * 2021-05-20 2021-08-17 深圳易财信息技术有限公司 税收风险预测方法、设备、介质及计算机程序产品
CN115660410A (zh) * 2022-10-09 2023-01-31 广东迪浪科技股份有限公司 基于大数据的企业风险预测方法、控制装置及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913195A (zh) * 2016-04-29 2016-08-31 浙江汇信科技有限公司 基于全行业数据的企业金融风险评分方法
CN107945024A (zh) * 2017-12-12 2018-04-20 厦门市美亚柏科信息股份有限公司 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
CN107993143A (zh) * 2017-11-23 2018-05-04 深圳大管加软件与技术服务有限公司 一种信贷风险评估方法及系统
CN108509569A (zh) * 2018-03-26 2018-09-07 河北省科学院应用数学研究所 企业画像的生成方法、装置、电子设备以及存储介质
CN109409677A (zh) * 2018-09-27 2019-03-01 深圳壹账通智能科技有限公司 企业信用风险评估方法、装置、设备及存储介质
CN109858762A (zh) * 2018-12-29 2019-06-07 重庆誉存大数据科技有限公司 一种企业风险预测方法及装置
CN110689437A (zh) * 2019-10-08 2020-01-14 湖北电信工程有限公司 一种基于随机森林的通信施工项目财务风险预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105913195A (zh) * 2016-04-29 2016-08-31 浙江汇信科技有限公司 基于全行业数据的企业金融风险评分方法
CN107993143A (zh) * 2017-11-23 2018-05-04 深圳大管加软件与技术服务有限公司 一种信贷风险评估方法及系统
CN107945024A (zh) * 2017-12-12 2018-04-20 厦门市美亚柏科信息股份有限公司 识别互联网金融借贷企业经营异常的方法、终端设备及存储介质
CN108509569A (zh) * 2018-03-26 2018-09-07 河北省科学院应用数学研究所 企业画像的生成方法、装置、电子设备以及存储介质
CN109409677A (zh) * 2018-09-27 2019-03-01 深圳壹账通智能科技有限公司 企业信用风险评估方法、装置、设备及存储介质
CN109858762A (zh) * 2018-12-29 2019-06-07 重庆誉存大数据科技有限公司 一种企业风险预测方法及装置
CN110689437A (zh) * 2019-10-08 2020-01-14 湖北电信工程有限公司 一种基于随机森林的通信施工项目财务风险预测方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111915155A (zh) * 2020-07-13 2020-11-10 上海冰鉴信息科技有限公司 小微企业风险等级识别方法、装置及计算机设备
CN112348353A (zh) * 2020-11-05 2021-02-09 浪潮软件股份有限公司 一种基于迁移学习的企业失信风险预测方法
CN112580992A (zh) * 2020-12-23 2021-03-30 成都数联铭品科技有限公司 类金融企业的非法集资风险监测系统
CN112580992B (zh) * 2020-12-23 2024-04-09 成都数联铭品科技有限公司 类金融企业的非法集资风险监测系统
CN112750029A (zh) * 2020-12-30 2021-05-04 北京知因智慧科技有限公司 信用风险预测方法、装置、电子设备及存储介质
CN112749742A (zh) * 2020-12-30 2021-05-04 北京知因智慧科技有限公司 源发风险分值的量化方法、量化装置及电子设备
CN112950344A (zh) * 2021-02-26 2021-06-11 平安国际智慧城市科技股份有限公司 数据评估方法、装置、电子设备及存储介质
CN112907097A (zh) * 2021-03-08 2021-06-04 北京科技大学 一种深部金属矿工程开采热环境风险评价方法
CN112907097B (zh) * 2021-03-08 2024-05-17 北京科技大学 一种深部金属矿工程开采热环境风险评价方法
CN113269433A (zh) * 2021-05-20 2021-08-17 深圳易财信息技术有限公司 税收风险预测方法、设备、介质及计算机程序产品
CN113269433B (zh) * 2021-05-20 2023-12-12 深圳易财信息技术有限公司 税收风险预测方法、设备、介质及计算机程序产品
CN115660410A (zh) * 2022-10-09 2023-01-31 广东迪浪科技股份有限公司 基于大数据的企业风险预测方法、控制装置及存储介质

Similar Documents

Publication Publication Date Title
CN110930250A (zh) 企业信用风险的预测方法及系统、存储介质及电子设备
Bracke et al. Machine learning explainability in finance: an application to default risk analysis
CN110188198B (zh) 一种基于知识图谱的反欺诈方法及装置
CN109409677A (zh) 企业信用风险评估方法、装置、设备及存储介质
CN104321794B (zh) 一种使用多维评级来确定一实体的未来商业可行性的系统和方法
CN110930248A (zh) 信用风险预测模型构建方法及系统、存储介质及电子设备
Mousavi et al. Multi-criteria ranking of corporate distress prediction models: empirical evaluation and methodological contributions
Chen et al. Application of random forest, rough set theory, decision tree and neural network to detect financial statement fraud–taking corporate governance into consideration
CN111461216A (zh) 一种基于机器学习的案件风险识别方法
CN113537807B (zh) 一种企业智慧风控方法及设备
Feofilovs et al. Assessment of urban resilience to natural disasters with a system dynamics tool: Case study of Latvian municipality
CN112488581A (zh) 一种智能制造能力成熟度评估模型
CN115760332A (zh) 基于企业数据分析的风险预测方法、系统、介质及设备
CN111563673A (zh) 一种计算机技术数字化程度评估方法和装置
Camelia et al. A Computational Grey Based Model for Companies Risk Forecasting.
CN112580992B (zh) 类金融企业的非法集资风险监测系统
Kipkogei et al. Business success prediction in Rwanda: a comparison of tree-based models and logistic regression classifiers
CN114781937A (zh) 一种预付卡企业风险预警方法和装置以及存储介质
Yip Business failure prediction: a case-based reasoning approach
JP2023025801A (ja) 予測装置、予測方法およびプログラム
Hondroyiannis et al. Recycling rate performance and socioeconomic determinants: Evidence from aggregate and regional data across European Union countries
Giannopoulos The effectiveness of artificial credit scoring models in predicting NPLs using micro accounting data
Farooquie et al. A grey-based approach for managing uncertainties and performance in automotive supply chains
Laitinen Financial failure of a startup: a simulation approach
Dotoli et al. Supplier evaluation and selection under uncertainty via an integrated model using cross-efficiency Data Envelopment Analysis and Monte Carlo simulation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination