CN112734567A - 宏观违约风险模型训练方法、信用评价方法及装置 - Google Patents

宏观违约风险模型训练方法、信用评价方法及装置 Download PDF

Info

Publication number
CN112734567A
CN112734567A CN202110084913.6A CN202110084913A CN112734567A CN 112734567 A CN112734567 A CN 112734567A CN 202110084913 A CN202110084913 A CN 202110084913A CN 112734567 A CN112734567 A CN 112734567A
Authority
CN
China
Prior art keywords
model
macro
risk
determining
mesoscopic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110084913.6A
Other languages
English (en)
Inventor
陈惊雷
黄昶君
王雪
房雯雯
罗晔
孙昊
杨菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCB Finetech Co Ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202110084913.6A priority Critical patent/CN112734567A/zh
Publication of CN112734567A publication Critical patent/CN112734567A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种宏观违约风险模型训练方法、信用评价方法及装置,应用于金融科技技术领域,与传统风险评估模型往往只考虑了客户微观上的经营风险,忽略了来自国内外经济、行业成长周期和地区经济形势的宏中观风险相比,本申请基于经济金融理论,综合宏中观系统性风险和微观经营风险,提出了一种更科学、全面的信贷风险评价方法,能够提升风险预测的准确性。该方法可以作为传统微观风险评估模型的优化方法,解决高度动态不确定的宏中观环境给金融机构带来的风险管理问题,使传统的模型可以快速且准确地对外部环境变化做出智能化响应。

Description

宏观违约风险模型训练方法、信用评价方法及装置
技术领域
本申请涉及金融科技技术领域,具体而言,本申请涉及一种宏观违约风险模型训练方法、信用评价方法及装置。
背景技术
宏观环境的动态变化为金融机构信贷风险管理,尤其是对公信贷业务,带来了新的挑战。当前,国际国内形势正在发生着深刻的变化,经济金融格局也在不断调整。中国宏观经济正逐步从投资拉动型发展为高储蓄率支撑下的消费驱动型,一些传统领域的产能过剩问题不断显现,在国内总体经济从高速度增长模式向高质量增长模式改革的进程中,无论是实体经济还是金融系统都面临着不断积累的风险。与此同时,以民生改善为背景的产业、产品、服务、技术运用等进入前所未有的新发展阶段,各种制度红利、人口红利、生态红利、资源红利日渐式微,亟需优化资源、提升结构、加快经济转型。
企业的经营绩效与每个人的经济收入往往受外部宏观环境的影响,该影响在不同地域和行业中存在着差异。传统评分卡模型往往忽略了外部市场环境对客户收入的影响,在宏观环境恶化时往往会造成整体违约率的升高。如何快速且准确地对外部环境变化做出智能化响应,提高整体信用评价系统的准确性与稳定性是本发明要解决的主要问题。
发明内容
本申请提供了一种宏观违约风险模型训练方法、信用评价方法及装置,用于提升信用风险预测的准确性。本申请采用的技术方案如下:
第一方面,提供了一种宏观违约风险模型训练方法,包括:
定义宏观违约风险模型为:
Figure BDA0002910508050000021
其中,
Figure BDA0002910508050000022
为客户样本集合Irit违约率,函数f表示预测算法,Z表示目标宏中观经济指标及其滞后项,εrit表示随机误差项;
基于预定时间段内样本客户违约率与目标宏中观经济指标,训练宏观信用评价模型,确定模型参数。
可选地,函数f为线性回归算法、XGBoost算法、岭回归算法、SVM、随机森林、AdaBoost、决策树、深度学习算法的任一种或多种的组合。
可选地,确定客户样本集合Irit违约率包括:
获取预设历史时间段T内的样本客户;
对各个样本客户添加时间窗编号
Figure BDA0002910508050000023
行业编号i、地域编号r,从而将所有样本分割后得到集合L={Lri1,…,Lrit,…,LriT};
基于确定的各样本客户的违约情况确定各个客户样本集合Irit的违约率
Figure BDA0002910508050000024
可选地,确定目标宏中观经济指标包括:
确定多个候选宏中观指标;
基于各个候选宏中观指标在时间序列上的预测能力从多个候选宏中观指标中确定出目标宏中观指标。
可选地,候选宏中观指标包括国内外经济环境指标、行业成长周期指标、地区经济形式指标中的至少一项。
第二方面,提供了一种信用评价方法,包括:
获取当前目标宏中观经济指标,并基于预训练的宏中观信用评价模型确定宏观信用风险;
基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险。
可选地,基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险,包括:
基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的权重;
基于确定的宏中观信用评价模型与微观风险评估模型的权重,以及确定的宏观信用风险与微观信用风险确定目标客户的信用风险。
可选地,基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的权重包括:
基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的相对权重;
对宏中观信用评价模型与微观风险评估模型的相对权重进行归一化处理,得到宏中观信用评价模型与微观风险评估模型在t时刻的权重
Figure BDA0002910508050000031
Figure BDA0002910508050000032
其中K是所有模型个数,
Figure BDA0002910508050000033
表示客户i是否在有效模型Mtk中。
可选地,预训练的权重确定模型的训练过程包括:
确定模型相对权重Xikt为各模型在过去(t-T0)~t时间窗口的预测表现的函数:
Figure BDA0002910508050000034
其中,函数中包含待学习参数βt,子模型不同时刻t的预测表现为Qtk=(qtk1,…,qtkn);
针对第t个时间窗口下的样本客户i,确定第k个模型上的权重为
Figure BDA0002910508050000035
Figure BDA0002910508050000041
其中K是所有模型个数,
Figure BDA0002910508050000042
表示客户i是否在当期有效模型Mtk中;
针对第t个时间窗,确定客户i的风险评估结果为
Figure BDA0002910508050000043
基于第(t-T)~t时间窗口的样本客户信息、各样本客户在各时间窗口的违约信息、各子模型第(t-T)~t时间窗口的预测表现为Qtk=(qtk1,…,qtkn),训练确定权重计算中的参数βt
可选地,该方法还包括:
基于目标客户的客户相关信息确定目标客户的类型;
基于目标客户的类型从多个候选微观风险评估模型确定出至少一个微观风险评估模型。
第三方面,提供了宏观违约风险模型训练装置,包括:
定义模块,用于定义宏观违约风险模型为:
Figure BDA0002910508050000044
其中,
Figure BDA0002910508050000045
为客户样本集合Irit违约率,函数f表示预测算法,Z表示目标宏中观经济指标及其滞后项,εrit表示随机误差项;
训练模块,用于基于预定时间段内样本客户违约率与目标宏中观经济指标,训练宏观信用评价模型,确定模型参数。
可选地,函数f为线性回归算法、XGBoost算法、岭回归算法、SVM、随机森林、AdaBoost、决策树、深度学习算法的任一种或多种的组合。
可选地,该装置包括:
第一获取模块,用于获取预设历史时间段T内的样本客户;
分割模块,用于对各个样本客户添加时间窗编号
Figure BDA0002910508050000046
行业编号i、地域编号r,从而将所有样本分割后得到集合L={Lri1,…,Lrit,…,LriT};
第一确定模块,用于基于确定的各样本客户的违约情况确定各个客户样本集合Irit的违约率
Figure BDA0002910508050000051
可选地,该装置还包括:
第二确定模块,用于确定多个候选宏中观指标;
第三确定模块,用于基于各个候选宏中观指标在时间序列上的预测能力从多个候选宏中观指标中确定出目标宏中观指标。
可选地,候选宏中观指标包括国内外经济环境指标、行业成长周期指标、地区经济形式指标中的至少一项。
第四方面,提供了一种信用评价装置,包括:
第二获取模块,用于获取当前目标宏中观经济指标,并基于预训练的宏中观信用评价模型确定宏观信用风险;
第四确定模块,用于基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险。
可选地,第四确定模块包括:
第一确定单元,用于基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的权重;
第二确定单元,用于基于确定的宏中观信用评价模型与微观风险评估模型的权重,以及确定的宏观信用风险与微观信用风险确定目标客户的信用风险。
可选地,第一确定单元,具体用于基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的相对权重;
以及具体用于对宏中观信用评价模型与微观风险评估模型的相对权重进行归一化处理,得到宏中观信用评价模型与微观风险评估模型在t时刻的权重
Figure BDA0002910508050000061
其中K是所有模型个数,
Figure BDA0002910508050000062
表示客户i是否在有效模型Mtk中。
可选地,该装置还包括:
训练模块,用于确定模型相对权重Xikt为各模型在过去(t-T0)~t时间窗口的预测表现的函数:
Figure BDA0002910508050000063
其中,函数中包含待学习参数βt,子模型不同时刻t的预测表现为Qtk=(qtk1,…,qtkn);
以及用于针对第t个时间窗口下的样本客户i,确定第k个模型上的权重为
Figure BDA0002910508050000064
其中K是所有模型个数,
Figure BDA0002910508050000065
表示客户i是否在当期有效模型Mtk中;
以及用于针对第t个时间窗,确定客户i的风险评估结果为
Figure BDA0002910508050000066
Figure BDA0002910508050000067
以及用于基于第(t-T)~t时间窗口的样本客户信息、各样本客户在各时间窗口的违约信息、各子模型第(t-T)~t时间窗口的预测表现为Qtk=(qtk1,…,qtkn),训练确定权重计算中的参数βt
可选地,该装置还包括:
第五确定模块,用于基于目标客户的客户相关信息确定目标客户的类型;
第六确定模块,用于基于目标客户的类型从多个候选微观风险评估模型确定出至少一个微观风险评估模型。
第五方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行第一方面和/或第二方面所示的方法。
第六方面,提供了一种计算机可读存储介质,计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行第一方面和/或第二方面所示的方法。
本申请提供了一种宏观违约风险模型训练方法、信用评价方法及装置,本申请通过获取当前目标宏中观经济指标,并基于预训练的宏中观信用评价模型确定宏观信用风险;基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险。即与传统风险评估模型往往只考虑了客户微观上的经营风险,忽略了来自国内外经济、行业成长周期和地区经济形势的宏中观风险相比。本申请基于经济金融理论,综合宏中观系统性风险和微观经营风险,提出了一种更科学、全面的信贷风险评价方法,能够提升风险预测的准确性。该方法可以作为传统微观风险评估模型的优化方法,解决高度动态不确定的宏中观环境给金融机构带来的风险管理问题,使传统的模型可以快速且准确地对外部环境变化做出智能化响应。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例的一种宏观违约风险模型训练方法的流程示意图;
图2为本申请实施例的信用评价方法的流程示意图;
图3为本申请实施例的宏观违约风险模型训练装置的结构示意图;
图4为本申请实施例的信用评价装置的结构示意图;
图5为本申请实施例的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,各实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本申请的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例提供了一种宏观违约风险模型训练方法,如图1所示,该方法可以包括以下步骤:
步骤S101,定义宏观违约风险模型为:
Figure BDA0002910508050000091
其中,
Figure BDA0002910508050000092
为客户样本集合Irit违约率,函数f表示预测算法,Z表示目标宏中观经济指标及其滞后项,εrit表示随机误差项;
步骤S102,基于预定时间段内样本客户违约率与目标宏中观经济指标,训练宏观信用评价模型,确定模型参数。
其中,客户违约率为各目标宏观经济指标的相关函数,其中定义宏观违约风险为客户违约率。
本申请实施例提供了一种可能的实现方式,具体的,函数f为线性回归算法、XGBoost算法、岭回归算法、SVM、随机森林、AdaBoost、决策树、深度学习算法的任一种或多种的组合。
本申请实施例提供了一种可能的实现方式,具体的,确定客户样本集合Irit违约率包括:
获取预设历史时间段T内的样本客户;
对各个样本客户添加时间窗编号
Figure BDA0002910508050000093
行业编号i、地域编号r,从而将所有样本分割后得到集合L={Lri1,…,Lrit,…,LriT};
基于确定的各样本客户的违约情况确定各个客户样本集合Irit的违约率
Figure BDA0002910508050000094
本申请实施例提供了一种可能的实现方式,具体的,确定目标宏中观经济指标包括:
确定多个候选宏中观指标;
基于各个候选宏中观指标在时间序列上的预测能力从多个候选宏中观指标中确定出目标宏中观指标。
本申请实施例提供了一种可能的实现方式,具体的,候选宏中观指标包括国内外经济环境指标、行业成长周期指标、地区经济形式指标中的至少一项。
示例性地,宏观违约风险模型的训练过程包括如下步骤:
1.数据接入层:
获取过去预设时间段T内的样本客户,并对每个样本添加时间窗编号
Figure BDA0002910508050000101
(比如,t代表一个月)、行业编号i、地域编号r,从而将所有样本分割后得到集合L={Lri1,…,Lrit,…,LriT};
获取每个时间窗口下的宏中观指标,如国内外经济环境、行业成长周期、地区经济形式等;
2.数据准备层:
定义各地区、行业的宏观违约风险,为当前该地区、行业的客户整体违约率水平;计算每个客户样本集合Irit的违约率
Figure BDA0002910508050000102
对不同的行业或地区层面的宏中观经济指标Zrit及其滞后项
Figure BDA0002910508050000103
进行筛选,针对每个指标检测其时间序列上的预测能力,从全量的指标列表中删除预测能力较差的指标,构建新的指标集合。
3.宏观风险训练层:
定义不同地区、行业的宏观风险为各宏观指标的相关函数:
Figure BDA0002910508050000104
其中函数f表示预测算法(例如,普通线性回归或XGBoost等非线性算法),Z表示行业或地区层面的宏中观经济指标及其滞后项,εrit表示随机误差项;
基于预设时间段T内的样本客户违约情况与宏中观指标,训练宏观风险预测模型,获得模型参数;
获取基于历史宏中观数据得到的历史宏观风险估计结果:
Figure BDA0002910508050000111
4.微观与宏观风险集成层:
获取历史客户样本集L在传统风险模型上的微观风险结果{Pl}与宏观风险模型上对应的宏观风险结果
Figure BDA0002910508050000112
定义客户l的信用违约风险为宏观风险与微观风险的相关函数:
Figure BDA0002910508050000113
基于历史客户的违约情况数据、客户微观风险预测结果、宏中观风险预测结果,以最优化模型预测表现为目标,计算模型参数。
示例性地,以小微企业贷前申请为实施例,展示本发明系统对传统小微企业信贷申请评分卡的优化改进。
模型训练:
1.获取过去三年的小微企业申贷债项数据、各债项l在传统申请评分卡模型上的微观风险评估结果Pl,以及过去三年每月的宏中观指标Zrit,包括了省市地区、行业和全国三个层面的经济环境,例如各省的CPI同比、PPI同比、工业增加值同比、用电量同比、灯光强度同比指标,各行业的万得证监会行业指数上月收益率,全国的人民币兑美元汇率、能源/煤焦钢/化工商品指数上月收益率、经济政策不确定性指数(EPU指数)等指标;
2.以月份为时间窗口,计算每月各省各行业的申请债项的违约率结果
Figure BDA0002910508050000121
3.计算每个宏中观经济指标Zrit的预测能力,本实施例中使用线性回归的计算方式,即
Figure BDA0002910508050000122
以线性回归的R2为该指标预测能力的评价标准,基于各宏中观指标的预测结果筛选高预测能力的指标,剔除没有预测能力或能力较低的变量;
4.基于筛选后的宏中观指标对宏观系统风险(各省各行业的平均违约率)进行拟合训练,考虑到不同宏中观变量与系统风险之间可能存在非线性关系,本实施例中使用极端梯度提升方法(XGBoost)进行预测训练,并基于历史宏中观数据获取历史宏观风险的估计结果
Figure BDA0002910508050000123
5.本实施例中,定义客户信用违约风险公式如下:
Figure BDA0002910508050000124
其中,Pl是客户的微观风险评估结果,
Figure BDA0002910508050000125
是地区r、行业i、时间t的总体违约水平预测值,体现了当前环境的宏观风险估计值,
Figure BDA0002910508050000126
Figure BDA0002910508050000127
反映了两者之间的交互作用;
6.以历史客户样本的风险预测AUC最大化为目标,估计参数ω0、ω1、ω2和ω3
本申请提供了一种宏观违约风险模型训练方法,为综合宏中观系统性风险和微观经营风险确定客户的信用风险提供了基础。
实施例二
本申请实施例提供了一种信用评价方法,包括:
步骤201,获取当前目标宏中观经济指标,并基于预训练的宏中观信用评价模型确定宏观信用风险;
步骤202,基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险。
本申请提供了一种信用评价方法,本申请通过获取当前目标宏中观经济指标,并基于预训练的宏中观信用评价模型确定宏观信用风险;基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险。即与传统风险评估模型往往只考虑了客户微观上的经营风险,忽略了来自国内外经济、行业成长周期和地区经济形势的宏中观风险相比。本申请基于经济金融理论,综合宏中观系统性风险和微观经营风险,提出了一种更科学、全面的信贷风险评价方法,能够提升风险预测的准确性。该方法可以作为传统微观风险评估模型的优化方法,解决高度动态不确定的宏中观环境给金融机构带来的风险管理问题,使传统的模型可以快速且准确地对外部环境变化做出智能化响应。
本申请实施例提供了一种可能的实现方式,具体的,基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险,包括:
基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的权重;
基于确定的宏中观信用评价模型与微观风险评估模型的权重,以及确定的宏观信用风险与微观信用风险确定目标客户的信用风险。
本申请实施例提供了一种可能的实现方式,具体的,基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的权重包括:
基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的相对权重;
对宏中观信用评价模型与微观风险评估模型的相对权重进行归一化处理,得到宏中观信用评价模型与微观风险评估模型在t时刻的权重
Figure BDA0002910508050000141
Figure BDA0002910508050000142
其中K是所有模型个数,
Figure BDA0002910508050000143
表示客户i是否在有效模型Mtk中。具体地,可以根据目标客户的客户信息确定目标的有效模型,如根据目标客户的行业信息确定有效的行业微观模型。
本申请实施例提供了一种可能的实现方式,具体的,预训练的权重确定模型的训练过程包括:
确定模型相对权重Xikt为各模型在过去(t-T0)~t时间窗口的预测表现的函数:
Figure BDA0002910508050000144
其中,函数中包含待学习参数βt,子模型不同时刻t的预测表现为Qtk=(qtk1,…,qtkn);
针对第t个时间窗口下的样本客户i,确定第k个模型上的权重为
Figure BDA0002910508050000145
Figure BDA0002910508050000146
其中K是所有模型个数,
Figure BDA0002910508050000147
表示客户i是否在当期有效模型Mtk中;
针对第t个时间窗,确定客户i的风险评估结果为
Figure BDA0002910508050000148
其中,pikt表示客户i在子模型的风险预测结果。
基于第(t-T)~t时间窗口的样本客户信息、各样本客户在各时间窗口的违约信息、各子模型第(t-T)~t时间窗口的预测表现为Qtk=(qtk1,…,qtkn),训练确定权重计算中的参数βt。具体地,可以采用极大似然法或者整体模型预测效果最优化方法确定权重计算中的参数βt。其中,对参数的学习除了以训练样本内最大化AUC为目标,也可以采用其他最优化模型效果的指标,例如最大化KS值,使用最大化似然估计等。
本申请实施例提供了一种可能的实现方式,进一步地,该方法还包括:
基于目标客户的客户相关信息确定目标客户的类型;
基于目标客户的类型从多个候选微观风险评估模型确定出至少一个微观风险评估模型。
示例性地,信用风险评价的流程包括如下步骤:
获取最终入模的各省市、行业、全国的宏中观预测指标,以及目标客户在原风险模型中的微观风险评估结果;
基于预训练的宏中观风险评估模型,计算目标客户当前宏中观风险估计值;
基于客户当前宏中观系统性风险与客户微观风险,计算客户最终风险评分,并输出结果。
实施例三
本申请实施例提供了一种宏观违约风险模型训练装置,包括:
定义模块301,用于定义宏观违约风险模型为:
Figure BDA0002910508050000151
其中,
Figure BDA0002910508050000152
为客户样本集合Irit违约率,函数f表示预测算法,Z表示目标宏中观经济指标及其滞后项,εrit表示随机误差项;
训练模块302,用于基于预定时间段内样本客户违约率与目标宏中观经济指标,训练宏观信用评价模型,确定模型参数。
本申请实施例提供了一种可能的实现方式,具体地,函数f为线性回归算法、XGBoost算法、岭回归算法、SVM、随机森林、AdaBoost、决策树、深度学习算法的任一种或多种的组合。
本申请实施例提供了一种可能的实现方式,具体地,该装置包括:
第一获取模块,用于获取预设历史时间段T内的样本客户;
分割模块,用于对各个样本客户添加时间窗编号
Figure BDA0002910508050000161
行业编号i、地域编号r,从而将所有样本分割后得到集合L={Lri1,…,Lrit,…,LriT};
第一确定模块,用于基于确定的各样本客户的违约情况确定各个客户样本集合Irit的违约率
Figure BDA0002910508050000162
本申请实施例提供了一种可能的实现方式,具体地,该装置还包括:
第二确定模块,用于确定多个候选宏中观指标;
第三确定模块,用于基于各个候选宏中观指标在时间序列上的预测能力从多个候选宏中观指标中确定出目标宏中观指标。
本申请实施例提供了一种可能的实现方式,具体地,候选宏中观指标包括国内外经济环境指标、行业成长周期指标、地区经济形式指标中的至少一项。
本申请实施例的有益效果同实施例一,此处不再赘述。
实施例四
本申请实施例提供了一种信用评价装置40,该装置40包括:
第二获取模块401,用于获取当前目标宏中观经济指标,并基于预训练的宏中观信用评价模型确定宏观信用风险;
第四确定模块402,用于基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险。
本申请实施例提供了一种可能的实现方式,具体地,第四确定模块包括:
第一确定单元,用于基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的权重;
第二确定单元,用于基于确定的宏中观信用评价模型与微观风险评估模型的权重,以及确定的宏观信用风险与微观信用风险确定目标客户的信用风险。
本申请实施例提供了一种可能的实现方式,具体地,第一确定单元,具体用于基于预训练的权重确定模型确定宏中观信用评价模型与微观风险评估模型的相对权重;
以及具体用于对宏中观信用评价模型与微观风险评估模型的相对权重进行归一化处理,得到宏中观信用评价模型与微观风险评估模型在t时刻的权重
Figure BDA0002910508050000171
其中K是所有模型个数,
Figure BDA0002910508050000172
表示客户i是否在有效模型Mtk中。
本申请实施例提供了一种可能的实现方式,具体地,该装置还包括:
训练模块,用于确定模型相对权重Xikt为各模型在过去(t-T0)~t时间窗口的预测表现的函数:
Figure BDA0002910508050000173
其中,函数中包含待学习参数βt,子模型不同时刻t的预测表现为Qtk=(qtk1,…,qtkn);
以及用于针对第t个时间窗口下的样本客户i,确定第k个模型上的权重为
Figure BDA0002910508050000174
其中K是所有模型个数,
Figure BDA0002910508050000175
表示客户i是否在当期有效模型Mtk中;
以及用于针对第t个时间窗,确定客户i的风险评估结果为
Figure BDA0002910508050000176
Figure BDA0002910508050000177
以及用于基于第(t-T)~t时间窗口的样本客户信息、各样本客户在各时间窗口的违约信息、各子模型第(t-T)~t时间窗口的预测表现为Qtk=(qtk1,…,qtkn),训练确定权重计算中的参数βt
本申请实施例提供了一种可能的实现方式,具体地,该装置还包括:
第五确定模块,用于基于目标客户的客户相关信息确定目标客户的类型;
第六确定模块,用于基于目标客户的类型从多个候选微观风险评估模型确定出至少一个微观风险评估模型。
本申请实施例的有益效果同实施例一,此处不再赘述。
实施例五
本申请实施例提供了一种电子设备,如图5所示,图5所示的电子设备50包括:处理器501和存储器505。其中,处理器501和存储器503相连,如通过总线502相连。进一步地,电子设备50还可以包括收发器503。需要说明的是,实际应用中收发器504不限于一个,该电子设备50的结构并不构成对本申请实施例的限定。其中,处理器501应用于本申请实施例中,用于实现图3或4所示模块的功能。收发器504包括接收机和发射机。
处理器501可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器501也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线502可包括一通路,在上述组件之间传送信息。总线502可以是PCI总线或EISA总线等。总线502可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器505可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器505用于存储执行本申请方案的应用程序代码,并由处理器501来控制执行。处理器501用于执行存储器505中存储的应用程序代码,以实现图3或图4所示实施例提供的装置的功能。
本申请实施例提供了一种电子设备,本申请基于经济金融理论,综合宏中观系统性风险和微观经营风险,提出了一种更科学、全面的信贷风险评价方法,能够提升风险预测的准确性。该方法可以作为传统微观风险评估模型的优化方法,解决高度动态不确定的宏中观环境给金融机构带来的风险管理问题,使传统的模型可以快速且准确地对外部环境变化做出智能化响应。
本申请实施例提供了一种电子设备适用于上述方法实施例。在此不再赘述。
实施例六
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述实施例中所示的方法。
本申请实施例提供了一种计算机可读存储介质,本申请基于经济金融理论,综合宏中观系统性风险和微观经营风险,提出了一种更科学、全面的信贷风险评价方法,能够提升风险预测的准确性。该方法可以作为传统微观风险评估模型的优化方法,解决高度动态不确定的宏中观环境给金融机构带来的风险管理问题,使传统的模型可以快速且准确地对外部环境变化做出智能化响应。
本申请实施例提供了一种计算机可读存储介质适用于上述方法实施例。在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (16)

1.一种宏观违约风险模型训练方法,其特征在于,包括:
定义宏观违约风险模型为:
Figure FDA0002910508040000011
其中,
Figure FDA0002910508040000012
为客户样本集合Irit违约率,函数f表示预测算法,Z表示目标宏中观经济指标及其滞后项,εrit表示随机误差项;
基于预定时间段内样本客户违约率与目标宏中观经济指标,训练宏观信用评价模型,确定模型参数。
2.根据权利要求1所述的方法,其特征在于,所述函数f为线性回归算法、XGBoost算法、岭回归算法、SVM、随机森林、AdaBoost、决策树、深度学习算法的任一种或多种的组合。
3.根据权利要求1所述的方法,其特征在于,确定客户样本集合Irit违约率包括:
获取预设历史时间段T内的样本客户;
对各个样本客户添加时间窗编号
Figure FDA0002910508040000013
行业编号i、地域编号r,从而将所有样本分割后得到集合L={Lri1,…,Lrit,…,LriT};
基于确定的各样本客户的违约情况确定各个客户样本集合Irit的违约率
Figure FDA0002910508040000014
4.根据权利要求1所述的方法,其特征在于,确定所述目标宏中观经济指标包括:
确定多个候选宏中观指标;
基于各个候选宏中观指标在时间序列上的预测能力从所述多个候选宏中观指标中确定出目标宏中观指标。
5.根据权利要求1所述的方法,其特征在于,所述候选宏中观指标包括国内外经济环境指标、行业成长周期指标、地区经济形式指标中的至少一项。
6.一种信用评价方法,其特征在于,包括:
获取当前目标宏中观经济指标,并基于预训练的宏中观信用评价模型确定宏观信用风险;
基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险。
7.根据权利要求6所述的方法,其特征在于,所述基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险,包括:
基于预训练的权重确定模型确定所述宏中观信用评价模型与所述微观风险评估模型的权重;
基于确定的所述宏中观信用评价模型与所述微观风险评估模型的权重,以及确定的宏观信用风险与微观信用风险确定目标客户的信用风险。
8.根据权利要求7所述的方法,其特征在于,所述基于预训练的权重确定模型确定所述宏中观信用评价模型与所述微观风险评估模型的权重包括:
基于预训练的权重确定模型确定所述宏中观信用评价模型与所述微观风险评估模型的相对权重;
对所述宏中观信用评价模型与所述微观风险评估模型的相对权重进行归一化处理,得到所述宏中观信用评价模型与所述微观风险评估模型在t时刻的权重
Figure FDA0002910508040000031
其中K是所有模型个数,
Figure FDA0002910508040000032
表示客户i是否在有效模型Mtk中。
9.根据权利要求7或8所述的方法,其特征在于,预训练的权重确定模型的训练过程包括:
确定模型相对权重Xikt为各模型在过去(t-T0)~t时间窗口的预测表现的函数:
Figure FDA0002910508040000033
其中,函数中包含待学习参数βt,子模型不同时刻t的预测表现为Qtk=(qtk1,…,qtkn);
针对第t个时间窗口下的样本客户i,确定第k个模型上的权重为
Figure FDA0002910508040000034
Figure FDA0002910508040000035
其中K是所有模型个数,
Figure FDA0002910508040000036
表示客户i是否在当期有效模型Mtk中;
针对第t个时间窗,确定客户i的风险评估结果为
Figure FDA0002910508040000037
基于第(t-T)~t时间窗口的样本客户信息、各所述样本客户在各时间窗口的违约信息、各子模型第(t-T)~t时间窗口的预测表现为Qtk=qtk1,…,qtkn),训练确定权重计算中的参数βt
10.根据权利要求7所述的方法,其特征在于,该方法还包括:
基于目标客户的客户相关信息确定目标客户的类型;
基于目标客户的类型从多个候选微观风险评估模型确定出至少一个微观风险评估模型。
11.一种宏观违约风险模型训练装置,其特征在于,包括:
定义模块,用于定义宏观违约风险模型为:
Figure FDA0002910508040000041
其中,
Figure FDA0002910508040000042
为客户样本集合Irit违约率,函数f表示预测算法,Z表示目标宏中观经济指标及其滞后项,εrit表示随机误差项;
训练模块,用于基于预定时间段内样本客户违约率与目标宏中观经济指标,训练宏观信用评价模型,确定模型参数。
12.一种信用评价装置,其特征在于,包括:
第二获取模块,用于获取当前目标宏中观经济指标,并基于预训练的宏中观信用评价模型确定宏观信用风险;
第四确定模块,用于基于确定的宏观信用风险与目标客户在微观风险评估模型中的微观信用风险确定目标客户的信用风险。
13.根据权利要求6所述的装置,其特征在于,所述第四确定模块包括:
第一确定单元,用于基于预训练的权重确定模型确定所述宏中观信用评价模型与所述微观风险评估模型的权重;
第二确定单元,用于基于确定的所述宏中观信用评价模型与所述微观风险评估模型的权重,以及确定的宏观信用风险与微观信用风险确定目标客户的信用风险。
14.根据权利要求7或8所述的装置,其特征在于,该装置还包括:
训练模块,用于确定模型相对权重Xikt为各模型在过去(t-T0)~t时间窗口的预测表现的函数:
Figure FDA0002910508040000051
其中,函数中包含待学习参数βt,子模型不同时刻t的预测表现为Qtk=(qtk1,…,qtkn);
以及用于针对第t个时间窗口下的样本客户i,确定第k个模型上的权重为
Figure FDA0002910508040000052
其中K是所有模型个数,
Figure FDA0002910508040000053
表示客户i是否在当期有效模型Mtk中;
以及用于针对第t个时间窗,确定客户i的风险评估结果为
Figure FDA0002910508040000054
Figure FDA0002910508040000055
以及用于基于第(t-T)~t时间窗口的样本客户信息、各所述样本客户在各时间窗口的违约信息、各子模型第(t-T)~t时间窗口的预测表现为Qtk=(qtk1,…,qtkn),训练确定权重计算中的参数βt
15.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1至10任一项所述的方法。
16.一种计算机可读存储介质,其特征在于,所述计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至10中任一项所述的方法。
CN202110084913.6A 2021-01-22 2021-01-22 宏观违约风险模型训练方法、信用评价方法及装置 Pending CN112734567A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110084913.6A CN112734567A (zh) 2021-01-22 2021-01-22 宏观违约风险模型训练方法、信用评价方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110084913.6A CN112734567A (zh) 2021-01-22 2021-01-22 宏观违约风险模型训练方法、信用评价方法及装置

Publications (1)

Publication Number Publication Date
CN112734567A true CN112734567A (zh) 2021-04-30

Family

ID=75594915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110084913.6A Pending CN112734567A (zh) 2021-01-22 2021-01-22 宏观违约风险模型训练方法、信用评价方法及装置

Country Status (1)

Country Link
CN (1) CN112734567A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113222414A (zh) * 2021-05-14 2021-08-06 北京百度网讯科技有限公司 模型稳定性的评估方法、装置、电子设备和存储介质
CN114692973A (zh) * 2022-04-02 2022-07-01 中国建设银行股份有限公司 一种数据处理方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111311030A (zh) * 2020-03-27 2020-06-19 中国工商银行股份有限公司 基于影响因素检测的用户信用风险预测方法及装置
CN112053234A (zh) * 2020-09-04 2020-12-08 天元大数据信用管理有限公司 基于宏观区域经济指数与微观因素的企业信用评级方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111311030A (zh) * 2020-03-27 2020-06-19 中国工商银行股份有限公司 基于影响因素检测的用户信用风险预测方法及装置
CN112053234A (zh) * 2020-09-04 2020-12-08 天元大数据信用管理有限公司 基于宏观区域经济指数与微观因素的企业信用评级方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113222414A (zh) * 2021-05-14 2021-08-06 北京百度网讯科技有限公司 模型稳定性的评估方法、装置、电子设备和存储介质
CN113222414B (zh) * 2021-05-14 2023-09-29 北京百度网讯科技有限公司 模型稳定性的评估方法、装置、电子设备和存储介质
CN114692973A (zh) * 2022-04-02 2022-07-01 中国建设银行股份有限公司 一种数据处理方法及装置

Similar Documents

Publication Publication Date Title
Bastani et al. Wide and deep learning for peer-to-peer lending
Roy et al. A credit scoring model for SMEs using AHP and TOPSIS
Yang et al. ENHANCING FINANCIAL SERVICES THROUGH BIG DATA AND AI-DRIVEN CUSTOMER INSIGHTS AND RISK ANALYSIS
CN112734567A (zh) 宏观违约风险模型训练方法、信用评价方法及装置
Kim et al. Tutorial on time series prediction using 1D-CNN and BiLSTM: A case example of peak electricity demand and system marginal price prediction
CN112330153A (zh) 基于非线性正交回归的行业规模预测模型建模方法及装置
Ma et al. An intelligent retrofit decision-making model for building program planning considering tacit knowledge and multiple objectives
Cai et al. Credit Payment Fraud detection model based on TabNet and Xgboot
Zhang A deep learning model for ERP enterprise financial management system
CN107704944B (zh) 一种基于信息论学习的股市波动区间预测模型的构建方法
CN112766814A (zh) 一种信用风险压力测试模型的训练方法、装置及设备
Fang et al. An attention-based deep learning model for multi-horizon time series forecasting by considering periodic characteristic
Fazlollahi et al. Predicting Cryptocurrency Price Returns by Using Deep Learning Model of Technical Analysis Indicators
Puglia et al. Neural networks, the treasury yield curve, and recession forecasting
Hui Comparison and application of logistic regression and support vector machine in tax forecasting
Wen Application of Clustering Algorithm in Corporate Strategy and Risk
CN114140158A (zh) 基于组合预测的配电网投资需求确定方法、装置、设备及存储介质
Tagawa et al. Prospect theory-based formulation of portfolio optimization problem using loan and its solution by multi-start local search
Sun et al. A GD‐PSO Algorithm for Smart Transportation Supply Chain ABS Portfolio Optimization
Dhokane et al. Stock market prediction using the LSTM algorithm in association with the Relative Strength Index (RSI) and Exponential Moving Average (EMA) indicators.
Liskina Study of a Three-Factor Dynamical System of the Regional Economy Including Final Consumption and Limited Resources
Liu Labor Market Resource Allocation Optimization Based on Principal Component Analysis
Zhang et al. Research on P2P Default Risk Prediction Based on Logistic Regression
Michael A battle of pooled and panel data in credit risk modelling
Zhang [Retracted] Measurement of Economic Fluctuations Based on High‐Frequency Financial Time Series

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination