CN115409421A - 风险传染模型中参数的估算方法、系统、介质及程序产品 - Google Patents
风险传染模型中参数的估算方法、系统、介质及程序产品 Download PDFInfo
- Publication number
- CN115409421A CN115409421A CN202211199954.0A CN202211199954A CN115409421A CN 115409421 A CN115409421 A CN 115409421A CN 202211199954 A CN202211199954 A CN 202211199954A CN 115409421 A CN115409421 A CN 115409421A
- Authority
- CN
- China
- Prior art keywords
- risk
- financial institutions
- analysis
- indexes
- financial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Finance (AREA)
- Technology Law (AREA)
- Accounting & Taxation (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请涉及金融行业的风险控制技术领域。提供了一种风险传染模型中参数的估算方法、系统、介质及程序产品。该方法包括:预处理步骤;账龄分析及标注步骤,基于历史数据对不同分类下的金融机构分别进行账龄分析,以将金融机构进一步区分为不同的样本子集;指标选择步骤,为不同的样本子集分别选定用于衡量金融机构是否有被传染风险的衡量指标,中选取预测能力高于预定的阈值的衡量指标作为建模指标;单变量分析步骤,对每一个建模指标进行分箱分析,以分箱的边界值作为风险预警阈值;参数计算模块,将风险预警阈值作为已知值代入回归模型,得到参数的值。本申请可以得到更贴合实际,更真实准确的风险传染的分析结果。
Description
技术领域
本申请涉及金融行业的风险控制技术领域,尤其涉及一种风险传染模型中参数的估算方法、系统、介质及程序产品。
背景技术
金融机构日常的经营活动总是与大量的资金往来相关,因此,风险控制是金融机构最为关注的事项。金融风险指的是与金融有关的风险,如金融市场风险、金融产品风险、金融机构风险等。一家金融机构发生的风险后,与其有业务往来的其他金融机构往往会受到波及,金融风险可能会以一传十,十传百的方式传递开来。因此,一家金融机构在具体的金融交易活动中出现的风险,不仅对该金融机构的生存构成威胁还可能对整个金融体系的稳健运行构成威胁。
为了及早发现,从而控制金融风险的传递,需要对风险传染进行分析。
传统的对于风险传染的分析通常需要大量的人力去分析企业之间的关联关系,并在某一企业出现风险后,对于其供应链上下游、有控股、有流水交易、担保关系等等关联企业进行一一的排查。而通常一个金融机构的关联企业会比较多,纯人工排查效率较低,同时由于风险的传染并不是实时出现,存在着一定时间的潜伏期,人工排查发现风险传染的准确率也很低。
随着金融科技的发展,目前行业内通常会通过建立风险传染模型来监控风险传染的路径和分析所造成的影响。
然而,现有的模型中,一些参数,例如压力测试参数都是简单地设定为固定值,且不同金融机构都共用这一固定的参数,从而降低了风险传染模型的有效性。
发明内容
为了解决上述的缺陷,本申请提供一种风险传染模型中参数的估算方法、系统、介质及程序产品,用以针对不同的金融机构分别估算各自的模型参数,为每个金融机构建立自己专属的风险传染模型,从而提高模型的有效性。
第一方面,本申请提供种风险传染模型中的参数的估算方法,包括:
预处理步骤,对获取到的历史数据进行预处理,以及对金融机构进行分类;
账龄分析及标注步骤,基于所述历史数据对不同分类下的金融机构分别进行账龄分析,并根据所述账龄分析的结果对所述金融机构进行标注,以将所述金融机构进一步区分为不同的样本子集;
指标选择步骤,为所述不同的样本子集分别选定用于衡量所述金融机构是否有被传染风险的衡量指标,并对每一个所述衡量指标进行预测能力的分析,从中选取所述预测能力高于预定的阈值的衡量指标作为建模指标;
单变量分析步骤,对每一个所述建模指标进行分箱分析,并确定分箱的边界,以分箱的边界值作为风险预警阈值;
参数计算模块,以所述建模指标为自变量,所述参数为因变量,建立所述风险传染模型的回归模型,将所述风险预警阈值作为已知值代入所述回归模型,得到所述参数的值
上述的系统中,所述预处理步骤进一步包括:在选定的时间窗口内获取预定的金融机构之间的交易数据,计算所述金融机构在所述时间窗口内的基础违约损失率。
上述的系统中,所述预处理步骤进一步包括:按所具有的风险特征的不同,对所述金融机构进行分类。
上述的系统中,所述账龄分析及标注步骤进一步包括:在所述账龄分析的基础上,根据所述金融机构在表现期是否出现过违约逾期的情况来对所述金融机构进行标注,以将所述金融机构区分为有逾期的机构和无逾期的机构。
上述的系统中,所述指标选择步骤进一步包括:为不同分类下的金融机构分别选定衡量指标;针对账龄分析及标注步骤中所得到的所述的不同的样本子集,分别对衡量指标进行IV值分析,选取其中IV值超过预定的IV阈值的所述衡量指标作为相应的样本子集的建模指标。
第二方面,本申请提供一种风险传染模型中的参数的估算系统,包括:
预处理模块,用于对获取到的历史数据进行预处理,以及对金融机构进行分类;
账龄分析和标注模块,基于所述历史数据对不同分类下的金融机构分别进行账龄分析,并根据所述账龄分析的结果对所述金融机构进行标注,以将所述金融机构进一步区分为不同的样本子集;
指标选择模块,用于为所述不同的样本子集分别选定用于衡量所述金融机构是否有被传染风险的衡量指标,并对每一个所述衡量指标进行预测能力的分析,从中选取所述预测能力高于预定的阈值的衡量指标作为建模指标;
单变量分析模块,基于所述指标选择模块选出的所述建模指标,对每一个所述建模指标进行分箱分析,并确定分箱的边界,以分箱的边界值作为风险预警阈值;
参数计算模块,以所述建模指标为自变量,所述参数为因变量,建立所述风险传染模型的回归模型,将所述风险预警阈值作为已知值代入所述回归模型,得到所述参数的值
第三方面,本申请还提供了一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现上述的系统。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现上述的系统。
第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的系统。
相对于现有技术,本申请为风险传染模型中的重要参数违约损失率(Loss GivenDefault,LGD)的预警值建立估算模型,将LGD分解为与之相关联的若干分解指标,对这些分解指标分别进行分析,按照这些分解指标与LGD的相关性强弱排序后,设定这些分解指标的预警阈值。当不同的分解指标达到不同的预警阈值时,所对应的LGD各不相同,从而可以从不同的指标维度来设定不同的LGD值,从而可以得到针对单个机构的风险传染模型,从而可以得到更贴合实际,更真实准确的风险传染的分析结果。
进一步地,还可以结合误杀率、召回率等其他参数进行单因素分析,设定上述分解指标的预警阈值。从而使得预警更准确。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1为金融机构之间风险传染网络示意图;
图2为现有技术与本发明的计算方法之间的对比图;
图3为根据本申请一些实施例提出的金融风险传染模型中的参数估算方法的流程图;
图4为账龄分析的曲线图;
图5为根据本申请一些实施例提出的金融风险传染模型中的参数估算系统的模块图;
图6为根据本申请一些实施例供的电子设备的硬件结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其他优点及功效。虽然本发明的描述将结合较佳实施例一起介绍,但这并不代表此发明的特征仅限于该实施方式。恰恰相反,结合实施方式作发明介绍的目的是为了覆盖基于本发明的权利要求而有可能延伸出的其它选择或改造。为了提供对本发明的深度了解,以下描述中将包含许多具体的细节。本发明也可以不使用这些细节实施。此外,为了避免混乱或模糊本发明的重点,有些具体细节将在描述中被省略。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
应注意的是,在本说明书中,相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,默认为同一定义。
还需声明的是,本发明中对方法、流程进行编号是为了便于引用,而不是限定先后顺序,各步骤之间如有先后顺序,当以文字说明为准。
术语解释:
同业资金:同业资金是指具有法人资格的金融机构及经法人授权的金融分支机构之间进行短期资金融通的行为,金融机构之间的短期资金融通,目的在于调剂头寸和临时性资金余缺。
LGD:违约损失率(LGD,Loss Given Default),违约损失率是指债务人一旦违约将给债权人造成的资产损失的比例,即损失的严重程度。
分箱:在用逻辑回归模型进行评级、预测等开发过程中,变量需要进行分箱操作才能放入模型当中。对于数值型变量,将其分为若干有限的几个分段。例如,将资产分为<30K,30K~500K,500k~1000k,>1000k等多个段。对于类别型变量,如果取值个数很多,将其合并为个数较少的几个分段。例如,将学历分为{本科以下},{本科、硕士},{博士},其它。
IV值:IV值的计算以WOE值为基础,在对变量进行分箱之后,针对每箱计算其WOE值,WOE值表示当前分箱中坏人数量占所有样本中坏人数量的比例。而IV值表示WOE值加权和,用来表示特征对目标预测的贡献城市,即指标特征的预测能力。
风险传染:基于企业所处的各类关联关系联通体拓扑结构,当风险事件发生后,该事件在通体内,通过关联关系路径、在一定时间内,由一家企业传导至另一家企业的可能性。
多边概率整合:一个企业会同时受多个风险客户的影响,从而有多个风险传导概率结果,多边概率整合即将受到的多个风险客户影响进行整合。
时间窗口:根据对于建模周期的需求,将历史数据在时间维度上切分成若干个数据集,进而为模型训练提供数据素材。观察点的设计依据业务运用模型的实际需求,即何时需要隐性关联关系挖掘模型对企业的隐性关联关系进行预测,常见有季末、半年末等;观察点以前将选定固定时期作为观察期,从而构建训练集的特征变量(X变量);观察点以后同样选定固定时期作为表现期,即收集客户样本在观察点之后的表现,进而构建训练集的目标变量(Y变量)。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
本发明的发明构思的重点在于,针对不同的机构或个人基于不同的指标分别计算或估算专门的违约损失率(Loss Given Default,LGD),从而可以从多个维度计算一个机构(j机构)受到另一个机构(i机构)的影响而产生的资金损失额,且该资金损失额是比较接近事实,比较可信的。相对于现有技术中较为僵化的为所有机构或个人都设定同一个LGD的计算方法,本发明提供的技术方案能够基于更可信的资金损失额来进一步分析风险传染的严重程度,在此基础上得到的严重程度分析也相应地更接近可能发生的事实。
图1为金融机构之间风险传染网络示意图。企业的风险不只是跟自身的经营情况相关,也跟他的直接关联企业和间接关联企业相关。企业和企业之间,企业和人之间可以形成一个非常复杂的网络。图中列举了发生风险的机构11,一级关联机构12a、12b和12c,二级关联机构13a~13e。其中,各机构也可以是个人用户,图中为了简洁,采用了简略的说法。图中,发生风险的机构11,一级关联机构12a、12b和12c,二级关联机构13a~13e构成了多层次的、相互交叉的传染网络,针对这样的复杂的网络,需要量化一个机构产生风险对其他机构产生多大影响,从而可以建立风险传染的计算模型。风险传染模型可以解决企业对风险评估的难题。
基于金融机构间同业数据信息,可以对图1所示的金融业风险传染网络作如下设定:网络节点(例如图1中所示的一级关联机构和二级关联机构)为不同的金融机构(也可以为自然人),连接各节点的线为金融机构间的同业资金往来。假设整个网络中有n家金融机构,它们之间的资金往来构成一个n×n的矩阵M,称之为同业资金矩阵。在某时点,金融机构间同业资金矩阵M如下:
其中,任意一个元素Mij(i,j≤n)表示在某时点上金融机构j对金融机构i融出资金所形成的同业资产规模。
基于上述的设定,目前常用的风险传染监测方法有如下两种。
其一,假设体系中金融机构i发生同业资金违约,那么与其有同业往来的j金融机构所受到的损失为:
ΔMij=Mij×LGD+∑M*j×LS (2)
其中,LGD表示金融机构i违约后,金融机构j对金融机构i同业资产的违约损失率(Loss Given Default,LGD);LS表示所有与金融机构j有同业资金往来的其他金融机构因受到金融机构i对金融机构j违约的影响,因市场预期渠道或非理性心理恐慌而收回对金融机构j的同业融出资金,进而导致金融机构j因流动性困难而产生的损失率。
如果j金融机构的资本金在抵补损失ΔMij后低于监管规定的最低资本要求,那么可认定j金融机构受到传染且也将发生同业违约。如果金融机构j违约将导致体系中其他若干家金融机构受到传染,接下来再进一步考虑其他若干家金融机构同时违约带来的传染效应,步骤不断重复,直至没有新的金融机构违约,最终可求得i金融机构因同业违约将风险传染给体系中其他金融机构的影响。
其二,假设金融机构i违约后,其与他金融机构的同业资产以及投资的SPV因交易对手违约而造成的损失比率为x%和z%;此外因为市场信息受挫,同业链条趋紧,同业融资撤回增多,单家机构为了弥补资金渠口不得不抛售资产,引起估值损失,其与其他金融机构的同业负债的损失比率y%。
假设体系中金融机构i突然发生同业资金违约,那么与其有同业往来的j金融机构所受到的损失为:
ΔMij=Mij×LGD (3)
其中,LGD表示金融机构i违约后,金融机构j对金融机构i同业资产的违约损失率(Loss Given Default,LGD)。
如果j金融机构的资本金不足以抵补损失ΔMij,那么可认定i金融机构受到传染且也将发生同业违约。如果金融机构i违约将导致体系中n家金融机构受到传染,接下来进一步考虑其他若干家金融机构同时违约带来的传染效应,步骤不断重复,直至没有新的金融机构违约,最终可求得i金融机构因同业违约将风险传染给体系中其他金融机构的影响。
根据以上的两种模型来看,风险传染的模型可以有多种,但是各模型的偏重不同。例如,公式(2)中包含多边概率整合的部分,偏重考察机构i(例如图1中的发生风险的机构11)发生风险后,整个金融网络中的所有其他机构(例如图1中的一级关联机构12a-c以及二级关联机构13a-e)对机构j(例如图1中的一级关联机构12c或二级关联机构13c)所共同造成的总的风险累积。而公式(3)则不考虑其他机构对机构j所造成的风险影响,侧重考察机构i对机构j所造成的风险影响。
但是,以上的两种模型都存在一个缺点,即无论机构i和机构j如何改变,其中的参数LGD和LS都不改变。然而,风险传染模型不应该是一尘不变的。随着各机构经营状况的改变,风险传染模型中的各种参数会出现变化;随着机构与机构之间的资金往来的状态的变化,则风险传染网络本身也可能出现变化,因此,风险随时间可能会出现变化,机构与机构之间的风险传递路径也可能出现变化。参数LGD和LS始终保持不变是不合理的。更进一步地说,无论在哪一种模型中,其参数的确定都应该有相当的依据,并根据该依据的改变而改变。
本发明提出了一种金融机构风险传染模型中的参数的估计方法,该方法通过对一段时间窗口内的机构间的资金往来的统计,计算出基础的LGD;然后根据机构类型来分类,按类别为不同机构样本分别进行账龄分析,将存在违约的机构和没有违约的机构分别标注出来;同时,为不同类型的机构设定相应的衡量指标,基于选定的衡量指标进行分析,通过统计分析的方法,进一步为存在违约的机构和没有违约的机构分别选择信息价值(信息量)较大的衡量指标,并为选出来的衡量指标选择阈值;然后建立回归模型,以选出来的衡量指标作为自变量,以LGD值为因变量,以选择的阈值作为已知数,得到不同指标下的不同的LGD值;基于上述的不同的LGD值,可以通过计算得到机构j在不同指标下被传染的风险,例如,在公式(1)所示的模型中,可以计算得到由于机构i违约而造成的机构j的资金损失。
图2示出了基于公式(3)所示的模型,现有技术与本发明的计算方法之间的对比图。如图所示,现有技术中,发生风险的机构11将风险传染给一级关联机构12a时,一级关联机构12a的资金损失是M12×LGD,一级关联机构12b的资金损失是M13×LGD,其中,M12和M13是公式(1)所示的资金矩阵中发生风险的机构11对一级关联机构12a和一级关联机构12b融出资金所形成的同业资产规模,LGD是基于先验的经验而人工设定的一个统一的固定数值,一级关联机构12a和一级关联机构12b均使用同一个LGD。然而,由于是人工设定的数值,给出LGD的预警意义并不大。本发明中,通过对单个机构的指标的分解,得到单个机构再不同指标维度下的多个LGD值,例如,图2中,根据本发明所提出的方法,发生风险的机构11将风险传染给一级关联机构12a的LGD值为LGD2,发生风险的机构11将风险传染给一级关联机构12b的LGD值为LGD3,一级关联机构12a和一级关联机构12b使用不同的LGD值来计算各自的资金损失。一级关联机构12a的资金损失是M12×LGD2,一级关联机构12b的资金损失是M13×LGD3。进一步地,LGD2和LGD3可以是一组一维数组,数组中的每个元素的值分别对应通过本发明的方法选出来的衡量指标。
图3示出了根据本申请一些实施例提出的金融风险传染模型中的参数估算方法的流程图。
S31-S32为预处理步骤。预处理包括对历史数据的处理和对机构的处理。对数据的处理包括筛选数据、计算基础违约损失率等,对机构的处理包括按照不同特征对金融机构进行分类。
S31:选取一段时间窗口和一组相互之间有资金往来的金融机构(也可以包括个人),获取该时间窗口内上述金融机构之间的交易数据信息,计算该时间窗口内上述金融机构的基础违约损失率(LGD),该违约损失率作为历史数据可以作为对照数据与最终算出来的LGD进行比较,以验证在新参数(新的LGD的值)下,风险传染模型推断风险传染的准确性。
具体来说,所述的交易数据信息可以包括金融机构之间的贷款金额、到期损失金额、交易时间、还款历史记录等信息。
进一步地,为了提高电子设备处理数据的准确性,还可以对数据进行清理,例如对数据进行审核和筛选,将明显不符合实际情况的噪音数据剔除。
S32:对上述的金融机构进行分类。不同类型的金融机构具有不同的风险特征,可以对应不同的指标,依据不同类型的金融机构所对应的不同指标来有针对性地对金融机构进行风险分析,能够有助于更准确的识别风险的效果。具体的,在一些实施例中,可以按金融机构是否上市来分类,在另一些实施例中,还可以按金融机构是否属于银行类来分类。以下,本说明书将进一步地将金融机构分为:上市银行机构,非上市银行机构,非银行类上市金融机构,非银行类非上市金融机构四类来对本发明提出的参数估算方法进行具体说明。
S33:根据在S32中划分的四类金融机构,分别对每一个金融机构按类别进行账龄分析。在账龄分析的基础上,根据所述金融机构在表现期内是否出现过违约逾期的情况来对所述金融机构进行标注,以将所述金融机构区分为有逾期的机构和无逾期的机构。
具体的,账龄分析可以是Vintage分析。金融行业中,Vintage分析指的是每个月贷款的资产质量情况。通过Vintage分析可以考察金融机构的“好”和“坏”,即可以分析金融机构是否应当被判定为有违约逾期的机构。
图4示出了一个账龄分析的曲线图。图中示出了某一个有借款的金融机构从2008年到2012年5年间的还款逾期的记录。图中,横轴为账龄(Month of Book,MOB),纵轴为累积逾期率。从图中可以看出,不同年份发生的借款的还款逾期率都在一段时间(若干个月,即若干次还款后)后趋向稳定。一般而言,当上升的累计违约率曲线开始呈现为明显平缓时,可以认为该机构的违约率稳定,违约风险稳定。选取贷款日期起,至曲线趋向平缓的起点之间的时段作为表现期窗口。例如,根据图4可知,图4所示的金融机构的这一表现期窗口大约为24个月。
根据在该表现期窗口时段内是否有违约逾期的情况发生,本步骤还进一步为各金融机构进行样本标注。例如,在窗口时间内有逾期发生的金融机构标注为“1”,没有逾期情况发生的标注为“0”。即被标注为“1”的机构被判定为有违约逾期,而被标注为“0”的机构被判定为无违约逾期的机构。显然,在本实施例中,被标注为“0”的金融机构是“好”机构。
回到图3。S34-S35是指标选择步骤。用来衡量金融机构运营是否良好的指标有很多种,其中与风险传染和风险监测相关的衡量指标也有好几种,而且,根据金融机构的类型的不同,衡量指标也有所不同。为了进一步简化以及抓住更主要的关键信息,还可以从衡量指标中选取几个信息含量较大的指标作为参与建模的建模指标。例如,假设在10个衡量指标中,有2个指标在指示是否有风险的方面所携有的信息量占据了所有10个衡量指标所携有的总信息量的80%以上,则可以选择该2个衡量指标作为建模指标来参与建模,以降低计算量。
S34:根据在S32中划分的四类金融机构,为各类金融机构选定衡量指标。所述衡量指标用于衡量金融机构的融入、融出资金的流向、收益等方面的风险情况。例如,对于上市银行机构,可以选取:
作为衡量指标。
对于非上市银行机构,可以选取:
作为衡量指标。
对于非银行类上市金融机构,可以选取:
作为衡量指标。
对于非银行类非上市金融机构,可以选取:
作为衡量指标。
S35:选择在步骤S33中被标注为“1”的金融机构作为样本子集,分别按4种机构类型计算样本子集的IV值,筛选出其中IV值超过IV阈值(例如,可以预设阈值为0.2)的衡量指标作为建模指标,所述建模指标参与后续的回归模型的建立,而其余的指标信息含量较低,可以舍弃。当然,选择被标注为“0”的金融机构作为样本子集也是可行的,区别在于筛选出的指标是不同的。
其中,IV值的中文含义为信息值(Information Value,IV),或者说信息量。当现实中,我们进行建模时,会使用一些方法,对自变量进行筛选后,再放入模型进行拟合训练。为了挑选入模变量需要考虑很多因素,其中,以变量的预测能力为最主要和最直接的衡量标准。而IV值能够用来衡量自变量的预测能力。在步骤S34中指定的衡量指标是人为选定的若干种自变量,通过计算IV值,可以将其中对计算风险传染的贡献比较大的衡量指标挑选出来作为参与建模的建模指标,以减少自变量的数量,降低风险传染模型的复杂度。
IV值是在证据权重(Weight of Evidence,WOE)的基础上计算得出的,需要对自变量(即衡量指标)进行分箱、离散化等数据处理过程。具体的计算过程可以参照现有的IV计算方法,此处不赘述。
S36:在步骤S35中筛选出的建模指标的基础上,对被标注为“1”的金融机构进行单变量分析。具体的,可以基于在步骤S35中的分箱结果来对每个分箱中的建模指标进行分段的分析,从而计算出不同分箱所对应的坏账率以及样本占比。
进一步地,还可以按照不同分箱对筛选出的建模指标进行计算,算出不同分箱中的样本的召回率和误杀率,从而选择合适的分箱边界,以作为相应的单变量的风险预警阈值。其中,还可以根据分箱的划分的不同,选择多个风险预警阈值,例如,相应于分箱划分的分位数较小的边界,可以设定为轻度风险预警阈值;相应于分箱划分的分位数居中的边界,可以设定为中度风险预警阈值;相应于分箱划分的分位数较高的边界,可以设定为重度风险预警阈值。
S37-S38是参数计算步骤。将LGD作为因变量,通过回归计算得出确定的值,然后代回例如公式(1)或(2)的回归模型中,建立用以监测风险传染程度的计算模型。
S37:为4类金融机构分别建立回归风险传染模型,该模型可以是本说明之前提到的公式(2)或公式(3)或其他现有技术中使用的风险传染模型的变形。本步骤中,以LGD值为因变量y,以在步骤S35中选择出来的建模指标为自变量集合(x1,x2,x3,…,xn),其中n为正整数。模型建成后,以在步骤S36中选定的各风险预警阈值作为自变量代入上述的回归风险传染模型,得到LGD的值。
具体的,以轻度风险预警阈值作为自变量集合代入模型时,得到的LGD值是低风险情况下的LGD值,以中度风险预警阈值作为自变量集合代入模型时,得到的LGD值是中风险情况下的LGD值,以重度风险预警阈值作为自变量集合代入模型时,得到的LGD值是高风险情况下的LGD值。也就是说,对应多种风险预警阈值可以得到不同LGD,从而为用户在监测、评判风险传染时提供多种选择。
S38:将计算出的LGD值作为固定参数代回步骤S37中所使用的回归风险传染模型(例如公式(1))中,得到改进的风险传染模型。该模型是基于能够有效指示风险传染程度的建模指标而建立的,很好地弥补了目前运用方法的不足与局限性,达到了科学、有效、准确的风险识别方法的技术效果。
进一步地,可以定期执行上述的S31-S38,及时更新LGD的值,以建立更适合变化的金融环境的风险传染模型。
图5示出了根据本申请一些实施例提出的金融风险传染模型中的参数估算系统的模块图。
预处理模块51用于对历史数据和对机构进行处理。对数据的处理包括筛选数据、计算基础违约损失率等,对机构的处理包括按照不同特征对金融机构进行分类。具体可参考对步骤S31和S32的说明。
账龄分析和标注模块52用于在账龄分析的基础上对金融机构进行标注,将金融机构分为有违约记录的机构和无违约记录的机构两个样本子集。对应于为金融机构进行了分类(本发明的实施例中将机构分为了4类),可以在分类的基础上将所有金融机构样本分为8个样本子集。具体可参考对步骤33的说明。
指标选择模块53用于为每一个样本子集选择合适的指标以参与建模。也可以根据需要为其中一个样本子集选择合适的指标。具体可参考对步骤34和步骤35的说明。
单变量分析模块54用于设定风险预警阈值。例如,可以通过分箱法使得数据呈现明显离散化,从而从中选取出阈值。具体可参考对步骤36的说明。
参数计算模块55用于建立回归风险传染模型,先以某一参数(例如LGD)作为因变量,计算出该参数的值,然后将其代回回归风险传染模型中建立改进后的风险传染模型。具体可参考对步骤37和步骤38的说明。
上述的参数估算系统可以根据选定的几个可以指示风险传染的指标来计算风险传染模型中的某一参数,例如该参数可以是LGD,改变现有技术中通常依靠人工的经验来粗放地设定LGD的现状,将LGD的取值与金融机构的一些特征指标项关联起来,使得参数的设定有可信的依据,计算出的参数能使估算系统的估算结果(期望值)更贴近实际值。
本申请实施例提供的电子设备,可以是上述实施例的终端设备。图6示出了该电子设备的基本硬件结构示意图。
如图6所示,电子设备100至少包括主处理器101和存储介质103,根据实际使用需求的不同,电子设备100还可以包括协处理器102、I/O单元104、网络通信单元105和一些其他扩展单元106。其中协处理器102、I/O单元104、网络通信单元105和其他扩展单元106的可选择性用虚线体现在图中。
主处理器101和/或协处理器102用于执行存储在存储介质103中的计算机指令,以实现本发明所提出的方法。主处理器101是电子设备100的控制中心,通常为通用处理器(例如,英特尔各系列的CPU),可以较为均衡地实现逻辑处理和算术计算。主处理器101利用各种接口连接整个电子设备100的各个部分,通过运行或执行存储在存储介质103内的软件程序,以及调用存储在存储介质103内的数据,来实现电子设备100的各种功能,从而对电子设备100进行整体监控。
协处理器102通常是专用处理器(例如,用户可编程的嵌入式微处理器),用来实现某一项单一功能。例如,协处理器102可以是图像处理器(GPU,Graphic Process Unit),专用于处理图形图像的处理。主处理器101此时不直接处理有关图形图像的信息,而是向协处理器102提供来自其他单元的数据或者向协处理器102发送管理指令,以指示协处理器102从其他单元获取数据,并且,在协处理器102处理完数据后,主处理器101从协处理器102接收处理结果,以便后续根据该处理结果做出其他判决。对于不同专业领域来说,协处理器102还可以是信号处理器、网络通信处理器、复杂计算处理器等。通常,协处理器102的硬件实现基础是数字信号处理(DSP,Digital Signal Process)芯片,或者复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)等专用集成电路(ASIC,Application Specific IntegratedCircuit)。
存储介质103可以包括内部存储器和外部存储器,或者还可以包括易失性存储器和非易失性存储器,或者还可以包括磁性存储装置、固态存储器、闪存、软盘和硬盘等。存储介质103可用于存储操作系统(例如,可以由主处理器101来执行)及该操作系统在运行过程中产生的数据、应用软件的软件程序及该应用软件在运行过程中产生的数据、专用模块的软件程序(例如,可以由某一协处理器102来执行)及该程序在运行过程中产生的数据。例如,本发明的一个实施例中,主处理器101通过运行存储在存储介质103内的监测程序,来执行各种功能应用以及数据处理。在一些实施例中,存储介质103还可以是相对于主处理器101远程设置的远程存储器(相对通常意义上的存储器而言),这些远程存储器可以通过网络连接的方式(例如通过网络通信设备105)连接到主处理器101或某一协处理器102。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
I/O(Input/Output,输入输出)单元104包括信息的输入设备和信息的输出设备,其使得用户能够与电子设备100进行交互。输入设备可用于接收输入的数字或字符信息,具体可以包括:键盘、鼠标、操作杆、触摸输入设备或者轨迹球等。输出设备可以用于输出/显示经电子设备100处理的处理结果,该处理结果可以是根据输入设备输入的信息而做出的。具体的,输出设备可以包括:液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等。
网络通信单元105通过有/无线网络的连接来实现电子设备100与远程的各种设备之间的通信,从而使得电子设备100还可以与远程的设备(例如,前文所述的远程存储器)交换数据。或者,电子设备100还可以通过网络通信单元105实现与其他电子设备(例如安装有客户端的电子设备)的连接,从而使得电子设备100可以作为大型系统中的一部分,与其他电子设备进行交互。
其他扩展单元106包括多种外围组件及其接口,从而使得电子设备100可以与多种设备进行交互。例如,通过蓝牙接口,可以与蓝牙耳机连接,从而电子设备100播放的音频可以被蓝牙耳机接收。又如,通过总线接口(例如RS-485总线),电子设备100可以与一些传感器连接,从而获得一些监测数据来辅助电子设备100来实现特定功能。在各种实施例中,其他扩展接口106可以单独存在,也可以与电子设备100的其他组件集成。同时,其他扩展接口106是可选的,其任选性质用虚线表示在图中。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行上述实施例任务调度方法的技术方案。
本申请实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序,其存储在计算机可读存储介质中,至少一个处理器可以从计算机可读存储介质读取计算机程序,至少一个处理器执行计算机程序时可实现上述实施例中任务调度方法的技术方案。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
Claims (10)
1.一种风险传染模型中的参数的估算方法,其特征在于,包括:
预处理步骤,对获取到的历史数据进行预处理,以及对金融机构进行分类;
账龄分析及标注步骤,基于所述历史数据对不同分类下的金融机构分别进行账龄分析,并根据所述账龄分析的结果对所述金融机构进行标注,以将所述金融机构进一步区分为不同的样本子集;
指标选择步骤,为所述不同的样本子集分别选定用于衡量所述金融机构是否有被传染风险的衡量指标,并对每一个所述衡量指标进行预测能力的分析,从中选取所述预测能力高于预定的阈值的衡量指标作为建模指标;
单变量分析步骤,对每一个所述建模指标进行分箱分析,并确定分箱的边界,以分箱的边界值作为风险预警阈值;
参数计算模块,以所述建模指标为自变量,所述参数为因变量,建立所述风险传染模型的回归模型,将所述风险预警阈值作为已知值代入所述回归模型,得到所述参数的值。
2.根据权利要求1所述的方法,其特征在于,所述预处理步骤进一步包括:
在选定的时间窗口内获取预定的金融机构之间的交易数据,计算所述金融机构在所述时间窗口内的基础违约损失率。
3.根据权利要求1或2所述的方法,其特征在于,所述预处理步骤进一步包括:
按所具有的风险特征的不同,对所述金融机构进行分类。
4.根据权利要求1所述的方法,其特征在于,所述账龄分析及标注步骤进一步包括:
在所述账龄分析的基础上,根据所述金融机构在表现期是否出现过违约逾期的情况来对所述金融机构进行标注,以将所述金融机构区分为有逾期的机构和无逾期的机构。
5.根据权利要求1所述的方法,其特征在于,所述指标选择步骤进一步包括:
为不同分类下的金融机构分别选定衡量指标;
针对账龄分析及标注步骤中所得到的所述的不同的样本子集,分别对衡量指标进行IV值分析,选取其中IV值超过预定的IV阈值的所述衡量指标作为相应的样本子集的建模指标。
6.一种风险传染模型中的参数的估算系统,其特征在于,包括:
预处理模块,用于对获取到的历史数据进行预处理,以及对金融机构进行分类;
账龄分析和标注模块,基于所述历史数据对不同分类下的金融机构分别进行账龄分析,并根据所述账龄分析的结果对所述金融机构进行标注,以将所述金融机构进一步区分为不同的样本子集;
指标选择模块,用于为所述不同的样本子集分别选定用于衡量所述金融机构是否有被传染风险的衡量指标,并对每一个所述衡量指标进行预测能力的分析,从中选取所述预测能力高于预定的阈值的衡量指标作为建模指标;
单变量分析模块,基于所述指标选择模块选出的所述建模指标,对每一个所述建模指标进行分箱分析,并确定分箱的边界,以分箱的边界值作为风险预警阈值;
参数计算模块,以所述建模指标为自变量,所述参数为因变量,建立所述风险传染模型的回归模型,将所述风险预警阈值作为已知值代入所述回归模型,得到所述参数的值。
7.一种风险传染监测方法,其特征在于,根据如权利要求1-5任一项所述的估算方法定期估算和更新风险传染模型中的参数。
8.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-5中任一项所述的估算方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-5中任一项所述的估算方法。
10.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-5中任一项所述的估算方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211199954.0A CN115409421A (zh) | 2022-09-29 | 2022-09-29 | 风险传染模型中参数的估算方法、系统、介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211199954.0A CN115409421A (zh) | 2022-09-29 | 2022-09-29 | 风险传染模型中参数的估算方法、系统、介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115409421A true CN115409421A (zh) | 2022-11-29 |
Family
ID=84168629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211199954.0A Pending CN115409421A (zh) | 2022-09-29 | 2022-09-29 | 风险传染模型中参数的估算方法、系统、介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115409421A (zh) |
-
2022
- 2022-09-29 CN CN202211199954.0A patent/CN115409421A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bhat et al. | The implications of credit risk modeling for banks’ loan loss provisions and loan-origination procyclicality | |
US11599939B2 (en) | System, method and computer program for underwriting and processing of loans using machine learning | |
Grunert et al. | The role of non-financial factors in internal credit ratings | |
KR102009309B1 (ko) | 금융상품 관리자동화 시스템 및 관리자동화 방법 | |
Engelmann et al. | The Basel II risk parameters: estimation, validation, and stress testing | |
Stefanescu et al. | The credit rating process and estimation of transition probabilities: A Bayesian approach | |
CN109191282A (zh) | 一种基于行为模型的贷中监测评分方法以及系统 | |
Aloui et al. | Dependence and risk assessment for oil prices and exchange rate portfolios: A wavelet based approach | |
Pasiouras et al. | Multicriteria decision support methodologies for auditing decisions: The case of qualified audit reports in the UK | |
Mousavi et al. | Multi-criteria ranking of corporate distress prediction models: empirical evaluation and methodological contributions | |
CN111709826A (zh) | 目标信息确定方法和装置 | |
Jiang et al. | Does the price of strategic commodities respond to US partisan conflict? | |
Tang et al. | Institutional ownership and internal control material weakness | |
Zeng | [Retracted] Research on Risk Measurement and Early Warning of Electronic Banking Business Based on GMDH Algorithm | |
Farre-Mensa et al. | How prevalent are financial constraints in the US? | |
Parnes et al. | Prescreening bank failures with K-means clustering: Pros and cons | |
CN115409421A (zh) | 风险传染模型中参数的估算方法、系统、介质及程序产品 | |
Eko et al. | Improving credit scoring model of mortgage financing with smote methods in sharia banking | |
Terzi et al. | Comparison of financial distress prediction models: Evidence from turkey | |
Rezazadeh et al. | The Effect of Disclosure Quality on Shareholder Behavior with Emphasis on the Biological Characteristics of the Reporting Unit | |
Matoussi et al. | Using a neural network-based methodology for credit–risk evaluation of a Tunisian bank | |
Aliyev et al. | Is public distrust to the finance sector warranted? Evidence from the extent of financial adviser misconduct | |
Parnes | A spline hazard model for current expected credit losses | |
Szenes et al. | Modelling Corporate Probability of Default: A Possible Supervisory Benchmark Model | |
Baklouti et al. | The loan officer’s subjective judgment and its role in microfinance institutions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |