CN112712424B - 一种测度非预期损失的消费金融风险评估方法 - Google Patents
一种测度非预期损失的消费金融风险评估方法 Download PDFInfo
- Publication number
- CN112712424B CN112712424B CN202011420996.3A CN202011420996A CN112712424B CN 112712424 B CN112712424 B CN 112712424B CN 202011420996 A CN202011420996 A CN 202011420996A CN 112712424 B CN112712424 B CN 112712424B
- Authority
- CN
- China
- Prior art keywords
- user
- default
- default probability
- probability
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种测度非预期损失的消费金融风险评估方法,包括:从一定量的历史数据中提取不同类型的用户信息及其对应的违约信息,将之转换为通用格式,构建反欺诈数据集;接收增量用户的用户信息,提取与违约概率相关的用户属性,对其进行分类,根据反欺诈数据集中同类型用户对应的历史违约概率计算得到正常经济环境下该用户的预估违约概率;对计算得到的预估违约概率进行偏差修正;获取当前经济环境因素,计算其对预估违约概率的影响,调整得到最终的评估违约概率;计算得到该用户对应的非预期损失。本发明能够通过横向对比已有违约情况,通过分析过去违约用户的信息量推算同类型用户的违约概率,从而较为准确地预测非预期损失。
Description
技术领域
本发明涉及技术领域,具体而言涉及一种测度非预期损失的消费金融风险评估方法。
背景技术
在消费金融公司的业务中,存在两种损失:期望损失和非预期损失。对信贷业务影响比较大的不是期望损失,而是非预期损失,因为前者是可以知道的,后者是具有波动性的资产价值的潜在损失。非预期损失随容忍度的改变而不同、银行承担的风险正是这种预料外或由不确定因素造成的潜在损失,这种损失也正是需要由资本弥补的部分。消费金融公司受限于监管,在希望利益最大化和损失最小化的情况下,希望能明确可能的非预期损失,这样才能更加方便的开展和推广业务。
在非期望损失计算中存在几个不确定项,在传统银行的信贷场景中,银行常采用信用评级数据和大量历史数据进行违约概率建模估计;而对于消费金融公司,存在着数据匮乏的困境,采用消费金融公司已有信用评级数据建模出来的违约概率可能不是非常精准,会出现肥尾情况,如图2所示,使消费金融司难以如传统银行业一般利用信用评级数据对非期望损失进行直接计算。因此亟需一种能够测度非预期损失的消费金融风险评估方法,对非预期损失进行精准估算。
发明内容
本发明针对现有技术中的不足,提供一种测度非预期损失的消费金融风险评估方法,通过横向对比已有违约情况,通过分析过去违约用户的信息量推算同类型用户的违约概率,从而较为准确地预测非预期损失。
为实现上述目的,本发明采用以下技术方案:
一种测度非预期损失的消费金融风险评估方法,所述评估方法包括以下步骤:
S1,从一定量的历史数据中提取不同类型的用户信息及其对应的违约信息,将之转换为通用格式,构建反欺诈数据集,所述反欺诈数据集包括每个用户的用户属性、每个用户属性与违约概率的相关性和历史违约概率;
S2,接收增量用户的用户信息,提取与违约概率相关的用户属性,对其进行分类,根据反欺诈数据集中同类型用户对应的历史违约概率计算得到正常经济环境下该用户的预估违约概率;
S3,对计算得到的预估违约概率进行偏差修正;
S4,获取当前经济环境因素,计算其对预估违约概率的影响,调整得到最终的评估违约概率;
S5,根据步骤S4中的评估违约概率计算得到该用户对应的非预期损失。
为优化上述技术方案,采取的具体措施还包括:
进一步地,所述用户属性包括年收入、持有房产情况、婚育情况、年龄范围、借贷次数、性别、工作行业、职位、借贷金额范围、借贷期限、历史逾期情况、浏览购物商品信息、操作APP习惯和借贷原由中的几种或者全部。
进一步地,步骤S1中,所述历史数据包括消费金融公司通过自有业务或联合业务积累的内部用户违约数据及相关信息,和通过第三方数据公司获取的部分匿名用户违约数据及相关信息。
进一步地,步骤S2中,所述提取与违约概率相关的用户属性,对其进行分类的过程包括以下步骤:
S11,划分用户属性类型,所述用户属性类型包括数值型变量和字符型变量;
S12,随机选取k个初始原型;
S13,针对数据集中的每个样本点,计算样本点与k个原型的距离,其中,数值型变量计算欧氏距离,类别型变量计算汉明距离,将样本点划分到离它最近的中心点所对应的类别中;
S14,类别划分完成后,重新确定类别的原型,数值型变量样本取值的均值作为新的原型的特征取值,类别型变量样本取值的众数作为新的原型的特征取值;
S15,重复步骤S13至S14,直到没有样本改变类别,返回最后的聚类结果。
进一步地,步骤S2中,根据下述公式计算正常经济环境下该用户的预估违约概率Hnew(X):
式中,C为常数,p(xi)为用户属性xi对应的违约概率,通过对用户属性xi采用线归分析得到,X={xi},i=1,2,...,n。
进一步地,步骤S3中,基于历史用户实际违约概率和对应的预估违约概率,采用对数似然估计方法对计算得到的增量用户的预估违约概率进行偏差修正。
进一步地,步骤S4中,采用下述公式计算得到最终的评估违约概率Hnew(X|Y):
Hnew(X,Y)=Hnew(X)-H(X|Y)
H(X|Y)=Hold(X)-Hold(X|Y)
式中,H(X|Y)为在外部经济环境因素Y条件下用户属性集合X的不确定性;H(X,Y)为联合熵,用户属性集合X和外部经济环境因素Y一起发生时的不确定性,Hold(X)为正常经济环境下用户属性集合X对应的历史违约概率,Hold(X|Y)为外部经济环境因素Y下用户属性集合X对应的历史违约概率。
进一步地,步骤S5中,根据下述公式计算得到用户对应的非预期损失UL:
式中:
UL是非预期损失;
EAD是借款金额;
Hnew(X,Y):增量用户的评估违约概率;
LGD:违约损失率,LGD固定为1;
本发明的有益效果是:
(1)凭借积累的较大量的用户违约数据和用户画像数据,通过横向对比已有违约情况,通过分析过去违约用户的信息量推算同类型用户的违约概率,从而较为准确地预测非预期损失,减少对信用评级数据的依赖度。
(2)将影响用户违约的因素分为内外两种,以自身原因为根本,结合外部经济环境调整得到更为精确的增量用户的评估违约概率。
附图说明
图1是本发明的测度非预期损失的消费金融风险评估方法流程图。
图2是肥尾左偏示意图。
图3是本发明的用户画像示意图。
图4是本发明的聚类结果示意图。
具体实施方式
现在结合附图对本发明作进一步详细的说明。
需要注意的是,发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
结合图1,本发明提及一种测度非预期损失的消费金融风险评估方法,评估方法包括以下步骤:
S1,从一定量的历史数据中提取不同类型的用户信息及其对应的违约信息,将之转换为通用格式,构建反欺诈数据集,所述反欺诈数据集包括每个用户的用户属性、每个用户属性与违约概率的相关性和历史违约概率。
S2,接收增量用户的用户信息,提取与违约概率相关的用户属性,对其进行分类,根据反欺诈数据集中同类型用户对应的历史违约概率计算得到正常经济环境下该用户的预估违约概率。
S3,对计算得到的预估违约概率进行偏差修正。
S4,获取当前经济环境因素,计算其对预估违约概率的影响,调整得到最终的评估违约概率。
S5,根据步骤S4中的评估违约概率计算得到该用户对应的非预期损失。
优选的,步骤S1中,所述历史数据包括消费金融公司通过自有业务或联合业务积累的内部用户违约数据及相关信息,和通过第三方数据公司获取的部分匿名用户违约数据及相关信息。由于两者的数据口径不一致,因此需要将其转化为通用格式的数据,形成类似图3所示的用户的违约数据表。
本发明认为在金融信贷场景中可以从已知推未知,例如采用“物以类聚,人以群分”的思维预估类似用户违约概率。具体的消费金融公司对用户数据进行了分类记录,记录的用户数据存在数值类型与字符类型混合数据,此时可以采用K-prototype算法对用户划分类别,结合图4,该分类过程包括以下步骤:
(1)随机选取k个初始原型(中心点)。
(2)针对数据集中的每个样本点,计算样本点与k个原型的距离(数值型变量计算欧氏距离,类别型变量计算汉明距离),将样本点划分到离它最近的中心点所对应的类别中。
(3)类别划分完成后,重新确定类别的原型,数值型变量样本取值的均值作为新的原型的特征取值,类别型变量样本取值的众数作为新的原型的特征取值。
(4)重复步骤(2)和(3),直到没有样本改变类别,返回最后的聚类结果。
最终可以得知类似用户群体。
在消费金融公司的业务场景中,用户违约概率的往往是用户的一些自身关键条件、行为或外部环境影响的,在认为类似用户行为相似情况下,就可以通过分析这些影响变量或得到类似用户的违约概率。
本发明将影响用户违约的因素可以分为内外两种,包括自身原因和经济大环境原因。
一、自身原因
本发明选用信息熵描述信贷场景中的用户违约概率,预估的用户违约概率Hnew(X)的计算公式如下:
式中,C为常数,p(xi)为用户属性xi对应的违约概率,通过对用户属性xi采用线归分析得到,X={xi},i=1,2,...,n。xi对应的用户属性包括年收入、持有房产情况、婚育情况、年龄范围、借贷次数、性别、工作行业、职位、借贷金额范围、借贷期限、历史逾期情况、浏览购物商品信息、操作APP习惯和借贷原由中的几种或者全部。
因为现有存量用户历史违约概率是已知的,所以要推出增量用户违约概率或者未来环境下的违约概率,就要通过分析出每个p(xi)具体是多少。
在仅考虑正常经济环境下用户违约数据(因为经济过度繁荣或经济衰退会产生顺周期性效果,需要刨除这部分推波助澜的效果,属于外部环境因素),通过对违约概率的线归分析(regression analysis),是可以知道因素i发生了对应的p(xi)。比方说,通过回归可以得到一些基础信息:具有男性、34-43岁、夜猫子、达到3次以上逾期等特征的人可能超过80%的违约概率。考虑到任何违约概率会存在一定的离群值,会导致违约概率的计算出现偏差,可以基于历史用户实际违约概率和对应的预估违约概率,采用对数似然估计方法对计算得到的增量用户的预估违约概率进行偏差修正。
二、外部经济环境影响
由于,外部环境并不是一层不变的。有时候,经济环境下行会导致原来一些用户违约概率上升,这时候要算出环境对不确定性的影响,需要通过下面公式进行调整,以计算得到最终的评估违约概率Hnew(X|Y):
Hnew(X,Y)=Hnew(X)-H(X|Y)
H(X|Y)=Hold(X)-Hold(X|Y)
式中,H(X|Y)为在外部经济环境因素Y条件下用户属性集合X的不确定性;H(X,Y)为联合熵,用户属性集合X和外部经济环境因素Y一起发生时的不确定性,Hold(X)为正常经济环境下用户属性集合X对应的历史违约概率,Hold(X|Y)为外部经济环境因素Y下用户属性集合X对应的历史违约概率。
最后,步骤S5中,根据下述公式计算得到用户对应的非预期损失UL:
式中:
UL是非预期损失;
EAD是借款金额;
Hnew(X,Y):增量用户的评估违约概率;
LGD:违约损失率,LGD固定为1;
由于消费金融公司中存储的用户违约数据比较多,用户画像比较全面,采用前述方法能够分析出来的信息熵是全面的,推导出来的同类用户的违约概率准确的。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
Claims (7)
1.一种测度非预期损失的消费金融风险评估方法,其特征在于,所述评估方法包括以下步骤:
S1,从一定量的历史数据中提取不同类型的用户信息及其对应的违约信息,将之转换为通用格式,构建反欺诈数据集,所述反欺诈数据集包括每个用户的用户属性、每个用户属性与违约概率的相关性和历史违约概率;
S2,接收增量用户的用户信息,提取与违约概率相关的用户属性,对其进行分类,根据反欺诈数据集中同类型用户对应的历史违约概率计算得到正常经济环境下该用户的预估违约概率;
S3,对计算得到的预估违约概率进行偏差修正;
S4,获取当前经济环境因素,计算其对预估违约概率的影响,调整得到最终的评估违约概率;
S5,根据步骤S4中的评估违约概率计算得到该用户对应的非预期损失;
步骤S2中,根据下述公式计算正常经济环境下该用户的预估违约概率Hnew(X):
式中,C为常数,p(xi)为用户属性xi对应的违约概率,通过对用户属性xi采用线归分析得到,X={xi},i=1,2,...,n。
2.根据权利要求1所述的测度非预期损失的消费金融风险评估方法,其特征在于,所述用户属性包括年收入、持有房产情况、婚育情况、年龄范围、借贷次数、性别、工作行业、职位、借贷金额范围、借贷期限、历史逾期情况、浏览购物商品信息、操作APP习惯和借贷原由中的几种或者全部。
3.根据权利要求1所述的测度非预期损失的消费金融风险评估方法,其特征在于,步骤S1中,所述历史数据包括消费金融公司通过自有业务或联合业务积累的内部用户违约数据及相关信息,和通过第三方数据公司获取的部分匿名用户违约数据及相关信息。
4.根据权利要求1所述的测度非预期损失的消费金融风险评估方法,其特征在于,步骤S2中,所述提取与违约概率相关的用户属性,对其进行分类的过程包括以下步骤:
S11,划分用户属性类型,所述用户属性类型包括数值型变量和字符型变量;
S12,随机选取k个初始原型;
S13,针对数据集中的每个样本点,计算样本点与k个原型的距离,其中,数值型变量计算欧氏距离,类别型变量计算汉明距离,将样本点划分到离它最近的中心点所对应的类别中;
S14,类别划分完成后,重新确定类别的原型,数值型变量样本取值的均值作为新的原型的特征取值,类别型变量样本取值的众数作为新的原型的特征取值;
S15,重复步骤S13至S14,直到没有样本改变类别,返回最后的聚类结果。
5.根据权利要求1所述的测度非预期损失的消费金融风险评估方法,其特征在于,步骤S3中,基于历史用户实际违约概率和对应的预估违约概率,采用对数似然估计方法对计算得到的增量用户的预估违约概率进行偏差修正。
6.根据权利要求1所述的测度非预期损失的消费金融风险评估方法,其特征在于,步骤S4中,采用下述公式计算得到最终的评估违约概率Hnew(X|Y):
Hnew(XY)=Hnew(X)-H(X|Y)
H(X|Y)=Hold(X)-Hold(X|Y)
式中,H(X|Y)为在外部经济环境因素Y条件下用户属性集合X的不确定性;H(X,Y)为联合熵,用户属性集合X和外部经济环境因素Y一起发生时的不确定性,Hold(X)为正常经济环境下用户属性集合X对应的历史违约概率,Hold(X|Y)为外部经济环境因素Y下用户属性集合X对应的历史违约概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011420996.3A CN112712424B (zh) | 2020-12-07 | 2020-12-07 | 一种测度非预期损失的消费金融风险评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011420996.3A CN112712424B (zh) | 2020-12-07 | 2020-12-07 | 一种测度非预期损失的消费金融风险评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112712424A CN112712424A (zh) | 2021-04-27 |
CN112712424B true CN112712424B (zh) | 2022-08-02 |
Family
ID=75542688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011420996.3A Active CN112712424B (zh) | 2020-12-07 | 2020-12-07 | 一种测度非预期损失的消费金融风险评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112712424B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116452323B (zh) * | 2023-04-28 | 2024-01-30 | 广州市良策网络技术有限公司 | 风险评估方法、系统、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110981A (zh) * | 2019-04-26 | 2019-08-09 | 重庆第二师范学院 | 一种信用评级违约概率测度与风险预警方法 |
CN110689427A (zh) * | 2019-10-12 | 2020-01-14 | 杭州绿度信息技术有限公司 | 一种基于生存分析的消费分期违约概率模型 |
CN111324862A (zh) * | 2020-02-10 | 2020-06-23 | 深圳华策辉弘科技有限公司 | 贷中行为监控的方法及系统 |
-
2020
- 2020-12-07 CN CN202011420996.3A patent/CN112712424B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110981A (zh) * | 2019-04-26 | 2019-08-09 | 重庆第二师范学院 | 一种信用评级违约概率测度与风险预警方法 |
CN110689427A (zh) * | 2019-10-12 | 2020-01-14 | 杭州绿度信息技术有限公司 | 一种基于生存分析的消费分期违约概率模型 |
CN111324862A (zh) * | 2020-02-10 | 2020-06-23 | 深圳华策辉弘科技有限公司 | 贷中行为监控的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112712424A (zh) | 2021-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kolassa | Combining exponential smoothing forecasts using Akaike weights | |
US8577791B2 (en) | System and computer program for modeling and pricing loan products | |
AU2014202660C1 (en) | A system and method using multi-dimensional rating to determine an entity's future commercial viability | |
US8126747B2 (en) | Method and system for evaluating insurance liabilities using stochastic modeling and sampling techniques | |
WO2013179884A1 (ja) | 企業持続性評価装置、企業持続性評価方法、及びコンピュータ読み取り可能な記録媒体 | |
Garrido et al. | A Robust profit measure for binary classification model evaluation | |
Chen et al. | Bankruptcy prediction using machine learning models with the text-based communicative value of annual reports | |
Breeden | Incorporating lifecycle and environment in loan-level forecasts and stress tests | |
CN111738504A (zh) | 企业财务指标资金量预测方法和装置、设备及存储介质 | |
CN113674040B (zh) | 车辆的报价方法、计算机设备和计算机可读存储介质 | |
CN112712424B (zh) | 一种测度非预期损失的消费金融风险评估方法 | |
Elalem et al. | A machine learning-based framework for forecasting sales of new products with short life cycles using deep neural networks | |
CN115062087A (zh) | 一种用户画像构建方法、装置、设备和介质 | |
KR102217886B1 (ko) | 빅데이터 기반 상품 투자 추천 알고리즘의 최적 가중치를 인공지능을 이용하여 탐색하는 시스템 및 방법 | |
US20190050373A1 (en) | Apparatus, method, and program for calculating explanatory variable values | |
CN113344692B (zh) | 多信息源融合的网络借贷信用风险评估模型的建立方法 | |
Aleandri | Modeling dynamic policyholder behaviour through machine learning techniques | |
CN111737308A (zh) | 基于最小熵分值的股票交易点预测方法、系统及存储介质 | |
Dixon et al. | A Bayesian approach to ranking private companies based on predictive indicators | |
TW202318320A (zh) | 投資推薦方法及系統 | |
Edbrooke | Time Series Modelling Technique Analysis for Enterprise Stress Testing | |
US7660735B1 (en) | Method and system for creation of consumer segmentations using maturation and exogenous curves | |
Feng et al. | Contextual Data-Integrated Newsvendor Solution with Operational Data Analytics (ODA) | |
KR20230094936A (ko) | 근무행동 데이터를 활용한 행동주의 대안신용평가 모델 및 그 제공 방법 | |
CN118035654A (zh) | 基于量化业务数据的企业内控评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder |
Address after: No.88, Huaihai Road, Qinhuai District, Nanjing, Jiangsu 210001 Patentee after: Nanyin Faba Consumer Finance Co.,Ltd. Address before: No.88, Huaihai Road, Qinhuai District, Nanjing, Jiangsu 210001 Patentee before: SUNING CONSUMER FINANCE Co.,Ltd. |
|
CP01 | Change in the name or title of a patent holder |