CN112308293A - 违约概率预测方法及装置 - Google Patents

违约概率预测方法及装置 Download PDF

Info

Publication number
CN112308293A
CN112308293A CN202011080645.2A CN202011080645A CN112308293A CN 112308293 A CN112308293 A CN 112308293A CN 202011080645 A CN202011080645 A CN 202011080645A CN 112308293 A CN112308293 A CN 112308293A
Authority
CN
China
Prior art keywords
probability
prediction
predicted
default
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011080645.2A
Other languages
English (en)
Inventor
贺欧文
卜志成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shell Time Network Technology Co ltd
Original Assignee
Beijing Shell Time Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shell Time Network Technology Co ltd filed Critical Beijing Shell Time Network Technology Co ltd
Priority to CN202011080645.2A priority Critical patent/CN112308293A/zh
Publication of CN112308293A publication Critical patent/CN112308293A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Mathematical Optimization (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种违约概率预测方法及装置,其中,该方法包括:将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率;若根据待预测目标对应的行业特征获知需修正初步预测概率,则对初步预测概率进行修正,获取待预测目标的违约概率预测结果;其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。本发明实施例提供的违约概率预测方法及装置,根据待预测目标对应的行业特征获知需修正初步预测概率时,对初步预测概率进行修正,获取待预测目标的违约概率预测结果,能对违约概率进行带有周期性波动调整的预测,能获得更准确的违约概率预测结果。

Description

违约概率预测方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种违约概率预测方法及装置。
背景技术
在对企业或个人进行违约概率预测时,通常是根据待预测目标的基本信息和财务数据等基础数据,获得概率预测特征之后,将待预测目标的概率预测特征输入违约概率预测模型,输出待预测目标的违约概率预测结果。
现有方法容易出现预测结果与违约概率的自然周期产生共振的情况,导致预测结果滞后于企业的实际违约可能性,会增大违约概率预测的不确定性和错误率。
发明内容
本发明实施例提供一种违约概率预测方法及装置,用以解决现有技术中的预测结果不准确缺陷,实现更准确的违约概率预测。
本发明实施例提供一种违约概率预测方法,包括:
将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率;
若根据所述待预测目标对应的行业特征获知需修正所述初步预测概率,则对所述初步预测概率进行修正,获取所述待预测目标的违约概率预测结果;
其中,所述违约概率预测模型,是以概率预测特征样本数据为样本,以所述概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
根据本发明一个实施例的违约概率预测方法,所述若根据所述待预测目标对应的行业特征获知需修正所述初步预测概率,则对所述初步预测概率进行修正,获取所述待预测目标的违约概率预测结果的具体步骤包括:
若根据所述待预测目标对应的行业特征获知当前时刻处于违约概率的扩张周期,则根据预设的第一算法,调高所述初步预测概率,获取所述待预测目标的违约概率预测结果。
根据本发明一个实施例的违约概率预测方法,所述若根据所述待预测目标对应的行业特征获知需修正所述初步预测概率,则对所述初步预测概率进行修正,获取所述待预测目标的违约概率预测结果的具体步骤还包括:
若根据所述待预测目标对应的行业特征获知当前时刻处于违约概率的收缩周期,则根据预设的第二算法,调低所述初步预测概率,获取所述待预测目标的违约概率预测结果。
根据本发明一个实施例的违约概率预测方法,所述将待预测目标的概率预测特征输入违约概率预测模型,输出所述初步预测概率之前,还包括:
获取所述待预测目标的概率预测特征。
根据本发明一个实施例的违约概率预测方法,所述获取所述待预测目标的概率预测特征的具体步骤包括:
根据所述待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率,作为所述待预测目标的概率预测特征。
根据本发明一个实施例的违约概率预测方法,所述将待预测目标的概率预测特征输入违约概率预测模型,输出所述初步预测概率的具体步骤包括:
将每一所述待预测目标的概率预测特征输入所述违约概率预测模型中的预测子模型,获取所述待预测目标的原始预测结果;
根据各所述待预测目标的原始预测结果对各所述待预测目标进行聚类,根据聚类结果,获取每个类对应的初步预测概率,作为所述每个类中的待预测目标的初步预测概率。
根据本发明一个实施例的违约概率预测方法,所述根据所述待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率的具体步骤包括:
根据所述待预测目标在所述时间段内的基础数据和预设的时间窗口,获取所述时间段的各子时间段对应的基础数据的滑动平均值,获得滑动平均值曲线;
获取每一所述特征时间对应的所述滑动平均值曲线的导数,作为所述基础数据在所述特征时间的变化率;
其中,所述时间窗口,为时长等于所述子时间段的时长的大于1的整数倍的时间段。
本发明实施例还提供一种违约概率预测装置,包括:
预测模块,用于将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率;
修正模块,用于若根据所述待预测目标对应的行业特征获知需修正所述初步预测概率,则对所述初步预测概率进行修正,获取所述待预测目标的违约概率预测结果;
其中,所述违约概率预测模型,是以概率预测特征样本数据为样本,以所述概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述违约概率预测方法的步骤。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述违约概率预测方法的步骤。
本发明实施例提供的违约概率预测方法及装置,根据待预测目标对应的行业特征获知需修正初步预测概率时,对初步预测概率进行修正,获取待预测目标的违约概率预测结果,能对违约概率进行带有周期性波动调整的预测,能降低顺周期概率预测带来的共振效应,能避免严重的误判情况发生,能获得更准确的违约概率预测结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种违约概率预测方法的流程示意图;
图2是本发明实施例提供的一种违约概率预测装置的结构示意图;
图3是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了克服现有技术的上述问题,本发明实施例提供一种违约概率预测方法及装置,其发明构思是,根据待预测目标对应的行业特征,判断根据违约概率预测模型获得的初步预测概率,是否与违约概率的自然周期产生共振,如果产生共振,则进行相应的修正,以获取更准确的违约概率预测结果。
图1是本发明实施例提供的一种违约概率预测方法的流程示意图。下面结合图1描述本发明实施例的违约概率预测方法。如图1所示,该方法包括:步骤S101、将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率。
其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
具体地,概率预测特征,是根据基础数据中的各指标,预先确定的若干个合适的用于输入违约概率预测模型的指标。
预先确定的每一个用于输入回归模型的指标,可以是基础数据中的各指标中的某一个,也可以是基础数据中的各指标中某些指标的线性或非线性组合。
基础数据,指与待预测目标的风险状况存在一定相关性的人员、资金、交易和知识产权等方面的数据。
基础数据,可以包括一项或多项。
待预测目标,可以为企业或个人等实体。
需要说明的是,违约概率预测模型,可以是基于任一种机器学习算法构建的模型。违约概率预测模型,通常为非时间序列模型。
在步骤S101之前,可以将概率预测特征样本数据作为样本,将概率预测特征样本数据对应的未违约或违约数据作为样本标签,对违约概率预测模型进行训练,获得训练好的违约概率预测模型。
训练好的违约概率预测模型,可以用于对待预测目标的违约概率进行预测。
可以对样本企业在历史时间段内的基础数据进行特征提取,获取样本企业的基础数据在历史时间段内各特征时间的变化率,作为概率预测特征样本数据。
预测特征样本数据对应的未违约或违约数据,指该历史时间段结束后,该样本企业是否违约。如果违约,则为违约数据,该违约数据可以用1表示;如果未违约,则为未违约数据,该未违约数据可以用0表示。
步骤S102、若根据待预测目标对应的行业特征获知需修正初步预测概率,则对初步预测概率进行修正,获取待预测目标的违约概率预测结果。
具体地,可以采用自回归或移动平均等时间序列模型对待预测目标、所属的行业或宏观经济数据进行拟合和周期性描述。
例如,若待预测目标属于房地产企业,则可以选取该企业各月的销售额和成交套数,房产行业房屋新建开工面积,国内生产总值和房产投资额等数据中的至少一种作为行业特征,进行时间序列模型拟合和周期性分析。
通过拟合和周期性分析,可以获知是否需要修正初步预测概率。
可以根据拟合出的时间序列模型,借用量化交易中的MACD(异同移动平均线,Moving Average Convergence/Divergence)背离条件来判断时点上升或下降的趋势,从而找到违约概率的自然周期内,行业特征的背离点作为信号,采用逆周期的思想,根据其趋势对初步预测概率进行小幅修正,获得待预测目标的违约概率预测结果。
MACD的精髓在于通过顶背离和底背离,来判断大顶和大底。MACD背离是指前后波段的行业特征走势与MACD指标走向不同步的现象,有两个条件:第一,行业特征前后相邻两拨走势一定要沿着同一趋势创出新高或新低;第二,行业特征创新高或新低后对应MACD柱峰却没有创新高或新低。
本发明实施例根据待预测目标对应的行业特征获知需修正初步预测概率时,对初步预测概率进行修正,获取待预测目标的违约概率预测结果,能对违约概率进行带有周期性波动调整的预测,能降低顺周期概率预测带来的共振效应,能避免严重的误判情况发生,能获得更准确的违约概率预测结果。
基于上述各实施例的内容,若根据待预测目标对应的行业特征获知需修正初步预测概率,则对初步预测概率进行修正,获取待预测目标的违约概率预测结果的具体步骤包括:若根据待预测目标对应的行业特征获知当前时刻处于违约概率的扩张周期,则根据预设的第一算法,调高初步预测概率,获取待预测目标的违约概率预测结果。
具体地,如果待预测目标对应的行业特征沿着同一趋势创出新高,且行业特征的MACD指标没有创新高,说明当前时刻处于违约概率的扩张周期。
相应地,当前时刻处于违约概率的扩张周期时,为了避免或降低预测结果与违约概率的自然周期产生共振,可以根据预设的第一算法,调高初步预测概率,获取待预测目标的违约概率预测结果。
根据预设的第一算法,调高初步预测概率的具体步骤可以包括:
根据获取的第一函数中的待定参数,将确定后的上述待定参数和初步预测概率代入该第一函数中,获取待预测目标的违约概率预测结果。
该第一函数,用于调高初步预测概率。
例如,第一函数可以为初步预测概率加上调高值,也可以为初步预测概率乘以调高幅度之后,再加上初步预测概率。
上述两个例子中,调高值和调高幅度分别为第一函数中的待定参数。
第一函数中的待定参数,可以根据待预测目标的基础数据和/或对应的行业特征获取。
例如,可以根据行业特征沿着同一趋势创出新高时,行业特征的MACD指标与MACD指标在该周期内的最大值,获取调高幅度;MACD指标为90,MACD指标在该周期内的最大值为100,则可以确定调高幅度为(100-90)/100=0.1。
本发明实施例通过在当前时刻处于违约概率的扩张周期时,根据预设的第一算法,调高初步预测概率,获取待预测目标的违约概率预测结果,能避免或降低预测结果与违约概率的自然周期产生共振,能避免严重的误判情况发生,能获得更准确的违约概率预测结果。
基于上述各实施例的内容,若根据待预测目标对应的行业特征获知需修正初步预测概率,则对初步预测概率进行修正,获取待预测目标的违约概率预测结果的具体步骤还包括:若根据待预测目标对应的行业特征获知当前时刻处于违约概率的收缩周期,则根据预设的第二算法,调低初步预测概率,获取待预测目标的违约概率预测结果。
具体地,如果待预测目标对应的行业特征沿着同一趋势创出新低,且MACD指标没有创新低,说明当前时刻处于违约概率的收缩周期。
相应地,当前时刻处于违约概率的收缩周期时,为了避免或降低测结果与违约概率的自然周期产生共振,可以根据预设的第二算法,调低初步预测概率,获取待预测目标的违约概率预测结果。
根据预设的第二算法,调低初步预测概率的具体步骤可以包括:
根据获取的第二函数中的待定参数,将确定后的上述待定参数和初步预测概率代入该第二函数中,获取待预测目标的违约概率预测结果。
该第二函数,用于调低初步预测概率。
例如,第二函数可以为初步预测概率加上调低值,也可以为初步预测概率乘以调低幅度之后,再加上初步预测概率。
上述两个例子中,调低值和调低幅度分别为第二函数中的待定参数。
第二函数中的待定参数,可以根据待预测目标的基础数据和/或对应的行业特征获取。
例如,可以根据行业特征沿着同一趋势创出新低时,行业特征的MACD指标与MACD指标在该周期内的最小值,获取调低幅度;MACD指标为105,MACD指标在该周期内的最小值为100,则可以确定调低幅度为(105-100)/100=0.05。
本发明实施例通过在当前时刻处于违约概率的收缩周期时,根据预设的第二算法,调低初步预测概率,获取待预测目标的违约概率预测结果,能避免或降低预测结果与违约概率的自然周期产生共振,能避免严重的误判情况发生,能获得更准确的违约概率预测结果。
基于上述各实施例的内容,将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率之前,还包括:获取待预测目标的概率预测特征。
具体地,步骤S101之前,可以获取待预测目标的概率预测特征。
基础数据可以包括人员数据、金融数据、经营数据和工商数据中的至少一种。
待预测目标为企业时,基础数据可以包括人员数据、金融数据、经营数据和工商数据中的至少一种。
人员数据,指与待预测目标的员工有关的数据,可以包括员工数量、法人的年龄和法人的婚姻状况等,还可以包括员工数量、离职员工数量、各类型员工的数量和各类型员工的中离职数量中的至少一种。
员工数量,指现有员工的数量。
员工的类型,可以是根据年龄、性别、学历、从业年限和入职年限等标准中的至少一种确定的类型。
金融数据,可以包括贷款申请额度、还款记录和违约记录等。
经营数据,指与待预测目标的业务经营有关的数据,可以包括业绩、市值和资金流水等,还可以包括订单数量、订单成交量和订单成交率中的至少一种。
订单成交量,指成交的订单金额的总和。
订单成交率,指发出的订单中,成功进行交易的比例。
工商数据,可以包括注册资本、已成立时间和违法违规情况等。
本发明实施例通过获取待预测目标的概率预测特征,从而能基于待预测目标的概率预测特征获取初步预测概率,对初步预测概率修正以获取待预测目标的违约概率预测结果,能获得更准确的概率预测结果。
基于上述各实施例的内容,获取待预测目标的概率预测特征的具体步骤包括:根据待预测目标在预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征。
具体地,预设的时间段,可以为进行违约概率预测的时刻之前的某个时间至进行违约概率预测的时刻之间的时间段。
该时间段的时长,可以预先设定。例如,该时间段的时长为三年、一年或6个月等。对于该时间段的时长的具体取值,本发明实施例不作限定。
本发明实施例中,并不直接将基础数据作为概率预测特征,而是对基础数据进行处理,根据预先选取的该时间段中的特征时间,获取基础数据在时间段内各特征时间的变化率。
特征时间,为在该时间段内针对某一项基础数据选取的若干个时间点或子时间段。
若干个,指一个或多个。
通过选取合适的特征时间,可以使得基础数据在特征时间的变化率与违约概率存在更高的相关性。
例如,对于员工数量这一基础数据,可以选择新年前后、企业年终奖发放前后和应届生毕业时点等中的至少一个作为特征时间,还可以选择有新发布政策或其他外部因素影响的时间点等作为特征时间;对于定案成交量这一基础数据,可以选择节假日、企业推出新产品的时间点和行业规律(周期性)关键时间点等中的至少一个作为特征时间。
根据待预测目标在预设的时间段内的基础数据,可以通过计算等方法,获取基础数据在时间段内每一特征时间的变化率。
可以理解的是,基础数据在特征时间的变化率,反映的不是基础数据的绝对数量,而是基础数据的变化情况,因而是动态的特征,可以捕捉瞬时动态违约可能性,可以作为待预测目标的概率预测特征,用于预测待预测目标的违约概率。
本发明实施例通过获取待预测目标的基础数据在时间段内各特征时间的变化率,作为待预测目标的概率预测特征,根据待预测目标的概率预测特征,获取待预测目标的违约概率预测结果,采用动态的变化率作为概率预测特征,能最大限度地捕捉瞬时动态违约可能性,能对瞬时动态违约可能性进行灵敏响应,能获得更准确的违约概率预测结果,更能够反映违约可能性的变化趋势,对短期违约可能性的预警作用更加灵敏,能够有效增强违约概率预测。
基于上述各实施例的内容,将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率的具体步骤包括:将每一待预测目标的概率预测特征输入违约概率预测模型中的预测子模型,获取待预测目标的原始预测结果。
具体地,可以采用聚类的方法,先基于预测子模型,获取每个待预测目标的原始预测结果,然后利用各个待预测目标之间的相似性,根据各个待预测目标的原始预测结果进行聚类,根据聚类结果获取每个待预测目标的违约概率预测结果。
首先,分别将每一待预测目标的概率预测特征输入违约概率预测模型中的预测子模型,预测子模型输出该待预测目标的原始预测结果。
预测子模型,可以是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
概率预测特征样本数据,可以是根据样本企业在相应的历史时间段内的某一时间窗口的基础数据获得的。
概率预测特征样本数据对应的未违约或违约数据,指该历史时间段结束后,该样本企业是否违约。如果违约,则为违约数据,该违约数据可以用1表示;如果未违约,则为未违约数据,该未违约数据可以用0表示。
根据各待预测目标的原始预测结果对各待预测目标进行聚类,根据聚类结果,获取每个类对应的初步预测概率,作为每个类中的待预测目标的初步预测概率。
具体地,原始预测结果,可以是根据多个不同的特征分别获得的多个数据。
对各待预测目标进行聚类时,根据每一待预测目标的原始预测结果,将该待预测目标映射至特征空间中。
在特征空间中,根据两个待预测目标的各特征对应的原始预测结果,获取上述两个待预测目标之间的特征距离。
该特征距离可以为欧氏距离或马氏距离等任一种向量之间的距离,还可以是根据各时间窗口对应的权重进行加权之后,获得的特征距离。
两个待预测目标之间的特征距离的具体的计算公式如下:
Figure BDA0002718522370000131
其中,Xi,Xj分别表示两个待预测目标;k表示第k个时间窗口;Xik,Xjk分别表示Xi,Xj第k个时间窗口的原始预测结果;wk表示第k个时间窗口对应的权重;n表示特征的总数。
根据每两个待预测目标之间的特征距离,基于任一种聚类算法进行聚类,对各待预测目标进行聚类,将各待预测目标划分为多个类,确定每个待预测目标所属的类。
优选地,可以采用K均值聚类算法(k-means clustering algorithm),对各待预测目标进行聚类。
对各待预测目标进行聚类,可以将各待预测目标划分为多个类,确定每个待预测目标所属的类,获得聚类结果。
对于通过聚类获得的每个类,可以基于属于该类的各待预测目标原始预测结果,采用数理统计等方法,获取概率区间,作为该类对应的初步预测概率。
需要说明的是,相比属于另一个类的待预测目标,属于同一个类的各待预测目标,在行为和违约可能性上具有更高的相似性,从而可以将每个类对应的初步预测概率,作为每个类中的待预测目标的初步预测概率。
例如,对于每一时间窗口,可以基于属于该类的各待预测目标该时间窗口的原始预测结果,采用数理统计等方法,确定该时间窗口的概率上限和下限,如可以将各待预测目标该时间窗口的原始预测结果中的最大值和最小值分别作为该时间窗口的概率上限和下限,也可以将各待预测目标该时间窗口的原始预测结果的平均值分别加上和减去若干倍的标准差,获取该时间窗口的概率上限和下限;根据各时间窗口对应的权重和概率上限,获取概率区间的上限,根据各时间窗口对应的权重和概率下限,获取概率区间的下限,从而获得概率区间。
本发明实施例根据各待预测目标的原始预测结果进行聚类,获取每个类对应的初步预测概率,作为每个类中的待预测目标的初步预测概率,能提取待预测目标在不同时间段内的行为变化情况,能兼顾违约概率预测的实时性和准确性,能实现更精细的违约概率预测。
基于上述各实施例的内容,根据待预测目标在预设的时间段内的基础数据,获取基础数据在时间段内各特征时间的变化率的具体步骤包括:根据待预测目标在时间段内的基础数据和预设的时间窗口,获取时间段的各子时间段对应的基础数据的滑动平均值,获得滑动平均值曲线。
其中,时间窗口,为时长等于子时间段的时长的大于1的整数倍的时间段。
具体地,为了兼顾变化率的可比性和灵敏度,可以采用滑动时间窗口结合导数的方式,获取基础数据在特征时间的变化率。
可以理解的是,可以将该时间段划分为时间上不存在交叉的多个等时长的子时间段。
例如,时间段的时长为1年时,可以将该时间段按月划分为12个月,每个月均为一个子时间段。
预设的时间窗口是一个时间段。预设的时间窗口的时长,可以为子时间段的时长的大于1的整数倍。
例如,时间段的时长为1年,子时间段的时长为1个月或1周时,可以采用时长为1个季度的时间窗口。
滑动平均法(moving average)又称移动平均法,是在简单平均数法基础上,通过顺序逐期增减新旧数据求算移动平均值,借以消除偶然变动因素,找出事物发展趋势,并据此进行预测的方法。
对于任一子时间段,获取该子时间段对应的基础数据的滑动平均值的具体步骤包括:
根据预设的时间窗口,获取该时间窗口覆盖的多个子时间段;上述多个子时间段,以该任一子时间段为最后一个子时间段;
获取上述多个子时间段的基础数据的加权平均值,作为该任一子时间段对应的滑动平均值。
获取该时间段内各子时间段对应的基础数据的滑动平均值之后,可以获得滑动平均值曲线。
在二维平面坐标系中,该滑动平均值曲线上任一点的横坐标为时间,纵坐标为基础数据的滑动平均值。
获取每一特征时间对应的滑动平均值曲线的导数,作为基础数据在特征时间的变化率。
需要说明的是,本发明实施例中,特征时间,为在该时间段内针对某一项基础数据选取的时间点。
具体地,获得滑动平均值曲线之后,对于每一特征时间,获取该特征时间处滑动平均值曲线的导数,作为该特征时间对应的滑动平均值曲线的导数,并作为基础数据在该特征时间的变化率。
基础数据的同比变化率的可比性较高、灵敏度较低,而环比变化率的可比性较低、灵敏度较高,而通过滑动时间窗口结合导数的方式,则可以兼顾可比性和灵敏度,同时具有较高的可比性和较高的灵敏度。
本发明实施例根据预设的时间窗口,获取基础数据的滑动平均值形成的滑动平均值曲线,将滑动平均值曲线在滑动平均值曲线的导数,作为基础数据在特征时间的变化率,能兼顾动态特征的可比性和灵敏度,能有效地消除基础数据的随机波动,从而能基于动态的概率预测特征,获得更准确的违约概率预测结果。
下面对本发明实施例提供的违约概率预测装置进行描述,下文描述的违约概率预测装置与上文描述的违约概率预测方法可相互对应参照。
图2为根据本发明实施例提供的违约概率预测装置的结构示意图。基于上述各实施例的内容,如图2所示,该装置包括预测模块201和修正模块202,其中:
预测模块201,用于将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率;
修正模块202,用于若根据待预测目标对应的行业特征获知需修正初步预测概率,则对初步预测概率进行修正,获取待预测目标的违约概率预测结果;
其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
具体地,预测模块201和修正模块202电连接。
预测模块201将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率。
修正模块202可以采用自回归或移动平均等时间序列模型对待预测目标、所属的行业或宏观经济数据进行拟合和周期性描述;通过拟合和周期性分析,可以获知是否需要修正初步预测概率;若需要修正,则采用逆周期的思想,根据行业特征的趋势对初步预测概率进行小幅修正,获得待预测目标的违约概率预测结果。
本发明实施例提供的违约概率预测装置,用于执行本发明上述各实施例提供的违约概率预测方法,该违约概率预测装置包括的各模块实现相应功能的具体方法和流程详见上述违约概率预测方法的实施例,此处不再赘述。
该违约概率预测装置用于前述各实施例的违约概率预测方法。因此,在前述各实施例中的违约概率预测方法中的描述和定义,可以用于本发明实施例中各执行模块的理解。
本发明实施例根据待预测目标多个时间窗口的基础数据,获得多个时间窗口的违约概率的预测结果,根据各多个时间窗口的违约概率的预测结果和各时间窗口对应的权重进行聚类,获取每个类对应的违约概率预测结果,作为每个类中的待预测目标的违约概率预测结果,能提取待预测目标在不同时间段内的行为变化情况,能兼顾违约概率预测的实时性和准确性,能实现更精细的违约概率预测。
图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、存储器(memory)302和总线303;其中,处理器301和存储器302通过总线303完成相互间的通信;处理器301用于调用存储在存储器302中并可在处理器301上运行的计算机程序指令,以执行上述各方法实施例提供的违约概率预测方法,该方法包括:将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率;若根据待预测目标对应的行业特征获知需修正初步预测概率,则对初步预测概率进行修正,获取待预测目标的违约概率预测结果;其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
此外,上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的违约概率预测方法,该方法包括:将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率;若根据待预测目标对应的行业特征获知需修正初步预测概率,则对初步预测概率进行修正,获取待预测目标的违约概率预测结果;其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的违约概率预测方法,该方法包括:将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率;若根据待预测目标对应的行业特征获知需修正初步预测概率,则对初步预测概率进行修正,获取待预测目标的违约概率预测结果;其中,违约概率预测模型,是以概率预测特征样本数据为样本,以概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种违约概率预测方法,其特征在于,包括:
将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率;
若根据所述待预测目标对应的行业特征获知需修正所述初步预测概率,则对所述初步预测概率进行修正,获取所述待预测目标的违约概率预测结果;
其中,所述违约概率预测模型,是以概率预测特征样本数据为样本,以所述概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
2.根据权利要求1所述的违约概率预测方法,其特征在于,所述若根据所述待预测目标对应的行业特征获知需修正所述初步预测概率,则对所述初步预测概率进行修正,获取所述待预测目标的违约概率预测结果的具体步骤包括:
若根据所述待预测目标对应的行业特征获知当前时刻处于违约概率的扩张周期,则根据预设的第一算法,调高所述初步预测概率,获取所述待预测目标的违约概率预测结果。
3.根据权利要求2所述的违约概率预测方法,其特征在于,所述若根据所述待预测目标对应的行业特征获知需修正所述初步预测概率,则对所述初步预测概率进行修正,获取所述待预测目标的违约概率预测结果的具体步骤还包括:
若根据所述待预测目标对应的行业特征获知当前时刻处于违约概率的收缩周期,则根据预设的第二算法,调低所述初步预测概率,获取所述待预测目标的违约概率预测结果。
4.根据权利要求1所述的违约概率预测方法,其特征在于,所述将待预测目标的概率预测特征输入违约概率预测模型,输出所述初步预测概率之前,还包括:
获取所述待预测目标的概率预测特征。
5.根据权利要求1所述的违约概率预测方法,其特征在于,所述获取所述待预测目标的概率预测特征的具体步骤包括:
根据所述待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率,作为所述待预测目标的概率预测特征。
6.根据权利要求1至5任一所述的违约概率预测方法,其特征在于,所述将待预测目标的概率预测特征输入违约概率预测模型,输出所述初步预测概率的具体步骤包括:
将每一所述待预测目标的概率预测特征输入所述违约概率预测模型中的预测子模型,获取所述待预测目标的原始预测结果;
根据各所述待预测目标的原始预测结果对各所述待预测目标进行聚类,根据聚类结果,获取每个类对应的初步预测概率,作为所述每个类中的待预测目标的初步预测概率。
7.根据权利要求5所述的违约概率预测方法,其特征在于,所述根据所述待预测目标在预设的时间段内的基础数据,获取所述基础数据在所述时间段内各特征时间的变化率的具体步骤包括:
根据所述待预测目标在所述时间段内的基础数据和预设的时间窗口,获取所述时间段的各子时间段对应的基础数据的滑动平均值,获得滑动平均值曲线;
获取每一所述特征时间对应的所述滑动平均值曲线的导数,作为所述基础数据在所述特征时间的变化率;
其中,所述时间窗口,为时长等于所述子时间段的时长的大于1的整数倍的时间段。
8.一种违约概率预测装置,其特征在于,包括:
预测模块,用于将待预测目标的概率预测特征输入违约概率预测模型,输出初步预测概率;
修正模块,用于若根据所述待预测目标对应的行业特征获知需修正所述初步预测概率,则对所述初步预测概率进行修正,获取所述待预测目标的违约概率预测结果;
其中,所述违约概率预测模型,是以概率预测特征样本数据为样本,以所述概率预测特征样本数据对应的未违约或违约数据为样本标签进行训练后获得的。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述的违约概率预测方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至7任一项所述的违约概率预测方法的步骤。
CN202011080645.2A 2020-10-10 2020-10-10 违约概率预测方法及装置 Pending CN112308293A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011080645.2A CN112308293A (zh) 2020-10-10 2020-10-10 违约概率预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011080645.2A CN112308293A (zh) 2020-10-10 2020-10-10 违约概率预测方法及装置

Publications (1)

Publication Number Publication Date
CN112308293A true CN112308293A (zh) 2021-02-02

Family

ID=74488316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011080645.2A Pending CN112308293A (zh) 2020-10-10 2020-10-10 违约概率预测方法及装置

Country Status (1)

Country Link
CN (1) CN112308293A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409135A (zh) * 2021-06-30 2021-09-17 中国工商银行股份有限公司 模型训练方法及装置、行为预测方法及装置、设备及介质
CN113590629A (zh) * 2021-08-09 2021-11-02 马上消费金融股份有限公司 数据处理方法、违约概率模型训练方法及相关设备

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140108401A1 (en) * 2012-10-05 2014-04-17 Opera Solutions, Llc System and Method for Adjusting Distributions of Data Using Mixed Integer Programming
CN107527288A (zh) * 2017-06-16 2017-12-29 兴业数字金融服务(上海)股份有限公司 一种债券存续期风险预警系统
CN107644375A (zh) * 2016-07-22 2018-01-30 花生米浙江数据信息服务股份有限公司 一种专家模型与机器学习模型融合的小商户信用评估方法
CN109002835A (zh) * 2018-06-19 2018-12-14 西安电子科技大学 一种基于最大熵模糊聚类的粒子滤波数据关联方法
CN109657837A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 违约概率预测方法、装置、计算机设备和存储介质
CN109993348A (zh) * 2019-03-01 2019-07-09 平安科技(深圳)有限公司 对公类资产的不良概率调整方法、装置和存储介质
CN110110981A (zh) * 2019-04-26 2019-08-09 重庆第二师范学院 一种信用评级违约概率测度与风险预警方法
CN110717610A (zh) * 2018-07-11 2020-01-21 华北电力大学(保定) 一种基于数据挖掘的风电功率预测方法
CN110766168A (zh) * 2019-10-31 2020-02-07 深圳前海微众银行股份有限公司 数据处理方法、终端、装置及存储介质
CN110782339A (zh) * 2019-10-22 2020-02-11 黑龙江工业学院 一种违约概率预测方法、系统和可读存储介质
CN111178675A (zh) * 2019-12-05 2020-05-19 佰聆数据股份有限公司 基于LR-Bagging算法的电费回收风险预测方法、系统、存储介质及计算机设备
CN111191825A (zh) * 2019-12-20 2020-05-22 北京淇瑀信息科技有限公司 用户违约预测方法、装置及电子设备
CN111192140A (zh) * 2020-01-02 2020-05-22 北京明略软件系统有限公司 客户违约概率预测的方法及装置
CN111681102A (zh) * 2020-06-05 2020-09-18 深圳市卡牛科技有限公司 信贷预测方法、装置、设备和存储介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140108401A1 (en) * 2012-10-05 2014-04-17 Opera Solutions, Llc System and Method for Adjusting Distributions of Data Using Mixed Integer Programming
CN107644375A (zh) * 2016-07-22 2018-01-30 花生米浙江数据信息服务股份有限公司 一种专家模型与机器学习模型融合的小商户信用评估方法
CN107527288A (zh) * 2017-06-16 2017-12-29 兴业数字金融服务(上海)股份有限公司 一种债券存续期风险预警系统
CN109002835A (zh) * 2018-06-19 2018-12-14 西安电子科技大学 一种基于最大熵模糊聚类的粒子滤波数据关联方法
CN110717610A (zh) * 2018-07-11 2020-01-21 华北电力大学(保定) 一种基于数据挖掘的风电功率预测方法
CN109657837A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 违约概率预测方法、装置、计算机设备和存储介质
CN109993348A (zh) * 2019-03-01 2019-07-09 平安科技(深圳)有限公司 对公类资产的不良概率调整方法、装置和存储介质
CN110110981A (zh) * 2019-04-26 2019-08-09 重庆第二师范学院 一种信用评级违约概率测度与风险预警方法
CN110782339A (zh) * 2019-10-22 2020-02-11 黑龙江工业学院 一种违约概率预测方法、系统和可读存储介质
CN110766168A (zh) * 2019-10-31 2020-02-07 深圳前海微众银行股份有限公司 数据处理方法、终端、装置及存储介质
CN111178675A (zh) * 2019-12-05 2020-05-19 佰聆数据股份有限公司 基于LR-Bagging算法的电费回收风险预测方法、系统、存储介质及计算机设备
CN111191825A (zh) * 2019-12-20 2020-05-22 北京淇瑀信息科技有限公司 用户违约预测方法、装置及电子设备
CN111192140A (zh) * 2020-01-02 2020-05-22 北京明略软件系统有限公司 客户违约概率预测的方法及装置
CN111681102A (zh) * 2020-06-05 2020-09-18 深圳市卡牛科技有限公司 信贷预测方法、装置、设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
党琪: "" 交通银行D分行信贷风险评估研究"", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》, no. 01, 15 January 2019 (2019-01-15), pages 159 - 801 *
邓伟: ""基于修正KMV模型的我国上市公司信用风险度量研究"", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》, no. 06, pages 152 - 123 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409135A (zh) * 2021-06-30 2021-09-17 中国工商银行股份有限公司 模型训练方法及装置、行为预测方法及装置、设备及介质
CN113590629A (zh) * 2021-08-09 2021-11-02 马上消费金融股份有限公司 数据处理方法、违约概率模型训练方法及相关设备
CN113590629B (zh) * 2021-08-09 2024-05-24 马上消费金融股份有限公司 数据处理方法、违约概率模型训练方法及相关设备

Similar Documents

Publication Publication Date Title
US20220358528A1 (en) Methods and apparatus for self-adaptive time series forecasting engine
Nieto et al. Frontiers in VaR forecasting and backtesting
Tobback et al. Forecasting loss given default models: impact of account characteristics and the macroeconomic state
WO2019001120A1 (zh) 商品动态定价数据处理方法和系统
Bellotti et al. Retail credit stress testing using a discrete hazard model with macroeconomic factors
JP2015222596A (ja) 将来の損失に関連する頻度を予測し、損失決定ユニットの関連する自動処理のためのシステム及び方法
WO2020258994A1 (zh) 一种节点数据预测方法及装置
Bee et al. Realizing the extremes: Estimation of tail-risk measures from a high-frequency perspective
US20110153536A1 (en) Computer-Implemented Systems And Methods For Dynamic Model Switching Simulation Of Risk Factors
Li et al. Pure jump models for pricing and hedging VIX derivatives
CN112308293A (zh) 违约概率预测方法及装置
JP2016099915A (ja) 与信審査用サーバと与信審査用システム及び与信審査用プログラム
Chang et al. The accuracy of forecasts prepared for the Federal Open Market Committee
WO2021207780A1 (en) Systems, computer-implemented methods and computer programs for capital management
WO2020211245A1 (zh) 一种发展趋势数据获取方法、装置
Pirovano et al. Eurozone inflation differentials and the ECB
Jiang et al. Market effects on forecasting construction prices using vector error correction models
CN116167646A (zh) 基于交易算法的评价方法、装置、设备及存储介质
WO2022222230A1 (zh) 基于机器学习的指标预测方法、装置、设备及存储介质
CN114429367A (zh) 异常检测方法、装置、计算机设备和存储介质
Das Performance evaluation of modified adaptive Kalman filters, least means square and recursive least square methods for market risk beta and VaR estimation
CN111899093A (zh) 一种违约损失率的预测方法及装置
CN112308294A (zh) 违约概率预测方法及装置
Qi et al. Forecasting market risk using ultra-high-frequency data and scaling laws
CN112308295B (zh) 违约概率预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination