发明内容
为了解决现有技术的不足,本发明的主要目的在于提供一种违约损失率的预测方法及装置。
为了达到上述目的,第一方面本发明提供了一种违约损失率的预测方法,所述方法包括:
获取目标用户的还款状态及欠款总额,所述还款状态包括所述目标用户的还款能力及还款意愿,所述目标用户为预设平台的债务人;
根据宏观环境特征对所述还款状态进行修正,生成修正后的还款状态;
使用经训练的预设模型根据所述修正后的还款状态及所述欠款总额,预测所述目标用户在预设时间段无法偿还对所述预设平台造成的违约损失率。
在一些实施例中,所述预设模型的训练过程包括:
获取训练数据集;
使用所述训练数据集,对每一预设弱分类器进行训练,直至每一所述预设弱分类器的损失函数满足预设条件;
对经训练的所述弱分类器进行组合,生成对应的强分类器,所述经训练的预设模型由所述强分类器组成。
在一些实施例中,所述欠款总额包括所述预设平台收回所述目标用户的欠款的总成本及所述目标用户在所述预设时间段的欠款余额。
在一些实施例中,所述用户特征还包括所述目标用户的学历。
在一些实施例中,所述根据宏观环境特征对所述还款状态进行修正,生成修正后的还款状态包括:
根据宏观环境特征及所述目标用户的用户特征对所述还款状态进行修正,生成修正后的还款状态,所述用户特征包括所述目标用户的职业。
在一些实施例中,所述还款能力包括所述目标用户的收入及负债。
第二方面,本申请提出了一种违约损失率的预测装置,所述装置包括:
获取模块,用于获取目标用户的还款状态及欠款总额,所述还款状态包括所述目标用户的还款能力及还款意愿;
修正模块,用于根据宏观环境特征对所述还款状态进行修正,生成修正后的还款状态;
预测模块,用于使用经训练的预设模型根据所述修正后的还款状态及所述欠款总额,预测所述目标用户在所述预设时间段无法偿还对所述预设平台造成的违约损失率。
在一些实施例中,所述装置还包括训练模块,所述训练模块还可用于获取训练数据集,所述训练数据集包括在所述预设平台发生违约的历史用户样本,每一所述历史用户样本包括对应的还款状态、欠款总额及对所述预设平台造成的违约损失率;使用所述训练数据集,对每一预设弱分类器进行训练,直至每一所述预设弱分类器的损失函数满足预设条件,所述损失函数包括根据宏观环境特征确定的预设参数;对经训练的所述弱分类器进行组合,生成对应的强分类器,所述经训练的预设模型由所述强分类器组成。
第三方面,本申请提出了一种计算机可读存储介质,其存储有计算机指令,当所述计算机指令在计算机的处理组件上运行时,使得所述处理组件执行如上任一所述方法的步骤。
第四方面,本申请提出了一种计算机系统,所述系统包括:
一个或多个处理器;
以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
获取目标用户的还款状态及欠款总额,所述还款状态包括所述目标用户的还款能力及还款意愿,所述目标用户为预设平台的债务人;
根据宏观环境特征对所述还款状态进行修正,生成修正后的还款状态;
使用经训练的预设模型根据所述修正后的还款状态及所述欠款总额,预测所述目标用户在预设时间段无法偿还对所述预设平台造成的违约损失率。
本发明实现的有益效果为:
本申请提出了一种违约损失率的预测方法包括:获取目标用户的还款状态及欠款总额,所述还款状态包括所述目标用户的还款能力及还款意愿,所述目标用户为预设平台的债务人;根据宏观环境特征对所述还款状态进行修正,生成修正后的还款状态;使用经训练的预设模型根据所述修正后的还款状态及所述欠款总额,预测所述目标用户在预设时间段无法偿还对所述预设平台造成的违约损失率,在预测目标用户的违约损失率的过程中考虑到了宏观环境的改变,可实时根据实时情况或预测情况调整宏观环境特征,使得预测的违约损失率能够适应长周期的宏观变化,保证了预测的违约损失率的准确性,提高了金融机构的风险计量水平;
进一步地,本申请还提出了根据宏观环境特征对所述还款状态进行修正,生成修正后的还款状态包括:根据宏观环境特征及所述目标用户的用户特征对所述还款状态进行修正,生成修正后的还款状态,进一步保证修正后的还款状态能够代表用户的真实还款状态,保障了预测的准确性。
本发明所有产品并不需要具备上述所有效果。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
违约损失率是指债务人一旦违约将给债权人造成的损失数据占风险暴露总额的百分比。在本申请中,根据巴塞尔协议关于违约的定义与实际需要,可规定当用户出现以下情况,则认定用户违约:本金逾期大于1天;利息逾期大于1天;用户的贷款被归类为贷款五级分类中除正常贷款之外的其他贷款分类。损失包括贷款本金、利息及债务回收过程中造成的直接成本及间接成本。具体的,损失可通过如下公式计算:经济损失=EAD-NPV(回收)+NPV(成本), 其中,EAD为风险敞口,NPV(回收)为债务清偿过程中回收部分的净现值;NPV(成本)为债务清偿过程中成本部分的净现值。
;
为第i笔债项的第t期债务回收额;
为第i笔债项第t期债务回收折现所使用的贴现率;T表示从违约发生到清算结束的这段时间。
;
为第i笔债项的第n项债务回收成本;
为第i笔债项第n项债务回收成本折现所使用的贴现率。
其中,回收部分可包括直接现金回收和非现金回收;成本部分可包括直接成本及间接成本,直接成本包括法院诉讼费、执行费、律师费等其他相关贷款回收费用,间接成本可包括人工、办公等费用。
为解决背景技术中所述的技术问题,本申请提出了一种违约损失率的预测方法,可对需求的预设时间段内用户发生违约的概率进行预测,提高了金融机构的风险计量水平。
实施例一
具体的,所述过程包括:
步骤一、训练违约损失率预测模型;
如图1所示,所述预测模型为强学习器,由多个弱学习器根据结合策略结合生成。通过多轮迭代训练,每轮迭代训练可生成一个弱学习器,每一弱学习器将上一轮训练的损失函数的负梯度在当前模型的值作为残差的估计值,并根据估计值进行训练。损失函数可以L(y,f(x))表示,其中x表示根据还款状态经过IV(Information Value)计算得到的IV变量值,y表示根据训练样本确定的真实损失率,f(x)表示模型的训练过程中的预测损失率值。
其中,损失函数中包括根据宏观环境确定的宏观变量值。优选的,可定期从相关行业研究网站获取相应的数据,并根据获取的数据确定所述宏观变量值。
根据修改后的宏观变量值,可对模型进行重新训练,以提高预测的准确率。
根据生成的弱分类器,可计算:
,其中C
mj表示最小累计残差和,c表示常数项,m表示第m列向量值,R
mj表示模型中相关矩阵第m列与第j列的相关系数。
根据线性搜索算法,可估计使损失函数极小化的弱分类器的叶节点区域的值,生成
,其中
表示第m个损失函数最小化的弱学习器函数,J表示弱分类器个数,
表示惯性动量系数,代表弱分类器优化调整方向,以避免局部最优问题。
根据所有弱学习器对应的f(x),即可得到最后的模型:
所述弱学习器的训练数据集包括采集的内在预设平台发生了违约的历史用户样本,每一历史用户样本包括对应的还款状态、欠款总额及造成的违约损失率。其中,所述造成的违约损失率可根据历史用户样本的欠款总额和该历史用户样本实际对预设平台造成的经济损失计算得到。
使用该预测模型进行损失率的预测过程包括:
S1、获取目标用户的还款状态及欠款总额;
所述目标用户包括向预设平台贷款的用户。
还款状态包括目标用户的还款能力和还款意愿,可根据该用户的账户的使用状态、预设周期内工作的变更次数及根据该用户的实名认证获取的征信报告等数据确定。
欠款总额包括目标用户的欠款余额及预设平台向该目标用户催收贷款所花费的总成本。
S2、根据宏观环境特征及用户特征,生成修正后的还款状态;
宏观环境特征可根据采集的目标用户所在地区的失业率、收入负债比、储蓄量、消费量等宏观数据计算得到。优选的,可根据宏观环境特征生成相应的调整参数,根据该调整参数对还款状态进行修正。
所述用户特征包括目标用户的学历、职业、工作年限等特征。用户特征中还可包括用户对应的预设的风险评级。
如表1所示,根据用户特征可确定对应的调整系数,并根据调整系数对还款状态进行再次修正。
表1
S3、使用经训练的预测模型,根据修正的还款状态及欠款总额预测目标用户在预设时间段发生违约时对预设平台造成的违约损失率。
根据预测的违约损失率,还可生成预测的目标用户发生违约时预设平台欠款总额的回收率。所述回收率的计算公式为:回收率=1-违约损失率。
经测试,使用该模型进行预测,得到模型拟合度R2为96%,MSE为0.005,MAE为0.02,因此该模型能够较好地预测用户发生违约时对发放贷款的平台造成的违约损失率。
实施例二
对应上述实施例,本申请提供了一种违约损失率的预测方法,如图2所示,所述方法包括:
210、获取目标用户的还款状态及欠款总额,所述还款状态包括所述目标用户的还款能力及还款意愿,所述目标用户为预设平台的债务人;
220、根据所述目标用户的用户特征修正所述还款状态,生成修正后的还款状态,所述用户特征包括所述目标用户的职业;
230、使用经训练的预设模型根据所述修正后的还款状态及所述欠款总额,预测所述目标用户在预设时间段无法偿还对所述预设平台造成的违约损失率。
优选的,所述预设模型的训练过程包括:
240、获取训练数据集;
所述训练数据集由发生违约的用户样本组成,每一用户样本包括表示该用户样本的还款状态、该用户样本的欠款总额及造成的违约损失率。
241、使用所述训练数据集,对每一预设弱分类器进行训练,直至每一预设弱分类器的损失函数满足预设条件,所述损失函数包括根据宏观环境确定的预设参数;
242、对经训练的所述弱分类器进行组合,生成对应的强分类器,所述经训练的预设模型由所述强分类器组成。
优选的,所述欠款总额包括所述预设平台收回所述目标用户的欠款的总成本及所述目标用户在所述预设时间段的欠款余额。
优选的,所述用户特征还包括所述目标用户的学历。
优选的,所述用户特征还包括所述目标用户从事的行业。
优选的,所述还款能力包括所述目标用户的收入及负债。
实施例三
对应上述方法,如图3所示,本申请提供了一种违约损失率的预测装置,所述装置包括:
获取模块310,用于获取目标用户的还款状态及欠款总额,所述还款状态包括所述目标用户的还款能力及还款意愿;
修正模块320,用于根据所述目标用户的用户特征修正所述还款状态,生成修正后的还款状态,所述用户特征包括所述目标用户的职业;
预测模块330,用于使用经训练的预设模型根据所述修正后的还款状态及所述欠款总额,预测所述目标用户在预设时间段无法偿还对所述预设平台造成的违约损失率。
优选的,所述装置还包括训练模块340,所述训练模块340还可用于获取训练数据集,所述训练数据集包括在所述预设平台发生违约的历史用户样本,每一所述历史用户样本包括对应的还款状态、欠款总额及对所述预设平台造成的违约损失率;使用所述训练数据集,对每一预设弱分类器进行训练,直至每一所述预设弱分类器的损失函数满足预设条件,所述损失函数包括根据宏观环境确定的预设参数;对经训练的所述弱分类器进行组合,生成对应的强分类器,所述经训练的预设模型由所述强分类器组成。
所述修正模块320还可用于根据宏观环境特征及所述目标用户的用户特征对所述还款状态进行修正,生成修正后的还款状态,所述用户特征包括所述目标用户的职业。
实施例四
对应上述方法、设备及系统,本申请实施例四提供一种计算机系统,包括: 一个或多个处理器;以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
获取目标用户的还款状态及欠款总额,所述还款状态包括所述目标用户的还款能力及还款意愿,所述目标用户为预设平台的债务人;
根据所述目标用户的用户特征修正所述还款状态,生成修正后的还款状态,所述用户特征包括所述目标用户的职业;
使用经训练的预设模型根据所述修正后的还款状态及所述欠款总额,预测所述目标用户在预设时间段无法偿还对所述预设平台造成的违约损失率。
其中,图4示例性的展示出了计算机系统的架构,具体可以包括处理器1510,视频显示适配器1511,磁盘驱动器1512,输入/输出接口1513,网络接口1514,以及存储器1520。上述处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520之间可以通过通信总线1530进行通信连接。
其中,处理器1510可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请所提供的技术方案。
存储器1520可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1520可以存储用于控制计算机系统1500运行的操作系统1521,用于控制计算机系统1500的低级别操作的基本输入输出系统(BIOS)1522。另外,还可以存储网页浏览器1523,数据存储管理1524,以及图标字体处理系统1525等等。上述图标字体处理系统1525就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之,在通过软件或者固件来实现本申请所提供的技术方案时,相关的程序代码保存在存储器1520中,并由处理器1510来调用执行。 输入/输出接口1513用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
网络接口1514用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1530包括一通路,在设备的各个组件(例如处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,与存储器1520)之间传输信息。
另外,该计算机系统1500还可以从虚拟资源对象领取条件信息数据库1541中获得具体领取条件的信息,以用于进行条件判断,等等。
需要说明的是,尽管上述设备仅示出了处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514,存储器1520,总线1530等,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本申请方案所必需的组件,而不必包含图中所示的全部组件。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,云服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。