发明内容
本发明以科学、全面且准确地量化评估用户还款能力为目的,提供一种还款能力评估方法及装置。
为达此目的,本发明采用以下技术方案:
提供一种还款能力评估方法,具体步骤包括:
1)以规则模型预测输出的还款能力系数y1作为拟合模型输出的真实值更新训练所述拟合模型;
2)更新训练完成的所述拟合模型以还款能力评估对象的用户基础信息数据、用户金融统计数据和用户贷款金额为模型输入,预测输出各所述评估对象分别对应的还款能力系数y2;
3)分类模型以各所述评估对象的用户金融时序数据为模型输入,预测输出每个所述评估对象分别对应的还款能力折减系数z;
4)以所述还款能力折减系数z校正所述拟合模型预测输出的所述还款能力系数y2,并以校正结果表征所述评估对象的还款能力。
作为本发明的一种优选方案,所述用户基础信息包括关联所述评估对象的年龄、性别、婚姻状态、子女个数、房车资产、工作和学历情况中的任意一种或多种;
所述用户金融统计数据包括关联所述评估对象的收支、理财、逾期、还款、贷款和贷款申请情况中的任意一种或多种;
所述用户金融时序数据为所述用户金融统计数据按时间顺序记录的数据列。
作为本发明的一种优选方案,步骤1)中,所述规则模型预测各所述评估对象分别对应的所述还款能力系数y1的步骤具体包括:
1.1)根据用户年龄和用户贷款金额,将不同的所述评估对象划分为对应类型的用户群体;
1.2)获取不同用户群体的模型输入特征;
1.3)所述规则模型根据模型输入,预测输出不同群体分类下的每个所述评估对象分别对应的所述还款能力系数y1。
作为本发明的一种优选方案,所述规则模型预测输出所述还款能力系数y1过程可通过以下公式(1)表达:
公式(1)中,n表示符合预设评估逻辑的的评估逻辑数;
N表示所述规则模型评估用户还款能力的评估逻辑总数;
p为一常数。
作为本发明的一种优选方案,常数p=0.1。
作为本发明的一种优选方案,步骤3)中,所述分类模型预测输出每个所述评估对象对应的所述还款能力折减系数z的步骤具体包括:
3.1)计算每个所述评估对象本月还款金额与其近6个月还款金额平均值的比值r1;
3.2)根据所述比值r1预测输出一分类标签,每个所述分类标签对应一比值区间s1;
3.3)根据所述分类标签对应的所述比值区间s1确定每个所述评估对象对应的下月还款金额计算系数;
3.4)计算每个所述评估对象近6个月还款金额平均值与其对应的所述下月还款金额计算系数的乘积,作为所述分类模型预测得到的所述评估对象对应的下月还款金额;
3.5)计算每个所述评估对象对应的所述下月还款金额与所述本月还款金额的比值r2;
3.6)根据所述比值r2对应的比值区间s2,确定每个所述评估对象对应的还款能力折减系数z。
作为本发明的一种优选方案,所述评估对象的本月还款金额通过以下公式(2)计算而得:
公式(2)中,a表示待计算的所述评估对象的本月还款金额;
M表示所述评估对象的所述贷款金额;
y2表示所述拟合模型输出的表征所述评估对象还款能力的所述还款能力系数。
作为本发明的一种优选方案,步骤4)中,通过以下公式(3)校正所述拟合模型输出的所述还款能力系数y2:
yy=y2×z 公式(3)
公式(3)中,yy表示所述校正结果;
y2表示所述拟合模型输出的还款能力系数;
z表示所述分类模型预测输出的所述评估对象对应的所述还款能力折减系数。
作为本发明的一种优选方案,所述拟合模型为LightGBM回归模型;所述分类模型由LSTM长短期记忆人工神经网络训练而得。
本发明还提供了一种基于拟合模型的还款能力评估装置,可实现所述的还款能力评估方法,所述还款能力评估装置包括:
规则模型预测模块,用于以还款能力评估对象的用户基础信息数据、用户金融统计数据和贷款金额为规则模型的输入,由所述规则模型预测输出各所述评估对象分别对应的还款能力系数y1;
拟合模型更新训练模块,连接所述规则模型预测模块,用于以所述规则模型输出的所述还款能力系数y1作为拟合模型输出的真实值更新训练所述拟合模型;
拟合模型预测模块,连接所述拟合模型更新训练模块,用于将所述评估对象的所述用户基础信息数据、所述用户金融统计数据和所述贷款金额输入到完成更新训练的所述拟合模型中,由所述拟合模型预测输出各所述评估对象分别对应的还款能力系数y2;
系数校正模块,连接所述拟合模型预测模块,用于以分类模型预测输出的还款能力折减系数z作为校正依据,对所述拟合模型输出的所述还款能力系数y2进行校正,校正结果最终表征所述评估对象的还款能力。
本发明的有益效果:
1、采用预测性能更佳、预测速度更快的拟合模型量化评估用户的还款能力,评估结果更加客观、科学、准确且评估结果的生成更加快速;
2、以传统规则模型输出的还款能力系数y1作为拟合模型输出的真实值调整拟合模型的训练参数并更新训练拟合模型,训练而得的拟合模型具有更高的还款能力评估准确度;
3、以分类模型的输出校正拟合模型的预测结果,进一步提升了拟合模型对于还款能力评估的准确度。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明实施例提供的一种还款能力评估方法,如图1、图4和图5所示,该还款能力评估方法包括如下步骤:
步骤1)以规则模型预测输出的还款能力系数y1作为拟合模型输出的真实值更新训练拟合模型(拟合模型优选为数据拟合能力强、模型训练速度快、模型计算内存占用低的LightGBM回归模型);规则模型基于还款能力评估对象的用户基础信息数据、用户金融统计数据以及用户贷款金额(当前待还款总额)为模型输入,预测输出评估对象对应的还款能力系数y1(还款能力系数数值越大,说明评估对象的还款能力越高);
评估对象的用户基础信息数据内容见下表a,包括但不限于评估对象的年龄、性别、婚姻状态、子女个数、房车资产、工作和学历情况,用户基础信息数据作为规则模型预测还款能力系数y1的其中一项模型输入特征。
序号 |
特征名称 |
1 |
年龄 |
2 |
性别 |
3 |
是否已婚 |
4 |
是否有孩子 |
5 |
名下是否有房 |
6 |
名下是否有车 |
7 |
工作是否稳定 |
8 |
是否是高学历 |
表a
评估对象的用户金融统计数据内容见下表b,包括但不限于评估对象的收支情况(比如银行入账金额、支出银行、工资收入等)、理财情况(比如是否为股票用户或基金用户)、在互联网和/或银行和/或信用卡平台的逾期情况(是否为逾期用户、逾期金额、逾期平台数等)、还款情况(还款金额、还款次数等)、贷款情况(贷款金额、贷款次数等)以及贷款申请情况(贷款申请次数、贷款申请成功次数、贷款申请失败次数等)。用户金融统计数据作为规则模型预测还款能力系数y1的另外一项模型输入特征。
表b
用户贷款金额则是在还款能力评估时点,评估对象待还的贷款总额(当前待还款总额)。
由于用户原始数据可能存在数据缺失、数据异常等情况而无法直接作为模型的输入特征,所以需要对获取到的原始数据进行数据处理。本实施例中,对于用户基础信息数据的处理包括但不限于缺失值处理、特征数值化处理,例如将用户的工作情况打标为是否具有稳定工作,将学历情况打标为是否具有高学历,在婚姻状态不明时将婚姻状态默认为未婚,在子女数量不明时将子女数量默认为0等。
对于用户金融统计数据的处理包括但不限于异常值处理、缺失值处理、特征归一化处理等,例如用户原始数据中若缺乏工资收入数据,则将该用户缺失的工资收入用最低工资填充,若用户原始数据中缺乏逾期次数和还款次数数据,则将该用户的逾期次数和还款次数均默认为0。另外,对于错误明显的数据将直接进行剔除。
本实施例中,规则模型预测评估对象对应的还款能力系数y1的步骤如图2所示,具体包括:
步骤1.1)根据用户年龄和用户贷款金额(当前待还款总额),将不同的评估对象划分为对应类型的用户群体;请见下表c,比如,将年龄小于18岁的评估对象划分为一年龄大类,将年龄处于[18,20)年龄段的各评估对象划分为另一年龄大类;将同一年龄大类下的具有不同待还款总额(表c中用“剩余应还总金额”表示)的各评估对象划分为对应的群体小类,比如同处[18,20)这一年龄大类下的评估对象a的当前待还款总额≤1000,评估对象b的当前待还款总额在[1000,10000)之间,则将评估对象a的群体类型划分为“年龄段处于[18,20)且当前待还款总额≤1000”,将评估对象b的群体类型划分为“年龄段处于[18,20)且当前待还款总额在[1000,10000)之间”。关于评估对象群体类型的详细划分方法请见下表c,在此不作一一举例。
表c
模型在评估不同群体类型下的用户的还款能力时,评估依据通常并不相同。请参见上表c,比如考虑到[18,20)年龄段的用户学历、工作尚不稳定,模型在评估该年龄段用户的还款能力时,主要关注评估对象的收支情况、在各平台的还款情况以及已有资产状况。另外,一般情况下,待还款总额数目越少,用户还不上贷款的风险越小,所以对于年龄段相同但当前待还款总额不同的用户,模型的还款能力评估依据也并不相同,比如评估对象a、评估对象b和评估对象c的年龄段均为[18,20),但评估对象a的当前待还款总额≤1000,评估对象b的当前待还款总额在[1000,10000)之间,评估对象c的当前待还款总额≥10000,则对于评估对象a,模型以评估对象a的收支情况作为还款能力评估依据,而对于评估对象b,模型则以评估对象b的收支情况和在各平台的还款情况作为还款能力评估依据,对于评估对象c,模型则以评估对象c的收支情况、在各平台的还款情况以及已有资产情况作为还款能力评估依据。
请继续参照图2,规则模型预测评估对象对应的还款能力系数y1的方法还包括:
步骤1.2)获取不同用户群体的模型输入特征;请参见上表c,比如当前评估对象对应的群体类型为“年龄段处于[18,20)且当前待还款金额≤1000”,规则模型评估该群体类型下的评估对象的还款能力的逻辑为:评估对象前6个自然月银行平均入账金额是否大于前6个自然月银行平均支出金额以及前6个自然月银行入账总金额与支出总金额的差值是否大于本平台逾期总金额的二分之一,则规则模型根据评估逻辑获取需要的模型输入特征,群体类型“年龄段处于[18,20)且当前待还款金额≤1000”对应的模型输入特征为评估对象“前6个自然月银行平均入账金额”“前6个自然月银行平均支出金额”“前6个自然月银行入账总金额”“前6个自然月银行支出总金额”以及“本平台逾期总金额”。不同群体类型对应的模型输入特征见上表c,在此不做一一举例。
步骤1.3)规则模型根据模型输入,预测输出不同群体分类下的每个评估对象分别对应的还款能力系数y1。
规则模型预测输出评估对象对应的还款能力系数y1的过程可通过以下公式(1)表达:
n表示符合预设评估逻辑的评估逻辑数;
N表示规则模型评估用户还款能力的评估逻辑总数;
p为一常数(优选为0.1)。
请继续参照图1、图4和图5,本实施例提供的还款能力评估方法还包括:
步骤2)更新训练完成的拟合模型以评估对象的用户基础信息数据、用户金融统计数据和用户贷款金额(当前待还款总额)为模型输入,预测输出各评估对象分别对应的还款能力系数y2;
步骤3)分类模型(优选由LSTM(Long Short-Term Memory)长短期记忆人工神经网络训练而得)以各评估对象的用户金融时序数据为模型输入,预测输出每个评估对象对应的还款能力折减系数z;
用户金融时序数据为用户金融统计数据按时间顺序记录的数据列,比如用户6个自然月的银行入账金额记录、近一年中每个月的还款金额记录、还款次数记录等。由于原始的用户金融时序数据同样可能存在数据缺失、异常等问题,所以同样需要对原始的用户金融时序数据进行数据处理后再提供给分类模型使用,具体的数据处理方法在此不作具体阐述。
如图3所示,分类模型预测输出每个评估对象对应的还款能力折减系数z的方法具体包括:
步骤3.1)计算评估对象本月还款金额与其近6个月还款金额的平均值的比值r1;评估对象的本月还款金额可通过以下公式(2)计算而得:
公式(2)中,a表示待计算的评估对象的本月还款金额;
M表示评估对象的贷款金额(当前待还款总额);
y2表示拟合模型输出的表征评估对象还款能力的还款能力系数。
为提高分类模型的预测速度,评估对象本月还款金额与其近6个月还款金额的平均值提前计算而得,分类模型在预测还款能力折减系数z时,直接获取评估对象的本月还款金额和近6个月还款金额的平均值即可。
步骤3.2)根据比值r1预测输出一分类标签,每个分类标签对应一比值区间s1;
请参见下表d,比如所计算的比值r1落入到0-0.25这一比值区间,则分类模型匹配出0-0.25这一比值区间对应的分类标签“0”作为评估对象的下月还款金额类别。
表d
请继续参照图3,分类模型计算评估对象的还款能力折减系数z的方法还包括:
步骤3.3)根据分类标签对应的比值区间s1确定每个评估对象对应的下月还款金额计算系数;系数确定方法见上表d,比如分类标签“0”对应的比值区间为0-0.25,则取该比值区间的最小值“0”作为计算该评估对象的下月还款金额的系数;
步骤3.4)计算每个评估对象近6个月还款金额平均值与其对应的下月还款金额计算系数的乘积,作为分类模型预测得到的评估对象的下月还款金额;
步骤3.5)计算每个评估对象对应的下月还款金额与本月还款金额的比值r2;
步骤3.6)根据比值r2对应的比值区间s2,确定每个评估对象对应的还款能力折减系数z。还款能力折减系数z的确定方法请参见下表e:
表e
表e中的字符“b”表示分类模型预测的评估对象的下月还款金额;“a”表示评估对象的本月还款金额。比如b与a的比值r2落入到比值区间0-0.2时,比值区间0-0.2与还款能力折减系数“0.6”具有匹配关系,则分类模型将该评估对象的还款能力折减系数z确定为0.6。
请继续参照图1,本实施例提供的还款能力评估方法还包括:
步骤4)以还款能力折减系数z校正拟合模型预测输出的还款能力系数y2,并以校正结果表征评估对象的还款能力。校正方法可通过以下公式(3)表达:
yy=y2×z 公式(3)
公式(3)中,yy表示校正结果;
y2表示拟合模型输出的还款能力系数;
z表示分类模型计算的评估对象对应的还款能力折减系数。
本发明还提供了一种还款能力评估装置,可实现上述的还款能力评估方法,如图6所示,该装置包括:
规则模型预测模块,用于以还款能力评估对象的用户基础信息数据、用户金融统计数据和贷款金额为规则模型的输入,由规则模型预测输出各评估对象分别对应的还款能力系数y1;
拟合模型更新训练模块,连接规则模型预测模块,用于以规则模型输出的还款能力系数y1作为拟合模型输出的真实值更新训练所述拟合模型;
拟合模型预测模块,连接拟合模型更新训练模块,用于将评估对象的用户基础信息数据、用户金融统计数据和贷款金额输入到完成更新训练的拟合模型中,由拟合模型预测输出各评估对象分别对应的还款能力系数y2;
系数校正模块,连接拟合模型预测模块,用于以分类模型预测输出的还款能力折减系数z作为校正依据,对拟合模型输出的还款能力系数y2进行校正,校正结果最终表征评估对象的还款能力。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。