CN111539812A - 逾期个贷催收方式确定方法、装置及电子设备 - Google Patents
逾期个贷催收方式确定方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111539812A CN111539812A CN202010517148.8A CN202010517148A CN111539812A CN 111539812 A CN111539812 A CN 111539812A CN 202010517148 A CN202010517148 A CN 202010517148A CN 111539812 A CN111539812 A CN 111539812A
- Authority
- CN
- China
- Prior art keywords
- overdue
- determining
- credit
- candidate
- account risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000013508 migration Methods 0.000 claims abstract description 40
- 230000005012 migration Effects 0.000 claims abstract description 40
- 238000010801 machine learning Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 13
- 230000000977 initiatory effect Effects 0.000 claims description 3
- 230000001133 acceleration Effects 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 13
- 238000003860 storage Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000717 retained effect Effects 0.000 description 6
- 238000012216 screening Methods 0.000 description 5
- 230000001617 migratory effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000003306 harvesting Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本说明书实施方案提供了一种逾期个贷催收方式确定方法、装置及电子设备,该方法包括:获取逾期个贷客户的目标输入变量数据;将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别;确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;根据所述时长确定针对所述逾期个贷客户的催收方式。本说明书实施方案可以提高催收成功率,降低催收成本。
Description
技术领域
本说明书涉及数据处理技术领域,尤其是涉及一种逾期个贷催收方式确定方法、装置及电子设备。
背景技术
随着互联网金融业务的快速发展,消费金融、P2P网贷和无抵押贷款等个人贷款业务(简称个贷)的逾期还款情况越来越多,相应的催收工作量也迅速增加。传统大范围的催收方式已经面临一些严重的问题,比如催收资源受限制、回收率不高。虽然伴随着催收方式的不断改进和多元化,这一问题得到了一些缓解,但是现有资源仍然难以匹配个贷催收的需求量。例如,关于催收资源的问题,以传统的电话催收为例,电话催收的工作量由于催收人员的经验不同,按照平均每天每人可以播出200个电话来计算。如果要覆盖50万个逾期客户,则需要有2500个人来支持电催业务,而实际上的可以提供电催的人数远远满足不了催收工作量。因此,传统的无差异催收方式已经远远不能适应现在的业务量了。
因此,如何提高催收成功率并降低催收成本已成为目前亟待解决的技术问题。
发明内容
本说明书实施方案的目的在于提供一种逾期个贷催收方式确定方法、装置及电子设备,以提高催收成功率,降低催收成本。
为达到上述目的,一方面,本说明书实施方案提供了一种逾期个贷催收方式确定方法,包括:
获取逾期个贷客户的目标输入变量数据;
将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;
根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别;
确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;
根据所述时长确定针对所述逾期个贷客户的催收方式。
另一方面,本说明书实施方案还提供了一种逾期个贷催收方式确定装置,包括:
输入变量获取模块,用于获取逾期个贷客户的目标输入变量数据;
风险参数预测模块,用于将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;
风险类别确定模块,用于根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别;
临界时长确定模块,用于确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;
催收方式确定模块,用于根据所述时长确定针对所述逾期个贷客户的催收方式。
另一方面,本说明书实施方案还提供了一种电子设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时执行如下步骤:
获取逾期个贷客户的目标输入变量数据;
将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;
根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别;
确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;
根据所述时长确定针对所述逾期个贷客户的催收方式。
由以上本说明书实施方案提供的技术方案可见,与常规的人工大范围催收相比,本说明书实施方案针对待预测的逾期个贷客户,可以将其目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;然后根据预测出的坏账风险参数值确定所述逾期个贷客户的坏账风险类别,其次确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;最后根据时长确定针对所述逾期个贷客户的催收方式。如此,就实现了差异化催收方式的自动确定,从而有利于提高逾期个贷的催收成功率,降低催收成本。
附图说明
为了更清楚地说明本说明书实施方案或现有技术中的技术方案,下面将对实施方案或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施方案,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本说明书一些实施方案中逾期个贷催收方式确定方法的流程图;
图2为本说明书一实施方案中机器模型训练过程示意图;
图3为本说明书一实施方案中快贷迁徙率变化示意图;
图4为本说明书一些实施方案中逾期个贷催收方式确定装置的结构框图;
图5为本说明书一些实施方案中电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施方案中的附图,对本说明书实施方案中的技术方案进行清楚、完整地描述,显然,所描述的实施方案仅仅是本说明书一部分实施方案,而不是全部的实施方案。基于本说明书中的实施方案,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方案,都应当属于本说明书保护的范围。
参考图1所示,本说明书一些实施方案中逾期个贷催收方式确定方法可以包括如下步骤:
S101、获取逾期个贷客户的目标输入变量数据。
S102、将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值。
S103、根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别。
S104、确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长。
S105、根据所述时长确定针对所述逾期个贷客户的催收方式。
由此可见,与常规的人工大范围催收相比,本说明书实施方案针对待预测的逾期个贷客户,可以将其目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;然后根据预测出的坏账风险参数值确定所述逾期个贷客户的坏账风险类别,其次确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;最后根据时长确定针对所述逾期个贷客户的催收方式。如此,就实现了差异化催收方式的自动确定,从而有利于提高逾期个贷的催收成功率,降低催收成本。
在本说明书一些实施方案中,所述获取逾期个贷客户的目标输入变量数据可以是指:从待预测的逾期个贷客户数据集中,读取逾期个贷客户的目标输入变量数据。其中,目标输入变量数据是与训练得到的坏账风险参数预测模型时所输入的变量相一致。例如在训练得到坏账风险参数预测模型时,输入的变量为:变量A、变量B、变量C、变量D、变量E、变量F、变量G、变量H、变量I和变量J总共10个变量,则在预测时,逾期个贷客户的目标输入变量数据即为这10个变量所对应的数据。
在本说明书一些实施方案中,所述坏账风险参数预测模型可以是预先通过训练机器学习模型得到。在机器学习模型的个贷客户样本集中,个贷客户样本可以具有相同的个贷业务类型,且所述逾期个贷客户与所述个贷客户样本具有相同的个贷业务类型。也就是说,在本说明书一些实施方案中可以针对不同的贷业务类型分别进行建模,以根据对应的模型进行预测。如此,可以有利于提高预测精度。其中,个贷客户样本集可以包括训练集、验证集和测试集。例如,在一示例性实施方案中,机器学习模型的个贷客户样本集中的个贷客户样本可以均为二手房贷款客户。同时,在训练好机器学习模型后(训练好的机器学习模型即为坏账风险参数预测模型),相应的,输入待预测的逾期个贷客户也均为逾期二手房贷款客户。
在本说明书的实施方案中,在训练机器学习模型之前,可以基于客户的基本信息、财力信息(动产)、房屋信息(不动产)、历史还款、历史逾期、历史催收信息、人行征信信息等基本数据,衍生出大量的指标变量,这些指标变量可以作为候选变量,即形成候选变量集合。为了有利于训练出准确而高效的坏账风险参数预测模型,需要从候选变量集合中筛选出一些合适的变量指标,即可以剔除对预测结果无关紧要的变量指标。
在本说明书一实施方案中,所述机器学习模型的输入变量通过以下方式确定:
1)、获取候选变量集合。
在本说明书的实施方案中,所述获取候选变量集合可以为读取候选变量数据表。本领域技术人员可以理解,候选变量集合中的数据可以是经数据标准化处理后的数据,以便于后续处理。
在一示例性实施方案中,针对快贷业务类型(即个人快贷业务类型),候选变量集合可基于申请信息、客户基本信息、客户财力信息、支用记录、历史还款、逾期情况、催收记录和人行征信衍生出649个变量指标(如下表1所示)。
表1
2)、确定所述候选变量集合中各候选变量的数据缺失率,并可以剔除其数据缺失率达到缺失率阈值的输入变量,形成第二集合。
一般地,如果候选变量集合中某些候选变量的数据缺失或异常比较严重,则这些候选变量所带来的不确定性就会增加,因此,需要首先可以剔除这些候选变量。在一示例性实施例中,在计算出候选变量集合中各候选变量的数据缺失率(即数据缺失占比)后,可以将其与预设的缺失率阈值(例如80%)进行比较,如果缺失率达到缺失率阈值,则可以剔除该候选变量,从而形成第二集合。当然,如果候选变量集合中所有候选变量的数据缺失率均未达到缺失率阈值,则可以都保留。例如,以表1所示的候选变量集合为例,在经过数据缺失筛选后所形成的第二集合中仅保留有450个变量指标。
3)、确定所述第二集合中各连续型候选变量在按照第一区间长度分箱下的第一信息价值,并可以剔除其第一信息价值未达到第一信息价值阈值的连续型候选变量,形成第三集合。
在本说明书的实施方案中,对第二集合中各连续型候选变量按照第一区间长度分箱(这里的分箱可以为细分箱)的目的在于,寻找连续型候选变量的最佳分箱。本说明书的分箱是指将连续性变量进行离散化。例如以“年龄”这个连续型候选变量为例,假设客户年龄范围为[18,100],则可以按照10岁区间长度可以分为八个区间:[18,27]、[28,37]、[38,47]、[48,57]、[58,67]、[68,77]、[78,87]、[88,100]。
本说明书中的第一信息价值以及下文提到的第二信息价值分别指不同的信息价值(Information Value,简称IV),信息价值可以用来表征变量的预测能力(即变量对模型预测的贡献大小)。当某一候选变量的IV值过小,说明该候选变量对模型预测的影响较小,也即该候选变量对模型预测不具有区分度。当某一候选变量的IV值过大,说明该候选变量对模型预测的影响较大,也即该候选变量对模型预测具有区分度。因此,在一示例性实施例中,在计算出第二集合中各候选变量的IV值后,可以将其与预设的第一IV值阈值(例如0.05)进行比较,如果候选变量的IV值不超过(即未达到)该第一IV值阈值,则可以从第二集合中剔除该候选变量,从而第三集合。例如,以表1所示的候选变量集合所对应的第二集合为例,在经过该步骤筛选后所形成的第三集合中仅保留有442个变量指标。
4)、确定所述第三集合中各连续型候选变量在按照第二区间长度分箱下的群体稳定性指数值,并可以剔除其群体稳定性指数值大于群体稳定性指数阈值及不符合业务解释的连续型候选变量,形成第四集合。
在本说明书的实施方案中,类似地,对第三集合中各连续型候选变量按照第二区间长度分箱(这里的分箱可以为粗分箱)的目的在于,寻找连续型候选变量的最佳分箱。本说明书中的粗分箱和细分箱是相对而言,相对于细分箱而言,粗分箱时连续型候选变量的区间间隔较大,即第二区间长度大于第一区间长度。例如,在一示例性实施方案中,粗分箱的第二区间长度可以为10,细分箱的第二区间长度可以为2。
本说明书中的群体稳定性指数(Population Stability Index,简称PSI)可以用于衡量候选变量的特征稳定性。在一示例性实施例中,在计算出第三集合中各连续型候选变量在按照第二区间长度分箱下的PSI值后,可以将各候选变量在按照第二区间长度分箱下的PSI值与PSI阈值进行比较,并可以剔除其PSI值大于PSI阈值及不符合业务解释的连续型候选变量,从而形成第四集合。其中,不符合业务解释的连续型候选变量是指无实际意义的候选变量。例如,以表1所示的候选变量集合所对应的第三集合为例,在经过该步骤筛选后所形成的第四集合中仅保留有259个变量指标。
5)、确定所述第四集合中各候选变量的第二信息价值,并可以剔除其第二信息价值小于第二信息价值阈值的连续型候选变量,形成第五集合。
在本说明书的实施方案中,所述确定第四集合中各候选变量的第二信息价值是指:计算第四集合中包括连续型变量和离散型变量在内的各候选变量IV值。如果某个候选变量的变量IV值小于第二IV值阈值(例如0.02),则可以剔除该候选变量,以对第五集合中的候选变量进行进一步优选。例如,以表1所示的候选变量集合所对应的第四集合为例,在经过该步骤筛选后所形成的第四集合中仅保留有259个变量指标。
6)、确定所述第五集合中每两个候选变量之间的相关系数;当两个候选变量之间的相关系数大于相关系数阈值时,可以剔除所述两个候选变量中第二信息价值较小者,从而形成输入变量集合。
在本说明书的实施方案中,为防止第五集合中各候选变量间存在强相关性,需要进行相关性检查,即需要计算第五集合中每两个候选变量之间的相关系数。当两个候选变量之间的相关系数大于相关系数阈值(例如0.7)时,则可以剔除所述两个候选变量中第二信息价值较小者(例如候选变量A和候选变量B之间的相关系数大于0.7,其中候选变量A的第二IV值为0.05,候选变量B的第二IV值为0.08,则可以删除候选变量A),从而形成输入变量集合。例如,以表1所示的候选变量集合所对应的第五集合为例,在经过该步骤筛选后所形成的第五集合中仅保留有32个变量指标。
结合图2所示,在本说明书的一实施方案中,当基于筛选的输入变量集合所对应的训练样本进行机器学习训练后,需要判断当前训练出的机器学习模型是否满足要求。如果不满足要求,则可以调整输入变量(例如剔除输入变量集合中的一个或多个输入变量),然后基于新的输入变量集合所对应的训练样本重新进行训练。如此递推,直至判断出当前训练出的机器学习模型满足要求为止;则此时训练出的机器学习模型则可以作为坏账风险参数预测模型。因此,当获得坏账风险参数预测模型后,输入变量集合一般为发生变化。例如,以上述保留有32个变量指标的输入变量集合为例,当获得坏账风险参数预测模型后,最终的输入变量集合可能仅剩10个变量指标。
在本说明书的一些实施方案中,可以基于验证集,验证当前训练出的机器学习模型的区分度(即预测精度)区分度和稳定性等是否满足要求。
在本说明书的一实施方案中,区分度可以使用方差、KS(Kolmogorov-Smirnov,简称KS)指标和/或接受者操作特性曲线下的面积(Area Under Curve,简称AUC)指标等进行衡量。例如,以KS指标为例,其可以额衡量的是黑白样本累计分部之间的差值。黑白样本累计差异越大,KS指标越大,那么模型的风险区分能力越强。一般采用两条曲线,一条曲线代表正确预测出来正确的正例占比,一条曲线代表预测错误的占比,两条曲线的最大差值就是KS值。
在上文中已经提到可以用PSI指标衡量候选变量的特征稳定性。不仅如此,在本说明书的一实施方案中,PSI指标还可以用衡量机器学习模型的稳定性。在此情况下,PSI值越小表明模型的稳定性越高。
在本说明书的一些实施方案中,根据逾期天数可以将个贷逾期阶段划分为多个阶段。例如,可以将个贷逾期阶段划分M0-M7+八个阶段。没有逾期的定义为M0,逾期1~30天的定义为M1,逾期31~60天的定义为M2,逾期61~90天的定义为M3,以此类推。在机器学习模型的个贷客户样本集中,黑样本和白样本可以是以个贷逾期迁徙率临界值作为区分。其中,个贷逾期迁徙率是指:处于某一逾期阶段的客户转人到下一逾期阶段的比例。例如,M3-M4迁徙率是指:从逾期阶段M3转入到逾期阶段M4的比例。因此,迁移率可以用来预测不同逾期阶段的未来坏账损失。相应的,个贷逾期迁徙率临界值就是指迁徙率变化曲线上的临界点所对应的迁徙率值。
例如,在图3所示的示例性实施方案中示出了快贷迁徙率变化曲线。在图3中横坐标表示快贷逾期阶段;纵坐标表示不同阶段的迁徙率。从而图3所示的迁徙率变化曲线可以看出,个贷迁徙率临界值(即图3中91.64%所对应的点)对应于M2-M3,因此,可以将M3所对应的逾期天数上限90天(这里以90天为例)作为区分点。即在逾期90天内还清的快贷逾期客户可以认为是白样本,而在逾期90天内未还清的快贷逾期客户可以认为是黑样本。
在本说明书的一些实施方案中,所述根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别,可以包括:根据所述坏账风险参数值及所述逾期个贷客户的贷款余额等确定所述逾期个贷客户的坏账风险类别。例如,在一示例性实施例中,所述坏账风险类别可以为十二个类别之一:极高风险大额队列、极高风险小额队列、高风险大额队列、高风险小额队列、中高风险大额队列、中高风险小额队列、中等风险大额队列、中等风险小额队列、低风险大额队列、低风险小额队列、极低风险大额队列和极低风险小额队列。
为了有利于降低坏账风险,越是坏账风险高且贷款余额高的逾期个贷客户,越应该及时地、重点地去催收。基于这种策略,可以根据对应的历史数据确定每一个坏账风险类别的迁徙率分布,并根据迁徙率分布确定其个贷逾期迁徙率临界值所属的逾期阶段。如此,当确定逾期个贷客户当前所处的逾期阶段所对应的个贷逾期迁徙率后,可以确定所述个贷逾期迁徙率变化至对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长。
例如,在一示例性实施方案中,若逾期个贷客户A当前逾期了55天,对应所处的逾期阶段为M2(逾期31-60天为M2);若所述逾期个贷客户属于“高风险大额队列”类别,且该“高风险大额队列”的个贷逾期迁徙率临界值所对应的逾期阶段为M3(逾期61-90天为M3),则可以推断出,当90-55=35天后,逾期个贷客户A将有很大概率变为黑样本,因此,可以确定所述逾期个贷客户的催收方式为35天后启动电话催收。
与上述逾期个贷催收方式确定方法对应,参考图4所示,本说明书一些实施方案的逾期个贷催收方式确定装置可以包括:
输入变量获取模块41,可以用于获取逾期个贷客户的目标输入变量数据;
风险参数预测模块42,用于将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;
风险类别确定模块43,可以用于根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别;
临界时长确定模块44,可以用于确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;
催收方式确定模块45,可以用于根据所述时长确定针对所述逾期个贷客户的催收方式。
本说明书一些实施方案的逾期个贷催收方式确定装置中,所述机器学习模型的输入变量通过以下方式确定:
获取候选变量集合;
确定所述候选变量集合中各候选变量的数据缺失率,并可以剔除其数据缺失率达到缺失率阈值的输入变量,形成第二集合;
确定所述第二集合中各连续型候选变量在按照第一区间长度分箱下的第一信息价值,并可以剔除其第一信息价值未达到第一信息价值阈值的连续型候选变量,形成第三集合;
确定所述第三集合中各连续型候选变量在按照第二区间长度分箱下的群体稳定性指数值,并可以剔除其群体稳定性指数值大于群体稳定性指数阈值及不符合业务解释的连续型候选变量,形成第四集合;所述第二区间长度大于所述第一区间长度;
确定所述第四集合中各候选变量的第二信息价值,并可以剔除其第二信息价值小于第二信息价值阈值的连续型候选变量,形成第五集合;
确定所述第五集合中每两个候选变量之间的相关系数;当两个候选变量之间的相关系数大于相关系数阈值时,可以剔除所述两个候选变量中第二信息价值较小者,从而形成输入变量集合。
本说明书一些实施方案的逾期个贷催收方式确定装置中,在所述机器学习模型的个贷客户样本集中,黑样本和白样本以个贷逾期迁徙率临界值作为区分。
本说明书一些实施方案的逾期个贷催收方式确定装置中,在所述机器学习模型的个贷客户样本集中,个贷客户样本具有相同的个贷业务类型,且所述逾期个贷客户与所述个贷客户样本具有相同的个贷业务类型。
本说明书一些实施方案的逾期个贷催收方式确定装置中,所述催收方式包括启动电话催收的开始时间。
与上述逾期个贷催收方式确定方法对应,参考图5所示,本说明书一些实施方案的电子设备可以包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时执行如下步骤:
获取逾期个贷客户的目标输入变量数据;
将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;
根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别;
确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;
根据所述时长确定针对所述逾期个贷客户的催收方式。
虽然上文描述的过程流程包括以特定顺序出现的多个操作,但是,应当清楚了解,这些过程可以包括更多或更少的操作,这些操作可以顺序执行或并行执行(例如使用并行处理器或多线程环境)。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本申请是参照根据本说明书实施方案的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本说明书的实施方案可提供为方法、系统或计算机程序产品。因此,本说明书实施方案可采用完全硬件实施方案、完全软件实施方案或结合软件和硬件方面的实施方案的形式。而且,本说明书实施方案可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书实施方案可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施方案,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施方案均采用递进的方式描述,各个实施方案之间相同相似的部分互相参见即可,每个实施方案重点说明的都是与其他实施方案的不同之处。尤其,对于系统实施方案而言,由于其基本相似于方法实施方案,所以描述的比较简单,相关之处参见方法实施方案的部分说明即可。在本说明书的描述中,参考术语“一个实施方案”、“一些实施方案”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施方案或示例描述的具体特征、结构、材料或者特点包含于本说明书实施方案的至少一个实施方案或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施方案或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施方案或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施方案或示例以及不同实施方案或示例的特征进行结合和组合。
以上所述仅为本申请的实施方案而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (13)
1.一种逾期个贷催收方式确定方法,其特征在于,包括:
获取逾期个贷客户的目标输入变量数据;
将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;
根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别;
确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;
根据所述时长确定针对所述逾期个贷客户的催收方式。
2.如权利要求1所述的逾期个贷催收方式确定方法,其特征在于,所述坏账风险参数预测模型预先通过训练机器学习模型得到。
3.如权利要求2所述的逾期个贷催收方式确定方法,其特征在于,所述机器学习模型的输入变量通过以下方式确定:
获取候选变量集合;
确定所述候选变量集合中各候选变量的数据缺失率,并剔除其数据缺失率达到缺失率阈值的输入变量,形成第二集合;
确定所述第二集合中各连续型候选变量在按照第一区间长度分箱下的第一信息价值,并剔除其第一信息价值未达到第一信息价值阈值的连续型候选变量,形成第三集合;
确定所述第三集合中各连续型候选变量在按照第二区间长度分箱下的群体稳定性指数值,并剔除其群体稳定性指数值大于群体稳定性指数阈值及不符合业务解释的连续型候选变量,形成第四集合;所述第二区间长度大于所述第一区间长度;
确定所述第四集合中各候选变量的第二信息价值,并剔除其第二信息价值小于第二信息价值阈值的连续型候选变量,形成第五集合;
确定所述第五集合中每两个候选变量之间的相关系数;当两个候选变量之间的相关系数大于相关系数阈值时,剔除所述两个候选变量中第二信息价值较小者,从而形成输入变量集合。
4.如权利要求2所述的逾期个贷催收方式确定方法,其特征在于,在所述机器学习模型的个贷客户样本集中,黑样本和白样本以个贷逾期迁徙率临界值作为区分。
5.如权利要求2所述的逾期个贷催收方式确定方法,其特征在于,在所述机器学习模型的个贷客户样本集中,个贷客户样本具有相同的个贷业务类型,且所述逾期个贷客户与所述个贷客户样本具有相同的个贷业务类型。
6.如权利要求1所述的逾期个贷催收方式确定方法,其特征在于,所述催收方式包括启动电话催收的开始时间。
7.一种逾期个贷催收方式确定装置,其特征在于,包括:
输入变量获取模块,用于获取逾期个贷客户的目标输入变量数据;
风险参数预测模块,用于将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;
风险类别确定模块,用于根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别;
临界时长确定模块,用于确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;
催收方式确定模块,用于根据所述时长确定针对所述逾期个贷客户的催收方式。
8.如权利要求7所述的逾期个贷催收方式确定装置,其特征在于,所述坏账风险参数预测模型预先通过训练机器学习模型得到。
9.如权利要求8所述的逾期个贷催收方式确定装置,其特征在于,所述机器学习模型的输入变量通过以下方式确定:
获取候选变量集合;
确定所述候选变量集合中各候选变量的数据缺失率,并剔除其数据缺失率达到缺失率阈值的输入变量,形成第二集合;
确定所述第二集合中各连续型候选变量在按照第一区间长度分箱下的第一信息价值,并剔除其第一信息价值未达到第一信息价值阈值的连续型候选变量,形成第三集合;
确定所述第三集合中各连续型候选变量在按照第二区间长度分箱下的群体稳定性指数值,并剔除其群体稳定性指数值大于群体稳定性指数阈值及不符合业务解释的连续型候选变量,形成第四集合;所述第二区间长度大于所述第一区间长度;
确定所述第四集合中各候选变量的第二信息价值,并剔除其第二信息价值小于第二信息价值阈值的连续型候选变量,形成第五集合;
确定所述第五集合中每两个候选变量之间的相关系数;当两个候选变量之间的相关系数大于相关系数阈值时,剔除所述两个候选变量中第二信息价值较小者,从而形成输入变量集合。
10.如权利要求8所述的逾期个贷催收方式确定装置,其特征在于,在所述机器学习模型的个贷客户样本集中,黑样本和白样本以个贷逾期迁徙率临界值作为区分。
11.如权利要求8所述的逾期个贷催收方式确定装置,其特征在于,在所述机器学习模型的个贷客户样本集中,个贷客户样本具有相同的个贷业务类型,且所述逾期个贷客户与所述个贷客户样本具有相同的个贷业务类型。
12.如权利要求7所述的逾期个贷催收方式确定装置,其特征在于,所述催收方式包括启动电话催收的开始时间。
13.一种电子设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,其特征在于,所述计算机程序被所述处理器运行时执行如下步骤:
获取逾期个贷客户的目标输入变量数据;
将所述目标输入变量数据输入预设的坏账风险参数预测模型,获得所述逾期个贷客户的坏账风险参数值;
根据所述坏账风险参数值确定所述逾期个贷客户的坏账风险类别;
确定所述逾期个贷客户当前的个贷逾期迁徙率变化至,对应于所述坏账风险类别的个贷逾期迁徙率临界值所需时长;
根据所述时长确定针对所述逾期个贷客户的催收方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010517148.8A CN111539812A (zh) | 2020-06-09 | 2020-06-09 | 逾期个贷催收方式确定方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010517148.8A CN111539812A (zh) | 2020-06-09 | 2020-06-09 | 逾期个贷催收方式确定方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111539812A true CN111539812A (zh) | 2020-08-14 |
Family
ID=71979880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010517148.8A Pending CN111539812A (zh) | 2020-06-09 | 2020-06-09 | 逾期个贷催收方式确定方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111539812A (zh) |
-
2020
- 2020-06-09 CN CN202010517148.8A patent/CN111539812A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106952155A (zh) | 一种基于信用评分的催收方法及装置 | |
CN110378575B (zh) | 逾期事件回款催收方法及装置、计算机可读存储介质 | |
CN112598500A (zh) | 一种无额度客户的授信处理方法及系统 | |
CN112801775A (zh) | 客户信用评价方法及装置 | |
CN116205355B (zh) | 电力负荷的预测方法、装置以及存储介质 | |
CN110634060A (zh) | 一种用户信用风险的评估方法、系统、装置及存储介质 | |
CN110807699B (zh) | 逾期事件的回款催收方法及装置、计算机可读存储介质 | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
WO2021034852A1 (en) | Cryptocurrency valuation by processing near real-time and historical data from multiple cryptocurrency exchanges | |
CN115293336A (zh) | 风险评估模型训练方法、装置和服务器 | |
CN114066620A (zh) | 基于客户画像的客户信息处理方法及装置 | |
CN110020939A (zh) | 建立违约损失率预测模型的装置、方法及存储介质 | |
CN111539812A (zh) | 逾期个贷催收方式确定方法、装置及电子设备 | |
CN112598068B (zh) | 一种贷款用途的验证方法、装置及设备 | |
CN113421154B (zh) | 基于控制图的信贷风险评估方法及系统 | |
CN115099933A (zh) | 一种业务预算方法、装置及设备 | |
CN117455681A (zh) | 业务风险预测方法和装置 | |
KR102336462B1 (ko) | 신용평가정보 제공 장치 및 방법 | |
CN112037049B (zh) | 银行卡收费方法及装置 | |
CN115577888A (zh) | 确定企业风险的方法及装置、电子设备和存储介质 | |
CN117035433B (zh) | 非法资金转移客户识别方法及装置 | |
CN111754331B (zh) | 一种业务审批方法及装置 | |
CN113537666B (zh) | 评测模型训练方法、评测和业务审核方法、装置及设备 | |
Shopov | Analysing and Forecasting the Debt Burden of the EU Countries: Is There a New European Debt Crisis on the Horizon? | |
CN114239748A (zh) | 信用分类模型处理方法、装置、设备、存储介质及程序 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220915 Address after: 25 Financial Street, Xicheng District, Beijing 100033 Applicant after: CHINA CONSTRUCTION BANK Corp. Address before: 25 Financial Street, Xicheng District, Beijing 100033 Applicant before: CHINA CONSTRUCTION BANK Corp. Applicant before: Jianxin Financial Science and Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200814 |
|
RJ01 | Rejection of invention patent application after publication |