CN111784506A - 逾期风险控制方法、设备及可读存储介质 - Google Patents

逾期风险控制方法、设备及可读存储介质 Download PDF

Info

Publication number
CN111784506A
CN111784506A CN202010625203.5A CN202010625203A CN111784506A CN 111784506 A CN111784506 A CN 111784506A CN 202010625203 A CN202010625203 A CN 202010625203A CN 111784506 A CN111784506 A CN 111784506A
Authority
CN
China
Prior art keywords
overdue
feature
target
preset
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010625203.5A
Other languages
English (en)
Inventor
卓本刚
黄启军
唐兴兴
李诗琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010625203.5A priority Critical patent/CN111784506A/zh
Publication of CN111784506A publication Critical patent/CN111784506A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本申请公开了一种逾期风险控制方法、设备及可读存储介质,所述逾期风险控制方法包括:获取目标用户对应的逾期特征数据,并将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果,进而对所述逾期预测结果进行模型预测解释,确定所述逾期预测结果对应的逾期影响因素,进而基于所述逾期影响因素,生成催收信息,以控制所述目标用户对应的逾期风险。本申请解决了贷款逾期风险高的技术问题。

Description

逾期风险控制方法、设备及可读存储介质
技术领域
本申请涉及人工智能领域,尤其涉及一种逾期风险控制方法、设备及可读存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
随着计算机软件和人工智能的不断发展,机器学习模型在商业银行或者其他信贷金融机构的业务中应用广泛,目前,逾期预测模型可对用户进行评分,进而基于评分,预测用户贷款是否会逾期,例如,若评分高于阀值,则预测结果为逾期,进而在用户发生实际逾期行为前,基于评分生成催收信息,以督促用户按期还款,但是,对于贷款用户,基于评分生成的催收信息所具备的置信度较低,贷款用户在接收到催收信息后,往往不愿意按期还款,进而导致贷款逾期的风险较高。
发明内容
本申请的主要目的在于提供一种逾期风险控制方法、设备及可读存储介质,旨在解决现有技术中贷款逾期风险高的技术问题。
为实现上述目的,本申请提供一种逾期风险控制方法,所述逾期风险控制方法应用于逾期风险控制设备,所述逾期风险控制方法包括:
获取目标用户对应的逾期特征数据,并将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果;
对所述逾期预测结果进行模型预测解释,确定所述逾期预测结果对应的逾期影响因素;
基于所述逾期影响因素,生成催收信息,以控制所述目标用户对应的逾期风险。
可选地,所述逾期影响因素包括目标逾期特征,
所述对所述逾期预测结果进行模型预测解释,确定所述逾期预测结果对应的逾期影响因素的步骤包括:
若所述逾期预测结果符合预设催收条件,则确定所述逾期特征数据对应的各逾期特征;
基于所述预设逾期预测模型,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度;
基于各所述特征贡献度,在各所述逾期特征中确定所述目标逾期特征。
可选地,所述基于各所述特征贡献度,在各所述逾期特征中确定所述目标逾期特征的步骤包括:
确定各所述特征贡献度的目标绝对值,并对各所述目标绝对值进行排序,获得排序结果;
基于所述排序结果,在各所述逾期特征中选取所述目标逾期特征。
可选地,所述逾期预测结果包括逾期概率,
在所述若所述逾期预测结果符合预设催收条件,则确定所述逾期特征数据对应的各逾期特征的步骤之前,所述逾期风险控制方法还包括:
将所述逾期概率与预设逾期概率阀值进行比对,若所述逾期概率大于所述预设逾期概率阀值,则判定所述逾期预测结果符合所述预设催收条件;
若所述逾期概率小于或者等于所述预设逾期概率阀值,则判定所述逾期预测结果不符合所述预设催收条件。
可选地,所述逾期影响因素包括目标逾期特征,
所述基于所述逾期影响因素,生成催收信息的步骤包括:
基于所述目标逾期特征对应的目标特征编码组合,匹配所述目标逾期特征组合对应的催收关键词;
基于所述催收关键词,生成所述催收信息。
可选地,所述将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果的步骤包括:
将所述逾期特征数据输入所述预设逾期预测模型,对所述逾期特征数据进行分类,以对所述目标用户进行逾期预测,获得分类标签;
基于所述分类标签,确定所述逾期预测结果。
可选地,所述基于所述预设逾期预测模型,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度的步骤包括:
基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集;
基于所述预设逾期预测模型和所述模型解释样本集,分别计算各所述特征贡献度。
可选地,所述模型解释样本集至少包括一个模型输入元素,所述模型输入元素至少包括一个第一类型元素和一个第二类型元素,
所述基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集的步骤包括:
在各所述逾期特征中选取目标特征,并在所述逾期特征数据中剔除所述目标特征对应的目标特征数据,获得剔除数据集,并在所述剔除数据集中选取所述第一类型元素之一,其中,所述第一类型元素为所述剔除数据集的子集;
将所述目标特征数据加入所述第一类型元素,获得所述第二类型元素之一;
重新在所述逾期特征中选取所述目标特征,以获取其他所述第一类型元素和其他所述第二类型元素,直至所述逾期特征数据中不存在所述目标特征,获得所述模型解释样本集。
本申请还提供一种逾期风险控制装置,所述逾期风险控制装置为虚拟装置,且所述逾期风险控制装置应用于逾期风险控制设备,所述逾期风险控制装置包括:
预测模块,用于获取目标用户对应的逾期特征数据,并将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果;
模型解释模块,用于对所述逾期预测结果进行模型预测解释,确定所述逾期预测结果对应的逾期影响因素;
生成模块,用于基于所述逾期影响因素,生成催收信息,以控制所述目标用户对应的逾期风险。
可选地,所述模型解释模块包括:
第一确定子模块,用于若所述逾期预测结果符合预设催收条件,则确定所述逾期特征数据对应的各逾期特征;
计算子模块,用于基于所述预设逾期预测模型,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度;
第二确定子模块,用于基于各所述特征贡献度,在各所述逾期特征中确定所述目标逾期特征。
可选地,所述第一确定子模块包括:
排序单元,用于确定各所述特征贡献度的目标绝对值,并对各所述目标绝对值进行排序,获得排序结果;
选取单元,用于基于所述排序结果,在各所述逾期特征中选取所述目标逾期特征。
可选地,所述逾期风险控制装置还包括:
第一判定模块,用于将所述逾期概率与预设逾期概率阀值进行比对,若所述逾期概率大于所述预设逾期概率阀值,则判定所述逾期预测结果符合所述预设催收条件;
第二判定模块,用于若所述逾期概率小于或者等于所述预设逾期概率阀值,则判定所述逾期预测结果不符合所述预设催收条件。
可选地,所述生成模块包括:
匹配子模块,用于基于所述目标逾期特征对应的目标特征编码组合,匹配所述目标逾期特征组合对应的催收关键词;
生成子模块,用于基于所述催收关键词,生成所述催收信息。
可选地,所述预测模块包括:
分类子模块,用于将所述逾期特征数据输入所述预设逾期预测模型,对所述逾期特征数据进行分类,以对所述目标用户进行逾期预测,获得分类标签;
第三确定子模块,用于基于所述分类标签,确定所述逾期预测结果。
可选地,所述计算子模块包括:
确定单元,用于基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集;
计算单元,用于基于所述预设逾期预测模型和所述模型解释样本集,分别计算各所述特征贡献度。
可选地,所述确定单元包括:
剔除子单元,用于在各所述逾期特征中选取目标特征,并在所述逾期特征数据中剔除所述目标特征对应的目标特征数据,获得剔除数据集,并在所述剔除数据集中选取所述第一类型元素之一,其中,所述第一类型元素为所述剔除数据集的子集;
并入子单元,用于将所述目标特征数据加入所述第一类型元素,获得所述第二类型元素之一;
重新选取单元,用于重新在所述逾期特征中选取所述目标特征,以获取其他所述第一类型元素和其他所述第二类型元素,直至所述逾期特征数据中不存在所述目标特征,获得所述模型解释样本集。
本申请还提供一种逾期风险控制设备,所述逾期风险控制设备为实体设备,所述逾期风险控制设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述逾期风险控制方法的程序,所述逾期风险控制方法的程序被处理器执行时可实现如上述的逾期风险控制方法的步骤。
本申请还提供一种可读存储介质,所述可读存储介质上存储有实现逾期风险控制方法的程序,所述逾期风险控制方法的程序被处理器执行时实现如上述的逾期风险控制方法的步骤。
本申请提供了一种逾期风险控制方法、设备及可读存储介质,相比于现有技术采用的基于逾期预测模型的评分,直接生成催收信息的技术手段,本申请在获得逾期预测结果之后,通过模型解释的方法,分析导致所述逾期预测结果的逾期影响因素,进而针对于逾期影响因素,生成对应的催收信息,使得催收信息与造成贷款逾期的逾期影响因素相匹配,进而提高了催收信息的置信度,克服了现有技术中由于催收信息的置信度低而导致逾期风险高的技术缺陷,进而降低了贷款逾期的风险,所以,解决了贷款逾期风险高的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请逾期风险控制方法第一实施例的流程示意图;
图2为本申请逾期风险控制方法中各所述逾期特征对应的特征贡献度的可视化示意图;
图3为本申请逾期风险控制方法第二实施例的流程示意图;
图4为本申请实施例方案涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种逾期风险控制方法,在本申请逾期风险控制方法的第一实施例中,参照图1,所述逾期风险控制方法包括:
步骤S10,获取目标用户对应的逾期特征数据,并将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果;
在本实施例中,需要说明的是,所述逾期特征数据为所述目标用户的逾期关联数据,用于评估所述目标用户对应的贷款是否将逾期,所述逾期特征数据包括教育支出数据、工作因素数据、医疗花费数据和投资收益数据等,所述预设逾期预测模型为对所述目标用户进行逾期预测的神经网络模型,用于评估所述目标用户的贷款是否将逾期或者评估所述目标用户的贷款逾期的概率等。
获取目标用户对应的逾期特征数据,并将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果,具体地,获取目标用户对应的逾期特征数据,并将所述逾期特征数据对应的逾期特征表示向量输入所述预设逾期预测模型,其中,所述逾期特征表示向量为所述逾期特征数据的向量表示形式,例如,假设所述逾期特征表示向量为(a,b,c),则特征值a表示目标用户的教育支出为10000元,特征值b表示目标用户在投资时亏损10000元,特征值c表示目标用户辞职了,进而对所述逾期特征表示向量进行数据处理,其中,数据处理包括卷积、池化和全连接等,获得逾期预测向量,并将所述逾期预测向量作为所述逾期预测结果,例如,假设所述逾期预测向量为(1,0.8),其中,1为所述目标用户的标签,表示目标用户为高逾期风险用户,0.8表示目标用户有80%的概率逾期。
其中,所述将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果的步骤包括:
步骤S11,将所述逾期特征数据输入所述预设逾期预测模型,对所述逾期特征数据进行分类,以对所述目标用户进行逾期预测,获得分类标签;
在本实施例中,将所述逾期特征数据输入所述预设逾期预测模型,对所述逾期特征数据进行分类,以对所述目标用户进行逾期预测,获得分类标签,具体地,对所述逾期特征数据进行编码,例如,独热编码等,进而获得所述逾期特征数据对应的逾期特征编码数据,进而将所述逾期特征编码数据输入所述预设逾期预测模型,对所述逾期特征编码数据进行数据处理,例如,卷积、池化和全连接等,以对所述逾期特征编码数据进行分类,获得分类向量,并将所述分类向量作为所述分类标签。
步骤S12,基于所述分类标签,确定所述逾期预测结果。
在本实施例中,基于所述分类标签,确定所述逾期预测结果,具体地,基于所述分类向量,在预设数据库中查询所述分类向量对应的逾期概率,并将所述逾期概率作为所述逾期预测结果。
步骤S20,对所述逾期预测结果进行模型预测解释,确定所述逾期预测结果对应的逾期影响因素;
在本实施例中,需要说明的是,所述逾期影响因素包括目标逾期特征,所述目标逾期特征为对所述逾期预测结果的影响程度高于预设影响程度阀值的逾期特征,也即为对所述逾期预测结果的特征贡献度高于预设特征贡献度阀值的逾期特征。
对所述逾期预测结果进行模型预测解释,确定所述逾期预测结果对应的逾期影响因素,具体地,确定所述逾期特征数据对应的各逾期特征,并对所述逾期预测结果进行模型预测解释,以分别计算各所述逾期特征对所述逾期预测结果的特征贡献度,进而基于各所述特征贡献度,在各所述逾期特征中确定目标逾期特征。
步骤S21,若所述逾期预测结果符合预设催收条件,则确定所述逾期特征数据对应的各逾期特征;
在本实施例中,需要说明的是,所述预设催收条件为用于判定所述目标用户是否逾期的条件,其中,所述预设催收条件包括逾期概率达到预设逾期概率阀值等。
若所述逾期预测结果符合预设催收条件,则确定所述逾期特征数据对应的各逾期特征,具体地,若所述逾期预测结果符合预设催收条件,则基于所述逾期特征数据对应的数据类别信息,确定各所述逾期特征,例如,假设所述逾期特征数据为目标用户辞职了而导致逾期概率高,则逾期特征为工作因素。
其中,所述逾期预测结果包括逾期概率,
在所述若所述逾期预测结果符合预设催收条件,则确定所述逾期特征数据对应的各逾期特征的步骤之前,所述逾期风险控制方法还包括:
步骤A10,将所述逾期概率与预设逾期概率阀值进行比对,若所述逾期概率大于所述预设逾期概率阀值,则判定所述逾期预测结果符合所述预设催收条件;
在本实施例中,将所述逾期概率与预设逾期概率阀值进行比对,若所述逾期概率大于所述预设逾期概率阀值,则判定所述逾期预测结果符合所述预设催收条件,具体地,将所述逾期概率与预设逾期概率阀值进行比对,若所述逾期概率大于所述预设逾期概率阀值,则证明所述目标用户为高风险逾期用户,需要对所述目标用户进行催收,进而判定所述逾期预测结果符合所述预设催收条件。
步骤A20,若所述逾期概率小于或者等于所述预设逾期概率阀值,则判定所述逾期预测结果不符合所述预设催收条件。
在本实施例中,若所述逾期概率小于或者等于所述预设逾期概率阀值,则判定所述逾期预测结果不符合所述预设催收条件,具体地,若所述逾期概率小于或者等于所述预设逾期概率阀值,则证明所述目标用户为低风险逾期用户,需要对所述目标用户进行催收,进而判定所述逾期预测结果不符合所述预设催收条件。
步骤S22,基于所述预设逾期预测模型,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度;
在本实施例中,需要说明的是,所述特征贡献度为所述逾期特征对所述逾期预测结果的影响程度,其中,所述特征贡献度包括正特征贡献度和负特征贡献度,其中,正特征贡献度表示对所述逾期预测结果具有正向的影响,负特征贡献度表示对所述逾期预测结果具有负向的影响,例如,假设目标用户辞职了,且在进行投资时净赚了20万元,则对应的逾期特征分别为工作因素和投资收益,由于工作丢失,则工作因素对应的特征贡献度应当为正特征贡献度,对逾期概率的提升具有正向激励作用,将提升逾期概率,由于投资收益为正,则投资收益对应的特征贡献度应当为负特征贡献度,对逾期概率的提升具有反向激励作用,将降低逾期概率。
基于所述预设逾期预测模型,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度,具体地,基于所述预设逾期预测模型,通过预设特征贡献度计算方式,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度,其中,所述预设特征贡献度计算方式包括SHAP(SHapley Additive exPlanations,沙普利可加性模型解释)和LIME(LocalInterpretable Model-Agnostic Explanations,模型无关局部解释)等。
进一步地,在一种可实施的方案,基于各所述特征贡献度与各所述特征贡献度对应的逾期特征,生成各所述逾期特征对应的特征贡献度可视化示意图,以对各所述逾期特征对所述逾期预测结果的特征贡献度进行可视化展示,如图2所示为各所述逾期特征对应的特征贡献度的可视化示意图,其中,通讯频率、教育支出、工作因素、投资收益和医疗等均为所述逾期特征,所述特征贡献度的绝度值大小为五边形中心至各顶点的线段的长度。
步骤S23,基于各所述特征贡献度,在各所述逾期特征中确定所述目标逾期特征。
在本实施例中,基于各所述特征贡献度,在各所述逾期特征中确定所述目标逾期特征,具体地,在各所述特征贡献度中选取大于预设特征贡献度阀值的各目标特征贡献度,进而将各所述目标特征贡献度对应的逾期特征作为目标逾期特征。
其中,所述基于各所述特征贡献度,在各所述逾期特征中确定所述目标逾期特征的步骤包括:
步骤S231,确定各所述特征贡献度的目标绝对值,并对各所述目标绝对值进行排序,获得排序结果;
在本实施例中,需要说明的是,所述目标绝对值为所述特征贡献度的绝对值。
确定各所述特征贡献度的目标绝对值,并对各所述目标绝对值进行排序,获得排序结果,具体地,确定各所述特征贡献度的目标绝对值,并将各所述目标绝对值以从大至小的方式进行排序,获得排序列表,并将所述排序列表作为所述排序结果。
步骤S232,基于所述排序结果,在各所述逾期特征中选取所述目标逾期特征。
在本实施例中,基于所述排序结果,在各所述逾期特征中选取目标逾期特征,具体地,基于所述排序列表中的逾期特征排列顺序,则所述排序列表中选取预设数量的目标逾期特征,其中,所述目标逾期特征为所述排序列表中对应的目标绝对值大于预设阀值的逾期特征。
步骤S30,基于所述逾期影响因素,生成催收信息,以控制所述目标用户对应的逾期风险。
在本实施例中,基于所述逾期影响因素,生成催收信息,以控制所述目标用户对应的逾期风险,具体地,基于所述目标逾期特征对应的催收关键词,生成催收信息,进而将所述催收信息发送至所述目标用户,对所述目标用户进行催收,以控制所述目标用户对应的逾期风险,其中,所述催收信息为对所述目标用户进行催收的信息,用于提醒目标用户按期还款,例如,假设当目标逾期特征为投资收益和工作因素,且投资收益对应的特征贡献度为负特征贡献度,工作因素对应的特征贡献度为正特征贡献度,则生成的催收信息为“虽然短期投资亏损,但工作稳定,身体健康,从长远来看,不要留下信用不良的记录,想办法先把贷款还了”,进而实现对目标用户的精准催收,提高催收的效果。
其中,所述基于所述逾期影响因素,生成催收信息的步骤包括:
步骤S41,基于所述目标逾期特征对应的目标特征编码组合,匹配所述目标逾期特征组合对应的催收关键词;
在本实施例中,需要说明的是没所述目标逾期特征的数量至少为一。
基于所述目标逾期特征对应的目标特征编码组合,匹配所述目标逾期特征组合对应的催收关键词,具体地,获取各所述目标逾期特征对应的目标特征贡献度和对应的目标特征编码,进而基于各所述目标特征编码和各所述目标特征贡献度之间的绝对值大小关系,生成所述目标特征编码组合,并基于所述目标特征编码组合,在预设关键词数据库中匹配所述目标特征编码组合对应的催收关键词,例如,假设目标逾期特征A对应的特征编码为a,对应的目标特征贡献度为0.5,目标逾期特征B对应的特征编码为b,对应的目标特征贡献度为-0.3,则所述目标特征编码组合为向量(0.5a,-0.3b)。
步骤S42,基于所述催收关键词,生成所述催收信息。
在本实施例中,基于所述催收关键词,生成所述催收信息,具体地,基于所述催收关键词,在预设催收信息数据库中匹配对应的所述催收信息,并将所述催收信息发送至所述目标用户,对所述目标用户进行催收,以提醒所述目标用户按时还款,以控制所述目标用户的逾期风险,例如,假设当目标逾期特征为投资收益和工作因素,且投资收益对应的特征贡献度为负特征贡献度,工作因素对应的特征贡献度为正特征贡献度,则投资收益对应的催收关键词为投资亏损,工作因素对应的催收关键词为工作稳定,进而在预设催收信息数据库中匹配的催收信息为“虽然短期投资亏损,但工作稳定,身体健康,从长远来看,不要留下信用不良的记录,想办法先把贷款还了”。
进一步地,需要说明的是,所述催收信息为基于目标逾期特征生成的,而目标逾期特征为各逾期特征中对逾期预测结果的特征贡献度超过预设特征贡献度阀值的逾期特征,进而捕捉到了对用户贷款逾期的逾期影响程度超过预测影响程度阀值的逾期影响因素,进而基于所述逾期影响因素,即可生成相匹配的催收信息,实现对高风险逾期用户的精准催收,以降低贷款逾期的风险。
本实施例提供了一种逾期风险控制方法、设备及可读存储介质,相比于现有技术采用的基于逾期预测模型的评分,直接生成催收信息的技术手段,本实施例在获得逾期预测结果之后,通过模型解释的方法,分析导致所述逾期预测结果的逾期影响因素,进而针对于逾期影响因素,生成对应的催收信息,使得催收信息与造成贷款逾期的逾期影响因素相匹配,进而提高了催收信息的置信度,克服了现有技术中由于催收信息的置信度低而导致逾期风险高的技术缺陷,进而降低了贷款逾期的风险,所以,解决了贷款逾期风险高的技术问题。
进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,所述基于所述预设逾期预测模型,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度的步骤包括:
步骤S221,基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集;
在本实施例中,需要说明的是,本实施例中计算特征贡献度的方法为SHAP,所述模型解释样本集为用于计算SHAP值的样本集,所述模型解释样本集包括一个或者多个模型输入元素,所述模型输入元素包括一个或者多个第一类型元素和一个或者多个第二类型元素。
基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集,具体地,在各所述逾期特征中选取目标特征,进而在所述逾期特征数据中剔除所述目标特征对应的数据,获得剔除数据集,其中,所述剔除数据集为除所述目标特征之外的其余各逾期特征对应的数据集,进而在剔除数据集中选取子集作为所述第一类型元素之一,并将所述目标特征加入所述第一类型元素,获得第二类型元素之一,直至所述剔除数据集的子集均被选取过一次,获得所述目标特征对应的各第一类型元素和各第二类型元素,并重新在各所述逾期特征中选取目标特征以获取所述第一类型元素和第二类型元素,直至各所述逾期特征均被选取过一次作为所述目标特征,其中,需要说明的是,所述剔除数据集的每一子集和每一目标特征均只选取一次。
其中,所述模型解释样本集至少包括一个模型输入元素,所述模型输入元素至少包括一个第一类型元素和一个第二类型元素,
所述基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集的步骤包括:
步骤B10,在各所述逾期特征中选取目标特征,并在所述逾期特征数据中剔除所述目标特征对应的目标特征数据,获得剔除数据集,并在所述剔除数据集中选取所述第一类型元素之一,其中,所述第一类型元素为所述剔除数据集的子集;
在本实施例中,需要说明的是,每一所述逾期特征均只选取一次作为所述目标特征,所述剔除数据集的每一子集均只选取一次作为所述第一类型元素之一,且若需要进行基于所述预设逾期预测模型对各所述逾期特征进行全局解释,则所述第一类型元素即为所述剔除数据集,其中,所述剔除数据集的子集为对应的各逾期特征进行排列组合确定的,例如,假设所述剔除数据集为(A,B),其中,A和B代表不同的逾期特征,则所述剔除数据集的子集包括空集,A,B,(A,B)和(B,A)五种情况。
步骤B20,将所述目标特征数据加入所述第一类型元素,获得所述第二类型元素之一;
在本实施例中,将所述目标特征加入所述第一类型元素,获得所述第二类型元素之一,具体地,将所述目标特征对应的目标特征数据并入所述目标特征对应的第一类型元素,获得所述目标特征数据和所述第一类型元素之间的并集,并将所述并集作为所述第一类型元素对应的第二类型元素。
步骤B30,重新在所述逾期特征中选取所述目标特征,以获取其他所述第一类型元素和其他所述第二类型元素,直至所述逾期特征数据中不存在所述目标特征,获得所述模型解释样本集。
在本实施例中,需要说明的是,若一所述逾期特征已经被选取过作为所述目标特征,则选取过的所述逾期特征不能再作为所述目标特征,且选取过的所述剔除数据集的子集不能再作为所述第一类型元素之一。
重新在所述逾期特征中选取所述目标特征,以获取其他所述第一类型元素和其他所述第二类型元素,直至所述逾期特征数据中不存在所述目标特征,获得所述模型解释样本集,具体地,重复执行所述步骤B10至步骤B20,直至获得的所述剔除数据集中无法再选取所述第一类型元素和所述第二类型元素,获得所述模型解释样本集。
步骤S222,基于所述预设逾期预测模型和所述模型解释样本集,分别计算各所述特征贡献度。
在本实施例中,需要说明的是,所述模型解释样本集包括各所述逾期特征分别对应的各所述第一类型元素和各所述第二类型元素,其中,一所述逾期特征至少对应一所述第一类型元素和一所述第二类型元素。
基于所述预设逾期预测模型和所述模型解释样本集,分别计算各所述特征贡献度,具体地,分别将各所述逾期特征分别对应的各第一类型元素和对应的各第二类型元素输入所述预设逾期预测模型,执行模型预测,获得所述预设逾期预测模型在所述模型解释样本集中各元素上的输出结果,获得所述模型输出结果集合,其中,一所述第一类型元素或者一所述第二类型元素对应所述模型输出结果集合中的一输出结果元素,进一步地,基于所述模型输出结果集合,通过预设SHAP值计算公式,计算各所述逾期特征分别对应的各SHAP值,其中,一所述逾期特征至少对应一SHAP值,进而对每一所述逾期特征对应的各SHAP值求平均,获得各所述逾期特征对应的特征贡献度,其中,所述预设SHAP值计算公式如下所示:
Figure BDA0002565924600000141
其中,φi为所述SHAP值,F为各所述逾期特征的特征数据集合,F\{i}为F中剔除第i个特征后的剔除数据集,S为所述剔除数据集的一个子集,
Figure BDA0002565924600000142
为所述预设逾期预测模型在S集合上的输出值,fS∪{i}(xS∪{i})为S集并上特征i后在所述预设逾期预测模型上的输出值,且所述预设边际效益期望计算公式中带有阶乘符号的分数系数为剔除的逾期特征为第i个特征且剔除数据集为S时的情况占所有情况的概率。
本实施例通过基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集,进而基于所述预设逾期预测模型和所述模型解释样本集,分别计算各所述特征贡献度。也即本实施例提供了一种基于SHAP算法计算特征贡献度的方法,进而计算获得各逾期特征的特征贡献度之后,即可基于各特征贡献度,在各所述逾期特征中确定目标逾期特征,进而基于所述目标逾期特征,即可有针对性的对所述目标用户进行催收,使得催收手段与造成贷款逾期的逾期影响因素相匹配,进而提高了贷款催收的效果,降低了贷款逾期的风险,进而为解决贷款逾期风险高的技术问题奠定了基础。
参照图4,图4是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
如图4所示,该逾期风险控制设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该逾期风险控制设备还可以包括矩形用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图4中示出的逾期风险控制设备结构并不构成对逾期风险控制设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及逾期风险控制方法程序。操作系统是管理和控制逾期风险控制设备硬件和软件资源的程序,支持逾期风险控制方法程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与逾期风险控制方法系统中其它硬件和软件之间通信。
在图4所示的逾期风险控制设备中,处理器1001用于执行存储器1005中存储的逾期风险控制方法程序,实现上述任一项所述的逾期风险控制方法的步骤。
本申请逾期风险控制设备具体实施方式与上述逾期风险控制方法各实施例基本相同,在此不再赘述。
本申请实施例还提供一种逾期风险控制装置,所述逾期风险控制装置应用于逾期风险控制设备,所述逾期风险控制装置包括:
预测模块,用于获取目标用户对应的逾期特征数据,并将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果;
模型解释模块,用于对所述逾期预测结果进行模型预测解释,确定所述逾期预测结果对应的逾期影响因素;
催收模块,用于基于所述逾期影响因素,生成催收信息,以控制所述目标用户对应的逾期风险。
可选地,所述模型解释模块包括:
第一确定子模块,用于若所述逾期预测结果符合预设催收条件,则确定所述逾期特征数据对应的各逾期特征;
计算子模块,用于基于所述预设逾期预测模型,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度;
第二确定子模块,用于基于各所述特征贡献度,在各所述逾期特征中确定所述目标逾期特征。
可选地,所述第一确定子模块包括:
排序单元,用于确定各所述特征贡献度的目标绝对值,并对各所述目标绝对值进行排序,获得排序结果;
选取单元,用于基于所述排序结果,在各所述逾期特征中选取所述目标逾期特征。
可选地,所述逾期风险控制装置还包括:
第一判定模块,用于将所述逾期概率与预设逾期概率阀值进行比对,若所述逾期概率大于所述预设逾期概率阀值,则判定所述逾期预测结果符合所述预设催收条件;
第二判定模块,用于若所述逾期概率小于或者等于所述预设逾期概率阀值,则判定所述逾期预测结果不符合所述预设催收条件。
可选地,所述催收模块包括:
匹配子模块,用于基于所述目标逾期特征对应的目标特征编码组合,匹配所述目标逾期特征组合对应的催收关键词;
生成子模块,用于基于所述催收关键词,生成所述催收信息。
可选地,所述预测模块包括:
分类子模块,用于将所述逾期特征数据输入所述预设逾期预测模型,对所述逾期特征数据进行分类,以对所述目标用户进行逾期预测,获得分类标签;
第三确定子模块,用于基于所述分类标签,确定所述逾期预测结果。
可选地,所述计算子模块包括:
确定单元,用于基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集;
计算单元,用于基于所述预设逾期预测模型和所述模型解释样本集,分别计算各所述特征贡献度。
可选地,所述确定单元包括:
剔除子单元,用于在各所述逾期特征中选取目标特征,并在所述逾期特征数据中剔除所述目标特征对应的目标特征数据,获得剔除数据集,并在所述剔除数据集中选取所述第一类型元素之一,其中,所述第一类型元素为所述剔除数据集的子集;
并入子单元,用于将所述目标特征数据加入所述第一类型元素,获得所述第二类型元素之一;
重新选取单元,用于重新在所述逾期特征中选取所述目标特征,以获取其他所述第一类型元素和其他所述第二类型元素,直至所述逾期特征数据中不存在所述目标特征,获得所述模型解释样本集。
本申请逾期风险控制装置的具体实施方式与上述逾期风险控制方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

Claims (10)

1.一种逾期风险控制方法,其特征在于,所述逾期风险控制方法包括:
获取目标用户对应的逾期特征数据,并将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果;
对所述逾期预测结果进行模型预测解释,确定所述逾期预测结果对应的逾期影响因素;
基于所述逾期影响因素,生成催收信息,以控制所述目标用户对应的逾期风险。
2.如权利要求1所述逾期风险控制方法,其特征在于,所述逾期影响因素包括目标逾期特征,
所述对所述逾期预测结果进行模型预测解释,确定所述逾期预测结果对应的逾期影响因素的步骤包括:
若所述逾期预测结果符合预设催收条件,则确定所述逾期特征数据对应的各逾期特征;
基于所述预设逾期预测模型,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度;
基于各所述特征贡献度,在各所述逾期特征中确定所述目标逾期特征。
3.如权利要求2所述逾期风险控制方法,其特征在于,所述基于各所述特征贡献度,在各所述逾期特征中确定所述目标逾期特征的步骤包括:
确定各所述特征贡献度的目标绝对值,并对各所述目标绝对值进行排序,获得排序结果;
基于所述排序结果,在各所述逾期特征中选取所述目标逾期特征。
4.如权利要求2所述逾期风险控制方法,其特征在于,所述逾期预测结果包括逾期概率,
在所述若所述逾期预测结果符合预设催收条件,则确定所述逾期特征数据对应的各逾期特征的步骤之前,所述逾期风险控制方法还包括:
将所述逾期概率与预设逾期概率阀值进行比对,若所述逾期概率大于所述预设逾期概率阀值,则判定所述逾期预测结果符合所述预设催收条件;
若所述逾期概率小于或者等于所述预设逾期概率阀值,则判定所述逾期预测结果不符合所述预设催收条件。
5.如权利要求1所述逾期风险控制方法,其特征在于,所述逾期影响因素包括目标逾期特征,
所述基于所述逾期影响因素,生成催收信息的步骤包括:
基于所述目标逾期特征对应的目标特征编码组合,匹配所述目标逾期特征组合对应的催收关键词;
基于所述催收关键词,生成所述催收信息。
6.如权利要求1所述逾期风险控制方法,其特征在于,所述将所述逾期特征数据输入预设逾期预测模型,对所述目标用户进行逾期预测,获得逾期预测结果的步骤包括:
将所述逾期特征数据输入所述预设逾期预测模型,对所述逾期特征数据进行分类,以对所述目标用户进行逾期预测,获得分类标签;
基于所述分类标签,确定所述逾期预测结果。
7.如权利要求2所述逾期风险控制方法,其特征在于,所述基于所述预设逾期预测模型,分别计算各所述逾期特征对所述逾期预测结果的特征贡献度的步骤包括:
基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集;
基于所述预设逾期预测模型和所述模型解释样本集,分别计算各所述特征贡献度。
8.如权利要求7所述逾期风险控制方法,其特征在于,所述模型解释样本集至少包括一个模型输入元素,所述模型输入元素至少包括一个第一类型元素和一个第二类型元素,
所述基于各所述逾期特征和所述逾期特征数据,确定模型解释样本集的步骤包括:
在各所述逾期特征中选取目标特征,并在所述逾期特征数据中剔除所述目标特征对应的目标特征数据,获得剔除数据集,并在所述剔除数据集中选取所述第一类型元素之一,其中,所述第一类型元素为所述剔除数据集的子集;
将所述目标特征数据加入所述第一类型元素,获得所述第二类型元素之一;
重新在所述逾期特征中选取所述目标特征,以获取其他所述第一类型元素和其他所述第二类型元素,直至所述逾期特征数据中不存在所述目标特征,获得所述模型解释样本集。
9.一种逾期风险控制设备,其特征在于,所述逾期风险控制设备包括:存储器、处理器以及存储在存储器上的用于实现所述逾期风险控制方法的程序,
所述存储器用于存储实现逾期风险控制方法的程序;
所述处理器用于执行实现所述逾期风险控制方法的程序,以实现如权利要求1至8中任一项所述逾期风险控制方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有实现逾期风险控制方法的程序,所述实现逾期风险控制方法的程序被处理器执行以实现如权利要求1至8中任一项所述逾期风险控制方法的步骤。
CN202010625203.5A 2020-07-01 2020-07-01 逾期风险控制方法、设备及可读存储介质 Pending CN111784506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010625203.5A CN111784506A (zh) 2020-07-01 2020-07-01 逾期风险控制方法、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010625203.5A CN111784506A (zh) 2020-07-01 2020-07-01 逾期风险控制方法、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN111784506A true CN111784506A (zh) 2020-10-16

Family

ID=72757773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010625203.5A Pending CN111784506A (zh) 2020-07-01 2020-07-01 逾期风险控制方法、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111784506A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112184431A (zh) * 2020-11-09 2021-01-05 上海优扬新媒信息技术有限公司 用户风险确定方法和装置
CN112561713A (zh) * 2020-12-15 2021-03-26 中国人寿保险股份有限公司 一种保险行业理赔反欺诈识别方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952155A (zh) * 2017-03-08 2017-07-14 深圳前海纵腾金融科技服务有限公司 一种基于信用评分的催收方法及装置
CN109902833A (zh) * 2018-12-05 2019-06-18 阿里巴巴集团控股有限公司 机器学习模型解释方法以及装置
CN110533520A (zh) * 2019-06-06 2019-12-03 上海凯京信达科技集团有限公司 一种基于多模型的个体客户贷款逾期等级的评级方法
CN110782341A (zh) * 2019-10-25 2020-02-11 深圳前海微众银行股份有限公司 业务催收方法、装置、设备及介质
CN111160473A (zh) * 2019-12-30 2020-05-15 深圳前海微众银行股份有限公司 一种分类标签的特征挖掘方法及装置
CN111325353A (zh) * 2020-02-28 2020-06-23 深圳前海微众银行股份有限公司 训练数据集的贡献度计算方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952155A (zh) * 2017-03-08 2017-07-14 深圳前海纵腾金融科技服务有限公司 一种基于信用评分的催收方法及装置
CN109902833A (zh) * 2018-12-05 2019-06-18 阿里巴巴集团控股有限公司 机器学习模型解释方法以及装置
CN110533520A (zh) * 2019-06-06 2019-12-03 上海凯京信达科技集团有限公司 一种基于多模型的个体客户贷款逾期等级的评级方法
CN110782341A (zh) * 2019-10-25 2020-02-11 深圳前海微众银行股份有限公司 业务催收方法、装置、设备及介质
CN111160473A (zh) * 2019-12-30 2020-05-15 深圳前海微众银行股份有限公司 一种分类标签的特征挖掘方法及装置
CN111325353A (zh) * 2020-02-28 2020-06-23 深圳前海微众银行股份有限公司 训练数据集的贡献度计算方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张友谊等: "《张全新塑造论哲学研究 新哲学体系探索》", 28 February 2015 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112184431A (zh) * 2020-11-09 2021-01-05 上海优扬新媒信息技术有限公司 用户风险确定方法和装置
CN112561713A (zh) * 2020-12-15 2021-03-26 中国人寿保险股份有限公司 一种保险行业理赔反欺诈识别方法及装置

Similar Documents

Publication Publication Date Title
CN110070391B (zh) 数据处理方法、装置、计算机可读介质及电子设备
CN111816312B (zh) 基于模型解释的健康状态检测方法、设备及可读存储介质
CN111460250B (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN110598620A (zh) 模型训练方法和装置、目标检测方法和装置
US11514369B2 (en) Systems and methods for machine learning model interpretation
CN111783873A (zh) 基于增量朴素贝叶斯模型的用户画像方法及装置
CN111784506A (zh) 逾期风险控制方法、设备及可读存储介质
CN113822488A (zh) 融资租赁的风险预测方法、装置、计算机设备及存储介质
CN111611390B (zh) 一种数据处理方法及装置
CN112990281A (zh) 异常投标识别模型训练方法、异常投标识别方法及装置
CN112328869A (zh) 一种用户贷款意愿的预测方法、装置及计算机系统
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
CN111784053A (zh) 交易风险检测方法、设备及可读存储介质
CN113033912A (zh) 问题解决人推荐方法及装置
CN110991247B (zh) 一种基于深度学习与nca融合的电子元器件识别方法
CN112102049A (zh) 一种模型训练方法、业务处理方法、装置及设备
CN115292167A (zh) 生命周期预测模型构建方法、装置、设备及可读存储介质
CN113516182A (zh) 视觉问答模型训练、视觉问答方法和装置
Sun et al. Multi-attribute fuzzy pattern decision making based on information systems
CN113159460A (zh) 一种用户数据处理的方法、装置、计算机设备及存储介质
CN115757956A (zh) 一种组合产品推荐方法、装置、电子设备及存储介质
CN112184417A (zh) 一种业务的审批方法、装置、介质及电子设备
CN114036302A (zh) 分类方法与装置、数据交易系统及可读存储介质
CN117541885A (zh) 样本数据处理方法、装置、存储介质和系统
CN117611352A (zh) 一种车险理赔处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201016