CN111652711A - 基于催收数据的贷前分析方法、装置、设备与存储介质 - Google Patents

基于催收数据的贷前分析方法、装置、设备与存储介质 Download PDF

Info

Publication number
CN111652711A
CN111652711A CN202010520734.8A CN202010520734A CN111652711A CN 111652711 A CN111652711 A CN 111652711A CN 202010520734 A CN202010520734 A CN 202010520734A CN 111652711 A CN111652711 A CN 111652711A
Authority
CN
China
Prior art keywords
risk
determining
box
variable
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010520734.8A
Other languages
English (en)
Inventor
林禹君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010520734.8A priority Critical patent/CN111652711A/zh
Publication of CN111652711A publication Critical patent/CN111652711A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Abstract

本发明公开了一种基于催收数据的贷前分析方法,包括:若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组;确定所述箱组的负样本数,并基于所述负样本数,确定所述风险变量对应的目标风险规则;若检测到用户的贷款申请,则基于所述用户的催收数据,获取所述用户对应的目标风险变量;基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。本发明还公开了一种基于催收数据的贷前分析装置、设备和存储介质。本发明通过历史催收数据构建风险规则,并确定当前用户是否命中风险规则,以此确定用户的贷前风险,提高贷前分析的准确性。

Description

基于催收数据的贷前分析方法、装置、设备与存储介质
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及基于催收数据的贷前分析方法、装置、设备与存储介质。
背景技术
近年来,随着金融科技(Fintech),尤其是互联网金融的不断发展,数据分析技术被引入银行等金融机构的日常服务中。在银行等金融机构的日常服务过程中,往往需要对申请相关业务的客户进行风险分析,如对申请贷款的客户进行贷前分析,以决定是否给与贷款,避免客户在贷款之后无法及时偿还,给银行等金融带来直接的经济损失,因此,如何对贷前客户进行还款风险分析,是银行等金融机构必做的一项重要工作。
现有银行等金融系统,在进行贷前分析时,一般是根据客户在银行留底的数据,如贷款信息和信用卡还款信息等,构造信用评分卡,以此判断客户的还款意愿和还款能力。
然而,此种判断方式数据来源较为狭隘,依赖本地银行系统留底的数据,对于未上报的其他金融机构的信息无从知晓,且信息维度缺失,导致在分析判断时准确率较低。
发明内容
本发明的主要目的在于提出一种基于催收数据的贷前分析方法、装置、设备与存储介质,旨在提高贷前风险分析的准确率。
为实现上述目的,本发明提供一种基于催收数据的贷前分析方法,所述基于催收数据的贷前分析方法包括如下步骤:
若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则;
确定所述箱组的负样本数,并基于所述负样本数和所述箱组规则,确定所述风险变量对应的目标风险规则;
若检测到用户的贷款申请,则基于所述用户的催收记录,获取所述用户对应的目标风险变量;
基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。
优选地,所述确定所述箱组的负样本数,并基于所述负样本数和所述箱组规则,确定所述风险变量对应的目标风险规则的步骤包括:
确定所述箱组的负样本数,并基于所述负样本数,计算所述箱组的提升度;
基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则。
优选地,所述确定所述箱组的负样本数,并基于所述负样本数,计算所述箱组的提升度的步骤包括:
确定所述箱组的负样本数,以及所述风险变量的总负样本数,并分别计算所述负样本数在所述箱组中的坏账比,以及所述总负样本数在所述风险变量中的总坏账比;
基于所述坏账比和所述总坏账比,计算所述箱组的提升度。
优选地,所述基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则的步骤包括:
确定提升度大于等于预设值的目标箱组,并基于所述箱组规则,确定所述目标箱组对应的目标箱组规则;
基于所述目标箱组规则,确定所述风险变量对应的目标风险规则。
优选地,所述风险变量至少包括两种,所述基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则的步骤包括:
基于所述提升度和所述箱组规则,确定所述风险变量对应的至少两种风险规则;
基于预设算法,确定所述风险规则的稳定性,并基于所述稳定性,从所述风险规则中筛选出目标风险规则。
优选地,所述若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量的步骤包括:
若获得电催机器人记录的催收记录,则确定所述催收记录的表现期,并基于所述表现期,对所述催收记录进行扩充处理,以得到所述催收记录对应的样本数据;
确定所述样本数据对应的风险变量。
优选地,所述对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则的步骤包括:
确定所述风险变量的变量值,并基于所述变量值对所述风险变量进行过滤;
确定过滤后的所述风险变量的分箱数量,并基于所述分箱数量,对过滤后的所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则。
此外,为实现上述目的,本发明还提供一种基于催收数据的贷前分析装置,所述基于催收数据的贷前分析装置包括:
分箱模块,用于若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则;
确定模块,用于确定所述箱组的负样本数,并基于所述负样本数和所述箱组规则,确定所述风险变量对应的目标风险规则;
获取模块,用于若检测到用户的贷款申请,则基于所述用户的催收记录,获取所述用户对应的目标风险变量;
判断模块,用于基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。
优选地,所述确定模块还用于:
确定所述箱组的负样本数,并基于所述负样本数,计算所述箱组的提升度;
基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则。
优选地,所述确定模块还用于:
确定所述箱组的负样本数,以及所述风险变量的总负样本数,并分别计算所述负样本数在所述箱组中的坏账比,以及所述总负样本数在所述风险变量中的总坏账比;
基于所述坏账比和所述总坏账比,计算所述箱组的提升度。
优选地,所述确定模块还用于:
确定提升度大于等于预设值的目标箱组,并基于所述箱组规则,确定所述目标箱组对应的目标箱组规则;
基于所述目标箱组规则,确定所述风险变量对应的目标风险规则。
优选地,所述确定模块还用于:
基于所述提升度和所述箱组规则,确定所述风险变量对应的至少两种风险规则;
基于预设算法,确定所述风险规则的稳定性,并基于所述稳定性,从所述风险规则中筛选出目标风险规则。
优选地,所述分箱模块还用于:
若获得电催机器人记录的催收记录,则确定所述催收记录的表现期,并基于所述表现期,对所述催收记录进行扩充处理,以得到所述催收记录对应的样本数据;
确定所述样本数据对应的风险变量。
优选地,所述分箱模块还用于:
确定所述风险变量的变量值,并基于所述变量值对所述风险变量进行过滤;
确定过滤后的所述风险变量的分箱数量,并基于所述分箱数量,对过滤后的所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则。
此外,为实现上述目的,本发明还提供一种基于催收数据的贷前分析设备,所述基于催收数据的贷前分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于催收数据的贷前分析程序,所述基于催收数据的贷前分析程序被所述处理器执行时实现如上所述的基于催收数据的贷前分析方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于催收数据的贷前分析程序,所述基于催收数据的贷前分析程序被处理器执行时实现如上所述的基于催收数据的贷前分析方法的步骤。
本发明提出的基于催收数据的贷前分析方法,若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组;确定所述箱组的负样本数,并基于所述负样本数,确定所述风险变量对应的目标风险规则;若检测到用户的贷款申请,则基于所述用户的催收数据,获取所述用户对应的目标风险变量;基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。本发明通过历史催收记录构建风险规则,并在检测到用户的贷款申请时,通过用户的催收数据,确定用户存在哪些风险变量,并基于风险变量,确定用户是否命中风险规则,以此确定用户的贷前风险,使得银行等金融机构可从催收数据这一维度确定用户的贷前风险,并且,通过构建风险规则,准确识别风险贷款,提高了贷前分析的准确性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明基于催收数据的贷前分析方法第一实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例设备可以是移动终端或服务器设备。
如图1所示,该设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于催收数据的贷前分析程序。
其中,操作系统是管理和控制基于催收数据的贷前分析设备与软件资源的程序,支持网络通信模块、用户接口模块、基于催收数据的贷前分析程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;用户接口模块用于管理和控制用户接口1003。
在图1所示的基于催收数据的贷前分析设备中,所述基于催收数据的贷前分析设备通过处理器1001调用存储器1005中存储的基于催收数据的贷前分析程序,并执行下述基于催收数据的贷前分析方法各个实施例中的操作。
基于上述硬件结构,提出本发明基于催收数据的贷前分析方法实施例。
参照图2,图2为本发明基于催收数据的贷前分析方法第一实施例的流程示意图,所述方法包括:
步骤S10,若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组;
步骤S20,确定所述箱组的负样本数,并基于所述负样本数,确定所述风险变量对应的目标风险规则;
步骤S30,若检测到用户的贷款申请,则基于所述用户的催收数据,获取所述用户对应的目标风险变量;
步骤S40,基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。
本实施例基于催收数据的贷前分析方法运用于理财机构或者银行等金融机构的基于催收数据的贷前分析设备中,基于催收数据的贷前分析设备可以是终端、机器人或者PC设备,为描述方便,基于催收数据的贷前分析设备以分析设备简称。
为避免用户在贷款之后没有能力或者没有意愿进行还款,银行等金融机构往往需要对申请贷款的用户进行贷前风险分析,以决定是否通过审批,在本实施例中,银行等金融机构的分析设备在对用户进行贷前风险分析的过程中,根据电催机器人的催收记录构建目标风险规则,在检测到用户的贷款申请时,判断用户是否命中目标风险规则来确定用户的贷款申请是否可以通过审批,与以往根据用户的信用评分卡来判断用户是否具备贷前风险不同,创造性的利用电催机器人的催收记录进行贷前风险分析,并且,由于催收记录真实客观的反映出用户在贷款之后的贷后行为,因此,通过催收记录构建的目标风险规则更具参考价值,使得最终的贷前分析结果更加准确。
以下将对各个步骤进行详细说明:
步骤S10,若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则。
在本实施例中,分析设备与外部的电催机器人对接,分析设备可主动从电催机器人获取所有贷款的客户的催收记录;分析设备还可接收电催机器人主动上传的催收记录,也即,在另一实施例中,催收记录由电催机器人主动上传。需要说明的是,电催机器人承接了很多金融机构的电催任务,每一个电催任务即为一个样本,也可理解为一个用户即为一个样本,电催机器人在执行电催任务时,如催促贷款用户尽快还款等,会记录相应的催收记录,如是否有接听等,以被分析设备获得。
若分析设备获得电催机器人记录的催收记录,则先确定催收记录对应的风险变量,需要说明的是,风险变量指的是与用户贷后违约相关的维度参数,在本实施例中,风险变量的风险类型至少包括多头类、外呼维度、客户响应维度、逾期情况等中的一种或几种,其中,多头类指的是用户贷过款的贷款平台数量等,如甲用户在3个贷款平台贷过款,则甲用户的多头类的多头值为3;外呼维度指的是用户在贷款之后被电催的次数等,如甲用户贷款之后被电催过4次,则甲用户的外呼维度的外呼值为4;客户响应维度指的是用户在被电催时是否有接听,若有接听,是否有承诺还款等,其中,以1表示有接听但未承诺还款,0表示未接听,2表示有接听且承诺还款,如甲用户在被电催时未接听,则甲用户的客户响应维度的响应值为0;逾期情况指的是用户贷款之后未按照约定期限进行还款的逾期天数等,如甲用户未在约定的15号进行还款,而是等到20号进行还款,则甲用户的逾期情况的逾期值为5天等。
接着,分析设备对风险变量进行分箱处理,具体可通过等频分箱或者等距分箱的方式进行分箱,以得到若干个箱组,以及每个箱组对应的箱组规则。
需要说明的是,一个样本中可能包括多个风险变量,如甲用户在2个贷款平台贷过款,当前已被电催3次,则甲用户对应的风险变量就包括多头类的多头值为2,外呼维度的外呼值为3等。分箱过程中,是以风险变量作为分箱参数来对电催记录中的用户进行划分,如以多头类作为分箱参数,对电催记录中的样本进行划分等,当风险变量有多个时,如多头类和外呼维度,则分别以各风险变量作为分箱参数,对电催记录中的样本进行划分,以得到两组若干个箱组。
进一步地,在一实施例中,对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则的步骤包括:
步骤a1,确定所述风险变量的变量值,并基于所述变量值对所述风险变量进行过滤;
在一实施例中,分析设备先确定风险变量的变量值,然后根据变量值,对风险变量进行过滤,具体过滤掉尾部极端值,如99分位点的值等,为描述方便,以风险变量是多头类为例进行说明,在一实施例中,先确定各用户多头类的变量值,也即多头值,如甲在3个贷款平台贷过款,乙在2个贷款平台贷过款,丙在4个贷款平台贷过款,丁在999个贷款平台贷过款等,则确定变量值分别为3、2、4和999等,再对尾部极端值999进行过滤,从而剩下甲3,乙2,丙4......避免尾部极端值对后续判断的干扰。
步骤a2,确定过滤后的所述风险变量的分箱数量,并基于所述分箱数量,对过滤后的所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则。
在一实施例中,在得到过滤后的风险变量之后,确定风险变量的分箱数量,其中,分箱数量可根据实际情况进行设定,如10等,再根据分箱数量对风险变量进行分箱处理,以得到对应的箱组,以及各箱组对应的箱组规则,如进行等频分箱,假设风险变量的变量数量有100个,也即有100个用户样本,则先按照风险变量的变量值进行从大到小或者从小到大的排序,然后根据分箱数量10,将100个样本,划分成10个等频的箱组,即每个箱组中包含10个变量值等,每个箱组都对应一条箱组规则,如多头类的多头值排序前10的10个样本为第一个箱组,且多头值都为1或者2,则第一个箱组的箱组规则是多头值≤2等。
此外,还可采用等距分箱的方式进行分箱处理,具体的,先按照分箱变量的变量值进行从大到小或者从小到大的排序,然后将序列中的最大值减去最小值除以分箱数量,从而得到箱距,再以箱距进行等距分箱,如风险变量中,变量值最大值与最小值的差值为20,则除以分箱数量10,得到箱距为2,则以2为距离,将变量值≤2的风险变量放置在第一个箱组,将2<变量值≤4的风险变量放置在第二个箱组......以此类推,划分为10个箱组,可以理解的,等距分箱得到的某个箱组,可能没有样本,如10<变量值≤12的箱组,由于样本中没有变量值是11或者12的样本,则该箱组的样本为0等。
进一步地,在另一实施例中,分箱数量可根据风险变量的变量数量以及风险变量的风险类型确定,也即,所述确定过滤后的所述风险变量的分箱数量的步骤包括:
确定过滤后的所述风险变量的变量数量,以及所述风险变量的风险类型,并基于所述变量数量和所述风险类型,确定所述风险变量的分箱数量。
具体的,在另一实施例中,分箱数量由风险变量的变量数量以及风险变量的风险类型共同确定,可事先建立变量数量、风险类型与分箱数量的映射关系,因此,可通过风险变量的变量数量和风险类型,确定风险变量对应的分箱数量。也即,不同变量数量和不同风险类型的风险变量对应有不同的分箱数量,避免由于变量数量不同或者风险类型不同,在面对一些特殊情况,如99个风险变量要分成等频的10个箱组等情形时,无法对风险变量进行准确分箱。也即,通过风险变量的变量数量和风险类型,确定风险变量对应的分箱数量的方式可应对各种分箱问题,提高分箱准确性。
步骤S20,确定所述箱组的负样本数,并基于所述负样本数和所述箱组规则,确定所述风险变量对应的目标风险规则。
在本实施例中,在得到若干箱组之后,确定各箱组的负样本数,其中,负样本事先定义,具体定义规则为:选取预设表现期内,如三个月内,连续预设次数,如两次,逾期的样本为负样本,也即,分析设备在获得电催机器人的催收记录时,即可根据事先定义的负样本规则进行正样本和负样本的筛选,然后,根据各箱组中的负样本数以及各箱组的箱组规则,确定风险变量对应的目标风险规则。
在一实施例中,可根据箱组中负样本数的多寡来确定目标箱组,也即,负样本数大于预设数值的箱组,或者负样本数最大的箱组即为目标箱组,最后,将目标箱组对应的箱组规则确定为目标风险规则,可以理解的,在分箱之后,每一个箱组中的样本不尽相同,如对多头类风险变量进行等距分箱之后,目标箱组是2<变量值≤4的分箱规则,负样本都集中在该目标箱组中,则可认为在2个到4个贷款平台贷过款的用户都是风险用户。
进一步地,在一实施例中,步骤S20包括:
步骤b1,确定所述箱组的负样本数,并基于所述负样本数,计算所述箱组的提升度;
在一实施例中,在分箱之后,计算每个箱组的提升度,其中,提升度(Lift)衡量的是箱组规则对负样本“响应”的预测能力优于随机选择的倍数,以1为界线,大于1的Lift表示该箱组规则比随机选择捕捉了更多的“响应”,等于1的Lift表示该箱组规则的表现独立于随机选择,小于1则表示该箱组规则比随机选择捕捉了更少的“响应”。
具体的,步骤b1包括:
步骤b11,确定所述箱组的负样本数,以及所述风险变量的总负样本数,并分别计算所述负样本数在所述箱组中的坏账比,以及所述总负样本数在所述风险变量中的总坏账比;
步骤b12,基于所述坏账比和所述总坏账比,计算所述箱组的提升度。
具体的,确定催收记录中的总样本数,以及总负样本数,再确定各箱组的箱样本数,以及负样本数,再分别计算负样本数在各箱组中的坏账比,以及总负样本数在总样本数中的坏账比,再取两者的比值,即为各箱组的提升度,也即将负样本与箱样本数的比值,除以总负样本数与总样本数的比值,得到的值即为箱组的提升度,以此计算各箱组的提升度。
步骤b2,基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则。
在一实施例中,根据各箱组的提升度以及各箱组的箱组规则,确定目标风险变量对应的目标风险规则。
具体的,步骤b2包括:
步骤b21,确定提升度大于等于预设值的目标箱组,并基于所述箱组规则,确定所述目标箱组对应的目标箱组规则;
步骤b22,基于所述目标箱组规则,确定所述风险变量对应的目标风险规则。
具体的,从众多箱组中筛选出目标箱组,筛选标准为:Lift大于等于预设值,如大于等于2,从而确定出目标箱组,再确定目标箱组对应的目标箱组规则,从而将目标箱组规则确定为风险变量对应的目标风险规则。
需要说明的是,目标箱组可以是一个,也可以是多个,在多个的情况下,可以将多个目标箱组对应的箱组规则都作为目标风险规则,也即目标风险规则是一个组合规则;此外,还可以在多个箱组规则中择优选择一个,择优标准可以是Lift值最大等。
步骤S30,若检测到用户的贷款申请,则基于所述用户的催收记录,获取所述用户对应的目标风险变量。
在本实施例中,分析设备若检测到用户的贷款申请,则根据用户的用户信息,在催收机器人中,确定该用户的催收记录,也即确定当前用户是否在其他贷款平台贷过款,且别催收机器人催收过,若有,则根据该用户的催收记录,获取该用户对应的目标风险变量。需要说明的是,若未在催收机器人中获取到该用户的催收记录,则该用户对应的目标风险变量为0。
步骤S40,基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。
在本实施例中,由于已确定了目标风险规则,因此,只需确定当前用户是否命中目标风险规则,即确定当前用户是否存在贷前风险,以此判断当前用户的贷款申请是否给与通过审批。
具体的,将当前用户的目标风险变量输入目标风险规则中进行匹配,确认当前用户是否命中目标风险规则,如目标风险规则为催收次数达5次的用户存在逾期风险,则判断当前用户的催收次数是否达到了5次,若是,则确定当前用户命中目标风险规则,当前用户的贷款申请将不予通过审批。
本实施例若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组;确定所述箱组的负样本数,并基于所述负样本数,确定所述风险变量对应的目标风险规则;若检测到用户的贷款申请,则基于所述用户的催收数据,获取所述用户对应的目标风险变量;基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。本发明通过历史催收记录构建风险规则,并在检测到用户的贷款申请时,通过用户的催收数据,确定用户存在哪些风险变量,并基于风险变量,确定用户是否命中风险规则,以此确定用户的贷前风险,使得银行等金融机构可从催收数据这一维度确定用户的贷前风险,并且,通过构建风险规则,准确识别风险贷款,提高了贷前分析的准确性。
进一步地,基于本发明基于催收数据的贷前分析方法第一实施例,提出本发明基于催收数据的贷前分析方法第二实施例。
基于催收数据的贷前分析方法的第二实施例与基于催收数据的贷前分析方法的第一实施例的区别在于,风险变量至少包括两种,所述基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则的步骤包括:
步骤b23,基于所述提升度和所述箱组规则,确定所述风险变量对应的至少两种风险规则;
步骤b24,基于预设算法,确定所述风险规则的稳定性,并基于所述稳定性,从所述风险规则中筛选出目标风险规则。
本实施例的风险变量至少包括两种,每种风险变量对应一条风险规则,为准确的确定出用户的贷前风险是哪一条或者哪几条规则造成的,需对确定出的风险规则作进一步筛选,以筛选出最为相关的风险规则作为目标风险规则,以便在检测到用户的贷款申请时,能正确的识别出该用户是否是风险用户,提高风险判断的正确率。
以下将对各个步骤进行详细说明:
步骤b23,基于所述提升度和所述箱组规则,确定所述风险变量对应的至少两种风险规则。
在本实施例中,风险变量至少包括两种风险类型,如包括多头类和外呼维度,因此,在进行分箱处理时,得到至少两组箱组,每组箱组都对应有一个或多个风险规则,本实施例的分析设备先根据提升度筛选出符合筛选标准的至少两种风险规则,具体过程与上述实施例类似,在此不再赘述。
步骤b24,基于预设算法,确定所述风险规则的稳定性,并基于所述稳定性,从所述风险规则中筛选出目标风险规则。
在本实施例中,根据预设算法,分析风险规则的稳定性,也即各变量间的共线性,如规则1与规则2是否有关,也即规则1是否影响规则2等,在具体实施时,以VIF(varianceinflation factors,方差膨胀系数)用来衡量变量的共线性,VIF越大,则变量共线性越大,模型稳定性越差,也即风险规则稳定性越差。
其中,预设算法的计算公式如下:
Figure BDA0002530880550000131
其中,R2 i是当前变量对风险规则其他变量线性回归的拟合优度,方差膨胀系数VIF越大,说明变量之间存在共线性的可能性越大。一般来讲,如果方差膨胀系数超过10,则回归模型存在严重的多重共线性。又根据Hair(1995)的共线性诊断标准,当变量的容忍度大于0.1,方差膨胀系数小于10的范围是可以接受的,表明变量之间没有共线性问题存在。
此外,由于方差膨胀系数是容忍度的倒数,因此,也可以容忍度来衡量变量间的共线性。
最终根据得到的方差膨胀系数,衡量各风险规则的稳定性,若对应的方差膨胀系数超过10,则舍弃当前风险规则,也即,根据方差膨胀系数对风险规则做进一步筛选,从而得到目标风险规则。
本实施例通过风险规则的稳定性对风险规则做进一步筛选,从而筛选出更有识别价值的目标风险规则,使得后续在对贷前用户的贷款申请进行识别时,能更为准确的判断出是否给与通过审批,提高贷前分析的准确性。
进一步地,基于本发明基于催收数据的贷前分析方法第一、第二实施例,提出本发明基于催收数据的贷前分析方法第三实施例。
基于催收数据的贷前分析方法的第三实施例与基于催收数据的贷前分析方法的第一、第二实施例的区别在于,所述若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量的步骤包括:
步骤a3,若获得电催机器人记录的催收记录,则确定所述催收记录的表现期,并基于所述表现期,对所述催收记录进行扩充处理,以得到所述催收记录对应的样本数据;
步骤a4,确定所述样本数据对应的风险变量。
本实施例为避免由于电催机器人的催收记录过少,使得最终的目标风险规则过于片面,也即不具有普适性,因此,在确定催收记录对应的风险变量的过程中,先对样本进行扩充,以丰富样本,以便后续确定的目标风险规则更具通用性。
以下将对各个步骤进行详细说明:
步骤a3,若获得电催机器人记录的催收记录,则确定所述催收记录的表现期,并基于所述表现期,对所述催收记录进行扩充处理,以得到所述催收记录对应的样本数据。
在本实施例中,分析设备若获得电催机器人记录的催收记录,则先确定催收记录的表现期,其中,表现期指的是催收的跨度时间,如甲用户在1月、2月、3月、4月、5月和6月都有相应的催收记录,则甲用户的表现期为6个月。然后,根据表现期,对催收记录进行扩充处理,从而得到扩充之后的样本数据。
具体的,根据表现期,以及预设的表现期长度,对催收记录进行扩充,具体的表现期长度可根据实际情况进行设置,如上述例子,样本A在1月、2月、3月、4月、5月和6月都有相应的催收记录,以3期表现期作为表现期长度,则可将样本A扩充为A1样本:1月、2月和3月;A2样本:2月、3月和4月;A3样本:3月、4月和5月;A4样本:4月、5月和6月;四个样本,以此方式,对所有的催收记录进行扩充,从而得到数据丰富的样本数据。
步骤a4,确定所述样本数据对应的风险变量。
在本实施例中,在对催收记录进行扩充,得到丰富的样本数据之后,再去获取样本数据对应风险变量,可以理解的,由于对催收记录进行了扩充,因此,催收记录对应的风险变量与样本数据的风险变量不尽相同,如上述例子,甲用户在1月表现期的风险变量是多头类的多头值为1,在6月表现期的风险变量的多头值为4,也即甲用户可能在5个月后,在其他3个贷款平台进行了贷款,因此,A1样本对应的风险变量为的多头值为1,A4样本对应的风险变量的多头值为4等。
本实施例为避免由于电催机器人的催收记录过少,使得最终的目标风险规则过于片面,也即不具有普适性,因此,在确定催收记录对应的风险变量的过程中,先对样本进行扩充,以丰富样本,以便后续确定的目标风险规则更具通用性,提高目标风险规则的可用性。
本发明还提供一种基于催收数据的贷前分析装置。本发明基于催收数据的贷前分析装置包括:
分箱模块,用于若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则;
确定模块,用于确定所述箱组的负样本数,并基于所述负样本数和所述箱组规则,确定所述风险变量对应的目标风险规则;
获取模块,用于若检测到用户的贷款申请,则基于所述用户的催收记录,获取所述用户对应的目标风险变量;
判断模块,用于基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。
优选地,所述确定模块还用于:
确定所述箱组的负样本数,并基于所述负样本数,计算所述箱组的提升度;
基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则。
优选地,所述确定模块还用于:
确定所述箱组的负样本数,以及所述风险变量的总负样本数,并分别计算所述负样本数在所述箱组中的坏账比,以及所述总负样本数在所述风险变量中的总坏账比;
基于所述坏账比和所述总坏账比,计算所述箱组的提升度。
优选地,所述确定模块还用于:
确定提升度大于等于预设值的目标箱组,并基于所述箱组规则,确定所述目标箱组对应的目标箱组规则;
基于所述目标箱组规则,确定所述风险变量对应的目标风险规则。
优选地,所述确定模块还用于:
基于所述提升度和所述箱组规则,确定所述风险变量对应的至少两种风险规则;
基于预设算法,确定所述风险规则的稳定性,并基于所述稳定性,从所述风险规则中筛选出目标风险规则。
优选地,所述分箱模块还用于:
若获得电催机器人记录的催收记录,则确定所述催收记录的表现期,并基于所述表现期,对所述催收记录进行扩充处理,以得到所述催收记录对应的样本数据;
确定所述样本数据对应的风险变量。
优选地,所述分箱模块还用于:
确定所述风险变量的变量值,并基于所述变量值对所述风险变量进行过滤;
确定过滤后的所述风险变量的分箱数量,并基于所述分箱数量,对过滤后的所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则。
本发明还提供一种计算机可读存储介质。
本发明计算机可读存储介质上存储有基于催收数据的贷前分析程序,所述基于催收数据的贷前分析程序被处理器执行时实现如上所述的基于催收数据的贷前分析方法的步骤。
其中,在所述处理器上运行的基于催收数据的贷前分析程序被执行时所实现的方法可参照本发明基于催收数据的贷前分析方法各个实施例,此处不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书与附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于催收数据的贷前分析方法,其特征在于,所述基于催收数据的贷前分析方法包括如下步骤:
若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则;
确定所述箱组的负样本数,并基于所述负样本数和所述箱组规则,确定所述风险变量对应的目标风险规则;
若检测到用户的贷款申请,则基于所述用户的催收记录,获取所述用户对应的目标风险变量;
基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。
2.如权利要求1所述的基于催收数据的贷前分析方法,其特征在于,所述确定所述箱组的负样本数,并基于所述负样本数和所述箱组规则,确定所述风险变量对应的目标风险规则的步骤包括:
确定所述箱组的负样本数,并基于所述负样本数,计算所述箱组的提升度;
基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则。
3.如权利要求2所述的基于催收数据的贷前分析方法,其特征在于,所述确定所述箱组的负样本数,并基于所述负样本数,计算所述箱组的提升度的步骤包括:
确定所述箱组的负样本数,以及所述风险变量的总负样本数,并分别计算所述负样本数在所述箱组中的坏账比,以及所述总负样本数在所述风险变量中的总坏账比;
基于所述坏账比和所述总坏账比,计算所述箱组的提升度。
4.如权利要求2所述的基于催收数据的贷前分析方法,其特征在于,所述基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则的步骤包括:
确定提升度大于等于预设值的目标箱组,并基于所述箱组规则,确定所述目标箱组对应的目标箱组规则;
基于所述目标箱组规则,确定所述风险变量对应的目标风险规则。
5.如权利要求2所述的基于催收数据的贷前分析方法,其特征在于,所述风险变量至少包括两种,所述基于所述提升度和所述箱组规则,确定所述风险变量对应的目标风险规则的步骤包括:
基于所述提升度和所述箱组规则,确定所述风险变量对应的至少两种风险规则;
基于预设算法,确定所述风险规则的稳定性,并基于所述稳定性,从所述风险规则中筛选出目标风险规则。
6.如权利要求1-5任一项所述的基于催收数据的贷前分析方法,其特征在于,所述若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量的步骤包括:
若获得电催机器人记录的催收记录,则确定所述催收记录的表现期,并基于所述表现期,对所述催收记录进行扩充处理,以得到所述催收记录对应的样本数据;
确定所述样本数据对应的风险变量。
7.如权利要求1-5任一项所述的基于催收数据的贷前分析方法,其特征在于,所述对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则的步骤包括:
确定所述风险变量的变量值,并基于所述变量值对所述风险变量进行过滤;
确定过滤后的所述风险变量的分箱数量,并基于所述分箱数量,对过滤后的所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则。
8.一种基于催收数据的贷前分析装置,其特征在于,所述基于催收数据的贷前分析装置包括:
分箱模块,用于若获得电催机器人记录的催收记录,则确定所述催收记录对应的风险变量,并对所述风险变量进行分箱处理,以得到所述风险变量对应的箱组,以及所述箱组对应的箱组规则;
确定模块,用于确定所述箱组的负样本数,并基于所述负样本数和所述箱组规则,确定所述风险变量对应的目标风险规则;
获取模块,用于若检测到用户的贷款申请,则基于所述用户的催收记录,获取所述用户对应的目标风险变量;
判断模块,用于基于所述目标风险变量和所述目标风险规则,确定所述贷款申请是否通过审批。
9.一种基于催收数据的贷前分析设备,其特征在于,所述基于催收数据的贷前分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于催收数据的贷前分析程序,所述基于催收数据的贷前分析程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于催收数据的贷前分析方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于催收数据的贷前分析程序,所述基于催收数据的贷前分析程序被处理器执行时实现如权利要求1至7中任一项所述的基于催收数据的贷前分析方法的步骤。
CN202010520734.8A 2020-06-09 2020-06-09 基于催收数据的贷前分析方法、装置、设备与存储介质 Pending CN111652711A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010520734.8A CN111652711A (zh) 2020-06-09 2020-06-09 基于催收数据的贷前分析方法、装置、设备与存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010520734.8A CN111652711A (zh) 2020-06-09 2020-06-09 基于催收数据的贷前分析方法、装置、设备与存储介质

Publications (1)

Publication Number Publication Date
CN111652711A true CN111652711A (zh) 2020-09-11

Family

ID=72348635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010520734.8A Pending CN111652711A (zh) 2020-06-09 2020-06-09 基于催收数据的贷前分析方法、装置、设备与存储介质

Country Status (1)

Country Link
CN (1) CN111652711A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724067A (zh) * 2021-08-31 2021-11-30 重庆富民银行股份有限公司 一种催收方法、存储介质及设备
CN114390016A (zh) * 2022-03-24 2022-04-22 太平金融科技服务(上海)有限公司深圳分公司 邮箱规则管理方法、装置、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389486A (zh) * 2018-08-27 2019-02-26 深圳壹账通智能科技有限公司 贷款风控规则调整方法、装置、设备及计算机存储介质
WO2019080407A1 (zh) * 2017-10-25 2019-05-02 深圳壹账通智能科技有限公司 信贷评估方法、装置、设备及计算机可读存储介质
CN109711984A (zh) * 2019-01-23 2019-05-03 北京市天元网络技术股份有限公司 一种基于催收的贷前风险监控方法及装置
CN110009479A (zh) * 2019-03-01 2019-07-12 百融金融信息服务股份有限公司 信用评价方法及装置、存储介质、计算机设备
CN110135701A (zh) * 2019-04-23 2019-08-16 北京淇瑀信息科技有限公司 控制规则的自动生成方法、装置、电子设备及可读介质
CN110766541A (zh) * 2019-09-25 2020-02-07 平安科技(深圳)有限公司 贷款风险评估方法、装置、设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019080407A1 (zh) * 2017-10-25 2019-05-02 深圳壹账通智能科技有限公司 信贷评估方法、装置、设备及计算机可读存储介质
CN109389486A (zh) * 2018-08-27 2019-02-26 深圳壹账通智能科技有限公司 贷款风控规则调整方法、装置、设备及计算机存储介质
CN109711984A (zh) * 2019-01-23 2019-05-03 北京市天元网络技术股份有限公司 一种基于催收的贷前风险监控方法及装置
CN110009479A (zh) * 2019-03-01 2019-07-12 百融金融信息服务股份有限公司 信用评价方法及装置、存储介质、计算机设备
CN110135701A (zh) * 2019-04-23 2019-08-16 北京淇瑀信息科技有限公司 控制规则的自动生成方法、装置、电子设备及可读介质
CN110766541A (zh) * 2019-09-25 2020-02-07 平安科技(深圳)有限公司 贷款风险评估方法、装置、设备及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724067A (zh) * 2021-08-31 2021-11-30 重庆富民银行股份有限公司 一种催收方法、存储介质及设备
CN114390016A (zh) * 2022-03-24 2022-04-22 太平金融科技服务(上海)有限公司深圳分公司 邮箱规则管理方法、装置、计算机设备和存储介质
CN114390016B (zh) * 2022-03-24 2022-09-02 太平金融科技服务(上海)有限公司深圳分公司 邮箱规则管理方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN110363387B (zh) 基于大数据的画像分析方法、装置、计算机设备及存储介质
CN111652711A (zh) 基于催收数据的贷前分析方法、装置、设备与存储介质
CN110610431A (zh) 基于大数据的智能理赔方法及智能理赔系统
CN112598294A (zh) 在线建立评分卡模型的方法、装置、机器可读介质及设备
CN113205403A (zh) 一种企业信用等级的计算方法、装置、存储介质及终端
US20210358044A1 (en) Analysis and visual presentation of dataset components
CN112862593B (zh) 信用评分卡模型训练方法、装置、系统及计算机存储介质
CN114004691A (zh) 基于融合算法的额度评分方法、装置、设备及存储介质
KR100616054B1 (ko) 데이터 분석 시스템, 데이터 분석 방법 및 프로그램을기록하는 컴퓨터 판독 가능한 기록 매체
CN111400663B (zh) 模型训练方法、装置、设备及计算机可读存储介质
US20130013244A1 (en) Pattern based test prioritization using weight factors
CN112785418B (zh) 信贷风险建模方法、装置、设备及计算机可读存储介质
CN111209484B (zh) 基于大数据的产品数据的推送方法、装置、设备及介质
CN114936281A (zh) 基于大数据的试题动态分类方法、装置、设备及存储介质
CN111598418A (zh) 基于均衡度的项目排序方法、装置、设备和存储介质
CN113158037A (zh) 一种面向对象的信息推荐方法和装置
CN112036940A (zh) 数据的处理方法、装置、设备和存储介质
AU2021104059A4 (en) Dynamic application for investor’s portfolio detection using behavioural analysis
KR102462728B1 (ko) Esg경영 중요 이슈 선정 방법
CN111652712A (zh) 基于地理信息的贷前分析方法、装置、设备与存储介质
CN109657895B (zh) 流动性缺口预警方法、装置、设备及存储介质
CN115470304A (zh) 一种特征因果仓库管理方法及系统
CN111125546A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN116415831A (zh) 客户粘性评价方法、装置、电子设备及存储介质
CN113011971A (zh) 风险测度方法、装置、系统与计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination