CN109345373A - 核销风险预警方法、装置、电子设备及计算机可读介质 - Google Patents

核销风险预警方法、装置、电子设备及计算机可读介质 Download PDF

Info

Publication number
CN109345373A
CN109345373A CN201811054458.XA CN201811054458A CN109345373A CN 109345373 A CN109345373 A CN 109345373A CN 201811054458 A CN201811054458 A CN 201811054458A CN 109345373 A CN109345373 A CN 109345373A
Authority
CN
China
Prior art keywords
days
time limit
prediction
risk
exceeds
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811054458.XA
Other languages
English (en)
Inventor
鲍新平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201811054458.XA priority Critical patent/CN109345373A/zh
Publication of CN109345373A publication Critical patent/CN109345373A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供一种核销风险预警方法、装置、电子设备及计算机可读介质,属于互联网技术领域。该核销风险预警方法包括:从多个目标用户中提取得到预测对象的特征数据,所述预测对象为超期天数在预设范围内的目标用户;根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数;根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。该方法通过对目标用户中提取的预测对象采用滚动回归预测策略进行预测,得到预测超期天数,然后根据预测超期天数与预设阈值的对比结果识别出不同风险等级的目标用户,以便采用不同的催收策略进行催收,提高风险预警的准确性。

Description

核销风险预警方法、装置、电子设备及计算机可读介质
技术领域
本公开总体涉及互联网技术领域,具体而言,涉及一种核销风险预警方法、装置、电子设备及计算机可读介质。
背景技术
当前,小微企业/商户对互联网金融平台的信贷需求日益扩大,小微企业/商户贷款的需求也迫使互联网金融公司对贷款企业(小微企业/商户)进行信贷风险管理。信贷风险管理是指通过风险识别、计量、监测和控制等,对风险进行评级、分类、报告和管理,保持风险和效益的平衡发展,提高贷款的经济效益。
传统方式中多数采用财务报表进行信贷风险管理,即根据历史的财务报表,只能根据过去的情况作为当前能力的估计,但是无法预估出贷款用户未来的发展潜力及还款能力,对于贷后风险预警仍有欠缺。有的采用核销预警技术,仅做分类,即得出哪些用户是正常的,哪些用户是违约的,但对于分类得到的核销样本无法确定待收款用户(贷款后并未还清贷款的用户)的优先等级,无法区别对待哪些属于接近于违约期的正常用户,而哪些是贷后风险极高的用户。
因此,现有技术中的技术方案中还存在有待改进之处。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开提供一种核销风险预警方法、装置、电子设备及计算机可读介质,解决上述问题中的至少一个问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一方面,提供一种核销风险预警方法,包括:从多个目标用户中提取得到预测对象的特征数据,所述预测对象为超期天数在预设范围内的目标用户;根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数;根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。
在本公开的一个实施例中,所述特征数据包括个人数据、经营数据、历史数据和征信数据。
在本公开的一个实施例中,从多个目标用户中提取得到预测对象的特征数据之前,还包括:
获取用户列表,其中所述用户列表中包括已经完成预设任务的用户和未完成预设任务的用户;
对所述用户列表进行过滤,去除所述贷款用户列表中已经还清贷款的贷款用户,得到所述多个目标用户;
其中所述预设任务具有设定的完成期限,所述超期天数为当前日期超过设定的完成期限的天数。
在本公开的一个实施例中,根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的总超期天数包括:
对同一目标用户的特征数据进行滚动提取,得到多组滚动样本数据;
对所述多组滚动样本数据利用回归算法进行融合预测,得到预测超期天数;
获取所述目标用户的当前超期天数;
根据所述当前超期天数和所述预测超期天数求和计算得到总超期天数。
在本公开的一个实施例中,对所述滚动样本数据利用回归算法进行融合预测,得到预测超期天数包括:
将所述多组滚动样本数据划分成第一训练数据集合和第二训练数据集合;
根据所述第一训练数据集合按照超期天数分组,并分别进行样本训练,得到多个单模型;
根据所述多个单模型进行融合,得到回归算子;
根据所述回归算子计算得到所述预测超期天数。
在本公开的一个实施例中,根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级包括:
如果所述预测超期天数未超过所述预设阈值,则结合所述风险预警规则得到风险等级为一般风险,对所述目标用户进行内催;
如果所述预测超期天数超过所述预设阈值,则结合所述风险预警规则得到风险等级为高风险,对所述目标用户进行外催。
在本公开的一个实施例中,对所述目标用户进行内催包括:
根据所述预测超期天数进行排序,得到排序列表,其中所述排序列表为降序;
根据所述排序列表进行内催。
根据本公开的再一方面,提供一种核销风险预警装置,包括:特征提取模块,配置为从多个目标用户中提取得到预测对象的特征数据,所述预测对象为超期天数在预设范围内的目标用户;回归预测模块,配置为根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数;风险预警模块,配置为根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。
根据本公开的又一方面,提供一种电子设备,包括处理器;存储器,存储用于所述处理器控制如上所述的方法步骤的指令。
根据本公开的另一方面,提供一种计算机可读介质,其上存储有计算机可执行指令,所述可执行指令被处理器执行时实现如上所述的方法步骤。
根据本公开实施例提供的核销风险预警方法、装置、电子设备及计算机可读介质,一方面,通过对目标用户中提取的预测对象采用滚动回归预测策略进行预测,得到预测超期天数,然后根据预测超期天数与预设阈值的对比结果识别出不同风险等级的目标用户,以便采用不同的催收策略进行催收,提高风险预警的准确性;另一方面,利用滚动回归预测策略可以增加样本量,通过多模型的融合提高模型精度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。
图1示出本公开一实施例中提供的一种核销风险预警方法的流程图。
图2示出本公开一实施例图1中步骤S120的流程图。
图3示出本公开一实施例图2中步骤S202的流程图。
图4示出本公开一实施例图2中步骤S202进行数据训练得到预测超期天数的原理示意图。
图5示出本公开一实施例中提供的核销风险预警方法的执行流程图。
图6示出本公开另一实施例中提供的一种核销风险预警装置的示意图。
图7示出本公开一实施例提供的适于用来实现本申请实施例的电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现、材料或者操作以避免喧宾夺主而使得本公开的各方面变得模糊。
附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
根据本公开的一些实施例,采用传统的核销预警技术,存在如下问题:
一是样本的正负比例不平衡,容易造成二分类的分类器精度下降;
二是分类器刻画粒度不够细致,无法体现客户的优先等级。
基于上述问题,本公开提供一种核销风险预警方法、装置、电子设备及计算机可读介质。
图1示出本公开一实施例中提供的一种核销风险预警方法的流程图,包括以下步骤:
如图1所示,在步骤S110中,从多个目标用户中提取得到预测对象的特征数据,所述预测对象为超期天数在预设范围内的目标用户。
如图1所示,在步骤S120中,根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数。
如图1所示,在步骤S130中,根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。
通过本示例性实施例中的核销风险预警方法,一方面,通过对目标用户中提取的预测对象采用滚动回归预测策略进行预测,得到预测超期天数,然后根据预测超期天数与预设阈值的对比结果识别出不同风险等级的目标用户,以便采用不同的催收策略进行催收,通过量化贷款用户的核销风险,提高风险预警的准确性;另一方面,利用滚动回归预测策略可以增加样本量,通过多模型的融合提高模型精度。
下面,将以欠款核销场景为例对本公开实施例中的核销风险预警方法中的各步骤作进一步的说明。
在步骤S110中,从多个目标用户中提取得到预测对象的特征数据。
在本公开的一个实施例中,目标用户可以为欠款用户,所述特征数据至少包括个人数据、经营数据、历史数据和征信数据,其中个人数据包括个人近期资金流入流出的信息、健康信息等,经营数据包括经营流水、投资/被投资动态等,历史数据主要是指历史还款数据,包括该贷款用户对于历次贷款的还款有无超期,如果有超期则超期天数都是多少天等。
在本公开的一个实施例中,步骤S110从多个目标用户中提取得到预测对象的特征数据之前,还包括:
首先,获取用户列表,其中所述用户列表中包括已经完成预设任务的用户和未完成预设任务的用户。
对所述用户列表进行过滤,去除所述用户列表中已经完成预设任务的用户,得到所述多个目标用户。
在本实施例中,用户列表即为贷款用户列表,该列表中包括已经还清贷款的用户和未还清贷款的用户(即欠款用户),其中欠款用户就是本公开实施例需要进行后续风险等级预测的用户,也就是目标用户。
需要说明的是,本实施例中的预设任务具有设定的完成期限,例如,预设任务为还清贷款,则对应的完成期限就是还款期限;所述超期天数为当前日期超过设定的完成期限的天数,也就是超过还款期限的天数,即逾期天数。
在本公开的一个实施例中,所述预测对象为超期天数在预设范围内的目标用户,该预设范围可以为6~120天。本实施例中是以欠款核销为场景,在实际应用中,该预设范围可以是根据具体应用场景进行设定。
需要说明的是,该过滤步骤是指进行内催之后,可能会有一部分贷款用户已经还清贷款,通过过滤将已经还清贷款的用户从贷款用户列表中删除,这样排除干扰项,以便对剩下未还清贷款的用户(即当前仍是目标用户)预测超期天数。
在步骤S120中,根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数。
在本公开的一个实施例中,图2示出步骤S120中根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的总超期天数的流程图,具体包括以下步骤:
如图2所示,在步骤S201中,对同一目标用户的特征数据进行滚动提取,得到多组滚动样本数据。
具体的,针对同一目标用户的特征数据利用固定长度的滑动窗进行提取,得到滚动样本数据。
仍以贷款核销场景为例,假设预测的目标是m4(120天),设定滑动窗为w天,间隔天数c=120-基准-滑动窗长度。由于使用历史数据进行训练,假设用第6天的特征数据(用X6表示)来训练,则取用户在120减6天时的真实超期天数(即逾期天数)作为Y超期天数。然后根据设定的滑动窗滑动w天,则用120减6减w天时的真实超期数据作为用户的超期天数。这样得到的训练数据就变为:
X6,X6+c,X6+2c,……,对应的Y超期天数:
Y120-6,Y120-6-c,Y120-6-2c
其中120减6表示用户在超期第6天开始算,经过了114天后的超期情况。可以看出实际可以预测120天的超期情况,只不过滑动的基准点变了,训练/预测的间隔天数也就随之改变。举例滑动到30天,我们主要预测未来90天的超期情况即可。在训练时,从120天的周期样本,如果用户在30天是超期的,取当天的样本特征,取30天到120天的实际超期天数作为Y,从而得到X到真实Y之间的规律。
如图2所示,在步骤S202中,对所述多组滚动样本数据利用回归算法进行融合预测,得到预测超期天数。步骤S202的具体步骤详见后续图3以及相关介绍。
在本公开的一个实施例中,本实施例中采用的回归算法可以包括但不限于不限于xgboost、sgd回归、线性回归等技术,其他任何可用于回归预测的方法均可。根据不同的预测模型对上述滚动样本数据进行回归预测,分别得到一个预测结果,然后再对多个预测模型的预测结果进行融合(如加权计算)等方式得到最终的预测超期天数。如图2所示,在步骤S203中,获取所述目标用户的当前超期天数。
如图2所示,在步骤S204中,根据所述当前超期天数和所述预测超期天数求和计算得到总超期天数。
图3示出步骤S202中对所述滚动样本数据利用回归算法进行融合预测,得到预测超期天数的流程图,具体包括以下步骤:
如图3所示,在步骤S301中,将所述多组滚动样本数据划分成第一训练数据集合和第二训练数据集合。
如图3所示,在步骤S302中,根据所述第一训练数据集合按照超期天数分组,并分别进行样本训练,得到多个单模型。
如图3所示,在步骤S303中,根据所述多个单模型进行融合,得到回归算子。
如图3所示,在步骤S304中,根据所述回归算子计算得到所述预测超期天数。
比如,输入一个目标用户的超期特征,先经过多个单模型,各得到一个输出值,这几个单模型的输出值作为融合模型的输入,经过回归算子得出最终的预测结果。
其中的回归算子可以树模型方法得到,也可以最小二乘加权方法得到,等等。基于上述,图4示出步骤S202进行数据训练得到预测超期天数的原理示意图,如图4所示,以3个预测模型为例,其中M1为xgboost预测模型,M2为sgd回归预测模型,M3为线性回归预测模型。第一训练数据集合trainData0主要用于训练单模型,其中M1fit表示单模型M1进行参数拟合,M2fit表示单模型M2进行参数拟合,M3fit表示单模型M3进行参数拟合,分别得到预测模型M1、M2和M3。其中最小二乘可以是参数拟合出来的加权系数α和β,Y=α*X+β。第二训练数据集合trainData1主要用于把单模型的训练结果P1、P2和P3作为输入特征,通过数据训练,得到回归算子。
假设该回归算子是线性回归算子,比如有3个单模型,这3个单模型的准确置信度(即权重)是0.3,0.5,0.2,则预测超期天数可以表示为:
0.3*M1预测出的超期天数+0.5*M2预测出来的超期天数+0.2*M3预测出来的超期天数,
最终给出各模型的预测天数进行加权平均计算,即得到预测超期天数。
例如可以通过添加isMonthPhase开关(m0,m1,m2,m3,m4,={0,1})对样本数据进行扩展,即对不同贷后阶段区分对待,对每个阶段训练不同的权重。其中m1表示特征数据中超期天数在0~30范围内的数据,m2表示表示特征数据中超期天数在31~60范围内的数据,m3表示特征数据中超期天数在61~90范围内的数据,m4表示特征数据中超期天数在91~120范围内的数据。
从超期m1的数据中提取m1截止日前最近的特征,取未来120-m1天的时刻的超期天数+m1。需要说明书的是由于m0到m1阶段,在贷后核销风险检测中并不是很重要,因此一般不考虑。从超期m2的数据中提取其最近的特征,取未来120-m2天的时刻的预期天数+m2。从超期m3的数据中提取其最近的特征,取未来120-m3天的时刻的预期天数+m3。这样利用固定长度的滑动窗来提取特征数据可以提高样本量,另外,利用回归预测的多模型融合可以提升模型精度,避免因某一种预测模型的特点影响最终预测结果的精度。
在步骤S130中,根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。
在本公开的一个实施例中,根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级包括:
如果所述预测超期天数未超过所述预设阈值,则结合所述风险预警规则得到风险等级为一般风险,对所述目标用户进行内催;
如果所述预测超期天数超过所述预设阈值,则结合所述风险预警规则得到风险等级为高风险,对所述目标用户进行外催。
其中该预设阈值是一个预先给定的天数,可以根据具体需求进行设定,例如可以设定预设阈值为120天,也就是如果步骤S120得到的预测超期天数未超过120天,则其风险等级为一般风险,进行内催即可,但是如果步骤S120得到的预测超期天数超过120天,则其风险等级为高风险,一般内催可能无法达到核销的目的,需要进行外催(即外催),无论最终是内催还是外催,都是为了达到核销的目的,本实施例中通过对超期天数进行预测,对于目标用户根据风险级别的高低分别采用相应的催收方法进行催收。
其中总超期天数=当前超期天数+预测超期天数,假如目标用户在已知超期了110天,在他的生命周期里,最大超期10天就核销了。10天的阈值相比总的超期天数就没有太大意义,总的超期天数对于后续催收工作如何进行才更有意义。
在本公开的一个实施例中,对所述目标用户进行内催包括:
首先,根据所述预测超期天数进行排序,得到排序列表,其中所述排序列表为降序;然后,根据所述排序列表进行内催,也就是按照预测超期天数从高到低的顺序进行内催,即预测超期天数多的优先进行内催。
需要说明的是,在该步骤中,除了可以利用预测超期天数进行排序得到排序列表,还可以利用总超期天数进行排序得到排序列表,具体是利用预测超期天数还是利用总超期天数可以根据需要进行选择。例如如果仅考虑当前一次超期情况,则可以按照预测超期天数进行排序得到排序列表,那么这次内催也主要是根据本次预测的超期情况的优先级先后进行催收;如果是考虑到目前为止目标用户的超期程度,则可以按照总超期天数进行排序得到排序列表,那么这次内催也主要是根据总的超期情况的优先级先后进行催收。
图5示出本实施例中上述核销风险预警方法的执行流程图,包括以下步骤:
如图5所示,在步骤S501中,提取贷款用户列表中超期天数x的范围在A<x<B的特征数据,其中A为60天,B为120天。
如图5所示,在步骤S502中,利用滚动回归模型预测策略进行预测,得到预测超期天数。
如图5所示,在步骤S503中,根据预测超期天数判断是否为高风险,如果是高风险,则转至步骤S504,如果不是高风险,则转至步骤S505。
如图5所示,在步骤S504中,外催。
如图5所示,在步骤S505中,对预测超期天数进行排序,例如可以为降序排列。
如图5所示,在步骤S506中,按照排序进行内催。
如图5所示,在步骤S507中,内催后过滤掉已经还清贷款的用户。
基于上述步骤S501~S507,过滤后继续返回到步骤S501,重复进行特征数据的提取,并利用滚动回归模型预测等后续步骤,这样通过滚动回归预测,只要该样本的生命周期(例如可以是30天,也可以是120天,可以根据业务需求进行设定)就没有结束,持续监控动态处理,提高风险预警的级别区分性及准确性。
需要说明的是,上述均是以贷款核销应用场景为例对贷后核销风险预警的方法进行介绍,本公开提供的方法还可以应用在其他应用场景中,如任务完成期限核销场景,利用本公开提供的方法可以对目标对象完成任务的期限进行监控,即哪些是核销期限比较好的,就是风险等级一般的,哪些是核销期限比较差的,就是风险等级较高的,以此可以对完成任务的目标对象采用不同的催促策略进行催促,提醒其尽早完成任务。
综上所述,本实施例提供的核销风险预警方法,一方面,通过对目标用户中提取的预测对象采用滚动回归预测策略进行预测,得到预测超期天数,然后根据预测超期天数与预设阈值的对比结果识别出不同风险等级的目标用户,以便采用不同的催收策略进行催收,提高风险预警的准确性;另一方面,利用滚动回归预测策略可以增加样本量,通过多模型的融合提高模型精度。
图6示出本公开另一实施例中提供的一种核销风险预警装置的示意图,如图6所示,该装置600包括:特征提取模块610、回归预测模块620和风险预警模块630。
特征提取模块610配置为从多个目标用户中提取得到预测对象的特征数据,所述预测对象为超期天数在预设范围内的目标用户;回归预测模块620配置为根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数;风险预警模块630配置为根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。
在本公开的一个实施例中,特征提取模块610配置为从多个目标用户中提取得到预测对象的特征数据。其中特征数据至少包括个人数据、经营数据、历史数据和征信数据,其中个人数据包括个人近期资金流入流出的信息、健康信息等,经营数据包括经营流水、投资/被投资动态等,历史数据即历史还款数据,主要包括该贷款用户对于历次贷款的还款有无超期,如果有超期则超期天数都是多少天等。
在本公开的一个实施例中,回归预测模块620配置为根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数。
图2示出回归预测模块620预测超期天数的具体步骤,如下:
如图2所示,在步骤S201中,对同一目标用户的特征数据进行滚动提取,得到多组滚动样本数据。
具体的,针对同一目标用户的特征数据利用固定长度的滑动窗进行提取,得到滚动样本数据。
仍以欠款核销场景为例,假设预测的目标是m4(120天),设定滑动窗为w天,间隔天数c=120-基准-滑动窗长度。由于使用历史数据进行训练,假设用第6天的特征数据(用X6表示)来训练,则取用户在120-6时的真实超期天数作为Y超期天数。然后根据设定的滑动窗滑动w天,则用120-6-w时的真实超期数据作为用户的超期天数。这样得到的训练数据就变为:
X6,X6+c,X6+2c,……,对应的Y超期天数:
Y120-6,Y120-6-c,Y120-6-2c
其中120-6表示用户在超期第6天开始算,经过了114天后的超期情况。可以看出实际可以预测120天的超期情况,只不过滑动的基准点变了,训练/预测的间隔天数也就随之改变。举例滑动到30天,我们主要预测未来90天的超期情况即可。在训练时,从120天的周期样本,如果用户在30天是超期的,取当天的样本特征,取30天到120天的实际超期天数作为Y,从而得到X到真实Y之间的规律。
如图2所示,在步骤S202中,对所述多组滚动样本数据利用回归算法进行融合预测,得到预测超期天数。
在本公开的一个实施例中,本实施例中采用的回归算法可以包括但不限于不限于xgboost、sgd回归、线性回归等技术,其他任何可用于回归预测的方法均可。根据不同的预测模型对上述滚动样本数据进行回归预测,分别得到一个预测结果,然后再对多个预测模型的预测结果进行融合(如加权计算)等方式得到最终的预测超期天数。
在本公开的一个实施例中,图3示出步骤S202中对所述滚动样本数据利用回归算法进行融合预测,得到预测超期天数的流程图,具体包括以下步骤:
如图3所示,在步骤S301中,将所述多组滚动样本数据划分成第一训练数据集合和第二训练数据集合。
如图3所示,在步骤S302中,根据所述第一训练数据集合按照超期天数分组,并分别进行样本训练,得到多个单模型。
如图3所示,在步骤S303中,根据所述多个单模型进行融合,得到回归算子。
如图3所示,在步骤S304中,根据所述回归算子计算得到所述预测超期天数。
比如,输入一个目标用户的超期特征,先经过多个单模型,各得到一个输出值,这几个单模型的输出值作为融合模型的输入,经过回归算子得出最终的预测结果。
其中的回归算子可以树模型方法得到,也可以最小二乘加权方法得到,等等。
如图2所示,在步骤S203中,获取所述目标用户的当前超期天数。
如图2所示,在步骤S204中,根据所述当前超期天数和所述预测超期天数求和计算得到总超期天数。
在本公开的一个实施例中,风险预警模块630具体根据预测超期天数得到风险等级包括:如果所述预测超期天数未超过所述预设阈值,则结合所述风险预警规则得到风险等级为一般风险,对所述目标用户进行内催;
如果所述预测超期天数超过所述预设阈值,则结合所述风险预警规则得到风险等级为高风险,对所述目标用户进行外催。
其中该预设阈值是一个预先给定的天数,可以根据具体需求进行设定,例如可以设定预设阈值为120天,也就是如果步骤S120得到的预测超期天数未超过120天,则其风险等级为一般风险,进行内催即可,但是如果步骤S120得到的预测超期天数超过120天,则其风险等级为高风险,一般内催可能无法达到核销的目的,需要进行外催(即外催),无论最终是内催还是外催,都是为了达到核销的目的,本实施例中通过对超期天数进行预测,对于目标用户根据风险级别的高低分别采用相应的催收方法进行催收。
其中,对所述目标用户进行内催包括:
首先,根据所述预测超期天数进行排序,得到排序列表,其中所述排序列表为降序;然后,根据所述排序列表进行内催,也就是按照预测超期天数从高到低的顺序进行内催,即预测超期天数多的优先进行内催。
该装置中各个模块的功能参见上述方法实施例中的相关描述,此处不再赘述。
综上所述,本实施例中的核销风险预警装置,一方面,通过对目标用户中提取的预测对象采用滚动回归预测策略进行预测,得到预测超期天数,然后根据预测超期天数与预设阈值的对比结果识别出不同风险等级的目标用户,以便采用不同的催收策略进行催收,提高风险预警的准确性;另一方面,利用滚动回归预测策略可以增加样本量,通过多模型的融合提高模型精度。
另一方面,本公开还提供了一种电子设备,包括处理器和存储器,存储器存储用于上述处理器控制以下方法的操作指令:
从多个目标用户中提取得到预测对象的特征数据,所述预测对象为超期天数在预设范围内的目标用户;根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数;根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。
下面参考图7,其示出了适于用来实现本申请实施例的电子设备的计算机系统700的结构示意图。图7示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分706加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分708;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。
另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括以下方法步骤:
从多个目标用户中提取得到预测对象的特征数据,所述预测对象为超期天数在预设范围内的目标用户;根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数;根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。
应清楚地理解,本公开描述了如何形成和使用特定示例,但本公开的原理不限于这些示例的任何细节。相反,基于本公开公开的内容的教导,这些原理能够应用于许多其它实施方式。
以上具体地示出和描述了本公开的示例性实施方式。应可理解的是,本公开不限于这里描述的详细结构、设置方式或实现方法;相反,本公开意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

Claims (10)

1.一种核销风险预警方法,其特征在于,包括:
从多个目标用户中提取得到预测对象的特征数据,所述预测对象为超期天数在预设范围内的目标用户;
根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数;
根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。
2.根据权利要求1所述的核销风险预警方法,其特征在于,所述特征数据包括个人数据、经营数据、历史数据和征信数据。
3.根据权利要求1所述的核销风险预警方法,其特征在于,从多个目标用户中提取得到预测对象的特征数据之前,还包括:
获取用户列表,其中所述用户列表中包括已经完成预设任务的用户和未完成预设任务的用户;
对所述用户列表进行过滤,去除所述用户列表中已经完成预设任务的用户,得到所述多个目标用户;
其中所述预设任务具有设定的完成期限,所述超期天数为当前日期超过设定的完成期限的天数。
4.根据权利要求1所述的核销风险预警方法,其特征在于,根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的总超期天数包括:
对同一目标用户的特征数据进行滚动提取,得到多组滚动样本数据;
对所述多组滚动样本数据利用回归算法进行融合预测,得到预测超期天数;
获取所述目标用户的当前超期天数;
根据所述当前超期天数和所述预测超期天数求和计算得到总超期天数。
5.根据权利要求4所述的核销风险预警方法,其特征在于,对所述滚动样本数据利用回归算法进行融合预测,得到预测超期天数包括:
将所述多组滚动样本数据划分成第一训练数据集合和第二训练数据集合;
根据所述第一训练数据集合按照超期天数分组,并分别进行样本训练,得到多个单模型;
根据所述多个单模型进行融合,得到回归算子;
根据所述回归算子计算得到所述预测超期天数。
6.根据权利要求1所述的核销风险预警方法,其特征在于,根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级包括:
如果所述预测超期天数未超过所述预设阈值,则结合所述风险预警规则得到风险等级为一般风险,对所述目标用户进行内催;
如果所述预测超期天数超过所述预设阈值,则结合所述风险预警规则得到风险等级为高风险,对所述目标用户进行外催。
7.根据权利要求6所述的核销风险预警方法,其特征在于,对所述目标用户进行内催包括:
根据所述预测超期天数进行排序,得到排序列表,其中所述排序列表为降序;
根据所述排序列表进行内催。
8.一种核销风险预警装置,其特征在于,包括:
特征提取模块,配置为从多个目标用户中提取得到预测对象的特征数据,所述预测对象为超期天数在预设范围内的目标用户;
回归预测模块,配置为根据所述特征数据利用滚动回归预测策略进行预测,得到每个预测对象的预测超期天数;
风险预警模块,配置为根据所述预测超期天数与预设阈值进行对比,并根据对比结果结合风险预警规则得到所述目标用户的风险等级。
9.一种电子设备,其特征在于,包括:
处理器;
存储器,存储用于所述处理器控制如权利要求1-7任一项所述的方法步骤的指令。
10.一种计算机可读介质,其上存储有计算机可执行指令,其特征在于,所述可执行指令被处理器执行时实现如权利要求1-7任一项所述的方法步骤。
CN201811054458.XA 2018-09-11 2018-09-11 核销风险预警方法、装置、电子设备及计算机可读介质 Pending CN109345373A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811054458.XA CN109345373A (zh) 2018-09-11 2018-09-11 核销风险预警方法、装置、电子设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811054458.XA CN109345373A (zh) 2018-09-11 2018-09-11 核销风险预警方法、装置、电子设备及计算机可读介质

Publications (1)

Publication Number Publication Date
CN109345373A true CN109345373A (zh) 2019-02-15

Family

ID=65305342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811054458.XA Pending CN109345373A (zh) 2018-09-11 2018-09-11 核销风险预警方法、装置、电子设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN109345373A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109993648A (zh) * 2019-03-12 2019-07-09 中国平安人寿保险股份有限公司 一种数据处理方法和相关装置
CN110046986A (zh) * 2019-03-06 2019-07-23 平安科技(深圳)有限公司 基于大数据的借款逾期客户分群方法及装置
CN110705963A (zh) * 2019-09-25 2020-01-17 中国建设银行股份有限公司 一种核销审核方法和装置
CN112529303A (zh) * 2020-12-15 2021-03-19 建信金融科技有限责任公司 基于模糊决策的风险预测方法、装置、设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046986A (zh) * 2019-03-06 2019-07-23 平安科技(深圳)有限公司 基于大数据的借款逾期客户分群方法及装置
CN109993648A (zh) * 2019-03-12 2019-07-09 中国平安人寿保险股份有限公司 一种数据处理方法和相关装置
CN110705963A (zh) * 2019-09-25 2020-01-17 中国建设银行股份有限公司 一种核销审核方法和装置
CN112529303A (zh) * 2020-12-15 2021-03-19 建信金融科技有限责任公司 基于模糊决策的风险预测方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN106020715B (zh) 存储池容量管理
CN109345373A (zh) 核销风险预警方法、装置、电子设备及计算机可读介质
CN107231264A (zh) 用于管理云服务器的容量的方法和装置
CN108053120A (zh) 一种模型整合方法及装置
CN105786681B (zh) 数据中心的服务器性能评估及服务器更新方法
CN109788489A (zh) 一种基站规划方法及装置
CN114355793B (zh) 用于车辆仿真评测的自动驾驶规划模型的训练方法及装置
CN110070430A (zh) 评估还款风险的方法及装置、存储介质、电子设备
CN109784779A (zh) 财务风险预测方法、装置及存储介质
CN118152106A (zh) 资源调度方法和终端设备
CN108564423A (zh) 票务订单的恶意占位识别方法、系统、设备和存储介质
CN112862546B (zh) 用户流失预测方法、装置、计算机设备及存储介质
CN116029395B (zh) 商业区域的人流预警方法、装置、电子设备及存储介质
CN114721835A (zh) 边缘数据中心服务器能耗预测方法、系统、设备及介质
CN113837383B (zh) 模型训练方法、装置、电子设备及存储介质
CN114970357A (zh) 节能效果评价方法、系统、装置及存储介质
CN114444782A (zh) 企业资产的管理方法、装置、存储介质及计算机设备
CN113138847B (zh) 基于联邦学习的计算机资源分配调度方法和装置
CN112686470A (zh) 电网饱和负荷预测方法、装置及终端设备
CN116307559A (zh) 多云资源管理方法、多云资源管理平台、设备及介质
KR101927317B1 (ko) 부채 관리 능력 평가 방법 및 장치
CN113723712B (zh) 风电功率预测方法、系统、设备及介质
CN109472455A (zh) 活动评估方法、装置、电子设备及存储介质
CN109598625A (zh) 基于大数据的保费计算方法、装置、介质及电子设备
CN112529303A (zh) 基于模糊决策的风险预测方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination