CN111369348A - 贷后风险监控方法、装置、设备及计算机可读存储介质 - Google Patents

贷后风险监控方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111369348A
CN111369348A CN202010222741.XA CN202010222741A CN111369348A CN 111369348 A CN111369348 A CN 111369348A CN 202010222741 A CN202010222741 A CN 202010222741A CN 111369348 A CN111369348 A CN 111369348A
Authority
CN
China
Prior art keywords
risk
enterprise
data
post
invoice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010222741.XA
Other languages
English (en)
Inventor
王东华
何颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010222741.XA priority Critical patent/CN111369348A/zh
Publication of CN111369348A publication Critical patent/CN111369348A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/128Check-book balancing, updating or printing arrangements

Abstract

本发明涉及金融科技技术领域,公开了一种贷后风险监控方法、装置、设备及计算机可读存储介质。该贷后风险监控方法包括:获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量;将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分;根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控。本发明能够提高贷后风险监控的及时性和准确性,节省人力成本。

Description

贷后风险监控方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种贷后风险监控方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
在对企业进行贷后风险监控时,目前通常是通过人工对企业的发票数据进行风险分析。然而,人工分析的模式,对工作人员的数量和专业能力都有一定的要求,导致较高的人力成本开销,且人工分析速度慢、效率低,间接导致调查的频率低,多为半年一次或一年一次,进而导致风险监控的及时性较差;此外,由于人工分析的主观性强,标准难以统一,导致风险分析结果的准确性较差。
发明内容
本发明的主要目的在于提供一种贷后风险监控方法、装置、设备及计算机可读存储介质,旨在提高贷后风险监控的及时性和准确性,节省人力成本。
为实现上述目的,本发明提供一种贷后风险监控方法,所述贷后风险监控方法包括:
获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量;
将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分;
根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控。
可选地,所述获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量的步骤包括:
获取待监控企业的第一发票数据,其中,所述第一发票数据包括发票信息和开票客户的企业基础信息;
根据所述发票信息计算得到各第一预设时间段的各类发票的金额同比环比值和开票频率;
根据所述发票信息统计各第二预设时间段的各开票客户的开票金额,根据所述开票金额对各开票客户进行排序,并根据排序结果和所述企业基础信息统计得到对应的客户数据变量、区域数据变量和行业数据变量;
其中,第一目标变量包括所述各第一预设时间段的各类发票的金额同比环比值和开票频率、所述客户数据变量、所述区域数据变量和所述行业数据变量。
可选地,所述将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分的步骤之前,还包括:
获取样本企业的第二发票数据和风险指标信息;
根据所述第二发票信息得到第二目标变量,并根据所述风险指标信息确定所述样本企业的标注标签;
根据所述第二目标变量和所述标注标签构建训练样本集,并通过所述训练样本集对预设风险评分模型进行训练,得到训练好的风险评分模型。
可选地,所述风险指标信息为历史最长逾期天数,所述根据所述风险指标信息确定所述样本企业的标注标签的步骤包括:
比较所述历史最长逾期天数与第一预设阈值和第二预设阈值的大小关系,其中,所述第一预设阈值小于所述第二预设阈值;
若所述历史最长逾期天数小于或等于所述第一预设阈值,则确定对应样本企业的标注标签为好样本标签;
若所述历史最长逾期天数大于或等于所述第二预设阈值,则确定对应样本企业的标注标签为坏样本标签。
可选地,所述根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控的步骤包括:
将所述风险评分与预设的评分区间进行匹配,确定所述风险评分所处的目标评分区间;
根据预先设定的评分区间与风险等级之间的映射关系,确定所述目标评分区间对应的风险等级,并基于所述风险等级采用对应的贷后风险监控策略对所述待监控企业进行监控。
可选地,所述贷后风险监控方法还包括:
根据预先设定的风险等级与提醒方式的映射关系,确定所述风险等级对应的提醒方式;
根据所述提醒方式发送对应的风险提醒信息至管理端。
可选地,所述贷后风险监控方法还包括:
记录所述待监控企业的风险数据,所述风险数据包括风险等级和风险提醒时间;
定期对所述风险数据进行统计,得到风险等级的变化信息;
根据所述风险等级的变化信息生成对应的风险分析报告,并发送至管理端。
此外,为实现上述目的,本发明还提供一种贷后风险监控装置,所述贷后风险监控装置包括:
数据处理模块,用于获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量;
变量输入模块,用于将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分;
风险监控模块,用于根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控。
此外,为实现上述目的,本发明还提供一种贷后风险监控设备,所述贷后风险监控设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的贷后风险监控程序,所述贷后风险监控程序被所述处理器执行时实现如上所述的贷后风险监控方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有贷后风险监控程序,所述贷后风险监控程序被处理器执行时实现如上所述的贷后风险监控方法的步骤。
本发明提供一种贷后风险监控方法、装置、设备及计算机可读存储介质,通过获取待监控企业的第一发票数据,并对第一发票数据进行处理,得到第一目标变量;然后,将第一目标变量输入至预先训练好的风险评分模型,得到待监控企业的风险评分;进而,根据风险评分确定对应的风险等级,以基于风险等级对待监控企业进行监控。通过上述方式,本发明可实现发票数据的自动处理、得到模型的输入变量,然后基于风险评分模型得到风险评分,进而确定风险等级,实现了统一标准下的风险等级的自动划分,便于对企业进行贷后风险监控,相比于现有技术中通过人工进行数据的处理和分析,本发明可节省人力成本,同时避免了人工分析的主观性,从而可提高贷后风险监控的准确性。此外,本发明可根据需要灵活进行定期和非定期监控,从而可提高贷后风险监控的及时性。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明贷后风险监控方法第一实施例的流程示意图;
图3为本发明贷后风险监控装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例贷后风险监控设备可以是智能手机,也可以是PC(PersonalComputer,个人计算机)、平板电脑、便携计算机等终端设备。
如图1所示,该贷后风险监控设备可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的贷后风险监控设备结构并不构成对贷后风险监控设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及贷后风险监控程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的贷后风险监控程序,并执行以下操作:
获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量;
将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分;
根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控。
进一步地,处理器1001可以调用存储器1005中存储的贷后风险监控程序,还执行以下操作:
获取待监控企业的第一发票数据,其中,所述第一发票数据包括发票信息和开票客户的企业基础信息;
根据所述发票信息计算得到各第一预设时间段的各类发票的金额同比环比值和开票频率;
根据所述发票信息统计各第二预设时间段的各开票客户的开票金额,根据所述开票金额对各开票客户进行排序,并根据排序结果和所述企业基础信息统计得到对应的客户数据变量、区域数据变量和行业数据变量;
其中,第一目标变量包括所述各第一预设时间段的各类发票的金额同比环比值和开票频率、所述客户数据变量、所述区域数据变量和所述行业数据变量。
进一步地,处理器1001可以调用存储器1005中存储的贷后风险监控程序,还执行以下操作:
获取样本企业的第二发票数据和风险指标信息;
根据所述第二发票信息得到第二目标变量,并根据所述风险指标信息确定所述样本企业的标注标签;
根据所述第二目标变量和所述标注标签构建训练样本集,并通过所述训练样本集对预设风险评分模型进行训练,得到训练好的风险评分模型。
进一步地,所述风险指标信息为历史最长逾期天数,处理器1001可以调用存储器1005中存储的贷后风险监控程序,还执行以下操作:
比较所述历史最长逾期天数与第一预设阈值和第二预设阈值的大小关系,其中,所述第一预设阈值小于所述第二预设阈值;
若所述历史最长逾期天数小于或等于所述第一预设阈值,则确定对应样本企业的标注标签为好样本标签;
若所述历史最长逾期天数大于或等于所述第二预设阈值,则确定对应样本企业的标注标签为坏样本标签。
进一步地,处理器1001可以调用存储器1005中存储的贷后风险监控程序,还执行以下操作:
将所述风险评分与预设的评分区间进行匹配,确定所述风险评分所处的目标评分区间;
根据预先设定的评分区间与风险等级之间的映射关系,确定所述目标评分区间对应的风险等级,并基于所述风险等级采用对应的贷后风险监控策略对所述待监控企业进行监控。
进一步地,处理器1001可以调用存储器1005中存储的贷后风险监控程序,还执行以下操作:
根据预先设定的风险等级与提醒方式的映射关系,确定所述风险等级对应的提醒方式;
根据所述提醒方式发送对应的风险提醒信息至管理端。
进一步地,处理器1001可以调用存储器1005中存储的贷后风险监控程序,还执行以下操作:
记录所述待监控企业的风险数据,所述风险数据包括风险等级和风险提醒时间;
定期对所述风险数据进行统计,得到风险等级的变化信息;
根据所述风险等级的变化信息生成对应的风险分析报告,并发送至管理端。
基于上述硬件结构,提出本发明贷后风险监控方法的各实施例。
本发明提供一种贷后风险监控方法。
参照图2,图2为本发明贷后风险监控方法第一实施例的流程示意图。
在本实施例中,该贷后风险监控方法包括:
步骤S10,获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量;
本实施例的贷后风险监控方法是由贷后风险监控设备实现的,该设备以服务器为例进行说明。在本实施例中,先获取待监控企业的第一发票数据,并对第一发票数据进行处理,得到第一目标变量。
具体的,步骤S10包括:
步骤a11,获取待监控企业的第一发票数据,其中,所述第一发票数据包括发票信息和开票客户的企业基础信息;
步骤a12,根据所述发票信息计算得到各第一预设时间段的各类发票的金额同比环比值和开票频率;
步骤a13,根据所述发票信息统计各第二预设时间段的各开票客户的开票金额,根据所述开票金额对各开票客户进行排序,并根据排序结果和所述企业基础信息统计得到对应的客户数据变量、区域数据变量和行业数据变量;
其中,第一目标变量包括所述各第一预设时间段的各类发票的金额同比环比值和开票频率、所述客户数据变量、所述区域数据变量和所述行业数据变量。
本实施例中,第一目标标量的获取过程如下:
先获取待监控企业的第一发票数据,其中,第一发票数据包括待监控企业的发票信息和开票客户的企业基础信息。发票信息可以包括预设时间范围内(如近2年内)每月的开票金额及其笔数、废票金额及其笔数、红票(即红字发票,包括红字普通发票和红字增值税专用发票)金额及其笔数、及每天的开票情况,开票客户的企业基础信息至少包括开票客户的公司名称,还可以包括公司区域和所属行业,当然还可以包括公司状态、纳税信用等级、经营范围、法人信息等信息。
然后,根据发票信息计算得到各第一预设时间段的各类发票的金额同比环比值和开票频率。其中,当预设时间范围为2年时,第一预设时间段可以设为近1个月、近3个月、近6个月、近9个月和近12个月,对应的,各第一预设时间段的各类发票的金额同比环比值包括:近1/3/6/9/12月的开票金额的第一同比值和第一环比值、近1/3/6/9/12月的废票金额的第二同比值和第二环比值、近1/3/6/9/12月的红票金额的第二同比值和第二环比值。对于同比值的计算,以近3个月为例,若近3个月的月份为当年的10-12月,先计算10-12月的开票金额之和,记为a,对应的,计算去年10-12月的开票金额之和,记为b,进而可计算得到近3个月的金额同比值为(a-b)/b;对于环比值的计算,以近3个月为例,若近3个月的月份为当年的10-12月,先计算10-12月的开票金额之和,记为c,再计算上一周期的3月(即7-9月)的开票金额之和,记为d,进而可计算得到近3个月的金额环比值为(c-d)/d。各第一预设时间段内的开票频率包括各第一预设时间段内的开票天数、最长未开票天数、首次和末次开票日期之间的相隔天数,可根据每天的开票情况的统计得到。
根据发票信息统计各第二预设时间段的各开票客户的开票金额,根据开票金额对各开票客户进行排序,并根据排序结果和企业基础信息统计得到对应的客户数据变量、区域数据变量和行业数据变量。其中,当预设时间范围为2年时,第二预设时间段可以为当年和上一年,即近12个月内和近12个月至近24个月之间。
可先根据发票信息统计当年和上一年的各开票客户的开票金额,根据开票金额对各开票客户进行排序,并根据排序结果获取当年和上一年在预设名次内的客户名称、对应排名,进而结合开票客户的企业基础信息统计得到对应的客户数据变量、区域数据变量和行业数据变量。
对于客户数据变量的获取过程:在根据排序结果获取到当年和上一年在预设名次内的客户名称、对应排名之后,统计当年和上一年排在预设名次内的客户的开票总金额和开票总笔数,并结合企业的纳税人识别号统计当年和上一年排在预设名次内的客户中客户名称重合的数量、纳税人识别号重合的数量。其中,预设名次可设为前十和前五,对应的客户数据变量包括当年和上一年开票金额在前十内的客户名称、对应排名、开票总金额和开票总笔数,当年和上一年开票金额在前五内的客户名称、对应排名、开票总金额和开票总笔数,还包括当年和上一年之间开票金额在前十内的客户名称重合的数量、纳税人识别号重合的数量,当年和上一年之间开票金额在前五内的客户名称重合的数量、纳税人识别号重合的数量。
对于区域数据变量的获取过程:在根据开票金额对各开票客户进行排序之后,获取在预设名次内的各开票客户的省份名称,以获取当年和上一年在预设名次内的省份名称、对应排名,进而统计当年和上一年排在预设名次内的各省份对应的开票总金额和开票总笔数,并统计当年和上一年排在预设名次内的客户中省份重合的数量。
对于行业数据变量的获取过程:在根据开票金额对各开票客户进行排序之后,获取在预设名次内的各开票客户所属的行业,以获取当年和上一年在预设名次内的行业名称、对应排名,进而统计当年和上一年排在预设名次内的各所属行业对应的开票总金额和开票总笔数,并统计当年和上一年排在预设名次内的客户中所述行业重合的数量。
其中,第一目标变量包括上述处理得到的各第一预设时间段的各类发票的金额同比环比值和开票频率、客户数据变量、区域数据变量和行业数据变量。
需要说明的是,步骤a12和a13的执行顺序不分先后。
步骤S20,将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分;
然后,将第一目标变量输入至预先训练好的风险评分模型,得到待监控企业的风险评分。其中,该风险评分模型的类型可选地为逻辑回归模型,当然,在具体实施时,还可以为其他分类模型,如神经网络模型、XGBoost(eXtreme Gradient Boosting,极端梯度增强)模型,SVM(Support Vector Machine,支持向量机)模型,贝叶斯模型和CNN(ConvolutionalNeural Networks,卷积神经网络)模型等。其训练过程可参照下述第二实施例,此处不作赘述。
需要说明的是,在输入时,由于第一目标变量包括多个,可根据预设顺序生成对应的第一特征向量,例如,第一目标变量的种类包括n个,分别记为1-n,对应的值分别记为x1,x2,……,xn,可构建得到第一特征向量(x1,x2,……,xn),进而将该第一特征向量输入至预先训练好的风险评分模型,得到待监控企业的风险评分。
步骤S30,根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控。
在确定得到待监控企业的风险评分之后,根据风险评分确定对应的风险等级,以基于风险等级对待监控企业进行监控。
具体的,步骤S30包括:
步骤a31,将所述风险评分与预设的评分区间进行匹配,确定所述风险评分所处的目标评分区间;
步骤a32,根据预先设定的评分区间与风险等级之间的映射关系,确定所述目标评分区间对应的风险等级,并基于所述风险等级采用对应的贷后风险监控策略对所述待监控企业进行监控。
本实施例中,可预先设定不同的评分区间与风险等级之间的映射关系,在确定风险等级时,可将风险评分与预设的评分区间进行匹配,确定风险评分所处的评分区间,记为目标评分区间,然后,根据预先设定的评分区间与风险等级之间的映射关系,确定目标评分区间对应的风险等级,并基于风险等级采用对应的贷后风险监控策略对待监控企业进行监控。其中,对于风险监控策略的制定,可基于实际情况针对不同的风险等级制定不同的风险监控策略,此处不作具体限定。
本发明实施例提供一种贷后风险监控方法,通过获取待监控企业的第一发票数据,并对第一发票数据进行处理,得到第一目标变量;然后,将第一目标变量输入至预先训练好的风险评分模型,得到待监控企业的风险评分;进而,根据风险评分确定对应的风险等级,以基于风险等级对待监控企业进行监控。通过上述方式,本发明实施例可实现发票数据的自动处理、得到模型的输入变量,然后基于风险评分模型得到风险评分,进而确定风险等级,实现了统一标准下的风险等级的自动划分,便于对企业进行贷后风险监控,相比于现有技术中通过人工进行数据的处理和分析,本发明实施例可节省人力成本,同时避免了人工分析的主观性,从而可提高贷后风险监控的准确性。此外,本发明实施例可根据需要灵活进行定期和非定期监控,从而可提高贷后风险监控的及时性。
进一步地,基于上述第一实施例,提出本发明贷后风险监控方法的第二实施例。
在本实施例中,在上述步骤S20之前,该贷后风险监控方法还包括:
步骤A,获取样本企业的第二发票数据和风险指标信息;
本实施例介绍了风险评分模型的训练过程,具体如下:
先获取样本企业的第二发票数据和风险指标信息,其中,第二发票数据包括待监控企业的发票信息和开票客户的企业基础信息。第一发票数据包括样本企业的发票信息和开票客户的企业基础信息,发票信息可以包括预设时间范围内(如近2年内)每月的开票金额及其笔数、废票金额及其笔数、红票(即红字发票,包括红字普通发票和红字增值税专用发票)金额及其笔数、及每天的开票情况,开票客户的企业基础信息至少包括开票客户的公司名称,还可以包括公司区域和所属行业,当然还可以包括公司状态、纳税信用等级、经营范围、法人信息等。风险指标信息可以为历史最长逾期天数,可以基于样本企业的贷款历史信息获取得到。
步骤B,根据所述第二发票信息得到第二目标变量,并根据所述风险指标信息确定所述样本企业的标注标签;
然后,根据第二发票信息得到第二目标变量,并根据风险指标信息确定样本企业的标注标签。其中,第二目标变量的类型和获取过程与第一目标变量相一致,此处不作赘述。所述风险指标信息为历史最长逾期天数,步骤“根据所述风险指标信息确定所述样本企业的标注标签”包括:
步骤b1,比较所述历史最长逾期天数与第一预设阈值和第二预设阈值的大小关系,其中,所述第一预设阈值小于所述第二预设阈值;
步骤b2,若所述历史最长逾期天数小于或等于所述第一预设阈值,则确定对应样本企业的标注标签为好样本标签;
步骤b3,若所述历史最长逾期天数大于或等于所述第二预设阈值,则确定对应样本企业的标注标签为坏样本标签。
本实施例中,对于标注标签的确定,可基于历史最长逾期天数来确定样本企业的标注标签,具体的,可以比较历史最长逾期天数与第一预设阈值和第二预设阈值的大小关系,其中,第一预设阈值小于第二预设阈值;若历史最长逾期天数小于或等于第一预设阈值,则确定对应样本企业的标注标签为好样本标签,对应的好样本标签可设为1;若历史最长逾期天数大于或等于第二预设阈值,则确定对应样本企业的标注标签为坏样本标签,对应的坏样本标签可设为0。
需要说明的是,在本实施例中,选用历史最长逾期天数作为风险指标信息,是基于工作人员的多次实验确定得到的。此外,通过将历史最长逾期天数与两个预设阈值(第一预设阈值和第二预设阈值)进行比较、以确定样本企业的标注标签,在确定标注标签时,将位于第一预设阈值和第二预设阈值之间(不含端点)的样本企业确定为灰色样本,并进行剔除,相比于只设定单个预设阈值来确定标注标签,可剔除一些干扰样本,更有利于风险评分模型的训练,从而提高风险评分结果的准确性。
步骤C,根据所述第二目标变量和所述标注标签构建训练样本集,并通过所述训练样本集对预设风险评分模型进行训练,得到训练好的风险评分模型。
在获取到样本企业所对应的第二目标变量和标注标签之后,可根据第二目标变量和标注标签构建训练样本集。在构建训练样本集时,由于第二目标变量包括多个,可根据预设顺序生成对应的第二特征向量,例如,第二目标变量的种类包括n个,分别记为1-n,对应的值分别记为x 1,x 2,……,x n,可构建得到第二特征向量(x 1,x 2,……,x n),进而基于该第二特征向量和标注标签构建训练样本集。
需要说明的是,由于在确定样本企业的标注标签时,舍弃了一部分样本企业,即,有一部分样本企业未被确定标注标签,因此,在根据第二目标变量和标注标签构建训练样本集时,同样也不包括未确定标注标签的样本企业的第二目标变量。
进而,通过训练样本集对预设风险评分模型进行训练,得到训练好的风险评分模型。其中,预设风险评分模型可选地为逻辑回归模型,当然,在具体实施时,还可以为其他分类模型,如神经网络模型、XGBoost(eXtreme Gradient Boosting,极端梯度增强)模型,SVM(Support Vector Machine,支持向量机)模型,贝叶斯模型和CNN(Convolutional NeuralNetworks,卷积神经网络)模型等。风险评分模型的具体训练过程可参照现有技术,此处不作赘述。
通过上述方式,可训练得到风险评分模型,该模型可用于对企业的贷后风险程度进行自动量化评分,可便于后续对待监控企业进行风险评分、然后确定风险等级以进行风险监控。
进一步地,基于上述各实施例,提出本发明贷后风险监控方法的第三实施例。
在本实施例中,在上述步骤S30之后,所述贷后风险监控方法还包括:
步骤D,根据预先设定的风险等级与提醒方式的映射关系,确定所述风险等级对应的提醒方式;
在本实施例中,根据预先设定的风险等级与提醒方式的映射关系,确定风险等级对应的提醒方式。其中,提醒方式包括但不限于提醒手段(如电话、邮件、短信等)、提醒次数和提醒对象等,可基于风险等级所对应的风险严重程度来设定对应的提醒方式,此处不作具体限定。
步骤E,根据所述提醒方式发送对应的风险提醒信息至管理端。
然后,根据提醒方式发送对应的风险提醒信息至管理端,以及时通知管理人员进行贷后风险监控。
通过上述方式,根据风险等级的严重程度设定不同的提醒方式,从而实现分级提醒,使得该贷后风险监控系统更加规范化和人性化。
进一步地,基于上述第三实施例,提出本发明贷后风险监控方法的第四实施例。
在本实施例中,在上述步骤E之后,所述贷后风险监控方法还包括:
步骤F,记录所述待监控企业的风险数据,所述风险数据包括风险等级和风险提醒时间;
在本实施例中,为便于管理人员后续了解待监控企业的风险提醒情况,在根据确定的提醒方式发送对应的风险提醒信息至管理端之后,可记录待监控企业的风险数据,其中,风险数据包括风险等级和风险提醒时间。
步骤G,定期对所述风险数据进行统计,得到风险等级的变化信息;
步骤H,根据所述风险等级的变化信息生成对应的风险分析报告,并发送至管理端。
然后,定期对风险数据进行统计,得到风险等级的变化信息。其中,统计的周期时长可以是根据实际情况进行设置,如定期可以设定为一个月一次,即以一个月为一个统计周期,还可以设定为一个季度一次。在统计时,可以统计对应统计周期内各风险等级的风险提醒次数、及风险等级的变化情况,即,风险等级的变化信息可以包括各风险等级的风险提醒次数及风险等级的变化情况。进而根据风险等级的变化信息生成对应的风险分析报告,并发送至管理端,以供管理人员进行查看,便于管理人员了解待监控企业的贷后风险的变化情况。
本发明还提供一种贷后风险监控装置。
参照图3,图3为本发明贷后风险监控装置第一实施例的功能模块示意图。
如图3所示,所述贷后风险监控装置包括:
数据处理模块10,用于获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量;
变量输入模块20,用于将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分;
风险监控模块30,用于根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控。
进一步地,所述数据处理模块10包括:
数据获取单元,用于获取待监控企业的第一发票数据,其中,所述第一发票数据包括发票信息和开票客户的企业基础信息;
数据计算单元,用于根据所述发票信息计算得到各第一预设时间段的各类发票的金额同比环比值和开票频率;
数据统计单元,用于根据所述发票信息统计各第二预设时间段的各开票客户的开票金额,根据所述开票金额对各开票客户进行排序,并根据排序结果和所述企业基础信息统计得到对应的客户数据变量、区域数据变量和行业数据变量;
其中,第一目标变量包括所述各第一预设时间段的各类发票的金额同比环比值和开票频率、所述客户数据变量、所述区域数据变量和所述行业数据变量。
进一步地,所述贷后风险监控装置还包括:
第一获取模块,用于获取样本企业的第二发票数据和风险指标信息;
第二获取模块,用于根据所述第二发票信息得到第二目标变量,并根据所述风险指标信息确定所述样本企业的标注标签;
模型训练模块,用于根据所述第二目标变量和所述标注标签构建训练样本集,并通过所述训练样本集对预设风险评分模型进行训练,得到训练好的风险评分模型。
进一步地,所述风险指标信息为历史最长逾期天数,所述第二获取模块包括:
大小比较单元,用于比较所述历史最长逾期天数与第一预设阈值和第二预设阈值的大小关系,其中,所述第一预设阈值小于所述第二预设阈值;
第一确定单元,用于若所述历史最长逾期天数小于或等于所述第一预设阈值,则确定对应样本企业的标注标签为好样本标签;
第二确定单元,用于若所述历史最长逾期天数大于或等于所述第二预设阈值,则确定对应样本企业的标注标签为坏样本标签。
进一步地,所述风险监控模块30包括:
区间确定单元,用于将所述风险评分与预设的评分区间进行匹配,确定所述风险评分所处的目标评分区间;
数据监控单元,用于根据预先设定的评分区间与风险等级之间的映射关系,确定所述目标评分区间对应的风险等级,并基于所述风险等级采用对应的贷后风险监控策略对所述待监控企业进行监控。
进一步地,所述贷后风险监控装置还包括:
方式确定模块,用于根据预先设定的风险等级与提醒方式的映射关系,确定所述风险等级对应的提醒方式;
风险提醒模块,用于根据所述提醒方式发送对应的风险提醒信息至管理端。
进一步地,所述贷后风险监控装置还包括:
数据记录模块,用于记录所述待监控企业的风险数据,所述风险数据包括风险等级和风险提醒时间;
数据统计模块,用于定期对所述风险数据进行统计,得到风险等级的变化信息;
报告生成模块,用于根据所述风险等级的变化信息生成对应的风险分析报告,并发送至管理端。
其中,上述贷后风险监控装置中各个模块的功能实现与上述贷后风险监控方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有贷后风险监控程序,所述贷后风险监控程序被处理器执行时实现如以上任一项实施例所述的贷后风险监控方法的步骤。
本发明计算机可读存储介质的具体实施例与上述贷后风险监控方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种贷后风险监控方法,其特征在于,所述贷后风险监控方法包括:
获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量;
将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分;
根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控。
2.如权利要求1所述的贷后风险监控方法,其特征在于,所述获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量的步骤包括:
获取待监控企业的第一发票数据,其中,所述第一发票数据包括发票信息和开票客户的企业基础信息;
根据所述发票信息计算得到各第一预设时间段的各类发票的金额同比环比值和开票频率;
根据所述发票信息统计各第二预设时间段的各开票客户的开票金额,根据所述开票金额对各开票客户进行排序,并根据排序结果和所述企业基础信息统计得到对应的客户数据变量、区域数据变量和行业数据变量;
其中,第一目标变量包括所述各第一预设时间段的各类发票的金额同比环比值和开票频率、所述客户数据变量、所述区域数据变量和所述行业数据变量。
3.如权利要求1所述的贷后风险监控方法,其特征在于,所述将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分的步骤之前,还包括:
获取样本企业的第二发票数据和风险指标信息;
根据所述第二发票信息得到第二目标变量,并根据所述风险指标信息确定所述样本企业的标注标签;
根据所述第二目标变量和所述标注标签构建训练样本集,并通过所述训练样本集对预设风险评分模型进行训练,得到训练好的风险评分模型。
4.如权利要求3所述的贷后风险监控方法,其特征在于,所述风险指标信息为历史最长逾期天数,所述根据所述风险指标信息确定所述样本企业的标注标签的步骤包括:
比较所述历史最长逾期天数与第一预设阈值和第二预设阈值的大小关系,其中,所述第一预设阈值小于所述第二预设阈值;
若所述历史最长逾期天数小于或等于所述第一预设阈值,则确定对应样本企业的标注标签为好样本标签;
若所述历史最长逾期天数大于或等于所述第二预设阈值,则确定对应样本企业的标注标签为坏样本标签。
5.如权利要求1所述的贷后风险监控方法,其特征在于,所述根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控的步骤包括:
将所述风险评分与预设的评分区间进行匹配,确定所述风险评分所处的目标评分区间;
根据预先设定的评分区间与风险等级之间的映射关系,确定所述目标评分区间对应的风险等级,并基于所述风险等级采用对应的贷后风险监控策略对所述待监控企业进行监控。
6.如权利要求1至5中任一项所述的贷后风险监控方法,其特征在于,所述贷后风险监控方法还包括:
根据预先设定的风险等级与提醒方式的映射关系,确定所述风险等级对应的提醒方式;
根据所述提醒方式发送对应的风险提醒信息至管理端。
7.如权利要求6所述的贷后风险监控方法,其特征在于,所述贷后风险监控方法还包括:
记录所述待监控企业的风险数据,所述风险数据包括风险等级和风险提醒时间;
定期对所述风险数据进行统计,得到风险等级的变化信息;
根据所述风险等级的变化信息生成对应的风险分析报告,并发送至管理端。
8.一种贷后风险监控装置,其特征在于,所述贷后风险监控装置包括:
数据处理模块,用于获取待监控企业的第一发票数据,并对所述第一发票数据进行处理,得到第一目标变量;
变量输入模块,用于将所述第一目标变量输入至预先训练好的风险评分模型,得到所述待监控企业的风险评分;
风险监控模块,用于根据所述风险评分确定对应的风险等级,以基于所述风险等级对所述待监控企业进行监控。
9.一种贷后风险监控设备,其特征在于,所述贷后风险监控设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的贷后风险监控程序,所述贷后风险监控程序被所述处理器执行时实现如权利要求1至7中任一项所述的贷后风险监控方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有贷后风险监控程序,所述贷后风险监控程序被处理器执行时实现如权利要求1至7中任一项所述的贷后风险监控方法的步骤。
CN202010222741.XA 2020-03-25 2020-03-25 贷后风险监控方法、装置、设备及计算机可读存储介质 Pending CN111369348A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010222741.XA CN111369348A (zh) 2020-03-25 2020-03-25 贷后风险监控方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010222741.XA CN111369348A (zh) 2020-03-25 2020-03-25 贷后风险监控方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111369348A true CN111369348A (zh) 2020-07-03

Family

ID=71209172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010222741.XA Pending CN111369348A (zh) 2020-03-25 2020-03-25 贷后风险监控方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111369348A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016796A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 综合风险评分请求处理方法、装置及电子设备
CN116934464A (zh) * 2023-07-26 2023-10-24 广东企企通科技有限公司 基于小微企业的贷后风险监控方法、装置、设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016796A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 综合风险评分请求处理方法、装置及电子设备
CN112016796B (zh) * 2020-07-15 2024-03-01 北京淇瑀信息科技有限公司 综合风险评分请求处理方法、装置及电子设备
CN116934464A (zh) * 2023-07-26 2023-10-24 广东企企通科技有限公司 基于小微企业的贷后风险监控方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN111383101B (zh) 贷后风险监控方法、装置、设备及计算机可读存储介质
US8751436B2 (en) Analyzing data quality
CN111401777B (zh) 企业风险的评估方法、装置、终端设备及存储介质
US20080208780A1 (en) System and method for evaluating documents
CN110163683B (zh) 价值用户关键指标确定方法、广告投放方法及装置
CN111369348A (zh) 贷后风险监控方法、装置、设备及计算机可读存储介质
CN116542631B (zh) 一种分布式架构企业信息管理系统
CN115423586A (zh) 一种基于网络的财务发票报销上传审核系统
CN112907356A (zh) 逾期催收方法、装置、系统及计算机可读存储介质
CN110569363A (zh) 一种决策流组件生成方法、装置、电子设备及存储介质
CN111222923B (zh) 一种判断潜在客户的方法及装置、电子设备和存储介质
CN116629677A (zh) 一种人力资源工作分析用数据统计系统
CN115099986A (zh) 车险续保的处理方法、装置及相关设备
Seufert et al. A Literature-based Derivation of a Meta-framework for IT Business Value.
CN115619340A (zh) 基于智慧供应链的招标采购全业务管控方法、装置、设备、系统和介质
CN111008038B (zh) 一种基于逻辑回归模型的pull request被合并概率的计算方法
CN109919811B (zh) 基于大数据的保险代理人培养方案生成方法及相关设备
CN107122865A (zh) 通过流程统计进行估算的方法、系统及终端设备
CN111930815A (zh) 一种基于行业属性和经营属性构建企业画像的方法及系统
US20210350305A1 (en) Notifying key performance indicators of interest in a business intelligence system
CN117787759A (zh) 企业评分的确定方法、装置、存储介质及电子装置
Alberts et al. Churn Prediction in the Mobile Telecommunications Industry
Porter et al. Balancing Efficiency and Risk in Procure to Pay: Safely Realizing Cost Savings Using Process Mining Techniques
CN117745479A (zh) 关键业务环节定位方法、装置、设备及存储介质
CN116757833A (zh) 预授信额度的获取方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200703