CN110766544A - 信用风险的检测方法及装置、存储介质、电子装置 - Google Patents
信用风险的检测方法及装置、存储介质、电子装置 Download PDFInfo
- Publication number
- CN110766544A CN110766544A CN201911002617.6A CN201911002617A CN110766544A CN 110766544 A CN110766544 A CN 110766544A CN 201911002617 A CN201911002617 A CN 201911002617A CN 110766544 A CN110766544 A CN 110766544A
- Authority
- CN
- China
- Prior art keywords
- detection model
- target detection
- credit risk
- time period
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 169
- 238000012549 training Methods 0.000 claims abstract description 54
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000004590 computer program Methods 0.000 claims description 18
- 230000006399 behavior Effects 0.000 claims description 17
- 230000000694 effects Effects 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 abstract description 5
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 206010037180 Psychiatric symptoms Diseases 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种信用风险的检测方法及装置、存储介质、电子装置,该方法包括:将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率,其中,目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;基于信用风险概率确定出第一待检测对象的信用风险等级。通过本发明,解决了相关技术中对信用风险概率的评估问题,达到准确评估信用风险的效果。
Description
技术领域
本发明涉及通信领域,具体而言,涉及一种信用风险的检测方法及装置、存储介质、电子装置。
背景技术
近年来,随着我国经济发展及居民消费观念的更新,小额贷款机构无论数量上还是规模上都得到了飞速发展,作为一种低门槛、易操作的广受消费者喜爱的借款平台,小额贷款机构近几年的收益也颇为丰厚,但同时也承担着部分贷款不能收回的风险,即贷款方到期不能还本付息。这直接对社会经济等各个方面产生了不良影响,因此急需控制个人信贷风险。由于客户违约,造成小额贷款机构的资产质量下降,最终极有可能造成部分小额贷款机构没有足够的资金来进行日常的运营。
在小额贷款领域目前普遍使用的方法:小额贷款机构相关人员结合自身经验,对贷款客户能力和资本等各个方面进行评估,同时也会通过贷款客户的个人资料进行量化评分,判断贷款者在下一个还款周期是否有能力还本付息。但经验评估有很大的主观随意性,过于依赖评估人员的经验和能力。经验评估所耗费的时间人力成本较高,精确度不够。量化评分有严格的假设条件,要求数据服从正态分布,而且无法处理离散型变量。
针对上述技术问题,相关技术尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种信用风险的检测方法及装置、存储介质、电子装置,以至少解决相关技术中对信用风险进行评估的问题。
根据本发明的一个实施例,提供了一种信用风险的检测方法,包括:将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到上述目标检测模型输出的信用风险概率,其中,上述目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;基于上述信用风险概率确定出上述第一待检测对象的信用风险等级。
可选地,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到上述目标检测模型输出的信用风险概率之前,上述方法还包括:获取上述第一时间段内上述第一待检测对象的第一特征信息,得到上述第一训练数据,其中,上述第一特征信息包括上述第一待检测对象的交易信息;获取上述第二时间段内上述第一待检测对象是否发生目标行为的第二特征信息,得到上述第二训练数据,其中,上述目标行为用于表示上述第一待检测对象在上述第二时间段内发生失信行为,上述第二特征信息用于标记上述第一待检测对象是否发生失信行为。
可选地,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到上述目标检测模型输出的信用风险概率之前,上述方法还包括:将上述第一训练数据输入至上述初始检测模型中,得到上述初始检测模型输出的第一信用风险概率,其中,上述初始检测模型是利用极端梯度提升XGBoost算法和K折交叉算法确定的;将上述第二训练数据输入至上述初始检测模型中,得到上述初始检测模型输出的第二信用风险概率;在上述第一信用风险概率与上述第二信用风险概率之间的比值大于第一预设阈值的情况下,得到上述目标检测模型。
可选地,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到上述目标检测模型输出的信用风险概率之后,上述方法还包括:确定第三时间段内第二待检测对象;利用上述目标检测模型确定出上述第二待检测对象中信用风险概率大于第一预设阈值的检测对象,得到目标检测对象;将上述第三时间段换分为N段时间段,其中,上述N是大于或等于1的自然数;确定上述N段时间段中每段时间段内目标检测对象所占的比例;利用上述每段时间段内目标检测对象所占的比例检测上述目标检测模型。
可选地,利用上述每段时间段内目标检测对象所占的比例检测上述目标检测模型,包括:确定上述每段时间段内真实发生的信用风险概率大于第一预设阈值的检测对象的数量;确定真实发生的信用风险概率大于第一预设阈值的检测对象的数量在每段时间段内所占的比例,得到第一比例数据;将上述第一比例数据与上述每段时间段内目标检测对象所占的比例进行比较,得到比较结果;基于上述比较结果确定每段时间段内的上述目标检测对象的查全率和查准率;利用上述查全率和上述查准率检测上述目标检测模型。
根据本发明的另一个实施例,提供了一种信用风险的检测装置,包括:第一确定模块,用于将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到上述目标检测模型输出的信用风险概率,其中,上述目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;第二确定模块,用于基于上述信用风险概率确定出上述第一待检测对象的信用风险等级。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,由于将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率,其中,目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;基于信用风险概率确定出第一待检测对象的信用风险等级。因此,可以解决相关技术中对信用风险概率的评估问题,达到准确评估信用风险的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种信用风险的检测方法的移动终端的硬件结构框图;
图2是根据本发明实施例的信用风险的检测方法的流程图;
图3是根据本发明实施例的模型预测的效果的示意图;
图4是根据本发明实施例预测结果的示意图(一);
图5是根据本发明可选实施例的预测结果的示意图(二);
图6是根据本发明可选实施例的预测结果的示意图(三);
图7是根据本发明实施例的信用风险的检测装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种信用风险的检测方法的移动终端的硬件结构框图。如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的信用风险的检测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种信用风险的检测方法,图2是根据本发明实施例的信用风险的检测方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率,其中,目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;
步骤S204,基于信用风险概率确定出第一待检测对象的信用风险等级。
通过上述步骤,由于将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率,其中,目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;基于信用风险概率确定出第一待检测对象的信用风险等级。因此,可以解决相关技术中对信用风险概率的评估问题,达到准确评估信用风险的效果。
可选地,上述步骤的执行主体可以为终端等,但不限于此。
可选地,上述信用风险的检测方法可以但不限于应用于信用评估的场景中,例如,小额贷款机构中对逾期客户信用风险的检测场景中。
可选地,在本实施例中,预设时间段可以是3个月、4个月等。第一待检测对象包括但不限于是存在信用风险的对象,例如,小额贷款机构中贷款的客户。如表1所示,以三个月为区间划分贷款客户,每组中大约有十万的贷款客户,而对于这十万贷款客户,在下个月发生逾期的客户大约在2000左右,占总贷款客户总量的2%,相当于假设随机猜测客户是否会发生逾期,命中的概率为2%左右,即假设随机抽取一个2000左右的客户名单,那么这里边包含真正逾期的客户大约有20个左右(2000*2%)。
表1:
可选地,在本实施例中,第一训练数据可以是上述中的贷款客户,第二训练数据可以是上述中的预期客户和非预期客户,即采用逾期和非逾期两个类别作为训练数据。本实施例中的目标检测模型利用XGBoost算法、K折交叉验证构建而成。为了捕获到数据的动态变化的特性,每次都使用待预测月份的前一个月的数据作为训练集,对当前月份的数据做测试。例如,首先统计8~10月份的在途客户,以及这些客户在11月份是否发生逾期,并利用11月份之前的交易数据和个人信息构建8~10的在途客户的特征,用11月份客户的行为作为客户的标签,发生逾期则标记为1,未发生逾期则标记为0,以此作为训练数据。
在一个可选的实施例中,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率之前,方法还包括:
S1,获取第一时间段内第一待检测对象的第一特征信息,得到第一训练数据,其中,第一特征信息包括第一待检测对象的交易信息;
S2,获取第二时间段内第一待检测对象是否发生目标行为的第二特征信息,得到第二训练数据,其中,目标行为用于表示第一待检测对象在第二时间段内发生失信行为,第二特征信息用于标记第一待检测对象是否发生失信行为。
可选地,在本实施例中,第一检测对象的第一特征信息包括但不限于是客户的贷款信息。第二特征信息包括但不限于是贷款逾期的客户。
在一个可选的实施例中,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率之前,方法还包括:
S1,将第一训练数据输入至初始检测模型中,得到初始检测模型输出的第一信用风险概率,其中,初始检测模型是利用极端梯度提升XGBoost算法和K折交叉算法确定的;
S2,将第二训练数据输入至初始检测模型中,得到初始检测模型输出的第二信用风险概率;
S3,在第一信用风险概率与第二信用风险概率之间的比值大于第一预设阈值的情况下,得到目标检测模型。
可选地,在本实施例中,第二信用风险概率包括但不限于是真实的贷款逾期的客户。
在一个可选的实施例中,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率之后,方法还包括:
S1,确定第三时间段内第二待检测对象;
S2,利用目标检测模型确定出第二待检测对象中信用风险概率大于第一预设阈值的检测对象,得到目标检测对象;
S3,将第三时间段换分为N段时间段,其中,N是大于或等于1的自然数;
S4,确定N段时间段中每段时间段内目标检测对象所占的比例;
S5,利用每段时间段内目标检测对象所占的比例检测目标检测模型。
可选地,例如,将统计9~11月份的贷款客户作为测试集。利用12月份之前的数据构建这些客户的特征,将这些客户的特征输入到目标测试模型当中,输出对这些客户在12月份可能发生逾期的概率。统计9~11月份客户在12月份的是否发生逾期的真实情况,作为测试集标签。通过对比模型预测结果与真实发生逾期的情况,得到模型预测的准确率。
为了更充分的评估我们模型的效果,我们通过历史回测的方式进行了多组测试,具体如表2所示。
表2,历史回测数据构建情况:
其中,“11月份的客户逾期情况”统计到11月18日。
在一个可选的实施例中,利用每段时间段内目标检测对象所占的比例检测目标检测模型,包括:
S1,确定每段时间段内真实发生的信用风险概率大于第一预设阈值的检测对象的数量;
S2,确定真实发生的信用风险概率大于第一预设阈值的检测对象的数量在每段时间段内所占的比例,得到第一比例数据;
S3,将第一比例数据与每段时间段内目标检测对象所占的比例进行比较,得到比较结果;
S4,基于比较结果确定每段时间段内的目标检测对象的查全率和查准率;
S5,利用查全率和查准率检测目标检测模型。
可选地,在本实施例中,对于一个二分类问题,分类的结果和样例的真实类别的组合可以构成四种情况,分别为真正例(TP)、假正例(FP)、真负例(TN)和假负例(FN)。通常我们会用一个混淆矩阵如表3所示。
表3,分类结果混淆矩阵:
查准率反映了分类器判定正例的样本中真正是正例的比例,而查全率反映了被正确判定的正例占总正例的比例。直接给出查准率Precision和查全率Recall的定义:
查准率与查全率是一对矛盾的度量。一般来说,查准率高时,查全率往往偏低;而查全率高时,查准率往往偏低。通常使用F$1$度量来综合考虑查准率和查全率。F1的定义如下:
F1事实上是查准率和查全率的调和平均,只有当两者都相对大时,F$1$的值才会比较大。它反映了查准率和查全率之间取舍的平衡。这里为了方便对比,设定预测结果按照概率大小排名后,取与真实正样本的数量相同的客户,记为预测正例,认为这些客户会发生逾期,其他客户为负例,认为其他客户不会发生逾期。如对9月份96986个在途客户,有2403个客户真实发生逾期了,则对这96986个客户按照概率大小进行排序,然后取前2403个客户认为他们会发生逾期。在这种设定条件下Precision、Recall、F1三个指标的值相等。
图3展示了模型预测的效果与随机猜测的f1的对比情况,从图3中可以看出,基本上目标检测模型得到的f1为随机猜的10倍左右。比如对9月份的96986个在途客户,通过目标检测模型预测结果抽取了2403个客户认为他们会逾期,通过与真实情况对比,发现其中真正逾期的有2403*0.264=634人,而随机猜的命中数量只有2403*0.025=60人。
此外,为了进一步说明模型的效果,按照真实逾期的比例将客户切分成多个区间,然后统计每个区间命中的逾期客户的数量,并与随机猜测的情况进行对比。图4、图5、图6分别为9、10、11月份的预测结果。从图4、图5、图6中可以看出目标检测模型将大部分真实逾期的客户都排在了靠前的几个区间当中,即当按照目标检测模型输出概率排序后取排名靠前的少量客户(如15%),则可以找出大部分真实逾期的客户。而随机猜测则会将真实的客户散落在各个区间当中,效果较差。
此外,根据目标检测模型的预测,给出了使用的特征的重要性,需要说明的是该特征重要性只能表明该特征与客户逾期可能存在某种关系,分值的大小并不能完全反应特征与逾期的相关程度。表4给出了预测三个月各自的特征重要性比较靠前的前40个特征,从表4可以看出,三组特征基本上是一致的。这些特征能从一定程度上反应逾期客户共同存在的特性。
表4:特征重要性排名
在一个可选的实施例中,基于信用风险概率确定出第一待检测对象的信用风险等级之后,方法还包括:
S1,统计信用风险等级大于第二预设阈值的检测对象的特征信息;
S2,标识信用风险等级大于第二预设阈值的检测对象。
可选地,在本实施例中,通过对信用风险的深入研究,引入机器学习技术对小额贷款机构的客户构建逾期概率预测模型,可以有效的对小额贷款机构逾期客户信用风险进行预警,这将成为小额贷款机构在判别客户在未来的还款周期中是否会逾期甚至是否会成为老赖的重要依据,从而可以对逾期风险进行等级划分,对于预测出逾期可能性较高的客户,可以在逾期前期对其强有力的措施来督促确保其按时还款,从而减少平台坏账而带来的损失。
通过对客户信用的深入研究,结合机器学习技术及不断的反馈迭代,将逾期客户预测准确率相较于传统方式提高了10倍左右,为降低小额贷款机构的风险提供了有力保障。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种信用风险的检测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图7是根据本发明实施例的信用风险的检测装置的结构框图,如图7所示,该装置包括:
第一确定模块72,用于将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率,其中,目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;
第二确定模块74,用于基于信用风险概率确定出第一待检测对象的信用风险等级。
可选地,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率之前,上述装置还用于:获取第一时间段内第一待检测对象的第一特征信息,得到第一训练数据,其中,第一特征信息包括第一待检测对象的交易信息;获取第二时间段内第一待检测对象是否发生目标行为的第二特征信息,得到第二训练数据,其中,目标行为用于表示第一待检测对象在第二时间段内发生失信行为,第二特征信息用于标记第一待检测对象是否发生失信行为。
可选地,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率之前,上述装置还用于:将第一训练数据输入至初始检测模型中,得到初始检测模型输出的第一信用风险概率,其中,初始检测模型是利用极端梯度提升XGBoost算法和K折交叉算法确定的;将第二训练数据输入至初始检测模型中,得到初始检测模型输出的第二信用风险概率;在第一信用风险概率与第二信用风险概率之间的比值大于第一预设阈值的情况下,得到目标检测模型。
可选地,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率之后,上述装置还用于:确定第三时间段内第二待检测对象;利用目标检测模型确定出第二待检测对象中信用风险概率大于第一预设阈值的检测对象,得到目标检测对象;将第三时间段换分为N段时间段,其中,N是大于或等于1的自然数;确定N段时间段中每段时间段内目标检测对象所占的比例;利用每段时间段内目标检测对象所占的比例检测目标检测模型。
可选地,通过以下方式利用每段时间段内目标检测对象所占的比例检测目标检测模型:确定每段时间段内真实发生的信用风险概率大于第一预设阈值的检测对象的数量;确定真实发生的信用风险概率大于第一预设阈值的检测对象的数量在每段时间段内所占的比例,得到第一比例数据;将第一比例数据与每段时间段内目标检测对象所占的比例进行比较,得到比较结果;基于比较结果确定每段时间段内的目标检测对象的查全率和查准率;利用查全率和查准率检测目标检测模型。
可选地,基于信用风险概率确定出第一待检测对象的信用风险等级之后,上述装置还用于:统计信用风险等级大于第二预设阈值的检测对象的特征信息;标识信用风险等级大于第二预设阈值的检测对象。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率,其中,目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;
S2,基于信用风险概率确定出第一待检测对象的信用风险等级。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到目标检测模型输出的信用风险概率,其中,目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;
S2,基于信用风险概率确定出第一待检测对象的信用风险等级。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种信用风险的检测方法,其特征在于,包括:
将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到所述目标检测模型输出的信用风险概率,其中,所述目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;
基于所述信用风险概率确定出所述第一待检测对象的信用风险等级。
2.根据权利要求1所述的方法,其特征在于,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到所述目标检测模型输出的信用风险概率之前,所述方法还包括:
获取所述第一时间段内所述第一待检测对象的第一特征信息,得到所述第一训练数据,其中,所述第一特征信息包括所述第一待检测对象的交易信息;
获取所述第二时间段内所述第一待检测对象是否发生目标行为的第二特征信息,得到所述第二训练数据,其中,所述目标行为用于表示所述第一待检测对象在所述第二时间段内发生失信行为,所述第二特征信息用于标记所述第一待检测对象是否发生失信行为。
3.根据权利要求2所述的方法,其特征在于,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到所述目标检测模型输出的信用风险概率之前,所述方法还包括:
将所述第一训练数据输入至所述初始检测模型中,得到所述初始检测模型输出的第一信用风险概率,其中,所述初始检测模型是利用极端梯度提升XGBoost算法和K折交叉算法确定的;
将所述第二训练数据输入至所述初始检测模型中,得到所述初始检测模型输出的第二信用风险概率;
在所述第一信用风险概率与所述第二信用风险概率之间的比值大于第一预设阈值的情况下,得到所述目标检测模型。
4.根据权利要求1所述的方法,其特征在于,在将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到所述目标检测模型输出的信用风险概率之后,所述方法还包括:
确定第三时间段内第二待检测对象;
利用所述目标检测模型确定出所述第二待检测对象中信用风险概率大于第一预设阈值的检测对象,得到目标检测对象;
将所述第三时间段换分为N段时间段,其中,所述N是大于或等于1的自然数;
确定所述N段时间段中每段时间段内目标检测对象所占的比例;
利用所述每段时间段内目标检测对象所占的比例检测所述目标检测模型。
5.根据权利要求4所述的方法,其特征在于,利用所述每段时间段内目标检测对象所占的比例检测所述目标检测模型,包括:
确定所述每段时间段内真实发生的信用风险概率大于第一预设阈值的检测对象的数量;
确定真实发生的信用风险概率大于第一预设阈值的检测对象的数量在每段时间段内所占的比例,得到第一比例数据;
将所述第一比例数据与所述每段时间段内目标检测对象所占的比例进行比较,得到比较结果;
基于所述比较结果确定每段时间段内的所述目标检测对象的查全率和查准率;
利用所述查全率和所述查准率检测所述目标检测模型。
6.一种信用风险的检测装置,其特征在于,包括:
第一确定模块,用于将预设时间段内的第一待检测对象的特征信息输入至目标检测模型,得到所述目标检测模型输出的信用风险概率,其中,所述目标检测模型是使用第一时间段内的第一训练数据和第二时间段内的第二训练数据对初始检测模型进行训练得到的模型;
第二确定模块,用于基于所述信用风险概率确定出所述第一待检测对象的信用风险等级。
7.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至5任一项中所述的方法。
8.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至5任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911002617.6A CN110766544A (zh) | 2019-10-21 | 2019-10-21 | 信用风险的检测方法及装置、存储介质、电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911002617.6A CN110766544A (zh) | 2019-10-21 | 2019-10-21 | 信用风险的检测方法及装置、存储介质、电子装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110766544A true CN110766544A (zh) | 2020-02-07 |
Family
ID=69331332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911002617.6A Pending CN110766544A (zh) | 2019-10-21 | 2019-10-21 | 信用风险的检测方法及装置、存储介质、电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110766544A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634017A (zh) * | 2020-12-21 | 2021-04-09 | 平安科技(深圳)有限公司 | 远程开卡激活方法、装置、电子设备及计算机存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657894A (zh) * | 2018-09-27 | 2019-04-19 | 深圳壹账通智能科技有限公司 | 企业信用风险预警方法、装置、设备及存储介质 |
CN110246029A (zh) * | 2019-06-21 | 2019-09-17 | 深圳前海微众银行股份有限公司 | 贷后风险管理方法、终端、装置及可读存储介质 |
CN110349038A (zh) * | 2019-06-13 | 2019-10-18 | 中国平安人寿保险股份有限公司 | 风险评估模型训练方法和风险评估方法 |
-
2019
- 2019-10-21 CN CN201911002617.6A patent/CN110766544A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109657894A (zh) * | 2018-09-27 | 2019-04-19 | 深圳壹账通智能科技有限公司 | 企业信用风险预警方法、装置、设备及存储介质 |
CN110349038A (zh) * | 2019-06-13 | 2019-10-18 | 中国平安人寿保险股份有限公司 | 风险评估模型训练方法和风险评估方法 |
CN110246029A (zh) * | 2019-06-21 | 2019-09-17 | 深圳前海微众银行股份有限公司 | 贷后风险管理方法、终端、装置及可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634017A (zh) * | 2020-12-21 | 2021-04-09 | 平安科技(深圳)有限公司 | 远程开卡激活方法、装置、电子设备及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180308160A1 (en) | Risk assessment method and system | |
CN107040397B (zh) | 一种业务参数获取方法及装置 | |
CN109977403B (zh) | 恶意评论信息识别方法及装置 | |
CN106919579A (zh) | 一种信息处理方法及装置、设备 | |
TW201842473A (zh) | 確定使用者風險偏好的方法、資訊推薦方法及裝置 | |
CN111078880B (zh) | 子应用的风险识别方法以及装置 | |
CN105354210A (zh) | 移动游戏支付账户行为数据处理方法和装置 | |
CN108399565A (zh) | 金融产品推荐装置、方法及计算机可读存储介质 | |
CN106815452A (zh) | 一种作弊检测方法及装置 | |
CN106408325A (zh) | 基于用户支付信息的用户消费行为预测分析方法及系统 | |
CN112598294A (zh) | 在线建立评分卡模型的方法、装置、机器可读介质及设备 | |
CN113177839A (zh) | 一种信用风险评估方法、装置、存储介质和设备 | |
CN106998336B (zh) | 渠道中的用户检测方法和装置 | |
CN111061948B (zh) | 一种用户标签推荐方法、装置、计算机设备及存储介质 | |
CN110009012A (zh) | 一种风险样本识别方法、装置及电子设备 | |
CN111325572B (zh) | 一种数据处理方法及装置 | |
CN110766544A (zh) | 信用风险的检测方法及装置、存储介质、电子装置 | |
CN113361778A (zh) | 应用于业务连续性管理平台的信息处理方法及装置 | |
CN112598326A (zh) | 模型迭代方法、装置、电子设备及存储介质 | |
CN107844874A (zh) | 企业营运问题分析系统及其方法 | |
CN115630708A (zh) | 一种模型更新方法、装置、电子设备、存储介质及产品 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
CN111625720B (zh) | 数据决策项目执行策略的确定方法、装置、设备和介质 | |
CN116308370A (zh) | 异常交易识别模型的训练方法、异常交易识别方法及装置 | |
CN112598225A (zh) | 评价指标的确定方法及装置、存储介质、电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200207 |