CN117333290A - 一种一体化多尺度风控模型构建方法 - Google Patents
一种一体化多尺度风控模型构建方法 Download PDFInfo
- Publication number
- CN117333290A CN117333290A CN202311631940.6A CN202311631940A CN117333290A CN 117333290 A CN117333290 A CN 117333290A CN 202311631940 A CN202311631940 A CN 202311631940A CN 117333290 A CN117333290 A CN 117333290A
- Authority
- CN
- China
- Prior art keywords
- overdue
- similarity
- users
- different
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010276 construction Methods 0.000 title claims abstract description 14
- 238000011156 evaluation Methods 0.000 claims abstract description 41
- 238000012216 screening Methods 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 22
- 238000012937 correction Methods 0.000 claims description 9
- 238000001914 filtration Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000012502 risk assessment Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种一体化多尺度风控模型构建方法,属于风控管理技术领域,具体包括:根据相似度进行筛选逾期用户中的相似逾期用户的确定,并结合与不同的所述筛选逾期用户的相似度进行授信申请用户的逾期相似度的确定,当逾期相似度不满足要求时,通过不同尺度的逾期特征所对应的历史授信申请案件的权重以及不同尺度的逾期特征与筛选逾期用户的相似度进行不同尺度的逾期特征的特征权值的确定,通过特征权值对不同尺度的逾期特征进行修正得到不同尺度的修正逾期特征,并将不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到授信申请用户在不同尺度的逾期风险以及综合逾期风险,从而实现了对不同尺度的逾期风险的一体化评估。
Description
技术领域
本发明属于风控管理技术领域,尤其涉及一种一体化多尺度风控模型构建方法。
背景技术
借款人逾期风险贯穿贷款全生命周期,可靠的风控体系应具备应对贷款生命周期中不同阶段逾期风险的能力,风控模型是风控体系中的核心部件,是风控工作开展的关键抓手,但是由于不同阶段逾期的借款人存在差异,需在不同尺度下进行针对性建模,常规风控模型体系中,每一个尺度对应一个模型,随着覆盖尺度的细化和增加,模型数量也同步增加,进而增加了部署难度和资源需求。
为解决上述技术问题,现有技术方案例如发明专利CN202311028075.6《一种融合尺度标签的多尺度风控系统及其方法》中通过融合短期风险特征向量和长期风险特征向量以得到多尺度风险特征向量,并基于此来确定长期逾期概率和短期逾期概率,进而降低风控环节的复杂度和操作风险,但是却存在以下技术问题:
现有技术方案在进行风险模型的构建时,忽视了首先根据授信申请用户的历史逾期数据进行授信申请用户与逾期用户的相似度的评估,并根据相似度的评估结果对存在逾期风险的用户进行筛选,从而导致逾期风险评估的效率有所降低。
现有技术方案在进行风险模型的构建时,对于授信申请用户的不同的历史逾期案件,一般时间和违约程度存在一定程度的差异,不同的历史逾期案件所反映的短期风险特征和长期风险特征的可信度存在一定程度的差异,因此若不考虑上述因素,则无法实现对授信申请用户的逾期风险的准确评估。
针对上述技术问题,本发明提供了涉及一种一体化多尺度风控模型构建方法。
发明内容
为实现本发明目的,本发明采用如下技术方案:
根据本发明的一个方面,提供了一种一体化多尺度风控模型构建方法。
一种一体化多尺度风控模型构建方法,其特征在于,具体包括:
S1基于历史授信申请数据进行授信申请用户在不同的时间尺度的历史授信申请案件的提取,并基于不同的历史授信申请案件的不同尺度的逾期特征以及时间尺度进行所述授信申请用户与筛选逾期用户的相似度的评估;
S2根据所述相似度进行所述筛选逾期用户中的相似逾期用户的确定,并结合与不同的所述筛选逾期用户的相似度进行所述授信申请用户的逾期相似度的确定,当所述逾期相似度不满足要求时,进入下一步骤;
S3基于不同尺度的逾期特征以及时间尺度进行不同的历史授信申请案件的权重的确定,并通过不同尺度的逾期特征所对应的历史授信申请案件的权重以及不同尺度的逾期特征与所述筛选逾期用户的相似度进行不同尺度的逾期特征的特征权值的确定;
S4通过所述特征权值对不同尺度的逾期特征进行修正得到不同尺度的修正逾期特征,并将所述不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到所述授信申请用户在不同尺度的逾期风险以及综合逾期风险。
本发明的有益效果在于:
1、通过基于不同的历史授信申请案件的不同尺度的逾期特征以及时间尺度进行授信申请用户与筛选逾期用户的相似度的评估,避免了原有的直接进行逾期风险的评估导致的评估效率较低的技术问题,实现了从逾期特征的相似度的角度对逾期风险较高的授信申请用户的筛选。
2、通过根据相似逾期用户以及不同的筛选逾期用户的相似度进行授信申请用户的逾期相似度的确定,从而实现了根据不同的授信申请用户与筛选逾期用户的相似情况实现了对逾期风险较大的授信申请用户的筛选,也为针对性的进行逾期风险的评估奠定了基础。
3、通过基于不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到授信申请用户在不同尺度的逾期风险以及综合逾期风险,既实现了不同尺度的逾期风险的一体化处理,同时还考虑到不同尺度的逾期特征由于相似程度和时间尺度的差异导致的逾期风险的差异,从而实现了对不同尺度的逾期风险和综合逾期风险的准确评估。
进一步的技术方案在于,所述授信申请用户的历史授信申请数据根据所述授信申请用户的授信申请信息、经所述授信申请用户同意后的其它数据源的数据进行确定。
进一步的技术方案在于,所述时间尺度根据所述筛选逾期用户的数量以及不同的筛选逾期用户的逾期特征的时间分布情况进行确定,其中所述筛选逾期用户的数量越少,筛选逾期用户的逾期特征的时间分布越分散,则所述时间尺度越多。
进一步的技术方案在于,所述不同尺度的逾期特征根据所述授信申请用户的不同的历史授信申请案件在不同的时间区间内的逾期天数和逾期金额进行确定。
进一步的技术方案在于,当所述授信申请用户的逾期相似度不大于用户相似度限定值时,则确定所述授信申请用户的逾期相似度满足要求,无须进行所述授信申请用户在不同尺度的逾期风险以及综合逾期风险的评估。
另一方面,本发明提供了一种一体化多尺度风控模型构建系统,采用上述的一种一体化多尺度风控模型构建方法,其特征在于,具体包括:
相似度评估模块,逾期评估模块,特征重构模块,风险确定模块;
其中所述相似度评估模块负责基于历史授信申请数据进行授信申请用户在不同的时间尺度的历史授信申请案件的提取,并基于不同的历史授信申请案件的不同尺度的逾期特征以及时间尺度进行所述授信申请用户与筛选逾期用户的相似度的评估;
所述逾期评估模块负责根据所述相似度进行所述筛选逾期用户中的相似逾期用户的确定,并结合与不同的所述筛选逾期用户的相似度进行所述授信申请用户的逾期相似度的确定;
所述特征重构模块负责基于不同尺度的逾期特征以及时间尺度进行不同的历史授信申请案件的权重的确定,并通过不同尺度的逾期特征所对应的历史授信申请案件的权重以及不同尺度的逾期特征与所述筛选逾期用户的相似度进行不同尺度的逾期特征的特征权值的确定;
所述风险确定模块负责通过所述特征权值对不同尺度的逾期特征进行修正得到不同尺度的修正逾期特征,并将所述不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到所述授信申请用户在不同尺度的逾期风险以及综合逾期风险。
其他特征和优点将在随后的说明书中阐述,本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显;
图1是一种一体化多尺度风控模型构建方法的流程图;
图2是授信申请用户与筛选逾期用户的相似度的评估的具体步骤的流程图;
图3是授信申请用户的逾期相似度的确定的方法的流程图;
图4是逾期特征的特征权值的确定的方法的流程图;
图5是一种一体化多尺度风控模型构建系统的框架图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
在进行授信申请的处理时,对于不同的授信申请用户其历史授信申请案件在不同的尺度的逾期特征反应的授信申请用户的逾期风险存在较大的差异,具体的,对于还款期限为6期的用户,因此在1期、2期、3期、4期、5期以及6期的逾期特征反应的授信申请用户的资质情况存在较大的差异,现有技术方案中往往对不同尺度的逾期特征采用差异化的逾期模型的构建,处理效率和处理准确率都难以满足要求。
为解决上述技术问题,提供了以下技术手段:
首先通过历史授信申请数据进行授信申请用户在不同的时间尺度的历史授信申请案件的提取,具体的,可以根据1年为间隔进行1年前的历史授信申请案件的提取和1年内的历史授信申请案件的提取,并基于不同的历史授信申请案件的不同尺度的逾期特征以及时间尺度进行授信申请用户与筛选逾期用户的相似度的评估,具体的可以根据在不同的时间尺度的逾期特征的相似数量进行不同的时间尺度的相似度的确定,并根据不同的时间尺度的相似度进行授信申请用户与筛选逾期用户的相似度的评估;
然后将相似度较高的筛选逾期用户作为相似逾期用户,并结合与不同的所述筛选逾期用户的相似度进行所述授信申请用户的逾期相似度的确定,具体的可以根据相似逾期用户的相似度的平均值以及相似逾期用户的数量与筛选逾期用户的比值进行逾期相似度的构建,当逾期相似度不满足要求时,说明逾期风险较大,此时进入下一步骤;
紧接着基于不同尺度的逾期特征以及时间尺度进行不同的历史授信申请案件的权重的确定,具体的可以根据逾期特征的数量以及时间尺度对应的时间区间进行权重的确定,并通过不同尺度的逾期特征所对应的历史授信申请案件的权重以及不同尺度的逾期特征与筛选逾期用户的相似度进行不同尺度的逾期特征的特征权值的确定,具体的可以通过相似度以及权重和的乘积进行特征权值的确定;
最后通过特征权值对不同尺度的逾期特征进行修正得到不同尺度的修正逾期特征,并将不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到授信申请用户在不同尺度的逾期风险以及综合逾期风险,具体的可以通过神经网络亦或者其它类型的机器学习算法构建的风控模型进行不同尺度的逾期风险的确定,并将所述授信申请用户在不同尺度的逾期风险的数量和进行归一化处理后得到所述综合逾期风险。
以下将从系统类实施例和方法类实施例两个角度进行详细叙述。
为解决上述问题,根据本发明的一个方面,如图1所示,提供了一种一种一体化多尺度风控模型构建方法,其特征在于,具体包括:
S1基于历史授信申请数据进行授信申请用户在不同的时间尺度的历史授信申请案件的提取,并基于不同的历史授信申请案件的不同尺度的逾期特征以及时间尺度进行所述授信申请用户与筛选逾期用户的相似度的评估;
具体的,所述授信申请用户的历史授信申请数据根据所述授信申请用户的授信申请信息、经所述授信申请用户同意后的其它数据源的数据进行确定。
可以理解的是,所述时间尺度根据所述筛选逾期用户的数量以及不同的筛选逾期用户的逾期特征的时间分布情况进行确定,其中所述筛选逾期用户的数量越少,筛选逾期用户的逾期特征的时间分布越分散,则所述时间尺度越多。
在其中的可能的一个实施例中,如图2所示,上述步骤S1中的所述授信申请用户与筛选逾期用户的相似度的评估的具体步骤为:
S11通过所述历史授信申请案件的时间尺度将所述历史授信申请案件划分至多个区间,并基于不同区间的不同的历史授信申请案件的不同尺度的逾期特征以及所述筛选逾期用户的不同的历史授信申请案件的不同尺度的逾期特征进行不同区间的不同尺度的逾期特征相似度以及不同尺度的逾期特征的数量的偏差量的确定;
S12基于不同区间的不同尺度的逾期特征相似度、不同尺度的逾期特征的数量的偏差量以及所述偏差量与所述筛选逾期用户的不同尺度的逾期特征的数量进行不同区间的所述授信申请用户与筛选逾期用户的区间综合相似度的评估,并根据所述区间综合相似度进行所述授信申请用户与所述筛选逾期用户的相似区间以及不相似区间的确定;
S13通过所述授信申请用户与所述筛选逾期用户的相似区间与当前时刻的距离时长对所述筛选逾期用户的区间综合相似度进行修正得到修正区间相似度,并基于不同的相似区间的修正区间相似度以及数量进行所述授信申请用户与所述筛选逾期用户的相似区间的相似度评估量的确定;
S14获取所述授信申请用户与所述筛选逾期用户的不相似区间的数量以及区间相似度,并结合授信申请用户与所述筛选逾期用户的不同区间的修正区间相似度以及所述相似区间的相似度评估量确定所述授信申请用户与所述筛选逾期用户的相似度。
具体的,所述不同尺度的逾期特征根据所述授信申请用户的不同的历史授信申请案件在不同的时间区间内的逾期天数和逾期金额进行确定。
在另外的可能的一个实施例中,上述步骤S1中的所述授信申请用户与筛选逾期用户的相似度的评估的具体步骤为:
通过所述历史授信申请案件的时间尺度将所述历史授信申请案件划分至多个区间,并基于不同区间的不同的历史授信申请案件的不同尺度的逾期特征以及所述筛选逾期用户的不同的历史授信申请案件的不同尺度的逾期特征进行不同区间的不同尺度的逾期特征相似度以及不同尺度的逾期特征的数量的偏差量的确定;
基于不同区间的不同尺度的逾期特征相似度、不同尺度的逾期特征的数量的偏差量以及所述偏差量与所述筛选逾期用户的不同尺度的逾期特征的数量进行不同区间的所述授信申请用户与筛选逾期用户的区间综合相似度的评估,通过所述授信申请用户与所述筛选逾期用户的不同区间与当前时刻的距离时长对所述筛选逾期用户的不同区间的区间综合相似度进行修正得到修正区间相似度,并根据所述修正区间相似度进行所述授信申请用户与所述筛选逾期用户的相似区间以及不相似区间的确定;
当所述授信申请用户与所述筛选逾期用户不存在相似区间时:
获取所述授信申请用户与所述筛选逾期用户的不相似区间的数量以及修正区间相似度,并结合授信申请用户与所述筛选逾期用户的不同区间的修正区间相似度确定所述授信申请用户与所述筛选逾期用户的相似度;
当所述授信申请用户与所述筛选逾期用户存在相似区间时:
基于不同的相似区间的修正区间相似度、数量以及所述授信申请用户的区间的数量占比进行所述授信申请用户与所述筛选逾期用户的相似区间的相似度评估量的确定;
当所述授信申请用户与所述筛选逾期用户的相似区间的相似度评估量满足要求时:
将所述相似区间的相似度评估量作为所述授信申请用户与筛选逾期用户的相似度;
当所述授信申请用户与筛选逾期用户的相似区间的相似度评估量不满足要求时:
获取所述授信申请用户与所述筛选逾期用户的不相似区间的数量以及修正区间相似度,并结合授信申请用户与所述筛选逾期用户的不同区间的修正区间相似度以及所述相似区间的相似度评估量确定所述授信申请用户与筛选逾期用户的相似度的评估。
S2根据所述相似度进行所述筛选逾期用户中的相似逾期用户的确定,并结合与不同的所述筛选逾期用户的相似度进行所述授信申请用户的逾期相似度的确定,当所述逾期相似度不满足要求时,进入下一步骤;
可以理解的是,当筛选逾期用户与所述授信申请用户的相似度大于预设相似度限定值时,则确定所述筛选用户为相似逾期用户,其中所述预设相似度限定值根据所述筛选逾期用户的数量进行动态调整。
在其中的可能的一个实施例中,如图3所示,上述步骤S2中的所述授信申请用户的逾期相似度的确定的方法为:
S21获取所述授信申请用户的相似逾期用户,并判断所述相似逾期用户的数量是否大于预设用户数量,若是,则通过所述相似用户的数量进行所述授信申请用户的逾期相似度的确定,若否,则进入下一步骤;
S22通过所述授信申请用户的相似逾期用户进行所述相似逾期用户的相似度的确定,并根据所述相似逾期用户的数量以及相似度进行所述授信申请用户的相似度的数量和的确定,判断所述授信申请用户的相似度的数量和是否大于预设用户相似度阈值,若是,则通过所述授信申请用户的相似度的数量和进行所述授信申请用户的逾期相似度的确定,若否,则进入下一步骤;
S23通过所述授信申请用户的相似逾期用户的相似度进行所述相似逾期用户中的相似度在预设相似度区间的数量的确定,并结合所述相似逾期用户的数量以及不同的相似逾期用户的相似度的平均值进行所述授信申请用户的相似逾期用户的用户相似度评估量的确定,判断所述授信申请用户的相似逾期用户的用户相似度评估量是否满足要求,若是,则将所述相似逾期用户的用户相似度评估量作为所述授信申请用户的逾期相似度,若否,则进入下一步骤;
S24获取所述授信申请用户与不同的筛选逾期用户的相似度,并根据所述相似度进行关联逾期用户的数量以及不同的关联逾期用户的相似度的确定,并结合关联逾期用户在所述筛选逾期用户的数量占比以及所述相似逾期用户的用户相似度评估量进行所述授信申请用户的逾期相似度的确定。
进一步的,当所述授信申请用户的逾期相似度不大于用户相似度限定值时,则确定所述授信申请用户的逾期相似度满足要求,无须进行所述授信申请用户在不同尺度的逾期风险以及综合逾期风险的评估。
在另外的可能的一个实施例中,上述步骤S2中的所述授信申请用户的逾期相似度的确定的方法为:
获取所述授信申请用户与不同的筛选逾期用户的相似度,并根据所述相似度进行关联逾期用户的数量以及不同的关联逾期用户的相似度的确定,当所述关联逾期用户的相似度的数量和不满足要求时:
通过所述关联逾期用户的相似度的数量和进行所述授信申请用户的逾期相似度的确定;
当所述关联逾期用户的相似度的数量和满足要求时:
通过所述授信申请用户的相似逾期用户进行所述相似逾期用户的相似度的确定,并根据所述相似逾期用户的数量以及相似度进行所述授信申请用户的相似度的数量和的确定,判断所述授信申请用户的相似度的数量和是否大于预设用户相似度阈值,若是,则通过所述授信申请用户的相似度的数量和进行所述授信申请用户的逾期相似度的确定,若否,则进入下一步骤;
通过所述授信申请用户的相似逾期用户的相似度进行所述相似逾期用户中的相似度在预设相似度区间的数量的确定,并结合所述相似逾期用户的数量以及不同的相似逾期用户的相似度的平均值进行所述授信申请用户的相似逾期用户的用户相似度评估量的确定,判断所述授信申请用户的相似逾期用户的用户相似度评估量是否满足要求,若是,则将所述相似逾期用户的用户相似度评估量作为所述授信申请用户的逾期相似度,若否,则进入下一步骤;
获取所述授信申请用户与不同的筛选逾期用户的相似度,并根据所述相似度进行关联逾期用户的数量以及不同的关联逾期用户的相似度的确定,并结合关联逾期用户在所述筛选逾期用户的数量占比以及所述相似逾期用户的用户相似度评估量进行所述授信申请用户的逾期相似度的确定。
S3基于不同尺度的逾期特征以及时间尺度进行不同的历史授信申请案件的权重的确定,并通过不同尺度的逾期特征所对应的历史授信申请案件的权重以及不同尺度的逾期特征与所述筛选逾期用户的相似度进行不同尺度的逾期特征的特征权值的确定;
进一步需要说明的是,基于不同尺度的逾期特征以及时间尺度进行不同的历史授信申请案件的权重的确定,具体包括:
通过不同的历史授信申请案件的不同尺度的逾期特征进行所述历史授信申请案件的逾期特征的数量以及不同的逾期特征的严重程度的确定,并基于所述历史授信申请案件的逾期特征的数量以及不同的逾期特征的严重程度进行所述历史授信申请案件的逾期严重程度值的确定;
根据所述历史授信申请案件的时间尺度进行所述历史授信申请案件所处的时间区间的确定,并基于所述时间区间进行修正量的确定,通过所述逾期严重程度值以及所述修正量进行所述历史授信申请案件的权重的确定。
在其中的可能的一个实施例中,如图4所示,上述步骤S3中的所述逾期特征的特征权值的确定的方法为:
S31通过所述逾期特征的时间尺度以及逾期特征确定与所述筛选逾期用户在所述时间尺度的相同尺度的逾期特征,并将其作为相同尺度特征,并根据所述筛选逾期用户的相同尺度特征的逾期严重程度确定与所述逾期特征的相似度,将其作为筛选逾期用户与所述逾期特征的相似度;
S32基于筛选逾期用户与所述逾期特征的相似度确定与所述逾期特征的相似度满足要求的所述筛选逾期用户,并将其作为相似特征逾期用户,并根据相似特征逾期用户的数量和相似度进行所述逾期特征的历史用户相似度的确定;
S33通过逾期特征所对应的历史授信申请案件的权重以及历史授信申请案件的数量进行不同的逾期特征的案件权重和的确定,并结合所述逾期特征的历史用户相似度以及逾期特征在不同的时间尺度的数量进行所述逾期特征的特征权值的确定。
S4通过所述特征权值对不同尺度的逾期特征进行修正得到不同尺度的修正逾期特征,并将所述不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到所述授信申请用户在不同尺度的逾期风险以及综合逾期风险。
具体的,风控模型可以通过采用BP神经网络、CNN卷积神经网络等任意一种或者多种基于机器学习算法的模型进行构建。
可以理解的是,所述综合逾期风险根据所述授信申请用户在不同尺度的逾期风险的数量和进行确定,具体的将所述授信申请用户在不同尺度的逾期风险的数量和进行归一化处理后得到所述综合逾期风险。
另一方面,如图5所示,本发明提供了一种一体化多尺度风控模型构建系统,采用上述的一种一体化多尺度风控模型构建方法,其特征在于,具体包括:
相似度评估模块,逾期评估模块,特征重构模块,风险确定模块;
其中所述相似度评估模块负责基于历史授信申请数据进行授信申请用户在不同的时间尺度的历史授信申请案件的提取,并基于不同的历史授信申请案件的不同尺度的逾期特征以及时间尺度进行所述授信申请用户与筛选逾期用户的相似度的评估;
所述逾期评估模块负责根据所述相似度进行所述筛选逾期用户中的相似逾期用户的确定,并结合与不同的所述筛选逾期用户的相似度进行所述授信申请用户的逾期相似度的确定;
所述特征重构模块负责基于不同尺度的逾期特征以及时间尺度进行不同的历史授信申请案件的权重的确定,并通过不同尺度的逾期特征所对应的历史授信申请案件的权重以及不同尺度的逾期特征与所述筛选逾期用户的相似度进行不同尺度的逾期特征的特征权值的确定;
所述风险确定模块负责通过所述特征权值对不同尺度的逾期特征进行修正得到不同尺度的修正逾期特征,并将所述不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到所述授信申请用户在不同尺度的逾期风险以及综合逾期风险。
通过以上实施例,本发明取得以下有益效果:
1、通过基于不同的历史授信申请案件的不同尺度的逾期特征以及时间尺度进行授信申请用户与筛选逾期用户的相似度的评估,避免了原有的直接进行逾期风险的评估导致的评估效率较低的技术问题,实现了从逾期特征的相似度的角度对逾期风险较高的授信申请用户的筛选。
2、通过根据相似逾期用户以及不同的筛选逾期用户的相似度进行授信申请用户的逾期相似度的确定,从而实现了根据不同的授信申请用户与筛选逾期用户的相似情况实现了对逾期风险较大的授信申请用户的筛选,也为针对性的进行逾期风险的评估奠定了基础。
3、通过基于不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到授信申请用户在不同尺度的逾期风险以及综合逾期风险,既实现了不同尺度的逾期风险的一体化处理,同时还考虑到不同尺度的逾期特征由于相似程度和时间尺度的差异导致的逾期风险的差异,从而实现了对不同尺度的逾期风险和综合逾期风险的准确评估。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (10)
1.一种一体化多尺度风控模型构建方法,其特征在于,具体包括:
基于历史授信申请数据进行授信申请用户在不同的时间尺度的历史授信申请案件的提取,并基于不同的历史授信申请案件的不同尺度的逾期特征以及时间尺度进行所述授信申请用户与筛选逾期用户的相似度的评估;
根据所述相似度进行所述筛选逾期用户中的相似逾期用户的确定,并结合与不同的所述筛选逾期用户的相似度进行所述授信申请用户的逾期相似度的确定,当所述逾期相似度不满足要求时,进入下一步骤;
基于不同尺度的逾期特征以及时间尺度进行不同的历史授信申请案件的权重的确定,并通过不同尺度的逾期特征所对应的历史授信申请案件的权重以及不同尺度的逾期特征与所述筛选逾期用户的相似度进行不同尺度的逾期特征的特征权值的确定;
通过所述特征权值对不同尺度的逾期特征进行修正得到不同尺度的修正逾期特征,并将所述不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到所述授信申请用户在不同尺度的逾期风险以及综合逾期风险。
2.如权利要求1所述的一体化多尺度风控模型构建方法,其特征在于,所述授信申请用户的历史授信申请数据根据所述授信申请用户的授信申请信息、经所述授信申请用户同意后的其它数据源的数据进行确定。
3.如权利要求1所述的一体化多尺度风控模型构建方法,其特征在于,所述时间尺度根据所述筛选逾期用户的数量以及不同的筛选逾期用户的逾期特征的时间分布情况进行确定,其中所述筛选逾期用户的数量越少,筛选逾期用户的逾期特征的时间分布越分散,则所述时间尺度越多。
4.如权利要求1所述的一体化多尺度风控模型构建方法,其特征在于,所述授信申请用户与筛选逾期用户的相似度的评估的具体步骤为:
通过所述历史授信申请案件的时间尺度将所述历史授信申请案件划分至多个区间,并基于不同区间的不同的历史授信申请案件的不同尺度的逾期特征以及所述筛选逾期用户的不同的历史授信申请案件的不同尺度的逾期特征进行不同区间的不同尺度的逾期特征相似度以及不同尺度的逾期特征的数量的偏差量的确定;
基于不同区间的不同尺度的逾期特征相似度、不同尺度的逾期特征的数量的偏差量以及所述偏差量与所述筛选逾期用户的不同尺度的逾期特征的数量进行不同区间的所述授信申请用户与筛选逾期用户的区间综合相似度的评估,并根据所述区间综合相似度进行所述授信申请用户与所述筛选逾期用户的相似区间以及不相似区间的确定;
通过所述授信申请用户与所述筛选逾期用户的相似区间与当前时刻的距离时长对所述筛选逾期用户的区间综合相似度进行修正得到修正区间相似度,并基于不同的相似区间的修正区间相似度以及数量进行所述授信申请用户与所述筛选逾期用户的相似区间的相似度评估量的确定;
获取所述授信申请用户与所述筛选逾期用户的不相似区间的数量以及区间相似度,并结合授信申请用户与所述筛选逾期用户的不同区间的修正区间相似度以及所述相似区间的相似度评估量确定所述授信申请用户与所述筛选逾期用户的相似度。
5.如权利要求1所述的一体化多尺度风控模型构建方法,其特征在于,所述不同尺度的逾期特征根据所述授信申请用户的不同的历史授信申请案件在不同的时间区间内的逾期天数和逾期金额进行确定。
6.如权利要求1所述的一体化多尺度风控模型构建方法,其特征在于,当筛选逾期用户与所述授信申请用户的相似度大于预设相似度限定值时,则确定所述筛选用户为相似逾期用户,其中所述预设相似度限定值根据所述筛选逾期用户的数量进行动态调整。
7.如权利要求1所述的一体化多尺度风控模型构建方法,其特征在于,所述授信申请用户的逾期相似度的确定的方法为:
获取所述授信申请用户的相似逾期用户,并判断所述相似逾期用户的数量是否大于预设用户数量,若是,则通过所述相似用户的数量进行所述授信申请用户的逾期相似度的确定,若否,则进入下一步骤;
通过所述授信申请用户的相似逾期用户进行所述相似逾期用户的相似度的确定,并根据所述相似逾期用户的数量以及相似度进行所述授信申请用户的相似度的数量和的确定,判断所述授信申请用户的相似度的数量和是否大于预设用户相似度阈值,若是,则通过所述授信申请用户的相似度的数量和进行所述授信申请用户的逾期相似度的确定,若否,则进入下一步骤;
通过所述授信申请用户的相似逾期用户的相似度进行所述相似逾期用户中的相似度在预设相似度区间的数量的确定,并结合所述相似逾期用户的数量以及不同的相似逾期用户的相似度的平均值进行所述授信申请用户的相似逾期用户的用户相似度评估量的确定,判断所述授信申请用户的相似逾期用户的用户相似度评估量是否满足要求,若是,则将所述相似逾期用户的用户相似度评估量作为所述授信申请用户的逾期相似度,若否,则进入下一步骤;
获取所述授信申请用户与不同的筛选逾期用户的相似度,并根据所述相似度进行关联逾期用户的数量以及不同的关联逾期用户的相似度的确定,并结合关联逾期用户在所述筛选逾期用户的数量占比以及所述相似逾期用户的用户相似度评估量进行所述授信申请用户的逾期相似度的确定。
8.如权利要求1所述的一体化多尺度风控模型构建方法,其特征在于,当所述授信申请用户的逾期相似度不大于用户相似度限定值时,则确定所述授信申请用户的逾期相似度满足要求,无须进行所述授信申请用户在不同尺度的逾期风险以及综合逾期风险的评估。
9.如权利要求1所述的一体化多尺度风控模型构建方法,其特征在于,基于不同尺度的逾期特征以及时间尺度进行不同的历史授信申请案件的权重的确定,具体包括:
通过不同的历史授信申请案件的不同尺度的逾期特征进行所述历史授信申请案件的逾期特征的数量以及不同的逾期特征的严重程度的确定,并基于所述历史授信申请案件的逾期特征的数量以及不同的逾期特征的严重程度进行所述历史授信申请案件的逾期严重程度值的确定;
根据所述历史授信申请案件的时间尺度进行所述历史授信申请案件所处的时间区间的确定,并基于所述时间区间进行修正量的确定,通过所述逾期严重程度值以及所述修正量进行所述历史授信申请案件的权重的确定。
10.一种一体化多尺度风控模型构建系统,采用权利要求1-9任一项所述的一种一体化多尺度风控模型构建方法,其特征在于,具体包括:
相似度评估模块,逾期评估模块,特征重构模块,风险确定模块;
其中所述相似度评估模块负责基于历史授信申请数据进行授信申请用户在不同的时间尺度的历史授信申请案件的提取,并基于不同的历史授信申请案件的不同尺度的逾期特征以及时间尺度进行所述授信申请用户与筛选逾期用户的相似度的评估;
所述逾期评估模块负责根据所述相似度进行所述筛选逾期用户中的相似逾期用户的确定,并结合与不同的所述筛选逾期用户的相似度进行所述授信申请用户的逾期相似度的确定;
所述特征重构模块负责基于不同尺度的逾期特征以及时间尺度进行不同的历史授信申请案件的权重的确定,并通过不同尺度的逾期特征所对应的历史授信申请案件的权重以及不同尺度的逾期特征与所述筛选逾期用户的相似度进行不同尺度的逾期特征的特征权值的确定;
所述风险确定模块负责通过所述特征权值对不同尺度的逾期特征进行修正得到不同尺度的修正逾期特征,并将所述不同尺度的修正逾期特征、逾期相似度为输入量,构建风控模型得到所述授信申请用户在不同尺度的逾期风险以及综合逾期风险。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311631940.6A CN117333290B (zh) | 2023-12-01 | 2023-12-01 | 一种一体化多尺度风控模型构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311631940.6A CN117333290B (zh) | 2023-12-01 | 2023-12-01 | 一种一体化多尺度风控模型构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117333290A true CN117333290A (zh) | 2024-01-02 |
CN117333290B CN117333290B (zh) | 2024-03-26 |
Family
ID=89277778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311631940.6A Active CN117333290B (zh) | 2023-12-01 | 2023-12-01 | 一种一体化多尺度风控模型构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117333290B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117808577A (zh) * | 2024-03-01 | 2024-04-02 | 杭银消费金融股份有限公司 | 一种基于多因子动态调节的授信处理方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014201515A1 (en) * | 2013-06-18 | 2014-12-24 | Deakin University | Medical data processing for risk prediction |
WO2019100581A1 (zh) * | 2017-11-24 | 2019-05-31 | 丰德金融平台有限公司 | 基于网络平台朋友圈授信实现风控的借贷撮合系统及方法 |
CN111127191A (zh) * | 2019-12-25 | 2020-05-08 | 北京百度网讯科技有限公司 | 风险评估方法及装置 |
CN112348663A (zh) * | 2020-10-21 | 2021-02-09 | 深圳乐信软件技术有限公司 | 一种信用风险评估方法、装置、计算机设备及存储介质 |
CN116630033A (zh) * | 2023-07-20 | 2023-08-22 | 杭银消费金融股份有限公司 | 信息审核方法、系统与存储介质 |
CN116823274A (zh) * | 2023-08-30 | 2023-09-29 | 杭银消费金融股份有限公司 | 一种应用于金融终端的欺诈风险评估方法及装置 |
CN117035985A (zh) * | 2023-07-31 | 2023-11-10 | 浙江孚临科技有限公司 | 一种授信逾期风险控制方法与系统 |
CN117078007A (zh) * | 2023-08-16 | 2023-11-17 | 杭银消费金融股份有限公司 | 一种融合尺度标签的多尺度风控系统及其方法 |
CN117132001A (zh) * | 2023-10-24 | 2023-11-28 | 杭银消费金融股份有限公司 | 一种多目标风控策略优化方法及系统 |
-
2023
- 2023-12-01 CN CN202311631940.6A patent/CN117333290B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014201515A1 (en) * | 2013-06-18 | 2014-12-24 | Deakin University | Medical data processing for risk prediction |
WO2019100581A1 (zh) * | 2017-11-24 | 2019-05-31 | 丰德金融平台有限公司 | 基于网络平台朋友圈授信实现风控的借贷撮合系统及方法 |
CN111127191A (zh) * | 2019-12-25 | 2020-05-08 | 北京百度网讯科技有限公司 | 风险评估方法及装置 |
CN112348663A (zh) * | 2020-10-21 | 2021-02-09 | 深圳乐信软件技术有限公司 | 一种信用风险评估方法、装置、计算机设备及存储介质 |
CN116630033A (zh) * | 2023-07-20 | 2023-08-22 | 杭银消费金融股份有限公司 | 信息审核方法、系统与存储介质 |
CN117035985A (zh) * | 2023-07-31 | 2023-11-10 | 浙江孚临科技有限公司 | 一种授信逾期风险控制方法与系统 |
CN117078007A (zh) * | 2023-08-16 | 2023-11-17 | 杭银消费金融股份有限公司 | 一种融合尺度标签的多尺度风控系统及其方法 |
CN116823274A (zh) * | 2023-08-30 | 2023-09-29 | 杭银消费金融股份有限公司 | 一种应用于金融终端的欺诈风险评估方法及装置 |
CN117132001A (zh) * | 2023-10-24 | 2023-11-28 | 杭银消费金融股份有限公司 | 一种多目标风控策略优化方法及系统 |
Non-Patent Citations (3)
Title |
---|
GUANGYOU ZHOU等: "《P2P Network Lending, Loss Given Default and Credit Risks》", SUSTAINABLITY * |
宁婷,苗德壮,董启文,陆雪松: "《逾期风险预测的宽度和深度学习》", 计算机科学 * |
李砚笛: "《商业银行零售类贷款业务风险管理系统设计与实现》", 中国优秀硕士学位论文全文数据库信息科技辑, 15 July 2023 (2023-07-15) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117808577A (zh) * | 2024-03-01 | 2024-04-02 | 杭银消费金融股份有限公司 | 一种基于多因子动态调节的授信处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117333290B (zh) | 2024-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7849062B1 (en) | Identifying and using critical fields in quality management | |
CN110738564A (zh) | 贷后风险评估方法及装置、存储介质 | |
CN117333290B (zh) | 一种一体化多尺度风控模型构建方法 | |
US7925638B2 (en) | Quality management in a data-processing environment | |
US9390121B2 (en) | Analyzing large data sets to find deviation patterns | |
CN113627566B (zh) | 一种网络诈骗的预警方法、装置和计算机设备 | |
CN117132001B (zh) | 一种多目标风控策略优化方法及系统 | |
CN112101520A (zh) | 风险评估模型训练方法、业务风险评估方法及其他设备 | |
CN116915710A (zh) | 流量预警方法、装置、设备及可读存储介质 | |
CN113139687A (zh) | 一种预测信用卡用户违约的方法及装置 | |
CN111061948A (zh) | 一种用户标签推荐方法、装置、计算机设备及存储介质 | |
KR20220115357A (ko) | 어텐션 메커니즘 기반의 미래 수요 예측 데이터 생성방법 및 장치 | |
CN117808578B (zh) | 一种智能化人行征信数据解析方法及系统 | |
CN111597343A (zh) | 一种基于app的智能化用户职业判断方法、装置和电子设备 | |
CN113268929B (zh) | 短期负荷区间预测方法及装置 | |
CN111783487B (zh) | 一种读卡器设备的故障预警方法及装置 | |
CN116823451B (zh) | 一种信贷风险控制方法与系统 | |
CN111612366A (zh) | 渠道质量评估方法、装置、电子设备及存储介质 | |
CN116912016A (zh) | 一种账单稽核方法和装置 | |
CN108197740A (zh) | 企业倒闭预测方法、电子设备和计算机存储介质 | |
CN114004414A (zh) | 一种耦合Copula与LSTM的工企用能负荷预测方法 | |
CN118151974B (zh) | 一种投顾服务系统升级处理方法与系统 | |
CN117408742B (zh) | 用户筛分方法及系统 | |
CN117217711B (zh) | 通信费单据自动审核方法及系统 | |
CN116664289A (zh) | 业务信息的预测方法和装置、存储介质及电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |