CN118037430A - 用户信贷违约的预测方法、装置、电子设备及存储介质 - Google Patents
用户信贷违约的预测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN118037430A CN118037430A CN202410278734.XA CN202410278734A CN118037430A CN 118037430 A CN118037430 A CN 118037430A CN 202410278734 A CN202410278734 A CN 202410278734A CN 118037430 A CN118037430 A CN 118037430A
- Authority
- CN
- China
- Prior art keywords
- credit
- user
- historical
- violation
- characteristic data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000012549 training Methods 0.000 claims abstract description 12
- 238000010276 construction Methods 0.000 claims description 18
- 230000006399 behavior Effects 0.000 claims description 15
- 238000009825 accumulation Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 10
- 238000012502 risk assessment Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请提供了一种用户信贷违约的预测方法、装置、电子设备及存储介质,可应用于金融领域或其他领域。其中,在本申请提供的一种用户信贷违约的预测方法,首先基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,信贷特征数据为各个信贷因子对应的数据。然后将信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到待预测用户的信贷违约率;其中,信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。由此可知,本申请利用预先确定的信贷因子,获取到用户的信贷特征数据,然后通过预先构建的信贷违约预测模型对信贷特征数据进行处理,能准确地预测出用户的信贷违约率,不依赖于人工的经验。
Description
技术领域
本申请涉及金融技术领域,尤其涉及一种用户信贷违约的预测方法、装置、电子设备及存储介质。
背景技术
在金融行业,信贷业务发展迅速,但同时也会伴随较高的信用风险。借款方对自身的财务状况、还款能力及还款意愿有着较为全面的掌握,而金融机构不能全面获知借款方的风险水平。
在现有技术中,进行信贷风险评估时,比较依赖工作人员的个人经验,容易使得金融机构在对用户贷款过程中的风险评估与实际情况有偏差,导致产生资金损失,直接影响金融机构的利润水平。
发明内容
有鉴于此,本申请提供了一种用户信贷违约的预测方法、装置、电子设备及存储介质,以准确地对用户信贷违约概率进行预测。
为实现上述目的,本申请提供如下技术方案:
本申请第一方面公开了一种用户信贷违约的预测方法,包括:
基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,所述信贷特征数据为各个所述信贷因子对应的数据;
将所述信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到所述待预测用户的信贷违约率;其中,所述信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。
可选的,上述的方法,所述信贷因子的确定过程,包括:
获取预设时间段内的初始信贷因子的数据;其中,所述初始信贷因子包括用户的基本属性、用户的公积金基数、用户的社保、用户的银行流水记录、用户的浏览行为、用户的银行卡账单记录、用户的借款时间、用户是否发生逾期行为的记录;
对所述各个初始信贷因子进行冗余因子剔除,得到最终的信贷因子。
可选的,上述的方法,所述对所述各个初始信贷因子进行冗余因子剔除,包括:
分别计算每两个所述初始信贷因子的协方差值;
若某两个所述初始信贷因子的协方差值大于预设阈值,则随机判定当前两个所述初始信贷因子中的一个为冗余因子,并剔除所述冗余因子。
可选的,上述的方法,所述信贷违约预测模型的构建过程,包括:
获取历史用户的历史信贷特征数据和历史信贷违约率;
将所述历史信贷特征数据输入到初始模型中进行运算,得到所述历史信贷特征数据的信贷违约率;
判断所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率是否一致;
若所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成所述信贷违约预测模型的构建;
若所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率不一致,则求出误差函数,并利用所述误差函数调整所述初始模型的参数,直至输出的所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成所述信贷违约预测模型的构建。
可选的,上述的方法,所述获取历史用户的历史信贷特征数据和历史信贷违约率之后,还包括:
对所述历史信贷特征数据和所述历史信贷违约率进行数据预处理。
本申请第二方面公开了一种用户信贷违约的预测装置,包括:
获取单元,用于基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,所述信贷特征数据为各个所述信贷因子对应的数据;
预测单元,用于将所述信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到所述待预测用户的信贷违约率;其中,所述信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。
可选的,上述的装置,所述获取单元,包括:
第一获取子单元,用于获取预设时间段内的初始信贷因子的数据;其中,所述初始信贷因子包括用户的基本属性、用户的公积金基数、用户的社保、用户的银行流水记录、用户的浏览行为、用户的银行卡账单记录、用户的借款时间、用户是否发生逾期行为的记录;
第一剔除子单元,用于对所述各个初始信贷因子进行冗余因子剔除,得到最终的信贷因子。
可选的,上述的装置,所述第一剔除子单元,包括:
第一计算子单元,用于分别计算每两个所述初始信贷因子的协方差值;
第二剔除子单元,用于若某两个所述初始信贷因子的协方差值大于预设阈值,则随机判定当前两个所述初始信贷因子中的一个为冗余因子,并剔除所述冗余因子。
可选的,上述的装置,所述预测单元,包括:
第二获取子单元,用于获取历史用户的历史信贷特征数据和历史信贷违约率;
第二运算子单元,用于将所述历史信贷特征数据输入到初始模型中进行运算,得到所述历史信贷特征数据的信贷违约率;
判断子单元,用于判断所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率是否一致;
构建子单元,用于若所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成所述信贷违约预测模型的构建;
调参子单元,用于若所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率不一致,则求出误差函数,并利用所述误差函数调整所述初始模型的参数,直至输出的所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成所述信贷违约预测模型的构建。
可选的,上述的装置,还包括:
数据预处理单元,用于对所述历史信贷特征数据和所述历史信贷违约率进行数据预处理。
本申请第三方面公开了一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如本发明第一方面中任意一项所述的方法。
本申请第四方面公开了一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如本发明第一方面中任意一项所述的方法。
从上述技术方案可以看出,本申请提供的一种用户信贷违约的预测方法,首先基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,信贷特征数据为各个信贷因子对应的数据。然后将信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到待预测用户的信贷违约率;其中,信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。由此可知,本申请利用预先确定的信贷因子,获取到用户的信贷特征数据,然后通过预先构建的信贷违约预测模型对信贷特征数据进行处理,准确地预测出用户的信贷违约率,不依赖于人工的经验。解决了现有技术中进行信贷风险评估时,比较依赖工作人员的个人经验,容易使得金融机构在对用户贷款过程中的风险评估与实际情况有偏差,导致产生资金损失,直接影响金融机构的利润水平的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请另一实施例公开的一种用户信贷违约的预测方法的流程图;
图2为本申请另一实施例公开的步骤S101中信贷因子的确定过程的一种实施方式的流程图;
图3为本申请另一实施例公开的步骤S102中信贷违约预测模型的构建过程的一种实施方式的流程图;
图4为本申请另一实施例公开的一种用户信贷违约的预测装置的示意图;
图5为本申请另一实施例公开的一种电子设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
并且,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
由背景技术可知,在现有技术中,进行信贷风险评估时,比较依赖工作人员的个人经验,容易使得金融机构在对用户贷款过程中的风险评估与实际情况有偏差,导致产生资金损失,直接影响金融机构的利润水平。
鉴于此,本申请提供了一种用户信贷违约的预测方法、装置、电子设备及存储介质,以准确地对用户信贷违约概率进行预测。
需要说明的是,本发明提供的用户信贷违约的预测方法、装置、电子设备及存储介质可用于金融领域或其他领域。上述仅为示例,并不对本发明提供的用户信贷违约的预测方法、装置、电子设备及存储介质的应用领域进行限定。
本申请实施例提供了一种用户信贷违约的预测方法,如图1所示,具体包括:
S101、基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,信贷特征数据为各个信贷因子对应的数据。
需要说明的是,基于预先确定的信贷因子,获取待预测用户的信贷特征数据,其中,信贷特征数据为各个信贷因子对应的数据,信贷因子为影响用户信贷违约率的因素,例如用户的基本属性、用户的公积金基数、用户的银行流水记录、用户的银行卡账单记录、用户是否发生逾期行为的记录等。通过获取用户的各个信贷因子对应的数据,即可得到用户的信贷特征数据。
可选的,在本申请的另一实施例中,步骤S101中信贷因子的确定过程的一种实施方式,如图2所示,可以包括:
S201、获取预设时间段内的初始信贷因子的数据;其中,初始信贷因子包括用户的基本属性、用户的公积金基数、用户的社保、用户的银行流水记录、用户的浏览行为、用户的银行卡账单记录、用户的借款时间、用户是否发生逾期行为的记录。
需要说明的是,获取预设时间段内银行数据库中的初始信贷因子的数据和信贷违约率数据,例如前一年银行数据库中的初始信贷因子的数据和信贷违约率数据。其中,初始信贷因子包括用户的基本属性、用户的公积金基数、用户的社保、用户的银行流水记录、用户的浏览行为、用户的银行卡账单记录、用户的借款时间和用户是否发生逾期行为的记录。
S202、对各个初始信贷因子进行冗余因子剔除,得到最终的信贷因子。
需要说明的是,对各个初始信贷因子进行冗余因子筛查,若筛查出冗余因子,则从初始信贷因子中剔除冗余因子。例如用户的公积金基数和用户的社保都是体现用户的收入情况,则随机判定这两个因子其中一个为冗余因子,并进行剔除。剔除冗余因子后可以得到更精简、更准确的信贷因子,提升模型预测的准确性。
可选的,在本申请的另一实施例中,步骤S202中对各个初始信贷因子进行冗余因子剔除的一种实施方式,可以包括:
分别计算每两个初始信贷因子的协方差值;
若某两个初始信贷因子的协方差值大于预设阈值,则随机判定当前两个初始信贷因子中的一个为冗余因子,并剔除冗余因子。
需要说明的是,对于每两个初始信贷因子,分别计算每两个初始信贷因子之间的协方差值,协方差可以衡量两个变量的相关性,能够准确的查找出冗余因子。如果某两个初始信贷因子的协方差值大于预设阈值,则随机判定当前两个初始信贷因子中的一个为冗余因子,并剔除判定为冗余因子的初始信贷因子。其中,预设阈值可根据实际情况进行设定,比如0.8。协方差的计算公式如下:
COV(X,Y)=E(XY)-E(X)E(Y)
其中,X和Y为初始信贷因子,E(X)为X的数学期望,E(Y)为Y的数学期望,E(XY)是XY的数学期望。
S102、将信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到待预测用户的信贷违约率;其中,信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。
需要说明的是,获取到用户的信贷特征数据之后,将信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到待预测用户的信贷违约率,银行可以根据信贷违约率对用户进行贷款评估,信贷违约率越高则表示给该用户办理贷款的风险越大。其中,信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型,利用该模型能准确地预测出用户的信贷违约率,不依赖于人工的经验。该模型为利用随机森林构建的模型,随机森林指的是利用多颗树对样本进行训练并预测得一种分类器。在机器学习中,随机森林是一个包含多个决策树得分类器,并且其输出的类别是由个别数输出的类别的众数而定。
本申请实施例提供的一种用户信贷违约的预测方法,首先基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,信贷特征数据为各个信贷因子对应的数据。然后将信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到待预测用户的信贷违约率;其中,信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。由此可知,本申请利用预先确定的信贷因子,获取到用户的信贷特征数据,然后通过预先构建的信贷违约预测模型对信贷特征数据进行处理,准确地预测出用户的信贷违约率,不依赖于人工的经验。解决了现有技术中进行信贷风险评估时,比较依赖工作人员的个人经验,容易使得金融机构在对用户贷款过程中的风险评估与实际情况有偏差,导致产生资金损失,直接影响金融机构的利润水平的问题。
可选的,在本申请的另一实施例中,步骤S102中信贷违约预测模型的构建过程的一种实施方式,如图3所示,具体包括:
S301、获取历史用户的历史信贷特征数据和历史信贷违约率。
需要说明的是,获取历史用户的历史信贷特征数据和历史信贷违约率,作为样本数据,对初始模型进行训练。
S302、将历史信贷特征数据输入到初始模型中进行运算,得到历史信贷特征数据的信贷违约率。
S303、判断历史信贷特征数据的信贷违约率与实际的历史信贷违约率是否一致。
需要说明的是,在初始运算模型中运算得到历史信贷特征数据的信贷违约率之后,将运算得到历史信贷特征数据的信贷违约率与实际的历史信贷违约率进行对比,从而判断初始运算模型中运算得到的历史信贷特征数据的信贷违约率是否准确。
S304、若历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成信贷违约预测模型的构建。
S305、若历史信贷特征数据的信贷违约率与实际的历史信贷违约率不一致,则求出误差函数,并利用误差函数调整初始模型的参数,直至输出的历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成信贷违约预测模型的构建。
需要说明的是,如果历史信贷特征数据的信贷违约率与实际的历史信贷违约率不一致,则求出误差函数,利用误差函数调整初始模型的参数,并重新进行新一轮的运算,直至输出的历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成信贷违约预测模型的构建。利用该模型能准确地预测出用户的信贷违约率。
可选的,在本申请的另一实施例中,执行步骤S301之后,还可以包括:
对历史信贷特征数据和历史信贷违约率进行数据预处理。
需要说明的是,获取历史信贷特征数据和历史信贷违约率之后,然后将这些数据进行预处理,包括缺失值处理、离群值处理、以及为了能够更好将这些数据放入模型中进行运算,进行数据标准化处理,将这些数据按照同一标准进行转换,提升模型在数据运算时的收敛速度和效果。
本申请另一实施例还公开了一种用户信贷违约的预测装置,如图4所示,具体包括:
获取单元401,用于基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,信贷特征数据为各个信贷因子对应的数据。
预测单元402,用于将信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到待预测用户的信贷违约率;其中,信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。
本实施例中,获取单元401和预测单元402的具体执行过程,可参见对应图1的方法实施例内容,此处不再赘述。
本申请实施例提供的一种用户信贷违约的预测装置,首先获取单元401基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,信贷特征数据为各个信贷因子对应的数据。然后预测单元402将信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到待预测用户的信贷违约率;其中,信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。由此可知,本申请利用预先确定的信贷因子,获取到用户的信贷特征数据,然后通过预先构建的信贷违约预测模型对信贷特征数据进行处理,准确地预测出用户的信贷违约率,不依赖于人工的经验。解决了现有技术中进行信贷风险评估时,比较依赖工作人员的个人经验,容易使得金融机构在对用户贷款过程中的风险评估与实际情况有偏差,导致产生资金损失,直接影响金融机构的利润水平的问题。
可选的,在本申请的另一实施例中,获取单元401的一种实施方式,具体包括:
第一获取子单元,用于获取预设时间段内的初始信贷因子的数据;其中,初始信贷因子包括用户的基本属性、用户的公积金基数、用户的社保、用户的银行流水记录、用户的浏览行为、用户的银行卡账单记录、用户的借款时间、用户是否发生逾期行为的记录。
第一剔除子单元,用于对各个初始信贷因子进行冗余因子剔除,得到最终的信贷因子。
本实施例中,第一获取子单元、第一剔除子单元的具体执行过程,可参见对应图2的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,第一剔除子单元的一种实施方式,具体包括:
第一计算子单元,用于分别计算每两个初始信贷因子的协方差值。
第二剔除子单元,用于若某两个初始信贷因子的协方差值大于预设阈值,则判定当前两个初始信贷因子为冗余因子,并随机剔除当前两个初始信贷因子中的一个初始信贷因子。
本实施例中,第一计算子单元、第二剔除子单元的具体执行过程,可参见对应上述方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,预测单元402的一种实施方式,具体包括:
第二获取子单元,用于获取历史用户的历史信贷特征数据和历史信贷违约率。
第二运算子单元,用于将历史信贷特征数据输入到初始模型中进行运算,得到历史信贷特征数据的信贷违约率。
判断子单元,用于判断历史信贷特征数据的信贷违约率与实际的历史信贷违约率是否一致。
构建子单元,用于若历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成信贷违约预测模型的构建。
调参子单元,用于若历史信贷特征数据的信贷违约率与实际的历史信贷违约率不一致,则求出误差函数,并利用误差函数调整初始模型的参数,直至输出的历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成信贷违约预测模型的构建。
本实施例中,第二获取子单元、第二运算子单元、判断子单元、构建子单元和调参子单元的具体执行过程,可参见对应图3的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,上述用户信贷违约的预测装置,还可以包括:
数据预处理单元,用于对历史信贷特征数据和历史信贷违约率进行数据预处理。
本实施例中,数据预处理单元的具体执行过程,可参见对应上述方法实施例内容,此处不再赘述。
本申请另一实施例还提供了一种电子设备,如图5所示,具体包括:
一个或多个处理器501。
存储装置502,其上存储有一个或多个程序。
当一个或多个程序被一个或多个处理器501执行时,使得一个或多个处理器501实现如上述实施例中任意一项方法。
本申请另一实施例还提供了计算机存储介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现如上述实施例中任意一项方法。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种用户信贷违约的预测方法,其特征在于,包括:
基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,所述信贷特征数据为各个所述信贷因子对应的数据;
将所述信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到所述待预测用户的信贷违约率;其中,所述信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。
2.根据权利要求1所述的方法,其特征在于,所述信贷因子的确定过程,包括:
获取预设时间段内的初始信贷因子的数据;其中,所述初始信贷因子包括用户的基本属性、用户的公积金基数、用户的社保、用户的银行流水记录、用户的浏览行为、用户的银行卡账单记录、用户的借款时间、用户是否发生逾期行为的记录;
对所述各个初始信贷因子进行冗余因子剔除,得到最终的信贷因子。
3.根据权利要求2所述的方法,其特征在于,所述对所述各个初始信贷因子进行冗余因子剔除,包括:
分别计算每两个所述初始信贷因子的协方差值;
若某两个所述初始信贷因子的协方差值大于预设阈值,则随机判定当前两个所述初始信贷因子中的一个为冗余因子,并剔除所述冗余因子。
4.根据权利要求1所述的方法,其特征在于,所述信贷违约预测模型的构建过程,包括:
获取历史用户的历史信贷特征数据和历史信贷违约率;
将所述历史信贷特征数据输入到初始模型中进行运算,得到所述历史信贷特征数据的信贷违约率;
判断所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率是否一致;
若所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成所述信贷违约预测模型的构建;
若所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率不一致,则求出误差函数,并利用所述误差函数调整所述初始模型的参数,直至输出的所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成所述信贷违约预测模型的构建。
5.根据权利要求4所述的方法,其特征在于,所述获取历史用户的历史信贷特征数据和历史信贷违约率之后,还包括:
对所述历史信贷特征数据和所述历史信贷违约率进行数据预处理。
6.一种用户信贷违约的预测装置,其特征在于,包括:
获取单元,用于基于预先确定的信贷因子,获取待预测用户的信贷特征数据;其中,所述信贷特征数据为各个所述信贷因子对应的数据;
预测单元,用于将所述信贷特征数据输入到预先构建的信贷违约预测模型中进行运算,得到所述待预测用户的信贷违约率;其中,所述信贷违约预测模型为利用历史信贷特征数据和历史信贷违约率进行训练后得到的模型。
7.根据权利要求6所述的装置,其特征在于,所述获取单元,包括:
第一获取子单元,用于获取预设时间段内的初始信贷因子的数据;其中,所述初始信贷因子包括用户的基本属性、用户的公积金基数、用户的社保、用户的银行流水记录、用户的浏览行为、用户的银行卡账单记录、用户的借款时间、用户是否发生逾期行为的记录;
第一剔除子单元,用于对所述各个初始信贷因子进行冗余因子剔除,得到最终的信贷因子。
8.根据权利要求6所述的装置,其特征在于,所述预测单元,包括:
第二获取子单元,用于获取历史用户的历史信贷特征数据和历史信贷违约率;
第二运算子单元,用于将所述历史信贷特征数据输入到初始模型中进行运算,得到所述历史信贷特征数据的信贷违约率;
判断子单元,用于判断所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率是否一致;
构建子单元,用于若所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成所述信贷违约预测模型的构建;
调参子单元,用于若所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率不一致,则求出误差函数,并利用所述误差函数调整所述初始模型的参数,直至输出的所述历史信贷特征数据的信贷违约率与实际的历史信贷违约率一致,则完成所述信贷违约预测模型的构建。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任意一项所述的方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至5中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410278734.XA CN118037430A (zh) | 2024-03-12 | 2024-03-12 | 用户信贷违约的预测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410278734.XA CN118037430A (zh) | 2024-03-12 | 2024-03-12 | 用户信贷违约的预测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118037430A true CN118037430A (zh) | 2024-05-14 |
Family
ID=91003965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410278734.XA Pending CN118037430A (zh) | 2024-03-12 | 2024-03-12 | 用户信贷违约的预测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118037430A (zh) |
-
2024
- 2024-03-12 CN CN202410278734.XA patent/CN118037430A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110689438A (zh) | 企业类金融风险评分方法、装置、计算机设备及存储介质 | |
US20070124236A1 (en) | Credit risk profiling method and system | |
CN111008896A (zh) | 金融风险预警方法、装置、电子设备及存储介质 | |
CN110335144B (zh) | 个人电子银行账户安全检测方法及装置 | |
CN111275338A (zh) | 一种企业欺诈行为的判定方法、装置、设备及存储介质 | |
CN112232950A (zh) | 针对借贷风险的评估方法及装置、设备、计算机可读存储介质 | |
CN110020939B (zh) | 建立违约损失率预测模型的装置、方法及存储介质 | |
CN112990989B (zh) | 价值预测模型输入数据生成方法、装置、设备和介质 | |
CN117132383A (zh) | 一种信贷数据处理方法、装置、设备及可读存储介质 | |
CN111738824A (zh) | 一种账务数据处理方式筛选方法、装置及系统 | |
CN112330355A (zh) | 消费券交易数据处理方法、装置、设备及存储介质 | |
CN116630020A (zh) | 风险评估方法、装置、存储介质及电子设备 | |
CN116757820A (zh) | 企业风险的确定方法、装置、存储介质及电子设备 | |
CN110766547A (zh) | 一种可信度等级的确定方法、装置、设备和存储介质 | |
CN114707420A (zh) | 一种信贷欺诈行为识别方法、装置、设备及存储介质 | |
CN118037430A (zh) | 用户信贷违约的预测方法、装置、电子设备及存储介质 | |
CN117455681A (zh) | 业务风险预测方法和装置 | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
CN113781056A (zh) | 预测用户欺诈行为的方法及装置 | |
CN113177840A (zh) | 一种客户风险的识别方法及装置 | |
CN112116358A (zh) | 一种交易欺诈行为的预测方法、装置及电子设备 | |
CN113393328A (zh) | 融资贷前审批评估方法、装置及计算机存储介质 | |
CN112163943A (zh) | 违约概率的确定方法、装置、设备和介质 | |
CN113011971B (zh) | 风险测度方法、装置、系统与计算机存储介质 | |
Shen et al. | Modelling the predictive performance of credit scoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |