CN112053225A - 贷款逾期的预测方法、装置、电子设备和存储介质 - Google Patents
贷款逾期的预测方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112053225A CN112053225A CN202010908892.0A CN202010908892A CN112053225A CN 112053225 A CN112053225 A CN 112053225A CN 202010908892 A CN202010908892 A CN 202010908892A CN 112053225 A CN112053225 A CN 112053225A
- Authority
- CN
- China
- Prior art keywords
- loan
- parameter
- user
- parameter vector
- overdue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 90
- 239000013598 vector Substances 0.000 claims description 98
- 238000012545 processing Methods 0.000 claims description 16
- 230000002068 genetic effect Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012512 characterization method Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 10
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请提供了一种贷款逾期的预测方法、装置、电子设备和存储介质,其中,在贷款逾期的预测方法中,首先获取用户的贷款特征数据。其中,贷款特征数据包括贷款信息、身份信息、交易信息和资产信息。然后将贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值。其中,LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型。再将得到的预测结果值与预设的阈值进行对比,如果预测结果值小于阈值,则生成用户的贷款不会逾期的提示信息,如果预测结果值大于阈值,则生成用户的贷款会逾期的提示信息。
Description
技术领域
本申请涉及数据分析技术领域,尤其涉及一种贷款逾期的预测方法、装置、电子设备和存储介质。
背景技术
随着社会的发展,我们国家信贷市场规模急剧扩大,银行的发展前景呈现出新的气象。而贷款业务对于银行来说是一项非常重要的业务,因此银行为了把控风险会对办理贷款业务的用户进行多方面的评估,在贷款后就需要对用户贷款是否会逾期的进行预测。
在现有技术中,缺乏一种稳定可靠的贷款逾期预测方法,对用户贷款逾期的预测通常由工作人员去对用户进行分析和预测。但是,现在的用户数据过于庞大,增加了对贷款用户进行逾期预测的难度,导致不能快速和准确地预测出贷款用户是否会逾期的相关结果。
发明内容
有鉴于此,本申请提供一种贷款逾期的预测方法、装置、电子设备和存储介质,以解决在现有技术中不能快速和准确地预测出贷款用户是否会逾期的问题。
为实现上述目的,本申请提供如下技术方案:
本申请第一方面公开了一种贷款逾期的预测方法,包括:
获取用户的贷款特征数据;其中,所述贷款特征数据包括贷款信息、身份信息、交易信息和资产信息;
将所述贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值;其中,所述LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型;
将所述预测结果值与预设的阈值进行对比;
若所述预测结果值小于所述阈值,则生成所述用户的贷款不会逾期的提示信息;
若所述预测结果值大于所述阈值,则生成所述用户的贷款会逾期的提示信息。
可选的,上述的方法,所述获取用户的贷款特征数据,包括:
采集所述用户的贷款特征数据;
对所述贷款特征数据进行数据预处理。
可选的,上述的方法,所述利用预设的调参算法进行参数调整,得到所述LigthGBM算法模型的方式,包括:
通过网格搜索来确定所述LigthGBM算法模型的参数集合;
将所述参数集合分成第一参数集合和第二参数集合;其中,所述第一参数集合为手动调整的参数集合,所述第二参数集合为自动调整的参数集合;
利用二分法对所述第一参数集合进行参数调整,得到第一目标参数向量集合;
利用遗传算法对所述第二参数集合进行参数调整,得到第二目标参数向量集合;
将所述第一目标参数向量集合与所述第二目标参数向量集合相结合,得到最终参数向量集合;
利用所述最终参数向量集合对所述LigthGBM算法模型的参数进行配置,得到所述LigthGBM算法模型。
可选的,上述的方法,所述利用遗传算法对所述第二参数集合进行调整,得到第二目标参数向量集合,包括:
对所述第二参数集合进行初始化赋值,得到多个参数向量集合;
将得到的多个参数向量集合按照预设组数进行划分;
从划分后的每一组参数向量集合中都挑选出一个最优的参数向量集合,组成新的一组参数向量集合;
将所述新的一组参数向量集合进行交叉与变异处理,得到第二目标参数向量集合。
可选的,上述的方法,所述若所述预测结果值大于所述阈值,则生成所述用户的贷款会逾期的提示信息之后,还包括:
对所述用户进行标记。
本申请第二方面公开了一种贷款逾期的预测装置,包括:
获取单元,用于获取用户的贷款特征数据;其中,所述贷款特征数据包括贷款信息、身份信息、交易信息和资产信息;
预测单元,用于将所述贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值;其中,所述LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型;
对比单元,用于将所述预测结果值与预设的阈值进行对比;
第一信息生成单元,用于若所述预测结果值小于所述阈值,则生成所述用户的贷款不会逾期的提示信息;
第二信息生成单元,用于若所述预测结果值大于所述阈值,则生成所述用户的贷款会逾期的提示信息。
可选的,上述的装置,所述获取单元,包括:
采集子单元,用于采集所述用户的贷款特征数据;
数据处理子单元,用于对所述贷款特征数据进行数据预处理。
可选的,上述的装置,所述预测单元,包括:
确定子单元,用于通过网格搜索来确定所述LigthGBM算法模型的参数集合;
第一划分子单元,用于将所述参数集合分成第一参数集合和第二参数集合;其中,所述第一参数集合为手动调整的参数集合,所述第二参数集合为自动调整的参数集合;
第一调整子单元,用于利用二分法对所述第一参数集合进行参数调整,得到第一目标参数向量集合;
第二调整子单元,用于利用遗传算法对所述第二参数集合进行参数调整,得到第二目标参数向量集合;
数据结合子单元,用于将所述第一目标参数向量集合与所述第二目标参数向量集合相结合,得到最终参数向量集合;
配置子单元,用于利用所述最终参数向量集合对所述LigthGBM算法模型的参数进行配置,得到所述LigthGBM算法模型。
可选的,上述的装置,所述第二调整子单元,包括:
初始化子单元,用于对所述第二参数集合进行初始化赋值,得到多个参数向量集合;
第二划分子单元,用于将得到的多个参数向量集合按照预设组数进行划分;
挑选子单元,用于从划分后的每一组参数向量集合中都挑选出一个最优的参数向量集合,组成新的一组参数向量集合;
处理子单元,用于将所述新的一组参数向量集合进行交叉与变异处理,得到第二目标参数向量集合。
可选的,上述的装置,还包括:
标记子单元,用于对所述用户进行标记。
本申请第三方面公开了一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如本发明第一方面中任意一项所述的方法。
本申请第四方面公开了一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如本发明第一方面中任意一项所述的方法。
从上述技术方案可以看出,本申请提供的贷款逾期的预测方法,首先获取用户的贷款特征数据。其中,贷款特征数据包括贷款信息、身份信息、交易信息和资产信息。然后将贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值。其中,LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型。再将得到的预测结果值与预设的阈值进行对比,如果预测结果值小于阈值,则生成用户的贷款不会逾期的提示信息,如果预测结果值大于阈值,则生成用户的贷款会逾期的提示信息。由此可知,利用用户的贷款特征数据和本申请预先构建LigthGBM算法模型就可以快速和准确得到用户的贷款是否会逾期的预测结果,解决了在现有技术中不能快速和准确地预测出贷款用户是否会逾期的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的贷款逾期的预测方法的流程图;
图2为本申请另一实施例公开的步骤S102中利用预设的调参算法进行参数调整,得到LigthGBM算法模型的方式的一种实施方式的流程图;
图3为本申请另一实施例公开的步骤S204的一种实施方式的流程图;
图4为本申请另一实施例公开的一种贷款逾期的预测装置示意图;
图5为本申请另一实施例公开的一种电子设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
并且,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
由背景技术可知,在现有技术中,缺乏一种稳定可靠的贷款逾期预测方法,对用户贷款逾期的预测通常由工作人员去对用户进行分析和预测。但是,现在的用户数据过于庞大,增加了对贷款用户进行逾期预测的难度,导致不能快速和准确地预测出贷款用户是否会逾期的相关结果。
鉴于此,本申请提供一种贷款逾期的预测方法、装置、电子设备和存储介质,以解决在现有技术中不能快速和准确地预测出贷款用户是否会逾期的问题。
本申请实施例公开了一种贷款逾期的预测方法,如图1所示,具体包括:
S101、获取用户的贷款特征数据;其中,贷款特征数据包括贷款信息、身份信息、交易信息和资产信息。
需要说明的是,为了对用户的贷款逾期情况进行预测,那么就需要获取用户的贷款特征数据。其中贷款特征数据具体包括贷款信息、身份信息、交易信息和资产信息。例如,用户的贷款信息包括用户贷款了多少金额、贷款时长为多久,下一次还款时间等信息。用户的身份信息包括用户的姓名、电话、住址等信息。用户交易信息包括用户在银行办理了哪些业务,买了哪些哪些产品,办理的借记卡和信用卡等信息。用户的资产信息包括用户名下的资产、投资了哪些项目等信息。
可选的,在本申请的另一实施例中,步骤S101的一种实施方式,包括:
采集用户的贷款特征数据。
对贷款特征数据进行数据预处理。
需要说明的是,利用查找函数采集到用户的贷款特征数据,然后将这些数据进行预处理,为了能够更好将这些数据放入本申请构建的LigthGBM算法模型中进行运算,可以将这些数据按照同一标准进行转换,提升LigthGBM算法模型中数据运算的速度和效果。
S102、将贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值;其中,LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型。
需要说明的是,在获取到用户的贷款信息、身份信息、交易信息和资产信息等贷款特征数据之后,就将贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,然后就会输出一个预测结果值,该结果值通常设置为一个数值。其中,LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型。
还需要说明的是,LigthGBM算法模型是微软2017年新提出的,比之前的算法更强大、速度更快的一种算法模型。LigthGBM算法模型在性能上有很大的提升,与传统算法相比,它具有更快的训练效率、低内存使用、更高的准确率以及支持并行化学习等优点。但是,LigthGBM算法模型对于参数的要求比较高,很难调整到合适参数,从而导致模型的性能指标无法达到最优。因此在构建LigthGBM算法模型时,利用本申请提供的调参算法对其进行参数调整,从而让该模型整体的性能指标达到最优,提升该模型对用户贷款逾期预测的准确性。
可选的,在本申请的另一实施例中,步骤S102中利用预设的调参算法进行参数调整,得到LigthGBM算法模型的方式的一种实施方式,如图2所示,具体包括:
S201、通过网格搜索来确定LigthGBM算法模型的参数集合。
需要说明的是,在构建LigthGBM算法模型时,首先需要确定该模型中的参数。在本实施例中,以行业中常用的参数为基础,通过网格搜索的方式来确定该模型中需要用到的参数,得到一个参数的集合。
S202、将参数集合分成第一参数集合和第二参数集合;其中,第一参数集合为手动调整的参数集合,第二参数集合为自动调整的参数集合。
需要说明的是,将得到的参数集合分成两个参数集合,一个为手动调参的集合,集第一参数集合,另一个为自动调参的集合,即第二参数集合。其中,两个参数集合分别对应两种调参方式。在本实施例中,第一参数集合可以包括learning_rate、num_leaves、max_depth等参数,第二参数集合可以包括min_data、min_sum_hessian、feature_fraction等参数。
S203、利用二分法对第一参数集合进行参数调整,得到第一目标参数向量集合。
需要说明的是,针对需要手动调整参数的第一参数集合,则利用二分法对第一参数集合进行参数调整,得到第一目标参数集合,即最优第一参数集合。例如第一次给参数集合中的参数赋值100,第二次再赋值1000,第三次赋值100到1000之间的一个中间值,然后再从100到中间值之间以及中间值到1000之间选择一个数值进行赋值,以此类推,最后得到一个赋值效果最好的目标参数向量集合。
S204、利用遗传算法对第二参数集合进行参数调整,得到第二目标参数向量集合。
需要说明的是,针对需要自动调整参数的第二参数集合,则利用遗传算法对第二参数集合进行参数调整,得到第二目标参数集合,即最优第二参数集合。其中,遗传算法是根据大自然中生物体进化规律而设计提出的。是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。因此,利用遗传算法可以得到一个最优参数向量集合。
S205、将第一目标参数向量集合与第二目标参数向量集合相结合,得到最终参数向量集合;
需要说明的是,在得到最优第一参数向量集合与最优第二参数向量之后,将两个参数向量集合合并成一个参数向量集合,该参数向量集合中包括了该LigthGBM算法模型的全部参数,该参数向量集合就是该模型的最终参数向量集合,即模型最优参数向量集合。
S206、利用最终参数向量集合对LigthGBM算法模型的参数进行配置,得到LigthGBM算法模型。
需要说明的是,按照最终参数向量集合中各个参数的值,对LigthGBM算法模型中对应的参数进行配置,从而完成LigthGBM算法模型的构建,并可以将其应用于用户贷款逾期的预测。
可选的,在本申请的另一实施例中,步骤S204的一种实施方式,参见图3,可以包括:
S301、对第二参数集合进行初始化赋值,得到多个参数向量集合。
需要说明的是,对第二参数集合中的每一个参数进行初始化赋值,得到多个参数向量集合。其中,赋值的次数以及具体数值可以根据情况进行设定,比如赋值两次,得到两个参数向量集合为{100,200,300}和{200,300,100}。
S302、将得到的多个参数向量集合按照预设组数进行划分。
需要说明的是,将赋值完成后得到多个参数向量集合按照预设组数随机进行分组,比如分成五组。
S303、从划分后的每一组参数向量集合中都挑选出一个最优的参数向量集合,组成新的一组参数向量集合。
需要说明的是,在将多个参数向量集合进行分组后,针对每一个分组,分别求出分组中每一个参数向量集合的适应度函数值,然后将每一组中适应度函数值最好的一个参数向量集合挑选出来,即最优的参数向量集合。最后将所有挑选出来的参数向量集合组成新的一组参数向量集合。
S304、将新的一组参数向量集合进行交叉与变异处理,得到第二目标参数向量集合。
需要说明的是,在将所有挑选出来的参数向量集合组成新的一组参数向量集合之后,将新的一组参数向量集合进行随机的交叉和变异,反复迭代多次后,最终得到第二目标参数向量集合。
S103、将预测结果值与预设的阈值进行对比。
需要说明的是,在LigthGBM算法模型输出预测结果值之后,则将预测结果值与预设的阈值进行对比,该阈值为表示用户贷款逾期的临界值,可以根据实际情况设定,比如0.5。
S104、若预测结果值小于阈值,则生成用户的贷款不会逾期的提示信息。
需要说明的是,如果预测结果值小于预先设置的阈值,说明该用户的预测结果是贷款不会逾期,因此生成该用户的贷款不会逾期的提示信息,提供给工作人员查看。
S105、若预测结果值大于阈值,则生成用户的贷款会逾期的提示信息。
需要说明的是,如果预测结果值大于预先设置的阈值,说明该用户的预测结果是贷款会逾期,因此生成该用户的贷款会逾期的提示信息,提供给工作人员查看。
本申请实施例提供的贷款逾期的预测方法中,首先获取用户的贷款特征数据。其中,贷款特征数据包括贷款信息、身份信息、交易信息和资产信息。然后将贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值。其中,LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型。再将得到的预测结果值与预设的阈值进行对比,如果预测结果值小于阈值,则生成用户的贷款不会逾期的提示信息,如果预测结果值大于阈值,则生成用户的贷款会逾期的提示信息。由此可知,利用用户的贷款特征数据和本申请预先构建LigthGBM算法模型就可以快速和准确得到用户的贷款是否会逾期的预测结果,解决了在现有技术中不能快速和准确地预测出贷款用户是否会逾期的问题。
可选的,在本申请的另一实施例中,上述贷款逾期的预测方法,步骤S105之后,还可以包括:
对用户进行标记。
需要说明的是,如果用户的预测结果是会逾期,那么除了生成该用户的贷款会逾期的提示信息,还需要对该用户进行标记,说明该用户属于贷款逾期风险用户,银行需要对该用户多一些关注并与用户进行进一步沟通,以应对该用户的贷款会逾期的情况。
本申请另一实施例还提供了一种贷款逾期的预测装置,如图4所示,具体包括:
获取单元401,用于获取用户的贷款特征数据;其中,贷款特征数据包括贷款信息、身份信息、交易信息和资产信息。
预测单元402,用于将贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值;其中,LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型。
对比单元403,用于将预测结果值与预设的阈值进行对比。
第一信息生成单元404,用于若预测结果值小于阈值,则生成用户的贷款不会逾期的提示信息。
第二信息生成单元405,用于若预测结果值大于阈值,则生成用户的贷款会逾期的提示信息。
本申请实施例提供的贷款逾期的预测装置中,首先获取单元401获取用户的贷款特征数据。其中,贷款特征数据包括贷款信息、身份信息、交易信息和资产信息。然后预测单元402将贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值。其中,LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型。对比单元403再将得到的预测结果值与预设的阈值进行对比,如果预测结果值小于阈值,第一信息生成单元404则生成用户的贷款不会逾期的提示信息,如果预测结果值大于阈值,第二信息生成单元405则生成用户的贷款会逾期的提示信息。由此可知,利用用户的贷款特征数据和本申请预先构建LigthGBM算法模型就可以快速和准确得到用户的贷款是否会逾期的预测结果,解决了在现有技术中不能快速和准确地预测出贷款用户是否会逾期的问题。
本实施例中,获取单元401、预测单元402、对比单元403、第一信息生成单元404以及第二信息生成单元405的具体执行过程,可参见对应图1的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,获取单元401的一种实施方式,包括:
采集子单元,用于采集用户的贷款特征数据。
数据处理子单元,用于对贷款特征数据进行数据预处理。
本实施例中,采集子单元以及数据处理子单元的具体执行过程,可参见上述对应的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,预测单元402的一种实施方式,包括:
确定子单元,用于通过网格搜索来确定LigthGBM算法模型的参数集合。
第一划分子单元,用于将参数集合分成第一参数集合和第二参数集合;其中,第一参数集合为手动调整的参数集合,第二参数集合为自动调整的参数集合。
第一调整子单元,用于利用二分法对第一参数集合进行参数调整,得到第一目标参数向量集合。
第二调整子单元,用于利用遗传算法对第二参数集合进行参数调整,得到第二目标参数向量集合。
数据结合子单元,用于将第一目标参数向量集合与第二目标参数向量集合相结合,得到最终参数向量集合。
配置子单元,用于利用最终参数向量集合对LigthGBM算法模型的参数进行配置,得到LigthGBM算法模型。
本实施例中,确定子单元、第一划分子单元、第一调整子单元、第二调整子单元、数据结合子单元以及配置子单元的具体执行过程,可参见图2对应的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,第二调整子单元的一种实施方式,包括:
初始化子单元,用于对第二参数集合进行初始化赋值,得到多个参数向量集合。
第二划分子单元,用于将得到的多个参数向量集合按照预设组数进行划分。
挑选子单元,用于从划分后的每一组参数向量集合中都挑选出一个最优的参数向量集合,组成新的一组参数向量集合。
处理子单元,用于将新的一组参数向量集合进行交叉与变异处理,得到第二目标参数向量集合。
本实施例中,初始化子单元、第二划分子单元、挑选子单元以及处理子单元的具体执行过程,可参见图3对应的方法实施例内容,此处不再赘述。
可选的,在本申请的另一实施例中,上述贷款逾期的预测装置,还可以包括:
标记子单元,用于对用户进行标记。
本实施例中,标记子单元的具体执行过程,可参见图3对应的方法实施例内容,此处不再赘述。
本申请另一实施例还提供了一种电子设备,如图5所示,具体包括:
一个或多个处理器501。
存储装置502,其上存储有一个或多个程序。
当一个或多个程序被一个或多个处理器501执行时,使得一个或多个处理器501实现如上述实施例中任意一项方法。
本申请另一实施例还提供了计算机存储介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现如上述实施例中任意一项方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种贷款逾期的预测方法,其特征在于,包括:
获取用户的贷款特征数据;其中,所述贷款特征数据包括贷款信息、身份信息、交易信息和资产信息;
将所述贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值;其中,所述LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型;
将所述预测结果值与预设的阈值进行对比;
若所述预测结果值小于所述阈值,则生成所述用户的贷款不会逾期的提示信息;
若所述预测结果值大于所述阈值,则生成所述用户的贷款会逾期的提示信息。
2.根据权利要求1所述的方法,其特征在于,所述获取用户的贷款特征数据,包括:
采集所述用户的贷款特征数据;
对所述贷款特征数据进行数据预处理。
3.根据权利要求1所述的方法,其特征在于,所述利用预设的调参算法进行参数调整,得到所述LigthGBM算法模型的方式,包括:
通过网格搜索来确定所述LigthGBM算法模型的参数集合;
将所述参数集合分成第一参数集合和第二参数集合;其中,所述第一参数集合为手动调整的参数集合,所述第二参数集合为自动调整的参数集合;
利用二分法对所述第一参数集合进行参数调整,得到第一目标参数向量集合;
利用遗传算法对所述第二参数集合进行参数调整,得到第二目标参数向量集合;
将所述第一目标参数向量集合与所述第二目标参数向量集合相结合,得到最终参数向量集合;
利用所述最终参数向量集合对所述LigthGBM算法模型的参数进行配置,得到所述LigthGBM算法模型。
4.根据权利要求3所述的方法,其特征在于,所述利用遗传算法对所述第二参数集合进行调整,得到第二目标参数向量集合,包括:
对所述第二参数集合进行初始化赋值,得到多个参数向量集合;
将得到的多个参数向量集合按照预设组数进行划分;
从划分后的每一组参数向量集合中都挑选出一个最优的参数向量集合,组成新的一组参数向量集合;
将所述新的一组参数向量集合进行交叉与变异处理,得到第二目标参数向量集合。
5.根据权利要求1所述的方法,其特征在于,所述若所述预测结果值大于所述阈值,则生成所述用户的贷款会逾期的提示信息之后,还包括:
对所述用户进行标记。
6.一种贷款逾期的预测装置,其特征在于,包括:
获取单元,用于获取用户的贷款特征数据;其中,所述贷款特征数据包括贷款信息、身份信息、交易信息和资产信息;
预测单元,用于将所述贷款特征数据输入到预先构建的LigthGBM算法模型中进行运算,得到预测结果值;其中,所述LigthGBM算法模型为利用预设的调参算法进行参数调整得到的模型;
对比单元,用于将所述预测结果值与预设的阈值进行对比;
第一信息生成单元,用于若所述预测结果值小于所述阈值,则生成所述用户的贷款不会逾期的提示信息;
第二信息生成单元,用于若所述预测结果值大于所述阈值,则生成所述用户的贷款会逾期的提示信息。
7.根据权利要求6所述的装置,其特征在于,所述获取单元,包括:
采集子单元,用于采集所述用户的贷款特征数据;
数据处理子单元,用于对所述贷款特征数据进行数据预处理。
8.根据权利要求6所述的装置,其特征在于,所述预测单元,包括:
确定子单元,用于通过网格搜索来确定所述LigthGBM算法模型的参数集合;
第一划分子单元,用于将所述参数集合分成第一参数集合和第二参数集合;其中,所述第一参数集合为手动调整的参数集合,所述第二参数集合为自动调整的参数集合;
第一调整子单元,用于利用二分法对所述第一参数集合进行参数调整,得到第一目标参数向量集合;
第二调整子单元,用于利用遗传算法对所述第二参数集合进行参数调整,得到第二目标参数向量集合;
数据结合子单元,用于将所述第一目标参数向量集合与所述第二目标参数向量集合相结合,得到最终参数向量集合;
配置子单元,用于利用所述最终参数向量集合对所述LigthGBM算法模型的参数进行配置,得到所述LigthGBM算法模型。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任意一项所述的方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至5中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010908892.0A CN112053225A (zh) | 2020-09-02 | 2020-09-02 | 贷款逾期的预测方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010908892.0A CN112053225A (zh) | 2020-09-02 | 2020-09-02 | 贷款逾期的预测方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112053225A true CN112053225A (zh) | 2020-12-08 |
Family
ID=73608432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010908892.0A Pending CN112053225A (zh) | 2020-09-02 | 2020-09-02 | 贷款逾期的预测方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112053225A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966878A (zh) * | 2021-03-31 | 2021-06-15 | 中国工商银行股份有限公司 | 一种贷款逾期预测、学习方法及装置 |
CN113159921A (zh) * | 2021-04-23 | 2021-07-23 | 上海晓途网络科技有限公司 | 一种逾期预测方法、装置、电子设备及存储介质 |
CN113781210A (zh) * | 2021-09-29 | 2021-12-10 | 中国银行股份有限公司 | 基于客户金融交易数据结构的自动化特征工程方法及装置 |
CN113159921B (zh) * | 2021-04-23 | 2024-10-25 | 上海晓途网络科技有限公司 | 一种逾期预测方法、装置、电子设备及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476658A (zh) * | 2020-04-13 | 2020-07-31 | 中国工商银行股份有限公司 | 一种贷款连续逾期的预测方法及装置 |
-
2020
- 2020-09-02 CN CN202010908892.0A patent/CN112053225A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476658A (zh) * | 2020-04-13 | 2020-07-31 | 中国工商银行股份有限公司 | 一种贷款连续逾期的预测方法及装置 |
Non-Patent Citations (1)
Title |
---|
HAHACHAO: "LightGBM+gridsearchcv调参", Retrieved from the Internet <URL:https://zhuanlan.zhihu.com/p/76206257> * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966878A (zh) * | 2021-03-31 | 2021-06-15 | 中国工商银行股份有限公司 | 一种贷款逾期预测、学习方法及装置 |
CN113159921A (zh) * | 2021-04-23 | 2021-07-23 | 上海晓途网络科技有限公司 | 一种逾期预测方法、装置、电子设备及存储介质 |
CN113159921B (zh) * | 2021-04-23 | 2024-10-25 | 上海晓途网络科技有限公司 | 一种逾期预测方法、装置、电子设备及存储介质 |
CN113781210A (zh) * | 2021-09-29 | 2021-12-10 | 中国银行股份有限公司 | 基于客户金融交易数据结构的自动化特征工程方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106251174A (zh) | 信息推荐方法及装置 | |
US20070124236A1 (en) | Credit risk profiling method and system | |
Assefa Tsehayae et al. | Developing and optimizing context-specific fuzzy inference system-based construction labor productivity models | |
TW201923675A (zh) | 資訊推薦方法及裝置、設備 | |
CN101930560A (zh) | 原因分析支持装置以及原因分析支持方法 | |
CN1870041A (zh) | 期权价格计算和预测方法与系统 | |
CN112053225A (zh) | 贷款逾期的预测方法、装置、电子设备和存储介质 | |
CN113095408A (zh) | 风险的确定方法、装置和服务器 | |
CN109685643A (zh) | 贷款审核中风险等级确定方法、装置、设备及存储介质 | |
Kao et al. | Measuring performance improvement of Taiwanese commercial banks under uncertainty | |
CN106294882A (zh) | 数据挖掘方法以及装置 | |
CN113761375B (zh) | 基于神经网络的消息推荐方法、装置、设备及存储介质 | |
Katharakisa et al. | SFA vs. DEA for measuring healthcare efficiency: A systematic review | |
CN111178656A (zh) | 信用模型训练方法、信用评分方法、装置及电子设备 | |
CN112328869A (zh) | 一种用户贷款意愿的预测方法、装置及计算机系统 | |
Soltani et al. | Ranking decision making units based on the multi-directional efficiency measure | |
CN116402625B (zh) | 客户评估方法、装置、计算机设备及存储介质 | |
CN110750572A (zh) | 一种科技成果启发式评价的自适应方法和装置 | |
CN116843483A (zh) | 一种车险理赔方法、装置、计算机设备及存储介质 | |
CN115860835A (zh) | 基于人工智能的广告推荐方法、装置、设备及存储介质 | |
CN115860958A (zh) | 一种债券资产规模配置的系统及方法 | |
CN115167965A (zh) | 交易进度条的处理方法及装置 | |
Nanayakkara et al. | Adaptive Stock Market portfolio management and stock prices prediction platform for Colombo Stock Exchange of sri lanka | |
Zahedi-Seresht et al. | A NEW MONTE CARLO BASED PROCEDURE FOR COMPLETE RANKING EFFICIENT UNITS IN DEA MODELS. | |
CN115860889A (zh) | 一种基于人工智能的金融贷款大数据管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201208 |
|
RJ01 | Rejection of invention patent application after publication |