CN112926794A - 银行贷款信息预测方法及装置 - Google Patents
银行贷款信息预测方法及装置 Download PDFInfo
- Publication number
- CN112926794A CN112926794A CN202110300430.5A CN202110300430A CN112926794A CN 112926794 A CN112926794 A CN 112926794A CN 202110300430 A CN202110300430 A CN 202110300430A CN 112926794 A CN112926794 A CN 112926794A
- Authority
- CN
- China
- Prior art keywords
- independent variable
- independent
- bank
- variable set
- variables
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012417 linear regression Methods 0.000 claims abstract description 61
- 238000012216 screening Methods 0.000 claims abstract description 36
- 238000012360 testing method Methods 0.000 claims description 28
- 238000009499 grossing Methods 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 19
- 238000011161 development Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 12
- 230000001419 dependent effect Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 10
- 230000007774 longterm Effects 0.000 claims description 4
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 238000000611 regression analysis Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000001134 F-test Methods 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Technology Law (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种银行贷款信息预测方法及装置,可用于金融领域或其他技术领域,该方法包括:获取预设的第一自变量集合以及历史数据;根据所述历史数据采用逐步回归法对所述第一自变量集合中的自变量进行筛选,得到第二自变量集合;对所述第二自变量集合中的自变量进行筛选得到第三自变量集合;将所述第三自变量集合中的每个自变量在待预测年上的值输入到所述多元线性回归方程,得到所述待预测年的银行个人住房贷款总额预测值。本发明实现了准确的对银行个人住房贷款总额进行预测的有益效果。
Description
技术领域
本发明涉及银行数据处理技术领域,具体而言,涉及一种银行贷款信息预测方法及装置。
背景技术
随着房地产行业的繁荣发展,银行个人住房贷款总额逐步增长,逐渐成为银行营收的重要组成部分。研究影响银行个人住房贷款总额的影响因素和预测其未来的增长额,有利于银行决策者更好的配置银行资金,制度年度计划,提高营业额等。现有的技术方案主要基于多元回归分析的统计方法,采用的因变量包括房价指数、GDP、通货膨胀率等预测短期银行个人住房贷款总额,这种方法存在误差较大的问题。例如,基于2000-2018年的数据,建立了预测银行个人住房贷款总额的多元回归模型,并将2019年的房价指数、GDP、通货膨胀率等因素代入模型计算出2019年的预测银行个人住房贷款总额数据,误差率为7.5%。现有技术缺少一种更为准确的对银行个人住房贷款总额进行预测的方法。
发明内容
本发明为了解决上述背景技术中的技术问题,提出了一种银行贷款信息预测方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种银行贷款信息预测方法,该方法包括:
获取预设的第一自变量集合以及历史数据,其中,所述历史数据中包含了所述第一自变量集合中的每个自变量在预设的连续多年中每年的值以及在所述预设的连续多年中每年的银行个人住房贷款总额数据;
根据所述历史数据采用逐步回归法对所述第一自变量集合中的自变量进行筛选,得到第二自变量集合;
对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,其中,所述多元线性回归方程的因变量为银行个人住房贷款总额;
将所述第三自变量集合中的每个自变量在待预测年上的值输入到所述多元线性回归方程,得到所述待预测年的银行个人住房贷款总额预测值。
可选的,所述对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,具体包括:
从所述第二自变量集合中选择多个自变量组成第四自变量集合,使得在根据所述第四自变量集合以及所述历史数据建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都通过显著性检验。
可选的,所述对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,具体还包括:
若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都没有严重的多重共线性,则将所述第四自变量集合作为所述第三自变量集合;
若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的至少一个自变量存在严重的多重共线性,则对所述第四自变量集合中的自变量进行筛选得到所述第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都没有严重的多重共线性。
可选的,该银行贷款信息预测方法,还包括:
根据在所述预设的连续多年中每年的银行个人住房贷款总额数据采用霍尔特指数平滑法预测出在所述预设的连续多年之后的N年中每年的银行个人住房贷款总额,其中,N为大于等于1的整数。
可选的,所述第一自变量集合中的自变量包括:城镇居民人均可支配收入、人均存款、GDP增长率、货币和准货币供应量、居民消费价格指数、人口增长率、不良贷款率、住宅商品房平均销售价格、房地产开发企业竣工房屋造价以及房地产开发投资额。
为了实现上述目的,根据本发明的另一方面,提供了一种银行贷款信息预测装置,该装置包括:
自变量数据获取模块,用于获取预设的第一自变量集合以及历史数据,其中,所述历史数据中包含了所述第一自变量集合中的每个自变量在预设的连续多年中每年的值以及在所述预设的连续多年中每年的银行个人住房贷款总额数据;
自变量筛选模块,用于根据所述历史数据采用逐步回归法对所述第一自变量集合中的自变量进行筛选,得到第二自变量集合;
自变量确定模块,用于对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,其中,所述多元线性回归方程的因变量为银行个人住房贷款总额;
预测模块,用于将所述第三自变量集合中的每个自变量在待预测年上的值输入到所述多元线性回归方程,得到所述待预测年的银行个人住房贷款总额预测值。
可选的,所述自变量确定模块,具体包括:
第一筛选单元,用于从所述第二自变量集合中选择多个自变量组成第四自变量集合,使得在根据所述第四自变量集合以及所述历史数据建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都通过显著性检验。
可选的,所述自变量确定模块,具体还包括:
确定单元,用于若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都没有严重的多重共线性,则将所述第四自变量集合作为所述第三自变量集合;
第二筛选单元,用于若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的至少一个自变量存在严重的多重共线性,则对所述第四自变量集合中的自变量进行筛选得到所述第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都没有严重的多重共线性。
可选的,该银行贷款信息预测装置,还包括:
长期预测模块,用于根据在所述预设的连续多年中每年的银行个人住房贷款总额数据采用霍尔特指数平滑法预测出在所述预设的连续多年之后的N年中每年的银行个人住房贷款总额,其中,N为大于等于1的整数。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述银行贷款信息预测方法中的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述银行贷款信息预测方法中的步骤。
本发明的有益效果为:本发明采用逐步回归法对选择的自变量进行筛选,进而根据筛选后的自变量建立的多元线性回归方程,对银行个人住房贷款总额进行预测,实现了较为准确的对银行个人住房贷款总额进行预测的有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例银行贷款信息预测方法的流程图;
图2是本发明实施例银行对自变量进行筛选的流程图;
图3是未对自变量进行筛选建立回归模型的显著性检验示意图;
图4是运用逐步回归法筛选自变量示意图;
图5是经过逐步回归法筛选自变量后建立回归模型的显著性检验示意图;
图6是剔除不显著变量后建立回归模型的显著性检验示意图;
图7是检查剩余四个变量的多重共线性示意图;
图8是剔除居民消费价格指数后建立回归模型的显著性检验示意图;
图9是剔除人均可支配收入后建立回归模型的显著性检验示意图;
图10是运用霍尔特指数平滑法预测银行个人住房贷款预测图;
图11是本发明实施例银行贷款信息预测装置的结构框图;
图12是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本发明为了克服预测银行个人住房贷款总额选取的多元回归模型精度不足,提供了一种可以更加精确的预测短期银行个人住房贷款总额及补充实现长期预测银行个人住房贷款总额的方法。
图1是本发明实施例银行贷款信息预测方法的流程图,如图1所示,本实施例的银行贷款信息预测方法包括步骤S101至步骤S104。
步骤S101,获取预设的第一自变量集合以及历史数据,其中,所述历史数据中包含了所述第一自变量集合中的每个自变量在预设的连续多年中每年的值以及在所述预设的连续多年中每年的银行个人住房贷款总额数据。
在本发明一个实施例中,所述第一自变量集合中的自变量包括:城镇居民人均可支配收入、人均存款、GDP增长率、货币和准货币供应量、居民消费价格指数、人口增长率、不良贷款率、住宅商品房平均销售价格、房地产开发企业竣工房屋造价以及房地产开发投资额。
为了体现出经济发展对银行个人住房贷款总额的影响,本发明选取城镇居民人均可支配收入(单位元)X1,人均存款X2,GDP增长率X3货币和准货币(M2)供应量X4,居民消费价格指数X5作为其中五个自变量。为了体现出人口增长对银行个人住房贷款总额的影响,本发明选取人口增长率X6作为其中一个自变量。为了体现不良贷款情况对银行个人住房贷款总额的影响,本发明选取不良贷款率X7作为其中一个自变量。为了体现房地产相关因素对银行个人住房贷款总额的影响,本发明选用住宅商品房平均销售价格(元/平方米)X8,房地产开发企业竣工房屋造价(元/平方米)X9,房地产开发投资额X10作为其中的三个自变量。本发明从经济发展,人口增长,银行不良贷款情况,房地产相关因素四个显著影响银行个人住房贷款总额情况的方向选取变量,建立的模型精确度更高。
在本发明以下实施例中,本发明用2000年至2019年对所述预设的连续多年进行举例说明,但本发明不以为限。
在本发明一个实施例中,本发明可以运用R软件,对2000-2019年影响银行个人住房贷款总额相关自变量的值进行描述性统计分析,得到的结果见表1。
表1影响银行个人住房贷款总额相关变量描述性统计
由表1可以看出,城镇居民人均可支配收入、人均存款、不良贷款率、住宅商品房平均销售价格、房地产开发投资额和银行个人住房贷款总额的中位数和平均值差距较大,说明数据攀升明显。根据变异系数反馈的结果,不良贷款率的离散程度最大,最小的是居民消费价格指数。说明随着年份不良贷款率增长的幅度大,居民消费价格指数增长的幅度较小。根据偏度反馈的结果,城镇居民人均可支配收入(单位元)、人均存款、GDP增长率、货币和准货币(M2)供应量、居民消费价格指数、人口增长率、不良贷款率、住宅商品房平均销售价格、房地产开发企业竣工房屋造价、房地产开发投资额和银行个人住房贷款总额的分布是右偏的。
步骤S102,根据所述历史数据采用逐步回归法对所述第一自变量集合中的自变量进行筛选,得到第二自变量集合。
在本发明中,根据收集的2000-2019年上述10个自变量的历史数据,以银行个人住房贷款总额Y为因变量,建立多元线性回归模型。发现建立的多元线性回归模型明显存在不显著变量(见图3),因此本发明需要对10个自变量进行筛选。
在本发明实施例中,本发明采用逐步回归法对上述多个自变量进行筛选。具体的,本发明通过运用逐步回归法筛选出AIC值最小的情况(见图4),得到筛选后的自变量,即第二自变量集合。
在本发明一个可选实施例中,筛选之后得到的第二自变量集合包含居民消费价格指数X5、城镇居民人均可支配收入X1、人口增长率X6、住宅商品房平均销售价格X8以及房地产开发企业竣工房屋造价(元/平方米)X9。
步骤S103,对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,其中,所述多元线性回归方程的因变量为银行个人住房贷款总额。
在本发明一个实施例中,本步骤的对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,具体可以为从所述第二自变量集合中随机选择出多个自变量组成第三自变量集合,进而验证第三自变量集合是否符合上述条件,最终确定出满足上述条件的第三自变量集合。
在本发明一个实施例中,本步骤的显著性检验具体为,针对多元线性回归方程,运用Summary函数得到参数估计结果,进而根据参数估计结果来对各自变量进行显著性检验。
在本发明一个实施例中,本步骤的检查多重共线性具体为,针对多元线性回归方程计算每个自变量的方差膨胀因子(Variance Inflation Factor,VIF),进而获取预设的VIF阈值,若自变量的VIF值大于预设的VIF阈值则说明该自变量存在严重的多重共线性,否则说明该自变量不存在严重的多重共线性。
在本发明一个具体实施例中,本步骤根据所述第二自变量集合建立多元回归分析方程(见图5),发现只有房地产开发企业竣工房屋造价这个变量不显著,剔除之后发现四个剩余四个变量都是显著的(见图6)。再检查剩余四个变量是否存在多重共线性,可以发现居民消费价格指数,城镇人均可支配收入和住宅商品房销售价格三个变量存在比较明显的多重共线性(见图7)。再结合常识,人均可支配收入和居民消费价格指数的相关程度较高。先剔除居民消费价格指数,再建立的多元线性方程城镇居民人均可支配收入不显著(见图8),明细不符合我们需求。再假设剔除人均可支配收入,得到的多元线性回归方程显著且多重共线性不高(见图9),所以最终选定居民消费价格指数X5,人口增长率X6,住宅商品房平均销售价格X8为自变量,银行个人住房贷款总额Y为因变量,建立多元回归分析方程。
将2000-2019年的居民消费价格指数X5,人口增长率X6,住宅商品房平均销售价格X8作为自变量,银行个人住房贷款总额Y为因变量,运用Summary函数得到参数估计结果如表2所示,根据表2可以看出,对Y来说,X5,X6,X8都通过了显著性检验,模型有效。并且,该模型的R^2等于0.9828,P值等于2.531E-14,表明模型的拟合效果良好。
表2模型参数估计结果
综上所述,可以得到多元线性回归方程为:
Y=2.865-0.07187×X5+2085×X6+0.006919×X8+εt
下面对得到多元线性回归方程的精度进行检验。本发明将2019年的居民消费价格指数X5(669.8),人口增长率X6(0.0036),住宅商品房平均销售价格X8(9287)代入方程,预测计算出来的2019年银行个人住房贷款总额等于26.4892,实际2019年银行个人住房贷款总额等于26.87,可以计算出实际误差率等于1.42%,精度较高。由此可见,采用本发明方法得到的多元线性回归方程的预测准确性较高。
步骤S104,将所述第三自变量集合中的每个自变量在待预测年上的值输入到所述多元线性回归方程,得到所述待预测年的银行个人住房贷款总额预测值。以使根据所述银行个人住房贷款总额预测值配置该待预测年的银行资金。
在本发明实施例中,本发明的多元线性回归方程预测准确性较高,用于对短期的银行个人住房贷款总额进行预测。在本发明一个实施例中,所述待预测年为所述预设的连续多年的下一年。当获得所述预设的连续多年的下一年的第三自变量集合的取值后,可以根据本发明的多元线性回归方程预测出该年的银行个人住房贷款总额。
图2是本发明实施例银行对自变量进行筛选的流程图,如图2所示,在本发明一个实施例中,上述步骤S103的对自变量进行筛选具体包括步骤S201至步骤S203。
步骤S201,从所述第二自变量集合中选择多个自变量组成第四自变量集合,使得在根据所述第四自变量集合以及所述历史数据建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都通过显著性检验。
步骤S202,若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都没有严重的多重共线性,则将所述第四自变量集合作为所述第三自变量集合。
步骤S203,若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的至少一个自变量存在严重的多重共线性,则对所述第四自变量集合中的自变量进行筛选得到所述第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都没有严重的多重共线性。
在本发明一个实施例中,本发明的银行贷款信息预测方法,还包括:
根据在所述预设的连续多年中每年的银行个人住房贷款总额数据采用霍尔特指数平滑法预测出在所述预设的连续多年之后的N年中每年的银行个人住房贷款总额,其中,N为大于等于1的整数。
在本发明中,上述多元线性回归方程虽然预测准确性较高,但需要得到自变量的值才能对因变量进行预测,例如,要想对2030年的银行个人住房贷款总额进行预测,则需要先得到2030年的自变量的值,因此,上述多元线性回归方程针对未来长时间的预测存在不足。因此,本发明选择采用霍尔特指数平滑法来对未来长时间的银行个人住房贷款总额进行预测。
为了预测例如2020-2024年的银行个人住房贷款总额,由于2000-2019年的银行个人住房贷款总额呈增长趋势且没有季节性因素相加,因此可以使用霍尔特指数平滑法对其进行预测。霍尔特指数平滑法估计当前时间点的水平和斜率,其平滑化是由两个参数控制的,alpha用于估计当前时间点的水平,beta用于估计当前时间点趋势部分的斜率。正如简单指数平滑法一样,alpha和beta参数都介于0到1之间,并且当参数接近0,大多数近期的观测将占预测更小的权重。
将2000-2019年的银行个人住房贷款总额代入模型,计算出alpha预测值等于0.817,beta预测值等于1.00,这都是非常高的值,告诉我们无论是水平上,还是趋势的斜率,当前值大部分都基于时间序列上最近的观测值。
在本发明实施例中,可以用黑色线条画出原始时间序列分布,用红色线条画出顶部的预测值(见图10),从图中可以看出样本内预测非常接近观测值,预测值相比于观测值有一点点延迟。
为了使用霍尔特指数平滑法在银行个人住房贷款总额中找到合适的预测模型,本发明可以设定其水平初值为0.338,趋势部分的斜率初始值为0.222,并使用forecast函数预测2020-2024这五年的银行个人住房贷款总额,预测结果见下表3。
表3 2020-2024银行个人住房贷款总额预测结果
预测年份 | 预测值 | 预测低80 | 预测高80 | 预测低95 | 预测高95 |
2020 | 28.91007 | 27.52606 | 30.29408 | 26.79341 | 31.02673 |
2021 | 30.5091 | 27.86683 | 33.16137 | 26.45281 | 34.56539 |
2022 | 32.10813 | 27.80088 | 36.41538 | 25.52076 | 38.69550 |
2023 | 33.70716 | 27.45988 | 39.95445 | 24.15277 | 43.26156 |
2024 | 35.30619 | 26.87870 | 43.73368 | 22.41746 | 48.19493 |
由以上实施例可以看出,本发明通过建立多元线性模型预测短期(例如2019年)的银行个人住房贷款总额,并与实际值比较计算模型精度。再通过霍尔特指数平滑法计算长期(例如2020-2024年)的银行个人住房贷款总额情况。可以比较精确的预测未来五年的银行个人住房贷款总额走势,方便银行决策者配置资金,为后续支持个人房贷业务的资金准备提供理论支持,提高存款利用率的同时,增加银行利润。
下面对本发明上述实施例中的一些术语进行解释说明:
变异系数:当需要比较两组数据离散程度大小的时候,如果两组数据的测量尺度相差太大的时候,或者数据量纲不同的时候,直接使用标准差来进行比较不合适,此时就应当消除测量尺度和量纲的影响,而变异系数就能够做到这一点,它是原始数据标准差与原始数据平均值的比。变异系数没有量纲,所以就可以客观比较了。
偏度:也称为偏态,偏态系数。是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
逐步回归法:逐步回归的基本思想是将变量逐个引入模型,每引入一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入变得不再显著时,则将其删除。以确保每次引入新的变量之前回归方程中只包含显著性变量。这是一个反复的过程,直到既没有显著的解释变量选入回归方程,也没有不显著的解释变量从回归方程中剔除为止。以保证最后的解释变量集是最优的。
多重共线性:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
Summary函数:拟合线性方程计算得出估值,标准误差,T值和P值,其中T检验是检验解释变量的显著性,R-Squared是查看方程拟合程度的,F检验是检验方程整体显著性的,也就是说R-Squared,T-p,F-p值决定了线性关系是否成立。
霍尔特指数平滑法:时间序列预测算法的一种,具体特征是有增长或者降低趋势的,没有季节性可相加。
Alpha参数:霍尔特指数平滑法估计当前时间的水平和斜率,其平滑水平是由两个参数控制,alpha估计当前点水平
Beta参数:霍尔特指数平滑法估计当前时间的水平和斜率,其平滑水平是由两个参数控制,beta估计当前点趋势部分斜率。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种银行贷款信息预测装置,可以用于实现上述实施例所描述的银行贷款信息预测方法,如下面的实施例所述。由于银行贷款信息预测装置解决问题的原理与银行贷款信息预测方法相似,因此银行贷款信息预测装置的实施例可以参见银行贷款信息预测方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图11是本发明实施例银行贷款信息预测装置的结构框图,如图11所示,本发明实施例银行贷款信息预测装置包括:
自变量数据获取模块1,用于获取预设的第一自变量集合以及历史数据,其中,所述历史数据中包含了所述第一自变量集合中的每个自变量在预设的连续多年中每年的值以及在所述预设的连续多年中每年的银行个人住房贷款总额数据;
自变量筛选模块2,用于根据所述历史数据采用逐步回归法对所述第一自变量集合中的自变量进行筛选,得到第二自变量集合;
自变量确定模块3,用于对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,其中,所述多元线性回归方程的因变量为银行个人住房贷款总额;
预测模块4,用于将所述第三自变量集合中的每个自变量在待预测年上的值输入到所述多元线性回归方程,得到所述待预测年的银行个人住房贷款总额预测值。
在本发明一个实施例中,所述自变量确定模块3,具体包括:
第一筛选单元,用于从所述第二自变量集合中选择多个自变量组成第四自变量集合,使得在根据所述第四自变量集合以及所述历史数据建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都通过显著性检验;
确定单元,用于若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都没有严重的多重共线性,则将所述第四自变量集合作为所述第三自变量集合;
第二筛选单元,用于若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的至少一个自变量存在严重的多重共线性,则对所述第四自变量集合中的自变量进行筛选得到所述第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都没有严重的多重共线性。
在本发明一个实施例中,本发明的银行贷款信息预测装置,还包括:
长期预测模块,用于根据在所述预设的连续多年中每年的银行个人住房贷款总额数据采用霍尔特指数平滑法预测出在所述预设的连续多年之后的N年中每年的银行个人住房贷款总额,其中,N为大于等于1的整数。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图12所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述银行贷款信息预测方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种银行贷款信息预测方法,其特征在于,包括:
获取预设的第一自变量集合以及历史数据,其中,所述历史数据中包含了所述第一自变量集合中的每个自变量在预设的连续多年中每年的值以及在所述预设的连续多年中每年的银行个人住房贷款总额数据;
根据所述历史数据采用逐步回归法对所述第一自变量集合中的自变量进行筛选,得到第二自变量集合;
对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,其中,所述多元线性回归方程的因变量为银行个人住房贷款总额;
将所述第三自变量集合中的每个自变量在待预测年上的值输入到所述多元线性回归方程,得到所述待预测年的银行个人住房贷款总额预测值。
2.根据权利要求1所述的银行贷款信息预测方法,其特征在于,所述对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,具体包括:
从所述第二自变量集合中选择多个自变量组成第四自变量集合,使得在根据所述第四自变量集合以及所述历史数据建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都通过显著性检验。
3.根据权利要求2所述的银行贷款信息预测方法,其特征在于,所述对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,具体还包括:
若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都没有严重的多重共线性,则将所述第四自变量集合作为所述第三自变量集合;
若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的至少一个自变量存在严重的多重共线性,则对所述第四自变量集合中的自变量进行筛选得到所述第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都没有严重的多重共线性。
4.根据权利要求1所述的银行贷款信息预测方法,其特征在于,还包括:
根据在所述预设的连续多年中每年的银行个人住房贷款总额数据采用霍尔特指数平滑法预测出在所述预设的连续多年之后的N年中每年的银行个人住房贷款总额,其中,N为大于等于1的整数。
5.根据权利要求1所述的银行贷款信息预测方法,其特征在于,所述第一自变量集合中的自变量包括:城镇居民人均可支配收入、人均存款、GDP增长率、货币和准货币供应量、居民消费价格指数、人口增长率、不良贷款率、住宅商品房平均销售价格、房地产开发企业竣工房屋造价以及房地产开发投资额。
6.一种银行贷款信息预测装置,其特征在于,包括:
自变量数据获取模块,用于获取预设的第一自变量集合以及历史数据,其中,所述历史数据中包含了所述第一自变量集合中的每个自变量在预设的连续多年中每年的值以及在所述预设的连续多年中每年的银行个人住房贷款总额数据;
自变量筛选模块,用于根据所述历史数据采用逐步回归法对所述第一自变量集合中的自变量进行筛选,得到第二自变量集合;
自变量确定模块,用于对所述第二自变量集合中的自变量进行筛选得到第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都通过显著性检验并且都没有严重的多重共线性,其中,所述多元线性回归方程的因变量为银行个人住房贷款总额;
预测模块,用于将所述第三自变量集合中的每个自变量在待预测年上的值输入到所述多元线性回归方程,得到所述待预测年的银行个人住房贷款总额预测值。
7.根据权利要求6所述的银行贷款信息预测装置,其特征在于,所述自变量确定模块,具体包括:
第一筛选单元,用于从所述第二自变量集合中选择多个自变量组成第四自变量集合,使得在根据所述第四自变量集合以及所述历史数据建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都通过显著性检验。
8.根据权利要求7所述的银行贷款信息预测装置,其特征在于,所述自变量确定模块,具体还包括:
确定单元,用于若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的每个自变量都没有严重的多重共线性,则将所述第四自变量集合作为所述第三自变量集合;
第二筛选单元,用于若在根据所述第四自变量集合建立的多元线性回归方程上,所述第四自变量集合中的至少一个自变量存在严重的多重共线性,则对所述第四自变量集合中的自变量进行筛选得到所述第三自变量集合,使得在根据所述第三自变量集合以及所述历史数据建立的多元线性回归方程上,所述第三自变量集合中的每个自变量都没有严重的多重共线性。
9.根据权利要求6所述的银行贷款信息预测装置,其特征在于,还包括:
长期预测模块,用于根据在所述预设的连续多年中每年的银行个人住房贷款总额数据采用霍尔特指数平滑法预测出在所述预设的连续多年之后的N年中每年的银行个人住房贷款总额,其中,N为大于等于1的整数。
10.根据权利要求6所述的银行贷款信息预测装置,其特征在于,所述第一自变量集合中的自变量包括:城镇居民人均可支配收入、人均存款、GDP增长率、货币和准货币供应量、居民消费价格指数、人口增长率、不良贷款率、住宅商品房平均销售价格、房地产开发企业竣工房屋造价以及房地产开发投资额。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的方法。
12.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序在计算机处理器中执行时实现如权利要求1至5任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110300430.5A CN112926794A (zh) | 2021-03-22 | 2021-03-22 | 银行贷款信息预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110300430.5A CN112926794A (zh) | 2021-03-22 | 2021-03-22 | 银行贷款信息预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112926794A true CN112926794A (zh) | 2021-06-08 |
Family
ID=76175266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110300430.5A Pending CN112926794A (zh) | 2021-03-22 | 2021-03-22 | 银行贷款信息预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112926794A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113379531A (zh) * | 2021-06-10 | 2021-09-10 | 中国工商银行股份有限公司 | 银行客户存款总额预测方法及装置 |
-
2021
- 2021-03-22 CN CN202110300430.5A patent/CN112926794A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113379531A (zh) * | 2021-06-10 | 2021-09-10 | 中国工商银行股份有限公司 | 银行客户存款总额预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Battaglia et al. | Practical considerations in raking survey data | |
Arroyo et al. | Smoothing methods for histogram‐valued time series: an application to value‐at‐risk | |
CN112163963B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
Alimi | Inflation and financial sector performance: The case of Nigeria | |
CN115422788B (zh) | 一种配电网线损分析管理方法、装置、存储介质及系统 | |
CN112288172A (zh) | 台区线损率的预测方法、装置 | |
CN112926794A (zh) | 银行贷款信息预测方法及装置 | |
CN112508260B (zh) | 基于对比学习的配电变压器中长期负荷预测方法及装置 | |
CN112257958A (zh) | 一种电力饱和负荷预测方法及装置 | |
CN117593115A (zh) | 信贷风险评估模型的特征值确定方法、装置、设备和介质 | |
Bum Kim et al. | Bias-correction schemes for calibrated flow in a conceptual hydrological model | |
CN116739742A (zh) | 信贷风控模型的监控方法、装置、设备及存储介质 | |
Das et al. | Regional model for agricultural imbalances in West Bengal, India | |
D'Andrea | A meta-analysis on the debt-growth relationship | |
CN113837887A (zh) | 养老保险基金收支数据精准预测方法、装置、介质及设备 | |
CN113256124A (zh) | 低效网点的筛选方法、装置、设备及存储介质 | |
CN112686423A (zh) | 基于机器学习的信托产品收益率预测方法及装置 | |
CN113379531A (zh) | 银行客户存款总额预测方法及装置 | |
Halkos et al. | Performance evaluation using bootstrapping DEA techniques: Evidence from industry ratio analysis | |
CN116739379A (zh) | 网点容量的预估方法、装置、设备及存储介质 | |
JP2017045387A (ja) | 異種エネルギ消費量推定装置及び異種特性推定装置 | |
CN116307085A (zh) | 基于智能预测的网格化配电规划方法、装置、设备及介质 | |
CN117952688A (zh) | 商户的分类方法、装置及电子设备 | |
CN115526642A (zh) | 配电网户变关系确定方法、装置、计算机设备和存储介质 | |
CN117689410A (zh) | 一种快速挖掘增值服务潜在需求客户方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |