CN111506876B - 一种数据预测分析方法、系统、设备及可读存储介质 - Google Patents

一种数据预测分析方法、系统、设备及可读存储介质 Download PDF

Info

Publication number
CN111506876B
CN111506876B CN202010256491.1A CN202010256491A CN111506876B CN 111506876 B CN111506876 B CN 111506876B CN 202010256491 A CN202010256491 A CN 202010256491A CN 111506876 B CN111506876 B CN 111506876B
Authority
CN
China
Prior art keywords
data
prediction
accumulation
month
accumulation fund
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010256491.1A
Other languages
English (en)
Other versions
CN111506876A (zh
Inventor
曲大伟
汪震
丁志强
王宏栋
史宜轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Digital Cloud Technology Co ltd
Original Assignee
Shenyang Digital Cloud Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Digital Cloud Technology Co ltd filed Critical Shenyang Digital Cloud Technology Co ltd
Priority to CN202010256491.1A priority Critical patent/CN111506876B/zh
Publication of CN111506876A publication Critical patent/CN111506876A/zh
Application granted granted Critical
Publication of CN111506876B publication Critical patent/CN111506876B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof

Abstract

本申请实施例公开了一种数据预测分析方法、系统、设备及可读存储介质,其中所述方法包括:接收客户端发送的公积金数据预测请求;根据公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;基于目标公积金数据预测模型,对公积金数据预测类型和公积金数据预测时间进行数据预测分析;将预测分析结果发送至所述客户端。提供了更加精确的公积金数据预测。

Description

一种数据预测分析方法、系统、设备及可读存储介质
技术领域
本申请实施例涉及数据分析技术领域,具体涉及一种数据预测分析方法、系统、设备及可读存储介质。
背景技术
住房公积金,是指国家机关、国有企业、城镇集体企业、外商投资企业、城镇私营企业及其他城镇企业、事业单位、民办非企业单位、社会团体及其在职职工缴存的长期住房储金。住房公积金制度是我国一种住房保障制度,是住房分配货币化的一种形式,这项制度已经给广大中低收入家庭带来了利益。伴随着时代的发展,公积金制度也在逐步完善。住房和城乡建设部正在联合各个部门,研究修订公积金条例工作中,放开个人提取公积金用于支付住房租金的规定。
目前,公积金资金的沉淀是很大的浪费。为了有效利用公积金,对公积金进行科学管理、引进计算机技术、对公积金的汇缴、贷款回收、公积金提取进行科学预测,结合现有的公积金数据,开发一套公积金数据预测分析系统,通过对数据的预测分析,对制定公积金政策、提高公积金的有效利用率、促进我国房地产的健康发展起到积极的作用。
发明内容
为此,本申请实施例提供一种数据预测分析方法、系统、设备及可读存储介质,提供了更加精确的公积金数据预测。
为了实现上述目的,本申请实施例提供如下技术方案:
根据本申请实施例的第一方面,提供了一种数据预测分析方法,所述方法包括:
接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间;
根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;
根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;
根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;
基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析;
将预测分析结果发送至所述客户端。
可选地,所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预测。
可选地,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型,包括:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,得到季度预测值;
将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中所占比值,得到月占比;
将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测值。
可选地,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型,包括:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中的相同季度的公积金贷款回收金额取对数;
将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;
将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所需预测季度或者月份的公积金贷款回收金额的预测模型。
可选地,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型,包括:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初始值S13,以所述第N+1年一季度与所述第N年一季度差值的作为趋势平滑值bt的初始值b13,按照如下公式进行所述第N+1年的下一月份的公积金支取总量/>的预测:
bt=γ(St-St-1)+(1-γ)bt-1
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
根据本申请实施例的第二方面,提供了一种数据预测分析系统,所述系统包括:
消息接收模块,用于接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间;
数据调取模块,用于根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;
预测模型匹配模块,用于根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;
精度校验模块,用于根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;
预测分析模块,用于基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析;
消息发送模块,用于将预测分析结果发送至所述客户端。
可选地,所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预测。
可选地,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,得到季度预测值;
将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中所占比值,得到月占比;
将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测值。
可选地,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中的相同季度的公积金贷款回收金额取对数;
将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;
将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所需预测季度或者月份的公积金贷款回收金额的预测模型。
可选地,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初始值S13,以所述第N+1年一季度与所述第N年一季度差值的作为趋势平滑值bt的初始值b13,按照如下公式进行所述第N+1年的下一月份的公积金支取总量/>的预测:
bt=γ(St-St-1)+(1-γ)bt-1
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
根据本申请实施例的第三方面,提供了一种数据预测分析设备,所述设备包括:数据采集装置、处理器和存储器;
所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行上述第一方面任一项所述的方法。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行如上述第一方面任一项所述的方法。
综上所述,本申请实施例提供了一种数据预测分析方法、系统、设备及可读存储介质,通过接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间;根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析;将预测分析结果发送至所述客户端。提供了更加精确的公积金数据预测。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。
图1为本申请实施例提供的一种数据预测分析流程示意图;
图2为本申请实施例提供的系统架构示意图;
图3为本申请实施例提供的功能结构示意图;
图4为本申请实施例提供的模块内功能结构示意图;
图5为本申请实施例提供的公积金数据预测分析流程图;
图6a、图6b、图6c、图6d和图6e为本申请实施例提供的公积金汇缴的预测实施例示意图;
图7a、图7b、图7c和图7d为本申请实施例提供的公积金贷款回收预测实施例示意图;
图8a和图8b为本申请实施例提供的公积金支取总量的预测实施例示意图;
图9为本申请实施例提供的一种数据预测分析系统框图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
伴随着时代的发展,公积金制度也在逐步完善。2011年,住房和城乡建设部正在联合各个部门,研究修订公积金条例工作中,放开个人提取公积金用于支付住房租金的规定。2013年部分城市出台办法,允许患有重大疾病的职工或其直系亲属提取公积金救急。2014年,三部门发文,取消住房公积金个人住房贷款保险、公证、新房评估和强制性机构担保等收费项目,减轻贷款职工负担。2015年,《住房公积金管理条例》规定,职工和单位住房公积金的缴存比例均不得低于5%,不得高于12%。2016年2月21日起,职工住房公积金账户存款利率调整为统一按一年期定期存款基准利率执行,上调后的利率为1.50%。2016年4月13日国务院总理李克强主持召开国务院常务会议,决定阶段性降低企业社保缴费费率和住房公积金缴存比例,为市场主体减负、增加职工现金收入。2016年5月1日起,我国将阶段性降低住房公积金缴存比例,凡缴存比例高于12%的一律予以规范调整,不得超过12%,该政策暂按两年执行。2018年5月,住建部发布《改进通知》,明确了住房公积金缴存比例浮动区间:住房公积金缴存比例下限为5%,上限由各地区按照《住房公积金管理条例》规定的程序确定,最高不得超过12%。缴存单位可在5%至当地规定的上限区间内,自主确定住房公积金缴存比例。
为了实现对公积金资金数据进行科学管理,有效利用住房公积金改善广大居民的住房条件,并且为了对公积金政策的制定提供有力依据,本申请实施例提供的数据预测分析方法对住房公积金资金历史数据进行分析建模,并结合公积金业务发展和政策取向建立中短期业务模拟演变数学模型。该数学模型需具备实现虚拟与现实相结合的不断实践和不断优化的技术能力,具有收敛逼近未来的中短期真实数据的功能,能够为公积金中短期事业发展提供辅助决策的有力支持。本申请实施例提供的数学模型比依据同比、环比分析预测方法相比较,速度更快,精度更高,自适应能力更强。对公积金行业相关政策的制定具有较强的辅助指导作用。
经分析发现,公积金管理中心提供的公积金缴存、回收、提取等数据,在平稳时期具有一定规律性,在国家、地方出台相关政策法规后,数据对政策法规有较为灵敏的反应,所以,公积金管理中心的各项数据真实可靠,可以对其进行分析预测。通过对历史海量数据的统计分析,得出研究对象的一般统计规律,为以后的建模预测提供必要的准备。
进一步,确定预测所需的最小数据量。具体地需要通过大量试验得到。
接下来,针对不同类型的数据,建立相应的数学模型:对统计规律较强的数据,根据设计原则,在保证预测精度的前提下,选择易于编程实现的模型;对统计规律不强、随机性较大的数据,将其分解为平稳的、趋势的、季节性的三个部分来建立模型,设置相应参数来实现平滑随机性、修正趋势性、处理季节性。同时,设置其他参数来体现政策法规对公积金各项数据的影响。
最后,模型的检验。在应用上述建立的模型进行预测之前,先对模型进行检验。举例来说,需要预测第n个数据,先用前n-2个数据预测出第n-1个数据,用第n-1个数据的真实值来进行检验,如果误差在允许范围内,则加入第n-1个数据进行预测。否则,需要对公式进行修正,根据计算结果调整参数,达到精度才进行下一步预测,直至找到合适的参数,确定最终的模型。
本申请实施例提供的数据预测分析方法及系统,可应用于公积金数据预测分析领域。通过历史数据和分析的设计的模型,对未来一段时间产生的数据进行预测性计算,再通过月份已发生的真实数据来计算检验模型误差。公积金数据预测分析系统具有公积金汇缴预测、公积金回收预测、公积金支取预测、新增贷款人数预测、公积金数据运营情况分析等功能。
公积金行业的公积金汇缴、支取、回收等数据具有较强的时序性,均可以视为时间序列,都可以建立相应的时间序列模型来进行分析和预测。但由于公积金汇缴、支取、回收等数据时间序列的发展变化基本规律不同,所以需要依据其自身特点建立不同的数学模型,才能准确地对其进行分析预测。对于规律性较强的数据,可使用时间序列平滑法或趋势外推法对其进行分析预测;对于有一定规律性,又有随机因素在内的数据,可以将其分解为趋势项、季节项、随机项分别加以分析处理再进行预测;对更复杂的数据,可以将上述方法结合起来进行分析预测。
图1示出了本申请实施例提供的数据预测分析方法,具体可以包括如下步骤:
步骤101:接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间。
步骤102:根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据。
步骤103:根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型。
步骤104:根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求。
步骤105:基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析。
步骤106:将预测分析结果发送至所述客户端。
在一种可能的实施方式中,所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预测。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为公积金汇缴金额预测,具体可以包括如下步骤:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,得到季度预测值;将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中所占比值,得到月占比;将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测值。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为公积金贷款回收金额预测,具体可以包括如下步骤:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中的相同季度的公积金贷款回收金额取对数;将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所需预测季度或者月份的公积金贷款回收金额的预测模型。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为公积金支取总量预测,具体可以包括如下步骤:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初始值S13,以所述第N+1年一季度与所述第N年一季度差值的作为趋势平滑值bt的初始值b13,按照如下公式(1)、(2)、(3)、(4)进行所述第N+1年的下一月份的公积金支取总量/>的预测:
bt=γ(St-St-1)+(1-γ)bt-1……公式(2)
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为公积金分项支取预测,具体可以包括如下步骤:
预测方法还是以温特斯季节预测法为主,再辅以其他预测模型。针对公积金贷款支取,以参数设置为α=0.3,β=0.8,γ=0.025的温特斯季节预测法为主,再辅以最小二乘直线拟合及对数差分,构成组合预测模型。
针对自有资金购房支取,以参数设置为α=0.6,β=0.9,γ=0.06的温特斯季节预测法为主,再辅以最小二乘直线拟合及隔月环比法,构成组合预测模型。
针对纯商贷支取,以参数设置为α=0.3,β=0.95,γ=0.04的温特斯季节预测法为主,再辅以最小二乘直线拟合法,构成组合预测模型。
在一种可能的实施方式中,在步骤103中,若所述公积金数据预测类型为新增贷款人数预测,具体可以包括如下步骤:
利用对数差分模型和加权平均模型,组合成新增贷款人数模型。
先对几年中每年前三月的新增贷款人数进行对数差分,去掉异常数据,所述异常数据为绝对值大于等于0.9的对数差分值。然后用剩余4个数的平均值作为第N年前三月对数差分的预测值,再换算成该月的新增贷款人数预测值。
若所述几年中4到10月新增贷款人数极不规律,即使采用对数差分也无规律性可言,所以必须建立另一个模型来预测其申请人数。此处采用加权平均为主的预测方法:首先对要预测月份的历史数据进行排序,目的是去掉异常数据(如果最大值和次最大值的差大于等于150,则去掉最大值,否则所有该月的历史数据都为有效数据)。考虑到政策调整因素,再加入政策调整因子即可对4到10月新增贷款人数进行预测。
在公积金数据预测分析中,可能存在以下几种预测类型。
第一,中短期公积金缴存资金预测:
(1)中短期单位缴存公积金的资金测算模型:实现模拟出未来6个月的单位公积金缴存发生资金。(2)中短期个人补缴的资金测算模型:实现模拟未来6个月的个人补缴发生资金。(3)中短期个人转入的资金测算模型:实现模拟未来6个月个人转入发生金额。(4)中短期公积金总体缴存测算模型:实现模拟未来6个月公积金缴存总体发生资金。(5)政策对公积金缴存资金的扰动:缴存比例调整的影响;缴存基数上线调整的影响;用工体制的影响;退休年龄调整的影响。
第二,中短期公积金贷款回收本金和利息预测:
(1)存量公积金贷款回收资金:计算存量公积金贷款未来6个月的本金回收和利息回收资金。(2)建立增量公积金贷款的资金回收模型:对未来6个月的新增贷款人建立需求模型,模拟测算这类新增人群的贷款需求情况,测算实际新增贷款人群的贷款本金回收和利息。
第三,公积金支取预测:
(1)中短期公积金提取总量的测算。(2)中短期公积金提取原因分类测算:主要是公积金贷款支取、自有资金购房支取、纯商贷支取的预测。
图2示出了本申请实施例提供的系统架构示意图;系统采用B/S结构,布置在服务器IIS上,在网络环境下,使用者通过账号,密码可以登录到系统平台查看公积金资金的运营情况,选择要预测的模块,来查看计算未来的资金走向情况。
图3示出了本申请实施例提供的功能结构示意图;公积金预测分析系统包括登录模块、资金运行情况模块、汇缴模块、贷款回收支取预测模块、贷款回收支取预测模块、贷款新增人数预测模块、贷款新增人数预测模块和系统设置模块。其中,贷款回收支取预测模块包括商贷支取预测模块、全部支取预测模块、公积金支取预测模块和自有资金支取预测模块。
图4示出了本申请实施例提供的模块内功能结构示意图;商贷支取预测模块包括历史数据存储单元、数据预测单元和数据对比单元。
为了使得本申请实施例提供的数据预测分析方法更加清楚,现在结合下面的附图进行进一步的解释说明。
图5为本申请实施例提供的公积金数据预测分析流程图,具体可以包括如下步骤:
步骤501:获取历史数据。
步骤502:判断历史数据是否具有较强的统计规律?若不是,进入步骤503;若是,进入步骤504。
步骤503:将数据分解为趋势性的、季节性的、随机性的三个部分来建立模型,设置相应参数平滑随机性、修正趋势性、处理季节性,设置其他参数来体现政策法规对公积金各项数据的影响。进一步,转入步骤504。
步骤504:确定数据量。
步骤505:初步确定预测公式。
步骤506:对所述预测公式进行应用检验:对第n个数据预测时,用第n-1个数据作为检验数据。
步骤507:判断精度是否达标;若是,执行步骤508;若不达标,返回步骤505。
步骤508:确定预测公式。
图6a、图6b、图6c、图6d和图6e为本申请实施例提供的公积金汇缴的预测实施例示意图。
首先,通过大量的试验,选择建模所需的最小数据量,经试验选取2012至2016年连续5年的数据,作为预测2017年前3个月汇缴金额的基础数据。
从图6a可以看出,2012年1月至2016年12月汇缴金额的柱状图,发现规律性不强。但是,把2012年至2016年第一季度的汇缴金额整理出来,如图6b所示,可以发现其具有较好的规律性。
于是,在保证预测结果准确、易于实现的原则下,选择较为简单的模型,先预测出2017年第一季度的公积金汇缴金额,再通过历史数据计算出5年中1、2、3月份汇缴金额在第一季度中占比的平均值,就可以预测出2017年1、2、3月份的公积金汇缴金额,以下为预测结果及误差:
表1 2017年1、2、3月份汇缴金额预测值及误差
年月 汇缴真实值 汇缴预测值 误差
201701 150984619.1 151619399.3 0.004204271
201702 170595723.5 169803666.4 -0.004642889
201703 234398270.9 242062924 0.032699273
从表1可以看出,预测的误差在5%以内,预测精度高,预测结果具有很高的可靠性。
经过前面的分析研究,虽然2012年1月至2016年12月住房公积金汇缴金额规律性较差,但是,如果把2012年至2016年每个季度的汇缴金额整理出来,可以发现其具有较好的规律性,如图6c、图6d和图6e所示。图6c示出了2012至2016年第一季度汇缴金额,图6d示出了2012至2016年第三季度汇缴金额,图6e示出了2012至2016年第四季度汇缴金额。
于是,采取以下方法预测2017年各月公积金汇缴金额:
第一步:先按季度进行预测。具体而言,对当前年度之前连续5年的汇缴数据按季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,进而对于当前年度的每个季度进行预测,得到季度预测值。
第二步:完成按月预测。计算当前年度之前连续5年的每月在其所属季度中所占比值。
最后,用季度预测值乘以每月在其所属季度中占比均值即可得到每月的预测值。
利用此方法对2017年一季度的三个月份汇缴金额进行预测,可得2017年1、2、3月份公积金汇缴金额的预测误差分别为0.4%、-0.5%、3.3%。由此可见,该预测方法预测精度高,预测结果可信度好。
图7a、图7b、图7c和图7d为本申请实施例提供的公积金贷款回收预测实施例示意图。
对2012年至2017年各个季度的公积金贷款回收金额做图分析,可见每个季度的贷款回收金额基本上都呈现出指数增长的趋势,如图7a、图7b、图7c和图7d所示。图7a示出了2012至2017年第一季度贷款回收金额,图7b示出了2012至2017年第二季度贷款回收金额,图7c示出了2012至2017年第三季度贷款回收金额,图7d示出了2012至2017年第四季度贷款回收金额。
于是,针对每个季度,采用当前年份之前5年的公积金贷款回收金额为基本数据,利用指数模型对其进行预测。
首先,对2013年至2017年同一季度的贷款回收金额取对数。然后,对上一步所取的对数,利用最小二乘法拟合,求出预测的直线方程。最后,将上一步得到的直线方程还原回最终预测的指数方程,对当前年份所需预测季度的公积金贷款回收金额进行预测。
利用指数模型对2018年第一季度的贷款回收进行预测,预测该季度贷款回收金额为239087138.3元,而真实值为228304335.1元,误差为4.7%,预测精度高,该预测模型可靠度好。
关于公积金贷款回收的月份预测,公积金贷款回收的月份预测模型和季度模型基本一样,只是把季度的贷款回收金额换成所需预测月份之前连续7个月的贷款回收实际金额即可。
例如,要预测2018年8月的贷款回收金额,选取2018年1月至7月的贷款回收数据,对其取对数后,进行和贷款回收季度预测相同的处理方法,可以预测出2018年8月的公积金贷款回收金额为80097111元。而该月真实值为76770243.1元,误差为4.3%。同时还可以根据2018年1月至7月数据直接预测出2018年9月的数据为81000679元,而真实值为75070807.4元,误差为7.9%,预测效果较为理想。也可以用2018年2月至8月的数据,根据这个模型来预测9月的贷款回收金额。
图8a和图8b为本申请实施例提供的公积金支取总量的预测实施例示意图。图8a示出了2012年1月至2017年12月公积金总支取金额柱状图,图8b示出了2012年1月至2017年12月公积金总支取金额折线图。对2012年1月至2017年12月公积金总支取金额分别做柱状图、折线图加以分析,发现该数据不像汇缴、贷款回收金额那样具有较强的规律性。一方面,该数据随着时间的推移表现出增大的总体趋势;另一方面,又存在着季节的波动性;此外,数据还存在随机性波动。利用一般的模型对其进行预测时,误差较大,效果不好。
温特斯(winters)季节预测法是一种较为高级的平滑预测方法,这种方法的突出优点是对于同时具有趋势变动和季节变动的时间序列,分别对每种形式进行指数平滑,然后将每种形式的指数平滑结果结合起来,对原时间序列进行预测。该方法扩大了指数平滑的应用范围,提高了对兼有趋势和季节变动的时间序列预测的准确性。温特斯季节预测法以三个方程为基础。其中,每个方程用于平滑模型的三个组成部分(平稳的、趋势的和季节性的),且都含有一个有关参数。这种方法可以平滑随机性、修正倾向性、处理季节性。
温特斯季节预测法的三个基本方程如下所示:公式(5)为整体平滑基本方程,公式(6)为趋势平滑基本方程,公式(7)为季节平滑基本方程。
bt=γ(St-St-1)+(1-γ)bt-1……公式(6)
其中,p是季节长度,α,β,γ为(0,1)中的数,称为平滑参数,Yt为观测的实际值。
选用2012年的数据为基础数据,以2012年各月与2012年全年的月均值之比,作为1至12月的初始月份平滑值I1~I12,用2013年1月份的实际值作为一次平滑值St的初始值S13,以2013年一季度与2012年一季度差值的作为趋势平滑值bt的初始值b13,用预测2013年2月的总支取。然后按3个基本方程计算St,bt,It,并用对下个月的总支取金额进行预测。/>
使用此方法时,重要的是确定平滑参数α,β,γ的取值问题,平滑参数的取值合适与否,决定着预测的准确程度。经过大量实验和以往数据分析工作的实践经验,此处选择α=0.382,β=0.45,γ=0.7作为该模型的平滑参数。考虑到政策因素以及某些月份的特殊性(如春节在1月或2月份,十一长假在10月份),我们又加入政策调整因子和月份调整因子,共计5个参数。
该模型是一个逐步修正的过程,一般需要3个季节周期就会基本稳定,前面预测的数据可能不太准确,等数据修正基本稳定后,后面模型预测值比较理想。
利用上述模型对2018年1至9月的总支取金额进行预测,结果见下表:
表2 2018年1至9月份总支取金额预测值及误差
年月 总支取真实值 总支取预测值 误差
201801 194555410.8 194808106 0.001298835
201802 119831278.2 109516808.9 -0.086074934
201803 176187818.7 164441449.3 -0.066669589
201804 165931701.5 153641579.1 -0.074067356
201805 169638114.3 157595752.9 -0.070988536
201806 168492050.3 167718005.3 -0.004593956
201807 243258654.6 223811449.7 -0.079944555
201808 217509745.5 223717517.5 0.028540202
201809 211637365.2 210289441.4 -0.006369026
在对公积金重要分析支取的预测中,通过对数据的分析,发现公积金贷款支取、自有资金购房支取、纯商贷支取3项在整个公积金支取总量中,所占比重较大,三者之和占比超过了公积金支取总量的70%,所以需要分别对这三类支取进行预测。
预测方法还是以温特斯季节预测法为主,再辅以其他预测模型。对公积金贷款支取,以α=0.3,β=0.8,γ=0.025的温特斯季节预测法为主,再辅以最小二乘直线拟合及对数差分,构成组合预测模型,对2018年1至9月预测结果如下表3:
表3 2018年1至9月份公积金贷款支取金额预测值及误差
/>
对自有资金购房支取,以α=0.6,β=0.9,γ=0.06的温特斯季节预测法为主,再辅以最小二乘直线拟合及隔月环比法,构成组合预测模型,对2018年1至9月预测结果如下表4:
表4 2018年1至9月份自有资金购房支取金额预测值及误差
对纯商贷支取,以α=0.3,β=0.95,γ=0.04的温特斯季节预测法为主,再辅以最小二乘直线拟合法,构成组合预测模型,对2018年1至9月预测结果如下表:
表5 2018年1至9月份纯商贷支取金额预测值及误差
/>
对于新增贷款人数的预测。新增贷款人数影响到了公积金的支取及贷款回收,所以必须建立新增贷款人数模型(需求模型),模拟测算这类新增人群的贷款需求情况。
利用对数差分模型和加权平均模型,组合成新增贷款人数模型对2018年1至9月的新增贷款人数进行预测:
先对2012到2017年每年1,2,3月的新增贷款人数进行对数差分,去掉异常数据(绝对值大于等于0.9的对数差分值被视为异常数据),然后用剩余4个数的平均值作为2018年1至3月对数差分的预测值,再换算成该月的新增贷款人数预测值。
由于2012-2017年4到10月新增贷款人数极不规律,即使采用对数差分也无规律性可言,所以必须建立另一个模型来预测2018年4到10月的申请人数。此处采用加权平均为主的预测方法:首先对要预测月份的历史数据进行排序,目的是去掉异常数据(如果最大值和次最大值的差大于等于150,则去掉最大值,否则所有该月的历史数据都为有效数据)。考虑到政策调整因素,再加入政策调整因子即可对4到10月新增贷款人数进行预测。
采用该组合预测方法对2018年1至9月新增贷款人数进行预测,结果见下表6:
表6 2018年1至9月份新增贷款人数预测值及误差
年月 新增贷款人数真实值 新增贷款人数预测值 误差
201801 194 188 -0.03146
201802 131 128 -0.02294
201803 235 229 -0.02432
201804 366 345 -0.05738
201805 305 319 0.045027
201806 298 276 -0.07345
201807 388 363 -0.06469
201808 412 400 -0.03058
201809 279 265 -0.0509
本申请实施例提供的数据预测分析方法中的公积金预测分析系统数据库采用MSSQL Server2014数据库。SQL(Structured Query Language)是具有数据操纵和数据定义等多种功能的数据库语言,这种语言具有交互性特点,能为用户提供极大的便利,数据库管理系统应充分利用SQL语言提高计算机应用系统的工作质量与效率。SQL语言不仅能独立应用于终端,还可以作为子语言为其他程序设计提供有效助力,该程序应用中,SQL可与其他程序语言一起优化程序功能,进而为用户提供更多更全面的信息。
三层式数据访问机制,数据加密处理机制;数据加密处理机制主要对数据库的访问密码和个人密码进行机密处理,采用当前较为流行的基数据加密机制,主要方式为,采用数据技术数据方式进行加密于解密,变动加密机制时,只需修改对应的基数位置或基数值即可,实现方式简单方便,而解密极其困难。其中数据字典如表7所示:
表7model_initialdata数据基础表
可以看出,本申请实施例提供的数据预测分析方法具有准确性,通过对公积金汇缴、回收、支取等数据进行分析预测,是对公积金进行科学管理、科学决策的重要环节,所以预测结果准确与否,至关重要。对于规律性强的数据,本产品把误差控制在5%以内;对于随机性较大的数据,已基本将误差控制在10%以内,极少数数据误差较大,给出了合理的解释。
还具有易实现性,建立预测模型后,需要将模型编程实现,在保证较高预测精度的前提下,使用简单的数学模型,不涉及复杂的数学运算,模型易于实现,运行速度快。
还具有自适应性,公积金汇缴、回收、支取等数据,受房地产市场、政府及相关部门政策的影响较大,一旦房地产市场出现较大波动,或是力度较大的政策出台,相关的公积金数据就会出现大幅波动。由于政策调整或其他因素影响,个别月份与winters基本模型偏差较大,通过概率赋权、移动平滑赋权等方法调整修正系数。需要建立的数学模型具有较强的适应性,本申请实施例提供的数据预测分析方法将波动考虑在内,能够及时进行自适应调整,从而避免了连续出现预测误差较大情况的发生。
综上所述,本申请实施例提供的一种数据预测分析方法,通过接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间;根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析;将预测分析结果发送至所述客户端。提供了更加精确的公积金数据预测。
基于相同的技术构思,本申请实施例还提供了一种数据预测分析系统,如图9所示,所述系统包括:
消息接收模块901,用于接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间。
数据调取模块902,用于根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据。
预测模型匹配模块903,用于根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型。
精度校验模块904,用于根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求。
预测分析模块905,用于基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析。
消息发送模块906,用于将预测分析结果发送至所述客户端。
在一种可能的实施方式中,所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预测。
在一种可能的实施方式中,所述预测模型匹配模块903,具体用于:
根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,得到季度预测值;
将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中所占比值,得到月占比;
将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测值。
在一种可能的实施方式中,所述预测模型匹配模块903,具体用于:
根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中的相同季度的公积金贷款回收金额取对数;
将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;
将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所需预测季度或者月份的公积金贷款回收金额的预测模型。
在一种可能的实施方式中,所述预测模型匹配模块903,具体用于:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初始值S13,以所述第N+1年一季度与所述第N年一季度差值的作为趋势平滑值bt的初始值b13,按照公式(1)、(2)、(3)和(4)进行所述第N+1年的下一月份的公积金支取总量/>的预测。
基于相同的技术构思,本申请实施例还提供了一种数据预测分析设备,所述设备包括:数据采集装置、处理器和存储器;
所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行上述方法任一项所述的方法。
基于相同的技术构思,本申请实施例还提供了一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行如上述方法任一项所述的方法。
本说明书中上述方法的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。
需要说明的是,尽管在附图中以特定顺序描述了本发明方法的操作,但这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然本申请提供了如实施例或流程图的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。
上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
以上所述的具体实施例,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施例而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (6)

1.一种数据预测分析方法,其特征在于,所述方法包括:
接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间;
根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;
根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;
根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;
基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析;
将预测分析结果发送至所述客户端;
所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预测;
所述根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型,包括:根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,得到季度预测值;将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中所占比值,得到月占比;将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测值;
所述根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型,包括:根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中的相同季度的公积金贷款回收金额取对数;将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所需预测季度或者月份的公积金贷款回收金额的预测模型。
2.如权利要求1所述的方法,其特征在于,所述根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型,包括:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初始值S13,以所述第N+1年一季度与所述第N年一季度差值的作为趋势平滑值bt的初始值b13,按照如下公式进行所述第N+1年的下一月份的公积金支取总量/>的预测:
bt=γ(St-St-1)+(1-γ)bt-1
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
3.一种数据预测分析系统,其特征在于,所述系统包括:
消息接收模块,用于接收客户端发送的公积金数据预测请求,所述公积金数据预测请求携带公积金数据预测类型和公积金数据预测时间;
数据调取模块,用于根据所述公积金数据预测类型和公积金数据预测时间从数据库中调取对应的建模基础数据;
预测模型匹配模块,用于根据所述建模基础数据匹配所述公积金数据预测类型对应的预测模型;
精度校验模块,用于根据所述预测模型进行精度校验,若达到精度要求,则将所述预测模型确定为目标公积金数据预测模型;若未达到精度要求,则根据所述建模基础数据的规律更换预测模型,再进行精度校验,直到达到精度要求;
预测分析模块,用于基于所述目标公积金数据预测模型,对所述公积金数据预测类型和公积金数据预测时间进行数据预测分析;
消息发送模块,用于将预测分析结果发送至所述客户端;
所述公积金数据预测类型包括公积金汇缴金额预测、公积金贷款回收金额预测、公积金支取总量预测、公积金分项支取预测和新增贷款人数预测;
所述预测模型匹配模块,具体用于:根据从所述数据库中调取的公积金汇缴金额历史数据,将所述公积金汇缴金额历史数据按照季度汇总,利用最小二乘法拟合出每一季度的预测直线方程,得到季度预测值;将所述公积金汇缴金额历史数据按照月度汇总,计算每月在其所属季度中所占比值,得到月占比;将所述季度预测值乘以所述月占比,得到所述公积金汇缴金额的每月预测值;
所述预测模型匹配模块,具体用于:根据从所述数据库中调取的公积金贷款回收金额历史数据,对设定年度中的相同季度的公积金贷款回收金额取对数;将所述取对数之后的结果进行最小二乘法拟合,确定预测直线方程;将所述预测直线方程还原为指数方程,将所述指数方程确定为当前年份所需预测季度或者月份的公积金贷款回收金额的预测模型。
4.如权利要求3所述的系统,其特征在于,所述预测模型匹配模块,具体用于:
根据从所述数据库中调取的公积金支取总量历史数据,选取第N年的数据为基础数据,以第N年各月与第N年各月的月均值之比,作为各月的初始月份平滑值I1~I12,选取第N+1年的第一月份的实际值作为一次平滑值St的初始值S13,以所述第N+1年一季度与所述第N年一季度差值的作为趋势平滑值bt的初始值b13,按照如下公式进行所述第N+1年的下一月份的公积金支取总量/>的预测:
bt=γ(St-St-1)+(1-γ)bt-1
其中,p为季节长度,α,β,γ为(0,1)的平滑参数,Yt为观测的实际值。
5.一种数据预测分析设备,其特征在于,所述设备包括:数据采集装置、处理器和存储器;
所述数据采集装置用于采集数据;所述存储器用于存储一个或多个程序指令;所述处理器,用于执行一个或多个程序指令,用以执行如权利要求1-2任一项所述的方法。
6.一种计算机可读存储介质,其特征在于,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于执行如权利要求1-2任一项所述的方法。
CN202010256491.1A 2020-04-02 2020-04-02 一种数据预测分析方法、系统、设备及可读存储介质 Active CN111506876B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010256491.1A CN111506876B (zh) 2020-04-02 2020-04-02 一种数据预测分析方法、系统、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010256491.1A CN111506876B (zh) 2020-04-02 2020-04-02 一种数据预测分析方法、系统、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN111506876A CN111506876A (zh) 2020-08-07
CN111506876B true CN111506876B (zh) 2023-09-12

Family

ID=71872678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010256491.1A Active CN111506876B (zh) 2020-04-02 2020-04-02 一种数据预测分析方法、系统、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN111506876B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200532A (zh) * 2020-09-16 2021-01-08 北京中宣智伟科技有限公司 一种施工工期智能计算的方法及系统、计算机可读介质
CN112288158A (zh) * 2020-10-28 2021-01-29 税友软件集团股份有限公司 一种业务数据预测方法及相关装置
CN117390008B (zh) * 2023-12-11 2024-04-12 北京星球空天信息技术有限公司 多类型观测仪器的测量数据处理方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599886B1 (en) * 2006-05-15 2009-10-06 Ken Lambert System and method for allocating mortgage repayment funds
CN105120487A (zh) * 2015-09-02 2015-12-02 中国联合网络通信集团有限公司 一种业务数据预测方法及装置
CN107292429A (zh) * 2017-06-07 2017-10-24 上海欧睿供应链管理有限公司 一种基于需求特性分析的需求预测模型选择方法
CN107862476A (zh) * 2017-11-06 2018-03-30 国网山东省电力公司电力科学研究院 一种基于数据分析的计量用表需求计算方法
CN110009042A (zh) * 2019-04-08 2019-07-12 中诚信征信有限公司 一种数据预测方法、装置、电子设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7599886B1 (en) * 2006-05-15 2009-10-06 Ken Lambert System and method for allocating mortgage repayment funds
CN105120487A (zh) * 2015-09-02 2015-12-02 中国联合网络通信集团有限公司 一种业务数据预测方法及装置
CN107292429A (zh) * 2017-06-07 2017-10-24 上海欧睿供应链管理有限公司 一种基于需求特性分析的需求预测模型选择方法
CN107862476A (zh) * 2017-11-06 2018-03-30 国网山东省电力公司电力科学研究院 一种基于数据分析的计量用表需求计算方法
CN110009042A (zh) * 2019-04-08 2019-07-12 中诚信征信有限公司 一种数据预测方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭剑川 等.税收收入预测的时间序列方法选择.统计与决策.2009,(第05期),全文. *

Also Published As

Publication number Publication date
CN111506876A (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
CN111506876B (zh) 一种数据预测分析方法、系统、设备及可读存储介质
CN102663650A (zh) 一种企业信用风险分析系统及其使用方法
Hsu Investment decision making using a combined factor analysis and entropy-based topsis model
Dionne et al. Default risk in corporate yield spreads
Chen et al. A study on operational risk and credit portfolio risk estimation using data analytics
JP2016099915A (ja) 与信審査用サーバと与信審査用システム及び与信審査用プログラム
CN1971610A (zh) 一种用于评价银行贷款风险的系统及方法
Hwang et al. A two-stage probit model for predicting recovery rates
Genriha et al. Entrepreneurship insolvency risk management: a case of Latvia
TWM581252U (zh) Credit rating evaluation
Pomulev et al. Methodological aspects of credit portfolio management in financing innovative projects
US10235719B2 (en) Centralized GAAP approach for multidimensional accounting to reduce data volume and data reconciliation processing costs
Adem et al. Parametric Modeling of Probability of Bank Loan Default in Kenya
Lu Measuring the capital charge for operational risk of a bank with the large deviation approach
Niknya et al. Financial distress prediction of Tehran Stock Exchange companies using support vector machine
Zandi et al. Research on stock portfolio based on time series prediction and multi-objective optimization
Ma Study on risk spillover effects of shadow banks on traditional banks in China
CN117291702A (zh) 现金分存方法、装置、设备及存储介质
Chen et al. Risk and Return of Securities Investment in the Context of Big Data and Artificial Intelligence
RU190382U1 (ru) Автоматизированное устройство оценки эффективности перепрофилирования промышленных территорий
Sadowa The impact of COVID-19 pandemic on financing the purchase of residential real estate through a mortgage in Poland
Medvedkina et al. Check for updates Analysis of the Impact of Fintech on the Economy: Japan and Russia Case
Dzidzevičiūtė Possibilities of the Statistical Scoring Models' Application at Lithuanian Banks
CN115879608A (zh) 资源信息预测方法、装置、计算机设备和存储介质
Huang et al. Evaluating Cryptocurrency Market Risk on the Blockchain: An Empirical Study Using the ARMA-GARCH-VaR Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant