CN105139079A - 一种基于混合模型的税收收入预测方法及装置 - Google Patents

一种基于混合模型的税收收入预测方法及装置 Download PDF

Info

Publication number
CN105139079A
CN105139079A CN201510467901.6A CN201510467901A CN105139079A CN 105139079 A CN105139079 A CN 105139079A CN 201510467901 A CN201510467901 A CN 201510467901A CN 105139079 A CN105139079 A CN 105139079A
Authority
CN
China
Prior art keywords
model
predicted value
sequence
support vector
nerve network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510467901.6A
Other languages
English (en)
Inventor
陈乐华
张青
涂继来
黄晓晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shi Yun Information Technology Co Ltd
Original Assignee
Guangzhou Shi Yun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shi Yun Information Technology Co Ltd filed Critical Guangzhou Shi Yun Information Technology Co Ltd
Priority to CN201510467901.6A priority Critical patent/CN105139079A/zh
Publication of CN105139079A publication Critical patent/CN105139079A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于混合模型的税收收入预测方法及装置,方法包括:利用支持向量回归模型的测试数据序列对训练数据序列进行测试,得到支持向量回归模型的预测值;利用自回归移动平均模型的测试数据序列对训练数据序列进行测试,得到自回归移动平均模型的预测值;利用人工神经网络模型的测试数据序列对训练数据序列进行测试,得到人工神经网络模型的预测值;将支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值分别代入混合模型中,计算出税收收入预测值。实施本发明的基于混合模型的税收收入预测方法及装置,具有以下有益效果:能将各种模型的优势进行很好地结合、模型参数具有自适应调节的能力、预测精度较高。

Description

一种基于混合模型的税收收入预测方法及装置
技术领域
本发明涉及税收收入预测领域,特别涉及一种基于混合模型的税收收入预测方法及装置。
背景技术
目前我国各地税务机构所使用的统计预测工具大多是国外软件,例如EViews、SPSSmodeler和SAS等,这些软件价格昂贵,并且用户体验不大符合中国国情,内置的算法模型比较适合西方发达国家体系,因此,我国各地需要一整套适合各自的预测软件和算法模型。
我国目前现行的税收收入预测模型包括回归、时间序列和人工神经网络等。这些模型的建立或是关注税收收入与相关经济要素,或是发掘税收收入自身的规律特点,各种模型有各自的适用范围和优势,但现有技术中不能将各种模型的优势进行很好地结合。但随着数据挖掘和机器学习理论的进一步发展,各种税收收入预测模型有较大需要细化提高的空间,同时也存在若干难点,总结为如下两方面:
首先,预测模型需要创新研究。现行的税收收入预测往往基于指数平滑法、时间序列法等较为传统的预测模型,虽然时间序列法以税种自身的发展变化为重点,在这方面有着天然的优势。但是随着大数据的出现、数据挖掘的发展和机器学习的深入,涌现出支持向量机、组合建模等先进的建模的理论,需要引入到税收收入预测中来。其次,模型参数需要自适应调节。比如人工神经网络具有较好的容错和容差能力,但在神经网络结构上有很多人为因素,且模型的复杂性使其不能精确预测每一个系统参数,从而导致模型的泛化能力较差。但现有传统的预测模型的模型参数不具有自适应调节的能力,导致预测精度不高。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述不能将各种模型的优势进行很好地结合、模型参数不具有自适应调节的能力、预测精度不高的缺陷,提供一种能将各种模型的优势进行很好地结合、模型参数具有自适应调节的能力、预测精度较高的无线自拍系统及方法。
本发明解决其技术问题所采用的技术方案是:构造一种基于混合模型的税收收入预测方法,包括如下步骤:
A)获取税收收入预测样本序列,并将其作为训练数据序列;
B)利用支持向量回归模型的测试数据序列对所述训练数据序列进行测试,得到支持向量回归模型的预测值;
C)利用自回归移动平均模型的测试数据序列对所述训练数据序列进行测试,得到自回归移动平均模型的预测值;
D)利用人工神经网络模型的测试数据序列对所述训练数据序列进行测试,得到人工神经网络模型的预测值;
E)将所述支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值分别代入混合模型中,计算出税收收入预测值;所述混合模型中税收收入预测值为一常数项与一含有所述支持向量回归模型的预测值、自回归移动平均模型的预测值、人工神经网络模型的预测值和自适应回归参数的表达式之和;
所述步骤B)、步骤C)和步骤D)是并行执行的。
在本发明所述的基于混合模型的税收收入预测方法中,所述步骤E)中的混合模型为y=β01X12X23X3+e;其中,其中,y为税收收入预测值,β0为常数项,β1为第一回归参数,X1为支持向量回归模型的预测值,β2为第二回归参数,X2为自回归移动平均模型的预测值,β3为第三回归参数,X3为人工神经网络模型的预测值,e为残差。
在本发明所述的基于混合模型的税收收入预测方法中,所述步骤B)进一步包括:
B1)对所述训练数据序列进行对数变换,并取嵌入维度为二维,建立训练样本;
B2)通过交叉配对实验,选择对应的核函数及相关参数;
B3)建立以不敏感函数为损失函数的支持向量回归模型;
B4)根据所述核函数及相关参数,利用所述支持向量回归模型求解相应的二次规划问题,并得到相应的回归函数;
B5)将所述训练样本代入所述回归函数中,通过计算得到所述支持向量回归模型的预测值。
在本发明所述的基于混合模型的税收收入预测方法中,所述步骤C)进一步包括:
C1)对所述训练数据序列取对数,将其转换为呈线性趋势的样本序列;
C2)采用单位根检验法判断所述样本序列是否为非平稳序列,如是,对所述样本序列进行一阶差分处理,执行步骤C3);否则,执行步骤C4);
C3)判断差分处理后的样本序列是否通过ADF检验,如是,认定所述差分处理后的样本序列是平稳序列,执行步骤C4);否则,对所述差分处理后的样本序列进行比当前差分阶数高一阶的差分处理,并继续进行本步骤的判断;
C4)从非季节性模型、季节性模型和乘积模型中选择相应的模型;
C5)利用选择的模型对所述平稳序列进行估计,并对估计结果进行白噪声检测,判断是否通过检测,如是,则接受所述选择的模型,执行步骤C6);否则,返回步骤C4)再次进行选择;
C6)利用所述选择的模型计算所述自回归移动平均模型的预测值。
在本发明所述的基于混合模型的税收收入预测方法中,所述步骤D)进一步包括:
D1)根据所述训练数据序列随机确定初始矩阵;
D2)建立人工神经网络模型,并用学习数据计算网络输出;
D3)用反向公式对所述人工神经网络模型进行修正,直到用完所述学习数据时,得到最终的人工神经网络模型;
D4)根据所述最终的人工神经网络模型计算出所述人工神经网络模型的预测值。
本发明还涉及一种实现上述基于混合模型的税收收入预测方法的装置,包括:
训练数据序列获取单元:用于获取税收收入预测样本序列,并将其作为训练数据序列;
支持向量回归预测值获取单元:用于利用支持向量回归模型的测试数据序列对所述训练数据序列进行测试,得到支持向量回归模型的预测值;
自动回归移动平均预测值获取单元:用于利用自回归移动平均模型的测试数据序列对所述训练数据序列进行测试,得到自回归移动平均模型的预测值;
人工神经网络预测值获取单元:用于利用人工神经网络模型的测试数据序列对所述训练数据序列进行测试,得到人工神经网络模型的预测值;
税收收入预测值获取单元:用于将所述支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值分别代入混合模型中,计算出税收收入预测值;所述混合模型中税收收入预测值为一常数项与一含有所述支持向量回归模型的预测值、自回归移动平均模型的预测值、人工神经网络模型的预测值和自适应回归参数的表达式之和。
在本发明所述的装置中,所述税收收入预测值获取单元中的混合模型为y=β01X12X23X3+e;其中,其中,y为税收收入预测值,β0为常数项,β1为第一回归参数,X1为支持向量回归模型的预测值,β2为第二回归参数,X2为自回归移动平均模型的预测值,β3为第三回归参数,X3为人工神经网络模型的预测值,e为残差。
在本发明所述的装置中,所述支持向量回归预测值获取单元进一步包括:
训练样本建立模块:用于对所述训练数据序列进行对数变换,并取嵌入维度为二维,建立训练样本;
函数参数选择模块:用于通过交叉配对实验,选择对应的核函数及相关参数;
支持向量回归模型建立模块:用于建立以不敏感函数为损失函数的支持向量回归模型;
回归函数获取模块:用于根据所述核函数及相关参数,利用所述支持向量回归模型求解相应的二次规划问题,并得到相应的回归函数;
训练样本代入计算模块:用于将所述训练样本代入所述回归函数中,通过计算得到所述支持向量回归模型的预测值。
在本发明所述的装置中,所述自动回归移动平均预测值获取单元进一步包括:
样本序列转换模块:用于对所述训练数据序列取对数,将其转换为呈线性趋势的样本序列;
非平稳序列判断模块:用于采用单位根检验法判断所述样本序列是否为非平稳序列,如是,对所述样本序列进行一阶差分处理;否则,选择相应的模型;
ADF检验判断模块:用于判断差分处理后的样本序列是否通过ADF检验,如是,认定所述差分处理后的样本序列是平稳序列;否则,对所述差分处理后的样本序列进行比当前差分阶数高一阶的差分处理,并继续进行ADF检验的判断;
模型选择模块:用于从非季节性模型、季节性模型和乘积模型中选择相应的模型;
估计检测模块:用于利用选择的模型对所述平稳序列进行估计,并对估计结果进行白噪声检测,判断是否通过检测,如是,则接受所述选择的模型;否则,再次进行选择相应的模型;
自回归移动平均预测值计算模块:用于利用所述选择的模型计算所述自回归移动平均模型的预测值。
在本发明所述的装置中,所述人工神经网络预测值获取单元进一步包括:
初始矩阵确定模块:用于根据所述训练数据序列随机确定初始矩阵;
人工神经网络模型建立模块:用于建立人工神经网络模型,并用学习数据计算网络输出;
模型修正模块:用于用反向公式对所述人工神经网络模型进行修正,直到用完所述学习数据时,得到最终的人工神经网络模型;
人工神经网络预测值计算模块:用于根据所述最终的人工神经网络模型计算出所述人工神经网络模型的预测值。
实施本发明的基于混合模型的税收收入预测方法及装置,具有以下有益效果:由于混合模型将支持向量回归模型、自回归移动平均模型和人工神经网络模型结合起来,这样就将三个模型的优势进行了结合,这样在对税收收入进行预测时,分析就会比较全面,同时由于混合模型中的回归参数为自适应回归参数,也就是回归参数是自适应调节的,这样可根据实际情况来调节回归参数的大小,有利于提高税收收入预测的精度,所以其能将各种模型的优势进行很好地结合、模型参数具有自适应调节的能力、预测精度较高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于混合模型的税收收入预测方法及装置一个实施例中方法的流程图;
图2为所述实施例中利用支持向量回归模型的测试数据序列对训练数据序列进行测试,得到支持向量回归模型的预测值的具体流程图;
图3为所述实施例中利用自回归移动平均模型的测试数据序列对训练数据序列进行测试,得到自回归移动平均模型的预测值的具体流程图;
图4为所述实施例中逐年的税收收入数值分布示意图;
图5为所述实施例中利用人工神经网络模型的测试数据序列对训练数据序列进行测试,得到人工神经网络模型的预测值的具体流程图;
图6为所述实施例中装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明基于混合模型的税收收入预测方法及装置实施例中,其基于混合模型的税收收入预测方法的流程图如图1所示。图1中,该基于混合模型的税收收入预测方法包括如下步骤:
步骤S01获取税收收入预测样本序列,并将其作为训练数据序列:本步骤中,获取税收收入预测样本序列,并将其作为训练数据序列。
步骤S02利用支持向量回归模型的测试数据序列对训练数据序列进行测试,得到支持向量回归模型的预测值:本步骤中,利用支持向量回归模型的测试数据序列对训练数据序列进行测试,得到支持向量回归模型的预测值。关于如何得到支持向量回归模型的预测值,后续会对进行详细描述。
步骤S03利用自回归移动平均模型的测试数据序列对训练数据序列进行测试,得到自回归移动平均模型的预测值:本步骤中,利用自回归移动平均模型的测试数据序列对训练数据序列进行测试,得到自回归移动平均模型的预测值。关于如何得到自回归移动平均模型的预测值,后续会对进行详细描述。
步骤S04利用人工神经网络模型的测试数据序列对训练数据序列进行测试,得到人工神经网络模型的预测值:本步骤中,利用人工神经网络模型的测试数据序列对训练数据序列进行测试,得到人工神经网络模型的预测值。关于如何得到人工神经网络模型的预测值,后续会进行详细描述。
步骤S05将支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值分别代入混合模型中,计算出税收收入预测值:本步骤中,将支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值分别代入混合模型中,计算出税收收入预测值。值得一提的是,混合模型中税收收入预测值为一常数项与一含有支持向量回归模型的预测值、自回归移动平均模型的预测值、人工神经网络模型的预测值和自适应回归参数的表达式之和。值得一提的是,本实施例中,支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值都是月度预测值,当然,在本实施例的一些情况下,上述支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值也可以是季度预测值或年度预测值。
值得一提的是,上述步骤S02、步骤S03和步骤S04是并行执行的,也就是步骤S02、步骤S03和步骤S04的执行没有先后顺序,例如:执行的先后顺序可以是步骤S02、步骤S03和步骤S04,也可以是步骤S02、步骤S04和步骤S03,也可以是步骤S03、步骤S02和步骤S04,也可以是步骤S03、步骤S04和步骤S02,也可以是步骤S04、步骤S02和步骤S03,也可以是步骤S04、步骤S03和步骤S02。
本实施例中,该混合模型主要包括支持向量回归模型、自回归移动平均模型和人工神经网络模型,也就是将三个模型的预测值(预测结果)通过线性回归得出组合模型(也就是混合模型),同时,建立自适应回归参数调节过程,利用包含上年最新历史数据及变换来确定模型参数,预测下一年度税收收入。
本实施例中,上述步骤S05中的,具体来讲,上述步骤S05中提到的混合模型具体如下:y=β01X12X23X3+e;其中,y为税收收入预测值,β0为常数项,β1为第一回归参数,X1为支持向量回归模型的预测值,β2为第二回归参数,X2为自回归移动平均模型的预测值,β3为第三回归参数,X3为人工神经网络模型的预测值,X1、X2和X3在该混合模型中为自变量,e为残差,具体的,e为去除3个自变量对税收预测影响后的随机误差。其中,β1、β2和β3都是自适应回归参数,也就是其大小可根据具体情况进行相应调整。模型参数是模型拟合的关键因素,传统对模型进行拟合时,通常的做法是凭经验固定建模参数,对样本数据进行预测;或者验证有限个数的参数后确定。本实施例中采用动态最优法确定建模参数,也就是使用自适应回归参数进行动态调节。
本实施例中,通过在混合模型中叠加残差,是为了进一步提高对税收收入的预测精度。当然,在本实施例的一些情况,该混合模型还可以进一步扩充,也就是进一步将其他税收收入模型也包含进来,这时就需要在混合模型中增加一项该税收收入模型与其对应的回归参数的乘积就可以了,这样就能更进一步提高税收收入的预测精度。
由于混合模型将支持向量回归模型、自回归移动平均模型和人工神经网络模型结合起来,这样就将三个模型的优势进行了结合,这样在对税收收入进行预测时,分析就会比较全面,同时由于混合模型中的回归参数为自适应回归参数,也就是回归参数是自适应调节的,这样可根据实际情况来调节回归参数的大小,有利于提高税收收入预测的精度,所以其能将各种模型的优势进行很好地结合、模型参数具有自适应调节的能力、预测精度较高。
对于本实施例而言,上述步骤S02还可进一步细化,其细化后的流程图如图2所示。图2中,上述步骤S02进一步包括:
步骤S21对训练数据序列进行对数变换,并取嵌入维度为二维,建立训练样本:本步骤中,对训练数据序列进行对数变换(也就是对训练数据序列取对数),并取嵌入维度为二维,建立训练样本。
步骤S22通过交叉配对实验,选择对应的核函数及相关参数:本步骤中,根据Mercer定理,通过交叉配对实验,选择对应的核函数及相关参数。Mercer定理是解决核函数定义的一个定理,其重新规范描述了任何半正定对称函数都可以作为核函数。
步骤S23建立以不敏感函数为损失函数的支持向量回归模型:本步骤中,建立以不敏感函数为损失函数的支持向量回归模型。
步骤S24根据核函数及相关参数,利用支持向量回归模型求解相应的二次规划问题,并得到相应的回归函数:本步骤中,根据上述核函数及相关参数,利用支持向量回归模型求解相应的二次规划问题,然后得到回归函数。
具体来讲,回归函数标记为f(x),f(x)如下:
f ( x ) = b + Σ i , j = 1 t ( a i - α i ′ ) K ( x i , x j ) , 当αj∈(0,C)
上式中,b表示偏移量,αi和α′i表示拉格朗日乘子,且αi>0,α′i>0,K(xi,xj)表示核函数(这里是高斯核函数),C表示精度的规则化因子,即cost值,无上限,是大于0的常数,其用于平衡经验风险和模型复杂度,控制对超出样本的精度的样本进行惩罚情况。
步骤S25将训练样本代入回归函数中,通过计算得到支持向量回归模型的预测值:本步骤中,将训练样本代入回归函数中,通过计算得到支持向量回归模型的预测值。这样就得到了支持向量回归模型的预测值。
对于本实施例而言,上述步骤S03还可进一步细化,其细化后的流程图如图3所示。图3中,上述步骤S03进一步包括:
步骤S31对训练数据序列取对数,将其转换为呈线性趋势的样本序列:本步骤中,本步骤中,对训练数据序列对对数,将该训练数据序列转换为呈线性趋势的样本序列。
步骤S32采用单位根检验法判断所述样本序列是否为非平稳序列:本步骤中,采用单位根检验法判断所述样本序列是否为非平稳序列,如果判断的结果为是,则执行步骤S32;否则,执行步骤S36。
步骤S32对样本序列进行一阶差分处理:本步骤中,对样本序列进行一阶差分处理。执行完本步骤,执行步骤S33。
步骤S33判断差分处理后的样本序列是否通过ADF检验:本步骤中,判断差分处理后的样本序列是否通过ADF检验,也就是判断差分结果是否能通过ADF检验,如果判断的结果为是,则执行步骤S35;否则,执行步骤S34。
步骤S34对差分处理后的样本序列进行比当前差分阶数高一阶的差分处理:如果上述步骤S33的判断结果为否,则执行本步骤。本步骤中,对差分处理后的样本序列进行比当前差分阶数高一阶的差分处理,也就是进行二阶差分处理。执行完本步骤,返回步骤S33继续进行判断,如果不能通过ADF检验,则进行更高阶差分处理,直到通过ADF检验为止。
步骤S35认定差分处理后的样本序列是平稳序列:如果上述步骤S24的判断结果为是,则执行本步骤。本步骤中,认定差分处理后的样本序列是平稳序列。执行完本步骤,执行步骤S36。
步骤S36从非季节性模型、季节性模型和乘积模型中选择相应的模型:本步骤中,从非季节性模型、季节性模型和乘积模型中选择相应的模型,也就是确定是使用非季节性模型、季节性模型还是乘积模型。
按照过往经验来说,我国各地区的季度、月度或周度的税收收入具有比较大的季节性波动,即:逐年的季度、月度或周度税收收入数值在长期来说呈“S”型,且基本都是非平稳的特征序列,请参见图4,图4为本实施例中逐年的税收收入数值分布示意图。针对税收收入预测,采用非平稳序列的季节性模型,并且只适用于季度、月度或周度的税收收入的预测过程。
求自回归移动平均模型,简记为ARIMA(p,d,q)模型,其中p,d,q分别表示自回归模型的阶数、差分阶数和移动平均模型的阶数。对于非平稳季节性时间序列,在经过D次季节差分之后转换为平稳的序列ut,在此基础上可以建立关于周期长度为s的P阶自回归Q阶移动平均季节时间序列模型:
其中:L表示时间滞后的算子;表示L的p阶特征多项式,即一个平稳的自回归算子,Θq(L)则表示L的q阶特征多项式,即一个可逆的移动平均算子;下标P、Q、p、q分别表示季节自回归算子的最大滞后阶数、季节移动平均算子的最大滞后阶数、非季节自回归算子的最大滞后阶数、非季节移动平均算子的最大滞后阶数;Ap是一个可逆的自回归计算过程;表示差分算子,yt表示季节性时间序列样本;BQ表示一个可逆的移动平均计算过程;υt表示白噪声随机计算过程,即当一常数在其协方差函数delay=0(即常说的“零均值”)时不为0,在delay不等于0时值为零,换句话说,样本点互不相关。最后,周期长度s的识别可以通过对实际问题的分析、时间序列图以及时间序列的相关图和偏相关图分析得到。
步骤S37利用选择的模型对平稳序列进行估计,并对估计结果进行白噪声检测,判断是否通过检测:本步骤中,利用选择的模型对平稳序列进行估计,并对估计结果进行白噪声检测,判断是否通过检测,如果判断的结果为是,则执行步骤S38;否则,返回步骤S36。
步骤S38接受选择的模型:如果上述步骤S37的判断结果为是,则执行本步骤。本步骤中,接受所选择的模型。执行完本步骤,执行步骤S39。
步骤S39利用选择的模型计算自回归移动平均模型的预测值:本步骤中,利用选择的模型计算自回归移动平均模型的预测值。这样就得到了自回归移动平均模型的预测值。自回归移动平均模型就是将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个数学模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。
对于本实施例而言,上述步骤S04还可进一步细化,其细化后的流程图如图5所示。图5中,上述步骤S04进一步包括:
步骤S41根据训练数据序列随机确定初始矩阵:本步骤中,根据训练数据序列随机确定初始矩阵。
步骤S42建立人工神经网络模型,并用学习数据计算网络输出:本步骤中,建立人工神经网络模型,并用学习数据计算网络输出。人工神经网络模型用于解决分类和回归问题。
步骤S43用反向公式对人工神经网络模型进行修正,直到用完学习数据时,得到最终的人工神经网络模型:本步骤中,用反向公式对人工神经网络模型进行修正,直到用完学习数据,这时就会得到最终的人工神经网络模型。
经过分析,我国税务行业的人工神经网络模型可以归纳为“多层前馈网络类型”,上述最终的人工神经网络模型下的输入和输出关系可以表示为:
u 1 ( i ) = Σ j = 1 N 0 w 1 ( i , j ) a 0 ( j ) + θ 1 ( i ) , a 1 ( i ) = f ( u 1 ( i ) ) , 1 ≤ i ≤ N 1 u 2 ( i ) = Σ j = 1 N 1 w 2 ( i , j ) a 1 ( j ) + θ 2 ( i ) , a 2 ( i ) = f ( u 2 ( i ) ) , 1 ≤ i ≤ N 2 ... ... ... ... ... ... ... ... ... ... ... ... u L ( i ) = Σ j = 1 N L - 1 w L ( i , j ) a L - 1 ( j ) + θ L - 1 ( i ) , a L ( i ) = f ( u L ( i ) ) , 1 ≤ i ≤ N L
上述最终的人工神经网络模型表示的是该神经网络有N0个神经元,网络共有L层,其中输出层为第L层。其中,UL(i)表示第L层的第i个神经元所接受的信息,WL(i,j)表示从第L-1层的第j个神经元到第L层的第i个神经元的权重,aL(i)表示第L层的第i个神经元的输出,aL(j)表示输入的第j个分量,f(uL(i))表示用线性方程输出aL(i)值,θL-1(i)表示第L-1层神经元的阈值。
步骤S44根据最终的人工神经网络模型计算出人工神经网络模型的预测值:本步骤中,根据最终的人工神经网络模型计算出人工神经网络模型的预测值。这样就得到了人工神经网络模型的预测值。
值得一的是,在本实施例的一些情况下,在对税收收入进行预测时,也可以采用改良算法可以通过excel的宏命令完成预测输出,需要把上述多个步骤中的公式通过VB编写成宏脚本,让excel加载该宏,然后在excel的菜单“文件-选项-加载项”中选择该编译后的宏脚本进行加载,就能对指定excel中数据区域进行预测输出。该方案需要用户熟悉vb编程语言以及excel的操作完成。因为需要重新编译的缘故,修改其中的各变量参数不是很方便。实际应用中,可根据具体情况选择相应的方案。
本实施例还涉及一种实现上述基于混合模型的税收收入预测方法的装置,其结构示意图如图6所示。图6中,该装置包括训练数据序列获取单元1、支持向量回归预测值获取单元2、自动回归移动平均预测值获取单元3、人工神经网络预测值获取单元4和税收收入预测值获取单元5;其中,训练数据序列获取单元1用于获取税收收入预测样本序列,并将其作为训练数据序列;支持向量回归预测值获取单元2用于利用支持向量回归模型的测试数据序列对训练数据序列进行测试,得到支持向量回归模型的预测值;自动回归移动平均预测值获取单元3用于利用自回归移动平均模型的测试数据序列对训练数据序列进行测试,得到自回归移动平均模型的预测值;人工神经网络预测值获取单元4用于利用人工神经网络模型的测试数据序列对训练数据序列进行测试,得到人工神经网络模型的预测值;税收收入预测值获取单元5用于将支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值分别代入混合模型中,计算出税收收入预测值;该混合模型中税收收入预测值为一常数项与一含有支持向量回归模型的预测值、自回归移动平均模型的预测值、人工神经网络模型的预测值和自适应回归参数的表达式之和。由于混合模型将支持向量回归模型、自回归移动平均模型和人工神经网络模型结合起来,这样就将三个模型的优势进行了结合,这样在对税收收入进行预测时,分析就会比较全面,同时由于混合模型中的回归参数为自适应回归参数,也就是回归参数是自适应调节的,这样可根据实际情况来调节回归参数的大小,有利于提高税收收入预测的精度,所以其能将各种模型的优势进行很好地结合、模型参数具有自适应调节的能力、预测精度较高。
本实施例中,上述税收收入预测值获取单元5中的混合模型为y=β01X12X23X3+e;其中,y为税收收入预测值,β0为常数项,β1为第一回归参数,X1为支持向量回归模型的预测值,β2为第二回归参数,X2为自回归移动平均模型的预测值,β3为第三回归参数,X3为人工神经网络模型的预测值,e为残差。
本实施例中,支持向量回归预测值获取单元2进一步包括训练样本建立模块21、函数参数选择模块22、支持向量回归模型建立模块23、回归函数获取模块24和训练样本代入计算模块25;其中,训练样本建立模块21用于对训练数据序列进行对数变换,并取嵌入维度为二维,建立训练样本;函数参数选择模块22用于通过交叉配对实验,选择对应的核函数及相关参数;支持向量回归模型建立模块23用于建立以不敏感函数为损失函数的支持向量回归模型;回归函数获取模块24用于根据核函数及相关参数,利用支持向量回归模型求解相应的二次规划问题,并得到相应的回归函数;训练样本代入计算模块25用于将训练样本代入回归函数中,通过计算得到支持向量回归模型的预测值。
本实施例中,自动回归移动平均预测值获取单元3进一步包括样本序列转换模块31、非平稳序列判断模块32、ADF检验判断模块33、模型选择模块34、估计检测模块35和自回归移动平均预测值计算模块36;其中,样本序列转换模块31用于对训练数据序列取对数,将其转换为呈线性趋势的样本序列;非平稳序列判断模块32用于采用单位根检验法判断样本序列是否为非平稳序列,如是,对样本序列进行一阶差分处理;否则,选择相应的模型;ADF检验判断模块33用于判断差分处理后的样本序列是否通过ADF检验,如是,认定差分处理后的样本序列是平稳序列;否则,对差分处理后的样本序列进行比当前差分阶数高一阶的差分处理,并继续进行ADF检验的判断;模型选择模块34用于从非季节性模型、季节性模型和乘积模型中选择相应的模型;估计检测模块35用于利用选择的模型对平稳序列进行估计,并对估计结果进行白噪声检测,判断是否通过检测,如是,则接受选择的模型;否则,再次进行选择相应的模型;自回归移动平均预测值计算模块36用于利用选择的模型计算所述自回归移动平均模型的预测值。
本实施例中,人工神经网络预测值获取单元4进一步包括初始矩阵确定模块41、人工神经网络模型建立模块42、模型修正模块43和人工神经网络预测值计算模块44;其中,初始矩阵确定模块41用于根据训练数据序列随机确定初始矩阵;人工神经网络模型建立模块42用于建立人工神经网络模型,并用学习数据计算网络输出;模型修正模块43用于用反向公式对人工神经网络模型进行修正,直到用完学习数据时,得到最终的人工神经网络模型;人工神经网络预测值计算模块44用于根据最终的人工神经网络模型计算出人工神经网络模型的预测值。
总之,在本实施例中,各地通过对当地的增值税收收入的预测结果与同期增值税收收入的真实数值比较分析,不仅可以发现非经济因素变量对增值税收收入的影响,不断完善的税收收入预测模型,还可以指定相应的政策措施在影响增值税的同时调节整个地区的经济状况。所以,利用统计建模的思想(也就是利用混合模型)对经济变量进行分析预测,不仅为当地税务部门指定年度税收计划提供数据支撑,并根据当地经济发展的实际情况,制定季度、年度的税收收入预测模型,实时追踪税收计划的完成进度,衡量增值税目标完成情况,为后续税源管理、税收征管等工作提供很大的帮助。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于混合模型的税收收入预测方法,其特征在于,包括如下步骤:
A)获取税收收入预测样本序列,并将其作为训练数据序列;
B)利用支持向量回归模型的测试数据序列对所述训练数据序列进行测试,得到支持向量回归模型的预测值;
C)利用自回归移动平均模型的测试数据序列对所述训练数据序列进行测试,得到自回归移动平均模型的预测值;
D)利用人工神经网络模型的测试数据序列对所述训练数据序列进行测试,得到人工神经网络模型的预测值;
E)将所述支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值分别代入混合模型中,计算出税收收入预测值;所述混合模型中税收收入预测值为一常数项与一含有所述支持向量回归模型的预测值、自回归移动平均模型的预测值、人工神经网络模型的预测值和自适应回归参数的表达式之和;
所述步骤B)、步骤C)和步骤D)是并行执行的。
2.根据权利要求1所述的基于混合模型的税收收入预测方法,其特征在于,所述步骤E)中的混合模型为y=β01X12X23X3+e;其中,y为税收收入预测值,β0为常数项,β1为第一回归参数,X1为支持向量回归模型的预测值,β2为第二回归参数,X2为自回归移动平均模型的预测值,β3为第三回归参数,X3为人工神经网络模型的预测值,e为残差。
3.根据权利要求1或2所述的基于混合模型的税收收入预测方法,其特征在于,所述步骤B)进一步包括:
B1)对所述训练数据序列进行对数变换,并取嵌入维度为二维,建立训练样本;
B2)通过交叉配对实验,选择对应的核函数及相关参数;
B3)建立以不敏感函数为损失函数的支持向量回归模型;
B4)根据所述核函数及相关参数,利用所述支持向量回归模型求解相应的二次规划问题,并得到相应的回归函数;
B5)将所述训练样本代入所述回归函数中,通过计算得到所述支持向量回归模型的预测值。
4.根据权利要求1或2所述的基于混合模型的税收收入预测方法,其特征在于,所述步骤C)进一步包括:
C1)对所述训练数据序列取对数,将其转换为呈线性趋势的样本序列;
C2)采用单位根检验法判断所述样本序列是否为非平稳序列,如是,对所述样本序列进行一阶差分处理,执行步骤C3);否则,执行步骤C4);
C3)判断差分处理后的样本序列是否通过ADF检验,如是,认定所述差分处理后的样本序列是平稳序列,执行步骤C4);否则,对所述差分处理后的样本序列进行比当前差分阶数高一阶的差分处理,并继续进行本步骤的判断;
C4)从非季节性模型、季节性模型和乘积模型中选择相应的模型;
C5)利用选择的模型对所述平稳序列进行估计,并对估计结果进行白噪声检测,判断是否通过检测,如是,则接受所述选择的模型,执行步骤C6);否则,返回步骤C4)再次进行选择;
C6)利用所述选择的模型计算所述自回归移动平均模型的预测值。
5.根据权利要求1或2所述的基于混合模型的税收收入预测方法,其特征在于,所述步骤D)进一步包括:
D1)根据所述训练数据序列随机确定初始矩阵;
D2)建立人工神经网络模型,并用学习数据计算网络输出;
D3)用反向公式对所述人工神经网络模型进行修正,直到用完所述学习数据时,得到最终的人工神经网络模型;
D4)根据所述最终的人工神经网络模型计算出所述人工神经网络模型的预测值。
6.一种实现如权利要求1所述的基于混合模型的税收收入预测方法的装置,其特征在于,包括:
训练数据序列获取单元:用于获取税收收入预测样本序列,并将其作为训练数据序列;
支持向量回归预测值获取单元:用于利用支持向量回归模型的测试数据序列对所述训练数据序列进行测试,得到支持向量回归模型的预测值;
自动回归移动平均预测值获取单元:用于利用自回归移动平均模型的测试数据序列对所述训练数据序列进行测试,得到自回归移动平均模型的预测值;
人工神经网络预测值获取单元:用于利用人工神经网络模型的测试数据序列对所述训练数据序列进行测试,得到人工神经网络模型的预测值;
税收收入预测值获取单元:用于将所述支持向量回归模型的预测值、自回归移动平均模型的预测值和人工神经网络模型的预测值分别代入混合模型中,计算出税收收入预测值;所述混合模型中税收收入预测值为一常数项与一含有所述支持向量回归模型的预测值、自回归移动平均模型的预测值、人工神经网络模型的预测值和自适应回归参数的表达式之和。
7.根据权利要求6所述的装置,其特征在于,所述税收收入预测值获取单元中的混合模型为y=β01X12X23X3+e;其中,其中,y为税收收入预测值,β0为常数项,β1为第一回归参数,X1为支持向量回归模型的预测值,β2为第二回归参数,X2为自回归移动平均模型的预测值,β3为第三回归参数,X3为人工神经网络模型的预测值,e为残差。
8.根据权利要求6或7所述的装置,其特征在于,所述支持向量回归预测值获取单元进一步包括:
训练样本建立模块:用于对所述训练数据序列进行对数变换,并取嵌入维度为二维,建立训练样本;
函数参数选择模块:用于通过交叉配对实验,选择对应的核函数及相关参数;
支持向量回归模型建立模块:用于建立以不敏感函数为损失函数的支持向量回归模型;
回归函数获取模块:用于根据所述核函数及相关参数,利用所述支持向量回归模型求解相应的二次规划问题,并得到相应的回归函数;
训练样本代入计算模块:用于将所述训练样本代入所述回归函数中,通过计算得到所述支持向量回归模型的预测值。
9.根据权利要求6或7所述的装置,其特征在于,所述自动回归移动平均预测值获取单元进一步包括:
样本序列转换模块:用于对所述训练数据序列取对数,将其转换为呈线性趋势的样本序列;
非平稳序列判断模块:用于采用单位根检验法判断所述样本序列是否为非平稳序列,如是,对所述样本序列进行一阶差分处理;否则,选择相应的模型;
ADF检验判断模块:用于判断差分处理后的样本序列是否通过ADF检验,如是,认定所述差分处理后的样本序列是平稳序列;否则,对所述差分处理后的样本序列进行比当前差分阶数高一阶的差分处理,并继续进行ADF检验的判断;
模型选择模块:用于从非季节性模型、季节性模型和乘积模型中选择相应的模型;
估计检测模块:用于利用选择的模型对所述平稳序列进行估计,并对估计结果进行白噪声检测,判断是否通过检测,如是,则接受所述选择的模型;否则,再次进行选择相应的模型;
自回归移动平均预测值计算模块:用于利用所述选择的模型计算所述自回归移动平均模型的预测值。
10.根据权利要求6或7所述的装置,其特征在于,所述人工神经网络预测值获取单元进一步包括:
初始矩阵确定模块:用于根据所述训练数据序列随机确定初始矩阵;
人工神经网络模型建立模块:用于建立人工神经网络模型,并用学习数据计算网络输出;
模型修正模块:用于用反向公式对所述人工神经网络模型进行修正,直到用完所述学习数据时,得到最终的人工神经网络模型;
人工神经网络预测值计算模块:用于根据所述最终的人工神经网络模型计算出所述人工神经网络模型的预测值。
CN201510467901.6A 2015-07-30 2015-07-30 一种基于混合模型的税收收入预测方法及装置 Pending CN105139079A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510467901.6A CN105139079A (zh) 2015-07-30 2015-07-30 一种基于混合模型的税收收入预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510467901.6A CN105139079A (zh) 2015-07-30 2015-07-30 一种基于混合模型的税收收入预测方法及装置

Publications (1)

Publication Number Publication Date
CN105139079A true CN105139079A (zh) 2015-12-09

Family

ID=54724420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510467901.6A Pending CN105139079A (zh) 2015-07-30 2015-07-30 一种基于混合模型的税收收入预测方法及装置

Country Status (1)

Country Link
CN (1) CN105139079A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106529671A (zh) * 2016-10-28 2017-03-22 国网福建省电力有限公司 一种基于神经网络的原煤全水分软测量方法
CN107346464A (zh) * 2016-05-06 2017-11-14 腾讯科技(深圳)有限公司 业务指标预测方法及装置
CN109614742A (zh) * 2018-12-25 2019-04-12 中国海洋大学 一种海面高度持续性预测算法
CN110675960A (zh) * 2019-09-10 2020-01-10 北京大学 基于时间序列分析的呼吸运动预测建模方法
CN111768282A (zh) * 2020-06-30 2020-10-13 平安国际智慧城市科技股份有限公司 数据分析方法、装置、设备及存储介质
CN113267256A (zh) * 2021-04-14 2021-08-17 国网山东省电力公司济宁供电公司 一种配电线路接点温度预测系统及方法
CN113283972A (zh) * 2021-05-06 2021-08-20 胡立禄 一种税务大数据模型的构建系统及方法
CN113672642A (zh) * 2021-07-07 2021-11-19 德特赛维技术有限公司 一种基于时序预测移动网络性能的方法及其系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239982A (zh) * 2014-10-12 2014-12-24 刘岩 一种基于时间序列和神经网络的建筑节假日能耗预测方法
CN104504475A (zh) * 2014-12-24 2015-04-08 上海大学 基于ar*-svm混合建模的雾霾时间序列预测方法
CN105376097A (zh) * 2015-11-30 2016-03-02 沈阳工业大学 网络流量的一种混合预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239982A (zh) * 2014-10-12 2014-12-24 刘岩 一种基于时间序列和神经网络的建筑节假日能耗预测方法
CN104504475A (zh) * 2014-12-24 2015-04-08 上海大学 基于ar*-svm混合建模的雾霾时间序列预测方法
CN105376097A (zh) * 2015-11-30 2016-03-02 沈阳工业大学 网络流量的一种混合预测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
TAY,A.S.&WALLIS,K.E: "Denisty Forecasting:A Survey", 《JOURNAL OF FORECASTING》 *
吕宁: "地方财政一般预算收入预测模型研究--以浙江省为例", 《中国优秀博硕士学位论文全文数据库 经济与管理科学辑》 *
孙志勇: "我国结构性减税政策的相关问题研究", 《中国博士学位论文全文数据库 经济与管理科学辑》 *
孙智勇,刘星: "模糊软集合理论在税收组合预测中的应用", 《系统工程理论与实践》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107346464A (zh) * 2016-05-06 2017-11-14 腾讯科技(深圳)有限公司 业务指标预测方法及装置
CN107346464B (zh) * 2016-05-06 2021-04-16 腾讯科技(深圳)有限公司 业务指标预测方法及装置
CN106529671A (zh) * 2016-10-28 2017-03-22 国网福建省电力有限公司 一种基于神经网络的原煤全水分软测量方法
CN109614742A (zh) * 2018-12-25 2019-04-12 中国海洋大学 一种海面高度持续性预测算法
CN110675960A (zh) * 2019-09-10 2020-01-10 北京大学 基于时间序列分析的呼吸运动预测建模方法
CN110675960B (zh) * 2019-09-10 2022-08-26 北京大学 基于时间序列分析的呼吸运动预测建模方法
CN111768282A (zh) * 2020-06-30 2020-10-13 平安国际智慧城市科技股份有限公司 数据分析方法、装置、设备及存储介质
CN111768282B (zh) * 2020-06-30 2023-11-28 深圳赛安特技术服务有限公司 数据分析方法、装置、设备及存储介质
CN113267256A (zh) * 2021-04-14 2021-08-17 国网山东省电力公司济宁供电公司 一种配电线路接点温度预测系统及方法
CN113283972A (zh) * 2021-05-06 2021-08-20 胡立禄 一种税务大数据模型的构建系统及方法
CN113672642A (zh) * 2021-07-07 2021-11-19 德特赛维技术有限公司 一种基于时序预测移动网络性能的方法及其系统

Similar Documents

Publication Publication Date Title
CN105139079A (zh) 一种基于混合模型的税收收入预测方法及装置
Xu et al. Determining China's CO2 emissions peak with a dynamic nonlinear artificial neural network approach and scenario analysis
Zhou et al. Type-2 fuzzy multi-objective DEA model: An application to sustainable supplier evaluation
Xu et al. Discrete time–cost–environment trade-off problem for large-scale construction systems with multiple modes under fuzzy uncertainty and its application to Jinping-II Hydroelectric Project
Costantini et al. A hierarchical procedure for the combination of forecasts
CN105205570A (zh) 一种基于季节时序分析的电网售电量预测方法
CN106845669A (zh) 基于指数平滑法预测电网年持续负荷的方法
CN110135635A (zh) 一种区域电力饱和负荷预测方法及系统
CN111967696A (zh) 基于神经网络的电动汽车充电需求预测方法、系统及装置
Wang et al. A novel decomposition-ensemble forecasting system for dynamic dispatching of smart grid with sub-model selection and intelligent optimization
Ghannadpour et al. Appraising the triple bottom line utility of sustainable project portfolio selection using a novel multi-criteria house of portfolio
CN112686693A (zh) 电力现货市场边际电价预测方法、系统、设备及存储介质
D'Amico et al. Multiple criteria assessment of methods for forecasting building thermal energy demand
Yan et al. Short-term load forecasting of smart grid based on load spatial-temporal distribution
CN115187134A (zh) 基于网格的配电网规划方法、装置及终端设备
CN117081088B (zh) 电网负荷调度控制方法、装置、计算机设备及存储介质
CN109359388A (zh) 一种复杂仿真系统可信度评估方法
Wang et al. A fuzzy DEA–Neural approach to measuring design service performance in PCM projects
Coelho et al. A heuristic fuzzy algorithm bio-inspired by evolution strategies for energy forecasting problems
CN105654197A (zh) 一种基于灰色理论的综合计划投入总盘预测方法
CN115564265A (zh) 一种基于评价模型的电网企业数字化转型评价方法
CN115549082A (zh) 基于负荷挖掘和lstm神经网络的电力负荷预测方法
CN114330818A (zh) 一种基于主要驱动因子筛选和深度学习的动态需水预测方法
CN114549233A (zh) 基于lgb算法与arima算法相结合的流动人口预测方法
Hu et al. Stochastic multi-attribute group decision-making for long-term comprehensive operation of cascade reservoirs under multiple uncertainties

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 2708, 2, 2709, 511011 and 2710, Da Nan Road, Guangzhou, Guangdong, Yuexiu District

Applicant after: GUANGDONG IDATATECH CO., LTD.

Address before: 2708, 2, 2709, 511011 and 2710, Da Nan Road, Guangzhou, Guangdong, Yuexiu District

Applicant before: Guangzhou Shi Yun Information technology company limited

CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Chen Lehua

Inventor after: Tu Jilai

Inventor after: Huang Xiaohui

Inventor before: Chen Lehua

Inventor before: Zhang Qing

Inventor before: Tu Jilai

Inventor before: Huang Xiaohui

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151209