CN110070202A - 一种通过用电量数据预测经济产出的方法 - Google Patents
一种通过用电量数据预测经济产出的方法 Download PDFInfo
- Publication number
- CN110070202A CN110070202A CN201910123238.6A CN201910123238A CN110070202A CN 110070202 A CN110070202 A CN 110070202A CN 201910123238 A CN201910123238 A CN 201910123238A CN 110070202 A CN110070202 A CN 110070202A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- electricity consumption
- prediction model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000011161 development Methods 0.000 claims abstract description 21
- 238000012360 testing method Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims description 51
- 230000006870 function Effects 0.000 claims description 31
- 238000005457 optimization Methods 0.000 claims description 28
- 238000013507 mapping Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 8
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000001325 log-rank test Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000001816 cooling Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000003064 k means clustering Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims 1
- 238000004445 quantitative analysis Methods 0.000 abstract description 4
- 238000012544 monitoring process Methods 0.000 abstract description 2
- 238000013135 deep learning Methods 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种通过用电量数据预测经济产出的方法,涉及一种电力负荷预测技术领域。目前只应用线性模型进行定量分析,准确率低。本发明包括以下步骤:根据各个部门用电量与产业发展之间的数据,进行相关性检验,获得与用电量相关的产业发展数据;将获得的用电量数据输入第一预测模型中,获得对应产业发展的第一预测值;将获得的用电量数据输入第二预测模型中,获得对应产业发展的第二预测值;判断第一预测值、第二预测值的差值,当差值大于阈值时,修正第一预测模型和第二预测模型;当差值小于阈值时,取第一预测值、第二预测值的平均值作为对应产业发展的预测值。本技术方案采用非线性回归的模型,两预测模型综合监控,有效提高精度及准确性。
Description
技术领域
本发明涉及一种电力负荷预测技术领域,尤其涉及一种通过用电量数据预测经济产出的方法。
背景技术
电力是国民经济的重要基础。电力生产对以电能为重要生产资料的行业具有强烈响应,这种响应具体表现在工业生产与电力消费的直接作用之上。经济运行过程中的市场机制和政策调控推动了部分乃至全体行业的发展与进步,使得各行业逐步由高能耗向低能耗、低利润向高利润转型。产业结构的变化意味着电力消费模式的变化。可见电力负荷的波动与宏观经济的变化密切相关,研究电力负荷与宏观经济的相关性具有重要意义。
最近有人提出,电力与国内生产密切相关,研究人员将基于电力消费的经济建模研究分为两类:长期协整关系和短期因果关系。应用给基于偏最小二乘回归分析的中长期经济增长预测方法进行了实证分析。引进了M- 估计法,采用稳健回归的M-估计法估计参数并建立了用电量-经济的回归模型。
但是在现阶段经济学家只应用线性模型进行定量分析,其准确率低,这对由用电量预测行业经济增长是不够的。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种通过用电量数据预测经济产出的方法,以达到提高准确率的目的。为此,本发明采取以下技术方案。
一种通过用电量数据预测经济产出的方法,包括以下步骤:
一)根据各个部门用电量与产业发展之间的数据,进行相关性检验,获得与用电量相关的产业发展数据;
二)将获得的用电量数据输入第一预测模型中,获得对应产业发展的第一预测值;
三)将获得的用电量数据输入第二预测模型中,获得对应产业发展的第二预测值;
四)判断第一预测值、第二预测值的差值,当差值大于阈值时,修正第一预测模型和第二预测模型;当差值小于阈值时,取第一预测值、第二预测值的平均值作为对应产业发展的预测值;
其中第一预测模型的建立包括步骤:
步骤S11:获取训练数据,训练数据包括行业用电量数据X和行业经济指标数据Y;行业用电量数据X是某个工业行业的月用电量增量时间序列,行业经济指标数据Y是对应工业行业的月度生产总值;
步骤S12:将训练数据输入自回归滑动平均模型中,对训练数据X和 Y进行对数标准化处理,以降低训练模型的异方差,提升模型训练的可靠性;处理后的logX和logY作为模型训练的输入数据;
步骤S13:将输入数据打上时序标识log X=[log Xt,log Xt-1,…,log X2, logX1],log Y=[log Yt,log Yt-1,…,log Y2,log Y1];对输入数据进行时序检验,得到log X对log Y的滞后阶数n;
步骤S14:构造单隐层的自编码网络模型;隐层节点数m的设置方法是:若n≥10,m=n;若n<10,m=2n;隐层节点函数h(x)=[1+ exp(-x)]-1;
步骤S15:训练单隐层的自编码网络模型,得到网络参数W;对应的损失函数L(X)=||X–h(X)||2+ρ||h’(X)||2,其中ρ代表正则系数;
步骤S16:单隐层的自编码网络模型训练完成后,提取模型的隐层输出值logX*=WlogX,作为预测模型的自变量训练数据,即所提取的非线性特征值;
步骤S17:以行业用电量数据的对数值logY作为因变量训练数据,构建基于非线性特征提取的回归模型:log Y=α+alog X*;用最小二乘法解得α,a=[a1,a2,…,an],为预测模型的参数;从而获得第一预测模型;
其中第二预测模型的建立包括步骤:
步骤S21:获取训练数据,包括自变量行业用电量数据X和因变量行业经济指标数据Y,进行对数标准化处理;行业用电量数据X是某个工业行业的月用电量数据;行业经济指标数据Y是对应工业行业的月度行业GDP;
步骤S22:构造单隐层的极限学习机模型;隐层节点数设为10个;隐层节点函数为h(x)=[1+exp(-x)]-1;
步骤S23:训练单隐层的极限学习机模型,得到网络结构和对应参数 W;训练的损失函数为均方误差,均方误差的表达式为:MSE=||Y–h(X)||2;
步骤S24:求解极限学习机模型,得到第二预测模型。
本技术方案根据各个部门产业发展与用电量之间的数据,进行相关性检验。根据各个部门的每月工业逐年增长率和每日电力消耗量,将数据进行对数处理。根据自编码网络,构建经济变量间的非线性回归模型。求解非线性回归模型,得出更为精确的经济预测电力模型。
本发明与现有技术相比,基于非线性回归的经济预测电力模型精确度要高于对数线性回归模型的结果。从而解决了现阶段经济学家只应用线性模型进行定量分析,提出了一种精确度更高的通过经济增长率来预测用电量消耗增长率的非线性回归模型。两预测模型综合监控,有效提高精度及准确性。
作为优选技术手段:在步骤S13中,时序检验的方法如下:
利用相关系数验证经济时间序列先行、一致或滞后关系;时差相关系数分为自相关系数和偏自相关系数;自相关系数的计算方法为:将原始序列看成一个序列,滞后的序列看成另一个序列,然后计算两列之间的相关系数;偏自相关系数的计算方法为:将一个重要的、能够敏感地反映当前经济活动的经济指标作为基准指标,然后使被选择指标超前或滞后若干期,计算它们的相关系数;
自相关系数的数学表达式为:
其中,下标k表示滞后阶数,Xt表示时间t的样本,表示时间样本均值,T表示截止采样时间。
偏自相关系数的数学表达式为:
其中,at=Var(Xt)即时间t采样的方差。
自相关系数和偏自相关系数是用来判断自回归滑动平均模型中时间序列滞后项和残差时序滞后项的阶数的;判定的规则是当某个系数出现“截尾”现象,即滞后项的阶数被判定为所停留的阶数;“截尾”现象指的是随着阶数增大时,系数显著下降的现象。
作为优选技术手段:在步骤S14)、S15)中,自编码网络模型采用神经网络,其为一种无监督学习方法;单隐层自编码网络模型由一个编码映射层f和一个解码映射层g组成;输入向量X经过编码与解码两次非线性映射后得到的输出X'=g(f(X))应与输入X近似相等;此时,由于网络的中间层结果f(X)经过解码映射g即可基本还原出X;
自编码网络的训练在数学上抽象为如下的优化问题:
min JAE(W)=L(X,g(f(X)))
其中:L是度量输入X与输出X'之间距离的损失函数,决策变量W表示网络参数;为了确保从数据中提取有意义的,且具有某些良好数学性质的特征,在优化目标中引入正则项;当需要避免过拟合问题时,在优化目标中加入网络参数的二范数:
避免过拟合问题;
当需增强对于输入当中的随机扰动的鲁棒性时,在优化目标中加入编码映射对输入导数的二范数:
增强对于输入当中的随机扰动的鲁棒性。
作为优选技术手段:步骤S16和S17中,非线性特征值的选取方法为:
当时序相关检验结果的滞后阶数n≥10时,则抽取全部隐层节点变量作为非线性特征值;
当时序相关检验结果的滞后阶数n<10时,由于节点的个数m=2n 大于自回归滑动平均模型所需的自变量个数,利用k-means聚类算法,令k=n,从而将m个非线性特征值降到n个。
作为优选技术手段:在k-means算法中,用质心来表示所聚的类别, k-means算法收敛等价于所有质心不再发生变化;基本的k-means算法流程如下:
1)随机选取k个质心;
2)遍历所有数据,将每个数据划分到最近的质心中;3)计算每个聚类的平均值,并作为新的质心;
4)重复步骤2)、3),直到k个质心不再变化,即收敛为止。
作为优选技术手段:在步骤S17)中,根据自编码网络,根据均方误差作为精度的度量,构建经济变量间的非线性回归模型。
作为优选技术手段:极限学习机模型的基本数学表达式为:
其中,X表示网络的输入向量,B=[β1,...,βL]T表示网络的输出层权重,而H=[h1(X),...hL(X)]T表示一组满足分段连续特性的非线性特征变换函数,其对模型的输入层和隐层参数不进行优化,而是随机生成;在随机生成输入层与隐层参数后,网络的输出层权重可通过求解下面的优化问题获得:
min||HB-T||2
其中:H是隐层的映射函数矩阵;
T是训练数据构成的矩阵,||·||表示Frobenius范数;
优化问题的最优解可解析求解如下:
其中:表示映射函数矩阵的H的Moore-Penrose广义逆矩阵。
由于极限学习机模型(ELM)的输入层与隐层参数可随机给定,而输出层权重不需要优化,可通过矩阵求逆获得;因此,ELM的计算效率相较其它主流机器学习算法大幅提高,一般比支持向量机等常见算法训练速度提高一个数量级,比深度学习可最多提高数百倍,可以应用于大数据的在线处理;此外,理论与实践均证明,ELM具有对非线性函数的全局逼近能力,且由于隐层参数随机给定,对训练数据中的噪声相对不敏感,有利于避免过拟合。
作为优选技术手段:在步骤四)中,当修正第一预测模型和第二预测模型后;差值依旧大于阈值时,采用在测试集上的误差小的模型作为预测模型。
有益效果:本发明首先根据各个部门产业发展与用电量之间的数据,对经济指标和电力指标进行相关性检验,确定两者之间的相关性。根据各个部门的每月工业逐年增长率和每日电力消耗量,将数据进行对数处理。根据自编码网络,构建非线性回归模型,得到基于非线性回归的第一预测模型。第一预测模型的精确度要高于对数线性回归模型的结果。解决了现阶段经济学家只应用线性模型进行定量分析,提出了一种精确度更高的通过电量消耗增长来预测经济增长率的第一预测模型。用AutoEncoder给用电数据除了个噪声,再做回归,精度高;同时其与第二预测模型配合使用,也有效地防止了过拟合的情况发生。
本技术方案同时也采用基于极限学习机模型的第二预测模型。两模型综合使用,两模型相互配合,防止误测,实现的精确预测。在极限学习机模型中的输入层与隐层参数可随机给定,而输出层权重不需要优化,可通过矩阵求逆获得。因此,极限学习机模型(ELM)的计算效率相较其它主流机器学习算法大幅提高,一般比支持向量机等常见算法训练速度提高一个数量级,比深度学习可最多提高数百倍,可以应用于大数据的在线处理。此外,ELM具有对非线性函数的全局逼近能力,且由于隐层参数随机给定,对训练数据中的噪声相对不敏感,有利于避免过拟合。
附图说明
图1是本发明的第一预测模型建模流程图。
图2是本发明的第二预测模型建模流程图。
具体实施方式
以下结合说明书附图对本发明的技术方案做进一步的详细说明。
本发明包括以下步骤:
一种通过用电量数据预测经济产出的方法,包括以下步骤:
一)根据各个部门用电量与产业发展之间的数据,进行相关性检验,获得与用电量相关的产业发展数据;
二)将获得的用电量数据输入第一预测模型中,获得对应产业发展的第一预测值;
三)将获得的用电量数据输入第二预测模型中,获得对应产业发展的第二预测值;
四)判断第一预测值、第二预测值的差值,当差值大于阈值时,修正第一预测模型和第二预测模型;当差值小于阈值时,取第一预测值、第二预测值的平均值作为对应产业发展的预测值
如图1所示,其中第一预测模型的建立包括步骤:
步骤S11:获取训练数据,训练数据包括行业用电量数据X和行业经济指标数据Y;行业用电量数据X是某个工业行业的月用电量增量时间序列,行业经济指标数据Y是对应工业行业的月度生产总值;
步骤S12:将训练数据输入自回归滑动平均模型中,对训练数据X和 Y进行对数标准化处理,以降低训练模型的异方差,提升模型训练的可靠性;处理后的log X和log Y作为模型训练的输入数据;
步骤S13:将输入数据打上时序标识log X=[log Xt,log Xt-1,…,log X2, logX1],log Y=[log Yt,log Yt-1,…,log Y2,log Y1];对输入数据进行时序检验,得到log X对log Y的滞后阶数n;
步骤S14:构造单隐层的自编码网络模型;隐层节点数m的设置方法是:若n≥10,m=n;若n<10,m=2n;隐层节点函数h(x)=[1+ exp(-x)]-1;
步骤S15:训练单隐层的自编码网络模型,得到网络参数W;对应的损失函数L(X)=||X–h(X)||2+ρ||h’(X)||2,其中ρ代表正则系数;
步骤S16:单隐层的自编码网络模型训练完成后,提取模型的隐层输出值log X*=Wlog X,作为预测模型的自变量训练数据,即所提取的非线性特征值;
步骤S17:以行业用电量数据的对数值logY作为因变量训练数据,构建基于非线性特征提取的回归模型:log Y=α+alog X*;用最小二乘法解得α,a=[a1,a2,…,an],为预测模型的参数;从而获得第一预测模型;
如图2所示,其中第二预测模型的建立包括步骤:
步骤S21:获取训练数据,包括自变量行业用电量数据X和因变量行业经济指标数据Y,进行对数标准化处理;行业用电量数据X是某个工业行业的月用电量数据;行业经济指标数据Y是对应工业行业的月度行业GDP;
步骤S22:构造单隐层的极限学习机模型;隐层节点数设为10个;隐层节点函数为h(x)=[1+exp(-x)]-1;
步骤S23:训练单隐层的极限学习机模型,得到网络结构和对应参数 W;训练的损失函数为均方误差,均方误差的表达式为:MSE=||Y–h(X)||2;
步骤S24:求解极限学习机模型,得到第二预测模型。
其中,在步骤S13中,时序检验的方法如下:
利用相关系数验证经济时间序列先行、一致或滞后关系;时差相关系数分为自相关系数和偏自相关系数;自相关系数的计算方法为:将原始序列看成一个序列,滞后的序列看成另一个序列,然后计算两列之间的相关系数;偏自相关系数的计算方法为:将一个重要的、能够敏感地反映当前经济活动的经济指标作为基准指标,然后使被选择指标超前或滞后若干期,计算它们的相关系数;
自相关系数的数学表达式为:
其中,下标k表示滞后阶数,Xt表示时间t的样本,表示时间样本均值,T表示截止采样时间;
偏自相关系数的数学表达式为:
其中,at=Var(Xt)即时间t采样的方差;
自相关系数和偏自相关系数是用来判断自回归滑动平均模型中时间序列滞后项和残差时序滞后项的阶数的;判定的规则是当某个系数出现“截尾”现象,即滞后项的阶数被判定为所停留的阶数;“截尾”现象指的是随着阶数增大时,系数显著下降的现象。
在步骤S14)、S15)中,自编码网络模型采用神经网络,其为一种无监督学习方法;单隐层自编码网络模型由一个编码映射层f和一个解码映射层g组成;输入向量X经过编码与解码两次非线性映射后得到的输出 X'=g(f(X))应与输入X近似相等;此时,由于网络的中间层结果f(X)经过解码映射g即可基本还原出X;
自编码网络的训练在数学上抽象为如下的优化问题:
min JAE(W)=L(X,g(f(X)))
其中:L是度量输入X与输出X'之间距离的损失函数(如平方误差),决策变量W表示网络参数(输入与输出权重及激发函数参数);为了确保从数据中提取有意义的,且具有某些良好数学性质的特征,在优化目标中引入正则项;当需要避免过拟合问题时,在优化目标中加入网络参数的二范数:
避免过拟合问题;
当需增强对于输入当中的随机扰动的鲁棒性时,在优化目标中加入编码映射对输入导数的二范数:
增强对于输入当中的随机扰动的鲁棒性。
在步骤S16和S17中,非线性特征值的选取方法为:
当时序相关检验结果的滞后阶数n≥10时,则抽取全部隐层节点变量作为非线性特征值;
当时序相关检验结果的滞后阶数n<10时,由于节点的个数m=2n 大于自回归滑动平均模型所需的自变量个数,利用k-means聚类算法,令 k=n,从而将m个非线性特征值降到n个;
在k-means算法中,用质心来表示所聚的类别,k-means算法收敛等价于所有质心不再发生变化;基本的k-means算法流程如下:
1)随机选取k个质心;
2)遍历所有数据,将每个数据划分到最近的质心中;3)计算每个聚类的平均值,并作为新的质心;
4)重复步骤2)、3),直到k个质心不再变化,即收敛了,为止。
在步骤S17)中,根据自编码网络,根据均方误差作为精度的度量,构建经济变量间的非线性回归模型。
极限学习机模型的基本数学表达式为:
其中,X表示网络的输入向量,B=[β1,...,βL]T表示网络的输出层权重,而H=[h1(X),...hL(X)]T表示一组满足分段连续特性的非线性特征变换函数,其对模型的输入层和隐层参数不进行优化,而是随机生成;在随机生成输入层与隐层参数后,网络的输出层权重可通过求解下面的优化问题获得:
min||HB-T||2
其中:H是隐层的映射函数矩阵;
T是训练数据构成的矩阵,||·||表示Frobenius范数;
优化问题的最优解可解析求解如下:
其中:表示映射函数矩阵的H的Moore-Penrose广义逆矩阵。
由于ELM的输入层与隐层参数可随机给定,而输出层权重不需要优化,可通过矩阵求逆获得;因此,ELM的计算效率相较其它主流机器学习算法大幅提高,一般比支持向量机等常见算法训练速度提高一个数量级,比深度学习可最多提高数百倍,可以应用于大数据的在线处理;此外,理论与实践均证明,ELM具有对非线性函数的全局逼近能力,且由于隐层参数随机给定,对训练数据中的噪声相对不敏感,有利于避免过拟合。
以上图1、2所示的一种通过用电量数据预测经济产出的方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行等同修改,均在本方案的保护范围之列。
Claims (8)
1.一种通过用电量数据预测经济产出的方法,其特征在于:包括以下步骤:
一)根据各个部门用电量与产业发展之间的数据,进行相关性检验,获得与用电量相关的产业发展数据;
二)将获得的用电量数据输入第一预测模型中,获得对应产业发展的第一预测值;
三)将获得的用电量数据输入第二预测模型中,获得对应产业发展的第二预测值;
四)判断第一预测值、第二预测值的差值,当差值大于阈值时,修正第一预测模型和第二预测模型;当差值小于阈值时,取第一预测值、第二预测值的平均值作为对应产业发展的预测值;
其中第一预测模型的建立包括步骤:
步骤S11:获取训练数据,训练数据包括行业用电量数据X和行业经济指标数据Y;行业用电量数据X是某个工业行业的月用电量增量时间序列,行业经济指标数据Y是对应工业行业的月度生产总值;
步骤S12:将训练数据输入自回归滑动平均模型中,对训练数据X和Y进行对数标准化处理,以降低训练模型的异方差,提升模型训练的可靠性;处理后的logX和logY作为模型训练的输入数据;
步骤S13:将输入数据打上时序标识logX=[logXt,logXt-1,…,logX2,logX1],logY=[logYt,logYt-1,…,logY2,logY1];对输入数据进行时序检验,得到logX对logY的滞后阶数n;
步骤S14:构造单隐层的自编码网络模型;隐层节点数m的设置方法是:若n≥10,m=n;若n<10,m=2n;隐层节点函数h(x)=[1+ exp(-x)]-1;
步骤S15:训练单隐层的自编码网络模型,得到网络参数W;对应的损失函数L(X)=||X–h(X)||2+ρ||h’(X)||2,其中ρ代表正则系数;
步骤S16:单隐层的自编码网络模型训练完成后,提取模型的隐层输出值logX*=WlogX,作为预测模型的自变量训练数据,即所提取的非线性特征值;
步骤S17:以行业用电量数据的对数值logY作为因变量训练数据,构建基于非线性特征提取的回归模型:logY=α+alogX*;用最小二乘法解得α,a=[a1,a2,…,an],为预测模型的参数;从而获得第一预测模型;
其中第二预测模型的建立包括步骤:
步骤S21:获取训练数据,包括自变量行业用电量数据X和因变量行业经济指标数据Y,进行对数标准化处理;行业用电量数据X是某个工业行业的月用电量数据;行业经济指标数据Y是对应工业行业的月度行业GDP;
步骤S22:构造单隐层的极限学习机模型;隐层节点数设为10个;隐层节点函数为h(x)=[1+exp(-x)]-1;
步骤S23:训练单隐层的极限学习机模型,得到网络结构和对应参数W;训练的损失函数为均方误差,均方误差的表达式为:MSE=||Y–h(X)||2;
步骤S24:求解极限学习机模型,得到第二预测模型。
2.根据权利要求1所述的一种通过用电量数据预测经济产出的方法,其特征在于:
在步骤S13中,时序检验的方法如下:
利用相关系数验证经济时间序列先行、一致或滞后关系;时差相关系数分为自相关系数和偏自相关系数;自相关系数的计算方法为:将原始序列看成一个序列,滞后的序列看成另一个序列,然后计算两列之间的相关系数;偏自相关系数的计算方法为:将一个重要的、能够敏感地反映当前经济活动的经济指标作为基准指标,然后使被选择指标超前或滞后若干期,计算它们的相关系数;
自相关系数的数学表达式为:
其中,下标k表示滞后阶数,Xt表示时间t的样本,表示时间样本均值,T表示截止采样时间;
偏自相关系数的数学表达式为:
其中,at=Var(Xt)即时间t采样的方差;
自相关系数和偏自相关系数是用来判断自回归滑动平均模型中时间序列滞后项和残差时序滞后项的阶数的;判定的规则是当某个系数出现“截尾”现象,即滞后项的阶数被判定为所停留的阶数;“截尾”现象指的是随着阶数增大时,系数显著下降的现象。
3.根据权利要求2所述的一种通过用电量数据预测经济产出的方法,其特征在于:在步骤S14)、S15)中,自编码网络模型采用神经网络,其为一种无监督学习方法;单隐层自编码网络模型由一个编码映射层f和一个解码映射层g组成;输入向量X经过编码与解码两次非线性映射后得到的输出X'=g(f(X))应与输入X近似相等;此时,由于网络的中间层结果f(X)经过解码映射g即可基本还原出X;
自编码网络的训练在数学上抽象为如下的优化问题:
min JAE(W)=L(X,g(f(X)))
其中:L是度量输入X与输出X'之间距离的损失函数,决策变量W表示网络参数;为了确保从数据中提取有意义的,且具有某些良好数学性质的特征,在优化目标中引入正则项;当需要避免过拟合问题时,在优化目标中加入网络参数的二范数:
避免过拟合问题;
当需增强对于输入当中的随机扰动的鲁棒性时,在优化目标中加入编码映射对输入导数的二范数:
增强对于输入当中的随机扰动的鲁棒性。
4.根据权利要求3所述的一种通过用电量数据预测经济产出的方法,其特征在于:步骤S16和S17中,非线性特征值的选取方法为:
当时序相关检验结果的滞后阶数n≥10时,则抽取全部隐层节点变量作为非线性特征值;
当时序相关检验结果的滞后阶数n<10时,由于节点的个数m=2n大于自回归滑动平均模型所需的自变量个数,利用k-means聚类算法,令k=n,从而将m个非线性特征值降到n个。
5.根据权利要求4所述的一种通过用电量数据预测经济产出的方法,其特征在于:在k-means算法中,用质心来表示所聚的类别,k-means算法收敛等价于所有质心不再发生变化;基本的k-means算法流程如下:
1)随机选取k个质心;
2)遍历所有数据,将每个数据划分到最近的质心中;
3)计算每个聚类的平均值,并作为新的质心;
4)重复步骤2)、3),直到k个质心不再变化,即收敛为止。
6.根据权利要求4所述的一种通过用电量数据预测经济产出的方法,其特征在于:在步骤S17)中,根据自编码网络,根据均方误差作为精度的度量,构建经济变量间的非线性回归模型。
7.根据权利要求1-6任一权利要求所述的一种通过用电量数据预测经济产出的方法,其特征在于:极限学习机模型的基本数学表达式为:
其中,X表示网络的输入向量,B=[β1,...,βL]T表示网络的输出层权重,而H=[h1(X),...hL(X)]T表示一组满足分段连续特性的非线性特征变换函数,其对模型的输入层和隐层参数不进行优化,而是随机生成;在随机生成输入层与隐层参数后,网络的输出层权重可通过求解下面的优化问题获得:
min||HB-T||2
其中:H是隐层的映射函数矩阵;
T是训练数据构成的矩阵,||·||表示Frobenius范数;
优化问题的最优解可解析求解如下:
其中:表示映射函数矩阵的H的Moore-Penrose广义逆矩阵。
8.根据权利要求1所述的一种通过用电量数据预测经济产出的方法,其特征在于:在步骤四)中,当修正第一预测模型和第二预测模型后;差值依旧大于阈值时,采用在测试集上的误差小的模型作为预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910123238.6A CN110070202A (zh) | 2019-02-19 | 2019-02-19 | 一种通过用电量数据预测经济产出的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910123238.6A CN110070202A (zh) | 2019-02-19 | 2019-02-19 | 一种通过用电量数据预测经济产出的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110070202A true CN110070202A (zh) | 2019-07-30 |
Family
ID=67365978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910123238.6A Pending CN110070202A (zh) | 2019-02-19 | 2019-02-19 | 一种通过用电量数据预测经济产出的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110070202A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112115180A (zh) * | 2020-09-11 | 2020-12-22 | 国网山东省电力公司枣庄供电公司 | 一种基于大数据的电网事故预测方法 |
CN113449919A (zh) * | 2021-06-29 | 2021-09-28 | 国网山东省电力公司菏泽供电公司 | 一种基于特征和趋势感知的用电量预测方法及系统 |
CN113496309A (zh) * | 2021-06-15 | 2021-10-12 | 中国食品药品检定研究院 | 西洋参生长年限预测方法、模型的训练方法及装置 |
CN117436712A (zh) * | 2023-12-21 | 2024-01-23 | 山东铁鹰建设工程有限公司 | 一种施工挂篮运行风险实时监测方法及系统 |
CN113191559B (zh) * | 2021-05-08 | 2024-04-19 | 苏州瑞城电力科技有限公司 | 一种基于自回归选择的改进神经网短期居民负荷预测方法 |
-
2019
- 2019-02-19 CN CN201910123238.6A patent/CN110070202A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112115180A (zh) * | 2020-09-11 | 2020-12-22 | 国网山东省电力公司枣庄供电公司 | 一种基于大数据的电网事故预测方法 |
CN112115180B (zh) * | 2020-09-11 | 2021-09-14 | 国网山东省电力公司枣庄供电公司 | 一种基于大数据的电网事故预测方法 |
CN113191559B (zh) * | 2021-05-08 | 2024-04-19 | 苏州瑞城电力科技有限公司 | 一种基于自回归选择的改进神经网短期居民负荷预测方法 |
CN113496309A (zh) * | 2021-06-15 | 2021-10-12 | 中国食品药品检定研究院 | 西洋参生长年限预测方法、模型的训练方法及装置 |
CN113496309B (zh) * | 2021-06-15 | 2024-04-19 | 中国食品药品检定研究院 | 西洋参生长年限预测方法、模型的训练方法及装置 |
CN113449919A (zh) * | 2021-06-29 | 2021-09-28 | 国网山东省电力公司菏泽供电公司 | 一种基于特征和趋势感知的用电量预测方法及系统 |
CN117436712A (zh) * | 2023-12-21 | 2024-01-23 | 山东铁鹰建设工程有限公司 | 一种施工挂篮运行风险实时监测方法及系统 |
CN117436712B (zh) * | 2023-12-21 | 2024-04-12 | 山东铁鹰建设工程有限公司 | 一种施工挂篮运行风险实时监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110070202A (zh) | 一种通过用电量数据预测经济产出的方法 | |
CN108022001B (zh) | 基于pca和分位数回归森林的短期负荷概率密度预测方法 | |
CN109543737B (zh) | 一种基于fahp_fca组合赋权的信息系统健康度评估方法 | |
CN110309603B (zh) | 一种基于风速特性的短期风速预测方法及系统 | |
CN108280552B (zh) | 基于深度学习的电力负荷预测方法和系统、存储介质 | |
CN109214708B (zh) | 基于交叉熵理论优化支持向量机的电力系统风险评估方法 | |
CN110070201A (zh) | 一种通过经济增长率预测用电量增长率的方法 | |
CN109992921B (zh) | 一种燃煤电厂锅炉热效率的在线软测量方法及系统 | |
CN104732303A (zh) | 一种基于动态径向基函数神经网络的油田产量预测方法 | |
CN109376953A (zh) | 一种中长期电量预测方法及系统 | |
CN106980910B (zh) | 中长期电力负荷测算系统及方法 | |
CN110751318A (zh) | 一种基于ipso-lstm的超短期电力负荷预测方法 | |
CN108667069B (zh) | 一种基于偏最小二乘法回归的短期风电功率预测方法 | |
CN104504475A (zh) | 基于ar*-svm混合建模的雾霾时间序列预测方法 | |
CN111460001B (zh) | 一种配电网理论线损率评估方法及系统 | |
CN108776017B (zh) | 一种改进chsmm的滚动轴承剩余寿命预测方法 | |
CN113344288A (zh) | 梯级水电站群水位预测方法、装置及计算机可读存储介质 | |
CN110807490A (zh) | 一种基于单基塔的输电线路工程造价智能预测方法 | |
CN115759380A (zh) | 基于SHAP-XGBoost算法的电力系统惯量短期预测方法 | |
CN115358437A (zh) | 基于卷积神经网络的供电负荷预测方法 | |
CN114429238A (zh) | 一种基于时空特征提取的风电机组故障预警方法 | |
CN116865343B (zh) | 分布式光伏配电网的无模型自适应控制方法、装置及介质 | |
Wu | The comparison of forecasting analysis based on the ARIMA-LSTM hybrid models | |
CN112836876A (zh) | 一种基于深度学习的配电网线路负荷预测方法 | |
CN111798055A (zh) | 基于灰色关联度的变权重组合光伏出力预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190730 |