CN110070202A

CN110070202A - 一种通过用电量数据预测经济产出的方法

Info

Publication number: CN110070202A
Application number: CN201910123238.6A
Authority: CN
Inventors: 张利军; 陈昊; 张密; 谭煌; 李媛; 刘婧; 谷凯; 郭俊岑; 严华江
Original assignee: State Grid Corp of China SGCC; State Grid Zhejiang Electric Power Co Ltd; China Electric Power Research Institute Co Ltd CEPRI; Zhejiang Huayun Information Technology Co Ltd
Current assignee: State Grid Corp of China SGCC; State Grid Zhejiang Electric Power Co Ltd; China Electric Power Research Institute Co Ltd CEPRI; Zhejiang Huayun Information Technology Co Ltd
Priority date: 2019-02-19
Filing date: 2019-02-19
Publication date: 2019-07-30

Abstract

本发明公开了一种通过用电量数据预测经济产出的方法，涉及一种电力负荷预测技术领域。目前只应用线性模型进行定量分析，准确率低。本发明包括以下步骤：根据各个部门用电量与产业发展之间的数据，进行相关性检验，获得与用电量相关的产业发展数据；将获得的用电量数据输入第一预测模型中，获得对应产业发展的第一预测值；将获得的用电量数据输入第二预测模型中，获得对应产业发展的第二预测值；判断第一预测值、第二预测值的差值，当差值大于阈值时，修正第一预测模型和第二预测模型；当差值小于阈值时，取第一预测值、第二预测值的平均值作为对应产业发展的预测值。本技术方案采用非线性回归的模型，两预测模型综合监控，有效提高精度及准确性。

Description

一种通过用电量数据预测经济产出的方法

技术领域

本发明涉及一种电力负荷预测技术领域，尤其涉及一种通过用电量数据预测经济产出的方法。

背景技术

电力是国民经济的重要基础。电力生产对以电能为重要生产资料的行业具有强烈响应，这种响应具体表现在工业生产与电力消费的直接作用之上。经济运行过程中的市场机制和政策调控推动了部分乃至全体行业的发展与进步，使得各行业逐步由高能耗向低能耗、低利润向高利润转型。产业结构的变化意味着电力消费模式的变化。可见电力负荷的波动与宏观经济的变化密切相关，研究电力负荷与宏观经济的相关性具有重要意义。

最近有人提出，电力与国内生产密切相关，研究人员将基于电力消费的经济建模研究分为两类：长期协整关系和短期因果关系。应用给基于偏最小二乘回归分析的中长期经济增长预测方法进行了实证分析。引进了M- 估计法，采用稳健回归的M-估计法估计参数并建立了用电量-经济的回归模型。

但是在现阶段经济学家只应用线性模型进行定量分析，其准确率低，这对由用电量预测行业经济增长是不够的。

发明内容

本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进，提供一种通过用电量数据预测经济产出的方法，以达到提高准确率的目的。为此，本发明采取以下技术方案。

一种通过用电量数据预测经济产出的方法，包括以下步骤：

一)根据各个部门用电量与产业发展之间的数据，进行相关性检验，获得与用电量相关的产业发展数据；

二)将获得的用电量数据输入第一预测模型中，获得对应产业发展的第一预测值；

三)将获得的用电量数据输入第二预测模型中，获得对应产业发展的第二预测值；

四)判断第一预测值、第二预测值的差值，当差值大于阈值时，修正第一预测模型和第二预测模型；当差值小于阈值时，取第一预测值、第二预测值的平均值作为对应产业发展的预测值；

其中第一预测模型的建立包括步骤：

步骤S11：获取训练数据，训练数据包括行业用电量数据X和行业经济指标数据Y；行业用电量数据X是某个工业行业的月用电量增量时间序列,行业经济指标数据Y是对应工业行业的月度生产总值；

步骤S12：将训练数据输入自回归滑动平均模型中，对训练数据X和 Y进行对数标准化处理，以降低训练模型的异方差，提升模型训练的可靠性；处理后的logX和logY作为模型训练的输入数据；

步骤S13：将输入数据打上时序标识log X＝[log X_t,log X_t-1,…,log X₂, logX₁]，log Y＝[log Y_t,log Y_t-1,…,log Y₂,log Y₁]；对输入数据进行时序检验，得到log X对log Y的滞后阶数n；

步骤S14：构造单隐层的自编码网络模型；隐层节点数m的设置方法是：若n≥10，m＝n；若n<10，m＝2n；隐层节点函数h(x)＝[1+ exp(-x)]^-1；

步骤S15：训练单隐层的自编码网络模型，得到网络参数W；对应的损失函数L(X)＝||X–h(X)||²+ρ||h’(X)||²，其中ρ代表正则系数；

步骤S16：单隐层的自编码网络模型训练完成后，提取模型的隐层输出值logX*＝WlogX，作为预测模型的自变量训练数据，即所提取的非线性特征值；

步骤S17：以行业用电量数据的对数值logY作为因变量训练数据，构建基于非线性特征提取的回归模型：log Y＝α+alog X*；用最小二乘法解得α,a＝[a₁,a₂,…,a_n],为预测模型的参数；从而获得第一预测模型；

其中第二预测模型的建立包括步骤：

步骤S21：获取训练数据，包括自变量行业用电量数据X和因变量行业经济指标数据Y，进行对数标准化处理；行业用电量数据X是某个工业行业的月用电量数据；行业经济指标数据Y是对应工业行业的月度行业GDP；

步骤S22：构造单隐层的极限学习机模型；隐层节点数设为10个；隐层节点函数为h(x)＝[1+exp(-x)]-¹；

步骤S23：训练单隐层的极限学习机模型，得到网络结构和对应参数 W；训练的损失函数为均方误差，均方误差的表达式为：MSE＝||Y–h(X)||²；

步骤S24：求解极限学习机模型，得到第二预测模型。

本技术方案根据各个部门产业发展与用电量之间的数据，进行相关性检验。根据各个部门的每月工业逐年增长率和每日电力消耗量，将数据进行对数处理。根据自编码网络，构建经济变量间的非线性回归模型。求解非线性回归模型，得出更为精确的经济预测电力模型。

本发明与现有技术相比，基于非线性回归的经济预测电力模型精确度要高于对数线性回归模型的结果。从而解决了现阶段经济学家只应用线性模型进行定量分析，提出了一种精确度更高的通过经济增长率来预测用电量消耗增长率的非线性回归模型。两预测模型综合监控，有效提高精度及准确性。

作为优选技术手段：在步骤S13中，时序检验的方法如下：

利用相关系数验证经济时间序列先行、一致或滞后关系；时差相关系数分为自相关系数和偏自相关系数；自相关系数的计算方法为：将原始序列看成一个序列，滞后的序列看成另一个序列，然后计算两列之间的相关系数；偏自相关系数的计算方法为：将一个重要的、能够敏感地反映当前经济活动的经济指标作为基准指标，然后使被选择指标超前或滞后若干期，计算它们的相关系数；

自相关系数的数学表达式为：

其中，下标k表示滞后阶数，X_t表示时间t的样本，表示时间样本均值，T表示截止采样时间。

偏自相关系数的数学表达式为：

其中，a_t＝Var(X_t)即时间t采样的方差。

自相关系数和偏自相关系数是用来判断自回归滑动平均模型中时间序列滞后项和残差时序滞后项的阶数的；判定的规则是当某个系数出现“截尾”现象，即滞后项的阶数被判定为所停留的阶数；“截尾”现象指的是随着阶数增大时，系数显著下降的现象。

作为优选技术手段：在步骤S14)、S15)中，自编码网络模型采用神经网络，其为一种无监督学习方法；单隐层自编码网络模型由一个编码映射层f和一个解码映射层g组成；输入向量X经过编码与解码两次非线性映射后得到的输出X'＝g(f(X))应与输入X近似相等；此时，由于网络的中间层结果f(X)经过解码映射g即可基本还原出X；

自编码网络的训练在数学上抽象为如下的优化问题：

min J_AE(W)＝L(X,g(f(X)))

其中：L是度量输入X与输出X'之间距离的损失函数，决策变量W表示网络参数；为了确保从数据中提取有意义的，且具有某些良好数学性质的特征，在优化目标中引入正则项；当需要避免过拟合问题时，在优化目标中加入网络参数的二范数：

避免过拟合问题；

当需增强对于输入当中的随机扰动的鲁棒性时，在优化目标中加入编码映射对输入导数的二范数：

增强对于输入当中的随机扰动的鲁棒性。

作为优选技术手段：步骤S16和S17中，非线性特征值的选取方法为：

当时序相关检验结果的滞后阶数n≥10时，则抽取全部隐层节点变量作为非线性特征值；

当时序相关检验结果的滞后阶数n<10时，由于节点的个数m＝2n 大于自回归滑动平均模型所需的自变量个数，利用k-means聚类算法，令k＝n，从而将m个非线性特征值降到n个。

作为优选技术手段：在k-means算法中，用质心来表示所聚的类别， k-means算法收敛等价于所有质心不再发生变化；基本的k-means算法流程如下：

1)随机选取k个质心；

2)遍历所有数据，将每个数据划分到最近的质心中；3)计算每个聚类的平均值，并作为新的质心；

4)重复步骤2)、3)，直到k个质心不再变化，即收敛为止。

作为优选技术手段：在步骤S17)中，根据自编码网络，根据均方误差作为精度的度量，构建经济变量间的非线性回归模型。

作为优选技术手段：极限学习机模型的基本数学表达式为：

其中，X表示网络的输入向量，B＝[β₁,...,β_L]^T表示网络的输出层权重，而H＝[h₁(X),...h_L(X)]^T表示一组满足分段连续特性的非线性特征变换函数，其对模型的输入层和隐层参数不进行优化，而是随机生成；在随机生成输入层与隐层参数后，网络的输出层权重可通过求解下面的优化问题获得：

min||HB-T||²

其中：H是隐层的映射函数矩阵；

T是训练数据构成的矩阵，||·||表示Frobenius范数；

优化问题的最优解可解析求解如下：

其中：表示映射函数矩阵的H的Moore-Penrose广义逆矩阵。

由于极限学习机模型(ELM)的输入层与隐层参数可随机给定，而输出层权重不需要优化，可通过矩阵求逆获得；因此，ELM的计算效率相较其它主流机器学习算法大幅提高，一般比支持向量机等常见算法训练速度提高一个数量级，比深度学习可最多提高数百倍，可以应用于大数据的在线处理；此外，理论与实践均证明，ELM具有对非线性函数的全局逼近能力，且由于隐层参数随机给定，对训练数据中的噪声相对不敏感，有利于避免过拟合。

作为优选技术手段：在步骤四)中，当修正第一预测模型和第二预测模型后；差值依旧大于阈值时，采用在测试集上的误差小的模型作为预测模型。

有益效果：本发明首先根据各个部门产业发展与用电量之间的数据，对经济指标和电力指标进行相关性检验，确定两者之间的相关性。根据各个部门的每月工业逐年增长率和每日电力消耗量，将数据进行对数处理。根据自编码网络，构建非线性回归模型，得到基于非线性回归的第一预测模型。第一预测模型的精确度要高于对数线性回归模型的结果。解决了现阶段经济学家只应用线性模型进行定量分析，提出了一种精确度更高的通过电量消耗增长来预测经济增长率的第一预测模型。用AutoEncoder给用电数据除了个噪声，再做回归，精度高；同时其与第二预测模型配合使用，也有效地防止了过拟合的情况发生。

本技术方案同时也采用基于极限学习机模型的第二预测模型。两模型综合使用，两模型相互配合，防止误测，实现的精确预测。在极限学习机模型中的输入层与隐层参数可随机给定，而输出层权重不需要优化，可通过矩阵求逆获得。因此，极限学习机模型(ELM)的计算效率相较其它主流机器学习算法大幅提高，一般比支持向量机等常见算法训练速度提高一个数量级，比深度学习可最多提高数百倍，可以应用于大数据的在线处理。此外，ELM具有对非线性函数的全局逼近能力，且由于隐层参数随机给定，对训练数据中的噪声相对不敏感，有利于避免过拟合。

附图说明

图1是本发明的第一预测模型建模流程图。

图2是本发明的第二预测模型建模流程图。

具体实施方式

以下结合说明书附图对本发明的技术方案做进一步的详细说明。

本发明包括以下步骤：

一种通过用电量数据预测经济产出的方法，包括以下步骤：

四)判断第一预测值、第二预测值的差值，当差值大于阈值时，修正第一预测模型和第二预测模型；当差值小于阈值时，取第一预测值、第二预测值的平均值作为对应产业发展的预测值

如图1所示，其中第一预测模型的建立包括步骤：

步骤S12：将训练数据输入自回归滑动平均模型中，对训练数据X和 Y进行对数标准化处理，以降低训练模型的异方差，提升模型训练的可靠性；处理后的log X和log Y作为模型训练的输入数据；

步骤S16：单隐层的自编码网络模型训练完成后，提取模型的隐层输出值log X*＝Wlog X，作为预测模型的自变量训练数据，即所提取的非线性特征值；

如图2所示，其中第二预测模型的建立包括步骤：

步骤S22：构造单隐层的极限学习机模型；隐层节点数设为10个；隐层节点函数为h(x)＝[1+exp(-x)]^-1；

步骤S24：求解极限学习机模型，得到第二预测模型。

其中，在步骤S13中，时序检验的方法如下：

自相关系数的数学表达式为：

其中，下标k表示滞后阶数，X_t表示时间t的样本，表示时间样本均值，T表示截止采样时间；

偏自相关系数的数学表达式为：

其中，a_t＝Var(X_t)即时间t采样的方差；

在步骤S14)、S15)中，自编码网络模型采用神经网络，其为一种无监督学习方法；单隐层自编码网络模型由一个编码映射层f和一个解码映射层g组成；输入向量X经过编码与解码两次非线性映射后得到的输出 X'＝g(f(X))应与输入X近似相等；此时，由于网络的中间层结果f(X)经过解码映射g即可基本还原出X；

自编码网络的训练在数学上抽象为如下的优化问题：

min J_AE(W)＝L(X,g(f(X)))

其中：L是度量输入X与输出X'之间距离的损失函数(如平方误差)，决策变量W表示网络参数(输入与输出权重及激发函数参数)；为了确保从数据中提取有意义的，且具有某些良好数学性质的特征，在优化目标中引入正则项；当需要避免过拟合问题时，在优化目标中加入网络参数的二范数：

避免过拟合问题；

增强对于输入当中的随机扰动的鲁棒性。

在步骤S16和S17中，非线性特征值的选取方法为：

当时序相关检验结果的滞后阶数n<10时，由于节点的个数m＝2n 大于自回归滑动平均模型所需的自变量个数，利用k-means聚类算法，令 k＝n，从而将m个非线性特征值降到n个；

在k-means算法中，用质心来表示所聚的类别，k-means算法收敛等价于所有质心不再发生变化；基本的k-means算法流程如下：

1)随机选取k个质心；

4)重复步骤2)、3)，直到k个质心不再变化，即收敛了，为止。

在步骤S17)中，根据自编码网络，根据均方误差作为精度的度量，构建经济变量间的非线性回归模型。

极限学习机模型的基本数学表达式为：

min||HB-T||²

其中：H是隐层的映射函数矩阵；

T是训练数据构成的矩阵，||·||表示Frobenius范数；

优化问题的最优解可解析求解如下：

其中：表示映射函数矩阵的H的Moore-Penrose广义逆矩阵。

由于ELM的输入层与隐层参数可随机给定，而输出层权重不需要优化，可通过矩阵求逆获得；因此，ELM的计算效率相较其它主流机器学习算法大幅提高，一般比支持向量机等常见算法训练速度提高一个数量级，比深度学习可最多提高数百倍，可以应用于大数据的在线处理；此外，理论与实践均证明，ELM具有对非线性函数的全局逼近能力，且由于隐层参数随机给定，对训练数据中的噪声相对不敏感，有利于避免过拟合。

以上图1、2所示的一种通过用电量数据预测经济产出的方法是本发明的具体实施例，已经体现出本发明实质性特点和进步，可根据实际的使用需要，在本发明的启示下，对其进行等同修改，均在本方案的保护范围之列。

Claims

1.一种通过用电量数据预测经济产出的方法，其特征在于：包括以下步骤：

其中第一预测模型的建立包括步骤：

步骤S12：将训练数据输入自回归滑动平均模型中，对训练数据X和Y进行对数标准化处理，以降低训练模型的异方差，提升模型训练的可靠性；处理后的logX和logY作为模型训练的输入数据；

步骤S13：将输入数据打上时序标识logX＝[logX_t,logX_t-1,…,logX₂,logX₁]，logY＝[logY_t,logY_t-1,…,logY₂,logY₁]；对输入数据进行时序检验，得到logX对logY的滞后阶数n；

步骤S14：构造单隐层的自编码网络模型；隐层节点数m的设置方法是：若n≥10，m＝n；若n<10，m＝2n；隐层节点函数h(x)＝[1+ exp(-x)]-¹；

步骤S17：以行业用电量数据的对数值logY作为因变量训练数据，构建基于非线性特征提取的回归模型：logY＝α+alogX*；用最小二乘法解得α,a＝[a₁,a₂,…,a_n],为预测模型的参数；从而获得第一预测模型；

其中第二预测模型的建立包括步骤：

步骤S23：训练单隐层的极限学习机模型，得到网络结构和对应参数W；训练的损失函数为均方误差，均方误差的表达式为：MSE＝||Y–h(X)||²；

步骤S24：求解极限学习机模型，得到第二预测模型。

2.根据权利要求1所述的一种通过用电量数据预测经济产出的方法，其特征在于：

在步骤S13中，时序检验的方法如下：

自相关系数的数学表达式为：

偏自相关系数的数学表达式为：

其中，a_t＝Var(X_t)即时间t采样的方差；

3.根据权利要求2所述的一种通过用电量数据预测经济产出的方法，其特征在于：在步骤S14)、S15)中，自编码网络模型采用神经网络，其为一种无监督学习方法；单隐层自编码网络模型由一个编码映射层f和一个解码映射层g组成；输入向量X经过编码与解码两次非线性映射后得到的输出X'＝g(f(X))应与输入X近似相等；此时，由于网络的中间层结果f(X)经过解码映射g即可基本还原出X；

自编码网络的训练在数学上抽象为如下的优化问题：

min J_AE(W)＝L(X,g(f(X)))

避免过拟合问题；

增强对于输入当中的随机扰动的鲁棒性。

4.根据权利要求3所述的一种通过用电量数据预测经济产出的方法，其特征在于：步骤S16和S17中，非线性特征值的选取方法为：

当时序相关检验结果的滞后阶数n<10时，由于节点的个数m＝2n大于自回归滑动平均模型所需的自变量个数，利用k-means聚类算法，令k＝n，从而将m个非线性特征值降到n个。

5.根据权利要求4所述的一种通过用电量数据预测经济产出的方法，其特征在于：在k-means算法中，用质心来表示所聚的类别，k-means算法收敛等价于所有质心不再发生变化；基本的k-means算法流程如下：

1)随机选取k个质心；

2)遍历所有数据，将每个数据划分到最近的质心中；

3)计算每个聚类的平均值，并作为新的质心；

4)重复步骤2)、3)，直到k个质心不再变化，即收敛为止。

6.根据权利要求4所述的一种通过用电量数据预测经济产出的方法，其特征在于：在步骤S17)中，根据自编码网络，根据均方误差作为精度的度量，构建经济变量间的非线性回归模型。

7.根据权利要求1-6任一权利要求所述的一种通过用电量数据预测经济产出的方法，其特征在于：极限学习机模型的基本数学表达式为：

min||HB-T||²

其中：H是隐层的映射函数矩阵；

T是训练数据构成的矩阵，||·||表示Frobenius范数；

优化问题的最优解可解析求解如下：

其中：表示映射函数矩阵的H的Moore-Penrose广义逆矩阵。

8.根据权利要求1所述的一种通过用电量数据预测经济产出的方法，其特征在于：在步骤四)中，当修正第一预测模型和第二预测模型后；差值依旧大于阈值时，采用在测试集上的误差小的模型作为预测模型。