CN113159361A

CN113159361A - 基于VDM和Stacking模型融合的短期负荷预测方法及系统

Info

Publication number: CN113159361A
Application number: CN202011398686.6A
Authority: CN
Inventors: 张倩; 丁津津; 王璨; 于洋; 高博; 徐斌; 谢毓广; 孙辉; 李远松; 张峰; 汪勋婷; 李圆智; 陈洪波; 何开元; 栾喜臣; 张骏
Original assignee: Electric Power Research Institute of State Grid Anhui Electric Power Co Ltd; Anhui University; State Grid Anhui Electric Power Co Ltd
Current assignee: Electric Power Research Institute of State Grid Anhui Electric Power Co Ltd; Anhui University; State Grid Anhui Electric Power Co Ltd
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2021-07-23

Abstract

本发明的一种基于VDM和Stacking模型融合的短期负荷预测方法及系统，采集负荷序列数据，并输入到事先训练好的预测模型，进行负荷预测并输出预测结果；其中，预测模型的训练步骤如下：采用VMD算法将获取到的原始负荷序列分解为不同的固有模态分量IMF；计算每个IMF负荷分量序列的ApEn值；把每一个ApEn值作为一个随机分量，基于Stacking的思想，XGBoost和长短期记忆神经网络来构建模态分量IMF的预测模型；通过将上述预测模型对各模态分量IMF的预测结果叠加得到最终预测结果，再进行加权融合。相比传统方法的结果，本发明方法的结果表明基于多模型融合的Stacking集成学习方法在电力负荷预测中有良好的应用效果。

Description

基于VDM和Stacking模型融合的短期负荷预测方法及系统

技术领域

本发明涉及电力负荷预测技术领域，具体涉及一种基于VDM和Stacking模型融合的短期负荷预测方法及系统。

背景技术

基于精确短期负荷预测(STLF)是制定电力供应计划和电力供需平衡的关键挑战之一。它考虑未来几天的预测，是电力市场运转和规划不可或缺的基础。提高短期负荷预测的精度有助于提高电力设备的利用率，减少能量的消耗，缓解电能供应端和需求端之间的不平衡。

在电力系统中，短期负荷预测是最深入广泛应用人工智能技术的领域之一。目前有大量的方法适用于短期负荷预测，而且可以分为统计学方法和基于人工智能的方法。本发明重点介绍基于人工智能的方法，因为它们能对不同变量间的复杂关系搭建出适合的模型，尤其是非线性关系。在短期负荷预测领域中，目前已经建立了基于智能的方法应用于负荷预测。现有技术的基于灰色投影改进随机森林算法，以及通过比较XGBoost和其他几种算法，表明了XGBoost模型在计算速度和预测精度的优势，以及将深层神经网络算法引入负荷预测问题，并且和浅层模型的预测结果进行比较。以及将长短期记忆神经网络应用于用户端的短期负荷预测，是深度学习中的一种经典算法。

尽管已经对汇总的负荷数据的短期负荷预测已经广泛研究，以上的工作仍着重于神经网络模型和深度学习算法。由于负荷序列有很强的随机性和易变性，很难通过单一的预测方法得到理想的预测准确度。电力负荷由于其规律性，波动性和混沌特性无法在时域和频域尺度上综合考虑。为克服这一问题，衍生很多算法如下：基于频域分解和人工智能算法的综合方法；特征提取技术能较好地处理负荷的复杂特点来增强预测精确度；小波分解是一种典型的频域分解的方法，负荷序列在进行ADF检定前先通过小波进行分解；二阶灰色预测模型的准确性；基于优化的前馈神经网络中应用最佳平稳小波包变换用于短期负荷预测；小波分解应用于数据筛选，再通过蝙蝠算法和比例共轭算法完成ANN的训练等等。

关于上述工作，这里仍有一些问题出现在频率分解，分量预测和数据重构。首先，传统的小波分解不能满足短期负荷预测的要求。此外，有更多先进的频率分解方法已经被应用，比如EMD，VMD算法。第二，通过数值性能指标对得到的分解分量判断是很有必要的。除此之外，选择有效的智能算法和相关超参数是有一定难度的。最后，在对几个分量分别预测后的结果进行数据重构和模型融合的工作较少。

传统小波分解无法有效处理其平移不变性问题和模型混叠现象。为了解决小波变换中的平移不变性问题，基于EMD的分解方法能有效实现原始负荷的分解，再通过预测方法预测每个分离的IMF。然而，EMD分解方法很难避免模型混叠现象。错误得到的IMF会对预测精度造成负面影响。在这种情况下，VMD将负荷数据分解为具有不同特征的模态函数，是为了避免出现模态混叠的发生，同时提高信号的分析效果。

由频率分解和人工智能技术混合组成的方法不但能够用于负荷预测，而且已经应用于可再生能源的预测。现有文献中将VMD算法用于风力预测，再用人工智能技术算法估算其分解所得分量，寻找分解水平和分量的稳定性之间的平衡在频率分解的过程中很有必要的，采用ADF检验法来评价获得分量的稳定性。采用具有噪声的基于密度的聚类算法寻找任意形状的簇，且将高密度的点区域划分为多个簇。分解结果的性能指标仍需要更多关注。

先前的工作中主要使用的频率分解方法为长短期记忆网络(LSTM)、循环神经网络(RNN)和Elman神经网络，发现使用多种人工智能神经网络构造最佳预测模型结构是非常困难和费时的。

发明内容

本发明提出的一种基于VDM和Stacking模型融合的短期负荷预测方法，可解决上述技术缺陷。

为实现上述目的，本发明采用了以下技术方案：

采集负荷序列数据，并输入到事先训练好的预测模型，进行负荷预测并输出预测结果；

其中，预测模型的训练步骤如下：

采用VMD算法将获取到的原始负荷序列分解为不同的固有模态分量IMF；

计算每个IMF负荷分量序列的ApEn值；

把每一个ApEn值作为一个随机分量，基于Stacking的思想，XGBoost和长短期记忆神经网络来构建模态分量IMF的预测模型；

通过将上述预测模型对各模态分量IMF的预测结果叠加得到最终预测结果，再进行加权融合。

进一步的，所述采用VMD算法将获取到的原始负荷序列分解为不同的固有模态分量IMF，具体包括：

假设：

u_k(t)是模态函数的输入信号，{u_k}代表模态集合{u₁，u₂，......,u_k}，ω_k是与输入信号的第k个模态相对应的中心频率，{ω_k}代表模态分量对应的中心频率{ω₁,ω₂,...,ω_k}，f(t)是输入信号，δ(t)是单位脉冲函数；

通过引入拉格朗日乘数λ和二次惩罚因子ψ，公式(1)可改写为：

对方程进行求解时采用乘法的交替方向法，得到一组模态分量及其各自的中心频率，通过频域的解中估算每种模态，并表示为：

其中n是迭代次数，

和

分别代表f(t)，

u_i(t)和λ(t)傅里叶变换后的形式；

在公式(3)中，它具有维纳滤波器结构的特征，可直接更新傅立叶域中的模态；此外，通过提取傅立叶逆变换的实部在时域中获得这些模态；

运用公式(4)，计算出这些模态的中心频率

这表明新的中心频率位于其各自模态功率谱的重心处。

进一步的，所述计算每个IMF负荷分量序列的ApEn值，具体包括以下步骤：

(6)通过IMF序列构造一组q维向量：

(7)上述构造的向量中任意两组间的距离计算式为：

(8)上述构造的向量中任意两组间的相关程度计算式为：

其中H{·}是Heaciside函数，ε是相似公差；

(9)向量序列a的平均自相关程度计算式为：

(10)ApEn S_a求解为：

S_a＝δ(q,ε)-δ(q+1,ε) (9)。

进一步的，所述把每一个ApEn值作为一个随机分量，基于Stacking的思想，XGBoost和长短期记忆神经网络来构建模态分量IMF的预测模型具体包括：

树的集成模型如下：

其中，

是模型的预测值，M是树的数量，F是M颗树的集合，x_i是第i个节点的特征向量，f_k对应于第m颗树结构q和叶子权重ww；

XGBoost模型的损失函数L由以下两部分组成：

第一部分是预测值

和目标真实值y_i的训练差，后一部分是树的复杂度之和，是控制模型复杂度的正则项，如下表示：

其中α和β代表模型的惩罚系数；

对于公式(11)在序列最小化的过程中，每轮增加函数f_t(x_i)以尽可能减少损失函数，T回合的目标函数写成如下：

对于公式(13)，使用二阶泰勒展开近似目标函数，每个叶节点j上样本下标集合为I_j＝{i|q(x_i＝j)}，因此，公式(13)如下表示：

其中

和

分别为损失函数的第一阶和第二阶导数；

和

分别定义为G_j和H_j，公式(14)改写为如下：

对W偏导，得到公式(16)

将权重代入目标函数，公式(16)可以表示如下：

损失函数越小，表示模型越好；

贪婪算法用于划分子树并枚举可行的分割点，也就是说，每次将新的分割添加到现有叶子时，都会计算出由此获得的最大增益；增益L_Gain计算如下：

其中项目1和2分别代表通过拆分左右子树生成的增益，项目3代表不拆分子树的增益。

进一步的，所述把每一个ApEn值作为一个随机分量，基于Stacking的思想，XGBoost和长短期记忆神经网络来构建模态分量IMF的预测模型，其中包括训练步骤：

用以下方程定义LSTM单元：

输入转换定义如下：

c-in_t＝tanh(W_xcx_t+W_hch_t-1+b_c-in) (20)

状态更新为：

其中x_t和h_t是计算节点的输入和输出，i_t是输入门的输出，f_t是遗忘门的输出，c_t是单元状态，o_t是输出门的输出，t是当前时间，W和b是参数矩阵；

对于一个数据集S＝{(y_n,x_n),n＝1,...,N}，x_n是第n个样本的特征向量，y_n是第n个样本对应的预测值；

将数据集随机分为K个子集S₁，S₂，…，S_K，每个子集大小基本相等；

将S_-K＝S-S_K，S_new＝y_n，Z_1n，…，Z_Kn和S_K分别定义为K折测试集和经过m折交叉验证的训练集；对于包括基于K的学习器的第一级预测算法，训练集S_-K采用第K个算法训练来得到基模型L_K；

对于k折交叉验证中的k折测试集S_K中的每个样本x_n，基学习器L_K的预测表示为z_Kn；

完成交叉验证的过程后，基于K的学习器的输出数据形成一个新的数据样本，即：S_new＝y_n，Z_1n，…，Z_Kn；

新的数据集作为Stacking的二层输入数据；

第二级预测算法将这些数据求和得到元学习器L_new。

另一方面，本发明的一种基于VDM和Stacking模型融合的短期负荷预测系统，包括以下单元：

数据采集单元，用于采集负荷序列数据；

预测单元，用于把采集到的数据输入到事先训练好的预测模型，进行负荷预测并输出预测结果；

其中，还包括模型训练单元，用于采用VMD算法将获取到的原始负荷序列分解为不同的固有模态分量IMF；并计算每个IMF负荷分量序列的ApEn值，把每一个ApEn值作为一个随机分量，基于Stacking的思想，XGBoost和长短期记忆神经网络来构建模态分量IMF的预测模型；通过将上述预测模型对各模态分量IMF的预测结果叠加得到最终预测结果，再进行加权融合。

本发明的一种基于VDM和Stacking模型融合的短期负荷预测方法，是一种新颖的短期负荷预测方法，该方法结合了XGBoost算法、LSTM神经网络和集成学习方法，以及VMD和模型融合的方法论。VMD算法将负荷序列分解为多个具有不同特征的子序列。ApEn用来计算每个IMF的复杂度。计算结果相近的IMF将合成新的分量，形成随机分量、细节分量和趋势分量。在Stacking集成框架下，考虑多个模型的数据观测空间，建立了一种多模型融合的负荷预测模型。相比传统方法的结果，该方法的结果表明基于多模型融合的Stacking集成学习方法在电力负荷预测中有良好的应用效果。

附图说明

图1是本发明的预测模型的训练步骤示意图；

图2是LSTM单元框架示意图；

图3基于Stacking的集成学习模型方法示意图；

图4是本发明的预测系统的流程图；

图5是Stacking框架下基于多模型的负荷预测示意图；

图6是本发明实施例每个模型的预测误差的相关性分析；

图7是本发明实施例的原始负荷序列；

图8是本发明实施例的VMD分解结果；

图9是本发明实施例的VMD分解结果；

图10是本发明实例的三种模型预测结果的比较；

图11是本发明实施例的三种模型的六天预测天数的误差指标。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。

负荷预测技术的提高和细化对网络分配的实时调度是至关重要的，为达到这一目的，本发明实施例提出一种基于变分模态分解(VMD)和stacking模型融合的短期负荷预测方法。如图1所示，本实施例所述的基于VDM和Stacking模型融合的短期负荷预测方法，包括首先，VMD算法将负荷序列分解为不同的固有模态分量(IMF)，每个IMF的近似熵(ApEn)被用来计算产生新的分量。第二，基于Stacking的思想，XGBoost和长短期记忆(LSTM)神经网络被用来预测每个IMF。然后，通过将各分量的预测结果叠加得到这两个模型的最终预测结果，再进行加权融合。该方法与XGBoost、LSTM、VMD-XGBoost和VMD-LSTM方法的预测结果比较，可以有效提高预测的精度，减少预测值和实际值的偏差程度。

具体的说，本发明的一种基于变分模态分解(VMD)和stacking模型融合的短期负荷预测方法包括以下步骤：

其中，预测模型的训练步骤如图1所示：

计算每个IMF负荷分量序列的ApEn值；

以下具体说明：

首先，在介绍了负荷数据分解的VMD算法的原理和近似熵(ApEn)。其次，阐述了用于分量预测的XGBoost算法原理。然后，对分量模型构造建立了LSTM神经网络。最后，对模型融合提出了基于stacking的集成学习方法。

1.1VMD算法原理

VMD估算方法，该方法用于非平稳信号的自适应分解。它本质上是一种自适应维纳滤波器组，可以有效地将测试信号分解为有限带宽的一组中心频率。和EMD方法不同，VMD方法使用了非递归和变分模态求解模式来处理原始信号，具有更好的抗噪声和非平稳性能。

VMD的目的是将多分量信号分解为一组具有特定带宽稀疏性的有限带宽模态分量。相反，这些分解到的模态也可以重构输入信号。解决约束变分优化问题可描述为：

u_k(t)是模态函数的输入信号，{u_k}代表模态集合{u₁，u₂，......,u_k}，ω_k是与输入信号的第k个模态相对应的中心频率，{ω_k}代表模态分量对应的中心频率{ω₁,ω₂,...,ω_k}，f(t)是输入信号，δ(t)是单位脉冲函数。

对方程进行求解时采用乘法的交替方向法，得到一组模态分量及其各自的中心频率，可以频域的解中估算每种模态，并表示为：

其中n是迭代次数，

和

分别代表f(t)，

u_i(t)和λ(t)傅里叶变换后的形式。

在公式(3)中，它具有维纳滤波器结构的特征，可以直接更新傅立叶域中的模态。此外，可以通过提取傅立叶逆变换的实部在时域中获得这些模态。

运用公式(4)，可以轻松地计算出这些模态的中心频率

这表明新的中心频率位于其各自模态功率谱的重心处。

1.2ApEn值

为了理解每种情况下电力负荷的复杂性，应用了数据分析中的确定性混沌情况。近似熵(ApEn)的引入意味着潜在的确定性模式或者负荷数据的混沌。它能够描述时间序列的复杂度，并且已经广泛用于各种领域。ApEn能识别顺序和规律性的存在和程度，在其他情况下，它可能被认为是随机或者无序的数据。每个IMF负荷分量序列的ApEn值计算如下:

(11)通过IMF序列构造一组q维向量：

(12)上述构造的向量中任意两组间的距离计算式为：

(13)上述构造的向量中任意两组间的相关程度计算式为：

其中H{·}是Heaciside函数，ε是相似公差。

(14)向量序列a的平均自相关程度计算式为：

(15)ApEn S_a求解为：

S_a＝δ(q,ε)-δ(q+1,ε) (9)

1.3XGboost算法原理

XGBoost通常由数据科学家使用。它是一种可扩展的机器学习系统用于避免过拟合的提升树算法。它在自身领域表现良好，而且在许多机器学习竞赛中表现很成功。可将XGBoost用于因子分解机在电力系统暂态稳定评估的应用。它也应用于分类问题，柴油品牌识别和空气污染控制等。XGBoost是一种优化的集成树模型，它是对梯度提升树模型的提升和扩展。树的集成模型如下：

其中，

是模型的预测值，M是树的数量，F是M颗树的集合。x_i是第i个节点的特征向量，f_k对应于第m颗树结构q和叶子权重ww。

XGBoost模型的损失函数L由以下两部分组成：

第一部分是预测值

和目标真实值y_i的训练差。后一部分是树的复杂度之和，是控制模型复杂度的正则项，可如下表示：

其中α和β代表模型的惩罚系数。

对于公式(11)在序列最小化的过程中，每轮增加函数f_t(x_i)以尽可能减少损失函数。T回合的目标函数可以写成如下：

对于公式(13)，使用二阶泰勒展开近似目标函数。每个叶节点j上样本下标集合为I_j＝{i|q(x_i＝j)}。因此，公式(13)可以如下表示：

其中

和

分别为损失函数的第一阶和第二阶导数。

和

分别定义为G_j和H_j，公式(14)改写为如下：

对W偏导，得到公式(16)

将权重代入目标函数，公式(16)可以表示如下：

损失函数越小，表示模型越好。贪婪算法用于划分子树并枚举可行的分割点，也就是说，每次将新的分割添加到现有叶子时，都会计算出由此获得的最大增益。增益L_Gain计算如下：

1.4LSTM神经网络

传统神经网络在处理分类和回归问题时，无法避免陷入局部最优的情况，然而深度学习神经网络可以通过预先训练缓解这个问题。LSTM神经网络是一种广泛用于自然语言处理的一种深度学习算法，它可被用于短期负荷预测的混合方法，LSTM网络通常由输入层、输出层和隐藏层组成，LSTM通过门控制信息的删除或增加，新信息添加到输入门控制，输出门用来控制滤除当前单元状态的数量，LSTM的记忆单元结构如图2所示。

cell单元是计算节点的核心，它用于记录当前时间状态。输入和输出门用来控制信息的输入和输出。遗忘门用来控制单元内历史状态信息的保留。门使用sigmoid激活函数来保持遗忘门的输出值在0-1之间。当遗忘门的输出值为0时,，它表示先前状态的所有信息都丢失。当输出值为1时，先前状态的信息将被保留。

可以用以下方程定义LSTM单元：

输入转换定义如下：

c-in_t＝tanh(W_xcx_t+W_hch_t-1+b_c-in) (20)

状态更新为：

其中x_t和h_t是计算节点的输入和输出，i_t是输入门的输出，f_t是遗忘门的输出，c_t是单元状态，o_t是输出门的输出，t是当前时间，W和b是参数矩阵。

在公式(21)中，可以看出，不仅o_t有效，而且h_t是LSTM网络的一个特殊功能，解决了参数训练效率低的问题。

1.5基于Stacking的集成学习

Stacking[25-27]集成学习框架首先将原始数据集划分为几个子集，将它们放入第一级预测模型的每个基学习器，每个基学习器输出各自的预测结果。然后，一层的输出将被用来作为二层的输入来训练二层预测模型的元学习器。最终的预测结果由位于二层的模型输出。Stacking学习框架对多个模型输出进行概括，以此提高整体预测精度，如图3所示。

stacking集成学习的具体训练方法：对于一个数据集S＝{(yn,xn),n＝1,...,N}，x_n是第n个样本的特征向量，y_n是第n个样本对应的预测值。将数据集随机分为K个子集S₁，S₂，…，S_K，每个子集大小基本相等。将S_-K＝S-S_K，S_new＝y_n，Z_1n，…，Z_Kn和S_K分别定义为K折测试集和经过m折交叉验证的训练集。对于包括基于K的学习器的第一级预测算法，训练集S_-K采用第K个算法训练来得到基模型L_K。

对于k折交叉验证中的k折测试集S_K中的每个样本x_n，基学习器L_K的预测表示为z_Kn。完成交叉验证的过程后，基于K的学习器的输出数据形成一个新的数据样本，即：S_new＝y_n，Z_1n，…，Z_Kn。

新的数据集作为Stacking的二层输入数据。第二级预测算法将这些数据求和得到元学习器L_new。stacking配置能够将第一层算法的训练结果充分利用。第二层算法可以发现并纠正第一层学习算法中的预测误差，以提高模型的准确性。

2.基于VMD和模型融合的短期负荷预测

2.1前期工作

电力负荷在一定程度上受到人类活动、气象条件、社会经济和政治因素的影响，呈现出一定的波动性和随机性。但是，人类的生活和生产活动具有一定的规律性，因此负荷也具有很强的周期性特征。为了研究和分析负荷序列的特性，本发明采用VMD方法对原始负荷序列进行分解，并结合ApEn算法得到了反映负荷特性的分量包。

集成学习是一种基于统计学理论的多算法融合机器学习方法。Stacking集成学习是一种模型集成技术，它将来自多个预测模型的信息组合起来以生成新模型。与单个算法相比，不同的机器学习算法以不同的方式进行组合以实现更好的性能。在Stacking集成学习模型中，有必要分析每个基础学习者的个体预测能力，并全面比较每个基学习器的组合效果，使得Stacking集成学习模型获得最佳的预测效果。

2.2算法选择

综上所述，Stacking集成模型的第一层最初选择XGBoost，LSTM，GBDT，RF，KNN，SVM作为基学习器，第二层选择XGBoost作为元学习器。为了获得最佳的预测效果，差异度大的算法可以最大程度地体现不同算法的优势，并使每个差异模型相互学习。因此，应该在第一层Stacking模型中选择差异度较大的模型作为基学习器。本发明采用Pearson相关系数计算每个模型的误差差异度，从而分析不同基学习器的相关度。计算公式如下：

为了避免数据被双层学习器重复学习且防止“过拟合”的发生，有必要合理地使用过程对数据进行划分。根据所选的六个基学习器，应将原始训练数据集根据时间维度划分为六个子数据集，并且每个数据ID不应相互重叠。对于单个基学习器，将一个数据块用作验证集和其他五个数据块用作训练集。每个基学习器都可以为自己的测试数据集输出预测结果，然后可以将这六个结果最终合并为一个新的数据集。因此，实现了从输入特征到输出特征的所有数据的特征变换。由于每个基学习器预测的数据块都不参与学习器的训练，因此，这种配置使所有数据在模型训练期间仅使用一次，并且有效地防止了过拟合的发生。

2.3本发明提出模型的整个过程

基于基学习器的预测能力，除了Stacking模型第一层中的XGBoost算法和LSTM网络外，本发明还选择了几种具有出色预测性能的模型作为基学习器。这是因为具有较强学习能力的基模型有助于提高模型的整体预测效果。其中，随机森林(RF)和梯度增强决策树(GBDT)分别采用bagging和boosting的集成学习模式。它们具有出色的学习能力和严格的数学理论支持，并广泛应用于各个领域。支持向量机(SVM)在求解小样本，非线性和高维回归问题方面具有自己的优势。KNN理论成熟，训练效率高，具有良好的实际应用效果。在第二层中，选择具有较强泛化能力的模型，从中引入并纠正多种学习算法对训练集的偏差，并通过集的方式防止过拟合的效果。

Stacking框架中基于多模型融合的负荷预测方法的训练过程如下。预测的流程图如图4所示。

(1)将VMD方法是用于分解原始负荷序列，可以获得一系列有利于预测的负荷分量。

(2)每个IMF的预测结果基于Stacking模型融合方法。在Stacking框架中基于多模型融合的负荷预测方法的训练过程如图5所示。

(3)每个IMF的预测结果是叠加的，这是本发明提出方法的最终预测结果。

以下举例说明：

3.案例分析

3.1数据集合与评价指标

实验数据源自中国安徽省某一城市2017年5月20日至2017年6月29日，采样时间为15分钟，共3936个采样点。选择样本中的前3360次采样点进行训练，后576次采样点进行测试。平均绝对百分比误差(MAPE)用于评估模型的质量，均方根误差(RMSE)用于反映预测的精度。公式(23)如下:

其中

为预测值，y_i为实际值，n为样本数量。

3.2模型融合：超参数选择和交叉验证

为了获得最佳的Stacking性能，有必要基于每个基模型的学习能力以及每个模型之间的相关性进行分析。

首先，设计实验以比较和分析每个基学习器对原始数据集的单个预测的结果。根据交叉验证方法，将划分的数据进一步分为训练集和验证集。在分别观察和训练不同的超参数之后，根据模型在验证集中的预测效果，从而选择每个模型的最优超参数。表1中显示了每个模型的超参数和单个模型的预测性能。

表1：不同单一算法的超参数和预测误差

表1证明了当每种算法单独进行预测时，XGBoost的预测误差很小。由于XGBoost对损失函数采用二阶泰勒展开，因此优化过程使用一阶和二阶导数信息进行更新和迭代，这使得模型训练更加充分。此外，考虑到负荷数据的变化是一个连续的过程，当前时间的负载和先前时间的负载不是彼此独立的。因此，每一时刻的负载变化不仅取决于当前时刻的输入特性，还取决于过去的输入特性。LSTM算法可以有效利用先前训练的累积信息，并且预测性能也优秀。

Stacking框架集成了多种预测算法，可以充分利用每种算法来观察来自不同数据空间和结构的数据。因此，除了选择性能优异的算法外，第1层的基学习器还应尽可能增加不同类型的预测算法。为了选择最佳的基模型进行组合，设计了一些实验来比较预测误差的分布由每个基学习器的独立负荷预测生成。二维向量的Pearson相关系数用作相关指数，每种算法的误差相关分析如图6所示。

图6表明了每种算法的误差相关性通常都很高。这是由于每种算法的强大学习能力所致，并且在训练过程中学习到的数据本身的误差是不可避免的。其中，XGBoost，GBDT，RF算法具有最高的误差相关性。尽管这三种算法的原理略有不同，但它们总体上仍属于树集成算法，并且它们的数据观察方法具有很强的相似性。LSTM，SVM和KNN的训练机制存在较大差距，所以误差相关性也较低。因此，本发明选择了XGBoost，LSTM，SVM和KNN作为Stacking集成学习的基模型。

3.3基于VMD算法和ApEn值的频率分解

用VMD方法分解原始数据集，将VMD算法的超参数设置为：惩罚参数为1000，模态函数数为5(经过反复测试)，初始中心频率为0，收敛准则为10-6。图7和图8分别显示了原始载负序列和VMD分解结果。

如果直接对五个模态函数进行建模，则任务量将增加。在本发明中，ApEn用于计算每个模态函数的复杂度。具有相似ApEn值的模态函数被组合到一个新序列中，以形成随机分量，细节分量和趋势分量，从而减少了建模任务。求解ApEn时需要确定两个不确定的参数，维数为2，相似度公差为0.15STD(STD为序列的标准偏差)。图9是合并后的新序列分量。

趋势分量反映了负荷的日变化规律，规律性强，波动小。细节分量表明人们的生活不同于生产用电规律，具有周期性强，规律性好等特点。随机分量反映了人们的工作时间和中途休息时间之间不同的用电规则。该分量波动很大，受到生产方式的影响，并且具有一定的随机性和波动性。

3.4Stacking模型融合的预测性能分析

然后，分别对在上一节中获得的三个分量进行建模和预测，最终的预测结果是将三个分量的预测结果叠加后的预测结果。为了验证stacking模型融合的预测性能，选择了XGBoost和VMD-XGBoost模型，并与VMD-stacking模型融合的预测效果进行了比较。三种模型的预测结果如图10所示。三种方法的误差统计结果如表2所示。

表2:三种模型的误差统计结果

从图10的放大区域可以看出，单个XGBoost模型在峰值和峰谷负荷下的预测误差很大，而本发明提出的模型的预测值比VMD-XGBoost的预测值更接近实际负荷值。在表2中，本发明提出的方法的MAPE和RMSE分别为1.25％和13.83mw。与其他两种方法相比，本发明提出的短期负荷预测方法具有较高的准确性。这表明本发明提出的短期负荷预测方法具有较准确的预测结果，预测值与实际值的偏差范围较低。

六天的预测天数的误差指标的箱线图如图11所示。选择误差值(实际值与预测值的差)来比较三种负荷预测方法。以第二天的箱线图的误差为例。结果表明，VMD-stacking方法的中位数小于VMD-XGBoost和XGBoost方法的中位数。VMD-stacking方法的误差值的上限和下限明显小于VMD-XGBoost和XGBoost方法的误差值的上限和下限。此外，VMD-stacking方法没有异常值，而VMD-XGBoost和XGBoost方法分别有两个或更多异常值。研究还表明，尽管VMD-stacking和VMD-XGBoost的中值接近，但提出的VMD-stacking方法具有较低的误差值和更稳定的预测性能。与XGBoost相比，VMD-stacking方法的误差值的变化区间较小。此外，VMD-stacking方法的误差中值明显小于XGBoost。因此，本发明提出的方法在预测性能方面有了显著提升。

综上所述，本发明提出了一种基于VMD和stacking模型融合的短期负荷预测方法。VMD算法将非平稳的负荷序列分解得到一系列分量，再通过ApEn算法对其进行重构。基于stacking集成学习的思想，选择人工智能和机器学习领域的高级算法作为预测模型并进行融合。这样不同的算法可以相互学习并获得最佳的预测结果。通过示例测试，将提出的模型的预测结果与VMD-XGBoost和XGBoost模型的预测结果进行比较。结果表明，该方法具有较高的预测精度。

另一方面，本发明还公开一种基于VDM和Stacking模型融合的短期负荷预测系统，包括以下单元：

数据采集单元，用于采集负荷序列数据；

预测单元，用于把采集到的数据输入到事先训练好的预测模型，

进行负荷预测并输出预测结果；

可理解的是，本发明实施例提供的系统与本发明实施例提供的方法相对应，相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。