CN112785056B

CN112785056B - 一种基于CatBoost和LSTM模型融合的短期负荷预测方法

Info

Publication number: CN112785056B
Application number: CN202110086845.7A
Authority: CN
Inventors: 陈忠华; 俞容江; 高振宇; 王才倩; 陈嘉敏; 石国超; 董悦
Original assignee: Hangzhou Electric Power Design Institute Co ltd
Current assignee: Hangzhou Electric Power Design Institute Co ltd
Priority date: 2021-01-22
Filing date: 2021-01-22
Publication date: 2023-04-28
Anticipated expiration: 2041-01-22
Also published as: CN112785056A

Abstract

本发明公开了一种基于CatBoost和LSTM模型融合的短期负荷预测方法，包括以下步骤：S1、获取样本数据，提取样本数据的特征向量并进行预处理；S2、利用预处理后的样本数据，使用K折交叉验证分别训练得到多个CatBoost模型和LSTM模型；S3、利用Stacking策略，用RidgeRegression模型来融合CatBoost模型和LSTM模型的预测结果，用以构建混合模型，再使用混合模型来进行短期负荷的预测。本发明具有预测准确的优点。

Description

一种基于CatBoost和LSTM模型融合的短期负荷预测方法

技术领域

本发明涉及电力系统负荷预测技术领域，具体为一种基于CatBoost和LSTM模型融合的短期负荷预测方法。

背景技术

电力系统的稳定运行是社会高速发展的基础，保障电力系统运行的安全性和可靠性具有重要的意义。为了保障电力系统稳定运行，满足用户变化的用电需求，电力部门需要制定合理的电力调度方案，准确的短期负荷预测是制定科学合理的调度方案的必要条件。

短期负荷预测以日负荷值为预测目标，主要用来给电网的日常调度提供参考。短期负荷容易受到很多因素的影响，例如经济、天气、社会活动等因素，这些因素对负荷的影响都是非线性的，这使得精准的短期负荷预测成为了一个巨大的挑战。

传统的负荷预测方法主要包括线性回归模型和自回归移动平均模型。线性回归模型容易理解，实现方便，但缺点在于难以用于复杂的非线性拟合中。自回归移动平均模型是一种时间序列预测方法，对平稳的时间序列预测精度较高，但其高阶模型的参数估计较为困难，并且负荷序列多为非平稳序列，因此该方法具有很大的局限性。

随着人工智能技术和负荷预测技术的发展，越来越多机器学习和深度学习方法被用于解决负荷预测问题，这些模型凭借其强大的学习能力和泛化能力，对各种因素和负荷之间的非线性关系进行拟合，展示出了不俗的预测性能。

CatBoost是一种新颖且强大的梯度提升决策树算法，对类别型特征进行了有效的处理，在某些领域取得了优异的预测精度，而负荷预测问题中正有很多具有很大挖掘价值的类别型特征。神经网络模型广泛应用于各个领域中，其中，LSTM模型主要用于解决时间序列问题，而负荷预测问题就是典型的时间序列问题，历史负荷数据会对当前的负荷值产生影响。由于短期负荷值受到多种因素的影响，不同的模型关注的重点不同，单一的预测模型容易陷入局部最优解，导致预测结果出现误差。

发明内容

本发明的目的在于，提供一种基于CatBoost和LSTM模型融合的短期负荷预测方法。本发明具有预测准确的优点。

本发明的技术方案：一种基于CatBoost和LSTM模型融合的短期负荷预测方法，包括以下步骤：

S1、获取样本数据，提取样本数据的特征向量并进行预处理；

S2、利用预处理后的样本数据，使用K折交叉验证分别训练得到多个CatBoost模型和LSTM模型；

S3、利用Stacking策略，用RidgeRegression模型来融合CatBoost模型和LSTM模型的预测结果，用以构建混合模型，再使用混合模型来进行短期负荷的预测。

上述的基于CatBoost和LSTM模型融合的短期负荷预测方法，所述样本数据表示为：

{(x₁，y₁)，(x₂，y₂)，...，(x_n，y_n)}；

其中：x_i是第i个样本的特征向量，

m是特征维度；y_i是第i个样本的负荷数据；

所述特征向量包括时间特征、天气特征、节假日特征、历史负荷特征；

所述时间特征包括年份、季度、月份、日、星期、一周的第几天和是否是周末；

所述天气特征包括日最高气温、日最低气温、日平均气温、日最大气温差、日最高湿度、日最低湿度、日平均湿度和日最大湿度差；

所述节假日特征包括该日是否为节假日和是否为调休日；

所述历史负荷特征包括使用前一周的历史负荷。

前述的基于CatBoost和LSTM模型融合的短期负荷预测方法，所述预处理包括缺失值的处理、归一化处理和独热编码；

所述缺失值处理是采用线性插值对样本数据中的缺失值进行补全，所述线性差值表示如下：

其中，

为缺失值，表示第n个样本的第k维特征向量；

表示第n-1个样本的第k维特征向量；

表示第n+1个样本的第k为特征向量；

所述归一化处理用于处理天气特征和历史负荷特征，归一化公式如下：

其中：

是归一化处理后的数据；x是原始数据；x_max是对应特征在样本数据中的最大值；x_min是对应特征在样本数据中的最小值；

所述独热编码用于处理时间特征和节假日特征；通过对时间特征和节假日特征进行独热编编码转换成二进制编码，用于LSTM模型的输入。

前述的基于CatBoost和LSTM模型融合的短期负荷预测方法，所述S2步骤具体如下：将经过预处理的样本数据作为训练集，在训练CatBoost模型和LSTM模型时，采用K折交叉验证法，取K为10，将训练集分为10份，通过10轮训练得到10个CatBoost模型和10个LSTM模型；

在每轮训练的时，依次用每份训练集中的其中9份作为测试集，剩余1份作为验证集，经过10次训练后，用每次训练得到的CatBoost模型和LSTM模型分别对验证集和测试集进行预测，将CatBoost模型和LSTM模型的各自的10个验证集预测结果对应拼接起来，得到原训练集的预测结果；将CatBoost模型和LSTM模型的各自的10个测试集的预测结果取平均值，得到测试集的预测结果。

前述的基于CatBoost和LSTM模型融合的短期负荷预测方法，所述S3步骤具体如下：

将CatBoost模型和LSTM模型作为Stacking第一层的基学习器，用一个RidgeRegression模型作为Stacking第二层的结合模型，将第一层的基学习器的输出作为第二层的结合模型的输入，构建一个混合模型；

将CatBoost模型和LSTM模型对验证集的预测结果拼接起来，作为第二层的训练集特征；将CatBoost模型和LSTM模型对测试集的预测结果作为第二层的测试集特征，得到最终的短期负荷预测。

与现有技术相比，本发明通过提取样本数据的特征向量并对其进行预处理，再利用预处理后的样本数据结合K折交叉验证分别得到训练得到多个CatBoost模型和LSTM模型，然后利用Stacking策略，用RidgeRegression模型来融合CatBoost模型和LSTM模型的预测结果，用以构建混合模型，再使用混合模型来进行短期负荷的预测。由此，本发明结合各个模型的预测结果来得到最终预测结果，可以吸取不同模型的优点从而提高预测精度；本发明通过Stacking策略提高了混合模型对特征向量和负荷之间关系的学习能力，提高了预测的准确性。此外，由于短期负荷值收到多种因素的影响，由此本发明采用的特征向量数量多、范围广，充分的考虑了不同因素对短期负荷的影响，从而可以适用于不同的模型进行结果预测，便于后续结合不同模型的预处理结果。

附图说明

图1为本发明方法的实现流程图；

图2为LSTM的结构图；

图3为本发明方法与现有技术的预测结果对比图。

具体实施方式

下面结合附图和实施例对本发明作进一步的说明，但并不作为对本发明限制的依据。

实施例：一种基于CatBoost和LSTM模型融合的短期负荷预测方法，本实施例以spyder为开发平台，以python为开发语言，CatBoost模型使用CatBoost机器学习库来实现，LSTM模型使用Keras深度学习库来实现，RidgeRegression模型使用sklearn机器学习库来实现；使用的样本数据是某市变电站测得的一年的负荷数据；如图1所示，包括以下步骤：

所述样本数据表示为：

{(x₁，y₁)，(x₂，y₂)，...，(x_n，y_n)}；

其中：x_i是第i个样本的特征向量，

m是特征维度；y_i是第i个样本的负荷数据；

所述节假日特征包括该日是否为节假日和是否为调休日；

所述历史负荷特征包括使用前一周的历史负荷。

其中，时间特征以及节假日特征都属于类别型特征，特征值只在有限选项内取值，而天气特征和历史负荷特征都属于数值型特征。

所述预处理包括缺失值的处理、归一化处理和独热编码；

其中，

为缺失值，表示第n个样本的第k维特征向量；

表示第n-1个样本的第k维特征向量；

表示第n+1个样本的第k为特征向量；

所述归一化处理用于处理天气特征和历史负荷特征等数值型特征，通过归一化处理将数据都转换到[0,1]的范围内，归一化公式如下：

其中：

所述独热编码用于处理时间特征和节假日特征；通过对时间特征和节假日特征进行独热编编码转换成二进制编码，用于LSTM模型的输入。在训练LSTM模型时，类别型特征不可以直接输入到模型中，LSTM模型不具备处理类别型特征的能力，需要对时间特征以及节假日特征等类别型特征进行独热编码，将类别型特征转换为二进制编码。而在训练CatBoost模型时，可以不进行对类别型特征进行独热编码，CatBoost模型可以自己将类别型特征转换为数值型特征。

S2、利用预处理后的样本数据，使用K折交叉验证分别训练得到多个CatBoost模型和LSTM模型；具体如下：将经过预处理的样本数据作为训练集，在训练CatBoost模型和LSTM模型时，采用K折交叉验证法(K折交叉验证法是将原始数据D随机分成K份，每次选择(K-1)份作为训练集，剩余的1份(红色部分)作为测试集。交叉验证重复K次，取K次准确率的平均值作为最终模型的评价指标)，取K为10，将训练集分为10份，通过10轮训练得到10个CatBoost模型和10个LSTM模型；

需要说明的是，CatBoost是一种梯度提升决策树算法，由很多决策树组成，每一棵决策树是在当前的残差的基础上来学习得到的，关注的重点是当前的残差与特征之间的关系；LSTM模型是一种循环神经网络，其输入是时间序列，关注的重点是每个时间序列中各个时序点之间的函数关系。

CatBoost是一种新颖的梯度提升决策树算法，可以更好地处理类别特征。传统的GBDT算法不支持类别型特征，在使用类别型特征前需要进行预处理，最常见的预处理方式是独热编码，独热编码的缺点是容易导致特征变得稀疏。CatBoost在训练数据时可以将类别型特征转换为数值型特征。CatBoost使用目标变量统计值(target statistics,TS)来处理类别型特征，CatBoost先对数据集进行一次随机排列，然后使用TS来估算每个类别的目标变量期望值，TS的公式为：

为了更好地阐述这个公式，假设

是样本集中第k个样本的特征向量，维度为m，其中第i维特征为需要转换的类别型特征，y_k是对应的目标值，在这里即负荷值。对于一个训练样本x_k，D_k表示在CatBoost的随机排列中排在此样本前的子数据集。

表示当

时，该表达式的值为1，不等于时为0。为了减小低频类别数据的噪声，引入P和β这两个值，P是先验值，在这里设置为样本中的平均负荷值，β是先验值的权重。

在负荷预测问题中，有很多类别型特征，比如时间特征和节假日特征，在建立CatBoost模型时，不用在预处理阶段将这些类别型特征转换为数值型特征，CatBoost可以很好地处理这些类别型特征。

如图2所示，LSTM基于循环神经网络RNN算法，是一种输入为时间序列的神经网络。在LSTM模型中，一些隐藏神经元的输出会作为状态，被保留在网络模型中，这部分输出会和下一个时间段的其他数据共同作为输入送给当前神经元，将状态值在自身网络中循环传递，因此在LSTM中当前神经元的输出会受到历史数据的影响，适用于处理电力负荷预测这类的时间序列问题。

LSTM添加了很多“门”结构来提高当前神经元从历史数据中提取信息的能力，包括输入门i_t、输出门f_t、遗忘门o_t这三个控制门。三个控制门都是介于[0,1]区间的系数，并且每一个神经元都将计算得到的状态值S_t和输出值y_t作为下一个神经元的输入。

三个门系数的公式如下计算：

i_t＝σ(W_i·[y_t+1，x_t]+b_i)；

f_t＝σ(W_f·[y_t-1，x_t]+b_f)；

o_t＝σ(W_o·[y_t-1，x_t]+b_o)；

其中，W_i、W_f、W_o分别是三个控制门的权值矩阵，b_i、b_f、b_o分别是对应的偏置量，σ是ReLU函数；

然后根据当前时刻的输入x_t和上一时刻的输出y_t-1来计算当前神经元的候选状态值

其中W_s和b_s分别是候选状态的权值矩阵和偏置量；

当前时刻的状态值由上一时刻的状态值和当前的候选状态值得到，由遗忘门o_t和输入门i_t来决定相应的比例：

最后计算当前时刻的输出值y_t：

y_t＝o_t*tanh(S_t)。

S3、利用Stacking策略，用RidgeRegression模型来融合CatBoost模型和LSTM模型的预测结果，用以构建混合模型，再使用混合模型来进行短期负荷的预测。构成混合模型的基学习器是CatBoost模型和LSTM模型，当构建混合模型的基学习器关注的方面不同，具有多样性的特点时，混合模型可以更好地学习到两者的优点。

具体如下：

本实施例使用平均绝对百分比误差(MAPE)、均方根误差(RMSE)、平均绝对误差(MAE)这三种指标来评价预测结果：

其中，N是样本的数量，y_i是第i个样本的负荷预测值，

是第i个样本的负荷实际值。

申请对采用现有技术中的GBDT模型、CatBoost模型、LSTM和本实施构建的CatBoost和LSTM混合模型进行预测结果对比，预测结果对比如图3和表1所示。

表1

从表1的MAPE,RMSE,MAE三个指标中都可以看到，本实施例的预测结果误差值均为最小，说明结果最为准确的，同时从图1中的单日预测曲线图(图中的Stacking—CatBoost+LSTM为本实施例的预测曲线)来看，本发明预测的短期负荷与实际负荷均非常接近，说明本发明具有优越的预测性能。

综上所述，本发明结合各个模型的预测结果来得到最终预测结果，可以吸取不同模型的优点从而提高预测精度；本发明通过Stacking策略提高了混合模型对特征向量和负荷之间关系的学习能力，提高了预测的准确性。

Claims

1.一种基于CatBoost和LSTM模型融合的短期负荷预测方法，其特征在于：包括以下步骤：

S3、利用Stacking策略，用RidgeRegression模型来融合CatBoost模型和LSTM模型的预测结果，用以构建混合模型，再使用混合模型来进行短期负荷的预测；

所述样本数据表示为：

{(x₁，y₁)，(x₂，y₂)，...，(x_n，y_n)}；

其中：x_i是第i个样本的特征向量，

m是特征维度；y_i是第i个样本的负荷数据；

所述节假日特征包括该日是否为节假日和是否为调休日；

所述历史负荷特征包括使用前一周的历史负荷；

2.根据权利要求1所述的基于CatBoost和LSTM模型融合的短期负荷预测方法，其特征在于：所述预处理包括缺失值的处理、归一化处理和独热编码；

所述缺失值处理是采用线性插值对样本数据中的缺失值进行补全，所述线性插值表示如下：

其中，

为缺失值，表示第n个样本的第k维特征向量；

表示第n-1个样本的第k维特征向量；

表示第n+1个样本的第k为特征向量；

其中：

所述独热编码用于处理时间特征和节假日特征；通过对时间特征和节假日特征进行独热编码转换成二进制编码，用于LSTM模型的输入。

3.根据权利要求1所述的基于CatBoost和LSTM模型融合的短期负荷预测方法，其特征在于：所述S2步骤具体如下：将经过预处理的样本数据作为训练集，在训练CatBoost模型和LSTM模型时，采用K折交叉验证法，取K为10，将训练集分为10份，通过10轮训练得到10个CatBoost模型和10个LSTM模型；