CN115618993A

CN115618993A - 一种基于时序数据预测技术的光伏发电功率智能预测方法

Info

Publication number: CN115618993A
Application number: CN202211048055.0A
Authority: CN
Inventors: 白洁; 赵锐; 白静波; 尚文; 马飞; 张红伟; 夏彦; 马江海
Original assignee: Datong Power Supply Co of State Grid Shanxi Electric Power Co Ltd
Current assignee: Datong Power Supply Co of State Grid Shanxi Electric Power Co Ltd
Priority date: 2022-08-30
Filing date: 2022-08-30
Publication date: 2023-01-17

Abstract

本发明涉及一种基于时序数据预测技术的光伏发电功率智能预测方法，包括：步骤1，建立光伏发电量数据集；步骤2，对数据集进行预处理，生成标准化数据集；步骤3，通过标准化数据集构建光伏发电功率智能预测深度学习模型；步骤4，通过真实结果进一步调整光伏发电功率智能预测深度学习模型；步骤5，通过光伏发电功率智能预测深度学习模型对光伏发电功率进行实时预测，每次预测后对权重进行重新计算。本发明提出的方法通过集成学习方法既结合了LSTM网络对时序数据处理的优点，又结合了CNN网络可以处理大量数据的能力，对具有时序特点的大样本数据集处理有很大优势。

Description

一种基于时序数据预测技术的光伏发电功率智能预测方法

技术领域

本发明涉及光伏发电技术领域，特别涉及一种基于时序数据预测技术的光伏发电功率智能预测方法。

背景技术

由于光伏发电的不确定性和间歇性特点，光伏发电的高度普及也给现有电网系统的运行带来了许多新的挑战。这些挑战包括光伏电源对气象条件的敏感性、高昂的安装成本和间歇性发电。光伏发电预测是克服这些挑战的有效解决方案。准确预测光伏发电量被认为是在主电网中大规模渗透光伏发电的先决条件。然而，光伏功率时间序列通常表现出非线性和不稳定的特性。光伏发电依赖于不可预测的气象条件，这使得准确的光伏发电预测变得困难。

目前，有一些研究致力于光伏发电量预测。人们提出了许多预测方法。光伏功率预测模型可进一步分为物理方法、持久性方法和统计方法。物理方法利用数学方程来描述气象条件的物理状态和动态运动。当天气条件稳定时，基于物理方法的预测模型表现最好。持久性方法通常假设当前值和未来值之间存在非常强的相关性。假设从时间t到时间+Δt的条件保持不变，计算时间序列的未来值。基于持久性方法的模型的预测精度主要取决于历史平均值。相比之下，基于统计方法的模型旨在测量历史光伏发电量与天气参数之间的关系。统计方法通常基于预测模型和历史变量的学习过程。统计方法的性能对时间范围和输入数据的质量高度敏感，通常可以产生更准确的短期光伏功率预测结果，因为考虑了历史光伏发电值，并且模型参数不断优化。然而由于在开发基于回归的预测模型时需要解释变量，因此很难开发数学模型。

发明内容

本发明提供一种基于时序数据预测技术的光伏发电功率智能预测方法，其特征在于，所述基于时序数据预测技术的光伏发电功率智能预测方法包括以下步骤：

步骤1，建立光伏发电量数据集；

步骤2，对数据集进行预处理，生成标准化数据集；

步骤3，通过标准化数据集构建光伏发电功率智能预测深度学习模型；

步骤4，通过光伏发电功率智能预测深度学习模型对光伏发电功率进行实时预测，每次预测后对权重进行重新计算；

在步骤3中，还包括以下步骤：

步骤31，构建并训练LSTM神经网络；

步骤32，构建并训练CNN神经网络；

步骤33，通过集成学习方法计算LSTM神经网络与CNN神经网络的预测值权重。

更进一步地，在步骤S1中，所述光伏发电量数据集包括时间、光照幅度、温度、气压以及实际功率的多维时序数据样本；

所述数据样本获取频率为10分钟，积累获取5000个历史数据。

更进一步地，在步骤S31中，LSTM神经网络结构为：

将当前时刻的气象数据x_t、上一个LSTM结构的隐藏层输出

和 LSTM结构所包含的信息c_t一起作为当前时刻的LSTM循环神经网络的输入；

LSTM结构输出

除了传递到下一个LSTM结构，会通过随机失活随机舍弃隐藏层部分节点，从而避免出现训练精度高而测试精度很低的过拟合现象，同时也可以避免网络过于关注历史信息以至于当新信息输入时无法获取满意结果的问题；

经过随机失活的输出为

再经过Dense层进行矩阵维度的变换，输出需要的形式

最后通过输出层得到预测结果y_t。

更进一步地，在步骤S32中，所述CNN神经网络结构为：

CNN网络采用双卷积层和双池化层的拓扑结构，经预处理的数据依次通过卷积层conv1、池化层pool1、卷积层conv2、池化层pool2、全连接 FC层、最终输出一个预测值；

卷积层和池化层输入选择s×s正方形型矩阵；卷积核选择e×e大小，池化单元在输人数据不大的情况下，一般选择2×2大小；全连接FC层选用单隐藏层结构，输人节点数为池化层pool2的输出大小，隐藏层节点数设置为h，输出层节点数为1；

卷积层的卷积核大小和数量分别为(3×3，4)和(2×2，16)；池化层的下采样面积均为2×2；卷积层和池化层中步长取1，padding＝'valid'，均使用relu作为激活函数；全连接层节点数依次为128/64/1，其中最后一个节点为输出节点，实现64对1的预测结构，目标预测值为输入数据下一个点的光电输出值；

设置模型训练参数，才可将划分好的数据放人网络进行训练过程，训练参数包括迭代次数、误差计算间隔、误差函数选择优化器选择；

迭代次数epoch＝100，批处理参数batch_size＝128；误差函数选择均方根误差计算损失；优化器选择adam，实现学习率的自动调节；节点丢弃率Drop-out＝0.05。

更进一步地，在步骤S33中，还包括以下步骤：

步骤331，首先将现有数据分为两组；其中80％为训练集，20％为测试集；

步骤332，选择了CNN和LSTM这两种作为基模型，分别使用五折交叉验证方法进行训练；

CNN神经网络将训练集随机分为五等份，分别命名为train1，train2， train3，train4，train5，分别训练四个训练集得出4份预测值，使用模型对验证集进行预测得出一份预测值，之后换验证集和训练集，用此办法会得到在训练集上由模型训练出来的5份预测值，将5份预测值纵向重叠合并起来得到预测值A1，和在测试集上的1份预测值B1；

LSTM神经网络也采用相同操作，LSTM神经网络也会得到在训练集上由模型训练出来的5份预测值，将这五份纵向重叠合并起来得到预测值 A2，和在测试集上的1份预测值B2；

步骤333，两个基模型训练完毕后，将两个模型在训练集上的预测值 A1，A2分别作为训练集，结合对应时刻实际功率的真实值，对极大似然估计LR模型进行训练：

通过预测值A1，A2输入极大似然估计LR模型，输出值为y：

y＝aA1+bA2

A1、A2分别为CNN与LSTM模型的预测值，a、b是CNN与LSTM 模型对应的权重，y表示极大似然估计LR模型输出值；

将输出值y与对应时刻实际功率的真实值对比，进一步对极大似然估计LR模型进行修正，调整CNN与LSTM模型对应的权重；

步骤334，使用修正过的极大似然估计LR模型，将验证集上的预测值所构建的两个预测值B1，B2作为测试集，结合对应时刻实际功率的真实值，查看极大似然估计LR模型精确度，并继续用预测值B1，B2训练极大似然估计LR模型，得出最终的预测权重a，b。

本发明达到的有益效果是：

本发明提出的方法通过集成学习方法既结合了LSTM网络对时序数据处理的优点，又结合了CNN网络可以处理大量数据的能力，对具有时序特点的大样本数据集处理有很大优势。

本发明提出的方法可以在投入现实使用后继续调整网络，每一次预测都可以再次优化模型，从而更适应现实需求，而且也会更加精确；

本发明基于CNN和LSTM神经网络同时训练，由于单独使用LSTM 运算量会非常大，等待时间长，所以在精确预测结果输出前会先单独输出 CNN预测结果，方便工作人员及时查看。

附图说明

图1是本发明实施例中一种基于时序数据预测技术的光伏发电功率智能预测方法的训练和测试流程图；

图2是本发明实施例中一种基于时序数据预测技术的光伏发电功率智能预测方法中LSTM网络随机失活层示意图；

图3是本发明实施例中一种基于时序数据预测技术的光伏发电功率智能预测方法中LSTM网络训练流程图；

图4是本发明实施例中一种基于时序数据预测技术的光伏发电功率智能预测方法中CNN网络模型训练流程图；

图5是本发明实施例中一种基于时序数据预测技术的光伏发电功率智能预测方法的训练和测试流程图；

图6是本发明实施例中一种基于时序数据预测技术的光伏发电功率智能预测方法中光伏发电站发电量折线图。

具体实施方式

下面结合附图对本发明的技术方案进行更详细的说明，本发明包括但不仅限于下述实施例。

如附图1所示，本发明提出了一种基于时序数据预测技术的光伏发电功率智能预测方法，包括如下步骤：

步骤1，建立光伏发电量数据集；

通过光伏发电厂历史数据汇总，收集包含时间、光照幅度、温度、气压以及实际功率多维时序数据样本，数据获取频率为10分钟，积累获取 5000个历史数据，保存为本地文件。涵盖了多场景因素的光伏发电功率数据，为后续的模型训练提供了数据支撑。

步骤2，对数据集进行预处理，生成标准化数据集；

通过四分位点内距算法实现对异常数据检测，对数据集进行过清洗后对数据进行数据重构与标准化，形成特定的输入形式；

具体的，构建光伏发电功率智能预测深度学习模型还包括以下步骤：

步骤31，构建并训练LSTM神经网络；

具体模型设计基于长短期记忆网络，同时考虑当前日期和100个历史数据，以时间、光照幅度、温度、气压为输入，提取输入数据的短期特征和长期特征，基于此对实际功率进行精准预测。

LSTM神经网络预测模型采用了门控制机制，包括选择性遗忘阶段、选择性记忆阶段和预测阶段，模型的单个部分可称为细胞。将预处理之后的训练数据集输入LSTM循环神经网络，通过网络具有的遗忘门、输入门和输出门进行处理。为了避免出现过拟合现象，在LSTM循环神经网络中引入随机失活层，而随机失活输出的数据维度与想要的预测数据维度并不同，引入全连接层进行维度变换，最后通过一个输出层输出预测数据。

将当前时刻的气象数据x_t、上一个LSTM结构的隐藏层输出

和 LSTM结构所包含的信息c_t一起作为当前时刻的LSTM循环神经网络的输入。

LSTM结构输出

它除了传递到下一个LSTM结构，会通过随机失活随机舍弃隐藏层部分节点，从而避免出现训练精度高而测试精度很低的过拟合现象，同时也可以避免网络过于关注历史信息以至于当新信息输入时无法获取满意结果的问题。

经过随机失活的输出为

再经过Dense层进行矩阵维度的变换，输出需要的形式

最后通过输出层得到预测结果y_t。

步骤32，构建并训练CNN神经网络；

CNN具体模型设计以光照幅度、温度、气压为输入，提取输入数据特征，基于数据特征对实际功率进行预测。CNN网络拥有众多的模型参数，每一个参数都会对最终预测结果产生影响。

网络拓扑结构的确定，由于光伏功率数据的波动性，本专利采用双卷积层和双池化层的拓扑结构，经预处理的数据依次通过卷积层conv1、池化层pool1、卷积层conv2、池化层pool2、全连接FC层、最终输出一个预测值。

确定上述每层中的结构大小和运算方式，卷积层和池化层输入选择s ×s正方形型矩阵；卷积核选择e×e大小，池化单元在输人数据不大的情况下，一般选择2×2大小；全连接FC层选用单隐藏层结构，输人节点数为池化层pool2的输出大小，隐藏层节点数设置为h，输出层节点数为1。运算方式包括步长的确定、padding边缘补0的设置、激活函数的选取等。

在光伏发电功率预测具体实施中，两卷积层的卷积核大小和数量分别为(3×3，4)和(2×2，16)；池化层的下采样面积均为2×2；卷积层和池化层中步长取1，padding＝'valid'，均使用relu作为激活函数；全连接层节点数依次为128/64/1，其中最后一个节点为输出节点，实现64对1的预测结构，目标预测值为输入数据下一个点的光电输出值，将目标预测值与实际输出的差值为训练误差。

上述结构确定完成后，还需要设置模型训练参数，才可将划分好的数据放人网络进行训练过程。训练参数包括迭代次数、误差计算间隔、误差函数选择优化器选择等。

在光伏发电功率预测具体实施中，相关网络训练参数设置如下：迭代次数epoch＝100，批处理参数batch_size＝128；误差函数选择均方根误差计算损失；优化器选择adam，实现学习率的自动调节；节点丢弃率Drop- out＝0.05。

网络建好后，预处理后的数据依次通过卷积层conv1、池化层pool1、卷积层conv2、池化层pool2、全连接FC层，最终输出一个预测值。

步骤33，使用Stacking集成学习方法计算LSTM与CNN预测值权重；

Stacking是一种对模型集成的一种策略，Stacking集成算法可以理解为一个两层的集成，第一层含有多个基础分类器，把输出的预测结果作为第二层的输入特征，第二层的分类器通常是逻辑回归。

步骤331，首先将现有数据分为两组；其中80％为训练集，20％为测试集。

步骤332，基模型训练；

这里选择了CNN和LSTM这两种作为基模型。两个模型同时训练，分别使用五折交叉验证方法，即把数据平均分成5等份，每次实验拿一份做测试，其余用做训练，实验5次求平均值。

将步骤331中的训练集随机分为五等份，分别命名为train1，train2， train3，train4，train5。在基模型训练时，依次用train1，train2，train3， train4，train5作为验证集，其余4份作为训练集进行模型训练，训练结束后在验证集上进行预测。

以CNN模型训练中“train1，train2，train3，train4作为训练集， train5作为测试集”为例，分别训练四个训练集得出4份预测值，使用模型对验证集进行预测得出一份预测值，之后换验证集和训练集，用此办法会得到在训练集上由模型训练出来的5份预测值，将五份预测值纵向重叠合并起来得到预测值A1，和在测试集上的1份预测值B1。

同样在LSTM模型中也是如此操作，LSTM模型也会得到在训练集上由模型训练出来的5份预测值，将这五份纵向重叠合并起来得到预测值 A2，和在测试集上的1份预测值B2。

通过预测值A1，A2输入极大似然估计LR模型，输出值为y：

y＝aA1+bA2

将输出值y与对应时刻实际功率的真实值对比，进一步对极大似然估计LR模型进行修正，调整CNN与LSTM模型对应的权重。

最后部署在现实光伏发电厂进行实时推理分析，流程图如图3所示。

步骤4，实时预测光伏发电功率，每次预测后对权重进行重新计算。

该专利投入到现实中表现出精确快速的特征。本发明部署在光伏发电设备运行状态评价系统中，将实地采集的信息上传到该系统，进行光伏发电功率的预测，在算法测试中，对某村光伏发电功率趋势进行了预测。如下图6所示，当天系统运行过程中，实际发电量和本算法预测值最大差值出现在当日14时，差值约为1.26kwh，最小差值出现在当日6时，差值小于0.2kwh，当天实际总发电量与全部预测发电量和的差值小于5kwh，由此可见本算法的理论发电量预测曲线和实际发电量曲线拟合情况很好。

本发明不仅局限于上述具体实施方式，本领域一般技术人员根据实施例和附图公开内容，可以采用其它多种具体实施方式实施本发明，因此，凡是采用本发明的设计结构和思路，做一些简单的变换或更改的设计，都落入本发明保护的范围。

Claims

1.一种基于时序数据预测技术的光伏发电功率智能预测方法，其特征在于，所述基于时序数据预测技术的光伏发电功率智能预测方法包括以下步骤：

步骤1，建立光伏发电量数据集；

步骤2，对数据集进行预处理，生成标准化数据集；

在步骤3中，还包括以下步骤：

步骤31，构建并训练LSTM神经网络；

步骤32，构建并训练CNN神经网络；

2.根据权利要求1所述基于时序数据预测技术的光伏发电功率智能预测方法，其特征在于，在步骤S1中，所述光伏发电量数据集包括时间、光照幅度、温度、气压以及实际功率的多维时序数据样本；

所述数据样本获取频率为10分钟，积累获取5000个历史数据。

3.根据权利要求1所述基于时序数据预测技术的光伏发电功率智能预测方法，其特征在于，在步骤S31中，LSTM神经网络结构为：

将当前时刻的气象数据x_t、上一个LSTM结构的隐藏层输出

和LSTM结构所包含的信息c_t一起作为当前时刻的LSTM循环神经网络的输入；

LSTM结构输出

经过随机失活的输出为

再经过Dense层进行矩阵维度的变换，输出需要的形式

最后通过输出层得到预测结果y_t。

4.根据权利要求1所述基于时序数据预测技术的光伏发电功率智能预测方法，其特征在于，在步骤S32中，所述CNN神经网络结构为：

CNN网络采用双卷积层和双池化层的拓扑结构，经预处理的数据依次通过卷积层conv1、池化层pool1、卷积层conv2、池化层pool2、全连接FC层、最终输出一个预测值；

5.根据权利要求1所述基于时序数据预测技术的光伏发电功率智能预测方法，其特征在于，在步骤S33中，还包括以下步骤：

CNN神经网络将训练集随机分为五等份，分别命名为train1，train2，train3，train4，train5，分别训练四个训练集得出4份预测值，使用模型对验证集进行预测得出一份预测值，之后换验证集和训练集，用此办法会得到在训练集上由模型训练出来的5份预测值，将5份预测值纵向重叠合并起来得到预测值A1，和在测试集上的1份预测值B1；

LSTM神经网络也采用相同操作，LSTM神经网络也会得到在训练集上由模型训练出来的5份预测值，将这五份纵向重叠合并起来得到预测值A2，和在测试集上的1份预测值B2；

步骤333，两个基模型训练完毕后，将两个模型在训练集上的预测值A1，A2分别作为训练集，结合对应时刻实际功率的真实值，对极大似然估计LR模型进行训练：

通过预测值A1，A2输入极大似然估计LR模型，输出值为y：

y＝aA1+bA2

A1、A2分别为CNN与LSTM模型的预测值，a、b是CNN与LSTM模型对应的权重，y表示极大似然估计LR模型输出值；