基于网格气象数据的小水电站发电功率超短期预测方法
技术领域
本发明属于水电站发电功率预测领域,具体涉及一种基于网格气象数据的小水电站发电功率超短期预测方法。
背景技术
小水电作为清洁能源的重要组成部分,对于优化能源结构和节能减排都具有积极的意义,随着我国能源转型道路的向前推进,小水电的装机并网将逐渐增加。然而,小水电存在调节能力差、远离负荷中心等方面的不足,其发电功率受到降雨影响,频繁的出力波动将对电网造成冲击,严重情况下会影响电网调度和挤压输电通道。小水电的发电功率受流域气象条件的影响,而流域的空间分布范围大,流域的来水情况又受地区近期历史降雨的影响,如何从小水电发电功率相关的区域的海量的气象数据中抽取有效特征数据用于小水电的发电功率预测是难点。
采用科学的预测方法提升小水电发电功率的预测准确率,对发电计划制定和促进新能源消纳都具有积极意义。因此,研究基于网格气象数据的小水电发电功率超短期预测方法。
发明内容
本发明的技术问题是小水电普遍远离电网负荷中心,调节能力差,其发电功率易受降雨等气象条件影响,不确定性大,而小水电的地区气象数据庞杂,现有技术缺乏有效利用气象数据进行高精度的水电功率预测的方法。
本发明的目的是针对上述问题,提供一种基于网格气象数据的小水电站发电功率超短期预测方法,以网格气象数据为基础,利用相关性分析筛选空间上与小水电发电功率相关的网格,而后引入局部线性嵌入算法对相关网格气象数据进一步降维,最后将降维后网格气象数据与小水电历史发电功率作为输入代入到长短记忆神经网络训练,构建高精度的考虑降雨量时空分布影响的小水电发电功率超短期预测模型。
本发明的技术方案是基于网格气象数据的小水电站发电功率超短期预测方法,包括以下步骤:
步骤1:将水电站所在区域划分为网格,获取网格的降雨量数据;
步骤2:获取水电站历史发电功率数据,计算水电站历史发电功率与各个网格历史降雨量的相关系数,筛选水电站发电功率相关性大的网格;
步骤3:采用局部线性嵌入方法对网格的降雨量数据降维,得到降维的网格降雨量数据;
步骤4:采用长短期记忆人工神经网络(Long Short-Term Memory,LSTM)建立发电功率预测模型,发电功率预测模型的输入为降维的网格降雨量数据,发电功率预测模型的输出为水电站发电功率;
步骤5:将降维的历史网格降雨量数据和水电站历史发电功率作为发电功率预测模型的数据集,设置发电功率预测模型参数,利用数据集对发电功率预测模型进行训练和测试,使其达到预测精度要求;
步骤6:采用训练好的发电功率预测模型进行水电站发电功率超短期预测。
进一步地,步骤2具体包括:
步骤2.1:采用皮尔森相关系数度量水电站发电功率与各个网格降雨量之间的相关性;
将水电站所在区域划分为网格,水电站所在地区的网格降雨量数据采用矩阵X表示,
Ei=[ei1,ei2,...,eit] (2)
式中eij,i=1,2…n,j=1,2…t表示第i个网格在第j个时段内的降雨量,n表示划分的网格总数量,t表示时段总数量;Ei,i=1,2…n表示第i个网格在t个时间段上的降雨数据向量;网格降雨量与水电站发电功率的相关系数的计算式如下:
式中r
i表示水电站发电功率与第i个网格的降雨量的相关系数;
表示第i个网格在t个时段内的平均降雨量,p
j表示第j个时段水电站平均发电功率,
表示水电站在t个时段内的平均发电功率;相关系数r
i∈[-1,1],当|r
i|越大时,表明第i个网格的降雨量和水电站发电功率的相关程度越高;
步骤2.2:选取相关系数阈值Rt作为相关性大的网格的筛选阈值,筛选出|ri|≥Rt的网格,并得到筛选出的与水电站发电功率相关性大的网格的降雨量数据X′,
X′=[Ef,Eg,…,Eh]T (4)
式中Ef、Eg、Eh分别为筛选前的网格降雨量数据矩阵X中表示的第f个网格、第g个网格、第h个网格在t个时间段上的降雨数据向量。
优选地,所述将水电站所在区域划分为网格,划分的单位网格为边长3公里的正方形区域。
优选地,网格的筛选阈值为Rt=0.6。
进一步地,步骤3包括以下子步骤:
步骤3.1:计算地区降雨断面的相似性度量;
列向量[e1j,…emj]T,j=1,2…t表示筛选的与水电站发电功率相关性大的网格在第j个时间段内的降雨量,即第j个时间段的降雨断面,记为Fj,m表示筛选出的与水电站发电功率相关性大的网格的数量;
采用欧拉距离作为地区降雨断面的相似性度量,相似性度量的计算式如下:
Dij=|Fi-Fj| (5)
式中Dij,i=1,2…t,j=1,2…t表示降雨断面Fi与Fj的相似性度量结果,Dij数值越小则表示相似性越高;
步骤3.2:求解线性化重构系数矩阵;
预设近邻参数k,将与降雨断面Fi,i=1,2…t最为邻近的k个样本作为一个邻近集合,记为H(i),以线性化误差函数ε最小为目标求解重构系数矩阵M中的系数,重构误差函数ε以及约束条件如下:
式中a
ij,i=1,2…t,j=1,2…t表示重构系数,代表降雨断面F
i和降雨断面F
j之间的线性关系,若
则令a
ij=0;
步骤3.3:根据重构系数矩阵M以及预设目标维数d进行降维处理;
利用重构系数矩阵M,以损失函数σ最小为目标构造优化问题,求解得到降维后归一化的网格降雨数据集Y;
对应构造优化问题的数学模型如下:
目标函数:min[σ] (9)
式中Ui=[e1i,…edi]T表示地区第i个降雨断面Fi=[e1i,…emi]T降维后的结果,Uj表示地区第j个降雨断面Fj降维后的结果,i=1,2…t,j=1,2…t,d表示对筛选的网格数量m降维后的维数,d<m;Id表示d阶单位矩阵,0表示d维零向量;Y=[U1,...,Ut]则为降维后的网格降雨数据集Y;
步骤3.4:以残差方差最小为目标确定最优的目标维数d与近邻参数k;
采用残差方差μ对步骤3.3中降维后的网格降雨数据进行评价,残差方差μ越小,表明降维前后数据之间相关性越大,残差方差μ计算公式如下:
μ=1-ρ2 (12)
式中μ表示残差方差,ρ表示线性相关系数,D
ij表示降维前降雨断面F
i与降雨断面F
j的相似性度量,D′
ij表示降维后降雨断面U
i与降雨断面U
j的相似性度量,
表示集合{D
ij}内所有数据的平均值,
表示集合{D′
ij}内所有数据的平均值;
D′ij的计算式如下:
D′ij=|Ui-Uj| (14)
步骤3.5:重复上述步骤3.2~步骤3.4,并采用式(12)对降维结果进行评价,直至获得残差方差μ最小所对应的目标维数d和近邻参数k,即为最优参数;根据最优参数k、d,重复步骤3.2~3.3,求解得到最优的降维网格降雨数据Y。
相比现有技术,本发明的有益效果包括:
1)本发明的方法建立了考虑降雨量时空分布影响的小水电发电功率超短期预测模型,通过对模型输入数据的降维,降低了功率预测模型的计算复杂度,提高了功率预测模型的计算效率和准确率;
2)本发明通过相关性分析,筛选出与水电站发电功率相关性大的网格区域,利用相关性大的网格的降雨数据实现了水电站发电功率的超短期预测;
3)本发明利用局部线性嵌入算法对筛选后的网格气象数据进行降维,通过相似度计算寻找降雨分布特性相似的降雨断面,并利用小领域内样本相对位置线性化处理的方式实现降维,将时间尺度上降雨特征相似的网格表现为虚拟网格,保留原始网格降雨主要的特征,对具体时刻的网格降雨数据的降维效果显著,大大减少了用于发电功率预测的单时刻的网格气象数据的数据量,使得发电功率预测模型的训练更专注于关键特征数据,防止预测模型的训练出现过拟合,提高了预测模型的训练效率和发电功率预测结果的精度;
4)本发明采用长短期记忆人工神经网络建立发电功率预测模型,有效实现了长时间窗口的水电功率预测,充分考量小水电预测时刻之前时刻发电功率与降雨数据对当前时刻发电功率预测值的影响,很大程度上解决了小水电发电功率受时滞效应与累积效应的影响,尤其是对超短期的发电功率的预测效果好。
附图说明
下面结合附图和实施例对本发明作进一步说明。
图1为本发明实施例的小水电站发电功率超短期预测方法的流程示意图。
图2为本发明实施例的筛选与小水电站发电功率相关性大的网格的流程示意图。
图3为本发明实施例的局部线性嵌入算法的流程示意图。
图4为本发明实施例的LSTM发电功率预测模型训练的流程示意图。
图5为本发明实施例的LSTM单元的示意图。
具体实施方式
如图1所示,基于网格气象数据的小水电站发电功率超短期预测方法,包括以下步骤:步骤1:将水电站所在区域划分为网格,获取网格的降雨量数据;
实施例中,收集近3年每年5月至10月小水电区域网格降雨数据及小水电历史发电功率时间序列作为模型训练数据,网格降雨数据和小水电历史发电功率时间序列的时间间隔为15分钟。
步骤2:获取水电站历史发电功率数据,计算水电站历史发电功率与各个网格历史降雨量的相关系数,筛选水电站发电功率相关性大的网格,如图2所示。
步骤2.1:采用皮尔森相关系数度量水电站发电功率与各个网格降雨量之间的相关性;
将水电站所在区域划分成边长为3公里的正方形网格,水电站所在地区的网格降雨量数据采用矩阵X表示,
Ei=[ei1,ei2,...,eit] (2)
式中eij,i=1,2…n,j=1,2…t表示第i个网格在第j个时段内的降雨量,n表示划分的网格总数量,t表示时段总数量;Ei,i=1,2…n表示第i个网格在t个时间段上的降雨数据向量。
网格降雨量与水电站发电功率的相关系数的计算式如下:
式中r
i表示水电站发电功率与第i个网格的降雨量的相关系数;
表示第i个网格在t个时段内的平均降雨量,p
j表示第j个时段水电站平均发电功率,
表示水电站在t个时段内的平均发电功率;相关系数r
i∈[-1,1],当|r
i|越大时,表明第i个网格的降雨量和水电站发电功率的相关程度越高。
步骤2.2:选取相关系数阈值Rt作为相关性大的网格的筛选阈值,筛选出|ri|≥Rt的网格,Rt=0.6,并得到筛选出的与水电站发电功率相关性大的网格的降雨量数据X′,
其中Ef、Eg、Eh分别为筛选前的网格降雨量数据矩阵X中表示的第f个网格、第g个网格、第h个网格在t个时间段上的降雨数据向量。
步骤3:采用局部线性嵌入算法对网格的降雨量数据降维,得到降维的网格降雨量数据,如图3所示。
步骤3.1:计算地区降雨断面的相似性度量;
列向量[e1j,…emj]T,j=1,2…t表示筛选的与水电站发电功率相关性大的网格在第j个时间段内的降雨量,即第j个时间段的降雨断面,记为Fj,m表示筛选出的与水电站发电功率相关性大的网格的数量。
采用欧拉距离作为地区降雨断面的相似性度量,相似性度量的计算式如下:
Dij=|Fi-Fj| (5)
式中Dij,i=1,2…t,j=1,2…t表示降雨断面Fi与Fj的相似性度量结果,Dij数值越小则表示相似性越高。
步骤3.2:求解线性化重构系数矩阵;
预设近邻参数k,将与降雨断面Fi,i=1,2…t最为邻近的k个样本作为一个邻近集合,记为H(i),以线性化误差函数ε最小为目标求解重构系数矩阵M中的系数,重构误差函数ε以及约束条件如下:
a
ij,i=1,2…t,j=1,2…t表示重构系数,代表降雨断面F
i和降雨断面F
j之间的线性关系,若
则令a
ij=0。
步骤3.3:根据重构系数矩阵M以及预设目标维数d进行降维处理;
利用重构系数矩阵M,以损失函数σ最小为目标构造优化问题,求解得到降维后归一化的网格降雨数据集Y;对应构造优化问题的数学模型如下:
目标函数:min[σ] (9)
式中Ui=[e1i,…edi]T表示地区第i个降雨断面Fi=[e1i,…emi]T降维后的结果,Uj表示地区第j个降雨断面Fj降维后的结果,i=1,2…t,j=1,2…t,d表示对筛选的网格数量m降维后的维数,d<m;Id表示d阶单位矩阵,0表示d维零向量;Y=[U1,...,Ut]则为降维后的网格降雨数据集Y。
步骤3.4:以残差方差最小为目标确定最优的目标维数d与近邻参数k;
采用残差方差μ对降维后的网格降雨数据进行评价,残差方差μ越小,表明降维前后数据之间相关性越大,残差方差μ计算公式如下:
μ=1-ρ2 (12)
式中μ表示残差方差,ρ表示线性相关系数,D
ij表示降维前降雨断面F
i与降雨断面F
j的相似性度量,D′
ij表示降维后降雨断面U
i与降雨断面U
j的相似性度量,
表示集合{D
ij}内所有数据的平均值,
表示集合{D′
ij}内所有数据的平均值;
D′ij的计算式如下:
D′ij=|Ui-Uj| (14)
步骤3.5:重复上述步骤3.2~步骤3.4,并采用式(12)对降维结果进行评价,直至获得残差方差μ最小所对应的目标维数d和近邻参数k,即为最优参数;根据最优参数k、d,得到最优的降维的虚拟网格降雨数据Y。
步骤4:采用长短期记忆人工神经网络建立LSTM发电功率预测模型,LSTM发电功率预测模型的输入为降维的网格降雨量数据与小水电历史发电功率数据,LSTM发电功率预测模型的输出为水电站发电功率。
步骤5:将降维的历史网格降雨量数据和水电站历史发电功率作为LSTM发电功率预测模型的数据集,设置LSTM发电功率预测模型参数,利用数据集对LSTM发电功率预测模型进行训练和测试,使其达到预测精度要求,如图4所示。
步骤5.1:设置长短期记忆人工神经网络的超参数;
设置的超参数包括:输入节点数N1,隐藏节点数N2,输出节点数N3,学习率α,误差阈值cost,最大迭代次数s,LSTM细胞核个数z;实施例中N1=d+1,z<3。
步骤5.2:初始化权重偏置;
实施例的LSTM如图5所示,LSTM的数学模型如下:
ht=ot×tanh(Ct) (20)
式中x
t表示t时刻神经网络的输入;h
t-1表示t-1时刻神经网络的输出;h
t表示t时刻神经网络的输出;C
t-1、C
t表示t-1、t时刻神经网络的单元状态输出;f
t、i
t、o
t分别表示遗忘门、输入门、输出门的输出值,
表示输入单元的状态中间量;
分别表示x
t与遗忘门、输入门、输出门、单元状态的权重矩阵;
分别为h
t-1与遗忘门、输入门、输出门、单元状态的权重矩阵;b
f、b
i、b
o、b
C分别表示遗忘门、输入门、输出门、单元状态的偏置向量。
σ()和tanh()均为激活函数,其中σ()表示Sigmoid函数,tanh()表示双曲正切函数,计算式如下:
步骤5.3:前向计算;
长短期记忆人工神经网络的前向计算公式如式(15)~(20)所示,前向计算得到每个神经元的输出值,即f
t、i
t、o
t、
h
t五个向量的值。
通过前向计算,LSTM能更加有效地决定哪些信息被遗忘,哪些信息被保留,更加高效的处理长时间序列。
步骤5.4:根据损失函数η更新网络权重和偏置;
损失函数η表示网络的误差大小,其值越小,则模型越精确,反之模型越不精确;损失函数的计算公式如下:
W′=W-α·2[ht-h′t] (24)
b′=b-α·2[ht-h′t] (25)
式中L表示训练样本总数,ht表示第t个训练样本的网络发电功率预测值,h′t表示第t个训练样本对应的实际发电功率,α为学习率,W、b分别表示更新前的权重和偏置,W′、b′分别表示更新后的权重和偏置。
改变权重偏置值,可改变η的大小,利用梯度下降算法快速找到合适的权重和偏置,使η最小化,以达到误差阈值cost,加快网络收敛速度。实施例的梯度下降算法参考2020年第2期《软件工程》刊登的李兴怡、岳洋的论文“梯度下降算法研究综述”公开的梯度下降算法。步骤5.5:重复步骤5.3和步骤5.4,直到迭代次数等于s或误差小于误差阈值cost,停止训练。步骤6:采用训练好的LSTM发电功率预测模型进行水电站发电功率超短期预测。
实施结果表明,本发明的方法显著提高了小水电发电功率预测的准确率,对电网发电计划制定和促进新能源消纳都具有积极意义。