CN112257941B - 基于改进型Bi-LSTM的光伏电站短期功率预测方法 - Google Patents

基于改进型Bi-LSTM的光伏电站短期功率预测方法 Download PDF

Info

Publication number
CN112257941B
CN112257941B CN202011175408.4A CN202011175408A CN112257941B CN 112257941 B CN112257941 B CN 112257941B CN 202011175408 A CN202011175408 A CN 202011175408A CN 112257941 B CN112257941 B CN 112257941B
Authority
CN
China
Prior art keywords
data
photovoltaic power
days
output power
photovoltaic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011175408.4A
Other languages
English (en)
Other versions
CN112257941A (zh
Inventor
陈志聪
张财贵
吴丽君
林培杰
程树英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN202011175408.4A priority Critical patent/CN112257941B/zh
Publication of CN112257941A publication Critical patent/CN112257941A/zh
Application granted granted Critical
Publication of CN112257941B publication Critical patent/CN112257941B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Photovoltaic Devices (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于改进型Bi‑LSTM的光伏电站短期功率预测方法,提取原始气象参数作为光伏电站预测模型的输入;对数据集进行预处理;采用皮尔森相关系数分析对光伏电站输出功率预测曲线的拟合程度进行特征参数选择;采用主成分分析法对所选择的特征参数进行排序,确定改进型模型输入数据集;根据数值天气预报中心获得的连续三天待预测日数据作为测试集;根据数值统计学方法来判断待预测日的天气类型,计算历史训练集的特征参数与待预测日的特征参数之间的欧式距离,选取误差小于0.5的参数作为改进模型输入;搭建预测模型,并进行优化,设定改进型预测模型的相关参数,选择最佳的光伏电站输出功率预测效果。本发明能提高光伏发电输出功率预测的精准度。

Description

基于改进型Bi-LSTM的光伏电站短期功率预测方法
技术领域
本发明涉及光伏电站输出功率预测技术领域,特别是一种基于改进型Bi-LSTM的光伏电站短期功率预测方法。
背景技术
由于当前光伏发电功率容易被多种气象环境因素影响,造成光伏电站的输出功率呈现间歇性、挥发性和不稳定性。近年来,光伏发电成为目前最重要的可再生能源之一,而可再生能源成为世界经济发展的重要保障,目前世界各地建立了数目众多的光伏电站来利用太阳能进行供电。但是,随着光伏电站光伏阵列规模的逐年扩大,特别是发电功率的波动性和随机性给光伏并网系统的安全带来了巨大的挑战。为了保障并网系统的稳定性和安全性,深入研究准确可靠的光伏电站输出功率预测方法,提前做好电网电力的调度和把控,以便及时调整并网的负荷匹配,也能进一步为光伏电站在未来电力体系中的大规模运用提供保证。精准的光伏发电功率预测能够掌握光伏电站发电情况有利于合理分配地区间的光伏并网系统资源,实现经济效益和社会效益的最大化。
当前光伏电站功率预测的精确度影响主要来自两个方面,一是气象监测系统所采集的历史气象数据,数据的异常和滞后都会影响预测效果——用于模型训练的数据集要求其本身具有良好的质量,若采用带有严重噪声干扰的数据集进行模型训练,会严重影响预测模型的最终预测效果,因此数据预处理是关键研究问题。二是模型本身的运算和学习方式。从模型自身的效果来说,能否提炼出多个特征之间关系,并通过训练来调整到合适的参数,是首先需要达到的要求。目前的很多模型只考虑了当前的气象数据,直接输出预测值,没有考虑历史气象数据到当前气象数据,忽视了不同时间点间的内在影响关系,这对最终预测效果也具有很大程度的影响。
发明内容
有鉴于此,本发明的目的是提供一种基于改进型Bi-LSTM的光伏电站短期功率预测方法,可以准确的预测多种工况下的光伏电站输出功率。
本发明采用以下方案实现:一种基于改进型Bi-LSTM的光伏电站短期功率预测方法,包括以下步骤:
步骤S1:从光伏电站监测的原始的电气以及多种气象数据中,提取光伏电站中两年的原始数据集,所述包括多种气象数据:全球水平辐射、漫射水平辐射、环境温度和天气相对湿度数据;所述原始数据集包括光伏发电输出功率、全球水平辐射、漫射水平辐射、环境温度、天气相对湿度和风速数据,作为光伏电站预测模型的输入;
步骤S2:将步骤S1中采集到的全球水平辐射、漫射水平辐射、环境温度和天气相对湿度数据即特征参数进行预处理,从而建立训练样本数据集;
步骤S3:将采集到的原始光伏输出功率数据,采用皮尔森相关系数分析对光伏输出功率预测曲线的拟合程度进行特征参数选择;
步骤S4:根据所述步骤S2和步骤S3所提取的特征参数,采用主成分分析法PCA对所选择的特征参数进行排序,依次选择最佳的特征因素数据集作为改进型Bi-LSTM预测模型的训练集;
步骤S5:根据数值天气预报中心NWP获得的连续三天待预测日数据作为测试集;
步骤S6:根据对所述步骤S3以及所述步骤S5,根据数值统计学方法来判断待预测日的天气类型,其中包括晴天、雨天、阴天以及部分阴天四种天气类型;根据所述步骤S4,计算历史训练集的特征参数与待预测日的特征参数之间的欧式距离,从而选取误差小于0.5的相关特征参数作为改进型Bi-LSTM预测模型的输入;
同时,对数据集进行划分为训练和测试验证数据集;
步骤S7:利用RMSprop算法来优化Bi-LSTM网络来搭建光伏电站输出功率预测模型即改进型Bi-LSTM预测模型,即RMSprop算法初始迭代点占的权重小,迭代点靠后的梯度权重大,这样Bi-LSTM模型能够丢弃靠前的梯度,从而加速整体的收敛速度;RMSprop算法采用动态调整Bi-LSTM预测模型的学习速率,在计算累积平方梯度时加入衰减系数β来控制Bi-LSTM预测模型获取的历史信息;
从历史训练集中采集包含m个样本{x(1),x(2),...,x(m)}的小批量数据,其中数据x(i)对应映射y(i)
计算梯度估计:
Figure BDA0002747481800000031
累积平方梯度:γ←βγ+(1-β)ge g
计算参数更新量:
Figure BDA0002747481800000041
更新参数:θ←θ+Δθ
式中,ε表示全局学习率,θ表示初始参数,δ是小常数,初始化梯度累积量γ=0;选取网络激活函数sigmoid函数和双曲正切tanh函数,设定改进后的Bi-LSTM预测模型的相关参数,用以选择最佳的光伏电站输出功率预测效果;
步骤S8:利用步骤S6中划分好的训练和测试验证数据集,根据步骤S7中所述的光伏电站功率预测模型预测方法,直接将划分好的训练集和测试集放入改进型Bi-LSTM预测模型中进行训练,从而获得最佳的光伏电站预测功率的输出情况。
进一步地,步骤S2中所述对数据集进行预处理依次进行缺失值处理、异常值处理和标准化处理操作,具体包括以下步骤:
步骤SA:若光伏电站监测到的数据存在缺失问题,包括完全随机缺失、随机缺失和非随机缺失三种,则通过填补和删除处理空缺的数据;异常值处理则通过描述性统计法、3σ原则和箱型图方法来清除明显偏离观测值的样本数;
步骤SB:将经过步骤SA处理的数据进行标准化处理,通过最小-最大规范化将数据值压缩到[0,1]范围,其计算公式如下:
Figure BDA0002747481800000042
式中的xmin表示样本数据的最小值,xmax表示样本数据的最大值,xi表示样本数据第i个数值;通过z-score标准化将数据处理呈正态分布,其计算公式如下:
Figure BDA0002747481800000051
Figure BDA0002747481800000052
为原始样本数据均值,σ为样本数据方差;通过小数定标规范化,通过移动数据小数点位数,将数据变换到[-1,1]范围,其计算公式如下:
Figure BDA0002747481800000053
xi'表示样本数据绝对值最大值的数量级。
进一步地,所述步骤S3具体包括以下步骤:
步骤S31:光伏发电输出功率与步骤S1中选择的多种气象特征因素之间进行Pearson相关系数分析,其计算公式如下:
Figure BDA0002747481800000054
式中Xi和Yi分别代表第i种气象因素和光伏发电输出功率的样本数据,N是日样本数;
光伏发电输出功率大小直接取决于太阳辐照度的大小,太阳辐照度包括全球水平辐射和漫射水平辐射两种,光伏发电输出功率与太阳辐照度呈现正相关关系,两者的计算公式如下:
Ps=ηSI[1-0.005(t+25)]
式中η表示光伏转换效率,S表示接收辐射的光伏器件表面积,I表示光照强度,t表示环境温度;其中全球水平辐射与光伏发电输出功率之间的相关系数为0.9952,漫射水平辐射与光伏发电输出功率之间的相关系数为0.9083;
步骤S32:太阳辐照强度会导致光伏面板表面温度的提升,引起开路电压大幅度的减小,对应转换效率也会降低,光伏发电输出功率与环境温度之间的相关系数为0.4383;
步骤S33:环境湿度与光伏发电输出功率呈现负相关关系,它们之间曲线拟合呈现出非线性关系,光伏发电输出功率与环境湿度之间的相关系数为-0.5280。
进一步地,所述步骤S4具体包括以下步骤:
步骤S41:获取比较序列y和参考序列xi,其定义如下:
y={y(k)|k=1,2,...,n}
xi={xi(k)|k=1,2,...,n},i=1,2,...,m
式中的n代表特征值的维数,m代表不同气象因子的数量;
步骤S42:进行数据序列的无量纲处理;
Figure BDA0002747481800000061
式中xj(k)表示比较序列和参考序列的组合矩阵序列,j表示比较序列和参考序列数目总和;
步骤S43:计算比较序列和参考序列之间的灰色相关系数ξi(k);
Figure BDA0002747481800000062
式中ρ是分辨率系数,取值范围是[0,1];
步骤S44:计算多种气象参数与原始光伏电站输出功率之间的相关程度;
Figure BDA0002747481800000071
步骤S45:根据步骤S44所述,将选择的多种气象参数进行相关度排列,依次是全球水平辐射、漫射水平辐射、环境温度和天气相对湿度。
进一步地,所述步骤S6的具体内容为:
根据选取的多种气象参数数据和数值天气预报中心NWP提供的预测数据进行天气类型判定,然后分不同天气类型情况下,计算历史训练集X天与待预测日之间的特征参数的欧式距离:
Figure BDA0002747481800000072
式中,ED为欧式距离,y1和y2为两个特征参数序列。分别选取欧式距离较小的Z天即X天前20%数据作为测试集,Y天即X天后80%数据作为训练集,再从Y天的数据集中选择相似日M天即Y天后90%数据作为训练集,选择最佳相似日N天即Y天前10%数据作为验证集。
与现有技术相比,本发明具有以下有益效果:
本发明通过对特征输入气象参数的预处理,对神经网络预测模型进行优化处理,能够大幅度提升预测精度和有效的拟合非线性时间序列数据。该方法可以准确的预测光伏电站的输出功率。
附图说明
图1为本发明实施例的总体原理流程图。
图2为本发明实施例的系统流程框图。
图3为本发明实施例的数据预处理箱型图。
图4为本发明实施例的多种气象参数与光伏输出功率的相关程度图,其中图4(a)为全球水平辐射图,图4(b)为漫射水平辐射图,图4(c)为环境温度图,图4(d)为天气相对湿度图。
图5为本发明实施例的相似日算法处理后数据分布结构图。
图6为本发明实施例的连续三天随机预测结果图。
图7为本发明实施例的分四个季节预测结果图,其中图7(a)为春季预测结果图,图7(b)为夏季预测结果图,图7(c)为秋季预测结果图,图7(d)为冬季预测结果图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1和2所示,本实施例提供一种基于改进型Bi-LSTM的光伏电站短期功率预测方法,包括以下步骤:
步骤S1:从光伏电站监测的原始的电气以及多种气象数据中,提取光伏电站中两年的原始数据集,所述包括多种气象数据:全球水平辐射、漫射水平辐射、环境温度和天气相对湿度数据;所述原始数据集包括光伏发电输出功率、全球水平辐射、漫射水平辐射、环境温度、天气相对湿度和风速数据,作为光伏电站预测模型的输入;
步骤S2:将步骤S1中采集到的全球水平辐射、漫射水平辐射、环境温度和天气相对湿度数据即特征参数进行预处理,从而建立训练样本数据集;
步骤S3:将采集到的原始光伏输出功率数据,采用皮尔森相关系数分析对光伏输出功率预测曲线的拟合程度进行特征参数选择;
步骤S4:根据所述步骤S2和步骤S3所提取的特征参数,采用主成分分析法PCA对所选择的特征参数进行排序,依次选择最佳的特征因素数据集作为改进型Bi-LSTM预测模型的训练集;
步骤S5:根据数值天气预报中心NWP获得的连续三天待预测日数据作为测试集;
步骤S6:根据对所述步骤S3以及所述步骤S5,根据数值统计学方法来判断待预测日的天气类型,其中包括晴天、雨天、阴天以及部分阴天四种天气类型;根据所述步骤S4,计算历史训练集的特征参数与待预测日的特征参数之间的欧式距离,从而选取误差小于0.5的相关特征参数作为改进型Bi-LSTM预测模型的输入;
同时,对数据集进行划分为训练和测试验证数据集;
步骤S7:利用RMSprop算法来优化Bi-LSTM网络来搭建光伏电站输出功率预测模型即改进型Bi-LSTM预测模型,即RMSprop算法初始迭代点占的权重小,迭代点靠后的梯度权重大,这样Bi-LSTM模型能够丢弃靠前的梯度,从而加速整体的收敛速度;RMSprop算法采用动态调整Bi-LSTM预测模型的学习速率,在计算累积平方梯度时加入衰减系数β来控制Bi-LSTM预测模型获取的历史信息;
从历史训练集中采集包含m个样本{x(1),x(2),...,x(m)}的小批量数据,其中数据x(i)对应映射y(i)
计算梯度估计:
Figure BDA0002747481800000101
累积平方梯度:γ←βγ+(1-β)ge g
计算参数更新量:
Figure BDA0002747481800000102
更新参数:θ←θ+Δθ
式中,ε表示全局学习率,θ表示初始参数,δ是小常数,初始化梯度累积量γ=0;选取网络激活函数sigmoid函数和双曲正切tanh函数,设定改进后的Bi-LSTM预测模型的相关参数,用以选择最佳的光伏电站输出功率预测效果;
步骤S8:利用步骤S6中划分好的训练和测试验证数据集,根据步骤S7中所述的光伏电站功率预测模型预测方法,直接将划分好的训练集和测试集放入改进型Bi-LSTM预测模型中进行训练,从而获得最佳的光伏电站预测功率的输出情况。
在本实施例中,步骤S2中所述对数据集进行预处理依次进行缺失值处理、异常值处理和标准化处理操作,具体包括以下步骤:
步骤SA:若光伏电站监测到的数据存在缺失问题,包括完全随机缺失、随机缺失和非随机缺失三种,则通过填补和删除处理空缺的数据;异常值处理则通过描述性统计法、3σ原则和箱型图方法来清除明显偏离观测值的样本数;箱型图方法如图3所示。
步骤SB:将经过步骤SA处理的数据进行标准化处理,通过最小-最大规范化将数据值压缩到[0,1]范围,其计算公式如下:
Figure BDA0002747481800000111
式中的xmin表示样本数据的最小值,xmax表示样本数据的最大值,xi表示样本数据第i个数值;通过z-score标准化将数据处理呈正态分布,其计算公式如下:
Figure BDA0002747481800000112
Figure BDA0002747481800000113
为原始样本数据均值,σ为样本数据方差;通过小数定标规范化,通过移动数据小数点位数,将数据变换到[-1,1]范围,其计算公式如下:
Figure BDA0002747481800000114
xi'表示样本数据绝对值最大值的数量级。
在本实施例中,所述步骤S3具体包括以下步骤:
步骤S31:光伏发电输出功率与步骤S1中选择的多种气象特征因素之间进行Pearson相关系数分析,其计算公式如下:
Figure BDA0002747481800000115
式中Xi和Yi分别代表第i种气象因素和光伏发电输出功率的样本数据,N是日样本数;
光伏发电输出功率大小直接取决于太阳辐照度的大小,太阳辐照度包括全球水平辐射和漫射水平辐射两种,光伏发电输出功率与太阳辐照度呈现正相关关系,两者的计算公式如下:
Ps=ηSI[1-0.005(t+25)]
式中η表示光伏转换效率,S表示接收辐射的光伏器件表面积,I表示光照强度,t表示环境温度;其中全球水平辐射与光伏发电输出功率之间的相关系数为0.9952,漫射水平辐射与光伏发电输出功率之间的相关系数为0.9083;
步骤S32:太阳辐照强度会导致光伏面板表面温度的提升,引起开路电压大幅度的减小,对应转换效率也会降低,光伏发电输出功率与环境温度之间的相关系数为0.4383;
步骤S33:环境湿度与光伏发电输出功率呈现负相关关系,它们之间曲线拟合呈现出非线性关系,光伏发电输出功率与环境湿度之间的相关系数为-0.5280。
在本实施例中,所述步骤S4具体包括以下步骤:
1、所述步骤S4具体包括以下步骤:
步骤S41:获取比较序列y和参考序列xi,其定义如下:
y={y(k)|k=1,2,...,n}
xi={xi(k)|k=1,2,...,n},i=1,2,...,m
式中的n代表特征值的维数,m代表不同气象因子的数量;
步骤S42:进行数据序列的无量纲处理;
Figure BDA0002747481800000131
式中xj(k)表示比较序列和参考序列的组合矩阵序列,j表示比较序列和参考序列数目总和;
步骤S43:计算比较序列和参考序列之间的灰色相关系数ξi(k);
Figure BDA0002747481800000132
式中ρ是分辨率系数,取值范围是[0,1];
步骤S44:计算多种气象参数与原始光伏电站输出功率之间的相关程度;
Figure BDA0002747481800000133
步骤S45:根据步骤S44所述,将选择的多种气象参数进行相关度排列,依次是全球水平辐射、漫射水平辐射、环境温度和天气相对湿度。
在本实施例中,所述步骤S6的具体内容为:
根据选取的多种气象参数数据和数值天气预报中心NWP提供的预测数据进行天气类型判定,然后分不同天气类型情况下,计算历史训练集X天与待预测日之间的特征参数的欧式距离:
Figure BDA0002747481800000134
式中,ED为欧式距离,y1和y2分别为两个特征参数序列;分别选取欧式距离较小的Z天即X天前20%数据作为测试集,Y天即X天后80%数据作为训练集,再从Y天的数据集中选择相似日M天即Y天后90%数据作为训练集,选择最佳相似日N天即Y天前10%数据作为验证集。如图5所示。
较佳的,如图4所示,在本实施例中,首先,从光伏电站中提取原始光伏发电输出功率数据以及监测到的多种气象因素数据集。其次,对所提取的电气和气象参数进行数据预处理,采用Pearson相关系数分析各种气象参数与光伏发电输出功率之间的R2,选择对光伏发电输出功率影响较大的气象参数,并通过主成分分析法PCA依次对所选择的气象参数进行排序。然后,通过数值统计学方法划分待预测日的天气类型,根据不同天气类型情况,分别计算历史训练集X天与待预测日之间的气象特征参数的欧式距离,选择欧式距离较小的Z天(X天前20%数据)作为测试集,Y天(X天后80%数据)作为训练集,再从Y天的数据集中选择相似日M天(Y天后90%数据)作为训练集,最佳相似日N天(Y天前10%数据)作为验证集,从而将数据划分为训练集、测试集和验证集。最后,搭建基于改进型Bi-LSTM的光伏电站短期输出功率预测模型进行预测,并采用优化算法Adam进行模型优化,从而获得最佳的光伏发电输出功率的预测效果。本实施例所提出的基于改进型Bi-LSTM的光伏电站短期功率预测方法,具有精确度高、收敛速度快、鲁棒性强和泛化能力好等优点,能够有效提高光伏发电输出功率预测的精准度。
表1
Figure BDA0002747481800000141
Figure BDA0002747481800000151
表2
Figure BDA0002747481800000152
表3
Figure BDA0002747481800000153
较佳的,在本实施例中,运用相似日算法结合改进型Bi-LSTM深度学习神经网络来建立光伏电站输出功率预测模型,用于处理不同天气类型状况下的光伏发电输出功率,所采用的方法能够较好的处理非线性时间序列数据,准确的预测不同天气类型的光伏电站的输出功率。目前,公开发表的文献及专利中尚未见有将相似日算法结合改进型Bi-LSTM深度学习神经网络建立预测模型来预测光伏电站输出功率的研究。
较佳的,本实施例通过仿真和实例的验证分析结果表明,将均方根误差(RMSE)、平均绝对误差(MAE)、均方误差(MSE)和R2引入作为预测结果的评价;
Figure BDA0002747481800000154
Figure BDA0002747481800000155
Figure BDA0002747481800000161
Figure BDA0002747481800000162
式中,N表示样本数据量,yi表示实际值,
Figure BDA0002747481800000163
表示预测值,
Figure BDA0002747481800000164
表示样本均值。
实验结果表明本发明方法预测的结果精度非常高。
本发明通过对特征输入气象参数的预处理,对神经网络预测模型进行优化处理,能够大幅度提升预测精度和有效的拟合非线性时间序列数据。该方法可以准确的预测光伏电站的输出功率。
本实施例具体实现过程:包括如下步骤:
步骤S1:从光伏电站监测的原始的电气以及多种气象数据中,提取光伏电站中两年的原始数据集,其中有光伏输出功率、全球水平辐射、漫射水平辐射、大气温度、大气湿度以及风速等数据,作为光伏电站预测模型的输入。
步骤S2:将采集到的全球水平辐射、漫射水平辐射、环境温度和天气相对湿度进行预处理,从而建立训练样本数据集。
步骤S3:将采集到的原始光伏输出功率数据,采用皮尔森相关系数分析对光伏输出功率预测曲线的拟合程度进行特征参数选择。
步骤S4:根据所述步骤S2和S3所提取的特征参数,采用主成分分析法PCA对所选择的特征参数进行排序,依次选择最佳的特征因素数据集作为改进型Bi-LSTM预测模型的训练集。
步骤S5:根据数值天气预报中心NWP获得的连续三天待预测日数据作为测试集。
步骤S6:根据对所述步骤S3以及所述步骤S5,根据数值折线统计图方法来判断待预测日的天气类型,其中包括晴天、雨天、阴天以及部分阴天四种天气类型。根据对所述步骤S4,计算采集的历史训练集的特征参数与待预测日的特征参数之间的欧式距离,从而选取误差小于0.5的相关特征参数作为改进型Bi-LSTM预测模型的输入;
步骤S7:利用RMSprop算法来优化Bi-LSTM网络来搭建光伏电站输出功率预测模型即改进型Bi-LSTM预测模型,即RMSprop算法初始迭代点占的权重小,迭代点靠后的梯度权重大,这样Bi-LSTM模型能够丢弃靠前的梯度,从而加速整体的收敛速度;RMSprop算法采用动态调整Bi-LSTM预测模型的学习速率,在计算累积平方梯度时加入衰减系数β来控制Bi-LSTM预测模型获取的历史信息;
从历史训练集中采集包含m个样本{x(1),x(2),...,x(m)}的小批量数据,其中数据x(i)对应映射y(i)
计算梯度估计:
Figure BDA0002747481800000171
累积平方梯度:γ←βγ+(1-β)ge g
计算参数更新量:
Figure BDA0002747481800000172
更新参数:θ←θ+Δθ
式中,ε表示全局学习率,θ表示初始参数,δ是小常数,初始化梯度累积量γ=0;选取网络激活函数sigmoid函数和双曲正切tanh函数,设定改进后的Bi-LSTM预测模型的相关参数,用以选择最佳的光伏电站输出功率预测效果;
步骤S8:利用步骤S6中划分好的训练和测试验证数据集,根据步骤S7中所述的光伏电站功率预测模型预测方法,直接将划分好的训练集和测试集放入改进型Bi-LSTM预测模型中进行训练,从而获得最佳的光伏电站预测功率的输出情况。
进一步,在本实施例中,采集数据所采用的来自澳大利太阳能中心。步骤S1光伏电站五参数包括全球水平辐射、漫射水平辐射、环境温度、天气相对湿度数据以及光伏发电原始输出功率。在本实施例中,使用处理完的DKASC 1A号光伏电站两年的数据。图6是本发明模型连续三天随机预测结果图,表2是本实施例中误差评价指标情况,从表中可以看出采用Bi-LSTM预测模型能够表现出较好的曲线拟合度并取得较小的误差。图7是本实施例模型连续三天在不同季节情况下的预测结果图,表3是本实施例中不同季节下模型性能情况示意图。以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (3)

1.一种基于改进型Bi-LSTM的光伏电站短期功率预测方法,其特征在于:包括以下步骤:
步骤S1:从光伏电站监测的原始的电气以及多种气象数据中,提取光伏电站中两年的原始数据集,多种气象数据包括:全球水平辐射、漫射水平辐射、环境温度和环境湿度数据;所述原始数据集包括光伏发电输出功率、全球水平辐射、漫射水平辐射、环境温度、环境湿度和风速数据,作为光伏电站预测模型的输入;
步骤S2:将步骤S1中采集到的全球水平辐射、漫射水平辐射、环境温度和环境湿度数据即特征参数进行预处理,从而建立训练样本数据集;
步骤S3:将采集到的光伏发电输出功率,采用皮尔森相关系数分析对光伏发电输出功率预测曲线的拟合程度进行特征参数选择;
步骤S4:根据所述步骤S2和步骤S3所提取的特征参数,采用主成分分析法PCA对所选择的特征参数进行排序,依次选择最佳的特征参数集作为改进型Bi-LSTM预测模型的历史训练集;
步骤S5:将数值天气预报中心NWP获得的连续三天待预测日数据作为测试集;
步骤S6:根据数值统计学方法来判断待预测日的天气类型,其中包括晴天、雨天、阴天以及部分阴天四种天气类型;根据所述步骤S4,计算历史训练集的特征参数与待预测日的特征参数之间的欧式距离,从而选取误差小于0.5的相关特征参数作为改进型Bi-LSTM预测模型的输入;同时,对数据集进行划分为训练集、测试集和验证集;
步骤S7:利用RMSprop算法优化Bi-LSTM网络从而搭建光伏电站输出功率预测模型,即改进型Bi-LSTM预测模型,RMSprop算法初始迭代点占的权重小,迭代点靠后的梯度权重大;采用RMSprop算法动态调整改进型Bi-LSTM预测模型的学习速率,在计算累积平方梯度时加入衰减系数β来控制改进型Bi-LSTM预测模型获取的历史信息;
从历史训练集中采集包含m个样本{x(1),x(2),...,x(m)}的小批量数据,其中数据对应映射
计算梯度估计:
Figure FDA0004080271900000021
累积平方梯度:γ←βγ+(1-β)g*g
计算参数更新量:
Figure FDA0004080271900000022
更新参数:θ←θ+Δθ
式中,ε表示全局学习率,θ表示初始参数,δ是常数,初始化梯度累积量γ'=0;选取网络激活函数sigmoid函数和双曲正切tanh函数,设定改进型Bi-LSTM预测模型的相关参数,用以选择最佳的光伏电站输出功率预测效果;
步骤S8:将步骤S6中划分好的训练集和测试集放入改进型Bi-LSTM预测模型中进行训练,从而获得最佳的光伏电站预测功率的输出情况;
所述步骤S3具体包括以下步骤:
步骤S31:光伏发电输出功率与步骤S1中选择的多种气象数据之间进行Pearson相关系数分析,其计算公式如下:
Figure FDA0004080271900000023
式中Xi和Yi分别代表第i种气象数据和光伏发电输出功率的样本数据,N是日样本数;
光伏发电输出功率大小直接取决于太阳辐照度的大小,太阳辐照度包括全球水平辐射和漫射水平辐射两种,光伏发电输出功率与太阳辐照度呈现正相关关系,两者的计算公式如下:
Ps=ηSI[1-0.005(t+25)]
式中η表示光伏转换效率,S表示接收辐射的光伏器件表面积,I表示光照强度,t表示环境温度;其中全球水平辐射与光伏发电输出功率之间的相关系数为0.9952,漫射水平辐射与光伏发电输出功率之间的相关系数为0.9083;
步骤S32:太阳辐照强度会导致光伏面板表面温度的提升,引起开路电压的减小,对应转换效率也会降低,光伏发电输出功率与环境温度之间的相关系数为0.4383;
步骤S33:环境湿度与光伏发电输出功率呈现负相关关系,它们之间曲线拟合呈现出非线性关系,光伏发电输出功率与环境湿度之间的相关系数为-0.5280;
所述步骤S4具体包括以下步骤:
步骤S41:获取比较序列y和参考序列xi,其定义如下:
y={y(k)|k=1,2,...,n}
xi={xi(k)|k=1,2,...,n},i=1,2,...,m
式中的n代表特征值的维数;
步骤S42:进行数据序列的无量纲处理;
Figure FDA0004080271900000031
式中xj(k)表示比较序列和参考序列的组合矩阵序列,j表示比较序列和参考序列数目总和;
步骤S43:计算比较序列和参考序列之间的灰色相关系数ξi(k);
Figure FDA0004080271900000041
式中ρ是分辨率系数,取值范围是[0,1];
步骤S44:计算多种气象数据与光伏发电输出功率之间的相关程度;
Figure FDA0004080271900000042
步骤S45:将选择的多种气象数据进行相关度排列,依次是全球水平辐射、漫射水平辐射、环境温度和环境湿度。
2.根据权利要求1所述的一种基于改进型Bi-LSTM的光伏电站短期功率预测方法,其特征在于:对步骤S2中数据集进行预处理,依次进行缺失值处理、异常值处理和标准化处理操作,具体包括以下步骤:
步骤SA:若光伏电站监测到的数据存在缺失问题,包括完全随机缺失、随机缺失和非随机缺失三种,则通过填补和删除处理空缺的数据;异常值处理则通过描述性统计法、3σ原则和箱型图方法来清除明显偏离观测值的样本数;
步骤SB:将经过步骤SA处理的数据进行标准化处理,通过最小-最大规范化将数据值压缩到[0,1]范围,其计算公式如下:
Figure FDA0004080271900000043
式中的xmin表示样本数据的最小值,xmax表示样本数据的最大值,xi”表示样本数据第i个数值;通过z-score标准化将数据处理呈正态分布,其计算公式如下:
Figure FDA0004080271900000051
Figure FDA0004080271900000052
为原始样本数据均值,为样本数据方差;通过小数定标规范化,通过移动数据小数点位数,将数据变换到[-1,1]范围,其计算公式如下:
Figure FDA0004080271900000053
xi'表示样本数据绝对值最大值的数量级。
3.根据权利要求1所述的一种基于改进型Bi-LSTM的光伏电站短期功率预测方法,其特征在于:所述步骤S6的具体内容为:
根据选取的多种气象数据和数值天气预报中心NWP提供的预测数据进行天气类型判定,然后分不同天气类型情况下,计算历史训练集X天与待预测日之间的特征参数的欧式距离:
Figure FDA0004080271900000054
式中,ED为欧式距离,y1,i和y2,i分别为两个特征参数序列;分别选取欧式距离小的Z天即X天前20%数据作为测试集,Y天即X天后80%数据作为训练集,再从Y天的数据集中选择相似日M天即Y天后90%数据作为训练集,选择最佳相似日N’天即Y天前10%数据作为验证集。
CN202011175408.4A 2020-10-28 2020-10-28 基于改进型Bi-LSTM的光伏电站短期功率预测方法 Active CN112257941B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011175408.4A CN112257941B (zh) 2020-10-28 2020-10-28 基于改进型Bi-LSTM的光伏电站短期功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011175408.4A CN112257941B (zh) 2020-10-28 2020-10-28 基于改进型Bi-LSTM的光伏电站短期功率预测方法

Publications (2)

Publication Number Publication Date
CN112257941A CN112257941A (zh) 2021-01-22
CN112257941B true CN112257941B (zh) 2023-04-18

Family

ID=74262250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011175408.4A Active CN112257941B (zh) 2020-10-28 2020-10-28 基于改进型Bi-LSTM的光伏电站短期功率预测方法

Country Status (1)

Country Link
CN (1) CN112257941B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862630B (zh) * 2021-03-08 2024-03-22 海南省电力学校(海南省电力技工学校) 基于天气类型指数区间的光伏功率预测方法、终端及介质
CN113092321B (zh) * 2021-03-31 2023-04-11 东北电力大学 一种基于功率衰减的光伏板积灰浓度检测系统及方法
CN113112091A (zh) * 2021-05-06 2021-07-13 云南电力技术有限责任公司 一种基于pca和lstm的核电机组功率预测方法
CN113496311A (zh) * 2021-06-25 2021-10-12 国网山东省电力公司济宁供电公司 光伏电站发电功率预测方法及系统
CN113344293B (zh) * 2021-06-29 2024-04-05 东南大学 一种基于nca-融合回归树模型的光伏功率预测方法
CN114330923A (zh) * 2022-01-06 2022-04-12 国电南瑞南京控制系统有限公司 一种基于公共气象数据的光伏发电功率预测方法
CN114201924B (zh) * 2022-02-16 2022-06-10 杭州经纬信息技术股份有限公司 基于迁移学习的太阳辐照度预测方法及预测系统
CN117117819A (zh) * 2022-05-13 2023-11-24 中国电力科学研究院有限公司 一种光伏发电短期功率预测方法、系统、设备和介质
CN117113230A (zh) * 2022-08-19 2023-11-24 南方电网数字电网研究院有限公司 面向新能源高精度预测的机器学习特征选择方法
CN115587644A (zh) * 2022-08-30 2023-01-10 浙江正泰智维能源服务有限公司 一种光伏电站性能参数预测方法、装置、设备及介质
CN116339394B (zh) * 2023-04-13 2024-04-19 四川航洋电力工程设计有限公司 一种倾角与方位角自动对焦的光伏发电方法及装置
CN117749089B (zh) * 2024-02-19 2024-05-10 北京智芯微电子科技有限公司 光伏电站异常识别方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018007312A (ja) * 2016-06-27 2018-01-11 藤崎電機株式会社 発電電力予測装置、サーバ、コンピュータプログラム及び発電電力予測方法
CN109711609A (zh) * 2018-12-15 2019-05-03 福州大学 基于小波变换和极限学习机的光伏电站输出功率预测方法
CN109858673A (zh) * 2018-12-27 2019-06-07 南京工程学院 一种光伏发电系统功率预测方法
CN110148068A (zh) * 2019-05-23 2019-08-20 福州大学 一种基于气象数据相似度分析和lstm神经网络实现光伏电站超短期功率预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018007312A (ja) * 2016-06-27 2018-01-11 藤崎電機株式会社 発電電力予測装置、サーバ、コンピュータプログラム及び発電電力予測方法
CN109711609A (zh) * 2018-12-15 2019-05-03 福州大学 基于小波变换和极限学习机的光伏电站输出功率预测方法
CN109858673A (zh) * 2018-12-27 2019-06-07 南京工程学院 一种光伏发电系统功率预测方法
CN110148068A (zh) * 2019-05-23 2019-08-20 福州大学 一种基于气象数据相似度分析和lstm神经网络实现光伏电站超短期功率预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于气象因素充分挖掘的BiLSTM光伏发电短期功率预测;徐先峰等;《计算机系统应用》;20200715(第07期);全文 *

Also Published As

Publication number Publication date
CN112257941A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN112257941B (zh) 基于改进型Bi-LSTM的光伏电站短期功率预测方法
CN107766990B (zh) 一种光伏电站发电功率的预测方法
CN106529814B (zh) 基于Adaboost聚类和马尔科夫链的分布式光伏超短期预测方法
CN106779223B (zh) 一种光伏系统发电功率实时预测方法及装置
CN109002915B (zh) 基于Kmeans-GRA-Elman模型的光伏电站短期功率预测方法
CN110880789B (zh) 一种风电、光伏联合发电系统经济调度方法
CN109711609B (zh) 基于小波变换和极限学习机的光伏电站输出功率预测方法
CN110909919A (zh) 融合注意力机制的深度神经网络模型的光伏功率预测方法
CN110729764B (zh) 一种含光伏发电系统的优化调度方法
CN109376951B (zh) 一种光伏概率预测方法
CN113496311A (zh) 光伏电站发电功率预测方法及系统
CN111695736B (zh) 一种基于多模型融合的光伏发电短期功率预测方法
CN109086928A (zh) 基于saga-fcm-lssvm模型的光伏电站实时功率预测方法
CN104021427A (zh) 一种基于因子分析的并网光伏电站日发电量预测方法
CN110503153B (zh) 基于差分进化算法和支持向量机的光伏系统故障诊断方法
CN115829105A (zh) 基于历史数据特征搜索的光伏功率预测方法
CN114004139A (zh) 一种光伏发电功率预测方法
CN111626473A (zh) 一种考虑误差修正的两阶段光伏功率预测方法
CN110909958A (zh) 一种计及光伏并网功率的短期负荷预测方法
CN114792156A (zh) 基于曲线特征指标聚类的光伏输出功率预测方法和系统
CN115441447B (zh) 一种新能源发电功率预测方法
CN117060407B (zh) 一种基于相似日划分的风电集群功率预测方法及系统
CN110991747A (zh) 一种计及风电场功率的短期负荷预测方法
CN110852492A (zh) 一种基于马氏距离找相似的光伏功率超短期预测方法
CN111242371B (zh) 一种基于非迭代多模型的光伏发电短期预测校正方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant