CN117874495A - 一种太阳能发电功率组合预测方法及其装置 - Google Patents
一种太阳能发电功率组合预测方法及其装置 Download PDFInfo
- Publication number
- CN117874495A CN117874495A CN202410064246.9A CN202410064246A CN117874495A CN 117874495 A CN117874495 A CN 117874495A CN 202410064246 A CN202410064246 A CN 202410064246A CN 117874495 A CN117874495 A CN 117874495A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- prediction
- training
- power generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010248 power generation Methods 0.000 title claims abstract description 54
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 44
- 241000254173 Coleoptera Species 0.000 claims abstract description 14
- 210000003608 fece Anatomy 0.000 claims abstract description 14
- 238000012795 verification Methods 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 238000012360 testing method Methods 0.000 claims abstract description 11
- 238000012545 processing Methods 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 claims description 12
- 238000011176 pooling Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 230000010354 integration Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 abstract description 2
- 230000000295 complement effect Effects 0.000 abstract 1
- 238000013527 convolutional neural network Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003245 coal Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 230000002431 foraging effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 235000001968 nicotinic acid Nutrition 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种太阳能发电功率组合预测方法及其装置,包括:获取太阳能发电模组的运行数据和环境数据;补全缺失值后通过三次特征提取算法,提取数据特征得到处理后的数据集;预测模型训练:设定两个模型CNN‑BiLSTM和XGBoost,均用蜣螂算法优化,训练集输入并训练得到训练模型;再将验证集输入训练模型,使用优化算法迭代,得到上述模型的最佳超参数,结合权重得到预测模型;将测试集数据输入预测模型,得到太阳能发电功率的预测结果。本发明使用三次特征提取方法处理数据,提高了数据的质量;采用组合模型的方法,选择互补的子模型进行适当的训练和集成,并用DBO算法对模型的权重进行了寻优,提升了组合模型的预测准确度。
Description
技术领域
本发明属于太阳能发电技术领域,公开了一种太阳能发电功率组合预测方法及其装置。
背景技术
随着对气候和可持续发展的日益关注,可再生能源(RES)和替代能源越来越受到各个国家的关注。新能源要点指出“建立大型风光基地支撑调节煤电机组容量补偿机制”,一方面风光发电很好的补足了激增的电力需求;另一方面风光等可再生清洁能源弥补了煤炭传统能源的高消耗高污染的缺陷。太阳能以其储量丰富、清洁高效等优势成为最理想的替代能源。作为太阳能的主要利用形式,太阳能(光伏)发电得到了快速发展。能源环境智库Ember发布的2023《全球电力评论》报告指出:2022年风力、太阳能发电在全球发电总量中的占比持续增加,达到12%的新高纪录。其中,太阳能发电量增长24%,连续18年成为增长最快的电力来源。与此同时,风力和太阳能发电量的增长满足了全球电力需求增长的80%,远高于2021年的69%。
但是由于太阳能发电固有的间歇性、周期性和随机性,影响了电网电能质量、以及供电可靠性。太阳能发电等新能源出力具有较大的波动性,难以把控实际输入电网的电量,使得太阳能新能源被认为是垃圾能源,存在大规模弃光现象。因此,预测作为电力和能源行业的重要组成部分,可靠和准确的太阳能功率预测对于太阳能电站控制、调度性能和电网安全稳定运行至关重要,太阳能发电预测技术的改进可以降低电力系统中净发电成本,并减少对太阳能发电的弃用。
发明内容
本发明的目的在于提供一种太阳能发电功率组合预测方法及其装置,通过可靠准确地对太阳能发电功率进行预测,从而辅助太阳能电站的控制调度和运行,降低太阳能发电弃用的问题。
为解决上述的技术问题,本发明采用以下技术方案:
一种太阳能发电功率组合预测方法,其特征在于包括如下步骤:
S1.数据采集:获取太阳能发电(光伏)模组的运行数据和环境数据;
S2.数据处理:补全缺失值后通过三次特征提取算法,提取数据特征得到处理后的数据集;
S3.预测模型训练:将数据集分为训练集、验证集、测试集,设定两个模型CNN-BiLSTM和XGBoost,均用蜣螂算法优化,训练集输入并训练得到训练模型;再将验证集输入训练模型,使用优化算法迭代,得到上述模型的最佳超参数,并对两个模型的技术误差进行比较,当误差不大于设定阈值,计算两个模型的权重并组合得到预测模型,当误差大于设定阈值时,选择误差较小的模型作为预测模型;
S4.将测试集数据输入预测模型,得到太阳能发电功率的预测结果。
更进一步的技术方案是步骤S1中所述运行数据为太阳能模组温度、倾斜角、电流、电压、发电功率,环境数据为环境温度、环境湿度、辐照强度;数据采集为采样时间连续的采集,采样间隔为10min。
更进一步的技术方案是步骤S2中所述补全缺失值采用三次样条插值法填补缺失值;所述三次特征提取算法具体步骤为:利用皮尔逊相关系数公式计算各个数据特征与发电功率的相关系数值,然后从大到小排列,选取前五个数据特征,再用集合经验模态分解将数据分解为多个代表不同频率成分的固有模态函数,最后用连续小波变换进行进一步处理,得到处理后的数据集。
更进一步的技术方案是步骤S3中所述模型CNN-BiLSTM由输入层、数据预处理层、CNN层、BiLSTM层、全连接层和输出层组成,CNN层由卷积层和最大池化层堆叠组成,BiLSTM层由两层LSTM堆叠组成。
更进一步的技术方案是步骤S3中所述模型CNN-BiLSTM和XGBoost中均使用蜣螂优化算法寻优,利用仿生学的知识,模拟蜣螂的滚球、跳舞、繁殖、觅食和偷窃行为,通过迭代更新个体的活动区域和位置来获取模型的最优超参数,如feature num(特征数)、LayerSizes(网络层大小)和Stride(步幅)。
更进一步的技术方案是一种太阳能发电功率组合预测装置,其特征在于:包括依次信号连接的数据采集装置、数据处理装置和显示器,其中数据处理装置包括依次信号连接的数据记录模块、数据处理模块、数据训练模块、数据预测模块、预测结果评估模块。
更进一步的技术方案是所述数据采集装置获取太阳能模组的运行数据和环境数据,并传送给数据记录模块;
数据处理模块补全数据缺失值后通过三次特征提取算法,提取数据特征得到处理后的数据集;
数据训练模块设定两个模型CNN-BiLSTM和XGBoost,均用蜣螂算法优化,训练集输入并训练得到训练模型;再将验证集输入训练模型,使用优化算法迭代,得到上述模型的最佳超参数模型,并对两个模型的技术误差进行比较,当误差不大于设定阈值,计算两个模型的权重并组合得到预测模型,当误差大于设定阈值时,选择误差较小的模型作为预测模型,并传输给数据预测模块;
数据预测模块接收输入的测试集数据后经计算得到太阳能发电功率的预测结果;
预测结果评估模块将预测结果与实际结果进行比较,计算预测误差,包括平均相对误差、平均误差、均方误差、均方根误差、决定系数;
显示器将数据采集装置、数据处理装置得到的数据和结果进行显示。
与现有技术相比,本发明的有益效果是:提出了一种太阳能发电功率组合预测方法及其装置,通过三次特征提取算法(PCEEMD)准确提取太阳能模组发电的重要数据特征,利用皮尔逊相关系数Pearson选择筛选出对目标变量有更强相关性的特征,送入集合经验模态分解EEMD进行去噪分离出不同频率分量,连续小波变换CWT进一步识别频率间隔的信息提取数据特征。预测模型基于卷积-双向长短时记忆(CNN-BiLSTM)模型和极度梯度提升(XGBoost)模型组合,采用蜣螂优化算法(DBO)进行超参数寻优,综合考虑时间与空间差异性以及降低误差多方面因素,大大提高了太阳能发电功率预测的准确度。本申请也搭建了上述方法的装置,将所提方法从抽象的理论概念转化为具体的实际应用,同时也为验证和改进理论方法提供了实践平台。其预测方法和装置在能源预测领域具有很强的实用性、适用性和发展性。
附图说明
图1是本发明的流程图。
图2是实施例中数据集划分示意图。
图3是实施例中数据集曲线图。
图4是实施例中数据处理流程示意图。
图5是本发明的原理框图。
图6是实施例中预测结果对比图。
图7是本发明中预测装置界面示意图。
图8是本发明中预测装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
图1示出了一种太阳能发电功率组合预测方法,包括如下步骤:
S1.数据采集:获取太阳能(光伏)发电模组的运行数据和环境数据;所述运行数据为太阳能模组温度、倾斜角、电流、电压、发电功率,环境数据为环境温度、环境湿度、辐照强度;数据采集为采样时间连续的采集,采样间隔为10min。
S2.数据处理:补全缺失值后通过三次特征提取算法PCEEMD,提取数据特征得到处理后的数据集。所述补全缺失值采用三次样条插值法填补缺失值;所述三次特征提前算法具体步骤为:利用皮尔逊相关系数公式计算各个数据特征与发电功率的相关系数值,然后从大到小排列,选取前五个数据特征,再用集合经验模态分解将数据分解为多个代表不同频率成分的固有模态函数,最后用连续小波变换进行进一步处理,得到处理后的数据集。
S3.预测模型训练:构建一种由蜣螂算法(DBO)优化CNN-BiLSTM和XGB得到最优模型,由最优模型的误差确定权重的太阳能发电功率组合预测模型。将数据集以8:1:1的比例分为训练集、验证集、测试集,设定两个模型CNN-BiLSTM和XGBoost,均用蜣螂算法优化,训练集输入并训练得到训练模型;再将验证集输入训练模型,使用优化算法迭代,得到上述模型的最佳超参数模型,并对两个模型的技术误差进行比较,当误差不大于设定阈值,计算两个模型的权重并组合得到预测模型,当误差大于设定阈值时,选择误差较小的模型作为预测模型。
所述模型CNN-BiLSTM由输入层、数据预处理层、CNN层、BiLSTM层、全连接层和输出层组成,CNN层由卷积层和最大池化层堆叠组成,BiLSTM层由两层LSTM堆叠组成,所述模型CNN-BiLSTM和XGBoost中均使用蜣螂优化算法寻优,利用仿生学的知识,模拟蜣螂的滚球、跳舞、繁殖、觅食和偷窃行为,通过迭代更新个体的活动区域和位置来获取模型的最优超参数,如feature num(特征数)、Layer Sizes(网络层大小)和Stride(步幅)。
S4.将测试集数据输入预测模型,得到太阳能发电功率的预测结果。
S5.通过不同评价指标评估组合预测方法的预测性能。评价指标有:平均相对误差(MAPE)、平均误差(MAE)、均方误差(MSE)、均方根误差(RMSE)和R2,其中MAPE作为各个模型预测性能的主要评价指标。
实施例2
图7、8示出了一种太阳能发电功率组合预测装置,其特征在于:包括依次信号连接的数据采集装置、数据处理装置和显示器,其中数据处理装置包括依次信号连接的数据记录模块、数据处理模块、数据训练模块、数据预测模块、预测结果评估模块。
其中,所述数据采集装置获取太阳能模组的运行数据和环境数据,并传送给数据记录模块;
数据处理模块补全数据缺失值后通过三次特征提取算法,提取数据特征得到处理后的数据集;
数据训练模块设定两个模型CNN-BiLSTM和XGBoost,均用蜣螂算法优化,训练集输入并训练得到训练模型;再将验证集输入训练模型,使用优化算法迭代,得到上述模型的最佳超参数模型,并对两个模型的技术误差进行比较,当误差不大于设定阈值,计算两个模型的权重并组合得到预测模型,当误差大于设定阈值时,选择误差较小的模型作为预测模型,并传输给数据预测模块;
数据预测模块接收输入的测试集数据后经计算得到太阳能发电功率的预测结果;
预测结果评估模块将预测结果与实际结果进行比较,计算预测误差和均方根误差;
显示器将数据采集装置、数据处理装置得到的数据和结果进行显示。
实施例3
结合实际对上述方法进行说明。
步骤一、对某太阳能(光伏)发电站的数据进行采集,将收集到的历史太阳能发电功率数据以及对应时刻的历史气象数据和太阳能发电模组数据按照时间顺序记录如表1,以多维数组形式展示,其中,第一列为时间,第二至第七列依次为倾斜角、电流、电压、环境湿度、环境温度、辐照强度和太阳能发电模组温度,最后一列为发电功率。
表1
步骤二:将记录的数据集进行各特征关于时间变化的曲线绘制,如图3所示,其中,以年为时间长度月为时间刻度、以月为时间长度天为时间刻度、以周为时间长度小时为时间刻度,分别绘制多面板堆叠线图、字母图和局部放大图展示不同的变化趋势和周期。
步骤三:对因传感器故障、数据采集问题、天气条件和数据记录问题等原因导致数据集部分缺失数据,进行缺失值识别后采用三次样条插值方法填补缺失值。
步骤四:对包含大量的特征变量的数据集中存在冗余或不相关的特征,提出一种三次提取算法(PCEEMD)用来提取太阳能(光伏)序列的主要特征。
具体地,在本实施例中,为了进一步提高对太阳能数据集学习的准确度,如图4所示,首先通过Pearson特征选择,筛选出五个对目标变量有更强相关性的特征:电流、电压、环境温度、辐照强度和太阳能模组温度,从而减少太阳能数据集的特征空间的维度,提高预测模型的泛化能力;接着将筛选出的五个特征的相关数据输入到EEMD中提高信噪比去噪,将太阳能信号分解为多个代表不同频率成分的固有模态函数(IMF);最后,使用CWT接收去噪太阳能信号中的频率,估计每个频率下的幅值,分别提取出太阳能数据集高频(HF)分量、低频(LF)分量中的特征,从而得到准确的太阳能数据特征。
其中,Pearson特征选择方法具体为:利用皮尔逊相关系数公式,计算得各个特征的相关系数值,计算公式如下所示:
式中:xi为第i时段的某个特征因子的值,yi为第i个时段的太阳能发电功率值,为某个特征因子的平均值,/>为太阳能发电功率的平均值,n为整个数据集的时段长度。
然后,将各特征因子的相关系数值从大到小排序,剔除后两个相关系数小的特征,保留前五个强特征作为主控特征因子输入到预测模型。此外,绘制皮尔逊热力图展示相关性计算结果。
步骤五:利用太阳能数据的时间连续性和相关特征数据的空间特性,选择具有平移不变性的子模型CNN提取数据集中空间特征。
具体地,在本实施例中,原始太阳能(光伏)数据集输入后,首先卷积层负责提取太阳能数据中的局部及全局特征;然后池化层用来大幅降低光伏参数量级(降维);此时,CNN常将包含ReLU层的卷积层和池化层连接一起,并经过数次重复直到太阳能(光伏)数据在空间上被缩小到理想的尺寸;最后会先将多维的数据进行压缩“扁平化(Flatten)”,再与全连接层连接,全连接层用于处理“压缩的数据信息”并输出结果。CNN将原始太阳能数据经过逐层的处理后,再与全连接层连接,在这个过程中依次识别出了太阳能(光伏)时间序列从部分到整体的各个空间特征。
利用太阳能(光伏)数据的时间变化特性,选择具有很强的捕捉时间特性的能力的子模型BiLSTM提取数据集中时间信息。
具体地,在本实施例中,数据集中太阳能(光伏)发电功率随时间变化具有很强的周期性,但由于功率的影响因素随时间的动态变化,功率的变化不是严格周期性的。BiLSTM模型由两个LSTM层组成,一个从前往后读取输入序列,另一个从后往前读取输入序列,能够很好的读取到太阳能(光伏)相关的历史数据间存在双向信息。其中,LSTM层通过它的“门控装置”避免梯度爆炸和梯度消失现象,能够解决循环神经网络RNN的长期依赖问题,在多次传递中仍然能很好的保存信息。LSTM重复模块包含了遗忘门、输入门和输出门。在遗忘门进行式(1)计算,当前太阳能(光伏)数据输入xt和上一时刻隐藏层的状态ht-1,通过激活函数sigmoid,得到决定将会被遗忘的信息ft。式(2)和式(3)共同构成输入门,xt和ht-1通过激活函数sigmoid决定将会被新添加的信息it;同时,xt和ht-1通过一个tanh层创建一个新的候选值向量在遗忘门进行式(4)计算,上一时刻细胞状态Ct-1与的“遗忘门”输出ft相乘,丢弃掉确定需要丢弃的信息,接着加上输入门/>得到新的细胞状态Ct。最终,根据当前时刻输入xt、上一时刻隐藏层的状态ht-1、以及最新的状态Ct决定该时刻的输出ht。这两个LSTM层的输出经过拼接后,再送入后续的全连接层进行太阳能时序数据预测。
ft=σ(Wf·[ht-1,xt]+bf) (1)
it=σ(Wi·[ht-1,xt]+bi) (2)
ot=σ(Wo·[ht-1,xt]+bo) (5)
ht=ot*tanh(Ct) (6)
为了进一步减少太阳能(光伏)功率预测误差,选择树模型XGBoost,通过不断迭代,生成一棵新树拟合前一棵树预测的残差,从而不断提高太阳能(光伏)预测精度。
具体地,在本实施例中,XGBoost集成模型表示如下:
式中:n为树的数目;为预测值;F为所有可能的CART集合。
每一次迭代不影响模型,即原来的模型保持不变,将一个新的函数添加到模型里。一个函数对应一棵树,新生成的树拟合上次预测的残差,迭代过程表达式如下所示:
XGB的目标函数为:损失函数+模型复杂度。目标函数如下所示:
式(9)中:用来表示预测值和真实值的误差;/>是正则化项,用来表示每棵树的复杂度之和。
式(10)中:T为叶子结点的个数;ω为叶子节点的权重;γ为惩罚力度,用来控制叶子节点的个数;λ保证叶子节点的分数不至于太大。每次迭代将目标函数更新为
为了找到能够最小化的目标函数的ft,XGBoost利用其在ft=0处的泰勒二阶展开近似它,加速收敛。所以目标函数近似为
式中:gi为一阶导数;hi为二阶导数。
将复杂度公式代入,叶子数据点的目标函数总和等价于
式中:为叶子节点中所有包涵样本的一阶偏导数的和;
为叶子节点所有包涵样本的二阶偏导数的和。
将目标函数改写成关于叶子结点权重ω的一元二次函数,求解所得的最优ω和目标函数值分别如下所示:
在构建预测模型时,选择将CNN子模型和BiLSTM子模型混合。
CNN适合提取局部空间特征,BiLSTM兼顾双向时间序列信息结合,可以从时空特性上更周全地分析太阳能发电功率数据,使预测结果的拟合度更高。
具体地,在本实施例中,CNN-BILSTM混合模型由输入层、数据预处理层、CNN层、BiLSTM层、全连接层和输出层组成,CNN层由卷积层和最大池化层堆叠组成,BiLSTM层由两层LSTM堆叠成。首先,太阳能数据集以图像形式输入,经过零均值归一化,进入二维卷积层,此时卷积的步幅是[11],然后进入十个通道的批量归一化层,接着激活函数对其训练,之后进入步幅为[22]最大池化层,然后经过扁平化处理进入包含128个隐藏单元的BiLSTM层,再经过激活函数训练,进入全连接层,最终回归输出。
步骤六:将处理后的数据集以8:1:1的比例划分为训练集、验证集、测试集,设置初始超参数,包括模型的神经元个数、迭代次数和一次训练所选取的样本数,设定CNN-BiLSTM模型与XGBoost模型的优化方法均为DBO,将其分别在训练集上进行训练;
步骤七:使用DBO优化算法在多次迭代计算中分别找到两个模型的最佳超参数模型MCNN-BiLSTM,MXGB,设验证集的特征为xv,真实值为yv,经过验证集后可以得到模型预测值分别为根据公式/>和/>计算模型的误差ECNN-BiLSTM,EXGB;
步骤八:进一步优化模型的组合,如果在验证集上两个算法相差的较大,两个算法结合效果会处于中间值,此时取效果最好的算法模型作为最终的模型。具体为:设定一个阈值θ=0.1,根据公式
|ECNN-BiLSTM-EXGB|/max(ECNN-BiLSTM,EXGB)≤θ判断结合方式。如果满足阈值判断条件则通过验证集的误差决定组合的权重:
如果不满足,说明两个算法相对差值比大于阈值,此时将误差小的模型权重设置为1,另外一个模型权重为0。最终组合模型预测结果为:
步骤九:选择组合预测模型的对比模型,以与本发明中方法进行对比。
具体地,在本实施例中,先选取当前典型的预测方法作为对比方法,其描述如下:
CNN:此方法是一种深度学习模型,它通过卷积层、池化层和全连接层构成,能够很好的提取连续数据的空间特征。
LSTM:是一种循环神经网络(RNN)的变体,用于处理序列数据,LSTM通过门控单元来记忆和控制信息的流动,能够有效处理长期依赖关系,防止梯度消失和梯度爆炸的问题。
BILSTM:是在LSTM的基础上增加了反向传播的连接,使得模型能够同时考虑过去和未来的上下文信息,增强了模型对序列数据的理解能力。
CNN-LSTM:是将CNN和LSTM结合起来的模型,用于处理空间和时间上的序列数据,具有较好的特征提取和序列建模能力。
CNN-BILSTM-XGB:本发明采用的组合预测模型,这种结合可以充分发挥各个子模型的特点优势,从时间与空间因素以及降低误差等多方面提高预测模型准确性。
太阳能(光伏)数据集按照划分好的比例输入到各个模型中进行预测,为了公平比较,对于上述太阳能(光伏)功率预测方法,所有方法的设定参数保持一致,即采用上述相同的数据处理方法以及相同的模型参数设定。
步骤十:对各模型的预测结果设置公平的评价指标。
选取平均相对误差MAPE作为各个模型预测性能的主要评价指标,并选择平均误差(mean error,MAE)、均方误差(mean square error,MSE)、均方根误差(root mean squareerror,RMSE)和R2作为辅助评价指标。
步骤十一:将各模型的预测结果进行分析,如图6,进行各模型预测曲线和真实曲线绘制,在对比中证实本发明所提一种太阳能发电功率组合预测方法的预测性能。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种太阳能发电功率组合预测方法,其特征在于包括如下步骤:
S1.数据采集:获取太阳能发电模组的运行数据和环境数据;
S2.数据处理:补全缺失值后通过三次特征提取算法,提取数据特征得到处理后的数据集;
S3.预测模型训练:将数据集分为训练集、验证集、测试集,设定两个模型CNN-BiLSTM和XGBoost,均用蜣螂算法优化,训练集输入并训练得到训练模型;再将验证集输入训练模型,使用优化算法迭代,得到上述模型的最佳超参数,并对两个模型的技术误差进行比较,当误差不大于设定阈值,计算两个模型的权重并组合得到预测模型,当误差大于设定阈值时,选择误差较小的模型作为预测模型;
S4.将测试集数据输入预测模型,得到太阳能发电功率的预测结果。
2.根据权利要求1所述的一种太阳能发电功率组合预测方法,其特征在于:步骤S1中所述运行数据为太阳能模组温度、倾斜角、电流、电压、发电功率,环境数据为环境温度、环境湿度、辐照强度;数据采集为采样时间连续的采集,采样间隔为10min。
3.根据权利要求1所述的一种太阳能发电功率组合预测方法,其特征在于:步骤S2中所述补全缺失值采用三次样条插值法填补缺失值;所述三次特征提取算法具体步骤为:利用皮尔逊相关系数公式计算各个数据特征与发电功率的相关系数值,然后从大到小排列,选取前五个数据特征,再用集合经验模态分解将数据分解为多个代表不同频率成分的固有模态函数,最后用连续小波变换进行进一步处理,得到处理后的数据集。
4.根据权利要求1所述的一种太阳能发电功率组合预测方法,其特征在于:步骤S3中所述模型CNN-BiLSTM由输入层、数据预处理层、CNN层、BiLSTM层、全连接层和输出层组成,CNN层由卷积层和最大池化层堆叠组成,BiLSTM层由两层LSTM堆叠组成。
5.根据权利要求1所述的方法一种太阳能发电功率组合预测方法,其特征在于:步骤S3中所述模型CNN-BiLSTM和XGBoost中均使用蜣螂优化算法寻优,通过迭代更新个体的活动区域和位置来获取模型的最优超参数。
6.一种太阳能发电功率组合预测装置,其特征在于:包括依次信号连接的数据采集装置、数据处理装置和显示器,其中数据处理装置包括依次信号连接的数据记录模块、数据处理模块、数据训练模块、数据预测模块、预测结果评估模块。
7.根据权利要求6所述的方法一种太阳能发电功率组合预测装置,其特征在于:所述数据采集装置获取太阳能模组的运行数据和环境数据,并传送给数据记录模块;
数据处理模块补全数据缺失值后通过三次特征提取算法,提取数据特征得到处理后的数据集;
数据训练模块设定两个模型CNN-BiLSTM和XGBoost,均用蜣螂算法优化,训练集输入并训练得到训练模型;再将验证集输入训练模型,使用优化算法迭代,得到上述模型的最佳超参数模型,并对两个模型的技术误差进行比较,当误差不大于设定阈值,计算两个模型的权重并组合得到预测模型,当误差大于设定阈值时,选择误差较小的模型作为预测模型,并传输给数据预测模块;
数据预测模块接收输入的测试集数据后经计算得到太阳能发电功率的预测结果;
预测结果评估模块将预测结果与实际结果进行比较,计算预测误差和均方根误差;
显示器将数据采集装置、数据处理装置得到的数据和结果进行显示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410064246.9A CN117874495B (zh) | 2024-01-17 | 2024-01-17 | 一种太阳能发电功率组合预测方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410064246.9A CN117874495B (zh) | 2024-01-17 | 2024-01-17 | 一种太阳能发电功率组合预测方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117874495A true CN117874495A (zh) | 2024-04-12 |
CN117874495B CN117874495B (zh) | 2024-06-04 |
Family
ID=90584413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410064246.9A Active CN117874495B (zh) | 2024-01-17 | 2024-01-17 | 一种太阳能发电功率组合预测方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117874495B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554148A (zh) * | 2021-06-07 | 2021-10-26 | 南京理工大学 | 一种基于贝叶斯优化的BiLSTM电压偏差预测方法 |
CN114781723A (zh) * | 2022-04-22 | 2022-07-22 | 国网河北省电力有限公司 | 一种基于多模型融合的短期光伏出力预测方法 |
US20220373984A1 (en) * | 2021-05-19 | 2022-11-24 | Shandong University | Hybrid photovoltaic power prediction method and system based on multi-source data fusion |
CN116523035A (zh) * | 2023-03-09 | 2023-08-01 | 重庆邮电大学 | 一种基于iscso和topsis的pm2.5浓度预测方法 |
CN116775687A (zh) * | 2023-07-07 | 2023-09-19 | 哈尔滨工程大学 | 一种基于数模共生的时间序列预测闭环框架 |
CN117081063A (zh) * | 2023-08-30 | 2023-11-17 | 淮阴工学院 | 一种基于GCN-Crossformer模型的分布式充电负荷预测方法及系统 |
CN117319231A (zh) * | 2023-09-25 | 2023-12-29 | 广东工业大学 | 一种基于蜣螂算法优化vmd的网络流量预测方法与系统 |
-
2024
- 2024-01-17 CN CN202410064246.9A patent/CN117874495B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220373984A1 (en) * | 2021-05-19 | 2022-11-24 | Shandong University | Hybrid photovoltaic power prediction method and system based on multi-source data fusion |
CN113554148A (zh) * | 2021-06-07 | 2021-10-26 | 南京理工大学 | 一种基于贝叶斯优化的BiLSTM电压偏差预测方法 |
CN114781723A (zh) * | 2022-04-22 | 2022-07-22 | 国网河北省电力有限公司 | 一种基于多模型融合的短期光伏出力预测方法 |
CN116523035A (zh) * | 2023-03-09 | 2023-08-01 | 重庆邮电大学 | 一种基于iscso和topsis的pm2.5浓度预测方法 |
CN116775687A (zh) * | 2023-07-07 | 2023-09-19 | 哈尔滨工程大学 | 一种基于数模共生的时间序列预测闭环框架 |
CN117081063A (zh) * | 2023-08-30 | 2023-11-17 | 淮阴工学院 | 一种基于GCN-Crossformer模型的分布式充电负荷预测方法及系统 |
CN117319231A (zh) * | 2023-09-25 | 2023-12-29 | 广东工业大学 | 一种基于蜣螂算法优化vmd的网络流量预测方法与系统 |
Non-Patent Citations (4)
Title |
---|
DUAN, JIAHUI等: "Air-quality prediction based on the ARIMA-CNN-LSTM combination model optimized by dung beetle optimizer", 《SCIENTIFIC REPORTS》, vol. 13, no. 1, 26 July 2023 (2023-07-26), pages 1 - 16 * |
LINLIN FU等: "A novel combined model integrating Twin Compensation and Dung Beetle Optimizer for photovoltaic power prediction", 《AVAILABLE AT SSRN 4811407》, 29 April 2024 (2024-04-29), pages 1 - 28 * |
李斌等: ".改进蜣螂算法优化LSTM的光伏阵列故障诊断", 《电力系统及其自动化学报》, 7 August 2023 (2023-08-07), pages 1 - 10 * |
王愈轩等: "基于LSTM-XGboost组合的超短期风电功率预测方法", 《科学技术与工程》, vol. 22, no. 14, 31 December 2022 (2022-12-31), pages 5629 - 5635 * |
Also Published As
Publication number | Publication date |
---|---|
CN117874495B (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112365040B (zh) | 一种基于多通道卷积神经网络和时间卷积网络的短期风电功率预测方法 | |
CN110059878B (zh) | 基于cnn lstm光伏发电功率预测模型及其构建方法 | |
CN113962364B (zh) | 一种基于深度学习的多因素用电负荷预测方法 | |
CN112016734A (zh) | 基于lstm栈式自编码多模型荷预测方法及系统 | |
CN115293415A (zh) | 计及时间演变和空间相关的多风电场短期功率预测方法 | |
CN113205226B (zh) | 一种结合注意力机制以及误差修正的光伏功率预测方法 | |
Aliberti et al. | Forecasting Short-term Solar Radiation for Photovoltaic Energy Predictions. | |
CN116345555A (zh) | 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法 | |
CN115860215A (zh) | 一种光伏和风电发电功率预测方法及系统 | |
CN110738363A (zh) | 一种光伏发电功率预测模型及其构建方法和应用 | |
CN114488069A (zh) | 基于图神经网络的雷达高分辨率距离像识别方法 | |
CN117874495B (zh) | 一种太阳能发电功率组合预测方法及其装置 | |
CN115392387B (zh) | 一种低压分布式光伏发电出力预测方法 | |
CN117131654A (zh) | 基于预分析初猜值条件非线性最优扰动的目标观测方法 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
CN115169742A (zh) | 一种短期风力发电功率预测方法 | |
Li et al. | The application of deep neural network algorithm considering multi-dimensional meteorological feature extraction in short-term wind speed prediction | |
Li et al. | Short-term Power Load Forecasting based on Feature Fusion of Parallel LSTM-CNN | |
Xia et al. | Research on Solar Radiation Estimation based on Singular Spectrum Analysis-Deep Belief Network | |
CN116842855B (zh) | 分布式光伏配电网出力预测方法、装置、电子设备及介质 | |
Wu et al. | Optimizing CNN-LSTM model for short-term PV power prediction using northern goshawk optimization | |
CN117674143B (zh) | 基于回声脉冲神经p系统的短期光伏功率预测方法及装置 | |
Che et al. | A Sample Entropy Parsimonious Model Using Decomposition-ensemble with SSA and CEEMDAN for Short-term Wind Speed Prediction. | |
Gandhi et al. | Solar energy forecasting architecture using deep learning models | |
Ala et al. | Deep Learning for Smart Grid and Energy Context |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |