CN117708716B - 基于回归和时序融合的光伏发电功率预测方法及设备 - Google Patents
基于回归和时序融合的光伏发电功率预测方法及设备 Download PDFInfo
- Publication number
- CN117708716B CN117708716B CN202410161173.5A CN202410161173A CN117708716B CN 117708716 B CN117708716 B CN 117708716B CN 202410161173 A CN202410161173 A CN 202410161173A CN 117708716 B CN117708716 B CN 117708716B
- Authority
- CN
- China
- Prior art keywords
- data
- model
- regression
- prediction
- power generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000010248 power generation Methods 0.000 title claims abstract description 43
- 230000004927 fusion Effects 0.000 title claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 32
- 238000007637 random forest analysis Methods 0.000 claims abstract description 28
- 238000013528 artificial neural network Methods 0.000 claims abstract description 21
- 238000010606 normalization Methods 0.000 claims abstract description 11
- 238000002790 cross-validation Methods 0.000 claims abstract description 7
- 230000007774 longterm Effects 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 13
- 238000003066 decision tree Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000012795 verification Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 claims description 2
- 238000013138 pruning Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 238000010200 validation analysis Methods 0.000 claims description 2
- 238000002759 z-score normalization Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000013450 outlier detection Methods 0.000 description 1
- 238000013082 photovoltaic technology Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的一种基于回归和时序融合的光伏发电功率预测方法及设备,包括收集多个光伏电站的历史发电数据及气象数据;使用多重插补方法处理数据中的缺失值,并进行数据归一化;结合随机森林、直方图梯度提升回归模型HGBR和深度神经网络DNN模型进行预测,随机森林用于处理非线性和高维数据,直方图梯度提升回归模型HGBR用于处理时间序列数据进行短期功率预测,深度神经网络DNN用于提取复杂特征;使用Stacking集成直方图梯度提升回归模型HGBR、深度神经网络DNN、随机森林的回归结果,利用Informer模型进行长期时序预测,使用Attention融合回归与时序预测的结果,以提高预测的准确性和效率;利用交叉验证和实际发电数据来调整和验证模型的准确性。
Description
技术领域
本发明涉及光伏发电预测技术领域,具体涉及一种基于回归和时序融合的光伏发电功率预测方法及设备。
背景技术
光伏发电作为一种清洁、可再生的能源,在全球范围内得到了迅速发展。随着光伏技术的不断进步和成本的降低,光伏发电的装机容量逐年增加,对电网的影响日益显著。然而,光伏发电具有高度的不确定性和可变性,主要因素包括太阳辐射的波动、气候条件的变化和设备的性能。因此,准确预测光伏发电功率成为电力系统运行和管理中的一个重要课题。
传统的光伏发电预测方法主要基于物理模型,例如气象模型和光伏系统的性能模型。这些方法依赖于精确的气象数据和设备参数,但在实际应用中面临数据获取困难、计算成本高、适应性差等问题。随着气候变化和环境复杂性的增加,这些传统方法在预测准确性和稳定性方面面临着挑战。
近年来,随着大数据技术和人工智能的发展,机器学习在光伏发电预测中显示出了巨大的潜力。机器学习方法能够处理大量的历史数据,从中学习模式和趋势,以预测未来的发电功率。这些方法不仅可以提高预测的准确性,还可以在数据缺失或不完整的情况下提供有效的预测。
机器学习在光伏发电预测中的应用包括多种算法,如人工神经网络(ANN)、支持向量机(SVM)、随机森林(RF)和深度学习等。这些算法具有处理复杂、非线性数据的能力,能够适应不同的气象条件和设备特性。此外,机器学习方法还可以结合传统的物理模型,提供更为准确和可靠的预测。
然而,机器学习方法在光伏发电预测中也面临着一些挑战。例如,模型的过度拟合、数据质量的影响、以及算法的透明度和可解释性。这些问题需要通过更精细的数据处理、模型优化和算法创新来解决。
综上所述,光伏发电功率预测技术正在从传统的物理模型向基于数据驱动的机器学习方法转变。这一转变为提高预测准确性、降低运营成本和优化电网管理提供了新的可能性,同时也带来了新的技术挑战。
发明内容
本发明提出的一种基于回归和时序融合的光伏发电功率预测方法、设备,可至少解决背景技术中的技术问题之一,此方法旨在解决传统光伏发电预测中存在的不准确性和不稳定性问题,提供更为精确和可靠的预测结果。
为实现上述目的,本发明采用了以下技术方案:
一种基于回归和时序融合的光伏发电功率预测方法,包括以下步骤,
步骤1,收集多个光伏电站的历史发电数据及气象数据;
步骤2,使用多重插补方法处理数据中的缺失值,并进行数据归一化;
步骤3,结合随机森林、直方图梯度提升回归模型HGBR和深度神经网络DNN模型进行预测,其中随机森林用于处理非线性和高维数据,直方图梯度提升回归模型HGBR用于处理时间序列数据进行短期功率预测,深度神经网络DNN用于提取复杂特征;使用Stacking集成直方图梯度提升回归模型HGBR、深度神经网络DNN、随机森林的回归结果;
步骤4,利用Informer模型进行长期时序预测,特别是在数据量大和序列长的情况下,以提高预测的准确性和效率;
步骤5,使用Attention融合回归与时序预测的结果;
步骤6,利用交叉验证和实际发电数据来调整和验证模型的准确性。
又一方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
再一方面,本发明还公开一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上方法的步骤。
由上述技术方案可知,本发明提供了一种基于时序预测和回归预测相结合的光伏发电功率预测方法,旨在提高发电功率预测的准确性和可靠性。该方法在发电功率预测中,设计了直方图梯度提升回归模型HGBR、深度神经网络DNN、随机森林模型处理之后,得到的结果进行stacking融合,然后再与原始输入数据经过Informer的时序预测模型得到的结果进行Attention融合得到最终结果。该方法具有高准确性、鲁棒性和自动特征选择的优点。其可解释性强,能够输出特征的重要性排序,助于理解哪些特征对预测结果有更大影响。这一技术的实施在发电功率预测方面取得了显著成效。
本发明的核心创新在于综合利用了多种先进的机器学习技术来解决光伏发电预测中的关键问题。这不仅提高了预测的准确性,也增强了模型的适应性和可靠性,对光伏发电领域的发展具有重要意义。
附图说明
图1为本发明实施例发电功率预测系统框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
如图1所示,本实施例所述的基于回归和时序融合的光伏发电功率预测方法,包括以下步骤,
步骤一,数据处理与特征工程:
本发明首先对收集到的光伏发电场站的历史功率数据、气象数据及相关时间数据进行处理。包括使用多重插补法处理数据中的缺失值,并对数据进行归一化。特征工程部分涉及提取与发电功率相关的时间、日期和季节信息,以及气象因素如温度、湿度等。
步骤二,预测模型的构建与应用;
本发明实施例结合随机森林、直方图梯度提升回归模型HGBR和深度神经网络DNN模型进行预测,其中随机森林用于处理非线性和高维数据,直方图梯度提升回归模型HGBR用于处理时间序列数据进行短期功率预测,深度神经网络DNN用于提取复杂特征;使用Stacking集成直方图梯度提升回归模型HGBR、深度神经网络DNN、随机森林的回归结果;再利用Informer模型进行长期时序预测,特别是在数据量大和序列长的情况下,以提高预测的准确性和效率;最后使用Attention融合回归与时序预测的结果。
步骤三,模型验证与优化;
通过使用实际功率输出数据对所构建的模型进行验证和调整,本发明进一步提升了预测模型的准确性和适应性。模型验证过程包括对比预测结果与实际数据,以及根据反馈调整模型参数。
以下分别具体说明:
步骤1,数据预处理,其中包含:
异常值处理:使用如箱线图等统计学方法识别数据中的异常值,针对不同种类的异常分别采取删除、用中位数或平均值替换等离群点检测算法进行处理。
缺失值处理:对于环境参数(如温度、湿度等),采用多重插补法进行处理。这些方法可以有效减少缺失数据对模型预测性能的影响;
引入损耗系数:考虑到设备性能会随着时间有一定损耗,本发明针对预测长时间发电功率这个特定问题设计了损耗系数特征,有效提高了模型性能。
特征工程:根据光伏发电的特点,提取与发电功率密切相关的时间序列特征;这些特征包括月份、日、小时、分钟、一天中的分钟数、一周中的天数、一年中的天数、星期几、时间段(使用独热编码表示)等。同时,考虑季节性因素,如季节、月初、月末、季度初、季度末及周末的标记。
数据归一化:对所有数值型特征进行归一化处理,以消除不同量级数据间的影响。常用的归一化方法包括最小-最大标准化和Z分数标准化。
步骤2,模型选择与训练,其中包含:
模型选择:采用直方图梯度提升回归(HGBR)、随机森林、深度神经网络(DNN),以及Informer模型。最后分别采用Attention融合、Stacking等策略来融合最终预测结果。其中随机森林用于处理非线性和高维数据,直方图梯度提升回归模型HGBR用于处理时间序列数据进行短期功率预测,深度神经网络DNN用于提取复杂特征;使用Stacking集成直方图梯度提升回归模型HGBR、深度神经网络DNN、随机森林的回归结果;利用Informer模型进行长期时序预测,特别是在数据量大和序列长的情况下,以提高预测的准确性和效率;
模型训练:使用预处理的数据集进行训练,对每个模型进行参数调整和优化。HGBR和随机森林模型通过分箱和直方图表示特征分布进行训练。Informer模型利用自注意力机制处理时间序列数据。DNN用于提取复杂特征。
在发电功率预测中,随机森林的构造过程如下:
①假如有N个样本,则有放回的随机选择个样本(每次随机选择一个样本,然后返回继续选择)。这选择好了的个样本用来训练一个决策树,作为决策树根节点处的样本。
②当每样本有M个属性时,在决策树的每个节点需要分裂时,随机以这M个属性中选取出m个属性,满足条m<M。然后以这m个属性中采用某种策略比如说信息增益)来选择1个属性作为该节点的分裂属性。
③决策树形成过程中每个节点都要按照步骤2分裂,如果下一次该节点选出来的那一个属性是刚刚其父节点分裂时用过的属性,则该节点已经达到了叶子节点,无须继续分裂。一直到不能够再分裂为止。注意整个决策树形成过程中没有进行剪枝。
④按照步骤①-③建立大量的决策树,这样就构成了随机森林。
Informer的训练过程:
Informer原理指的是一种基于自监督学习的方法,主要用于处理自然语言处理任务。其核心思想是通过对输入数据进行遮盖或替换,构建一个辅助任务并利用模型自身的预测能力来进行训练,从而获得更好的表示学习结果。
具体而言,Informer原理包括以下几个步骤:
①输入数据构建:将输入的序列数据进行切分,并进行时间序列的构建。
②遮盖或替换:在构建的时间窗口中,对其中的某些元素进行遮盖或替换,形成辅助任务。
③辅助任务的训练:将遮盖或替换后的时间窗口作为输入,通过模型的预测能力来恢复遮盖或替换的元素。这个过程可以使用自监督学习方法进行训练,比如使用对比学习或生成模型的方法。
④主任务的训练:在辅助任务的训练完成后,继续使用原始的序列数据进行主任务的训练。
在发电功率预测中,DNN的训练过程如下:
①加载数据:需要对数据进行加载、处理,创建数据加载器,可以将整块数据用数据加载器处理成小块形式,后续进行迭代循环,并输入到模型中进行训练。
②定义网络格式:随后定义自己的模型,并实例化,随后定义使用的损失函数、优化器。
③训练、验证和测试:训练之前需要注意设置随机固定的随机种子,保证可复现性。
参数调整和交叉验证:对每个模型的关键参数进行调整,如学习率、树的数量(HGBR和随机森林)、层数和头的数量(Informer),并使用交叉验证来评估模型的准确性和泛化能力。
需要注意的是,在发电功率模型得到预测结果后,本发明采用了三次样条插值(Cubic Spline Interpolation)的方法进行非预测点上采样,三次样条插值简称Spline插值,是通过一系列形值点的一条光滑曲线,数学上通过求解三弯矩方程组得出曲线函数组的过程。实际计算时还需要引入边界条件才能完成计算。
定义:设区间[a,b]上给定一个剖分:
为/>上满足下列条件的函数:
(1);
(2)在每个子区间/>上是三次多项式那么称/>为关于剖分/>的一个三次样条函数。如果再给定某个函数/>在剖分的节点上的函数值
,且满足插值条件。
(3)
那么称为/>在/>上关于剖分/>的三次样条插值函数;
本发明就是利用三次样条插值函数来对生成的预测数据进行相应的插值,最后数据量会增大到四倍(分辨率从1h变为15分钟)。
步骤3,模型评估与预测,其中包含:
评估指标:为了全面评估模型性能,采用了多种指标,如均方根误差(RMSE)、平均绝对误差(MAE)和R²分数等。这些指标可以全面反映模型在预测准确性和泛化能力方面的表现;
模型评估:使用验证集对模型进行评估,观察模型在不同指标下的表现。对于每个模型,特别关注其在预测未来发电功率方面的准确性和稳定性;
预测应用:在模型训练和评估完成后,使用模型进行实际的发电功率预测。这包括短期(未来几天)和长期(未来几个月)的预测。预测结果可以应用于发电站的运行管理,优化电力资源分配;
模型优化:根据评估结果对模型进行进一步的调整和优化,以提高预测的准确性。这可能包括参数调整、模型结构优化等。
本发明通过综合利用多种机器学习模型,设计了一种基于回归预测和时序预测相结合的预测方案,有效提升了光伏发电预测的准确性和可靠性。
以下举例说明:
本实施例为集中式,即一种区域场群中电站集群的发电功率预测方法,包括以下步骤:
步骤1,收集多个光伏电站的历史发电数据及气象数据;
步骤2,使用多重插补方法处理数据中的缺失值,并进行数据归一化;
步骤3,采用Stacking集成方法,结合随机森林、HGBR和深度神经网络(DNN)模型进行预测,其中随机森林用于处理非线性和高维数据,HGBR用于处理时间序列数据,DNN用于提取复杂特征;
步骤4,利用Informer模型进行长期时序预测,特别是在数据量大和序列长的情况下,以提高预测的准确性和效率;
步骤5,使用Attention融合回归与时序预测的结果;
步骤6,利用交叉验证和实际发电数据来调整和验证模型的准确性。
综上所述,为提高发电功率预测的准确性和可靠性。本发明实施例的方法在发电功率预测中,设计了直方图梯度提升回归模型HGBR、深度神经网络DNN、随机森林模型处理之后,得到的结果进行stacking融合,然后再与原始输入数据经过Informer的时序预测模型得到的结果进行Attention融合得到最终结果,该方法具有高准确性、鲁棒性和自动特征选择的优点。
又一方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
再一方面,本发明还公开一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上方法的步骤。
在本申请提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一基于回归和时序融合的光伏发电功率预测方法。
可理解的是,本发明实施例提供的系统与本发明实施例提供的方法相对应,相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。
本申请实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述基于回归和时序融合的光伏发电功率预测方法。
上述电子设备提到的通信总线可以是外设部件互连标准(英文:PeripheralComponent Interconnect,简称:PCI)总线或扩展工业标准结构(英文:Extended IndustryStandard Architecture,简称:EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(英文:Random Access Memory,简称:RAM),也可以包括非易失性存储器(英文:Non-Volatile Memory,简称:NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(英文:Central ProcessingUnit,简称:CPU)、网络处理器(英文:Network Processor,简称:NP)等;还可以是数字信号处理器(英文:Digital Signal Processing,简称:DSP)、专用集成电路(英文:ApplicationSpecific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field-Programmable Gate Array,简称:FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk (SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种基于回归和时序融合的光伏发电功率预测方法,其特征在于,包括以下步骤:
步骤1,收集多个光伏电站的历史功率数据、气象数据及相关时间数据;
步骤2,使用多重插补方法处理数据中的缺失值,并进行数据归一化;
步骤3,结合随机森林、直方图梯度提升回归模型HGBR和深度神经网络DNN模型进行预测,其中随机森林用于处理非线性和高维数据,直方图梯度提升回归模型HGBR用于处理时间序列数据进行短期功率预测,深度神经网络DNN用于提取复杂特征;使用Stacking集成直方图梯度提升回归模型HGBR、深度神经网络DNN、随机森林的回归结果;
步骤4,利用Informer模型进行长期时序的功率预测,以提高预测的准确性和效率;
步骤5,使用Attention融合回归与时序预测的结果;
步骤6,利用交叉验证和实际功率数据来调整和验证模型的准确性。
2.根据权利要求1所述的基于回归和时序融合的光伏发电功率预测方法,其特征在于:步骤2中的数据归一化即对所有数值型特征进行归一化处理,以消除不同量级数据间的影响,归一化方法包括最小-最大标准化和Z分数标准化。
3.根据权利要求1所述的基于回归和时序融合的光伏发电功率预测方法,其特征在于:步骤3还包括模型训练:使用预处理的数据集进行训练,对每个模型进行参数调整和优化;直方图梯度提升回归模型HGBR和随机森林模型通过分箱和直方图表示特征分布;Informer模型利用自注意力机制处理时间序列数据。
4.根据权利要求1所述的基于回归和时序融合的光伏发电功率预测方法,其特征在于:在发电功率预测中,随机森林的构造过程如下:
①假如有N个样本,则有放回的随机选择个样本即每次随机选择一个样本,然后返回继续选择;这选择好了的个样本用来训练一个决策树,作为决策树根节点处的样本;
②当每样本有M个属性时,在决策树的每个节点需要分裂时,随机以这M个属性中选取出m个属性,满足条m<M,然后以这m个属性中采用设定的策略来选择1个属性作为该节点的分裂属性;
③决策树形成过程中每个节点都要按照步骤②分裂,如果下一次该节点选出来的那一个属性是刚刚其父节点分裂时用过的属性,则该节点已经达到了叶子节点,无须继续分裂,一直到不能够再分裂为止,整个决策树形成过程中没有进行剪枝;
④按照步骤①-③建立大量的决策树,这样就构成了随机森林。
5.根据权利要求3所述的基于回归和时序融合的光伏发电功率预测方法,其特征在于:Informer模型的训练过程包括:
①输入数据构建:将输入的序列数据进行切分,并进行时间序列的构建;
②遮盖或替换:在构建的时间窗口中,对其中的指定元素进行遮盖或替换,形成辅助任务;
③辅助任务的训练:将遮盖或替换后的时间窗口作为输入,通过模型的预测能力来恢复遮盖或替换的元素;
④主任务的训练:在辅助任务的训练完成后,继续使用原始的序列数据进行主任务的训练。
6.根据权利要求3所述的基于回归和时序融合的光伏发电功率预测方法,其特征在于:在发电功率预测中,深度神经网络DNN的训练过程如下:
①加载数据:对数据进行加载、处理,创建数据加载器,将整块数据用数据加载器处理成小块形式,后续进行迭代循环,并输入到模型中进行训练;
②定义网络格式:随后定义自己的模型,并实例化,随后定义使用的损失函数、优化器;
③训练、验证和测试:训练之前设置随机固定的随机种子,保证可复现性;
参数调整和交叉验证:对每个模型的关键参数进行调整,包括学习率、树的数量、层数和头的数量,并使用交叉验证来评估模型的准确性和泛化能力。
7.根据权利要求1所述的基于回归和时序融合的光伏发电功率预测方法,其特征在于:还包括,在发电功率模型得到预测结果后,采用了三次样条插值的方法进行非预测点上采样,包括:
定义:设区间[a,b]上给定一个剖分:
为/>上满足下列条件的函数:
(1);
(2)在每个子区间/>上是三次多项式那么称/>为关于剖分/>的一个三次样条函数,如果再给定某个函数 />在剖分的节点上的函数值;
,且满足插值条件;
(3)
那么称为/>在/>上关于剖分/>的三次样条插值函数;
利用三次样条插值函数来对生成的预测数据进行相应的插值,最后数据量会增大到四倍。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410161173.5A CN117708716B (zh) | 2024-02-05 | 2024-02-05 | 基于回归和时序融合的光伏发电功率预测方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410161173.5A CN117708716B (zh) | 2024-02-05 | 2024-02-05 | 基于回归和时序融合的光伏发电功率预测方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117708716A CN117708716A (zh) | 2024-03-15 |
CN117708716B true CN117708716B (zh) | 2024-05-10 |
Family
ID=90146520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410161173.5A Active CN117708716B (zh) | 2024-02-05 | 2024-02-05 | 基于回归和时序融合的光伏发电功率预测方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117708716B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018013148A1 (en) * | 2016-07-15 | 2018-01-18 | University Of Connecticut | Systems and methods for outage prediction |
CN109784473A (zh) * | 2018-12-13 | 2019-05-21 | 天津大学 | 一种基于双时序特征学习的短期风功率预测方法 |
CN111815037A (zh) * | 2020-06-24 | 2020-10-23 | 河海大学 | 一种基于注意力机制的可解释性短临极端降雨预测方法 |
CN115618993A (zh) * | 2022-08-30 | 2023-01-17 | 国网山西省电力公司大同供电公司 | 一种基于时序数据预测技术的光伏发电功率智能预测方法 |
WO2023093774A1 (zh) * | 2021-11-26 | 2023-06-01 | 中国华能集团清洁能源技术研究院有限公司 | 基于深度学习的风电集群功率预测方法 |
CN116307246A (zh) * | 2023-04-10 | 2023-06-23 | 中南大学 | 一种基于lstm-cnn和icbam长短期特征提取的铝电解槽温预测方法 |
CN116345555A (zh) * | 2023-03-29 | 2023-06-27 | 国网河南省电力公司安阳供电公司 | 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法 |
CN117239731A (zh) * | 2023-09-21 | 2023-12-15 | 山东工商学院 | 基于混合模型的节假日短期电力负荷预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113128793A (zh) * | 2021-05-19 | 2021-07-16 | 中国南方电网有限责任公司 | 一种基于多源数据融合的光伏功率组合预测方法及系统 |
-
2024
- 2024-02-05 CN CN202410161173.5A patent/CN117708716B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018013148A1 (en) * | 2016-07-15 | 2018-01-18 | University Of Connecticut | Systems and methods for outage prediction |
CN109784473A (zh) * | 2018-12-13 | 2019-05-21 | 天津大学 | 一种基于双时序特征学习的短期风功率预测方法 |
CN111815037A (zh) * | 2020-06-24 | 2020-10-23 | 河海大学 | 一种基于注意力机制的可解释性短临极端降雨预测方法 |
WO2023093774A1 (zh) * | 2021-11-26 | 2023-06-01 | 中国华能集团清洁能源技术研究院有限公司 | 基于深度学习的风电集群功率预测方法 |
CN115618993A (zh) * | 2022-08-30 | 2023-01-17 | 国网山西省电力公司大同供电公司 | 一种基于时序数据预测技术的光伏发电功率智能预测方法 |
CN116345555A (zh) * | 2023-03-29 | 2023-06-27 | 国网河南省电力公司安阳供电公司 | 一种基于cnn-isca-lstm模型的短期光伏发电功率预测方法 |
CN116307246A (zh) * | 2023-04-10 | 2023-06-23 | 中南大学 | 一种基于lstm-cnn和icbam长短期特征提取的铝电解槽温预测方法 |
CN117239731A (zh) * | 2023-09-21 | 2023-12-15 | 山东工商学院 | 基于混合模型的节假日短期电力负荷预测方法 |
Non-Patent Citations (3)
Title |
---|
"A novel GBDT‑BiLSTM hybrid model on improving day‑ahead photovoltaic prediction";Senyao Wang;《nature》;20231231;第1-13页 * |
"Multi-timescale photovoltaic power forecasting using an improved Stacking ensemble algorithm based LSTM-Informer model";Yisheng Cao;《Energy》;20230808;第1-14页 * |
基于时间序列关系的GBRT交通事故预测模型;杨文忠;张志豪;吾守尔・斯拉木;温杰彬;富雅玲;王丽花;王婷;;电子科技大学学报;20200730(第04期);第137-143页 * |
Also Published As
Publication number | Publication date |
---|---|
CN117708716A (zh) | 2024-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hafeez et al. | Electric load forecasting based on deep learning and optimized by heuristic algorithm in smart grid | |
Chen et al. | Short-term wind speed predicting framework based on EEMD-GA-LSTM method under large scaled wind history | |
Tang et al. | Short‐term power load forecasting based on multi‐layer bidirectional recurrent neural network | |
CN112215442B (zh) | 电力系统短期负荷预测方法、系统、设备及介质 | |
CN116596044B (zh) | 基于多源数据的发电负荷预测模型训练方法及装置 | |
Torabi et al. | A new prediction model based on cascade NN for wind power prediction | |
CN114792156A (zh) | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 | |
Zhang et al. | A novel sequence to sequence data modelling based CNN-LSTM algorithm for three years ahead monthly peak load forecasting | |
Li et al. | Short term prediction of photovoltaic power based on FCM and CG-DBN combination | |
CN114676923A (zh) | 发电功率的预测方法、装置、计算机设备和存储介质 | |
CN114091361B (zh) | 基于气象事件的transformer模型构建方法 | |
Fan et al. | Multi-objective LSTM ensemble model for household short-term load forecasting | |
Inteha et al. | A data driven approach for day ahead short term load forecasting | |
Yu et al. | A novel short-term electrical load forecasting framework with intelligent feature engineering | |
Liu et al. | Short-term wind power forecasting based on multivariate/multi-step LSTM with temporal feature attention mechanism | |
Abdoos et al. | An intelligent hybrid method based on Monte Carlo simulation for short-term probabilistic wind power prediction | |
Sang et al. | Ensembles of gradient boosting recurrent neural network for time series data prediction | |
CN111697560B (zh) | 一种基于lstm预测电力系统负荷的方法及系统 | |
CN117708716B (zh) | 基于回归和时序融合的光伏发电功率预测方法及设备 | |
Yang et al. | Short‐Term Demand Forecasting Method in Power Markets Based on the KSVM–TCN–GBRT | |
Irankhah et al. | A parallel CNN-BiGRU network for short-term load forecasting in demand-side management | |
CN115271242A (zh) | 光伏发电功率预测模型的训练方法、预测方法、装置 | |
CN114492945A (zh) | 电力市场背景下的短期光伏功率预测方法、介质及设备 | |
CN113723670A (zh) | 变时间窗口的光伏发电功率短期预测方法 | |
Wang et al. | Short-term probability density function forecasting of industrial loads based on ConvLSTM-MDN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |