CN116933037A - 一种基于多模型融合的光伏出力预测方法及相关装置 - Google Patents
一种基于多模型融合的光伏出力预测方法及相关装置 Download PDFInfo
- Publication number
- CN116933037A CN116933037A CN202311059270.5A CN202311059270A CN116933037A CN 116933037 A CN116933037 A CN 116933037A CN 202311059270 A CN202311059270 A CN 202311059270A CN 116933037 A CN116933037 A CN 116933037A
- Authority
- CN
- China
- Prior art keywords
- prediction
- model
- data
- photovoltaic output
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000004927 fusion Effects 0.000 title claims abstract description 30
- 238000004458 analytical method Methods 0.000 claims abstract description 33
- 238000007637 random forest analysis Methods 0.000 claims abstract description 17
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 29
- 238000012549 training Methods 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 5
- 238000003066 decision tree Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 5
- 238000010248 power generation Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000031877 prophase Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Economics (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于多模型融合的光伏出力预测方法及相关装置,方法包括:采用随机森林算法在多个候选预测指标中选取优选预测指标,每个优选预测指标包括特征贡献度;通过预置Stacking集成模型中的第一层数据预测模型对输入的优选预测指标进行基于特征贡献度的特征预测分析,得到预测指标数据,第一层数据预测模型包括多个基学习器;采用预置Stacking集成模型中的第二层出力预测模型根据预测指标数据进行光伏出力预测分析,得到光伏出力预测结果。本申请能够解决现有模型单一,且准确率较低,导致应用场景受限且预测效果较差的技术问题。
Description
技术领域
本申请涉及电力系统技术领域,尤其涉及一种基于多模型融合的光伏出力预测方法及相关装置。
背景技术
光伏发电目前存在发电效率低、建设成本高、受环境因素影响大等问题,因此很多光伏项目在建成后的运行过程中也并不能带来它应有的成果与收益。要解决这些问题必须在光伏项目建设前做好前期的建设规划,在建设完成后做好运行过程中的运营维护。其中研究光伏出力结果是光伏发电项目成果与收益预测、运营维护数据参考的重要环节。
目前国内外光伏预测技术主要依托环境气候、光伏材料、历史数据、类似项目参考等进行预测。例如早期的光伏预测主要考虑光伏发电系统的历史发电量建立预测模型,该模式适用于缺少气象、辐照数据,历史运行数据较容易获得。随着时间的推移后续陆续出现基于地基云图、基于人工神经网络、基于支持向量机的预测模型等方法。但是,目前的预测技术模型单一,所以应用场景较为局限;而且预测准确率较低,无法满足大体量光伏出力的预测分析。
发明内容
本申请提供了一种基于多模型融合的光伏出力预测方法及相关装置,用于解决现有模型单一,且准确率较低,导致应用场景受限且预测效果较差的技术问题。
有鉴于此,本申请第一方面提供了一种基于多模型融合的光伏出力预测方法,包括:
采用随机森林算法在多个候选预测指标中选取优选预测指标,每个所述优选预测指标包括特征贡献度;
通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,所述第一层数据预测模型包括多个基学习器;
采用所述预置Stacking集成模型中的第二层出力预测模型根据所述预测指标数据进行光伏出力预测分析,得到光伏出力预测结果。
优选地,所述通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,之前还包括:
计算所有候选模型误差的Pearson相关系数,得到误差差异度;
基于所述误差差异度在所有所述候选模型中选取第一层数据预测模型,所述第一层数据预测模型包括XGBoost、LSTM、GBDT、RF、KNN、SVM。
优选地,所述通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,之前还包括:
基于XGBoost框架和改进目标函数构建第二层出力预测模型,所述改进目标函数基于叶节点进行迭代计算。
优选地,所述通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,之前还包括:
通过获取的天气数据和历史数据构建初始数据集;
按照时间维度将所述初始数据集划分为多个不同子数据集,所述子数据集包括训练数据集和测试数据集;
通过所述训练数据集对初始Stacking集成模型进行预测训练,得到预置Stacking集成模型。
本申请第二方面提供了一种基于多模型融合的光伏出力预测装置,包括:
指标选取单元,用于采用随机森林算法在多个候选预测指标中选取优选预测指标,每个所述优选预测指标包括特征贡献度;
指标分析单元,用于通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,所述第一层数据预测模型包括多个基学习器;
出力预测单元,用于采用所述预置Stacking集成模型中的第二层出力预测模型根据所述预测指标数据进行光伏出力预测分析,得到光伏出力预测结果。
优选地,还包括:
差异计算单元,用于计算所有候选模型误差的Pearson相关系数,得到误差差异度;
模型选取单元,用于基于所述误差差异度在所有所述候选模型中选取第一层数据预测模型,所述第一层数据预测模型包括XGBoost、LSTM、GBDT、RF、KNN、SVM。
优选地,还包括:
模型构建单元,用于基于XGBoost框架和改进目标函数构建第二层出力预测模型,所述改进目标函数基于叶节点进行迭代计算。
优选地,还包括:
数据获取单元,用于通过获取的天气数据和历史数据构建初始数据集;
数据划分单元,用于按照时间维度将所述初始数据集划分为多个不同子数据集,所述子数据集包括训练数据集和测试数据集;
预测训练单元,用于通过所述训练数据集对初始Stacking集成模型进行预测训练,得到预置Stacking集成模型。
本申请第三方面提供了一种基于多模型融合的光伏出力预测设备,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行第一方面所述的基于多模型融合的光伏出力预测方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行第一方面所述的基于多模型融合的光伏出力预测方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,提供了一种基于多模型融合的光伏出力预测方法,包括:采用随机森林算法在多个候选预测指标中选取优选预测指标,每个优选预测指标包括特征贡献度;通过预置Stacking集成模型中的第一层数据预测模型对输入的优选预测指标进行基于特征贡献度的特征预测分析,得到预测指标数据,第一层数据预测模型包括多个基学习器;采用预置Stacking集成模型中的第二层出力预测模型根据预测指标数据进行光伏出力预测分析,得到光伏出力预测结果。
本申请提供的基于多模型融合的光伏出力预测方法,基于Stacking集成学习方式构建预置Stacking集成模型,两层模型中包含了多个学习器,特别是第一层数据预测模型,对输入优选预测指标进行基于特征贡献度的特征预测分析,能够增强第一层数据预测模型中基学习器对数据信息的感知学习能力,进而提高后续的光伏出力预测结果的准确性;而且,不同的基学习器对数据特征分析的侧重点不同,可以兼容多种场景数据的变化特性,确保预测结果的可靠性。因此,本申请能够解决现有模型单一,且准确率较低,导致应用场景受限且预测效果较差的技术问题。
附图说明
图1为本申请实施例提供的一种基于多模型融合的光伏出力预测方法的流程示意图;
图2为本申请实施例提供的一种基于多模型融合的光伏出力预测装置的结构示意图;
图3为本申请实施例提供的预测指标的特征重要度列表示意图;
图4为本申请实施例提供的太阳辐射强度和表面温度对光伏出力的影响分布图;
图5为本申请实施例提供的预置Stacking集成模型数据分析框架示意图;
图6为本申请应用例提供的在平稳天气下的光伏出力预测结果波形图;
图7为本申请应用例提供的在突变天气下的光伏出力预测结果波形图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的一种基于多模型融合的光伏出力预测方法的实施例,包括:
步骤101、采用随机森林算法在多个候选预测指标中选取优选预测指标,每个优选预测指标包括特征贡献度。
需要说明的是,本实施例中的预测指标是指能够影响光伏出力的一些因素,主要可以划分为天气类数据和历史真实功率数据;其中天气类数据是从数值天气预报获取的,包括并不限于湿度、气压、空气密度、表面密度、太阳辐射强度、平均露点、低云覆盖率、中云覆盖率和高云覆盖率等。历史真实功率数据则为预测目标时刻前面24个时刻的历史光伏真实出力。
请参阅图3,每个预测指标相对于光伏出力而言都有其对应的特征贡献度,也称作特征重要度;其中,太阳辐射强度、表面温度、低云覆盖率、中云覆盖率和高云覆盖率是对光伏预测影响较大的天气因素;与预测时刻相邻越近的时刻的历史光伏数据对预测目标的影响越大。
采用随机森林算法可以对勾选预测指标进行特征选择的有效性分析,将对预测影响最大的变量与光伏出力的关联性进行分析。请参阅图4,当辐照强度越大时,光伏的输出功率越大,二者呈线性相关的关系;在0℃到25℃区间,光伏出力较为平稳,当温度过高或过低时,光伏的输出功率呈下降趋势。由此可见,辐照度与温度对光伏出力的预测准确性有着较大影响,也侧面验证了本实施例中指标选择的有效性。考虑到本实施例是进行分布式光伏预测,选择相对较少且相关性较强的指标能够有效减少模型训练周期。
步骤102、通过预置Stacking集成模型中的第一层数据预测模型对输入的优选预测指标进行基于特征贡献度的特征预测分析,得到预测指标数据,第一层数据预测模型包括多个基学习器。
进一步地,步骤102,之前还包括:
计算所有候选模型误差的Pearson相关系数,得到误差差异度;
基于误差差异度在所有候选模型中选取第一层数据预测模型,第一层数据预测模型包括XGBoost、LSTM、GBDT、RF、KNN、SVM。
进一步地,步骤102,之前还包括:
基于XGBoost框架和改进目标函数构建第二层出力预测模型,改进目标函数基于叶节点进行迭代计算。
进一步地,步骤102,之前还包括:
通过获取的天气数据和历史数据构建初始数据集;
按照时间维度将初始数据集划分为多个不同子数据集,子数据集包括训练数据集和测试数据集;
通过训练数据集对初始Stacking集成模型进行预测训练,得到预置Stacking集成模型。
需要说明的是,本实施例构建的预置Stacking集成模型包括第一层数据预测模型和第二层出力预测模型;第一层数据预测模型包括多个基学习器,第二层出力预测模型包括一个元学习器;每个基学习器和元学习器都是一种类型的模型,包括且不限于XGBoost、LSTM、GBDT、RF、KNN、SVM。其中,随机森林(random forest,RF)和梯度提升决策树(gradientboosted decision tree,GBDT)分别采用Bagging和Boosting的集成学习方式,有着较强的学习能力与严谨数学理论支撑,可以用于不同场景的光伏出力预测任务中。支持向量机(support vector machine,SVM)对于解决小样本、非线性及高维度的回归问题则具有较为明显的优势。KNN的理论成熟、训练高效,可以提升模型的高效性和可靠性。
XGBoost算法作为有监督的集成学习算法,可理解为多棵决策树的求和模型,其计算式为:
其中,xi分别为第i个样本和对应的模型预测值,/>为关于样本xi的函数,k为决策树的棵数,n为总棵数,fk为函数空间F的独立函数,函数空间由决策树构成,fk(xi)表示第k棵树对样本的预测值。
XGBoost算法理论目标函数可分为两部分:损失误差函数及正则项。损失误差函数描述预测值与真实值之间的差值,正则项Ω(fk)控制决策树的复杂度,防止过拟合,理论目标函数表达为:
其中,为目标函数;T为决策树个数;γ为T的惩罚系数;λ为正则化惩罚项系数,ω为叶子权重。本实施例考虑到目标函数的优化参数是模型,不能用传统的优化方法在欧氏空间进行优化,故在模型训练时,将其理解为一种加法方式,将正则项Ω(fk)公式展开,此时需要学习的是函数,将已经学习的决策树固定,每轮向其中添加一棵新的决策树,最小化目标函数,具体表达为:
其中,为第t步获取到的预测值,每一轮加入新的决策树函数即为fk(xi),以最大化降低目标函数,所以第t轮目标函数为:
其中,
其中,gi表示损失函数的一阶导数,hi表示损失函数的二阶导数,fi为第i个样本预测值。
求解之后将关于决策树模型的迭代过程转化为关于树的叶节点的迭代过程。求出最优叶节点分数:
其中,为叶节点分数,Ij为当前节点的实例集,所以改进目标函数表达为:
其中,q为树的增益状况。
在基于XGBoost算法创建决策树之后,可以利用特征工程直接进行特征提取,并计算权重和增益两个指标,用于特征选择。其中,权重指某特征在整个树集合的节点中出现的次数,而增益则表示某特征在整个树集合中作为分裂节点所带来的信息增益之和,再除以某特征出现的频次。这种特征选择方法可以有效地剔除无用特征,减少模型复杂度,提高模型的泛化能力和预测准确度。同时,该方法具有计算速度快、可扩展性强等优点。
另外,为了获取最优预测结果,本实施例在预置Stacking集成模型的第一层数据预测模型的基学习器的选取过程中引入了Pearson相关系数的计算,通过计算模型误差的相关系数,从而选取差异度较大的模型作为学习器,这样可以得到不同的算法模型在不同的数据空间角度和数据结构角度进行数据分析,且各个模型之间可以取长补短。具体的Pearson相关系数计算过程可以表达为:
其中,xi、yi分别表示两个变量在样本中的观测值,分别表示各个误差元素的平均值,m为样本数量。
请参阅图5,在模型训练阶段,为了防止数据被模型重复学习,进而产生过拟合现象,本实施例基于时序维度将获取到的初始数据集划分为多个子数据集,例如6个,从而保证每一块数据ID互不重叠,对于单一基学习器,使用1个子数据集作为验证数据集,其他的则可以作为训练数据集和测试数据集。由于本实施例的第一层数据预测模型包括XGBoost、LSTM、GBDT、RF、KNN、SVM6个基学习器,所以可以输出6个数据预测结果,即预测指标数据,数据形式也是集合,即新的数据集合;而且新的数据集合与原始数据集和大小相同,所以经过第一层数据预测模型进行分析处理的实质是实现了特征变换。
步骤103、采用预置Stacking集成模型中的第二层出力预测模型根据预测指标数据进行光伏出力预测分析,得到光伏出力预测结果。
预置Stacking集成模型是经过训练得到的优化模型,可以直接用于实际的光伏出力预测任务中,根据第一层数据预测模型预测得到的预测指标数据进行特征分析,从而输出光伏出力预测结果。
请参阅图6,在平稳天气时,本实施例所提方案能够较为准确的预测光伏出力情况,在光伏出力上升时段7时至11时、光伏出力最大时段12时至14时及下降时段15时至18时,预测与实际值存在细微误差;所选日期RMSE为0.085。
请参阅图7,在突变较大天气时,相较于平稳天气光伏系统出力随机性更强,深度学习算法能够良好地预测光伏出力走势,但是细节处理不到位。图7在11时至16时该时段出现雷阵雨天气,降雨、云量信息均变化明显,光伏功率在0.6MW至2MW之间反复突变,导致预测值与实际值偏差较大;所选日期RMSE为0.2059。由此可见,当天气突变较大时预测结果与实际结果误差较大,并更倾向于较为保守的平均值。
本申请实施例提供的基于多模型融合的光伏出力预测方法,基于Stacking集成学习方式构建预置Stacking集成模型,两层模型中包含了多个学习器,特别是第一层数据预测模型,对输入优选预测指标进行基于特征贡献度的特征预测分析,能够增强第一层数据预测模型中基学习器对数据信息的感知学习能力,进而提高后续的光伏出力预测结果的准确性;而且,不同的基学习器对数据特征分析的侧重点不同,可以兼容多种场景数据的变化特性,确保预测结果的可靠性。因此,本申请实施例能够解决现有模型单一,且准确率较低,导致应用场景受限且预测效果较差的技术问题。
为了便于理解,请参阅图2,本申请提供了一种基于多模型融合的光伏出力预测装置的实施例,包括:
指标选取单元201,用于采用随机森林算法在多个候选预测指标中选取优选预测指标,每个优选预测指标包括特征贡献度;
指标分析单元202,用于通过预置Stacking集成模型中的第一层数据预测模型对输入的优选预测指标进行基于特征贡献度的特征预测分析,得到预测指标数据,第一层数据预测模型包括多个基学习器;
出力预测单元203,用于采用预置Stacking集成模型中的第二层出力预测模型根据预测指标数据进行光伏出力预测分析,得到光伏出力预测结果。
进一步地,还包括:
差异计算单元204,用于计算所有候选模型误差的Pearson相关系数,得到误差差异度;
模型选取单元205,用于基于误差差异度在所有候选模型中选取第一层数据预测模型,第一层数据预测模型包括XGBoost、LSTM、GBDT、RF、KNN、SVM。
进一步地,还包括:
模型构建单元206,用于基于XGBoost框架和改进目标函数构建第二层出力预测模型,改进目标函数基于叶节点进行迭代计算。
进一步地,还包括:
数据获取单元207,用于通过获取的天气数据和历史数据构建初始数据集;
数据划分单元208,用于按照时间维度将初始数据集划分为多个不同子数据集,子数据集包括训练数据集和测试数据集;
预测训练单元209,用于通过训练数据集对初始Stacking集成模型进行预测训练,得到预置Stacking集成模型。
本申请还提供了一种基于多模型融合的光伏出力预测设备,设备包括处理器以及存储器;
存储器用于存储程序代码,并将程序代码传输给处理器;
处理器用于根据程序代码中的指令执行上述方法实施例中的基于多模型融合的光伏出力预测方法。
本申请还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行上述方法实施例中的基于多模型融合的光伏出力预测方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种基于多模型融合的光伏出力预测方法,其特征在于,包括:
采用随机森林算法在多个候选预测指标中选取优选预测指标,每个所述优选预测指标包括特征贡献度;
通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,所述第一层数据预测模型包括多个基学习器;
采用所述预置Stacking集成模型中的第二层出力预测模型根据所述预测指标数据进行光伏出力预测分析,得到光伏出力预测结果。
2.根据权利要求1所述的基于多模型融合的光伏出力预测方法,其特征在于,所述通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,之前还包括:
计算所有候选模型误差的Pearson相关系数,得到误差差异度;
基于所述误差差异度在所有所述候选模型中选取第一层数据预测模型,所述第一层数据预测模型包括XGBoost、LSTM、GBDT、RF、KNN、SVM。
3.根据权利要求2所述的基于多模型融合的光伏出力预测方法,其特征在于,所述通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,之前还包括:
基于XGBoost框架和改进目标函数构建第二层出力预测模型,所述改进目标函数基于叶节点进行迭代计算。
4.根据权利要求3所述的基于多模型融合的光伏出力预测方法,其特征在于,所述通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,之前还包括:
通过获取的天气数据和历史数据构建初始数据集;
按照时间维度将所述初始数据集划分为多个不同子数据集,所述子数据集包括训练数据集和测试数据集;
通过所述训练数据集对初始Stacking集成模型进行预测训练,得到预置Stacking集成模型。
5.一种基于多模型融合的光伏出力预测装置,其特征在于,包括:
指标选取单元,用于采用随机森林算法在多个候选预测指标中选取优选预测指标,每个所述优选预测指标包括特征贡献度;
指标分析单元,用于通过预置Stacking集成模型中的第一层数据预测模型对输入的所述优选预测指标进行基于所述特征贡献度的特征预测分析,得到预测指标数据,所述第一层数据预测模型包括多个基学习器;
出力预测单元,用于采用所述预置Stacking集成模型中的第二层出力预测模型根据所述预测指标数据进行光伏出力预测分析,得到光伏出力预测结果。
6.根据权利要求5所述的基于多模型融合的光伏出力预测装置,其特征在于,还包括:
差异计算单元,用于计算所有候选模型误差的Pearson相关系数,得到误差差异度;
模型选取单元,用于基于所述误差差异度在所有所述候选模型中选取第一层数据预测模型,所述第一层数据预测模型包括XGBoost、LSTM、GBDT、RF、KNN、SVM。
7.根据权利要求6所述的基于多模型融合的光伏出力预测装置,其特征在于,还包括:
模型构建单元,用于基于XGBoost框架和改进目标函数构建第二层出力预测模型,所述改进目标函数基于叶节点进行迭代计算。
8.根据权利要求7所述的基于多模型融合的光伏出力预测装置,其特征在于,还包括:
数据获取单元,用于通过获取的天气数据和历史数据构建初始数据集;
数据划分单元,用于按照时间维度将所述初始数据集划分为多个不同子数据集,所述子数据集包括训练数据集和测试数据集;
预测训练单元,用于通过所述训练数据集对初始Stacking集成模型进行预测训练,得到预置Stacking集成模型。
9.一种基于多模型融合的光伏出力预测设备,其特征在于,所述设备包括处理器以及存储器;
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令执行权利要求1-4任一项所述的基于多模型融合的光伏出力预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-4任一项所述的基于多模型融合的光伏出力预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311059270.5A CN116933037A (zh) | 2023-08-21 | 2023-08-21 | 一种基于多模型融合的光伏出力预测方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311059270.5A CN116933037A (zh) | 2023-08-21 | 2023-08-21 | 一种基于多模型融合的光伏出力预测方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116933037A true CN116933037A (zh) | 2023-10-24 |
Family
ID=88394197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311059270.5A Pending CN116933037A (zh) | 2023-08-21 | 2023-08-21 | 一种基于多模型融合的光伏出力预测方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116933037A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117522626A (zh) * | 2023-11-15 | 2024-02-06 | 河北大学 | 一种基于特征选择与异多模型融合光伏出力预测方法 |
-
2023
- 2023-08-21 CN CN202311059270.5A patent/CN116933037A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117522626A (zh) * | 2023-11-15 | 2024-02-06 | 河北大学 | 一种基于特征选择与异多模型融合光伏出力预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Temperature Forecasting via Convolutional Recurrent Neural Networks Based on Time‐Series Data | |
US20210133536A1 (en) | Load prediction method and apparatus based on neural network | |
Liu et al. | Short-term predictions of multiple wind turbine power outputs based on deep neural networks with transfer learning | |
CN110969290A (zh) | 一种基于深度学习的径流概率预测方法及系统 | |
CN111539841A (zh) | 电量预测方法、装置、设备及可读存储介质 | |
CN116933037A (zh) | 一种基于多模型融合的光伏出力预测方法及相关装置 | |
CN114676923A (zh) | 发电功率的预测方法、装置、计算机设备和存储介质 | |
Porteiro et al. | Short term load forecasting of industrial electricity using machine learning | |
CN110738363B (zh) | 一种光伏发电功率预测方法 | |
CN115034426B (zh) | 一种基于相空间重构与多模型融合Stacking集成学习方式的滚动负荷预测方法 | |
CN118036822A (zh) | 电氢一体化能源站的电氢负荷预测方法、装置及存储介质 | |
Abdelaziz et al. | Convolutional neural network with genetic algorithm for predicting energy consumption in public buildings | |
CN114444821A (zh) | 面向电力物联网的集成学习负荷预测方法、系统及介质 | |
JP2020091171A (ja) | 気象予測システム、気象予測方法、および気象予測プログラム | |
Sharma et al. | Deep Learning Based Prediction Of Weather Using Hybrid_stacked Bi-Long Short Term Memory | |
Qin et al. | A hybrid deep learning model for short‐term load forecasting of distribution networks integrating the channel attention mechanism | |
ȚIBOACĂ et al. | Design of short-term wind production forecasting model using machine learning algorithms | |
CN116245259A (zh) | 基于深度特征选择的光伏发电预测方法、装置和电子设备 | |
CN112465195A (zh) | 考虑高比例分布式光伏接入的母线负荷预测方法及系统 | |
CN112183814A (zh) | 一种短期风速预测方法 | |
Li et al. | Medium-and Long-Term Power Generation Forecast Based on Climate Characterisation and Improved XGBoost Algorithm | |
Jannah et al. | Comparative Analysis of MLP and CNN-LSTM Models for Solar Power Generation Forecasting | |
Jang et al. | Comparative Analysis of Deep Learning Techniques for Load Forecasting in Power Systems Using Single‐Layer and Hybrid Models | |
Keisler et al. | Automated Deep Learning for Load Forecasting | |
Li et al. | An artificial intelligence-based fusion method for wind power prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |