CN113627070A - 一种短期光伏功率预测方法 - Google Patents
一种短期光伏功率预测方法 Download PDFInfo
- Publication number
- CN113627070A CN113627070A CN202110565656.8A CN202110565656A CN113627070A CN 113627070 A CN113627070 A CN 113627070A CN 202110565656 A CN202110565656 A CN 202110565656A CN 113627070 A CN113627070 A CN 113627070A
- Authority
- CN
- China
- Prior art keywords
- model
- photovoltaic power
- data
- cnn
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 18
- 230000007613 environmental effect Effects 0.000 claims abstract description 12
- 238000010606 normalization Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000003066 decision tree Methods 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 16
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 12
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 10
- 230000003068 static effect Effects 0.000 claims description 8
- 210000002569 neuron Anatomy 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 5
- 150000001875 compounds Chemical class 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 9
- 238000012795 verification Methods 0.000 abstract description 4
- 238000012360 testing method Methods 0.000 abstract description 3
- 238000004140 cleaning Methods 0.000 abstract 1
- 238000013527 convolutional neural network Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002015 leaf growth Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/06—Power analysis or power optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Human Resources & Organizations (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种短期光伏功率预测方法,主要包括数据预处理、模型训练和模型预测三个部分。在数据预处理阶段,收集历史环境和历史光伏功率数据,对数据进行数据清洗和归一化等预处理;在模型训练阶段,首先搭建CNN‑LSTM模型(模型一),其次,搭建LightGBM模型(模型二),使用训练集和验证集对模型一和模型二进行单独训练和验证;在模型预测阶段,使用模型一和模型二对测试集进行并行预测,通过MAPE‑RW算法对模型一和模型二进行线性组合,构成最终的组合预测模型。本发明采用短期光伏功率预测模型,考虑天气、温度、压力、湿度等各类环境因素,有效提取数据的局部特征和时序特征,能够实现对光伏功率的精准预测。
Description
技术领域
本发明涉及短期光伏功率预测技术领域,具体涉及一种短期光伏功率预测方法。
背景技术
随着经济的不断发展,人类对能源的需求越来越大,能源问题也越来越严重。太阳能成 为发展最为迅速的绿色能源之一,光伏发电成为太阳能开发的重要方式。因此,光伏功率的 精准预测对电网稳定经济运行具有重要意义,做好光伏功率预测的工作能够降低运行成本, 优化电网调度,便于电网管理,进而实现调度的经济合理性。
预测的方法主要有传统的统计学方法和基于机器学习的预测方法。其中,统计学方法主 要有多元线性回归(MLR)、时间序列分析法和卡尔曼滤波法等,这类方法原理与建模简单, 但当数据样本容量较大时,预测效果不明显。另一类方法则基于机器学习算法,例如灰色系 统、人工神经网络、支持向量机(SVM)以及高斯过程(GP)等。其中,反向传播(BP)神经网络和SVM的应用最为广泛。但上述方法缺少对时间序列相关性的考虑,并且当训练样本较多时存在无法有效收敛的问题。
近年来,以长记忆(LSTM)网络为代表的深度学习算法在短期光伏功率预测领域取得 了较好的应用,LSTM网络可以充分挖掘时序数据之间的内在关联,但当特征为非连续数据 时,预测精度不高。此外,梯度提升机(GBM)模型的相关改进算法也对回归预测问题有着不错的效果,例如极端梯度提升机(XGBoost)以及轻梯度提升机(LightGBM)等,它们具 有训练速度快、内存占用低等优点,但缺乏对时间序列的整体感知能力。
发明内容
本发明的目的是为了提高光伏功率预测的精度,在考虑天气、温度、压力、湿度、历史 光伏功率数据等因素的基础上提出了一种短期光伏功率预测方法,利用深度学习和数据挖掘 技术,构建了CNN-LSTM-LightGBM短期光伏功率组合预测模型,在经过预处理的数据集上 实现光伏功率的精准预测。
为解决上述技术问题,本发明采用的技术方案为:
一种短期光伏功率预测方法,包括如下步骤:
步骤(1)、利用环境数据和光伏系统运行的历史功率数据,提取出不同时刻的环境数据 和光伏功率的作为特征数据,并对非数字特征进行one-hot独热编码,然后对所有数据的特征 进行归一化处理;
步骤(2)、分别构建用于光伏功率预测的CNN-LSTM模型和LightGBM决策树模型,并利用步骤1归一化处理后的数据分别对构建好的CNN-LSTM模型和LightGBM决策树模型进行训练。其中,CNN-LSTM网络和LightGBM决策树模型的输入为由预测点时刻的环境特征 数据和预测点前一天同时刻的光伏功率值构成的特征向量,输出为预测点时刻的光伏功率预测值。
步骤(3)、在两个模型并行完成训练后,利用训练好的CNN-LSTM网络和LightGBM决策树模型对步骤1归一化处理后的数据进行预测并计算每个模型对应光伏功率预测值的MAPE值的比例作为权重初值,并结合双向搜索方法进行优化获得最优权重。
步骤(4)、实时获取预测点时刻的环境特征数据和预测点前一天同时刻的光伏功率值并 利用步骤1方法进行处理后作为训练好的CNN-LSTM模型和LightGBM决策树模型的输入, 得到两个模型的光伏功率预测值,分别表示为和t为预测点时刻,再结合步骤3得到 的最优权重获得最终的光伏功率预测值。
进一步地,所述步骤1中,还包括对历史功率数据的预处理步骤,具体为:
采用聚类的方式,取相似度最大的三日数据对应时刻的光伏功率值的均值填补空缺数据。 其中,聚类的特征包括天气、温度、电压、电流等。
检查历史功率数据的平稳性,并采用前一天同一时刻的值填补极端数据。
进一步地,所述步骤2中,特征向量至少包括:预测点时刻的天气、预测点时刻的压力、 预测点时刻的温度、预测点时刻的湿度、预测点前一天同时刻的光伏功率值等。
进一步地,所述CNN-LSTM模型包括CNN网络和LSTM网络,其中,所述CNN网络 用于提取输入的特征向量的静态特征,具体表示:
式中:xt为t时刻的输入特征向量;ωj为卷积核权重矩阵;b为偏差值;k为卷积核个数。
所述CNN网络用于根据CNN网络提取的静态特征学习时间序列长依赖信息并输出光伏 功率预测值。其中,所述LSTM隐藏层层数为2,且神经元个数分别为128和64。
进一步地,所述步骤2中,所述LightGBM模型采用梯度提升方法进行训练,采用网格 搜索法优化LightGBM模型的超参数。
进一步地,利用训练好的CNN-LSTM模型和LightGBM决策树模型对步骤1归一化处理 后的数据进行预测并计算每个模型对应光伏功率预测值的MAPE值的比例作为权重初值,具 体为:
计算对应光伏功率预测值的MAPE值:
计算MAPE值的比例作为权重初值:
式中,ω1和ω2分别为CNN-LSTM模型和LightGBM模型的权重初值。
进一步地,所述步骤4中,结合步骤3得到的最优权重获得最终的光伏功率预测值,具 体为:
ωCNN-LSTM和ωLightGBM分别为CNN-LSTM模型和LightGBM模型的最优权重值,yt,c为组合模型的光伏功率预测值。
优选的,所述CNN-LSTM模型和所述LightGBM模型均采用python语言实现,基于CNN-LSTM的短期光伏功率预测模型使用Keras深度学习库实现,基于LightGBM的短期光 伏功率预测模型使用lightgbm机器学习库实现。
本发明的有益技术效果:
1.本发明提出了一种短期光伏功率预测方法,设计了相应的光伏功率预测模型,该模型 由CNN-LSTM网络与LightGBM模型组合而成。针对LSTM网络训练速度慢的缺点,添加了局部特征预提取模块,由卷积神经网络结构对局部特征进行预提取,是处理长期时序数据 问题的理想模型。
2.本发明提供的CNN-LSTM-LightGBM短期光伏功率预测方法,基于CNN-LSTM的短期光伏功率预测模型,并结合误差反向传播法则实现对参数的最优化求解,且考虑到单一预 测模型在预测性能上的不足,同时构建基于决策树梯度提升方法LightGBM的短期光伏功率 预测模型,借鉴boosting集成学习的思想,提升预测准确度。
3.本发明提供的CNN-LSTM-LightGBM短期光伏功率预测方法,利用平均绝对百分误差 MAPE评价指标比较LSTM与LGBM的预测精度,MAPE评价指标是统计领域中衡量模型预测准确度的常用指标,它不仅考虑预测值与真实值的误差,还考虑了误差与真实值之间的比 例。使用MAPE-RW算法对模型进行组合,得到模型最优权重值,使组合模型相对单独的模型而言都有效提高了预测精度。
附图说明
图1为模型流程图;
图2为CNN网络结构;
图3为LSTM网络结构;
具体实施方式
为使本领域技术人员更加清楚和明确本发明的技术方案,下面结合实施例及附图。对本 发明作进一步详细的描述,但本发明的实施方式不限于此。
如图1-图3所示,本实施提供的CNN-LSTM-LightGBM短期光伏功率预测方法,基于CNN-LSTM的预测模型,并结合误差反向传播法实现对参数的最优化求解,且考虑到单一预测模型在预测性能上的不足,同时构建基于决策树梯度提升方法LightGBM的短期光伏功率预测模型,借鉴boosting集成学习的思想,提升预测准确度。
本实施例中的模型均采用python编程语言实现,基于CNN-LSTM的短期光伏功率预测 模型使用Keras深度学习库实现,基于LGBM的短期光伏功率预测模型调用lightgbm机器学 习库实现,训练的模型硬件环境为Intel Core i5,NVIDIA Geforce RTX 2080Ti。
如图1-图3所示,本实施例提供了一种短期光伏功率预测方法,包括如下步骤:
步骤(1)、利用天气预报数据和光伏系统运行的历史数据,提取出每个时刻的天气、温 度、压力、湿度、光伏功率等特征数据,对非数字特征进行one-hot独热编码,然后对提取出 的所有数据按特征进行归一化,并处理成模型需要的张量形式,具体步骤是:
1)选取2020年1月1日至2020年7月31日的光伏功率数据,一共31189条数据,本 实施例中按照8∶1∶1的比例划分训练集、验证集和测试集,训练集、验证集、测试集数据 分别为24951条、3119条和3119条。
2)光伏功率数据在收集过程中,会出现数据缺失和数据错误的情况,需要对数据进行预 处理,处理步骤为:
2.1)由于光伏功率数据具有时序性,一般是连续且平滑的,通过检查数据的平稳性找出 异常数据,对于异常数据的处理,由于每天同一时刻的值具有相似性,因此本实施例中采用 前一天同一时刻的值填补异常数据。
2.2)对于光伏功率原始数据的缺失值,本实施例采用聚类的方式,取相似度最大的三日 数据,然后所求时刻光伏功率值用所对应的三日对应时刻的平均值填充。
3)收集光伏功率数据对应的天气数据,构建CNN-LSTM模型和LightGBM模型的输入特征向量,选择特征因子,包括:预测点时刻的天气Wet、预测点时刻的压力prt、预测点时 刻的温度Tt、预测点时刻的湿度Ht、预测点前一天同时刻的光伏功率y′t等特征因子,表示为xt=[Wet,prt,...Tt,Ht,...y′t]。其中,对于天气数据,若出现非数字特征,则采用one-hot独热编码的方式进行处理。
4)为了简少后续模型处理的运算量,对输入特征进行归一化处理,采用min-max归一化 方法,归一化后的数据范围均在[0,1]之间,计算公式为:
式中,θ′为归一化以后的特征的值,包括天气、压力、温度、湿度、功率等,θ为原始数 据中的特征的值,θmax为所有数据中该特征的最大值,θmin为所有数据中该特征的最小值。
步骤(2)、构建CNN-LSTM网络,将预处理后的输入特征向量输入CNN网络进行训练,通过CNN网络的卷积、池化等操作可以提取出输入特征向量的静态特征,将CNN网络提取 的静态特征输入LSTM网络的隐藏层进行训练,得到训练后的特征向量,具体步骤是:
1)采用CNN结构对局部特征进行预提取
在众多神经网络结构中,CNN常用于实现图像识别、图像分类、目标检测和人脸识别, 结构具有可学习的权重与偏差值的神经元,可增加数据的低层次特征,随着网络加深,将低 层次特征组合为多层次特征,引导后续模型针对此类特征的学习与调整,其具体结构如图3 所示。CNN结构通过将特定的特征编译于卷积结构中,使得正向传递函数更加高效,并且降 低了网络中的参数数量。一维卷积层可实现时间轴的特征提取,经CNN网络中一维卷积层提 取后得到的静态特征为:
式中:xt为t时刻的输入特征向量;ωj为卷积核权重矩阵;b为偏差值;k为卷积核个数。
2)LSTM模型构建
传统的循环神经网络(RNN)会出现梯度消失和梯度爆炸问题,LSTM作为一种特殊的 RNN,能够很好地解决此类问题。LSTM具有良好的记忆能力,可以学习时间序列长依赖信息,在对光伏功率预测时,能从光伏功率历史数据中寻找规律信息。LSTM这些优势是通过对神经元增加“门”信息来实现的,其具体结构如图3所示,LSTM网络包括基本的LSTM隐 藏层、Dropout层以及最后的Dense层。
其中,LSTM隐藏层的基本神经单元中较普通RNN新增了三个“门”,分别是输入门it、 遗忘门ft、输出门ot,这三个门是三个系数,取值范围均在[0,1]之间。输入门主要是用来判 断更新哪些属性以及新属性的内容,遗忘门是为了遗忘以前无用的状态信息,输出门决定输 出什么,三个门都由上个单元输出ht-1和当前时刻输入的静态特征Xt共同决定。其中输入门it、 遗忘门ft、输出门ot和当前神经元候选值的计算公式如下:
it=σ(WixXt+Wihht-1+bi) (3)
ft=σ(WfXXt+Wfhht-1+bf) (4)
ot=σ(WoXXt+Wohht-1+bo) (5)
式中,WiX,Wih,WfX,Wfh,Wox,Woh,WCx,WCh分别表示相应门与当前输入的静态 特征Xt和上个单元输出ht-1相乘的得到的矩阵权重,bi,bf,bo,bC为偏置项,σ为sigmoid 函数;
ht=ot*tanh(Ct) (8)
式中,*表示各相乘向量中的元素按位乘积。
3)确定LSTM模型隐藏层数
LSTM隐藏层的主要作用是通过不断地学习训练提取有价值的信息,遗忘丢掉无价值的 信息。本质上讲,LSTM的隐藏层层数越多,非线性拟合能力越强,模型的学习效果自然越 好。但是层数多的训练需要花费大量时间,用户体验感差,因此,应选择一种用时较少而训 练效果较好的方案。本模型设置LSTM为2层,且每层神经元个数分别为128和64。
步骤(4)、搭建LightGBM决策树模型,并将预处理后的输入特征向量作为输入矩阵, 根据Xgboost方法原理生成M棵弱回归树,得到该M棵弱回归树的输出值之和,即为LightGBM模型的预测值具体步骤如下:
1)搭建LightGBM决策树模型
在机器学习领域,回归树模型是一类应用广泛的决策树学习方法。GBDT方法是生成决 策树的主流方法,它是一个加性回归模型,其主要思想是通过boosting迭代构造出一组学习 器,使得期望损失最小。
微软开源了快速、高性能的分布式梯度提升框架LightGBM,在提高模型性能的同时, 计算速度是原始GBDT方法的10倍,训练模型占用的内存大小缩小3倍,方便了广大研究者更好地应用Xgboost方法。它的基本思想是通过M棵弱回归树线性组合为强回归树,计 算公式如下:
式中:F(x)为最终的输出值;fm(x)为第m棵弱回归树的输出值。
LightGBM模型的主要改进包括直方图算法和带深度限制的叶子生长(Leaf-wise)策略。 直方图算法将连续数据划分为K个整数,并构造宽度为K的直方图。遍历时将离散化的值作 为索引在直方图中累积,进而搜索出最优的决策树分割点。
而带深度限制的Leaf-wise策略是指在每次分裂时,找到最大增益的叶子进行分裂并循 环下去。同时,通过树的深度以及叶子数限制,减小模型的复杂度,防止出现过拟合。
2)LightGBM模型采用梯度提升方法进行训练,采用网格搜索法优化LightGBM模型的 超参数。
通过网格搜索法优化后的主要超参数为:LightGBM模型的弱回归树数量为200、叶子 数为50、学习率为0.1、迭代次数为2000。
步骤(5)、在两个模型并行完成训练和预测后,结合MAPE-RW算法对模型权重进行计 算,得到最后的预测值,具体步骤如下:
1)平均绝对百分误差MAPE的计算公式为:
2)MAPE-RW算法对模型权重进行计算的方法为:
首先分别计算CNN-LSTM模型和LightGBM模型的MAPE值,确定单个模型的权重初始值,然后对最佳权重值进行双向搜索,更快速地确定最优权重,然后计算组合光伏功率预测值,计算公式如下:
式中,ω1和ω2分别为CNN-LSTM模型和LightGBM模型的权重初始值,ωCNN-LSTM和ωLightGBM分别为CNN-LSTM模型和LightGBM模型的最优权重值,yt,c为组合模型的光伏功 率预测值。
综上所述,本发明提供的短期光伏功率预测模型,考虑天气、温度、压力、湿度等各类 环境因素,能够有效提取数据的局部特征和时序特征,实现了对短期光伏功率的精准预测。
以上仅是本发明的优选实例,并非对本发明保护范围的限制。应当指出,对于本技术领 域的人员,其根据本发明的技术方案或构思做出的同等替换或改变,都属于本发明的保护范 围。
Claims (7)
1.一种短期光伏功率预测方法,其特征在于:包括如下步骤:
步骤(1)、利用环境数据和光伏系统运行的历史功率数据,提取出不同时刻的环境数据和光伏功率的作为特征数据,并对非数字特征进行one-hot独热编码,然后对所有数据的特征进行归一化处理;
步骤(2)、分别构建用于光伏功率预测的CNN-LSTM模型和LightGBM决策树模型,并利用步骤1归一化处理后的数据分别对构建好的CNN-LSTM模型和LightGBM决策树模型进行训练。其中,CNN-LSTM模型和LightGBM决策树模型的输入为由预测点时刻的环境特征数据和预测点前一天同时刻的光伏功率值构成的特征向量,输出为预测点时刻的光伏功率预测值。
步骤(3)、在两个模型并行完成训练后,利用训练好的CNN-LSTM模型和LightGBM决策树模型对步骤1归一化处理后的数据进行预测并计算每个模型对应光伏功率预测值的MAPE值的比例作为权重初值,并结合双向搜索方法进行优化获得最优权重。
2.根据权利要求1所述的一种短期光伏功率预测方法,其特征在于:所述步骤1中,还包括对历史功率数据的预处理步骤,具体为:
采用聚类的方式,取相似度最大的三日数据对应时刻的光伏功率值的均值填补空缺数据。其中,聚类的特征包括天气、温度、电压、电流等。
检查历史功率数据的平稳性,并采用前一天同一时刻的值填补极端数据。
3.根据权利要求1所述的一种短期光伏功率预测方法,其特征在于:所述步骤2中,特征向量至少包括:预测点时刻的天气、预测点时刻的压力、预测点时刻的温度、预测点时刻的湿度、预测点前一天同时刻的光伏功率值等。
5.根据权利要求1所述的一种短期光伏功率预测方法,其特征在于:所述步骤2中,所述LightGBM模型采用梯度提升方法进行训练,采用网格搜索法优化LightGBM模型的超参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110565656.8A CN113627070A (zh) | 2021-05-24 | 2021-05-24 | 一种短期光伏功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110565656.8A CN113627070A (zh) | 2021-05-24 | 2021-05-24 | 一种短期光伏功率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113627070A true CN113627070A (zh) | 2021-11-09 |
Family
ID=78378035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110565656.8A Pending CN113627070A (zh) | 2021-05-24 | 2021-05-24 | 一种短期光伏功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113627070A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227748A (zh) * | 2023-05-08 | 2023-06-06 | 石家庄铁道大学 | 生态环境pm2.5浓度预测模型的训练方法及预测方法 |
CN116307287A (zh) * | 2023-05-19 | 2023-06-23 | 国网信息通信产业集团有限公司 | 一种光伏发电有效时段的预测方法、系统及预测终端 |
CN117081064A (zh) * | 2023-09-01 | 2023-11-17 | 国电南瑞科技股份有限公司 | 一种基于误差评估的风电功率组合预测方法和系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140095076A1 (en) * | 2012-09-28 | 2014-04-03 | Hewlett-Packard Development Company, L.P. | Predicting near-future photovoltaic generation |
CN108280551A (zh) * | 2018-02-02 | 2018-07-13 | 华北电力大学 | 一种利用长短期记忆网络的光伏发电功率预测方法 |
CN109858673A (zh) * | 2018-12-27 | 2019-06-07 | 南京工程学院 | 一种光伏发电系统功率预测方法 |
WO2019174040A1 (zh) * | 2018-03-16 | 2019-09-19 | 大连理工大学 | 一种耦合聚类分析和决策树的梯级水电站群短期发电调度方法 |
CN110705789A (zh) * | 2019-09-30 | 2020-01-17 | 国网青海省电力公司经济技术研究院 | 一种光伏电站短期功率预测方法 |
CN110909926A (zh) * | 2019-11-18 | 2020-03-24 | 中国计量大学 | 基于tcn-lstm的太阳能光伏发电预测方法 |
CN112288137A (zh) * | 2020-10-09 | 2021-01-29 | 国网电力科学研究院有限公司 | 一种计及电价和Attention机制的LSTM短期负荷预测方法及装置 |
CN112507793A (zh) * | 2020-11-05 | 2021-03-16 | 上海电力大学 | 一种超短期光伏功率预测方法 |
-
2021
- 2021-05-24 CN CN202110565656.8A patent/CN113627070A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140095076A1 (en) * | 2012-09-28 | 2014-04-03 | Hewlett-Packard Development Company, L.P. | Predicting near-future photovoltaic generation |
CN108280551A (zh) * | 2018-02-02 | 2018-07-13 | 华北电力大学 | 一种利用长短期记忆网络的光伏发电功率预测方法 |
WO2019174040A1 (zh) * | 2018-03-16 | 2019-09-19 | 大连理工大学 | 一种耦合聚类分析和决策树的梯级水电站群短期发电调度方法 |
CN109858673A (zh) * | 2018-12-27 | 2019-06-07 | 南京工程学院 | 一种光伏发电系统功率预测方法 |
CN110705789A (zh) * | 2019-09-30 | 2020-01-17 | 国网青海省电力公司经济技术研究院 | 一种光伏电站短期功率预测方法 |
CN110909926A (zh) * | 2019-11-18 | 2020-03-24 | 中国计量大学 | 基于tcn-lstm的太阳能光伏发电预测方法 |
CN112288137A (zh) * | 2020-10-09 | 2021-01-29 | 国网电力科学研究院有限公司 | 一种计及电价和Attention机制的LSTM短期负荷预测方法及装置 |
CN112507793A (zh) * | 2020-11-05 | 2021-03-16 | 上海电力大学 | 一种超短期光伏功率预测方法 |
Non-Patent Citations (1)
Title |
---|
陈振宇等: ""基于LSTM与XGBoost组合模型的超短期电力负荷预测"", 《电网技术》, pages 614 - 619 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227748A (zh) * | 2023-05-08 | 2023-06-06 | 石家庄铁道大学 | 生态环境pm2.5浓度预测模型的训练方法及预测方法 |
CN116307287A (zh) * | 2023-05-19 | 2023-06-23 | 国网信息通信产业集团有限公司 | 一种光伏发电有效时段的预测方法、系统及预测终端 |
CN116307287B (zh) * | 2023-05-19 | 2023-08-01 | 国网信息通信产业集团有限公司 | 一种光伏发电有效时段的预测方法、系统及预测终端 |
CN117081064A (zh) * | 2023-09-01 | 2023-11-17 | 国电南瑞科技股份有限公司 | 一种基于误差评估的风电功率组合预测方法和系统 |
CN117081064B (zh) * | 2023-09-01 | 2024-03-26 | 国电南瑞科技股份有限公司 | 一种基于误差评估的风电功率组合预测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111340273B (zh) | 一种基于GEP参数优化XGBoost的电力系统短期负荷预测方法 | |
Ke et al. | Short-term electrical load forecasting method based on stacked auto-encoding and GRU neural network | |
Lv et al. | Deep learning combined wind speed forecasting with hybrid time series decomposition and multi-objective parameter optimization | |
Shen et al. | Wind speed prediction of unmanned sailboat based on CNN and LSTM hybrid neural network | |
CN110751318B (zh) | 一种基于ipso-lstm的超短期电力负荷预测方法 | |
CN113642225A (zh) | 一种基于attention机制的CNN-LSTM短期风电功率预测方法 | |
CN110110080A (zh) | 文本分类模型训练方法、装置、计算机设备及存储介质 | |
CN113627070A (zh) | 一种短期光伏功率预测方法 | |
Cao et al. | Multi-step wind power forecasting model using LSTM networks, similar time series and LightGBM | |
Bendali et al. | Deep learning using genetic algorithm optimization for short term solar irradiance forecasting | |
Zulqarnain et al. | Predicting financial prices of stock market using recurrent convolutional neural networks | |
CN109919188A (zh) | 基于稀疏局部注意力机制和卷积回声状态网络的时序分类方法 | |
CN115204035A (zh) | 基于多尺度时序数据融合模型的发电机组运行参数预测方法、装置及存储介质 | |
CN115099461A (zh) | 基于双分支特征提取的太阳辐射预测方法及系统 | |
CN113255366A (zh) | 一种基于异构图神经网络的方面级文本情感分析方法 | |
Jin et al. | Adaptive forecasting of wind power based on selective ensemble of offline global and online local learning | |
Guo et al. | Ma-lstm: A multi-attention based lstm for complex pattern extraction | |
Yang et al. | A new mc-lstm network structure designed for regression prediction of time series | |
CN114596726A (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
Busari et al. | An application of AdaBoost-GRU ensemble model to economic time series prediction | |
Alam | Recurrent neural networks in electricity load forecasting | |
CN115796029A (zh) | 基于显式及隐式特征解耦的nl2sql方法 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 | |
He et al. | GA-based optimization of generative adversarial networks on stock price prediction | |
CN114492945A (zh) | 电力市场背景下的短期光伏功率预测方法、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |