CN115618993A - 一种基于时序数据预测技术的光伏发电功率智能预测方法 - Google Patents
一种基于时序数据预测技术的光伏发电功率智能预测方法 Download PDFInfo
- Publication number
- CN115618993A CN115618993A CN202211048055.0A CN202211048055A CN115618993A CN 115618993 A CN115618993 A CN 115618993A CN 202211048055 A CN202211048055 A CN 202211048055A CN 115618993 A CN115618993 A CN 115618993A
- Authority
- CN
- China
- Prior art keywords
- power generation
- training
- prediction
- lstm
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010248 power generation Methods 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000005516 engineering process Methods 0.000 title claims abstract description 17
- 238000013136 deep learning model Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 67
- 238000013527 convolutional neural network Methods 0.000 claims description 32
- 238000013528 artificial neural network Methods 0.000 claims description 28
- 238000011176 pooling Methods 0.000 claims description 24
- 238000007476 Maximum Likelihood Methods 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 9
- 230000002779 inactivation Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005286 illumination Methods 0.000 claims description 5
- 230000000306 recurrent effect Effects 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000007636 ensemble learning method Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims 1
- 238000005070 sampling Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 7
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 3
- 238000000053 physical method Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000002688 persistence Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Water Supply & Treatment (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Fuzzy Systems (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明涉及一种基于时序数据预测技术的光伏发电功率智能预测方法,包括:步骤1,建立光伏发电量数据集;步骤2,对数据集进行预处理,生成标准化数据集;步骤3,通过标准化数据集构建光伏发电功率智能预测深度学习模型;步骤4,通过真实结果进一步调整光伏发电功率智能预测深度学习模型;步骤5,通过光伏发电功率智能预测深度学习模型对光伏发电功率进行实时预测,每次预测后对权重进行重新计算。本发明提出的方法通过集成学习方法既结合了LSTM网络对时序数据处理的优点,又结合了CNN网络可以处理大量数据的能力,对具有时序特点的大样本数据集处理有很大优势。
Description
技术领域
本发明涉及光伏发电技术领域,特别涉及一种基于时序数据预测技术 的光伏发电功率智能预测方法。
背景技术
由于光伏发电的不确定性和间歇性特点,光伏发电的高度普及也给现 有电网系统的运行带来了许多新的挑战。这些挑战包括光伏电源对气象条 件的敏感性、高昂的安装成本和间歇性发电。光伏发电预测是克服这些挑 战的有效解决方案。准确预测光伏发电量被认为是在主电网中大规模渗透 光伏发电的先决条件。然而,光伏功率时间序列通常表现出非线性和不稳 定的特性。光伏发电依赖于不可预测的气象条件,这使得准确的光伏发电预测变得困难。
目前,有一些研究致力于光伏发电量预测。人们提出了许多预测方法。 光伏功率预测模型可进一步分为物理方法、持久性方法和统计方法。物理 方法利用数学方程来描述气象条件的物理状态和动态运动。当天气条件稳 定时,基于物理方法的预测模型表现最好。持久性方法通常假设当前值和 未来值之间存在非常强的相关性。假设从时间t到时间+Δt的条件保持不 变,计算时间序列的未来值。基于持久性方法的模型的预测精度主要取决 于历史平均值。相比之下,基于统计方法的模型旨在测量历史光伏发电量 与天气参数之间的关系。统计方法通常基于预测模型和历史变量的学习过 程。统计方法的性能对时间范围和输入数据的质量高度敏感,通常可以产 生更准确的短期光伏功率预测结果,因为考虑了历史光伏发电值,并且模 型参数不断优化。然而由于在开发基于回归的预测模型时需要解释变量, 因此很难开发数学模型。
发明内容
本发明提供一种基于时序数据预测技术的光伏发电功率智能预测方法, 其特征在于,所述基于时序数据预测技术的光伏发电功率智能预测方法包 括以下步骤:
步骤1,建立光伏发电量数据集;
步骤2,对数据集进行预处理,生成标准化数据集;
步骤3,通过标准化数据集构建光伏发电功率智能预测深度学习模型;
步骤4,通过光伏发电功率智能预测深度学习模型对光伏发电功率进 行实时预测,每次预测后对权重进行重新计算;
在步骤3中,还包括以下步骤:
步骤31,构建并训练LSTM神经网络;
步骤32,构建并训练CNN神经网络;
步骤33,通过集成学习方法计算LSTM神经网络与CNN神经网络的 预测值权重。
更进一步地,在步骤S1中,所述光伏发电量数据集包括时间、光照幅 度、温度、气压以及实际功率的多维时序数据样本;
所述数据样本获取频率为10分钟,积累获取5000个历史数据。
更进一步地,在步骤S31中,LSTM神经网络结构为:
LSTM结构输出除了传递到下一个LSTM结构,会通过随机失 活随机舍弃隐藏层部分节点,从而避免出现训练精度高而测试精度很低的 过拟合现象,同时也可以避免网络过于关注历史信息以至于当新信息输入 时无法获取满意结果的问题;
更进一步地,在步骤S32中,所述CNN神经网络结构为:
CNN网络采用双卷积层和双池化层的拓扑结构,经预处理的数据依次 通过卷积层conv1、池化层pool1、卷积层conv2、池化层pool2、全连接 FC层、最终输出一个预测值;
卷积层和池化层输入选择s×s正方形型矩阵;卷积核选择e×e大小, 池化单元在输人数据不大的情况下,一般选择2×2大小;全连接FC层选 用单隐藏层结构,输人节点数为池化层pool2的输出大小,隐藏层节点数 设置为h,输出层节点数为1;
卷积层的卷积核大小和数量分别为(3×3,4)和(2×2,16);池化层的 下采样面积均为2×2;卷积层和池化层中步长取1,padding='valid',均使 用relu作为激活函数;全连接层节点数依次为128/64/1,其中最后一个节 点为输出节点,实现64对1的预测结构,目标预测值为输入数据下一个点 的光电输出值;
设置模型训练参数,才可将划分好的数据放人网络进行训练过程,训 练参数包括迭代次数、误差计算间隔、误差函数选择优化器选择;
迭代次数epoch=100,批处理参数batch_size=128;误差函数选择均 方根误差计算损失;优化器选择adam,实现学习率的自动调节;节点丢弃 率Drop-out=0.05。
更进一步地,在步骤S33中,还包括以下步骤:
步骤331,首先将现有数据分为两组;其中80%为训练集,20%为测 试集;
步骤332,选择了CNN和LSTM这两种作为基模型,分别使用五折交 叉验证方法进行训练;
CNN神经网络将训练集随机分为五等份,分别命名为train1,train2, train3,train4,train5,分别训练四个训练集得出4份预测值,使用模型对 验证集进行预测得出一份预测值,之后换验证集和训练集,用此办法会得 到在训练集上由模型训练出来的5份预测值,将5份预测值纵向重叠合并 起来得到预测值A1,和在测试集上的1份预测值B1;
LSTM神经网络也采用相同操作,LSTM神经网络也会得到在训练集 上由模型训练出来的5份预测值,将这五份纵向重叠合并起来得到预测值 A2,和在测试集上的1份预测值B2;
步骤333,两个基模型训练完毕后,将两个模型在训练集上的预测值 A1,A2分别作为训练集,结合对应时刻实际功率的真实值,对极大似然 估计LR模型进行训练:
通过预测值A1,A2输入极大似然估计LR模型,输出值为y:
y=aA1+bA2
A1、A2分别为CNN与LSTM模型的预测值,a、b是CNN与LSTM 模型对应的权重,y表示极大似然估计LR模型输出值;
将输出值y与对应时刻实际功率的真实值对比,进一步对极大似然估 计LR模型进行修正,调整CNN与LSTM模型对应的权重;
步骤334,使用修正过的极大似然估计LR模型,将验证集上的预测值 所构建的两个预测值B1,B2作为测试集,结合对应时刻实际功率的真实 值,查看极大似然估计LR模型精确度,并继续用预测值B1,B2训练极大 似然估计LR模型,得出最终的预测权重a,b。
本发明达到的有益效果是:
本发明提出的方法通过集成学习方法既结合了LSTM网络对时序数据 处理的优点,又结合了CNN网络可以处理大量数据的能力,对具有时序特 点的大样本数据集处理有很大优势。
本发明提出的方法可以在投入现实使用后继续调整网络,每一次预测 都可以再次优化模型,从而更适应现实需求,而且也会更加精确;
本发明基于CNN和LSTM神经网络同时训练,由于单独使用LSTM 运算量会非常大,等待时间长,所以在精确预测结果输出前会先单独输出 CNN预测结果,方便工作人员及时查看。
附图说明
图1是本发明实施例中一种基于时序数据预测技术的光伏发电功率智 能预测方法的训练和测试流程图;
图2是本发明实施例中一种基于时序数据预测技术的光伏发电功率智 能预测方法中LSTM网络随机失活层示意图;
图3是本发明实施例中一种基于时序数据预测技术的光伏发电功率智 能预测方法中LSTM网络训练流程图;
图4是本发明实施例中一种基于时序数据预测技术的光伏发电功率智 能预测方法中CNN网络模型训练流程图;
图5是本发明实施例中一种基于时序数据预测技术的光伏发电功率智 能预测方法的训练和测试流程图;
图6是本发明实施例中一种基于时序数据预测技术的光伏发电功率智 能预测方法中光伏发电站发电量折线图。
具体实施方式
下面结合附图对本发明的技术方案进行更详细的说明,本发明包括但 不仅限于下述实施例。
如附图1所示,本发明提出了一种基于时序数据预测技术的光伏发电 功率智能预测方法,包括如下步骤:
步骤1,建立光伏发电量数据集;
通过光伏发电厂历史数据汇总,收集包含时间、光照幅度、温度、气 压以及实际功率多维时序数据样本,数据获取频率为10分钟,积累获取 5000个历史数据,保存为本地文件。涵盖了多场景因素的光伏发电功率数 据,为后续的模型训练提供了数据支撑。
步骤2,对数据集进行预处理,生成标准化数据集;
通过四分位点内距算法实现对异常数据检测,对数据集进行过清洗后 对数据进行数据重构与标准化,形成特定的输入形式;
步骤3,通过标准化数据集构建光伏发电功率智能预测深度学习模型;
具体的,构建光伏发电功率智能预测深度学习模型还包括以下步骤:
步骤31,构建并训练LSTM神经网络;
具体模型设计基于长短期记忆网络,同时考虑当前日期和100个历史 数据,以时间、光照幅度、温度、气压为输入,提取输入数据的短期特征 和长期特征,基于此对实际功率进行精准预测。
LSTM神经网络预测模型采用了门控制机制,包括选择性遗忘阶段、 选择性记忆阶段和预测阶段,模型的单个部分可称为细胞。将预处理之后 的训练数据集输入LSTM循环神经网络,通过网络具有的遗忘门、输入门 和输出门进行处理。为了避免出现过拟合现象,在LSTM循环神经网络中 引入随机失活层,而随机失活输出的数据维度与想要的预测数据维度并不 同,引入全连接层进行维度变换,最后通过一个输出层输出预测数据。
LSTM结构输出它除了传递到下一个LSTM结构,会通过随机失 活随机舍弃隐藏层部分节点,从而避免出现训练精度高而测试精度很低的 过拟合现象,同时也可以避免网络过于关注历史信息以至于当新信息输入 时无法获取满意结果的问题。
步骤32,构建并训练CNN神经网络;
CNN具体模型设计以光照幅度、温度、气压为输入,提取输入数据特 征,基于数据特征对实际功率进行预测。CNN网络拥有众多的模型参数, 每一个参数都会对最终预测结果产生影响。
网络拓扑结构的确定,由于光伏功率数据的波动性,本专利采用双卷 积层和双池化层的拓扑结构,经预处理的数据依次通过卷积层conv1、池 化层pool1、卷积层conv2、池化层pool2、全连接FC层、最终输出一个预 测值。
确定上述每层中的结构大小和运算方式,卷积层和池化层输入选择s ×s正方形型矩阵;卷积核选择e×e大小,池化单元在输人数据不大的情 况下,一般选择2×2大小;全连接FC层选用单隐藏层结构,输人节点数 为池化层pool2的输出大小,隐藏层节点数设置为h,输出层节点数为1。 运算方式包括步长的确定、padding边缘补0的设置、激活函数的选取等。
在光伏发电功率预测具体实施中,两卷积层的卷积核大小和数量分别 为(3×3,4)和(2×2,16);池化层的下采样面积均为2×2;卷积层和池化 层中步长取1,padding='valid',均使用relu作为激活函数;全连接层节点 数依次为128/64/1,其中最后一个节点为输出节点,实现64对1的预测结 构,目标预测值为输入数据下一个点的光电输出值,将目标预测值与实际 输出的差值为训练误差。
上述结构确定完成后,还需要设置模型训练参数,才可将划分好的数 据放人网络进行训练过程。训练参数包括迭代次数、误差计算间隔、误差 函数选择优化器选择等。
在光伏发电功率预测具体实施中,相关网络训练参数设置如下:迭代 次数epoch=100,批处理参数batch_size=128;误差函数选择均方根误差 计算损失;优化器选择adam,实现学习率的自动调节;节点丢弃率Drop- out=0.05。
网络建好后,预处理后的数据依次通过卷积层conv1、池化层pool1、 卷积层conv2、池化层pool2、全连接FC层,最终输出一个预测值。
步骤33,使用Stacking集成学习方法计算LSTM与CNN预测值权重;
Stacking是一种对模型集成的一种策略,Stacking集成算法可以理解为 一个两层的集成,第一层含有多个基础分类器,把输出的预测结果作为第 二层的输入特征,第二层的分类器通常是逻辑回归。
步骤331,首先将现有数据分为两组;其中80%为训练集,20%为测 试集。
步骤332,基模型训练;
这里选择了CNN和LSTM这两种作为基模型。两个模型同时训练, 分别使用五折交叉验证方法,即把数据平均分成5等份,每次实验拿一份 做测试,其余用做训练,实验5次求平均值。
将步骤331中的训练集随机分为五等份,分别命名为train1,train2, train3,train4,train5。在基模型训练时,依次用train1,train2,train3, train4,train5作为验证集,其余4份作为训练集进行模型训练,训练结束 后在验证集上进行预测。
以CNN模型训练中“train1,train2,train3,train4作为训练集, train5作为测试集”为例,分别训练四个训练集得出4份预测值,使用模 型对验证集进行预测得出一份预测值,之后换验证集和训练集,用此办法 会得到在训练集上由模型训练出来的5份预测值,将五份预测值纵向重叠 合并起来得到预测值A1,和在测试集上的1份预测值B1。
同样在LSTM模型中也是如此操作,LSTM模型也会得到在训练集上 由模型训练出来的5份预测值,将这五份纵向重叠合并起来得到预测值 A2,和在测试集上的1份预测值B2。
步骤333,两个基模型训练完毕后,将两个模型在训练集上的预测值 A1,A2分别作为训练集,结合对应时刻实际功率的真实值,对极大似然 估计LR模型进行训练:
通过预测值A1,A2输入极大似然估计LR模型,输出值为y:
y=aA1+bA2
A1、A2分别为CNN与LSTM模型的预测值,a、b是CNN与LSTM 模型对应的权重,y表示极大似然估计LR模型输出值;
将输出值y与对应时刻实际功率的真实值对比,进一步对极大似然估 计LR模型进行修正,调整CNN与LSTM模型对应的权重。
步骤334,使用修正过的极大似然估计LR模型,将验证集上的预测值 所构建的两个预测值B1,B2作为测试集,结合对应时刻实际功率的真实 值,查看极大似然估计LR模型精确度,并继续用预测值B1,B2训练极大 似然估计LR模型,得出最终的预测权重a,b。
最后部署在现实光伏发电厂进行实时推理分析,流程图如图3所示。
步骤4,实时预测光伏发电功率,每次预测后对权重进行重新计算。
该专利投入到现实中表现出精确快速的特征。本发明部署在光伏发电 设备运行状态评价系统中,将实地采集的信息上传到该系统,进行光伏发 电功率的预测,在算法测试中,对某村光伏发电功率趋势进行了预测。如 下图6所示,当天系统运行过程中,实际发电量和本算法预测值最大差值 出现在当日14时,差值约为1.26kwh,最小差值出现在当日6时,差值小 于0.2kwh,当天实际总发电量与全部预测发电量和的差值小于5kwh,由 此可见本算法的理论发电量预测曲线和实际发电量曲线拟合情况很好。
本发明不仅局限于上述具体实施方式,本领域一般技术人员根据实施 例和附图公开内容,可以采用其它多种具体实施方式实施本发明,因此, 凡是采用本发明的设计结构和思路,做一些简单的变换或更改的设计,都 落入本发明保护的范围。
Claims (5)
1.一种基于时序数据预测技术的光伏发电功率智能预测方法,其特征在于,所述基于时序数据预测技术的光伏发电功率智能预测方法包括以下步骤:
步骤1,建立光伏发电量数据集;
步骤2,对数据集进行预处理,生成标准化数据集;
步骤3,通过标准化数据集构建光伏发电功率智能预测深度学习模型;
步骤4,通过光伏发电功率智能预测深度学习模型对光伏发电功率进行实时预测,每次预测后对权重进行重新计算;
在步骤3中,还包括以下步骤:
步骤31,构建并训练LSTM神经网络;
步骤32,构建并训练CNN神经网络;
步骤33,通过集成学习方法计算LSTM神经网络与CNN神经网络的预测值权重。
2.根据权利要求1所述基于时序数据预测技术的光伏发电功率智能预测方法,其特征在于,在步骤S1中,所述光伏发电量数据集包括时间、光照幅度、温度、气压以及实际功率的多维时序数据样本;
所述数据样本获取频率为10分钟,积累获取5000个历史数据。
4.根据权利要求1所述基于时序数据预测技术的光伏发电功率智能预测方法,其特征在于,在步骤S32中,所述CNN神经网络结构为:
CNN网络采用双卷积层和双池化层的拓扑结构,经预处理的数据依次通过卷积层conv1、池化层pool1、卷积层conv2、池化层pool2、全连接FC层、最终输出一个预测值;
卷积层和池化层输入选择s×s正方形型矩阵;卷积核选择e×e大小,池化单元在输人数据不大的情况下,一般选择2×2大小;全连接FC层选用单隐藏层结构,输人节点数为池化层pool2的输出大小,隐藏层节点数设置为h,输出层节点数为1;
卷积层的卷积核大小和数量分别为(3×3,4)和(2×2,16);池化层的下采样面积均为2×2;卷积层和池化层中步长取1,padding='valid',均使用relu作为激活函数;全连接层节点数依次为128/64/1,其中最后一个节点为输出节点,实现64对1的预测结构,目标预测值为输入数据下一个点的光电输出值;
设置模型训练参数,才可将划分好的数据放人网络进行训练过程,训练参数包括迭代次数、误差计算间隔、误差函数选择优化器选择;
迭代次数epoch=100,批处理参数batch_size=128;误差函数选择均方根误差计算损失;优化器选择adam,实现学习率的自动调节;节点丢弃率Drop-out=0.05。
5.根据权利要求1所述基于时序数据预测技术的光伏发电功率智能预测方法,其特征在于,在步骤S33中,还包括以下步骤:
步骤331,首先将现有数据分为两组;其中80%为训练集,20%为测试集;
步骤332,选择了CNN和LSTM这两种作为基模型,分别使用五折交叉验证方法进行训练;
CNN神经网络将训练集随机分为五等份,分别命名为train1,train2,train3,train4,train5,分别训练四个训练集得出4份预测值,使用模型对验证集进行预测得出一份预测值,之后换验证集和训练集,用此办法会得到在训练集上由模型训练出来的5份预测值,将5份预测值纵向重叠合并起来得到预测值A1,和在测试集上的1份预测值B1;
LSTM神经网络也采用相同操作,LSTM神经网络也会得到在训练集上由模型训练出来的5份预测值,将这五份纵向重叠合并起来得到预测值A2,和在测试集上的1份预测值B2;
步骤333,两个基模型训练完毕后,将两个模型在训练集上的预测值A1,A2分别作为训练集,结合对应时刻实际功率的真实值,对极大似然估计LR模型进行训练:
通过预测值A1,A2输入极大似然估计LR模型,输出值为y:
y=aA1+bA2
A1、A2分别为CNN与LSTM模型的预测值,a、b是CNN与LSTM模型对应的权重,y表示极大似然估计LR模型输出值;
将输出值y与对应时刻实际功率的真实值对比,进一步对极大似然估计LR模型进行修正,调整CNN与LSTM模型对应的权重;
步骤334,使用修正过的极大似然估计LR模型,将验证集上的预测值所构建的两个预测值B1,B2作为测试集,结合对应时刻实际功率的真实值,查看极大似然估计LR模型精确度,并继续用预测值B1,B2训练极大似然估计LR模型,得出最终的预测权重a,b。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211048055.0A CN115618993A (zh) | 2022-08-30 | 2022-08-30 | 一种基于时序数据预测技术的光伏发电功率智能预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211048055.0A CN115618993A (zh) | 2022-08-30 | 2022-08-30 | 一种基于时序数据预测技术的光伏发电功率智能预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115618993A true CN115618993A (zh) | 2023-01-17 |
Family
ID=84857486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211048055.0A Pending CN115618993A (zh) | 2022-08-30 | 2022-08-30 | 一种基于时序数据预测技术的光伏发电功率智能预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115618993A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117708716A (zh) * | 2024-02-05 | 2024-03-15 | 敏博科技(武汉)有限公司 | 基于回归和时序融合的光伏发电功率/量预测方法及设备 |
-
2022
- 2022-08-30 CN CN202211048055.0A patent/CN115618993A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117708716A (zh) * | 2024-02-05 | 2024-03-15 | 敏博科技(武汉)有限公司 | 基于回归和时序融合的光伏发电功率/量预测方法及设备 |
CN117708716B (zh) * | 2024-02-05 | 2024-05-10 | 敏博科技(武汉)有限公司 | 基于回归和时序融合的光伏发电功率预测方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7894926B2 (en) | Global predictive monitoring system for a manufacturing facility | |
CN111833202B (zh) | 考虑作物系数动态变化与降雨的农田蒸散量短期预测方法 | |
CN109143408B (zh) | 基于mlp的动态区域联合短时降水预报方法 | |
US20220100997A1 (en) | Farmland reference crop evapotranspiration prediction method considering uncertainty of meteorological factors | |
CN105974495B (zh) | 利用分类拟合法预判目标区域未来平均云量的方法 | |
CN112381282B (zh) | 基于宽度学习系统的光伏发电功率预测方法 | |
CN113298297A (zh) | 一种基于孤立森林与wgan网络的风电输出功率预测方法 | |
CN110222714B (zh) | 一种基于arma与bp神经网络的太阳总辐照资源预测方法 | |
CN111767517A (zh) | 一种应用于洪水预测的BiGRU多步预测方法、系统及存储介质 | |
CN111815027A (zh) | 一种光伏场站发电功率预测方法及系统 | |
CN115618993A (zh) | 一种基于时序数据预测技术的光伏发电功率智能预测方法 | |
CN109543911B (zh) | 一种日照辐射预测方法及系统 | |
CN113108918B (zh) | 一种极轨气象卫星热红外遥感数据反演气温方法 | |
Cabezon et al. | Comparison of methods for power curve modelling | |
CN114325877B (zh) | 气象预报数据的评估方法和装置 | |
Kowalski et al. | The comparison of linear models for PM10 and PM2. 5 forecasting | |
CN115310653A (zh) | 基于性能退化数据的光伏阵列剩余寿命预测方法 | |
CN113608239A (zh) | 基于bp神经网络的gnss掩星对流层参数的修正方法 | |
CN115563848A (zh) | 一种基于深度学习的分布式光伏总辐射预测方法及系统 | |
CN114116840A (zh) | 一种人工增雨效果的评估方法 | |
Darji | Rainfall forecasting using neural networks | |
CN113435630A (zh) | 一种产流模式自适应的流域水文预报方法及系统 | |
TW202123603A (zh) | 一種太陽能預測的方法 | |
CN117192063B (zh) | 基于耦合卡尔曼滤波数据同化的水质预测方法及系统 | |
CN113705932B (zh) | 一种短期负荷预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |