CN114662807B - 基于序列编码重构的多尺度区域光伏出力预测方法及系统 - Google Patents
基于序列编码重构的多尺度区域光伏出力预测方法及系统 Download PDFInfo
- Publication number
- CN114662807B CN114662807B CN202210582341.9A CN202210582341A CN114662807B CN 114662807 B CN114662807 B CN 114662807B CN 202210582341 A CN202210582341 A CN 202210582341A CN 114662807 B CN114662807 B CN 114662807B
- Authority
- CN
- China
- Prior art keywords
- sequence
- output
- photovoltaic
- prediction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000012512 characterization method Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 13
- 238000004140 cleaning Methods 0.000 claims abstract description 9
- 238000005096 rolling process Methods 0.000 claims abstract description 9
- 239000013589 supplement Substances 0.000 claims abstract description 4
- 238000001228 spectrum Methods 0.000 claims description 39
- 238000013527 convolutional neural network Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000005070 sampling Methods 0.000 claims description 21
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000002156 mixing Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 4
- 230000010354 integration Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000000265 homogenisation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
Abstract
本发明公开了基于序列编码重构的多尺度区域光伏出力预测方法及系统,属于光伏出力预测技术领域。本发明的基于序列编码重构的多尺度区域光伏出力预测方法,首先,选取基准站点,对站点数据进行清洗与加工,去除无效值补充缺失值;其次,进行序列整合以及确定预测时间尺度后,采用编码单元提取观测时间序列中适合用作区域光伏预测的内在表征向量;并使用解码单元来对内在表征向量解码,以此来预测输出的区域光伏出力序列;通过在解码过程中加入注意力单元,使其充分利用输入序列所含信息,实现对区域光伏滚动预测。本发明可在数据量有限和低采集数据成本的情况下,保持良好的多时间尺度区域光伏出力预测效果,方案科学、合理、切实可行。
Description
技术领域
本发明涉及基于序列编码重构的多尺度区域光伏出力预测方法及系统,属于光伏出力预测技术领域。
背景技术
通过对区域分布式光伏整体出力的精确预测,可有效提高电网稳定性、增加电网消纳光电能力、促进多能转换的能力,可推动电网的能源低碳发展与用能成本降低。
一般地,集中式光伏电站由于具有比较完备的数据采集、存储和通信系统,可聚合得到光伏物理预测模型,或利用人工神经网络解决非线性关系的特点,基于数值天气预报建立分布式光伏输出功率模型。但是,考虑到很多小型分布式电站具有历史运行数据收集困难、实时监测数据缺乏、信息获取成本较高的问题,在进行区域级预测时普遍采用外推法或统计升尺度功率预测方法,首先对区域进行片区划分,通过对不同片区进行出力预测,进而累加全部片区的出力预测结果得到区域出力预测结果;或者通过选择基准站点,并基于基准光伏电站的功率预测结果实现整个区域的出力预测。
进一步,中国专利(公开号:CN 113205226 A)公开了一种结合注意力机制以及误差修正的光伏功率预测方法,该方法包括以下内容:建立BiLSTM-Attention神经网络模型;选取与待预测日相近的历史相似日的光伏发电序列为训练样本,并对历史相似日的光伏功率序列进行模态分解,得到不同的分量,然后以每个分量作为输入分别训练一个BiLSTM-Attention神经网络模型,得到每个分量的预测值,所有分量的预测值相加得到总的预测值记为y1;同时,以训练样本直接训练一个BiLSTM-Attention神经网络模型,得到训练样本的预测值,再将相似日的训练样本的预测值与真实的训练样本做差获得误差序列;对误差序列进行相同的分解、预测操作得到总的误差预测值记为y2;则最终的预测结果y为二者相加。实现了光伏功率预测结果的修正以及预测。
但上述方案以及现有的技术方案中,需要的光伏站点数据相对完备,通过分析所有站点的功率数据与区域总体功率数据的内在联系,进行光伏出力预测。然而在实际应用中,数据条件更加苛刻,检测数据稀少的问题更加突出,并且随着输入序列变长和预测时间尺度的增加,存在历史信息丢失的问题,进而影响光伏出力预测的准确。
发明内容
针对现有技术的缺陷,本发明的目的一在于提供一种通过选取基准站点,对站点数据进行清洗与加工,去除无效值补充缺失值,并对有限的数据集进行时域和频域上的数据增强;其次,进行序列整合以及确定预测时间尺度后,采用编码单元提取观测时间序列中适合用作区域光伏预测的内在表征向量;并使用解码单元来对内在表征向量解码,以此来预测输出的区域光伏出力序列;通过在解码过程中加入注意力单元,使其充分利用输入序列所含信息;经过不断迭代使编码单元和解码单元达到性能要求;最后,通过输入选定基准站点的实时出力数据至可用混合模型,实现对区域光伏滚动预测;进而可在数据量有限和低采集数据成本的情况下,保持良好的多时间尺度区域光伏出力预测效果,方案科学、合理、切实可行的基于序列编码重构的多尺度区域光伏出力预测方法。
本发明的目的二在于提供一种适用于数据量有限以及数据缺失的场合,能最大程度上利用历史数据所含的有效信息,并且能够在一定程度上避免模型参数同质化的问题,具有实用性好、可操作性强、适用度广等特点的基于序列编码重构的多尺度区域光伏出力预测方法。
本发明的目的三在于提供一种通过构建网格化采样模块、数据预处理模块、编码解码模块、可用混合模块,特别适用于数据量有限以及数据缺失的场合,能最大程度上利用历史数据所含的有效信息,并且能够在一定程度上避免模型参数同质化的问题,具有实用性好、可操作性强、适用度广等特点的基于序列编码重构的多尺度区域光伏出力预测系统。
为实现上述目的之一,本发明的第一种技术方案为:
基于序列编码重构的多尺度区域光伏出力预测方法,
包括以下步骤:
步骤1:通过构建网格化采样模型,确定基准站点;
步骤2:获取步骤1中基准站点的光伏历史出力时序数据,并对光伏历史出力时序数据进行预处理,得到修正增强数据集;
所述预处理包括数据清洗与加工、数据增强;
步骤3:根据所需要的预测时间尺度,重新构建步骤2中的修正增强数据集,形成多维出力张量序列;
步骤4:建立编码解码模型,对区域光伏出力进行预测;
所述编码解码模型设有编码单元、注意力单元、解码单元;
所述编码单元将步骤3中的多维出力张量序列提取为内在表征向量序列,并将内在表征向量序列输入到解码单元中进行解码;
在解码过程中,利用注意力单元,赋予每次输入的内在表征向量序列不同的权重,使编码解码模型能充分利用输入的光伏历史出力时序数据所含信息;
步骤5:利用样本数据对步骤4中的编码解码模型进行训练,经过不断迭代使编码解码模型达到性能要求,形成可用混合模型;
步骤6:将待预测的基准站点的光伏实时出力时序数据依次输入至步骤2到步骤5中,进行区域光伏出力滚动预测。
本发明经过不断探索以及试验,针对区域光伏出力应用需求以及小型分布式光伏电站数据采集成本高、历史数据稀少、长时间序列中有效历史信息易丢失等问题,提出一种基于序列编码重构和升尺度转化的区域光伏出力预测方法,首先,选取基准站点,对站点数据进行清洗与加工,去除无效值补充缺失值,并对有限的数据集进行时域和频域上的数据增强;其次,进行序列整合以及确定预测时间尺度后,采用编码单元提取观测时间序列中适合用作区域光伏预测的内在表征向量;并使用解码单元来对内在表征向量解码,以此来预测输出的区域光伏出力序列;通过在解码过程中加入注意力单元,使其充分利用输入序列所含信息;经过不断迭代使编码单元和解码单元达到性能要求;最后,通过输入选定基准站点的实时出力数据至可用混合模型,实现对区域光伏滚动预测。
进而,本发明可在数据量有限和低采集数据成本的情况下,保持良好的多时间尺度区域光伏出力预测效果,方案科学、合理、切实可行。
进一步,本发明方法不同于一般技术方案仅限于单一时间尺度预测,可根据需求应用于超短期、短期、中长期多种时间尺度的出力预测;针对数据量有限的情况具有相应优化措施,能最大程度上利用历史数据所含的有效信息,并且能够在一定程度上避免模型参数同质化的问题,具有实用性好、可操作性强、适用度广等特点,对增强电网稳定性、促进光伏消纳能力具有重要意义。
作为优选技术措施:
所述步骤1中,网格化采样模型的构建方法如下:
步骤11,获取极限位置坐标信息;
极限位置坐标信息包括最低点坐标和最高点坐标;
步骤12,根据步骤11中的极限位置坐标信息,选择合适的网格宽度λ来进行网格划分;
步骤13,步骤12中网格划分完成后,对网格内站点进行随机采样,获得n×m个基准站点;所述n、m的计算公式如下:
作为优选技术措施:
所述步骤2中,所述数据清洗与加工为去除光伏历史出力时序数据中的无效值,并补充光伏历史出力时序数据中的缺失值,形成时序数据集;
所述数据增强包括时域上增强、频域上增强;
所述时域上增强,包括以下内容:
首先对时序数据集中的部分片段进行拉伸或压缩,然后通过从时序数据集中提取设定窗口大小的切片,将时序数据集统一到原始序列长度;
所述频域上增强,包括以下内容:
作为优选技术措施:
所述步骤4中,编码单元包括卷积神经网络CNN和时空序列预测网络ConvLSTM;
作为优选技术措施:
所述时空序列预测网络ConvLSTM的计算公式如下所示:
其中为编码单元时空序列预测网络ConvLSTM的输入门,为编码单元时空序
列预测网络ConvLSTM的遗忘门,为编码单元时空序列预测网络ConvLSTM的输出门,W、H、 b为学习到的权重,为编码器中第t个输入出力张量序列的第L个卷积神经网络CNN层的
输出。
作为优选技术措施:
所述注意力单元包括以下内容:
作为优选技术措施:
作为优选技术措施:
所述解码单元的结构与编码单元的结构对称,其包括以下内容:
通过复制时空序列预测网络ConvLSTM的细胞状态和隐藏状态来初始化解码单元时空序列预测网络ConvLSTM;
作为优选技术措施:
为实现上述目的之一,本发明的第二种技术方案为:
基于序列编码重构的多尺度区域光伏出力预测系统,
应用上述的基于序列编码重构的多尺度区域光伏出力预测方法,其包括网格化采样模块、数据预处理模块、编码解码模块、可用混合模块;
所述网格化采样模块,用于确定基准站点;
所述数据预处理模块,用于对光伏历史出力时序数据进行清洗、加工以及增强,得到修正增强数据集;
所述编码解码模块,用于对区域光伏出力进行初步预测;
所述可用混合模块,用于对区域光伏出力深度预测。
本发明通过构建网格化采样模块、数据预处理模块、编码解码模块、可用混合模块,能够适用于数据量有限以及数据缺失的场合,能最大程度上利用历史数据所含的有效信息,并且能够在一定程度上避免模型参数同质化的问题,具有实用性好、可操作性强、适用度广等特点,能够增强电网稳定性,提升光伏消纳能力。
与现有技术相比,本发明具有以下有益效果:
本发明经过不断探索以及试验,针对区域光伏出力应用需求以及小型分布式光伏电站数据采集成本高、历史数据稀少、长时间序列中有效历史信息易丢失等问题,提出一种基于序列编码重构和升尺度转化的区域光伏出力预测方法,首先,选取基准站点,对站点数据进行清洗与加工,去除无效值补充缺失值,并对有限的数据集进行时域和频域上的数据增强;其次,进行序列整合以及确定预测时间尺度后,采用编码单元提取观测时间序列中适合用作区域光伏预测的内在表征向量;并使用解码单元来对内在表征向量解码,以此来预测输出的区域光伏出力序列;通过在解码过程中加入注意力单元,使其充分利用输入序列所含信息;经过不断迭代使编码单元和解码单元达到性能要求;最后,通过输入选定基准站点的实时出力数据至可用混合模型,实现对区域光伏滚动预测。
进而本发明可在数据量有限和低采集数据成本的情况下,保持良好的多时间尺度区域光伏出力预测效果,方案科学、合理、切实可行。
进一步,本发明通过构建网格化采样模块、数据预处理模块、编码解码模块、可用混合模块,能够适用于数据量有限以及数据缺失的场合,能最大程度上利用历史数据所含的有效信息,并且能够在一定程度上避免模型参数同质化的问题,具有实用性好、可操作性强、适用度广等特点,能够增强电网稳定性,提升光伏消纳能力。
附图说明
图1是本发明一种预测方法流程图;
图2是本发明网格化采样示意图;
图3是本发明序列时域数据增强方法示意图;
图4是本发明注意力向量的计算流程示意图;
图5是本发明网格化采样部分预处理数据示图;
图6是本发明频域数据增强前后对比数据片段示图;
图7是本发明数据增强后的数据集示图;
图8是本发明功率预测值与真实值对比示图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
如图1所示,本发明基于序列编码重构的多尺度区域光伏出力预测方法的第一种具体实施例:
基于序列编码重构的多尺度区域光伏出力预测方法,
包括以下步骤:
步骤1:通过构建网格化采样模型,确定基准站点;
步骤2:获取步骤1中基准站点的光伏历史出力时序数据,并对光伏历史出力时序数据进行预处理,得到修正增强数据集;
所述预处理包括数据清洗与加工、数据增强;
步骤3:根据所需要的预测时间尺度,重新构建步骤2中的修正增强数据集,形成多维出力张量序列;
步骤4:建立编码解码模型,对区域光伏出力进行预测;
所述编码解码模型设有编码单元、注意力单元、解码单元;
所述编码单元将步骤3中的多维出力张量序列提取为内在表征向量序列,并将内在表征向量序列输入到解码单元中进行解码;
在解码过程中,利用注意力单元,赋予每次输入的内在表征向量序列不同的权重,使编码解码模型能充分利用输入的光伏历史出力时序数据所含信息;
步骤5:利用样本数据对步骤4中的编码解码模型进行训练,经过不断迭代使编码解码模型达到性能要求,形成可用混合模型;
步骤6:将待预测的基准站点的光伏实时出力时序数据依次输入至步骤2到步骤5中进行处理,从而根据光伏实时出力时序数据,进行区域光伏出力滚动预测。
本发明基于序列编码重构的多尺度区域光伏出力预测方法的第二种具体实施例:
一种基于序列编码重构的多尺度区域光伏出力预测方法,
其步骤如下:
步骤1:在具有光伏历史出力数据的分布式站点中,采用网格化采样方法,确定基准站点;
步骤2:对基准站点光伏历史出力时序进行清洗与加工,去除无效值补充缺失值,并对有限的数据集进行时域和频域上的数据增强,得到修正增强数据集;
步骤3:根据所需要的预测时间尺度,重新构建修正增强数据集并对其整形;
步骤4:建立编码解码模型,采用编码单元将输入的基准站点光伏历史出力序列提取为内在表征向量序列;采用解码单元解释这些内在表征,以此来预测输出的区域光伏出力序列,并通过在解码过程中加入注意力单元,赋予解码单元输入不同的权重,在解码单元计算输出序列的每次迭代中使用,使模型充分利用输入的历史数据序列所含信息;
步骤5:通过样本数据对模型进行训练,经过不断迭代使编码解码模型达到性能要求,得到最终的可用混合模型;
步骤6:通过输入选定基准站点的实时出力数据至可用混合模型,实现对区域光伏滚动预测。
本发明基准站点采样方法的一种具体实施例:
本发明数据增强方法的一种具体实施例:
(1)时域上增强
首先对时间序列中的部分片段进行拉伸或压缩,然后通过从序列中提取设定窗口大小的切片,将时间序列统一到原始序列长度。
(2)频域上增强
其中是角频率,是幅度谱,是相位谱。对于幅度谱中的扰动,考虑幅度谱中的原始均值和方差,用高斯噪声替换随机选择片段的幅
度值。而对于相位谱中的扰动,随机选择片段的相位值由相位谱中额外的零均值
高斯噪声相加得到。
本发明编码单元的一种具体实施例:
编码单元由两个主要部分组成:较低层的CNN单元和较高层的ConvLSTM单元。
对于经过整形用于输入的出力张量序列,首先每一个出力张
量都通过第层卷积处理提取潜在特征得到, 对于个出力张量得到。
进一步,将输入到多层ConvLSTM网络中,得到用于输入解码单元的细胞状态
和隐藏状态。
ConvLSTM的更新方程如下:
本发明注意力单元的一种具体实施例:
其中激活函数f可以为ReLU或者tanh。
本发明解码单元的一种具体实施例:
解码单元的结构与编码单元的结构对称。
通过复制编码单元ConvLSTM的细胞状态和隐藏状态来初始化解码单元ConvLSTM,
解码单元的计算方程如下:
本发明基于序列编码重构的多尺度区域光伏出力预测方法的一种最佳实施例:
基于序列编码重构的多尺度区域光伏出力预测方法,包括以下步骤:
步骤2:经过数据预处理后,对基准站点光伏历史出力时序进行时域和频域上的数据增强,增加数据的价值,其过程如下:
(1)时域上增强
首先对时间序列中的占总序列10%片段进行拉伸或压缩,然后通过从序列中提取设定窗口大小的切片,将时间序列统一到原始序列长度,如图3所示。
(2)频域上增强
其中是角频率,是幅度谱,是相位谱。对于幅度谱中的扰动,考虑幅度谱中的原始均值和方差,用高斯噪声替换随机选择片段的幅
度值。而对于相位谱中的扰动,随机选择片段的相位值由相位谱中额外的零均值
高斯噪声相加得到。
步骤4:建立编码解码模型,采用编码单元将输入的基准站点光伏历史出力序列提取为内在表征向量序列;采用解码单元解释这些内在表征,以此来预测输出的区域光伏出力序列,并通过在解码过程中加入注意力单元,赋予解码单元输入不同的权重,在解码单元计算输出序列的每次迭代中使用,使模型充分利用输入的历史数据序列所含信息。
如图4所示,所述编码解码模型的建立过程,包括以下内容:
(1)建立编码单元
编码单元由两个主要部分组成:较低层的CNN单元和较高层的ConvLSTM单元。
对于经过整形用于输入的出力张量序列,首先每一个出力张
量都通过第层卷积处理提取潜在特征得到, 对于个出力张量得到。
进一步,将输入到多层ConvLSTM网络中,得到用于输入解码单元的细胞状态
和隐藏状态。
ConvLSTM的更新方程如下:
(2)建立注意力单元。
其中激活函数f可以为ReLU或者tanh。
(3)建立解码单元模型,解码单元的结构与编码单元的结构对称。
通过复制编码单元ConvLSTM的细胞状态和隐藏状态来初始化解码单元ConvLSTM,
其关键方程如下:
步骤5:通过样本数据对模型进行训练,经过不断迭代使编码解码模型达到性能要求,得到最终可用的可用混合模型;
步骤6:通过输入选定基准站点的实时出力数据至可用混合模型,实现对区域光伏滚动预测。
本发明基于序列编码重构的多尺度区域光伏出力预测方法的一种应用实施例:
将本发明所提方法应用于浙江宁波某区域分布式光伏系统,该区域共包含36个光伏站点,采用有限数据集,数据时间范围为2021年10月1日至2021年10月15日,分辨率为15分钟,共1440个时间步,预测尺度为未来1小时,分辨率同为15分钟。
首先,网格宽度λ选择10km,经过采样后得到4个基准站点,其编号为39_P、76_P、43_P、52_P。
进一步,将原始数据进行预处理,移除无效值,补全缺失值后,4个基准站点某一天的数据如图5所示。
进一步,根据步骤二对有限时长数据进行数据增强,以下以站点编号为“43_P”的分布式光伏站点的去零值数据并结合附图6,对本发明应用例采用的数据增强过程做详细说明。
将频谱取模得到幅度谱,将频谱取弧度得到相位谱。考虑幅度谱
中的原始均值和方差,用高斯噪声替换随机选择片段的幅度值;原始幅度和经过增强后的
幅度的对比结果,如图6中的(a)所示;而对于相位谱,通过对随机选择片段叠加额外的零均
值高斯噪声相加得到;原始相位和经过增强后的相位的对比结果,如图6中的(b)所示。
新的幅度谱和相位谱通过合成得到增强后的频谱,其计算公式为:
对增强后的频谱执行傅里叶逆变换得到新的时间序列;原始序列和经过增强后的时间序列的对比结果,如图6中的(c)所示。
进一步,对所有基准站点执行类似数据增强操作,将数据拓展到2880个时间步,增强后的编号为“43_P”的基准站点数据集如图7所示。
最后,根据步骤4-7建立编码解码模型,并输入测试集检验模型性能,评价指标为RMSE,进而可得到功率的预测值与真实值的对比结果,可参见图8。该模型全局RMSE为532.27,小于朴素预测模型RMSE923.62,由此可见本发明在少量数据情况下,仍具有良好的预测性能。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包括有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (6)
1.基于序列编码重构的多尺度区域光伏出力预测方法,其特征在于,
包括以下步骤:
步骤1:通过构建网格化采样模型,确定基准站点;
网格化采样模型的构建方法如下:
步骤11,获取极限位置坐标信息;
极限位置坐标信息包括最低点坐标和最高点坐标;
其中,lon l 为最低点的经度坐标;
lat l 为最低点的纬度坐标;
lon h 为最高点的经度坐标;
lat h 为最高点的纬度坐标;
步骤12,根据步骤11中的极限位置坐标信息,选择合适的网格宽度λ来进行网格划分;
步骤13,步骤12中网格划分完成后,对网格内站点进行随机采样,获得n×m个基准站点;所述n、m的计算公式如下:
步骤2:获取步骤1中基准站点的光伏历史出力时序数据,并对光伏历史出力时序数据进行预处理,得到修正增强数据集;
所述预处理包括数据清洗与加工、数据增强;
所述数据清洗与加工为去除光伏历史出力时序数据中的无效值,并补充光伏历史出力时序数据中的缺失值,形成时序数据集;
所述数据增强包括时域上增强、频域上增强;
所述时域上增强,包括以下内容:
首先对时序数据集中的部分片段进行拉伸或压缩,然后通过从时序数据集中提取设定窗口大小的切片,将时序数据集统一到原始序列长度;
所述频域上增强,包括以下内容:
步骤3:根据所需要的预测时间尺度,重新构建步骤2中的修正增强数据集,形成多维出力张量序列;
步骤4:建立编码解码模型,对区域光伏出力进行预测;
所述编码解码模型设有编码单元、注意力单元、解码单元;
所述编码单元将步骤3中的多维出力张量序列提取为内在表征向量序列,并将内在表征向量序列输入到解码单元中进行解码;
在解码过程中,利用注意力单元,赋予每次输入的内在表征向量序列不同的权重,使编码解码模型能充分利用输入的光伏历史出力时序数据所含信息;
所述解码单元的结构与编码单元的结构对称,其包括以下内容:
通过复制时空序列预测网络ConvLSTM的细胞状态和隐藏状态来初始化解码单元时空序列预测网络ConvLSTM;
其中为解码单元时空序列预测网络ConvLSTM输入门,为解码单元时空序列预测网络ConvLSTM遗忘门,为解码单元时空序列预测网络ConvLSTM输出门,为注意力向量,为相乘运算符号,*为卷积运算符号;
步骤5:利用样本数据对步骤4中的编码解码模型进行训练,经过不断迭代使编码解码模型达到性能要求,形成可用混合模型;
步骤6:将待预测的基准站点的光伏实时出力时序数据依次输入至步骤2到步骤5中,进行区域光伏出力滚动预测。
6.基于序列编码重构的多尺度区域光伏出力预测系统,其特征在于,
应用如权利要求1-5任一所述的基于序列编码重构的多尺度区域光伏出力预测方法,其包括网格化采样模块、数据预处理模块、编码解码模块、可用混合模块;
所述网格化采样模块,用于确定基准站点;
所述数据预处理模块,用于对光伏历史出力时序数据进行清洗、加工以及增强,得到修正增强数据集;
所述编码解码模块,用于对区域光伏出力进行初步预测;
所述可用混合模块,用于对区域光伏出力深度预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210582341.9A CN114662807B (zh) | 2022-05-26 | 2022-05-26 | 基于序列编码重构的多尺度区域光伏出力预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210582341.9A CN114662807B (zh) | 2022-05-26 | 2022-05-26 | 基于序列编码重构的多尺度区域光伏出力预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114662807A CN114662807A (zh) | 2022-06-24 |
CN114662807B true CN114662807B (zh) | 2022-10-14 |
Family
ID=82038394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210582341.9A Active CN114662807B (zh) | 2022-05-26 | 2022-05-26 | 基于序列编码重构的多尺度区域光伏出力预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114662807B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116362503B (zh) * | 2023-03-30 | 2023-11-07 | 国网河南省电力公司安阳供电公司 | 基于人工智能的电力调节方法及系统 |
CN116451873B (zh) * | 2023-06-12 | 2023-10-20 | 中国科学技术大学 | 基于多尺度双时空网络区域风力发电功率预测方法及系统 |
CN117411078B (zh) * | 2023-09-22 | 2024-06-14 | 华中科技大学 | 一种考虑隐私保护的新能源并网系统出力预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111563624A (zh) * | 2020-05-06 | 2020-08-21 | 北京工业大学 | 一种基于LSTM与Attention相结合的绿色能源预测方法 |
CN111814398A (zh) * | 2020-07-08 | 2020-10-23 | 国网河北省电力有限公司 | 一种基于图的融合时空注意力的地表太阳辐射度预测方法 |
CN112348271A (zh) * | 2020-11-12 | 2021-02-09 | 华北电力大学 | 基于vmd-ipso-gru的短期光伏功率预测方法 |
CN113935534A (zh) * | 2021-10-20 | 2022-01-14 | 华能大理风力发电有限公司洱源分公司 | 一种基于卷积transformer架构的光伏日前预测方法、系统及设备 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110073301A (zh) * | 2017-08-02 | 2019-07-30 | 强力物联网投资组合2016有限公司 | 工业物联网中具有大数据集的数据收集环境下的检测方法和系统 |
FR3078802B1 (fr) * | 2018-03-07 | 2020-10-30 | Electricite De France | Reseau de neurones convolutionnel pour l'estimation d'un indicateur de production d'energie solaire |
CN109409024B (zh) * | 2018-12-25 | 2022-09-06 | 福州大学 | 基于一维深度残差网络的光伏组件电压电流特性建模方法 |
CN110059862A (zh) * | 2019-03-25 | 2019-07-26 | 国网浙江省电力有限公司电力科学研究院 | 一种基于自编码与极限学习机的光伏区间预测方法和系统 |
WO2021013334A1 (en) * | 2019-07-22 | 2021-01-28 | Toyota Motor Europe | Depth maps prediction system and training method for such a system |
CN111598337B (zh) * | 2020-05-15 | 2022-12-13 | 国网河北省电力有限公司电力科学研究院 | 一种分布式光伏短期出力预测的方法 |
CN112200764B (zh) * | 2020-09-02 | 2022-05-03 | 重庆邮电大学 | 一种基于热红外图像的光伏电站热斑检测与定位方法 |
CN113205226B (zh) * | 2021-05-28 | 2022-10-14 | 河北工业大学 | 一种结合注意力机制以及误差修正的光伏功率预测方法 |
CN113313316A (zh) * | 2021-06-11 | 2021-08-27 | 北京明略昭辉科技有限公司 | 预测数据的输出方法及装置、存储介质、电子设备 |
CN113469427A (zh) * | 2021-06-24 | 2021-10-01 | 国网山东省电力公司东营供电公司 | 基于卷积lstm的光伏电站日前发电量预测方法及系统 |
CN113904321A (zh) * | 2021-09-01 | 2022-01-07 | 国网浙江省电力有限公司电力科学研究院 | 基于弹性力学映射的配电网优化配置方法、系统及终端 |
CN113984198B (zh) * | 2021-10-25 | 2023-11-17 | 北京航天创智科技有限公司 | 一种基于卷积神经网络的短波辐射预测方法及系统 |
CN114004338A (zh) * | 2021-11-09 | 2022-02-01 | 华东师范大学 | 基于神经网络的混合时间周期模式多变量时序预测方法 |
CN114004424A (zh) * | 2021-12-21 | 2022-02-01 | 南方电网科学研究院有限责任公司 | 一种光伏功率预测方法、系统、设备及存储介质 |
-
2022
- 2022-05-26 CN CN202210582341.9A patent/CN114662807B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111563624A (zh) * | 2020-05-06 | 2020-08-21 | 北京工业大学 | 一种基于LSTM与Attention相结合的绿色能源预测方法 |
CN111814398A (zh) * | 2020-07-08 | 2020-10-23 | 国网河北省电力有限公司 | 一种基于图的融合时空注意力的地表太阳辐射度预测方法 |
CN112348271A (zh) * | 2020-11-12 | 2021-02-09 | 华北电力大学 | 基于vmd-ipso-gru的短期光伏功率预测方法 |
CN113935534A (zh) * | 2021-10-20 | 2022-01-14 | 华能大理风力发电有限公司洱源分公司 | 一种基于卷积transformer架构的光伏日前预测方法、系统及设备 |
Non-Patent Citations (1)
Title |
---|
风电和光伏随机场景生成的条件变分自动编码器方法;王守相等;《电网技术》;20180605(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114662807A (zh) | 2022-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114662807B (zh) | 基于序列编码重构的多尺度区域光伏出力预测方法及系统 | |
CN112668494A (zh) | 基于多尺度特征提取的小样本变化检测方法 | |
Sun et al. | Prediction of Short‐Time Rainfall Based on Deep Learning | |
Sugiartawan et al. | Prediction by a hybrid of wavelet transform and long-short-term-memory neural network | |
CN114549925A (zh) | 一种基于深度学习的海浪有效波高时间序列预测方法 | |
CN113376600A (zh) | 一种基于RSDNet的行人雷达回波去噪方法 | |
CN114692506A (zh) | 一种基于改进TimeGAN模型的小样本故障诊断方法 | |
CN111242351A (zh) | 基于自编码器和gru神经网络的热带气旋轨迹预测方法 | |
CN114692947A (zh) | 一种基于VMD-Lasso-CNN-LSTM的用户用电能耗预测方法 | |
CN114358435A (zh) | 双阶段时空注意力机制的污染源-水质预测模型权重影响计算方法 | |
CN112967185A (zh) | 基于频率域损失函数的图像超分辨率算法 | |
CN115796351A (zh) | 基于变分模态分解和微波衰减的降雨短临预测方法及装置 | |
Dong et al. | Extraction of multi-scale features enhances the deep learning-based daily PM2. 5 forecasting in cities | |
CN116399588A (zh) | 一种小样本下基于WPD和AFRB-LWUNet的滚动轴承故障诊断方法 | |
Du et al. | High-accuracy estimation method of typhoon storm surge disaster loss under small sample conditions by information diffusion model coupled with machine learning models | |
CN109672885B (zh) | 一种用于矿井智能监控的视频图像编解码方法 | |
He et al. | Can sampling techniques improve the performance of decomposition-based hydrological prediction models? Exploration of some comparative experiments | |
Meng et al. | A gear fault diagnosis method based on improved accommodative random weighting algorithm and BB-1D-TP | |
Song et al. | Application of a novel signal decomposition prediction model in minute sea level prediction | |
CN115936196A (zh) | 基于时序卷积网络的月降水模型预测方法 | |
CN115796359A (zh) | 基于深度Koopman算符的PM2.5时空预测方法 | |
Yang et al. | Multi-factor PM2. 5 concentration optimization prediction model based on decomposition and integration | |
Liu et al. | Scientific Error-bounded Lossy Compression with Super-resolution Neural Networks | |
Xiaosheng et al. | Short-Term wind power prediction based on wavelet transform and convolutional neural networks | |
Zhang et al. | Implementing a new fully stepwise decomposition-based sampling technique for the hybrid water level forecasting model in real-world application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |