CN117688362A - 基于多元数据特征增强的光伏功率区间预测方法及装置 - Google Patents
基于多元数据特征增强的光伏功率区间预测方法及装置 Download PDFInfo
- Publication number
- CN117688362A CN117688362A CN202311700048.9A CN202311700048A CN117688362A CN 117688362 A CN117688362 A CN 117688362A CN 202311700048 A CN202311700048 A CN 202311700048A CN 117688362 A CN117688362 A CN 117688362A
- Authority
- CN
- China
- Prior art keywords
- photovoltaic power
- prediction
- data
- interval
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 119
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 88
- 238000011156 evaluation Methods 0.000 claims abstract description 34
- 230000015654 memory Effects 0.000 claims abstract description 31
- 238000013528 artificial neural network Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000010219 correlation analysis Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims description 24
- 238000010248 power generation Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 12
- 108090000672 Annexin A5 Proteins 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 9
- 238000011049 filling Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000013507 mapping Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000006403 short-term memory Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
- H02J3/381—Dispersed generators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2123/00—Data types
- G06F2123/02—Data types in the time domain, e.g. time-series data
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2300/00—Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
- H02J2300/20—The dispersed energy generation being of renewable origin
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Power Engineering (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Public Health (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于多元数据特征增强的光伏功率区间预测方法及装置,通过构建相似日数据集,相似日数据集中包括采样的天气特征和光伏功率出力原始数据,对相似日数据集进行相关性分析,聚类前生数据预处理,聚类指标选取和聚类结果处理;对卷积神经网络模块CNN、超轻量子空间注意力模块ULSAM、双向长短期记忆神经网络模块BiLSTM、模块内分位数回归模型QR进行组合形成基于QR‑CNN‑ULSAM‑BiLSTM的光伏功率短期区间预测混合模型以预测区间覆盖率、预测区间平均宽度为区间评价指标,对光伏功率预测区间进行评估预测。本发明在多种复杂天气场景下表现出更高的预测准确性、敏锐性和场景适应性。
Description
技术领域
本发明属于新能源发电技术领域,具体涉及一种基于多元数据特征增强的光伏功率区间预测方法及装置。
背景技术
光伏发电作为一种清洁、可再生的能源形式正日益受到瞩目,成为未来能源体系中的重要支柱。然而,由于光伏发电受天气等因素影响,其出力波动不稳定,这对电网的安全稳定运营构成了挑战。
目前,为应对光伏发电的波动性,短期光伏出力预测技术应运而生,它能基于历史数据、天气预报等信息,准确预测短时段内光伏电站的发电能力,为电网调度、能源规划提供有力支持。这项技术的应用,有望降低光伏发电波动对电网的冲击,提高电网的可靠性与稳定性。然而,光伏发电波动性的挑战依然存在,为实现大规模应用带来难题。正因如此,短期光伏出力预测技术的研究显得尤为重要。
现阶段,常用的新能源出力预测方法包括物理模型方法、数据驱动方法和混合模型方法等。
物理模型方法避免了对历史发电数据的依赖,通过对设备的使用情况、周围环境等因素进行精确的分析,如数值天气预报(Numerical Weather Prediction,NWP),从而得到准确的未来趋势。但是,物理模型方法的精度受到外界因素的影响,对所获取的物理信息的可靠性要求较高,频繁且剧烈的环境变化会导致预测结果与实际情况严重不符,而且物理模型结构复杂,计算量较大,具有很大的局限性。
数据驱动方法基于机器学习技术,在新能源出力预测方面,数据驱动方法具有很强的数据特征挖掘能力、非线性映射能力、自主学习能力,从有限的实测数据中学习出数据演变的一般性规律。数据驱动方法主要包括了传统的机器学习方法和深度学习方法。
传统机器学习方法已经发展出许多截然不同的方式,例如支持向量机(SupportVector Machine,SVM)、随机森林、决策树,等。其中,SVM是新能源电力系统预测中的常用模型,其通过引入高维变量,将复杂非线性映射问题转化为高维空间上的线性映射问题。直接使用SVM进行建模并不能取得较好的预测效果,因此一般为SVM引入高斯径向基作为核函数,将原始的样本空间映射到更高维的特征空间。相关技术构建以高斯径向基为核函数的SVM单项预测模型,采用滚动预测,预测精度有一定的提升空间。但是,该类方法计算量较小,训练速度快,但由于其非线性映射能力受到核函数的限制,当数据量较大时,它的学习能力受限,因此在新能源预测方面表现不佳。
随着技术的发展迭代,混合模型已经成为时间序列预测的主流方法。相关技术采用离散灰色模型(Discrete Grey Model,DGM)辨别天气类别,并利用LSTM预测光伏发电功率,提出了DGM-LSTM模型;相关技术采用改进的LSTM,结合变分模态分解对时间序列进行预处理实现风功率预测;另有相关技术提出了一种将共享权重LSTM和高斯过程回归相结合的新模型,减少变量数目的同时,提高训练效率;混合模型结合多种预测方法的优势,克服了单一算法无法保障预测精度和预测结果可靠性的缺陷。通过改进预测的模型和方法,在一定程度上提高了新能源出力预测性能,但在时间序列数据特征的信息捕捉上仍有提升的空间。仅依赖单一模型进行预测任务,会由于单一模型泛化能力弱而陷入局部最优的问题。
发明内容
为此,本发明提供一种基于多元数据特征增强的光伏功率区间预测方法及装置,能够在多种复杂天气场景下表现出更高的预测准确性、敏锐性和场景适应性。
为了实现上述目的,本发明提供如下技术方案:第一方面,提供一种基于多元数据特征增强的光伏功率区间预测方法,包括:
构建相似日数据集,所述相似日数据集中包括采样的天气特征和光伏功率出力原始数据,对所述相似日数据集进行相关性分析,聚类指标选取和聚类结果处理;
根据所述相似日数据集建立卷积神经网络模块CNN;通过卷积神经网络模块CNN输出的特征序列建立超轻量子空间注意力模块ULSAM;通过卷积神经网络模块CNN输出的特征序列数据建立双向长短期记忆神经网络模块BiLSTM;通过给定置信度、条件分位数和分位数的回归系数向量建立模块内分位数回归模型QR;对所述卷积神经网络模块CNN、所述超轻量子空间注意力模块ULSAM、所述双向长短期记忆神经网络模块BiLSTM、所述模块内分位数回归模型QR进行组合形成基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型;
采用基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型,以预测区间覆盖率、预测区间平均宽度为区间评价指标,结合光伏功率预测总样本数、光伏出力最大值、光伏出力最小值和光伏功率观测值的极差对光伏功率预测区间进行评估预测。
作为基于多元数据特征增强的光伏功率区间预测方法优选方案,对所述相似日数据集进行相关性分析过程,采用Kendall相关系数筛选多元数据与光伏发电功率的相关性,根据所得Kendall相关系数绘制出热力图;
Kendall相关系数R的定义为:
式中,L、M分别表示为一致对、非一致对数目,表示变量总数。
作为基于多元数据特征增强的光伏功率区间预测方法优选方案,还包括对所述相似日数据集进行聚类前生数据预处理,聚类前生数据预处理过程,对缺失值采用最近邻均值法填充,采用箱型图法检测异常值,并对异常值采用前向填充法修正;
还包括计算聚类损失函数J(U,V)、聚类中心V、隶属度矩阵U:
dij=||xi-vj||
式中,uij为第i个样本属于第j类的隶属度;m是隶属度因子;n是样本数;c为聚类个数;l为迭代次数;dij为第i个样本xi到第j类中心的距离;连续迭代计算隶属度矩阵U和聚类中心V,当达到给定的标准或者|J(l)-J(l-1)|<εJ时,迭代停止;εu为隶属度终止阈值,εJ为损失函数终止阈值。
作为基于多元数据特征增强的光伏功率区间预测方法优选方案,聚类指标选取包括均值、标准差、波峰波谷数量、变异系数cv、峰度kur和偏度sk:
式中,Xi为所选取聚类指标的样本,为样本的均值,σ为样本的标准差、N为总样本数。
作为基于多元数据特征增强的光伏功率区间预测方法优选方案,聚类结果处理过程,根据功率曲线的幅值和波动特性,对原始气象影响因素进行相似日聚类,将天气划分为晴天、多云、阴雨和极端天气四种类型。
作为基于多元数据特征增强的光伏功率区间预测方法优选方案,所述卷积神经网络模块CNN中,卷积层输入与输出的对应关系下式所示:
式中,O表示卷积层局部输出数据;I为输入层局部输入数据;co、mh、mw分别表示输出矩阵通道数、长度和宽度;ci、nh、nw分别表示输入数据的通道数、长度和宽度;kh、kw分别表示卷积核K的长度和宽度;bn表示卷积核的偏置;表示矩阵的乘法运算;
对所述超轻量子空间注意力模块ULSAM的网络进行重构:
将Conv1d2后维度为N的特征序列进行维度拆分,等分为若干组子特征序列,每个子特征序列单独进行子空间注意力模块处理,将子数据集重新拼接,得到重构数据。
作为基于多元数据特征增强的光伏功率区间预测方法优选方案,在给定置信度θ下,所述模块内分位数回归模型QR因变量条件分位数和自变量之间的对应关系为:
式中,为因变量ypi的第θ个条件分位数,θ的取值范围为[0,1],βi(θ)是第θ个分位数的回归系数向量,xi是第i个自变量;
当数据已知时,因变量ypi的第θ个分位数估计值为其中分别为/>βi(θ)的估计值;
使用隶属度矩阵对不同天气类型的训练样本加权,得到加权损失函数为:
式中,表示由训练集中自变量xi经过模型训练之后得到的预测值,ypi表示由训练集中自变量xi经过模型训练之后得到的预测值,uij为第i个相似日样本属于天气类型j的隶属度,/>为单一数据点损失函数。
作为基于多元数据特征增强的光伏功率区间预测方法优选方案,预测区间覆盖率PICP计算公式为:
预测区间平均宽度PINAW计算公式为:
式中,Li、Ui为光伏功率预测值对应的上、下界,当其落在对应范围内时,逻辑值Si为1,否则为0,NP为光伏功率预测总样本数,Pmax为光伏出力最大值,Pmin为光伏出力最小值,RP为光伏功率观测值的极差。
作为基于多元数据特征增强的光伏功率区间预测方法优选方案,采用基于改进的覆盖宽度标准CWC作为综合评价指标:
式中,η为用户自定参数,用来衡量PICP和PINAW的贡献度。
第二方面,本发明还提供一种基于多元数据特征增强的光伏功率区间预测装置,采用上述的基于多元数据特征增强的光伏功率区间预测方法,包括:
相似日数据集构建模块,用于构建相似日数据集,所述相似日数据集中包括采样的天气特征和光伏功率出力原始数据;
数据集处理模块,用于对所述相似日数据集进行相关性分析,聚类前生数据预处理,聚类指标选取和聚类结果处理;通过相关性分析绘制出热力图,通过聚类前生数据预处理填充缺失值和检测异常值,通过聚类指标选取得到指定聚类指标参数,通过聚类结果处理对原始气象影响因素进行相似日聚类;
预测混合模型构建模块,用于通过输入层局部输入数据,输入数据的通道数、长度和宽度,卷积核的长度和宽度,卷积核的偏置量建立卷积神经网络模块CNN;通过卷积神经网络模块CNN输出的特征序列建立超轻量子空间注意力模块ULSAM;通过卷积神经网络模块CNN输出的特征序列数据建立双向长短期记忆神经网络模块BiLSTM;通过给定置信度、条件分位数和分位数的回归系数向量建立模块内分位数回归模型QR;对所述卷积神经网络模块CNN、所述超轻量子空间注意力模块ULSAM、所述双向长短期记忆神经网络模块BiLSTM、所述模块内分位数回归模型QR进行组合形成基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型;
区间评估预测模块,用于采用基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型,以预测区间覆盖率、预测区间平均宽度为区间评价指标,结合光伏功率预测总样本数、光伏出力最大值、光伏出力最小值和光伏功率观测值的极差对光伏功率预测区间进行评估预测。
第三方面,本发明还提供一种非暂态计算机可读存储介质,所述计算机可读存储介质中存储有基于多元数据特征增强的光伏功率区间预测方法的程序代码,所述程序代码包括用于执行第一方面或其任意可能实现方式的基于多元数据特征增强的光伏功率区间预测方法的指令。
第四方面,本发明还提供一种电子设备,包括:存储器和处理器;所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面或其任意可能实现方式的基于多元数据特征增强的光伏功率区间预测方法。
本发明具有如下优点:通过构建相似日数据集,所述相似日数据集中包括采样的天气特征和光伏功率出力原始数据,对所述相似日数据集进行相关性分析,聚类前生数据预处理,聚类指标选取和聚类结果处理;通过相似日数据集建立卷积神经网络模块CNN;通过卷积神经网络模块CNN输出的特征序列建立超轻量子空间注意力模块ULSAM;通过卷积神经网络模块CNN输出的特征序列数据建立双向长短期记忆神经网络模块BiLSTM;通过给定置信度、条件分位数和分位数的回归系数向量建立模块内分位数回归模型QR;对所述卷积神经网络模块CNN、所述超轻量子空间注意力模块ULSAM、所述双向长短期记忆神经网络模块BiLSTM、所述模块内分位数回归模型QR进行组合形成基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型;采用基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型,以预测区间覆盖率、预测区间平均宽度为区间评价指标,结合光伏功率预测总样本数、光伏出力最大值、光伏出力最小值和光伏功率观测值的极差对光伏功率预测区间进行评估预测。本发明能够凸显关键信息,同时抑制噪声和冗余,形成具有更强表征能力的特征序列;在多种复杂天气场景下表现出更高的预测准确性、敏锐性和场景适应性;提升了网络对于多元数据特征序列的提取能力,增强了模型的预测性能,极大地减少了预测的不确定性。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的实施附图。
图1为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测方法流程示意图;
图2为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测方法中聚类算法流程图;
图3为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测方法中光伏历史功率聚类统计指标;
图4为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测方法中不同天气类型聚类结果图;
图5为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测方法中基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测模型架构;
图6为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测方法中晴天光伏功率区间预测结果对比;
图7为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测方法中多云天气光伏功率区间预测结果对比;
图8为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测方法中阴雨天气光伏功率区间预测结果对比;
图9为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测方法中极端天气光伏功率区间预测结果对比;
图10为本发明实施例中提供的基于多元数据特征增强的光伏功率区间预测装置示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参见图1,本发明实施例1中,提供一种基于多元数据特征增强的光伏功率区间预测方法,包括以下步骤:
S1、构建相似日数据集,所述相似日数据集中包括采样的天气特征和光伏功率出力原始数据,对所述相似日数据集进行相关性分析,聚类指标选取和聚类结果处理;
S2、通过所述相似日数据集建立卷积神经网络模块CNN;通过卷积神经网络模块CNN输出的特征序列建立超轻量子空间注意力模块ULSAM;通过卷积神经网络模块CNN输出的特征序列数据建立双向长短期记忆神经网络模块BiLSTM;通过给定置信度、条件分位数和分位数的回归系数向量建立模块内分位数回归模型QR;对所述卷积神经网络模块CNN、所述超轻量子空间注意力模块ULSAM、所述双向长短期记忆神经网络模块BiLSTM、所述模块内分位数回归模型QR进行组合形成基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型;
S3、采用基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型,以预测区间覆盖率、预测区间平均宽度为区间评价指标,结合光伏功率预测总样本数、光伏出力最大值、光伏出力最小值和光伏功率观测值的极差对光伏功率预测区间进行评估预测。
本实施例中,在步骤S1,由于Kendall相关系数分析更为强健、有效且计算简便,在分析光伏发电出力情况与多元气象因素的相关性问题中,可以更准确地量化光伏功率和多元气象因素的相关性程度,故对所述相似日数据集进行相关性分析过程,采用Kendall相关系数筛选多元数据与光伏发电功率的相关性,根据所得Kendall相关系数绘制出热力图;
Kendall相关系数R的定义为:
式中,L、M分别表示为一致对、非一致对数目,表示变量总数。取A、B变量中的两对变量(ai,bi)、(ak,bk),若ai<ak且bi<bk,则称两对变量为一致变量,否则为不一致变量。Kendall相关系数R越接近1,表明两个变量的相关性越高。
其中,选取来源于澳大利亚沙漠知识太阳能中心(Desert KnowledgeAustraliaSolarCentre,DKASC)AliceSprings站点光伏阵列实际运行数据,对上述数据预处理之后,进行相关性分析,筛选强相关性影响因素。数据包含的多元气象因素有风速、相对湿度、环境温度、GHI、DHI、GTI、DTI、降雨量以及风向,其中由于降雨量和风速数据缺失,因此本文考虑的气象因素排除上述两项,根据所得相关系数R绘制出热力图
由相关系数热力图直观分析,GHI为极强相关性影响因素;DHI、GTI和DTI为强相关性影响因素;温度为中等相关性影响因素;而相对湿度与风向与光伏发电功率存在负相关性。本实施例在考虑多元数据影响因素时,选取GHI、DHI、GTI、DTI和温度五个气象因素作为主要影响因素。
本实施例中,还包括对所述相似日数据集进行聚类前生数据预处理,聚类前生数据预处理过程中,以天为单位,对缺失值采用最近邻均值法填充,采用箱型图法检测异常值,并对异常值采用前向填充法修正。
其中,计算聚类损失函数J(U,V)、聚类中心V、隶属度矩阵U:
dij=||xi-vj||
式中,uij为第i个样本属于第j类的隶属度;m是隶属度因子;n是样本数;c为聚类个数;l为迭代次数;dij为第i个样本xi到第j类中心的距离;连续迭代计算隶属度矩阵U和聚类中心V,当达到给定的标准或者|J(l)-J(l-1)|<εJ时,迭代停止;εu为隶属度终止阈值,εJ为损失函数终止阈值。参见图2,为FCM聚类算法的流程图。
本实施例中,在步骤S1,聚类指标选取包括均值、标准差、波峰波谷数量、变异系数cv、峰度kur和偏度sk:
式中,Xi为所选取聚类指标的样本,为样本的均值,σ为样本的标准差、N为总样本数。
参见图3,对历史光伏功率按聚类指标进行统计分析,并将6个聚类指标的计算结果作max-min归一化处理。所选取的聚类指标能够全面、准确地捕捉每天历史数据的变化趋势和波动性的特点,提高聚类效率。
本实施例中,在步骤S1,基于模糊C类均值算法对数量众多、场景复杂的光伏功率数据聚类处理,对采集到的原始生数据通过最近邻均值法填充,采用箱型图法检测异常值,并对其采用前向填充法修正,最终得到相似日场景数据集
本实施例中,聚类结果处理过程,根据功率曲线的幅值和波动特性,对原始气象影响因素进行相似日聚类,将天气划分为晴天、多云、阴雨和极端天气四种类型。
具体的,光伏功率为0的数据对模型训练的贡献度较低,因此需要删除该时间段数据,截取每天7:00-19:30,共151个点的数据。将DKASCAlice Springs光伏电站在2019-2021年间所有的光伏功率数据,以天为单位,按照不同的天气类型进行相似日聚类,聚类结果如图4所示。根据功率曲线的幅值和波动特性,将天气划分为晴天、多云、阴雨和极端天气四种类型,以便后续分别建立模型更好的提取时序数据中不同特征之间的复杂非线性关系。
本实施例中,在步骤S2,建立模型内的卷积神经网络模块CNN,CNN模块包括对输入信息的特征进行深度挖掘,以获取其内部的关键信息的卷积层、能够有效的缩小卷积提取后矩阵的尺寸,降低特征维度,从而减少参数数量,提升CNN的收敛速度的池化层、在训练过程中使每一层的输入数据分布在一定范围内,使数据更均匀的批量标准化(BatchStandardization,BN)层、确保每个数据点能够对模型有更好的响应能力,并对模型提供了很强的正则化效果的Mish激活函数层。
其中,卷积神经网络模块CNN中,卷积层输入与输出的对应关系下式所示:
式中,O表示卷积层局部输出数据;I为输入层局部输入数据;co、mh、mw分别表示输出矩阵通道数、长度和宽度;ci、nh、nw分别表示输入数据的通道数、长度和宽度;kh、kw分别表示卷积核K的长度和宽度;bn表示卷积核的偏置;表示矩阵的乘法运算。
其中,Mish激活函数的计算公式为:Mish=xtanh(ln(1+ex))。
本实施例中,在步骤S2,建立超轻量子空间注意力模块(ULSAM),注意力机制模块的引入,能够增强特征在映射过程中有效特征权重,抑制无效特征信息,从而提高整个网络模型的效率。本实施例中采用超轻量子空间注意力模块(Ultra-Lightweight SubspaceAttention Module,ULSAM)来提高CNN效率。超轻量子空间注意力机制模块其具有较低的参数和计算量,ULSAM具有“即插即用”的特性,可以直接作用于CNN输出特征序列,且最终输出特征序列维度与CNN输出序列维度保持一致。ULSAM将原本经过CNN输出的特征序列,进一步划分,产生更精细的特征序列,通过注意力机制分别对每个子特征序列关键信息部分的权重系数进行加强,在完成一系列处理之后,将子序列重新拼接。经过ULSAM处理后的特征序列在维度上仍与经过CNN后的特征序列保持一致。
由于原始ULSAM只适用于二维输入信息,不适用于一维输入信息,因此本文对ULSAM的网络进行重构,使得其适用于一维卷积神经网络,具体做法为:首先,将Conv1d2#后维度为N的特征序列进行维度拆分,等分为5组子特征序列,每组子特征序列的维度为4,数据长度为10。其次,每个子特征序列单独进行子空间注意力模块处理。最后,将子数据集重新拼接,得到重构数据。其主要组成单元为两层一维卷积层,一维最大池化层和Softmax层。
本实施例中,在步骤S2,建立双向长短期记忆神经网络模块(Bi-directionalLong Short Term Memory,BiLSTM),长短期记忆(Long Short Term Memory,LSTM)神经网络在训练时,特征序列的传播方向为单向,即从前向后传播,单向传播无法最大程度地挖掘特征序列的内在信息,导致数据的利用率低。为此,本实施例在LSTM的基础上,构建了双向长短期记忆神经网络(Bi-directional Long Short Term Memory,BiLSTM),能够同时完成前向和后向传播,充分挖掘当前时刻输入数据与前后数据之间的联系,进一步提升了数据利用率。
本实施例中,在步骤S2,建立模块内分位数回归模型的,分位数回归(QuantileRegression,QR)模型是最小二乘回归模型的改进和拓展,QR模型的优势在于可以根据具体问题设定多个置信度,基于不同的分位点,充分利用样本数据,进行回归分析。
其中,在给定置信度θ下,QR模型因变量条件分位数和自变量之间的对应关系如下式所示:
式中,为因变量ypi的第θ个条件分位数,θ的取值范围为[0,1],βi(θ)是第θ个分位数的回归系数向量,xi是第i个自变量。
当数据已知时,因变量ypi的第θ个分位数估计值为其中分别为/>βi(θ)的估计值:
的计算方法可以转化为求解如下损失函数的最小值:
本实施例中,通过FCM算法得到了四类天气典型场景,对于光伏区间预测模型,不同天气类型的数据对光伏区间预测模型产生不同的影响,从而影响训练数据对于内部结构的权重系数。在训练模型时,使用隶属度矩阵对不同天气类型的训练样本加权(WeightedSamples,WS),得到加权损失函数如下
式中,ypi表示由训练集中自变量xi经过模型训练之后得到的预测值。uij为第i个相似日样本属于天气类型j的隶属度,为单一数据点损失函数,其表达式为:
参见图5,本实施例中,在步骤S2,融合构建QR-CNN-ULSAM-BiLSTM光伏功率特征信息增强与短期区间预测模型,。
具体的,组合卷积神经网络模块(CNN)、超轻量子空间注意力模块(ULSAM)、双向长短期记忆神经网络模块(Bi-directional Long Short Term Memory,BiLSTM)、模块内分位数回归模型组成基于QR-CNN-ULSAM-BiLSTM的短期光伏预测混合预测模型,CNN负责对光伏和气象历史数据进行局部特征提取。在预测时间粒度更为精细,波动幅度和频率更为剧烈的光伏功率时,CNN能够最大程度地挖掘光伏序列特征信息,使模型的预测结果更加接近实际情况;ULSAM增强多元数据特征在映射过程中有效特征权重,抑制无效特征信息,进一步提升模型训练效率;BiLSTM有效解决了LSTM网络无法充分利用数据信息的缺陷,对光伏和气象影响因素序列的长期依赖关系进行了最大程度地学习和挖掘;QR通过设定的置信度,找到对应的置信区间,生成光伏功率预测区间。
本实施例中,在步骤S3,区间评价指标采用预测区间覆盖率(PredictionInterval Coverage Probability,PICP)、预测区间平均宽度(Prediction IntervalNormalizedAverage Width,PINAW),主要用于评估光伏预测区间的准确性和敏锐性。其评价指标的计算方法为:
式中,Li、Ui为光伏功率预测值对应的上、下界,当其落在对应范围内时,逻辑值Si为1,否则为0,NP为光伏功率预测总样本数,Pmax为光伏出力最大值,Pmin为光伏出力最小值,RP为光伏功率观测值的极差。
其中,最佳光伏功率预测区间应该接近设置的置信水平,同时使得PINAW最小化。此处采用基于改进的覆盖宽度标准(Coverage Width-based Criterion,CWC)作为综合评价指标:
式中,η为用户自定参数,其用来衡量PICP和PINAW的贡献度,本实施例中,选用η=30。CWC将两个评价指标转化单一评价指标,更直观、综合地反应了光伏功率区间预测结果的优劣。
以下内容为本发明实施例的算例分析。
一、多元特征预处理以及模型参数设置:
为了提高模型的估计精度和收敛速度,对具有不同量纲的多元数据进行归一化预处理,使其映射范围为[-1,1]。归一化和反归一化的计算过程为:
上式中,x分别表示训练集或者测试集的原值和归一化值。xmax、xmin分别表示当前数据特征下的最大、最小值。
其中,为了充分利用预测时刻数据点前后特征序列信息,对单采样时刻训练数据进行重新组织,通过滑动时间窗口对采样单时刻数据重采样,形成“数据单元”,将数据单元作为模型的输入。滑动窗口中,Lw代表原始特征长度,Nw代表原始特征维度,滑动时间窗口的长度为Tw,滑动步长为1。经过滑动时间窗口重采样后数据单元的维度为(Lw-Tw+1,Tw,1)。
在考虑多元数据影响因素时,选取GHI、DHI、GTI、DTI和温度5个气象因素作为主要影响因素。此处所提光伏功率区间预测模型的网络结构和超参数如表1所示,其中C为卷积层Convolutional layer,M为池化层Maxpool layer,B为BiLSTM神经网络层BiLSTM layer,D为全连接层Dense layer。
表1光伏功率区间预测模型关键层超参数
与本实施例模型相比,QR-CNN-BiLSTM、QR-BiLSTM模型结构缺少CNN以及ULSAM注意力机制模块,除此之外,其他结构参数保持一致,以保证模型性能的可比较性。
其中,采用的3类模型的优化器超参数设置如表2所示。选取相似日数据集中,以距离测试集最近的前70天作为训练集,其中训练部分与验证部分占比为7:3;选取相似日数据集中,时间上相近的30天作为测试集。模型的输入特征序列为GHI、DHI、GTI、DTI和温度;模型的输出为给定置信度下对应分位点的光伏预测值,在可视化分析时,随机在四类测试集中选择一天进行对比分析。
表2模型的主要超参数设置
二、区间预测结果和分析:
参见图6,为晴天天气预测结果及分析,评价指标的定量结果分析见表3。从点预测指标可以看出,QR-CNN-ULSAM-BiLSTM模型预测曲线更加平稳,预测功率趋近于实际功率。同样,从区间预测指标看出,所提模型在满足设置置信度的情况下,预测区间宽度更窄,具有较高的敏锐性。
表3晴天各模型评价指标
参见图7,为多云天气预测结果及分析:从局部点预测结果看,在时间分辨率为5min的小范围剧烈波动时,依靠CNN和ULSAM对于局部光伏序列出色的特征提取能力,所提模型相较于其他模型能够更准确地捕捉光伏实际出力。
从图7可以看出,所提模型预测结果在采样点60-90以及120-151波动平缓的区间范围窄,而在采样点0-40以及95-105波动剧烈的区间范围变宽。相较于其他模型,所提模型在光伏功率平稳时间段的预测区间宽度更小;同时,在光伏波动区间段,所提模型也给出了区间宽度更小的预测区间。在表4-4中,采样点13到28,共计16个样本点,所提模型在该采样区间的PINAW与其他两个模型相比,分别降低了17.13%和27.16%,所提模型预测区间的敏锐性显著优于其他两者。在光伏功率出现小幅度波动时,能够获得可靠性和敏锐度更高的预测区间,显著减小了区间预测的不确定性。
表4多云天气各模型评价指标
参见表4,在各个模型预测区间的PICP>95%的前提下,QR-CNN-ULSAM-BiLSTM模型预测区间的PINAW较QR-CNN-BiLSTM和QR-BiLSTM模型分别降低了10.11%和29.97%,PINAW显著降低;所提模型区间综合评价指标CWC值最大,所提模型的区间预测性能最佳。
参见图8,为阴雨天气预测结果及分析,从局部点预测结果看,QR-CNN-ULSAM-BiLSTM模型在面对光伏剧烈无规则的波动时,能够出色的捕捉光伏实际功率的快速变化,预测性能优于其他两个对比模型。
在剧烈波动采样区段,选取采样点109至114,共计6个采样点,分别计算3种模型预测区间的PINAW值作为局部量化比较的指标。选取采样点区间的PINAW相较于其他两个模型分别降低了14.75%和33.71%,计算结果表明所提模型的预测区间敏锐性显著优于其他两者。
参见表5,QR-CNN-ULSAM-BiLSTM模型的各评价指标都表明其具有更高的准确性和敏锐性,预测性能最佳。在PICP>98%的前提下,所提模型的PINAW降幅明显,较QR-CNN-BiLSTM、QR-BiLSTM分别降低了16.16%、30.33%,同时区间综合评价指标CWC值最大,显著减少了光伏功率区间预测的不确定性。
表5阴雨天气各模型评价指标
参见图9,为极端天气预测结果及分析,极端天气较阴雨天气相比,光伏发电功率值更低,且呈现出更加无规则的剧烈波动。确定性评价指标表明,QR-CNN-ULSAM-BiLSTM模型点预测性能相较于其他两个模型具有明显优势。所提模型在应对极端天气场景下,依然展现出较强的光伏实际功率跟踪能力。
其中,对于剧烈波动时段,选取采样点41至59,共计19个采样点,计算选取时段预测区间的PINAW以进行局部的量化比较研究。计算结果表明在所选取的剧烈波动时段,所提模型的预测区间在满足要求覆盖率的条件下,区间宽度更窄,相较于其他两个模型,PINAW分别降低了21.32%和23.09%。在剧烈波动区间,CNN-ULSAM-BiLSTM模型具有出色的场景适应性和优越的区间预测性能。
表6极端天气各模型评价指标
参见表6,在各模型预测区间PICP>95%的前提下,QR-CNN-ULSAM-BiLSTM模型的预测区间的PINAW较QR-CNN-BiLSTM和QR-BiLSTM分别降低了6.76%和11.90%,预测性能有较大的提升,同时区间综合评价指标CWC值最大,在光伏发电功率剧烈波动的场景下减少了区间预测的不确定性。
综上所述,本发明通过构建相似日数据集,所述相似日数据集中包括采样的天气特征和光伏功率出力原始数据,对所述相似日数据集进行相关性分析,聚类前生数据预处理,聚类指标选取和聚类结果处理,通过相关性分析绘制出热力图,通过聚类前生数据预处理填充缺失值和检测异常值,通过聚类指标选取得到指定聚类指标参数,通过聚类结果处理对原始气象影响因素进行相似日聚类;通过输入层局部输入数据,输入数据的通道数、长度和宽度,卷积核的长度和宽度,卷积核的偏置量建立卷积神经网络模块CNN;通过卷积神经网络模块CNN输出的特征序列建立超轻量子空间注意力模块ULSAM;通过卷积神经网络模块CNN输出的特征序列数据建立双向长短期记忆神经网络模块BiLSTM;通过给定置信度、条件分位数和分位数的回归系数向量建立模块内分位数回归模型QR;对所述卷积神经网络模块CNN、所述超轻量子空间注意力模块ULSAM、所述双向长短期记忆神经网络模块BiLSTM、所述模块内分位数回归模型QR进行组合形成基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型;采用基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型,以预测区间覆盖率、预测区间平均宽度为区间评价指标,结合光伏功率预测总样本数、光伏出力最大值、光伏出力最小值和光伏功率观测值的极差对光伏功率预测区间进行评估预测。本发明建立了基于多元数据特征驱动的QR-CNN-ULSAM-BiLSTM光伏功率短期区间预测与数据增强模型,并对混合模型中应用的各模型结构,包括QR模型、CNN、ULSAM和BiLSTM神经网络进行了详细的介绍。通过与QR-CNN-BiLSTM和QR-BiLSTM两种对照模型的算例分析,所提模型在晴天、多云、阴雨和极端天气场景下的PINAW均大于95%,满足置信度要求;在不同天气场景预测区间覆盖率相近的前提下,所提模型的PICP更小,CWC更大,即区间宽度更窄,敏锐性更高。可见,本发明提出的QR-CNN-ULSAM-BiLSTM模型在多种复杂天气场景下表现出更高的预测准确性、敏锐性和场景适应性。
需要说明的是,本公开实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
实施例2
参见图10,本发明实施例2还提供一种基于多元数据特征增强的光伏功率区间预测装置,采用上述实施例1的基于多元数据特征增强的光伏功率区间预测方法,包括:
相似日数据集构建模块1,用于构建相似日数据集,所述相似日数据集中包括采样的天气特征和光伏功率出力原始数据;
数据集处理模块2,用于对所述相似日数据集进行相关性分析,聚类指标选取和聚类结果处理;
预测混合模型构建模块3,用于根据所述相似日数据集建立卷积神经网络模块CNN;通过卷积神经网络模块CNN输出的特征序列建立超轻量子空间注意力模块ULSAM;通过卷积神经网络模块CNN输出的特征序列数据建立双向长短期记忆神经网络模块BiLSTM;通过给定置信度、条件分位数和分位数的回归系数向量建立模块内分位数回归模型QR;对所述卷积神经网络模块CNN、所述超轻量子空间注意力模块ULSAM、所述双向长短期记忆神经网络模块BiLSTM、所述模块内分位数回归模型QR进行组合形成基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型;
区间评估预测模块4,用于采用基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型,以预测区间覆盖率、预测区间平均宽度为区间评价指标,结合光伏功率预测总样本数、光伏出力最大值、光伏出力最小值和光伏功率观测值的极差对光伏功率预测区间进行评估预测。
需要说明的是,上述装置各模块之间的信息交互、执行过程等内容,由于与本申请实施例1中的方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。
实施例3
本发明实施例3提供一种非暂态计算机可读存储介质,所述计算机可读存储介质中存储有基于多元数据特征增强的光伏功率区间预测方法的程序代码,所述程序代码包括用于执行实施例1或其任意可能实现方式的基于多元数据特征增强的光伏功率区间预测方法的指令。
计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(SolidState Disk、SSD))等。
实施例4
本发明实施例4提供一种电子设备,包括:存储器和处理器;
所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行实施例1或其任意可能实现方式的基于多元数据特征增强的光伏功率区间预测方法。
具体的,处理器可以通过硬件来实现也可以通过软件来实现,当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于所述处理器之外,独立存在。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (12)
1.基于多元数据特征增强的光伏功率区间预测方法,其特征在于,包括:
构建相似日数据集,所述相似日数据集中包括采样的天气特征和光伏功率出力原始数据,对所述相似日数据集进行相关性分析,聚类指标选取和聚类结果处理;
根据所述相似日数据集建立卷积神经网络模块CNN;通过卷积神经网络模块CNN输出的特征序列建立超轻量子空间注意力模块ULSAM;通过卷积神经网络模块CNN输出的特征序列数据建立双向长短期记忆神经网络模块BiLSTM;通过给定置信度、条件分位数和分位数的回归系数向量建立模块内分位数回归模型QR;对所述卷积神经网络模块CNN、所述超轻量子空间注意力模块ULSAM、所述双向长短期记忆神经网络模块BiLSTM、所述模块内分位数回归模型QR进行组合形成基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型;
采用基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型,以预测区间覆盖率、预测区间平均宽度为区间评价指标,结合光伏功率预测总样本数、光伏出力最大值、光伏出力最小值和光伏功率观测值的极差对光伏功率预测区间进行评估预测。
2.根据权利要求1所述的基于多元数据特征增强的光伏功率区间预测方法,其特征在于,对所述相似日数据集进行相关性分析过程,采用Kendall相关系数筛选多元数据与光伏发电功率的相关性,根据所得Kendall相关系数绘制出热力图;
Kendall相关系数R的定义为:
式中,L、M分别表示为一致对、非一致对数目,表示变量总数。
3.根据权利要求2所述的基于多元数据特征增强的光伏功率区间预测方法,其特征在于,还包括对所述相似日数据集进行聚类前生数据预处理,聚类前生数据预处理过程,对缺失值采用最近邻均值法填充,采用箱型图法检测异常值,并对异常值采用前向填充法修正;
还包括计算聚类损失函数J(U,V)、聚类中心V、隶属度矩阵U:
dij=||xi-vj||
式中,uij为第i个样本属于第j类的隶属度;m是隶属度因子;n是样本数;c为聚类个数;l为迭代次数;dij为第i个样本xi到第j类中心的距离;连续迭代计算隶属度矩阵U和聚类中心V,当达到给定的标准或者|J(l)-J(l-1)|<εJ时,迭代停止;εu为隶属度终止阈值,εJ为损失函数终止阈值。
4.根据权利要求3所述的基于多元数据特征增强的光伏功率区间预测方法,其特征在于,聚类指标选取包括均值、标准差、波峰波谷数量、变异系数cv、峰度kur和偏度sk:
式中,Xi为所选取聚类指标的样本,为样本的均值,σ为样本的标准差、N为总样本数。
5.根据权利要求4所述的基于多元数据特征增强的光伏功率区间预测方法,其特征在于,聚类结果处理过程,根据功率曲线的幅值和波动特性,对原始气象影响因素进行相似日聚类,将天气划分为晴天、多云、阴雨和极端天气四种类型。
6.根据权利要求1所述的基于多元数据特征增强的光伏功率区间预测方法,其特征在于,所述卷积神经网络模块CNN中,卷积层输入与输出的对应关系下式所示:
式中,O表示卷积层局部输出数据;I为输入层局部输入数据;co、mh、mw分别表示输出矩阵通道数、长度和宽度;ci、nh、nw分别表示输入数据的通道数、长度和宽度;kh、kw分别表示卷积核K的长度和宽度;bn表示卷积核的偏置;表示矩阵的乘法运算;
对所述超轻量子空间注意力模块ULSAM的网络进行重构:
将Conv1d2后维度为N的特征序列进行维度拆分,等分为若干组子特征序列,每个子特征序列单独进行子空间注意力模块处理,将子数据集重新拼接,得到重构数据。
7.根据权利要求6所述的基于多元数据特征增强的光伏功率区间预测方法,其特征在于,在给定置信度θ下,所述模块内分位数回归模型QR因变量条件分位数和自变量之间的对应关系为:
式中,为因变量ypi的第θ个条件分位数,θ的取值范围为[0,1],βi(θ)是第θ个分位数的回归系数向量,xi是第i个自变量;
当数据已知时,因变量ypi的第θ个分位数估计值为其中分别为/>βi(θ)的估计值;
使用隶属度矩阵对不同天气类型的训练样本加权,得到加权损失函数为:
式中,表示由训练集中自变量xi经过模型训练之后得到的预测值,ypi表示由训练集中自变量xi经过模型训练之后得到的预测值,uij为第i个相似日样本属于天气类型j的隶属度,/>为单一数据点损失函数。
8.根据权利要求7所述的基于多元数据特征增强的光伏功率区间预测方法,其特征在于,预测区间覆盖率PICP计算公式为:
预测区间平均宽度PINAW计算公式为:
式中,Li、Ui为光伏功率预测值对应的上、下界,当其落在对应范围内时,逻辑值Si为1,否则为0,NP为光伏功率预测总样本数,Pmax为光伏出力最大值,Pmin为光伏出力最小值,RP为光伏功率观测值的极差。
9.根据权利要求8所述的基于多元数据特征增强的光伏功率区间预测方法,其特征在于,采用基于改进的覆盖宽度标准CWC作为综合评价指标:
式中,η为用户自定参数,用来衡量PICP和PINAW的贡献度。
10.基于多元数据特征增强的光伏功率区间预测装置,采用权利要求1至9任意一项所述的基于多元数据特征增强的光伏功率区间预测方法,其特征在于,包括:
相似日数据集构建模块,用于构建相似日数据集,所述相似日数据集中包括采样的天气特征和光伏功率出力原始数据;
数据集处理模块,用于对所述相似日数据集进行相关性分析,聚类指标选取和聚类结果处理;
预测混合模型构建模块,用于根据所述相似日数据集建立卷积神经网络模块CNN;通过卷积神经网络模块CNN输出的特征序列建立超轻量子空间注意力模块ULSAM;通过卷积神经网络模块CNN输出的特征序列数据建立双向长短期记忆神经网络模块BiLSTM;通过给定置信度、条件分位数和分位数的回归系数向量建立模块内分位数回归模型QR;对所述卷积神经网络模块CNN、所述超轻量子空间注意力模块ULSAM、所述双向长短期记忆神经网络模块BiLSTM、所述模块内分位数回归模型QR进行组合形成基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型;
区间评估预测模块,用于采用基于QR-CNN-ULSAM-BiLSTM的光伏功率短期区间预测混合模型,以预测区间覆盖率、预测区间平均宽度为区间评价指标,结合光伏功率预测总样本数、光伏出力最大值、光伏出力最小值和光伏功率观测值的极差对光伏功率预测区间进行评估预测。
11.一种非暂态计算机可读存储介质,所述计算机可读存储介质中存储有基于多元数据特征增强的光伏功率区间预测方法的程序代码,其特征在于,所述程序代码包括用于执行权利要求1至9任一项所述的基于多元数据特征增强的光伏功率区间预测方法的指令。
12.一种电子设备,包括:存储器和处理器;所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,其特征在于,所述处理器调用所述程序指令能够执行权利要求1至9任一项所述的基于多元数据特征增强的光伏功率区间预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311700048.9A CN117688362A (zh) | 2023-12-12 | 2023-12-12 | 基于多元数据特征增强的光伏功率区间预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311700048.9A CN117688362A (zh) | 2023-12-12 | 2023-12-12 | 基于多元数据特征增强的光伏功率区间预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117688362A true CN117688362A (zh) | 2024-03-12 |
Family
ID=90125982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311700048.9A Pending CN117688362A (zh) | 2023-12-12 | 2023-12-12 | 基于多元数据特征增强的光伏功率区间预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117688362A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117932347A (zh) * | 2024-03-22 | 2024-04-26 | 四川大学 | 基于对抗性迁移学习的小样本时序预测方法及系统 |
-
2023
- 2023-12-12 CN CN202311700048.9A patent/CN117688362A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117932347A (zh) * | 2024-03-22 | 2024-04-26 | 四川大学 | 基于对抗性迁移学习的小样本时序预测方法及系统 |
CN117932347B (zh) * | 2024-03-22 | 2024-06-11 | 四川大学 | 基于对抗性迁移学习的pm2.5预测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ma et al. | A hybrid attention-based deep learning approach for wind power prediction | |
Lipu et al. | Artificial intelligence based hybrid forecasting approaches for wind power generation: Progress, challenges and prospects | |
CN111091233B (zh) | 一种风电场短期风电预测建模方法 | |
US20180101765A1 (en) | System and method for hierarchically building predictive analytic models on a dataset | |
CN111832825B (zh) | 融合长短期记忆网络和极限学习机的风电预测方法及系统 | |
CN117455070B (zh) | 一种基于大数据的中药生产数据管理系统 | |
CN117688362A (zh) | 基于多元数据特征增强的光伏功率区间预测方法及装置 | |
CN111008726A (zh) | 一种电力负荷预测中类图片转换方法 | |
Wang et al. | Hybrid deep learning model for short-term wind speed forecasting based on time series decomposition and gated recurrent unit | |
Dong et al. | Short-term regional wind power forecasting for small datasets with input data correction, hybrid neural network, and error analysis | |
Al-Ja’afreh et al. | An enhanced CNN-LSTM based multi-stage framework for PV and load short-term forecasting: DSO scenarios | |
CN115564155A (zh) | 一种分散式风电机组功率预测方法及相关设备 | |
CN117458480A (zh) | 基于改进lof的光伏发电功率短期预测方法及系统 | |
Dai et al. | Multimodal deep learning water level forecasting model for multiscale drought alert in Feiyun River basin | |
CN117689082A (zh) | 一种短期风电功率概率预测方法、系统及存储介质 | |
Xu et al. | A hybrid model for multi-step wind speed forecasting based on secondary decomposition, deep learning, and error correction algorithms | |
CN115081551A (zh) | 基于K-Means聚类和优化RVM线损模型建立方法及系统 | |
Prashanthi et al. | A comparative study of the performance of machine learning based load forecasting methods | |
Tian et al. | Non-intrusive load monitoring using inception structure deep learning | |
Huang et al. | Short‐term power forecasting method for 5G photovoltaic base stations on non‐sunny days based on SDN‐integrated INGO‐BP and RGAN | |
CN113964825A (zh) | 基于二次分解和BiGRU的超短期风电功率预测方法 | |
Zhang et al. | Ultra-short-term photovoltaic power prediction based on similar day clustering and temporal convolutional network with bidirectional long short-term memory model: A case study using DKASC data | |
Ji et al. | Multivariate time series prediction of high dimensional data based on deep reinforcement learning | |
Zhao et al. | Spatio-temporal model combining vmd and am for wind speed prediction | |
Liu et al. | Wavelet decomposition-bi-directional long-short term memory neural network with prob-sparse attention for non-intrusive load monitoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |