CN116565850A - 一种基于qr-blstm的风电功率超短期预测方法 - Google Patents
一种基于qr-blstm的风电功率超短期预测方法 Download PDFInfo
- Publication number
- CN116565850A CN116565850A CN202310550524.7A CN202310550524A CN116565850A CN 116565850 A CN116565850 A CN 116565850A CN 202310550524 A CN202310550524 A CN 202310550524A CN 116565850 A CN116565850 A CN 116565850A
- Authority
- CN
- China
- Prior art keywords
- prediction
- wind power
- data
- blstm
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 31
- 230000000694 effects Effects 0.000 claims abstract description 15
- 238000012360 testing method Methods 0.000 claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims abstract description 7
- 238000010219 correlation analysis Methods 0.000 claims abstract description 6
- 238000001914 filtration Methods 0.000 claims abstract description 5
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 14
- 239000011159 matrix material Substances 0.000 claims description 12
- 239000002131 composite material Substances 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 238000010200 validation analysis Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 5
- 239000013598 vector Substances 0.000 claims description 5
- 230000008859 change Effects 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 230000015654 memory Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000000611 regression analysis Methods 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 5
- 238000010248 power generation Methods 0.000 abstract description 3
- 230000002159 abnormal effect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 108090000672 Annexin A5 Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/10—Power transmission or distribution systems management focussing at grid-level, e.g. load flow analysis, node profile computation, meshed network optimisation, active network management or spinning reserve management
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2300/00—Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
- H02J2300/20—The dispersed energy generation being of renewable origin
- H02J2300/28—The renewable source being wind energy
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Power Engineering (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Development Economics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于QR‑BLSTM的风电功率超短期预测方法,涉及新能源风力发电功率预测技术领域。该基于QR‑BLSTM的风电功率超短期预测方法将两组LSTM以时序中相向的形式相结合,用于风电功率超短期概率点预测,克服了单向预测中可能存在的相位滞后问题;基于点预测模型进行了非参数化建模,解决了传统深度神经网络预测模型训练过程中对时间序列信息提取分析深度不足的问题,优化了模型的训练效果,提高了模型的预测精度;针对风波动性和间歇性的特点,对风电出力历史数据中可能存在的异常数据值通过特征提取方法进行识别和剔除;通过方差过滤、F检验及相关性分析等方法筛选出与风电功率相关程度高的变量,优化训练效果,提高预测精度。
Description
技术领域
本发明涉及新能源风力发电功率预测技术领域,具体为一种基于QR-BLSTM的风电功率超短期预测方法。
背景技术
低碳背景下,因风电优异的环境效益和可再生、基建周期短、装机规模灵活等特点,大规模的风能开发与风电并网正成为大趋势。然而,由于风电出力的随机性、波动性,随着风电装机容量的逐年上升,电网系统灵活供需失衡、实时电力平衡困难等问题日益突出。针对上述矛盾,预测时间尺度在未来4h内的风电功率超短期预测是当前领域研究热点,有助于制定合理的电网调度指令,促进风能消纳,优化能源结构。
为了对风电功率作出更精确的预测,长期以来,国内外众多学者进行了一系列研究。当前的风电出力预测方法按输出结果可划分为点预测和概率预测。点预测为确定性预测,常见方法有人工神经网络和支持向量机等。其中,以long short term memory(LSTM)网络为代表的深度学习算法运用最为广泛。LSTM网络可以充分挖掘时序数据之间的内在关联,但当特征为非平稳、非连续的数据时,预测精度不高。
文献“RENANI E T,ELIAS M F M,RAHIM N A.Using data-driven approach forwind power prediction:a comparative study[J].Energy Conversion&Management,2016,118:193-203.”以LSTM网络改进了recurrent neural network(RNN)算法的结构,同时保留其递归特性,避免了传统RNN训练过程中的梯度消失和梯度爆炸问题。但由于风电功率序列具有非平稳性,噪声很强的特点,该方法需要进一步考虑风电出力序列的时间相依性。
在实际应用中,点预测结果难以定量描述风电出力不确定性,不可避免地存在误差。与之相比,概率预测能够给出更多预测信息,更适合于电力系统调度中精确估计风电出力范围的需求。从预测结果形式看,风电功率概率预测包括概率密度预测、区间预测、场景预测。传统的概率预测模型计算及统计规律研究预测误差范围,未能深入考虑风电功率的时间相依性,预测结果易出现相位滞后问题。本发明采用区间预测方法,估计未来风电功率变化范围,以实现更高精度的风电功率超短期预测;鉴于此,我们提出了一种基于QR-BLSTM的风电功率超短期预测方法。
发明内容
针对现有技术的不足,本发明提供了一种基于QR-BLSTM的风电功率超短期预测方法,针对现有风电出力预测方法难以有效挖掘和分析风电的出力波动特性等问题,本发明计及风电功率的时序特性求解分位点,对传统LSTM进行前后向时序的训练,并基于条件分位数结果得到各点概率区间,克服了传统单向预测中可能出现的时序偏移问题,提高了风电功率预测模型的精度。
为实现以上目的,本发明通过以下技术方案予以实现:一种基于QR-BLSTM的风电功率超短期预测方法,所述预测方法包括以下步骤:
S1、采集风电场历史数据,包括各高度风速、风向、气温、湿度等气象数据和风电功率数据;
S2、对原始数据进行特征提取与预处理;
S3、将经预处理后的特征数据集按9:1的比例划分为训练集和测试集;
S4、进行分位数回归分析,预设需要的分位点个数并求出各个分位数下的数据;
S5、建立QR-BLSTM网络,将各个分位点数据输入进行模型训练;
S6、将测试集输入训练好的模型中进行预测,得到各个分位数下的风电出力点预测结果,即回归系数;
S7、基于点预测结果,计算出训练集再输入的预测误差;
S8、将ei按照从小到大的顺序排列,取出前n个,将具有“相似性”以及“最小”误差的数据构成新的数据集。
S9、进一步挑选出新数据集的ei作为预测误差;
S10、计算出新数据集的方差和标准差,计算预测区间的上包络线和下包络线,结合已得出的条件分位数结果,得到风电功率概率预测区间,即完成风电功率概率预测;
S11、整理预测结果,并进行点预测及概率预测效果评价;经过基于QR-LSTM模型输出,实现风电功率预测。
可选的,所述S2中对原始数据进行预处理,通过层次聚类方法将数据降维至n类,包括以下步骤:
S2.1、对呈现一定波动性的风电特征数据集进行方差过滤,筛选出一部分可过滤特征;
S2.2、对数据集进行F检验以及相关性分析,进一步寻求特征与标签之间的线性关系;以实际出力功率为参考,选取相关性过小的特征予以剔除;
S2.3、通过层次聚类方法将数据降维至n类;
S2.4、对风电数据进行小波降噪,进一步优化整体数据,并对整体数据进行归一化处理。
可选的,所述S4中变量Y的τ分位数的定义是满足F(y)≥τ的最小值,计算公式如下:
QY(τ|X)=β0(τ)+β1(τ)X1+β2(τ)X2+…+βn(τ)Xn=X′β(τ)
式中,QY(τ|X)表示响应变量Y在解释变量X=[X1,X2,...Xn]T下第τ个条件分位数,β(τ)=[β1(τ),β2(τ),...,βn(τ)]T则表示τ分位点处的回归系数向量。
可选的,所述S5中BLSTM为双向长短期记忆神经网络,将两组LSTM以时序中相向的形式相结合,用以进一步挖掘风电功率历史数据的时间序列信息,提高预测效果;
其中,LSTM作为模型基础,对具有时间相依性的风电出力序列处理基于3个“门”,用以控制信息通过的量,分别为遗忘门、输入门与输出门;
遗忘门公式如下:ft=σ(Wf·[ht-1,Xt]+bf)
式中,ft为历史状态通过遗忘门保留的值,σ为sigmoid函数,Wf为遗忘门连接权重矩阵,ht-1为隐含层上一个结点的输出值,Xt为t时刻输入层的输出,bf为遗忘门的偏移值;
输入门公式如下:it=σ(Wi·[ht-1,Xt]+bi),
输出门公式如下:
式中:it为t时刻输入门的输出值,Wi、bi分别为输入门的连接权重矩阵与偏移值,为临时新状态值。WC、bC分别为t时刻计算单元新状态的连接权重矩阵与偏移值,tanh为双曲正切函数;
将通过σ函数的输出信息与经过tanh函数转化的单元状态值相乘,得到最终输出:
ot=σ(Wo·[ht-1,Xt]+bo)
ht=ot·tanh(Ct)
式中:Wo、bo为输出门的连接权值矩阵与偏移值;
将正向、逆向2个LSTM组合构成BLSTM模型,充分考虑时序数据的正反向信息变化规律,从而完成风电功率点预测模型的训练。
可选的,所述S6中采用《Q/GDW 10588—2015》标准推荐的均方根误差(Root MeanSquared Error,RMSE)和平均绝对值误差(Mean Absolute Error,MAE)作为误差评价指标,计算这两个指标,验证算法的点预测效果,公式如下;
式中,n为样本个数,为预测值,yi为真实值。
可选的,所述S7中基于点预测结果,训练集再输入的预测误差计算公式为:
ei=ytru(i)-yfor(i)
式中:ytru(i)表示第i个真实风电功率值,yfor(i)表示第i个训练集预测风电功率值。
可选的,所述S10中计算预测区间的上包络线和下包络线,即待预测时刻的上限值以及下限值;结合已得出的条件分位数结果,得到风电功率概率预测区间,完成风电功率概率预测,公式如下:
式中:upi和lowi分别表示预测区间的上包络线和下包络线,表示置信度为α下的分位数(通过计算或查表可知),/>表示训练集预测的标准差;
以覆盖度(Prediction Interval Coverage Probability,PICP)、平均区间宽度(Mean Interval Width,MIW)和综合得分(score)对概率预测区间的预测性能进行分析。
可选的,所述覆盖度(P)公式如下:
式中,upi和lowi分别为第i个验证样本概率预测的上限与下限,ytru(i)为第i个验证样本的功率值。
平均区间宽度(M)公式如下:
该指标即所有上下边界差的平均值,它体现预测随机变化范围的灵敏区域,绝对值越小表示预测准确度越高。
式中,upi和lowi分别为第i个验证样本概率预测的上限与下限,yi为第i个验证样本的功率值。
综合得分(sc)公式如下:
式中:表示置信度为1-α下在第i个点处的区间宽度,sc(i)表示在第i个点处的综合得分。
则n个数据点的平均综合得分可粗略估计公式如下:
本发明提供了一种基于QR-BLSTM的风电功率超短期预测方法。具备以下有益效果:
1.本发明提供的一种基于QR-BLSTM的超短期风电功率预测方法,基于分位数回归及深度学习理论,将两组LSTM以时序中相向的形式相结合,用于风电功率超短期概率点预测,克服了单向预测中可能存在的相位滞后问题;基于点预测模型进行了非参数化建模,解决了传统深度神经网络预测模型训练过程中对时间序列信息提取分析深度不足的问题,优化了模型的训练效果,提高了模型的预测精度。
2.本发明提供的一种基于QR-BLSTM的超短期风电功率预测方法,针对风波动性和间歇性的特点,对风电出力历史数据中可能存在的异常数据值通过特征提取方法进行识别和剔除;通过方差过滤、F检验及相关性分析等方法筛选出与风电功率相关程度高的变量,优化训练效果,提高预测精度。
3.本发明提供的一种基于QR-BLSTM的超短期风电功率预测方法,考虑到不同数据量纲的不统一,对数据进行归一化处理,以在模型训练及测试中能够平等考虑各变量对风电功率的作用。
4.本发明提供的一种基于QR-BLSTM的超短期风电功率预测方法,针对传统点预测结果难以定量描述风电出力不确定性、给出预测信息不足的局限性,基于BLSTM点预测误差结果进一步计算风电出力概率预测区间,可进一步提高预测效果,增强模型的泛化能力。
附图说明
图1为本发明的点预测及概率预测流程示意图;
图2为本发明的典型LSTM网络原理示意图;
图3为本发明的BLSTM网络原理示意图;
图4为本发明的置信区间为90%时的预测结果;
图5为本发明的置信区间为95%时的预测结果。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图5,本发明提供一种技术方案:一种基于QR-BLSTM的风电功率超短期预测方法,包括步骤如下:
S1、采集风电场历史数据,包括各高度风速、风向、气温、湿度等气象数据和风电功率数据;
本实施例选取中国西南部某风电场数据进行分析,原始数据具16个预测备选特征,包括风速(高度为10m、30m、50m、70m)、风向(高度为0、10m、30m、50m、70m)、轮毂高度风向、气温、气压、空气湿度,以及风力发电功率,分辨率为15分钟。
S2、对原始数据进行特征提取与预处理,通过层次聚类方法将数据降维至n类;
S2.1、对呈现一定波动性的风电特征数据集进行方差过滤,筛选出一部分可过滤特征;
S2.2、对数据集进行F检验以及相关性分析,进一步寻求特征与标签之间的线性关系;以实际出力功率为参考,选取相关性过小的特征予以剔除;
S2.3、通过层次聚类方法将数据降维至n类;
由于风波动特性对风电出力的影响,降维后的特征大概率以numerical weatherprediction(NWP)中的风波动特征为主,相关系数由大到小依次为风速、风向和气温;
本实施例中,数据被降维至8类,相关性分析结果显示:与风电功率相关性最大的几个特征分别为50m风速、50m风向和70m风向;
S2.4、对风电数据进行小波降噪,进一步优化整体数据,并对整体数据进行归一化处理。
S3、本实施例中,将经预处理后的特征数据集以季度划分为4个子集,按9:1的比例分别划分为训练集和测试集;
S4、进行分位数回归分析,预设需要的分位点个数并求出各个分位数下的数据;
其中,变量Y的τ分位数的定义是满足F(y)≥τ的最小值,其计算公式如下:
Q(τ)=inf{y:F(y)≥τ};0≤τ≤1
假设变量Y的一组样本为Y1,Y2,…Yn,其受到n个影响因素X1,X2,…Xn的影响,则样本的分位数回归本质上是使其加权误差的绝对值之和最小,计算公式如下:
QY(τ|X)=β0(τ)+β1(τ)X1+β2(τ)X2+…+βn(τ)Xn=X′β(τ)
式中,QY(τ|X)表示响应变量Y在解释变量X=[X1,X2,...Xn]T下第τ个条件分位数,β(τ)=[β1(τ),β2(τ),...,βn(τ)]T则表示τ分位点处的回归系数向量;
S5、建立QR-BLSTM网络,将各个分位点数据输入进行模型训练,作为点预测。
作为本发明对现有LSTM网络的改进,步骤S5中,BLSTM为双向长短期记忆神经网络,可将两组LSTM以时序中相向的形式相结合,用以进一步挖掘风电功率历史数据的时间序列信息,提高预测效果;
其中,LSTM作为模型基础,对具有时间相依性的风电出力序列处理基于3个“门”,用以控制信息通过的量,如图2所示,分别为forget gate(遗忘门)、input gate(输入门)与output gate(输出门);
遗忘门:ft=σ(Wf·[ht-1,Xt]+bf);式中,ft为历史状态通过遗忘门保留的值,σ为sigmoid函数,Wf为遗忘门连接权重矩阵,ht-1为隐含层上一个结点的输出值,Xt为t时刻输入层的输出,bf为遗忘门的偏移值;对应的计算公式如下:
输入门:it=σ(Wi·[ht-1,Xt]+bi)
输出门:式中:it为t时刻输入门的输出值,Wi、bi分别为输入门的连接权重矩阵与偏移值,/>为临时新状态值。WC、bC分别为t时刻计算单元新状态的连接权重矩阵与偏移值,tanh为双曲正切函数;
将通过σ函数的输出信息与经过tanh函数转化的单元状态值相乘,得到最终输出,公式如下:
ot=σ(Wo·[ht-1,Xt]+bo)
ht=ot·tanh(Ct)
式中:Wo、bo为输出门的连接权值矩阵与偏移值;
将正向、逆向2个LSTM组合构成BLSTM模型,充分考虑时序数据的正反向信息变化规律,从而完成风电功率点预测模型的训练。
如图3所示,在BLSTM的预测结构中,时间序列信息分别以前向和后向水平双向流动,与此同时,数据信息由输入层到隐层到输出层竖直单向流动。
S6、本实施例中,对于测试集,取当前时刻前144个风功率值作为预测模型的输入向量,取未来2h时刻的功率值作为输出向量。
S6.1、将测试集输入训练好的模型中进行预测,得到各个分位数下的风电出力点预测结果,即回归系数;
双向训练所采用的目标优化器为adam函数,Dropout设为0.6,选择linear函数作为输出层激活函数,训练迭代次数设置为3000次;
通过模型求解可知,当设置隐含网络层数为8层时,本发明所建立的BLSTM网络预测效果最佳。
S6.2、采用《Q/GDW 10588—2015》标准推荐的均方根误差(Root Mean SquaredError,RMSE)和平均绝对值误差(Mean Absolute Error,MAE)作为误差评价指标,计算这两个指标,验证算法的点预测效果,其计算公式如下:
式中,n为样本个数,为预测值,yi为真实值。
进一步将全年风电数据进行逐月测试,或将其预测误差指标与其他传统预测方法进行对比,可验证本发明所提方法的有效性和可行性。
S7、基于已完成的BLSTM点预测结果,计算出训练集再输入的预测误差,其计算公式如下:
ei=ytru(i)-yfor(i)
式中:ytru(i)表示第i个真实风电功率值,yfor(i)表示第i个训练集预测风电功率值;
S8、将ei按照从小到大的顺序排列,取出前n个,将具有“相似性”以及“最小”误差的数据构成新的数据集。
S9、进一步挑选出新数据集的ei作为预测误差;
S10、基于前述所得点预测误差进行概率区间预测;
S10.1、计算出新数据集的方差和标准差,计算预测区间的上包络线和下包络线,即待预测时刻的上限值以及下限值;
结合已得出的条件分位数结果,得到风电功率概率预测区间,即完成风电功率概率预测,其计算公式如下:
式中:upi和lowi分别表示预测区间的上包络线和下包络线,表示置信度为α下的分位数(通过计算或查表可知),/>表示训练集预测的标准差;
本实施例中,将置信区间分别设置为90%和95%,进行了超前2h的BLSTM概率区间预测模型的训练及测试,预测结果如图4、图5所示。从图上看,本发明所用方法预测区间基本能做到完全覆盖真实值,很好地克服了点预测中预测信息有限的局限性,进一步提高了预测精度和鲁棒性。
S10.2、以覆盖度(Prediction Interval Coverage Probability,PICP)、平均区间宽度(Mean Interval Width,MIW)和综合得分(score)对概率预测区间的预测性能进行分析。
覆盖度(P)计算公式如下:
式中,upi和lowi分别为第i个验证样本概率预测的上限与下限,ytru(i)为第i个验证样本的功率值。
平均区间宽度(M)的计算公式如下:
该指标即所有上下边界差的平均值,它体现预测随机变化范围的灵敏区域,绝对值越小表示预测准确度越高。
式中,upi和lowi分别为第i个验证样本概率预测的上限与下限,yi为第i个验证样本的功率值。
综合得分(sc)的其计算公式如下:
式中:表示置信度为1-α下在第i个点处的区间宽度,sc(i)表示在第i个点处的综合得分。
则n个数据点的平均综合得分可粗略估计的计算公式如下:
分别计算不同置信区间下的上述评价指标可知,对于高频数据而言,条件概率预测在点预测的基础上有效提高了风电功率预测的质量,减小了累计误差对结果准确性的影响。一定程度上,扩大置信区间可以提高预测的覆盖度、缩小平均区间宽度,提高预测的综合得分。
S11、整理预测结果,并进行点预测及概率预测效果评价;经过基于QR-LSTM模型输出,完成风电功率预测。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (8)
1.一种基于QR-BLSTM的风电功率超短期预测方法,其特征在于:所述预测方法包括以下步骤:
S1、采集风电场历史数据,包括各高度风速、风向、气温、湿度气象数据和风电功率数据;
S2、对原始数据进行特征提取与预处理;
S3、将经预处理后的特征数据集按9∶1的比例划分为训练集和测试集;
S4、进行分位数回归分析,预设需要的分位点个数并求出各个分位数下的数据;
S5、建立QR-BLSTM网络,将各个分位点数据输入进行模型训练;
S6、将测试集输入训练好的模型中进行预测,得到各个分位数下的风电出力点预测结果,即回归系数;
S7、基于点预测结果,计算出训练集再输入的预测误差;
S8、将ei按照从小到大的顺序排列,取出前n个,将具有“相似性”以及“最小”误差的数据构成新的数据集;
S9、进一步挑选出新数据集的ei作为预测误差;
S10、计算出新数据集的方差和标准差,计算预测区间的上包络线和下包络线,结合已得出的条件分位数结果,得到风电功率概率预测区间,完成风电功率概率预测;
S11、整理预测结果,并进行点预测及概率预测效果评价;经过基于QR-LSTM模型输出,实现风电功率预测。
2.根据权利要求1所述的一种基于QR-BLSTM的风电功率超短期预测方法,其特征在于:所述S2中对原始数据进行预处理,通过层次聚类方法将数据降维至n类,包括以下步骤:
S2.1、对呈现一定波动性的风电特征数据集进行方差过滤,筛选出一部分可过滤特征;
S2.2、对数据集进行F检验以及相关性分析,进一步寻求特征与标签之间的线性关系;以实际出力功率为参考,选取相关性过小的特征予以剔除;
S2.3、通过层次聚类方法将数据降维至n类;
S2.4、对风电数据进行小波降噪,进一步优化整体数据,并对整体数据进行归一化处理。
3.根据权利要求1所述的一种基于QR-BLSTM的风电功率超短期预测方法,其特征在于:所述S4中变量Y的τ分位数的定义是满足F(y)≥τ的最小值,计算公式如下:
QY(τ|X)=β0(τ)+β1(τ)X1+β2(τ)X2+…+βn(τ)Xn=X′β(τ)
式中,QY(τ|X)表示响应变量Y在解释变量X=[X1,X2,...Xn]T下第τ个条件分位数,β(τ)=[β1(τ),β2(τ),...,βn(τ)]T则表示τ分位点处的回归系数向量。
4.根据权利要求1所述的一种基于QR-BLSTM的风电功率超短期预测方法,其特征在于:所述S5中BLSTM为双向长短期记忆神经网络,将两组LSTM以时序中相向的形式相结合;
其中,LSTM作为模型基础,对具有时间相依性的风电出力序列处理基于3个“门”,用以控制信息通过的量,分别为遗忘门、输入门与输出门;
遗忘门公式如下:ft=σ(Wf·[ht-1,Xt]+bf)
式中,ft为历史状态通过遗忘门保留的值,σ为sigmoid函数,Wf为遗忘门连接权重矩阵,ht-1为隐含层上一个结点的输出值,Xt为t时刻输入层的输出,bf为遗忘门的偏移值;
输入门公式如下:it=σ(Wi·[ht-1,Xt]+bi),
输出门公式如下:
式中:it为t时刻输入门的输出值,Wi、bi分别为输入门的连接权重矩阵与偏移值,为临时新状态值;WC、bc分别为t时刻计算单元新状态的连接权重矩阵与偏移值,tanh为双曲正切函数;
将通过σ函数的输出信息与经过tanh函数转化的单元状态值相乘,得到最终输出,公式如下:
ot=σ(Wo·[ht-1,Xt]+bo)
ht=ot·tanh(Ct)
式中:Wo、bo为输出门的连接权值矩阵与偏移值;
将正向、逆向2个LSTM组合构成BLSTM模型,充分考虑时序数据的正反向信息变化规律,完成风电功率点预测模型的训练。
5.根据权利要求1所述的一种基于QR-BLSTM的风电功率超短期预测方法,其特征在于:所述S6中采用均方根误差和平均绝对值误差作为误差评价指标,计算这两个指标,验证算法的点预测效果,公式如下;
式中,n为样本个数,为预测值,yi为真实值。
6.根据权利要求1所述的一种基于QR-BLSTM的风电功率超短期预测方法,其特征在于:所述S7中基于点预测结果,训练集再输入的预测误差计算公式如下:
ei=ytru(i)-yfor(i)
式中:ytru(i)表示第i个真实风电功率值,yfor(i)表示第i个训练集预测风电功率值。
7.根据权利要求1所述的一种基于QR-BLSTM的风电功率超短期预测方法,其特征在于:所述S10中计算预测区间的上包络线和下包络线,结合已得出的条件分位数结果,得到风电功率概率预测区间,完成风电功率概率预测:
式中:upi和lowi分别表示预测区间的上包络线和下包络线,表示置信度为α下的分位数,/>表示训练集预测的标准差;
以覆盖度、平均区间宽度和综合得分对概率预测区间的预测性能进行分析。
8.根据权利要求7所述的一种基于QR-BLSTM的风电功率超短期预测方法,其特征在于:
所述覆盖度(P)公式如下:
式中,upi和lowi分别为第i个验证样本概率预测的上限与下限,ytru(i)为第i个验证样本的功率值;
平均区间宽度(M)公式如下:
式中,upi和lowi分别为第i个验证样本概率预测的上限与下限,yi为第i个验证样本的功率值;
综合得分(sc)公式如下:
式中:表示置信度为1-α下在第i个点处的区间宽度,sc(i)表示在第i个点处的综合得分;
则n个数据点的平均综合得分可粗略估计公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310550524.7A CN116565850A (zh) | 2023-05-16 | 2023-05-16 | 一种基于qr-blstm的风电功率超短期预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310550524.7A CN116565850A (zh) | 2023-05-16 | 2023-05-16 | 一种基于qr-blstm的风电功率超短期预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116565850A true CN116565850A (zh) | 2023-08-08 |
Family
ID=87489512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310550524.7A Pending CN116565850A (zh) | 2023-05-16 | 2023-05-16 | 一种基于qr-blstm的风电功率超短期预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116565850A (zh) |
-
2023
- 2023-05-16 CN CN202310550524.7A patent/CN116565850A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112949945B (zh) | 一种改进双向长短期记忆网络的风电功率超短期预测方法 | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN111260136A (zh) | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 | |
CN110942194A (zh) | 一种基于tcn的风电预测误差区间评估方法 | |
CN111639823B (zh) | 一种基于特征集构建的建筑冷热负荷预测方法 | |
CN113505923B (zh) | 一种地区电网短期负荷预测方法及系统 | |
CN109143408B (zh) | 基于mlp的动态区域联合短时降水预报方法 | |
CN111915092A (zh) | 基于长短时记忆神经网络的超短期风电功率预测方法 | |
CN107463993A (zh) | 基于互信息‑核主成分分析‑Elman网络的中长期径流预报方法 | |
CN113344288B (zh) | 梯级水电站群水位预测方法、装置及计算机可读存储介质 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN115374995A (zh) | 一种分布式光伏、小风电场站功率预测方法 | |
CN117977568A (zh) | 基于嵌套lstm和分位数计算的电力负荷预测方法 | |
CN115115125A (zh) | 基于深度学习融合模型的光伏功率区间概率预测方法 | |
CN115796004A (zh) | 一种基于SLSTM和MLSTNet模型的光伏电站超短期功率智能预测方法 | |
CN115358437A (zh) | 基于卷积神经网络的供电负荷预测方法 | |
CN115759389A (zh) | 基于天气类型的相似日组合策略的日前光伏功率预测方法 | |
CN110555566B (zh) | 一种基于b样条分位数回归的光电概率密度预测方法 | |
CN116757321A (zh) | 太阳直接辐射量预测方法、系统、设备及存储介质 | |
CN115907131A (zh) | 一种北方地区电采暖负荷预测模型搭建方法和系统 | |
CN116565850A (zh) | 一种基于qr-blstm的风电功率超短期预测方法 | |
CN115965177A (zh) | 基于注意力机制改进的自回归误差补偿风电功率预测方法 | |
CN113191526A (zh) | 一种基于随机敏感度的短期风速区间多目标优化预测方法及系统 | |
CN112712213A (zh) | 一种集中空调住宅深度迁移学习能耗预测方法及系统 | |
CN113256018B (zh) | 一种基于条件分位数回归模型的风电功率超短期概率预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |