CN116646927A - 一种基于分段滤波与纵横聚类的风电功率预测方法 - Google Patents
一种基于分段滤波与纵横聚类的风电功率预测方法 Download PDFInfo
- Publication number
- CN116646927A CN116646927A CN202310627483.7A CN202310627483A CN116646927A CN 116646927 A CN116646927 A CN 116646927A CN 202310627483 A CN202310627483 A CN 202310627483A CN 116646927 A CN116646927 A CN 116646927A
- Authority
- CN
- China
- Prior art keywords
- data
- clustering
- longitudinal
- algorithm
- wind power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000001914 filtration Methods 0.000 title claims abstract description 31
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 79
- 241000245665 Taraxacum Species 0.000 claims abstract description 41
- 235000005187 Taraxacum officinale ssp. officinale Nutrition 0.000 claims abstract description 41
- 230000009194 climbing Effects 0.000 claims abstract description 23
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 230000001932 seasonal effect Effects 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000008569 process Effects 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 21
- 238000007906 compression Methods 0.000 claims description 19
- 230000002159 abnormal effect Effects 0.000 claims description 16
- 230000006835 compression Effects 0.000 claims description 15
- 238000011423 initialization method Methods 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 13
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 claims description 13
- 238000009826 distribution Methods 0.000 claims description 12
- 230000001174 ascending effect Effects 0.000 claims description 8
- 210000002569 neuron Anatomy 0.000 claims description 8
- 230000000630 rising effect Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 230000005653 Brownian motion process Effects 0.000 claims description 6
- 238000005537 brownian motion Methods 0.000 claims description 6
- 230000000739 chaotic effect Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 241000772415 Neovison vison Species 0.000 claims description 3
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000009827 uniform distribution Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000009499 grossing Methods 0.000 claims description 2
- 238000011161 development Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
- H02J3/381—Dispersed generators
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Power Engineering (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于分段滤波与纵横聚类的风电功率预测方法,首先获取风电功率的历史数据,SDT进行爬坡识别,分别使用MEEMD滤波、smooth滤波对数据进行预处理,得到分段滤波后的波形;采用纵横聚类对数据进行聚类,纵向聚类通过日内预聚类、单日间再聚类和纵向时间单元的三步聚类来实现全年细化季节特性聚类,同时将纵向类内的全部数据联排聚类,实现小时间尺度下的精细横向聚类;使用变分自动编码器对聚类后的数据进行特征提取,然后使用改进的蒲公英优化算法优化Transformer预测模型参数,预测得到风电功率。本发明解决了数据波动性对预测精度的影响,其次考虑单日相似性与细化季节特性的实际情况,有效提高了预测风电功率的精确性和鲁棒性。
Description
技术领域
本发明属于风电功率预测技术邻域,具体涉及一种基于分段滤波与纵横聚类的风电功率预测方法。
背景技术
随着我国经济发展越来越好,社会各行各业和人们对能源需求也不断增加。而传统能源已不能满足人们的需求,再加上传统能源对环境的污染也比较严重,风电作为一种新型可再生能源在我国发展迅速,发展风电对于保障能源安全,调整能源结构,减轻环境污染,实现可持续发展等都具有非常重要的意义。然而,风电的不稳定性是风电系统与主电网结合的障碍之一,为了更安全有效的利用持续增长的风能,高精度的风电功率预测方法对电网运行有着重要意义。提前对风速和风电功率进行准确的预测,可以缓解电力系统调峰、调频的压力,有效提高电网对风电的接纳能力。
风电并网给电力系统的调度和安全稳定带来很大的挑战,使得风电功率的准确预测变得尤为重要。目前,风电功率预测方法主要分为统计方法和机器学习方法等,而统计方法只对波动规律明显、较平稳的功率可取得较好的预测,然而风能和风电功率具有较强的随机性和波动性,导致这种方法对风电功率预测的精确度差。考虑到客观因素等的影响,就会涉及到高维特征,而传统的功率预测方法在实际运用中,预测方法的训练周期长,运算复杂,预测准确性不高。并且风能在不同季节以及一天内不同时间段的差别大,普通的聚类和预测方法都不能满足实际的情况,这对风电功率预测也有很大的影响。
发明内容
发明目的:为了解决背景技术中所提出的问题,本发明提供一种基于分段滤波与纵横聚类的风电功率预测方法,使用纵横聚类对风电功率进行聚类,从而考虑到了不同季节以及单日内风电功率变化,使用VAE对聚类后的数据进行特征提取,通过改进的DO算法对Transformer模型进行优化,来实现对风电功率的准确预测。
技术方案:本发明提出一种基于分段滤波与纵横聚类的风电功率预测方法,包括以下步骤:
(1)对风电场的原始功率数据进行采集,并将采集后的数据进行预处理;
(2)采用改进的蒲公英优化算法优化旋转门算法,对预处理后的数据进行爬坡事件的特征识别,然后把识别后的数据根据是否爬坡分成两类;
(3)将识别为爬坡的数据通过MEEMD滤波,将非爬坡的数据通过smooth滤波;
(4)将滤波后的数据采用纵横聚类策略对其进行聚类,纵向聚类通过日内预聚类、单日间再聚类和纵向时间单元的三步聚类来实现全年细化季节特性聚类,同时将纵向类内的全部数据联排聚类,实现小时间尺度下的精细横向聚类;
(5)使用变分自动编码器对聚类后的数据分别进行特征提取;
(6)构建Transformer预测模型,并采用改进的蒲公英优化算法对Transformer预测模型参数进行优化;将特征提取后的数据输入优化后的Transformer预测模型,对未来风电功率进行预测。
进一步地,所述步骤(2)实现过程如下:
(2.1)首先进行初始化,其中K1new为初始化的上旋转门斜率,K2new为初始化的下旋转门斜率,公式如下所示:
设X为数据序列,式中,x0为上一压缩过程终点,x1为下一数目据点,xi为第i数目据点;T0,T1,Ti分别为x0,x1,xi所对应的时刻点,E是压缩阈值,T是原始数据时间序列,x是对应的原始数据序列;
(2.2)分别计算Ti上旋转门斜率K1和下旋转门斜率K2,如公式所示:
(2.3)更新K1new和K2new的值:
K1new=Max(K1,K1new);K2new=Max(K2,K2new) (3)
(2.4)根据K1new和K2new大小判断是否压缩结束;若k1new≥k2new则此过程压缩结束,储存ti-1时刻所对应数据值pi-1,并且返回(2.1),开始下一个过程的压缩;如果k1new≤k2new,则继续本次压缩,并返回步骤(2.2),此时i=i+1;
(2.5)采用改进的蒲公英优化算法优化旋转门算法的容差系数△E的值,△E是门的高度,即容差系数,经过旋转门算法压缩后,得到新的数据序列:
DO算法根据蒲公英种子成熟时进行长距离飞行,寻找最优降落位置的特性分为上升阶段、下降阶段和着陆阶段,三个阶段采用不同的策略进行寻优过程,△E在算法中对应于适应度值,到算法不断迭代计算出最优适应度值后,输出容差系数△E的值。
进一步地,所述步骤(2.5)包括以下步骤:
(2.5.1)设置DO算法的参数包含:最大迭代次数、种群规模、维度大小、搜索空间的上界与下界;
(2.5.2)使用Logistic混沌初始化方法代替DO算法中的随机初始化方法,使蒲公英种群能够进行更广泛的初步搜索,其公式如下:
其中,L(n+1)是更新后个体位置,λ是控制变量;
(2.5.3)上升阶段在风速、空气湿度等的影响下,根据不同的天气状况进行局部飘落,通过计算种子位置的适应度值来寻找最优适应度值,从而输出适应度值所对应的容差系数的值:
晴天:在晴朗的天气,风速可以认为是对数正态分布,DO算法强调搜索,在搜索时,蒲公英种子被风随机吹到各个位置,其更新公式为:
Ft+1=Ft+α*vx*vy*lnY*(Fs-Ft) (5)
其中,Ft表示迭代t次时蒲公英种子的位置;Fs表示迭代t次时在搜索空间中随机选择的位置,InY表示符合μ=0和σ2=1的对数正态分布,α是用于调整搜索步长的自适应参数,在[0,1]之间的随机波动;
雨天:蒲公英种子进行局部搜索,位置更新公式为:
Ft+1=Ft*ε (6)
其中,ε用于限定局部搜索范围,呈“向下凸”振荡;
蒲公英种子在上升期的数学表达式为:
(2.5.4)下降阶段:在本阶段DO算法也强调搜索,采用布朗运动来模拟蒲公英的运动轨迹,为了反映蒲公英下降的稳定性,采用了上升阶段后的平均位置信息,对应的数学表达式为:
Ft+1=Ft-α*βt*(Fmean_t-α*βt*Ft) (8)
其中,βt表示布朗运动,是标准正态分布的随机数,Fmean_tt为群体的平均位置,表达式为:
(2.5.5)着陆阶段:在本阶段DO算法重点是开发,基于前两个阶段,随着种群的进化,最终可以找到全局最优解,即是最优容差系数,然后就可以通过旋转门优化算法对爬坡事件进行识别,采用莱维飞行进行选择,位置更新公式:
Ft+1=Felite+levy(λ)*α*(Felite-Ft*δ) (10)
其中,Felite表示当前迭代最优位置,δ为一个线性递增的参数,等于2t/T,Levy飞行的公式计算:
β是一个介于[0,2]之间的随机数,s是一个固定常数0.01,ω和t为[0,1]之间的随机数;
(2.5.6)判断最大迭代次数是否达到算法终止条件,若未达到则转到(2.5.3),最终结束运行并输出最优结果。
进一步地,所述步骤(3)实现过程如下:
(3.1)将一组模值相同,符号相反的白噪声信号vi(t)和-vi(t)添加进实际风电功率信号x(t)中,如公式所示:
式中,vi(t)表示白噪声:ai表示白噪声幅值,n为添加白噪声的对数,集合中白噪声信号的数目为2n;
(3.2)对集合中每对风电功率信号x+(t)和x-(t)进行EMD分解,可获得一组IMF分量:
其中,hij +(t),hij -(t)表示i个信号的第j阶IMF分量;
(3.3)对多组分量集合平均,得到各阶IMF分量:
式中,p(t)表示第j阶的IMF分量;
(3.4)通过排列熵来识别hj(t)是否为异常信号;如果信号随机性越大,排
列熵越大;设置阈值判断信号是否为异常信号或噪声信号;
(3.5)用实际风电功率信号减去异常信号和噪声信号,然后加上滤波后的噪声信号,得到滤波后的风电功率信号:
p(t)=x(t)-x'(t)+x”(t) (15)
其中,p(t)表示滤波之后的风电功率信号,x(t)是原始信号,x'(t)为所有异常信号和噪声信号之和,x”(t)为小波滤波后的噪声信号;
(3.6)将非爬坡的数据通过smooth滤波,smooth滤波的作用是对序列进行平滑处理,以及信号的降噪;其滤波原理是将连续的采样数据看成一个长度固定为N的队列,在新的一次测量后,将队列的首数据去掉,其余N-1个数据依次前移,并将新的采样数据插入,作为新队列的尾;然后对这个队列进行算术运算,并将其结果做为本次测量的结果;假设输入为x,输出为y,则移动平均滤波器计算公式为:
进一步地,所述步骤(4)实现过程如下:
(4.1)日内预聚类,以日内各最小时间间隔T为样本,构造特征向量,如下表所示:
其中,i为最小时间间隔序列号;Rmaxi和Rmini分别为单日内第i个最小时间间隔Ti内最大有功功率值和最小有功功率值,为Ti内有功功率平均值;然后对样本进行归一化处理对数据进行变换:
其中,Yij为第i个样本的第j个属性的采样值,Yij'为第i个样本的第j个属性的规范化值;mj和Mj分别为第j个属性的最大值和最小值;Mjnew和mjnew分别是j的新映射范围上下限;
(4.2)对预聚类之后的数据进行单日间再聚类,经过日内预聚类,对单日间再聚类的特征向量进行构建,来表示日内各T所属类别及日内总聚类数,公式如下:
其中,k是日序列号;DTnk为第k日的时段Tn所属类别聚类中心的,n为单日按最小时间间隔T分成的总段数;Dck为第k天的聚类数;Dmaxk和Dmink分别为第k天日内最大有功功率值和最小有功功率值,为日平均有功功率值;Ds2k为日有功功率样本方差;将全年数据分为J类,可获得全年各日所属类别;
(4.3)将全年纵向时间轴数据以纵向时间单元TZN为单位等分为L段,TZN选择按季度划分;根据单日间再聚类获得的比例特征来构建特征向量,最后获得能反映细化季节特性的聚类结果;经过单日间再聚类,将全年数据分为J类,统计纵向时间单元TZN内各类所占类别,以表示该时段内部单日组成结构和波动趋势,辅以表征功率波动的统计量,构成特征向量,
其中,h为纵向时间单元序号;Sh1,Sh2,...,Shj为统计第h个纵向时间单元内第1,2,...,j各类所占比例;Smaxh和Sminh分别为第h个纵向时间单元内的最大有功功率和最小有功功率,和Ss2h分别为第h个纵向时间单元有功功率均值和方差;根据TZN的分类,把全年数据客观分成L类;
(4.4)在纵向聚类之后,对数据进行横向聚类,将属于同一纵向类的全部数据首尾相连,横列组成横向连续数据,按按横向时间单元THN统一分为H段,对全部数据进行横向聚类;利用THN内最小时间间隔T的变化率序列来表示横向数据波动趋势,辅以有功功率统计量,来构成特征向量:
其中,p为横向时间单元序列号;b为TZN中最小时间间隔数;Wmaxp,Wminp分别为第p个横向时间单元内的最大有功功率和最小有功功率;和Ws2p分别为第p个横向时间单元内平均有功功率和方差;ηpb为TZN内b个最小时间间隔波动率序列,其计算公式为:
其中:i为最小时间间隔序列号;Pw为负荷与风电组成的根母线有功功率序列;{}内为根母线功率序列号;THN为横向时间单元;
(4.5)通过横向聚类,同一纵向类的全部数据被聚为q类,每类可由各自的聚类中心表示;通过氏距离判断该时段样本与历史样本中各类聚类中心特征向量的相似度:
其中,ρ(A,B)为序列A与序列B的欧氏距离。
进一步地,所述步骤(5)实现过程如下:
(5.1)数据编码,编码器包含4个卷积层,4个卷积层后连接一256个神经元的全连接层,将均值、方差对数所对应的全连接层神经元个数设为10;
(5.2)数据解码,解码器输入维数为10,首先包含一个256个神经元的全连接层,后连接9216个神经元的全连接层;
(5.3)梯度反向传播:通过解码输出数据与输入原始数据计算损失函数,通过反向传播更新网络权重,网络权重采用Glorot均匀分布初始化方法,反复训练后解码器学习到了数据的映射规律;
(5.4)生成数据,即提取解码器作为VAE生成模型,从高斯分布中抽取一组特征向量作为模型输入,就能输出符合训练数据集概率分布的全新数据。
进一步地,步骤(6)所述Transformer预测模型包含编码模块,解码模块,前馈神经网络和注意力机制;编码模块包含两层,一个self-attention层和一个前馈神经网络,self-attention能获取上下文的信息;解码模块也包含self-attention层和前馈神经网络,在这中间还有一层attention层,可以帮助节点获取到目前要关注的重点内容;self-attention处理完数据之后,把数据送给前馈神经网络,得到输出会输入到下一个encoder。
进一步地,所述步骤(6)实现过程如下:
(6.1)DO算法可以对Transformer模型最优超参数进行寻找,随着不断迭代,DO算法中出现适应度值很高的个体即超参数的最优值;聚类和VAE特征提取后的风电功率数据是Transformer的输入,然后经过DO算法寻找的最优超参数来优化模型对风电功率的预测精度;
(6.2)使用Logistic混沌初始化方法代替DO算法中的随机初始化方法,使蒲公英种群能够进行更广泛的初步搜索;
(6.3)其中上升阶段通过计算种子位置的适应度值来寻找最优超参数,在晴天,算法模拟蒲公英种子更面向全局搜索,超参数结果为全局最优;在雨天,则进行局部搜索,超参数结果为局部最优,从而通过输入的风电功率进行预测;
(6.4)着陆阶段:随着种群的进化,最终可以找到全局最优解,即是最优超参数,然后就可以通过模型对风电功率进行预测;
(6.5)判断最大迭代次数是否达到算法终止条件,若未达到则转到步骤(7.3),最终结束运行并输出最优结果。
有益效果:与现有技术相比,本发明的有益效果:
1.本发明针对风电功率的波动性和随机性,用SDT旋转门算法对数据进行爬坡识别,对识别为爬坡的波动性大的数据通过MEEMD滤波,将非爬坡的数据通过smooth滤波,在一定程度上降低了波动性对功率预测的影响。
2.本发明针对在不同季节以及一天内不同时间段的风能差别大导致风电功率不确定性影响比较大,建立了一种兼顾日间相似性与细化季节特性的纵横聚类分析,考虑风电功率实际情况,提高了模型精确性和鲁棒性。
3.本发明提出了一种基于条件变分自动编码器的风电出力随机场景生成方法,无监督地学习风电训练数据的时间、空间及波动性特点,并按条件高效地生成符合特点的数据。降低了数据复杂度,简化了运算并且不减少预测精度。
4、本发明提出用Transformer模型对风电功率进行预测,使用混沌初始化种群增强DO算法的优化能力,通过改进的DO算法对Transformer模型优化,提高了模型预测的准确度。
附图说明
图1为本发明的流程图;
图2为MEEMD滤波流程图;
图3为纵横聚类方法的流程图;
图4为Transformer模型结构图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
本发明提出一种基于分段滤波与纵横聚类的风电功率预测方法,如图1所示,包括以下步骤:
步骤1:对采集后的数据进行预处理,对风电功率异常数据进行删除,以及使用插值法对缺失数据进行处理。
步骤2:采用改进的蒲公英算法优化旋转门算法,对预处理后的数据进行爬坡事件的特征识别,然后把识别后的数据根据是否爬坡分成两类具体步骤如下:
改进的旋转门算法(SDT)对数据进行爬坡事件的特征识别,设X为数据序列,x0为上一压缩过程终点,x1为下一数目据点,xi为第i数目据点。T为时间序列,T0,T1,Ti分别为x0,x1,xi所对应的时刻点。△E是门的高度,即容差系数,经过旋转门算法压缩后得到新数据序列,斜率用K表示,具体步骤如下:
(2.1)首先进行初始化,其中K1new为初始化的上旋转门斜率,K2new为初始化的下旋转门斜率,公式如下所示:
设X为数据序列,式中,x0为上一压缩过程终点,x1为下一数目据点,xi为第i数目据点;T0,T1,Ti分别为x0,x1,xi所对应的时刻点,E是压缩阈值,T是原始数据时间序列,x是对应的原始数据序列;
(2.2)分别计算Ti上旋转门斜率K1和下旋转门斜率K2,如公式所示:
(2.3)更新K1new和K2new的值:
K1new=Max(K1,K1new);K2new=Max(K2,K2new) (3)
(2.4)根据K1new和K2new大小判断是否压缩结束;若k1new≥k2new则此过程压缩结束,储存ti-1时刻所对应数据值pi-1,并且返回(2.1),开始下一个过程的压缩;如果k1new≤k2new,则继续本次压缩,并返回步骤(2.2),此时i=i+1。
(2.5)采用改进的蒲公英优化算法DO优化旋转门算法的容差系数△E的值,
△E在算法中对应于适应度值,到算法不断迭代计算出最优适应度值后,输出容差系数△E的值。通过对适应度值的计算来优化旋转门算法包括以下步骤:
DO算法根据蒲公英种子成熟时进行长距离飞行,寻找最优降落位置的特性分为上升阶段、下降阶段和着陆阶段,三个阶段采用不同的策略进行寻优过程,△E在算法中对应于适应度值,到算法不断迭代计算出最优适应度值后,输出容差系数△E的值。通过对适应度值的计算来优化旋转门算法包括以下步骤:
(2.5.1)设置DO算法的参数包含:最大迭代次数、种群规模、维度大小、搜索空间的上界与下界。
(2.5.2)使用Logistic混沌初始化方法代替DO算法中的随机初始化方法,使蒲公英种群能够进行更广泛的初步搜索,其公式如下:
其中,L(n+1)是更新后个体位置,λ是控制变量。
(2.5.3)上升阶段在风速、空气湿度等的影响下,根据不同的天气状况进行局部飘落,通过计算种子位置的适应度值来寻找最优适应度值,从而输出适应度值所对应的容差系数的值:
晴天:在晴朗的天气,风速可以认为是对数正态分布,DO算法强调搜索,在搜索时,蒲公英种子被风随机吹到各个位置,其更新公式为:
Ft+1=Ft+α*vx*vy*lnY*(Fs-Ft) (5)
其中,Ft表示迭代t次时蒲公英种子的位置,Fs表示迭代t次时在搜索空间中随机选择的位置,InY表示符合μ=0和σ2=1的对数正态分布,α是用于调整搜索步长的自适应参数,在[0,1]之间的随机波动。
雨天:蒲公英种子进行局部搜索,位置更新公式为:
Ft+1=Ft*ε (6)
其中,ε用于限定局部搜索范围,呈“向下凸”振荡。
综合在上升阶段的不同天气状况,并且为了使算法更面向全局搜索,确认其适应度值对应的容差系数结果为全局最优,截点设置为1.5,蒲公英种子在上升期的数学表达式为:
(2.5.4)下降阶段。在本阶段DO算法也强调搜索,采用布朗运动来模拟蒲公英的运动轨迹。为了反映蒲公英下降的稳定性,采用了上升阶段后的平均位置信息;对应的数学表达式为:
Ft+1=Ft-α*βt*(Fmean_t-α*βt*Ft) (8)
其中,βt表示布朗运动,是标准正态分布的随机数,Fmean_tt为群体的平均位置,表达式为:
(2.5.5)着陆阶段。在本阶段DO算法重点是开发。基于前两个阶段,随着种群的进化,最终可以找到全局最优解。即是最优容差系数,然后就可以通过旋转门优化算法对爬坡事件进行识别。采用莱维飞行进行选择。位置更新公式:
Ft+1=Felite+levy(λ)*α*(Felite-Ft*δ) (10)
其中,Felite表示当前迭代最优位置,δ为一个线性递增的参数,等于2t/T,Levy飞行的公式计算:
β是一个介于[0,2]之间的随机数(本文中β=1.5),s是一个固定常数0.01。ω和t为[0,1]之间的随机数。
(2.5.6)判断最大迭代次数是否达到算法终止条件,若未达到则转到(2.5.3),最终结束运行并输出最优结果。
步骤3:如图2所示,将识别为爬坡的数据通过MEEMD滤波,将非爬坡的数据通过smooth滤波。
MEEMD将实际的风电功率数据分解成由高频到低频的一系列IMF分量。通过计算IMF分量的排列熵,IMF分量可划分为异常分量,噪声分量以及规则分量三个部分。直接剔除异常信号。对小波滤波后的噪声分量和规则分量进行信号重构,重构后的信号即为经过MEEMD滤波后的风电功率数据。
步骤3.1:将一组模值相同,符号相反的白噪声信号vi(t)和-vi(t)添加进实际风电功率信号x(t)中,如公式所示。
式中,vi(t)表示白噪声:ai表示白噪声幅值,ai一般取值为原始信号标准差的0.15到0.25倍:n为添加白噪声的对数,集合中白噪声信号的数目为2n。
步骤3.2:对集合中每对风电功率信号x+(t)和x-(t)进行EMD分解,可获得一组IMF分量,如式所示
其中,hij +(t),hij -(t)表示i个信号的第j阶IMF分量。
步骤3.3:对多组分量集合平均,得到各阶IMF分量,如公式所示。
式中,p(t)表示第j阶的IMF分量。
步骤3.4:通过排列熵来识别hj(t)是否为异常信号。如果信号随机性越大,排列熵越大。设置阈值判断信号是否为异常信号或噪声信号。熵值介于0.5到0.7的信号归类为噪声信号,将熵值大于0.7的信号归类为异常信号。
步骤3.5用实际风电功率信号减去异常信号和噪声信号,然后加上滤波后的噪声信号,得到滤波后的风电功率信号。如公式所示。
p(t)=x(t)-x'(t)+x”(t) (15)
其中,p(t)表示滤波之后的风电功率信号,x(t)是原始信号,x'(t)为所有异常信号和噪声信号之和,x”(t)为小波滤波后的噪声信号。
将非爬坡的数据通过smooth滤波,假设输入为x,输出为y,则移动平均滤波器计算公式为:
步骤4:如图3所示,将滤波后的数据采用纵横聚类策略对其进行聚类,纵向聚类通过日内预聚类、单日间再聚类和纵向时间单元的三步聚类来实现全年细化季节特性聚类,同时将纵向类内的全部数据联排聚类,实现小时间尺度下的精细横向聚类。
利用纵横聚类的方法是将步骤3得到的滤波之后的数据进行小时间尺度横向聚类对日段聚类和大时间尺度纵向聚类对季节性和年段聚类,横向以纵向聚类可实现在时间连续性基础上,纵横聚类兼顾日间相似性与差异性规律的细化季节特性聚类分析,提高了模型精确性和鲁棒性,聚类采用K-means算法。
对数据先进行纵向聚类,纵向聚类分成三步,首先确定最小时间间隔T,将单日内各T按照功率波动特性进行聚类分析,来获得单日整体特性;再根据全年内各日特性实现相似日聚类;最终再根据日间聚类结果获得的比例特征来实现纵向时间单元聚类。其具体步骤如下:
(4.1)首先是日内预聚类,以日内各最小时间间隔T为样本,构造特征向量,如下表所示:
其中,i为最小时间间隔序列号;Rmaxi和Rmini分别为单日内第i个最小时间间隔Ti内最大有功功率值和最小有功功率值,为Ti内有功功率平均值。然后对样本进行归一化处理对数据进行变换:
其中,Yij为第i个样本的第j个属性的采样值,Yij'为第i个样本的第j个属性的规范化值;mj和Mj分别为第j个属性的最大值和最小值;Mjnew和mjnew分别是j的新映射范围上下限,分别取1和0。
(4.2)对预聚类之后的数据进行单日间再聚类,经过日内预聚类,对单日间再聚类的特征向量进行构建,来表示日内各T所属类别及日内总聚类数等,公式如下:
其中,k是日序列号;DTnk为第k日的时段Tn所属类别聚类中心的,n为单日按最小时间间隔T分成的总段数;Dck为第k天的聚类数;Dmaxk和Dmink分别为第k天日内最大有功功率值和最小有功功率值,为日平均有功功率值;Ds2k为日有功功率样本方差。构造后按式4先进行归一化处理再聚类,将全年数据分为J类,可获得全年各日所属类别。
(4.3)将全年纵向时间轴数据以纵向时间单元TZN为单位等分为L段,TZN选择按季度划分。经过单日间再聚类,全年数据按日聚为J类,统计纵向时间单元TZN内各类所占类别,以表示该时段内部单日组成结构和波动趋势,辅以表征功率波动的统计量,构成特征向量,
其中,h为纵向时间单元序号;Sh1,Sh2,...,Shj为统计第h个纵向时间单元内第1,2,...,j各类所占比例;Smaxh和Sminh分别为第h个纵向时间单元内的最大有功功率和最小有功功率,和Ss2h分别为第h个纵向时间单元有功功率均值和方差。按公式10归一化处理后聚类,可把全年数据客观分成L类。
(4.4)在纵向聚类之后,对数据进行横向聚类,主要做法是将属于同一纵向类的全部数据首尾相连,横列组成横向连续数据,按按横向时间单元THN统一分为H段,对全部数据进行横向聚类。利用THN内最小时间间隔T的变化率序列来表示横向数据波动趋势,辅以有功功率统计量,来构成特征向量:
其中,p为横向时间单元序列号;b为TZN中最小时间间隔数;Wmaxp,Wminp分别为第p个横向时间单元内的最大有功功率和最小有功功率;和Ws2p分别为第p个横向时间单元内平均有功功率和方差。ηpb为TZN内b个最小时间间隔波动率序列,以ηpb为例,其计算公式为
其中,i为最小时间间隔序列号;Pw为负荷与风电组成的根母线有功功率序列;{}内为根母线功率序列号;THN为横向时间单元。
(4.5)通过横向聚类,同一纵向类的全部数据被聚为q类,每类可由各自的聚类中心表示。当研究某时段负荷模型时,只需利用该时段波动数据形成下式的特征向量,通过式15欧氏距离判断该时段样本与历史样本中各类聚类中心特征向量的相似度,认为该样本属于相似度高(欧式距离小)的历史样本类。
其中,ρ(A,B)为序列A与序列B的欧氏距离。
步骤5:将聚类后的数据根据不同季度的负荷量进行加权,加大负荷量大的季度的权重,然后采用变分自动编码器(VAE)对聚类后的数据进行特征提取。
数据编码。其基本思想是利用深度神经网络的拟合能力,通过编码器(encoder)将输入数据降维成一组特征向量。
数据解码。利用解码器(decoder)将这组特征向量还原成输入数据。
梯度反向传播。通过解码输出数据与输入原始数据计算损失函数,通过反向传播更新网络权重,网络权重采用Glorot均匀分布初始化方法,反复训练后解码器学习到了数据的映射规律。训练的批梯度下降(mini-batch)大小为32,使用Adam作为优化器。除输出层使用Sigmoid外,其他激活函数全部采用ReLu。
生成数据,即提取解码器作为VAE生成模型,从高斯分布中抽取一组特征向量作为模型输入,就能输出符合训练数据集概率分布的全新数据。
步骤6:构建Transformer预测模型,并采用改进的蒲公英优化算法对Transformer预测模型参数进行优化;将特征提取后的数据输入优化后的Transformer预测模型,对未来风电功率进行预测。
图4为Transformer模型结构图,包含编码模块,解码模块,前馈神经网络和注意力机制。编码模块包含两层,一个self-attention层和一个前馈神经网络,self-attention能获取上下文的信息。解码模块也包含self-attention层和前馈神经网络,在这中间还有一层attention层,可以帮助节点获取到目前要关注的重点内容。self-attention处理完数据之后,把数据送给前馈神经网络,得到输出会输入到下一个encoder。
使用改进的蒲公英优化算法对Transformer模型中的超参数进行优化,具体步骤如下:
DO算法可以对Transformer模型最优超参数进行寻找,随着不断迭代,DO算法中出现适应度值很高的个体即超参数的最优值。聚类和VAE特征提取后的风电功率数据是Transformer的输入,然后经过DO算法寻找的最优超参数来优化模型对风电功率的预测精度。
使用Logistic混沌初始化方法代替DO算法中的随机初始化方法,使蒲公英种群能够进行更广泛的初步搜索。
其中上升阶段通过计算种子位置的适应度值来寻找最优超参数,在晴天,算法模拟蒲公英种子更面向全局搜索,超参数结果为全局最优,在雨天,则进行局部搜索,超参数结果局部最优,从而通过输入的风电功率进行预测。
着陆阶段。随着种群的进化,最终可以找到全局最优解。即是最优超参数,然后就可以通过模型对风电功率进行预测。达到算法终止条件,最终结束运行并输出最优结果。
上述实施方式只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。
Claims (8)
1.一种基于分段滤波与纵横聚类的风电功率预测方法,其特征在于,包括以下步骤:
(1)对风电场的原始功率数据进行采集,并将采集后的数据进行预处理;
(2)采用改进的蒲公英优化算法优化旋转门算法,对预处理后的数据进行爬坡事件的特征识别,然后把识别后的数据根据是否爬坡分成两类;
(3)将识别为爬坡的数据通过MEEMD滤波,将非爬坡的数据通过smooth滤波;
(4)将滤波后的数据采用纵横聚类策略对其进行聚类,纵向聚类通过日内预聚类、单日间再聚类和纵向时间单元的三步聚类来实现全年细化季节特性聚类,同时将纵向类内的全部数据联排聚类,实现小时间尺度下的精细横向聚类;
(5)使用变分自动编码器对聚类后的数据分别进行特征提取;
(6)构建Transformer预测模型,并采用改进的蒲公英优化算法对Transformer预测模型参数进行优化;将特征提取后的数据输入优化后的Transformer预测模型,对未来风电功率进行预测。
2.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法,其特征在于,所述步骤(2)实现过程如下:
(2.1)首先进行初始化,其中K1new为初始化的上旋转门斜率,K2new为初始化的下旋转门斜率,公式如下所示:
设X为数据序列,式中,x0为上一压缩过程终点,x1为下一数目据点,xi为第i数目据点;T0,T1,Ti分别为x0,x1,xi所对应的时刻点,E是压缩阈值,T是原始数据时间序列,x是对应的原始数据序列;
(2.2)分别计算Ti上旋转门斜率K1和下旋转门斜率K2,如公式所示:
(2.3)更新K1new和K2new的值:
K1new=Max(K1,K1new);K2new=Max(K2,K2new) (3)
(2.4)根据K1new和K2new大小判断是否压缩结束;若k1new≥k2new则此过程压缩结束,储存ti-1时刻所对应数据值pi-1,并且返回(2.1),开始下一个过程的压缩;如果k1new≤k2new,则继续本次压缩,并返回步骤(2.2),此时i=i+1;
(2.5)采用改进的蒲公英优化算法优化旋转门算法的容差系数△E的值,△E是门的高度,即容差系数,经过旋转门算法压缩后,得到新的数据序列:
DO算法根据蒲公英种子成熟时进行长距离飞行,寻找最优降落位置的特性分为上升阶段、下降阶段和着陆阶段,三个阶段采用不同的策略进行寻优过程,△E在算法中对应于适应度值,到算法不断迭代计算出最优适应度值后,输出容差系数△E的值。
3.根据权利要求2所述的一种基于分段滤波与纵横聚类的风电功率预测方法,其特征在于,所述步骤(2.5)包括以下步骤:
(2.5.1)设置DO算法的参数包含:最大迭代次数、种群规模、维度大小、搜索空间的上界与下界;
(2.5.2)使用Logistic混沌初始化方法代替DO算法中的随机初始化方法,使蒲公英种群能够进行更广泛的初步搜索,其公式如下:
其中,L(n+1)是更新后个体位置,λ是控制变量;
(2.5.3)上升阶段在风速、空气湿度等的影响下,根据不同的天气状况进行局部飘落,通过计算种子位置的适应度值来寻找最优适应度值,从而输出适应度值所对应的容差系数的值:
晴天:在晴朗的天气,风速可以认为是对数正态分布,DO算法强调搜索,在搜索时,蒲公英种子被风随机吹到各个位置,其更新公式为:
Ft+1=Ft+α*vx*vy*lnY*(Fs-Ft) (5)
其中,Ft表示迭代t次时蒲公英种子的位置;Fs表示迭代t次时在搜索空间中随机选择的位置,InY表示符合μ=0和σ2=1的对数正态分布,α是用于调整搜索步长的自适应参数,在[0,1]之间的随机波动;
雨天:蒲公英种子进行局部搜索,位置更新公式为:
Ft+1=Ft*ε (6)
其中,ε用于限定局部搜索范围,呈“向下凸”振荡;
蒲公英种子在上升期的数学表达式为:
(2.5.4)下降阶段:在本阶段DO算法也强调搜索,采用布朗运动来模拟蒲公英的运动轨迹,为了反映蒲公英下降的稳定性,采用了上升阶段后的平均位置信息,对应的数学表达式为:
Ft+1=Ft-α*βt*(Fmean_t-α*βt*Ft) (8)
其中,βt表示布朗运动,是标准正态分布的随机数,Fmean_tt为群体的平均位置,表达式为:
(2.5.5)着陆阶段:在本阶段DO算法重点是开发,基于前两个阶段,随着种群的进化,最终可以找到全局最优解,即是最优容差系数,然后就可以通过旋转门优化算法对爬坡事件进行识别,采用莱维飞行进行选择,位置更新公式:
Ft+1=Felite+levy(λ)*α*(Felite-Ft*δ) (10)
其中,Felite表示当前迭代最优位置,δ为一个线性递增的参数,等于2t/T,Levy飞行的公式计算:
β是一个介于[0,2]之间的随机数,s是一个固定常数0.01,ω和t为[0,1]之间的随机数;
(2.5.6)判断最大迭代次数是否达到算法终止条件,若未达到则转到(2.5.3),最终结束运行并输出最优结果。
4.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法,其特征在于,所述步骤(3)实现过程如下:
(3.1)将一组模值相同,符号相反的白噪声信号vi(t)和-vi(t)添加进实际风电功率信号x(t)中,如公式所示:
式中,vi(t)表示白噪声:ai表示白噪声幅值,n为添加白噪声的对数,集合中白噪声信号的数目为2n;
(3.2)对集合中每对风电功率信号x+(t)和x-(t)进行EMD分解,可获得一组IMF分量:
其中,hij +(t),hij -(t)表示i个信号的第j阶IMF分量;
(3.3)对多组分量集合平均,得到各阶IMF分量:
式中,p(t)表示第j阶的IMF分量;
(3.4)通过排列熵来识别hj(t)是否为异常信号;如果信号随机性越大,排列熵越大;设置阈值判断信号是否为异常信号或噪声信号;
(3.5)用实际风电功率信号减去异常信号和噪声信号,然后加上滤波后的噪声信号,得到滤波后的风电功率信号:
p(t)=x(t)-x'(t)+x”(t) (15)
其中,p(t)表示滤波之后的风电功率信号,x(t)是原始信号,x'(t)为所有异常信号和噪声信号之和,x”(t)为小波滤波后的噪声信号;
(3.6)将非爬坡的数据通过smooth滤波,smooth滤波的作用是对序列进行平滑处理,以及信号的降噪;其滤波原理是将连续的采样数据看成一个长度固定为N的队列,在新的一次测量后,将队列的首数据去掉,其余N-1个数据依次前移,并将新的采样数据插入,作为新队列的尾;然后对这个队列进行算术运算,并将其结果做为本次测量的结果;假设输入为x,输出为y,则移动平均滤波器计算公式为:
5.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法,其特征在于,所述步骤(4)实现过程如下:
(4.1)日内预聚类,以日内各最小时间间隔T为样本,构造特征向量,如下表所示:
其中,i为最小时间间隔序列号;Rmaxi和Rmini分别为单日内第i个最小时间间隔Ti内最大有功功率值和最小有功功率值,为Ti内有功功率平均值;然后对样本进行归一化处理对数据进行变换:
其中,Yij为第i个样本的第j个属性的采样值,Yij'为第i个样本的第j个属性的规范化值;mj和Mj分别为第j个属性的最大值和最小值;Mjnew和mjnew分别是j的新映射范围上下限;
(4.2)对预聚类之后的数据进行单日间再聚类,经过日内预聚类,对单日间再聚类的特征向量进行构建,来表示日内各T所属类别及日内总聚类数,公式如下:
其中,k是日序列号;DTnk为第k日的时段Tn所属类别聚类中心的,n为单日按最小时间间隔T分成的总段数;Dck为第k天的聚类数;Dmaxk和Dmink分别为第k天日内最大有功功率值和最小有功功率值,为日平均有功功率值;Ds2k为日有功功率样本方差;将全年数据分为J类,可获得全年各日所属类别;
(4.3)将全年纵向时间轴数据以纵向时间单元TZN为单位等分为L段,TZN选择按季度划分;根据单日间再聚类获得的比例特征来构建特征向量,最后获得能反映细化季节特性的聚类结果;经过单日间再聚类,将全年数据分为J类,统计纵向时间单元TZN内各类所占类别,以表示该时段内部单日组成结构和波动趋势,辅以表征功率波动的统计量,构成特征向量,
其中,h为纵向时间单元序号;Sh1,Sh2,...,Shj为统计第h个纵向时间单元内第1,2,...,j各类所占比例;Smaxh和Sminh分别为第h个纵向时间单元内的最大有功功率和最小有功功率,和Ss2h分别为第h个纵向时间单元有功功率均值和方差;根据TZN的分类,把全年数据客观分成L类;
(4.4)在纵向聚类之后,对数据进行横向聚类,将属于同一纵向类的全部数据首尾相连,横列组成横向连续数据,按按横向时间单元THN统一分为H段,对全部数据进行横向聚类;利用THN内最小时间间隔T的变化率序列来表示横向数据波动趋势,辅以有功功率统计量,来构成特征向量:
其中,p为横向时间单元序列号;b为TZN中最小时间间隔数;Wmaxp,Wminp分别为第p个横向时间单元内的最大有功功率和最小有功功率;和Ws2p分别为第p个横向时间单元内平均有功功率和方差;ηpb为TZN内b个最小时间间隔波动率序列,其计算公式为:
其中:i为最小时间间隔序列号;Pw为负荷与风电组成的根母线有功功率序列;{}内为根母线功率序列号;THN为横向时间单元;
(4.5)通过横向聚类,同一纵向类的全部数据被聚为q类,每类可由各自的聚类中心表示;通过氏距离判断该时段样本与历史样本中各类聚类中心特征向量的相似度:
其中,ρ(A,B)为序列A与序列B的欧氏距离。
6.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法,其特征在于,所述步骤(5)实现过程如下:
(5.1)数据编码,编码器包含4个卷积层,4个卷积层后连接一256个神经元的全连接层,将均值、方差对数所对应的全连接层神经元个数设为10;
(5.2)数据解码,解码器输入维数为10,首先包含一个256个神经元的全连接层,后连接9216个神经元的全连接层;
(5.3)梯度反向传播:通过解码输出数据与输入原始数据计算损失函数,通过反向传播更新网络权重,网络权重采用Glorot均匀分布初始化方法,反复训练后解码器学习到了数据的映射规律;
(5.4)生成数据,即提取解码器作为VAE生成模型,从高斯分布中抽取一组特征向量作为模型输入,就能输出符合训练数据集概率分布的全新数据。
7.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法,其特征在于,步骤(6)所述Transformer预测模型包含编码模块,解码模块,前馈神经网络和注意力机制;编码模块包含两层,一个self-attention层和一个前馈神经网络,self-attention能获取上下文的信息;解码模块包含self-attention层和前馈神经网络,在这中间还有一层attention层,可以帮助节点获取到目前要关注的重点内容;self-attention处理完数据之后,把数据送给前馈神经网络,得到输出会输入到下一个encoder。
8.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法,其特征在于,所述步骤(6)实现过程如下:
(6.1)DO算法可以对Transformer模型最优超参数进行寻找,随着不断迭代,DO算法中出现适应度值很高的个体即超参数的最优值;聚类和VAE特征提取后的风电功率数据是Transformer的输入,然后经过DO算法寻找的最优超参数来优化模型对风电功率的预测精度;
(6.2)使用Logistic混沌初始化方法代替DO算法中的随机初始化方法,使蒲公英种群能够进行更广泛的初步搜索;
(6.3)其中上升阶段通过计算种子位置的适应度值来寻找最优超参数,在晴天,算法模拟蒲公英种子更面向全局搜索,超参数结果为全局最优;在雨天,则进行局部搜索,超参数结果为局部最优,从而通过输入的风电功率进行预测;
(6.4)着陆阶段:随着种群的进化,最终可以找到全局最优解,即是最优超参数,然后就可以通过模型对风电功率进行预测;
(6.5)判断最大迭代次数是否达到算法终止条件,若未达到则转到步骤(7.3),最终结束运行并输出最优结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310627483.7A CN116646927A (zh) | 2023-05-30 | 2023-05-30 | 一种基于分段滤波与纵横聚类的风电功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310627483.7A CN116646927A (zh) | 2023-05-30 | 2023-05-30 | 一种基于分段滤波与纵横聚类的风电功率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116646927A true CN116646927A (zh) | 2023-08-25 |
Family
ID=87639514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310627483.7A Pending CN116646927A (zh) | 2023-05-30 | 2023-05-30 | 一种基于分段滤波与纵横聚类的风电功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116646927A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117117968A (zh) * | 2023-08-28 | 2023-11-24 | 淮阴工学院 | 一种基于数据增强的风电场爬坡事件预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112653142A (zh) * | 2020-12-18 | 2021-04-13 | 武汉大学 | 优化深度Transformer网络的风电功率预测方法及系统 |
CN114611808A (zh) * | 2022-03-18 | 2022-06-10 | 河海大学 | 一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法 |
US20220382263A1 (en) * | 2021-04-30 | 2022-12-01 | Dalian University Of Technology | Distributed industrial energy operation optimization platform automatically constructing intelligent models and algorithms |
CN115587525A (zh) * | 2022-04-12 | 2023-01-10 | 昆明理工大学 | 考虑海上风电多机组时空特性的超短期功率预测模型建立方法 |
CN115688472A (zh) * | 2022-11-15 | 2023-02-03 | 国网江苏省电力有限公司 | 一种基于pasda和fts的风电爬坡事件识别方法 |
CN115729307A (zh) * | 2022-11-17 | 2023-03-03 | 国网湖北省电力有限公司 | 一种基于蒲公英优化算法的光伏阵列重构方法和装置 |
-
2023
- 2023-05-30 CN CN202310627483.7A patent/CN116646927A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112653142A (zh) * | 2020-12-18 | 2021-04-13 | 武汉大学 | 优化深度Transformer网络的风电功率预测方法及系统 |
US20220382263A1 (en) * | 2021-04-30 | 2022-12-01 | Dalian University Of Technology | Distributed industrial energy operation optimization platform automatically constructing intelligent models and algorithms |
CN114611808A (zh) * | 2022-03-18 | 2022-06-10 | 河海大学 | 一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法 |
CN115587525A (zh) * | 2022-04-12 | 2023-01-10 | 昆明理工大学 | 考虑海上风电多机组时空特性的超短期功率预测模型建立方法 |
CN115688472A (zh) * | 2022-11-15 | 2023-02-03 | 国网江苏省电力有限公司 | 一种基于pasda和fts的风电爬坡事件识别方法 |
CN115729307A (zh) * | 2022-11-17 | 2023-03-03 | 国网湖北省电力有限公司 | 一种基于蒲公英优化算法的光伏阵列重构方法和装置 |
Non-Patent Citations (4)
Title |
---|
张旭 等: "广义负荷建模中纵横聚类策略研究", 《中国电机工程学报》, vol. 35, no. 23, pages 6028 - 6038 * |
李文泽: "基于深度学习的风电爬坡识别及短期功率预测技术研究", 《CNKI全国优秀硕士论文全文库》, no. 1, pages 1 - 55 * |
樊闻翰: "基于天气类型划分的短期风电功率预测技术研究", 《CNKI全国优秀硕士论文全文库》, no. 3, pages 1 - 64 * |
王守相 等: "风电和光伏随机场景生成的条件变分自动编码器方法", 《电网技术》, vol. 42, no. 6, pages 1860 - 1867 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117117968A (zh) * | 2023-08-28 | 2023-11-24 | 淮阴工学院 | 一种基于数据增强的风电场爬坡事件预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110414045B (zh) | 基于vmd-gru的短期风速预测方法 | |
CN101414366B (zh) | 基于改进极端学习机方法的电力系统短期负荷预测方法 | |
CN110751318B (zh) | 一种基于ipso-lstm的超短期电力负荷预测方法 | |
CN109063911A (zh) | 一种基于门控循环单元网络的负荷聚合体分组预测方法 | |
CN110717610B (zh) | 一种基于数据挖掘的风电功率预测方法 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN109117992B (zh) | 基于wd-la-wrf模型的超短期风功率预测方法 | |
CN113344288B (zh) | 梯级水电站群水位预测方法、装置及计算机可读存储介质 | |
CN106778838A (zh) | 一种预测空气质量的方法 | |
CN111401755A (zh) | 基于马尔科夫链的多新能源出力场景生成方法、装置及系统 | |
CN113554466A (zh) | 一种短期用电量预测模型构建方法、预测方法和装置 | |
CN115689008A (zh) | 基于集合经验模态分解的CNN-BiLSTM短期光伏功率预测方法及其系统 | |
CN114757427A (zh) | 自回归修正的lstm智能风电场超短期功率预测方法 | |
CN115293400A (zh) | 一种电力系统负荷预测方法及系统 | |
CN114912666A (zh) | 一种基于ceemdan算法和注意力机制的短时客流量预测方法 | |
CN116646927A (zh) | 一种基于分段滤波与纵横聚类的风电功率预测方法 | |
CN115115125A (zh) | 基于深度学习融合模型的光伏功率区间概率预测方法 | |
CN113627070A (zh) | 一种短期光伏功率预测方法 | |
CN116702937A (zh) | 一种基于K-means均值聚类及优化BP神经网络的光伏出力日前预测方法 | |
CN115409369A (zh) | 基于机理和数据混合驱动的综合能源系统可靠性评估方法 | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
CN114596726A (zh) | 基于可解释时空注意力机制的停车泊位预测方法 | |
CN113537556A (zh) | 一种基于状态频率记忆网络的家庭短期负荷预测方法 | |
CN117374941A (zh) | 一种基于神经网络的光伏发电功率预测方法 | |
CN116565877A (zh) | 基于谱聚类分析的电压自动分区控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |