CN116646927A

CN116646927A - 一种基于分段滤波与纵横聚类的风电功率预测方法

Info

Publication number: CN116646927A
Application number: CN202310627483.7A
Authority: CN
Inventors: 张学东; 陈佳雷; 陈杰; 张楚; 彭甜; 赵环宇; 李茜; 钱诗婕
Original assignee: Huaiyin Institute of Technology
Current assignee: Huaiyin Institute of Technology
Priority date: 2023-05-30
Filing date: 2023-05-30
Publication date: 2023-08-25

Abstract

本发明提供了一种基于分段滤波与纵横聚类的风电功率预测方法，首先获取风电功率的历史数据，SDT进行爬坡识别，分别使用MEEMD滤波、smooth滤波对数据进行预处理，得到分段滤波后的波形；采用纵横聚类对数据进行聚类，纵向聚类通过日内预聚类、单日间再聚类和纵向时间单元的三步聚类来实现全年细化季节特性聚类，同时将纵向类内的全部数据联排聚类，实现小时间尺度下的精细横向聚类；使用变分自动编码器对聚类后的数据进行特征提取，然后使用改进的蒲公英优化算法优化Transformer预测模型参数，预测得到风电功率。本发明解决了数据波动性对预测精度的影响，其次考虑单日相似性与细化季节特性的实际情况，有效提高了预测风电功率的精确性和鲁棒性。

Description

一种基于分段滤波与纵横聚类的风电功率预测方法

技术领域

本发明属于风电功率预测技术邻域，具体涉及一种基于分段滤波与纵横聚类的风电功率预测方法。

背景技术

随着我国经济发展越来越好，社会各行各业和人们对能源需求也不断增加。而传统能源已不能满足人们的需求，再加上传统能源对环境的污染也比较严重，风电作为一种新型可再生能源在我国发展迅速，发展风电对于保障能源安全，调整能源结构，减轻环境污染，实现可持续发展等都具有非常重要的意义。然而，风电的不稳定性是风电系统与主电网结合的障碍之一，为了更安全有效的利用持续增长的风能，高精度的风电功率预测方法对电网运行有着重要意义。提前对风速和风电功率进行准确的预测，可以缓解电力系统调峰、调频的压力，有效提高电网对风电的接纳能力。

风电并网给电力系统的调度和安全稳定带来很大的挑战，使得风电功率的准确预测变得尤为重要。目前，风电功率预测方法主要分为统计方法和机器学习方法等，而统计方法只对波动规律明显、较平稳的功率可取得较好的预测，然而风能和风电功率具有较强的随机性和波动性，导致这种方法对风电功率预测的精确度差。考虑到客观因素等的影响，就会涉及到高维特征，而传统的功率预测方法在实际运用中，预测方法的训练周期长，运算复杂，预测准确性不高。并且风能在不同季节以及一天内不同时间段的差别大，普通的聚类和预测方法都不能满足实际的情况，这对风电功率预测也有很大的影响。

发明内容

发明目的：为了解决背景技术中所提出的问题，本发明提供一种基于分段滤波与纵横聚类的风电功率预测方法，使用纵横聚类对风电功率进行聚类，从而考虑到了不同季节以及单日内风电功率变化，使用VAE对聚类后的数据进行特征提取，通过改进的DO算法对Transformer模型进行优化，来实现对风电功率的准确预测。

技术方案：本发明提出一种基于分段滤波与纵横聚类的风电功率预测方法，包括以下步骤：

(1)对风电场的原始功率数据进行采集，并将采集后的数据进行预处理；

(2)采用改进的蒲公英优化算法优化旋转门算法，对预处理后的数据进行爬坡事件的特征识别，然后把识别后的数据根据是否爬坡分成两类；

(3)将识别为爬坡的数据通过MEEMD滤波，将非爬坡的数据通过smooth滤波；

(4)将滤波后的数据采用纵横聚类策略对其进行聚类，纵向聚类通过日内预聚类、单日间再聚类和纵向时间单元的三步聚类来实现全年细化季节特性聚类，同时将纵向类内的全部数据联排聚类，实现小时间尺度下的精细横向聚类；

(5)使用变分自动编码器对聚类后的数据分别进行特征提取；

(6)构建Transformer预测模型，并采用改进的蒲公英优化算法对Transformer预测模型参数进行优化；将特征提取后的数据输入优化后的Transformer预测模型，对未来风电功率进行预测。

进一步地，所述步骤(2)实现过程如下：

(2.1)首先进行初始化，其中K_1new为初始化的上旋转门斜率，K_2new为初始化的下旋转门斜率，公式如下所示：

设X为数据序列，式中,x₀为上一压缩过程终点，x₁为下一数目据点，x_i为第i数目据点；T₀，T₁，T_i分别为x₀，x₁，x_i所对应的时刻点，E是压缩阈值，T是原始数据时间序列，x是对应的原始数据序列；

(2.2)分别计算T_i上旋转门斜率K₁和下旋转门斜率K₂，如公式所示：

(2.3)更新K_1new和K_2new的值：

K_1new＝Max(K₁,K_1new)；K_2new＝Max(K₂,K_2new) (3)

(2.4)根据K_1new和K_2new大小判断是否压缩结束；若k_1new≥k_2new则此过程压缩结束，储存t_i-1时刻所对应数据值p_i-1，并且返回(2.1)，开始下一个过程的压缩；如果k_1new≤k_2new,则继续本次压缩，并返回步骤(2.2)，此时i＝i+1；

(2.5)采用改进的蒲公英优化算法优化旋转门算法的容差系数△E的值，△E是门的高度，即容差系数，经过旋转门算法压缩后，得到新的数据序列：

DO算法根据蒲公英种子成熟时进行长距离飞行，寻找最优降落位置的特性分为上升阶段、下降阶段和着陆阶段，三个阶段采用不同的策略进行寻优过程，△E在算法中对应于适应度值，到算法不断迭代计算出最优适应度值后，输出容差系数△E的值。

进一步地，所述步骤(2.5)包括以下步骤：

(2.5.1)设置DO算法的参数包含：最大迭代次数、种群规模、维度大小、搜索空间的上界与下界；

(2.5.2)使用Logistic混沌初始化方法代替DO算法中的随机初始化方法，使蒲公英种群能够进行更广泛的初步搜索，其公式如下：

其中，L(n+1)是更新后个体位置，λ是控制变量；

(2.5.3)上升阶段在风速、空气湿度等的影响下，根据不同的天气状况进行局部飘落，通过计算种子位置的适应度值来寻找最优适应度值，从而输出适应度值所对应的容差系数的值：

晴天：在晴朗的天气，风速可以认为是对数正态分布，DO算法强调搜索，在搜索时，蒲公英种子被风随机吹到各个位置，其更新公式为：

F_t+1＝F_t+α*v_x*v_y*lnY*(F_s-F_t) (5)

其中，F_t表示迭代t次时蒲公英种子的位置；F_s表示迭代t次时在搜索空间中随机选择的位置，InY表示符合μ＝0和σ2＝1的对数正态分布，α是用于调整搜索步长的自适应参数，在[0,1]之间的随机波动；

雨天：蒲公英种子进行局部搜索，位置更新公式为：

F_t+1＝F_t*ε (6)

其中，ε用于限定局部搜索范围,呈“向下凸”振荡；

蒲公英种子在上升期的数学表达式为：

(2.5.4)下降阶段：在本阶段DO算法也强调搜索，采用布朗运动来模拟蒲公英的运动轨迹，为了反映蒲公英下降的稳定性，采用了上升阶段后的平均位置信息，对应的数学表达式为：

F_t+1＝F_t-α*β_t*(F_{mean_t}-α*β_t*F_t) (8)

其中，β_t表示布朗运动，是标准正态分布的随机数，F_{mean_t}t为群体的平均位置，表达式为：

(2.5.5)着陆阶段：在本阶段DO算法重点是开发，基于前两个阶段，随着种群的进化，最终可以找到全局最优解，即是最优容差系数，然后就可以通过旋转门优化算法对爬坡事件进行识别，采用莱维飞行进行选择，位置更新公式：

F_t+1＝F_elite+levy(λ)*α*(F_elite-F_t*δ) (10)

其中，F_elite表示当前迭代最优位置，δ为一个线性递增的参数，等于2t/T,Levy飞行的公式计算：

β是一个介于[0,2]之间的随机数，s是一个固定常数0.01，ω和t为[0,1]之间的随机数；

(2.5.6)判断最大迭代次数是否达到算法终止条件，若未达到则转到(2.5.3)，最终结束运行并输出最优结果。

进一步地，所述步骤(3)实现过程如下：

(3.1)将一组模值相同，符号相反的白噪声信号v_i(t)和-v_i(t)添加进实际风电功率信号x(t)中，如公式所示：

式中，v_i(t)表示白噪声:a_i表示白噪声幅值，n为添加白噪声的对数，集合中白噪声信号的数目为2n；

(3.2)对集合中每对风电功率信号x⁺(t)和x^-(t)进行EMD分解，可获得一组IMF分量：

其中，h_ij ⁺(t)，h_ij ^-(t)表示i个信号的第j阶IMF分量；

(3.3)对多组分量集合平均，得到各阶IMF分量：

式中，p(t)表示第j阶的IMF分量；

(3.4)通过排列熵来识别h_j(t)是否为异常信号；如果信号随机性越大，排

列熵越大；设置阈值判断信号是否为异常信号或噪声信号；

(3.5)用实际风电功率信号减去异常信号和噪声信号，然后加上滤波后的噪声信号，得到滤波后的风电功率信号：

p(t)＝x(t)-x'(t)+x”(t) (15)

其中，p(t)表示滤波之后的风电功率信号，x(t)是原始信号，x'(t)为所有异常信号和噪声信号之和，x”(t)为小波滤波后的噪声信号；

(3.6)将非爬坡的数据通过smooth滤波，smooth滤波的作用是对序列进行平滑处理，以及信号的降噪；其滤波原理是将连续的采样数据看成一个长度固定为N的队列，在新的一次测量后，将队列的首数据去掉，其余N-1个数据依次前移，并将新的采样数据插入，作为新队列的尾；然后对这个队列进行算术运算，并将其结果做为本次测量的结果；假设输入为x,输出为y，则移动平均滤波器计算公式为：

进一步地，所述步骤(4)实现过程如下：

(4.1)日内预聚类，以日内各最小时间间隔T为样本，构造特征向量，如下表所示：

其中，i为最小时间间隔序列号；R_maxi和R_mini分别为单日内第i个最小时间间隔T_i内最大有功功率值和最小有功功率值，为T_i内有功功率平均值；然后对样本进行归一化处理对数据进行变换：

其中，Y_ij为第i个样本的第j个属性的采样值，Y_ij'为第i个样本的第j个属性的规范化值；m_j和M_j分别为第j个属性的最大值和最小值；M_jnew和m_jnew分别是j的新映射范围上下限；

(4.2)对预聚类之后的数据进行单日间再聚类，经过日内预聚类，对单日间再聚类的特征向量进行构建，来表示日内各T所属类别及日内总聚类数，公式如下：

其中，k是日序列号；D_Tnk为第k日的时段T_n所属类别聚类中心的，n为单日按最小时间间隔T分成的总段数；D_ck为第k天的聚类数；D_maxk和D_mink分别为第k天日内最大有功功率值和最小有功功率值，为日平均有功功率值；D_s2k为日有功功率样本方差；将全年数据分为J类，可获得全年各日所属类别；

(4.3)将全年纵向时间轴数据以纵向时间单元T_ZN为单位等分为L段，T_ZN选择按季度划分；根据单日间再聚类获得的比例特征来构建特征向量，最后获得能反映细化季节特性的聚类结果；经过单日间再聚类，将全年数据分为J类，统计纵向时间单元T_ZN内各类所占类别，以表示该时段内部单日组成结构和波动趋势，辅以表征功率波动的统计量，构成特征向量，

其中，h为纵向时间单元序号；S_h1,S_h2,...,S_hj为统计第h个纵向时间单元内第1,2,...,j各类所占比例；S_maxh和S_minh分别为第h个纵向时间单元内的最大有功功率和最小有功功率,和S_s2h分别为第h个纵向时间单元有功功率均值和方差；根据T_ZN的分类，把全年数据客观分成L类；

(4.4)在纵向聚类之后，对数据进行横向聚类，将属于同一纵向类的全部数据首尾相连，横列组成横向连续数据，按按横向时间单元T_HN统一分为H段，对全部数据进行横向聚类；利用T_HN内最小时间间隔T的变化率序列来表示横向数据波动趋势，辅以有功功率统计量，来构成特征向量：

其中，p为横向时间单元序列号；b为T_ZN中最小时间间隔数；W_maxp,W_minp分别为第p个横向时间单元内的最大有功功率和最小有功功率；和W_s2p分别为第p个横向时间单元内平均有功功率和方差；η_pb为T_ZN内b个最小时间间隔波动率序列，其计算公式为：

其中：i为最小时间间隔序列号；Pw为负荷与风电组成的根母线有功功率序列；{}内为根母线功率序列号；T_HN为横向时间单元；

(4.5)通过横向聚类，同一纵向类的全部数据被聚为q类，每类可由各自的聚类中心表示；通过氏距离判断该时段样本与历史样本中各类聚类中心特征向量的相似度：

其中，ρ(A,B)为序列A与序列B的欧氏距离。

进一步地，所述步骤(5)实现过程如下：

(5.1)数据编码，编码器包含4个卷积层，4个卷积层后连接一256个神经元的全连接层，将均值、方差对数所对应的全连接层神经元个数设为10；

(5.2)数据解码，解码器输入维数为10，首先包含一个256个神经元的全连接层，后连接9216个神经元的全连接层；

(5.3)梯度反向传播：通过解码输出数据与输入原始数据计算损失函数，通过反向传播更新网络权重，网络权重采用Glorot均匀分布初始化方法,反复训练后解码器学习到了数据的映射规律；

(5.4)生成数据，即提取解码器作为VAE生成模型，从高斯分布中抽取一组特征向量作为模型输入，就能输出符合训练数据集概率分布的全新数据。

进一步地，步骤(6)所述Transformer预测模型包含编码模块，解码模块，前馈神经网络和注意力机制；编码模块包含两层，一个self-attention层和一个前馈神经网络，self-attention能获取上下文的信息；解码模块也包含self-attention层和前馈神经网络，在这中间还有一层attention层，可以帮助节点获取到目前要关注的重点内容；self-attention处理完数据之后，把数据送给前馈神经网络，得到输出会输入到下一个encoder。

进一步地，所述步骤(6)实现过程如下：

(6.1)DO算法可以对Transformer模型最优超参数进行寻找，随着不断迭代，DO算法中出现适应度值很高的个体即超参数的最优值；聚类和VAE特征提取后的风电功率数据是Transformer的输入，然后经过DO算法寻找的最优超参数来优化模型对风电功率的预测精度；

(6.2)使用Logistic混沌初始化方法代替DO算法中的随机初始化方法，使蒲公英种群能够进行更广泛的初步搜索；

(6.3)其中上升阶段通过计算种子位置的适应度值来寻找最优超参数，在晴天，算法模拟蒲公英种子更面向全局搜索，超参数结果为全局最优；在雨天，则进行局部搜索，超参数结果为局部最优，从而通过输入的风电功率进行预测；

(6.4)着陆阶段：随着种群的进化，最终可以找到全局最优解，即是最优超参数，然后就可以通过模型对风电功率进行预测；

(6.5)判断最大迭代次数是否达到算法终止条件，若未达到则转到步骤(7.3)，最终结束运行并输出最优结果。

有益效果：与现有技术相比，本发明的有益效果：

1.本发明针对风电功率的波动性和随机性，用SDT旋转门算法对数据进行爬坡识别，对识别为爬坡的波动性大的数据通过MEEMD滤波，将非爬坡的数据通过smooth滤波，在一定程度上降低了波动性对功率预测的影响。

2.本发明针对在不同季节以及一天内不同时间段的风能差别大导致风电功率不确定性影响比较大，建立了一种兼顾日间相似性与细化季节特性的纵横聚类分析，考虑风电功率实际情况，提高了模型精确性和鲁棒性。

3.本发明提出了一种基于条件变分自动编码器的风电出力随机场景生成方法，无监督地学习风电训练数据的时间、空间及波动性特点，并按条件高效地生成符合特点的数据。降低了数据复杂度，简化了运算并且不减少预测精度。

4、本发明提出用Transformer模型对风电功率进行预测，使用混沌初始化种群增强DO算法的优化能力，通过改进的DO算法对Transformer模型优化，提高了模型预测的准确度。

附图说明

图1为本发明的流程图；

图2为MEEMD滤波流程图；

图3为纵横聚类方法的流程图；

图4为Transformer模型结构图。

具体实施方式

下面结合附图对本发明作进一步详细说明。

本发明提出一种基于分段滤波与纵横聚类的风电功率预测方法，如图1所示，包括以下步骤：

步骤1：对采集后的数据进行预处理，对风电功率异常数据进行删除，以及使用插值法对缺失数据进行处理。

步骤2：采用改进的蒲公英算法优化旋转门算法，对预处理后的数据进行爬坡事件的特征识别，然后把识别后的数据根据是否爬坡分成两类具体步骤如下：

改进的旋转门算法(SDT)对数据进行爬坡事件的特征识别，设X为数据序列,x₀为上一压缩过程终点,x₁为下一数目据点，x_i为第i数目据点。T为时间序列，T₀，T₁，T_i分别为x₀，x₁，x_i所对应的时刻点。△E是门的高度，即容差系数，经过旋转门算法压缩后得到新数据序列,斜率用K表示，具体步骤如下：

(2.3)更新K_1new和K_2new的值：

K_1new＝Max(K₁,K_1new)；K_2new＝Max(K₂,K_2new) (3)

(2.4)根据K_1new和K_2new大小判断是否压缩结束；若k_1new≥k_2new则此过程压缩结束，储存t_i-1时刻所对应数据值p_i-1，并且返回(2.1)，开始下一个过程的压缩；如果k_1new≤k_2new,则继续本次压缩，并返回步骤(2.2)，此时i＝i+1。

(2.5)采用改进的蒲公英优化算法DO优化旋转门算法的容差系数△E的值，

△E在算法中对应于适应度值，到算法不断迭代计算出最优适应度值后，输出容差系数△E的值。通过对适应度值的计算来优化旋转门算法包括以下步骤：

DO算法根据蒲公英种子成熟时进行长距离飞行，寻找最优降落位置的特性分为上升阶段、下降阶段和着陆阶段，三个阶段采用不同的策略进行寻优过程，△E在算法中对应于适应度值，到算法不断迭代计算出最优适应度值后，输出容差系数△E的值。通过对适应度值的计算来优化旋转门算法包括以下步骤：

(2.5.1)设置DO算法的参数包含：最大迭代次数、种群规模、维度大小、搜索空间的上界与下界。

其中，L(n+1)是更新后个体位置，λ是控制变量。

F_t+1＝F_t+α*v_x*v_y*lnY*(F_s-F_t) (5)

其中，F_t表示迭代t次时蒲公英种子的位置，F_s表示迭代t次时在搜索空间中随机选择的位置，InY表示符合μ＝0和σ2＝1的对数正态分布，α是用于调整搜索步长的自适应参数，在[0,1]之间的随机波动。

雨天：蒲公英种子进行局部搜索，位置更新公式为：

F_t+1＝F_t*ε (6)

其中，ε用于限定局部搜索范围,呈“向下凸”振荡。

综合在上升阶段的不同天气状况，并且为了使算法更面向全局搜索，确认其适应度值对应的容差系数结果为全局最优，截点设置为1.5,蒲公英种子在上升期的数学表达式为：

(2.5.4)下降阶段。在本阶段DO算法也强调搜索，采用布朗运动来模拟蒲公英的运动轨迹。为了反映蒲公英下降的稳定性，采用了上升阶段后的平均位置信息；对应的数学表达式为：

F_t+1＝F_t-α*β_t*(F_{mean_t}-α*β_t*F_t) (8)

(2.5.5)着陆阶段。在本阶段DO算法重点是开发。基于前两个阶段，随着种群的进化，最终可以找到全局最优解。即是最优容差系数，然后就可以通过旋转门优化算法对爬坡事件进行识别。采用莱维飞行进行选择。位置更新公式：

F_t+1＝F_elite+levy(λ)*α*(F_elite-F_t*δ) (10)

β是一个介于[0,2]之间的随机数(本文中β＝1.5)，s是一个固定常数0.01。ω和t为[0,1]之间的随机数。

步骤3：如图2所示，将识别为爬坡的数据通过MEEMD滤波，将非爬坡的数据通过smooth滤波。

MEEMD将实际的风电功率数据分解成由高频到低频的一系列IMF分量。通过计算IMF分量的排列熵，IMF分量可划分为异常分量，噪声分量以及规则分量三个部分。直接剔除异常信号。对小波滤波后的噪声分量和规则分量进行信号重构，重构后的信号即为经过MEEMD滤波后的风电功率数据。

步骤3.1：将一组模值相同，符号相反的白噪声信号v_i(t)和-v_i(t)添加进实际风电功率信号x(t)中，如公式所示。

式中，v_i(t)表示白噪声:a_i表示白噪声幅值，a_i一般取值为原始信号标准差的0.15到0.25倍:n为添加白噪声的对数，集合中白噪声信号的数目为2n。

步骤3.2：对集合中每对风电功率信号x⁺(t)和x^-(t)进行EMD分解，可获得一组IMF分量，如式所示

其中，h_ij ⁺(t)，h_ij ^-(t)表示i个信号的第j阶IMF分量。

步骤3.3：对多组分量集合平均，得到各阶IMF分量，如公式所示。

式中，p(t)表示第j阶的IMF分量。

步骤3.4：通过排列熵来识别h_j(t)是否为异常信号。如果信号随机性越大，排列熵越大。设置阈值判断信号是否为异常信号或噪声信号。熵值介于0.5到0.7的信号归类为噪声信号，将熵值大于0.7的信号归类为异常信号。

步骤3.5用实际风电功率信号减去异常信号和噪声信号，然后加上滤波后的噪声信号，得到滤波后的风电功率信号。如公式所示。

p(t)＝x(t)-x'(t)+x”(t) (15)

其中，p(t)表示滤波之后的风电功率信号，x(t)是原始信号，x'(t)为所有异常信号和噪声信号之和，x”(t)为小波滤波后的噪声信号。

将非爬坡的数据通过smooth滤波，假设输入为x,输出为y，则移动平均滤波器计算公式为：

步骤4：如图3所示，将滤波后的数据采用纵横聚类策略对其进行聚类，纵向聚类通过日内预聚类、单日间再聚类和纵向时间单元的三步聚类来实现全年细化季节特性聚类，同时将纵向类内的全部数据联排聚类，实现小时间尺度下的精细横向聚类。

利用纵横聚类的方法是将步骤3得到的滤波之后的数据进行小时间尺度横向聚类对日段聚类和大时间尺度纵向聚类对季节性和年段聚类，横向以纵向聚类可实现在时间连续性基础上，纵横聚类兼顾日间相似性与差异性规律的细化季节特性聚类分析，提高了模型精确性和鲁棒性，聚类采用K-means算法。

对数据先进行纵向聚类，纵向聚类分成三步，首先确定最小时间间隔T，将单日内各T按照功率波动特性进行聚类分析，来获得单日整体特性；再根据全年内各日特性实现相似日聚类；最终再根据日间聚类结果获得的比例特征来实现纵向时间单元聚类。其具体步骤如下：

(4.1)首先是日内预聚类，以日内各最小时间间隔T为样本，构造特征向量，如下表所示：

其中，i为最小时间间隔序列号；R_maxi和R_mini分别为单日内第i个最小时间间隔T_i内最大有功功率值和最小有功功率值，为T_i内有功功率平均值。然后对样本进行归一化处理对数据进行变换：

其中，Y_ij为第i个样本的第j个属性的采样值，Y_ij'为第i个样本的第j个属性的规范化值；m_j和M_j分别为第j个属性的最大值和最小值；M_jnew和m_jnew分别是j的新映射范围上下限，分别取1和0。

(4.2)对预聚类之后的数据进行单日间再聚类，经过日内预聚类，对单日间再聚类的特征向量进行构建，来表示日内各T所属类别及日内总聚类数等，公式如下：

其中，k是日序列号；D_Tnk为第k日的时段T_n所属类别聚类中心的，n为单日按最小时间间隔T分成的总段数；D_ck为第k天的聚类数；D_maxk和D_mink分别为第k天日内最大有功功率值和最小有功功率值，为日平均有功功率值；D_s2k为日有功功率样本方差。构造后按式4先进行归一化处理再聚类，将全年数据分为J类，可获得全年各日所属类别。

(4.3)将全年纵向时间轴数据以纵向时间单元T_ZN为单位等分为L段，T_ZN选择按季度划分。经过单日间再聚类，全年数据按日聚为J类，统计纵向时间单元T_ZN内各类所占类别，以表示该时段内部单日组成结构和波动趋势，辅以表征功率波动的统计量，构成特征向量，

其中，h为纵向时间单元序号；S_h1,S_h2,...,S_hj为统计第h个纵向时间单元内第1,2,...,j各类所占比例；S_maxh和S_minh分别为第h个纵向时间单元内的最大有功功率和最小有功功率,和S_s2h分别为第h个纵向时间单元有功功率均值和方差。按公式10归一化处理后聚类，可把全年数据客观分成L类。

(4.4)在纵向聚类之后，对数据进行横向聚类，主要做法是将属于同一纵向类的全部数据首尾相连，横列组成横向连续数据，按按横向时间单元T_HN统一分为H段，对全部数据进行横向聚类。利用T_HN内最小时间间隔T的变化率序列来表示横向数据波动趋势，辅以有功功率统计量，来构成特征向量：

其中，p为横向时间单元序列号；b为T_ZN中最小时间间隔数；W_maxp,W_minp分别为第p个横向时间单元内的最大有功功率和最小有功功率；和W_s2p分别为第p个横向时间单元内平均有功功率和方差。η_pb为T_ZN内b个最小时间间隔波动率序列，以η_pb为例，其计算公式为

其中，i为最小时间间隔序列号；Pw为负荷与风电组成的根母线有功功率序列；{}内为根母线功率序列号；T_HN为横向时间单元。

(4.5)通过横向聚类，同一纵向类的全部数据被聚为q类，每类可由各自的聚类中心表示。当研究某时段负荷模型时，只需利用该时段波动数据形成下式的特征向量，通过式15欧氏距离判断该时段样本与历史样本中各类聚类中心特征向量的相似度，认为该样本属于相似度高(欧式距离小)的历史样本类。

其中，ρ(A,B)为序列A与序列B的欧氏距离。

步骤5：将聚类后的数据根据不同季度的负荷量进行加权，加大负荷量大的季度的权重，然后采用变分自动编码器(VAE)对聚类后的数据进行特征提取。

数据编码。其基本思想是利用深度神经网络的拟合能力，通过编码器(encoder)将输入数据降维成一组特征向量。

数据解码。利用解码器(decoder)将这组特征向量还原成输入数据。

梯度反向传播。通过解码输出数据与输入原始数据计算损失函数，通过反向传播更新网络权重，网络权重采用Glorot均匀分布初始化方法,反复训练后解码器学习到了数据的映射规律。训练的批梯度下降(mini-batch)大小为32，使用Adam作为优化器。除输出层使用Sigmoid外，其他激活函数全部采用ReLu。

生成数据，即提取解码器作为VAE生成模型，从高斯分布中抽取一组特征向量作为模型输入，就能输出符合训练数据集概率分布的全新数据。

步骤6：构建Transformer预测模型，并采用改进的蒲公英优化算法对Transformer预测模型参数进行优化；将特征提取后的数据输入优化后的Transformer预测模型，对未来风电功率进行预测。

图4为Transformer模型结构图，包含编码模块，解码模块，前馈神经网络和注意力机制。编码模块包含两层，一个self-attention层和一个前馈神经网络，self-attention能获取上下文的信息。解码模块也包含self-attention层和前馈神经网络，在这中间还有一层attention层，可以帮助节点获取到目前要关注的重点内容。self-attention处理完数据之后，把数据送给前馈神经网络，得到输出会输入到下一个encoder。

使用改进的蒲公英优化算法对Transformer模型中的超参数进行优化，具体步骤如下：

DO算法可以对Transformer模型最优超参数进行寻找，随着不断迭代，DO算法中出现适应度值很高的个体即超参数的最优值。聚类和VAE特征提取后的风电功率数据是Transformer的输入，然后经过DO算法寻找的最优超参数来优化模型对风电功率的预测精度。

使用Logistic混沌初始化方法代替DO算法中的随机初始化方法，使蒲公英种群能够进行更广泛的初步搜索。

其中上升阶段通过计算种子位置的适应度值来寻找最优超参数，在晴天，算法模拟蒲公英种子更面向全局搜索，超参数结果为全局最优，在雨天，则进行局部搜索，超参数结果局部最优，从而通过输入的风电功率进行预测。

着陆阶段。随着种群的进化，最终可以找到全局最优解。即是最优超参数，然后就可以通过模型对风电功率进行预测。达到算法终止条件，最终结束运行并输出最优结果。

上述实施方式只为说明本发明的技术构思及特点，其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施，并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于分段滤波与纵横聚类的风电功率预测方法，其特征在于，包括以下步骤：

(5)使用变分自动编码器对聚类后的数据分别进行特征提取；

2.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法，其特征在于，所述步骤(2)实现过程如下：

(2.3)更新K_1new和K_2new的值：

K_1new＝Max(K₁,K_1new)；K_2new＝Max(K₂,K_2new) (3)

3.根据权利要求2所述的一种基于分段滤波与纵横聚类的风电功率预测方法，其特征在于，所述步骤(2.5)包括以下步骤：

其中，L(n+1)是更新后个体位置，λ是控制变量；

F_t+1＝F_t+α*v_x*v_y*lnY*(F_s-F_t) (5)

雨天：蒲公英种子进行局部搜索，位置更新公式为：

F_t+1＝F_t*ε (6)

其中，ε用于限定局部搜索范围,呈“向下凸”振荡；

蒲公英种子在上升期的数学表达式为：

F_t+1＝F_t-α*β_t*(F_{mean_t}-α*β_t*F_t) (8)

F_t+1＝F_elite+levy(λ)*α*(F_elite-F_t*δ) (10)

4.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法，其特征在于，所述步骤(3)实现过程如下：

其中，h_ij ⁺(t)，h_ij ^-(t)表示i个信号的第j阶IMF分量；

(3.3)对多组分量集合平均，得到各阶IMF分量：

式中，p(t)表示第j阶的IMF分量；

(3.4)通过排列熵来识别h_j(t)是否为异常信号；如果信号随机性越大，排列熵越大；设置阈值判断信号是否为异常信号或噪声信号；

p(t)＝x(t)-x'(t)+x”(t) (15)

5.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法，其特征在于，所述步骤(4)实现过程如下：

其中，ρ(A,B)为序列A与序列B的欧氏距离。

6.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法，其特征在于，所述步骤(5)实现过程如下：

7.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法，其特征在于，步骤(6)所述Transformer预测模型包含编码模块，解码模块，前馈神经网络和注意力机制；编码模块包含两层，一个self-attention层和一个前馈神经网络，self-attention能获取上下文的信息；解码模块包含self-attention层和前馈神经网络，在这中间还有一层attention层，可以帮助节点获取到目前要关注的重点内容；self-attention处理完数据之后，把数据送给前馈神经网络，得到输出会输入到下一个encoder。

8.根据权利要求1所述的一种基于分段滤波与纵横聚类的风电功率预测方法，其特征在于，所述步骤(6)实现过程如下：