CN111008504B

CN111008504B - 一种基于气象模式识别的风电功率预测误差建模方法

Info

Publication number: CN111008504B
Application number: CN201911309950.1A
Authority: CN
Inventors: 柯德平; 刘念璋; 牛四清; 杨健; 刘健; 柳玉; 姜尚光
Original assignee: Wuhan University WHU; North China Grid Co Ltd
Current assignee: Wuhan University WHU; North China Grid Co Ltd
Priority date: 2019-12-18
Filing date: 2019-12-18
Publication date: 2022-03-15
Anticipated expiration: 2039-12-18
Also published as: CN111008504A

Abstract

本发明涉及电网风电预测技术，具体涉及一种基于气象模式识别的风电功率预测误差建模方法，包括通过对历史气象数据进行k‑means聚类分析得到了相应的气象模式，根据各气象模式下气象数据特征，训练支持向量机分类器，并用其将历史风电功率预测误差数据划分为各个气象模式下的子数据集，分别对这些子数据集进行统计分析得到对应的概率密度曲线，进而基于通用分布模型，通过最小二乘拟合得到各气象模式下风电功率预测误差概率密度模型，完成风电功率预测误差建模。该方法考虑了气象因素对于风电功率预测精度的影响，使得风电功率预测误差建模结果更加准确；采用通用分布模型拟合效果更好，表达式的解析性更好；提供准确的风电功率预测误差概率密度模型。

Description

一种基于气象模式识别的风电功率预测误差建模方法

技术领域

本发明属于电网风电预测技术领域，尤其涉及一种基于气象模式识别的风电功率预测误差建模方法。

背景技术

目前，风电消纳问题就是在给定未来一天或数小时内风电功率和负荷预测结果，同时系统以常规机组出力(包括启停)为调节手段并满足一定运行约束条件的前提下，判断系统未来究竟能接纳多少风电。如果不考虑风电功率预测误差，则在未来某一时刻可能会出现风电实际值大于或小于风电调度计划值，从而相应地导致弃风与切负荷的现象，不利于清洁能源消纳的同时还会为电力系统的调度带来不利的影响。考虑风电功率预测误差的随机性而进行调度，其本质上是一个优化问题，该随机优化问题的求解难度、计算效率以及最终解的质量充分依赖于风电功率预测误差的随机性建模。

气象因素与风电功率间存在密切的因果关系。众所周知，同一预测方法会在风电功率时间序列各点给出误差大小不一的预测结果。针对风电功率预测误差，目前比较认可的处理方法是认为其统计结果服从某一概率分布。利用某一特定结构的概率密度函数(正态分布等)拟合风电功率预测误差的统计结果后，该函数即可表征风电功率预测误差的概率分布情况，叠加到风电功率预测值上即可表示风电实际出力的概率分布，可以直接将该函数应用于考虑风电预测不确定性的随机经济调度当中。但事实上，目前针对风电功率预测误差的统计分析工作都是将所有的误差数据集中统一分析。这种处理方式本质上忽视了同一预测方法在不同气象条件下预测精度的差异，例如预测结果在风和日丽的平稳气象条件下可能较准确，而在风雨交加的骤变气象情况下则可能较差。因而将所有预测误差混在一起统计建模一方面会加大“精度”和“解析计算”的协调难度，另一方面也可能使得随机经济调度结果偏于保守。

发明内容

本发明的目的是提供一种考虑气象条件对风电功率预测精度的影响，通过对历史气象数据的聚类分析得到不同的气象模式，针对每个气象模式下的风电功率预测误差数据进行统计分析并采用通用分布模型进行建模的方法。

为实现上述目的，本发明采用的技术方案是：一种基于气象模式识别的风电功率预测误差建模方法，包括在考虑对风电功率预测误差影响情况下的气象数据聚类分析，形成相应的气象模式；采用支持向量机算法形成用于气象模式识别的分类器；对各气象模式下风电功率预测误差概率分布分别建模；采用通用分布模型对风电功率预测误差概率分布进行建模。

在上述的基于气象模式识别的风电功率预测误差建模方法中，包括以下具体步骤：

步骤1、选取气象指标，对历史气象数据以及历史风电功率预测误差数据进行预处理；

步骤2、将历史气象数据根据月份划分为四个季度下的数据集，通过肘部法确定各季度下气象模式数目，并利用K-means算法对各季度下历史气象数据分别进行聚类分析，建立相应的气象模式；

步骤3、根据步骤2所建立气象模式，利用支持向量机算法对各气象模式下的气象数据进行学习训练，得到支持向量机分类器；根据历史风电功率预测误差数据对应的气象数据，将风电功率预测误差划分为各个气象模式下的子集；

步骤4、根据步骤3计算所得各气象模式下风电功率预测误差数据子集，对各数据子集进行统计分析得到各气象模式下风电功率预测误差概率密度曲线；利用最小二乘拟合，基于通用分布模型，得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式，完成不同气象模式下的风电功率预测误差建模。

在上述的基于气象模式识别的风电功率预测误差建模方法中，步骤1的实现包括以下步骤：

步骤1.1、选取风速、风向、气温和气压作为气象指标；

步骤1.2、对历史数据进行的预处理包括缺失值与异常值处理以及数据的标准化；具体步骤如下：

步骤1.2.1、采用删除法将存在缺失以及数值明显超出其物理意义范围的数据删除，实现缺失值与异常值处理；

步骤1.2.2、数据的标准化采用0-1标准化方法，通过对历史数据进行线性变换使其转换到[0,1]区间，转换所用公式如下:

其中u表示待转换的历史数据风速、风向、气温、气压、风电功率预测误差，u^*表示0-1标准化后的历史数据，u_max与u_min分别为历史数据中的最大值与最小值。

在上述的基于气象模式识别的风电功率预测误差建模方法中，步骤2的实现包括以下步骤：

步骤2.1、利用肘部法确定各季度下气象模式数目为：

其中，k为该季度下的气象模式数目，ω_j表示第j个气象模式，n_j为第j个气象模式的聚类中心，e_i为属于第j个气象模式当中的第i个气象数据样本点，SSE为误差平方和，表示各气象模式内样本点与聚类中心的误差平方的和；

步骤2.2、利用k-means算法对各季度下历史气象数据分别进行聚类分析，形成各季度下的气象模式的具体步骤如下：

步骤2.2.1、从t个历史气象数据样本点中随机性的选取其中的k个气象数据样本点作为初始聚类中心，然后依次计算其余各样本点到这些初始聚类中心的距离，并将样本点赋给距离最近的类簇，从而形成初始的k个类簇；

步骤2.2.2、分别计算k个类簇内样本点数据的均值，即得到中心样本，以这k个中心样本作为新的聚类中心，重新计算各个气象数据样本点与新的聚类中心的距离，并再次根据最小距离原则将各个样本点分配给距离最近的类簇；

步骤2.2.3、重新计算k个类簇的均值，循环步骤2.2.2与步骤2.2.3，直到聚类中心不再发生变化为止。

在上述的基于气象模式识别的风电功率预测误差建模方法中，步骤3的实现包括以下步骤：

步骤3.1、利用支持向量机算法对各气象模式下的气象数据进行学习训练，得到支持向量机分类器的步骤：

步骤3.1.1、气象模式类别为2的支持向量机算法；

对于容量为L的气象数据训练样本集T＝{(x_i,y_i),i＝1,2,…,L}，若x_i属于第一类，则记为y_i＝1；若x_i属于第二类，则记为y_i＝-1；

选取高斯径向基核函数，将线性不可分的样本数据映射到高维特征空间中，变得可分，核函数形式为：

它将训练样本集映射到Hilbert空间，得到对应的新的气象数据训练集

选取惩罚因子C，控制外点规模和抑制噪声数据点，构造并求解最优问题；

s.t.y_i((τ·x_i)+b)≥1-ξ_i,ξ_i≥0,i＝1,…,L

上式中τ是Hilbert空间中的分类面；ξ是松弛变量；C是惩罚参数；构造Lagrange函数，得到上述问题的对偶问题为：

得到最优解

选取α^*的一个正分量

并据此计算阈值：

最终得到用于气象数据分类的最优分类函数为

步骤3.1.2、气象模式类别大于2的支持向量机算法；

采用逐一鉴别方法，构造k个SVM子分类器，在构造第j个SVM子分类器时，将属于第j类别的样本数据标记为正类，不属于j类别的样本数据标记为负类；训练时，对历史气象数据样本分别计算各个子分类器的判别函数值，并选取判别函数值最大所对应的类别为气象数据样本的类别，从而实现多分类；

步骤3.2、利用训练得到的支持向量机分类器，根据与历史风电功率预测误差数据对应的历史气象数据，判断出历史风电功率预测误差数据样本点所对应的气象模式，进而将历史风电功率预测误差数据进行分箱，变为各季度各气象模式的误差数据箱。

在上述的基于气象模式识别的风电功率预测误差建模方法中，步骤4的实现包括以下步骤：

步骤4.1、利用matlab对各季度各气象模式下风电功率预测误差数据集进行统计分析得到各气象模式下风电功率预测误差的概率密度曲线，各曲线体现为一组二维数据，即平面上的m个点(w_p,v_p),p＝1,2,…m,，w_p各不相同，令v＝f(w)，使得f(w)在最小二乘下与所有数据点最为接近，利用最小二乘拟合，基于通用分布模型，得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式；

令f(w)＝a₁r₁(w)+a₂r₂(w)+…a_sr_s(w)，

式中，r_z(w)为选定的一组线性无关的函数，a_z为待定系数，z＝1,2,…,s，δ_p为v_p与f(w_p)的距离；v与w之间的函数关系为所选取的通用分布模型；

步骤4.2、确定待定系数a_z；

记

式中，J即为各点的距离平方之和；为求a_z使J达到最小，利用极值的必要条件

得到关于a₁,…,a_s的线性方程组，

即

记

A＝[a₁,…,a_m]^T,V＝[v₁,…,v_s]^T

则方程组可表示为

R^TRA＝R^TV

当{r₁(w),…,r_s(w)}线性无关时，R列满秩，R^TR可逆，于是方程组有唯一解

A＝(R^TR)^-1R^TV

所选取的通用分布函数形式已知，通用分布的概率密度表达式如下所示：

式中λ,β,γ即为决定通用分布模型形状的参数；

步骤4.3、利用最小二乘拟合，通过使拟合函数与概率密度曲线的距离平方和最小，求出与曲线最接近的通用分布模型中的未知参数，得到相应的通用分布模型，完成不同气象模式下风电功率预测误差的通用分布建模。

本发明的有有益效果：考虑了多个气象因素，如风速、风向、气温、气压对于风电功率预测精度的影响，使得风电功率预测误差建模结果更加准确；采用肘部法确定气象模式数目，排除了聚类分析时人为确定气象模式数目的主观影响；所采用的通用分布模型对于风电功率预测误差概率分布的拟合效果更好，表达式的解析性更好；在应用时能利用支持向量机分类器，根据数值天气预报结果判断未来某时间点的气象模式，从而提供准确的风电功率预测误差概率密度模型。

在实际应用时通过数值天气预报，利用分类算法，可以识别出当时所处的气象模式，从而为随机经济调度提供更加准确的风电功率预测误差概率分布模型，提高调度计算的准确性。

附图说明

图1是本发明一个实施例应用时的工作流程图；

图2是本发明一个实施例的方法流程示意图；

图3(a)是本发明一个实施例第一季度下气象模式聚类效果图；

图3(b)是本发明一个实施例第二季度下气象模式聚类效果图；

图3(c)是本发明一个实施例第三季度下气象模式聚类效果图；

图3(d)是本发明一个实施例第四季度下气象模式聚类效果图；

图4是本发明一个实施例第一季度下各气象模式风电功率预测误差的概率密度曲线图；

图5是本发明一个实施例第一季度下第一气象模式1的风电功率预测误差概率密度曲线的通用分布拟合效果图。

具体实施方式

下面结合附图对本发明的实施方式进行详细描述。

本实施例为了解决现有技术中所存在的技术问题；提供了一种基于气象模式识别的风电功率预测误差建模方法，通过对风电功率预测误差的概率分布进行建模，得到其概率密度函数式，为考虑风电功率预测误差的电力系统随机经济调度提供更加合理的计算依据。

本实施例不是将所有情况下的风电功率预测误差集中统一分析，而是考虑了气象条件(风速、风向、气温、气压)对风电功率预测精度的影响，通过对历史气象数据的聚类分析得到不同的气象模式，针对每个气象模式下的风电功率预测误差数据进行统计分析并进行建模。在实际应用时通过数值天气预报，利用分类算法，可以识别出当时所处的气象模式，从而为随机经济调度提供更加准确的风电功率预测误差概率分布模型，提高调度计算的准确性，实际应用时的工作流程如图1所示。

本实施例采用的是通用分布模型来对预测误差的概率分布进行建模，相比于目前技术当中常用的正态分布与贝塔分布，通用分布对于风电功率预测误差分布的表征效果更加准确且具备更好的数学解析形式，更便于随机经济调度的计算且准确性更高。

本实施例一种基于气象模式识别的风电功率预测误差建模方法，包括在考虑对风电功率预测误差影响情况下的气象数据聚类分析，形成相应的气象模式；采用支持向量机算法形成用于气象模式识别的分类器；对各气象模式下风电功率预测误差概率分布分别建模；采用通用分布模型对风电功率预测误差概率分布进行建模。

本实施例是通过以下技术方案来实现的，如图2所示，一种基于气象模式识别的风电功率预测误差建模方法，包括以下步骤：

S1.选取气象指标，对历史气象数据以及历史风电功率误差数据进行预处理；

考虑到风速、风向对风电功率的出力具有直接相关性，同时风机所处区域的气压以及温度的高低，都会在一定程度上引起空气的对流，因而最终选取风速、风向、气温、气压作为在考虑风电功率预测误差情况下气象模式聚类分析的气象数据指标。在S1中，对历史数据进行的预处理包括缺失值与异常值处理，数据的标准化。由于当样本数量足够大时，缺失值与异常值只占总样本中的少数，因而采用删除法，将存在缺失以及数值明显超出其物理意义范围的数据删除。数据的标准化采用0-1标准化方法，它通过对历史数据进行线性变换使其转换到[0,1]区间，转换所用公式如下:

其中u表示待转换的历史数据(风速、风向、气温、气压、风电功率预测误差)，u^*表示0-1标准化后的历史数据，u_max与u_min分别为历史数据中的最大值与最小值。

S2.将历史气象数据根据月份划分为四个季度下的数据集，通过肘部法确定各季度下气象模式数目，并利用K-means算法对各季度下历史气象数据分别进行聚类分析，建立相应的气象模式；对于样本数据，第一、二、三、四季度气象模式聚类效果如图3(a)、图3(b)、图3(c)、图3(d)所示。

利用肘部法确定各季度下气象模式数目为：

其中，k为该季度下的气象模式数目；ω_j表示第j个气象模式；n_j为第j个气象模式的聚类中心；e_i为属于第j个气象模式当中的第i个气象数据样本点，样本点中包含风速、风向、气温、气压四个指标值；SSE(sum of the squared errors)为误差平方和，即表示各气象模式内样本点与聚类中心的误差平方的和，代表了聚类效果的好坏。伴随聚类数k的增大，样本的聚类划分会更加精细，各簇的聚合程度会逐渐提高，从而SSE会逐渐减小。并且，当k小于真实聚类数时，由于k的增大会大幅度增加每个簇的聚合程度，故SSE下降幅度会很大，而当k到达真实聚类数时，再增加k所得到的聚合程度增加回报会迅速变小，所以SSE的下降幅度会骤减，然后随k值得继续增大而趋于平缓，即SSE与k的关系曲线是一个手肘的形状，而肘部所对应的k值即为所求的初步聚类数。因而通过让聚类数目在一定范围内变化，找出肘部所对应的点，即可求出各季度下的气象模式数目，用于k-means聚类分析。

利用k-means算法对各季度下历史气象数据分别进行聚类分析，形成各季度下的气象模式的具体步骤如下：

S2.1.从t个历史气象数据样本点中随机性的选取其中的k个气象数据样本点作为初始聚类中心，然后依次计算其余各样本点到这些初始聚类中心的距离，并将样本点赋给距离最近的类簇，从而形成初始的k个类簇；

S2.2.分别计算k个类簇内样本点数据的均值，即得到中心样本，以这k个中心样本作为新的聚类中心，重新计算各个气象数据样本点与新的聚类中心的距离，并再次根据最小距离原则将各个样本点分配给距离最近的类簇；

S2.3.重新计算k个类簇的均值(中心样本)，循环S2.2与S2.3，直到聚类中心不再发生变化为止。该过程使得误差平方和SSE最小，最终即得到了各气象数据样本点所属气象模式类别，实现了气象模式聚类分析。

S3.根据S2中分析所得各季度下气象模式，利用支持向量机算法对各气象模式下的气象数据进行学习训练，得到支持向量机分类器；在得到用于分类的支持向量机之后，根据历史风电功率预测误差数据对应的气象数据，将风电功率预测误差划分为各个气象模式下的子集；

利用支持向量机算法对各气象模式下的气象数据进行学习训练，得到支持向量机分类器的方法为：

对于容量为L的气象数据训练样本集T＝{(x_i,y_i),i＝1,2,…,L}，假设其由两个气象模式组成，若气象数据样本点x_i属于第一类，则记为y_i＝1；若x_i属于第二类，则记为y_i＝-1。

选取高斯径向基核函数(gaussian radial basis function,RBF)，将线性不可分的样本数据映射到高维特征空间中，变得可分，核函数形式为：

选取适当的惩罚因子C，控制外点规模和抑制噪声数据点，构造并求解最优问题。

s.t.y_i((τ·x_i)+b)≥1-ξ_i,ξ_i≥0,i＝1,…,L

上式中τ是Hilbert空间中的分类面；ξ是松弛变量；C是惩罚参数。构造Lagrange函数，得到上述问题的对偶问题为：

得到最优解

选取α^*的一个正分量

并据此计算阈值：

最终得到用于气象数据分类的最优分类函数为

上述即为气象模式为两类情况下的支持向量机算法，对于气象模式类别大于2的情况，如有H个气象模式，则采用逐一鉴别方法，构造H个SVM子分类器，在构造第j个SVM子分类器时，将属于第j类别的样本数据标记为正类，不属于j类别的样本数据标记为负类。训练时，对历史气象数据样本分别计算各个子分类器的判别函数值，并选取判别函数值最大所对应的类别为气象数据样本的类别，从而实现多分类。利用训练得到的支持向量机分类器，根据与历史风电功率预测误差数据对应的历史气象数据，即可判断出历史风电功率预测误差数据样本点所对应的气象模式，进而将历史风电功率预测误差数据进行分箱，变为各季度各气象模式的误差数据箱。

S4.根据S3中计算所得各气象模式下风电功率预测误差数据子集，对各子集进行统计分析得到各气象模式下风电功率预测误差概率密度曲线，取第一季度下各气象模式风电功率预测误差的概率密度曲线，如图4所示。在得到不同模式下的概率密度曲线之后，利用最小二乘拟合，基于通用分布模型，得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式，完成不同气象模式下的风电功率预测误差建模；取第一季度下第一气象模式1的风电功率预测误差概率密度曲线的通用分布函数拟合效果如图5所示。

利用matlab对各季度各气象模式下风电功率预测误差数据集进行统计分析得到各气象模式下风电功率预测误差的概率密度曲线，各曲线体现为一组二维数据，即平面上的m个点(w_p,v_p),p＝1,2,…,m，w_p各不相同，令v＝f(w)，使得f(w)在最小二乘下与所有数据点最为接近，利用最小二乘拟合，基于通用分布模型，得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式；

令f(w)＝a₁r₁(w)+a₂r₂(w)+…a_sr_s(w)，

式中，r_z(w)为选定的一组线性无关的函数，a_z为待定系数(z＝1,2,…,s)，δ_p为v_p与f(w_p)的距离。由于此处v与w之间的函数关系已知，即为所选取的通用分布模型，故重点在于系数a_z的确定。记

式中，J即为各点的距离平方之和。为求a_z使J达到最小，利用极值的必要条件

得到关于a₁,…,a_s的线性方程组，

即

记

A＝[a₁,…,a_m]^T,V＝[v₁,…,v_s]^T

则方程组可表示为

R^TRA＝R^TV

A＝(R^TR)^-1R^TV

由于所选取的通用分布函数形式已知，通用分布的概率密度表达式如下所示：

式中的λ,β,γ即为决定通用分布模型形状的参数。利用上述最小二乘拟合，通过使拟合函数与利用统计分析所得概率密度曲线的距离平方和最小，即可求出与曲线最接近的通用分布模型中的未知参数，得到相应的通用分布模型，完成不同气象模式下风电功率预测误差的通用分布建模。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

虽然以上结合附图描述了本发明的具体实施方式，但是本领域普通技术人员应当理解，这些仅是举例说明，可以对这些实施方式做出多种变形或修改，而不背离本发明的原理和实质。本发明的范围仅由所附权利要求书限定。

Claims

1.一种基于气象模式识别的风电功率预测误差建模方法，其特征是，包括通过对历史气象数据进行k-means聚类分析得到相应的气象模式；根据各气象模式下气象数据特征，训练支持向量机分类器；并用其将历史风电功率预测误差数据划分为各个气象模式下的子数据集，分别对子数据集进行统计分析得到对应的概率密度曲线；进而基于通用分布模型，通过最小二乘拟合得到各气象模式下风电功率预测误差概率密度模型，从而完成对风电功率预测误差的建模；

包括以下具体步骤：

步骤4、根据步骤3计算所得各气象模式下风电功率预测误差数据子集，对各数据子集进行统计分析得到各气象模式下风电功率预测误差概率密度曲线；利用最小二乘拟合，基于通用分布模型，得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式，完成不同气象模式下的风电功率预测误差建模；

步骤1的实现包括以下步骤：

步骤1.1、选取风速、风向、气温和气压作为气象指标；

其中u表示待转换的历史数据风速、风向、气温、气压、风电功率预测误差，u^*表示0-1标准化后的历史数据，u_max与u_min分别为历史数据中的最大值与最小值；

步骤2的实现包括以下步骤：

步骤2.1、利用肘部法确定各季度下气象模式数目为：

步骤2.2.3、重新计算k个类簇的均值，循环步骤2.2.2与步骤2.2.3，直到聚类中心不再发生变化为止；

步骤3的实现包括以下步骤：

步骤3.1.1、气象模式类别为2的支持向量机算法；

s.t.y_i((τ·x_i)+b)≥1-ξ_i,ξ_i≥0,i＝1,…,L

得到最优解

选取α^*的一个正分量

并据此计算阈值：

最终得到用于气象数据分类的最优分类函数为

步骤3.1.2、气象模式类别大于2的支持向量机算法；

步骤3.2、利用训练得到的支持向量机分类器，根据与历史风电功率预测误差数据对应的历史气象数据，判断出历史风电功率预测误差数据样本点所对应的气象模式，进而将历史风电功率预测误差数据进行分箱，变为各季度各气象模式的误差数据箱；

步骤4的实现包括以下步骤：

步骤4.1、利用matlab对各季度各气象模式下风电功率预测误差数据集进行统计分析得到各气象模式下风电功率预测误差的概率密度曲线；各曲线为一组二维数据，即平面上的m个点(w_p,v_p),p＝1,2,…,m，w_p各不相同，令v＝f(w)，使得f(w)在最小二乘下与所有数据点最为接近，利用最小二乘拟合，基于通用分布模型，得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式；

令f(w)＝a₁r₁(w)+a₂r₂(w)+…a_sr_s(w)，

步骤4.2、确定待定系数a_z；

记