CN111008504B - 一种基于气象模式识别的风电功率预测误差建模方法 - Google Patents

一种基于气象模式识别的风电功率预测误差建模方法 Download PDF

Info

Publication number
CN111008504B
CN111008504B CN201911309950.1A CN201911309950A CN111008504B CN 111008504 B CN111008504 B CN 111008504B CN 201911309950 A CN201911309950 A CN 201911309950A CN 111008504 B CN111008504 B CN 111008504B
Authority
CN
China
Prior art keywords
meteorological
data
wind power
power prediction
prediction error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911309950.1A
Other languages
English (en)
Other versions
CN111008504A (zh
Inventor
柯德平
刘念璋
牛四清
杨健
刘健
柳玉
姜尚光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
North China Grid Co Ltd
Original Assignee
Wuhan University WHU
North China Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU, North China Grid Co Ltd filed Critical Wuhan University WHU
Priority to CN201911309950.1A priority Critical patent/CN111008504B/zh
Publication of CN111008504A publication Critical patent/CN111008504A/zh
Application granted granted Critical
Publication of CN111008504B publication Critical patent/CN111008504B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及电网风电预测技术,具体涉及一种基于气象模式识别的风电功率预测误差建模方法,包括通过对历史气象数据进行k‑means聚类分析得到了相应的气象模式,根据各气象模式下气象数据特征,训练支持向量机分类器,并用其将历史风电功率预测误差数据划分为各个气象模式下的子数据集,分别对这些子数据集进行统计分析得到对应的概率密度曲线,进而基于通用分布模型,通过最小二乘拟合得到各气象模式下风电功率预测误差概率密度模型,完成风电功率预测误差建模。该方法考虑了气象因素对于风电功率预测精度的影响,使得风电功率预测误差建模结果更加准确;采用通用分布模型拟合效果更好,表达式的解析性更好;提供准确的风电功率预测误差概率密度模型。

Description

一种基于气象模式识别的风电功率预测误差建模方法
技术领域
本发明属于电网风电预测技术领域,尤其涉及一种基于气象模式识别的风电功率预测误差建模方法。
背景技术
目前,风电消纳问题就是在给定未来一天或数小时内风电功率和负荷预测结果,同时系统以常规机组出力(包括启停)为调节手段并满足一定运行约束条件的前提下,判断系统未来究竟能接纳多少风电。如果不考虑风电功率预测误差,则在未来某一时刻可能会出现风电实际值大于或小于风电调度计划值,从而相应地导致弃风与切负荷的现象,不利于清洁能源消纳的同时还会为电力系统的调度带来不利的影响。考虑风电功率预测误差的随机性而进行调度,其本质上是一个优化问题,该随机优化问题的求解难度、计算效率以及最终解的质量充分依赖于风电功率预测误差的随机性建模。
气象因素与风电功率间存在密切的因果关系。众所周知,同一预测方法会在风电功率时间序列各点给出误差大小不一的预测结果。针对风电功率预测误差,目前比较认可的处理方法是认为其统计结果服从某一概率分布。利用某一特定结构的概率密度函数(正态分布等)拟合风电功率预测误差的统计结果后,该函数即可表征风电功率预测误差的概率分布情况,叠加到风电功率预测值上即可表示风电实际出力的概率分布,可以直接将该函数应用于考虑风电预测不确定性的随机经济调度当中。但事实上,目前针对风电功率预测误差的统计分析工作都是将所有的误差数据集中统一分析。这种处理方式本质上忽视了同一预测方法在不同气象条件下预测精度的差异,例如预测结果在风和日丽的平稳气象条件下可能较准确,而在风雨交加的骤变气象情况下则可能较差。因而将所有预测误差混在一起统计建模一方面会加大“精度”和“解析计算”的协调难度,另一方面也可能使得随机经济调度结果偏于保守。
发明内容
本发明的目的是提供一种考虑气象条件对风电功率预测精度的影响,通过对历史气象数据的聚类分析得到不同的气象模式,针对每个气象模式下的风电功率预测误差数据进行统计分析并采用通用分布模型进行建模的方法。
为实现上述目的,本发明采用的技术方案是:一种基于气象模式识别的风电功率预测误差建模方法,包括在考虑对风电功率预测误差影响情况下的气象数据聚类分析,形成相应的气象模式;采用支持向量机算法形成用于气象模式识别的分类器;对各气象模式下风电功率预测误差概率分布分别建模;采用通用分布模型对风电功率预测误差概率分布进行建模。
在上述的基于气象模式识别的风电功率预测误差建模方法中,包括以下具体步骤:
步骤1、选取气象指标,对历史气象数据以及历史风电功率预测误差数据进行预处理;
步骤2、将历史气象数据根据月份划分为四个季度下的数据集,通过肘部法确定各季度下气象模式数目,并利用K-means算法对各季度下历史气象数据分别进行聚类分析,建立相应的气象模式;
步骤3、根据步骤2所建立气象模式,利用支持向量机算法对各气象模式下的气象数据进行学习训练,得到支持向量机分类器;根据历史风电功率预测误差数据对应的气象数据,将风电功率预测误差划分为各个气象模式下的子集;
步骤4、根据步骤3计算所得各气象模式下风电功率预测误差数据子集,对各数据子集进行统计分析得到各气象模式下风电功率预测误差概率密度曲线;利用最小二乘拟合,基于通用分布模型,得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式,完成不同气象模式下的风电功率预测误差建模。
在上述的基于气象模式识别的风电功率预测误差建模方法中,步骤1的实现包括以下步骤:
步骤1.1、选取风速、风向、气温和气压作为气象指标;
步骤1.2、对历史数据进行的预处理包括缺失值与异常值处理以及数据的标准化;具体步骤如下:
步骤1.2.1、采用删除法将存在缺失以及数值明显超出其物理意义范围的数据删除,实现缺失值与异常值处理;
步骤1.2.2、数据的标准化采用0-1标准化方法,通过对历史数据进行线性变换使其转换到[0,1]区间,转换所用公式如下:
Figure GDA0002373593790000031
其中u表示待转换的历史数据风速、风向、气温、气压、风电功率预测误差,u*表示0-1标准化后的历史数据,umax与umin分别为历史数据中的最大值与最小值。
在上述的基于气象模式识别的风电功率预测误差建模方法中,步骤2的实现包括以下步骤:
步骤2.1、利用肘部法确定各季度下气象模式数目为:
Figure GDA0002373593790000041
其中,k为该季度下的气象模式数目,ωj表示第j个气象模式,nj为第j个气象模式的聚类中心,ei为属于第j个气象模式当中的第i个气象数据样本点,SSE为误差平方和,表示各气象模式内样本点与聚类中心的误差平方的和;
步骤2.2、利用k-means算法对各季度下历史气象数据分别进行聚类分析,形成各季度下的气象模式的具体步骤如下:
步骤2.2.1、从t个历史气象数据样本点中随机性的选取其中的k个气象数据样本点作为初始聚类中心,然后依次计算其余各样本点到这些初始聚类中心的距离,并将样本点赋给距离最近的类簇,从而形成初始的k个类簇;
步骤2.2.2、分别计算k个类簇内样本点数据的均值,即得到中心样本,以这k个中心样本作为新的聚类中心,重新计算各个气象数据样本点与新的聚类中心的距离,并再次根据最小距离原则将各个样本点分配给距离最近的类簇;
步骤2.2.3、重新计算k个类簇的均值,循环步骤2.2.2与步骤2.2.3,直到聚类中心不再发生变化为止。
在上述的基于气象模式识别的风电功率预测误差建模方法中,步骤3的实现包括以下步骤:
步骤3.1、利用支持向量机算法对各气象模式下的气象数据进行学习训练,得到支持向量机分类器的步骤:
步骤3.1.1、气象模式类别为2的支持向量机算法;
对于容量为L的气象数据训练样本集T={(xi,yi),i=1,2,…,L},若xi属于第一类,则记为yi=1;若xi属于第二类,则记为yi=-1;
选取高斯径向基核函数,将线性不可分的样本数据映射到高维特征空间中,变得可分,核函数形式为:
Figure GDA0002373593790000051
它将训练样本集映射到Hilbert空间,得到对应的新的气象数据训练集
Figure GDA0002373593790000052
选取惩罚因子C,控制外点规模和抑制噪声数据点,构造并求解最优问题;
Figure GDA0002373593790000053
s.t.yi((τ·xi)+b)≥1-ξii≥0,i=1,…,L
上式中τ是Hilbert空间中的分类面;ξ是松弛变量;C是惩罚参数;构造Lagrange函数,得到上述问题的对偶问题为:
Figure GDA0002373593790000054
Figure GDA0002373593790000055
得到最优解
Figure GDA0002373593790000056
选取α*的一个正分量
Figure GDA0002373593790000057
并据此计算阈值:
Figure GDA0002373593790000058
最终得到用于气象数据分类的最优分类函数为
Figure GDA0002373593790000059
步骤3.1.2、气象模式类别大于2的支持向量机算法;
采用逐一鉴别方法,构造k个SVM子分类器,在构造第j个SVM子分类器时,将属于第j类别的样本数据标记为正类,不属于j类别的样本数据标记为负类;训练时,对历史气象数据样本分别计算各个子分类器的判别函数值,并选取判别函数值最大所对应的类别为气象数据样本的类别,从而实现多分类;
步骤3.2、利用训练得到的支持向量机分类器,根据与历史风电功率预测误差数据对应的历史气象数据,判断出历史风电功率预测误差数据样本点所对应的气象模式,进而将历史风电功率预测误差数据进行分箱,变为各季度各气象模式的误差数据箱。
在上述的基于气象模式识别的风电功率预测误差建模方法中,步骤4的实现包括以下步骤:
步骤4.1、利用matlab对各季度各气象模式下风电功率预测误差数据集进行统计分析得到各气象模式下风电功率预测误差的概率密度曲线,各曲线体现为一组二维数据,即平面上的m个点(wp,vp),p=1,2,…m,,wp各不相同,令v=f(w),使得f(w)在最小二乘下与所有数据点最为接近,利用最小二乘拟合,基于通用分布模型,得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式;
令f(w)=a1r1(w)+a2r2(w)+…asrs(w),
式中,rz(w)为选定的一组线性无关的函数,az为待定系数,z=1,2,…,s,δp为vp与f(wp)的距离;v与w之间的函数关系为所选取的通用分布模型;
步骤4.2、确定待定系数az
Figure GDA0002373593790000061
式中,J即为各点的距离平方之和;为求az使J达到最小,利用极值的必要条件
Figure GDA0002373593790000071
得到关于a1,…,as的线性方程组,
Figure GDA0002373593790000072
Figure GDA0002373593790000073
Figure GDA0002373593790000074
A=[a1,…,am]T,V=[v1,…,vs]T
则方程组可表示为
RTRA=RTV
当{r1(w),…,rs(w)}线性无关时,R列满秩,RTR可逆,于是方程组有唯一解
A=(RTR)-1RTV
所选取的通用分布函数形式已知,通用分布的概率密度表达式如下所示:
Figure GDA0002373593790000075
式中λ,β,γ即为决定通用分布模型形状的参数;
步骤4.3、利用最小二乘拟合,通过使拟合函数与概率密度曲线的距离平方和最小,求出与曲线最接近的通用分布模型中的未知参数,得到相应的通用分布模型,完成不同气象模式下风电功率预测误差的通用分布建模。
本发明的有有益效果:考虑了多个气象因素,如风速、风向、气温、气压对于风电功率预测精度的影响,使得风电功率预测误差建模结果更加准确;采用肘部法确定气象模式数目,排除了聚类分析时人为确定气象模式数目的主观影响;所采用的通用分布模型对于风电功率预测误差概率分布的拟合效果更好,表达式的解析性更好;在应用时能利用支持向量机分类器,根据数值天气预报结果判断未来某时间点的气象模式,从而提供准确的风电功率预测误差概率密度模型。
在实际应用时通过数值天气预报,利用分类算法,可以识别出当时所处的气象模式,从而为随机经济调度提供更加准确的风电功率预测误差概率分布模型,提高调度计算的准确性。
附图说明
图1是本发明一个实施例应用时的工作流程图;
图2是本发明一个实施例的方法流程示意图;
图3(a)是本发明一个实施例第一季度下气象模式聚类效果图;
图3(b)是本发明一个实施例第二季度下气象模式聚类效果图;
图3(c)是本发明一个实施例第三季度下气象模式聚类效果图;
图3(d)是本发明一个实施例第四季度下气象模式聚类效果图;
图4是本发明一个实施例第一季度下各气象模式风电功率预测误差的概率密度曲线图;
图5是本发明一个实施例第一季度下第一气象模式1的风电功率预测误差概率密度曲线的通用分布拟合效果图。
具体实施方式
下面结合附图对本发明的实施方式进行详细描述。
本实施例为了解决现有技术中所存在的技术问题;提供了一种基于气象模式识别的风电功率预测误差建模方法,通过对风电功率预测误差的概率分布进行建模,得到其概率密度函数式,为考虑风电功率预测误差的电力系统随机经济调度提供更加合理的计算依据。
本实施例不是将所有情况下的风电功率预测误差集中统一分析,而是考虑了气象条件(风速、风向、气温、气压)对风电功率预测精度的影响,通过对历史气象数据的聚类分析得到不同的气象模式,针对每个气象模式下的风电功率预测误差数据进行统计分析并进行建模。在实际应用时通过数值天气预报,利用分类算法,可以识别出当时所处的气象模式,从而为随机经济调度提供更加准确的风电功率预测误差概率分布模型,提高调度计算的准确性,实际应用时的工作流程如图1所示。
本实施例采用的是通用分布模型来对预测误差的概率分布进行建模,相比于目前技术当中常用的正态分布与贝塔分布,通用分布对于风电功率预测误差分布的表征效果更加准确且具备更好的数学解析形式,更便于随机经济调度的计算且准确性更高。
本实施例一种基于气象模式识别的风电功率预测误差建模方法,包括在考虑对风电功率预测误差影响情况下的气象数据聚类分析,形成相应的气象模式;采用支持向量机算法形成用于气象模式识别的分类器;对各气象模式下风电功率预测误差概率分布分别建模;采用通用分布模型对风电功率预测误差概率分布进行建模。
本实施例是通过以下技术方案来实现的,如图2所示,一种基于气象模式识别的风电功率预测误差建模方法,包括以下步骤:
S1.选取气象指标,对历史气象数据以及历史风电功率误差数据进行预处理;
考虑到风速、风向对风电功率的出力具有直接相关性,同时风机所处区域的气压以及温度的高低,都会在一定程度上引起空气的对流,因而最终选取风速、风向、气温、气压作为在考虑风电功率预测误差情况下气象模式聚类分析的气象数据指标。在S1中,对历史数据进行的预处理包括缺失值与异常值处理,数据的标准化。由于当样本数量足够大时,缺失值与异常值只占总样本中的少数,因而采用删除法,将存在缺失以及数值明显超出其物理意义范围的数据删除。数据的标准化采用0-1标准化方法,它通过对历史数据进行线性变换使其转换到[0,1]区间,转换所用公式如下:
Figure GDA0002373593790000101
其中u表示待转换的历史数据(风速、风向、气温、气压、风电功率预测误差),u*表示0-1标准化后的历史数据,umax与umin分别为历史数据中的最大值与最小值。
S2.将历史气象数据根据月份划分为四个季度下的数据集,通过肘部法确定各季度下气象模式数目,并利用K-means算法对各季度下历史气象数据分别进行聚类分析,建立相应的气象模式;对于样本数据,第一、二、三、四季度气象模式聚类效果如图3(a)、图3(b)、图3(c)、图3(d)所示。
利用肘部法确定各季度下气象模式数目为:
Figure GDA0002373593790000102
其中,k为该季度下的气象模式数目;ωj表示第j个气象模式;nj为第j个气象模式的聚类中心;ei为属于第j个气象模式当中的第i个气象数据样本点,样本点中包含风速、风向、气温、气压四个指标值;SSE(sum of the squared errors)为误差平方和,即表示各气象模式内样本点与聚类中心的误差平方的和,代表了聚类效果的好坏。伴随聚类数k的增大,样本的聚类划分会更加精细,各簇的聚合程度会逐渐提高,从而SSE会逐渐减小。并且,当k小于真实聚类数时,由于k的增大会大幅度增加每个簇的聚合程度,故SSE下降幅度会很大,而当k到达真实聚类数时,再增加k所得到的聚合程度增加回报会迅速变小,所以SSE的下降幅度会骤减,然后随k值得继续增大而趋于平缓,即SSE与k的关系曲线是一个手肘的形状,而肘部所对应的k值即为所求的初步聚类数。因而通过让聚类数目在一定范围内变化,找出肘部所对应的点,即可求出各季度下的气象模式数目,用于k-means聚类分析。
利用k-means算法对各季度下历史气象数据分别进行聚类分析,形成各季度下的气象模式的具体步骤如下:
S2.1.从t个历史气象数据样本点中随机性的选取其中的k个气象数据样本点作为初始聚类中心,然后依次计算其余各样本点到这些初始聚类中心的距离,并将样本点赋给距离最近的类簇,从而形成初始的k个类簇;
S2.2.分别计算k个类簇内样本点数据的均值,即得到中心样本,以这k个中心样本作为新的聚类中心,重新计算各个气象数据样本点与新的聚类中心的距离,并再次根据最小距离原则将各个样本点分配给距离最近的类簇;
S2.3.重新计算k个类簇的均值(中心样本),循环S2.2与S2.3,直到聚类中心不再发生变化为止。该过程使得误差平方和SSE最小,最终即得到了各气象数据样本点所属气象模式类别,实现了气象模式聚类分析。
S3.根据S2中分析所得各季度下气象模式,利用支持向量机算法对各气象模式下的气象数据进行学习训练,得到支持向量机分类器;在得到用于分类的支持向量机之后,根据历史风电功率预测误差数据对应的气象数据,将风电功率预测误差划分为各个气象模式下的子集;
利用支持向量机算法对各气象模式下的气象数据进行学习训练,得到支持向量机分类器的方法为:
对于容量为L的气象数据训练样本集T={(xi,yi),i=1,2,…,L},假设其由两个气象模式组成,若气象数据样本点xi属于第一类,则记为yi=1;若xi属于第二类,则记为yi=-1。
选取高斯径向基核函数(gaussian radial basis function,RBF),将线性不可分的样本数据映射到高维特征空间中,变得可分,核函数形式为:
Figure GDA0002373593790000121
它将训练样本集映射到Hilbert空间,得到对应的新的气象数据训练集
Figure GDA0002373593790000122
选取适当的惩罚因子C,控制外点规模和抑制噪声数据点,构造并求解最优问题。
Figure GDA0002373593790000123
s.t.yi((τ·xi)+b)≥1-ξii≥0,i=1,…,L
上式中τ是Hilbert空间中的分类面;ξ是松弛变量;C是惩罚参数。构造Lagrange函数,得到上述问题的对偶问题为:
Figure GDA0002373593790000131
Figure GDA0002373593790000132
得到最优解
Figure GDA0002373593790000133
选取α*的一个正分量
Figure GDA0002373593790000134
并据此计算阈值:
Figure GDA0002373593790000135
最终得到用于气象数据分类的最优分类函数为
Figure GDA0002373593790000136
上述即为气象模式为两类情况下的支持向量机算法,对于气象模式类别大于2的情况,如有H个气象模式,则采用逐一鉴别方法,构造H个SVM子分类器,在构造第j个SVM子分类器时,将属于第j类别的样本数据标记为正类,不属于j类别的样本数据标记为负类。训练时,对历史气象数据样本分别计算各个子分类器的判别函数值,并选取判别函数值最大所对应的类别为气象数据样本的类别,从而实现多分类。利用训练得到的支持向量机分类器,根据与历史风电功率预测误差数据对应的历史气象数据,即可判断出历史风电功率预测误差数据样本点所对应的气象模式,进而将历史风电功率预测误差数据进行分箱,变为各季度各气象模式的误差数据箱。
S4.根据S3中计算所得各气象模式下风电功率预测误差数据子集,对各子集进行统计分析得到各气象模式下风电功率预测误差概率密度曲线,取第一季度下各气象模式风电功率预测误差的概率密度曲线,如图4所示。在得到不同模式下的概率密度曲线之后,利用最小二乘拟合,基于通用分布模型,得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式,完成不同气象模式下的风电功率预测误差建模;取第一季度下第一气象模式1的风电功率预测误差概率密度曲线的通用分布函数拟合效果如图5所示。
利用matlab对各季度各气象模式下风电功率预测误差数据集进行统计分析得到各气象模式下风电功率预测误差的概率密度曲线,各曲线体现为一组二维数据,即平面上的m个点(wp,vp),p=1,2,…,m,wp各不相同,令v=f(w),使得f(w)在最小二乘下与所有数据点最为接近,利用最小二乘拟合,基于通用分布模型,得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式;
令f(w)=a1r1(w)+a2r2(w)+…asrs(w),
式中,rz(w)为选定的一组线性无关的函数,az为待定系数(z=1,2,…,s),δp为vp与f(wp)的距离。由于此处v与w之间的函数关系已知,即为所选取的通用分布模型,故重点在于系数az的确定。记
Figure GDA0002373593790000141
式中,J即为各点的距离平方之和。为求az使J达到最小,利用极值的必要条件
Figure GDA0002373593790000142
得到关于a1,…,as的线性方程组,
Figure GDA0002373593790000143
Figure GDA0002373593790000144
Figure GDA0002373593790000151
A=[a1,…,am]T,V=[v1,…,vs]T
则方程组可表示为
RTRA=RTV
当{r1(w),…,rs(w)}线性无关时,R列满秩,RTR可逆,于是方程组有唯一解
A=(RTR)-1RTV
由于所选取的通用分布函数形式已知,通用分布的概率密度表达式如下所示:
Figure GDA0002373593790000152
式中的λ,β,γ即为决定通用分布模型形状的参数。利用上述最小二乘拟合,通过使拟合函数与利用统计分析所得概率密度曲线的距离平方和最小,即可求出与曲线最接近的通用分布模型中的未知参数,得到相应的通用分布模型,完成不同气象模式下风电功率预测误差的通用分布建模。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
虽然以上结合附图描述了本发明的具体实施方式,但是本领域普通技术人员应当理解,这些仅是举例说明,可以对这些实施方式做出多种变形或修改,而不背离本发明的原理和实质。本发明的范围仅由所附权利要求书限定。

Claims (1)

1.一种基于气象模式识别的风电功率预测误差建模方法,其特征是,包括通过对历史气象数据进行k-means聚类分析得到相应的气象模式;根据各气象模式下气象数据特征,训练支持向量机分类器;并用其将历史风电功率预测误差数据划分为各个气象模式下的子数据集,分别对子数据集进行统计分析得到对应的概率密度曲线;进而基于通用分布模型,通过最小二乘拟合得到各气象模式下风电功率预测误差概率密度模型,从而完成对风电功率预测误差的建模;
包括以下具体步骤:
步骤1、选取气象指标,对历史气象数据以及历史风电功率预测误差数据进行预处理;
步骤2、将历史气象数据根据月份划分为四个季度下的数据集,通过肘部法确定各季度下气象模式数目,并利用K-means算法对各季度下历史气象数据分别进行聚类分析,建立相应的气象模式;
步骤3、根据步骤2所建立气象模式,利用支持向量机算法对各气象模式下的气象数据进行学习训练,得到支持向量机分类器;根据历史风电功率预测误差数据对应的气象数据,将风电功率预测误差划分为各个气象模式下的子集;
步骤4、根据步骤3计算所得各气象模式下风电功率预测误差数据子集,对各数据子集进行统计分析得到各气象模式下风电功率预测误差概率密度曲线;利用最小二乘拟合,基于通用分布模型,得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式,完成不同气象模式下的风电功率预测误差建模;
步骤1的实现包括以下步骤:
步骤1.1、选取风速、风向、气温和气压作为气象指标;
步骤1.2、对历史数据进行的预处理包括缺失值与异常值处理以及数据的标准化;具体步骤如下:
步骤1.2.1、采用删除法将存在缺失以及数值明显超出其物理意义范围的数据删除,实现缺失值与异常值处理;
步骤1.2.2、数据的标准化采用0-1标准化方法,通过对历史数据进行线性变换使其转换到[0,1]区间,转换所用公式如下:
Figure FDA0003401250560000021
其中u表示待转换的历史数据风速、风向、气温、气压、风电功率预测误差,u*表示0-1标准化后的历史数据,umax与umin分别为历史数据中的最大值与最小值;
步骤2的实现包括以下步骤:
步骤2.1、利用肘部法确定各季度下气象模式数目为:
Figure FDA0003401250560000022
其中,k为该季度下的气象模式数目,ωj表示第j个气象模式,nj为第j个气象模式的聚类中心,ei为属于第j个气象模式当中的第i个气象数据样本点,SSE为误差平方和,表示各气象模式内样本点与聚类中心的误差平方的和;
步骤2.2、利用k-means算法对各季度下历史气象数据分别进行聚类分析,形成各季度下的气象模式的具体步骤如下:
步骤2.2.1、从t个历史气象数据样本点中随机性的选取其中的k个气象数据样本点作为初始聚类中心,然后依次计算其余各样本点到这些初始聚类中心的距离,并将样本点赋给距离最近的类簇,从而形成初始的k个类簇;
步骤2.2.2、分别计算k个类簇内样本点数据的均值,即得到中心样本,以这k个中心样本作为新的聚类中心,重新计算各个气象数据样本点与新的聚类中心的距离,并再次根据最小距离原则将各个样本点分配给距离最近的类簇;
步骤2.2.3、重新计算k个类簇的均值,循环步骤2.2.2与步骤2.2.3,直到聚类中心不再发生变化为止;
步骤3的实现包括以下步骤:
步骤3.1、利用支持向量机算法对各气象模式下的气象数据进行学习训练,得到支持向量机分类器的步骤:
步骤3.1.1、气象模式类别为2的支持向量机算法;
对于容量为L的气象数据训练样本集T={(xi,yi),i=1,2,…,L},若xi属于第一类,则记为yi=1;若xi属于第二类,则记为yi=-1;
选取高斯径向基核函数,将线性不可分的样本数据映射到高维特征空间中,变得可分,核函数形式为:
Figure FDA0003401250560000031
它将训练样本集映射到Hilbert空间,得到对应的新的气象数据训练集
Figure FDA0003401250560000032
选取惩罚因子C,控制外点规模和抑制噪声数据点,构造并求解最优问题;
Figure FDA0003401250560000033
s.t.yi((τ·xi)+b)≥1-ξii≥0,i=1,…,L
上式中τ是Hilbert空间中的分类面;ξ是松弛变量;C是惩罚参数;构造Lagrange函数,得到上述问题的对偶问题为:
Figure FDA0003401250560000041
Figure FDA0003401250560000042
得到最优解
Figure FDA0003401250560000043
选取α*的一个正分量
Figure FDA0003401250560000044
并据此计算阈值:
Figure FDA0003401250560000045
最终得到用于气象数据分类的最优分类函数为
Figure FDA0003401250560000046
步骤3.1.2、气象模式类别大于2的支持向量机算法;
采用逐一鉴别方法,构造k个SVM子分类器,在构造第j个SVM子分类器时,将属于第j类别的样本数据标记为正类,不属于j类别的样本数据标记为负类;训练时,对历史气象数据样本分别计算各个子分类器的判别函数值,并选取判别函数值最大所对应的类别为气象数据样本的类别,从而实现多分类;
步骤3.2、利用训练得到的支持向量机分类器,根据与历史风电功率预测误差数据对应的历史气象数据,判断出历史风电功率预测误差数据样本点所对应的气象模式,进而将历史风电功率预测误差数据进行分箱,变为各季度各气象模式的误差数据箱;
步骤4的实现包括以下步骤:
步骤4.1、利用matlab对各季度各气象模式下风电功率预测误差数据集进行统计分析得到各气象模式下风电功率预测误差的概率密度曲线;各曲线为一组二维数据,即平面上的m个点(wp,vp),p=1,2,…,m,wp各不相同,令v=f(w),使得f(w)在最小二乘下与所有数据点最为接近,利用最小二乘拟合,基于通用分布模型,得到各气象模式下风电功率预测误差的概率密度通用分布解析表达式;
令f(w)=a1r1(w)+a2r2(w)+…asrs(w),
式中,rz(w)为选定的一组线性无关的函数,az为待定系数,z=1,2,…,s,δp为vp与f(wp)的距离;v与w之间的函数关系为所选取的通用分布模型;
步骤4.2、确定待定系数az
Figure FDA0003401250560000051
式中,J即为各点的距离平方之和;为求az使J达到最小,利用极值的必要条件
Figure FDA0003401250560000052
z=1,…,s,得到关于a1,…,as的线性方程组,
Figure FDA0003401250560000053
Figure FDA0003401250560000054
Figure FDA0003401250560000055
A=[a1,…,am]T,V=[v1,…,vs]T
则方程组可表示为
RTRA=RTV
当{r1(w),…,rs(w)}线性无关时,R列满秩,RTR可逆,于是方程组有唯一解:
A=(RTR)-1RTV
所选取的通用分布函数形式已知,通用分布的概率密度表达式如下:
Figure FDA0003401250560000061
式中λ,β,γ即为决定通用分布模型形状的参数;
步骤4.3、利用最小二乘拟合,通过使拟合函数与概率密度曲线的距离平方和最小,求出与曲线最接近的通用分布模型中的未知参数,得到相应的通用分布模型,完成不同气象模式下风电功率预测误差的通用分布建模。
CN201911309950.1A 2019-12-18 2019-12-18 一种基于气象模式识别的风电功率预测误差建模方法 Active CN111008504B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911309950.1A CN111008504B (zh) 2019-12-18 2019-12-18 一种基于气象模式识别的风电功率预测误差建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911309950.1A CN111008504B (zh) 2019-12-18 2019-12-18 一种基于气象模式识别的风电功率预测误差建模方法

Publications (2)

Publication Number Publication Date
CN111008504A CN111008504A (zh) 2020-04-14
CN111008504B true CN111008504B (zh) 2022-03-15

Family

ID=70116489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911309950.1A Active CN111008504B (zh) 2019-12-18 2019-12-18 一种基于气象模式识别的风电功率预测误差建模方法

Country Status (1)

Country Link
CN (1) CN111008504B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950598A (zh) * 2020-07-19 2020-11-17 中国海洋大学 一种基于K-Means算法的梭子蟹群体个性分类方法及应用
CN112232387B (zh) * 2020-09-29 2024-02-06 南京财经大学 基于lselm-rfe的粮食作物病害症状的有效特征识别方法
CN112581312B (zh) * 2020-12-21 2024-03-08 国网陕西省电力公司电力科学研究院 风电功率预测误差分布分析方法、装置、计算机设备和可读存储介质
CN113065278B (zh) * 2021-03-15 2023-01-31 国家电网公司华北分部 一种基于频繁模式挖掘的富风期风电小发事件统计特性模型的预测方法
CN113744082A (zh) * 2021-08-25 2021-12-03 国网(苏州)城市能源研究院有限责任公司 一种综合刻画源荷两侧不确定性的二维分箱方法
CN113673912B (zh) * 2021-09-16 2024-03-08 国网山东省电力公司潍坊供电公司 考虑输电网影响的配电-气网分布式协同规划方法及系统
CN116754002B (zh) * 2023-08-16 2023-11-14 深蓝(天津)智能制造有限责任公司 一种旋转变压器的测量误差拟合方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298707A (zh) * 2011-08-24 2011-12-28 辽宁力迅风电控制系统有限公司 基于连续时间段聚类与支持向量机建模的风电功率预测方法
CN105303266A (zh) * 2015-11-23 2016-02-03 国网山东省电力公司经济技术研究院 一种准确估计风电功率预测误差区间的方法
CN105678402A (zh) * 2015-12-29 2016-06-15 北京国能日新系统控制技术有限公司 一种基于季节分区的光伏功率预测方法
CN105930671A (zh) * 2016-04-29 2016-09-07 武汉大学 一种表征风电功率概率分布的改进通用分布及通用混合分布模型
CN110334847A (zh) * 2019-05-24 2019-10-15 广东智造能源科技研究有限公司 基于改进K-means聚类与支持向量机的风功率预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298707A (zh) * 2011-08-24 2011-12-28 辽宁力迅风电控制系统有限公司 基于连续时间段聚类与支持向量机建模的风电功率预测方法
CN105303266A (zh) * 2015-11-23 2016-02-03 国网山东省电力公司经济技术研究院 一种准确估计风电功率预测误差区间的方法
CN105678402A (zh) * 2015-12-29 2016-06-15 北京国能日新系统控制技术有限公司 一种基于季节分区的光伏功率预测方法
CN105930671A (zh) * 2016-04-29 2016-09-07 武汉大学 一种表征风电功率概率分布的改进通用分布及通用混合分布模型
CN110334847A (zh) * 2019-05-24 2019-10-15 广东智造能源科技研究有限公司 基于改进K-means聚类与支持向量机的风功率预测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
《A Novel Wind Power Forecast Model: Statistical Hybrid Wind Power Forecast Technique (SHWIP)》;Mehmet Baris Ozkan等;《IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS》;20150430;第375-387页 *
《Versatile distribution of wind power output for a given forecast value》;Zhang Z S等;《IEEE》;20121231;第1-7页 *
《基于K_means的手肘法自动获取K值方法研究》;吴广建等;《软件》;20190531;第167-170页 *
《基于Kmeans_SVM的短期光伏发电功率预测》;张雨金等;《电力系统保护与控制》;20181101;第118-124页 *
《基于分季建模的风电功率单一预测模型的建立》;张维杰;《中国优秀硕士学位论文全文数据库》;20150315;第12-26,64-74页 *
《基于通用分部的风电功率出力动态场景生成方法》;曹慧秋等;《电测与仪表》;20181225;第6-10页 *

Also Published As

Publication number Publication date
CN111008504A (zh) 2020-04-14

Similar Documents

Publication Publication Date Title
CN111008504B (zh) 一种基于气象模式识别的风电功率预测误差建模方法
CN108564192B (zh) 一种基于气象因子权重相似日的短期光伏功率预测方法
CN107766990B (zh) 一种光伏电站发电功率的预测方法
CN110070145B (zh) 基于增量聚类的lstm轮毂单品能耗预测
CN107392368B (zh) 一种基于气象预报的办公建筑动态热负荷组合预测方法
CN109255094B (zh) 基于SVR_Adaboost改进算法的商用货车质量估计方法
CN109492748B (zh) 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法
CN112186761B (zh) 一种基于概率分布的风电功率场景生成方法及系统
CN106778838A (zh) 一种预测空气质量的方法
CN112308298B (zh) 一种面向半导体生产线的多场景性能指标预测方法及系统
CN113361785A (zh) 配电网短期负荷预测方法、装置、终端及存储介质
CN111091236A (zh) 一种按桨距角分类的多分类深度学习短期风功率预测方法
CN112288157A (zh) 一种基于模糊聚类与深度强化学习的风电场功率预测方法
CN114117852B (zh) 一种基于有限差分工作域划分的区域热负荷滚动预测方法
CN111815039A (zh) 基于天气分类的周尺度风电功率概率预测方法及系统
CN114970725A (zh) 一种基于Adaboost-SVM的变压器工况辨识方法
CN110570091A (zh) 基于改进F-score特征选择及粒子群BP神经网络的负荷辨识方法
CN114240687A (zh) 一种适用于综合能源系统的能源托管效率分析方法
CN114298132A (zh) 风电功率预测方法及装置、电子设备
CN110991638B (zh) 基于聚类及神经网络的广义负荷建模方法
CN110163437A (zh) 基于DPK-means的日前光伏发电功率预测方法
CN115829418A (zh) 适用于负荷管理的电力用户负荷特性画像构建方法和系统
CN115879602A (zh) 一种基于瞬变气象的超短期光伏出力预测方法
CN114234392B (zh) 一种基于改进pso-lstm的空调负荷精细预测方法
CN116187506A (zh) 考虑气象分类的短期风电功率组合概率预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant