CN113256018A - 一种基于条件分位数回归模型的风电功率超短期概率预测方法 - Google Patents

一种基于条件分位数回归模型的风电功率超短期概率预测方法 Download PDF

Info

Publication number
CN113256018A
CN113256018A CN202110636517.XA CN202110636517A CN113256018A CN 113256018 A CN113256018 A CN 113256018A CN 202110636517 A CN202110636517 A CN 202110636517A CN 113256018 A CN113256018 A CN 113256018A
Authority
CN
China
Prior art keywords
sample
wind power
coefficient
regression model
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110636517.XA
Other languages
English (en)
Other versions
CN113256018B (zh
Inventor
孙永辉
周衍
王森
侯栋宸
王建喜
张林闯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202110636517.XA priority Critical patent/CN113256018B/zh
Publication of CN113256018A publication Critical patent/CN113256018A/zh
Application granted granted Critical
Publication of CN113256018B publication Critical patent/CN113256018B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/061Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Operations Research (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Mathematical Optimization (AREA)
  • Neurology (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Microelectronics & Electronic Packaging (AREA)

Abstract

本发明公开了一种基于条件分位数回归模型的风电功率超短期概率预测方法,首先分析风电功率时间序列的特性,研究基于多元时间序列基序的层次聚类方法,综合考虑静态特性、动态特性及气象特性,然后基于聚类结果计算样本倍增系数,并以此为条件针对每一个样本类进行分位数回归以训练模型,完成参数优化,最后输入风电功率时间序列,实现超短期概率预测。本发明其预测区间性能明显优于传统基于分位数回归模型的预测模型,且具有较好的可靠度,极大的提高了风电功率预测可信度。

Description

一种基于条件分位数回归模型的风电功率超短期概率预测 方法
技术领域
本发明涉及新能源发电和智能电网技术领域,尤其是一种基于条件分位数回归模型的风电功率超短期概率预测方法。
背景技术
近些年来,随着风电装机容量的不断增加,风能已经成为了最重要的可再生能源之一。然而风力发电具有不确定性和随机性,限制了其应用和发展。传统的风电功率预测集中于确定性预测,即点预测,缺少对不确定性的描述,使得无法给予电网调度部门更为客观、全面的信息。鉴于此,越来越多的技术人员关注概率区间预测方法。有别于点预测方法直接预测一个确定的数值,概率区间预测方法计算一个预设置信区间下的预测范围。相较于传统的点预测,区间预测的结果可信度更高,可以为合理的电力调度等提供更为科学的数据参考。
目前,概率区间预测主要采用的是基于参数化模型的概率区间预测。预测区间的构建基于两部分:点预测和不确定性分析。在点预测结束后,假设风电功率预测误差满足某种分布,如β分布,标准正态分布等,然后根据预先假设的分布情况计算预测误差,再加上点预测值构成区间上下界限的计算。然而,实际风电功率波动大、复杂性强,很难确定实际的误差分布情况。
随着近年来,概率预测模型的理论的研究逐渐增多,越来越多的非参数建模方法用于风电功率的概率区间预测。目前为了直接获得概率预测区间,会采用元启发式算法,如粒子群算法等直接对模型系数进行优化,从而通过反复迭代训练得到最优模型。但该方法训练时间长,效率低。极限学习机是一种高效简洁的前馈神经网络,不同于传统的反馈型神经网络,需要反复寻优计算参数,耗费时间和计算资源且容易陷入局部最小值。
基于分位数回归模型的概率区间预测方法越来越受技术人员重视,传统的线性分位数回归方法在统计学回归分析中常用来做回归分析和预测。为了改进传统的分位数回归模型,目前包括将极限学习机模型用于改进分位数回归方法,将线性模型改进为非线性模型。
聚类方法是最有效的数据挖掘技术之一,可以有效提高模型训练准确度。聚类理论如层次聚类法已经广泛用于功率预测技术,目前主要是针对确定预测模型。现有的基于聚类方法的概率预测模型主要是针对基于参数化模型方法,即先基于聚类方法进行确定性预测,然后再分析预测误差计算预测区间。由于确定性预测方法受限于误差假设的准确性,因此,研究基于聚类方法和非参数化模型的概率预测方法很有意义。
发明内容
本发明所要解决的技术问题在于,提供一种基于条件分位数回归模型的风电功率超短期概率预测方法,能够提高风电功率预测的可信度。
为解决上述技术问题,本发明提供一种基于条件分位数回归模型的风电功率超短期概率预测方法,包括如下步骤:
(1)针对数据进行预处理,即初始化极限学习机模型的输入层至隐含层的系数和隐含层的阈值,预测额定置信区间,导入经过归一化处理的历史风功率时间序列,构建样本;
(2)构建多个时间序列基序,分别算出基于静态特性、动态特性及气象特性差异性,结合不同时间序列基序的差异性,基于加权衡量不同特性,构建基于多种时间序列基序的样本距离计算;
(3)将上述样本距离计算作为差异性衡量指标,基于层次聚类方法和极限学习机模型,搭建确定性预测模型,实现点预测,并通过选取最小误差值,确定最优的特征值权重系数组合及各类样本;
(4)计算各样本类的相似度,针对各类确定其余样本的样本倍增系数,并以该倍增系数,并结合分位数回归模型的样本使用系数,搭建条件分位数回归模型。
优选的,步骤(1)中,针对数据进行预处理,即初始化极限学习机模型的输入层至隐含层的系数和隐含层的阈值,预测额定置信区间,导入经过归一化处理的历史风功率时间序列,构建样本具体包括如下步骤:
(1.1)依次初始化极限学习机的隐含层系数和阈值;
(1.2)设置分位数回归模型的上下分位数值,使得上分位数百分比减去下分位数百分比为置信区间百分比;
(1.3)将历史风功率时间序列导入且序列归一化处理;
(1.4)构建时间序列的输入输出样本集D,其表达式如下:
Figure BDA0003105431990000021
其中,xi和yi均为风功率数值,分别为第i组样本的输入向量和对应的实测值,S为样本数。
优选的,步骤(2)中,构建多个时间序列基序,分别算出基于静态特性、动态特性及气象特性差异性,结合不同时间序列基序的差异性,基于加权衡量不同特性,构建基于多种时间序列基序的样本距离计算具体包括如下步骤:
(2.1)第m和n个时间序列静态特性的差异性如下:
Figure BDA0003105431990000031
式中,DT表示静态特征差异性,ki代表第i个变量的权重系数,该系数基于Spearman相关性分析,反映输出和输入变量的同步性与相似性,xm,i和xn,i分别代表了第m和n个输入向量中第i个变量,N为变量个数;
(2.2)第m和n个时间序列动态特性的差异性如下:
Figure BDA0003105431990000032
式中,DD表示动态特性差异,υ表示相邻风电功率的差值,反映风速在时间尺度上的波动程度,j表示变量序号;
(2.3)第m和n个时间序列气象特性的差异性如下:
Figure BDA0003105431990000033
式中,Dω表示气象特性,即待测时刻风速之间的差值,Capi表示第i个风电场的容量,ωm和ωn分别为第m和n个时间序列中待测时刻的风速预测值,M为电场个数;
(2.4)DWMTSM代表基于时间序列基序的综合距离计算指标,计算如下:
DWMTSM=λTDTDDDωDω
式中,λTD和λω分别代表静态特征、动态特征以及气象特征的权重系数,基于时间序列基序的综合距离计算加权考虑三种特性的影响程度。
优选的,步骤(3)中,将上述样本距离计算作为差异性衡量指标,基于层次聚类方法和极限学习机模型,搭建确定性预测模型,实现点预测,并通过选取最小误差值,确定最优的特征值权重系数组合及各类样本具体包括如下步骤:
(3.1)将差异性计算指标DWMTSM作为样本距离衡量标准,进行层次聚类;
(3.2)将样本数据集中的xi按如下公式处理得Hi,其计算表达式如下:
Figure BDA0003105431990000041
式中,l为极限学习机隐含层神经元个数,S为输入历史风功率采样点数,a和b分别为极限学习机隐含层的系数和阈值,得
Figure BDA0003105431990000042
Figure BDA0003105431990000043
为sigmoid激励函数;
(3.3)构建极限学习机模型,其表达式如下:
g(xi,w)=Hiw
其中g(xi,w)为极限学习机的输出值,xi为第i个样本输入,w为极限学习机输出系数;
(3.4)根据平均绝对值误差和均方根误差指标,确定最优的λTD和λω及对应的训练样本类划分,计算指标如下:
Figure BDA0003105431990000044
Figure BDA0003105431990000045
式中,MAE()为平均绝对值误差,RMSE()为均方根误差,Tp代表测试样本规模,w为点预测对应的输出系数,yi和g(xi,w)分别为第i个样本对应的实测值和预测值。
优选的,步骤(4)中,计算各样本类的相似度,针对各类确定其余样本的样本倍增系数,并以该倍增系数,并结合分位数回归模型的样本使用系数,搭建条件分位数回归模型具体包括如下步骤:
(4.1)根据样本类中心之间的距离
Figure BDA0003105431990000046
计算各类中心的倍增系数,计算如下:
Figure BDA0003105431990000047
式中,C代表倍增系数;
(4.2)将样本倍增系数引入分位数回归模型,提高训练样本的使用精度,计算公式如下:
Figure BDA0003105431990000051
满足条件:
Figure BDA0003105431990000052
Figure BDA0003105431990000053
Figure BDA0003105431990000054
Figure BDA0003105431990000055
式中,Ci和xi分别为各类样本对于第i类样本训练时的的使用权重和输入,α为设定的置信度百分比,wα为对应的输出系数,
Figure BDA0003105431990000056
和α分别代表上下分位数对应的百分比,
Figure BDA0003105431990000059
和w α 分别为对应的输出系数,
Figure BDA0003105431990000057
Figure BDA0003105431990000058
为过渡变量,T为训练样本规模。
本发明的有益效果为:本发明其预测区间性能明显优于传统基于分位数回归模型的预测模型,且具有较好的可靠度,极大的提高了风电功率预测可信度。
附图说明
图1为本发明的方法流程示意图。
图2为本发明1月90%置信度下超前1小时预测区间图。
图3为本发明2月90%置信度下超前1小时预测区间图。
图4为本发明3月90%置信度下超前1小时预测区间图。
图5为本发明4月90%置信度下超前1小时预测区间图。
图6为本发明5月90%置信度下超前1小时预测区间图。
图7为本发明6月90%置信度下超前1小时预测区间图。
具体实施方式
本发明提供的一种基于条件分位数回归模型的风电功率超短期概率预测方法,是基于聚类理论和条件分位数回归模型进行风电功率非参数概率区间超短期预测。可以适用于负荷、风电/光伏出力等其他范围与领域。
本发明的预测模型流程图如图1所示,其实施例步骤主要如下:
(1)针对数据进行预处理,即初始化极限学习机模型的输入层至隐含层的系数和隐含层的阈值,预测额定置信区间,导入经过归一化处理的历史风功率时间序列,构建样本;
(2)构建多个时间序列基序,分别算出基于静态特性、动态特性及气象特性差异性,结合不同时间序列基序的差异性,基于加权系数衡量不同特性,构建综合样本距离计算;
(3)将综合样本距离计算作为差异性衡量指标,基于层次聚类方法和极限学习机模型,搭建确定性预测模型,实现点预测,并通过选取最优误差值,确定最优的特征值权重系数组合及各类样本;
(4)计算各样本类的相似度,针对各类确定其余样本的样本倍增系数,并以该倍增系数作为分位数回归模型的样本使用系数,搭建条件分位数回归模型。
所述步骤1具体包括模型参数初始化和数据的预处理和导入两个子步骤,其中模型参数初始化的具体方法为:
步骤1.11:初始化极限学习机的隐含层系数和阈值;
步骤1.12:根据置信区间,设置分位数回归模型的上下分位数值。
数据的预处理的具体方法为:
步骤1.21:将风功率数据导入且时间序列归一化;
步骤1.22:构建时间序列的输入输出样本集
Figure BDA0003105431990000061
其中,xi和yi均为风功率数值,分别为第i组样本输入和实测值,S为样本数。
所述步骤2具体为三种时间基序特性差异性计算,以及特性综合加权计算,第m和n个时间序列计算为例,具体方法为:
步骤2.1:第m和n个时间序列静态特征差异性DT计算如下:
Figure BDA0003105431990000062
式中,ki代表第i个变量的权重系数,该系数基于Spearman相关性分析,反映输出和输入变量的同步性与相似性,x则代表了输入变量,N为变量个数;
步骤2.2:第m和n个时间序列动态特性差异DD计算如下:
Figure BDA0003105431990000071
式中,DD表示动态特性差异,υ表示相邻风电功率的差值,反映风速在时间尺度上的波动程度,j表示变量序号;
步骤2.3:第m和n个时间序列气象特性差异性Dω计算如下:
Figure BDA0003105431990000072
式中,即待测时刻风速之间的差值,Capi表示第i个风电场的容量,ωm和ωn分别为第m和n个时间序列中待测时刻的风速预测值,M为电场个数;
步骤2.4:基于时间序列基序的综合距离DWMTSM,计算如下:
DWMTSM=λTDTDDDωDω
式中,λTD和λω分别衡量静态特征、动态特征以及气象特征的差异性,基于时间序列基序的综合距离计算加权考虑三种特性的影响程度。
所述步骤3具体为构建基于多种特征差异性层次聚类的点预测模型,并优化相应权重系数,具体方法为:
步骤3.1:基于上述综合距离,构建层次聚类计算方法;
步骤3.2:层次聚类类个数的设置参考训练集误差标准计算结果,三种特征差异性的权重系数根据点预测最优误差结果来确定,误差指标为评价绝对值误差和均方根误差,分别为:
Figure BDA0003105431990000073
Figure BDA0003105431990000074
式中,MAE()为平均绝对值误差,RMSE()为均方根误差,Tp代表测试样本规模,w为点预测对应的输出系数,yi和g(xi,w)分别为第i个样本对应的实测值和预测值。
所述步骤4分为两个子步骤,分别为训练样本倍增和条件分位数回归,具体方法为:
步骤4.11:根据样本类中心之间的距离
Figure BDA0003105431990000081
计算各类中心的倍增系数,计算如下:
Figure BDA0003105431990000082
式中,C代表倍增系数;
步骤4.21:将样本倍增系数引入分位数回归模型,提高训练样本的使用精度,针对每个样本类的计算公式如下:
Figure BDA0003105431990000083
满足条件:
Figure BDA0003105431990000084
Figure BDA0003105431990000085
Figure BDA0003105431990000086
Figure BDA0003105431990000087
式中,Ci为各类样本对于第i类样本训练时的的使用权重,α为设定的置信度百分比,wα为对应的输出系数,
Figure BDA0003105431990000088
和α分别代表上下分位数对应的百分比,
Figure BDA0003105431990000089
和w α 分别为对应的输出系数,
Figure BDA00031054319900000810
Figure BDA00031054319900000811
为过渡变量,T为训练样本规模。
为了使本领域技术人员更加理解本发明所述技术方案,也验证本发明方法的有效性,下面以实际区域风电场发电功率为例做详细介绍。将本发明的方法(CNQR)与现有的方法对比,包括基于自助采样法的极限学习机模型(BELM)、条件概率方法(CPPI)、基于机器学习的线性规划(MLLP)、基于聚类理论的概率预测方法(CM)、分位数回归模型(NQR),以及几种经典的集群功率预测方法,如平滑法(SM)、统计升尺度法(SU)。
我国东北某区域风电场群的风电功率时间序列用来验证模型超短期概率区间预测性能,数据分辨率为15分钟,进行超前1小时风电功率概率预测,数据采用2019年上半年每月中弃风较少的十五天的数据。每组算例测试取15天的数据,前11天的数据用作训练,最后4天的数据用作测试。
评价区间预测性能一般观察两个指标,区间平均覆盖偏差(ACE)和评分(Score)。ACE计算方法如下:
|ACE|=|PICP-PINC|
其中,PICP为实际区间覆盖率,PINC为额定置信度,ACE数值是越接近0越好。
覆盖偏差接近0的同时,区间宽度应尽量窄,计算公式如下:
Figure BDA0003105431990000091
其中,
Figure BDA0003105431990000092
为区间置信区间α下第i个预测值的宽度,平均区间宽度(AW)表示了预测区间的敏锐程度,
Figure BDA0003105431990000093
Figure BDA0003105431990000094
分别为i个样本对应的区间上下边界。
区间评分考虑了区间覆盖率偏差和区间宽度两个因素,计算公式如下:
Figure BDA0003105431990000095
Figure BDA0003105431990000096
Figure BDA0003105431990000097
为区间综合得分,数值为负数,数值越接近0说明预测区间综合性能越好。对于评价预测区间的指标,主要看区间综合得分,平均覆盖偏差一般用来参考区间覆盖性能,即覆盖度需接近额定置信度能证明预测区间具有较好的可靠度。
表1一月数据测试结果
Figure BDA0003105431990000098
表2二月数据测试结果
Figure BDA0003105431990000099
Figure BDA0003105431990000101
表3三月数据测试结果
Figure BDA0003105431990000102
表4四月数据测试结果
Figure BDA0003105431990000103
表5五月数据测试结果
Figure BDA0003105431990000104
表6六月数据测试结果
Figure BDA0003105431990000105
Figure BDA0003105431990000111
表1至表6反映本发明提出的方法与几种经典方法的算例测试对比,已将表中所提出方法的最优指标加粗标黑。数据来自2019年上半年我国东北某区域风电场实际运行状态,结合区间综合评分和可靠度来观测预测区间的性能。综合性能为评价预测区间的决定性指标,同时结合区间覆盖的准确度,来全面地比较概率预测的结果。不同置信度下各月份数据的测试结果显示,本发明方法得到的预测区间具有较好的性能。
图1展示本发明提出的概率预测方法,每个模块部分在前文已有较清晰的阐述,整个流程清晰、简单,具有较强的普适性,所提出的方法的有效性已于实际算例测试验证。
图2至图7,反映的是1至6月置信区间90%、超前一小时的预测效果,数据按风电场群容量归一化之后使用。可以看出风电功率的时间序列是变化复杂的,固定预设的参数建模很难准确估计误差的分布,以准确给出预测区间。从图中可以看出,本发明方法构建的区间有较好的预测效果。综上所述,本发明可实现风功率的区间超短期预测,可用于实际工程应用。

Claims (5)

1.一种基于条件分位数回归模型的风电功率超短期概率预测方法,其特征在于,包括如下步骤:
(1)针对数据进行预处理,即初始化极限学习机模型的输入层至隐含层的系数和隐含层的阈值,预测额定置信区间,导入经过归一化处理的历史风功率时间序列,构建样本;
(2)构建多个时间序列基序,分别算出基于静态特性、动态特性及气象特性差异性,结合不同时间序列基序的差异性,基于加权衡量不同特性,构建基于多种时间序列基序的样本距离计算;
(3)将上述样本距离计算作为差异性衡量指标,基于层次聚类方法和极限学习机模型,搭建确定性预测模型,实现点预测,并通过选取最小误差值,确定最优的特征值权重系数组合及各类样本;
(4)计算各样本类的相似度,针对各类确定其余样本的样本倍增系数,并以该倍增系数作为训练样本的使用系数,并结合分位数回归模型,搭建条件分位数回归模型。
2.如权利要求1所述的基于条件分位数回归模型的风电功率超短期概率预测方法,其特征在于,步骤(1)中,针对数据进行预处理,即初始化极限学习机模型的输入层至隐含层的系数和隐含层的阈值,预测额定置信区间,导入经过归一化处理的历史风功率时间序列,构建样本具体包括如下步骤:
(1.1)依次初始化极限学习机的隐含层系数和阈值;
(1.2)设置分位数回归模型的上下分位数值,使得上分位数百分比减去下分位数百分比为置信区间百分比;
(1.3)将历史风功率时间序列导入且序列归一化处理;
(1.4)构建时间序列的输入输出样本集,其表达式如下:
Figure FDA0003105431980000011
其中,xi和yi均为风功率数值,分别为第i组样本的输入和输出量,S为样本个数。
3.如权利要求1所述的基于条件分位数回归模型的风电功率超短期概率预测方法,其特征在于,步骤(2)中,构建多个时间序列基序,分别算出基于静态特性、动态特性及气象特性差异性,结合不同时间序列基序的差异性,基于加权衡量不同特性,构建基于多种时间序列基序的样本距离计算具体包括如下步骤:
(2.1)第m和n个时间序列静态特性的差异性如下:
Figure FDA0003105431980000021
式中,DT表示静态特征差异性,N为输入变量个数,ki代表第i个变量的权重系数,该系数基于Spearman相关性分析,反映输出和输入变量的同步性与相似性,xm,i和xn,i分别代表了第m和n个时间序列中第i个变量;
(2.2)第m和n个时间序列动态特性的差异性如下:
Figure FDA0003105431980000022
式中,DD表示动态特性差异,υm,j和υn,j分别代表第m和n个时间序列中第j组相邻风电功率的差值,反映风速在时间尺度上的波动程度;
(2.3)第m和n个时间序列气象特性的差异性如下:
Figure FDA0003105431980000023
式中,Dω表示气象特性,即待测时刻风速之间的差值,Capi表示第i个风电场的容量,ωm和ωn分别为第m和n个时间序列中待测时刻的风速预测值,M为风电场个数;
(2.4)DWMTSM代表基于时间序列基序的综合距离计算指标,计算如下:
DWMTSM=λTDTDDDωDω
式中,λTD和λω分别代表静态特征、动态特征以及气象特征的权重系数,基于时间序列基序的综合距离计算加权考虑三种特性的影响程度。
4.如权利要求1所述的基于条件分位数回归模型的风电功率超短期概率预测方法,其特征在于,步骤(3)中,将上述样本距离计算作为差异性衡量指标,基于层次聚类方法和极限学习机模型,搭建确定性预测模型,实现点预测,并通过选取最小误差值,确定最优的特征值权重系数组合及各类样本具体包括如下步骤:
(3.1)将差异性计算指标DWMTSM作为样本距离衡量标准,进行层次聚类;
(3.2)将样本数据集中的xi按如下公式处理得Hi,其计算表达式如下:
Figure FDA0003105431980000031
式中,l为极限学习机隐含层神经元个数,S为输入历史风功率采样点数,a和b分别为极限学习机隐含层的系数和阈值,
Figure FDA0003105431980000032
为sigmoid激励函数得
Figure FDA0003105431980000033
(3.3)构建极限学习机模型,其表达式如下:
g(xi,w)=Hiw
其中g(xi,w)为极限学习机的输出值,xi为样本输入,w为极限学习机输出系数;
(3.4)根据平均绝对值误差和均方根误差指标,确定最优的λTD和λω及对应的训练样本类划分,计算指标如下:
Figure FDA0003105431980000034
Figure FDA0003105431980000035
式中,MAE()为平均绝对值误差,RMSE()为均方根误差,Tp代表测试样本规模,w为点预测对应的输出系数,yi和g(xi,w)分别为第i个样本对应的实测值和预测值。
5.如权利要求1所述的基于条件分位数回归模型的风电功率超短期概率预测方法,其特征在于,步骤(4)中,计算各样本类的相似度,针对各类确定其余样本的样本倍增系数,并以该倍增系数,并结合分位数回归模型的样本使用系数,搭建条件分位数回归模型具体包括如下步骤:
(4.1)根据样本类中心之间的距离
Figure FDA0003105431980000036
计算各类中心的倍增系数,计算如下:
Figure FDA0003105431980000037
式中,C代表倍增系数;
(4.2)将样本倍增系数引入分位数回归模型,提高训练样本的使用精度,计算公式如下:
Figure FDA0003105431980000041
满足条件:
Figure FDA0003105431980000042
Figure FDA0003105431980000043
Figure FDA0003105431980000044
Figure FDA0003105431980000045
式中,Ci为针对待测样本各类样本的使用权重,即样本使用倍数,α为置信度,
Figure FDA0003105431980000046
和α分别代表上下分位数对应的百分比,
Figure FDA0003105431980000047
Figure FDA0003105431980000048
为过渡变量,T为训练样本个数,wα为输出系数,xi为第i个输入样本。
CN202110636517.XA 2021-06-08 2021-06-08 一种基于条件分位数回归模型的风电功率超短期概率预测方法 Active CN113256018B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110636517.XA CN113256018B (zh) 2021-06-08 2021-06-08 一种基于条件分位数回归模型的风电功率超短期概率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110636517.XA CN113256018B (zh) 2021-06-08 2021-06-08 一种基于条件分位数回归模型的风电功率超短期概率预测方法

Publications (2)

Publication Number Publication Date
CN113256018A true CN113256018A (zh) 2021-08-13
CN113256018B CN113256018B (zh) 2022-09-02

Family

ID=77187019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110636517.XA Active CN113256018B (zh) 2021-06-08 2021-06-08 一种基于条件分位数回归模型的风电功率超短期概率预测方法

Country Status (1)

Country Link
CN (1) CN113256018B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608514A (zh) * 2016-03-31 2016-05-25 山东大学 一种基于分位数回归的架空输电线路动态热定值概率分布预测方法
CN108428017A (zh) * 2018-04-23 2018-08-21 华北电力大学 基于核极限学习机分位数回归的风电功率区间预测方法
CN110598929A (zh) * 2019-09-10 2019-12-20 河海大学 一种风电功率非参数概率区间超短期预测方法
CN111695666A (zh) * 2020-05-26 2020-09-22 河海大学 一种基于深度学习的风电功率超短期条件概率预测方法
US20210097453A1 (en) * 2018-06-12 2021-04-01 Tsinghua University Method for quantile probabilistic short-term power load ensemble forecasting, electronic device and storage medium

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105608514A (zh) * 2016-03-31 2016-05-25 山东大学 一种基于分位数回归的架空输电线路动态热定值概率分布预测方法
CN108428017A (zh) * 2018-04-23 2018-08-21 华北电力大学 基于核极限学习机分位数回归的风电功率区间预测方法
US20210097453A1 (en) * 2018-06-12 2021-04-01 Tsinghua University Method for quantile probabilistic short-term power load ensemble forecasting, electronic device and storage medium
CN110598929A (zh) * 2019-09-10 2019-12-20 河海大学 一种风电功率非参数概率区间超短期预测方法
CN111695666A (zh) * 2020-05-26 2020-09-22 河海大学 一种基于深度学习的风电功率超短期条件概率预测方法

Also Published As

Publication number Publication date
CN113256018B (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN112949945B (zh) 一种改进双向长短期记忆网络的风电功率超短期预测方法
CN112686464A (zh) 短期风电功率预测方法及装置
CN108022001A (zh) 基于pca和分位数回归森林的短期负荷概率密度预测方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN107194495B (zh) 一种基于历史数据挖掘的光伏功率纵向预测方法
CN108388962B (zh) 一种风电功率预测系统及方法
CN110807554B (zh) 基于风电/光伏经典场景集的生成方法及系统
CN111753893A (zh) 一种基于聚类和深度学习的风电机组功率集群预测方法
CN103473621A (zh) 风电场短期功率预测方法
CN113344288A (zh) 梯级水电站群水位预测方法、装置及计算机可读存储介质
CN115860177A (zh) 基于组合式机器学习模型光伏发电功率预测方法及其应用
CN103353295B (zh) 一种精确预测大坝坝体垂直变形量的方法
CN112100911A (zh) 一种基于深度bisltm的太阳辐射预测方法
CN114119273A (zh) 一种园区综合能源系统非侵入式负荷分解方法及系统
CN115545333A (zh) 一种多负荷日类型配电网负荷曲线预测方法
CN115660232A (zh) 风电功率的超短期预测方法、装置及系统
Syu et al. Ultra-short-term wind speed forecasting for wind power based on gated recurrent unit
CN108710966B (zh) 一种基于多簇esn神经网络的光伏发电功率预测方法
CN110555566B (zh) 一种基于b样条分位数回归的光电概率密度预测方法
CN113111592A (zh) 一种基于emd-lstm的短期风电功率预测方法
CN117132132A (zh) 基于气象数据的光伏发电功率预测方法
CN113256018B (zh) 一种基于条件分位数回归模型的风电功率超短期概率预测方法
CN116307139A (zh) 一种优化与改进极限学习机的风电功率超短期预测方法
CN112581311B (zh) 一种多风电场聚合后出力长期波动特性预测方法及系统
CN113761023A (zh) 一种基于改进广义神经网络的光伏发电短期功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant