基于动态相关性特征的超短期风电功率预测方法
技术领域
本发明属于风电功率预测技术领域,尤其涉及一种基于动态相关性特征的超短期风电功率预测方法。
背景技术
随着世界经济迅猛发展,能源需求成倍增长,能源和环境的问题日益突出。常规能源直接向大气中排放温室气体和气溶胶等引起了全球气候变暖和日益严重的环境污染问题,对自然生态系统、社会经济和人体健康均构成了严重威胁,已引起国际社会和公众的高度关注。为了更好地克服能源供需矛盾的制约,促进全球经济的可持续性发展,应对气候变化,改善人居环境,大力发展包括风能在内的可再生能源已成为各国政府、科技界和公众广泛关注的焦点。风能作为可再生能源发电技术中发展最快的一种能源,越来越受到人们的重视,由于风电场的发电功率具有间歇性和波动性的特点,所以风电接入电网后会对整个电网的电能质量和电力系统运行的稳定性产生重要的影响。如果能对风电功率进行较准确的预测,一方面,电力系统运行人员可以及时调整调度计划,合理安排备用容量,从而提高系统运行的经济性和可靠性;另一方面,可超前进行相应的安全稳定校核,并提供相应的预警信息及预防控制措施,从而提高系统运行的安全稳定性。
目前风电功率的预测方法根据直接预测的物理量不同主要分为两类:一类是直接预测风电场的发电功率,另一类是先进行风速预测,然后根据风电机组或风电发电功率与风速的关系得到风电发电功率。其中,直接预测法常包括物理模型法和统计法两种。物理模型通过对风电场所在地进行物理建模,利用风速、风向、气温和气压等数值天气预报进行预测,该方法的预测结果和建立的模型好坏有很大的关系,如果模型太粗糙,预测精度就会较差。统计方法的实质是利用有效的历史数据(如数值天气预报数据、历史统计风电功率数据)进行预测。常见的统计方法有持续预测法、空间平滑法、时间序列法、卡尔曼滤波法、灰色预测法、人工神经网络法、小波分析法、支持向量机回归法、最小二乘法、模糊逻辑法等。
目前国内的风电功率预测尚处于探索和研究阶段,其预测时效较短,不能满足电力系统的运行调度需要。由于其输入数据、预测尺度等的不同,风电功率的预测误差也不同,尤其复杂地形下的风电功率预测,还缺乏成功预测的案例。探索出精准的风功率预测预报方法,成为当前复杂地形下风电功率预测迫在眉睫的难题。
发明内容
本发明的目的是为了解决现有技术的不足,提供一种基于动态相关性特征的超短期风电功率预测方法,本发明采用统计预测方法,最大限度的利用风电功率时间序列的动态相关性特征,掌握不同时刻风电功率的变化规律,充分利用风电功率的日变化特征如图1,做出准确的预测。本发明方法可滚动预测0-4小时内风电功率,时间间隔为15分钟,具有良好的运用前景。
为了实现上述目的,本发明采用的技术方案如下:
一种基于动态相关性特征的超短期风电功率预测方法,包括以下步骤:
步骤(1),资料收集与整理:选取风电场历史发电功率连续数据,时间间隔为15分钟,整理成样本长度为n的连续时间序列风电功率数据,样本长度越长建立的模型越稳定,所选资料连续时间不得少于10天,即n>960;
步骤(2),动态相关数据构造及相关系数计算:
在进行风电功率预测时需要了解某时刻发电功率与前期发电功率的关系,在此选择预测时刻前120小时内480个时刻对应的发电功率作为该预测时刻的备选预测样本;
(2.1)预测对象数据集构造
从样本最后tn时刻开始,采集tn,tn-1,…,t481时刻对应的发电功率为形成数据集Y作为预测对象数据集,令集合
(2.2)预测样本数据集构造
从样本tn-1时刻开始,采集tn-1,tn-2,…,t480时刻对应的发电功率 形成数据集X1,作为第1个预测样本数据集,令集合
从样本tn-2时刻开始,采集tn-2,tn-3,…,t479时刻对应的发电功率为形成数据集X2,作为第2个预测样本数据集,令集合
…,…
从样本tn-480时刻开始,采集tn-480,tn-481,…,t1时刻对应的发电功率为形成数据集X480,作为第480个预测样本数据集,令集合
(2.3)相关系数计算公式
式中:
━第k个预测样本数据集i时刻发电功率;
Yi━预测对象数据集i时刻发电功率;
━第k个预测样本数据集的平均值;
━预测对象数据集的平均值;
m━构造数据集长度,即n-480;
(2.4)相关系数计算
分别计算共计480个相关系数;
步骤(3),预测样本筛选:根据步骤(1)所选资料,按照步骤(2)的动态相关数据构造方法,构造出长度为n-480的预测对象数据集,以及长度为(n-480)的480个预测样本数据集,运用步骤(2.4)相关系数计算方法分别计算构造后长度为n-480的预测对象数据集与长度为(n-480)的480个预测样本数据集的相关系数;然后将480个相关系数平均分为5个时间段,每个时间段96个相关系数;每个时间段选择1个相关系数最大的作为该时段内最优预测样本数据集的方法,依次选出5个最优预测样本数据集;
步骤(4),预测模型建立:
根据步骤(3)筛选出5个最优预测样本数据集,将这5个样本的时间序列作为预测模型的自变量矩阵X,预测对象的时间序列作为因变量矩阵Y,形成由5维自变量数据矩阵X和1维因变量数据矩阵Y建立的预测模型训练样本。按此方法分别建立00时00分-23时45分每个时刻16个预测模型训练样本,共计96×16=1536个预测模型训练样本,每个时刻预测模型数学表达式如下所示:
…,…
为tn+1时刻预测功率,分别为tn+1时刻预测的5个最优预测样本数据集,其余预测时刻以此类推,直至预测模型建立完成;
步骤(5),实施预测:
预测模型训练样本建立完成后,获取预测时刻前480个时刻风电场发电功率数据,根据最优样本数据集的相对位置从预测时刻前480个时刻风电场发电功率数据中提取5个最优预测样本数据集,然后采用步骤(4)的方法建立预测模型,再采用APLSR算法进行计算,即得到预测功率;(每个时刻的预测功率有16个预测值);
预测方法:采用自适应偏最小二乘回归方法(APLSR)进行预测,APLSR原理和算法如下:
设样本容量为n,自变量维数为p,因变量维数为q,则自变量数据矩阵X为n×p(n>p)维,因变量矩阵Y为n×q(n>q)维。多元线性回归模型的形式为Y=XB+E(1)
式中B是p×q维需要确定的参数矩阵,E是n×q维的残差矩阵。
(5.1)偏最小二乘回归
针对各自变量间可能存在复共线性问题,从而造成回归模型极不稳定的情况,提出了偏最小二乘回归(PLSR)。它将从数据矩阵X中提取相互正交的PLS成分作为隐变量,让后对隐变量进行回归。PLS成分既保留了原变量中较多的方差,也保留了因变量较大的相关性,从而在消除原自变量复共线性的同时,使所建的回归模型仍能充分地反映出自变量与因变量之间的相关关系。PLS成分的提取可用非线性迭代的NIPALS算法,设T是前k个PLS成分组成的n×k维隐变量矩阵,且有
T=XU (2)
回归模型式(1)将变换为
Y==TC+E=XUC+E (3)
其中,其中U是p×k维转换矩阵,C是k×q维回归系数矩阵。在计算出C与U后,q个因变量的预测值可用如下回归方程计算
(5.2)自适应偏最小二乘回归
预测是建立模型的重要目标,对于一个非线性问题,由式(1)建立的全局线性回归模型,难以在定义区域的全范围内进行准确的预测。然而非线性问题往往可以在一个局部的较小的定义域内,用线性关系来近似,它们将定义域先划分为若干个较小的区域,在这些小区域内进行线性回归。但是,要恰当地划分定义域较为困难,同时在区域边界的附近较难保证预测精度。为此提出自适应回归方法,用以应对这些难点,它将以被预测的对象为出发点,并认为在建立适用于该预测对象的模型时,各个样本处于不同的地位,应分配不同的权值,而权值的分配将自适应地进行。
在自变量的定义域中,设预测对象为x*,样本xi与它的相似度可定义为
其中,ED*是样本xi和预测对象x*之间的欧氏距离。样本和预测对象间的欧氏距离距离越小,其相似度就越大,它对预测对象的线性预测能力也越大,建模中应分配较大的权值。将所有相似度SD*(i=1,2,...,n)从大至小排列,样本xi的相似度序号记为SNi *。设相似度最大的样本xmax,其序号显然有
依据相似度可以设计多种为样本分配权值的方案,在此采用简单易行的方案,对样本xi分配的权值为
式中的m是一个正整数,为权值分配的调整参数,该参数将在具体建模的过程中自适应地选定,如果部分权值为0,这意味着将会舍弃部分样本,它们不参与建模。当自变量间存在相关性时,随着样本个数的减少,出现复共线性的可能性将会增强,此时应采用PLSR方法,由此将构成自适应加权与偏最小二乘法相结合的APLSR算法。
(5.3)APLSR算法计算步骤
(1)设算法中实施偏最小二乘法时所提取并选用的隐变量(即PLS成分)数为k,令k取值为1,2,...,p;在每个k值下,又令调整参数m分别取值为k+1,k+2,…,n+1。
(2)对于每对确定的k和m值,采用交叉验证的方法,亦即将每个样本都选出1次不参与回归建模,而是作为验证样本,分析其预测相对误差,进而算出所有样本相对误差平方和。
首先分别从n个样本中选出第j个样本xj(j=1,2,...n)为校验样本,其余的则都作为建模样本。选择好样本以后,按照式(5)来计算n-1个建模样本xi(i=1,2,...,j+1,j+2,...,n与检验样本xj之间的相似度对它们进行排序处理并得到相对应的序号然后由式(6)为每个建模样本xi自适应地分配权值a(xi)。在得到权值a(xi)以后,可将权值进行开根号处理(即作为对角权矩阵W的对角元素,再加权处理建模样本的自变量矩阵X和因变量矩阵Y(不含校验样本),构成新的m×p维的自变量矩阵Xm=WX和m×q维因变量矩阵Ym=WY。接下来采用NIPALS算法从自变量矩阵Xm中提取前k个PLS成分,构成m×k维隐变量矩阵Tm,k,并求出p×k维转换矩阵Um,k。针对隐变量矩阵Tm,k和新的因变量矩阵Ym进进行最小二乘法回归,最终可得p×k维回归系数矩阵Cm,k。在得到回归系数矩阵以后,就可以计算校验样本xj的q个因变量的预测值矢量它代表矢量的第l个分量为当j=1,2,...,n时,将对每个样本进行一次预测,对于每对确定的m和k值,按式(7)计算相应的预测相对误差平方和,并记为Em,k
其中,yjl是因变量矩阵Y中的元素(样本的实际观测值)。将每个Em,k值放入相对误差矩阵R的第m行、第k列,在矩阵空白处以正无穷填补,选取误差矩阵R中最小值的元素,所在行列分别标记为mmin、kmin。对于取值为x*的预测对象,则将权值调整参数m取为mmin,根据式(5)、式(6)来计算所有样本与预测对象的相似度,并按照上面介绍过的方法进行排序,再分配权值至每一个样本,进而对自变量矩阵X和因变量矩阵Y进行加权处理。最终就可以在进行偏最小二乘回归时提取kmin个PLS成分,至此对于预测对象x*的回归预测模型就已经建立完成。
步骤(6),预测误差计算方法:
根据中华人民共和国能源行业标准《风电功率预测系统功能规范》(NB\T31046-2013)考核标准,分别计算风电场发电功率超短期预测的均方根误差,用于检验预测效果,计算公式如下:
式中:
PMi━i时刻的发电功率;
PPi━i时刻的预测功率;
Capi━i时刻的开机总容量;
n━预测样本个数。
本发明采用的预测方法为:
(1)从某装机容量为750KW的风电场单机发电功率日变化特征(图1)可以清楚的看到,风电场发电功率具有明显的日变化特征,可以利用近期发电功率作为预测样本进行超短期功率预测;
(2)由于历史发电功率可能出现资料不连续的现象,首先收集资料连续时间大于10天的资料形成多个资料集,将资料集整理成预测对象与预测样本资料集;
(3)根据整理出的资料,按照动态相关数据构造方法,构造出样本长度为n-480的预测对象数据集,以及样本长度为(n-480)的480个预测样本数据集,运用相关系数计算方法分别计算预测对象与前480个预测样本的相关系数。然后将480个相关系数平均分为5个时间段,每个时间段96个相关系数;每个时间段选择1个相关系数最大的作为该时段内最优预测样本数据集的方法,依次选出5个最优预测样本数据集;
(4)依据筛选出的5个最优预测样本数据集,将这5个样本的时间序列作为预测模型的自变量矩阵X,预测对象的时间序列作为因变量矩阵Y,形成由5维自变量样本数据矩阵X和1维因变量样本数据矩阵Y建立的预测模型训练样本。分别建立00时00分-23时45分每个时刻16个预测模型训练样本;
(5)预测模型训练样本建立完成后,采集最近480个时刻的风电场发电功率,按照最优样本的相对位置提取5个预测样本数据,采用APLSR算法进行计算。
本发明与现有技术相比,其有益效果为:
本发明采用统计预测方法,提供一种基于动态相关性特征的超短期风电功率预测方法,该方法最大限度的利用风电功率时间序列的动态相关性特征,在掌握不同时刻风电功率变化规律的基础上,充分利用近期风电功率的变化特征,做出准确的预测;本发明方法可滚动预测0-4小时内风电功率功率,时间间隔为15分钟。
本发明所有时刻的均方根误差均小于0.15,预测误差小于中华人民共和国能源行业标准,本发明预测精度完全满足电网实时电力调度需要。
采用本发明预测方法可保障电网运行的安全稳定,提高电网公司风电消纳能力、运行管理效率,促进节能减排,同时,本发明方法必将产生巨大的经济和社会效益,具有良好的运用前景。
从图1可清楚的看到日发电功率具有明显的日变化特征,发电功率最小往往出现在上午,发电功率最大出现在下午,发电功率从上午开始呈上升趋势一直持续到傍晚,之后开始转为下降趋势,如此反复循环,认识到这样的变化规律为风电功率预测提供了便利条件。
附图说明
图1为本发明提供的某风电场平均单机发电功率日变化图;
图2为本发明提供的超短期风电功率预测方法流程图;
图3为本发明提供的超短期风电功率预测方法动态相关系数统计图;
图4为本发明提供的2014年4月24日超短期风电功率预测第1个点预测与实际功率对比图;
图5为本发明提供的2014年4月24日超短期风电功率预测第16个点预测与实际功率对比图;
图6为本发明提供的2014年3月-2015年2月超短期风电功率预测16点平均均方根误差月际变化图;
图7为本发明提供的2014年3月-2015年2月超短期16个点均方根误差分布图。
具体实施方式
下面结合实施例对本发明作进一步的详细描述。
本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过购买获得的常规产品。
如图2所示,本发明基于动态相关性特征的超短期风电功率预测方法,主要包括以下步骤:
1资料收集与整理
选取风电场历史发电功率连续数据,时间间隔为15分钟,整理成样本长度为n的连续时间序列风电功率数据,样本长度越长建立的模型越稳定,所选资料连续时间不得少于10天,即n>960;
2动态相关数据构造动态相关数据构造及相关系数计算
在进行风电功率预测时需要了解某时刻发电功率与前期发电功率的关系,在此选择预测时刻前120小时内480个时刻对应的发电功率作为该预测时刻的备选预测样本;
具体步骤如下:
(2.1)预测对象数据集构造
从样本最后tn时刻开始,采集tn,tn-1,…,t481时刻对应的发电功率为形成数据集Y作为预测对象数据集,令集合
(2.2)预测样本数据集构造
从样本tn-1时刻开始,采集tn-1,tn-2,…,t480时刻对应的发电功率 形成数据集X1,作为第1个预测样本数据集,令集合
从样本tn-2时刻开始,采集tn-2,tn-3,…,t479时刻对应的发电功率为形成数据集X2,作为第2个预测样本数据集,令集合
…,…
从样本tn-480时刻开始,采集tn-480,tn-481,…,t1时刻对应的发电功率为形成数据集X480,作为第480个预测样本数据集,令集合
(2.3)相关系数计算公式
式中:
━第k个预测样本数据集i时刻发电功率;
Yi━预测对象数据集i时刻发电功率;
━第k个预测样本数据集的平均值;
━预测对象数据集的平均值;
m━构造数据集长度,即n-480;
(2.4)相关系数计算
分别计算共计480个相关系数;
3预测样本筛选
按照动态相关数据构造方法,构造出样本长度为n-480的预测对象数据集,以及样本长度为(n-480)的480个预测样本数据集,运用相关系数计算方法分别计算相关系数,并绘制成相关系数图3。从超短期相关系数图3看到,趋势上距离起报时刻越近相关系数越大,距离越远相关系数越小,但是并不是呈线性下降,而是呈周期性波动下降,并具有明显的日变化特征。
采用一个周期波动时段内(96个点)选择相关系数最大的作为该时段最优预测样本数据集,依次选出5个最优预测样本数据集的方法建立预测模型。
4预测模型建立
根据筛选出的5个最优预测样本数据集,将这5个样本的时间序列作为预测模型的自变量矩阵X,预测对象的时间序列作为因变量矩阵Y,形成由5维自变量数据矩阵X和1维因变量数据矩阵Y建立的预测模型训练样本。按此方法分别建立00时00分-23时45分每个时刻16个预测模型训练样本,共计96×16=1536个预测模型训练样本,每个时刻预测模型数学表达式如下所示:
…,…
为tn+1时刻预测功率,分别为tn+1时刻预测的5个最优预测样本数据集,其余预测时刻以此类推,直至预测模型建立完成;
5实施预测:
预测模型训练样本建立完成后,获取预测时刻前480个时刻风电场发电功率数据,根据最优样本数据集的相对位置从预测时刻前480个时刻风电场发电功率数据中提取5个最优预测样本数据集,然后采用步骤(4)的方法建立预测模型,再采用APLSR算法进行计算,即得到预测功率;(每个时刻的预测功率有16个预测值);
6预测误差计算方法:
根据中华人民共和国能源行业标准《风电功率预测系统功能规范》(NB\T31046-2013)考核标准,分别计算风电场发电功率超短期预测的均方根误差,用于检验预测效果,计算公式如下:
式中:
PMi━i时刻的发电功率;
PPi━i时刻的预测功率;
Capi━i时刻的开机总容量;
n━预测样本个数。
下面以具体实例对本发明的风电功率超短期预测方法作进一步说明。
(1)选择云南省第一个建设并网发电的大理者磨山风电场风电功率进行预测分析,该风电场装机容量为49.5MW。建模样本资料选择时间段为2012年10月1日-2014年2月28日,资料长度超过1年,涵盖春夏秋冬各个季节,时间均为00时00分到23时45分,时间间隔为15分钟。
(2)选取2014年3月1日00是00分-2015年2月28日23时45分作为预测时间段,时间长度为1整年,以便检验不同季节的预测能力。
(3)以2014年4月24日8时预测为例具体说明预测实施方法。
(3.1)建立训练样本
以2012年10月6日-2014年2月28日8时风电功率数据为基础,按照下表的位置关系,首先建立8时的16次训练样本,如表1所示。
表1
注:为8时风电功率
(3.2)预测样本
以2014年4月24日8时、23日9时30分、22日8时15分、21日8时30分、20日9时作为第1次预测的预测样本,其余15次预测样本按上表的位置关系建立;
(3.3)运用APLSR算法确定训练样本权值参数,通过预测样本预测8时15分功率,其余15个时刻预测以此类推,所得结果如表2所示。
表2
实际发电功率 |
10.649 |
预测功率(第1个点) |
11.47111 |
预测功率(第2个点) |
11.36875 |
预测功率(第3个点) |
11.59431 |
预测功率(第3个点) |
11.03623 |
预测功率(第4个点) |
11.02647 |
预测功率(第6个点) |
11.02486 |
预测功率(第7个点) |
10.80402 |
预测功率(第8个点) |
10.76796 |
预测功率(第9个点) |
10.82933 |
预测功率(第10个点) |
10.90764 |
预测功率(第11个点) |
11.11458 |
预测功率(第12个点) |
10.96134 |
预测功率(第13个点) |
11.51982 |
预测功率(第14个点) |
12.18413 |
预测功率(第15个点) |
12.918 |
预测功率(第16个点) |
13.76487 |
2014年4月24日全天15分钟及4小时预测结果图4和5所示,通过预测对比,预测功率与实际发电功率非常接近,实时跟踪能力强。
为进一步检验预测效果,按照中华人民共和国能源行业标准《风电功率预测系统功能规范》(NB\T31046-2013)考核标准,对预测结果进行考核检验,16个点平均均方根误差月季变化如图6所示。从月际RMSE分布图看到,最小的2014年9月为0.04,最大的2014年5月为0.13,平均RMSE为0.10。16个点均方根误差分布如图7所示,从图7中看到时间越短误差越小,时间越长误差越大,最近的第1个点RMSE为0.04,1小时为0.08,2小时为0.10,3小时为0.11,4小时为0.12,所有16个时刻的均方根误差均小于0.15,预测误差小于中华人民共和国能源行业标准,本发明预测精度完全满足电网实时电力调度需要。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。