CN110555548B - 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法 - Google Patents

基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法 Download PDF

Info

Publication number
CN110555548B
CN110555548B CN201910716142.0A CN201910716142A CN110555548B CN 110555548 B CN110555548 B CN 110555548B CN 201910716142 A CN201910716142 A CN 201910716142A CN 110555548 B CN110555548 B CN 110555548B
Authority
CN
China
Prior art keywords
formula
elm
value
wind power
hidden layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910716142.0A
Other languages
English (en)
Other versions
CN110555548A (zh
Inventor
徐艳春
邓翱
李振华
谭超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges University CTGU
Original Assignee
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges University CTGU filed Critical China Three Gorges University CTGU
Priority to CN201910716142.0A priority Critical patent/CN110555548B/zh
Publication of CN110555548A publication Critical patent/CN110555548A/zh
Application granted granted Critical
Publication of CN110555548B publication Critical patent/CN110555548B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于数据挖掘原始误差校正的ICS‑ELM超短期风电功率预测方法,首先,采用数据挖掘DM技术描述风速和风电功率的关系,对无效、缺失的原始数据进行修正;然后,通过变分模态分解VMD将风电功率分解为趋势分量和细节分量,以趋势分量作为输入量以减少噪声量;同时,提出一种改进布谷鸟搜索ICS算法对ELM的输入层权值矩阵和隐含层偏置矩阵进行优化;最后通过ELM网络完成风电功率预测。本发明一种基于数据挖掘原始误差校正的ICS‑ELM超短期风电功率预测方法,该方法针对风电时间序列的原始误差和非平稳波动特征,具有更高的预测精度和稳定性,适用于超短期风电功率预测问题。

Description

基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法
技术领域
本发明涉及属于新能源发电功率预测技术领域,尤其涉及一种基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法。
背景技术
风能作为目前最具潜力和发展前景的能源形式,由于受气候变化和地理因素的影响,其固有的随机性和间歇性严重阻碍了风电的进一步发展。在波动超出系统消纳能力时,会造成不同程度的“弃风”现象,从而直接导致资源浪费,也对含新能源的电力系统安全及可靠运行带来严峻的挑战。因此,准确地对风电出力进行预测,对于风电场规模化并网与运营维护、电力电网企业制定精确的调度计划、优化电力系统电力资源配置等具有重要意义。
目前,风电出力进行预测结果的准确性,主要受两个方面的影响:一是现有数据和信息的处理方式,二是风电预测方法。对于数据处理方式,由于SCADA(SupervisoryControl And Data Acquisition)系统的故障和传感器的老化等,采集的历史数据会存在遗漏和误差。如何从大量的数据中提取信息量和处理不合理的数据,仍然是目前亟待解决的问题。对于预测方法,近年来由于人工智能和大数据的兴起,机器学习算法被广泛应用于风电功率预测。与传统人工神经网络(Artificial Neural Network,ANN)和梯度下降学习算法关联的结构相比,极限学习机(Extreme Learning Machine,ELM)有效地规避了常规ANN训练过程中梯度消失和梯度爆炸问题,具有学习速度快、泛化能力强的特点。而由于ELM中参数的随机选择,可能会造成解的数值不稳定和无法满列秩等一些病态问题。为了改善ELM的风电预测性能,需要针对不同的风电样本选择相应的ELM最优网络参数。
发明内容
本发明提供一种基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法,该方法针对风电时间序列的原始误差和非平稳波动特征,具有更高的预测精度和稳定性,适用于超短期风电功率预测问题。
本发明采取的技术方案为:
基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法,首先,采用数据挖掘DM技术描述风速和风电功率的关系,对无效、缺失的原始数据进行修正;然后,通过变分模态分解VMD将风电功率分解为趋势分量和细节分量,以趋势分量作为输入量以减少噪声量;同时,提出一种改进布谷鸟搜索ICS算法对ELM的输入层权值矩阵和隐含层偏置矩阵进行优化;最后通过ELM网络完成风电功率预测。
基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法,包括以下步骤:
步骤1、采用DM技术,对风电功率原始数据进行修正;
步骤2、利用VMD对风电功率数据进行分解,得到若干个低频分量和高频分量,选取合适的低频分量重构形成趋势分量,以作为模型的输入;
步骤3、初始化ICS算法的参数和ELM的网络结构,确定适应度函数;
步骤4、将训练样本的修正值输入ELM并计算适应度值,根据ICS算法步骤,更新鸟巢位置,比较种群当前适应度值和全局历史最优适应度值,确定全局最优位置,即最优解;
步骤5、由得到的最优输入权重和隐含层偏置参数,建立ELM预测模型。
所述步骤1中,所述DM技术采用MATLAB中的curve fitting工具包,分别采用多项式拟合,傅里叶拟合和高斯拟合的方法,选取和方差SSE和确定系数R2为评价指标,找到最优的拟合方法,然后对其进行筛选、补充和矫正。
所述步骤1中,异常的风速、风电功率原始数据分为三类:第一类是风速和风电功率出现负值;第二类是风速不为0而功率值为0;第三类是由于设备故障等导致风速和功率数据出现丢失;
针对原始数据的修正处理分为三种:1)风速不为0而功率值为0时,风电功率由拟合函数求得;2)风速出现负值时遗弃样本,风速在切入风速上下浮动的点所对应的功率值出现负值时,取功率值为0;3)、对于出现时间序列数据缺失的情况,功率缺失时同样采用拟合函数求取功率值,如果风速和功率值都缺失,则分别用前一个采样点和后一个采样点的平均值填补。
所述步骤2中,所述VMD是能将一组非线性信号按不同频带分解为若干个低频分量和高频分量的信号处理方法,实质上是变分问题的求解,一个时间序列经VMD分解后进行筛选,如公式(4)所示:
Figure GDA0002241594380000021
其中,PTrend,i为第i个低频模态分量;PDetail,j为第j个高频模态分量。由n个低频分量构成的
Figure GDA0002241594380000022
代表信号的趋势分量,能够捕捉到原始信号的趋势;由m个高频分量构成的
Figure GDA0002241594380000031
代表信号的细节分量,其所包含的有用信息较少,一般为噪声分量。
所述步骤3中,所述适应度函数选取为拟合的残差平方和,即公式(9)所示:
Figure GDA0002241594380000032
式中:n为训练样本数;yi为训练样本的输出值;
Figure GDA0002241594380000033
为对应的拟合值。
所述步骤4中,所述ICS算法是针对标准CS的改进,CS算法寻优过程分为两个部分,第一个部分是通过Lévy飞行进行全局随机游走,其主要迭代过程如公式(5)所示:
Figure GDA0002241594380000034
式中:
Figure GDA0002241594380000035
表示第t代的第i个解;
Figure GDA0002241594380000036
表示点乘法;α表示步长控制因子;Levy(λ)服从Lévy概率分布,通常使用公式(6)来生成Lévy随机数:
Figure GDA0002241594380000037
式中:μ,ν服从标准正态分布;λ为幂次系数,布谷鸟的连续跳跃本质上形成随机游走过程,该过程遵循具有重尾的幂律步长分布;λ通常取1.5,φ取值如公式(7)所示:
Figure GDA0002241594380000038
式中:Γ()为标准的Gamma函数。
CS算法的第二部分会依据发现概率Pa丢弃部分解,然后通过偏好游走生成新解以取代它们,如公式(8)所示:
Figure GDA0002241594380000039
式中:r为比例因子,取值服从区间[0,1]上的均匀分布;
Figure GDA00022415943800000310
Figure GDA00022415943800000311
表示第t次迭代的两个随机解。
所述步骤4中,所述ICS算法是针对标准CS算法的改进,标准CS算法中Pa为固定值,步长由随机游走策略决定而大小不定。为此,根据算法的运行进程,动态地对其参数进行调整:
(1)、发现概率的动态调整策略:
在CS算法中引入一个正弦递增算子来调整发现概率Pa,如公式(10)所示:
Figure GDA0002241594380000041
式中:Pa,max和Pa,min是Pa的动态控制参数;T为最大迭代次数,t为当前迭代次数。
(2)、步长的动态调整策略:
根据当前最优鸟巢的生成信息,自适应调整下一代的步长,如公式(11)所示:
Figure GDA0002241594380000042
式中:m∈(0,1)为调节因子;k∈[0,1]为极限因子;INT为0到30的整数;xbest为当代的最优解;Smin为步长的最小值;exp()为以自然常数e为底的指数函数。
所述步骤5中,所述ELM为一种单隐层前馈神经网络,其数学描述如公式(13)所示:
Figure GDA0002241594380000043
式中:i=1,2,3,...,N;bj是第j个隐含层节点的阈值;aj=[a1j,a2j,…,arj]T为连接第j个隐含层节点和输入层节点的权值向量;g(x)为激励函数,本发明选取的为Sigmoid函数;βj=[βj1j2,…,βjm]T(j=1,2,…,L)为连接第j个隐含层节点和输出节点的权值向量;xi为一个样本向量的第i个元素;N为样本个数;L为隐含层节点个数。
把N个样本代入到公式(13),可以得到如下矩阵形式:
Hβ=Y   (14)
Figure GDA0002241594380000044
β=[β12,…,βL]T   (16)
Y=[y1,y2,…,yN]T   (17)
式中:H表示隐含层输出矩阵;β表示输出权值矩阵;Y表示目标值矩阵;N为样本个数;L为隐含层节点个数;x1,x2,…,xN分别为第1,2,…,N个样本向量;a1,a2,…,aL分别为输入层连接到第1,2,…,L个隐含层节点的权值向量;b1,b2,…,bL分别为第1,2,…,L个隐含层节点的阈值;
Figure GDA0002241594380000051
分别为第1,2,…,N个样本到隐含层的输出向量;β12,…,βL分别为第1,2,…,L个隐含层节点连接到输出层的权值向量;y1,y2,…,yN分别为第1,2,…,N个样本对应的目标值。
所述步骤5中,ELM算法步骤如下:
(1)随机确定输入权重aj和隐含层偏置bj
(2)计算隐含层输出矩阵H;
(3)计算输出权重,即线性系统Hβ=Y最小范数的最小二乘解,计算式如公式(18)所示:
β=H-1Y   (18)
式中:H表示隐含层输出矩阵;β表示输出权值矩阵;Y表示目标值矩阵;H-1为矩阵H的广义逆。
本发明是一种基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法,技术效果如下:
1)、本发明采用曲线拟合的方法,通过一系列数据处理的策略矫正误差和缺失数据,能够有效地减少非连续低质量的样本对预测精度的干扰。
2)、本发明运用VMD对预处理后的功率信号进行去噪,由于其非递归的模态函数求解形式,针对风电大数据样本减少了一定的计算量;而且模态函数的求解中有中心频率的参与,这能让每个模态函数的频率固定在一个频率上,规避了常规信号分解方法带来的模态混叠现象和端点效应等问题,能够有效地减少高干扰高噪声的样本对预测精度的干扰。
3)、本发明针对标准CS算法的局限性对其进行改进,在随机游走生成的步长和固定的发现概率背景下引入动态调整策略,提高模型的收敛速度和收敛精度。
4)、本发明采用ICS算法选择ELM网络的最优输入权重和偏置,避免了传统ELM参数选取问题上的随机性,减小了预测结果的波动性。
5)、本发明提出的DM-VMD-ICS-ELM混合预测模型,在超短期风电预测中效果良好。经过仿真实验与同类PSO、CS算法相比较,该方法对于风电功率非线性高不稳定性特征具有更高的预测精度,同时具有较高的稳定性。
附图说明
图1为本发明方法的流程图。
图2为高斯拟合结果图。
图3(a)为原始功率信号图;
图3(b)为功率信号经VMD分解后的趋势分量图;
图3(c)为功率信号经VMD分解后的细节分量图。
图4为ICS算法流程图。
图5为ELM网络结构图。
图6为ELM,DM-VMD-ELM,ICS-ELM,DM-VMD-ICS-ELM功率预测对比曲线图。
图7为ELM,DM-VMD-ELM,ICS-ELM,DM-VMD-ICS-ELM预测误差对比曲线图。
图8为三种混合模型功率预测对比曲线图。
图9为三种混合模型预测误差对比曲线图。
图10为三种优化算法的适应度曲线图。
具体实施方式
基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法,首先,采用DM技术描述风速和风电功率的关系,对无效、缺失的原始数据进行修正。然后,通过VMD对将风电功率分解为趋势分量和细节分量,以趋势分量作为输入量以减少噪声量,以降低高频扰动对预测结果所带来的干扰。为了改善传统神经网络在参数选取问题上的随机性,提出一种ICS算法对ELM的输入层权值矩阵和隐含层偏置矩阵进行优化;最后通过ELM网络完成风电功率预测。
基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法,包括以下步骤:
步骤1、采用DM技术,对风电功率原始数据进行修正。
步骤2、利用VMD对风电功率数据进行分解,得到若干个低频分量和高频分量,选取合适的低频分量重构形成趋势分量,以作为模型的输入。
步骤3、初始化ICS算法的参数和ELM的网络结构,确定适应度函数;
步骤4、将训练样本的修正值输入ELM并计算适应度值,根据ICS算法步骤,更新鸟巢位置,比较种群当前适应度值和全局历史最优适应度值,确定全局最优位置,即最优解;
步骤5、由得到的最优输入权重和隐含层偏置参数,建立ELM预测模型。
下面结合附图,对优选实例进行详细说明。
本发明采用DM技术对原始数据预处理的步骤为:
1.采用曲线拟合刻画风电机组P-v功率特性关系:
在理想条件下,风电机组的输出功率和其输入风速的三次方成正比例关系,具体转化关系如公式(1)所示。
Figure GDA0002241594380000071
式中:Pwt为风电机组的输出功率;ρ为空气密度;R为风机叶片半径;Cp(λ,β)是关于叶尖速比λ和浆矩角β的功率系数;vwt为风机的输入风速。
由于在实际运行过程中会受到如风速、温度等多种气象因素的影响,风机的输出功率和风速不会严格地满足标准P-v功率特性曲线关系,故采用MATLAB中的curve fitting工具包模拟风机实际的P-v功率特性关系,分别采用多项式(二次,三次)拟合,傅里叶拟合和高斯拟合的方法,选取和方差SSE和确定系数R2作为评价指标,表1展示了各个方法的拟合结果和评价指标。可知高斯拟合为此组样本的最优拟合方法,高斯拟合的结果如图2所示。
2.对异常数据的修正策略:
将风速带入得到的拟合公式求取需要修正的风电功率,具体分为以下几种情况。原始数据的异常可以分为三类:第一类是风速和风电功率出现负值,第二类是风速不为0而功率值为0;第三类是由于设备故障等导致风速和功率数据出现丢失。针对原始数据的处理策略也可分为三种:1)风速不为0而功率值为0时,风电功率由拟合函数求得;2)风速和风电功率均为负值时遗弃样本,风速在切入风速上下浮动的点所对应的功率值出现负值时取功率值为0;3)对于出现时间序列数据缺失的情况,功率缺失时同样采用拟合函数求取功率值,如果风速和功率值都缺失,则先用风速序列的前一个采样点和后一个采样点的平均值填补风速信息再求取功率值。
本发明采用VMD对风电功率进行去噪的步骤为:
1.各个功率分量模态函数和中心频率的确定:
Figure GDA0002241594380000072
Figure GDA0002241594380000073
式中:
Figure GDA0002241594380000081
为第k个模态函数的第n+1次迭代计算式;
Figure GDA0002241594380000082
为其对应的中心频率;
Figure GDA0002241594380000083
为输入信号;
Figure GDA0002241594380000084
为第i个本征模态函数;α为带宽参数;
Figure GDA0002241594380000085
为拉格朗日乘子。由此,一个风电功率非线性时间序列分解为若干个不同频带分量。
2.趋势分量的选择:
一个时间序列经VMD分解后进行筛选,如公式(4)所示:
Figure GDA0002241594380000086
其中,PTrend,i为第i个低频模态分量;PDetail,j为第j个高频模态分量。由n个低频分量构成的
Figure GDA0002241594380000087
代表信号的趋势分量,能够捕捉到原始信号的趋势;由m个高频分量构成的
Figure GDA0002241594380000088
代表信号的细节分量,其所包含的有用信息较少,一般为噪声分量。从模态分量中提取冗余信息(如高频变化),产生的滤波效果能有效地去除信号中的随机波动量,从而保留信号的真实信息。图3为经VMD处理后的趋势/细节分量与原始信号对比图。
本发明运用CS算法作为参数优化算法的步骤为:
CS算法寻优过程分为两个部分,第一个部分是通过Lévy飞行进行全局随机游走,其主要迭代过程如公式(5)所示:
Figure GDA0002241594380000089
式中:
Figure GDA00022415943800000810
表示第t代的第i个解;
Figure GDA00022415943800000811
表示点乘法;
Figure GDA00022415943800000812
表示步长控制因子,α0为常数,其值通常为0.01,xbest为当代的最优解。Levy(λ)服从Lévy概率分布,通常使用公式(6)来生成Lévy随机数:
Figure GDA00022415943800000813
式中:μ,ν服从标准正态分布;λ为幂次系数,布谷鸟的连续跳跃本质上形成随机游走过程,该过程遵循具有重尾的幂律步长分布;λ通常取1.5,φ取值如公式(7)所示:
Figure GDA00022415943800000814
式中:Γ()为标准的Gamma函数。
CS算法的第二部分会依据发现概率Pa丢弃部分解,然后通过一种交叉混合的偏好游走生成新解以取代它们,如公式(8)所示:
Figure GDA0002241594380000091
式中:r为比例因子,取值服从区间[0,1]上的均匀分布;
Figure GDA0002241594380000092
Figure GDA0002241594380000093
表示第t次迭代的两个随机解。
上述过程中新解的产生都采用贪婪算法选择,即得到新解后,比较新解和原解的适应度值以确定全局最优解。若新解优于旧解,则替换旧解;若旧解优于新解,则保留旧解。适应度函数选取为拟合的残差平方和,即公式(9)所示:
Figure GDA0002241594380000094
式中:n为训练样本数;yi为训练样本的输出值;
Figure GDA0002241594380000095
为对应的拟合值。
本发明针对标准CS的改进的实现方式为如下:
步长和发现概率是解向量微调过程中至关重要的两个量,决定了算法的全局搜索能力和收敛速度,标准CS算法中Pa为固定值,步长由随机游走策略决定而大小不定。为此,需要根据算法的运行进程,动态地对其参数进行调整。为此,根据算法的运行进程,动态地对其参数进行调整:
(1)发现概率的动态调整策略:
在CS算法中,最优解的搜索结果受发现概率Pa的影响:当Pa过大时,当前解难以收敛到最优位置;当Pa过小时,收敛速度较慢,导致迭代次数增加。在后期的进化阶段,适当增大Pa,更容易产生新的个体,同时也避免了个体早熟。因此,在CS算法中引入一个正弦递增算子来调整发现概率Pa,如公式(10)所示:
Figure GDA0002241594380000096
式中:Pa,max和Pa,min是Pa的动态控制参数;T为最大迭代次数,t为当前迭代次数。
(2)步长的动态调整策略:
CS算法的步长对全局最优解和搜索精度有显著的影响:较大的步长有利于算法跳出局部最优状态,但会降低收敛精度;相反,步长越小,越容易得到局部最优结果,同时降低运算效率。根据当前最优鸟巢的生成信息,自适应调整下一代的步长,如公式(11)所示:
Figure GDA0002241594380000101
式中:m∈(0,1)为调节因子;k∈[0,1]为极限因子;INT为0到30的整数;xbest为当代的最优解。因此公式(5)可以用公式(12)替换:
Figure GDA0002241594380000102
因此,ICS算法流程图如图4所示。
本发明采用ELM作为预测模型的实现方式如下:
ELM为一种单隐层前馈神经网络,其数学描述如公式(13)所示:
Figure GDA0002241594380000103
式中:i=1,2,3,...,N;bj是第j个隐含层节点的阈值;aj=[a1j,a2j,…,arj]T为连接第j个隐含层节点和输入层节点的权值向量;g(x)为激励函数,本发明选取的为Sigmoid函数;βj=[βj1j2,…,βjm]T(j=1,2,…,L)为连接第j个隐含层节点和输出节点的权值向量;xi为一个样本向量的第i个元素;N为样本个数;L为隐含层节点个数。
把N个样本代入到公式(13),可以得到如下矩阵形式:
Hβ=Y   (14)
Figure GDA0002241594380000104
β=[β12,…,βL]T   (16)
Y=[y1,y2,…,yN]T   (17)
式中:H表示隐含层输出矩阵;β表示输出权值矩阵;Y表示目标值矩阵;N为样本个数;L为隐含层节点个数;x1,x2,…,xN分别为第1,2,…,N个样本向量;a1,a2,…,aL分别为输入层连接到第1,2,…,L个隐含层节点的权值向量;b1,b2,…,bL分别为第1,2,…,L个隐含层节点的阈值;
Figure GDA0002241594380000105
分别为第1,2,…,N个样本到隐含层的输出向量;β12,…,βL分别为第1,2,…,L个隐含层节点连接到输出层的权值向量;y1,y2,…,yN分别为第1,2,…,N个样本对应的目标值。
由此,ELM的基本步骤如下:
(1)随机确定输入权重aj和隐含层偏置bj
(2)计算隐含层输出矩阵H;
(3)计算输出权重,即线性系统Hβ=Y最小范数的最小二乘解,计算式如公式(18)所示:
β=H-1Y   (18)
式中:H表示隐含层输出矩阵;β表示输出权值矩阵;Y表示目标值矩阵;H-1为矩阵H的广义逆。
ELM网络结构图如图5所示,本发明所提模型的仿真实验参数设置如表2所示。
图6和图7分别为控制变量条件下各个预测模型的功率预测对比图和预测误差对比图。对于本发明所提的混合模型,各个算法对预测精度的贡献是不同的。从图6和图7可以看出,ELM由于缺少DM-VMD误差校正和ICS参数选择步骤,预测结果表现最差,误差最大;相比之下,DM-VMD-ICS-ELM模型的绝对误差曲线波动幅度最小,接近于零的点最多,预测结果是有效且合理的。
图8、图9分别为三种混合预测模型的功率预测对比图和预测误差对比图。可以直观地判断出DM-VMD-PSO-ELM,DM-VMD-CS-ELM,DM-VMD-ICS-ELM这3种方法都有较好的拟合实际功率曲线的能力。
本发明所选用的误差评价指标如下:
为了避免各个模型对初始随机参数的依赖,保证实验的可靠性,每个模型重复试验20次。本发明采用控制变量的思路选取不同的方法作为参考进行对比分析。根据国家能源局和电力企业现行标准,选用平均绝对百分比误差(MeanAbsolute Percentage Error,MAPE)、均方根误差(Root Mean Square Error,RMSE)、相关性系数和预测误差方差四个衡量指标对实验误差进行具体量化评价,如公式(19-22)所示:
Figure GDA0002241594380000111
Figure GDA0002241594380000112
Figure GDA0002241594380000121
Figure GDA0002241594380000122
式中:yi为功率实际值;
Figure GDA0002241594380000123
为功率预测值;
Figure GDA0002241594380000124
为功率实际值的平均值;
Figure GDA0002241594380000125
为功率预测值的平均值;N为预测样本数;eMAPE,i表示第i次实验的MAPE;
Figure GDA0002241594380000126
表示P次实验的平均MAPE。
图10反映了PSO算法,CS算法和ICS算法3种不同优化算法的适应度值随迭代次数的增加而减少最终趋于稳定的过程,CS算法和PSO算法收敛精度相差不大但前者收敛较快,而ICS算法无论在收敛精度还是收敛速度上都有更好的表现,进一步地提高了预测模型的寻优能力。
表3展示了本发明所提混合模型与其它各个模型的预测结果误差对比。由于原始样本的误差和参数选取的随机性,ELM的eMAPE和eRMSE最大分别为26.793%和171.794kW,r最小为0.958,表明其预测值和实际值的拟合效果最差,预测精度最低;Var(eMAPE)最大为5.234×10-3,即重复实验结果的波动也最大。DM-VMD-PSO-ELM的Var(eMAPE)值最小为3.537×10-7,波动性最小。但本发明所提方法的eMAPE和eRMSE分别为2.609%和17.769kW,相比DM-VMD-PSO-ELM和DM-VMD-CS-ELM为最低值,r为0.995也最接近于1,可见该方法有最好的预测精度,同时具备较好的稳定性,能更好地满足工程实际需求。
表1P-v拟合结果和评价指标
Figure GDA0002241594380000127
表2仿真实验参数设置
Figure GDA0002241594380000128
Figure GDA0002241594380000131
表3各个预测方法的误差评价指标
Figure GDA0002241594380000132

Claims (3)

1.基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法,其特征在于包括以下步骤:
步骤1、采用DM技术,对风电功率原始数据进行修正;
步骤2、利用VMD对风电功率数据进行分解,得到若干个低频分量和高频分量,选取合适的低频分量重构形成趋势分量,以作为模型的输入;
步骤3、初始化ICS算法的参数和ELM的网络结构,确定适应度函数;
步骤4、将训练样本的修正值输入ELM并计算适应度值,根据ICS算法步骤,更新鸟巢位置,比较种群当前适应度值和全局历史最优适应度值,确定全局最优位置,即最优解;
步骤5、由得到的最优输入权重和隐含层偏置参数,建立ELM预测模型;
所述步骤1中,所述DM技术采用MATLAB中的curve fitting工具包,分别采用多项式拟合,傅里叶拟合和高斯拟合的方法,选取和方差SSE和确定系数R2为评价指标,找到最优的拟合方法,然后对其进行筛选、补充和矫正;
所述步骤1中,异常的风速、风电功率原始数据分为三类:第一类是风速和风电功率出现负值;第二类是风速不为0而功率值为0;第三类是由于设备故障导致风速和功率数据出现丢失;
针对原始数据的修正处理分为三种:1)风速不为0而功率值为0时,风电功率由拟合函数求得;2)风速出现负值时遗弃样本,风速在切入风速上下浮动的点所对应的功率值出现负值时,取功率值为0;3)、对于出现时间序列数据缺失的情况,功率缺失时同样采用拟合函数求取功率值,如果风速和功率值都缺失,则分别用前一个采样点和后一个采样点的平均值填补;
所述步骤2中,所述VMD是能将一组非线性信号按不同频带分解为若干个低频分量和高频分量的信号处理方法,实质上是变分问题的求解,一个时间序列经VMD分解后进行筛选,如公式(4)所示:
Figure FDA0004054011840000011
其中,PTrend,i为第i个低频模态分量;PDetail,j为第j个高频模态分量;由n个低频分量构成的
Figure FDA0004054011840000012
代表信号的趋势分量,能够捕捉到原始信号的趋势;由m个高频分量构成的
Figure FDA0004054011840000021
代表信号的细节分量,其所包含的有用信息较少,为噪声分量;
所述步骤3中,所述适应度函数选取为拟合的残差平方和,即公式(9)所示:
Figure FDA0004054011840000022
式中:n为训练样本数;yi为训练样本的输出值;
Figure FDA0004054011840000023
为对应的拟合值;
所述步骤4中,所述ICS算法是针对标准CS的改进,CS算法寻优过程分为两个部分,第一个部分是通过Lévy飞行进行全局随机游走,其主要迭代过程如公式(5)所示:
Figure FDA0004054011840000024
式中:
Figure FDA0004054011840000025
表示第t代的第i个解;
Figure FDA0004054011840000026
表示点乘法;α表示步长控制因子;Levy(λ)服从Lévy概率分布,使用公式(6)来生成Lévy随机数:
Figure FDA0004054011840000027
式中:μ,ν服从标准正态分布;λ为幂次系数,布谷鸟的连续跳跃本质上形成随机游走过程,该过程遵循具有重尾的幂律步长分布,φ取值如公式(7)所示:
Figure FDA0004054011840000028
式中:Γ()为标准的Gamma函数;
CS算法的第二部分会依据发现概率Pa丢弃部分解,然后通过偏好游走生成新解以取代它们,如公式(8)所示:
Figure FDA0004054011840000029
式中:r为比例因子,取值服从区间[0,1]上的均匀分布;
Figure FDA00040540118400000210
Figure FDA00040540118400000211
表示第t次迭代的两个随机解;
步骤4中,所述ICS算法是针对标准CS的改进,标准CS算法中Pa为固定值,步长由随机游走策略决定而大小不定;为此,根据算法的运行进程,动态地对其参数进行调整:
(1)、发现概率的动态调整策略:
在CS算法中引入一个正弦递增算子来调整发现概率Pa,如公式(10)所示:
Figure FDA0004054011840000031
式中:Pa,max和Pa,min是Pa的动态控制参数;T为最大迭代次数,t为当前迭代次数;
(2)、步长的动态调整策略:
根据当前最优鸟巢的生成信息,自适应调整下一代的步长,如公式(11)所示:
Figure FDA0004054011840000032
式中:m∈(0,1)为调节因子;k∈[0,1]为极限因子;INT为0到30的整数;xbest为当代的最优解;Smin为步长的最小值;exp()为以自然常数e为底的指数函数。
2.根据权利要求1所述基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法,其特征在于:步骤5中,所述ELM为一种单隐层前馈神经网络,其数学描述如公式(13)所示:
Figure FDA0004054011840000033
式中:i=1,2,3,...,N;bj是第j个隐含层节点的阈值;aj=[a1j,a2j,…,arj]T为连接第j个隐含层节点和输入层节点的权值向量;g(x)为激励函数,选取的为Sigmoid函数;βj=[βj1j2,…,βjm]T(j=1,2,…,L)为连接第j个隐含层节点和输出节点的权值向量;xi为一个样本向量的第i个元素;N为样本个数;L为隐含层节点个数;
把N个样本代入到公式(13),可以得到如下矩阵形式:
Hβ=Y (14)
Figure FDA0004054011840000034
β=[β12,…,βL]T (16)
Y=[y1,y2,…,yN]T (17)
式中:H表示隐含层输出矩阵;β表示输出权值矩阵;Y表示目标值矩阵;N为样本个数;L为隐含层节点个数;x1,x2,…,xN分别为第1,2,…,N个样本向量;a1,a2,…,aL分别为输入层连接到第1,2,…,L个隐含层节点的权值向量;b1,b2,…,bL分别为第1,2,…,L个隐含层节点的阈值;
Figure FDA0004054011840000041
分别为第1,2,…,N个样本到隐含层的输出向量;β12,…,βL分别为第1,2,…,L个隐含层节点连接到输出层的权值向量;y1,y2,…,yN分别为第1,2,…,N个样本对应的目标值。
3.根据权利要求1所述基于数据挖掘原始误差校正的ICS-ELM超短期风电功率预测方法,其特征在于:步骤5中,ELM算法步骤如下:
(1)随机确定输入权重aj和隐含层偏置bj
(2)计算隐含层输出矩阵H;
(3)计算输出权重,即线性系统Hβ=Y最小范数的最小二乘解,计算式如公式(18)所示:
β=H-1Y (18)
式中:H表示隐含层输出矩阵;β表示输出权值矩阵;Y表示目标值矩阵;H-1为矩阵H的广义逆。
CN201910716142.0A 2019-08-05 2019-08-05 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法 Active CN110555548B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910716142.0A CN110555548B (zh) 2019-08-05 2019-08-05 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910716142.0A CN110555548B (zh) 2019-08-05 2019-08-05 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法

Publications (2)

Publication Number Publication Date
CN110555548A CN110555548A (zh) 2019-12-10
CN110555548B true CN110555548B (zh) 2023-04-07

Family

ID=68737043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910716142.0A Active CN110555548B (zh) 2019-08-05 2019-08-05 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法

Country Status (1)

Country Link
CN (1) CN110555548B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101669B (zh) * 2020-09-21 2022-09-06 国网福建省电力有限公司泉州供电公司 一种基于改进极限学习机与分位数回归的光伏功率区间预测方法
CN112132347A (zh) * 2020-09-24 2020-12-25 华北电力大学 一种基于数据挖掘的短期电力负荷预测方法
CN112308169B (zh) * 2020-11-10 2022-05-03 浙江大学 一种基于改进在线序列极限学习机的出水水质预测方法
CN112613650B (zh) * 2020-12-14 2022-06-28 燕山大学 一种新型三阶段短期电力负荷预测方法
CN113468817B (zh) * 2021-07-13 2023-08-22 淮阴工学院 一种基于igoa优化elm的超短期风电功率预测方法
CN114595886A (zh) * 2022-03-09 2022-06-07 华电河南新能源发电有限公司 一种计及多源风速信息的风电功率超短期预测方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514353A (zh) * 2012-06-29 2014-01-15 国际商业机器公司 新增风机的功率预测方法和系统
CN102914969B (zh) * 2012-09-28 2014-12-10 南方电网科学研究院有限责任公司 一种短期风电功率预测系统的综合误差修正方法
US9438041B2 (en) * 2012-12-19 2016-09-06 Bosch Energy Storage Solutions Llc System and method for energy distribution
JP6400467B2 (ja) * 2014-12-26 2018-10-03 株式会社日立パワーソリューションズ 風力発電量の予測方法
CN106127295A (zh) * 2016-06-21 2016-11-16 湘潭大学 一种基于自适应布谷鸟与烟花混合算法的压力容器优化设计方法
CN106295798A (zh) * 2016-08-29 2017-01-04 江苏省电力试验研究院有限公司 经验模式分解与Elman神经网络组合风电预测方法
CN107169557A (zh) * 2017-05-12 2017-09-15 淮阴师范学院 一种对布谷鸟优化算法进行改进的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李燕青等.基于AMD-ICSA-SVM 的超短期风电功率组合预测.《电力系统保护与控制》.2017,第45卷(第45期),全文. *
赵坤等.采用改进的布谷鸟算法优化极限学习机.《计算机仿真》.2018,第35卷(第35期),全文. *

Also Published As

Publication number Publication date
CN110555548A (zh) 2019-12-10

Similar Documents

Publication Publication Date Title
CN110555548B (zh) 基于数据挖掘原始误差校正的ics-elm超短期风电功率预测方法
CN111783953B (zh) 一种基于优化lstm网络的24点电力负荷值7日预测方法
CN110826791A (zh) 一种基于长短时记忆神经网络的混合风功率预测方法
CN109886464B (zh) 基于优化奇异值分解生成特征集的低信息损失短期风速预测方法
CN111898828A (zh) 一种基于极限学习机的水力发电预测方法
CN110766200A (zh) 一种基于K-means均值聚类的风电机组发电功率预测方法
CN103023065A (zh) 一种基于相对误差熵值法的风电短期功率预测方法
CN114970952B (zh) 一种考虑环境因素的光伏出力短期预测方法及系统
CN113988481B (zh) 一种基于动态矩阵预测控制的风功率预测方法
CN111242353A (zh) 风电功率组合预测建模和预测方法
CN112949895A (zh) 一种基于动态可扩展神经网络模型的风速预测方法
CN112819238A (zh) 基于混沌鸡群优化算法的短期风电功率预测方法
CN115511657A (zh) 一种基于组合预测模型的风电出力与光伏出力评估的方法
CN112947672A (zh) 一种光伏电池最大功率点跟踪方法及装置
CN113205228B (zh) 一种短期风力发电输出功率的预测方法
CN112507613B (zh) 一种秒级超短期光伏功率预测方法
Sun et al. Short-term power load prediction based on VMD-SG-LSTM
CN113627674A (zh) 一种分布式光伏电站出力预测方法、装置及存储介质
CN112669168A (zh) 一种风电功率短期预测方法
CN117132132A (zh) 基于气象数据的光伏发电功率预测方法
CN113705885B (zh) 一种融合VMD、XGBoost及TCN的配电网电压预测方法及系统
CN115796327A (zh) 一种基于vmd和iwoa-f-gru模型的风电功率区间预测方法
CN116014724A (zh) 一种有源配电网网格化负荷预测方法
CN113779861B (zh) 光伏功率的预测方法及终端设备
CN116128211A (zh) 基于风光不确定性预报场景的风光水联合短期优化调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant