CN114611808A - 一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法 - Google Patents
一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法 Download PDFInfo
- Publication number
- CN114611808A CN114611808A CN202210267424.9A CN202210267424A CN114611808A CN 114611808 A CN114611808 A CN 114611808A CN 202210267424 A CN202210267424 A CN 202210267424A CN 114611808 A CN114611808 A CN 114611808A
- Authority
- CN
- China
- Prior art keywords
- wind power
- bilstm
- offshore wind
- ceemdan
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 241000287127 Passeridae Species 0.000 claims abstract description 54
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 52
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 30
- 238000005457 optimization Methods 0.000 claims abstract description 26
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 11
- 230000002431 foraging effect Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 10
- 230000015654 memory Effects 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 244000062645 predators Species 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000002789 length control Methods 0.000 claims description 3
- 230000014759 maintenance of location Effects 0.000 claims description 3
- 238000007792 addition Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于CEEMDAN‑SSA‑BiLSTM的短期海上风电功率预测方法,包括:利用CEEMDAN算法对历史海上风电功率序列进行分解,得到不同的子序列;针对各个子序列构建BiLSTM预测模型,并利用麻雀优化算法对BiLSTM模型的隐含层单元数、学习率、迭代次数等超参数进行优化,利用优化后的超参数对不同子序列进行预测,最后叠加不同子序列的预测结果,得到海上风电预测功率。本发明仅依靠海上风电历史功率序列进行预测,减少了海上风电天气预测数据的多变性对风电功率预测的影响,通过自适应噪声完备集合经验模态分解算法减少了风电功率波动性与随机性对预测结果的影响,同时利用麻雀优化算法优化后的超参数进行预测,在一定程度上提高了短期海上风电功率预测的精度。
Description
技术领域
本发明属于海上风电预测领域,涉及海上风电功率预测方法,具体涉及一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法。
背景技术
截至2021年底,中国风电装机容量累计达到3.28亿千瓦,占全部装机容量的13.8%,其中陆上风电累计装机3.02亿千瓦、海上风电累计装机约2639万千瓦。2021年中国海上风电新增装机容量占全球新增装机容量的四分之三,中国已经成为全球最大的海上风电市场,并且在未来将保持高速增长的态势。随着海上风电规模化发展,对海上风电功率准确预测尤为迫切。此外,提升海上风电功率预测技术的准确性可提升功率可信度,减少系统备用容量,降低系统调峰压力,实现海上风电的经济调度保障系统安全稳定运行。
借鉴陆上风电预测方法,研究人员利用海上风电场的气象数据对风电功率进行预测。但这些气象数据需要大量的专业仪器进行测量,即使获得相关数据,海上天气预报结果和实际环境之间的差异仍然会对预测结果造成很大干扰。在海上风电功率预测方面,难以依靠海上多变的气象数据对海上风电功率进行预测,预测精度有待进一步提高;而目前涉及仅依靠历史功率序列的海上风电功率预测的研究较少,急需一个有效的技术方案来解决现存的技术问题。
发明内容
发明目的:针对海上风电天气预测数据的多变性影响风电功率预测精度的问题,提供一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,能够有效提升海上风电功率预测精度,并且能提升功率可信度,减少系统备用容量,降低系统调峰压力,保障系统安全稳定运行。
技术方案:为实现上述目的,本发明提供一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,包括如下步骤:
S1:获得海上风电历史功率序列,明确CEEMDAN分解重构算法的定义,利用CEEMDAN方法对功率序列进行分解,得到不同的子序列;
S2:数据预处理,明确海上风电功率预测结果的评价指标;
S3:明确BiLSTM网络含义,对CEEMDAN分解得到的模态分量和剩余分量构建预测模型;
S4:明确麻雀优化算法含义,使用麻雀优化算法对BiLSTM模型的隐含层单元数、学习率和迭代次数等超参数进行优化;
S5:利用超参数优化后的BiLSTM预测模型对不同子序列进行预测,将各预测分量叠加,得到最后的预测结果。
进一步地,所述步骤S1中的CEEMDAN分解海上风电功率序列具体为:
A1:在原始海上风电功率序列中添加T次均值为0的高斯白噪声,得到预处理序列yi(t)。
yi(t)=y(t)+εni(t),i=1,2,…,T (1)
式中,y(t)为原始海上风电功率序列,yi(t)为第i次添加白噪声后的序列,ε为噪声标准差,ni(t)是满足N(0,1)分布的高斯白噪声,T为噪声添加的次数。
A2:使用EMD分解预处理序列T次,并对T个模态分量求均值,得到第一个子序列I1(t)。
r1(t)=y(t)-I1(t) (3)
式中,I1(t)为CEEMDAN分解得到的第1个模态分量,I1(i)为yi(t)经过EMD分解得到的模态分量,r1(t)为CEEMDAN分解一次后的剩余分量。
A3:重复以上步骤,将CEEMDAN分解k次后的剩余分量继续添加噪声并进行EMD分解,然后判断剩余信号序列是否满足收敛条件。
rk(t)=rk-1(t)-Ik(t) (5)
式中,Ik(t)为CEEMDAN分解得到的第k个模态分量,Ek-1(·)为yi(t)经过EMD分解得到的第k-1个模态分量,εk-1为对CEEMDAN分解k-1次后的剩余分量加入噪声的权值系数,rk(t)为CEEMDAN分解k次后的剩余分量。
进一步地,所述步骤S1中CEEMDAN分解中的EMD分解方法具体为:
给定一个原始序列信号y(t),应用EMD分解方法对信号进行分解的步骤如下:
B1:对于原始序列信号y(t),首先找到其所有局部极值点,然后利用插值法连接所有极大值和极小值,分别得到上包络线、下包络线;
B2:令上包络线为eu(t)、下包络线为ev(t),平均值e(t)如下:
从原始信号y(t)中减去平均值e(t)得到子序列h(t),即
h(t)=y(t)-e(t) (7)
根据h(t)的极值点和零点数量相等或相差一个来判别其是否为本征模态分量,若不满足条件,则重复上述步骤来得到第一个模态分量IMF1(t)。
B3:得到IMF1(t)后,用原始信号y(t)减去IMF1(t)得到剩余序列r1(t),即
r1(t)=y(t)-IMF1(t) (8)
然后将r1(t)作为新的初始信号序列,重复步骤B1、B2、B3,直至残余分量rn(t)为只有一个极值点或者一个单调的序列,则达到收敛条件,分解结束。
进一步的,所述步骤S2中数据预处理中功率序列的归一化和反归一化表达式如下:
进一步的,所述步骤S2中预测结果的评价指标表达式如下:
均方根误差(RMSE):
平均绝对百分比误差(MAPE):
确定系数(R2):
进一步的,所述步骤S3中BiLSTM预测模型由输入层、前向LSTM层、反向LSTM层、输出层构成。其中,LSTM包括遗忘门、记忆门、输出门,其提取数据特征过程的具体方法如下:
C1:信息选择遗忘阶段
ft=σ(Wf·[ht-1,xt]+bf) (14)
C2:信息选择记忆阶段
it=σ(Wi·[ht-1,xt]+bi) (15)
gt=tanh(Wg·[ht-1,xt]+bg) (16)
C3:当前细胞状态更新阶段
C4:信息输出阶段
ot=σ(Wo·[ht-1,xt]+bo) (18)
式中,xt为当前时刻的输入数据,ht-1为前一时刻的隐含层输出,ct为当前时刻细胞状态值,gt为记忆层输出,it为gt中信息的保留程度,W为不同层计算所需的权重值,b为不同层计算所需的偏置值,σ和tanh分别代表sigmoid和tanh激活函数,ot为当前时刻的输出值。
BiLSTM属于双向时序的特征学习,由前向LSTM与后向LSTM组合而成;然后将两个网络的隐含层连在一起,共同接入到输出层进行预测。
BiLSTM通过8个全局共享权重值来计算t时刻前向隐含层状态值和输出层状态值,主要包括输入层到前向、反向隐含层的权重值(w1,w2),前向隐含层内权重值(w3,w4),反向隐含层内权重值(w7,w8),前向、反向隐含层到输出层权重值(w5,w6)。首先在前向层从初始时刻到t时刻正向计算,获得每个时刻隐含层的输出;然后在反向层从时刻t到初始时刻进行反向计算,获得每个时刻向后隐含层的输出,最后根据权重w5、w6和前向隐含层和后向隐含层的输出值,计算得到对应时刻输出结果,具体计算公式如下:
ht=f(w1·xt+w3·ht-1+w4·ct-1) (20)
ht'=f(w2·xt+w7·ht'+1+w8·ct'+1) (21)
ot=w5ht+w6ht' (22)
进一步的,所述步骤S4中麻雀优化算法具体含义如下:
首先建立麻雀种群,由n只麻雀组成的种群表示为:
式中,d为待优化问题变量的维数,n表示麻雀个体的数量。
不同麻雀个体的适应度值表示为:
在SSA算法中,具有较好适应度值的发现者在搜索过程中会优先获取食物。此外,因为发现者负责为整个麻雀种群寻找食物并引导整个种群的移动。因此,发现者可以获得比加入者更大的觅食搜索范围。在每次迭代过程中,发现者的位置更新方式如下:
式中,t表示当前迭代次数;Xi,j代表第i个麻雀在第j维迭代次数为t时的位置信息;Nmax为最大迭代次数,α是一个随机数,α∈(0,1];λ是服从正态分布的随机数;R表示预警值,R∈[0,1];ST表示安全值,ST∈[0.5,1],L为1×d的矩阵,矩阵元素全为1;R<ST时周围环境无捕食者,种群处于安全状态,发现者可进行大规模搜索,R≥ST表示周围出现捕食者,发出信号,种群需要转移到其他安全区域内觅食。
觅食过程中,一些加入者会监视发现者,如果发现者找到更好的食物,它们会立刻离开当前位置去争夺食物。如果加入者争夺成功,它们就可以获得发现者的食物,否则会移动或继续监视发现者。加入者的位置更新方式如下:
式中,XP为目前发现者占据的最佳位置;Xworst为目前全局最差的位置;A为一个1×d的矩阵,矩阵内元素随机赋值1或-1,且A+=AT(AAT)-1;i>n/2表示第i个加入者适应度值较低,未获得食物则需要前往其他地方觅食。
另外,一般假设整个种群中能够发现捕食者的麻雀数量占比为10%~20%,这些警戒者的初始位置是随机生成的,表达形式如下:
式中,β为步长控制参数,是服从N(0,1)分布的随机数;Xbest表示当前全局最优的位置;fi表示当前个体适应度值,fg、fw表示当前全局最佳和最差的适应度值,fi>fg表示麻雀处于边缘,受威胁最大;fi=fg表示个体意识到危险,靠近其他麻雀来降低它们被捕食的风险;γ为最小常数,避免零点误差;K为麻雀移动方向。
应用麻雀优化算法优化BiLSTM模型的隐含层单元数、学习率和迭代次数等超参数的具体步骤为:
D1:初始化。针对本实施例预测模型优化的超参数,设定种群规模,目标函数的维数,种群中发现者和警戒者的数量,初始超参数的上下界,最大迭代次数。
D2:计算种群中不同麻雀个体的MSE值并排序,选取当前种群中MSE最大值和最小值以及其分别对应的位置,然后在种群中随机选取个体作为加入者;
D3:第一次迭代后,再次计算不同麻雀个体的MSE值,并更新发现者、加入者以及警戒者的位置信息;
D4:根据种群当前状态,更新整个种群的最优、最差位置以及相应的个体MSE值,判断是否达到最大迭代次数或者收敛条件,若是,则输出最优超参数的值,若不是则返回步骤2);
D5:将优化得到的超参数输入到BiLSTM预测模型。
进一步的,所述步骤S5中得到最终预测功率方法为:将步骤S1~S4所得数据依次送入BiLSTM模型进行预测,将每个子序列的预测结果反归一化并进行叠加,得到最终的海上风电功率预测值。
本发明提出一种仅依靠历史海上风电功率序列的组合预测方法。通过信号分解重构算法、BiLSTM网络和麻雀优化算法的组合,提高了海上风电功率预测的准确性。目前沿海地区大量跨区输电通道受入,外来电比例日益提升,在经济结构调整的影响下,地区负荷峰谷差进一步加大。随着海上风电规模化发展,沿海地区电网调度压力和风电消纳问题也日益严峻。对风电功率进行精准预测并将其纳入调度计划是提高受端电网的风电接纳能力,改善地区电力系统运行安全性和经济性的前提。在此基础上,提升风功率预测技术的准确性可提升功率可信度,减少系统备用容量,降低系统调峰压力,保障系统安全稳定运行。因此给出一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法具有十分重要的现实意义。
本发明首先利用CEEMDAN算法对历史海上风电功率序列进行分解,得到不同的子序列。然后针对各个子序列构建双向长短期记忆网络(BiLSTM)预测模型,并利用麻雀优化算法对BiLSTM模型的隐含层单元数、学习率、迭代次数等超参数进行优化,利用优化后的超参数对不同子序列进行预测,最后叠加不同子序列的预测值,得到海上风电功率预测结果。
有益效果:本发明与现有技术相比,仅依靠海上风电历史功率数据进行预测,减少了海上气象数据的多变性对风电功率预测的影响。利用CEEMDAN分解重构算法降低了功率的波动性,同时通过BiLSTM预测模型使得过去和未来的隐含层的状态都可以进行递归反馈,能够进一步挖掘当前海上风电功率数据与过去及未来时刻功率数据的内在联系,进一步提升特征数据利用率和模型预测精度。结合麻雀优化算法优化后的超参数,达到较为精确的功率预测效果。
附图说明
图1为本发明的基于CEEMDAN-SSA-BiLSTM方法的预测流程框图;
图2为本实施例的原始海上风电功率序列图;
图3为本实施例的CEEMDAN分解原始海上风电功率序列的流程图;
图4为本实施例的CEEMDAN分解结果图;
图5为本实施例的LSTM单元结构图;
图6为本实施例的BiLSTM单元结构图;
图7为本实施例的SSA优化BiLSTM超参数的流程框图;
图8为本实施例的SSA优化结果图;
图9为本实施例的CEEMDAN-SSA-BiLSTM预测结果图;
图10为本实施例的不同预测方法的预测结果对比图;
图11为本实施例的不同预测方法的预测误差对比图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明提供一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,以下分别对该方案的整体设计原理、方法流程以及仿真分析进行说明。
1、方法流程
如图1所示,本发明提供了一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法。
参照图1,具体步骤如下:
S1:获得海上风电历史功率序列,利用CEEMDAN方法对功率序列进行分解,得到不同的子序列;
S2:对CEEMDAN分解得到的子序列进行归一化处理,增强功率数据在最大值和最小值之间的可比性;
S3:利用BiLSTM网络对CEEMDAN分解得到的模态分量和剩余分量构建预测模型;
S4:使用麻雀优化算法对BiLSTM模型的隐含层单元数、学习率和迭代次数等超参数进行优化;
S5:根据超参数优化后的BiLSTM预测模型对不同子序列进行预测,将各预测分量反归一化处理并进行叠加,得到最后的预测结果。
步骤S1中的CEEMDAN分解海上风电功率序列具体为:
A1:在原始海上风电功率序列中添加T次均值为0的高斯白噪声,得到预处理序列yi(t)。
yi(t)=y(t)+εni(t),i=1,2,…,T (1)
式中,y(t)为原始海上风电功率序列,yi(t)为第i次添加白噪声后的序列,ε为噪声标准差,ni(t)是满足N(0,1)分布的高斯白噪声,T为噪声添加的次数。
A2:使用EMD分解预处理序列T次,并对T个模态分量求均值,得到第一个子序列I1(t)。
r1(t)=y(t)-I1(t) (3)
式中,I1(t)为CEEMDAN分解得到的第1个模态分量,I1(i)为yi(t)经过EMD分解得到的模态分量,r1(t)为CEEMDAN分解一次后的剩余分量。
A3:重复以上步骤,将CEEMDAN分解k次后的剩余分量继续添加噪声并进行EMD分解,然后判断剩余信号序列是否满足收敛条件。
rk(t)=rk-1(t)-Ik(t) (5)
式中,Ik(t)为CEEMDAN分解得到的第k个模态分量,Ek-1(·)为yi(t)经过EMD分解得到的第k-1个模态分量,εk-1为对CEEMDAN分解k-1次后的剩余分量加入噪声的权值系数,rk(t)为CEEMDAN分解k次后的剩余分量。
步骤S1中CEEMDAN分解中的EMD分解方法具体为:
给定一个原始序列信号y(t),应用EMD分解方法对信号进行分解的步骤如下:
B1:对于原始序列信号y(t),首先找到其所有局部极值点,然后利用插值法连接所有极大值和极小值,分别得到上包络线、下包络线;
B2:令上包络线为eu(t)、下包络线为ev(t),平均值e(t)如下:
从原始信号y(t)中减去平均值e(t)得到子序列h(t),即
h(t)=y(t)-e(t) (7)
根据h(t)的极值点和零点数量相等或相差一个来判别其是否为本征模态分量,若不满足条件,则重复上述步骤来得到第一个模态分量IMF1(t)。
B3:得到IMF1(t)后,用原始信号y(t)减去IMF1(t)得到剩余序列r1(t),即
r1(t)=y(t)-IMF1(t) (8)
然后将r1(t)作为新的初始信号序列,重复步骤B1、B2、B3,直至残余分量rn(t)为只有一个极值点或者一个单调的序列,则达到收敛条件,分解结束。
步骤S2中数据预处理中功率序列的归一化和反归一化表达式如下:
步骤S2中预测结果的评价指标表达式如下:
均方根误差(RMSE):
平均绝对百分比误差(MAPE):
确定系数(R2):
步骤S3中BiLSTM预测模型由输入层、前向LSTM层、反向LSTM层、输出层构成。其中,LSTM包括遗忘门、记忆门、输出门,其提取数据特征过程的具体方法如下:
C1:信息选择遗忘阶段
ft=σ(Wf·[ht-1,xt]+bf) (14)
C2:信息选择记忆阶段
it=σ(Wi·[ht-1,xt]+bi) (15)
gt=tanh(Wg·[ht-1,xt]+bg) (16)
C3:当前细胞状态更新阶段
C4:信息输出阶段
ot=σ(Wo·[ht-1,xt]+bo) (18)
式中,xt为当前时刻的输入数据,ht-1为前一时刻的隐含层输出,ct为当前时刻细胞状态值,gt为记忆层输出,it为gt中信息的保留程度,W为不同层计算所需的权重值,b为不同层计算所需的偏置值,σ和tanh分别代表sigmoid和tanh激活函数,ot为当前时刻的输出值。
BiLSTM属于双向时序的特征学习,由前向LSTM与后向LSTM组合而成;然后将两个网络的隐含层连在一起,共同接入到输出层进行预测。
BiLSTM通过8个全局共享权重值来计算t时刻前向隐含层状态值和输出层状态值,主要包括输入层到前向、反向隐含层的权重值(w1,w2),前向隐含层内权重值(w3,w4),反向隐含层内权重值(w7,w8),前向、反向隐含层到输出层权重值(w5,w6)。首先在前向层从初始时刻到t时刻正向计算,获得每个时刻隐含层的输出;然后在反向层从时刻t到初始时刻进行反向计算,获得每个时刻向后隐含层的输出,最后根据权重w5、w6和前向隐含层和后向隐含层的输出值,计算得到对应时刻输出结果,具体计算公式如下:
ht=f(w1·xt+w3·ht-1+w4·ct-1) (20)
h′t=f(w2·xt+w7·h′t+1+w8·c′t+1) (21)
ot=w5ht+w6h′t (22)
步骤S4中麻雀优化算法具体含义如下:
首先建立麻雀种群,由n只麻雀组成的种群表示为:
式中,d为待优化问题变量的维数,n表示麻雀个体的数量。
不同麻雀个体的适应度值表示为:
在SSA算法中,具有较好适应度值的发现者在搜索过程中会优先获取食物。此外,因为发现者负责为整个麻雀种群寻找食物并引导整个种群的移动。因此,发现者可以获得比加入者更大的觅食搜索范围。在每次迭代过程中,发现者的位置更新方式如下:
式中,t表示当前迭代次数;Xi,j代表第i个麻雀在第j维迭代次数为t时的位置信息;Nmax为最大迭代次数,α是一个随机数,α∈(0,1];λ是服从正态分布的随机数;R表示预警值,R∈[0,1];ST表示安全值,ST∈[0.5,1],L为1×d的矩阵,矩阵元素全为1;R<ST时周围环境无捕食者,种群处于安全状态,发现者可进行大规模搜索,R≥ST表示周围出现捕食者,发出信号,种群需要转移到其他安全区域内觅食。
觅食过程中,一些加入者会监视发现者,如果发现者找到更好的食物,它们会立刻离开当前位置去争夺食物。如果加入者争夺成功,它们就可以获得发现者的食物,否则会移动或继续监视发现者。加入者的位置更新方式如下:
式中,XP为目前发现者占据的最佳位置;Xworst为目前全局最差的位置;A为一个1×d的矩阵,矩阵内元素随机赋值1或-1,且A+=AT(AAT)-1;i>n/2表示第i个加入者适应度值较低,未获得食物则需要前往其他地方觅食。
另外,一般假设整个种群中能够发现捕食者的麻雀数量占比为10%~20%,这些警戒者的初始位置是随机生成的,表达形式如下:
式中,β为步长控制参数,是服从N(0,1)分布的随机数;Xbest表示当前全局最优的位置;fi表示当前个体适应度值,fg、fw表示当前全局最佳和最差的适应度值,fi>fg表示麻雀处于边缘,受威胁最大;fi=fg表示个体意识到危险,靠近其他麻雀来降低它们被捕食的风险;γ为最小常数,避免零点误差;K为麻雀移动方向。
应用麻雀优化算法优化BiLSTM模型的隐含层单元数、学习率和迭代次数等超参数的具体步骤为:
D1:初始化。针对本实施例预测模型优化的超参数,设定种群规模,目标函数的维数,种群中发现者和警戒者的数量,初始超参数的上下界,最大迭代次数。
D2:计算种群中不同麻雀个体的MSE值并排序,选取当前种群中MSE最大值和最小值以及其分别对应的位置,然后在种群中随机选取个体作为加入者;
D3:第一次迭代后,再次计算不同麻雀个体的MSE值,并更新发现者、加入者以及警戒者的位置信息;
D4:根据种群当前状态,更新整个种群的最优、最差位置以及相应的个体MSE值,判断是否达到最大迭代次数或者收敛条件,若是,则输出最优超参数的值,若不是则返回步骤2);
D5:将优化得到的超参数输入到BiLSTM预测模型。
2、仿真分析
基于上述方案,本实施例在MATLAB平台上进行仿真验证。本实例中使用江苏盐城某海上风电场实际功率数据进行实验分析,此数据集记录该海上风电场2020年9月10日-2020年12月10日的功率数据。原数据集的记录间隔为10分钟记录一次,对原始数据进行采样,每隔一小时采样一次,选取1500个样本点作为原始风功率序列,如图2所示。仿真测试软件平台使用MATLABR2020b,硬件平台使用AMDR7-4800H2.9GHz,16GBRAM电脑。
1)图3为CEEMDAN分解原始海上风电功率序列的流程。为抑制模态混叠效应,CEEMDAN分解模型的信噪比一般设置为0~1。针对本实施例数据,CEEMDAN分解模型信噪比设置为0.1,并进行50次的噪声添加,最大包络次数设定为5000。图4为CEEMDAN分解结果。CEEMDAN分解产生为9个不同的IMF分量和1个剩余分量,IMF1~IMF9分量从高频到低频依次显示。最开始被筛选出的IMF分量表示风功率序列样本中的高频分量或噪声分量,后筛选出的IMF分量则表示风功率序列样本的长期变化特征。CEEMDAN分解产生的IMF分量所含的瞬时频率较低,能更有效地削弱不同子序列间的相互影响,较好地表征原始风电功率序列的整体趋势,有利于进一步挖掘序列特性,提升预测性能。
2)图5和图6分别为LSTM和BiLSTM网络的单元结构。输入层时间步数等于用来进行风电功率预测的变量时间序列的长度。该参数的确定既要考虑预测知识的完备性,又要考虑模型训练的有效性。一方面,过短的历史序列长度将带来预测知识的缺失,从而限制预测精度的提高;另一方面,历史序列长度过长将增加模型训练难度,降低模型预测性能。本实施例通过试探法将该参数设置为12,即输入前12个时刻的历史数据用于预测;本实施例风电预测过程只考虑风电功率本身,所以设置输入层维数为1;隐含层数目即LSTM层的个数,随着隐含层数量的增多,在训练样本充足的情况下,模型的非线性拟合能力随之上升,但其模型的复杂程度及训练时间成本也将增加。设定隐含层神经元个数为100,输出步长为1,即输出层神经元个数为1,同时隐含层激活函数为tanh,优化器选用adam。在设置学习率时,考虑到过高的学习率会导致不收敛,而过低的学习率则导致学习速度慢。本实施例学习率设定为0.005,设置训练次数为150次,这样既保证了学习效果也保证了学习速度。每次投入的样本数batch_size设置过大会影响收敛速度和精度,而过小会增加训练时长,本实施例通过实验设定batch_size=100。
3)由于预测结果与预测模型选用的超参数具有较强的相关性,对于不同的历史功率序列进行预测时预测模型选取的超参数往往是不同的。这些参数主要是依靠研究人员的经验选取,具有较大的主观随意性。为解决此问题,考虑利用优化算法对预测模型的隐含层单元个数、学习率和迭代次数等超参数进行优化。选取预测结果的均方误差(MeanSquareError,MSE)为适应度函数,优化目标使MSE最小。在求解最优解在原点附近的问题时,麻雀优化算法具有一定的优越性。因此,采用麻雀优化算法对BiLSTM预测模型的四个超参数进行优化。优化具体步骤如图7所示。优化结果如图8所示。未采用CEEMDAN分解算法时,针对原始海上风电功率序列BiLSTM预测模型的超参数优化结果如图8所示。当隐含层1神经元个数为14,隐含层2神经元个数为80,学习率为0.0081,训练次数为149次时,整体预测结果的适应度值最优,即均方误差最小。
4)本实施例所提组合预测方法首先借助CEEMDAN对原始风电功率序列做出分解,得到不同频率的IMF分量,然后搭建SSA-BiLSTM对各个IMF分量进行预测,最后将不同IMF的预测值整合叠加获得最终的风电功率预测结果。CEEMDAN-SSA-BiLSTM预测过程如图9所示。不同预测方法的预测结果和预测误差对比如图10、图11所示,从中可以看出本实施例所提出的一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法预测效果最优。
Claims (10)
1.一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,其特征在于:包括如下步骤:
S1:获得海上风电历史功率序列,明确CEEMDAN分解重构算法的定义,利用CEEMDAN方法对功率序列进行分解,得到不同的子序列;
S2:对获取的子序列数据进行预处理,明确海上风电功率预测结果的评价指标;
S3:明确BiLSTM网络含义,对CEEMDAN分解得到的模态分量和剩余分量构建BiLSTM预测模型;
S4:明确麻雀优化算法含义,使用麻雀优化算法对BiLSTM预测模型的超参数进行优化;
S5:利用超参数优化后的BiLSTM预测模型对不同子序列进行预测,将各预测分量叠加,得到最后的预测结果。
2.根据权利要求1所述的一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,其特征在于:所述步骤S1中的CEEMDAN分解海上风电功率序列具体为:
A1:在原始海上风电功率序列中添加T次均值为0的高斯白噪声,得到预处理序列yi(t),
yi(t)=y(t)+εni(t),i=1,2,…,T (1)
式中,y(t)为原始海上风电功率序列,yi(t)为第i次添加白噪声后的序列,ε为噪声标准差,ni(t)是满足N(0,1)分布的高斯白噪声,T为噪声添加的次数;
A2:使用EMD分解预处理序列T次,并对T个模态分量求均值,得到第一个子序列I1(t),
r1(t)=y(t)-I1(t) (3)
式中,I1(t)为CEEMDAN分解得到的第1个模态分量,I1(i)为yi(t)经过EMD分解得到的模态分量,r1(t)为CEEMDAN分解一次后的剩余分量;
A3:重复以上步骤,将CEEMDAN分解k次后的剩余分量继续添加噪声并进行EMD分解,然后判断剩余信号序列是否满足收敛条件,
rk(t)=rk-1(t)-Ik(t) (5)
式中,Ik(t)为CEEMDAN分解得到的第k个模态分量,Ek-1(·)为yi(t)经过EMD分解得到的第k-1个模态分量,εk-1为对CEEMDAN分解k-1次后的剩余分量加入噪声的权值系数,rk(t)为CEEMDAN分解k次后的剩余分量。
3.根据权利要求1所述的一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,其特征在于:所述步骤S1中CEEMDAN分解中的EMD分解方法具体为:
给定一个原始序列信号y(t),应用EMD分解方法对信号进行分解,具体步骤如下:
B1:对于原始序列信号y(t),首先找到其所有局部极值点,然后利用插值法连接所有极大值和极小值,分别得到上包络线、下包络线;
B2:令上包络线为eu(t)、下包络线为ev(t),平均值e(t)如下:
从原始信号y(t)中减去平均值e(t)得到子序列h(t),即
h(t)=y(t)-e(t) (7)
根据h(t)的极值点和零点数量相等或相差一个来判别其是否为本征模态分量,若不满足条件,则重复上述步骤来得到第一个模态分量IMF1(t);
B3:得到IMF1(t)后,用原始信号y(t)减去IMF1(t)得到剩余序列r1(t),即
r1(t)=y(t)-IMF1(t) (8)
然后将r1(t)作为新的初始信号序列,重复步骤B1、B2、B3,直至残余分量rn(t)为只有一个极值点或者一个单调的序列,则达到收敛条件,分解结束。
6.根据权利要求1所述的一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,其特征在于:所述步骤S3中BiLSTM预测模型由输入层、前向LSTM层、反向LSTM层、输出层构成。
7.根据权利要求6所述的一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,其特征在于:所述BiLSTM预测模型中LSTM包括遗忘门、记忆门、输出门,其提取数据特征过程的具体方法如下:
C1:信息选择遗忘阶段
ft=σ(Wf·[ht-1,xt]+bf) (14)
C2:信息选择记忆阶段
it=σ(Wi·[ht-1,xt]+bi) (15)
gt=tanh(Wg·[ht-1,xt]+bg) (16)
C3:当前细胞状态更新阶段
C4:信息输出阶段
ot=σ(Wo·[ht-1,xt]+bo) (18)
式中,xt为当前时刻的输入数据,ht-1为前一时刻的隐含层输出,ct为当前时刻细胞状态值,gt为记忆层输出,it为gt中信息的保留程度,W为不同层计算所需的权重值,b为不同层计算所需的偏置值,σ和tanh分别代表sigmoid和tanh激活函数,ot为当前时刻的输出值。
8.根据权利要求6所述的一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,其特征在于:所述BiLSTM网络含义具体为:
BiLSTM属于双向时序的特征学习,由前向LSTM与后向LSTM组合而成,然后将两个网络的隐含层连在一起,共同接入到输出层进行预测;
BiLSTM通过8个全局共享权重值来计算t时刻前向隐含层状态值和输出层状态值,包括输入层到前向、反向隐含层的权重值(w1,w2),前向隐含层内权重值(w3,w4),反向隐含层内权重值(w7,w8),前向、反向隐含层到输出层权重值(w5,w6);首先在前向层从初始时刻到t时刻正向计算,获得每个时刻隐含层的输出;然后在反向层从时刻t到初始时刻进行反向计算,获得每个时刻向后隐含层的输出,最后根据权重w5、w6和前向隐含层和后向隐含层的输出值,计算得到对应时刻输出结果,具体计算公式如下。
ht=f(w1·xt+w3·ht-1+w4·ct-1) (20)
h′t=f(w2·xt+w7·h′t+1+w8·c′t+1) (21)
ot=w5ht+w6h′t (22)
9.根据权利要求1所述的一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,其特征在于:所述步骤S4中麻雀优化算法具体含义如下:
首先建立麻雀种群,由n只麻雀组成的种群表示为:
式中,d为待优化问题变量的维数,n表示麻雀个体的数量;
不同麻雀个体的适应度值表示为:
在SSA算法中,具有较好适应度值的发现者在搜索过程中会优先获取食物,此外,因为发现者负责为整个麻雀种群寻找食物并引导整个种群的移动,因此,发现者可以获得比加入者更大的觅食搜索范围,在每次迭代过程中,发现者的位置更新方式如下:
式中,t表示当前迭代次数;Xi,j代表第i个麻雀在第j维迭代次数为t时的位置信息;Nmax为最大迭代次数,α是一个随机数,α∈(0,1];λ是服从正态分布的随机数;R表示预警值,R∈[0,1];ST表示安全值,ST∈[0.5,1],L为1×d的矩阵,矩阵元素全为1;R<ST时周围环境无捕食者,种群处于安全状态,发现者可进行大规模搜索,R≥ST表示周围出现捕食者,发出信号,种群需要转移到其他安全区域内觅食;
觅食过程中,一些加入者会监视发现者,如果发现者找到更好的食物,它们会立刻离开当前位置去争夺食物;如果加入者争夺成功,它们就可以获得发现者的食物,否则会移动或继续监视发现者;
加入者的位置更新方式如下:
式中,XP为目前发现者占据的最佳位置;Xworst为目前全局最差的位置;A为一个1×d的矩阵,矩阵内元素随机赋值1或-1,且A+=AT(AAT)-1;i>n/2表示第i个加入者适应度值较低,未获得食物则需要前往其他地方觅食;
另外,假设整个种群中能够发现捕食者的麻雀数量占比为10%~20%,这些警戒者的初始位置是随机生成的,表达形式如下:
式中,β为步长控制参数,是服从N(0,1)分布的随机数;Xbest表示当前全局最优的位置;fi表示当前个体适应度值,fg、fw表示当前全局最佳和最差的适应度值,fi>fg表示麻雀处于边缘,受威胁最大;fi=fg表示个体意识到危险,靠近其他麻雀来降低它们被捕食的风险;γ为最小常数,避免零点误差;K为麻雀移动方向。
应用麻雀优化算法优化BiLSTM模型的超参数的步骤为:
D1:初始化:针对预测模型优化的超参数,设定种群规模,目标函数的维数,种群中发现者和警戒者的数量,初始超参数的上下界,最大迭代次数;
D2:计算种群中不同麻雀个体的MSE值并排序,选取当前种群中MSE最大值和最小值以及其分别对应的位置,然后在种群中随机选取个体作为加入者;
D3:第一次迭代后,再次计算不同麻雀个体的MSE值,并更新发现者、加入者以及警戒者的位置信息;
D4:根据种群当前状态,更新整个种群的最优、最差位置以及相应的个体MSE值,判断是否达到最大迭代次数或者收敛条件,若是,则输出最优超参数的值,若不是则返回步骤D2;
D5:将优化得到的超参数输入到BiLSTM预测模型。
10.根据权利要求1所述的一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法,其特征在于:所述步骤S5中得到最终预测功率方法为:将步骤S1~S4所得数据依次送入BiLSTM模型进行预测,将每个子序列的预测结果反归一化并进行叠加,得到最终的海上风电功率预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210267424.9A CN114611808A (zh) | 2022-03-18 | 2022-03-18 | 一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210267424.9A CN114611808A (zh) | 2022-03-18 | 2022-03-18 | 一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114611808A true CN114611808A (zh) | 2022-06-10 |
Family
ID=81864925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210267424.9A Pending CN114611808A (zh) | 2022-03-18 | 2022-03-18 | 一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114611808A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115952924A (zh) * | 2023-03-09 | 2023-04-11 | 南京信息工程大学 | 一种基于优化vmd与特征热力图的短期风电功率预测方法 |
CN116050270A (zh) * | 2023-02-07 | 2023-05-02 | 合肥学院 | 一种pm2.5浓度预测方法及系统 |
CN116646927A (zh) * | 2023-05-30 | 2023-08-25 | 淮阴工学院 | 一种基于分段滤波与纵横聚类的风电功率预测方法 |
-
2022
- 2022-03-18 CN CN202210267424.9A patent/CN114611808A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116050270A (zh) * | 2023-02-07 | 2023-05-02 | 合肥学院 | 一种pm2.5浓度预测方法及系统 |
CN115952924A (zh) * | 2023-03-09 | 2023-04-11 | 南京信息工程大学 | 一种基于优化vmd与特征热力图的短期风电功率预测方法 |
CN116646927A (zh) * | 2023-05-30 | 2023-08-25 | 淮阴工学院 | 一种基于分段滤波与纵横聚类的风电功率预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tian | Short-term wind speed prediction based on LMD and improved FA optimized combined kernel function LSSVM | |
CN109902801B (zh) | 一种基于变分推理贝叶斯神经网络的洪水集合预报方法 | |
CN114611808A (zh) | 一种基于CEEMDAN-SSA-BiLSTM的短期海上风电功率预测方法 | |
Zhang et al. | A comprehensive wind speed prediction system based on Monte Carlo and artificial intelligence algorithms | |
Wang et al. | Short-term forecasting of natural gas prices by using a novel hybrid method based on a combination of the CEEMDAN-SE-and the PSO-ALS-optimized GRU network | |
Wang et al. | Wind speed forecasting based on multi-objective grey wolf optimisation algorithm, weighted information criterion, and wind energy conversion system: A case study in Eastern China | |
CN112116162B (zh) | 基于ceemdan-qfoa-lstm的输电线覆冰厚度预测方法 | |
Wei et al. | Ultra-short-term forecasting of wind power based on multi-task learning and LSTM | |
CN113723007B (zh) | 基于drsn和麻雀搜索优化的设备剩余寿命预测方法 | |
CN110059867B (zh) | 一种swlstm结合gpr的风速预测方法 | |
CN111027772A (zh) | 基于pca-dbilstm的多因素短期负荷预测方法 | |
Li et al. | Multi-step ahead wind speed forecasting approach coupling maximal overlap discrete wavelet transform, improved grey wolf optimization algorithm and long short-term memory | |
CN113126676B (zh) | 一种畜禽舍养殖环境参数智能控制系统 | |
CN112163689A (zh) | 基于深度Attention-LSTM的短期负荷分位点概率预测方法 | |
CN113095598A (zh) | 一种多能负荷预测方法、系统、设备和介质 | |
CN112365033B (zh) | 一种风电功率区间预测方法、系统及存储介质 | |
Wang et al. | Multi-step-ahead time series prediction method with stacking LSTM neural network | |
CN116562908A (zh) | 一种基于双层vmd分解和ssa-lstm的电价预测方法 | |
CN116454863A (zh) | 一种基于改进天鹰优化算法的风电功率组合预测模型的最优权重确定方法 | |
CN115877483A (zh) | 一种基于随机森林和gru的台风路径预报方法 | |
Yang et al. | A prediction model of aquaculture water quality based on multiscale decomposition | |
Li et al. | Short-term probabilistic load forecasting method based on uncertainty estimation and deep learning model considering meteorological factors | |
CN116933025A (zh) | 基于vmd与dbo-lstm-at的变压器顶层油温预测方法 | |
CN116632834A (zh) | 一种基于SSA-BiGRU-Attention的短期电力负荷预测方法 | |
Wang et al. | A hybrid model with combined feature selection based on optimized VMD and improved multi-objective coati optimization algorithm for short-term wind power prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |