CN110685857B - 一种基于集成学习的山地风电机组行为预测模型 - Google Patents
一种基于集成学习的山地风电机组行为预测模型 Download PDFInfo
- Publication number
- CN110685857B CN110685857B CN201910983215.2A CN201910983215A CN110685857B CN 110685857 B CN110685857 B CN 110685857B CN 201910983215 A CN201910983215 A CN 201910983215A CN 110685857 B CN110685857 B CN 110685857B
- Authority
- CN
- China
- Prior art keywords
- data
- sample
- model
- input
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006399 behavior Effects 0.000 title claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 25
- 230000004927 fusion Effects 0.000 claims abstract description 16
- 238000012360 testing method Methods 0.000 claims abstract description 13
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 11
- 230000002159 abnormal effect Effects 0.000 claims abstract description 9
- 230000001133 acceleration Effects 0.000 claims description 18
- 238000012706 support-vector machine Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 6
- 230000000306 recurrent effect Effects 0.000 claims description 6
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 238000002790 cross-validation Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 238000005070 sampling Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000010845 search algorithm Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 241000288105 Grus Species 0.000 claims description 2
- 238000009826 distribution Methods 0.000 claims description 2
- 238000012417 linear regression Methods 0.000 claims description 2
- 238000010606 normalization Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 230000006403 short-term memory Effects 0.000 claims description 2
- 230000002123 temporal effect Effects 0.000 claims description 2
- 238000009827 uniform distribution Methods 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims 1
- 238000012423 maintenance Methods 0.000 abstract 1
- 230000009466 transformation Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F03—MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
- F03D—WIND MOTORS
- F03D7/00—Controlling wind motors
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F03—MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
- F03D—WIND MOTORS
- F03D17/00—Monitoring or testing of wind motors, e.g. diagnostics
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F05—INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
- F05B—INDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
- F05B2260/00—Function
- F05B2260/82—Forecasts
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F05—INDEXING SCHEMES RELATING TO ENGINES OR PUMPS IN VARIOUS SUBCLASSES OF CLASSES F01-F04
- F05B—INDEXING SCHEME RELATING TO WIND, SPRING, WEIGHT, INERTIA OR LIKE MOTORS, TO MACHINES OR ENGINES FOR LIQUIDS COVERED BY SUBCLASSES F03B, F03D AND F03G
- F05B2270/00—Control
- F05B2270/70—Type of control algorithm
- F05B2270/709—Type of control algorithm with neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E10/00—Energy generation through renewable energy sources
- Y02E10/70—Wind energy
- Y02E10/72—Wind turbines with rotation axis in wind direction
Abstract
本发明公开了一种基于集成学习的山地风电机组行为预测模型,包括以下步骤:1.采用自适应阈值法确定风速功率子区间数据密度阈值进而清洗异常数据;2.定义样本矩阵,采用自适应综合过采样方法生成新的样本矩阵均匀分布不同风况。3.根据第2步生成的数据,对其进行希尔伯特‑黄变换,得到山地风电机组模型输入量的分解量;4.根据第4步的数据,确定山地风电机组模型的输入输出,选取个体学习器并采用stacking的集成学习的融合策略,训练集成得到山地风电机组行为预测模型;5.采用网格搜索法确定模型最优参数6.运行测试山地风电机组行为预测模型。本发明可以为风电机组预测性控制提供服务,维护人员能更好更高效的维护机组正常运行。
Description
技术领域
本发明涉及风电机组建模领域,尤其涉及一种基于集成学习的山地风电机组行为预测模型。
背景技术
随着能源问题的日益凸显,风能作为一种可再生能源,具有清洁环保等特点,已经引起世界各国的重视。目前,由于内陆山区同样具有极其丰厚的风能资源,风能资源利用已经成为了广大学者关注的新的问题。然而,与传统的海上风电场相比,山区风电场的风由于受到地形的影响,风的波动性较大,风速、风向、5秒偏航、桨距角等因素都会影响山地风电机组模型的准确性。
随着山区风电机组装机数量的不断增加,精确的山地风电机组行为预测模型一方面可以为风电机组的预测性控制提供服务,另一方面还能够优化风电场能源调度以及风电场风能与电网的交互。因此,如何准确的建立山地风电机组行为预测模型成为了风力发电领域重要的研究方向,常见的风电机组行为预测模型主要包括以下几类:机理模型是理想状态下根据风电机组结构、内部运行机制建立起来的精确数学模型;基于数学表达式的统计学方法主要是通过对历史数据的采集,建立历史数据与当前时刻数据之间的一个映射关系,进而建立风电机组行为预测模型;经典的神经网络模型主要通过采集到的历史数据通过神经网络进行训练,从而得到风电机组行为预测模型。这些方法用于建立山地风电机组行为预测模型仍然有一些不足,主要包括以下三个方面:
(1)机理模型没有考虑山地风电机组实际运行环境,模型准确性较低;
(2)由于山区风波动较大,风机状态量也会剧烈变换,不同频率的风机状态量会影响风电机组模型输出,从而影响模型的预测精度;
(3)数据在不同的风况下分布不均匀,极端风况条件下的数据较少,多数类数据训练出来的模型容易出现过拟合现象而少数类数据训练出来的模型会出现欠拟合现象。
发明内容
为了解决现有技术存在的上述问题,本发明提出一种基于集成学习的山地风电机组行为预测模型,该方法包括以下步骤:
步骤1:从风电场SCADA系统中采集一年的风机数据,采样间隔为Δt秒;数据可以表示为X(t0)={X1(t0),X2(t0),...,X8(t0)},X1(t0),X2(t0),...,X8(t0)分别为t0时刻的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度;将采集到的数据通过密度法进行异常数据的清洗,其中密度阈值ρ0由自适应阈值法确定;
步骤2:定义样本矩阵,将清洗后的数据根据时间规律转换成样本矩阵X”sample,采用ADASYN(Adaptive Synthetic Oversampling,自适应综合过采样)方法生成新的样本矩阵均匀分布在不同的风况;
步骤3:将当前时刻t0前T秒的输入量即风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度进行希尔伯特-黄变换,以上每个输入量被分解成ua个IMF(Intrinsic Mode Function,本征模态函数)和一个余项,用ua个IMF和余项构成的矩阵代替其原输入量;
步骤4:训练构建山地风电机组行为预测模型网络;用当前时刻t0前T秒包含ua个IMF和余项的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络输入,当前时刻t0的风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络的输出。选取LSTM(Long Short-Term Memory,长短期记忆网络)、TCN(Temporal Convolutional Network,时间卷积网络)、RNN(Recurrent NeuralNetwork,循环神经网络)、GRU(Gated Recurrent Unit,门控循环单元)、SVM(SupportVector Machine,支持向量机)作为个体学习器,采用stacking的集成学习的融合策略,训练集成得到山地风电机组模型;
步骤5:采用网格搜索算法确定模型最优参数;
步骤6:运行山地风电机组行为预测模型,获取预测结果。
本发明的技术效果在于:本发明所述的是一种基于集成学习的山地风电机组行为预测模型。采用自适应综合过采样法生成新的样本数据均匀分布各个风况能够避免训练模型时的过拟合现象,从而提高预测模型精度。通过将实验的各个风机状态量的时间序列分解成一系列较平稳且具有明显周期变化的分解量,在很大程度减少不同特征信息间的干扰,使最终的模型更准确。由于集成学习在多输入多输出序列建模问题时,可获得比单一学习器更为显著优越的泛化能力,充分利用了所有的数据,能够将多个个体学习器所得到的输出结果有机的结合,防止出现过拟合现象,能够有效的提高模型准确性。
附图说明
图1为本发明建模方法的示意图。
图2为希尔伯特-黄分解示意图。
图3为本发明stacking集成学习算法的K折交叉验证过程示意图。
具体实施方式
本发明提出的基于集成学习的山地风电机组建模方法包括步骤:
步骤1:从风电场SCADA系统中采集一年的风机数据,采样间隔为Δt秒。数据可以表示为X(t0)={X1(t0),X2(t0),...,X8(t0)},X1(t0),X2(t0),...,X8(t0)分别为t0时刻的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度。将采集到的数据通过密度法进行异常数据的清洗,其中密度阈值ρ0由自适应阈值法确定。
具体为以下步骤:
步骤1-1:风速X1(t)、风向X2(t)、5秒偏航对风平均值X3(t)、风机输出功率X4(t)、桨距角X5(t)、风机转子转速X6(t)、叶片加速度X7(t)、叶片角度X8(t)以及时间t分别作为矩阵的列,构成矩阵X,即
X={X1(t),X2(t),...,X8(t),t} (1)
步骤1-2:按照风速大小递增的原则对矩阵X重新排序,以固定步长v将风速划分为n个区间,再以固定步长p对功率区间划分,得到m个子区间,每个子区间的数据密度为
ρ=ndata/(v×p) (2)
其中ndata为该子区间数据个数;
步骤1-3:每个风速区间子区间数据密度最大值记为ρmax,i,最小值为ρmin,i,计算每个风速区间数据密度为
ρi=(ρmax,i+ρmin,i)/2,1≤i≤m (3)
步骤1-5:删除异常数据后。按照t大小递增的原则恢复矩阵X初始时序,重构矩阵为:
X'={X'1(t),X'2(t),...,X'8(t)} (4)
式中X'1(t),X'2(t),...,X'8(t)分别为清洗掉异常数据后的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度的时间序列,此时当前时刻t0的数据样本为
X'(t0)={X'1(t0),X'2(t0),...,X'8(t0)} (5)
步骤2:定义样本矩阵,将清洗后的数据根据时间规律转换成样本矩阵X”sample,采用ADASYN采样方法生成新的样本矩阵均匀分布在不同的风况:
步骤2-1:定义8×(T+1)的样本数据矩阵X'sample={X'1(t0-T:t0),X'2(t0-T:t0),...,X'8(t0-T:t0)},将数据转换成样本矩阵;
步骤2-2:将样本矩阵X'sample按行顺序平铺转换成1×8*(T+1)的行向量xsample,其中T为输入量时间长度;
步骤2-3:以固定步长v'划分风速区间,将转换后的行向量样本根据其平均风速所处区间不同划分成e个类别,每个类别的样本数分别用r1,r2,...,re表示;
步骤2-4:记样本最多类别的样本数为rmax,该类别的样本即为多数类样本,其它类别样本记为少数类样本。计算每个少数类别需要合成的样本数Gf如下式所:
Gf=rmax-rf(1≤f≤e-1) (6)
其中rf为第f个少数类样本数;
步骤2-5:用欧氏距离计算属于第f个少数类的每一个样本的k个最近邻居,Δ为该样本k个邻居中属于多数类的样本数,记k个邻居中多数类所占比例z为
z=Δ/k,z∈[0,1] (7)
步骤2-6:由式(7)到第f个少数类第x个样本k个邻居多数类所占比例zf,x,其周围多数类的情况可以表示为
则第f个少数类第x个样本需要生成的样本数为
gf,x=zf,x×Gf (9)
步骤2-7:在第f个少数类第x个样本周围k个邻居中随机选择一个属于少数类f的样本df,k,根据式(10)生成新样本:
sf,x=df,x+(df,k-df,x)×λ (10)
其中df,x为第f个少数类第x个样本,sf,x为新样本;
步骤2-8:重复步骤2-5直到df,x生成的新样本数达到gf,x,当e-1个少数类样本全生成完后,数据达到分布均衡的状态。
步骤2-9:将行向量样以8维为间隔恢复新的样本矩阵,此时样本矩阵可表示为
X'sample_new={X'1_new(t0-T:t0),X'2_new(t0-T:t0),...,
X'8_new(t0-T:t0)} (11)
其中X'sample_new为新样本矩阵;
步骤2-10:X'sample和X'sample_new将构成最终的实验数据集,最终样本矩阵可表示为
X”sample={X”1(t0-T:t0),X”2(t0-T:t0),...,X”8(t0-T:t0)} (12)
其中X”sample为样本分布均匀下的样本矩阵;
步骤3:将当前时刻t0前T秒的输入量即风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度进行希尔伯特-黄变换,以上每个输入量被分解成ua个IMF和一个余项,用ua个IMF和余项构成的矩阵代替其原输入量。具体内容如下;
步骤3-1:对当前时刻的X"1(t0-T:t0-1),X"2(t0-T:t0-1),...,X"8(t0-T:t0-1)进行集合经验模态分解,第a个风机状态量输入包含ua个分解量xa1(t0-T:t0-1),xa2(t0-T:t0-1),……,和一个余项raua(t0-T:t0-1),1≤a≤8,且a为整数;
步骤3-2:对第a个风机状态量的每个分解量xa1(t0-T:t0-1),xa2(t0-T:t0-1),……,和余项进行希尔伯特变换得到ha1(t0-T:t0-1),ha2(t0-T:t0-1),……,和
步骤3-3:重构各个风机状态量的输入数据格式,以各个分解量和余项作为各个风机状态量的特征,即
步骤4:训练构建山地风电机组的网络。用当前时刻t0前T秒包含ua个IMF和余项的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络输入,当前时刻t0的风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络的输出。选取LSTM、TCN、RNN、GRU、SVM作为个体学习器,采用stacking的集成学习的融合策略,训练集成得到山地风电机组模型:
步骤4-1:以分解后风机状态量当前时刻t0前T秒X"1(t0-T:t0-1),X"2(t0-T:t0-1),...,X"8(t0-T:t0-1)为山地风电机组模型的输入,T是输入量时间步长;
步骤4-2:当前时刻t0的风机功率X”4(t0)、桨距角X”5(t0)、风机转速X”6(t0)、叶片加速度X”7(t0)、叶片角度X”8(t0)即为山地风电机组模型的输出;
步骤4-3:对输入输出数据集进行归一化处理;
步骤4-4:选取LSTM、TCN、RNN、GRU、SVM作为个体学习器,分别用model1、model2、model3、model4、model5表示。具体内容如下:
(1)LSTM:该个体学习器的每一个输入量对应一个LSTM,记为lstm1,lstm2,...,lstm8,每个LSTM由3层lstm层堆叠而成,对应的输出lstm3_1,lstm3_2,...,lstm3_8,将8个LSTM的输出通过融合层进行融合后再添加3层全连接层,最终的输出为model1的输出;
(2)TCN:该个体学习器的每一个输入量对应一个TCN,记为tcn1,tcn2,...,tcn8,每个TCN由6个残差模块堆叠而成,对应的输出tcn6_1,tcn6_2,...,tcn6_8,将8个TCN的输出通过融合层进行融合后再添加3层全连接层,最终的输出为model2的输出;
(3)RNN:该个体学习器的每一型输入量对应一个常规循环神经网络,记为rnn1,rnn2,...,rnn8,每个RNN由3层rnn层堆叠而成,对应的输出rnn3_1,rnn3_2,...,rnn3_8,将8个RNN的输出通过融合层进行融合后再添加3层全连接层,最终的输出为model3的输出;
(4)GRU:该个体学习器的每一个输入量对应一个GRU,记为gru1,gru2,...,gru8,每个GRU由3个gru层堆叠而成,对应的输出gru3_1,gru3_2,...,gru3_8,将8个GRU的输出通过融合层进行融合后再添加3层全连接层,最终的输出为model4的输出;
(5)SVM:该个体学习器的输入为数据清洗后的风机状态量,每个输入对应一个SVM,记为svm1,svn2,...,svm8,通过核函数K(X)将输入输出映射到高维空间,使其变成线性回归,将8个SVM的输出通过融合层进行融合后再添加3层全连接层最终的输出为model5;
步骤4-5:采用集成学习的思想将步骤4-4的5个个体学习器集成,具体内容如下:
(1)对第i个个体学习器进行K折交叉验证,1≤i≤5,即将训练集train_data随机分成K个子集,且每个子集大小相同,得到数据集
{train_data1,train_data2,...,train_dataK} (14)
(2)将数据集{train_data1,train_data2,...,train_dataK}中的每个子集train_dataj(1≤j≤K且j为整数)分别作为每个个体学习器的测试集,剩余的数据子集作为每个个体学习器的训练集,此时训练集的输出为ai,1,ai,2,...,ai,K,测试集输出为bi,1,bi,2,...,bi,K,第i个个体学习器的K个子模型集合为
{modlei,1,modlei,2,...modeli,K} (15)
(3)将第i个个体学习器的K个子模型训练集的输出ai,1,ai,2,...,ai,K进行融合得到次级学习器训练集的一个输入Ai,将测试集的输出bi,1,bi,2,...,bi,K相加求平均值得到次级学习器测试集的一个输入Bi;
步骤4-6:构建次级学习器,本发明采用的次级学习器为BP神经网络,A1,A2,A3,A4作为次级学习器训练集的输入,B1,B2,B3,B4作为次级学习器测试集的输入,进行训练得到最终的风电机组行为预测模型输出;
步骤5:采用网格搜索算法确定模型最优参数。具体步骤如下:
步骤5-1:训练模型过程中主要需要调整的参数诶学习率l、迭代次数e以及批尺寸bs,设定以上参数的选择范围和搜索步长,即可构成三维网格;
步骤5-2:按照交叉验证的方法计算不同参数组合(l,e,bs)的模型训练集准确率和测试集准确率,在保证训练集和测试集的准确率之和最大的前提下,确定了最优的参数组合为
(lbest,ebest,bsbest) (16)
其中lbest,ebest,bsbest分别为模型准确性最高下的学习率、迭代次数以及批尺寸;
步骤5-3:使用最优参数组合(lbest,ebest,bsbest)得到最优的山地风电机组行为预测模型;
步骤6:运行山地风电机组行为预测模型,获取预测结果。
将第二年的风机数据样本经过步骤3后以步骤4的数据输入形式作为网络的输入,即可输出得到次年风机状态量预测值;
本发明较佳的实施例如上所述,并发对本发明任何形式和实质上的限制,显然,任何本领域的技术人员在不脱离本发明的范围和精神的前提下,可对其做些许的修改和完善,本发明的保护范围需以权利要求书所界定为准。
Claims (7)
1.一种基于集成学习的山地风电机组行为预测模型,其特征在于,包括以下步骤:
步骤1:从风电场SCADA系统中采集一年的风机数据,采样间隔为Δt秒;数据可以表示为X(t0)={X1(t0),X2(t0),...,X8(t0)},X1(t0),X2(t0),...,X8(t0)分别为t0时刻的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度;将采集到的数据通过密度法进行异常数据的清洗,其中密度阈值ρ0由自适应阈值法确定;
步骤2:定义样本矩阵,将清洗后的数据根据时间规律转换成样本矩阵X”sample,采用ADASYN(Adaptive Synthetic Oversampling,自适应综合过采样)方法生成新的样本矩阵均匀分布在不同的风况;
步骤3:将当前时刻t0前T秒的输入量即风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度进行希尔伯特-黄变换,以上每个输入量被分解成ua个IMF(Intrinsic Mode Function,本征模态函数)和一个余项,用ua个IMF和余项构成的矩阵代替其原输入量;
步骤4:训练构建山地风电机组行为预测模型网络;用当前时刻t0前T秒包含ua个IMF和余项的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络输入,当前时刻t0的风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络的输出;选取LSTM(Long Short-Term Memory,长短期记忆网络)、TCN(Temporal Convolutional Network,时间卷积网络)、RNN(Recurrent Neural Network,循环神经网络)、GRU(Gated Recurrent Unit,门控循环单元)、SVM(Support VectorMachine,支持向量机)作为个体学习器,采用stacking的集成学习的融合策略,训练集成得到山地风电机组模型;
步骤5:采用网格搜索算法确定模型最优参数;
步骤6:运行山地风电机组行为预测模型,获取预测结果。
2.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型,其特征在于,所述步骤1中确定区间数据密度阈值,清洗异常数据的具体内容如下:
1-1:风速X1(t)、风向X2(t)、5秒偏航对风平均值X3(t)、风机输出功率X4(t)、桨距角X5(t)、风机转子转速X6(t)、叶片加速度X7(t)、叶片角度X8(t)以及时间t分别作为矩阵的列,构成矩阵X,即
X={X1(t),X2(t),...,X8(t),t} (1)
1-2:按照风速大小递增的原则对矩阵X重新排序,以固定步长v将风速划分为n个区间,再以固定步长p对功率区间划分,得到m个子区间,每个子区域的数据密度为
ρ=ndata/(v×p) (2)
其中ndata为该子区间数据个数;
1-3:每个风速区间子区间数据密度最大值记为ρmax,i,最小值为ρmin,i,计算每个风速区间数据密度为
ρi=(ρmax,i+ρmin,i)/2,1≤i≤m (3)
1-5:删除异常数据后,按照t大小递增的原则恢复矩阵X初始时序,重构矩阵为:
X'={X'1(t),X'2(t),...,X'8(t)} (4)
式中X'1(t),X'2(t),...,X'8(t)分别为清洗掉异常数据后的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度的时间序列,此时当前时刻t0的数据样本为
X'(t0)={X'1(t0),X'2(t0),...,X'8(t0)} (5)。
3.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型,其特征在于,所述步骤2中采用ADASYN方法生成训练样本具体内容如下:
2-1:定义8×(T+1)的样本数据矩阵X'sample={X'1(t0-T:t0),X'2(t0-T:t0),...,X'8(t0-T:t0)},将数据转换成样本矩阵;
2-2:将样本矩阵X'sample按行顺序平铺转换成1×8*(T+1)的行向量xsample,其中T为输入量时间长度;
2-3:以固定步长v'划分风速区间,将转换后的行向量样本根据其平均风速所处区间不同划分成e个类别,每个类别的样本数分别用r1,r2,...,re表示;
2-4:记样本最多类别的样本数为rmax,该类别的样本即为多数类样本,其它类别样本记为少数类样本,计算每个少数类别需要合成的样本数Gf如下式所:
Gf=rmax-rf(1≤f≤e-1) (6)
其中rf为第f个少数类样本数;
2-5:用欧氏距离计算属于第f个少数类的每一个样本的k个最近邻居,Δ为该样本k个邻居中属于多数类的样本数,记k个邻居中多数类所占比例z为
z=Δ/k,z∈[0,1] (7)
2-6:由式(7)到第f个少数类第x个样本k个邻居多数类所占比例zf,x,其周围多数类的情况可以表示为
则第f个少数类第x个样本需要生成的样本数为
gf,x=zf,x×Gf (9)
2-7:在第f个少数类第x个样本周围k个邻居中随机选择一个属于少数类f的样本df,k,根据式(10)生成新样本:
sf,x=df,x+(df,k-df,x)×λ (10)
其中df,x为第f个少数类第x个样本,sf,x为新样本;
2-8:重复步骤2-5直到df,x生成的新样本数达到gf,x,当e-1个少数类样本全生成完后,数据达到分布均衡的状态;
2-9:将行向量样以8维为间隔恢复新的样本矩阵,此时样本矩阵可表示为
其中X'sample_new为新样本矩阵;
2-10:X'sample和X'sample_new将构成最终的实验数据集,最终样本矩阵可表示为
X”sample={X”1(t0-T:t0),X”2(t0-T:t0),...,X”8(t0-T:t0)} (12)
其中X”sample为样本分布均匀下的样本矩阵。
5.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型,其特征在于,所述步骤4训练山地风电机组行为预测模型网络的具体内容如下:
4-1:以分解后风机状态量当前时刻t0前T秒X"1(t0-T:t0-1),X"2(t0-T:t0-1),...,X"8(t0-T:t0-1)为山地风电机组模型的输入,T是输入量时间步长;
4-2:当前时刻t0的风机功率X”4(t0)、桨距角X”5(t0)、风机转速X”6(t0)、叶片加速度X”7(t0)、叶片角度X”8(t0)即为山地风电机组模型的输出;
4-3:对输入输出数据集进行归一化处理;
4-4:选取LSTM、TCN、RNN、GRU、SVM作为个体学习器,分别用model1、model2、model3、model4、model5表示;具体内容如下:
(1)LSTM:该个体学习器的每一个输入量对应一个LSTM,记为lstm1,lstm2,...,lstm8,每个LSTM由3层lstm层堆叠而成,对应的输出lstm3_1,lstm3_2,...,lstm3_8,将8个LSTM的输出通过融合层进行融合后再添加3层全连接层,最终的输出为model1的输出;
(2)TCN:该个体学习器的每一个输入量对应一个TCN,记为tcn1,tcn2,...,tcn8,每个TCN由6个残差模块堆叠而成,对应的输出tcn6_1,tcn6_2,...,tcn6_8,将8个TCN的输出通过融合层进行融合后再添加3层全连接层,最终的输出为model2的输出;
(3)RNN:该个体学习器的每一型输入量对应一个常规循环神经网络,记为rnn1,rnn2,...,rnn8,每个RNN由3层rnn层堆叠而成,对应的输出rnn3_1,rnn3_2,...,rnn3_8,将8个RNN的输出通过融合层进行融合后再添加3层全连接层,最终的输出为model3的输出;
(4)GRU:该个体学习器的每一个输入量对应一个GRU,记为gru1,gru2,...,gru8,每个GRU由3个gru层堆叠而成,对应的输出gru3_1,gru3_2,...,gru3_8,将8个GRU的输出通过融合层进行融合后再添加3层全连接层,最终的输出为model4的输出;
(5)SVM:该个体学习器的输入为数据清洗后的风机状态量,每个输入对应一个SVM,记为svm1,svn2,...,svm8,通过核函数K(X)将输入输出映射到高维空间,使其变成线性回归,将8个SVM的输出通过融合层进行融合后再添加3层全连接层最终的输出为model5;
4-5:采用集成学习的思想将步骤4-4的5个个体学习器集成,具体内容如下:
(1)对第i个个体学习器进行K折交叉验证,1≤i≤5,即将训练集train_data随机分成K个子集,且每个子集大小相同,得到数据集
{train_data1,train_data2,...,train_dataK} (14)
(2)将数据集{train_data1,train_data2,...,train_dataK}中的每个子集train_dataj(1≤j≤K且j为整数)分别作为每个个体学习器的测试集,剩余的数据子集作为每个个体学习器的训练集,此时训练集的输出为ai,1,ai,2,...,ai,K,测试集输出为bi,1,bi,2,...,bi,K,第i个个体学习器的K个子模型集合为{modlei,1,modlei,2,...modeli,K} (15)
(3)将第i个个体学习器的K个子模型训练集的输出ai,1,ai,2,...,ai,K进行融合得到次级学习器训练集的一个输入Ai,将测试集的输出bi,1,bi,2,...,bi,K相加求平均值得到次级学习器测试集的一个输入Bi;
4-6:构建次级学习器,本发明采用的次级学习器为BP神经网络,A1,A2,A3,A4作为次级学习器训练集的输入,B1,B2,B3,B4作为次级学习器测试集的输入,进行训练得到最终的风电机组行为预测模型输出。
6.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型,其特征在于,所述步骤5中模型参数优化的具体内容如下:
5-1:训练模型过程中主要需要调整的参数为学习率l、迭代次数e以及批尺寸bs,设定以上参数的选择范围和搜索步长,即可构成三维网格;
5-2:按照交叉验证的方法计算不同参数组合(l,e,bs)的模型训练集准确率和测试集准确率,在保证训练集和测试集的准确率之和最大的前提下,确定了最优的参数组合为
(lbest,ebest,bsbest) (16)
其中lbest,ebest,bsbest分别为模型准确性最高下的学习率、迭代次数以及批尺寸;
5-3:使用最优参数组合(lbest,ebest,bsbest)得到最优的山地风电机组行为预测模型。
7.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型,其特征在于,所述步骤6中模型运行的具体内容如下:
将第二年的风机数据样本经过步骤3后以步骤4的数据输入形式作为网络的输入,即可输出得到次年风机状态量预测值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910983215.2A CN110685857B (zh) | 2019-10-16 | 2019-10-16 | 一种基于集成学习的山地风电机组行为预测模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910983215.2A CN110685857B (zh) | 2019-10-16 | 2019-10-16 | 一种基于集成学习的山地风电机组行为预测模型 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110685857A CN110685857A (zh) | 2020-01-14 |
CN110685857B true CN110685857B (zh) | 2021-10-15 |
Family
ID=69112924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910983215.2A Active CN110685857B (zh) | 2019-10-16 | 2019-10-16 | 一种基于集成学习的山地风电机组行为预测模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110685857B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111080039B (zh) * | 2020-03-17 | 2023-10-20 | 浙江上风高科专风实业有限公司 | 一种风机集群故障预测方法及系统 |
CN111709490B (zh) * | 2020-06-24 | 2022-03-18 | 河北工业大学 | 一种基于gru神经网络的风机健康状态评估方法 |
CN112761896A (zh) * | 2020-09-24 | 2021-05-07 | 国网内蒙古东部电力有限公司 | 提高风力发电站发电量预测精度的计算方法、装置和计算机设备 |
CN112183847B (zh) * | 2020-09-25 | 2022-09-20 | 合肥工业大学 | 基于QRNN改进Stacking算法的列车行驶风速概率预测方法 |
CN112365040B (zh) * | 2020-11-03 | 2022-03-01 | 哈尔滨工业大学 | 一种基于多通道卷积神经网络和时间卷积网络的短期风电功率预测方法 |
CN112842342B (zh) * | 2021-01-25 | 2022-03-29 | 北京航空航天大学 | 一种结合希尔伯特曲线和集成学习的心电磁信号分类方法 |
CN112879220B (zh) * | 2021-03-16 | 2022-11-01 | 上海电气风电集团股份有限公司 | 风机控制方法、系统和可读存储介质 |
CN112949938B (zh) * | 2021-03-29 | 2022-04-15 | 哈尔滨工业大学 | 改善训练样本类别不均衡的风电爬坡事件直接预报方法 |
CN113392826A (zh) * | 2021-06-18 | 2021-09-14 | 广东工业大学 | 一种基于多模型融合Stacked的害鸟密度分布预测方法 |
CN113379151A (zh) * | 2021-06-25 | 2021-09-10 | 重庆大学 | 基于Bagging-CNN-GRU的风速超短期预测方法 |
CN113553774A (zh) * | 2021-08-30 | 2021-10-26 | 北京东润环能科技股份有限公司 | 一种基于eemd-gru的短期风功率预测方法 |
CN114243674B (zh) * | 2022-02-24 | 2022-05-20 | 国网浙江省电力有限公司平阳县供电公司 | 一种直流微网孤岛状态下的光伏和储能协同控制系统 |
TWI812382B (zh) * | 2022-08-04 | 2023-08-11 | 正修學校財團法人正修科技大學 | 波浪發電控制方法及系統 |
CN115512717A (zh) * | 2022-11-21 | 2022-12-23 | 东北石油大学三亚海洋油气研究院 | 一种基于集成学习的二阶段单传感器管道泄漏定位方法 |
CN117577214B (zh) * | 2023-05-19 | 2024-04-12 | 广东工业大学 | 一种基于堆叠学习算法的化合物血脑屏障渗透性预测方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2667625A1 (en) * | 2006-11-03 | 2008-05-08 | Vestas Wind Systems A/S | A wind energy converter, a method and use hereof |
US8235662B2 (en) * | 2007-10-09 | 2012-08-07 | General Electric Company | Wind turbine metrology system |
WO2011022024A1 (en) * | 2009-08-21 | 2011-02-24 | Catch the Wind, Inc. | Wind and power forecasting using lidar distance wind sensor |
GB2476316B (en) * | 2009-12-21 | 2014-07-16 | Vestas Wind Sys As | A wind turbine having a control method and controller for predictive control of a wind turbine generator |
EP3037657A1 (en) * | 2014-12-23 | 2016-06-29 | ABB Technology AG | Optimal wind farm operation |
CN104778506B (zh) * | 2015-03-31 | 2019-03-26 | 天津大学 | 基于局部集成学习的短期风速预报方法 |
CN105069476B (zh) * | 2015-08-10 | 2018-12-11 | 国网宁夏电力公司 | 基于两阶段集成学习的风电异常数据识别方法 |
CN106529706A (zh) * | 2016-10-25 | 2017-03-22 | 国家电网公司 | 一种基于支持向量机回归的风电场风速预测方法 |
CN106991285A (zh) * | 2017-04-01 | 2017-07-28 | 广东工业大学 | 一种短期风速多步预测方法及装置 |
CN108181107B (zh) * | 2018-01-12 | 2019-08-30 | 东北电力大学 | 计及多分类目标的风电机组轴承机械故障诊断方法 |
CN108376298B (zh) * | 2018-02-12 | 2023-11-10 | 湘潭大学 | 一种风电机组发动机温度故障预警诊断方法 |
CN109145175B (zh) * | 2018-09-03 | 2023-05-30 | 成都卡普数据服务有限责任公司 | 基于stacking集成学习算法的时空数据预测方法 |
CN110068302A (zh) * | 2019-03-07 | 2019-07-30 | 中科院微电子研究所昆山分所 | 一种基于深度神经网络的车辆测距方法 |
CN110134919B (zh) * | 2019-04-30 | 2020-12-15 | 华北电力大学 | 风电机组异常数据清洗方法 |
CN110503251B (zh) * | 2019-08-12 | 2022-06-07 | 江苏方天电力技术有限公司 | 一种基于Stacking算法的非节假日负荷预测方法 |
-
2019
- 2019-10-16 CN CN201910983215.2A patent/CN110685857B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110685857A (zh) | 2020-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110685857B (zh) | 一种基于集成学习的山地风电机组行为预测模型 | |
Yang et al. | A weather-based hybrid method for 1-day ahead hourly forecasting of PV power output | |
Cabrera et al. | Wind-driven SWRO desalination prototype with and without batteries: A performance simulation using machine learning models | |
Tascikaraoglu et al. | A review of combined approaches for prediction of short-term wind speed and power | |
Kusiak et al. | A data-mining approach to monitoring wind turbines | |
CN112329339B (zh) | 一种风电场短期风速预测方法 | |
Li et al. | Ensemble offshore wind turbine power curve modelling–an integration of isolation forest, fast radial basis function neural network, and metaheuristic algorithm | |
Amarasinghe et al. | Ensemble models for solar power forecasting—a weather classification approach. | |
Houssein | Particle swarm optimization-enhanced twin support vector regression for wind speed forecasting | |
Bou-Rabee et al. | One-month-ahead wind speed forecasting using hybrid AI model for coastal locations | |
Wang et al. | Offshore wind turbine selection with a novel multi-criteria decision-making method based on Dempster-Shafer evidence theory | |
CN116070769A (zh) | 一种超短期风电场功率多步区间预测模块化方法及其设备 | |
Yu et al. | Comparison of short-term solar irradiance forecasting methods when weather conditions are complicated | |
CN112418504B (zh) | 一种基于混合变量选择优化深度信念网络风速预测方法 | |
Zhang et al. | Short-term wind power prediction based on EMD-LSTM combined model | |
Nikitha et al. | Solar PV Forecasting Using Machine Learning Models | |
CN116865248A (zh) | 一种超短期风电功率预测方法及电子设备 | |
Kumari et al. | Machine learning techniques for hourly global horizontal irradiance prediction: A case study for smart cities of India | |
Allal et al. | Machine learning solutions for renewable energy systems: Applications, challenges, limitations, and future directions | |
Patel et al. | Forecasting nonstationary wind data using adaptive min-max normalization | |
Ding et al. | Photovoltaic array power prediction model based on EEMD and PSO-KELM | |
Shetty et al. | Wind power optimization: a comparison of meta-heuristic algorithms | |
Demir et al. | Predicting The Power of a Wind Turbine with Machine Learning-Based Approaches from Wind Direction and Speed Data | |
Köksoy et al. | Improved wind power forecasting using combination methods | |
Alipour et al. | A Novel Cooperative Fuzzy Classifier for Predicting the Permissible Wind Speed Range in Wind Farms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |