CN110685857B

CN110685857B - 一种基于集成学习的山地风电机组行为预测模型

Info

Publication number: CN110685857B
Application number: CN201910983215.2A
Authority: CN
Inventors: 苏永新; 肖哲; 谭貌
Original assignee: Xiangtan University
Current assignee: Xiangtan University
Priority date: 2019-10-16
Filing date: 2019-10-16
Publication date: 2021-10-15
Anticipated expiration: 2039-10-16
Also published as: CN110685857A

Abstract

本发明公开了一种基于集成学习的山地风电机组行为预测模型，包括以下步骤：1.采用自适应阈值法确定风速功率子区间数据密度阈值进而清洗异常数据；2.定义样本矩阵，采用自适应综合过采样方法生成新的样本矩阵均匀分布不同风况。3.根据第2步生成的数据，对其进行希尔伯特‑黄变换，得到山地风电机组模型输入量的分解量；4.根据第4步的数据，确定山地风电机组模型的输入输出，选取个体学习器并采用stacking的集成学习的融合策略，训练集成得到山地风电机组行为预测模型；5.采用网格搜索法确定模型最优参数6.运行测试山地风电机组行为预测模型。本发明可以为风电机组预测性控制提供服务，维护人员能更好更高效的维护机组正常运行。

Description

一种基于集成学习的山地风电机组行为预测模型

技术领域

本发明涉及风电机组建模领域，尤其涉及一种基于集成学习的山地风电机组行为预测模型。

背景技术

随着能源问题的日益凸显，风能作为一种可再生能源，具有清洁环保等特点，已经引起世界各国的重视。目前，由于内陆山区同样具有极其丰厚的风能资源，风能资源利用已经成为了广大学者关注的新的问题。然而，与传统的海上风电场相比，山区风电场的风由于受到地形的影响，风的波动性较大，风速、风向、5秒偏航、桨距角等因素都会影响山地风电机组模型的准确性。

随着山区风电机组装机数量的不断增加，精确的山地风电机组行为预测模型一方面可以为风电机组的预测性控制提供服务，另一方面还能够优化风电场能源调度以及风电场风能与电网的交互。因此，如何准确的建立山地风电机组行为预测模型成为了风力发电领域重要的研究方向，常见的风电机组行为预测模型主要包括以下几类：机理模型是理想状态下根据风电机组结构、内部运行机制建立起来的精确数学模型；基于数学表达式的统计学方法主要是通过对历史数据的采集，建立历史数据与当前时刻数据之间的一个映射关系，进而建立风电机组行为预测模型；经典的神经网络模型主要通过采集到的历史数据通过神经网络进行训练，从而得到风电机组行为预测模型。这些方法用于建立山地风电机组行为预测模型仍然有一些不足，主要包括以下三个方面：

(1)机理模型没有考虑山地风电机组实际运行环境，模型准确性较低；

(2)由于山区风波动较大，风机状态量也会剧烈变换，不同频率的风机状态量会影响风电机组模型输出，从而影响模型的预测精度；

(3)数据在不同的风况下分布不均匀，极端风况条件下的数据较少，多数类数据训练出来的模型容易出现过拟合现象而少数类数据训练出来的模型会出现欠拟合现象。

发明内容

为了解决现有技术存在的上述问题，本发明提出一种基于集成学习的山地风电机组行为预测模型，该方法包括以下步骤：

步骤1：从风电场SCADA系统中采集一年的风机数据，采样间隔为Δt秒；数据可以表示为X(t₀)＝{X₁(t₀),X₂(t₀),...,X₈(t₀)}，X₁(t₀),X₂(t₀),...,X₈(t₀)分别为t₀时刻的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度；将采集到的数据通过密度法进行异常数据的清洗，其中密度阈值ρ₀由自适应阈值法确定；

步骤2：定义样本矩阵，将清洗后的数据根据时间规律转换成样本矩阵X”_sample，采用ADASYN(Adaptive Synthetic Oversampling，自适应综合过采样)方法生成新的样本矩阵均匀分布在不同的风况；

步骤3：将当前时刻t₀前T秒的输入量即风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度进行希尔伯特-黄变换，以上每个输入量被分解成u_a个IMF(Intrinsic Mode Function，本征模态函数)和一个余项，用u_a个IMF和余项构成的矩阵代替其原输入量；

步骤4：训练构建山地风电机组行为预测模型网络；用当前时刻t₀前T秒包含u_a个IMF和余项的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络输入，当前时刻t₀的风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络的输出。选取LSTM(Long Short-Term Memory，长短期记忆网络)、TCN(Temporal Convolutional Network，时间卷积网络)、RNN(Recurrent NeuralNetwork，循环神经网络)、GRU(Gated Recurrent Unit，门控循环单元)、SVM(SupportVector Machine，支持向量机)作为个体学习器，采用stacking的集成学习的融合策略，训练集成得到山地风电机组模型；

步骤5：采用网格搜索算法确定模型最优参数；

步骤6：运行山地风电机组行为预测模型，获取预测结果。

本发明的技术效果在于：本发明所述的是一种基于集成学习的山地风电机组行为预测模型。采用自适应综合过采样法生成新的样本数据均匀分布各个风况能够避免训练模型时的过拟合现象，从而提高预测模型精度。通过将实验的各个风机状态量的时间序列分解成一系列较平稳且具有明显周期变化的分解量，在很大程度减少不同特征信息间的干扰，使最终的模型更准确。由于集成学习在多输入多输出序列建模问题时，可获得比单一学习器更为显著优越的泛化能力，充分利用了所有的数据，能够将多个个体学习器所得到的输出结果有机的结合，防止出现过拟合现象，能够有效的提高模型准确性。

附图说明

图1为本发明建模方法的示意图。

图2为希尔伯特-黄分解示意图。

图3为本发明stacking集成学习算法的K折交叉验证过程示意图。

具体实施方式

本发明提出的基于集成学习的山地风电机组建模方法包括步骤：

步骤1：从风电场SCADA系统中采集一年的风机数据，采样间隔为Δt秒。数据可以表示为X(t₀)＝{X₁(t₀),X₂(t₀),...,X₈(t₀)}，X₁(t₀),X₂(t₀),...,X₈(t₀)分别为t₀时刻的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度。将采集到的数据通过密度法进行异常数据的清洗，其中密度阈值ρ₀由自适应阈值法确定。

具体为以下步骤：

步骤1-1：风速X₁(t)、风向X₂(t)、5秒偏航对风平均值X₃(t)、风机输出功率X₄(t)、桨距角X₅(t)、风机转子转速X₆(t)、叶片加速度X₇(t)、叶片角度X₈(t)以及时间t分别作为矩阵的列，构成矩阵X，即

X＝{X₁(t),X₂(t),...,X₈(t),t} (1)

步骤1-2：按照风速大小递增的原则对矩阵X重新排序，以固定步长v将风速划分为n个区间，再以固定步长p对功率区间划分，得到m个子区间，每个子区间的数据密度为

ρ＝n_data/(v×p) (2)

其中n_data为该子区间数据个数；

步骤1-3：每个风速区间子区间数据密度最大值记为ρ_max,i，最小值为ρ_min,i，计算每个风速区间数据密度为

ρ_i＝(ρ_max,i+ρ_min,i)/2，1≤i≤m (3)

步骤1-4：计算风速区间数据密度的平均值作为阈值，即

若最终区域数据密度ρ<ρ₀，该子区间数据所处矩阵X的行被删除；

步骤1-5：删除异常数据后。按照t大小递增的原则恢复矩阵X初始时序，重构矩阵为：

X'＝{X'₁(t),X'₂(t),...,X'₈(t)} (4)

式中X'₁(t),X'₂(t),...,X'₈(t)分别为清洗掉异常数据后的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度的时间序列，此时当前时刻t₀的数据样本为

X'(t₀)＝{X'₁(t₀),X'₂(t₀),...,X'₈(t₀)} (5)

步骤2：定义样本矩阵，将清洗后的数据根据时间规律转换成样本矩阵X”_sample，采用ADASYN采样方法生成新的样本矩阵均匀分布在不同的风况：

步骤2-1：定义8×(T+1)的样本数据矩阵X'_sample＝{X'₁(t₀-T:t₀),X'₂(t₀-T:t₀),...,X'₈(t₀-T:t₀)}，将数据转换成样本矩阵；

步骤2-2：将样本矩阵X'_sample按行顺序平铺转换成1×8*(T+1)的行向量x_sample，其中T为输入量时间长度；

步骤2-3：以固定步长v'划分风速区间，将转换后的行向量样本根据其平均风速所处区间不同划分成e个类别，每个类别的样本数分别用r₁,r₂,...,r_e表示；

步骤2-4：记样本最多类别的样本数为r_max，该类别的样本即为多数类样本，其它类别样本记为少数类样本。计算每个少数类别需要合成的样本数G_f如下式所：

G_f＝r_max-r_f(1≤f≤e-1) (6)

其中r_f为第f个少数类样本数；

步骤2-5：用欧氏距离计算属于第f个少数类的每一个样本的k个最近邻居，Δ为该样本k个邻居中属于多数类的样本数，记k个邻居中多数类所占比例z为

z＝Δ/k，z∈[0,1] (7)

步骤2-6：由式(7)到第f个少数类第x个样本k个邻居多数类所占比例z_f，x，其周围多数类的情况可以表示为

则第f个少数类第x个样本需要生成的样本数为

g_f，x＝z_f，x×G_f (9)

步骤2-7：在第f个少数类第x个样本周围k个邻居中随机选择一个属于少数类f的样本d_f，k，根据式(10)生成新样本：

s_f，x＝d_f，x+(d_f，k-d_f，x)×λ (10)

其中d_f，x为第f个少数类第x个样本，s_f，x为新样本；

步骤2-8：重复步骤2-5直到d_f，x生成的新样本数达到g_f，x，当e-1个少数类样本全生成完后，数据达到分布均衡的状态。

步骤2-9：将行向量样以8维为间隔恢复新的样本矩阵，此时样本矩阵可表示为

X'_{sample_new}＝{X'_{1_new}(t₀-T:t₀),X'_{2_new}(t₀-T:t₀),...,

X'_{8_new}(t₀-T:t₀)} (11)

其中X'_{sample_new}为新样本矩阵；

步骤2-10：X'_sample和X'_{sample_new}将构成最终的实验数据集，最终样本矩阵可表示为

X”_sample＝{X”₁(t₀-T:t₀),X”₂(t₀-T:t₀),...,X”₈(t₀-T:t₀)} (12)

其中X”_sample为样本分布均匀下的样本矩阵；

步骤3：将当前时刻t₀前T秒的输入量即风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度进行希尔伯特-黄变换，以上每个输入量被分解成u_a个IMF和一个余项，用u_a个IMF和余项构成的矩阵代替其原输入量。具体内容如下；

步骤3-1：对当前时刻的X"₁(t₀-T:t₀-1),X"₂(t₀-T:t₀-1),...,X"₈(t₀-T:t₀-1)进行集合经验模态分解，第a个风机状态量输入包含u_a个分解量x_a1(t₀-T:t₀-1)，x_a2(t₀-T:t₀-1)，……，

和一个余项r_aua(t₀-T:t₀-1),1≤a≤8，且a为整数；

步骤3-2：对第a个风机状态量的每个分解量x_a1(t₀-T:t₀-1)，x_a2(t₀-T:t₀-1)，……，

和余项

进行希尔伯特变换得到h_a1(t₀-T:t₀-1)，h_a2(t₀-T:t₀-1)，……，

和

步骤3-3：重构各个风机状态量的输入数据格式，以各个分解量和余项作为各个风机状态量的特征，即

步骤4：训练构建山地风电机组的网络。用当前时刻t₀前T秒包含u_a个IMF和余项的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络输入，当前时刻t₀的风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络的输出。选取LSTM、TCN、RNN、GRU、SVM作为个体学习器，采用stacking的集成学习的融合策略，训练集成得到山地风电机组模型：

步骤4-1：以分解后风机状态量当前时刻t₀前T秒X"₁(t₀-T:t₀-1)，X"₂(t₀-T:t₀-1),...,X"₈(t₀-T:t₀-1)为山地风电机组模型的输入，T是输入量时间步长；

步骤4-2：当前时刻t₀的风机功率X”₄(t₀)、桨距角X”₅(t₀)、风机转速X”₆(t₀)、叶片加速度X”₇(t₀)、叶片角度X”₈(t₀)即为山地风电机组模型的输出；

步骤4-3：对输入输出数据集进行归一化处理；

步骤4-4：选取LSTM、TCN、RNN、GRU、SVM作为个体学习器，分别用model₁、model₂、model₃、model₄、model₅表示。具体内容如下：

(1)LSTM：该个体学习器的每一个输入量对应一个LSTM，记为lstm₁,lstm₂,...,lstm₈，每个LSTM由3层lstm层堆叠而成，对应的输出lstm_{3_1},lstm_{3_2},...,lstm_{3_8}，将8个LSTM的输出通过融合层进行融合后再添加3层全连接层，最终的输出为model₁的输出；

(2)TCN：该个体学习器的每一个输入量对应一个TCN，记为tcn₁,tcn₂,...,tcn₈，每个TCN由6个残差模块堆叠而成，对应的输出tcn_{6_1},tcn_{6_2},...,tcn_{6_8}，将8个TCN的输出通过融合层进行融合后再添加3层全连接层，最终的输出为model₂的输出；

(3)RNN：该个体学习器的每一型输入量对应一个常规循环神经网络，记为rnn₁,rnn₂,...,rnn₈，每个RNN由3层rnn层堆叠而成，对应的输出rnn_{3_1},rnn_{3_2},...,rnn_{3_8}，将8个RNN的输出通过融合层进行融合后再添加3层全连接层，最终的输出为model₃的输出；

(4)GRU:该个体学习器的每一个输入量对应一个GRU，记为gru₁,gru₂,...,gru₈，每个GRU由3个gru层堆叠而成，对应的输出gru_{3_1},gru_{3_2},...,gru_{3_8}，将8个GRU的输出通过融合层进行融合后再添加3层全连接层，最终的输出为model₄的输出；

(5)SVM：该个体学习器的输入为数据清洗后的风机状态量，每个输入对应一个SVM，记为svm₁,svn₂,...,svm₈，通过核函数K(X)将输入输出映射到高维空间，使其变成线性回归，将8个SVM的输出通过融合层进行融合后再添加3层全连接层最终的输出为model₅；

步骤4-5：采用集成学习的思想将步骤4-4的5个个体学习器集成，具体内容如下：

(1)对第i个个体学习器进行K折交叉验证，1≤i≤5，即将训练集train_data随机分成K个子集，且每个子集大小相同，得到数据集

{train_data₁,train_data₂,...,train_data_K} (14)

(2)将数据集{train_data₁,train_data₂,...,train_data_K}中的每个子集train_data_j(1≤j≤K且j为整数)分别作为每个个体学习器的测试集，剩余的数据子集作为每个个体学习器的训练集，此时训练集的输出为a_i,1,a_i,2,...,a_i,K，测试集输出为b_i,1,b_i,2,...,b_i,K，第i个个体学习器的K个子模型集合为

{modle_i,1,modle_i,2,...model_i,K} (15)

(3)将第i个个体学习器的K个子模型训练集的输出a_i,1,a_i,2,...,a_i,K进行融合得到次级学习器训练集的一个输入A_i，将测试集的输出b_i,1,b_i,2,...,b_i,K相加求平均值得到次级学习器测试集的一个输入B_i；

步骤4-6：构建次级学习器，本发明采用的次级学习器为BP神经网络，A₁,A₂,A₃,A₄作为次级学习器训练集的输入，B₁,B₂,B₃,B₄作为次级学习器测试集的输入，进行训练得到最终的风电机组行为预测模型输出；

步骤5：采用网格搜索算法确定模型最优参数。具体步骤如下:

步骤5-1：训练模型过程中主要需要调整的参数诶学习率l、迭代次数e以及批尺寸bs，设定以上参数的选择范围和搜索步长，即可构成三维网格；

步骤5-2：按照交叉验证的方法计算不同参数组合(l,e,bs)的模型训练集准确率和测试集准确率，在保证训练集和测试集的准确率之和最大的前提下，确定了最优的参数组合为

(l_best,e_best,bs_best) (16)

其中l_best,e_best,bs_best分别为模型准确性最高下的学习率、迭代次数以及批尺寸；

步骤5-3：使用最优参数组合(l_best,e_best,bs_best)得到最优的山地风电机组行为预测模型；

步骤6：运行山地风电机组行为预测模型，获取预测结果。

将第二年的风机数据样本经过步骤3后以步骤4的数据输入形式作为网络的输入，即可输出得到次年风机状态量预测值；

本发明较佳的实施例如上所述，并发对本发明任何形式和实质上的限制，显然，任何本领域的技术人员在不脱离本发明的范围和精神的前提下，可对其做些许的修改和完善，本发明的保护范围需以权利要求书所界定为准。

Claims

1.一种基于集成学习的山地风电机组行为预测模型，其特征在于，包括以下步骤：

步骤4：训练构建山地风电机组行为预测模型网络；用当前时刻t₀前T秒包含u_a个IMF和余项的风速、风向、5秒偏航对风平均值、风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络输入，当前时刻t₀的风机输出功率、桨距角、风机转子转速、叶片加速度、叶片角度作为网络的输出；选取LSTM(Long Short-Term Memory，长短期记忆网络)、TCN(Temporal Convolutional Network，时间卷积网络)、RNN(Recurrent Neural Network，循环神经网络)、GRU(Gated Recurrent Unit，门控循环单元)、SVM(Support VectorMachine，支持向量机)作为个体学习器，采用stacking的集成学习的融合策略，训练集成得到山地风电机组模型；

步骤5：采用网格搜索算法确定模型最优参数；

步骤6：运行山地风电机组行为预测模型，获取预测结果。

2.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型，其特征在于，所述步骤1中确定区间数据密度阈值，清洗异常数据的具体内容如下：

1-1：风速X₁(t)、风向X₂(t)、5秒偏航对风平均值X₃(t)、风机输出功率X₄(t)、桨距角X₅(t)、风机转子转速X₆(t)、叶片加速度X₇(t)、叶片角度X₈(t)以及时间t分别作为矩阵的列，构成矩阵X，即

X＝{X₁(t),X₂(t),...,X₈(t),t} (1)

1-2：按照风速大小递增的原则对矩阵X重新排序，以固定步长v将风速划分为n个区间，再以固定步长p对功率区间划分，得到m个子区间，每个子区域的数据密度为

ρ＝n_data/(v×p) (2)

其中n_data为该子区间数据个数；

1-3：每个风速区间子区间数据密度最大值记为ρ_max,i，最小值为ρ_min,i，计算每个风速区间数据密度为

ρ_i＝(ρ_max,i+ρ_min,i)/2，1≤i≤m (3)

1-4：计算风速区间数据密度的平均值作为阈值，即

1-5：删除异常数据后，按照t大小递增的原则恢复矩阵X初始时序，重构矩阵为：

X'＝{X'₁(t),X'₂(t),...,X'₈(t)} (4)

X'(t₀)＝{X'₁(t₀),X'₂(t₀),...,X'₈(t₀)} (5)。

3.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型，其特征在于，所述步骤2中采用ADASYN方法生成训练样本具体内容如下：

2-1：定义8×(T+1)的样本数据矩阵X'_sample＝{X'₁(t₀-T:t₀),X'₂(t₀-T:t₀),...,X'₈(t₀-T:t₀)}，将数据转换成样本矩阵；

2-2：将样本矩阵X'_sample按行顺序平铺转换成1×8*(T+1)的行向量x_sample，其中T为输入量时间长度；

2-3：以固定步长v'划分风速区间，将转换后的行向量样本根据其平均风速所处区间不同划分成e个类别，每个类别的样本数分别用r₁,r₂,...,r_e表示；

2-4：记样本最多类别的样本数为r_max，该类别的样本即为多数类样本，其它类别样本记为少数类样本，计算每个少数类别需要合成的样本数G_f如下式所：

G_f＝r_max-r_f(1≤f≤e-1) (6)

其中r_f为第f个少数类样本数；

2-5：用欧氏距离计算属于第f个少数类的每一个样本的k个最近邻居，Δ为该样本k个邻居中属于多数类的样本数，记k个邻居中多数类所占比例z为

z＝Δ/k，z∈[0,1] (7)

2-6：由式(7)到第f个少数类第x个样本k个邻居多数类所占比例z_f，x，其周围多数类的情况可以表示为

则第f个少数类第x个样本需要生成的样本数为

g_f，x＝z_f，x×G_f (9)

2-7：在第f个少数类第x个样本周围k个邻居中随机选择一个属于少数类f的样本d_f，k，根据式(10)生成新样本：

s_f，x＝d_f，x+(d_f，k-d_f，x)×λ (10)

其中d_f，x为第f个少数类第x个样本，s_f，x为新样本；

2-8：重复步骤2-5直到d_f，x生成的新样本数达到g_f，x，当e-1个少数类样本全生成完后，数据达到分布均衡的状态；

2-9：将行向量样以8维为间隔恢复新的样本矩阵，此时样本矩阵可表示为

其中X'_{sample_new}为新样本矩阵；

2-10：X'_sample和X'_{sample_new}将构成最终的实验数据集，最终样本矩阵可表示为

其中X”_sample为样本分布均匀下的样本矩阵。

4.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型，其特征在于，所述步骤3中希尔伯特-黄变换的具体内容如下：

3-1：对当前时刻的X"₁(t₀-T:t₀-1),X"₂(t₀-T:t₀-1),...,X"₈(t₀-T:t₀-1)进行集合经验模态分解，第a个风机状态量输入包含u_a个分解量

和一个余项

1≤a≤8，且a为整数；

3-2：对第a个风机状态量的每个分解量

和余项

进行希尔伯特变换得到

和

3-3：重构各个风机状态量的输入数据格式，以各个分解量和余项作为各个风机状态量的特征，即

5.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型，其特征在于，所述步骤4训练山地风电机组行为预测模型网络的具体内容如下：

4-1：以分解后风机状态量当前时刻t₀前T秒X"₁(t₀-T:t₀-1)，X"₂(t₀-T:t₀-1),...,X"₈(t₀-T:t₀-1)为山地风电机组模型的输入，T是输入量时间步长；

4-2：当前时刻t₀的风机功率X”₄(t₀)、桨距角X”₅(t₀)、风机转速X”₆(t₀)、叶片加速度X”₇(t₀)、叶片角度X”₈(t₀)即为山地风电机组模型的输出；

4-3：对输入输出数据集进行归一化处理；

4-4：选取LSTM、TCN、RNN、GRU、SVM作为个体学习器，分别用model₁、model₂、model₃、model₄、model₅表示；具体内容如下：

4-5：采用集成学习的思想将步骤4-4的5个个体学习器集成，具体内容如下：

{train_data₁,train_data₂,...,train_data_K} (14)

(2)将数据集{train_data₁,train_data₂,...,train_data_K}中的每个子集train_data_j(1≤j≤K且j为整数)分别作为每个个体学习器的测试集，剩余的数据子集作为每个个体学习器的训练集，此时训练集的输出为a_i,1,a_i,2,...,a_i,K，测试集输出为b_i,1,b_i,2,...,b_i,K，第i个个体学习器的K个子模型集合为{modle_i,1,modle_i,2,...model_i,K} (15)

4-6：构建次级学习器，本发明采用的次级学习器为BP神经网络，A₁,A₂,A₃,A₄作为次级学习器训练集的输入，B₁,B₂,B₃,B₄作为次级学习器测试集的输入，进行训练得到最终的风电机组行为预测模型输出。

6.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型，其特征在于，所述步骤5中模型参数优化的具体内容如下：

5-1：训练模型过程中主要需要调整的参数为学习率l、迭代次数e以及批尺寸bs，设定以上参数的选择范围和搜索步长，即可构成三维网格；

5-2：按照交叉验证的方法计算不同参数组合(l,e,bs)的模型训练集准确率和测试集准确率，在保证训练集和测试集的准确率之和最大的前提下，确定了最优的参数组合为

(l_best,e_best,bs_best) (16)

5-3：使用最优参数组合(l_best,e_best,bs_best)得到最优的山地风电机组行为预测模型。

7.权利要求1所述的一种基于集成学习的山地风电机组行为预测模型，其特征在于，所述步骤6中模型运行的具体内容如下：

将第二年的风机数据样本经过步骤3后以步骤4的数据输入形式作为网络的输入，即可输出得到次年风机状态量预测值。