CN114215706B - 一种风电机组叶片开裂故障预警方法和装置 - Google Patents
一种风电机组叶片开裂故障预警方法和装置 Download PDFInfo
- Publication number
- CN114215706B CN114215706B CN202111612932.8A CN202111612932A CN114215706B CN 114215706 B CN114215706 B CN 114215706B CN 202111612932 A CN202111612932 A CN 202111612932A CN 114215706 B CN114215706 B CN 114215706B
- Authority
- CN
- China
- Prior art keywords
- data
- model
- wind
- wind turbine
- early warning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000005336 cracking Methods 0.000 title claims abstract description 34
- 238000013528 artificial neural network Methods 0.000 claims abstract description 32
- 238000007781 pre-processing Methods 0.000 claims abstract description 27
- 238000012544 monitoring process Methods 0.000 claims abstract description 15
- 238000012549 training Methods 0.000 claims description 39
- 239000013598 vector Substances 0.000 claims description 35
- 238000007637 random forest analysis Methods 0.000 claims description 24
- 238000012795 verification Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 230000009467 reduction Effects 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 238000012417 linear regression Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 238000012423 maintenance Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 15
- 230000001174 ascending effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000010248 power generation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000013210 evaluation model Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F03—MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
- F03D—WIND MOTORS
- F03D17/00—Monitoring or testing of wind motors, e.g. diagnostics
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Sustainable Development (AREA)
- Sustainable Energy (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Wind Motors (AREA)
Abstract
本发明公开了一种风电机组叶片开裂故障预警方法和装置,所述方法包括获取风力发电机组的监测实时数据;对实时数据进行数据预处理,特征重构后进入预先构建的基于深度神经网络的组合预测模型;判断是否会发生故障,根据预先设定的持续的时间阈值上限,当预测为故障的持续时间达到阈值则触发报警,本发明基于交叉熵的深度自编码器模型更好的提取与目标变量相关性强的特征,保证了变量估计的准确性,多阈值设置及判别准则设计避免了单次判断,使得预测结果更具有鲁棒性,最终实现风电机组叶片开裂故障的提前感知与预警,避免叶片开裂引起的故障停机,减少停机时长以及维护成本,具有较强的理论性与实用性。
Description
技术领域
本发明涉及一种风电机组叶片开裂故障预警方法和装置,属于风电机组故障预警技术领域。
背景技术
随着能源需求日益增长以及环境等问题日趋严重,优化能源结构、发展可再生能源迫在眉睫。风电作为技术成熟、环境友好的可再生能源,是继煤电、水电之后的第三大电力,也是最经济、最环保的绿色电力之一。因此近年来,全球范围内对风力发电的研究投资热度较高,风机的装机容量也在逐年攀升。随着风电行业的快速发展,风电场的运维问题也逐渐引起了风电运营商的重视。
风机的运维问题主要来源于风机的高故障率,高故障率的原因:一是风电机组是极其复杂的强耦合机电系统,任一部件出现异常都可能导致机组停机,风机整机性能降低;二是风电机组受极端天气影响,风机的运行环境越来越恶劣,许多零部件会因天气原因受损失效。风机的高故障率会导致风机频繁停机,发电效率降低,从而造成较大经济损失。
当前针对风机叶片的监控主要是通过对SCADA系统采集的数据进行分析,从而诊断是否发生故障。然而,当前的SCADA系统采集的数据并不包括叶片的状态参数,不能直接的反应出叶片的状态。因此,如何对SCADA系统采集的数据进行有效的分析,做到对风机叶片状况的诊断,对提升风机的发电效益以及安全性能有巨大的贡献。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种风电机组叶片开裂故障预警方法和装置,该方法能够实现风电机组叶片开裂故障的提前感知、主动预警,避免风机叶片开裂故障引起故障停机,减少运营维护的成本,提高了系统的可靠性。
为达到上述目的,本发明是采用下述技术方案实现的:
第一方面,本发明提供了一种风电机组叶片开裂故障预警方法,包括:
获取风力发电机组的监测实时数据;
对实时数据进行数据预处理,特征重构后进入预先构建的基于深度神经网络的组合预测模型;
判断是否会发生故障,根据预先设定的持续的时间阈值上限,当预测为故障的持续时间达到阈值则触发报警。
进一步的,所述基于深度神经网络的组合预测模型的构建,包括:
获取预先收集并记录的不同风电场多台风力发电机组的监测控制和数据采集系统中的数据;
选择风机叶片是否开裂作为目标变量,收集的相关特征变量作为自变量,构造初始样本集合;
对初始样本集合中未发生过叶片开裂的数据进行数据预处理,其中,数据预处理包括不良数据的识别和不良数据的修正;
对预处理后的数据进行特征提取,筛选出与目标变量相关性强的低维特征向量;
将低维特征向量与目标变量成的新的训练集输入变量估计模型进行模型训练,其中,所述变量估计模型选取softmax分类器;
对选取后的变量估计模型进行训练微调;
基于交叉熵损失函数进一步进行特征向量的选择,获取最终的特征向量;
将最终的特征向量作为随机森林是输入,训练得出对应的随机森林;
将随机森林的输出与基于softmax的深度自编码器模型的输出进行加权融合,得到最终的基于深度神经网络的组合预测模型。
进一步的,所述获取预先收集并记录的不同风电场多台风力发电机组的监测控制和数据采集系统中的数据中,选择的数据所在的机组包含一周内发生故障和一周内未发生故障的两部分数据。
进一步的,对初始样本集合中未发生过叶片开裂的数据进行数据预处理,包括:
通过判断数据值域范围进行判断,判断的条件包括:对于风速数值大于机组切出风速或者小于切入风速,功率大于0的数据;风速、风机转速、功率以及温度等任意一个小于等于0的数据;功率大于1.2倍额定数据;满足上述条件时,该数据判断为孤立异常点,予以剔除;
采用基于密度的聚类算法和线性回归模型结合对风电场的数据进一步的识别出不良数据,并予以剔除;
对剔除的数据以及采集的SCADA系统中缺失的数据进行插补,插补的方法为采用BPNN与LS-SVM组合模型来插补,选用其他正常时候的数据作为训练数据训练组合模型,选用变量插补位置前1小时的数据作为组合模型的输入,模型的输出作为当前时刻插补值。
进一步的,对预处理后的数据进行特征提取,筛选出与目标变量相关性强的低维特征向量,包括:
筛选出与目标变量相关性强的特征,基于SCADA系统数据集的所有其他变量,选取深度自编码模型对SCADA数据进行数据降维以及特征选取,将高维SCADA信息h(0)转换为与目标变量相关性高的低维特征向量h(2)。
进一步的,基于交叉熵损失函数进一步进行特征向量的选择,获取最终的特征向量,包括:
将低维特征向量h(2)中第i个特征用来表示,具体表示如下所示:
式(3)中中d(2)表示降维后h(2)的维度;
设定d(2)维交叉熵数组为J,设定最优特征子集S=h(2),先计算h(2)在深度自编码器模型中的交叉熵损失函数从i=1开始,令/>计算出S在模型中的/>然后将计算出的/>记录到数组J[i],直到i=d(2),停止循环;
将交叉熵数组J中的每一个元素与作差得J[i],具体表示如式子(4)所示:
式子(4)中i=1,2,…d(2);
假设选取k个特征子集,设定k维数组Q用来记录选取的特征,将JΔ数组按升序排列,并记录对应的JΔ数组升序排列前的序号到数组Q中,并且根据序号选择特征子集S,具体表示如式(5)所示:
进一步的,所述将随机森林的输出与基于softmax的深度自编码器模型的输出进行加权融合,得到最终的基于深度神经网络的组合预测模型,是通过投票机制得到最终的预测结果具体表示如式(6)所示:
式(6)中表示由随机森林预测达到的概率,/>表示由深度神经网络预测达到的概率,w1,w2为对应的权重。
进一步的,还包括对最终的基于深度神经网络的组合预测模型进行算法验证,包括:
以若干机组数据作为训练样本,其他机组作为验证样本;训练完成模型后输入验证样本,得到是否会发生故障;并以精准率、召回率、Roc曲线、Auc以及F1 score来评价模型的精度。
进一步的,所述对实时数据进行数据预处理,特征重构的方法与构建基于深度神经网络的组合预测模型时,对数据的处理方法相同。
第二方面,本发明提供一种风电机组叶片开裂故障预警装置,包括:
获取单元,用于获取风力发电机组的监测实时数据;
处理单元,用于对实时数据进行数据预处理,特征重构后进入预先构建的基于深度神经网络的组合预测模型;
判断单元,用于判断是否会发生故障,根据预先设定的持续的时间阈值上限,当预测为故障的持续时间达到阈值则触发报警。
与现有技术相比,本发明所达到的有益效果:
1)针对风电机组运行环境,采集的SCADA数据存在大量的噪声数据,设计了数据预处理流程,为精准的预警提供了数据基础。
2)针对风电机组SCADA系统的其他变量存在大量的针对风电机组叶片开裂故障预警的冗余信息以及各个特征变量之间具有复杂的耦合关系,设计了基于交叉熵的深度自编码器模型对特征变量降维,提取与目标变量相关性强的特征。提高了预警的准确性。
3)通过随机森林和深度神经网络相结合,进行两次独立判断,并设计投票机制确定最终的预警结果,提高了预警的准确性。
4)设计了单位时间故障预警次数限制,减少了数据波动引起的误报,保证了预警的准确性。
5)本发明为针对SCADA系统采集数据对风电机组叶片开裂故障预警的方法,该流程对有SCADA系统的所有风电机组均适用,具有扩展性,同时成本低,效率高。
附图说明
图1是本发明的风电机组叶片故障预警方法流程图;
图2是本发明实施例中收集数据预处理前的数据图;
图3是本发明实施例中收集数据预处理后的数据图;
图4是本发明选取的深度自编码示意图;
图5是本发明模型的ROC曲线图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例1
本实施例介绍一种风电机组叶片开裂故障预警方法和装置,包括:
获取风力发电机组的监测实时数据;
对实时数据进行数据预处理,特征重构后进入预先构建的基于深度神经网络的组合预测模型;
判断是否会发生故障,根据预先设定的持续的时间阈值上限,当预测为故障的持续时间达到阈值则触发报警。
如图1所示,本实施例提供的风电机组叶片开裂故障预警方法和装置,其应用过程具体涉及如下步骤:
步骤1:进行数据集的收集、选择和标记:收集多台风力发电机组的SCADA系统中的数据,包括风速、功率、转速以及风机状态等数据并记录,选取的风力发电机有些曾发生过叶片开裂故障,选择风机叶片是否开裂作为目标变量y,与风机叶片开裂相关的变量作为相关变量x,构造初始样本集合D,具体表示如下:
D={(x1,y1),(x2,y2),(x3,y3),…,(xi,yi),…}#(1)
式(1)中xi表示样本i的自变量,xi的具体表示如下:
式(2)中表示样本i的第d个特征。
步骤2:离线训练阶段:针对初始样本集合中正常状态的数据设计数据预处理流程,数据的预处理步骤包括不良数据的识别和不良数据的修正;
步骤3:进行特征提取:筛选出与目标标量相关性强的特征,基于SCADA系统数据集的所有其他变量,选取深度自编码模型对SCADA数据进行数据降维以及特征选取;
步骤4:训练集重构,并进行变量评估模型的选取:将降维后特征向量h(2)与目标变量y构成的新的训练集作为变量估计模型的输入进行模型训练,选取softmax分类器作为变量估计模型;
步骤5:对选取后的变量估计模型进行训练微调;
步骤6:采用交叉熵损失函数进一步进行特征向量的选择;
步骤7:将选取的特征向量作为随机森林是输入,训练得出对应的随机森林;
步骤8:将随机森林的输出与深度神经网络输出进行加权融合,得到最终的基于深度神经网络的组合预测模型;
步骤9:算法验证:以若干机组数据作为训练样本,其他机组作为验证样本;训练完成模型后输入验证样本,得到预测的故障概率;以精准率、召回率以及F1来评价模型的精度;
步骤10:进行在线应用阶段
步骤11:对实时数据经过相同的数据预处理,特征重构后进入模型,得到故障预测概率,设定持续的时间阈值上限,当预测为故障的持续时间达到阈值则触发报警。
所述步骤(2)中,离线训练的预处理流程包括以下步骤:
a)离群数据点通常是由传感器异常导致的记录错误,通过判断数据值域范围进行判断,判断的条件包括:对于风速数值大于机组切出风速或者小于切入风速,功率大于0的数据;风速、风机转速、功率以及温度等任意一个小于等于0的数据;功率大于1.2倍额定数据;满足上述条件时,该数据判断为孤立异常点,予以剔除;
b)采用DBSCAN聚类算法和线性回归模型结合对风电场的数据进一步的识别出不良数据。并予以剔除;其中DBSCAN聚类算法分为以下步骤:
首先任意选取一个点,然后找到这个点距离小于等于Eps的所有点。如果在Eps之内的数据点小于MinPts,那么这个点被标记为噪声点。如果距离在Eps之内的数据点大于MinPts,则这个点被标记为核心样本点,并被分配一个新的簇标签。
然后该访问点的所有邻居(距离在Eps以内)。如果他们还没有被分配一个簇,那么将刚创建的新簇标签分配给他们。如果他们是核心样本,那么久一次访问其邻居,一次类推。簇逐渐增大,直到在簇的Eps距离内没有更多的核心样本位置
最后选取另外一个尚未被访问过的点,并重复相同的过程。
通过线性模型来进行异常数据识别主要是通过多项式回归模型学习到一个通过属性来进行预测的函数如式(3)所示:
y'=β0+β1x+β2x2+…+βnxn+ε#(3)
式(3)x为特征属性,y'为预测值,ε为随机误差。
设定目标函数为式(4)所示:
J=y′-y#(4)
通过设定阈值C为-1.1,然后通过判别准则进行判断数据是否为异常点,从而实现数据的清洗作用。判别准则的步骤如下:
当数据点i的预测误差大于该数据点i的1.5倍上限,即J≥-1.5C时,判定为异常值,标记并剔除。当数据点i的预测误差小于该数据点i的上限,即J≤C时,判定为异常值,标记并剔除。
c)为保证时间的连续性,对剔除的数据以及采集的SCADA系统中缺失的数据进行插补,插补的方法为采用BPNN与LS-SVM组合模型来插补,选用其他正常时候的数据作为训练数据训练组合模型,选用变量插补位置前1小时的数据作为组合模型的输入,模型的输出作为当前时刻插补值;
所述步骤(3)中,通过以下的步骤构造深度自编码模型:
a)根据步骤2预处理后的数据作为自编码器模型的训练集数据集;
b)将训练集作为第一个自编码器的输入,将输入映射到隐藏层得到一阶特征h(1),映射的过程如下:
h(1)=σ(W1·x+b1)#(5)
式(5)中x∈Rd为d维输入变量;为d(1)维隐藏层特征表达式;W1是d(1)×d阶编码权值矩阵,b1是d(1)阶偏置向量;σ(·)函数为编码非线性sigmoid型传递函数。
将一阶特征解码重构到原来的输入得到解码的过程如下:
式(6)中为d维重构变量,W2是d×d(1)阶编码权值矩阵,b2是d阶偏置向量;σ(·)函数为解码非线性sigmoid型传递函数。
通过最小化重构变量与输入变量的误差调整网络模型的参数;
c)将一阶编码特征h(1)作为第二个编码器的输入,把第二个编码器的二阶特征h(2)进行解码得到重构变量通过最小化h(1)与/>的误差来调节第二个编码器的参数;
d)从而得到具有输入层、多重隐藏层和输出层的对称深度神经网络模型;
所述步骤(6)中选取softmax分类器作为变量估计模型通过交叉熵损失函数进一步的进行特征的选取的步骤包括:
a)将步骤3中二阶编码特征h(2)中第i个特征用来表示,具体表示如下所示:
式(7)中中d(2)表示降维后h(2)的维度。
设定d(2)维交叉熵数组为J,设定最优特征子集S=h(2),先计算h(2)在深度自编码器模型中的交叉熵损失函数从i=1开始,令/>计算出S在模型中的/>然后将计算出的/>记录到数组J[i]。直到i=d(2),停止循环。
b)将交叉熵数组J中的每一个元素与分别作差得JΔ[i],具体表示如式子(8)所示:
式子(6)中i=1,2,…d(2)。
c)假设选取k个特征子集,设定k维数组Q用来记录选取的特征。将JΔ数组按升序排列,并记录对应的JΔ数组升序排列前的序号到数组Q中,并且根据序号选择特征子集S,具体表示如式(9)所示:
所述步骤(8)中,采用随机森林和深度神经网络相结合形成组合预测模型是通过投票机制得到最终的预测结果具体表示如式(10)所示:
式子(10)中表示由随机森林预测达到的概率,/>表示由深度神经网络预测达到的概率,w1,w2为对应的权重。
所述步骤(11)中,结合上述得到的最终预测结果,附加单位时间故障超过限制次数才能触发预警,进一步提高预警的准确性。
实施例2
针对不同风电场多个发生过叶片开裂故障的风电机组进行故障预警。
1)进行数据集的收集、选择和标记:针对不同风电场多台风电机组采集多组数据样本,每个数据样本包括10min内采集的450条数据,每条数据包括75个不同的运行参数。所述的多台风电机组包括曾发生过叶片开裂和没有发生过叶片开裂风电机组。数据集具体变量如表1所示:
表1风电机组风机叶片开裂数据集目标变量及相关变量。
2)数据预处理:针对采集的原始数据做出散点图如图2所示,采用DBSCAN聚类算法和线性回归模型结合对风电场的数据进一步的识别出不良数据得出处理后的数据散点图如图3所示。
3)进行特征提取与训练集重构并进行变量估计模型选取:选取基于交叉熵的深度自编码器模型进行特征提取的模型达到训练集重构,选取softmax分类器作为变量估计模型;深度自编码器原理图如图4所示。
4)构建模型:使用随机深林和深度神经网络,以构建的特征作为输入量,以故障和正常标签作为输出目标,进行二分类有监督学习,训练构建的模型。
5)设置阈值:设值1小时内超过4次故障判定,则报警提示风电机组叶片开裂故障。
6)算法验证:若干机组数据作为训练样本,其他机组作为验证样本;训练完成模型后输入验证样本,得到预测的故障概率;以精准率、召回率以及F1来评价模型的精度;具体方法如下:
设定以故障概率0.3为临界点,大于0.3的样本标记为风电机组风机叶片故障,小于等于0.3标记为风电机组风机叶片正常。
召回率R:
精准率P:
本发明通过Roc曲线以及Auc的值判断模型的性能好坏。Roc曲线如图5所示。Auc计算得到为0.85。本发明模型的F1计算得到为0.76。相比其他模型有较好的提升。
实施例3
本实施例提供一种风电机组叶片开裂故障预警装置,包括:
获取单元,用于获取风力发电机组的监测实时数据;
处理单元,用于对实时数据进行数据预处理,特征重构后进入预先构建的基于深度神经网络的组合预测模型;
判断单元,用于判断是否会发生故障,根据预先设定的持续的时间阈值上限,当预测为故障的持续时间达到阈值则触发报警。
所述基于深度神经网络的组合预测模型的构建包括:
步骤1:进行数据集的收集、选择和标记:收集并记录不同风电场多台风力发电机组的监测控制和数据采集(Supervisory Control and Data Acquisition,简称SCADA)系统中的数据,包括风速、功率、转速以及风机状态等数据。选取的风力发电机组中有些曾发生过叶片开裂故障,选择风机叶片是否开裂作为目标变量y,收集的相关特征变量作为自变量x,构造初始样本集合D,具体表示如式(1)所示:
D={(x1,y1),(x2,y),(x3,y3),…,(xi,yi),…} #(1)
式(1)中xi表示样本i的自变量,xi的具体表示如式(2)所示:
式(2)中表示样本i的第d个特征。
步骤2:离线训练阶段:针对初始样本集合中未发生过叶片开裂的数据设计数据预处理流程,数据的预处理步骤包括不良数据的识别和不良数据的修正;
步骤3:进行特征提取:筛选出与目标变量相关性强的特征,基于SCADA系统数据集的所有其他变量,选取深度自编码模型对SCADA数据进行数据降维以及特征选取,将高维SCADA信息h(0)转换为与目标变量相关性高的低维特征向量h(2);
步骤4:训练集重构,并进行变量评估模型的选取:将降维后特征向量h(2)与目标变量y构成的新的训练集作为变量估计模型的输入进行模型训练,选取softmax分类器作为变量估计模型;
步骤5:对选取后的变量估计模型进行训练微调;
步骤6:采用交叉熵损失函数进一步进行特征向量的选择;
步骤7:将最终选取的特征向量作为随机森林是输入,训练得出对应的随机森林;
步骤8:将随机森林的输出与基于softmax的深度自编码器模型的输出进行加权融合,得到最终的基于深度神经网络的组合预测模型。
其中,所述获取预先收集并记录的不同风电场多台风力发电机组的监测控制和数据采集系统中的数据中,选择的数据所在的机组包含一周内发生故障和一周内未发生故障的两部分数据。
其中,对初始样本集合中未发生过叶片开裂的数据进行数据预处理,包括:
通过判断数据值域范围进行判断,判断的条件包括:对于风速数值大于机组切出风速或者小于切入风速,功率大于0的数据;风速、风机转速、功率以及温度等任意一个小于等于0的数据;功率大于1.2倍额定数据;满足上述条件时,该数据判断为孤立异常点,予以剔除;
采用基于密度的聚类算法和线性回归模型结合对风电场的数据进一步的识别出不良数据,并予以剔除;
对剔除的数据以及采集的SCADA系统中缺失的数据进行插补,插补的方法为采用BPNN与LS-SVM组合模型来插补,选用其他正常时候的数据作为训练数据训练组合模型,选用变量插补位置前1小时的数据作为组合模型的输入,模型的输出作为当前时刻插补值。
其中,对预处理后的数据进行特征提取,筛选出与目标变量相关性强的低维特征向量,包括:
筛选出与目标变量相关性强的特征,基于SCADA系统数据集的所有其他变量,选取深度自编码模型对SCADA数据进行数据降维以及特征选取,将高维SCADA信息h(0)转换为与目标变量相关性高的低维特征向量h(2)。
其中,基于交叉熵损失函数进一步进行特征向量的选择,获取最终的特征向量,包括:
将低维特征向量h(2)中第i个特征用来表示,具体表示如下所示:
式(3)中中d(2)表示降维后h(2)的维度;
设定d(2)维交叉熵数组为J,设定最优特征子集S=h(2),先计算h(2)在深度自编码器模型中的交叉熵损失函数从i=1开始,令/>计算出S在模型中的/>然后将计算出的/>记录到数组J[i],直到i=d(2),停止循环;
将交叉熵数组J中的每一个元素与作差得J[i],具体表示如式子(4)所示:
式子(4)中i=1,2,…d(2);
假设选取k个特征子集,设定k维数组Q用来记录选取的特征,将JΔ数组按升序排列,并记录对应的JΔ数组升序排列前的序号到数组Q中,并且根据序号选择特征子集S,具体表示如式(5)所示:
其中,所述将随机森林的输出与基于softmax的深度自编码器模型的输出进行加权融合,得到最终的基于深度神经网络的组合预测模型,是通过投票机制得到最终的预测结果具体表示如式(6)所示:
式(6)中表示由随机森林预测达到的概率,/>表示由深度神经网络预测达到的概率,w1,w2为对应的权重。
其中,还包括对最终的基于深度神经网络的组合预测模型进行算法验证,包括:
以若干机组数据作为训练样本,其他机组作为验证样本;训练完成模型后输入验证样本,得到是否会发生故障;并以精准率、召回率、Roc曲线、Auc以及F1 score来评价模型的精度。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (8)
1.一种风电机组叶片开裂故障预警方法,其特征在于,包括:
获取风力发电机组的监测实时数据;
对实时数据进行数据预处理,特征重构后进入预先构建的基于深度神经网络的组合预测模型;
判断是否会发生故障,根据预先设定的持续的时间阈值上限,当预测为故障的持续时间达到阈值则触发报警;
所述基于深度神经网络的组合预测模型的构建,包括:
获取预先收集并记录的不同风电场多台风力发电机组的监测控制和数据采集系统中的数据;
选择风机叶片是否开裂作为目标变量,收集的相关特征变量作为自变量,构造初始样本集合;
对初始样本集合中未发生过叶片开裂的数据进行数据预处理,其中,数据预处理包括不良数据的识别和不良数据的修正;
对预处理后的数据进行特征提取,筛选出与目标变量相关性强的低维特征向量;
将低维特征向量与目标变量构成的新的训练集输入变量估计模型进行模型训练,其中,所述变量估计模型选取softmax分类器;
对选取后的变量估计模型进行训练微调;
基于交叉熵损失函数进一步进行特征向量的选择,获取最终的特征向量;
将最终的特征向量作为随机森林的输入,训练得出对应的随机森林;
将随机森林的输出与基于softmax的深度自编码器模型的输出进行加权融合,得到最终的基于深度神经网络的组合预测模型。
2.根据权利要求1所述的风电机组叶片开裂故障预警方法,其特征在于:所述获取预先收集并记录的不同风电场多台风力发电机组的监测控制和数据采集系统中的数据中,选择的数据所在的机组包含一周内发生故障和一周内未发生故障的两部分数据。
3.根据权利要求1所述的风电机组叶片开裂故障预警方法,其特征在于:对初始样本集合中未发生过叶片开裂的数据进行数据预处理,包括:
通过判断数据值域范围进行判断,判断的条件包括:对于风速数值大于机组切出风速或者小于切入风速,功率大于0的数据;风速、风机转速、功率以及温度等任意一个小于等于0的数据;功率大于1.2倍额定数据;满足上述条件时,该数据判断为孤立异常点,予以剔除;
采用基于密度的聚类算法和线性回归模型结合对风电场的数据进一步的识别出不良数据,并予以剔除;
对剔除的数据以及采集的SCADA系统中缺失的数据进行插补,插补的方法为采用BPNN与LS-SVM组合模型来插补,选用其他正常时候的数据作为训练数据训练组合模型,选用变量插补位置前1小时的数据作为组合模型的输入,模型的输出作为当前时刻插补值。
4.根据权利要求3所述的风电机组叶片开裂故障预警方法,其特征在于:对预处理后的数据进行特征提取,筛选出与目标变量相关性强的低维特征向量,包括:
筛选出与目标变量相关性强的特征,基于SCADA系统数据集的所有其他变量,选取深度自编码模型对SCADA数据进行数据降维以及特征选取,将高维SCADA信息转换为与目标变量相关性高的低维特征向量/>。
5.根据权利要求1所述的风电机组叶片开裂故障预警方法,其特征在于:
所述将随机森林的输出与基于softmax的深度自编码器模型的输出进行加权融合,得到最终的基于深度神经网络的组合预测模型,是通过投票机制得到最终的预测结果,具体表示如式(6)所示:
式(6)中表示由随机森林预测达到的概率,/>表示由深度神经网络预测达到的概率,为对应的权重。
6.根据权利要求1所述的风电机组叶片开裂故障预警方法,其特征在于:还包括对最终的基于深度神经网络的组合预测模型进行算法验证,包括:
以若干机组数据作为训练样本,其他机组作为验证样本;训练完成模型后输入验证样本,得到是否会发生故障;并以精准率、召回率、Roc曲线、Auc以及F1 score来评价模型的精度。
7.根据权利要求1所述的风电机组叶片开裂故障预警方法,其特征在于:所述对实时数据进行数据预处理,特征重构的方法与构建基于深度神经网络的组合预测模型时,对数据的处理方法相同。
8.一种风电机组叶片开裂故障预警装置,其特征在于,包括:
获取单元,用于获取风力发电机组的监测实时数据;
处理单元,用于对实时数据进行数据预处理,特征重构后进入预先构建的基于深度神经网络的组合预测模型;
判断单元,用于判断是否会发生故障,根据预先设定的持续的时间阈值上限,当预测为故障的持续时间达到阈值则触发报警;
所述处理单元中,基于深度神经网络的组合预测模型的构建,包括:
获取预先收集并记录的不同风电场多台风力发电机组的监测控制和数据采集系统中的数据;
选择风机叶片是否开裂作为目标变量,收集的相关特征变量作为自变量,构造初始样本集合;
对初始样本集合中未发生过叶片开裂的数据进行数据预处理,其中,数据预处理包括不良数据的识别和不良数据的修正;
对预处理后的数据进行特征提取,筛选出与目标变量相关性强的低维特征向量;
将低维特征向量与目标变量构成的新的训练集输入变量估计模型进行模型训练,其中,所述变量估计模型选取softmax分类器;
对选取后的变量估计模型进行训练微调;
基于交叉熵损失函数进一步进行特征向量的选择,获取最终的特征向量;
将最终的特征向量作为随机森林的输入,训练得出对应的随机森林;
将随机森林的输出与基于softmax的深度自编码器模型的输出进行加权融合,得到最终的基于深度神经网络的组合预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111612932.8A CN114215706B (zh) | 2021-12-27 | 2021-12-27 | 一种风电机组叶片开裂故障预警方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111612932.8A CN114215706B (zh) | 2021-12-27 | 2021-12-27 | 一种风电机组叶片开裂故障预警方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114215706A CN114215706A (zh) | 2022-03-22 |
CN114215706B true CN114215706B (zh) | 2024-02-20 |
Family
ID=80706088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111612932.8A Active CN114215706B (zh) | 2021-12-27 | 2021-12-27 | 一种风电机组叶片开裂故障预警方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114215706B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114992063B (zh) * | 2022-05-06 | 2023-05-16 | 国能信控互联技术有限公司 | 一种自动化风机叶片故障检测方法及系统 |
CN117054104B (zh) * | 2023-08-15 | 2024-02-06 | 广州天马集团天马摩托车有限公司 | 一种摩托车发动机性能测试平台及系统 |
CN116910570B (zh) * | 2023-09-13 | 2023-12-15 | 华能新能源股份有限公司山西分公司 | 一种基于大数据的风电机组故障监测预警方法及系统 |
CN117435906B (zh) * | 2023-12-18 | 2024-03-12 | 湖南行必达网联科技有限公司 | 基于交叉熵的新能源汽车配置特征选择方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104995402A (zh) * | 2013-02-14 | 2015-10-21 | 维斯塔斯风力系统集团公司 | 检测叶片结构异常 |
CN108087210A (zh) * | 2017-12-19 | 2018-05-29 | 北京金风科创风电设备有限公司 | 风力发电机组叶片异常识别方法及装置 |
CN108240303A (zh) * | 2016-12-26 | 2018-07-03 | 北京金风科创风电设备有限公司 | 风力发电机风向标故障冗余运行方法和系统 |
CN112035716A (zh) * | 2020-08-21 | 2020-12-04 | 华风数据(深圳)有限公司 | 基于XGBoost算法的风机发电机故障监测与诊断方法 |
WO2021007812A1 (zh) * | 2019-07-17 | 2021-01-21 | 深圳大学 | 一种深度神经网络超参数优化方法、电子设备及存储介质 |
CN112733283A (zh) * | 2020-12-21 | 2021-04-30 | 北京华能新锐控制技术有限公司 | 一种风电机组部件故障预测方法 |
CN112834211A (zh) * | 2020-12-31 | 2021-05-25 | 江苏国科智能电气有限公司 | 一种风电机组传动系统故障预警方法 |
CN113719425A (zh) * | 2021-05-14 | 2021-11-30 | 北京智慧空间科技有限责任公司 | 一种风机叶片故障预测方法、系统及存储介质 |
-
2021
- 2021-12-27 CN CN202111612932.8A patent/CN114215706B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104995402A (zh) * | 2013-02-14 | 2015-10-21 | 维斯塔斯风力系统集团公司 | 检测叶片结构异常 |
CN108240303A (zh) * | 2016-12-26 | 2018-07-03 | 北京金风科创风电设备有限公司 | 风力发电机风向标故障冗余运行方法和系统 |
CN108087210A (zh) * | 2017-12-19 | 2018-05-29 | 北京金风科创风电设备有限公司 | 风力发电机组叶片异常识别方法及装置 |
WO2021007812A1 (zh) * | 2019-07-17 | 2021-01-21 | 深圳大学 | 一种深度神经网络超参数优化方法、电子设备及存储介质 |
CN112035716A (zh) * | 2020-08-21 | 2020-12-04 | 华风数据(深圳)有限公司 | 基于XGBoost算法的风机发电机故障监测与诊断方法 |
CN112733283A (zh) * | 2020-12-21 | 2021-04-30 | 北京华能新锐控制技术有限公司 | 一种风电机组部件故障预测方法 |
CN112834211A (zh) * | 2020-12-31 | 2021-05-25 | 江苏国科智能电气有限公司 | 一种风电机组传动系统故障预警方法 |
CN113719425A (zh) * | 2021-05-14 | 2021-11-30 | 北京智慧空间科技有限责任公司 | 一种风机叶片故障预测方法、系统及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于深度神经网络的风电机组故障识别;程浩;《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114215706A (zh) | 2022-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114215706B (zh) | 一种风电机组叶片开裂故障预警方法和装置 | |
Zhang et al. | Anomaly detection and diagnosis for wind turbines using long short-term memory-based stacked denoising autoencoders and XGBoost | |
CN111237134B (zh) | 一种基于GRA-LSTM-stacking模型的海上双馈风力发电机故障诊断方法 | |
Liu et al. | Intelligent wind turbine blade icing detection using supervisory control and data acquisition data and ensemble deep learning | |
CN111539553B (zh) | 基于svr算法和偏峰度的风电机组发电机故障预警方法 | |
CN111537219B (zh) | 一种基于温度参数的风机齿轮箱性能检测与健康评估方法 | |
Yang et al. | Fault detection of wind turbine generator bearing using attention-based neural networks and voting-based strategy | |
CN111415070A (zh) | 一种基于scada数据的风电机组齿轮箱油温过温故障预警方法 | |
Ramirez et al. | Alarms management by supervisory control and data acquisition system for wind turbines | |
Yang et al. | Fault early warning of wind turbine gearbox based on multi‐input support vector regression and improved ant lion optimization | |
CN114370380A (zh) | 一种计及气象因素的风电机组故障诊断方法 | |
de Sá et al. | Wind turbine fault detection: a semi-supervised learning approach with automatic evolutionary feature selection | |
CN115294671A (zh) | 一种空压机出口压力预测方法和预测系统 | |
Jin et al. | Condition monitoring of wind turbine generator based on transfer learning and one-class classifier | |
CN111814849B (zh) | 一种基于da-rnn的风电机组关键组件故障预警方法 | |
Zhao et al. | An abnormal data processing method based on an ensemble algorithm for early warning of wind turbine failure | |
CN113435228A (zh) | 一种基于振动信号建模的电动机轴承寿命预测与分析方法 | |
Rashid et al. | Anomaly Detection of Wind Turbine Gearbox based on SCADA Temperature Data using Machine Learning | |
CN114065618A (zh) | 一种基于微分进化的参数模型拟合风机功率曲线的方法 | |
Wei et al. | Wind turbine pitch system condition monitoring based on performance curves in multiple states | |
CN113989555A (zh) | 一种基于随机森林算法预警风机偏航故障的应用方法 | |
Song et al. | Anomaly detection of wind turbine generator based on temporal information | |
CN114154567A (zh) | 一种基于机器学习的风电场站运行数据异常识别方法 | |
Encalada-Dávila et al. | Wind turbine multi-fault detection based on SCADA data via an AutoEncoder | |
Qian et al. | A weighted kNN fault detection based on multistep index and dynamic neighborhood scale under complex working conditions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information |
Address after: 210003, 66 new model street, Gulou District, Jiangsu, Nanjing Applicant after: NANJING University OF POSTS AND TELECOMMUNICATIONS Address before: 210046 No. 9 Wenyuan Road, Qixia District, Nanjing, Jiangsu Province Applicant before: NANJING University OF POSTS AND TELECOMMUNICATIONS |
|
CB02 | Change of applicant information | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |