CN113361186A - 一种基于完全数据风电机组故障诊断方法 - Google Patents

一种基于完全数据风电机组故障诊断方法 Download PDF

Info

Publication number
CN113361186A
CN113361186A CN202110467308.7A CN202110467308A CN113361186A CN 113361186 A CN113361186 A CN 113361186A CN 202110467308 A CN202110467308 A CN 202110467308A CN 113361186 A CN113361186 A CN 113361186A
Authority
CN
China
Prior art keywords
data
fault
wind turbine
turbine generator
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110467308.7A
Other languages
English (en)
Other versions
CN113361186B (zh
Inventor
王小利
刘宜荣
王桂烁
蒋保臣
吕杰超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202110467308.7A priority Critical patent/CN113361186B/zh
Publication of CN113361186A publication Critical patent/CN113361186A/zh
Application granted granted Critical
Publication of CN113361186B publication Critical patent/CN113361186B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/06Wind turbines or wind farms
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/70Wind energy
    • Y02E10/72Wind turbines with rotation axis in wind direction

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Wind Motors (AREA)

Abstract

本发明涉及一种基于完全数据风电机组故障诊断方法,其解决了如何准确地诊断和预估风电机组的故障及其发展趋势,及早发现潜在故障征兆的技术问题。本发明从风场SCADA系统数据提纯出健康数据样本,使用经过贝叶斯优化算法BOA调参的极端梯度提升决策树XGBoost算法搭建了故障诊断模型,完成了从SCADA系统监测数据到故障特征的直观映射,根据故障的特征监测参数权重,设计了一种基于多特征监测参数信息融合的风电机组状态监测方案。该方案将不同来源、不同尺度的特征参数根据特征权重融合成机组运行状态指标,通过实时监测机组运行状态指标是否超过故障阈值来判断机组是否出现早期故障特征。

Description

一种基于完全数据风电机组故障诊断方法
技术领域
本发明涉及风力发电技术领域,具体而言,涉及一种基于完全数据风电机组故障诊断方法。
背景技术
近年来,随着全球生态环境的持续恶化以及化石燃料的逐渐枯竭,利用风能进行发电逐渐成为世界各国取代传统发电方式的一种新型发电方式。由于机组多安装在高山、荒野、海岛甚至海上等风能资源丰富的偏远地区,常年受极端温差的影响和强阵风的无序冲击,导致其故障率远高于其他机电设备。传统的风电场机组维护策略高度依赖定期常规检修和事后维修,仅能处理部分风场监控系统警告,加之调配备件周期长,导致大型风电场的故障维护成本居高不下,对风电场运维经济性影响巨大。风电机组结构的复杂性、运行工况的多变性以及不同部件之间的耦合性,都使得其故障频发,甚至出现连锁现象,引发风电烧毁、倒塌等重大事故。目前,大型风场使用监控和数据采集(Supervisory Control andData Acquisition,SCADA)系统监控风机组运行状态。
因此,如何准确地诊断和预估风电机组的故障及其发展趋势,及早发现潜在故障征兆,以便制定最优的维修策略、降低故障率、保证风电机组安全高效运行,通过故障趋势预警来防止重大事故的发生,从而避免重大财产损失、保障人身及设备安全,是本领域技术人员亟待解决的技术问题。
发明内容
本发明就是为了解决如何准确地诊断和预估风电机组的故障及其发展趋势,及早发现潜在故障征兆的技术问题,提供了一种基于完全数据风电机组故障诊断方法。
本发明采用BOA-XGBoost算法搭建多个故障特征参数的常态回归模型,实时每个计算特征参数的重构误差;然后,将不同来源、不同尺度的特征参数根据特征权重融合成机组运行状态指标,从众多监测参数中得到了对风电机组运行态势的一致性表述。
本发明公开的基于完全数据风电机组故障诊断方法,包括以下步骤:
第一步,从SCADA系统中获取风电机组健康数据样本;
第二步,通过BOA-XGBoost算法训练多分类模型;
(1)设置XGBoost算法的超参数空间,即各类超参数的寻优范围;
(2)确定超参数与分类准确率的先验分布;
(3)通过BOA算法寻优,首先从上一步得到的原始先验开始,使用高斯过程作为概率函数代理未知最优参数;然后使用采集函数围绕当前已找到的最优超参数组合从参数空间中选取未评估过的超参数组合,通过迭代增加信息量、不断修正先验;最后在迭代结束后,选取准确率最高模型的超参数即为最优超参数组合,最终使用最优超参数组合训练分类模型得到最终模型;
第三步,通过多分类模型确定每种故障的特征检测参数;
第四步,搭建各特征监测参数的回归预测模型,计算预测残差值;
第五步,设定动态故障阈值;
(1)设置窗口大小,选取能反映原始数据集特征的最小数据子集作为滑动窗口;
(2)选取滑动窗口内的数据,根据式(2-10)计算窗口数据内的阈值。
Figure BDA0003044673410000021
式(2-10)中,Rk为某一时刻的状态指标,N为滑动窗口大小,Rth表示置信区间上限,Rth作为风电机组出现异常状态的阈值;
(3)逐帧移动数据窗口,根据步骤(2)设置新的阈值;
(4)重复步骤(3)得到所有时刻的阈值,连接起来便成了拟合Rt变化趋势的自适应阈值曲线;
第六步,从SCADA系统中获取实时运行数据,如果实时运行数据超过故障阈值则表示机组状态异常。
优选地,第一步从SCADA系统中获取风电机组健康数据样本的过程包括以下步骤:
步骤1,使用DBSCAN算法剔除低密度离散噪声数据;
步骤2,按功率对数据分区,计算每个分区的密度中点;
步骤3,使用最小二乘算法拟合密度中点,作为机组运行理想功率曲线,具体过程是,计算每个分区中的风速均值记为
Figure BDA0003044673410000031
风速标准差记为σi,该分区内的功率均值记为
Figure BDA0003044673410000032
则每个分区内的密度中点记为
Figure BDA0003044673410000033
计算各分区的标准差的均值记为σ:
Figure BDA0003044673410000034
使用最小二乘法对各中心点进行三次多项式拟合,得到风电机组的理想输出功率公式:
y=a0+a1x+a2x2+a3x3 (2-2)
步骤4,根据3-sigma准则以理想功率曲线为中心设置正常功率区间如式(2-3):
[y(x-3σ),y(x+3σ)] (2-3)
式(2-3)中所示区间即为正常功率区间估计,不在此区间内的数据即可被认定为异常值。
步骤5,以正常功率区间边界为阈值,删除正常功率区间以外的异常数据,获得风电机组健康数据样本。
本发明的有益效果是:
不依赖先验经验,有效地预警发电机系统、齿轮箱系统和液压系统故障。实时监测风电机组状态参数,掌握风电机组健康信息,又能及早发现潜在故障征兆、降低故障率、保证大型风力发电机组的安全高效运行。基于自适应原理的动态阈值计算方法,充分考虑了机组前一段时间的运行态势,可以有效实现多种故障的提前预警,解决传统人为设定固定阈值导致模型主观性强、泛化能力弱和易产生误报警的问题。
本发明进一步的特征和方面,将在以下参考附图的具体实施方式的描述中,得以清楚地记载。
附图说明
图1是本发明基于完全数据风电机组故障诊断方法的流程图;
图2是含异常数据机组“风速-功率”分布图;
图3是功率分区示意图;
图4是BOA-XGBoost模型构建流程;
图5是决策树部分枝杈图;
图6是动态阈值设定示意图;
图7是子集选取示意图;
图8是实验数据“风速-功率”分布图;
图9是低密度异常数据识别与剔除图;
图10是异常功率数据识别与剔除对比图;
图11是风电机组各子系统健康状态指标趋势图;
图12是风电机组各子系统状态指标密度分布图;
图13是风电机组各子系统状态监测图;
图14是风电机组各子系统状态监测图;
图15是风电机组各子系统状态监测图。
具体实施方式
以下参照附图,以具体实施例对本发明作进一步详细说明。
参考图1,基于完全数据风电机组故障诊断方法包括以下步骤:
第一步,从风场SCADA系统中获取风电机组健康数据样本。
风电机组在实际运行中,受风速和风向的不确定性以及变速恒频发电控制的约束,运行状态通常在不同工况之间随机频繁切换,会产生停机数据、限功率数据、故障数据和离群数据等异常数据。如图2中图(a)所示,常见的异常数据有以下几种:①停机数据:风电机组测量风速大于切入风速,输出功率在连续一段时间内为0,主要是人为弃风,或通讯故障引起的;②限功率数据:风电机组输出功率分布在理想功率曲线下方,且不随风速的变化而改变(或变化较小),此类异常点主要是由人为控制风电机组限制出力导致;③噪声数据:数据点在数据整体数据点之外杂乱分布,此类异常点一般是由机组故障或噪声引起的。
对比图2中(b)可看出,上述三种异常数据的分布密度均较低,其中,噪声数据无固定聚集范围,呈随机离散分布;而停机数据和限功率数据,围绕某一特定功率值波动分布,其功率分布纵向高度约为20kW,即,功率波动范围约为±10kW。因此,使用基于密度的DBSCAN聚类算法识别低密度离散异常数据,进而,基于正常功率区间估计的异常数据处理方案流程如下:
步骤1,使用DBSCAN算法剔除低密度离散噪声数据;
步骤2,按功率对数据分区,计算每个分区的密度中点,以20kW为步长设置分区如图3所示;
步骤3,使用最小二乘算法拟合密度中点,作为机组运行理想功率曲线,具体过程是,计算每个分区中的风速均值记为
Figure BDA0003044673410000051
风速标准差记为σi,该分区内的功率均值记为
Figure BDA0003044673410000052
则每个分区内的密度中点记为
Figure BDA0003044673410000053
计算各分区的标准差的均值记为σ:
Figure BDA0003044673410000054
由于风电机的输出功率与风速的三次方成正比,因此使用最小二乘法对各中心点进行三次多项式拟合,得到风电机组的理想输出功率公式:
y=a0+a1x+a2x2+a3x3 (2-2)
步骤4,风电机组的“风速-功率”数据围绕理想功率曲线呈近似正态分布,距离理想功率曲线越远,数据分布量越少,因此,根据3-sigma准则以理想功率曲线为中心设置正常功率区间如式(2-3):
[y(x-3σ),y(x+3σ)] (2-3)
式(2-3)中所示区间即为正常功率区间估计,数据超出该区间范围的概率不足0.27%,因此不在此区间内的数据即可被认定为异常值。
步骤5,以正常功率区间边界为阈值,删除正常功率区间以外的异常数据,获得风电机组健康数据样本。
为了验证异常数据处理过程的效果,通过图8所示两组数据进行实验,图8中的图(a)所示样本数据集中数据主体明显,包含噪声数据较少,而停机和限功率数据较多;图8中图(b)中所示数据样本的数据分布范围广且杂乱,大量低密度异常数据分布在数据主体的右下方,同时还存在少量的限功率数据和较多的停机数据。
首先调整DBSCAN聚类算法参数,识别实验数据样本低密度异常数据分别如图9的(a)、(b)所示,然后剔除异常数据结果如图9中(c)、(d)所示。从图9中(c)、(d)中可以看出,DBSCAN聚类算法可以很好剔除原始数据样本中的大量低密度离散异常数据,仍有少量停机和限功率数据没被剔除。
图10中图(a)、(b)为数据样本设置正常功率区间结果图,图中星型数据点为每个分区的数据密度中点,以星型数据点拟合密度中点后得到的理想功率曲线,数据带左右两侧曲线分别表示正常功率区间的上限和下限。图10中,图(c)、(d)为根据正常功率区间剔除异常数据后结果图,从图中可以看出,基本所有类型的异常数据均已被剔除,且保留了完整的高密度正常数据主带。
第二步,创建故障诊断模型,分析不同故障的特征参数。
步骤1,将风场机组群中常发生的故障划分为发电机系统故障、齿轮箱系统故障、液压系统故障三大类进行故障诊断和特征分析,三类故障包含的故障类别如表2-1所示:
表2-1 各故障类别包含的报警内容
Figure BDA0003044673410000071
步骤2,故障诊断模型其本质为多分类模型,即通过学习已知类别的不同数据特征进而对未知数据样本进行类别划分。XGBoost算法能高效地处理多分类问题,但因为超参数较多导致调优困难,为解决这个问题,采用BOA寻找分类准确率最高的超参数组合。通过BOA-XGBoost算法训练多分类模型,如图4所示,具体过程是:
(1)设置超参数空间。XGBoost算法包含常规参数、模型参数和学习任务参数三类超参数,在进行参数寻优前需设置各类超参数的寻优范围,表2-3为超参数取值范围及参数含义。
表2-3 XGBoost参数设定范围及含义
Figure BDA0003044673410000081
(2)确定先验概率分布。BOA(Bayesian Optimization Algorithm,BOA)是一个不断更新先验分布的过程,在进行寻优之前需要确定超参数与分类准确率的先验分布。通过多次随机选取超参数组合训练分类模型后得到多组参数组合与准确率的关系作为先验分布。
(3)BOA寻优过程。在超参数寻优时,首先从上一步得到的原始先验开始,使用高斯过程作为概率函数代理未知最优参数;然后使用采集函数围绕当前已找到的最优超参数组合从参数空间中选取未评估过的超参数组合,通过迭代增加信息量、不断修正先验;最后在迭代结束后,选取准确率最高模型的超参数即为最优超参数组合,最终使用最优超参数组合训练分类模型得到最终模型。
在训练分类模型时,将故障诊断模型建模数据集按(8:2)的比例划分为训练集和测试集,分别用作训练和评价模型。在训练模型时,XGBoost算法将多分类问题转化为多个二分类问题,求出所有叶子节点的预测分值加权相加后通过SoftMax层转化为概率值,根据概率值大小进行分类。在使用测试集评价模型时,采用准确率Accuracy作为评价指标:
Figure BDA0003044673410000082
式(2-4)中,n表示总类别数,n=4;TPi表示某一类别正确分类的个数,TPi表示某一类别被错误分类的个数。即Accuracy表示正确分类的实例个数占总测试集实例个数的比例。
步骤3,
XGBoost算法在新建二叉树时所有样本集中在一个叶子节点上,通过叶子节点不断分裂而逐渐生成一棵树,在叶子节点分裂的过程采用特征并行的方法进行计算选择要分裂的特征。即用多个线程,首先尝试把每个特征都作为分裂的特征,找到各个特征的最优分割点,然后选择根据不同特征分裂后产生的增益最大的特征作为分裂的特征。因此特征被用作分裂的次数可作为衡量特征重要性的标准,特征作为分裂次数越多则该特征越重要。定义特征f的权重Weightf如公式2-5所示:
Figure BDA0003044673410000091
式(2-5)中,Weightf为特征f在构建XGBoost模型中的权重,Tree为组成模型的二叉树数量,ni为第i棵树中特征f作为分裂特征的次数。某一特征的权重即为该特征在所有决策树中作为分裂特征次数的总和。
图5为故障诊断模型训练时第50棵决策树的部分枝杈,图中f13表示环境风向,f17表示齿轮箱油温,f18表示齿轮箱高速轴承温度,f29表示变流器控制器温度。在图中使用f17分裂两次,使用其他特征分裂一次,所以在这棵枝杈上,特征f17(齿轮箱油温)的权重为2,其他特征的权重为1。
为验证故障诊断模型的有效性和可靠性,通过对比实验对比不同超参数寻优算法和多分类算法与本发明搭建的故障诊断模型的性能表现。常用的参数寻优方法有网格搜索和随机搜索,按表2-3设定的超参数范围进行XGBoost分类模型参数调优任务,以模型测试集的分类准确率和寻优时间作为评估指标,三种参数寻优方法性能比较结果如表3-1所示:
表3-1 三种寻优算法比较
Figure BDA0003044673410000101
由上表可得,三种参数寻优算法均可以将XGBoost分类模型的准确率调整到99.2%以上,但寻优耗时相差较大,其中BOA使用时间最少,约为随机搜索的1/3,网格搜索的1/7,因此BOA具有更高的超参数寻优效率。使用BOA确定XGBoost分类器的超参数如表3-2所示:
表3-2 最终参数列表
Figure BDA0003044673410000102
常用的分类算法有决策树、SVM、GBDT、自适应提升(Adaptive boosting,AdaBoost)算法和以DBN为代表的深度学习网络等。使用BOA搭建各分类算法的最优多分类模型,其中经过实验确定DBN结构为1024-100-100的3层神经网络。在测试阶段为消除算法随机性的影响,实验时随机选取10组不同测试数据,计算各个模型的准确率与训练时长的均值分别作为模型可靠性和有效性的的评估指标,实验结果如表3-3所示:
表3-3 多分类算法比较
Figure BDA0003044673410000103
分析上表可得,基于决策树的分类模型训练耗时最短,但分类准确率最低;GBDT和XGBoost分类算法的分类准确率都在99%以上,但XGBoost的训练耗时较短;使用AdaBoost和SVM算法搭建多分类模型的有效性和可靠性相对XGBoost算法均较差;而基于DBN的多分类模型的平均准确率可以达到95%以上,但其训练时间最长,有效性最差。因此,基于XGBoost算法搭建的多分类模型相较其它分类算法具有较好的有效性和可靠性。
为测试故障诊断模型在实际应用时的性能,使用该风电场2020年的SCADA数据模拟实时数据流,测试故障诊断模型判断机组运行状态的准确率,构建包含正常数据和各类故障的模拟实时数据流数据如表3-4所示:
表3-4 模拟实时数据流数据构成
Figure BDA0003044673410000111
将数据集打散之后随机选取数据输入故障诊断模型,判断机组状态,测试结果如表3-5所示:
表3-5 模拟实时数据流诊断模型测试结果
Figure BDA0003044673410000121
由上表可得,本发明故障诊断模型基本能准确识别出所有故障类型,但对于发电机前轴承温度过高有极少次数被错误判断为齿轮箱系统故障。这是由于在风电机组传动系统结构中,发电机前轴承与齿轮箱高速轴直接相连,发电机局部高温与齿轮箱局部高温往往相伴出现,导致部分数据特征不明显所致。
第三步,设置动态阈值。
步骤1,在计算运行状态指标之前,通过设置窗口计算一定时间段内某一监测参数的相对残差,来消除纲量和数据范围的影响。设某一特征参数的实际值为yt,预测值为
Figure BDA0003044673410000122
窗口大小为h,则该特征参数在k时刻的h时间跨度内的相对残差r(k)如下所示:
Figure BDA0003044673410000123
Figure BDA0003044673410000124
其中,
Figure BDA0003044673410000125
表示窗口内监测参数实际值的均值。风电机组的自动停机保护时间为5分钟,为了避免在自动停机时间内各项数据突变造成相对残差出现异常极值点,本文设置窗口大小为10分钟,同时也将将每1分钟一条的原始残差样本聚合为每10分钟一条的相对残差样本集。
通过融合多个故障特征监测参数的相对残差作为评价指标,来实现机组子系统的状态监测。设风电机组某一子系统的故障特征参数分别为监测量A、监测量B、监测量C,三个特征监测量的特征权重分别为wA、wB、wC,相对残差分别rA、rB、rC,定义该子系统的状态指标如下所示:
Figure BDA0003044673410000131
式(2-8)是根据特征权重为多个特征参数的相对残差赋权值,将多监测量的相对残差融合成一个状态指标。该指标是一个无纲量指标,指标值越大表明机组偏离理想工况越严重,若该指标超过一定阈值,则表明该机组的监测部位已经出现故障征兆,需要对该部位进行维护。
采用EWMA计算得到状态指标变化的趋势控制图,预测状态指标的变化趋势。EWMA常用于统计数据处理,以设置加权系数的形式充分考虑之前所有观测值的信息,每个EWMA点都结合了来自之前所有子组或观测值的信息,反应目标量近期变化趋势。EWMA控制点值表达式如式2-9所示:
vt=βRt+(1-β)vt-1 (2-9)
式中,vt表示t时刻状态指标的趋势值,Rt表示t时刻下的状态指标;系数β表示EWMA控制图对历史数据的权重系数,β∈(0,1],(1-β)表示历史值加权下降的速率,设定β=0.9。另外,由于模型预测总是不可避免的存在误差,通过EWMA处理残差不仅可以减小残差值的波动范围还能有效的消除误报警点,使得预警算法更加稳定和精确。
步骤2,通过滑动窗口分段设定动态故障阈值。
如图6所示,具体过程如下:
(1)设置窗口大小,选取能反映原始数据集特征的最小数据子集作为滑动窗口。根据K-S检验原则,如果两个数据集的K-S检验的结果值大于0.05,则可认为两个数据集具有相同的分布规律。如图7所示,在确定滑动窗口大小时,首先从数据样本开始处框选一定范围的数据作为子数据集,与原始母数据集做K-S检验,检验两者的相似性。然后依次向右扩大数据子集范围,直到子集与母集的k值大于0.05时,记录下此时子集的长度即为窗口大小N。
(2)设置故障阈值。在设置动态故障阈值时,应充分考虑窗口前一段时间状态指标的变化趋势,选取步骤(1)确定的滑动窗口内的数据,根据式(2-10)计算窗口数据内的阈值。
Figure BDA0003044673410000141
式中,Rk为某一时刻的状态指标,N为滑动窗口大小,Rth表示置信区间上限。Rth通过核密度估计法分析风电机组运行状态指标的分布特征,并基于小概率事件原理设定。根据统计学中的区间估计理论,设一个概率值α,如果某一范围内状态指标的累计概率分布P{0≤R≤Rth}=1-α,则称区间[0,Rth]是状态指标R的1-α置信度的置信区间。当α值越小,表明风电机组的状态指标数值R>Rth情况时的概率越小。如果以1-α作为置信度,则状态指标R几乎全分布在[0,Rth]的正常区间内,如此Rth便可作为风电机组出现异常状态的阈值。
(3)逐帧移动数据窗口,根据步骤(2)设置新的阈值。
(4)重复步骤(3)得到所有时刻的阈值,连接起来便成了拟合Rt变化趋势的自适应阈值曲线。
第四步,从SCADA系统中获取实时运行数据,如果实时运行数据超过故障阈值则表示机组状态异常。
验证实验,根据故障特征分析及式(2-8),确定各子系统的故障特征参数及特征权重占比如表3-6所示:
表3-6 系统的故障特征参数及特征权重占比
Figure BDA0003044673410000151
使用MIC算法计算表3-6中各故障特征参数与SCADA系统其他监测参数的最大互信息系数,根据相关性大小选取各故障特征参数的建模向量。
搭建各故障特征参数的常态模型,首先将用于建立常态模型的SCADA历史数据剔除异常数据,得到健康数据集。然后使用贝叶斯优化算法寻找每个回归模型的最优参数组合,最终以验证集的验证的MAE和r2分值为评价标准。结果如表3-7所示,从中可以看出,最终构建的各类故障特征参数回归模型得分相似,均能准确重构故障特征参数,且可以很好拟合各类参数的变化趋势。
表3-7 各模型最终验证结果
Figure BDA0003044673410000152
从风场内选取没有参与回归模型训练与测试的1台正常运行机组SCADA数据,从中截取未发生过任何故障和人为干预的不间断运行14天(20160个采样点)的数据作为健康历史数据集。
首先使用常态回归模型重构各故障特征参数值;然后计算重构结果的相对误差。最终计算得到发电机系统、齿轮箱系统、液压系统在机组正常运行时的状态指标趋势控制图如图11所示。从图11中可以看出,发电机子系统在运行期间大部分状态指标分布在0.01以下,中间出现过数次波动,但波动范围维持在0.025以内。而齿轮箱系统和液压系统在此期间运行较为稳定,状态指标多数都分布在0.008以内。此外,三个子系统的状态指标在14天的运行期间内均未出现明显的变化趋势。
统计图12中各子系统的健康状态指标数据分布,计算得频率分布直方图、核密度函数曲线及累计概率曲线,图中横坐标为系统的状态指标;左侧纵坐标为指标分布密度,对应图中核密度曲线和指标分布直方图;分段对核密度曲线积分并将概率点相连即得到累计概率曲线,对应图中虚线所示,其坐标为右侧纵坐标。设定99.5%的置信度,从上图中寻找各子系统的累计概率密度为99.5%时对应的状态指标作为正常状态指标的上限值。最终设定发电机系统的置信区间上限为0.0183,齿轮箱系统的置信区间上限为0.121,液压系统的置信区间上限为0.0125。
通过SCADA系统故障记录表得知风场内84号机组在2019年5月15日17点9分由SCADA系统发出“发电机主轴温度高”故障报警后停机。选取该机组发生故障时刻前7天的运行数据做发电机系统故障预警实验,使用常态回归模型重构各故障特征参数并计算相对误差,计算各子系统的状态检测图如图13所示。从图13中图(a)中可以看出,发电机系统的状态指标在第580个采样点附近出现较高幅度的突起但并未越过故障阈值,说明在这段时间内发电机系统运行状态发生过较大幅度波动,但并没有到达发生故障的程度;而在第950个采样点以后,状态指标开始快速上升,并逐渐越过了报警阈值。图13中图(b)为发电机系统状态检测图局部放大图,图中最右边竖着方向的虚线所示为故障发生点(第1008个采样点),中间竖直方向的虚线所示为故障预警点(第986个采样点),说明状态监测系统可以提前约3.67小时(22个采样点)发出发电机系统故障报警。相较之下,图13中(c)、(d)所示齿轮箱系统和液压系统状态指标整体较为平滑,在第950个采样点之后状态指标出现小幅升高但并未超出过故障阈值。
SCADA系统故障记录表显示风场内87号机组在2019年4月22日9点39分由SCADA系统发出“齿轮箱冷却器过载”故障报警后停机。选取该机组发生故障时刻前7天的运行数据做齿轮箱系统故障预警实验。使用常态回归模型重构各故障特征参数并计算相对误差,最后得各子系统的状态检测图如图14所示。从图14的图(a)中可以看出,齿轮箱系统运行指标整体较为平稳,从第940个采样点开始状态指标快速上升,并逐渐超过了故障阈值。从图14的图(b)为发电机系统发生故障前10小时的状态检测局部放大图,图中最右边虚线所示为故障发生点(第1008个采样点),中间虚线所示为故障预警点(第977个采样点),说明状态监测系统可以提前约5.17小时(31个采样点)发出发电机系统故障报警。图14的图(c)为发电机系统状态监测图,在整个运行期间内并没有出现越过故障阈值的情况。图14的图(d)为液压系统状态监测图,从图中可以看出,液压系统在在临近发生故障前受变流器和齿轮箱高速轴承温度升高影响导致状态指标产生小幅拉升,但并未超出故障阈值。
CADA系统故障记录表显示风场内106号机组在2019年4月26日15点36分由SCADA系统发出“液压电机温度过高”故障报警后停机。选取该机组发生故障时刻前7天的运行数据做液压系统故障预警实验。使用常态回归模型重构各故障特征参数并计算相对误差,各子系统的状态监测图如图15所示。由图15中图(a)、(b)液压系统状态检测图和局部放大图可得,液压系统状态指标从第850个采样点开始出现抖动上升态势,从第990个采样点后开始大幅提升截止到故障发生时刻,其状态指标升至0.11附近,这是由于在故障发生前变流器电抗器1温度快速升高所致。图15的图(b)中最右边竖直方向的虚线所示为故障发生点(第1008个采样点),中间竖直方向的虚线所示为故障预警点(第994个采样点),说明状态监测系统可以提前约2.33小时(14个采样点)发出发电机系统故障报警。对比图15中图(c)、(d)可得,在实验时间段内,发电机系统和齿轮箱系统均运行较为平稳且未发生报警情况。
以上所述仅对本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。

Claims (2)

1.一种基于完全数据风电机组故障诊断方法,其特征在于,包括以下步骤:
第一步,从SCADA系统中获取风电机组健康数据样本;
第二步,通过BOA-XGBoost算法训练多分类模型;
(1)设置XGBoost算法的超参数空间,即各类超参数的寻优范围;
(2)确定超参数与分类准确率的先验分布;
(3)通过BOA算法寻优,首先从上一步得到的原始先验开始,使用高斯过程作为概率函数代理未知最优参数;然后使用采集函数围绕当前已找到的最优超参数组合从参数空间中选取未评估过的超参数组合,通过迭代增加信息量、不断修正先验;最后在迭代结束后,选取准确率最高模型的超参数即为最优超参数组合,最终使用最优超参数组合训练分类模型得到最终模型;
第三步,通过多分类模型确定每种故障的特征检测参数;
第四步,搭建各特征监测参数的回归预测模型,计算预测残差值;
第五步,设定动态故障阈值;
(1)设置窗口大小,选取能反映原始数据集特征的最小数据子集作为滑动窗口;
(2)选取滑动窗口内的数据,根据式(2-10)计算窗口数据内的阈值。
Figure FDA0003044673400000011
式(2-10)中,Rk为某一时刻的状态指标,N为滑动窗口大小,Rth表示置信区间上限,Rth作为风电机组出现异常状态的阈值;
(3)逐帧移动数据窗口,根据步骤(2)设置新的阈值;
(4)重复步骤(3)得到所有时刻的阈值,连接起来便成了拟合Rt变化趋势的自适应阈值曲线;
第六步,从SCADA系统中获取实时运行数据,如果实时运行数据超过故障阈值则表示机组状态异常。
2.根据权利要求1所述的基于完全数据风电机组故障诊断方法,其特征在于,所述第一步从SCADA系统中获取风电机组健康数据样本的过程包括以下步骤:
步骤1,使用DBSCAN算法剔除低密度离散噪声数据;
步骤2,按功率对数据分区,计算每个分区的密度中点;
步骤3,使用最小二乘算法拟合密度中点,作为机组运行理想功率曲线,具体过程是,计算每个分区中的风速均值记为
Figure FDA0003044673400000021
风速标准差记为σi,该分区内的功率均值记为
Figure FDA0003044673400000022
则每个分区内的密度中点记为
Figure FDA0003044673400000023
计算各分区的标准差的均值记为σ:
Figure FDA0003044673400000024
使用最小二乘法对各中心点进行三次多项式拟合,得到风电机组的理想输出功率公式:
y=a0+a1x+a2x2+a3x3 (2-2)
步骤4,根据3-sigma准则以理想功率曲线为中心设置正常功率区间如式(2-3):
[y(x-3σ),y(x+3σ)] (2-3)
式(2-3)中所示区间即为正常功率区间估计,不在此区间内的数据即可被认定为异常值。
步骤5,以正常功率区间边界为阈值,删除正常功率区间以外的异常数据,获得风电机组健康数据样本。
CN202110467308.7A 2021-04-28 2021-04-28 一种基于完全数据风电机组故障诊断方法 Active CN113361186B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110467308.7A CN113361186B (zh) 2021-04-28 2021-04-28 一种基于完全数据风电机组故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110467308.7A CN113361186B (zh) 2021-04-28 2021-04-28 一种基于完全数据风电机组故障诊断方法

Publications (2)

Publication Number Publication Date
CN113361186A true CN113361186A (zh) 2021-09-07
CN113361186B CN113361186B (zh) 2023-04-07

Family

ID=77525578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110467308.7A Active CN113361186B (zh) 2021-04-28 2021-04-28 一种基于完全数据风电机组故障诊断方法

Country Status (1)

Country Link
CN (1) CN113361186B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114528948A (zh) * 2022-03-10 2022-05-24 电子科技大学 一种复杂系统的序贯测试序列生成方法
CN114609372A (zh) * 2022-02-18 2022-06-10 江苏徐工工程机械研究院有限公司 基于最大熵的工程机械油液监测系统及方法
CN114818779A (zh) * 2022-03-23 2022-07-29 国网江苏省电力有限公司南京供电分公司 一种基于层级分类算法的风机转子的故障诊断方法
CN114826971A (zh) * 2022-06-28 2022-07-29 苏州浪潮智能科技有限公司 一种服务器异常检测方法、装置、设备及可读存储介质
CN115013261A (zh) * 2022-08-08 2022-09-06 国网浙江省电力有限公司舟山供电公司 一种用于海上风电场的状态监测方法及系统
CN115329908A (zh) * 2022-10-14 2022-11-11 西安热工研究院有限公司 一种基于深度学习的电力变压器故障诊断方法
CN116596336A (zh) * 2023-05-16 2023-08-15 合肥联宝信息技术有限公司 电子设备的状态评估方法、装置、电子设备及存储介质
CN117034020A (zh) * 2023-10-09 2023-11-10 贵州大学 一种基于cvae-gan模型的无人机传感器零样本故障检测方法
CN117421698A (zh) * 2023-12-15 2024-01-19 深圳市泰士特科技股份有限公司 基于融合数据分析的大型发电机故障定位方法及系统
CN117563144A (zh) * 2023-12-04 2024-02-20 惠州市凌盛医疗科技有限公司 一种红外治疗仪状况评估与剩余寿命预测方法及系统
CN117563144B (zh) * 2023-12-04 2024-05-28 郭永强 一种红外治疗仪状况评估与剩余寿命预测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105134510A (zh) * 2015-09-18 2015-12-09 北京中恒博瑞数字电力科技有限公司 一种风力发电机组变桨系统的状态监测和故障诊断方法
CN110685868A (zh) * 2019-10-25 2020-01-14 长沙理工大学 一种基于改进梯度提升机的风电机组故障检测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105134510A (zh) * 2015-09-18 2015-12-09 北京中恒博瑞数字电力科技有限公司 一种风力发电机组变桨系统的状态监测和故障诊断方法
CN110685868A (zh) * 2019-10-25 2020-01-14 长沙理工大学 一种基于改进梯度提升机的风电机组故障检测方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
YIRONG LIU等: "Research on Fault Diagnosis of Wind Turbine Based on SCADA Data", 《IEEE》 *
江喆: "湖南省地级城市间住宅地价的差异及其影响因素", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *
王桂松: "基于风电机组SCADA数据的齿轮箱故障预警方法研究", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技II辑》 *
田浩: "基于 HHT 和XGBoost的风电机组滚动轴承故障诊断研究", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技II辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114609372B (zh) * 2022-02-18 2023-10-03 江苏徐工工程机械研究院有限公司 基于最大熵的工程机械油液监测系统及方法
CN114609372A (zh) * 2022-02-18 2022-06-10 江苏徐工工程机械研究院有限公司 基于最大熵的工程机械油液监测系统及方法
CN114528948A (zh) * 2022-03-10 2022-05-24 电子科技大学 一种复杂系统的序贯测试序列生成方法
CN114818779A (zh) * 2022-03-23 2022-07-29 国网江苏省电力有限公司南京供电分公司 一种基于层级分类算法的风机转子的故障诊断方法
CN114826971A (zh) * 2022-06-28 2022-07-29 苏州浪潮智能科技有限公司 一种服务器异常检测方法、装置、设备及可读存储介质
CN115013261A (zh) * 2022-08-08 2022-09-06 国网浙江省电力有限公司舟山供电公司 一种用于海上风电场的状态监测方法及系统
CN115013261B (zh) * 2022-08-08 2022-12-06 国网浙江省电力有限公司舟山供电公司 一种用于海上风电场的状态监测方法及系统
CN115329908A (zh) * 2022-10-14 2022-11-11 西安热工研究院有限公司 一种基于深度学习的电力变压器故障诊断方法
CN116596336A (zh) * 2023-05-16 2023-08-15 合肥联宝信息技术有限公司 电子设备的状态评估方法、装置、电子设备及存储介质
CN116596336B (zh) * 2023-05-16 2023-10-31 合肥联宝信息技术有限公司 电子设备的状态评估方法、装置、电子设备及存储介质
CN117034020A (zh) * 2023-10-09 2023-11-10 贵州大学 一种基于cvae-gan模型的无人机传感器零样本故障检测方法
CN117034020B (zh) * 2023-10-09 2024-01-09 贵州大学 一种基于cvae-gan模型的无人机传感器零样本故障检测方法
CN117563144A (zh) * 2023-12-04 2024-02-20 惠州市凌盛医疗科技有限公司 一种红外治疗仪状况评估与剩余寿命预测方法及系统
CN117563144B (zh) * 2023-12-04 2024-05-28 郭永强 一种红外治疗仪状况评估与剩余寿命预测方法及系统
CN117421698A (zh) * 2023-12-15 2024-01-19 深圳市泰士特科技股份有限公司 基于融合数据分析的大型发电机故障定位方法及系统
CN117421698B (zh) * 2023-12-15 2024-03-29 深圳市泰士特科技股份有限公司 基于融合数据分析的大型发电机故障定位方法及系统

Also Published As

Publication number Publication date
CN113361186B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN113361186B (zh) 一种基于完全数据风电机组故障诊断方法
Fu et al. Condition monitoring of wind turbine gearbox bearing based on deep learning model
CN109214566A (zh) 基于长短期记忆网络的风电功率短期预测方法
Udo et al. Data-driven predictive maintenance of wind turbine based on SCADA data
US20160223600A1 (en) Power generation performance evaluation method and apparatus for power generator set
US11840998B2 (en) Hydraulic turbine cavitation acoustic signal identification method based on big data machine learning
CN111597682B (zh) 预测风力机齿轮箱轴承剩余寿命的方法
CN110362045B (zh) 一种考虑海洋气象因素的海上双馈风电机组故障判别方法
CN111237134A (zh) 一种基于GRA-LSTM-stacking模型的海上双馈风力发电机故障诊断方法
CN111680875B (zh) 基于概率基线模型的无人机状态风险模糊综合评价方法
CN110362048A (zh) 风机关键部件状态监测方法及装置、存储介质和终端
Shi et al. Study of wind turbine fault diagnosis and early warning based on SCADA data
Zhan et al. Health assessment methods for wind turbines based on power prediction and mahalanobis distance
CN107728059A (zh) 一种变桨系统状态评估方法
CN115419558A (zh) 一种风电机组运行状态评估方法及装置
CN114580545A (zh) 一种基于融合模型的风电机组齿轮箱故障预警方法
CN116793666A (zh) 一种基于lstm-mlp-lsgan模型的风电机组齿轮箱故障诊断方法
CN115577854A (zh) 一种基于eemd-rbf组合的分位数回归风速区间预测方法
Neshat et al. Hybrid neuro-evolutionary method for predicting wind turbine power output
CN115660421A (zh) 一种新能源电力系统的风险早期预警分类方法
Peter et al. Wind turbine generator prognostics using field SCADA data
Zheng et al. Conditional variational autoencoder informed probabilistic wind power curve modeling
Zhang et al. An evaluation method of health condition for wind turbine based on asymmetric proximity
Cao et al. Fuzzy Analytic Hierarchy Process Evaluation Method of Gas Turbine Based on Health Degree
CN110334951A (zh) 一种风电机组高温降容状态的智能评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant