CN112746934B - 一种自联想神经网络诊断风机故障方法 - Google Patents

一种自联想神经网络诊断风机故障方法 Download PDF

Info

Publication number
CN112746934B
CN112746934B CN202011639678.6A CN202011639678A CN112746934B CN 112746934 B CN112746934 B CN 112746934B CN 202011639678 A CN202011639678 A CN 202011639678A CN 112746934 B CN112746934 B CN 112746934B
Authority
CN
China
Prior art keywords
self
neural network
data
individuals
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011639678.6A
Other languages
English (en)
Other versions
CN112746934A (zh
Inventor
武鑫
王立鹏
吕佃顺
李练兵
李思佳
李政宇
陈伟光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Guoke Intelligent Electric Co ltd
Hebei University of Technology
Original Assignee
Jiangsu Guoke Intelligent Electric Co ltd
Hebei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Guoke Intelligent Electric Co ltd, Hebei University of Technology filed Critical Jiangsu Guoke Intelligent Electric Co ltd
Priority to CN202011639678.6A priority Critical patent/CN112746934B/zh
Publication of CN112746934A publication Critical patent/CN112746934A/zh
Application granted granted Critical
Publication of CN112746934B publication Critical patent/CN112746934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F03MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
    • F03DWIND MOTORS
    • F03D17/00Monitoring or testing of wind motors, e.g. diagnostics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Combustion & Propulsion (AREA)
  • Mechanical Engineering (AREA)
  • Sustainable Development (AREA)
  • Sustainable Energy (AREA)
  • Chemical & Material Sciences (AREA)
  • Physiology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Wind Motors (AREA)

Abstract

一种自联想神经网络诊断风机故障的方法,将采集的数据归一化,去除奇异值,分为训练数据和测试数据。根据输入输出样本数据,确定自联想神经网络的输入输出节点及隐藏层结构。在保证种群多样性的同时选出较优个体的前提下,设计风机变桨系统故障诊断的选择算子公式,避免网络的权值和阈值陷入局部最优点,提高风机故障诊断准确率。设计适合风机变桨系统故障诊断的适应度函数,引入接收者操作特征曲线下方的面积AUC,以确保较低的漏诊率,并降低不平衡数据对模型诊断效果的干扰。基于改进自适应遗传算法‑自联想神经网络算法建立变桨系统正常运行模型,采用詹森‑山农散度比较正常时刻与故障时刻残差分布的偏移度,实现对变桨系统的故障诊断。

Description

一种自联想神经网络诊断风机故障方法
技术领域
本发明涉及一种风机故障诊断方法。
背景技术
变桨系统是风机控制系统中的重要组成部分,不仅直接影响风机对风能的利用率,其气动刹车功能还负责极端情况下风机的自身安全。大风冰雹天气以及风速风向的不断变化,对变桨系统的性能与寿命均造成影响,增大了其故障发生率,使变桨系统成为风机故障易发部件。同时变桨系统安装在离地面数十米的高度,维修难度大、成本高,因此对风机变桨系统的故障诊断研究具有重要意义。目前对于变桨系统的故障诊断方法主要是选取风速、风向、桨距角和电机转速参量,建立变桨系统的故障预测模型,如文献“基于SCADA系统的风电变桨故障预测方法研究[J]”(肖成,刘作军,张磊..可再生能源,2017(2).)。对于变桨系统这类难以建立精确数学模型、拥有较多运行数据变量的系统的故障诊断,人工神经网络有较好的效果,但是网络的初始参数不易确定,随机的初始参数很容易导致神经网络产生局部最优解,影响收敛速度和结果准确性。
目前,如何提高大样本处理上收敛速度、增强全局寻优效果,是一个需要解决的技术问题。
发明内容
针对现有技术的不足,本发明提出一种自联想神经网络的风机变桨系统故障诊断方法。本发明从选择算子和适应度函数两个方面对现有的自适应遗传算法进行改进,以提高现有自适应遗传算法的搜索效率、全局寻优能力,避免神经网络产生局部最优解,影响变桨系统故障诊断的速度和结果的准确性。
本发明采用改进自适应遗传算法(IAGA)优化自联想神经网络(AANN)的初始权值和阈值,通过自联想神经网络(AANN)获得变桨系统正常状态下的残差分布,利用詹森-山农(JS)散度计算正常时刻与故障时刻残差分布的偏移度,判断变桨系统是否故障。
本发明基于改进自适应遗传算法-自联想神经网络模型的风机变桨系统故障诊断方法步骤如下:
步骤1:采用风电机组的数据采集与监控系统(SCADA)采集的数据进行归一化以及奇异值去除等预处理操作,将所述的数据分为训练数据和测试数据。根据风电机的数据采集与监控系统采集的数据确定自联想神经网络模型的输入和输出节点数。
步骤2:设置种群数量N,最大迭代次数M,并随机生成N个个体作为初始种群,采用实数编码的方法对自联想神经网络的权值和阈值进行编码,每个个体包含自联想神经网络的全部权值、阈值以及它们的位置信息。
步骤3:对每个个体解码获取自联想神经网络的权值、阈值;训练自联想神经网络,计算个体适应度值。
步骤4:依据适应度值对个体降序排列,然后按照改进的选择算子对种群中的个体进行选取,除了精英保留策略选取的个体外,对其余选中个体的自适应交叉概率和自适应变异概率进行交叉和变异操作。
步骤5:判断适应度值是否满足要求或达到最大进化代数,若满足,则输出最优个体,否则进入步骤3。
步骤6:解码最优个体,并将权阈值信息赋予自联想神经网络的参数空间,进行参数微调训练,然后将测试集输入故障诊断模型中,获得残差数据及其分布信息,对残差进行分析,验证算法的准确性及效率。
各步骤具体如下:
所述步骤1中,风电机组数据采集与监控系统(SCADA)记录的相关数据中选取有关变桨系统运行的数据信息,所述的数据信息包含15个运行参数,分别为:当前风速、风机有功功率、叶片转速、发电机转速、风机3个叶片的桨距角和变桨驱动电流、变桨系统轴承温度、伺服电机温度、3个叶片的绝缘栅双极型晶体管(IGBT)温度。因此,自联想神经网络的输入和输出节点为15。
上述数据中去除功率为0、数值缺失、重复记录等无效数据,对处理后的数据进行归一化处理,获得风机变桨系统的样本集。归一化处理公式如下:
Figure BDA0002878010690000021
式中,xi为输入的数据,xmin、xmax分别输入数据的最小值和最大值,x′i为归一化后的数据。
所述步骤1中,自联想神经网络模型如下所述:
自联想神经网络提取变桨系统运行数据的主要特征和相互关联的同时,将其正常运行模式固化到网络中,通过比较劣化或故障时刻数据与正常运行数据残差分布的差异程度,更加准确、直观的反映变桨系统的健康状态。
在自联想神经网络中,输入数据经过输入层、映射层到达瓶颈层的过程属于编码过程;再通过瓶颈层到映射层最后到输出层的过程属于解码过程。首先高维数据通过输入层非线性映射到瓶颈层,实现对高维数据的压缩进而提取有效的特征维度。
设g(x)表示编码函数,xi作为输入,i为x的第i个维度。数据经过编码过程得出yi,其表达式为:
yi=gθ(xi)=s(Wxi+b)
式中,s(x)是非线性激活函数;θ=(W,b)是g(x)的参数;W代表权重;b是偏置。
然后,隐含层的yi由瓶颈层通过非线性函数再映射到与输入层相同维度的输出层实现信息的解码,即对输入数据的重构,其表达式为:
Figure BDA0002878010690000031
式中,θ'=(W',b')是h(y)的参数;W'代表权重;b'为偏置。
如此通过对数据的非线性的压缩和重构,自联想神经网络模型将会习得各个变量之间的非线性关系。对于输入为变桨系统正常运行的数据,自联想神经网络(AANN)会将正常运行时数据间的特性与关联固化到模型当中。自联想神经网络(AANN)模型训练时,以最小化输入与输出误差为目标,寻求最优网络参数,使输出尽可能还原输入数据。当输入劣化或故障时刻数据时,输出的数据就会和输入数据有较大偏差。
在对自联想神经网络(AANN)进行训练时,将训练样本数据yi作为模型的输入和期望输出,然后根据模型训练产生的输出
Figure BDA0002878010690000032
计算模型的误差平方和E,其公式如下:
Figure BDA0002878010690000033
式中,n为一个样本包含的变量个数;m为总共的样本数。
所述步骤4中,选择算子是根据适应度函数选出适应度高的个体繁衍产生下一代,常用的选择算子有轮盘赌法、排序法以及精英保留策略。轮盘赌法存在随机误差,可能会排除适应度高的个体,排序法及精英选择策略保留了优秀个体但可能破坏种群的多样性,导致算法易于陷入早熟收敛,同时及时发现风机变桨系统故障可以合理安排工作人员检修、提高风电机组的可靠性、增加风电场经济效应,为此,本发明在轮盘赌法的基础上进行改进,在保证种群多样性的同时加快收敛速度,选出较优个体,保证了风机故障诊断的时间和准确率,及时对风机变桨系统各类故障做出预警。
轮盘赌法步骤方法如下:
1)计算各个体适应度值;
2)计算每个个体被选中的概率和累积概率;
3)在[0,1]之间随机产生一个随机数r;
4)依次比较累积概率与r的值,选中第一个大于r的值。
本发明选择算子的步骤如下:
1)确定一个初始种群,依据适应度函数计算每个个体的适应度值;
2)按照适应度值的大小将种群中的个体按照降序排序;
3)根据当前迭代次数和总迭代次数,按照确定保留优秀个体的数量n,余下的个体使用轮盘赌法的第3步和第4步选择,然后将选出的个体进行交叉和变异操作。
保留优秀个体的数量n的计算公式如下:
Figure BDA0002878010690000041
式中,P为需要选出的优秀个体占总体的最大比例,N为种群个体总数,xmax为最大进化代数,n为优秀个体数量,x为进化代数,e为自然对数的底数。
4)进行精英保留操作。比较上一代和本代最优的个体,选出适应度最高的个体作为本代最优个体,并替换本代适应度低的个体。
其中,交叉和变异操作的计算公式如下:
Figure BDA0002878010690000042
Figure BDA0002878010690000043
式中,交叉率的上下限分别为Pc1、Pc2,变异率的上下限分别为Pm1、Pm2;fmax表示每代种群个体中最大的适应度值;favg为当前种群平均适应度值;f'为要进行交叉操作的两个个体中较大的适应度值;f为变异个体的适应度值。
步骤3和步骤4的改进选择算子中适应度函数计算方式如下:
选取自联想神经网络的输出值
Figure BDA0002878010690000051
与期望输出值y之差的绝对值作为目标函数Jm。取目标函数的倒数作为适应度函数。Jm目标函数的计算公式为:
Figure BDA0002878010690000052
式中,m为自联想神经网络输出节点数。
遗传算法是朝着适应度函数值增大的方向进化,但自联想神经网络模型误差越小,模型越优,同时风机变桨系统故障诊断模型注重模型的准确性,因此,本发明在现有遗传算法适应度函数的基础上加入自联想神经网络的接收者操作特征曲线ROC下方的面积(AUC)值,降低不平衡数据对风机变桨系统故障诊断模型诊断效果的干扰,提升自联想神经网络模型的准确性,准确识别出风机变桨系统的异常状态。
适应度函数f(xi)计算公式为:
Figure BDA0002878010690000053
式中,ζ为一个极小值,防止分母为0;k为调节系数;f(xi)为改进的适应度函数;Jm为目标函数,AUC为接收者操作特征曲线(ROC)下的面积。
将个体解码赋给自联想神经网络的权值、阈值,再输入训练数据,可求出接收者操作特征曲线ROC下的面积AUC值,降低改进自适应遗传算法-自联想神经网络风机变桨系统故障诊断模型的误诊率。
接收者操作特征曲线(ROC)下的面积AUC的计算方法如下:
接收者操作特征曲线下方面积AUC值的计算要先通过混淆矩阵来定义一些指标,如表1所示:
表1混淆矩阵
Figure BDA0002878010690000054
表中,TP是真正例,表示模型诊断为故障,实际也是故障的事件;FN是假反例,表示模型诊断无故障,但实际有故障的事件;FP是假正例,表示模型诊断为故障,但实际无故障的事件;TN是真反例,表示模型诊断无故障,实际也是无故障的事件。
根据上述定义,得出如下指标:
准确率是模型正确诊断事件的比例,在正负样本较为均衡的情况下,准确率越高,模型的诊断效果越好。准确率(accuracy)的计算公式如下:
Figure BDA0002878010690000061
真正类率(TPR)表示在所有实际故障的事件中,被诊断模型正确识别的比例。
Figure BDA0002878010690000062
负正类率(FPR)表示在所有实际无故障的事件中,被诊断模型错误地判断为故障的比例。
Figure BDA0002878010690000063
分别以负正类率和真正类率为横纵坐标,以不同的阈值计算对应的负正类率、真正类率值,构成不同的点,将其连接起来即为接收者操作特征曲线,计算其与横坐标所围成的面积即为AUC。
步骤6中,基于改进自适应遗传算法-自联想神经网络的方法,将风力发电机正常运行数据作为输入,获得模型输出残差,统计各个残差的频数,获得残差概率分布。以残差概率分布基准,当输入风力发电机故障数据后,模型的输出残差和概率分布情况就会与正常情况有所区别,通过比较这两种残差概率分布的相差程度即偏移度,判断风力发电机是否故障。并据此设置模型的阈值,尽可能包含全部的故障情况并排除健康状态在此阈值中的现象。当得出的偏移度超过此阈值时,代表风机的关键部件发生故障。
本发明使用库尔贝克-莱布勒(KL)散度的变体詹森-山农(JS)散度分析残差数据及其分布,其中库尔贝克-莱布勒(KL)散度的计算公式为:
Figure BDA0002878010690000064
将本发明步骤1中的自联想神经网络模型输出的残差范围分成n等份,统计落入每个残差区间中残差的个数,得到残差的概率分布p(xi)=xi/sp、q(xi)=xi/sq。其中p(xi)为变桨系统正常运行时残差落入区间i的比率,sp为变桨系统正常运行时所有区间的残差个数;q(xi)为故障时刻残差落入区间i的比率,sq为故障时刻所有区间的残差个数,xi为落入第i个区间的残差个数,n为模型输出的残差范围等分区间的个数,i为模型输出残差的第i个区间。
相较于库尔贝克-莱布勒(KL)散度,詹森-山农(JS)散度对相似度的判别更加准确,詹森-山农(JS)散度的计算公式JS(p||q)如下:
Figure BDA0002878010690000071
式中,p为数据的真实分布,q为数据的拟合分布。
所述步骤6中,风机变桨系统正常运行模型是经过正常运行数据训练的自联想神经网络模型,该模型可以识别出风机变桨系统下正常运行时的各个工作状态。从测试集中选择一部分风机变桨系统故障时刻前后风电机组数据采集与监控系统(SCADA)记录的数据和正常运行时的数据作为改进自适应遗传算法-自联想神经网络模型的输入,利用詹森-山农(JS)散度计算模型输出残差分布和相应工况下正常分布的偏移度,考虑灵敏度以及模型的准确性,滑动窗口值选择为10。以故障数据的残差分布与正常分布的最小偏移度为界限,确定阈值。
附图说明
图1基于改进自适应遗传算法-自联想神经网络的风机故障诊断模型的总体结构图;
图2自联想神经网络(AANN)结构图;
图3本发明的改进自适应遗传算法(IAGA)结构图;
图4本发明的改进自适应遗传算法(IAGA)、改进遗传算法(AGA)和遗传算法(GA)三种优化算法的最优个体适应度曲线;
图5本发明的改进自适应遗传算法-自联想神经网络(IAGA-AANN)、改进遗传算法-自适应联想网络(AGA-AANN)和遗传算法-自联想神经网络(GA-AANN)模型训练误差曲线;
图6部分训练数据残差分布的偏移度散点图;
图7本发明改进的自适应遗传算法-自联想神经网络(IAGA-AANN)故障诊断模型的偏移度曲线。
具体实施方式
以下面结合说明书附图和具体实施方式进一步说明本发明。
本发明基于改进自适应遗传算法-自联想神经网络风机变桨系统故障诊断模型的总体结构图如图1所示,具体方法的步骤如下:
步骤1:采用风电机组数据采集与监控系统(SCADA)采集的数据进行归一化以及奇异值去除等预处理操作,将所述的数据分为训练数据和测试数据。根据风电机组的数据采集与监控系统采集的数据确定自联想神经网络模型的输入和输出节点数。
步骤2:设置种群数量N,最大迭代次数M,并随机生成N个个体作为初始种群,采用实数编码的方法对自联想神经网络的权值和阈值进行编码,每个个体包含自联想神经网络的全部权值、阈值以及它们的位置信息。
步骤3:对每个个体解码获取自联想神经网络的权值、阈值;训练自联想神经网络,计算个体适应度值。
步骤4:依据适应度值对个体降序排列,然后按照改进的选择算子对种群中的个体进行选取,除了精英保留策略选取的个体外,对其余选中个体的自适应交叉概率和自适应变异概率进行交叉和变异操作。
步骤5:判断适应度值是否满足要求或达到最大进化代数,若满足,则输出最优个体,否则进入步骤3。
步骤6:解码最优个体,并将权阈值信息赋予自联想神经网络的参数空间,并进行参数微调训练,然后将测试集输入故障诊断模型中,获得残差数据及其分布信息,对残差进行分析,验证算法的准确性及效率。
所述步骤1中的数据来自风电机组的数据采集与监控系统(SCADA),从数据采集与监控系统记录的相关数据中,选取有关变桨系统运行的数据信息,包含15个运行参数,分别为:当前风速、风机有功功率、叶片转速、发电机转速、风机3个叶片的桨距角和变桨驱动电流、变桨系统轴承温度、伺服电机温度、3个叶片的绝缘栅双极型晶体管(IGBT)温度。因此,自联想神经网络的输入和输出节点数为15。
去除功率为0、数值缺失、重复记录等无效数据,对处理后的数据进行归一化处理,获得风机变桨系统的样本集。归一化处理公式如下:
Figure BDA0002878010690000081
式中,xi为输入的数据,xmin、xmax分别输入数据的最小值和最大值,xi'为归一化后的数据。
如图2所示,本发明步骤1所述的自联想神经网络理论依据如下:
自联想神经网络提取变桨系统运行数据的主要特征和相互关联的同时,将其正常运行模式固化到网络中,通过比较劣化或故障时刻数据与正常运行数据残差分布的差异程度,更加准确、直观的反映变桨系统的健康状态。
在自联想神经网络中,输入数据经过输入层、映射层到达瓶颈层的过程属于编码过程;再通过瓶颈层到映射层最后到输出层的过程属于解码过程。首先高维数据通过输入层非线性映射到瓶颈层,实现对高维数据的压缩进而提取有效的特征维度。
设g(x)表示编码函数,xi作为输入,i为x的第i个维度。数据经过编码过程得出yi,其表达式为:
yi=gθ(xi)=s(Wxi+b)
式中,s(x)是非线性激活函数;θ=(W,b)是g(x)的参数;W代表权重;b是偏置。
然后,隐含层的yi由瓶颈层通过非线性函数再映射到与输入层相同维度的输出层实现信息的解码,即对输入数据的重构,其表达式为:
Figure BDA0002878010690000091
式中,θ'=(W',b')是h(y)的参数;W'代表权重;b'为偏置。
如此通过对数据的非线性的压缩和重构,自联想神经网络模型将会习得各个变量之间的非线性关系。对于输入为变桨系统正常运行的数据,自联想神经网络(AANN)会将正常运行时数据间的特性与关联固化到模型当中。自联想神经网络(AANN)模型训练时,以最小化输入与输出误差为目标,寻求最优网络参数,使输出尽可能还原输入数据。当输入劣化或故障时刻数据时,输出的数据就会和输入数据有较大偏差。
在对自联想神经网络(AANN)进行训练时,将训练样本数据yi作为模型的输入和期望输出,然后根据模型训练产生的输出
Figure BDA0002878010690000092
计算模型的误差平方和E,其公式如下:
Figure BDA0002878010690000093
式中,n为一个样本包含的变量个数;m为总共的样本数。
遗传算法(GA)是模拟自然界遗传和生物进化论而成的一种全局优化概率搜索算法。它将问题的潜在可能解看作一个种群,以适应度函数作为评判标准,经过选择、交叉、变异3个遗传算子产生下一代个体,不断进化迭代,直到找出最优的个体。相较于其他算法,标准遗传算法具有适应性强、全局寻优等优点,但也存在局部寻优能力差,导致其训练比较费时,在进化后期搜索效率较低,容易产生早熟问题,影响风机故障诊断的准确率。
本发明针对上述问题,从选择算子和适应度函数两个方面进行改进,提出一种改进自适应遗传算法(IAGA)用于提高原算法的搜索效率、局部寻优能力,避免早熟现象的发生,如图3所示具体如下:
1)选择算子:选择操作是根据适应度函数选出适应度高的个体进行繁衍产生下一代,常用的选择算子有轮盘赌法、排序法以及精英保留策略。轮盘赌法存在随机误差,可能会排除适应度高的个体,排序法及精英选择策略保留了优秀个体但可能破坏种群的多样性,导致算法易于陷入早熟收敛,同时及时发现风机变桨系统故障可以合理安排工作人员检修、提高风电机组的可靠性、增加风电场经济效应,为此,本发明在轮盘赌法的基础上进行改进,在保证种群多样性的同时加快收敛速度,选出较优个体,保证了风机故障诊断的时间和准确率,及时对风机变桨系统各类故障做出预警。轮盘赌法步骤如下:
(1)计算各个体适应度值;
(2)计算每个个体被选中的概率和累积概率;
(3)在[0,1]之间随机产生一个随机数r;
(4)依次比较累积概率与r的值,选中第一个大于r的值。
本发明改进选择算子的步骤如下:
(1)确定一个初始种群,依据适应度函数计算每个个体的适应度值;
(2)按照适应度大小将种群中的个体降序排序;
(3)根据当前迭代次数x和总迭代次数xmax,确定保留优秀个体的数量n,余下的个体使用轮盘赌法选择,然后将选出的个体进行交叉和变异操作。其中优秀个体的数量n的公式如下:
Figure BDA0002878010690000101
式中,P为要选出的优秀个体占总体的最大比例,N为种群个体总数,xmax为最大进化代数。
(4)进行精英保留操作,比较上一代和本代最优的个体,选出适应度最高的个体作为本代最优个体,并替换本代最差个体。为了保留其优秀基因,该个体不进行交叉和变异操作直接进入下一代。
2)设计适应度函数:遗传算法的目标是找出所有进化代中使自联想神经网络输出最小误差的对应的权值、阈值。因此选取自联想神经网络的输出值
Figure BDA0002878010690000103
与期望输出值y之间差的绝对值作为目标函数。
Figure BDA0002878010690000102
式中,m为自联想神经网络输出节点数。
遗传算法是朝着适应度函数值增大的方向进化,但自联想神经网络模型误差越小,模型越优,所以取目标函数的倒数作为适应度函数。同时风机故障诊断模型非常注重模型预测的准确性,因此本发明在上述适应度函数的基础上加入自联想神经网络的接收者操作特征曲线下方的面积AUC值,降低不平衡数据对风机变桨系统故障诊断模型诊断效果的干扰,提升诊断模型的准确性,准确识别出风机变桨系统的异常状态,降低误报率,改进后的适应度函数为:
Figure BDA0002878010690000111
式中,ζ为一个极小值,防止分母为0,k为调节系数。将个体解码赋给自联想神经网络的权值、阈值,再输入训练数据,求出接收者操作特征曲线下方的面积AUC值带代入公式中,即为该个体的适应度值。
3)自适应交叉和变异概率:交叉和变异算子实现对种群的更新,常规遗传算法使用恒定的交叉与变异概率,这会使算法搜索效率低下,且可能陷入局部最优,无法找出最优个体。本发明选用自适应的交叉和变异率,其公式如下:
Figure BDA0002878010690000112
Figure BDA0002878010690000113
式中,交叉率的上下限分别为Pc1、Pc2,变异率的上下限分别为Pm1、Pm2;fmax表示每代种群个体中最大的适应度值;favg为当前种群平均适应度值;f'为要进行交叉操作的两个个体中较大的适应度值;f为变异个体的适应度值。
4)由于本发明使用实数编码,所以交叉算子采用算数交叉算子,公式如下:
Figure BDA0002878010690000114
式中,
Figure BDA0002878010690000115
分别表示第t+1代的第k个以及第l个染色体(个体)的第i个基因;α为[0,1]内的随机数。
变异算子采用均匀变异的方法,选取第m个染色体中第j个基因进行变异操作,其染色体取值范围为[Umin,Umax],表达式为:
xmj=Umin+λ(Umax-Umin)
式中,λ为[0,1]内均匀分布的随机数。
步骤6中,本发明基于改进自适应遗传算法-自联想神经网络的方法,将风机变桨系统正常运行数据作为输入,获得模型输出残差,统计各个残差的频数,获得残差概率分布。以此为基准,当输入变桨系统故障数据后,模型的输出残差和概率分布情况就会与正常情况有所区别,通过计算这两种残差概率分布的相差程度即偏移度,判断风机变桨系统是否故障。
比较两个分布间的相似度,一般采用相对熵进行衡量,即库尔贝克-莱布勒(KL)散度。设p(x)表示数据的真实分布,q(x)为数据的拟合分布,则在离散型随机变量的情形下,库尔贝克-莱布勒(KL)散度计算公式如下:
Figure BDA0002878010690000121
将改进自适应遗传算法-自联想神经网络的风机故障诊断模型输出的残差范围分成n等份,统计落入每个残差区间中残差的个数,得到残差的概率分布p(xi)=xi/sp、q(xi)=xi/sq。其中p(xi)为变桨系统正常运行时残差落入区间i的比率,sp为变桨系统正常运行时所有区间的残差个数;q(xi)为故障时刻残差落入区间i的比率,sq为故障时刻所有区间的残差个数,xi为落入第i个区间的残差个数。
因为库尔贝克-莱布勒(KL)散度值域范围为[0,∞),无上界,并且具有不对称性,所以不适合作为阈值。为了更加准确的比较残差分布的偏移程度,本发明选用基于库尔贝克-莱布勒(KL)散度的变体詹森-山农(JS)散度,作为衡量两个残差分布差异的指标。其值域范围为[0,1],JS散度越小,表示分布越相似,分布完全相同是0,相反则为1。相较于库尔贝克-莱布勒(KL)散度,詹森-山农(JS)散度对相似度的判别更加确切,计算公式如下:
Figure BDA0002878010690000122
步骤3的适应度函数中的接收者操作特征曲线ROC和接收者操作特征曲线下方的面积AUC的计算方式如下:
由于风机故障数据相比于正常运行数据占比比较低,即使模型预测的全是正常状态,准确率也不会太低。因此训练模型时以准确率作为评判标准便不能较好的反应模型的诊断效果。而根据接收者操作特征曲线ROC计算曲线下方面积AUC,即使在正负样本不均衡的情况下,也不会发生很大变化,能较好的反应诊断模型的诊断效果,因此本发明选用接收者操作特征曲线下方面积AUC值作为模型评估指标。接收者操作特征曲线下方面积AUC值的计算要先通过混淆矩阵来定义一些指标,如表2所示:
表2混淆矩阵
Figure BDA0002878010690000131
表中,TP是真正例,表示模型诊断为故障,实际也是故障的事件;FN是假反例,表示模型诊断无故障,但实际有故障的事件;FP是假正例,表示模型诊断为故障,但实际无故障的事件;TN是真反例,表示模型诊断无故障,实际也是无故障的事件。
根据上述定义,得出如下指标:
准确率是模型正确诊断事件的比例,在正负样本较为均衡的情况下,准确率越高,模型的诊断效果越好。准确率(accuracy)的计算公式如下:
Figure BDA0002878010690000132
真正类率(TPR)表示在所有实际故障的事件中,被诊断模型正确识别的比例。
Figure BDA0002878010690000133
负正类率(FPR)表示在所有实际无故障的事件中,被诊断模型错误地判断为故障的比例。
Figure BDA0002878010690000134
分别以负正类率和真正类率为横纵坐标,以不同的阈值计算对应的负正类率、真正类率值,构成不同的点,将其连接起来即为接收者操作特征曲线,计算其与横坐标所围成的面积即为AUC。
步骤6中风机变桨系统正常运行模型是经过正常运行的数据训练的改进自适应遗传算法-自联想神经网络模型,该模型可以识别出风机变桨系统下正常运行时的各个工作状态。从测试集中选择一部分风机变桨系统故障时刻前后数据采集与监控系统(SCADA)记录的数据和正常运行时的数据作为改进自适应遗传算法-自联想神经网络模型的输入,利用詹森-山农(JS)散度计算模型输出残差分布和相应工况下正常分布的偏移度,考虑灵敏度以及模型的准确性,滑动窗口值选择为10。以故障数据的残差分布与正常分布的最小偏移度为界限,确定阈值。
本实施例选取华北某风电场1.5MW风电机组数据采集与监控系统(SCADA)收集的数据进行实验分析。经过多次试验,设置种群规模为60,最大进化代数200,交叉概率最大最小值分别为:Pc1=0.89,Pc2=0.58,变异概率最大最小值分别为:Pm1=0.15,Pm2=0.005。自联想神经网络输入节点数为15,映射层与解映射层节点为数9,瓶颈层节点数为5,学习率为0.02。
图4为本发明改进自适应遗传算法(IAGA)、改进遗传算法(AGA)和遗传算法(GA)三种优化算法的最优个体适应度曲线。从图4可以看出改进自适应遗传算法(IAGA)不仅在收敛速度上优于改进遗传算法(AGA)和遗传算法(GA),而且最终的适应度函数值也更大,拥有更好的参数寻优效果。
图5为本发明改进自适应遗传算法-自联想神经网络(IAGA-AANN)、改进遗传算法-自联想神经网络(AGA-AANN)和遗传算法-自联想神经网络(GA-AANN)模型训练误差曲线。改进遗传算法-自联想神经网络(GA-AANN)在迭代1592次时达到设定的精度要求;改进遗传算法-自联想神经网络(AGA-AANN)在迭代1075次时达到精度要求;而改进自适应遗传算法-自联想神经网络(IAGA-AANN)在迭代694次时达到精度要求,说明改进自适应遗传算法-自联想神经网络(IAGA-AANN)的收敛速度更快。
图6为部分训练数据残差分布的偏移度散点图。将经过预处理的包含变桨系统正常运行和故障时刻数据的训练集,带入改进自适应遗传算法-自联想神经网络模型中,比较经过詹森-山农(JS)散度计算的正常运行和故障时刻的残差分布偏移度,得到模型的阈值为0.39。已得到的模型阈值作为评判变桨系统是否故障的指标,使模型接收者操作特征曲线下的面积AUC最大化,即诊断模型的准确性最高。得出当窗口时间长度选取为50min时,接收者操作特征曲线下的面积AUC达到最佳值0.967。
本发明选取的某风电场在2019年5月11日3号风机变桨系统发生故障,因此选取故障前10天的数据来检验本文提出的故障诊断方法的有效性。利用训练好的改进自适应遗传算法-自联想神经网络(IAGA-AANN)故障诊断模型获取风机的的残差分布,得出的偏移度曲线如图7所示。从图7中可以看出,5月3日有一次超过阈值的情况,但其所占比例在滑动时间窗口内没有超过60%,所以判定为无效警报。在5月8日偏移度开始出现较大震荡,并有上升的趋势,5月10日偏移度超出阈值,并持续增大,判断该风机变桨系统非常可能发生故障,应停机检修。
为了更直观的比较这几种算法的性能,采用同一变桨系统测试集作为诊断模型的输入数据,对最小二乘支持向量机(LSSVM)、自联想神经网络(AANN)、遗传算法-自联想神经网络(GA-AANN)、改进自适应遗传算法-自联想神经网络(IAGA-AANN)等诊断模型的接收者操作特征曲线下的面积(AUC)以及准确率进行了比较,结果如表2所示。
表2改进自适应遗传算法-自联想神经网络(IAGA-AANN)与其他模型的对比
Figure BDA0002878010690000151
选取的测试集中包含的正负样本数较为均衡,所以此时准确率也可作为测试集中模型诊断效果的衡量指标。从表2可以看出改进自适应遗传算法-自联想神经网络(IAGA-AANN)诊断模型的接收者操作特征曲线下的面积(AUC)和准确率均明显高于其他模型,因此改进自适应遗传算法-自联想神经网络(IAGA-AANN)故障诊断模型的精确度较高,效果较好。
本发明实施例的核心构思在于:利用风机正常运行历史数据对模型进行训练,通过计算正常与故障时刻模型输出残差分布的詹森-山农(JS)散度,获取模型阈值,判断变桨系统是否故障。在评估指标中引入接收者操作特征曲线下的面积AUC值和时间窗口,进一步增加模型的准确性。采用风机变桨系统正常运行与故障时刻的数据进行实验分析,验证模型有效性。

Claims (4)

1.一种自联想神经网络诊断风机故障的方法,其特征在于,所述方法包括以下步骤:
步骤1:采用风电机组的数据采集与监控系统(SCADA)采集的数据进行归一化以及奇异值去除预处理操作,将所述的数据分为训练数据和测试数据;根据风电机组的数据采集与监控系统采集的数据确定自联想神经网络模型的输入和输出节点数;
步骤2:设置种群数量N,最大迭代次数M,并随机生成N个个体作为初始种群,采用实数编码的方法对自联想神经网络的权值和阈值进行编码,每个个体包含自联想神经网络的全部权值、阈值以及每个个体的位置信息;
步骤3:对每个个体解码获取自联想神经网络的权值、阈值;训练自联想神经网络,计算个体适应度值;
步骤4:依据适应度值对个体降序排列,然后按照改进的选择算子对种群中的个体进行选取,除了精英保留策略选取的个体外,对其余选中个体的自适应交叉概率和自适应变异概率进行交叉和变异操作;
步骤5:判断适应度值是否达到最大进化代数,若满足,则输出最优个体,否则进入步骤3;
步骤6:解码最优个体,并将权阈值信息赋予自联想神经网络的参数空间,进行参数微调训练,然后将测试数据输入自联想神经网络模型中,获得残差数据及其分布信息,对残差进行分析,验证算法的准确性及效率。
2.根据权利要求1所述的诊断风机故障的方法,其特征在于:所述步骤4选择算子公式的方法如下:
1)确定一个初始种群,依据适应度函数计算每个个体的适应度值;
2)按照适应度值的大小将种群中的个体降序排序;
3)根据当前迭代次数和总迭代次数,确定保留优秀个体的数量n,余下的个体使用轮盘赌法选择,然后将选出的个体进行交叉和变异操作;
保留优秀个体的数量n的计算公式如下:
Figure FDA0003362302880000011
式中,P为需要选出的优秀个体占总体的最大比例,N为种群个体总数,xmax为最大进化代数,n为优秀个体数量,x为进化代数,e为自然对数的底数;
4)进行精英保留操作;比较上一代和本代最优的个体,选出适应度最高的个体作为本代最优个体,并替换本代最差个体。
3.根据权利要求2所述的诊断风机故障的方法,其特征在于:所述适应度函数为适合风机变桨系统故障诊断的适应度函数,所述步骤3设计适应度函数的方法如下:
选取自联想神经网络的输出值
Figure FDA0003362302880000021
与期望输出值y之差的绝对值作为目标函数Jm;取目标函数的倒数作为适应度函数;Jm目标函数的计算公式为:
Figure FDA0003362302880000022
式中,m为自联想神经网络输出节点数;
在现有遗传算法适应度函数的基础上加入自联想神经网络的接收者操作特征曲线ROC下方的面积AUC值;
适应度函数f(xi)计算公式为:
Figure FDA0003362302880000023
式中,ζ为一个极小值,防止分母为0,k为调节系数,f(xi)为改进的适应度函数;Jm为目标函数,AUC为接收者操作特征曲线ROC下方的面积;
将个体解码赋给自联想神经网络AANN的权值、阈值,再输入训练数据,可求出接收者操作特征曲线ROC下方的面积AUC值。
4.根据权利要求1所述的诊断风机故障的方法,其特征在于:所述步骤6中,使用库尔贝克-莱布勒(KL)散度的变体詹森-山农(JS)散度分析残差数据及其分布,詹森-山农(JS)散度是库尔贝克-莱布勒(KL)散度的变体,其中库尔贝克-莱布勒(KL)散度的计算公式为:
Figure FDA0003362302880000024
将风机故障诊断得到的残差范围分成n等份,统计落入每个残差区间中残差的个数,得到残差的概率分布p(xi)=xi/sp、q(xi)=xi/sq;其中p(xi)为变桨系统正常运行时残差落入区间i的比率,sp为变桨系统正常运行时所有区间的残差个数;q(xi)为故障时刻残差落入区间i的比率,sq为故障时刻所有区间的残差个数,xi为落入第i个区间的残差个数,n为模型输出的残差范围等分区间的个数,i为模型输出残差的第i个区间;
相较于库尔贝克-莱布勒(KL)散度,詹森-山农(JS)散度对相似度的判别更加准确,詹森-山农(JS)散度的计算公式JS(p||q)如下:
Figure FDA0003362302880000031
式中,p为数据的真实分布,q为数据的拟合分布。
CN202011639678.6A 2020-12-31 2020-12-31 一种自联想神经网络诊断风机故障方法 Active CN112746934B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011639678.6A CN112746934B (zh) 2020-12-31 2020-12-31 一种自联想神经网络诊断风机故障方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011639678.6A CN112746934B (zh) 2020-12-31 2020-12-31 一种自联想神经网络诊断风机故障方法

Publications (2)

Publication Number Publication Date
CN112746934A CN112746934A (zh) 2021-05-04
CN112746934B true CN112746934B (zh) 2022-03-15

Family

ID=75651184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011639678.6A Active CN112746934B (zh) 2020-12-31 2020-12-31 一种自联想神经网络诊断风机故障方法

Country Status (1)

Country Link
CN (1) CN112746934B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113760951A (zh) * 2021-08-06 2021-12-07 梁晓伟 一种配网关键词自动联想方法
CN114295377B (zh) * 2021-12-13 2023-04-18 南京工业大学 一种基于遗传算法的cnn-lstm轴承故障诊断方法
CN114757300B (zh) * 2022-05-06 2023-04-28 西南交通大学 一种基于ga改进的wnn的igbt模块故障预测方法
CN115856623A (zh) * 2022-12-13 2023-03-28 淮阴工学院 一种基于均匀度与峰度计算的电机故障诊断方法
CN116029356B (zh) * 2023-03-24 2023-06-13 杭州景业智能科技股份有限公司 刀具监测模型训练方法、刀具状态监测方法及相关装置
CN117057676B (zh) * 2023-10-11 2024-02-23 深圳润世华软件和信息技术服务有限公司 多数据融合的故障分析方法、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109709483A (zh) * 2018-12-26 2019-05-03 天津瑞源电气有限公司 一种风电机组变桨距系统故障诊断方法
CN110410282A (zh) * 2019-07-24 2019-11-05 河北工业大学 基于som-mqe和sfcm的风电机组健康状态在线监测及故障诊断方法
CN111506049A (zh) * 2020-04-27 2020-08-07 西北工业大学 基于aann网络系统的航空发动机控制系统多重故障诊断方法
CN112115999A (zh) * 2020-09-15 2020-12-22 燕山大学 一种时空多尺度神经网络的风电机组故障诊断方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120209539A1 (en) * 2011-02-10 2012-08-16 Honeywell International Inc. Turbine fault analysis
US20180335018A1 (en) * 2017-05-16 2018-11-22 Frontier Wind, Llc Turbine Loads Determination and Condition Monitoring

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109709483A (zh) * 2018-12-26 2019-05-03 天津瑞源电气有限公司 一种风电机组变桨距系统故障诊断方法
CN110410282A (zh) * 2019-07-24 2019-11-05 河北工业大学 基于som-mqe和sfcm的风电机组健康状态在线监测及故障诊断方法
CN111506049A (zh) * 2020-04-27 2020-08-07 西北工业大学 基于aann网络系统的航空发动机控制系统多重故障诊断方法
CN112115999A (zh) * 2020-09-15 2020-12-22 燕山大学 一种时空多尺度神经网络的风电机组故障诊断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于BP神经网络的风机转子故障诊断;王立鹏等;《沈阳工业大学学报》;20021030;第24卷(第5期);第429-431页 *

Also Published As

Publication number Publication date
CN112746934A (zh) 2021-05-04

Similar Documents

Publication Publication Date Title
CN112746934B (zh) 一种自联想神经网络诊断风机故障方法
CN111237134B (zh) 一种基于GRA-LSTM-stacking模型的海上双馈风力发电机故障诊断方法
CN116380445B (zh) 基于振动波形的设备状态诊断方法及相关装置
CN110796281B (zh) 基于改进深度信念网络的风电机组状态参数预测方法
CN111950505A (zh) 一种ssa-aann的风力发电机传感器状态评估方法
CN113107785B (zh) 一种风电机组功率性能异常的实时监测方法及装置
CN111581597A (zh) 基于自组织核回归模型的风电机组齿轮箱轴承温度状态监测方法
CN111931851B (zh) 一种基于一维残差神经网络的风机叶片结冰故障诊断方法
CN111461564A (zh) 基于云模型和最优组合赋权的风电机组功率特性评估方法
CN110458039A (zh) 一种工业过程故障诊断模型的构建方法及其应用
CN115294671A (zh) 一种空压机出口压力预测方法和预测系统
CN111461565A (zh) 一种电力调控下的电源侧发电性能评估方法
CN115293274A (zh) 一种基于对抗交替型滑动窗口的时间序列突变点检测方法
CN118188342A (zh) 一种面向风机的故障预警与寿命预测方法
CN117913806A (zh) 一种融合知识驱动的LightGBM-GRU风电功率组合预测方法
CN117232809A (zh) 基于dematel-anp-critic组合赋权的风机主轴故障预诊断方法
CN113469252A (zh) 一种考虑不平衡样本的特高压换流阀运行状态评估方法
CN115795999B (zh) 一种长期服役抽水蓄能机组性能异常预警方法
CN116070669B (zh) 一种基于改进深度置信网络的车间能耗预测方法与管理系统
CN116910677A (zh) 一种工业仪表故障诊断方法及系统
CN116401545A (zh) 一种多模型融合的水轮机振摆分析方法
US11339763B2 (en) Method for windmill farm monitoring
CN114970709A (zh) 基于改进ga的数据驱动型ahu多故障诊断特征选择方法
CN117910550B (zh) 一种基于深度学习的无油超高速离心压缩机自动优化系统
CN117893030B (zh) 基于大数据的电力系统风险预警方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant