CN114218991A - 一种基于加权BP-AdaBoost的转子故障诊断方法 - Google Patents

一种基于加权BP-AdaBoost的转子故障诊断方法 Download PDF

Info

Publication number
CN114218991A
CN114218991A CN202111634135.XA CN202111634135A CN114218991A CN 114218991 A CN114218991 A CN 114218991A CN 202111634135 A CN202111634135 A CN 202111634135A CN 114218991 A CN114218991 A CN 114218991A
Authority
CN
China
Prior art keywords
adaboost
sample set
rotor
weighted
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111634135.XA
Other languages
English (en)
Inventor
刘杨
赵晨诚
鲁欢欢
梁海英
陈海洋
崔宁远
包魁元
尹子键
单玥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN202111634135.XA priority Critical patent/CN114218991A/zh
Publication of CN114218991A publication Critical patent/CN114218991A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Signal Processing (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明提供一种基于加权BP‑AdaBoost的转子故障诊断方法,涉及转子故障诊断领域。利用传感器测得转子振动信号,从不同角度对转子状态特征进行提取,得到转子系统状态特征向量,而后计算初始特征向量的方差,根据方差值大小,合理地选择特征向量维度,利用BP神经网络作为AdaBoost算法的基分类器,构建二值分类器,并通过组合若干二值分类器,构建多分类分类器。针对组合式多分类分类器决策时存在的问题,本发明提出了基于验证样本的非模糊解系数,并结合K折交叉验证,得到了加权BP‑AdaBoost多分类器,完成了转子故障诊断。通过实验验证,该方法在故障类型识别和故障程度识别中均有较好的效果。

Description

一种基于加权BP-AdaBoost的转子故障诊断方法
技术领域
本发明涉及转子故障诊断领域,尤其涉及一种基于加权BP-AdaBoost的转子故障诊断方法。
背景技术
近年来,复杂机械的状态监测受到了越来越多的关注,其广泛应用于关键机械中,并且由于存在过多的部件特征而导致诊断困难,典型的例子包括:航空发动机、直升机齿轮箱和风力涡轮机。旋转机械在许多领域发挥着不可替代的作用,如国防和军事、交通运输和航空航天领域,而在故障诊断过程中,转子故障是最常见的现象。
机械转子系统在经历一定时间的负载运行的情况下,难免会出现一些机械故障,常见的转子系统故障有:转子不平衡、转子不对中、碰摩、转子裂纹、螺栓松动等。如果能及时诊断出故障的类型和故障程度,对于保证正常的生产及其安全来说就显得尤为重要。
近些年来,以机器学习方法为主的检测方法逐渐引起了学者们的广泛关注。在转子故障识别中,比较经典的方法通常是支持向量机、K-最邻近和决策树等,人工神经网络和提升方法凭借较好的泛化性能和鲁棒性,得到了越来越多的关注。
现实世界是一个非线性的复杂系统,人工神经元处于激活或抑制状态,表现为数学上的非线性关系,神经网络将知识存储于连接权值中,可以实现各种非线性映射,凭借在处理非线性问题中的优越性,人工神经网络得到了广泛的应用,其中BP神经网络是最为典型的。人工神经网络输入新的训练样本,网络能够自动调整结构参数,改变映射关系,从而对特定的输入产生相应的期望输出,其中每个神经元都可以根据接收到的信息进行独立运算和处理,同一层中的不同神经元可以同时进行运算。
提升(Boosting)方法是一种常用的统计学习方法,在分类问题中,通过改变训练样本的权重,学习多个分类器,并将多个分类器线性组合,提高分类性能。自适应提升(Adaptive Boosting)算法是提升(Boosting)方法的典型代表。自适应提升(AdaptiveBoosting)算法在二分类问题上有着很多成功的应用,然而在多分类问题上该算法的应用存在一些问题。自适应提升(Adaptive Boosting)算法的理论要求每个弱分类器的误差小于1/2,这对于二分类问题很容易满足,因为二分类中随机猜测的错误率为1/2,而在多类情况下,这就很难实现了,随机猜测错误率为(K-1)/K,K为分类类别。
发明内容
针对现有技术的不足,本发明提供一种基于加权BP-AdaBoost的转子故障诊断方法。
一种基于加权BP-AdaBoost的转子故障诊断方法,具体步骤为:
步骤1:提取转子状态参数和特征选择;利用加速度传感器测得转子的振动信号,将转子振动信号时域、频域和时频域的特征组合构建转子状态特征集;并利用方差方法进行特征选择排序,构造低维特征子集;
步骤1.1:提取转子振动信号时域特征;
时域特征包括:峰值Peak、均值Mean、均方根Root mean square、峭度指标Kurtosis factor、裕度指标Clearance factor、波形指标Shape factor、脉冲指标Impulsefactor和峰值指标Crest factor;
Peak=max(|x|),用TF1表示;
Figure BDA0003441135570000021
用TF2表示;
Figure BDA0003441135570000022
用TF3表示;
Figure BDA0003441135570000023
用TF4表示;
Figure BDA0003441135570000024
用TF5表示;
Figure BDA0003441135570000025
用TF6表示;
Figure BDA0003441135570000026
用TF7表示;
Figure BDA0003441135570000027
用TF8表示;
式中x表示样本的振动信号,xn表示x其中的点;RMS表示均方根;N表示振动信号的采样点数,
Figure BDA00034411355700000212
表示均值,σ表示标准差,max表示最大值;
步骤1.2:提取转子振动信号频域特征;
频域特征包括:平均频率MF、重心频率FC、均方根频率RMFS和标准差频率RVF;
Figure BDA0003441135570000028
用FF1表示;
Figure BDA0003441135570000029
用FF2表示;
Figure BDA00034411355700000210
用FF3表示;
Figure BDA00034411355700000211
用FF4表示;
式中,s表示幅值,h表示频率;sm是s其中的点;hm是h中的一点;q表示频率点的数量;
步骤1.3:提取转子振动信号时频域特征;
时频域下利用小波变换进行三层分解得到节点,计算出每个节点的能量,并且计算出每个节点能量占所有节点总能量的比值;即能量比E={E1,E2,E3,E4,E5,E6,E7,E8};将能量比作为时频域下的特征;
步骤1.4:转子状态特征集合的构建;
将时域、频域和时频域下的特征进行组合,得到转子状态特征集合F;
F={FF1,FF2,FF3,FF4,TF1,TF2,TF3,TF4,TF5,TF6,TF7,TF8,E1,E2,E3,E4,E5,E6,E7,E8};
步骤1.5:基于方差构建低维特征子集;
对转子状态特征集合F中的每个特征进行方差计算如下:
Figure BDA0003441135570000031
其中,N表示样本数量,yi表示独立样本的单个特征,
Figure BDA0003441135570000038
表示样本特征的均值;
转子状态特征集F有M维特征,M表示特征集合F中特征的数量;由上式(1)计算出所有特征对应的方差,表示为:
Figure BDA0003441135570000032
式中,
Figure BDA0003441135570000033
表示第i个特征的方差;
再对方差σ2进行归一化处理,得到
Figure BDA0003441135570000034
为:
Figure BDA0003441135570000035
式中
Figure BDA0003441135570000036
表示第i个特征的归一化方差;
根据方差值大小得到具有一定序列的特征集合,设定方差阈值选择特征维度,构造低维特征子集;
步骤2:将步骤1得到的低维特征子集进行比例划分,得到训练样本集C1和测试样本集O1;按照K折交叉验证思想对训练样本集C1进行处理;
按照K折交叉验证思想对训练样本集C1处理,即将训练样本集C1分为样本数量相等的K份,表示为[Λ12,…,Λi,…,ΛK-1K],不重复的选取其中(K-1)/K为训练样本集C,1/K为验证样本集V,用矩阵Λ表示:
Figure BDA0003441135570000037
矩阵中,第一行到最后一行为K折交叉验证得到的K轮训练样本集C和验证样本集V,每一行的前K-1列为训练样本集C:
Figure BDA0003441135570000041
每一行的第K列为验证样本集V:
Figure BDA0003441135570000042
步骤3:设定循环次数K,依次选择Λ中的每一行元素,循环到第i次时,i∈[1,K],得到训练样本集C2和验证样本集V1:
C2=[Λ12,…,Λi-1i+1,…,ΛK]
V1=[Λi]
通过AdaBoost算法,得到BP-AdaBoost二分类模型;利用一对其余策略即OneAgainst All模式,通过组合多个二分类式的BP-AdaBoost分类器,用以搭建M-BP-AdaBoost多分类模型;K轮循环结束后得到K个M-BP-AdaBoost多分类模型;
步骤3.1:对划分后得到的训练样本集C2进行预处理,依次提取出某一状态的转子故障样本,其标签用y∈{+1}表示,余下状态的转子故障样本的标签都用y∈{-1}表示,经过预处理得到的训练样本集,记作:U=[U1,U2,…,Ui,…,UM];
步骤3.2:通过AdaBoost算法,得到BP-AdaBoost二分类模型;通过BP-AdaBoost算法对预处理得到的训练样本集U=[U1,U2,…,Ui,…,UM]进行训练,得到关于M类分类问题的若干二类分类器h=[h1,h2,…,hi,…,hM];组合多个二分类式的BP-AdaBoost分类器,搭建多分类模型;
步骤3.2.1:AdaBoost算法通过提高前一轮弱分类器错误分类样本的权值和降低被正确分类样本的权值,并采取加权多数表决的方法来提升分类的效果;利用BP神经网络作为AdaBoost的基学习器,组建BP-AdaBoost二分类模型;
步骤3.2.1.1:首先输入一个训练样本集Ui
Ui={(x1,y1),(x2,y2),…,(xi,yi),…,(xN,yN)}
其中,每个样本点由样本实例和样本标记组成;样本实例xi∈χ∈Rn,表示第i个样本的特征向量,χ为实例空间,样本标记yi∈Y={-1,+1},yi第i个样本的标签类别,Y为标记空间;
步骤3.2.1.2:初始化训练样本集Ui的权值分布;每一个训练样本都被赋予相同的权值:
Figure BDA0003441135570000051
式中ω1,i表示每个训练样本的初始权重,N表示训练样本的数量;
训练样本集Ui的初始权重向量分布为:
Figure BDA0003441135570000052
步骤3.2.1.3:建立迭代终止条件et<r,如不满足终止条件,重复步骤A1-A5得到T个基学习器,利用T个基学习器构造强分类器;直到满足终止条件或T>10时,则执行步骤3.2.2;et表示每轮的分类误差率,r表示根据训练要求给定训练误差率的阈值;如满足终止条件则得到BP-AdaBoost二分类模型,执行步骤3.2.2;
步骤A1:根据上述训练样本集Ui的初始权重分布,得到第t个基学习器;
Gt(x):χ→{-1,+1}
式中,Gt(x)表示基学习器,即BP神经网络;
步骤A2:计算Gt(x)在训练样本集Ui的初始权重分布上的分类误差率:
Figure BDA0003441135570000053
式中ωt,i表示第t轮中的第i个样本的权重,I(Gt(xi)≠yi)为指示函数,当预测结果Gt(xi)与真实结果yi不等时,I(Gt(xi)≠yi)取值为1,其他情况取值为0;
步骤A3:计算Gt(x)的系数,即基学习器对应的权重:
Figure BDA0003441135570000054
式中αt表示每个基学习器的权重,et表示分类误差率;
步骤A4:更新训练样本Ui的权重:
Dt+1=(ωt+1,1t+1,2,...,ωt+1,N)
Figure BDA0003441135570000061
其中,Zt是规范化因子,exp为以e为底的指数函数;
Figure BDA0003441135570000062
步骤A5:把T个基学习器组合起来,构建强二分类器模型;
Figure BDA0003441135570000063
Figure BDA0003441135570000064
式中f(x)表示及分类器的线性组合,sign表示符号函数;G(x)表示强二分类器;T是基学习器的数量;
步骤3.2.2:步骤3.2.1构建了基于BP-AdaBoost的二分类模型,将步骤3.2.1循环M次,得到关于M类分类问题的二类分类器组合h=[h1,h2,…,hi,…,hM];至此,多个二分类式的BP-AdaBoost分类器的组合完成,记作M-BP-AdaBoost多分类模型;
步骤3.3:K轮循环结束后,可以得到K个M-BP-AdaBoost多分类模型,记作[M1,M2,…MK];
步骤4:基于验证样本集V提取K个M-BP-AdaBoost模型的非模糊解权重;
步骤4.1:将验证样本集V=[ΛKK-1,…,Λi,…,Λ1]T依次带入K个M-BP-AdaBoost模型中,根据验证样本集的分类模糊情况,提取非模糊解权重;针对每个M-BP-AdaBoost模型挑选出验证样本集Λi,表示第i个验证样本的预测标签中仅有一个BP-AdaBoost二分类器给出y∈{+1},其余BP-AdaBoost二分类器给出y∈{-1}的验证样本;非模糊解数量与验证样本集Λi总数进行对比,确定非模糊解所占比例,记作非模糊解权重γi
Figure BDA0003441135570000065
式中,γi为第i个M-BP-AdaBoost多分类模型非模糊解权重,
Figure BDA0003441135570000066
为第i轮的非模糊解的数量,ψi为第i轮的验证样本集中验证样本总数;
步骤4.2:K个M-BP-AdaBoost模型的非模糊解权重向量γ:
γ=[γ1,…,γK]
式中γ1~γK表示K个M-BP-AdaBoost模型中每个M-BP-AdaBoost模型对应的非模糊解权重;
步骤5:构建加权BP-AdaBoost多分类模型;
利用步骤3建立的多分类模型M-BP-AdaBoost和步骤4提取的K个M-BP-AdaBoost多分类模型的非模糊解权重,二者结合可以得到加权BP-AdaBoost多分类模型,表示为Model;
Model=[γ1,…,γK][M1,M2,…MK]T
至此完成加权BP-AdaBoost多分类模型的建立;
步骤6:利用加权BP-AdaBoost多分类模型Model对测试样本集O1进行预测;
利用加权BP-AdaBoost多分类模型Model,把测试样本集O1输入加权BP-AdaBoost多分类模型Model中,预测测试样本集O1中每个样本对应的标签类别;
步骤6.1:将测试样本集O1带入K个M-BP-AdaBoost多分类模型中,预测的结果S表示为:
Figure BDA0003441135570000071
sKn为第K个M-BP-AdaBoost测试样本集O1的预测结果;
简化为:S=[s1,s2,…,si,…,sK]T,其中si=[si1si2…sin](i=1,2,…,K);
步骤6.2:结合K个非模糊解权重向量γ和K个M-BP-AdaBoost多分类模型预测的结果S,得到加权测试特征解
Figure BDA0003441135570000072
表示为:
Figure BDA0003441135570000073
式中γ表示多分类器非模糊解权重,S表示分类BP-AdaBoost模型预测的结果;
Figure BDA0003441135570000074
Figure BDA0003441135570000075
中,每个测试样本O1在每类标签下均有一个数值,最大数值对应的标签为测试样本O1中每个样本的预测结果。
本发明的有益效果:
一种基于加权BP-AdaBoost的转子故障诊断方法在二分类问题和多分类问题中都具有普适性,该方法通过训练阶段的样本加权和验证阶段的多分类器加权,均化了误差的影响,在一定程度上提高了识别效果。本发明为二分类算法应用于多分类问题提供了解决思路,其中提出的非模糊解系数,既能验证训练效果,又对测试结论起到加权作用;基于非模糊解系数的加权测试解,经实验验证,对转子故障类型和故障程度具有较高的识别效果。与此同时,利用机器学习方法和振动信号分析转子系统,较好地解决了转子系统故障及其程度识别的问题,能够让使用者更精确的发现系统中存在的故障。
附图说明
图1为本发明实施例BP神经网络结构图。
图2为本发明实施例BP-AdaBoost模型图。
图3为本发明实施例基于BP-AdaBoost的多分类模型图。
图4为本发明实施例基于非模糊解加权BP-AdaBoost的流程图。
图5为本发明实施例转子故障设计示意图。
具体实施方式
下面结合附图和实施例对本发明做进一步说明,一种基于加权BP-AdaBoost的转子故障诊断方法具体为:
步骤1:提取转子状态参数和特征选择;利用加速度传感器测得转子的振动信号,将转子振动信号时域、频域和时频域的特征组合构建转子状态特征集;并利用方差方法进行特征选择排序,构造低维特征子集;
步骤1.1:提取转子振动信号时域特征;
时域特征包括:峰值Peak、均值Mean、均方根Root mean square、峭度指标Kurtosis factor、裕度指标Clearance factor、波形指标Shape factor、脉冲指标Impulsefactor和峰值指标Crest factor;
Peak=max(|x|),用TF1表示;
Figure BDA0003441135570000081
用TF2表示;
Figure BDA0003441135570000082
用TF3表示;
Figure BDA0003441135570000083
用TF4表示;
Figure BDA0003441135570000084
用TF5表示;
Figure BDA0003441135570000085
用TF6表示;
Figure BDA0003441135570000086
用TF7表示;
Figure BDA0003441135570000087
用TF8表示;
式中x表示样本的振动信号,xn表示x其中的点;RMS表示均方根;N表示振动信号的采样点数,
Figure BDA0003441135570000088
表示均值,σ表示标准差,max表示最大值;
步骤1.2:提取转子振动信号频域特征;
频域特征包括:平均频率MF、重心频率FC、均方根频率RMFS和标准差频率RVF;
Figure BDA0003441135570000089
用FF1表示;
Figure BDA0003441135570000091
用FF2表示;
Figure BDA0003441135570000092
用FF3表示;
Figure BDA0003441135570000093
用FF4表示;
式中,s表示幅值,h表示频率;sm是s其中的点;hm是h中的一点;q表示频率点的数量;
步骤1.3:提取转子振动信号时频域特征;
时频域下利用小波变换进行三层分解得到节点,计算出每个节点的能量,并且计算出每个节点能量占所有节点总能量的比值;即能量比E={E1,E2,E3,E4,E5,E6,E7,E8};将能量比作为时频域下的特征;
步骤1.4:转子状态特征集合的构建;
将时域、频域和时频域下的特征进行组合,得到转子状态特征集合F;
F={FF1,FF2,FF3,FF4,TF1,TF2,TF3,TF4,TF5,TF6,TF7,TF8,E1,E2,E3,E4,E5,E6,E7,E8};
步骤1.5:基于方差构建低维特征子集;
对转子状态特征集合F中的每个特征进行方差计算如下:
Figure BDA0003441135570000094
其中,N表示样本数量,yi表示独立样本的单个特征,
Figure BDA0003441135570000095
表示样本特征的均值;
转子状态特征集F有M维特征,M表示特征集合F中特征的数量;由上式(1)计算出所有特征对应的方差,表示为:
Figure BDA0003441135570000096
式中,
Figure BDA0003441135570000097
表示第i个特征的方差;
再对方差σ2进行归一化处理,得到
Figure BDA0003441135570000098
为:
Figure BDA0003441135570000099
式中
Figure BDA00034411355700000910
表示第i个特征的归一化方差;
根据方差值大小得到具有一定序列的特征集合,设定方差阈值选择特征维度,构造低维特征子集;
根据转子故障设计示意图5设计需要识别的故障类型。
利用涡流传感器采集正常、不对中、不平衡和碰摩四种转子状态的振动信号,对信号进行滑动截取,构造一定数量的样本,并对这些样本提取时域、频域和时频域特征,组成特征集合。转子故障的描述如下表1:
Figure BDA0003441135570000101
步骤2:将步骤1得到的低维特征子集进行比例划分,得到训练样本集C1和测试样本集O1;按照K折交叉验证思想对训练样本集C1进行处理;
按照K折交叉验证思想对训练样本集C1处理,即将训练样本集C1分为样本数量相等的K份,表示为[Λ12,…,Λi,…,ΛK-1K],不重复的选取其中(K-1)/K为训练样本集C,1/K为验证样本集V,用矩阵Λ表示:
Figure BDA0003441135570000102
矩阵中,第一行到最后一行为K折交叉验证得到的K轮训练样本集C和验证样本集V,每一行的前K-1列为训练样本集C:
Figure BDA0003441135570000103
每一行的第K列为验证样本集V:
Figure BDA0003441135570000104
步骤3:设定循环次数K,依次选择Λ中的每一行元素,循环到第i次时,i∈[1,K],得到训练样本集C2和验证样本集V1:
C2=[Λ12,…,Λi-1i+1,…,ΛK]
V1=[Λi]
通过AdaBoost算法,得到BP-AdaBoost二分类模型;利用一对其余策略即OneAgainst All模式,通过组合多个二分类式的BP-AdaBoost分类器,用以搭建M-BP-AdaBoost多分类模型;K轮循环结束后得到K个M-BP-AdaBoost多分类模型;BP神经网络结构图如图1所示;
步骤3.1:对划分后得到的训练样本集C2进行预处理,依次提取出某一状态的转子故障样本,其标签用y∈{+1}表示,余下状态的转子故障样本的标签都用y∈{-1}表示,经过预处理得到的训练样本集,记作:U=[U1,U2,…,Ui,…,UM];
步骤3.2:通过AdaBoost算法,得到BP-AdaBoost二分类模型;通过BP-AdaBoost算法对预处理得到的训练样本集U=[U1,U2,…,Ui,…,UM]进行训练,得到关于M类分类问题的若干二类分类器h=[h1,h2,…,hi,…,hM];组合多个二分类式的BP-AdaBoost分类器,搭建多分类模型;
步骤3.2.1:AdaBoost算法通过提高前一轮弱分类器错误分类样本的权值和降低被正确分类样本的权值,并采取加权多数表决的方法来提升分类的效果;利用BP神经网络作为AdaBoost的基学习器,组建BP-AdaBoost二分类模型;BP-AdaBoost模型图如图2所示;
步骤3.2.1.1:首先输入一个训练样本集Ui
Ui={(x1,y1),(x2,y2),…,(xi,yi),…,(xN,yN)}
其中,每个样本点由样本实例和样本标记组成;样本实例xi∈χ∈Rn,表示第i个样本的特征向量,χ为实例空间,样本标记yi∈Y={-1,+1},yi第i个样本的标签类别,Y为标记空间;
步骤3.2.1.2:初始化训练样本集Ui的权值分布;每一个训练样本都被赋予相同的权值:
Figure BDA0003441135570000111
式中ω1,i表示每个训练样本的初始权重,N表示训练样本的数量;
训练样本集Ui的初始权重向量分布为:
Figure BDA0003441135570000112
步骤3.2.1.3:建立迭代终止条件et<r,如不满足终止条件,重复步骤A1-A5得到T个基学习器,利用T个基学习器构造强分类器;直到满足终止条件或T>10时,则执行步骤3.2.2;et表示每轮的分类误差率,r表示根据训练要求给定训练误差率的阈值;如满足终止条件则得到BP-AdaBoost二分类模型,执行步骤3.2.2;
步骤A1:根据上述训练样本集Ui的初始权重分布,得到第t个基学习器;
Gt(x):χ→{-1,+1}
式中,Gt(x)表示基学习器,即BP神经网络;
步骤A2:计算Gt(x)在训练样本集Ui的初始权重分布上的分类误差率:
Figure BDA0003441135570000121
式中ωt,i表示第t轮中的第i个样本的权重,I(Gt(xi)≠yi)为指示函数,当预测结果Gt(xi)与真实结果yi不等时,I(Gt(xi)≠yi)取值为1,其他情况取值为0;
步骤A3:计算Gt(x)的系数,即基学习器对应的权重:
Figure BDA0003441135570000122
式中αt表示每个基学习器的权重,et表示分类误差率;
步骤A4:更新训练样本Ui的权重:
Dt+1=(ωt+1,1t+1,2,...,ωt+1,N)
Figure BDA0003441135570000123
其中,Zt是规范化因子,exp为以e为底的指数函数;
Figure BDA0003441135570000124
步骤A5:把T个基学习器组合起来,构建强二分类器模型;
Figure BDA0003441135570000125
Figure BDA0003441135570000126
式中f(x)表示及分类器的线性组合,sign表示符号函数;G(x)表示强二分类器;T是基学习器的数量;
步骤3.2.2:步骤3.2.1构建了基于BP-AdaBoost的二分类模型,将步骤3.2.1循环M次,得到关于M类分类问题的二类分类器组合h=[h1,h2,…,hi,…,hM];至此,多个二分类式的BP-AdaBoost分类器的组合完成,记作M-BP-AdaBoost多分类模型;基于BP-AdaBoost的多分类模型图如附图3所示。
步骤3.3:K轮循环结束后,可以得到K个M-BP-AdaBoost多分类模型,记作[M1,M2,…MK];
步骤4:基于验证样本集V提取M-BP-AdaBoost模型的非模糊解权重;
步骤4.1:将验证样本集V=[ΛKK-1,…,Λi,…,Λ1]T依次带入K个M-BP-AdaBoost模型中,根据验证样本集的分类模糊情况,提取非模糊解权重;针对每个M-BP-AdaBoost模型挑选出验证样本集Λi,表示第i个验证样本的预测标签中仅有一个BP-AdaBoost二分类器给出y∈{+1},其余BP-AdaBoost二分类器给出y∈{-1}的验证样本;非模糊解数量与验证样本集Λi总数进行对比,确定非模糊解所占比例,记作非模糊解权重γi
Figure BDA0003441135570000131
式中,γi为第i个M-BP-AdaBoost多分类模型非模糊解权重,
Figure BDA0003441135570000132
为第i轮的非模糊解的数量,ψi为第i轮的验证样本集中验证样本总数;
步骤4.2:K个M-BP-AdaBoost模型的非模糊解权重向量γ:
γ=[γ1,…,γK]
式中γ1~γK表示K个M-BP-AdaBoost模型中每个M-BP-AdaBoost模型对应的非模糊解权重;
步骤5:构建加权BP-AdaBoost多分类模型;
利用步骤3建立的多分类模型M-BP-AdaBoost和步骤4提取的K个M-BP-AdaBoost多分类模型的非模糊解权重,二者结合可以得到加权BP-AdaBoost多分类模型,表示为Model;
Model=[γ1,…,γK][M1,M2,…MK]T
至此完成加权BP-AdaBoost多分类模型的建立;基于非模糊解加权BP-AdaBoost的流程图如附图4所示。
步骤6:利用加权BP-AdaBoost多分类模型Model对测试样本集O1进行预测;
利用加权BP-AdaBoost多分类模型Model,把测试样本集O1输入加权BP-AdaBoost多分类模型Model中,预测测试样本集O1中每个样本对应的标签类别;
步骤6.1:将测试样本集O1带入K个M-BP-AdaBoost多分类模型中,预测的结果S表示为:
Figure BDA0003441135570000133
sKn为第K个M-BP-AdaBoost测试样本集O1的预测结果;
简化为:S=[s1,s2,…,si,…,sK]T,其中si=[si1si2…sin](i=1,2,…,K);
步骤6.2:结合K个非模糊解权重向量γ和K个M-BP-AdaBoost多分类模型预测的结果S,得到加权测试特征解
Figure BDA0003441135570000141
表示为:
Figure BDA0003441135570000142
式中γ表示多分类器非模糊解权重,S表示分类BP-AdaBoost模型预测的结果;
Figure BDA0003441135570000143
Figure BDA0003441135570000144
中,每个测试样本O1在每类标签下均有一个数值,最大数值对应的标签为测试样本O1中每个样本的预测结果。
根据方差对上述表1特征进行排序,得到特征序列,选取不同维度的特征集合,进行预处理操作后,带入图4基于非模糊解加权BP-AdaBoost的流程图,得到相应的识别效果。转子四种状态识别率如下表2:
特征维度 1 2 3 4 5 6 7 8 9 10
平均识别率(%) 54.2 74.8 84.2 87.1 89.6 91.3 92.3 93.2 93.5 92.8
特征维度 11 12 13 14 15 16 17 18 19 20
平均识别率(%) 92.9 94.5 95.4 97.4 96.8 97.1 97.2 97.5 97.4 97.6
转子十种状态识别率如下表3:
特征维度 1 2 3 4 5 6 7 8 9 10
平均识别率(%) 18.2 45.1 57.9 67.3 76.0 82.0 82.4 84.6 85.9 85.5
特征维度 11 12 13 14 15 16 17 18 19 20
平均识别率(%) 86.6 87.5 88.4 91.8 92.0 91.6 93.1 94.5 94.5 93.9
上表分析可知:
四分类情况下,特征维度为14时和特征维度为20时几乎一致,通过增加6个维度的特征提升0.2%的识别率,价值不大;随着分类类别的增加,分类难度会随之提升,所需特征维度也会相应增多,十分类情况下,特征维度为18时所达到的效果最佳,该结果验证了方差得到的特征序列对于故障的识别具有较好的协助。
四分类情况下对于故障的识别可以达到97%以上,十分类情况下可以达到94%以上,验证本发明所提的基于非模糊解加权的BP-AdaBoost方法在转子故障类型和故障程度识别上的有效性。

Claims (10)

1.一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,具体为:
步骤1:提取转子状态参数和特征选择;利用加速度传感器测得转子的振动信号,将转子振动信号时域、频域和时频域的特征组合构建转子状态特征集;并利用方差方法进行特征选择排序,构造低维特征子集;
步骤2:将步骤1得到的低维特征子集进行比例划分,得到训练样本集C1和测试样本集O1;按照K折交叉验证思想对训练样本集C1进行处理;得到其中(K-1)/K为训练样本集C,1/K为验证样本集V,用矩阵Λ表示;
步骤3:设定循环次数K,依次选择Λ中的每一行元素,循环到第i次时,i∈[1,K],得到训练样本集C2和验证样本集V1;通过AdaBoost算法,得到BP-AdaBoost二分类模型;利用一对其余策略即One Against All模式,通过组合多个BP-AdaBoost二分类模型,用以搭建M-BP-AdaBoost多分类模型;K轮循环结束后得到K个M-BP-AdaBoost多分类模型;
步骤4:基于验证样本集V提取K个M-BP-AdaBoost模型的非模糊解权重;
步骤5:利用步骤3建立的M-BP-AdaBoost多分类模型和步骤4提取的K个M-BP-AdaBoost多分类模型的非模糊解权重,构建加权BP-AdaBoost多分类模型Model;
步骤6:利用加权BP-AdaBoost多分类模型Model,把测试样本集O1输入加权BP-AdaBoost多分类模型Model中,预测测试样本集O1中每个样本对应的故障标签类别。
2.根据权利要求1所述的一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,所述步骤1具体为:
步骤1.1:提取转子振动信号时域特征;
时域特征包括:峰值Peak、均值Mean、均方根Root mean square、峭度指标Kurtosisfactor、裕度指标Clearance factor、波形指标Shape factor、脉冲指标Impulse factor和峰值指标Crest factor;
Peak=max(|x|),用TF1表示;
Figure FDA0003441135560000011
用TF2表示;
Figure FDA0003441135560000012
用TF3表示;
Figure FDA0003441135560000013
用TF4表示;
Figure FDA0003441135560000014
用TF5表示;
Figure FDA0003441135560000015
用TF6表示;
Figure FDA0003441135560000016
用TF7表示;
Figure FDA0003441135560000021
用TF8表示;
式中x表示样本的振动信号,xn表示x其中的点;RMS表示均方根;N表示振动信号的采样点数,
Figure FDA0003441135560000022
表示均值,σ表示标准差,max表示最大值;
步骤1.2:提取转子振动信号频域特征;
频域特征包括:平均频率MF、重心频率FC、均方根频率RMFS和标准差频率RVF;
Figure FDA0003441135560000023
用FF1表示;
Figure FDA0003441135560000024
用FF2表示;
Figure FDA0003441135560000025
用FF3表示;
Figure FDA0003441135560000026
用FF4表示;
式中,s表示幅值,h表示频率;sm是s其中的点;hm是h中的一点;q表示频率点的数量;
步骤1.3:提取转子振动信号时频域特征;
时频域下利用小波变换进行三层分解得到节点,计算出每个节点的能量,并且计算出每个节点能量占所有节点总能量的比值;即能量比E={E1,E2,E3,E4,E5,E6,E7,E8};将能量比作为时频域下的特征;
步骤1.4:转子状态特征集合的构建;
将时域、频域和时频域下的特征进行组合,得到转子状态特征集合F;
F={FF1,FF2,FF3,FF4,TF1,TF2,TF3,TF4,TF5,TF6,TF7,TF8,E1,E2,E3,E4,E5,E6,E7,E8};
步骤1.5:基于方差构建低维特征子集;
对转子状态特征集合F中的每个特征进行方差计算如下:
Figure FDA0003441135560000027
其中,N表示样本数量,yi表示独立样本的单个特征,
Figure FDA00034411355600000211
表示样本特征的均值;
转子状态特征集F有M维特征,M表示特征集合F中特征的数量;由上式(1)计算出所有特征对应的方差,表示为:
Figure FDA0003441135560000028
式中,
Figure FDA0003441135560000029
表示第i个特征的方差;
再对方差σ2进行归一化处理,得到
Figure FDA00034411355600000210
为:
Figure FDA0003441135560000031
式中
Figure FDA0003441135560000032
表示第i个特征的归一化方差;
根据方差值大小得到具有一定序列的特征集合,设定方差阈值选择特征维度,构造低维特征子集。
3.根据权利要求1所述的一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,所述步骤2为:
按照K折交叉验证思想对训练样本集C1处理,即将训练样本集C1分为样本数量相等的K份,表示为[Λ12,…,Λi,…,ΛK-1K],不重复的选取其中(K-1)/K为训练样本集C,1/K为验证样本集V,用矩阵Λ表示:
Figure FDA0003441135560000033
矩阵中,第一行到最后一行为K折交叉验证得到的K轮训练样本集C和验证样本集V,每一行的前K-1列为训练样本集C:
Figure FDA0003441135560000034
每一行的第K列为验证样本集V:
Figure FDA0003441135560000035
4.根据权利要求1所述的一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,所述步骤3具体为:
步骤3.1:对划分后得到的训练样本集C2进行预处理,依次提取出某一状态的转子故障样本,其标签用y∈{+1}表示,余下状态的转子故障样本的标签都用y∈{-1}表示,经过预处理得到的训练样本集,记作:U=[U1,U2,…,Ui,…,UM];
步骤3.2:通过AdaBoost算法,得到BP-AdaBoost二分类模型;通过BP-AdaBoost算法对预处理得到的训练样本集U=[U1,U2,...,Ui,…,UM]进行训练,得到关于M类分类问题的若干二类分类器h=[h1,h2,…,hi,…,hM];组合多个二分类式的BP-AdaBoost分类器,搭建多分类模型;
步骤3.3:K轮循环结束后,可以得到K个M-BP-AdaBoost多分类模型,记作[M1,M2,…MK]。
5.根据权利要求4所述的一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,所述步骤3.2具体为:
步骤3.2.1:AdaBoost算法通过提高前一轮弱分类器错误分类样本的权值和降低被正确分类样本的权值,并采取加权多数表决的方法来提升分类的效果;利用BP神经网络作为AdaBoost的基学习器,组建BP-AdaBoost二分类模型;
步骤3.2.2:步骤3.2.1构建了基于BP-AdaBoost的二分类模型,将步骤3.2.1循环M次,得到关于M类分类问题的二类分类器组合h=[h1,h2,…,hi,…,hM];至此,多个二分类式的BP-AdaBoost分类器的组合完成,记作M-BP-AdaBoost多分类模型。
6.根据权利要求5所述的一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,所述步骤3.2.1具体为:
步骤3.2.1.1:首先输入一个训练样本集Ui
Ui={(x1,y1),(x2,y2),…,(xi,yi),…,(xN,yN)}
其中,每个样本点由样本实例和样本标记组成;样本实例xi∈χ∈Rn,表示第i个样本的特征向量,χ为实例空间,样本标记yi∈Y={-1,+1},yi第i个样本的标签类别,Y为标记空间;
步骤3.2.1.2:初始化训练样本集Ui的权值分布;每一个训练样本都被赋予相同的权值:
Figure FDA0003441135560000041
式中ω1,i表示每个训练样本的初始权重,N表示训练样本的数量;
训练样本集Ui的初始权重向量分布为:
Figure FDA0003441135560000042
步骤3.2.1.3:建立迭代终止条件et<r,如不满足终止条件,重复步骤A1-A5得到T个基学习器,利用T个基学习器构造强分类器;直到满足终止条件或T>10时,则执行步骤3.2.2;et表示每轮的分类误差率,r表示根据训练要求给定训练误差率的阈值;如满足终止条件则得到BP-AdaBoost二分类模型,执行步骤3.2.2。
7.根据权利要求6所述的一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,所述步骤A1-A5具体为:
步骤A1:根据上述训练样本集Ui的初始权重分布,得到第t个基学习器;
Gt(x):χ→{-1,+1}
式中,Gt(x)表示基学习器,即BP神经网络;
步骤A2:计算Gt(x)在训练样本集Ui的初始权重分布上的分类误差率:
Figure FDA0003441135560000051
式中ωt,i表示第t轮中的第i个样本的权重,I(Gt(xi)≠yi)为指示函数,当预测结果Gt(xi)与真实结果yi不等时,I(Gt(xi)≠yi)取值为1,其他情况取值为0;
步骤A3:计算Gt(x)的系数,即基学习器对应的权重:
Figure FDA0003441135560000052
式中αt表示每个基学习器的权重,et表示分类误差率;
步骤A4:更新训练样本Ui的权重:
Dt+1=(ωt+1,1,ωt+1,2,...,ωt+1,N)
Figure FDA0003441135560000053
其中,Zt是规范化因子,exp为以e为底的指数函数;
Figure FDA0003441135560000054
步骤A5:把T个基学习器组合起来,构建强二分类器模型;
Figure FDA0003441135560000055
Figure FDA0003441135560000056
式中f(x)表示及分类器的线性组合,sign表示符号函数;G(x)表示强二分类器;T是基学习器的数量。
8.根据权利要求1所述的一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,所述步骤4具体为:
步骤4.1:将验证样本集V=[ΛK,ΛK-1,…,Λi,…,Λ1]T依次带入K个M-BP-AdaBoost模型中,根据验证样本集的分类模糊情况,提取非模糊解权重;针对每个M-BP-AdaBoost模型挑选出验证样本集Λi,表示第i个验证样本的预测标签中仅有一个BP-AdaBoost二分类器给出y∈{+1},其余BP-AdaBoost二分类器给出y∈{-1}的验证样本;非模糊解数量与验证样本集Λi总数进行对比,确定非模糊解所占比例,记作非模糊解权重γi
Figure FDA0003441135560000061
式中,γi为第i个M-BP-AdaBoost多分类模型非模糊解权重,
Figure FDA0003441135560000062
为第i轮的非模糊解的数量,ψi为第i轮的验证样本集中验证样本总数;
步骤4.2:K个M-BP-AdaBoost模型的非模糊解权重向量γ:
γ=[γ1,…,γK]
式中γ1~γK表示K个M-BP-AdaBoost模型中每个M-BP-AdaBoost模型对应的非模糊解权重。
9.根据权利要求1所述的一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,所述步骤5构建加权BP-AdaBoost多分类模型具体为:
利用步骤3建立的多分类模型M-BP-AdaBoost和步骤4提取的K个M-BP-AdaBoost多分类模型的非模糊解权重,二者结合可以得到加权BP-AdaBoost多分类模型,表示为Model;
Model=[γ1,…,γK][M1,M2,…MK]T
至此完成加权BP-AdaBoost多分类模型的建立。
10.根据权利要求1所述的一种基于加权BP-AdaBoost的转子故障诊断方法,其特征在于,所述步骤6具体为:
步骤6.1:将测试样本集O1带入K个M-BP-AdaBoost多分类模型中,预测的结果S表示为:
Figure FDA0003441135560000063
sKn为第K个M-BP-AdaBoost测试样本集O1的预测结果;
简化为:S=[s1,s2,…,si,…,sK]T,其中si=[si1si2…sin](i=1,2,…,K);
步骤6.2:结合K个非模糊解权重向量γ和K个M-BP-AdaBoost多分类模型预测的结果S,得到加权测试特征解
Figure FDA0003441135560000064
表示为:
Figure FDA0003441135560000071
式中γ表示多分类器非模糊解权重,S表示分类BP-AdaBoost模型预测的结果;
Figure FDA0003441135560000072
Figure FDA0003441135560000073
中,每个测试样本O1在每类标签下均有一个数值,最大数值对应的标签为测试样本O1中每个样本的预测结果。
CN202111634135.XA 2021-12-29 2021-12-29 一种基于加权BP-AdaBoost的转子故障诊断方法 Pending CN114218991A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111634135.XA CN114218991A (zh) 2021-12-29 2021-12-29 一种基于加权BP-AdaBoost的转子故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111634135.XA CN114218991A (zh) 2021-12-29 2021-12-29 一种基于加权BP-AdaBoost的转子故障诊断方法

Publications (1)

Publication Number Publication Date
CN114218991A true CN114218991A (zh) 2022-03-22

Family

ID=80706673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111634135.XA Pending CN114218991A (zh) 2021-12-29 2021-12-29 一种基于加权BP-AdaBoost的转子故障诊断方法

Country Status (1)

Country Link
CN (1) CN114218991A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115081483A (zh) * 2022-07-01 2022-09-20 淮阴工学院 基于特征选择和gwo-bp的水轮发电机转子故障诊断方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115081483A (zh) * 2022-07-01 2022-09-20 淮阴工学院 基于特征选择和gwo-bp的水轮发电机转子故障诊断方法

Similar Documents

Publication Publication Date Title
CN110287983B (zh) 基于最大相关熵深度神经网络单分类器异常检测方法
CN110596492B (zh) 一种基于粒子群算法优化随机森林模型的变压器故障诊断方法
Ko et al. Fault classification in high-dimensional complex processes using semi-supervised deep convolutional generative models
CN110175386B (zh) 变电站电气设备温度预测方法
CN111368885B (zh) 一种航空发动机气路故障诊断方法
CN109141847B (zh) 一种基于mscnn深度学习的飞机系统故障诊断方法
CN109800875A (zh) 基于粒子群优化和降噪稀疏编码机的化工故障检测方法
CN107725283A (zh) 一种基于深度信念网络模型的风机故障检测方法
CN107766668B (zh) 一种基于神经网络的复杂仿真模型验证方法
CN113673346B (zh) 一种基于多尺度SE-Resnet的电机振动数据处理与状态识别方法
CN110852365B (zh) 一种zpw-2000a型无绝缘轨道电路故障诊断方法
CN109492748B (zh) 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法
CN111738309A (zh) 多尺度分析和集成学习的气敏传感器故障模式识别方法
CN111397902A (zh) 一种基于特征对齐卷积神经网络的滚动轴承故障诊断方法
CN112504682A (zh) 基于粒子群优化算法的底盘发动机故障诊断方法及系统
CN113553624A (zh) 基于改进pate的wgan-gp隐私保护系统和方法
Liu et al. A rotor fault diagnosis method based on BP-Adaboost weighted by non-fuzzy solution coefficients
CN111079348B (zh) 一种缓变信号检测方法和装置
CN114218991A (zh) 一种基于加权BP-AdaBoost的转子故障诊断方法
CN117056678B (zh) 一种基于小样本的机泵设备运行故障诊断方法及装置
CN109164794A (zh) 基于偏f值selm的多变量工业过程故障分类方法
CN110363232B (zh) 基于bp神经网络的毫米波探测器干扰效果评估方法
CN111861038A (zh) 一种基于机器学习算法的高考分数预测方法及系统
CN116400168A (zh) 一种基于深度特征聚类的电网故障诊断方法及系统
CN116304940A (zh) 基于长短期记忆神经网络的模拟电路故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination