发明内容
本发明的目的在于克服上述现有技术的不足,提供一种机械故障的集成支持向量机混合智能诊断方法,该方法精度高、成本低、简单可靠,便于工程实践中使用,通过将提升小波包变换和经验模式分解这两种现代信号处理技术、特征距离评估技术与集成支持向量机进行有效融合,实现对故障运行状态的智能诊断。
本发明的技术方案是这样解决的:按下述步骤进行:
1)分别采用提升小波包按频段和经验模式分解按本征模式分量对振动信号进行分解,提取分解信号的时域统计特征,构成全体特征集;
2)提出特征距离评估技术及特征评估指标,按照特征评估指标大小从全体特征集中选取最敏感特征集;
3)将获得的最敏感特征集作为诊断特征,建立集成支持向量机混合智能诊断模型,实现对设备运行状态的智能诊断。
所说的特征距离评估技术及特征评估指标如下:
首先,对于一个原始振动信号X(t),计算l个时域统计特征Ftime,l个时域统计特征是指均值、方差、方根幅值、有效值、峰值、偏斜度、峭度、波形指标、峰值指标、裕度指标和脉冲指标中的一个或多个;利用提升小波包变换将X(t)分解m层,m取值为2、3或4,得到2m个分解信号,对每个分解信号分别计算l个统计特征,共得到l×2m个提升小波包变换后的特征Fwp;采用经验模式分解将X(t)分解得到前n个本征模式分量,n取值为4到8的整数,计算n个本征模式分量的相对能量特征Femd,从而构成全体特征集Ftotal=[Ftime Fwp Femd];
接着,将全体特征集Ftotal的类间距Sb与类内距Sw的比值设定为距离评估指标JA;
最后,按照特征评估指标JA的大小,从全体特征集Ftotal中选择大于给定阈值ρ的特征评估指标JA所对应的特征,将最大分类准确率所对应的阈值设为ρ,从而构成最敏感特征集Fsensitivity。
所述的集成支持向量机混合智能诊断模型建立方法如下:
首先利用袋装算法,简称Bagging算法,从训练样本中随机生成T个训练样本子集TR
t(t=1,2,…,T),T取值为10到100的整数,然后利用T个多分类支持向量机对这些子集TR
t进行训练,得到T个子分类器f
t;设T个子分类器f
t的平均分类误差为
将
作为遗传算法的适应度函数,对T个子分类器f
t的集成结果进行优化,得到分类器的优化权值大于预设阈值λ=1/T的权值向量w,从而构成集成支持向量机,用最敏感特征集F
sensitivity作为诊断特征,对集成支持向量机进行训练,即可建立混合智能诊断模型,利用混合智能诊断模型实现机械故障的智能诊断。
由于本发明实现了基于现代信号分析技术的特征提取、最敏感特征集的选择和集成智能分类方法在算法上的混合,本发明具有下列区别于传统方法的显著优势:
1)进行特征距离评估可以有效地去除原始特征集中的不相关或冗余信息,选择到最敏感特征集,从而提高分类器的分类准确率和运算效率;
2)建立集成支持向量机混合智能模型进行智能分类,能很好地进行少样本模式识别,有效地提高了单一分类器的分类性能和抗噪能力,为准确有效的诊断提供了保证;
3)整个过程实现了特征提取、特征选择和模式识别在算法上的混合,为机械故障的智能诊断提供了有效的实用新技术。
具体实施方式
附图是本发明的具体实施例;
下面结合附图对本发明的内容作进一步详细说明:
1)对设备的振动量信号分别进行提升小波包变换和经验模式分解,提取各个不同频段分量的时域统计特征,构成全体特征集,将获得的全体特征集进行特征距离评估,选取最敏感特征集;
2)将获得的最敏感特征集作为诊断特征,对集成支持向量机进行训练,训练好的混合智能诊断模型即可对设备运行状态进行智能分类。
根据上述发明内容和图1的混合智能诊断结构流程,首先,构造原始特征集。
对于一个原始振动信号X(t),提取11个时域统计特征Ftime(均值、方差、方根幅值、有效值、峰值、偏斜度、峭度、波形指标、峰值指标、裕度指标和脉冲指标)。
对于原始振动信号X(t),数据长度为L,j尺度将逼近信号{sj+1(k)}剖分为奇、偶样本序列{sj(2k+1)}和{sj(2k)},采用插值细分原理用N个偶样本预测奇样本,则细节信号dj(k)为
式(1)中p(m)为预测系数,令:P=[p(1),…,p(N)]T,采用式(1)求得的
个细节信号dj(k)更新偶样本{sj(2k)},则逼近信号sj(k)为
式(2)中u(m)为更新系数,令:
在式(1)和式(2)中,选取不同的N和
将得到具有不同消失矩的尺度函数和小波函数。
以N和
构造的具有冲击信号特性的小波为基函数,采用提升策略对小波子空间Wj进行分解,从而得到小波包变换后的子空间Uj n的信号为Xj={xj,n,l,j,n,l∈Z},Xj,n,l为j尺度的第n频带的第l个数据。
对原始信号X(t),利用提升小波包变换分解3层,得到8段小波包频带系数,对每段系数各提取与原始信号处理中相同的11个统计特征,共得到88个提升小波包变换后的特征Fwp。
经验模式分解可将任意信号分解为若干个本征模式分量和一个余项。所谓本征模式分量就是满足2个条件的函数或信号:①在整个数据序列中,极值点的数量与过0点的数量必须相等或最多相差一个。②在任何一点,数据序列的局部极大值点确定的上包络线和局部极小值点确定的下包络线的均值为0,即信号关于时间轴局部对称。经验模式分解的本质是一个筛选的过程,经过一系列分解后,时间序列X(t)可表示成n个本征模式分量fi(t)和一个余项rn(t)之和,即
式(3)中得到的n个本征模式分量fi(t),其频率从大到小排列,f1(t)所含频率最高,fn(t)所含频率最低,余项rn(t)是一个非震荡的单调序列。
对原始信号X(t),利用经验模式分解得到前六个本征模式分量,提取6个本征模式分量的相对能量特征Femd,得到全体特征集Ftotal=[Ftime Fwp Femd]。
然后,对原始特征集Ftotal进行特征选择。
假设c个模式类ω1,ω2,…,ωc的联合特征向量集为{q(i,k),i=1,2,…,c;k=1,2,…,Ni},其中q(i,k)为ωi中的第k个特征,Ni为ωi中特征向量的数目。特征选择可分为三个步骤:
第一步:计算ωi类中所有特征向量间的平均距离如下
对Si(i=1,2,…,c)求平均后得到平均类内距离为
第二步:计算c个模式类的类间距离如下
其中:
为ωi中所有特征的均值,
为c个模式类样本的总体均值。
第三步:定义类间距与类内距的比值JA为距离评估指标
从(7)式的定义中可以看出,小的平均类内距离和大的平均类间距离才具有好的可分性,因此选择大于一定阈值的JA所对应的特征构成最敏感特征集Fsensitivity,将最大分类准确率所对应的阈值设为ρ。
最后,建立集成支持向量机混合智能诊断模型,对最敏感特征集Fsensitivity进行智能分类。
支持向量机(Support Vector Machines,SVMs)是基于统计学习理论和结构风险最小化原则的一种小样本模式识别算法。在集成支持向量机算法中,首先利用Bagging算法从训练样本中随机生成T个训练样本子集TRt(t=1,2,…,T),然后利用T个多分类支持向量机对这些子集TRt进行训练,得到T个子分类器ft。在本发明中,设T个子分类器ft的平均分类误差为
将 作为遗传算法的适应度函数,对T个子分类器ft的集成结果进行优化,得到分类器的优化权值大于预设阈值λ=1/T的权值向量w,从而构成集成支持向量机。其算法如表1所示。
表1集成支持向量机算法
输入:N个训练样本{(x1,y1),…,(xN,yN)}构成训练样本集S,yi∈Y={1,2,…,k}
基于SVMs基本分类器f
迭代次数T
预设阈值λ
计算过程:
步骤一:
循环for t=1 to T
从中利用Bagging算法随机重采样,得到训练样本子集TRt
用子集TRt对基本分类器f进行训练,得到分类器ft
结束
步骤二:
利用遗传算法,优化权值w,其中wi>λ
从而,从分类器{ft,t=1,2,…,T}中选择合适的支持向量机集成个体,构成集合T*输出:总体分类器的判别函数
其中算子|·|的含义为,当·为真时,|·|=1,否则|·|=0
利用训练好的支持向量机混合智能诊断模型,即可对设备运行状态进行诊断,从而可以获得故障的类型。
参照图1所示,为机械故障的集成支持向量机混合智能诊断流程图,机械设备的振动信号经过传感器和数据采集系统的拾取,以及信号预处理系统的预处理后,可获得原始时域振动信号;计算原始时域振动信号的11个时域特征、提升小波包分解后的88个统计特征和经验模式分解后的6个相对能量特征,构成全体特征集;利用特征距离评估技术对全体特征集进行特征选择,构成最敏感特征集;用训练样本的最敏感特征集对集成支持向量机进行训练,构建集成支持向量机混合智能诊断模型,利用该模型即可对机械设备进行实时智能诊断,最后得到混合智能诊断结果。
参照图2所示,为某电力机车走行部轮对结构示意图,每个轮对由两个轴承1和5、两个车轮2和4和一根车轴3组成,将加速度传感器6安装在轴承座上方进行振动信号拾取。
参照图3所示,为最敏感特征集选择的距离评估图,根据设定的阈值ρ,从而可以确定大于该阈值的距离评估指标JA所对应的特征即为最敏感特征集,其中,横坐标为特征序号,纵坐标为距离评估指标JA。
参照图4所示,为不同的特征评估指标阈值下,集成持向量机与单一持向量机和Bagging算法的分类性能比较图,通过与传统方法的比较可以看出,在不同的阈值下,本发明都具有很好的分类效果,且当ρ=20时选择的特征即为最敏感特征集,其中,横坐标为阈值ρ,纵坐标为分类准确率。
参照图5所示,为不同的噪声含量下,集成SVMs与单一SVMs和Bagging算法的分类性能比较图,通过与传统方法的比较可以看出,在不同的噪声含量下,本发明都具有很高的诊断效率高和抗噪能力,其中,横坐标为噪声含量百分比,纵坐标为分类准确率。
实施例:
该实施例给出了本发明在工程实践中的具体实施过程,同时验证了该发明的有效性。
某客运型电力机车走行部由六副轮对组成。轮对由一根车轴和两个车轮组成,每副轮对再与轴箱组合在一起。轮对结构如图2所示。由安装在车轮轴承座上方的加速度传感器进行信号采集,采样频率为12.8KHz,数据长度为8192个点。
取该电力机车轴承在四种工况(正常、外圈故障、滚动体故障、外圈和滚动体复合故障)下的振动数据各36组,其中22组作为训练数据,另14组作为测试样本。从电力机车轴承振动的训练数据集中提取的全体特征集Ftotal=[Ftime Fwp Femd]由105个特征组成,这些特征的距离评估指标值如图3所示。
为了验证集成SVMs方法的分类性能,同时也对单一SVMs分类算法和基于SVMs的Bagging算法分类算法进行了分析。此处取集成SVMs的数目T=20,可选择集成SVMs中的预设阈值λ=1/T=0.05。
单一SVMs、Bagging算法和集成SVMs的分类结果如表2所示。其中分类精度为每次试验重复10次的平均结果。
表2不同阈值对应的SVMs、Bagging和集成Bagging的分类精度比较
阈值 |
特征数目 |
SVMs |
Bagging |
集成SVMs |
分类精度(%) |
分类精度(%) |
分类精度(%) |
集成SVMs的平均数目 |
训练 | 测试 | 训练 | 测试 | 训练 | 测试 |
00.513510152025303540 |
10575634338333024161453 |
99.8510099.5599.5510099.8599.8510099.8599.8598.9598.95 |
63.3363.3376.6794.1995.3896.5796.5797.0597.0595.5390.1277.52 |
100100100100100100100100100100100100 |
81.0081.0082.5296.4398.3398.8198.5798.9597.9397.6394.0483.17 |
100100100100100100100100100100100100 |
83.3383.3387.8197.4998.9799.0199.2510099.1398.2196.3585.89 |
11.210.79.18.48.18.78.27.69.810.09.710.4 |
如表2所示,随着阈值的增加,特征数目逐渐减少。在训练过程中,单一SVMs的分类精度都大于98.95%,且在ρ=0.5,5或20时取得最大值(100%);然而,Bagging算法和集成SVMs的训练样本的分类精度都为100%。另外还可以看出,在集成SVMs中,平均SVMs的集成个数(9.3)大约为整体数目(20)的一半,因此与Bagging算法相比,可选择集成SVMs的测试时间将大幅度减少(从0.12秒降到0.02秒)。
针对不同的特征选择阈值,单一SVMs、Bagging算法和集成SVMs的测试样本分类结果如图4所示。
从图4中可以看出,对于单一SVMs的测试结果而言,当不进行特征选择时,其分类准确率仅为63.33%;分类准确率随着阈值的增加而提高,最高达到97.05%,此时阈值ρ=20,这表明ρ=20时选择的特征即为最敏感特征集。可以发现,集成SVMs的分类性能优于其它两种方法,当ρ=20时,集成SVMs取得最好的分类效果(100%)。
进一步验证集成SVMs的泛化性能,在测试数据中添加不同含量的随机噪声。不失一般性,在Bagging算法和集成SVMs中取集成SVMs的数目T=20进行实验,阈值ρ=20。不同噪声含量的分类准确率如图5所示。从图中可以看出,随着噪声含量的增加,对于集成SVMs来说,当噪声含量小于20%时,其分类精度都大于90%。当噪声含量在0与40%之间时,集成SVMs的分类精度都高于Bagging算法。随着噪声含量的进一步增加,集成SVMs的分类精度与Bagging算法的分类精度相当,都为70%左右,但是在集成SVMs中,平均SVMs的集成个数(9.3)大约为Bagging算法的集成个数(20)的一半,可选择集成SVMs的测试时间将大幅度减少(从0.12秒降到0.02秒)。这些都说明集成SVMs计算效率高、抗噪能力强。
从图4和图5的分析可知,集成SVMs的分类性能优于单一SVMs和Bagging算法,对于机车轮对轴承的故障诊断来说,当特征距离评估技术中的阈值设定为ρ=20时,其分类准确率为100%,这说明集成支持向量机混合智能诊断方法能够准确地诊断出轴承的外圈故障、滚动体故障和外圈和滚动体复合故障,具有很好的智能诊断能力。