CN102254177B - 一种不均衡数据svm轴承故障检测方法 - Google Patents
一种不均衡数据svm轴承故障检测方法 Download PDFInfo
- Publication number
- CN102254177B CN102254177B CN 201110101842 CN201110101842A CN102254177B CN 102254177 B CN102254177 B CN 102254177B CN 201110101842 CN201110101842 CN 201110101842 CN 201110101842 A CN201110101842 A CN 201110101842A CN 102254177 B CN102254177 B CN 102254177B
- Authority
- CN
- China
- Prior art keywords
- sample
- samples
- normal class
- algorithm
- svm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明的目的在于提供一种不均衡数据SVM轴承故障检测方法,包括以下步骤:收集振动信号,确定嵌入维数和延迟的时间间隔,重构正常样本相空间,确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,对SVM检测器进行训练,调整需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,再放入SVM检测器进行训练,直至检测性能指标达到0.6,将待测试的轴承数据样本输入到SVM检测器中,实现滚动轴承故障检测。本发明对数据样本采样进行改进,具有较强的去除正常状态样本中的冗余信息和噪声能力,进而提高不均衡数据SVM轴承故障检测器的检测性能。
Description
技术领域
本发明涉及的是一种轴承故障的检测方法。
背景技术
在工业领域中,滚动轴承对整体机械设备的影响是至关重要的,机械运行过程中对滚动轴承的工作状态进行实时监测,能够有效地确保整体机械设备运行的安全性。
目前,轴承故障检测最常用的方法是神经网络方法,但是神经网络方法容易出现维数灾难、局部极值等问题,检测效果往往不是很理想。支持向量机(support vector machine:SVM)是建立在基于统计学习理论和结构风险最小化基础上的一种新型学习方法。相对于传统的智能学习方法,SVM能够较好地解决维数灾难、小样本学习、非线性和局部极值等问题,特别是由于SVM在小样本学习方面展现的良好的泛化性能,使得SVM在滚动轴承故障检测领域中具有广泛的应用。
SVM是有监督学习方法,对均衡数据的检测效果最为理想。但由于滚动轴承的故障数据难以获得,训练数据集往往是不均衡的,故障样本为SVM检测器提供的信息较少,导致故障样本容易被错分,从而增加了故障的漏检率。因此,目前多采用将不均衡数据转化为均衡数据的方法来训练SVM检测器。实现数据均衡的方法有以下几种:第一种方法是故障样本过采样法,目前使用最多的是该方法,但该方法增加了故障样本数的同时容易产生大量的重复信息,并且在正常样本中存在着大量的冗余信息和噪声会对SVM检测器产生负面影响;第二种方法是正常样本欠采样法,目前常用的欠采样法是随机欠采样法,但该方法减少正常样本数的同时存在较大的随机性,容易丢失正常样本中的有用信息,并且去除冗余信息和噪声并不彻底。
发明内容
本发明的目的在于提供具有较强的去除正常状态样本中的冗余信息和噪声能力的一种不均衡数据SVM轴承故障检测方法。
本发明的目的是这样实现的:
本发明一种不均衡数据SVM轴承故障检测方法,其特征是:
(1)利用安装在感应电动机输出轴的传感器收集振动信号;
(2)利用互信息函数指标和虚假最近邻点法来确定嵌入维数和延迟的时间间隔,采用时间延迟技术重构正常样本相空间,故障类型的样本在所述的正常样本空间的投影系数为故障特征;
(3)α表示需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,取α初值为0.3,利用α的初定值与训练样本中正常类样本数目和故障类样本数目之间的差值分别确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,达到训练数据集均衡;
(4)利用步骤(3)均衡后的训练数据集对SVM检测器进行训练,调整α值进行均衡数据的处理再放入SVM检测器进行训练,直至检测性能指标达到0.6,所述的检测性能指标为几何平均率G:其中P是正常样本检测正确率,N是故障样本检测正确率;
(5)对于待测试的轴承数据样本,将其输入到训练好的SVM检测器中,得到滚动轴承的工作状态,实现滚动轴承故障检测。
本发明的优势在于:本发明将ODR和BSMOTE方法相结合对数据样本采样进行改进,具有较强的去除正常状态样本中的冗余信息和噪声能力,进而提高不均衡数据SVM轴承故障检测器的检测性能。
附图说明
图1为本发明的流程图;
图2为BSMOTE算法的流程图;
图3为ODR算法的流程图;
图4为不同比例内圈故障数据各种方法G性能比较图;
图5为不同比例外圈故障数据各种方法G性能比较图;
图6为不同比例滚动体故障数据各种方法G性能比较图。
具体实施方式
下面结合附图举例对本发明做更详细地描述:
结合图1~6,本发明一种不均衡数据SVM轴承故障检测方法,包括以下步骤:
(1)利用安装在感应电动机输出轴的传感器收集振动信号;
(2)利用互信息函数指标和虚假最近邻点法来确定嵌入维数和延迟的时间间隔,采用时间延迟技术重构正常样本相空间,故障类型的样本在所述的正常样本空间的投影系数为故障特征;
(3)α表示需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,取α初值为0.3,利用α的初定值与训练样本中正常类样本数目和故障类样本数目之间的差值分别确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,达到训练数据集均衡;
(4)利用步骤(3)均衡后的训练数据集对SVM检测器进行训练,调整α值进行均衡数据的处理再放入SVM检测器进行训练,直至检测性能指标达到0.6,所述的检测性能指标为几何平均率G:其中P是正常样本检测正确率,N是故障样本检测正确率;
(5)对于待测试的轴承数据样本,将其输入到训练好的SVM检测器中,得到滚动轴承的工作状态,实现滚动轴承故障检测。
BSMOTE算法的流程如图2,具体过程如下:
定义训练数据集是S,故障样本集是F={f1,f2,·,fn}。
a1.计算每一个故障样本fi(i=1,2,·n)在训练数据集S中的k个最近邻,然后利用这k个最近邻样本对F中的样本进行归类:如果这k个最近邻样本全是正常样本,那么认为该样本为噪声样本,将它保存在N′集合中;反之如果k个最近邻样本都是故障样本,则认为该样本是远离分类边界样本将其保存在S′集合中;如果这k个最近邻样本中既有故障样本又有正常样本,则认为该样本是边界样本,存放在B集合中。
a2.设B={f′1,f′2,·f′b},计算集合B中每一个样本f′i,i=1,2,·b在故障样本集合F中的k′个最近邻fij,j=1,2,·k′,然后随机选出s(1<s<b)个最近邻样本,分别求出它们与该样本之间全部属性的差值dij′:dij′=f′i-fij′,j′=1,2,·s,并乘以一个随机数rij′,rij′∈(0,1)(如果fij′是N′集合或是S′集合中的样本则rij′∈(0,0.5))。最后合成的人工故障样本为:
hij′=fi′+rij′×dij′,j′=1,2,·s。
a3.重复步骤a2中人工故障样本的生成过程,直到生成的故障样本数目满足要求后,算法结束。
ODR算法流程如图3,具体过程如下:
定义训练样本集为T,正常样本集为N,p是正常样本,即是N集中的样本,我们定义p的关联集是指N集中的其余样本的k个最近邻中含有样本p的样本集合,关联集用Ap={np1,np2,·npn}表示,其中p为npi(npi∈Ap)的最近邻。对立样本指的是样本类型和p不一致的样本。
b1.利用K值最近邻算法寻找训练样本集T中每一个样本的t个最近邻,建立每一个样本的最近邻链表,根据所有样本的最近邻链表创建正常样本的关联集链表。
b2.正常样本集N中的每一个样本p,对p的关联集中的样本根据K值最近邻算法进行分类,正确分类的个数记withp;接着将样本p从这些样本的最近邻链表中删除,使用这些样本各自的第t+1个最近邻代替,此时能够被K值最近邻算法正确分类的个数,记withoutp。
b3.根据withp和withoutp的值确定是否删除样本p:假如withp≤withoutp,则认为删除p后对训练样本集T分类的影响较小,反之withp>withoutp时,认为删除p对分类的影响较大。
b4.计算正常样本集N中每一个样本在训练样本集T中距离最近的对立样本,并求出两者之间的欧式距离d′p。
b5.最后根据withp-withoutp的值从大到小对正常样本进行排列(只在withp-withoutp≥0的情形下),假如两个正常样本的withp-withoutp值相同,则按各自的d′p值从大到小的顺序将其排列,然后依次删除正常样本,直到正常样本的数目达到指定的数目时,则算法结束。
根据上述检测步骤,本发明采用滚动轴承四种运行状态的实验数据来源于美国Case Western Reserve University的电气工程实验室,该数据的故障检测特征是由正常样本、外圈故障样本、内圈故障样本和滚动体故障样本四种5维矢量组成,为保证检测器的通用性,将实验数据样本分为正常样本和故障样本,并且实验数据分为训练数据和测试数据。
具体数据:选取2000个正常样本,分别以2∶1,5∶1,10∶1,20∶1,50∶1,100∶1的比例来选取外圈故障、内圈故障和滚动体故障数据进行训练,测试数据分别是5000个正常样本,1000外圈故障样本,1000内圈故障样本和1000个滚动体故障样本,利用训练样本得到SVM滚动轴承故障检测器,同时对测试样本进行检测判断,得到测试样本的检测结果。将标准的SVM算法、基于SVM和BSMOTE过采样算法相结合的算法(BSMOTE-SVM)、基于SVM和SMOTE算法相结合的算法(BSMOTE-CSVM)以及本发明提出的方法进行对比,得出对比图,图4表示不同比例内圈故障数据各种方法G性能比较,图5表示不同比例外圈故障数据各种方法G性能比较,图6表示不同比例滚动体故障数据各种方法G性能比较。SVM算法选择高斯核函数,宽度为1,BSMOTE和SMOTE算法的k值是5,BSMOTE算法的k′值为5,s为3,惩罚常数C=1000,初始α值为0.3。
为了测试本发明在实际当中的泛化能力,训练样本选取正常数据样本2000个,故障样本分别由200个内圈故障样本,200个外圈故障样本和200个滚动体故障样本,测试样本为正常样本2000个,故障样本是1000个内圈故障样本,1000个外圈故障样本和1000个滚动体故障样本,参数设置同上。
检测结果:从图4、5、6均可以看出,随着不均衡数据比例的增大,本发明提出的基于逐级优化递减和BSMOTE的不均衡数据SVM轴承故障检测器关于指标G好于其它两种过采样的方法,检测性能明显提高。这是由于随着不均衡数据比例增大,正常样本中的冗余信息和噪声也随着增加,但该算法利用ODR算法能够去除正常样本中的冗余信息和噪声样本,大大提高了SVM检测器的检测性能。从表1中可以看出本发明在不均衡数据下具有较强故障检测的泛化能力。
表1
Claims (1)
1.一种不均衡数据SVM轴承故障检测方法,其特征是:
(1)利用安装在感应电动机输出轴的传感器收集振动信号;
(2)利用互信息函数指标和虚假最近邻点法来确定嵌入维数和延迟的时间间隔,采用时间延迟技术重构正常类样本空间,故障类样本在所述的正常类样本空间的投影系数为故障特征;
(3)α表示需要删除的正常类样本的个数和正常类样本数与故障类样本数间差值的比值,取α初值为0.3,利用α的初值与训练样本中正常类样本数目和故障类样本数目之间的差值分别确定需删除和增加的样本数目,分别利用ODR算法和BSMOTE算法删除正常类样本,增加人工故障类样本,达到训练数据集均衡;
BSMOTE算法具体过程如下:
定义训练数据集是S,故障类样本集是F={f1,f2,…,fn};
①计算每一个故障类样本fi(i=1,2,…n)在训练数据集S中的k个最近邻,然后利用这k个最近邻对F中的样本进行归类:如果这k个最近邻全是正常类样本,那么认为该样本为噪声样本,将它保存在N′集合中;反之如果k个最近邻都是故障类样本,则认为该样本是远离分类边界样本将其保存在S′集合中;如果这k个最近邻中既有故障类样本又有正常类样本,则认为该样本是边界样本,存放在B集合中;
②设计算集合B中每一个样本i=1,2,…b在F中的k′个最近邻fij,j=1,2,…k′,然后随机选出s个最近邻样本,其中1<s<b,分别求出它们与该样本之间全部属性的差值dij′:j′=1,2,…s,并乘以一个随机数rij′,rij′∈(0,1),如果fij′是N′集合或是S′集合中的样本则rij′∈(0,0.5),最后合成的人工故障类样本为:
③重复步骤②中人工故障类样本的生成过程,直到生成的故障类样本数目满足要求后,算法结束;
ODR算法具体过程如下:
定义训练样本集为T,正常类样本集为N,p是正常类样本,即是N集中的样本,定义p的关联集是指N集中的其余样本的k个最近邻中含有样本p的样本集合,关联集用Ap={np1,np2,…npn}表示,其中p为npi的最近邻,其中npi∈Ap,对立样本指的是样本类型和p不一致的样本,
1)利用K值最近邻算法寻找训练样本集T中每一个样本的t个最近邻,建立每一个样本的最近邻链表,根据所有样本的最近邻链表创建正常类样本的关联集链表;
2)正常类样本集N中的每一个样本p,对p的关联集中的样本根据K值最近邻算法进行分类,正确分类的个数记withp;将样本p从这些样本的最近邻链表中删除,使用这些样本各自的第t+1个最近邻代替,此时能够被K值最近邻算法正确分类的个数,记withoutp;
3)根据withp和withoutp的值确定是否删除样本p:假如withp≤withoutp,则认为删除p后对训练样本集T分类的影响较小,反之withp>withoutp时,认为删除p对分类的影响较大;
5)根据withp-withoutp的值从大到小对正常类样本进行排列,假如两个正常类样本的withp-withoutp值相同,则按各自的值从大到小的顺序将其排列,然后依次删除正常类样本,直到正常类样本的数目达到指定的数目时,则算法结束;
(4)利用步骤(3)均衡后的训练数据集对SVM检测器进行训练,调整α值进行均衡数据的处理再放入SVM检测器进行训练,直至检测性能指标达到0.6,所述的检测性能指标为几何平均率G:其中P是正常类样本检测正确率,M是故障类样本检测正确率;
(5)对于待测试的轴承数据样本,将其输入到训练好的SVM检测器中,得到滚动轴承的工作状态,实现滚动轴承故障检测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110101842 CN102254177B (zh) | 2011-04-22 | 2011-04-22 | 一种不均衡数据svm轴承故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110101842 CN102254177B (zh) | 2011-04-22 | 2011-04-22 | 一种不均衡数据svm轴承故障检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102254177A CN102254177A (zh) | 2011-11-23 |
CN102254177B true CN102254177B (zh) | 2013-06-05 |
Family
ID=44981431
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110101842 Expired - Fee Related CN102254177B (zh) | 2011-04-22 | 2011-04-22 | 一种不均衡数据svm轴承故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102254177B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091073A (zh) * | 2014-07-11 | 2014-10-08 | 中国人民解放军国防科学技术大学 | 虚拟资产不平衡交易数据的采样方法 |
CN105867347B (zh) * | 2016-03-29 | 2020-01-17 | 全球能源互联网研究院 | 一种基于机器学习技术的跨空间级联故障检测方法 |
CN106056130A (zh) * | 2016-05-18 | 2016-10-26 | 天津大学 | 针对不平衡数据集的组合降采样线性判别分类方法 |
CN106056160B (zh) * | 2016-06-06 | 2022-05-17 | 南京邮电大学 | 非均衡iptv数据集下的用户报障预测方法 |
CN107729838A (zh) * | 2017-10-12 | 2018-02-23 | 中科视拓(北京)科技有限公司 | 一种基于深度学习的头部姿态估算方法 |
CN107657250B (zh) * | 2017-10-30 | 2020-11-24 | 四川理工学院 | 轴承故障检测及定位方法及检测定位模型实现系统和方法 |
CN110196166B (zh) * | 2019-05-28 | 2020-09-29 | 重庆邮电大学 | 一种滚动轴承高速运动滚动体的定位方法 |
CN111240279B (zh) * | 2019-12-26 | 2021-04-06 | 浙江大学 | 一种面向工业不平衡数据的对抗增强故障分类方法 |
CN111881289B (zh) * | 2020-06-10 | 2023-09-08 | 北京启明星辰信息安全技术有限公司 | 分类模型的训练方法、数据风险类别的检测方法及装置 |
CN117349786A (zh) * | 2023-09-11 | 2024-01-05 | 国网湖北省电力有限公司宜昌供电公司 | 基于数据均衡的证据融合变压器故障诊断方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101405718A (zh) * | 2006-03-30 | 2009-04-08 | 卡尔斯特里姆保健公司 | 具有局部线性嵌入的smote算法 |
CN101980202A (zh) * | 2010-11-04 | 2011-02-23 | 西安电子科技大学 | 不平衡数据的半监督分类方法 |
-
2011
- 2011-04-22 CN CN 201110101842 patent/CN102254177B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101405718A (zh) * | 2006-03-30 | 2009-04-08 | 卡尔斯特里姆保健公司 | 具有局部线性嵌入的smote算法 |
CN101980202A (zh) * | 2010-11-04 | 2011-02-23 | 西安电子科技大学 | 不平衡数据的半监督分类方法 |
Non-Patent Citations (3)
Title |
---|
Hui Han et al.Borderline-SMOTE: A New Over-Sampling Method in Imbalanced Data Sets Learning.《Advances in Intelligent Computing》.2005,第3644卷878-887. * |
陈思等.基于聚类融合的不平衡数据分类方法.《模式识别与人工智能》.2010,第23卷(第6期),772-780. * |
陶新民等.不均衡数据下基于SVM的故障检测新算法.《振动与冲击》.2010,第29卷(第12期),8-12,29. * |
Also Published As
Publication number | Publication date |
---|---|
CN102254177A (zh) | 2011-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102254177B (zh) | 一种不均衡数据svm轴承故障检测方法 | |
CN103398769B (zh) | 基于小波ggd特征和不均衡k-均值下采样集成svm的变压器在线故障检测方法 | |
CN103323749B (zh) | 多分类器信息融合的局部放电诊断方法 | |
CN103115789B (zh) | 金属结构损伤剩余寿命的第二代小波支持向量机评估方法 | |
Kankar et al. | Vibration-based fault diagnosis of a rotor bearing system using artificial neural network and support vector machine | |
Udmale et al. | Multi-fault bearing classification using sensors and ConvNet-based transfer learning approach | |
CN106874957A (zh) | 一种滚动轴承故障诊断方法 | |
Liu et al. | A two-stage approach for predicting the remaining useful life of tools using bidirectional long short-term memory | |
CN106973057A (zh) | 一种适用于入侵检测的分类方法 | |
CN107657250A (zh) | 轴承故障检测及定位方法及检测定位模型实现系统和方法 | |
CN102156873B (zh) | 一种基于混沌的机械零部件早期单点故障检测与分类方法 | |
CN101907088A (zh) | 基于单类支持向量机的故障诊断方法 | |
CN106441896A (zh) | 滚动轴承故障模式识别及状态监测的特征向量提取方法 | |
CN111351665B (zh) | 基于emd和残差神经网络的滚动轴承故障诊断方法 | |
CN104504403B (zh) | 一种基于散射变换的旋转机械故障预测方法 | |
CN101271625A (zh) | 集成支持向量机检测高速公路交通事件的方法 | |
CN107247968A (zh) | 基于核熵成分分析失衡数据下物流设备异常检测方法 | |
Kumar et al. | Fault diagnosis of bearings through vibration signal using Bayes classifiers | |
CN103927874A (zh) | 基于欠抽样面向不平衡数据集的交通事件自动检测方法 | |
CN115545070A (zh) | 基于综合平衡网络的类不平衡轴承智能诊断方法 | |
Yuan et al. | Bearing fault diagnosis using a speed-adaptive network based on vibro-speed data fusion and majority voting | |
CN109271889B (zh) | 一种基于双层lstm神经网络的动作识别方法 | |
Zhang et al. | Acoustic emission monitoring for film thickness of mechanical seals based on feature dimension reduction and cascaded decision | |
Dong et al. | Rolling bearing incipient degradation monitoring and performance assessment based on signal component tracking | |
Han et al. | A Study on Motor Poor Maintenance Detection Based on DT-CNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130605 Termination date: 20190422 |