CN110375987B - 一种基于深度森林机械轴承故障检测方法 - Google Patents

一种基于深度森林机械轴承故障检测方法 Download PDF

Info

Publication number
CN110375987B
CN110375987B CN201910548884.7A CN201910548884A CN110375987B CN 110375987 B CN110375987 B CN 110375987B CN 201910548884 A CN201910548884 A CN 201910548884A CN 110375987 B CN110375987 B CN 110375987B
Authority
CN
China
Prior art keywords
data
feature
vector
groups
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910548884.7A
Other languages
English (en)
Other versions
CN110375987A (zh
Inventor
丁家满
吴晔辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201910548884.7A priority Critical patent/CN110375987B/zh
Publication of CN110375987A publication Critical patent/CN110375987A/zh
Application granted granted Critical
Publication of CN110375987B publication Critical patent/CN110375987B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis

Abstract

本发明涉及一种基于深度森林机械轴承故障检测方法,属于故障检测技术领域。首先,将采集到的正常轴承数据和多种故障轴承数据根据振动频率f分别进行多粒度采样策略进行分组,得到N组采样数据,再将N组采样数据分别进行特征提取,得到N组特征向量Xs,然后将N组特征向量Xs分别打上标签,再进行整合,得到整个数据的特征向量X,最后,将特征向量X输入到深度森林,构建级联结构,得到训练模型。本发明基于深度森林模型提出了多粒度分组提取特征方法,有效地扩大训练数据集,防止特征提取时的信息丢失现象,该方法不仅在机械轴承故障上具有较好的应用性,还可以应用于其他类型的机械故障诊断中。

Description

一种基于深度森林机械轴承故障检测方法
技术领域
本发明涉及一种基于深度森林机械轴承故障检测方法,属于故障检测技术领域。
背景技术
轴承、齿轮箱等在运动和传递扭矩传递机器的工业中发挥着重要作用,它们在多个领域,例如航空、航天、汽车、电力、风力涡轮机等都有应用。作为机器的核心部件,因为长期处在高速运转的工作环境下,导致轴承很容易产生损坏,一旦发生故障,对于公司不管是时间还是成本的损失都是巨大的。对复杂系统来说,早期发现故障问题是至关重要的,采取补救措施以避免危险情况的发生可以节省宝贵的时间和成本。机械故障的诊断方法对现代工业系统的可靠性和安全性起着重要的作用。人工智能技术作为一种新兴的工业应用领域和故障识别的有效解决方案,都受到了学术界和工业界的重视。造成轴承故障的原因有多种原因,轴承信号的采集也是多样的,采集到的故障信号也存在不确定性。若对原始信号直接进行特征提取会带来特征以外的信息缺失问题,对于这种问题,采用传统的方法,不仅会造成信息丢失和浪费问题,而且数据量不够的情况下也会造成分类器的过拟合等问题。
发明内容
本发明要解决的技术问题是针对上述问题,提出一种基于深度森林轴承故障诊断方法,在对原始轴承信号根据振动频率进行多粒度分组并提取特征向量整合后作为深度森林的输入,训练并得到诊断模型。同时,该方法可操作性强,实用性强,不仅在对轴承故障上具有较好的应用性,而且可以应用于其他类型的机械故障诊断中。
本发明的技术方案是:一种基于深度森林机械轴承故障检测方法,首先,将采集到的正常轴承数据和多种故障轴承数据根据振动频率f分别进行多粒度采样策略分组,得到N组采样数据,再将N组采样数据分别进行特征提取,得到N组特征向量Xs,然后将N组特征向量Xs分别打上标签,再进行整合,得到整个数据的特征向量X,最后,将特征向量X输入到深度森林,构建级联结构,得到训练模型。
具体步骤为:
Step1:将采集到的正常轴承数据和多种故障轴承数据根据振动频率f分别进行多粒度采样策略分组;
具体为:每隔Δt进行一次信号xi的采样,得到信号xi的具有信号周期的数据样本,共M条,再将采集到的M条数据根据振动频率f,按照多粒度采样策略f,2f,3f,…,nf进行分组,得到
Figure GDA0002971758890000021
共N组采样数据;
Step2:将Step1中得到的N组采样数据分别进行特征提取,得到N组数据的特征向量Xs(s=1,2,3,...,N);
Step3:将N组特征向量Xs分别打上标签,再进行整合,得到整个数据的特征向量X;
Step4:将特征向量X输入到深度森林,构建级联结构,具体为:
Step4.1:构建两个完全随机森林Forest1和两个普通随机森林Forest2,每一个完全随机森林Forest1包含m个完全随机的决策树,随机选择一个特征在树的每个节点上进行分割,并生长树直到每个节点只包含相同的类;同样,每一个普通随机森林Forest2包含m个决策树,随机选择
Figure GDA0002971758890000023
个特征作为候选,k为输入的特征数,并计算信息增益,选择信息增益最大的一个特征进行生长树,Forest1和Forest2输出的结果是类分布向量I。每个森林的输出结果为估计的类分布,通过计算森林中相关实例在每棵树的叶子节点的比例,最后平均所有相同森林。
Step4.2:将Step 4.1中估计的类分布形成一个类向量I,然后与原始特征向量X进行拼接,输入到下一个级联层中;例如,现有四分类问题,那么四个森林中的每一个都会产生一个四维的类向量I;因此,级联的下一层将接收4×4=16个增强特征。
Step4.3:为减少过拟合的风险,每个森林生成的类向量I由K折交叉验证(K-foldCross Validation)生成;这样做的一个好处是当验证集验证该级联的时候发现分类的精度不再上升的时候就停止训练,也保证了级联结构的自适应性。
Step4.4:深度森林中的基学习器随机森林Forest1和Forest2的结果采用投票的方法,投票的方法定义两个元素i和j之间的贴近度函数prox(·,·),也就是随机森林模型中同时将i和j分类为同一类的树的比例,即:
Figure GDA0002971758890000022
其中,
Figure GDA0002971758890000024
(·)是指标函数,ht是森林中的第t个树,ht(i)是i的预测值,ht(j)是j的预测值,若所有的树在同一类中对i和j进行分类,则prox(i,j)=1;
Step4.5:使用信息增益对于Forest1和Forest2的树节点进行划分,具体为:信息增益是分类模型的常用的特征选择方法,它是对计算每个特征提供的关于类的信息量进行排序。设数据集D=(x,y),其中x=(x1,…,xk)是样本特征集合,y是相应的类标签,对于整个数据的特征向量X的第i个特征,采用训练集D的熵与xi的D个固定值的子集的熵的加权平均值之间的差异对于Forest1和Forest2的树节点进行划分,信息增益函数Gain(·|·)由以下的式子定义:
Gain(D|i)=H(D)-H(D|i) (2)
其中,
Figure GDA0002971758890000031
Figure GDA0002971758890000032
Figure GDA0002971758890000033
D{y=c}={(x,y)∈D|y=c} (6)
其中,Pi(D)是D中xi所占的比例,C是可能的类标签;
Step5:采用Step4中构建的级联结构对特征向量X进行故障分类,具体过程如下:
Step5.1:将多粒度分组并提取特征的整个数据集按照3:1的比例建立训练集和测试集;
Step5.2:若训练集和测试集特征值是数值型则,将它们归一化,若是字符型或者字符串型,则将它们进行独热编码;
Step5.3:在级联结构的每一个步骤中使用K折交叉检验,使其自动适应深度森林的层数,K可以自己定义。
Step5.4:输入训练集得到训练模型;
Step5.5:将测试集送入训练模型,得到测试结果。
本发明的有益效果是:本发明利用多粒度分组方法对数据进行分割整合,较好的包容了轴承故障诊断中存在的样本数量小等问题,也防止了特征提取时信息丢失的现象。本发明提出的多粒度分组提取出来的特征向量作为后续诊断的特征不仅可以增加诊断的精度而且可以降低因为源数据集过大造成的诊断时间过长的问题。
附图说明
图1是本发明的流程示意图;
图2是本发明源数据多粒度分组采样操作示意图;
图3是本发明对分组后的数据进行特征提取示意图;
图4是本发明分组后提取特征的数据进行整合示意图;
图5是本发明级联结构的构建示意图;
图6是本发明生成类概率分布向量示意图;
图7是本发明的故障诊断的整个流程图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:一种基于深度森林的机械轴承故障诊断方法按照下面步骤进行:
待检测的轴承支撑着电动机的转轴,驱动端轴承为SKF6205,风扇端轴承为SKF6203。轴承用电火花加工单点损伤,损伤直径分为0.007,0.014和0.021英寸。电动机风扇端和驱动端的轴承座上方各放置一个加速度传感器用来采集故障轴承的振动加速度信号。振动信号由16通道数据记录仪采集得到,采样频率为12kHz,驱动端轴承故障还包含采样频率为48kHz的数据。功率和转速通过扭矩传感器测得。
Step1如图2-图4所示,分别选取正常和轴承各种故障情况下的信号各480000个采样点、360000采样点和120000采样点,利用MATLAB软件对原始正常和故障数据按照f,2f,3f,即12000,24000,36000多个粒度进行采样分组,得到共146组,再将这146组分别提取每一组数据的提取特征,在提取特征方面,可采用峭度
Figure GDA0002971758890000041
Figure GDA0002971758890000042
和歪度
Figure GDA0002971758890000043
(其中n为数据量,xi为采集到的数据,
Figure GDA0002971758890000044
为采集到数据的均值,xrms是均方根)等作为每组数据的特征。提取特征后再将他们的特征值整合在一起,作为级联结构的输入。
Step3如图4-图6所示,将步骤2的特征向量输入,构造出级联结构并训练模型,级联结构构建如图5所示。每一层的级联结构而每一层的级联结构都是决策树集成的集成,通过加入两种不同类型的随机森林来体现出集成的多样性,集成学习中基学习器的多样性对于整个模型的学习和建设是至关重要的。级联结构使用了两个完全随机森林和两个普通随机森林,而每一个完全随机森林包含500个完全随机的决策树,随机选择一个特征在树的每个节点上进行分割,并生长树直到每个节点只包含相同的类;同样,每一个普通随机森林包含500个决策树,随机选择
Figure GDA0002971758890000045
个特征作为候选,k为输入的特征数,并计算信息增益,选择信息增益最大的一个特征进行生长树。如图6所示,每个森林的输出结果为估计的类分布,通过计算森林中相关实例在每棵树的叶子节点的比例,最后平均所有相同森林。估计的类分布形成一个类向量,然后与原始向量进行拼接,输入到下一个级联层中。假设现有四分类问题,那么四个森林中的每一个都会产生一个四维的类向量;因此,级联的下一层将接收4×4=16个增强特征。为减少过拟合的风险,每个森林生成的类向量由K折交叉验证(K-foldCross Validation)生成。这样做的一个好处是当验证集验证该级联的时候发现分类的精度不再上升的时候就停止训练,也保证了级联结构的自适应性。
Step4将提取出的特征值2/3用于深度森林的训练数据,1/3用于模型建立后的故障识别,诊断结果表明诊断精度可以达到99.69%,突显出本发明采用分组提取故障特征和深度森林算法故障诊断的方法有效性。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (1)

1.一种基于深度森林机械轴承故障检测方法,其特征在于:首先,将采集到的正常轴承数据和多种故障轴承数据根据振动频率f分别进行多粒度采样策略分组,得到N组采样数据,再将N组采样数据分别进行特征提取,得到N组特征向量Xs,然后将N组特征向量Xs分别打上标签,再进行整合,得到整个数据的特征向量X,最后,将特征向量X输入到深度森林,构建级联结构,得到训练模型;具体步骤为:
Step1:将采集到的正常轴承数据和多种故障轴承数据根据振动频率f分别进行多粒度采样策略分组;
具体为:每隔Δt进行一次信号xi的采样,得到信号xi的具有信号周期的数据样本,共M条,再将采集到的M条数据根据振动频率f,按照多粒度采样策略f,2f,3f,…,nf进行分组,得到
Figure FDA0003152021540000011
共N组采样数据;
Step2:将Step1中得到的N组采样数据分别进行特征提取,得到N组数据的特征向量Xs,s=1,2,3,...,N;
Step3:将N组特征向量Xs分别打上标签,再进行整合,得到整个数据的特征向量X;
Step4:将特征向量X输入到深度森林,构建级联结构,具体为:
Step4.1:构建两个完全随机森林Forest1和两个普通随机森林Forest2,每一个完全随机森林Forest1包含m个完全随机的决策树,随机选择一个特征在树的每个节点上进行分割,并生长树直到每个节点只包含相同的类;同样,每一个普通随机森林Forest2包含m个决策树,随机选择
Figure FDA0003152021540000012
个特征作为候选,k为输入的特征数,并计算信息增益,选择信息增益最大的一个特征进行生长树,Forest1和Forest2输出的结果是类分布向量I;
Step4.2:将Step4.1中估计的类分布形成一个类向量I,然后与原始特征向量X进行拼接,输入到下一个级联层中;
Step4.3:每个森林生成的类向量I由K折交叉验证生成;
Step4.4:深度森林中的基学习器随机森林Forest1和Forest2的结果采用投票的方法定义两个元素i和j之间的贴近度函数prox(i,j),也就是随机森林模型中同时将i和j分类为同一类的树的比例,即:
Figure FDA0003152021540000013
其中,
Figure FDA0003152021540000024
是指标函数,ht是森林中的第t个树,ht(i)是i的预测值,ht(j)是j的预测值,若所有的树在同一类中对i和j进行分类,则prox(i,j)=1;
Step4.5:使用信息增益对于Forest1和Forest2的树节点进行划分,具体为:
设数据集D=(x,y),其中x=(x1,...,xk)是样本特征集合,y是相应的类标签,对于整个数据的特征向量X的第i个特征,采用训练集D的熵H(D)与xi的D个固定值的子集的熵的加权平均值H(D|i)之间的差异对于Forest1和Forest2的树节点进行划分,信息增益函数Gain(D|i)由以下的式子定义:
Gain(D|i)=H(D)-H(D|i) (2)
其中,
Figure FDA0003152021540000021
Figure FDA0003152021540000022
Figure FDA0003152021540000023
D{y=c}={(x,y)∈D|y=c} (6)
其中,Pi(D)是D中xi所占的比例,C是可能的类标签;
Step5:采用Step4中构建的级联结构对特征向量X进行故障分类,具体过程如下:
Step5.1:将多粒度分组并提取特征的整个数据集按照3:1的比例建立训练集和测试集;
Step5.2:若训练集和测试集特征值是数值型,则将它们归一化,若是字符型或者字符串型,则将它们进行独热编码;
Step5.3:在级联结构的每一个步骤中使用K折交叉检验,使其自动适应深度森林的层数;
Step5.4:输入训练集得到训练模型;
Step5.5:将测试集送入训练模型,得到测试结果。
CN201910548884.7A 2019-06-24 2019-06-24 一种基于深度森林机械轴承故障检测方法 Active CN110375987B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910548884.7A CN110375987B (zh) 2019-06-24 2019-06-24 一种基于深度森林机械轴承故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910548884.7A CN110375987B (zh) 2019-06-24 2019-06-24 一种基于深度森林机械轴承故障检测方法

Publications (2)

Publication Number Publication Date
CN110375987A CN110375987A (zh) 2019-10-25
CN110375987B true CN110375987B (zh) 2021-10-22

Family

ID=68249178

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910548884.7A Active CN110375987B (zh) 2019-06-24 2019-06-24 一种基于深度森林机械轴承故障检测方法

Country Status (1)

Country Link
CN (1) CN110375987B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111458145A (zh) * 2020-03-30 2020-07-28 南京机电职业技术学院 一种基于路图特征的缆车滚动轴承故障诊断方法
CN111461461B (zh) * 2020-04-29 2022-06-07 中国水利水电科学研究院 一种水利工程异常检测方法及系统
CN111476383B (zh) * 2020-05-08 2023-06-02 中国水利水电科学研究院 一种泵站机组状态检修动态决策方法
CN112861903B (zh) * 2020-12-03 2023-07-25 南京航空航天大学 一种基于改进深度森林的齿轮箱故障诊断方法
CN112633368B (zh) * 2020-12-21 2022-07-01 四川大学 基于改进多粒度级联森林的扁平振动电机缺陷检测系统及方法
CN113033827B (zh) * 2021-03-03 2024-03-15 南京大学 一种用于深度森林的训练方法和装置
CN113362888A (zh) * 2021-06-02 2021-09-07 齐鲁工业大学 一种基于随机森林的深度特征选择算法提高胃癌预后预测精度系统、方法、设备及介质
CN113408068A (zh) * 2021-06-18 2021-09-17 浙江大学 一种随机森林分类的机泵故障诊断方法及装置
CN116124398B (zh) * 2023-02-08 2023-11-14 广州工程技术职业学院 旋转机械故障检测方法及装置、设备、存储介质
CN116638374A (zh) * 2023-05-29 2023-08-25 北部湾大学 一种基于特征选择和传感器组合的刀具磨损状态识别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506796A (zh) * 2017-08-25 2017-12-22 电子科技大学 一种基于深度森林的阿尔兹海默病分类方法
CN107943704A (zh) * 2017-12-04 2018-04-20 扬州大学 一种基于深度森林网络的软件缺陷预测方法
CN108343599A (zh) * 2018-01-10 2018-07-31 中国水利水电科学研究院 一种基于多粒度级联森林的水泵机组智能故障诊断方法
CN108388860A (zh) * 2018-02-12 2018-08-10 大连理工大学 一种基于功率熵谱-随机森林的航空发动机滚动轴承故障诊断方法
CN108614992A (zh) * 2018-03-19 2018-10-02 中国地质大学(武汉) 一种高光谱遥感图像的分类方法、设备及存储设备
CN109241987A (zh) * 2018-06-29 2019-01-18 南京邮电大学 基于加权的深度森林的机器学习方法
CN109297689A (zh) * 2018-09-11 2019-02-01 中国水利水电科学研究院 一种引入权重因子的大型水力机械智能诊断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101872342B1 (ko) * 2016-10-07 2018-06-29 고려대학교 산학협력단 개선된 RTC(Real-time contrasts) 기법을 이용한 지능형 이상 진단 방법 및 장치

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107506796A (zh) * 2017-08-25 2017-12-22 电子科技大学 一种基于深度森林的阿尔兹海默病分类方法
CN107943704A (zh) * 2017-12-04 2018-04-20 扬州大学 一种基于深度森林网络的软件缺陷预测方法
CN108343599A (zh) * 2018-01-10 2018-07-31 中国水利水电科学研究院 一种基于多粒度级联森林的水泵机组智能故障诊断方法
CN108388860A (zh) * 2018-02-12 2018-08-10 大连理工大学 一种基于功率熵谱-随机森林的航空发动机滚动轴承故障诊断方法
CN108614992A (zh) * 2018-03-19 2018-10-02 中国地质大学(武汉) 一种高光谱遥感图像的分类方法、设备及存储设备
CN109241987A (zh) * 2018-06-29 2019-01-18 南京邮电大学 基于加权的深度森林的机器学习方法
CN109297689A (zh) * 2018-09-11 2019-02-01 中国水利水电科学研究院 一种引入权重因子的大型水力机械智能诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Reducing the Dimensionality of Data with Neural Networks;G. E. Hinton et al;《SCIENCE》;20160728;第313卷;第504-507页 *
基于改进深度森林算法的软件缺陷预测;薛参观等;《计算机科学》;20180831;第45卷(第8期);第160-165页 *
基于深度森林算法的电力系统短期负荷预测;陈吕鹏等;《电力建设》;20181130;第39卷(第11期);第42-50页 *

Also Published As

Publication number Publication date
CN110375987A (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
CN110375987B (zh) 一种基于深度森林机械轴承故障检测方法
Han et al. An adaptive spatiotemporal feature learning approach for fault diagnosis in complex systems
Wang et al. Feature-level attention-guided multitask CNN for fault diagnosis and working conditions identification of rolling bearing
CN109580215B (zh) 一种基于深度生成对抗网络的风电传动系统故障诊断方法
Zheng et al. A rolling bearing fault diagnosis method based on multi-scale fuzzy entropy and variable predictive model-based class discrimination
Zhang et al. Instance-based ensemble deep transfer learning network: A new intelligent degradation recognition method and its application on ball screw
Sugumaran et al. Fault diagnosis of roller bearing using fuzzy classifier and histogram features with focus on automatic rule learning
CN106874957A (zh) 一种滚动轴承故障诊断方法
CN110110768B (zh) 基于并行特征学习和多分类器的滚动轴承故障诊断方法
CN111444940A (zh) 风机关键部位故障诊断方法
CN113076834B (zh) 旋转机械故障信息处理方法、处理系统、处理终端、介质
CN113505664B (zh) 一种风电机组行星齿轮箱故障诊断方法
CN111931601A (zh) 齿轮箱错误类别标签修正系统及方法
CN112257862B (zh) 一种基于关系网络标记样本扩充的半监督辨识方法
Cao et al. Intelligent fault diagnosis of wind turbine gearbox based on Long short-term memory networks
CN112949402A (zh) 极小故障样本量下行星齿轮箱故障诊断方法
CN112860183A (zh) 基于高阶矩匹配的多源蒸馏-迁移机械故障智能诊断方法
CN115859077A (zh) 一种变工况下多特征融合的电机小样本故障诊断方法
Saberi et al. Lightgbm-based fault diagnosis of rotating machinery under changing working conditions using modified recursive feature elimination
CN114997211A (zh) 一种基于改进对抗网络和注意力机制的跨工况故障诊断方法
Maurya et al. Intelligent hybrid scheme for health monitoring of degrading rotary machines: An adaptive fuzzy c-means coupled with 1-d cnn
CN111539381B (zh) 风力发电机轴承故障分类诊断模型的构建方法
CN112163630A (zh) 一种基于不平衡学习的复合故障诊断方法及装置
Zhang et al. Gearbox health condition identification by neuro-fuzzy ensemble
CN110033082B (zh) 一种识别ai设备中深度学习模型的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant