CN113255591A - 一种基于随机森林和融合特征的轴承故障诊断方法 - Google Patents
一种基于随机森林和融合特征的轴承故障诊断方法 Download PDFInfo
- Publication number
- CN113255591A CN113255591A CN202110708178.1A CN202110708178A CN113255591A CN 113255591 A CN113255591 A CN 113255591A CN 202110708178 A CN202110708178 A CN 202110708178A CN 113255591 A CN113255591 A CN 113255591A
- Authority
- CN
- China
- Prior art keywords
- data
- fault diagnosis
- bearing
- fusion
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
- G06F2218/06—Denoising by applying a scale-space analysis, e.g. using wavelet analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/12—Classification; Matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Signal Processing (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明属于智能识别控制技术领域,具体涉及一种基于随机森林和融合特征的轴承故障诊断方法,包括数据处理步骤、特征提取步骤、特征融合步骤、模型训练步骤和故障诊断步骤,是一种通过分别提取时域特征和频域特征进行特征融合,基于随机森林算法对轴承故障进行智能的、自动化诊断的方法。
Description
技术领域
本发明属于智能识别控制技术领域,具体涉及一种基于随机森林和融合特征的轴承故障诊断方法。
背景技术
随着现代工业技术的快速发展,各类生产设备朝着越来越智能化、同时也越来越复杂化的方向发展,因此,一旦智能化的设备中某一部分发生故障时,就可能会引起链式反应,严重时可能导致整机停产检修。因此,在故障发生时如何准确判断故障类型、及时准确的安排专业人士进行维修,成了大型工业厂必须考虑的问题。
而在大部分机械类加工设备中,主要的传动结构都是旋转机械,滚动轴承作为各种旋转机械最常用的通用零部件,则是对设备故障进行诊断的重中之重,目前常用的滚动轴承故障诊断方法主要有三种:
1、基于贝叶斯推理的故障模式识别技术,是一种建立在概率统计推理基础上的贝叶斯分类算法,在故障诊断领域具有良好的应用效果,但由于朴素贝叶斯分类算法建立在属性条件独立性假设的基础之上,而此假设在实践过程常常并不满足,因此该方法在实际轴承故障诊断应用中具有一定的局限性;
2、基于神经网络的故障模式识别技术,基于神经网络的滚动轴承故障诊断就是利用神经网络建立故障信号的特征量和故障类型之间的映射关系从而实现对轴承的故障识别,但是由于该模型存在样本依赖性、网络结构难以确定以及解释性差等问题,还需要进一步深入研究提升神经网络的轴承故障诊断精度;
3、基于支持向量机的故障模式识别技术,支持向量机模型在小样本的轴承故障诊断中有着广阔的应用前景,但是应用该模型的前提需要提供有效的轴承故障特征量,因此需要进一步研究相关轴承故障特征量的提取问题。
随着机器学习技术的长足进步,将先进技术运用在传统机械加工设备中用于实现对机械化设备的智能化升级,也为滚动轴承故障诊断提供了一个新的方向。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是人工智能核心,是使计算机具有智能的根本途径。
在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。决策树相当于一个大师,通过自己在数据集中学到的知识对于新的数据进行分类,随机森林就是希望构建多个分支,希望最终的分类效果能够超过单个大师的一种算法。随机森林的构建有两个方面:数据的随机性选取、以及待选特征的随机选取。其中数据的随机选取,首先,从原始的数据集中采取有放回的抽样,构造子数据集,子数据集的数据量是和原始数据集相同的,不同子数据集的元素可以重复,同一个子数据集中的元素也可以重复;第二,利用子数据集来构建子决策树,将这个数据放到每个子决策树中,每个子决策树输出一个结果;最后,如果有了新的数据需要通过随机森林得到分类结果,就可以通过对子决策树的判断结果的投票,得到随机森林的输出结果了。所述待选特征的随机选取,与数据集的随机选取类似,随机森林中的子树的每一个分裂过程并未用到所有的待选特征,而是从所有的待选特征中随机选取一定的特征,之后再在随机选取的特征中选取最优的特征,这样能够使得随机森林中的决策树都能够彼此不同,提升系统的多样性,从而提升分类性能。
如果能将随机森林算法运用在对滚动轴承进行故障诊断中,就可以避免基于贝叶斯推理假设的局限性、得到的结果也能进行合理的解释,并且在大样本的情况下也适用。
发明内容
为了克服上述现有技术中存在的问题和不足,本发明旨在于提出一种通过分别提取时域特征和频域特征进行特征融合,基于随机森林算法对轴承故障进行智能的、自动化诊断的方法。
本发明的目的是通过以下技术方案实现的:
一种基于随机森林和融合特征的轴承故障诊断方法,包括数据处理步骤、特征提取步骤、特征融合步骤、模型训练步骤和故障诊断步骤,具体的:
数据处理步骤,将通过不同通道的传感器采集到的轴承数据中的异常值进行剔除,并将因不同通道的传感器的时间延迟差异造成数据延迟不一致的轴承数据进行对齐处理;
进一步的,所述数据处理步骤中,做为分析样本的轴承数据近似正态分布,考虑使用3σ方法对采集到的轴承数据中的异常值进行剔除,3σ方法认为99%以上的数据集中在均值上下3个标准差的范围内,具体来说,数值分布在(μ-3σ,μ+3σ)中的概率为99.73%,σ代表标准差,μ代表均,超过这个范围的极大或极小值,那就是异常值了。
优选地,所述数据处理步骤中,传感器采集轴承数据时的电机转速为60HZ,采样频率10000条/秒,即1秒采集10000条数据。
更为优选地,传感器每次只采集单一故障数据,每次采集的数据包括采集时间、传感器所在通道的数据、以及所属的状态,所属的状态为自定义状态,比如正常、故障状态1、故障状态2等。
进一步的,所述数据处理步骤中的对齐处理,是将轴承数据对应的不同通道的传感器的时间延迟的差异大于0.001秒的,认为该数据不属于同一时间的数据,进行删除。
所述特征提取步骤,根据预设的尺寸和步长将经过所述数据处理步骤处理的数据划分为若干个窗口,采集到的轴承数据是信号量,信号就有高频、低频的变化,频段的变化反应了元件是否正常工作,因信号各频率成分能量的变化,表征了系统某些元件的损坏情况,基于这点,提取每个窗口内数据的频域特征;对每个窗口内的数据取均值、标准差、最大最小值等作为数据指标,然后对不同状态下、不同通道的轴承数据进行描述性统计分析,并通过对每个窗口内的数据绘制概率密度图展示数据的偏斜程度和尖峭程度,这样可以直观的感受数据的偏斜程度和尖峭程度;通过均值可以反应采集数据的平均水平;通过标准差可以反应采集数据的离散程度;通过最大最小值可以反应采集数据的范围,通过对这些数据进行分析,找出不同状态下区分程度超过阈值的数据指标作为时域特征;所述区分程度的阈值,比如正常状态下均值为2,其他状态下均值大于1.15*2或者小于0.75*2,则认为区分程度大;
优选地,所述特征提取步骤中,预设的窗口尺寸大小为167、步长为1,因为电电机转速为60HZ,所以电机转动周期为T=1/60秒,1秒采集10000条数据,故10000/60约等于167设置为窗口大小。
即,所述特征提取步骤,通过概率密度图和描述性统计分析,得到每个窗口内数据的平均水平、离散程度和采集数据的范围。
进一步的,所述特征提取步骤中,提取每个窗口内数据的频域特征是对每个窗口内的数据进行三次小波分解,得到23=8个分解系数,小波包变换可以对时间和频域进行变换,采取三层小波包变换,得到通道17的s2、s4、s8分量,通道18的s3、s7、s8分量,通道19的s6、s7分量在3种状态下具有显著差异,故提取这8个特征,显著差异是指异常情况下分解得到的系数相比于正常情况下得到的系数大于10%。
所述特征融合步骤,将所述特征提取步骤中每个窗口内的数据的时域特征与频域特征进行融合,将相同窗口的时域特征与频域特征拼接起来得到融合特征,并根据先验阈值对融合特征进行故障诊断;
所述模型训练步骤,将所述特征融合步骤中的融合特征和对应的故障诊断结果作为样本集输入至模型中,采用随机森林算法进行模型训练,通过精确率和ROC确定随机森林的分支的数量T,精确率(Precision)即查准率,即正确预测为正的占全部预测为正的比例,ROC是以FPR为X轴,以TPR为Y轴的二维曲线图,FPR=(错分负例数)/(负例总数),TPR=(正确分类正例数)/(正例总数),其中横轴和纵轴的长度相等,为单位1,AUC的值就是处于ROC曲线下方的那部分面积的大小,值越大,说明模型越好,比如,跑随机森林模型时,设置树的大小为1:300,不同参数下会得到测试集上的精确率和ROC曲线,最终得到取100时两个指标最优。
在信号检测理论中,ROC(接收者操作特征曲线)是坐标图式的分析工具,用于选择最佳的信号侦测模型、舍弃次佳的模型,以及在同一模型中设定最佳阈值。在做决策时,ROC分析能不受成本/效益的影响,给出客观中立的建议。
更为具体的,所述模型训练步骤,采用随机森林算法进行模型训练,如图2所示,具体的:
将所述特征融合步骤中的融合特征xi和对应的故障诊断结果yi作为样本集D输入至模型中,D={(x1,y1),(x2,y2),...,(xm,ym)},m为常数、对应样本集的数量,随机森林中树的数量T即为弱分类器迭代次数,即模型中包括T个决策树模型GT;
对样本集D进行T次随机采样,没次随机采样共采样m个样本,得到对应每个树的、包含有m个样本的采样集DT;用采样集DT训练每个决策树模型GT,在训练每个决策树模型GT的节点时,在节点上的样本中随机选择一部分样本,并在这些随机选择的样本中选择一个最优的特征来做决策树的左右子树类别划分,最优的特征是根据先验阈值设置的;
所有决策树模型GT投出最多票数的左右子树类别为最终类别。
进一步的,还包括进行模型调优,具体的,是通过K折交叉验证计算精确率和ROC,将样本集D分割成K个样本子集,将一个样本子集保留作为测试数据,其他K-1个样本子集用来训练分类机,重复K次,平均K次的误差结果,最终得到误差估计。通过K交叉验证,可以避免数据集的选取对结果的影响,但是当数据不平衡时不能评定算法的优良性,故结合ROC来衡量算法精度,优选的,当T=100时,模型效果最好。
所述故障诊断步骤,模型训练好后,就可以将特征融合步骤中得到的融合特征直接输入至所述模型训练步骤得到轴承故障诊断模型中进行轴承故障诊断,不需要再进行人工的判别了。
有益效果:
与现有技术方案相比,本发明所提供的这种技术方案的有益效果如下:
对多通道数据进行异常值剔除和数据对齐,在每个窗口内对不同状态下不同通道数据进行描述性统计分析,通过绘制概率密度图可以直观的感受其偏斜程度和尖峭程度;通过均值可以反应采集数据的平均水平;通过标准差可以反应采集数据的离散程度;通过最大、最小值可以反应采集数据的范围,通过对这些数据进行分析,找出不同状态下区分程度较大的数据指标,作为时域特征,并且也提取数据的频域特征,将时域特征与频域特征进行融合使用融合的特征进行故障诊断,提高了诊断的准确率。
采用随机森林算法进行模型训练,在采集样本比较少的情况下,随机森林诊断准确率较高、漏报率较低,随机森林中树数量的确定是通过精确率和ROC,得到最适合的树的数量,最终训练出的模型在测试集上使得平均精确度、召回率、F1值均在92%,在各类别上的分类精确度也在85%以上。
附图说明
本发明的前述和下文具体描述在结合以下附图阅读时变得更清楚,附图中:
图1为本发明故障诊断流程的流程示意图;
图2为本发明模型训练逻辑示意图;
图3为本发明实施例中对轴承数据进行对齐处理示意图。
具体实施方式
下面通过几个具体的实施例来进一步说明实现本发明目的技术方案,需要说明的是,本发明要求保护的技术方案包括但不限于以下实施例。
本实施例提供了一种基于随机森林和融合特征的轴承故障诊断方法,包括数据处理步骤、特征提取步骤、特征融合步骤、模型训练步骤和故障诊断步骤,在采集样本比较少的情况下,采用准确率较高、漏报率较低的随机森林诊断对模型进行训练,将时域特征与频域特征进行融合使用融合的特征进行故障诊断,提高了诊断的准确率。
具体的,如图1,所述数据处理步骤,将通过不同通道的传感器采集到的轴承数据中的异常值进行剔除,并将因不同通道的传感器的时间延迟差异造成数据延迟不一致的轴承数据进行对齐处理;传感器采集数据时电机转速60HZ,采样频率10000条/秒,即1S采集10000条数据,且传感器每次只采集单一故障数据,轴承数据为通道17~通道20的数据,每次采集的数据包括时间,该通道的数据,所属状态,所属的状态包括正常、故障状态1、故障状态2等。
优选地,做为分析样本的轴承数据近似正态分布,考虑使用3σ方法对采集到的轴承数据中的异常值进行剔除,3σ方法认为99%以上的数据集中在均值上下3个标准差的范围内,具体来说,数值分布在(μ-3σ,μ+3σ)中的概率为99.73%,σ代表标准差,μ代表均,超过这个范围的极大或极小值,那就是异常值了,应当进行删除。
更为优选地,不同通道的传感器的时间延迟的差异大于0.001秒的,其轴承数据需要进行对齐处理,具体的如图3,不同通道的传感器的时间延迟的差异大于0.001秒的,认为该数据不属于同一时间的数据,进行删除,
进一步的,所述特征提取步骤,根据预设的尺寸和步长将经过所述数据处理步骤处理的数据划分为若干个窗口,采集到的轴承数据是信号量,信号就有高频、低频的变化,频段的变化反应了元件是否正常工作,因信号各频率成分能量的变化,表征了系统某些元件的损坏情况,基于这点,提取每个窗口内数据的频域特征;对每个窗口内的数据取均值、标准差、最大最小值等作为数据指标,然后对不同状态下、不同通道的轴承数据进行描述性统计分析,并通过对每个窗口内的数据绘制概率密度图展示数据的偏斜程度和尖峭程度,可以直观的感受数据的偏斜程度和尖峭程度;通过均值可以反应采集数据的平均水平;通过标准差可以反应采集数据的离散程度;通过最大最小值可以反应采集数据的范围,通过对这些数据进行分析,找出不同状态下区分程度超过阈值的数据指标作为时域特征;所述区分程度的阈值,比如正常状态下均值为2,其他状态下均值大于1.15*2或者小于0.75*2,则认为区分程度大;比如,得到通道17~通道20这4个通道的均值、标准差、峰度、偏度作为故障诊断特征,共计4*4=16个特征。
优选地,所述特征提取步骤中,预设的窗口尺寸大小为167、步长为1,因为电电机转速为60HZ,所以电机转动周期为T=1/60秒,1秒采集10000条数据,故10000/60约等于167设置为窗口大小。
更为优选地,提取每个窗口内数据的频域特征是对每个窗口内的数据进行三次小波分解,得到23=8个分解系数,小波包变换可以对时间和频域进行变换,采取三层小波包变换,得到通道17的s2、s4、s8分量,通道18的s3、s7、s8分量,通道19的s6、s7分量在3种状态下具有显著差异,故提取这8个特征,显著差异是指异常情况下分解得到的系数相比于正常情况下得到的系数大于10%。
进一步的,所述特征融合步骤,将所述特征提取步骤中每个窗口内的数据的时域特征与频域特征进行融合,将相同窗口的时域特征与频域特征拼接起来得到融合特征,并根据先验阈值对融合特征进行故障诊断,将通道17~通道20这4个通道的时8个特征在3种状态下的差异、即时域特征与频域特征融合共计24个特征,用于模型训练;
更进一步的,模型训练步骤,将所述特征融合步骤中的融合特征和对应的故障诊断结果作为样本集输入至模型中,采用随机森林算法进行模型训练,随机森林中的分支数量T的是通过精确率和ROC确定的,精确率(Precision)即查准率,即正确预测为正的占全部预测为正的比例,ROC是以FPR为X轴,以TPR为Y轴的二维曲线图,FPR=(错分负例数)/(负例总数),TPR=(正确分类正例数)/(正例总数),其中横轴和纵轴的长度相等,为单位1,AUC的值就是处于ROC曲线下方的那部分面积的大小,值越大,说明模型越好,比如,跑随机森林模型时,设置树的大小为1:300,不同参数下会得到测试集上的精确率和ROC曲线,最终得到取100时两个指标最优。
在信号检测理论中,ROC(接收者操作特征曲线)是坐标图式的分析工具,用于选择最佳的信号侦测模型、舍弃次佳的模型,以及在同一模型中设定最佳阈值。在做决策时,ROC分析能不受成本/效益的影响,给出客观中立的建议。
优选地,所述模型训练步骤,采用随机森林算法进行模型训练,如图2所示,具体的:
将所述特征融合步骤中的融合特征xi和对应的故障诊断结果yi作为样本集D输入至模型中,D={(x1,y1),(x2,y2),...,(xm,ym)},m为常数、对应样本集的数量,随机森林中树的数量T即为弱分类器迭代次数,即模型中包括T个决策树模型GT;
对样本集D进行T次随机采样,没次随机采样共采样m个样本,得到对应每个树的、包含有m个样本的采样集DT;用采样集DT训练每个决策树模型GT,在训练每个决策树模型GT的节点时,在节点上的样本中随机选择一部分样本,并在这些随机选择的样本中选择一个最优的特征来做决策树的左右子树类别划分,最优的特征是根据先验阈值设置的;
所有决策树模型GT投出最多票数的左右子树类别为最终类别,即所有决策树模型GT对应的弱分类器集合即构成强分类器f(x),也就是最后的模型。
进一步的,还包括进行模型调优,具体的,是通过K折交叉验证计算精确率和ROC,将样本集D分割成K个样本子集,将一个样本子集保留作为测试数据,其他K-1个样本子集用来训练分类机,重复K次,平均K次的误差结果,最终得到误差估计。通过K交叉验证,可以避免数据集的选取对结果的影响,但是当数据不平衡时不能评定算法的优良性,故结合ROC来衡量算法精度,优选的,当T=100时,模型效果最好。
所述故障诊断步骤,模型训练好后,就可以将特征融合步骤中得到的融合特征直接输入至所述模型训练步骤得到轴承故障诊断模型中进行轴承故障诊断,不需要再进行人工的判别了。
Claims (10)
1.一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于:包括以下步骤:
数据处理步骤,将通过不同通道的传感器采集到的轴承数据中的异常值进行剔除,并将因不同通道的传感器的时间延迟差异造成数据延迟不一致的轴承数据进行对齐处理;
特征提取步骤,根据预设的尺寸和步长将经过所述数据处理步骤处理的数据划分为若干个窗口,提取每个窗口内数据的频域特征;对每个窗口内的数据取均值、标准差、最大最小值作为数据指标,然后对不同通道的轴承数据进行描述性统计分析,并通过对每个窗口内的数据绘制概率密度图展示数据的偏斜程度和尖峭程度;找出区分程度超过阈值的数据指标作为时域特征;
特征融合步骤,将所述特征提取步骤中每个窗口内的数据的时域特征与频域特征进行融合,将相同窗口的时域特征与频域特征拼接起来得到融合特征,并根据先验阈值对融合特征进行故障诊断;
模型训练步骤,将所述特征融合步骤中的融合特征和对应的故障诊断结果作为样本集输入至模型中,采用随机森林算法进行模型训练,得到轴承故障诊断模型,通过精确率和ROC确定随机森林的分支的数量T;
故障诊断步骤,将特征融合步骤中得到的融合特征直接输入至所述模型训练步骤得到轴承故障诊断模型中进行轴承故障诊断。
2.如权利要求1所述的一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于:所述数据处理步骤中,使用3σ方法对采集到的轴承数据中的异常值进行剔除,将数值分布在(μ-3σ,μ+3σ)以外的值认为是异常值进行剔除,σ代表标准差,μ代表均值。
3.如权利要求1所述的一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于:所述数据处理步骤中,传感器采集轴承数据时的电机转速为60HZ,采样频率10000条/秒,即1秒采集10000条数据。
4.如权利要求1或3所述的一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于:传感器每次只采集单一故障数据,每次采集的数据包括采集时间、传感器所在通道的数据、以及所属的状态。
5.如权利要求1、2或3所述的一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于:所述数据处理步骤中的对齐处理,是将轴承数据对应的不同通道的传感器的时间延迟的差异大于0.001秒的进行删除。
6.如权利要求1所述的一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于:所述特征提取步骤中,预设的窗口尺寸大小为167、步长为1。
7.如权利要求1或6所述的一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于:所述特征提取步骤,通过概率密度图和描述性统计分析,得到每个窗口内数据的平均水平、离散程度和采集数据的范围。
8.如权利要求1所述的一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于:所述特征提取步骤中,提取每个窗口内数据的频域特征是对每个窗口内的数据进行三次小波分解,得到23=8个分解系数。
9.如权利要求1所述的一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于,所述模型训练步骤,采用随机森林算法进行模型训练,具体的:
将所述特征融合步骤中的融合特征xi和对应的故障诊断结果yi作为样本集D输入至模型中,D={(x1,y1),(x2,y2),...,(xm,ym)},m为常数、对应样本集的数量,随机森林中树的数量T即为弱分类器迭代次数,即模型中包括T个决策树模型GT;
对样本集D进行T次随机采样,每次随机采样共采样m个样本,得到对应每个树的、包含有m个样本的采样集DT;用采样集DT训练每个决策树模型GT,在训练每个决策树模型GT的节点时,在节点上的样本中随机选择一部分样本,并在这些随机选择的样本中选择一个最优的特征来做决策树的左右子树类别划分,最优的特征是根据先验阈值设置的;
所有决策树模型GT投出最多票数的左右子树类别为最终类别。
10.如权利要求9所述的一种基于随机森林和融合特征的轴承故障诊断方法,其特征在于:还包括进行模型调优,具体的,是通过K折交叉验证计算精确率和ROC,将样本集D分割成K个样本子集,将一个样本子集保留作为测试数据,其他K-1个样本子集用来训练分类机,重复K次,平均K次的误差结果,最终得到误差估计。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110708178.1A CN113255591A (zh) | 2021-06-25 | 2021-06-25 | 一种基于随机森林和融合特征的轴承故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110708178.1A CN113255591A (zh) | 2021-06-25 | 2021-06-25 | 一种基于随机森林和融合特征的轴承故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113255591A true CN113255591A (zh) | 2021-08-13 |
Family
ID=77189612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110708178.1A Pending CN113255591A (zh) | 2021-06-25 | 2021-06-25 | 一种基于随机森林和融合特征的轴承故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113255591A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114325236A (zh) * | 2021-12-28 | 2022-04-12 | 广东电网有限责任公司 | 一种基于频谱熵和随机森林的配电网故障识别方法及系统 |
CN116484753A (zh) * | 2023-06-25 | 2023-07-25 | 成都四威功率电子科技有限公司 | 融合机器学习和物理模型的发射阵故障诊断方法及装置 |
CN117648565A (zh) * | 2023-10-27 | 2024-03-05 | 甘肃倚莱克特电力科技有限公司 | 一种发电机故障识别算法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103868690A (zh) * | 2014-02-28 | 2014-06-18 | 中国人民解放军63680部队 | 基于多种特征提取和选择的滚动轴承状态自动预警方法 |
CN106980761A (zh) * | 2017-03-29 | 2017-07-25 | 电子科技大学 | 一种滚动轴承运行状态退化趋势预测方法 |
CN108152059A (zh) * | 2017-12-20 | 2018-06-12 | 西南交通大学 | 基于多传感器数据融合的高速列车转向架故障检测方法 |
CN109934089A (zh) * | 2018-10-31 | 2019-06-25 | 北京航空航天大学 | 基于监督梯度提升器的多级癫痫脑电信号自动识别方法 |
US20190310164A1 (en) * | 2018-04-06 | 2019-10-10 | United Technologies Corporation | Integrated vibe/odm fusion and trending analysis for prognostic health management of engine bearing |
CN110879351A (zh) * | 2019-11-28 | 2020-03-13 | 山东科技大学 | 一种基于rcca-svm的非线性模拟电路故障诊断方法 |
CN111476323A (zh) * | 2020-06-01 | 2020-07-31 | 合肥工业大学 | 一种轴承故障分类方法及系统 |
-
2021
- 2021-06-25 CN CN202110708178.1A patent/CN113255591A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103868690A (zh) * | 2014-02-28 | 2014-06-18 | 中国人民解放军63680部队 | 基于多种特征提取和选择的滚动轴承状态自动预警方法 |
CN106980761A (zh) * | 2017-03-29 | 2017-07-25 | 电子科技大学 | 一种滚动轴承运行状态退化趋势预测方法 |
CN108152059A (zh) * | 2017-12-20 | 2018-06-12 | 西南交通大学 | 基于多传感器数据融合的高速列车转向架故障检测方法 |
US20190310164A1 (en) * | 2018-04-06 | 2019-10-10 | United Technologies Corporation | Integrated vibe/odm fusion and trending analysis for prognostic health management of engine bearing |
CN109934089A (zh) * | 2018-10-31 | 2019-06-25 | 北京航空航天大学 | 基于监督梯度提升器的多级癫痫脑电信号自动识别方法 |
CN110879351A (zh) * | 2019-11-28 | 2020-03-13 | 山东科技大学 | 一种基于rcca-svm的非线性模拟电路故障诊断方法 |
CN111476323A (zh) * | 2020-06-01 | 2020-07-31 | 合肥工业大学 | 一种轴承故障分类方法及系统 |
Non-Patent Citations (2)
Title |
---|
刘敏等: "随机森林中树的数量", 《计算机工程与应用》 * |
朱家远等: "基于信号时频特性与GA-SVM的液压泵故障诊断方法", 《应用科技》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114325236A (zh) * | 2021-12-28 | 2022-04-12 | 广东电网有限责任公司 | 一种基于频谱熵和随机森林的配电网故障识别方法及系统 |
CN114325236B (zh) * | 2021-12-28 | 2023-08-18 | 广东电网有限责任公司 | 一种基于频谱熵和随机森林的配电网故障识别方法及系统 |
CN116484753A (zh) * | 2023-06-25 | 2023-07-25 | 成都四威功率电子科技有限公司 | 融合机器学习和物理模型的发射阵故障诊断方法及装置 |
CN116484753B (zh) * | 2023-06-25 | 2023-09-19 | 成都四威功率电子科技有限公司 | 融合机器学习和物理模型的发射阵故障诊断方法及装置 |
CN117648565A (zh) * | 2023-10-27 | 2024-03-05 | 甘肃倚莱克特电力科技有限公司 | 一种发电机故障识别算法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110162018B (zh) | 基于知识蒸馏与隐含层共享的增量式设备故障诊断方法 | |
CN111914883B (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
CN113255591A (zh) | 一种基于随机森林和融合特征的轴承故障诊断方法 | |
CN106895975B (zh) | 基于Stacked SAE深度神经网络的轴承故障诊断方法 | |
CN112254964A (zh) | 一种基于快速多尺度卷积神经网络的滚动轴承故障诊断方法 | |
CN111832647A (zh) | 异常流量检测系统及方法 | |
CN113962259B (zh) | 一种燃料电池系统多模式双层故障诊断方法 | |
CN110245745B (zh) | 基于集成双向循环神经网络的设备剩余使用寿命预测方法 | |
CN111562108A (zh) | 一种基于cnn和fcmc的滚动轴承智能故障诊断方法 | |
CN108985380B (zh) | 一种基于聚类集成的转辙机故障识别方法 | |
CN112756759B (zh) | 点焊机器人工作站故障判定方法 | |
CN117077044B (zh) | 一种发电机用真空断路器故障判别方法及装置 | |
CN108647707B (zh) | 概率神经网络创建方法、故障诊断方法及装置、存储介质 | |
CN115409131B (zh) | 基于spc过程管控系统的生产线异常检测方法 | |
CN115905976B (zh) | 基于注意力机制的Highway Bi-LSTM轴承故障诊断方法、系统及设备 | |
CN108375729B (zh) | 基于Fisher判别的电机SOM聚类退化状态评估方法 | |
CN114118219A (zh) | 基于数据驱动的长期加电设备健康状态实时异常检测方法 | |
CN113705715B (zh) | 一种基于lstm和多尺度fcn的时间序列分类方法 | |
CN116702076A (zh) | 一种基于cnn特征融合的小样本迁移学习故障诊断方法、系统、计算机及存储介质 | |
CN114169398A (zh) | 基于随机森林算法的光伏直流电弧故障识别方法及装置 | |
CN108665001B (zh) | 一种基于深度置信网络的跨被试空闲态检测方法 | |
CN111636123B (zh) | 一种智能纺纱生产线故障检测系统 | |
KR102366787B1 (ko) | 슬라이딩 윈도우 기법을 이용한 제조설비의 실시간 다변량 이상감지 시스템 | |
CN110490218B (zh) | 一种基于两级dbn的滚动轴承故障自学习方法 | |
CN116578833A (zh) | 基于优化随机森林模型的igbt模块老化故障诊断系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210813 |