CN110070060B

CN110070060B - 一种轴承设备的故障诊断方法

Info

Publication number: CN110070060B
Application number: CN201910342040.7A
Authority: CN
Inventors: 曹雪; 王哲人; 王向敏; 凤震宇
Original assignee: Tianjin Development Zone Jingnuo Hanhai Data Technology Co ltd
Current assignee: Tianjin Development Zone Jingnuo Hanhai Data Technology Co ltd
Priority date: 2019-04-26
Filing date: 2019-04-26
Publication date: 2021-06-04
Anticipated expiration: 2039-04-26
Also published as: CN110070060A

Abstract

本发明公开了一种轴承设备的故障诊断方法，涉及轴承设备故障诊断技术领域。本发明首先利用重采样方法对不平衡的数据样本进行处理，然后利用深度学习算法对新增数据进行特征模式提取，然后将新增模式输入原有集成模型中进行分类，进一步提出动态遗忘权重算法、有效增量筛选算法、增量信息融合算法，根据计算值对增量合并模式的权重动态调整。最后，使用增量集成SVM对加权模式进行有监督分类，从而实现轴承设备状态特征实时提取和故障模式可靠分类。

Description

一种轴承设备的故障诊断方法

技术领域

本发明涉及轴承设备故障诊断技术领域，尤其涉及一种基于增量融合动态权重集成学习的轴承设备故障诊断方法。

背景技术

轴承设备多应用于工业、航空、国防等重要领域，其故障后果相对严重，因此如何从轴承设备运行状态数据中提取故障特征信息并进行有效分析，从而完成故障诊断和预测日益重要，成为智能制造领域的研究热点。尤其在工业4.0背景下，随着工业物联网和信息技术的发展，生产过程中涌现出海量运行状态数据，使得借助大数据分析方法进行故障诊断成为可能。

近年来，随着工业物联网的高速发展，设备生产过程中产生的状态数据呈指数型增长，仅仅依靠现有故障模式进行匹配显然不合理，新增状态数据往往携带反应设备当前运行状态的重要信息。因此，如何挖掘新产生状态数据，合并到已有故障诊断模型中成为当前故障诊断领域研究的热点问题。

上述新增状态数据带来的问题可以通过增量学习的方法得到解决。目前广泛应用的处理方法是利用各基分类器输出的归一化加权平均值检测新增故障。Razavi-Far R等利用对分类的置信度度量，以集成分类器的输出值的归一化加权平均(NWAO)值作为检测新增故障类型的基础。Palade V等采用基于对集成诊断系统中基分类器的输出的归一化加权平均值(NWAO)进行阈值化的方法实现增量数据的故障检测。上述方法实现了动态环境下对增量状态数据的故障诊断，但上述方法没有使用增量数据更新已有决策模型，可能造成不必要的冗余。另一种较为典型的处理方法是利用新增数据训练新的基分类器与原有基分类器结合不断更新已有模型。例如以增量特征集为训练集训练一组极限学习机分类器与原有的决策模块合并诊断轴承故障，利用新增状态数据实现对原有分类模型的动态更新，避免了故障类型误报问题，有效提高故障诊断的准确率。但是设备实际运行产生的海量非平衡数据同样影响了诊断的准确率，处理新增非平衡数据的有效方法也亟待改进与完善。Bang s根据样本分布信息为其赋予不同的惩罚松弛权重，改善了样本分布不均对分类准确率的影响。改进支持向量机提高其对少数类样本的分类准确率是一种广泛应用的处理方法，Fan Q使用模糊支持向量机用于非平衡数据分类，以模糊隶属度反应样本的不同重要性，基于多数类样本的熵分配给一定的模糊隶属度，并为少数类样本分配相对较大的模糊隶属度保证其重要性。解决传统SVM对少数类样本识别率低的问题。但是上述针对算法的改进往往缺乏通用性，而对数据本身进行处理则更能从根本上解决非平衡问题。欠采样技术通过降低多数类样本数量以达到平衡.但是该方法会误删有效数据造成重要信息的缺失。过采样技术通过增加少数类样本以达到平衡,其中合成少数类技术(Synthetic Minority OverSampling Technique，简称SMOTE)是一种广泛应用的过采样方法，通过在少数类样本与其K近邻之间随机插值合成新样本解决数据集不平衡的问题，翟云等通过单边选择链遴选出处于分类边界的少数类样本，依据这些样本的分布密度采用SMOTE方法进行过采样，但是该方法可能会产生错误样本、冗余样本或造成分类器过拟合，使学习任务变得更加困难。上述非平衡数据处理方法都在相应文献中取得了一定的效果，但仍然存在一些问题。比如，在重采样的过程中未考虑噪声数据的影响，导致分类准确率严重降低。一些方法虽然考虑到了样本分布信息对数据处理过程的影响，但忽略了随海量新增数据的产生样本分布状态的变化。这些问题阻碍了上述非平衡处理方法在设备故障诊断领域的进一步应用。

发明内容

本发明的目的在于：本发明提供了一种基于增量融合动态权重集成学习的轴承设备故障诊断方法，首先利用动态加权的重采样方法对不平衡的数据样本进行处理，并利用堆叠式降噪自动编码器对新增数据挖掘并提取特征模式，将新增模式输入原有集成模型中进行分类，依据基分类器对新增特征模式识别的准确率利用动态遗忘权重算法对基分类器权重进行动态调整，并淘汰不能适应当前设备运行状态的基分类器。进一步提出有效增量筛选算法，选择具有代表性的新增模式训练新的基分类器实现分类模型的增量信息合并。使用增量集成SVM对加权模式进行有监督分类，该方法与传统深度学习相比既重视了新生故障模式，又考虑到原有失效模式，从而实现轴承设备状态特征实时提取和故障模式可靠分类。

本发明所采取的技术方案为：一种轴承设备的故障诊断方法，其特征在于，包括下述步骤：

(1)在轴承设备上对内圈、外圈和滚动体分别布置了多个不同故障等级的单点故障，利用传感器采集内圈、外圈和滚动体分别在正常状态和多个不同故障等级状态下的振动信号数据，分为正常数据和故障数据；

(2)对步骤(1)中轴承设备的振动信号数据进行预处理，使用小波包分解原始振动信号各频段的能量值，提取参数特征作为样本数据；然后随机抽样作为训练数据样本，并对测试数据样本进行标签化处理，将训练数据样本等量划分为多组，其中一组输出到步骤(3)，剩余组分别分别作为新增数据增量；

(3)采用基于样本分布信息的重采样方法分别将训练数据样本划分为噪声域、边界域和安全域，并用不同策略进行多数类欠采样和少数类过采样，将处理后的两类数据样本合并得到相对平衡的数据样本，依据样本分布信息为其赋予不同的权重；然后输入到步骤(4)；

(4)将用于训练深度学习模型的训练样本加入随机噪声，作为去噪自动编码器的输入进行无监督贪婪逐层预训练，对样本数据提取故障特征，然后输入到步骤(5)；

(5)将步骤(4)得到的故障特征作为输入向量训练一组集成SVM分类器进行故障模式分类；进行步骤(6)；

(6)若步骤(2)中无新增数据增量加入，则步骤(5)输出分类诊断得出的轴承故障类型；若步骤(2)中有新增数据增量加入，则对新增数据增量采用动态加权的重采样方法进行增量的非平衡处理，并依据样本分布状态的改变动态调整原有样本的权重；然后进行步骤(4)确定故障特征，并将其作为新增特征，进行步骤(7)；

(7)利用新增特征对步骤(5)中的集成SVM分类器进行动态评价，依据基分类器对新增特征的识别准确率，利用集成SVM分类器动态评价算法计算动态加权，并淘汰不能适应当前运行状态的基分类器；进行步骤(8)；

(8)采用有效增量筛选算法选择最有价值的新增特征训练新的基分类器，然后采用增量信息融合算法更新步骤(5)的集成SVM分类器，然后进行步骤(6)；

(9)待步骤(1)-(8)完成训练数据样本对集成SVM分类器的更新后，利用传感器采集待测轴承设备的内圈、外圈和滚动体的振动信号数据，将其作为新增数据增量进行步骤(6)-(8)的处理，输出轴承故障类型。

进一步技术方案在于，所述步骤(6)中对新增数据增量采用动态加权的重采样方法进行增量的非平衡处理，并依据样本分布状态的改变动态调整原有样本的权重，其原理如下：

1)采用自组织增量学习神经网络接受原始数据输入，并以自适应的方式生成神经元来表示输入数据，每个神经元代表了它周围与它最相似的输入模式，并为每一个神经元设置一个相似度阈值Ti来判断增量数据样本与原有样本的相似程度：

式中，N_i为节点i的邻居节点集合，l_i为节点i的位置；

2)对于新输入的数据点p，首先找到与其最相似的两个神经元s₁、s₂作为获胜节点，计算p与s₁、s₂的欧式距离d(s₁，p)、d(s₂，p)：

式中n为样本维度；

若满足

或

则认为新增样本与原始样本差异较大；在该数据点的位置上生成一个新的节点来代表这个可能的新模式；

若新输入的数据样本不满足节点插入的条件，则对与其最相似的两个神经元s₁、s₂所表示的原有样本进行权重更新：

式中，S_win为神经元获胜次数，S表示增量样本数目；t表示样本存在时间；w_t为更新前样本权重；将该神经元所表示样本的最大权重作为新增样本的初始权重；当样本权重低于阈值μ，则表示该样本随设备状态变化逐渐失效，故删除该样本。

进一步技术方案在于，所述步骤(7)中集成分类模型进行动态评价算法为：

依据已有集成SVM分类模型对新增特征进行分类的正确率计算基分类器对当前设备状态的适应性权重为：

上式中E_N为基分类器对新增特征的分类正确率；

由于设备状态随时间不断变化，较早训练得到的基分类器可能存在随时间推进逐渐失效的变化过程；因此给予其一个动态遗忘因子f，并计算基分类器的时间衰减权重：

V_forget＝V·f

上式中V为未更新前基分类器权重，动态遗忘因子f的计算方法如下：

式中m为基分类器在增量过程对新增特征进行分类的次数；

将基分类器的适应性权重和时间衰减权重的均值作为其动态遗忘权重：

式中V_adapt为基分类器适应性权重，V_forget为基分类器时间衰减权重，即动态遗忘权重为：

进一步技术方案在于，所述步骤(8)中有效增量筛选算法为：

1)由于不能被原有集成模型正确分类的新增特征往往包含新增的有效信息；因此，选择这部分新增特征加入有效特征集合；

2)选择与原有集成SVM模型的支持向量集差异较大的特征模式加入有效特征集合；采用KL散度衡量特征模式间的差异性；对于离散分布P和Q，KL散度定义为：

其中P(i)和Q(i)表示特征模式P和Q中第i个值，P和Q之间的KL散度值越小，差异性越小；

由KL散度的性质可知其不具有对称性，对KL散度进行对称性修正：

使用α代表使两对比特征之间相似度有意义的最小相似度阈值，β代表特征一般相似与高度相似之间的临界阈值，若α＜D_kl(P||Q)_min＜β，则表示新增特征与支持向量集中的特征存在阈值范围内的差异，将该特征加入有效特征集合；

3)为保证有效特征集的平衡性，依据其当前非平衡程度从原有特征中选择权值最大的R个少数类样本进行补充。

进一步技术方案在于，所述步骤(8)中增量信息融合算法为：

利用有效特征集合训练一个新的基分类器，新增基分类器权重计算方法为：

式中，V为基分类器的权重，E为基分类器在其训练集合上的分类正确率，基分类器的正确率计算方法为：

式中，W_T为正确分类的样本的权重和，W_sum为所有样本的权重和；

将有效增量特征训练得到的新的基分类其加入基分类器集合，更新原有分类模型，实现集成模型的增量信息融合。

进一步技术方案在于，所述步骤(1)的具体步骤为在轴承设备上对内圈、外圈和滚动体分别使用电火花加工技术布置了3个故障等级的单点故障，故障直径分别为0.007、0.014、0.021英寸；利用电机驱动端振动传感器采集内圈、外圈和滚动体分别在正常状态和多个不同故障等级状态下的振动信号数据，采样频率为12kHz，共计1,341,856个数据点。

采用上述技术方案所产生的有益效果在于：

本发明通过动态调整样本权重和集成分类模型实现增量学习和信息融合。在充分考虑样本噪声和分布特征的情况下得到利于准确识别设备故障的平衡数据，依据数据样本在随时间变化过程中的重要性改变程度动态调整其权重并对新增样本进行增量非平衡处理，使得诊断模型能够在获得更加准确的故障诊断精度的同时，节约时间成本。筛选有效增量特征更新原有分类模型，实现快速高效的增量合并。提出一种基分类器淘汰机制，选择有效基分类器进行故障诊断淘汰失效基分类器。从而实现故障诊断模型随设备运行状态改变的动态调整，有效提高诊断准确率。通过试验分析，验证了提出的增量融合动态权重集成学习的故障诊断方法的有效性，使轴承故障诊断效率达到89.90％，相比其他浅层和无增量深度学习方法平均提高了9.10％，能够实现轴承设备故障模式可靠诊断。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1是本发明增量融合动态权重集成学习的故障诊断方法流程图；

图2是四个训练集下K值选取与分类性能关系图；

图3-a、3-b、3-c、3-d为不同倾斜率的四组样本在分别在四种非平衡处理方法下多数类和少数类样本诊断准确率的对比图；

图4为五种算法增量数据诊断的训练时间对比图。

具体实施方式

本发明阐述了一种增量融合动态权重集成学习的故障诊断方法，利用样本分布信息的变化动态调整样本权重并进行增量的非平衡处理，将有效增量特征训练得到的新的基分类其加入基分类器集合，更新原有分类模型，实现集成模型的增量信息融合；最后将加权新增特征模式与原有特征模式一同输入分类器中，并调整模型参数完成故障诊断。本发明提高设备故障诊断的准确率，同时对推动设备运行数据的挖掘和处理有促进作用。

一、本发明方法的理论依据：

1、小波包变换(Wavelet packet transformation，简称WPT)：将原始的时域振动信号变换为可供分析的频域信号，利用小波包分解原始轴承故障振动信号各频段的能量值，得到合适的参数特征以区分不同类别。

2、自组织增量学习神经网络(self-organizing incremental neural network，简称SOINN)：是一种基于竞争学习的两层神经网络，用于在没有先验知识的情况下对动态输入数据以自组织的方式进行在线聚类和拓扑表示。同时，对噪音数据具有较强的鲁棒性。SOINN的增量性能够发现数据流中出现的新模式并进行学习,同时不影响之前学习的结果。利用自组织增量学习神经网络对设备运行中不断产生的增量样本进行在线聚类和拓扑表示，刻画随新增样本产生，样本分布的变化情况。

3、堆叠自动编码器(Stacked Denoising Autoencoders,简称SDA)：是由一系列去噪自动编码器(Denoising Autoencoder，简称DA)堆叠而成，是一种能够快速高效提取特征的深度学习方法。以每个去噪自动编码机的编码层作为下一层的输入，这样一层一层堆叠起来，构成一个深层网络，通过无监督学习进行逐层训练，每一层均可以还原加入随机噪音后的输入信号，满足生产过程中环境复杂噪声多发带来的实际需求，得到更具鲁棒性的特征。

最后，将所有去噪自动编码器堆叠形成的网络训练完成后，对整个网络结构进行有监督微调，以优化最终结果。

4、集成学习：主要思路是先通过一定的规则生成多个学习器，并通过选择合适的投票机制，形成组合分类器。最后综合判断输出最终结果。与单一的学习模型相比，集成学习模型的能够获得更高的可靠性和鲁棒性，并且表现出良好的泛化性能，具有准确率高训练速度快等优点。

5、SVM分类器：通过非线性映射把样本空间映射到一个高维特征空间中，并寻找一个满足分类要求的最优分类超平面，使得该超平面在保证分类精度的同时，能够使超平面两侧的空白区域最大化。支持向量机能够实现对线性可分数据的最优分类。

二、增量融合动态权重集成学习的故障诊断方法设计：

增量融合动态权重集成学习的故障诊断方法工作原理如下：当故障诊断模型初次获取数据样本时，采用上述基于样本分布信息的重采样方法对非平衡数据进行处理，得到相对平衡的样本集。通过上述训练过程构建堆叠式降噪自动编码器提取特征模式，并训练一组集成支持向量机分类模型。当增量样本到来时，需调用动态加权增量学习策略对新增样本进行增量或合并操作，动态调整样本权重，同时更新集成分类模型。使故障诊断模型能够随增量样本产生动态调整以适应设备运行状态随时间的变化。

其中，动态加权增量学习是增量融合动态权重集成学习的故障诊断方法的关键步骤，能有效解决生产过程中随时间推进原有故障被修复新增故障类型产生，设备运行状态不断变化的带来的实际问题。动态加权增量学习策略主要由三步组成，首先利用SOINN算法对增量数据进行在线聚类和拓扑表示，刻画样本分布信息变化情况，依此动态调整样本权重并对增量样本进行实时非平衡处理；其次利用集成模型动态评价算法，计算基分类器动态权重，并淘汰不能适应当前设备运行状态的基分类器；最后根据有效特征筛选策略和增量信息融合算法筛选携带较多重要信息的新增特征，训练新增基分类器，并更新原有集成模型，实现增量合并，使故障诊断模型尽可能的适应当前设备运行状态。

1、增量融合动态权重集成学习的故障诊断方法结构

本发明提供了一种基于增量融合动态权重集成学习的故障诊断方法，首先利用重采样方法对不平衡的数据样本进行处理，当增量样本到来时，采用自组织增量学习神经网络进行在线聚类和拓扑表示，对非平衡的增量样本进行实时处理。然后利用深度学习算法对新增数据进行特征模式提取，然后将新增模式输入原有集成模型中进行分类，利用增量数据更新原有集成模型。最后，使用增量集成SVM对加权模式进行有监督分类，从而实现轴承设备状态特征实时提取和故障模式可靠分类。

2、算法具体实现

增量融合动态权重集成学习的故障诊断方法步骤描述如下，流程图如图1所示。故障诊断方法包括下述步骤：

本发明优选实施方式中，所述步骤(6)中对新增数据增量采用动态加权的重采样方法进行增量的非平衡处理，并依据样本分布状态的改变动态调整原有样本的权重，其原理如下：

式中，N_i为节点i的邻居节点集合，l_i为节点i的位置；

式中n为样本维度；

若满足

或

式中，S_win为神经元获胜次数，S表示增量样本数目；t表示样本存在时间；wt为更新前样本权重；将该神经元所表示样本的最大权重作为新增样本的初始权重；当样本权重低于阈值μ，则表示该样本随设备状态变化逐渐失效，故删除该样本。

本发明优选实施方式中，所述步骤(7)中集成分类模型进行动态评价算法为：

依据已有集成SVM分类模型对增量特征进行分类的正确率计算基分类器对当前设备状态的适应性权重为：

上式中E_N为基分类器对增量特征的分类正确率；

V_forget＝V·f

式中m为基分类器在增量过程对增量特征进行分类的次数；

本发明优选实施方式中，所述步骤(8)中有效增量筛选算法为：

1)由于不能被原有集成模型正确分类的增量特征往往包含新增的有效信息；因此，选择这部分增量特征加入有效特征集合；

使用α代表使两对比特征之间相似度有意义的最小相似度阈值，β代表特征一般相似与高度相似之间的临界阈值，若α＜D_kl(P||Q)_min＜β，则表示增量特征与支持向量集中的特征存在阈值范围内的差异，将该特征加入有效特征集合；

本发明优选实施方式中，所述步骤(8)中增量信息融合算法为：

本发明优选实施方式中，所述步骤(1)的具体步骤为在轴承设备上对内圈、外圈和滚动体分别使用电火花加工技术布置了3个故障等级的单点故障，故障直径分别为0.007、0.014、0.021英寸；利用电机驱动端振动传感器采集内圈、外圈和滚动体分别在正常状态和多个不同故障等级状态下的振动信号数据，采样频率为12kHz，共计1,341,856个数据点。

实施例

1、数据描述

实验数据为电气工程实验室的轴承状态数据，共计1,341,856个数据点，轴承型号为6205-2RS JEM SKF深沟球轴承。使用电火花加工技术分别在轴承上对内圈、外圈和滚动体布置了3个故障等级的单点故障，故障直径分别为0.007、0.014、0.021英寸。选择电机驱动端振动传感器采集的正常状态(N)、内圈故障(IRF)、外圈故障(ORF)和滚动体故障(BF)这4种状态下的振动信号，采样频率为12kHz，并对原始振动信号使用小波包分解各频段的能量值，提取合适的参数特征以区分不同类别。分析数据样本可知，正常数据与故障数据之间存在不平衡现象，正常数据为多数类样本，其余故障数据为少数类样本。

为试验本发明提出模型的非平衡数据处理能力，分别随机抽样80、40、20、10个故障样例与100个正常样例合并形成4个不同训练样本，25个故障样例与50个正常样例组成测试样本，其中每个样例包含2048个数据点。为试验模型的增量学习能力，将上述每个训练样本等量划分为四组，其中一组用于训练DWE模型，剩余三组分三次添加至已有模型进行增量学习。具体轴承状态数据样本描述如表5.1所示。仿真实验在Windows10 64位系统Intel-I5CPU计算机python3.6平台下完成。

表1 轴承故障数据描述

2、模型结构

模型的动态加权的重采样方法中，近邻选取的个数k在处理非平衡数据过程中非常重要，影响每一类数据的具体划分情况，因此利用实验的方式进行确定。通过计算重采样算法中不同k值对应的不同G-mean值，来确定其最佳取值。其中G-mean指标能够同时兼顾少数类与多数类的识别率，有效反映出分类器处理非平衡数据的性能高低，其计算方式为

其中，TP表示正确分类的少数类样本数量，TN表示正确分类的多数类样本数量，FP表示错分为少数类的多数类数量，FN表示错分为多数类的少数类数量。将k的取值范围定于1～10之间进行讨论，在四个不同训练集中的实验结果如图2所示，G-mean值越大表明分类性能越好，综合考虑G-mean值与计算量后，可得最优k值分别选取为：6、8、5、5。

3、结果分析

1)非平衡处理性能分析

针对四种不同倾斜率的非平衡训练集，分别采用包含本发明所提出的动态加权非平衡处理方法的分类模型和采用随机欠采样(R-U)、随机过采样(R-O)、合成少数类过采样(SMOTE)的分类模型进行对比训练，各分类模型均采用以支持向量机(SVM)为基分类器的加权集成学习模型作为分类器。并使用测试集分别测试模型诊断效果，记录10次试验的准确率和G-mean值并求取平均值。对比结果如表2所示。

表2 非平衡故障诊断结果比较

由表2可得，采用本发明所提出的非平衡处理方法对四个不同倾斜率的非平衡训练集和测试集进行非平衡数据处理，在诊断准确率和G-mean方面均优于其他仅单一进行欠采样或过采样过程的非平衡数据处理方法。本发明提出的方法较其他方法模型相比，在不同数据倾斜率的情况下均能取得较高的G-mean值，且数据倾斜程度并未明显影响所提方法的分类性能。图3为上述四种模型在四种不同倾斜率的训练集中对多数类样本和少数类样本的分类准确率对比。可以看出采用本发明所提方法进行非平衡处理后，对于多数类样本和少数类样本均达到了很高的分类准确率，且差异值较小，可见提出的方法有效降低了样本非平衡性对分类准确率的影响。而其他方法严重偏向多数类样本，虽然整体准确率较高，但少数类样本识别率偏低。所提方法对于少数类样本的分类准确率远远高于其他三种方法，有效提高了故障样本的识别率。

2)增量学习性能分析

在验证本发明模型中非平衡数据处理方法的有效性后，对整个模型的增量学习性能进行试验，将4个不同训练集分别划分为四组，其中一组用于训练本发明所提故障诊断模型，剩余三组分三次添加至已有模型进行增量学习。分别与BP、SVM、AE、DAE方法进行增量学习对比，并使用测试样本测试模型诊断效果，对每组增量数据记录10次试验的准确率和运行时间并求取平均值，计算四组增量数据的训练平均值和测试值对比结果如表3所示。

表3 故障诊断结果比较

由表3可得，本发明所提出的模型在准确率和运行时间方面对于四个不同非平衡倾斜率的训练集均基本优于其他四种算法。从诊断效果的角度，所提增量融合动态权重集成学习的故障诊断方法的诊断准确率在不同倾斜率的数据集中均保持了较高的水平，未添加增量学习的AE和DAE算法虽然取得了较高的训练精度但测试结果较差，而浅层BP算法和SVM算法的测试准确率和训练准确率均低于本发明所提模型。可见模型由于考虑到增量样本的非平衡性并采用动态的方法有效处理，选择有效新增特征对分类模型进行更新，考虑了随时间变化设备运行状态的改变，因此使得模型故障诊断效果有了一定程度的提高。从模型运行时间方面来看，除训练模型所需的时间开销多于SVM算法外，所提模型所需训练时间均少于其他三种算法，且所需测试时间明显少于SVM算法、AE算法和BP算法，并基本与DAE算法持平，综合考虑训练时间和测试时间的情况下，所提出的模型在运行时间方面优于其他四种算法，因此表明所提该模型对于减轻模型计算量节约时间成本起到了一定作用。

接下来针对每一次添加增量数据时的训练时间情况进行分析，图4所示为将训练集1分四组依次加入训练模型时每一次训练时间的曲线图，使用BP算法、SVM算法和无增量学习的AE算法、DAE算法与提出的模型方法进行对比。可见，本发明模型在数据增量的过程中的训练时间并未显著增长。而其他几种算法在面对增量数据时需要重新训练已有模型，增加了时间开销。AE算法和DAE算法随增量数据产生数据规模增加所需训练时间大幅增加。所提方法在数据增量过程中所需训练时间明显少于AE算法、DAE算法、BP算法。而SVM算法虽然进行增量学习所需的训练时间很少，但训练和测试效果较差。

4、结论

为解决实际生产过程中设备运行状态随时间推进不断变化的情况，本发明提出增量融合动态权重集成学习的故障诊断方法，采用动态权重调整策略，提出有效特征筛选算法、基分类器动态评价算法、增量信息融合算法，在充分考虑样本噪声和分布特征的情况下得到利于准确识别设备故障的平衡数据，依据数据样本在随时间变化过程中的重要性改变程度动态调整其权重并对新增样本进行增量非平衡处理，使得诊断模型能够在获得更加准确的故障诊断精度的同时，节约时间成本。筛选有效增量特征更新原有分类模型，实现快速高效的增量合并，并选择有效基分类器进行故障诊断淘汰失效基分类器，从而实现故障诊断模型随设备运行状态改变的动态调整，有效提高诊断准确率。通过试验分析，验证了提出的增量融合动态权重集成学习的故障诊断方法的有效性，使轴承故障诊断效率达到89.90％，相比其他浅层和无增量深度学习方法平均提高了9.10％，能够实现轴承设备故障模式可靠诊断。主要优势如下：

(1)提出动态加权集成学习模型，对有效特征筛选算法、基分类器动态评价算法、增量信息融合等问题进行探索，使模型随新增样本产生动态调整，尽可能适应当前设备运行状态，提高诊断准确率。

(2)针对增量样本的不平衡性，提出动态加权的非平衡数据处理方法。使含有较多重要信息的样本得到应得的重视，同时实现了对非平衡增量数据的实时处理；

(3)针对设备运行过程中原有故障类型被修复新增故障类型产生的情况，提出了考虑增量数据的装备故障诊断知识挖掘新方法，同时对推动设备运行数据的挖掘和处理有促进作用。

Claims

1.一种轴承设备的故障诊断方法，其特征在于，包括下述步骤：

(2)对步骤(1)中轴承设备的振动信号数据进行预处理，使用小波包分解原始振动信号各频段的能量值，提取参数特征作为样本数据；然后随机抽样作为训练数据样本，并对测试数据样本进行标签化处理，将训练数据样本等量划分为多组，其中一组输出到步骤(3)，剩余组分别作为新增数据增量；

所述步骤(7)中集成分类模型进行动态评价算法为：

上式中E_N为基分类器对增量特征的分类正确率；

由于设备状态随时间不断变化，较早训练得到的基分类器存在随时间推进逐渐失效的变化过程；因此给予其一个动态遗忘因子f，并计算基分类器的时间衰减权重：

V_forget＝V·f

式中m为基分类器在增量过程对增量特征进行分类的次数；

2.根据权利要求1所述的一种轴承设备的故障诊断方法，其特征在于，所述步骤(6)中对新增数据增量采用动态加权的重采样方法进行增量的非平衡处理，并依据样本分布状态的改变动态调整原有样本的权重，其原理如下：

式中，N_i为节点i的邻居节点集合，l_i为节点i的位置；

式中n为样本维度；

若满足

或

则认为新增样本与原始样本差异较大；在该数据点的位置上生成一个新的节点来代表这个新模式；

若新输入的数据样本不满足节点插入的条件,则对与其最相似的两个神经元s₁、s₂所表示的原有样本进行权重更新：

3.根据权利要求1所述的一种轴承设备的故障诊断方法，其特征在于，所述步骤(8)中有效增量筛选算法为：

4.根据权利要求1所述的一种轴承设备的故障诊断方法，其特征在于，所述步骤(8)中增量信息融合算法为：

5.根据权利要求1所述的一种轴承设备的故障诊断方法，其特征在于，所述步骤(1)的具体步骤为在轴承设备上对内圈、外圈和滚动体分别使用电火花加工技术布置了3个故障等级的单点故障，故障直径分别为0.007、0.014、0.021英寸；利用电机驱动端振动传感器采集内圈、外圈和滚动体分别在正常状态和多个不同故障等级状态下的振动信号数据，采样频率为12kHz，共计1,341,856个数据点。