CN116701871A

CN116701871A - 基于因果特征加权网络的滚动轴承复合故障特征选择方法

Info

Publication number: CN116701871A
Application number: CN202310707211.8A
Authority: CN
Inventors: 于重重; 李梦雄; 吴宗柠; 高阔
Original assignee: Beijing Technology and Business University
Current assignee: Beijing Technology and Business University
Priority date: 2023-06-15
Filing date: 2023-06-15
Publication date: 2023-09-05

Abstract

本发明公布了一种基于因果特征加权网络的滚动轴承复合故障特征选择方法，构建因果特征加权网络模型。引入加权网络中心性指标节点强度对复合故障特征进行定量描述，通过深度神经网络模型的复合故障诊断完成特征选择，并利用沙普利累加性解释模型解释所选特征对诊断准确率的贡献度。本发明对滚动轴承复合故障特征选择适用性高，可提高滚动轴承复合故障识别的准确率。

Description

基于因果特征加权网络的滚动轴承复合故障特征选择方法

技术领域

本发明属于轴承故障诊断技术领域，具体涉及一种基于因果特征加权网络(Causal Feature Weighted Network，CFWN)的滚动轴承复合故障特征选择方法。

背景技术

滚动轴承作为一种关键部件，在现代机械设备中应用广泛，其健康状况关乎整个设备的工作安全。然而，由于实际工况中设备所处环境复杂多变，滚动轴承发生故障时往往不是单一故障，而是多种故障同时存在，导致复合故障特征难以准确提取，故障诊断的有效性变得十分困难。事实上，为了提高故障诊断的精度，工程上一般从多角度对振动信号进行特征提取，以此确保多域特征可以反映信号各种状态下的故障信息。但是，此类方法不仅导致特征维度增多，而且在提高相关性的同时出现特征冗余问题，影响诊断精度。因此，对复合故障信号多维特征进行选择是故障诊断的关键一环。

针对特征选择问题，传统算法分为封装法、过滤法和嵌入法三类，主要根据特征和复合故障之间的相关性寻找相关特征子集。然而，相关关系只能反映故障模式和特征之间的共存关系，无法解释特征之间的潜在机制。随着复杂网络理论研究的不断深入，有学者开始尝试使用复杂网络理论分析节点之间的关系进行选择特征，唐晓波等人通过PageRank算法识别网络中的重要节点作为特征，赵鹏等人构建文档语言网络计算节点的度和集聚系数来选择特征词，这些利用复杂网络小世界特性的思想为特征选择提供了新的思路。现有研究中，多数学者更倾向于针对简单的无权网络进行算法设计。然而，故障之间的相互耦合使信号在多域特征上涌现出不同强弱的因果属性，而加权网络中可以通过权重能反映特征节点间因果关系所蕴含的有效信息。现有技术难以对网络中的连边加以区分，不能将特征网络抽象为加权网络，无法合理有效地解决特定的滚动轴承复合故障特征选择。

发明内容

为了克服上述现有技术的不足，本发明实现一种基于马尔可夫毯(MarkovBlanket，MB)算法和复杂网络相结合的滚动轴承复合故障特征选择方法。在采用MB算法寻找复合故障特征间因果关系建立连边的基础上，使用皮尔逊相关系数(Pearsoncorrelation coefficient)赋予连边权重，构建因果特征加权网络模型。引入加权网络中心性指标节点强度对复合故障特征进行定量描述，通过深度神经网络(DNN)模型的复合故障诊断完成特征选择，并利用沙普利累加性解释(SHAP)模型解释所选特征对诊断准确率的贡献度，进而验证采用本发明方法进行滚动轴承复合故障特征选择的有效性。

本发明提供的技术方案是：

一种基于因果特征加权网络的滚动轴承复合故障特征选择方法，包括以下步骤：

1)提取得到滚动轴承复合故障多域特征，构建复合故障多域特征集，并划分为训练集和测试集：

11)对滚动轴承故障标准数据集进行混合切分形成复合故障数据。首先，利用线性瞬时混合模型对滚动轴承单一故障标准数据集进行混合，得到“内圈+外圈”、“内圈+滚动体”和“外圈+滚动体”三种类型的复合故障信号；然后，使用Python脚本对每种复合故障信号进行切分，形成复合故障信号数据集，得到长度统一的信号以便于后续进行特征提取。具体地，每种信号有9组，总计27组复合故障信号。切分后形成长度为1024个单位为一组，总计2700组的复合故障信号样本；

12)分别对步骤11)中处理好的复合故障信号数据集进行时域、频域和熵值的统计分析，完成复合故障多域特征提取。首先，分析复合故障信号在时间轴上的变化特征，对信号进行采样和量化并计算包括均值、方差、标准差等时域特征；然后，分析复合故障信号在频率轴上的变化特征，对信号进行傅里叶变换并计算包括功率谱密度、频率分布、频率带宽等频域特征；最后，分析复合故障信号分布的混乱程度和复杂度，对信号进行熵值运算，包括功率谱熵和奇异谱熵，形成复合故障多域特征集。

13)为了能让步骤12)中的特征集可以更好的作为后续模型的输入，对数据集进行划分。由于每段信号均为已发生故障的信号，并且每段信号经过切分后至少包含一个周期的故障信息，因此采用百分比为标准进行划分，80％为训练集，20％为测试集。

2)构建因果特征加权网络模型：

21)将步骤12)中所提取的多域特征作为因果特征加权网络中的网络节点。具体地，总计20种特征即网络节点数为20，分别为13种时域特征、5种频域特征和2种熵值特征。

22)寻找复合故障多域特征集中特征(以下特征均指复合故障多域特征集的多域特征，后面不再累述。)间的因果关系并构成因果特征加权网络的连边。首先，将一种复合故障特征作为目标特征，使用增量关联马尔可夫毯(Incremental Association MarkovBlanket，IAMB)算法获取该目标特征的MB集合；然后，根据目标特征的MB集合构建因果特征加权网络节点的连边关系，即将目标特征的MB集合中的所有特征与目标特征对应的网络节点进行连边；最后，重复上述操作对所有复合故障特征进行连边关系的建立，得到因果特征网络模型。

23)赋予步骤22)网络中每条连边权重，完成因果特征加权网络的构建。具体地，计算每种特征之间的Person相关系数值赋予连边权重，形成因果特征加权网络。

3)选择复合故障的因果特征：

31)运用加权网络中心性指标节点强度对步骤2)构建的因果特征加权网络中的网络节点进行定量描述。计算因果特征加权网络中各个节点的中心性指标，并对指标进行降序排列，即节点中心性从大到小。通过排序结果获得特征子集作为后续模型的输入。具体地，本发明中共20种特征，通过节点中心性排序结果获得第1特征子集，子集内特征为中心性最高的第1个特征，再获得第2特征子集，子集内特征为中心性最高的前2个特征，以此类推获得第20特征子集，子集内特征为中心性最高的前20个特征，总计20个特征子集。

32)设计4层DNN模型，双隐层的激活函数采用线性整流函数(Linearrectification function)，第二个隐层采用L2范数进行正则化，防止训练过拟合。输出层的激活函数采用Sigmoid函数。优化器采用自适应矩估计(Adaptive Moment Estimation)，损失函数采用二元交叉熵函数(Binary cross entropy)；具体地：

321)输入层：神经元个数为31)中获得的20个特征子集中包含特征种类的数量。

322)第一个隐层：神经元个数为40个，激活函数采用RELU函数。

323)第二个隐层：神经元个数为20个，激活函数采用RELU函数，并用L2范数进行正则化。

324)输出层：神经元个数为复合故障标签数量，激活函数采用Sigmoid函数。

33)对步骤31)中获得的多个(20个)特征子集分别输入到步骤32)设计的DNN模型中进行训练，得到复合故障诊断结果，并计算准确率，将准确率达到峰值时的复合故障特征子集作为最优特征子集，即最终复合故障特征选择结果。

4)量化复合故障因果特征的沙普利累加性解释SHAP值，进行归因分析：

41)对最优特征子集中的特征进行准确率贡献度归因分析。首先，计算最优特征子集中某个样本包含某种复合故障特征和不包含该特征对DNN模型预测输出的联合贡献；然后，计算样本中该特征和其他特征所有可能的组合分别对DNN模型预测输出的边际贡献；最后，计算每种特征边际贡献的加权平均值，即这些特征在该样本上对准确率的SHAP值。

42)对最优特征子集中全部样本分别进行步骤41)的操作，获得每种特征边际贡献的加权平均值，得到该特征在最优特征子集上对准确率的SHAP值。从全局和局部两个层面对准确率进行了归因分析，并表现出对贡献度影响的正负性，SHAP值为正，该特征对最终的预测结果是正向推动；反之，一个特征的SHAP值为负，该特征对最终的预测结果是负向的。

本发明具体实施采用的基于因果特征加权网络复合故障特征选择模型的结构中，MB集合为马尔可夫毯集合，CFWN为因果特征加权网络，DNN为深度神经网络，SHAP为沙普利累加性解释。

与现有技术相比，本发明的有益效果是：

本发明针对滚动轴承故障，采用IAMB算法和复杂网络相结合的方法解决滚动轴承复合故障特征选择的问题，该方法分析特征间因果关系的强弱，建立因果特征加权网络，引入节点强度作为中心性指标通过DNN模型进行特征选择；同时采用SHAP模型对所选复合故障特征进行可解释性分析。本发明对滚动轴承复合故障特征选择适用性高，具有良好的参考和应用价值，可以提高复合故障识别的准确率。

附图说明

图1是本发明方法的具体实施方案的流程框图。

图2是本发明方法具体实施构建复合故障特征集的流程框图。

图3是本发明方法具体实施构建因果特征加权网络的流程框图。

图4是本发明方法具体实施进行复合故障特征选择的流程框图。

图5是本发明具体实施中各特征子集的复合故障诊断的准确率图。

图6是本发明具体实施中最优特征子集中单一样本各特征的SHAP值图。

图7是本发明具体实施中最优特征子集中各特征的特征贡献度图。

具体实施方式

下面结合附图，通过实施例对本发明做进一步说明，但不以任何方式限制本发明的范围。

以下实施例采用某大学采集的滚动轴承振动数据集，通过本发明提供的因果特征加权网络复合故障特征选择方法实现滚动轴承复合故障特征选择的实施。

方法具体实施的过程如图1所示。本发明方法包括：1)预处理标准数据集，并对数据集进行多域特征提取；2)构建因果特征加权网络模型；3)通过节点中心性获得特征子集，对特征子集进行训练完成复合故障特征选择；4)对复合故障诊断准确率进行归因分析，量化复合故障因果特征的SHAP值。具体实施步骤如下：

1.预处理标准数据集，并对数据集进行多域特征提取，如图2所示，具体步骤如下：

1.1.利用线性瞬时混合模型对滚动轴承振动数据集进行混合获得“内圈+外圈”、“内圈+滚动体”和“外圈+滚动体”三种类型的混合数据集S。混合矩阵如式1所示，其中n为待定系数且n∈(0，1)。以1024为一组切分复合故障数据集S＝{s_a}，a∈[1，102400]，总计获得2700组复合故障数据集X＝{x_b}，b∈[1，2700]，并为三种类型的复合故障打上标签，复合故障状态信息表如表1所示。

表1轴承复合故障状态信息表

1.2.对复合故障数据集X进行时域、频域和熵值的多域特征提取获得复合故障特征集Fea＝{fea_i，j}，i∈[1，2700]，j∈[1，20]，其中时域特征包括7种有量纲参数和6种无量纲参数，有量纲参数记为fea₁～fea₇，分别是峰值、峰峰值、平均幅值、均方根、方根幅值、方差和标准差；无量纲参数记为fea₈～fea₁₃，分别是峰值因子、脉冲因子、裕度因子、波形因子、峭度因子和偏度；频域特征记为fea₁₄～fea₁₈，分别是重心频率、均方频率、均方根频率、频率方差和频率标准差；熵值特征记为fea₁₉～fea₂₀，分别是功率谱熵和奇异谱熵。

1.3.由于每段信号均为已发生故障的信号，并且每段信号经过切分至少包含一个周期的故障信息，因此将为百分比为标准划分训练集和测试集，分别是80％的特征集为训练集，20％的特征集为测试集。

2.构建因果特征加权网络模型，如图3所示，具体步骤如下：

2.1.通过增量关联马尔可夫毯IAMB算法寻找特征间的因果关系，获得每种复合故障特征的马尔可夫毯集合：MB＝{MB_p}，p∈[1，20]

2.1.1.以复合故障特征fea_j为当前目标特征，初始化目标特征的父子(PC)集合PC_j并初始化为空集，将除了目标特征以外的其他特征放入候选MB集合，记为CMBj。

2.1.2.运用Fish-z检验判断目标特征和CMB集合中每一个特征的条件独立性。如果二者条件相关，则将该特征从CMB集合中删除并加入到目标特征的PC集合中，以获得该目标特征的PC集合和CMB集合。

2.1.3.判断目标特征在以CMB集合为条件下，与PC集合中的每一个特征的条件独立性。如果二者条件独立，则该特征为错误的节点，将该节点从PC集合中删除，以获得该目标特征的最终PC集合。

2.1.4.将目标特征与PC集合的并集，视为该复合故障特征的马尔可夫毯MB集合MB＝{MB_p}。

2.2.以fea_j为网络节点v_j，通过MB_p为网络中添加连边。具体地，如果节点v₁所对应的特征fea₁的MB₁中存在特征fea₂，则在节点v₁和节点v₂之间添加连边，即a₁₂＝1，反之则不添加连边，即a₁₂＝0。重复上述过程，得到因果特征无权网络A＝{a_pj}。

2.3.计算所有特征对(fea_p，fea_j)之间的Person相关系数R＝{r_pj}，并将其定义为因果特征加权网络中的权重w_pj，即Person相关系数越大，表示两个节点相似。获得因果特征加权网络B＝{b_pj}。

3.通过节点中心性获得特征子集，对特征子集进行训练完成复合故障特征选择，如图4所示，具体步骤如下：

3.1.采用加权网络中的节点强度作为中心性指标来量化复合故障特征重要性，计算方式如式2所示，其中s_j表示每个节点的节点强度，N为网络节点的数量，w_pj表示节点p和节点j之间两边的权重。

对CFWN中的网络节点进行中心性降序排列，即节点中心性从大到小。根据排序结果得到特征子集f_n，n∈[1，20]，其中n表示节点中心性排序结果中相关性最大的前n个特征。

3.2.设计4层DNN模型对特征子集进行训练，优化器采用自适应矩估计(AdaptiveMoment Estimation)，损失函数采用二元交叉熵函数(Binary cross entropy)，其它实验参数设置如表2所示，实验环境如表3所示。具体框架如下：

3.2.1.输入层：神经元个数为特征子集中包含特征种类的数量。

3.2.2.第一个隐层：神经元个数为40个，激活函数采用线性整流函数(Linearrectification function，RELU)。

3.2.3.第二个隐层：神经元个数为20个，激活函数采用RELU函数，并用L2范数进行正则化防止训练过拟合。

3.2.4.输出层：神经元个数为标签数量，激活函数采用Sigmoid函数。

3.3.采用测试集对模型进行测试：

3.3.1.评价指标选择准确率(Accuracy)，计算原理及各指标说明如式4、表4所示。

表2实验参数设置

表3实验环境

表4准确率指标说明

3.3.2.计算每个特征子集用于进行复合故障诊断的准确率，结果如图5所示，将复合故障诊断准确率最高对应的特征子集作为最优特征子集。结果表明本发明提出的方法明显优于不进行特征选择的实验结果。相比于特征维度较高、信息冗余较多影响模型性能的原始方法，经过特征选择之后在有效的降低数据维度的同时，还保留了重要的故障信息，提高了复合故障诊断的准确率。

4.进一步地，对最优特征子集的复合故障诊断准确率进行归因分析，量化复合故障因果特征的SHAP值，结果如图6、7所示。具体步骤如下：

首先，计算最优特征子集中某个样本包含某些复合故障特征和不包含这些特征对DNN模型预测输出的联合贡献；然后，计算样本中该种特征和其他特征所有可能的组合分别对DNN模型预测输出的边际贡献；最后，计算每种特征边际贡献的加权平均值，即该特征在该样本上对准确率的SHAP值。对最优特征子集中全部样本分别进行执行上述的操作，获得每种特征边际贡献的加权平均值，得到该特征在最优特征子集上对准确率的SHAP值，SHAP值为正，该特征对最终的预测结果是正向推动；反之，一个特征的SHAP值为负，该特征对最终的预测结果是负向的。具体计算方法如式4～6所示：

其中整个模型的基线，即所有样本目标变量的均值为y_base；shap(f_ij)为最优特征子集中第i个样本的第j个特征对复合故障诊断的SHAP值。例如，shap(f_i1)是第i个样本中第1个特征对最终预测值y_i的贡献值，当shap(f_i1)＞0，说明该特征提升了预测值，有正向作用；反之，说明该特征使得预测值降低，有反向作用。M是最优特征子集不包含j特征的子集中特征类别的数目，是每个特征的SHAP值，/>是一个常数。对于某个特征j，需要针对所有可能的特征组合及其不同排序计算SHAP值，然后加权求和，式6中F是所有特征的集合，p_M∪{j}为训练第j个特征的模型，p_M为训练所有特征的模型，p_M∪{j}(f_M∪{j})-p_M(f_M)为比较第j个特征对模型输出的差异，f_M表示集合M中输入特征的值，由于特征j的贡献度取决于模型中的其他特征，因此需要为所有可能的子集/>计算f_M∪{j}(x_M∪{j})-f_M(x_M)，式中的权重可解释为一共有F个特征，则在考虑顺序的情况下这F个特征共有F！种组合，固定了某个特征j，则剩余的有|M|！(|F|-|M|-1)！种组合。

需要注意的是，公布实施例的目的在于帮助进一步理解本发明，但是本领域的技术人员可以理解：在不脱离本发明及所附权利要求的范围内，各种替换和修改都是可能的。因此，本发明不应局限于实施例所公开的内容，本发明要求保护的范围以权利要求书界定的范围为准。

Claims

1.一种基于因果特征加权网络的滚动轴承复合故障特征选择方法，包括以下步骤：

1)提取得到滚动轴承复合故障多域特征，构建复合故障多域特征集；

2)构建因果特征加权网络模型；包括：

21)将提取得到的滚动轴承复合故障多域特征作为因果特征加权网络中的网络节点；多域特征包括：时域特征、频域特征和熵值特征；

22)寻找滚动轴承复合故障多域特征之间的因果关系，并作为因果特征加权网络的连边；具体是：

首先，将一种复合故障多域特征作为目标特征，使用增量关联马尔可夫毯IAMB算法获取该目标特征的MB集合；

然后，根据目标特征的MB集合构建因果特征加权网络节点的连边关系，即将目标特征的MB集合中的所有特征与目标特征对应的网络节点进行连边；

重复上述操作，对所有复合故障多域特征建立连边关系，即得到因果特征网络模型；

23)赋予因果特征网络中每条连边权重，构建完成因果特征加权网络；具体是计算每种特征之间的皮尔逊相关系数值作为连边权重，形成因果特征加权网络模型；

3)选择复合故障的因果特征，包括：

31)对构建的因果特征加权网络中的网络节点，计算各个节点中心性指标的值，并通过排序获得多个特征子集；特征子集的数量与复合故障多域特征的数量相同；

32)设计深度神经网络DNN模型；DNN模型中的双隐层采用线性整流函数作为激活函数；DNN模型中的输出层采用Sigmoid函数作为激活函数；DNN模型的优化器采用自适应矩估计；DNN模型的损失函数采用二元交叉熵函数；

33)将步骤31)中获得的多个特征子集分别输入到步骤32)设计的DNN模型中进行训练，得到复合故障诊断结果，并计算准确率，将准确率达到峰值时的复合故障特征子集作为最优特征子集，即最终复合故障特征选择结果；

通过上述步骤，即实现基于因果特征加权网络的滚动轴承复合故障特征选择。

2.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法，其特征是，对得到的复合故障特征计算沙普利累加性解释SHAP值，进行归因分析，包括：

41)对最优特征子集中的特征进行准确率贡献度归因分析；

首先，计算最优特征子集中某个样本包含某种复合故障特征和不包含该特征对DNN模型预测输出的联合贡献；

然后，计算样本中该特征和其他特征所有可能的组合分别对DNN模型预测输出的边际贡献；

最后，计算每种特征边际贡献的加权平均值，即特征在该样本上对准确率的SHAP值；

42)对最优特征子集中全部样本，获得每种特征边际贡献的加权平均值，得到该特征在最优特征子集上对准确率的SHAP值，得到对贡献度影响的正负性。

3.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法，其特征是，步骤1)构建复合故障多域特征集包括如下过程：

11)对滚动轴承故障标准数据集进行混合切分，形成复合故障数据；包括：

首先，利用线性瞬时混合模型对滚动轴承单一故障标准数据集进行混合，得到“内圈+外圈”、“内圈+滚动体”和“外圈+滚动体”类型的复合故障信号；

然后，对每种复合故障信号进行切分，形成复合故障信号数据集，得到长度统一的信号；得到多组复合故障信号样本；

12)分别对步骤11)中处理好的复合故障信号数据进行时域、频域和熵值的统计分析，提取复合故障多域特征；包括：

首先，分析复合故障信号在时间轴上的变化特征，对信号进行采样和量化，并计算包括均值、方差、标准差时域特征；

然后，分析复合故障信号在频率轴上的变化特征，对信号进行傅里叶变换并计算包括功率谱密度、频率分布、频率带宽频域特征；

最后，分析复合故障信号分布的混乱程度和复杂度，对信号进行熵值运算，包括功率谱熵和奇异谱熵，形成复合故障多域特征集。

4.如权利要求3所述基于因果特征加权网络的滚动轴承复合故障特征选择方法，其特征是，进一步对数据集进行划分为训练集和测试集。

5.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法，其特征是，步骤32)设计深度神经网络DNN模型，具体是4层DNN模型，包括：输入层、第一个隐层、第二个隐层和输出层；其中，输入层的神经元个数为特征子集中包含特征种类的数量；第一个隐层的神经元个数为第二个隐层的神经元个数的两倍；输出层的神经元个数为复合故障标签数量；第二个隐层使用L2范数进行正则化。

6.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法，其特征是，步骤23)中，具体是：计算所有特征对之间的皮尔逊相关系数，将其定义为因果特征加权网络中的权重；皮尔逊相关系数越大，表示两个节点越相似。

7.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法，其特征是，步骤31)中，采用因果特征加权网络中的节点强度作为中心性指标量化复合故障特征重要性；因果特征加权网络中的网络节点强度的计算方式为：

其中，s_j表示每个网络节点的节点强度，N为网络节点的数量，w_pj表示节点p和节点j之间两边的权重。