CN116701871A - 基于因果特征加权网络的滚动轴承复合故障特征选择方法 - Google Patents
基于因果特征加权网络的滚动轴承复合故障特征选择方法 Download PDFInfo
- Publication number
- CN116701871A CN116701871A CN202310707211.8A CN202310707211A CN116701871A CN 116701871 A CN116701871 A CN 116701871A CN 202310707211 A CN202310707211 A CN 202310707211A CN 116701871 A CN116701871 A CN 116701871A
- Authority
- CN
- China
- Prior art keywords
- feature
- composite fault
- causal
- network
- rolling bearing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000002131 composite material Substances 0.000 title claims abstract description 108
- 230000001364 causal effect Effects 0.000 title claims abstract description 59
- 238000005096 rolling process Methods 0.000 title claims abstract description 40
- 238000010187 selection method Methods 0.000 title claims abstract description 8
- 238000003745 diagnosis Methods 0.000 claims abstract description 17
- 239000000654 additive Substances 0.000 claims abstract description 3
- 230000000996 additive effect Effects 0.000 claims abstract description 3
- 238000000034 method Methods 0.000 claims description 32
- 210000002569 neuron Anatomy 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 8
- 238000001228 spectrum Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 230000000739 chaotic effect Effects 0.000 claims description 2
- 238000005520 cutting process Methods 0.000 claims description 2
- 238000013461 design Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 claims description 2
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 abstract 1
- 230000006870 function Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013515 script Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2131—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公布了一种基于因果特征加权网络的滚动轴承复合故障特征选择方法,构建因果特征加权网络模型。引入加权网络中心性指标节点强度对复合故障特征进行定量描述,通过深度神经网络模型的复合故障诊断完成特征选择,并利用沙普利累加性解释模型解释所选特征对诊断准确率的贡献度。本发明对滚动轴承复合故障特征选择适用性高,可提高滚动轴承复合故障识别的准确率。
Description
技术领域
本发明属于轴承故障诊断技术领域,具体涉及一种基于因果特征加权网络(Causal Feature Weighted Network,CFWN)的滚动轴承复合故障特征选择方法。
背景技术
滚动轴承作为一种关键部件,在现代机械设备中应用广泛,其健康状况关乎整个设备的工作安全。然而,由于实际工况中设备所处环境复杂多变,滚动轴承发生故障时往往不是单一故障,而是多种故障同时存在,导致复合故障特征难以准确提取,故障诊断的有效性变得十分困难。事实上,为了提高故障诊断的精度,工程上一般从多角度对振动信号进行特征提取,以此确保多域特征可以反映信号各种状态下的故障信息。但是,此类方法不仅导致特征维度增多,而且在提高相关性的同时出现特征冗余问题,影响诊断精度。因此,对复合故障信号多维特征进行选择是故障诊断的关键一环。
针对特征选择问题,传统算法分为封装法、过滤法和嵌入法三类,主要根据特征和复合故障之间的相关性寻找相关特征子集。然而,相关关系只能反映故障模式和特征之间的共存关系,无法解释特征之间的潜在机制。随着复杂网络理论研究的不断深入,有学者开始尝试使用复杂网络理论分析节点之间的关系进行选择特征,唐晓波等人通过PageRank算法识别网络中的重要节点作为特征,赵鹏等人构建文档语言网络计算节点的度和集聚系数来选择特征词,这些利用复杂网络小世界特性的思想为特征选择提供了新的思路。现有研究中,多数学者更倾向于针对简单的无权网络进行算法设计。然而,故障之间的相互耦合使信号在多域特征上涌现出不同强弱的因果属性,而加权网络中可以通过权重能反映特征节点间因果关系所蕴含的有效信息。现有技术难以对网络中的连边加以区分,不能将特征网络抽象为加权网络,无法合理有效地解决特定的滚动轴承复合故障特征选择。
发明内容
为了克服上述现有技术的不足,本发明实现一种基于马尔可夫毯(MarkovBlanket,MB)算法和复杂网络相结合的滚动轴承复合故障特征选择方法。在采用MB算法寻找复合故障特征间因果关系建立连边的基础上,使用皮尔逊相关系数(Pearsoncorrelation coefficient)赋予连边权重,构建因果特征加权网络模型。引入加权网络中心性指标节点强度对复合故障特征进行定量描述,通过深度神经网络(DNN)模型的复合故障诊断完成特征选择,并利用沙普利累加性解释(SHAP)模型解释所选特征对诊断准确率的贡献度,进而验证采用本发明方法进行滚动轴承复合故障特征选择的有效性。
本发明提供的技术方案是:
一种基于因果特征加权网络的滚动轴承复合故障特征选择方法,包括以下步骤:
1)提取得到滚动轴承复合故障多域特征,构建复合故障多域特征集,并划分为训练集和测试集:
11)对滚动轴承故障标准数据集进行混合切分形成复合故障数据。首先,利用线性瞬时混合模型对滚动轴承单一故障标准数据集进行混合,得到“内圈+外圈”、“内圈+滚动体”和“外圈+滚动体”三种类型的复合故障信号;然后,使用Python脚本对每种复合故障信号进行切分,形成复合故障信号数据集,得到长度统一的信号以便于后续进行特征提取。具体地,每种信号有9组,总计27组复合故障信号。切分后形成长度为1024个单位为一组,总计2700组的复合故障信号样本;
12)分别对步骤11)中处理好的复合故障信号数据集进行时域、频域和熵值的统计分析,完成复合故障多域特征提取。首先,分析复合故障信号在时间轴上的变化特征,对信号进行采样和量化并计算包括均值、方差、标准差等时域特征;然后,分析复合故障信号在频率轴上的变化特征,对信号进行傅里叶变换并计算包括功率谱密度、频率分布、频率带宽等频域特征;最后,分析复合故障信号分布的混乱程度和复杂度,对信号进行熵值运算,包括功率谱熵和奇异谱熵,形成复合故障多域特征集。
13)为了能让步骤12)中的特征集可以更好的作为后续模型的输入,对数据集进行划分。由于每段信号均为已发生故障的信号,并且每段信号经过切分后至少包含一个周期的故障信息,因此采用百分比为标准进行划分,80%为训练集,20%为测试集。
2)构建因果特征加权网络模型:
21)将步骤12)中所提取的多域特征作为因果特征加权网络中的网络节点。具体地,总计20种特征即网络节点数为20,分别为13种时域特征、5种频域特征和2种熵值特征。
22)寻找复合故障多域特征集中特征(以下特征均指复合故障多域特征集的多域特征,后面不再累述。)间的因果关系并构成因果特征加权网络的连边。首先,将一种复合故障特征作为目标特征,使用增量关联马尔可夫毯(Incremental Association MarkovBlanket,IAMB)算法获取该目标特征的MB集合;然后,根据目标特征的MB集合构建因果特征加权网络节点的连边关系,即将目标特征的MB集合中的所有特征与目标特征对应的网络节点进行连边;最后,重复上述操作对所有复合故障特征进行连边关系的建立,得到因果特征网络模型。
23)赋予步骤22)网络中每条连边权重,完成因果特征加权网络的构建。具体地,计算每种特征之间的Person相关系数值赋予连边权重,形成因果特征加权网络。
3)选择复合故障的因果特征:
31)运用加权网络中心性指标节点强度对步骤2)构建的因果特征加权网络中的网络节点进行定量描述。计算因果特征加权网络中各个节点的中心性指标,并对指标进行降序排列,即节点中心性从大到小。通过排序结果获得特征子集作为后续模型的输入。具体地,本发明中共20种特征,通过节点中心性排序结果获得第1特征子集,子集内特征为中心性最高的第1个特征,再获得第2特征子集,子集内特征为中心性最高的前2个特征,以此类推获得第20特征子集,子集内特征为中心性最高的前20个特征,总计20个特征子集。
32)设计4层DNN模型,双隐层的激活函数采用线性整流函数(Linearrectification function),第二个隐层采用L2范数进行正则化,防止训练过拟合。输出层的激活函数采用Sigmoid函数。优化器采用自适应矩估计(Adaptive Moment Estimation),损失函数采用二元交叉熵函数(Binary cross entropy);具体地:
321)输入层:神经元个数为31)中获得的20个特征子集中包含特征种类的数量。
322)第一个隐层:神经元个数为40个,激活函数采用RELU函数。
323)第二个隐层:神经元个数为20个,激活函数采用RELU函数,并用L2范数进行正则化。
324)输出层:神经元个数为复合故障标签数量,激活函数采用Sigmoid函数。
33)对步骤31)中获得的多个(20个)特征子集分别输入到步骤32)设计的DNN模型中进行训练,得到复合故障诊断结果,并计算准确率,将准确率达到峰值时的复合故障特征子集作为最优特征子集,即最终复合故障特征选择结果。
4)量化复合故障因果特征的沙普利累加性解释SHAP值,进行归因分析:
41)对最优特征子集中的特征进行准确率贡献度归因分析。首先,计算最优特征子集中某个样本包含某种复合故障特征和不包含该特征对DNN模型预测输出的联合贡献;然后,计算样本中该特征和其他特征所有可能的组合分别对DNN模型预测输出的边际贡献;最后,计算每种特征边际贡献的加权平均值,即这些特征在该样本上对准确率的SHAP值。
42)对最优特征子集中全部样本分别进行步骤41)的操作,获得每种特征边际贡献的加权平均值,得到该特征在最优特征子集上对准确率的SHAP值。从全局和局部两个层面对准确率进行了归因分析,并表现出对贡献度影响的正负性,SHAP值为正,该特征对最终的预测结果是正向推动;反之,一个特征的SHAP值为负,该特征对最终的预测结果是负向的。
本发明具体实施采用的基于因果特征加权网络复合故障特征选择模型的结构中,MB集合为马尔可夫毯集合,CFWN为因果特征加权网络,DNN为深度神经网络,SHAP为沙普利累加性解释。
与现有技术相比,本发明的有益效果是:
本发明针对滚动轴承故障,采用IAMB算法和复杂网络相结合的方法解决滚动轴承复合故障特征选择的问题,该方法分析特征间因果关系的强弱,建立因果特征加权网络,引入节点强度作为中心性指标通过DNN模型进行特征选择;同时采用SHAP模型对所选复合故障特征进行可解释性分析。本发明对滚动轴承复合故障特征选择适用性高,具有良好的参考和应用价值,可以提高复合故障识别的准确率。
附图说明
图1是本发明方法的具体实施方案的流程框图。
图2是本发明方法具体实施构建复合故障特征集的流程框图。
图3是本发明方法具体实施构建因果特征加权网络的流程框图。
图4是本发明方法具体实施进行复合故障特征选择的流程框图。
图5是本发明具体实施中各特征子集的复合故障诊断的准确率图。
图6是本发明具体实施中最优特征子集中单一样本各特征的SHAP值图。
图7是本发明具体实施中最优特征子集中各特征的特征贡献度图。
具体实施方式
下面结合附图,通过实施例对本发明做进一步说明,但不以任何方式限制本发明的范围。
以下实施例采用某大学采集的滚动轴承振动数据集,通过本发明提供的因果特征加权网络复合故障特征选择方法实现滚动轴承复合故障特征选择的实施。
方法具体实施的过程如图1所示。本发明方法包括:1)预处理标准数据集,并对数据集进行多域特征提取;2)构建因果特征加权网络模型;3)通过节点中心性获得特征子集,对特征子集进行训练完成复合故障特征选择;4)对复合故障诊断准确率进行归因分析,量化复合故障因果特征的SHAP值。具体实施步骤如下:
1.预处理标准数据集,并对数据集进行多域特征提取,如图2所示,具体步骤如下:
1.1.利用线性瞬时混合模型对滚动轴承振动数据集进行混合获得“内圈+外圈”、“内圈+滚动体”和“外圈+滚动体”三种类型的混合数据集S。混合矩阵如式1所示,其中n为待定系数且n∈(0,1)。以1024为一组切分复合故障数据集S={sa},a∈[1,102400],总计获得2700组复合故障数据集X={xb},b∈[1,2700],并为三种类型的复合故障打上标签,复合故障状态信息表如表1所示。
表1轴承复合故障状态信息表
1.2.对复合故障数据集X进行时域、频域和熵值的多域特征提取获得复合故障特征集Fea={feai,j},i∈[1,2700],j∈[1,20],其中时域特征包括7种有量纲参数和6种无量纲参数,有量纲参数记为fea1~fea7,分别是峰值、峰峰值、平均幅值、均方根、方根幅值、方差和标准差;无量纲参数记为fea8~fea13,分别是峰值因子、脉冲因子、裕度因子、波形因子、峭度因子和偏度;频域特征记为fea14~fea18,分别是重心频率、均方频率、均方根频率、频率方差和频率标准差;熵值特征记为fea19~fea20,分别是功率谱熵和奇异谱熵。
1.3.由于每段信号均为已发生故障的信号,并且每段信号经过切分至少包含一个周期的故障信息,因此将为百分比为标准划分训练集和测试集,分别是80%的特征集为训练集,20%的特征集为测试集。
2.构建因果特征加权网络模型,如图3所示,具体步骤如下:
2.1.通过增量关联马尔可夫毯IAMB算法寻找特征间的因果关系,获得每种复合故障特征的马尔可夫毯集合:MB={MBp},p∈[1,20]
2.1.1.以复合故障特征feaj为当前目标特征,初始化目标特征的父子(PC)集合PCj并初始化为空集,将除了目标特征以外的其他特征放入候选MB集合,记为CMBj。
2.1.2.运用Fish-z检验判断目标特征和CMB集合中每一个特征的条件独立性。如果二者条件相关,则将该特征从CMB集合中删除并加入到目标特征的PC集合中,以获得该目标特征的PC集合和CMB集合。
2.1.3.判断目标特征在以CMB集合为条件下,与PC集合中的每一个特征的条件独立性。如果二者条件独立,则该特征为错误的节点,将该节点从PC集合中删除,以获得该目标特征的最终PC集合。
2.1.4.将目标特征与PC集合的并集,视为该复合故障特征的马尔可夫毯MB集合MB={MBp}。
2.2.以feaj为网络节点vj,通过MBp为网络中添加连边。具体地,如果节点v1所对应的特征fea1的MB1中存在特征fea2,则在节点v1和节点v2之间添加连边,即a12=1,反之则不添加连边,即a12=0。重复上述过程,得到因果特征无权网络A={apj}。
2.3.计算所有特征对(feap,feaj)之间的Person相关系数R={rpj},并将其定义为因果特征加权网络中的权重wpj,即Person相关系数越大,表示两个节点相似。获得因果特征加权网络B={bpj}。
3.通过节点中心性获得特征子集,对特征子集进行训练完成复合故障特征选择,如图4所示,具体步骤如下:
3.1.采用加权网络中的节点强度作为中心性指标来量化复合故障特征重要性,计算方式如式2所示,其中sj表示每个节点的节点强度,N为网络节点的数量,wpj表示节点p和节点j之间两边的权重。
对CFWN中的网络节点进行中心性降序排列,即节点中心性从大到小。根据排序结果得到特征子集fn,n∈[1,20],其中n表示节点中心性排序结果中相关性最大的前n个特征。
3.2.设计4层DNN模型对特征子集进行训练,优化器采用自适应矩估计(AdaptiveMoment Estimation),损失函数采用二元交叉熵函数(Binary cross entropy),其它实验参数设置如表2所示,实验环境如表3所示。具体框架如下:
3.2.1.输入层:神经元个数为特征子集中包含特征种类的数量。
3.2.2.第一个隐层:神经元个数为40个,激活函数采用线性整流函数(Linearrectification function,RELU)。
3.2.3.第二个隐层:神经元个数为20个,激活函数采用RELU函数,并用L2范数进行正则化防止训练过拟合。
3.2.4.输出层:神经元个数为标签数量,激活函数采用Sigmoid函数。
3.3.采用测试集对模型进行测试:
3.3.1.评价指标选择准确率(Accuracy),计算原理及各指标说明如式4、表4所示。
表2实验参数设置
表3实验环境
表4准确率指标说明
3.3.2.计算每个特征子集用于进行复合故障诊断的准确率,结果如图5所示,将复合故障诊断准确率最高对应的特征子集作为最优特征子集。结果表明本发明提出的方法明显优于不进行特征选择的实验结果。相比于特征维度较高、信息冗余较多影响模型性能的原始方法,经过特征选择之后在有效的降低数据维度的同时,还保留了重要的故障信息,提高了复合故障诊断的准确率。
4.进一步地,对最优特征子集的复合故障诊断准确率进行归因分析,量化复合故障因果特征的SHAP值,结果如图6、7所示。具体步骤如下:
首先,计算最优特征子集中某个样本包含某些复合故障特征和不包含这些特征对DNN模型预测输出的联合贡献;然后,计算样本中该种特征和其他特征所有可能的组合分别对DNN模型预测输出的边际贡献;最后,计算每种特征边际贡献的加权平均值,即该特征在该样本上对准确率的SHAP值。对最优特征子集中全部样本分别进行执行上述的操作,获得每种特征边际贡献的加权平均值,得到该特征在最优特征子集上对准确率的SHAP值,SHAP值为正,该特征对最终的预测结果是正向推动;反之,一个特征的SHAP值为负,该特征对最终的预测结果是负向的。具体计算方法如式4~6所示:
其中整个模型的基线,即所有样本目标变量的均值为ybase;shap(fij)为最优特征子集中第i个样本的第j个特征对复合故障诊断的SHAP值。例如,shap(fi1)是第i个样本中第1个特征对最终预测值yi的贡献值,当shap(fi1)>0,说明该特征提升了预测值,有正向作用;反之,说明该特征使得预测值降低,有反向作用。M是最优特征子集不包含j特征的子集中特征类别的数目,是每个特征的SHAP值,/>是一个常数。对于某个特征j,需要针对所有可能的特征组合及其不同排序计算SHAP值,然后加权求和,式6中F是所有特征的集合,pM∪{j}为训练第j个特征的模型,pM为训练所有特征的模型,pM∪{j}(fM∪{j})-pM(fM)为比较第j个特征对模型输出的差异,fM表示集合M中输入特征的值,由于特征j的贡献度取决于模型中的其他特征,因此需要为所有可能的子集/>计算fM∪{j}(xM∪{j})-fM(xM),式中的权重可解释为一共有F个特征,则在考虑顺序的情况下这F个特征共有F!种组合,固定了某个特征j,则剩余的有|M|!(|F|-|M|-1)!种组合。
需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
Claims (7)
1.一种基于因果特征加权网络的滚动轴承复合故障特征选择方法,包括以下步骤:
1)提取得到滚动轴承复合故障多域特征,构建复合故障多域特征集;
2)构建因果特征加权网络模型;包括:
21)将提取得到的滚动轴承复合故障多域特征作为因果特征加权网络中的网络节点;多域特征包括:时域特征、频域特征和熵值特征;
22)寻找滚动轴承复合故障多域特征之间的因果关系,并作为因果特征加权网络的连边;具体是:
首先,将一种复合故障多域特征作为目标特征,使用增量关联马尔可夫毯IAMB算法获取该目标特征的MB集合;
然后,根据目标特征的MB集合构建因果特征加权网络节点的连边关系,即将目标特征的MB集合中的所有特征与目标特征对应的网络节点进行连边;
重复上述操作,对所有复合故障多域特征建立连边关系,即得到因果特征网络模型;
23)赋予因果特征网络中每条连边权重,构建完成因果特征加权网络;具体是计算每种特征之间的皮尔逊相关系数值作为连边权重,形成因果特征加权网络模型;
3)选择复合故障的因果特征,包括:
31)对构建的因果特征加权网络中的网络节点,计算各个节点中心性指标的值,并通过排序获得多个特征子集;特征子集的数量与复合故障多域特征的数量相同;
32)设计深度神经网络DNN模型;DNN模型中的双隐层采用线性整流函数作为激活函数;DNN模型中的输出层采用Sigmoid函数作为激活函数;DNN模型的优化器采用自适应矩估计;DNN模型的损失函数采用二元交叉熵函数;
33)将步骤31)中获得的多个特征子集分别输入到步骤32)设计的DNN模型中进行训练,得到复合故障诊断结果,并计算准确率,将准确率达到峰值时的复合故障特征子集作为最优特征子集,即最终复合故障特征选择结果;
通过上述步骤,即实现基于因果特征加权网络的滚动轴承复合故障特征选择。
2.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法,其特征是,对得到的复合故障特征计算沙普利累加性解释SHAP值,进行归因分析,包括:
41)对最优特征子集中的特征进行准确率贡献度归因分析;
首先,计算最优特征子集中某个样本包含某种复合故障特征和不包含该特征对DNN模型预测输出的联合贡献;
然后,计算样本中该特征和其他特征所有可能的组合分别对DNN模型预测输出的边际贡献;
最后,计算每种特征边际贡献的加权平均值,即特征在该样本上对准确率的SHAP值;
42)对最优特征子集中全部样本,获得每种特征边际贡献的加权平均值,得到该特征在最优特征子集上对准确率的SHAP值,得到对贡献度影响的正负性。
3.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法,其特征是,步骤1)构建复合故障多域特征集包括如下过程:
11)对滚动轴承故障标准数据集进行混合切分,形成复合故障数据;包括:
首先,利用线性瞬时混合模型对滚动轴承单一故障标准数据集进行混合,得到“内圈+外圈”、“内圈+滚动体”和“外圈+滚动体”类型的复合故障信号;
然后,对每种复合故障信号进行切分,形成复合故障信号数据集,得到长度统一的信号;得到多组复合故障信号样本;
12)分别对步骤11)中处理好的复合故障信号数据进行时域、频域和熵值的统计分析,提取复合故障多域特征;包括:
首先,分析复合故障信号在时间轴上的变化特征,对信号进行采样和量化,并计算包括均值、方差、标准差时域特征;
然后,分析复合故障信号在频率轴上的变化特征,对信号进行傅里叶变换并计算包括功率谱密度、频率分布、频率带宽频域特征;
最后,分析复合故障信号分布的混乱程度和复杂度,对信号进行熵值运算,包括功率谱熵和奇异谱熵,形成复合故障多域特征集。
4.如权利要求3所述基于因果特征加权网络的滚动轴承复合故障特征选择方法,其特征是,进一步对数据集进行划分为训练集和测试集。
5.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法,其特征是,步骤32)设计深度神经网络DNN模型,具体是4层DNN模型,包括:输入层、第一个隐层、第二个隐层和输出层;其中,输入层的神经元个数为特征子集中包含特征种类的数量;第一个隐层的神经元个数为第二个隐层的神经元个数的两倍;输出层的神经元个数为复合故障标签数量;第二个隐层使用L2范数进行正则化。
6.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法,其特征是,步骤23)中,具体是:计算所有特征对之间的皮尔逊相关系数,将其定义为因果特征加权网络中的权重;皮尔逊相关系数越大,表示两个节点越相似。
7.如权利要求1所述基于因果特征加权网络的滚动轴承复合故障特征选择方法,其特征是,步骤31)中,采用因果特征加权网络中的节点强度作为中心性指标量化复合故障特征重要性;因果特征加权网络中的网络节点强度的计算方式为:
其中,sj表示每个网络节点的节点强度,N为网络节点的数量,wpj表示节点p和节点j之间两边的权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310707211.8A CN116701871A (zh) | 2023-06-15 | 2023-06-15 | 基于因果特征加权网络的滚动轴承复合故障特征选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310707211.8A CN116701871A (zh) | 2023-06-15 | 2023-06-15 | 基于因果特征加权网络的滚动轴承复合故障特征选择方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116701871A true CN116701871A (zh) | 2023-09-05 |
Family
ID=87827299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310707211.8A Pending CN116701871A (zh) | 2023-06-15 | 2023-06-15 | 基于因果特征加权网络的滚动轴承复合故障特征选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116701871A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117151196A (zh) * | 2023-10-26 | 2023-12-01 | 湘江实验室 | 一种基于逐层增量期望传播的可解释性故障诊断归因方法 |
CN117251960A (zh) * | 2023-11-20 | 2023-12-19 | 合肥工业大学 | 一种缺失数据的最优轴承故障因果结构生成方法 |
-
2023
- 2023-06-15 CN CN202310707211.8A patent/CN116701871A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117151196A (zh) * | 2023-10-26 | 2023-12-01 | 湘江实验室 | 一种基于逐层增量期望传播的可解释性故障诊断归因方法 |
CN117151196B (zh) * | 2023-10-26 | 2024-01-30 | 湘江实验室 | 一种基于逐层增量期望传播的可解释性故障诊断归因方法 |
CN117251960A (zh) * | 2023-11-20 | 2023-12-19 | 合肥工业大学 | 一种缺失数据的最优轴承故障因果结构生成方法 |
CN117251960B (zh) * | 2023-11-20 | 2024-01-30 | 合肥工业大学 | 一种缺失数据的最优轴承故障因果结构生成方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108062753B (zh) | 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法 | |
CN107516110B (zh) | 一种基于集成卷积编码的医疗问答语义聚类方法 | |
CN116701871A (zh) | 基于因果特征加权网络的滚动轴承复合故障特征选择方法 | |
Doumpos et al. | Multicriteria decision aid classification methods | |
CN110135459B (zh) | 一种基于双三元组深度度量学习网络的零样本分类方法 | |
Kong et al. | Attention recurrent autoencoder hybrid model for early fault diagnosis of rotating machinery | |
CN109389171B (zh) | 基于多粒度卷积降噪自动编码器技术的医疗图像分类方法 | |
CN110647830B (zh) | 基于卷积神经网络和高斯混合模型的轴承故障诊断方法 | |
CN110232434A (zh) | 一种基于属性图优化的神经网络架构评估方法 | |
CN112001270A (zh) | 基于一维卷积神经网络的地面雷达自动目标分类识别方法 | |
CN108445752A (zh) | 一种自适应选择深度特征的随机权神经网络集成建模方法 | |
CN111597991A (zh) | 一种基于信道状态信息和BiLSTM-Attention的康复检测方法 | |
CN111009324A (zh) | 脑网络多特征分析的轻度认知障碍辅助诊断系统及方法 | |
CN111222847B (zh) | 基于深度学习与非监督聚类的开源社区开发者推荐方法 | |
Zhao et al. | A novel deep fuzzy clustering neural network model and its application in rolling bearing fault recognition | |
CN113657449A (zh) | 一种含噪标注数据的中医舌象腐腻分类方法 | |
CN116702076A (zh) | 一种基于cnn特征融合的小样本迁移学习故障诊断方法、系统、计算机及存储介质 | |
Liu | [Retracted] Feature Recognition of English Based on Deep Belief Neural Network and Big Data Analysis | |
CN111125186A (zh) | 一种基于调查问卷的数据处理方法及系统 | |
Lonij et al. | Open-world visual recognition using knowledge graphs | |
CN117421994A (zh) | 一种边缘应用健康度的监测方法和监测系统 | |
CN115601604B (zh) | 一种基于长短时记忆网络的多任务微泡轨迹追踪方法 | |
CN109934248B (zh) | 一种针对迁移学习的多模型随机生成与动态自适应组合方法 | |
CN111798455A (zh) | 一种基于全卷积密集空洞网络的甲状腺结节实时分割方法 | |
CN116403706A (zh) | 一种融合知识扩展和卷积神经网络的糖尿病预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |