CN117571312A - 面向噪声标签工业场景的旋转机械故障诊断方法 - Google Patents
面向噪声标签工业场景的旋转机械故障诊断方法 Download PDFInfo
- Publication number
- CN117571312A CN117571312A CN202311530790.XA CN202311530790A CN117571312A CN 117571312 A CN117571312 A CN 117571312A CN 202311530790 A CN202311530790 A CN 202311530790A CN 117571312 A CN117571312 A CN 117571312A
- Authority
- CN
- China
- Prior art keywords
- noise
- training
- sample
- model
- clean
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000003745 diagnosis Methods 0.000 title claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 93
- 239000000203 mixture Substances 0.000 claims abstract description 33
- 238000013528 artificial neural network Methods 0.000 claims abstract description 23
- 238000009826 distribution Methods 0.000 claims abstract description 23
- 230000005540 biological transmission Effects 0.000 claims abstract description 20
- 238000012937 correction Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000011176 pooling Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 12
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 8
- 238000005096 rolling process Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 206010044048 Tooth missing Diseases 0.000 claims description 4
- 230000001133 acceleration Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 239000003550 marker Substances 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 17
- 230000003446 memory effect Effects 0.000 description 6
- 238000009825 accumulation Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010924 continuous production Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/028—Acoustic or vibration analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/021—Gearings
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/04—Bearings
- G01M13/045—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
- G06F2218/04—Denoising
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明一种面向噪声标签工业场景的旋转机械故障诊断方法,其包括以下步骤:S1、获取传动齿轮箱振动信号并进行预处理;S2、建立故障诊断模型并进行训练;S3、建立高斯混合模型并求解,对噪声样本和干净样本进行划分;S4、对干净数据集进行微调并对噪声数据进行修正;S5、进行故障诊断。本发明参考Co‑teaching策略引入两个结构参数完全相同的深度神经网络用于噪声标记学习与建模,预训练后的深度神经网络拟合训练数据集交叉熵损失分布的两成分高斯混合成分,设定合理的阈值实现干净样本和噪声样本划分。根据样本划分结果,对干净样本和噪声样本分别执行微调和修正,能够大幅度提高故障诊断结果。
Description
技术领域
本发明涉及旋转机械寿命诊断领域,具体涉及一种面向噪声标签工业场景的旋转机械故障诊断方法。
背景技术
随着工业化进程的不断推进,重大装备的智能运维需求日益增强,传动部件的维护对其运行安全和执行功能有重要影响。传统基于信号处理的故障诊断方法无论从部署难度还是计算效率都难以满足大数据背景下的技术要求。近年来,随着工业物联网技术的推广与硬件计算能力的提升,基于深度学习的模式分类方法得益于其强大的函数建模能力和自适应的目标学习能力在旋转机械部件状态监测与故障诊断领域得到了广泛的研究和关注,并取得了一系列具有实践指导意义的成果。需要说明的是,深度学习模型的模式分类性能和模式识别精度很大程度上由训练样本集的质量决定。在实际的工业场合中,训练样本的故障模式类别标记依靠于人工完成,在大数据监测背景下,繁复的人工标记过程难免会出现错误,最终导致训练样本集包含标记噪声。标记噪声的引入会较大程度上限制深度模型的表征性能与模式分类精度,使得基于深度学习的智能故障诊断方法在实际工程应用中存在一定局限。
基于上述缺陷,亟需提出一种能够用于工业场景的机械故障诊断方法。
发明内容
为了解决上述现有技术缺陷,本发明的目的在于提出一种面向噪声标签工业场景的旋转机械故障诊断方法,其能够实现噪声样本和干净样本的精确划分,并完成训练样本标签的微调和修正,准确的对噪声标签工业场景的旋转机械的故障进行诊断。
具体地,本发明提供一种面向噪声标签工业场景的旋转机械故障诊断方法,其包括以下步骤:
S1、获取传动齿轮箱振动信号并进行预处理;
S2、基于Co-teaching策略建立故障深度模型,完成深度模型预训练,其包括以下子步骤:
S21、利用Co-teaching策略建立故障深度模型,故障深度模型包括第一深度网络模型和第二深度网络模型;
S22、基于传统全监督方式对噪声样本集进行预训练,其中,xi∈Rd表示一维振动信号,/>表示样本xi的故障模式类别的独热编码标记;并利用第一深度网络模型和第二深度网络模型交替完成预训练;
S23、预训练阶段,模式分类通过最小化损失函数实现模型参数更新与优化,其反向传播的梯度表示为:
式中,f(·;θ)为深度神经网络,θ为模型参数,LCE(·)为交叉熵损失函数;
S3、建立高斯混合模型并求解,对噪声样本和干净样本进行划分,具体包括以下子步骤:
S31、对于噪声样本集经过多次步骤S2的模型预训练后的交叉熵损失表述为:
其中,Li为对应样本xi的交叉熵损失;F(xi;θ)表示参数为θ的深度模型;
S32、基于噪声训练样本集交叉熵损失分布,建立两成分高斯混合模型,表述为:
式中,ρ(L)表示两成分高斯混合模型的密度函数;αk表示第m个高斯成分系数;N(L|σm,ωm)表示第m个高斯成分,服从均值为σm标准差为ωm的正太分布;
S33、基于步骤S32得到的当前状态的两成分高斯混合模型,求解每一高斯成分对观测样本的响应Li:
S34、基于估计得到的响应Li,更新两成分高斯混合模型的参数:
S35、通过d迭代实现两成分高斯混合模型的参数更新,利用后验概率ρ(m*|Li)计算给定样本xi为干净样本的概率τi:
式中,τi为对应样本xi为干净样本的概率;m*为对应的干净类别,代表高斯成分的较小均值;
S36、根据估计概率τi,训练数据集Dtrain划分为干净数据集Dclean和噪声数据集Dnoise,设定阈值δ,当τi≥δ时,训练数据集被划分为干净数据集;当τi<δ时,训练数据集被划分为噪声数据集,并丢弃对应的标签;干净数据集Dclean和噪声数据集Dnoise表述如下:
S4、对干净数据集进行微调并对噪声数据进行修正,其具体包括以下子步骤:
S41、从干净数据集Dclean和噪声数据集Dnoise分别采集B个小批次样本,得到随后对新获取的小批次干净样本数据执行微调,其实质为深度模型预测输出与初始给定模式类别标记的线性组合,表述为:
S42、采用温度锐化函数降低温度,并获取新标签表述为:
其中,T代表温度系数,设定为0.5;
S43、对单个小批次噪声样本进行标记修正,新标签表示为第一深度网络模型和第二深度网络模型预测输出的加权平均,表述为:
之后对新标签执行温度锐化:
S44、通过执行上述标签微调与修正,获取两个小批次训练数据集和/>随后对其执行Mixup操作;
S45、将深度模型总体目标训练及优化函数表述为:
LTOTAL=LCE+ηLMSE+εLREG
其中,ε设置为1.0,η为包含无监督损失的系数,LREG为约束项;
S5、进行故障诊断,其包括以下子步骤:
S51、循环执行步骤S2至步骤S4,当达到最大迭代次数时,停止训练过程并保存模型参数;
S52、将带有不同程度噪声标签的变速箱测试数据集植入训练好的故障深度模型,输出故障诊断结果。
优选地,第一深度网络模型和第二深度网络模型均包括三个残差模块,残差模块旁路连接的卷积核尺寸为[1,1],步长为1;剩余卷积层的卷积核尺寸为[9,1],步长为1;多个池化层用于去除提取特征中的冗杂信息;每一个卷积层连接一个批处理归一化层;采用全局平均池化方法对最终残差块结果进行集成,并采用全连接层实现故障分类。
优选地,步骤S44中,对给定的两个训练样本(xi,yi)和(xj,yj),Mixup操作表述为:
其中,α是Beta分布的参数,设置为4.0,通过执行Mixup操作,小批次数据集和演化为/>和/>并分别计算交叉熵损失和均方误差损失,表达式为:
优选地,在模型训练过程中添加以下正则化项:
式中,φc=1/C表示训练样本集模式类别的先验概率分布。
优选地,阈值δ设为0.5。
优选地,步骤S1的具体过程为:采用加速度传感器测量传动齿轮箱的振动信号,将所测信号无重复的切分为点数为1024的数据段,并对每个数据段进行故障类型标注。
优选地,滚动轴承的故障类型包括内圈滚道故障、外圈滚道故障、滚动体故障以及组合故障;传动齿轮的故障类型包括齿底故障、齿根故障、缺齿故障、表面磨损以及正常状态。
优选地,步骤S1中按照7.2:1.8的比例对采集的信号样本进行数据划分,得到训练集样本和测试集样本。
优选地,步骤S234中约束项表示为:
式中,表示训练样本集模式类别的先验概率分布。
与现有技术相比,本发明的有益效果如下:
(1)本发明提出面向噪声标签工业场景的旋转机械智能诊断方法,实现准确的故障标签分类,避免了误差积累,减轻了深度神经网络的噪声记忆效应,使深度神经网络对噪声样本具有更强的鲁棒性。
(2)本发明基于Co-teaching策略建立两个深度神经网络对带噪声样本的模型进行预训练,可以过滤不同的错误类型,减轻深度神经网络对带噪声样本的记忆影响。然后,根据低损失和干净样本之间的关系,构造两成分高斯混合模型来拟合样本的交叉熵损失分布,根据阈值对干净数据集和有噪声数据集进行划分。紧接着,为了充分利用现有的数据集,采用一种名为Mixup的数据增强方法,对半监督训练方式的样本标签进行微调和修正。该方案技术方法参照Co-teaching策略,维护两个深度神经网络以过滤不同的错误类型,避免误差积累,两个深度神经网络交替执行参数更新和模型优化。
(3)本发明在传动齿轮箱数据集上的大量实验结果验证所提出的方法在不同噪声标签水平下的故障诊断精度显著优于其他方法,即使在相对噪声较大的情况下,该方法仍能获得较准确的故障诊断结果。
附图说明
图1为本发明面向噪声标签工业场景的旋转机械故障诊断方法的流程示意图;
图2为本发明的故障诊断试验台结构示意图;
图3为本发明的故障诊断方法总体框架示意图;
图4为本发明的模型网络结构示意图;
图5为本发明的故障诊断流程图;
图6为本发明的不同故障诊断方法结果对比示意图;
图7为本发明的不同故障诊断方法的混淆矩阵示意图;
图8为本发明的不同训练周期交叉熵损失分布可视化结果示意图。
具体实施方式
以下,参照附图对本发明的实施方式进行说明。
本发明提供一种面向噪声标签工业场景的旋转机械故障诊断方法,其包含三个连续的过程,分别为深度模型预训练、噪声样本探测与分离以及样本标记微调与修正。
如图1所示,包括以下步骤:
S1、获取传动齿轮箱振动信号并进行预处理。优选地,步骤S1的具体过程为:采用加速度传感器测量传动齿轮箱的振动信号,将所测信号无重复的切分为点数为1024的数据段,并对每个数据段进行故障类型标注。
优选地,滚动轴承的故障类型包括内圈滚道故障、外圈滚道故障、滚动体故障以及组合故障;传动齿轮的故障类型包括齿底故障、齿根故障、缺齿故障、表面磨损以及正常状态。
优选地,步骤S1中按照7.2:1.8的比例对采集的信号样本进行数据划分,得到训练集样本和测试集样本。
S2、为了缓解深度模型对噪声样本的记忆效应,基于Co-teaching策略建立深度模型,完成深度模型预训练。具体包括以下子步骤:
S21、利用Co-teaching策略建立深度模型,深度模型包括第一深度网络模型和第二深度网络模型,基于传统全监督方式对噪声样本集进行预训练,其中,xi∈Rd表示一维振动信号,/>表示样本xi的故障模式类别的独热编码标记。并利用第一深度网络模型和第二深度网络模型交替完成预训练。
S22、预训练阶段,模式分类通过最小化损失函数实现模型参数更新与优化,其反向传播的梯度可以表示为:
式中,f(·;θ)为深度神经网络,θ为模型参数,LCE(·)为交叉熵损失函数。
预训练中添加约束项,约束项表示为:
式中,表示训练样本集模式类别的先验概率分布。
S3、建立高斯混合模型并求解,对噪声样本和干净样本进行划分,具体包括以下子步骤:
S31、对于噪声样本集经过一定时期模型预训练后的交叉熵损失表述为:
其中,Li对应样本xi的交叉熵损失;F(xi;θ)表示参数为θ的深度模型。
S32、基于噪声训练样本集交叉熵损失分布,建立两成分高斯混合模型表述为:
式中,ρ(L)表示两成分高斯混合模型的密度函数;αk表示第m个高斯成分系数;N(L|σm,ωm)表示第m个高斯成分,服从均值为σm标准差为ωm的正太分布。
S33、基于当前状态的两成分高斯混合模型,求解每一高斯成分对观测样本的响应Li:
S34、基于估计得到的响应Li,更新两成分高斯混合模型的参数:
S35、通过d迭代实现两成分高斯混合模型的参数更新,利用后验概率ρ(m*|Li)计算给定样本xi为干净样本的概率τi:
式中,τi对应样本xi为干净样本的概率;m*为对应的干净类别,代表高斯成分的较小均值。
S36、根据估计概率τi,训练数据集Dtrain划分为干净数据集Dclean和噪声数据集Dnoise,设定阈值δ,当τi≥δ时,训练数据集被划分为干净数据集;当τi<δ时,训练数据集被划分为噪声数据集,并丢弃对应的标签;δ一般设为0.5。干净数据集Dclean和噪声数据集Dnoise表述如下:
S4、对干净数据集进行微调并对噪声数据进行修正,其具体包括以下子步骤:
S41、从干净数据集Dclean和噪声数据集Dnoise分别采集B个小批次样本,得到随后对新获取的小批次干净样本数据执行微调,其实质为深度模型预测输出与初始给定模式类别标记的线性组合,表述为:
S42、采用温度锐化函数降低温度,并获取新标签表述为:
其中,T代表温度系数,设定为0.5。
S43、对单个小批次噪声样本进行标记修正,新标签表示为第一深度网络模型和第二深度网络模型预测输出的加权平均,表述为:
相似地,对新标签执行温度锐化:
S44、通过执行上述标签微调与修正,获取两个小批次训练数据集和/>为了缓解深度模型的过拟合问题同时削弱神经网络对噪声样本的记忆效应,随后对其执行Mixup操作,对给定的两个训练样本(xi,yi)和(xj,yj),Mixup操作表述为:
其中,α是Beta分布的参数,设置为4.0,通过执行Mixup操作,小批次数据集和演化为/>和/>并分别计算交叉熵损失和均方误差损失,表达式为:
为了避免深度神经网络在高噪声条件下将所有样本归为同一类,在模型训练过程中考虑以下正则化项:
式中,φc=1/C表示训练样本集模式类别的先验概率分布。
S45、将深度模型总体目标训练及优化函数表述为:
LTOTAL=LCE+ηLMSE+εLREG
其中,ε设置为1.0,η为包含无监督损失的系数,LREG为约束项。
搭建神经网络模型和参数配置:第一神经网络和第二神经网络均包括三个残差模块,残差模块旁路连接的卷积核尺寸为[1,1],步长为1;剩余卷积层的卷积核尺寸为[9,1],步长为1;多个池化层用于去除提取特征中的冗杂信息;每一个卷积层连接一个批处理归一化层;采用全局平均池化方法对最终残差块结果进行集成,并采用全连接层实现故障分类。
S5、进行故障诊断:循环执行步骤S2-S4,当达到最大迭代次数时,停止训练过程并保存模型参数。然后,将带有不同程度噪声标签的变速箱测试数据集植入训练好的深度神经网络,获得故障智能化辨识诊断结果。
具体实施例
S1、获取传动齿轮箱振动信号并进行预处理。
传动齿轮箱振动信号获取:
采用加速度传感器测量传动齿轮箱的振动信号,所测信号被无重复的切分为点数为1024的数据段,并对每个数据段进行故障类型标注,其中滚动轴承的故障类型包括内圈滚道故障、外圈滚道故障、滚动体故障、组合故障;传动齿轮的故障类型包括齿底故障、齿根故障、缺齿故障、表面磨损、正常状态。对采集的信号样本按一定比例进行数据划分,其中训练集样本7200条,测试集样本1800条。试验台所图2所示,其包括电机1、电机控制器2、行星齿轮箱3、平行轴齿轮箱4、制动器5以及制动器控制箱6。
传动齿轮箱诊断数据集描述所表1所示:
表1传动齿轮箱诊断数据集描述
传动齿轮箱振动信号预处理。
对于故障类型为0的训练数据集(对应样本序列号:1-800),如果需要添加20%比例的噪声水平,首先随机选择160个训练样本,然后随机等量地人为修改为其他故障标签(修改为故障标签1-8),从而引入20%比例的噪声。根据需要,我们考虑了从低到高的四种不同的标记噪声水平,分别为20%、30%、40%和50%。本技术方案以传动齿轮箱为研究对象,实验模拟工况为20HZ-0V负载。
S2、建立故障诊断模型并训练,具体包括以下步骤,所图3所示:
S21、基于Co-teaching策略建立深度模型,完成预训练。
在深度模型初始训练阶段,模型倾向于先拟合干净样本后拟合噪声样本,这表明在拟合阶段,干净样本的交叉熵损失小于噪声样本,因此可基于损失分布的角度实现干净样本和噪声样本的分离。
深度模型基于传统全监督方式对噪声样本集进行预训练,为减少对噪声样本记忆效应和误差累积,本发明参考Co-teaching策略建立两个深度神经网络,第一深度网络和第二深度网络。两个网络交替完成预训练过程,通过过滤不同类型误差,使得对噪声样本更具鲁棒性。
S22、建立高斯混合模型并求解,实现干净、噪声数据集划分。
对于给定噪声训练数据集经过一定时期模型预训练后的交叉熵损失表述可为:
其中,Li对应样本xi的交叉熵损失;F(xi;θ)表示参数为θ的深度模型。
基于噪声训练样本集交叉熵损失分布,所建立的两成分高斯混合模型表述为:
式中,ρ(L)表示两成分高斯混合模型的密度函数;αk表示第m个高斯成分系数;N(L|σm,ωm)表示第m个高斯成分,服从均值为σm标准差为ωm的正太分布。
基于当前状态的两成分高斯混合模型,求解每一高斯成分对观测样本的响应Li:
基于估计得到的响应Li,更新两成分高斯混合模型的参数。
通过d迭代执行步骤E、M,实现两成分高斯混合模型的参数更新。利用后验概率ρ(m*|Li)计算给定样本xi为干净样本的概率τi:
式中,τi对应样本xi为干净样本的概率;m*为对应的干净类别,代表高斯成分的较小均值。
根据估计概率τi,训练数据集Dtrain划分为干净数据集Dclean和噪声数据集Dnoise。通过设定一个合理的阈值δ(设为0.5),当τi≥δ时,训练数据集被划分为干净数据集;当τi<δ时,训练数据集被划分为噪声数据集,并丢弃对应的标签。公式表述如下:
S23、干净样本微调与噪声数据修正。
为消除噪声标签可能造成的负面影响,本步骤首先从干净数据集Dclean和噪声数据集Dnoise采集B个小批次样本,得到随后对新获取的小批次干净样本数据执行微调,其实质为深度模型预测输出与初始给定模式类别标记的线性组合,表述为:
采用温度锐化函数降低温度,并获取新标签表述为:
T代表温度系数,设定为0.5。
对单个小批次噪声样本进行标记修正,新标签表示为两个深度网络预测输出的加权平均,其数学表述为:/>
相似地,对新标签执行温度锐化:/>
通过执行上述标签微调与修正,获取两个小批次训练数据集和为了缓解深度模型的过拟合问题同时削弱神经网络对噪声样本的记忆效应,随后对其执行Mixup操作,已起到充分利用数据、减轻深度模型对噪声标签记忆效应的效果。对于给定的两个训练样本(xi,yi)和(xj,yj),Mixup操作表述为:
其中,α是Beta分布的参数,设置为4.0。通过执行Mixup操作,小批次数据集和演化为/>和/>并分别计算交叉熵损失和均方误差损失,表达式为:
为避免深度模型将全部样本预测为同一模式类别,在模型训练过程中添加如下约束项:
式中,表示训练样本集模式类别的先验概率分布。综上,深度模型总体目标训练及优化函数表述为:
LTOTAL=LCE+ηLMSE+εLREG
式中,ε设置为1.0,η为包含无监督损失的系数。
S24、搭建神经网络模型和参数配置。
搭建的深度神经网络结构如图4所示,相关参数配置见表2。三个残差模块为该网络的主体部分,除残差模块旁路连接外,所有卷积层(Conv)的卷积核尺寸为[9,1],步长为1。残差模块旁路连接的卷积核尺寸为[1,1],步长也设为1。在网络中加入多个池化层(Pooling),去除提取特征中的冗杂信息;每一个卷积层都紧接着一个批处理归一化(BN)层,有助加快网络的收敛速度;采用全局平均池化(GAP)方法对最终残差块结果进行集成,并采用全连接层(FC)实现故障分类。
表2网络结构参数设置
函数层 | 卷积核尺寸 | 步长 | 填充 |
Conv/BN/ReLU | 32-[9×1] | 1×1 | / |
Pooling | 32-[9×1] | 1×1 | / |
ResidualBlock | / | / | / |
Pooling | 32-[9×1] | 1×1 | / |
ResidualBlock | / | / | / |
Pooling | 32-[9×1] | 1×1 | / |
ResidualBlock | / | / | / |
GAP | / | / | / |
FC | C | / | / |
Softmax激活函数 | / | / | / |
S3、故障诊断流程及验证,具体包括:
S31、故障诊断流程。
针对实际工业场景中所面临的噪声污染问题,提出的面向噪声标签工业场景的旋转机械智能诊断方法,具体诊断流程如下,如图5所示:
(1)数据采集与预处理。
采用振动传感器对变速箱信号进行测量,对采集到的振动信号数据集进行故障标注,并按一定比例将其分类为训练数据集和测试数据集,并对这两个数据集进行预处理。
(2)故障智能化辨识模型建立与训练。
构建如图3所示的两个深度神经网络,交替地以传统的全监督方式进行预训练,过滤不同的错误类型,避免错误积累。构造一个双成分高斯混合模型来拟合训练数据集的交叉熵损失,由于干净样本的损失值小于噪声样本,因此根据设置的阈值将干净样本和噪声样本分离。在半监督学习训练方式中采用一种名为Mixup操作的数据增强方法,抑制对噪声样本的负面影响,提高深度神经网络的鲁棒性,然后对干净样本和噪声样本进行标签微调和修正。
(3)诊断结果。
循环执行步骤2,当达到最大迭代次数时,停止训练过程并保存模型参数。然后,将带有不同程度噪声标签的变速箱测试数据集植入训练好的深度神经网络,获得故障智能化辨识诊断结果。
S32、故障诊断结果分析。
为验证所提方法的有效性,本节以变速箱为例,在不同噪声比水平条件下进行故障诊断实验,并介绍四种比较方法(ResNet、MSE、Co-teaching+和Mixup),进一步证明研究方法的优越性。表3和图6总结了不同噪声水平和工作条件下的故障诊断结果。
表3不同噪声水平下故障诊断结果
此外,引入混淆矩阵进一步说明本技术方案在齿轮箱故障诊断中的识别情况,如图7所示。图8为噪声水平40%情况下不同训练阶段干净样本和噪声样本的交叉熵损失分布可视化结果。从图8中可看出,随着训练周期迭代,干净样本的交叉熵损失进一步缩小,干净样本的损失分布与噪声样本的差异逐渐明显,明显的是重叠交叉部分明显减小,表明本技术方案提出的方法可以有效提高噪声样本和干净样本的辨识分离精度,提高深度神经网络抗噪声标签的性能。
以上所述的实施例仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (9)
1.一种面向噪声标签工业场景的旋转机械故障诊断方法,其特征在于:其包括以下步骤:
S1、获取传动齿轮箱振动信号并进行预处理;
S2、基于Co-teaching策略建立故障深度模型,完成深度模型预训练,其包括以下子步骤:
S21、利用Co-teaching策略建立故障深度模型,故障深度模型包括第一深度网络模型和第二深度网络模型;
S22、基于传统全监督方式对噪声样本集进行预训练,其中,xi∈Rd表示一维振动信号,/>表示样本xi的故障模式类别的独热编码标记;并利用第一深度网络模型和第二深度网络模型交替完成预训练;
S23、预训练阶段,模式分类通过最小化损失函数实现模型参数更新与优化,其反向传播的梯度表示为:
式中,f(·;θ)为深度神经网络,θ为模型参数,LCE(·)为交叉熵损失函数;
S3、建立高斯混合模型并求解,对噪声样本和干净样本进行划分,具体包括以下子步骤:
S31、对于噪声样本集经过多次步骤S2的模型预训练后的交叉熵损失表述为:
其中,Li为对应样本xi的交叉熵损失;F(xi;θ)表示参数为θ的深度模型;
S32、基于噪声训练样本集交叉熵损失分布,建立两成分高斯混合模型,表述为:
式中,ρ(L)表示两成分高斯混合模型的密度函数;αk表示第m个高斯成分系数;N(L|σm,ωm)表示第m个高斯成分,服从均值为σm标准差为ωm的正太分布;
S33、基于步骤S32得到的当前状态的两成分高斯混合模型,求解每一高斯成分对观测样本的响应Li:
S34、基于估计得到的响应Li,更新两成分高斯混合模型的参数:
S35、通过d迭代实现两成分高斯混合模型的参数更新,利用后验概率ρ(m*|Li)计算给定样本xi为干净样本的概率τi:
式中,τi为对应样本xi为干净样本的概率;m*为对应的干净类别,代表高斯成分的较小均值;
S36、根据估计概率τi,将训练数据集Dtrain划分为干净数据集Dclean和噪声数据集Dnoise,设定阈值δ,当τi≥δ时,训练数据集被划分为干净数据集;当τi<δ时,训练数据集被划分为噪声数据集,并丢弃对应的标签;干净数据集Dclean和噪声数据集Dnoise表述如下:
S4、对干净数据集进行微调并对噪声数据进行修正,其具体包括以下子步骤:
S41、从干净数据集Dclean和噪声数据集Dnoise分别采集B个小批次样本,得到随后对新获取的小批次干净样本数据执行微调,其实质为深度模型预测输出与初始给定模式类别标记的线性组合,表述为:
S42、采用温度锐化函数降低温度,并获取新标签表述为:
其中,T代表温度系数,设定为0.5;
S43、对单个小批次噪声样本进行标记修正,新标签表示为第一深度网络模型和第二深度网络模型预测输出的加权平均,表述为:
之后对新标签执行温度锐化:
S44、通过执行上述标签微调与修正,获取两个小批次训练数据集和随后对其执行Mixup操作;
S45、将深度模型总体目标训练及优化函数表述为:
LTOTAL=LCE+ηLMSE+εLREG
其中,ε设置为1.0,η为包含无监督损失的系数,LREG为约束项;
S5、进行故障诊断,其包括以下子步骤:
S51、循环执行步骤S2至步骤S4,当达到最大迭代次数时,停止训练过程并保存模型参数;
S52、将带有不同程度噪声标签的变速箱测试数据集植入训练好的故障深度模型,输出故障诊断结果。
2.根据权利要求1所述的面向噪声标签工业场景的旋转机械故障诊断方法,其特征在于:第一深度网络模型和第二深度网络模型均包括三个残差模块,残差模块旁路连接的卷积核尺寸为[1,1],步长为1;剩余卷积层的卷积核尺寸为[9,1],步长为1;多个池化层用于去除提取特征中的冗杂信息;每一个卷积层连接一个批处理归一化层;采用全局平均池化方法对最终残差块结果进行集成,并采用全连接层实现故障分类。
3.根据权利要求1所述的面向噪声标签工业场景的旋转机械故障诊断方法,其特征在于:步骤S44中,对给定的两个训练样本(xi,yi)和(xj,yj),Mixup操作表述为:
其中,α是Beta分布的参数,设置为4.0,通过执行Mixup操作,小批次数据集和/>演化为/>和/>并分别计算交叉熵损失和均方误差损失,表达式为:
4.根据权利要求1所述的面向噪声标签工业场景的旋转机械故障诊断方法,其特征在于:在模型训练过程中添加以下正则化项:
式中,φc=1/C表示训练样本集模式类别的先验概率分布。
5.根据权利要求1所述的面向噪声标签工业场景的旋转机械故障诊断方法,其特征在于:阈值δ设为0.5。
6.根据权利要求1所述的面向噪声标签工业场景的旋转机械故障诊断方法,其特征在于:步骤S1的具体过程为:采用加速度传感器测量传动齿轮箱的振动信号,将所测信号无重复的切分为点数为1024的数据段,并对每个数据段进行故障类型标注。
7.根据权利要求2所述的面向噪声标签工业场景的旋转机械故障诊断方法,其特征在于:滚动轴承的故障类型包括内圈滚道故障、外圈滚道故障、滚动体故障以及组合故障;传动齿轮的故障类型包括齿底故障、齿根故障、缺齿故障、表面磨损以及正常状态。
8.根据权利要求2所述的面向噪声标签工业场景的旋转机械故障诊断方法,其特征在于:步骤S1中按照7.2:1.8的比例对采集的信号样本进行数据划分,得到训练集样本和测试集样本。
9.根据权利要求1所述的面向噪声标签工业场景的旋转机械故障诊断方法,其特征在于:步骤S234中约束项表示为:
式中,表示训练样本集模式类别的先验概率分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311530790.XA CN117571312A (zh) | 2023-11-16 | 2023-11-16 | 面向噪声标签工业场景的旋转机械故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311530790.XA CN117571312A (zh) | 2023-11-16 | 2023-11-16 | 面向噪声标签工业场景的旋转机械故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117571312A true CN117571312A (zh) | 2024-02-20 |
Family
ID=89891114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311530790.XA Pending CN117571312A (zh) | 2023-11-16 | 2023-11-16 | 面向噪声标签工业场景的旋转机械故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117571312A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117951529A (zh) * | 2024-03-26 | 2024-04-30 | 济南浪潮数据技术有限公司 | 用于硬盘数据故障预测的样本获取方法、装置、设备 |
-
2023
- 2023-11-16 CN CN202311530790.XA patent/CN117571312A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117951529A (zh) * | 2024-03-26 | 2024-04-30 | 济南浪潮数据技术有限公司 | 用于硬盘数据故障预测的样本获取方法、装置、设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109765053B (zh) | 利用卷积神经网络和峭度指标的滚动轴承故障诊断方法 | |
CN112304613B (zh) | 一种基于特征融合的风电机组发电机轴承预警方法 | |
CN109829402B (zh) | 基于gs-svm的不同工况下轴承损伤程度诊断方法 | |
CN107941537A (zh) | 一种机械设备健康状态评估方法 | |
CN113128561A (zh) | 一种机床轴承故障诊断方法 | |
CN117571312A (zh) | 面向噪声标签工业场景的旋转机械故障诊断方法 | |
CN113281029B (zh) | 一种基于多尺度网络结构的旋转机械故障诊断方法及系统 | |
CN111459144A (zh) | 一种基于深度循环神经网络的飞机飞控系统故障预测方法 | |
CN115270956A (zh) | 基于持续学习的跨设备增量轴承故障诊断方法 | |
CN112257862B (zh) | 一种基于关系网络标记样本扩充的半监督辨识方法 | |
CN113177537B (zh) | 一种旋转机械设备的故障诊断方法及系统 | |
CN113188794B (zh) | 一种基于改进pso-bp神经网络齿轮箱故障诊断方法及装置 | |
CN110823543B (zh) | 一种基于往复机械活塞杆轴心轨迹包络与信息熵特征的负荷识别方法 | |
WO2017088208A1 (zh) | 一种由数据差异驱动的间歇过程自学习动态优化方法 | |
CN114722952B (zh) | 一种基于表示学习的轴承故障检测和分类的一体化方法 | |
CN113392881A (zh) | 一种基于迁移学习的旋转机械故障诊断方法 | |
CN117252878B (zh) | 一种纳米压印模具的图像缺陷检测方法 | |
CN116593157A (zh) | 少样本下基于匹配元学习的复杂工况齿轮故障诊断方法 | |
CN110837851A (zh) | 一种电静液作动器液压泵故障诊断方法 | |
CN112132102A (zh) | 一种深度神经网络结合人工蜂群优化的智能故障诊断方法 | |
CN113569685A (zh) | 机床主轴轴承故障诊断模型建立、故障诊断方法和系统 | |
CN115587290A (zh) | 基于变分自编码生成对抗网络的航空发动机故障诊断方法 | |
CN114714145A (zh) | 一种刀具磨损状态的格拉姆角场增强对比学习监测方法 | |
Hu et al. | Fault diagnosis based on multi-scale redefined dimensionless indicators and density peak clustering with geodesic distances | |
CN114964776A (zh) | 基于mse和pso-svm的轮对轴承故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |