CN117475191A

CN117475191A - 一种特征对齐域对抗神经网络的轴承故障诊断方法

Info

Publication number: CN117475191A
Application number: CN202310791257.2A
Authority: CN
Inventors: 张利; 顾士兴; 张凯鑫; 张皓博; 罗浩
Original assignee: Liaoning University
Current assignee: Liaoning University
Priority date: 2023-06-30
Filing date: 2023-06-30
Publication date: 2024-01-30

Abstract

一种特征对齐域对抗神经网络故障诊断方法，步骤如下：(1)信号采集；(2)数据扩充；(3)特征学习；(4)故障分类。改进特征对齐生成对抗网络构建真实数据与生成数据的最大均值差异机制，以卷积模块代替全连接模块，以实现对不平衡数据的扩充，可以满足域对抗神经网络DANN中源域与目标域数量平衡需求。DANN领域判别器对齐域间特征分布的同时会弱化特征提取器提取到的域内分类特征，为了使DANN标签分类器分类更准确，建立多尺度注意力机制筛选出重要故障相关信息，提取域判别不变下分类相关特征，并构建熵最小标签分类器，提高模型泛化能力。改进的域对抗神经网络可以更好的识别目标域样本的故障类别，完成滚动轴承不平衡样本下的故障识别。

Description

一种特征对齐域对抗神经网络的轴承故障诊断方法

技术领域

本发明涉及一种特征对齐域对抗神经网络故障诊断方法，属于故障诊断领域。

背景技术

滚动轴承作为大型旋转机械设备中至关重要的零件之一，一旦发生故障将对机械运行造成严重威胁，更会危害人身财产安全。因此对滚动轴承的振动信号进行合理分析，可以提前预警机械故障，减少安全隐患。轴承智能故障诊断模型通常需要充足的带标签样本进行训练，但在实际生产过程中，工业设备通常处于正常状态下运行。很难提前采集充足的轴承故障信号用于设备诊断，同时收集的故障数据类别间比例也不一致，导致难以对滚动轴承进行故障诊断，发生故障时可能导致严重生产损失和高昂研究费用。为解决收集样本存在不平衡的问题，生成对抗网络Generative Adversarial Networks，GAN是扩充样本至平衡状态的优秀措施，受到广大学者的青睐。而应对真实样本稀缺导致故障诊断准确率较低的问题，域对

抗神经网络Domain Adversarial Neural Networks，DANN由于具有弱化特征提取器提取到的域内分类特征，提取域判别不变下分类相关特征的能力，是识别目标域样本的故障类别，完成滚动轴承不平衡样本下的故障识别的重要方法之一。

发明内容

本发明创造提供本发明提供本发明涉及一种特征对齐域对抗神经网络故障诊断方法，解决现有技术中存在的智能故障诊断未能解决采集充足的轴承故障信号和已有故障数据类别间比例不一致问题，导致深层特征挖掘不充分，精度低的问题。

本发明是通过以下技术方案实现的：一种特征对齐域对抗神经网络故障诊断方法，步骤如下：

1)信号采集：利用传感器收集滚动轴承的原始一维振动信号，选取数字信号的采样频率为5000Hz的轴承数据。

2)数据扩充：提出特征对齐的生成对抗模型，特征对齐的生成对抗网络分为两个部分：一个是生成器G，一个是判别器D；随机噪声通过生成器的反卷积操作生成样本，将低维噪声上采样为与真实样本维度相同的生成样本，随后将生成样本与真实样本混合输入至判别器中进行训练，输入数据通过判别器的卷积操作提取样本特征，通过最大均值差异衡量真实样本与生成样本间特征分布差异，减少特征分布间距离损失，反向更新参数，指导生成器生成符合真实样本特征分布的生成样本；

具体方法如下：

特征对齐的生成对抗模型由三部分组成，分别是生成器G、判别器D和最终损失函数Loss；其中Loss分为三个部分，极小化生成器损失函数极大化判别器损失函数以及特征分布最大均值差异损失函数/>具体流程如下：

2.1)对目标域真实样本进行滑动窗口采样，样本大小为1024，为模拟不平衡样本输入，每类故障样本随机选取不同个数样本作为输入；

2.2)将大小为100维且服从正态分布的高斯噪声输入改进GAN的生成器中进行上采样，输出大小为1024的生成样本；

2.3)设置生成样本标签为1，真实样本标签为0；

2.4)固定生成器参数，将真实样本和生成样本混合送入判别器中，训练判别器；

2.5)固定判别器参数，将混合样本送入模型中，计算生成样本与真实样本特征间最大均值差异和判别结果，反向更新生成器参数；生成的最大均值差异可由公式(1)所示：

其中，_fi ^s表示源域数据，_fi ^t表示目标域数据，表示极小化生成器损失函数，/>表示极大化判别器损失函数；

2.6)固定生成器参数，重新生成样本，设置生成样本标签为0，训练判别器；

2.7)循环迭代训练模型，保存生成样本作为扩充数据。

3)特征学习：通过改进特征对齐的生成对抗模型、改进域对抗神经网络组成的旋转机械故障诊断模型进行深层特征学习。

4)轴承故障诊断：

4.1)随机取10个带标签目标域样本，同为一个类别，与随机变量生成样本等量混合；其中生成样本标签为1，真实样本标签为0；

4.2)混合样本输入判别器进行训练；

4.3)冻结判别器权重，混合样本输入模型中训练生成器，计算生成样本和真实样本特征之间最大均值差异，最小化特征间重建距离损失；

4.4)设置生成样本标签为0，输入模型训练生成器；

4.5)从训练好的模型中取出适量样本充当目标域样本；

4.6)源域样本、扩充后带标签目标域样本以及真实带标签目标域样本混合成训练集，输入改进域对抗神经网络IDANN中进行训练；

改进域对抗神经网络IDANN由三个部分组成，分别是特征提取器、标签分类器以及领域判别器；

特征提取器：通过构建多尺度注意力机制模块，提取领域判别不变下的分类相关特征；首先输入数据经特征提取模块得到输出特征，每个特征提取模块包括卷积层，注意力机制模块以及池化层组成，源域D_s和目标域D_t样本作为输入数据首先进行卷积操作，如式(2)所示：

其中，代表上一层的输出，/>代表当前输出，N代表卷积核数目，k代表卷积核，卷积核大小为3，b代表偏差，f(·)代表ReLU激活函数；

卷积提取特征后进行全局平均池化，如式(3)所示：

其中，x代表输入数据，m代表第m个通道，n代表该通道中的一个数据点，w代表当前通道样本数，v_m代表经全局平均池化计算得到的通道权重值；

池化后得到通道权重值经两层1*1卷积操作，得到最终的通道注意力权重v，对输入数据进行调整，并增加残差连接结构，得到输出特征；如式(4)所示：

其中，d代表通道维数，代表上一层输出，/>代表当前输出，v代表通道注意力权重；

输出特征经最大池化计算后，输入到下一个特征提取模块；如式(5)所示：

其中，w为池化区域大小3，为最大池化后输出值，/>为上一层输出特征；

输入数据经过三个特征提取模块得到最终输出特征，通过特征提取模块计算获得每个通道的重要程度，为每个特征赋予一个权重值，让模型重点关注特征通道，抑制不重要的特征通道，提高模型的分类准确率；

标签分类器：最小化熵损失能够提高目标域样本分类自信程度，通过最小化熵损失训练模型标签分类器，使得目标域样本熵值达到最小；熵最小化技术让模型的决策边界远离边缘数据，提高模型分类器的自信程度，熵最小化如式(6)所示：

其中，代表目标域中第i个样本，N代表样本数，G(·)代表特征提取器，C(·)代表分类器；

输入数据经特征提取器G提取特征，输入到分类器C中，通过softmax函数计算该样本预测为每个类别的概率，计算熵值后进行累加得到我们最终目标函数；熵值越小，分类器的自信程度越高，更好的刻画目标域数据内不同类别样本的决策边界，提高模型泛化能力；

4.7)最小化分类损失、域分类损失以及目标域熵损失；

基于带注意力机制特征提取器及基于熵最小化标签分类器的原理及具体实现过程，设计一种改进域对抗神经网络，模型优化目标函数发生变化，最小熵损失函数应用于目标域样本，提高模型泛化能力，改进DANN总体损失由式(4.6)表示：

L_DANN＝L_c(D_s,y_s)+L_c(D_T,y_T)+L_en(D_T,y_T)+λL_d(D_s,D_T) (7)

其中，L_c(D_s,y_s)为源域数据域内分类损失，L_c(D_T,y_T)为目标域数据域内分类损失，L_en(D_T,y_T)为目标域数据最小熵损失，L_d(D_s,D_T)为两域数据域间分类损失，λ为领域判别损失的权重系数；

4.8)保存训练好的网络模型；

4.9)利用目标域无标签样本进行测试，输出最终故障识别结果。

本发明创造的有益效果为：

发明主要设计并实现一种注意力降噪的残差时间卷积故障诊断方法，针对在实际工况中震动信号中存在噪声这一问题，设计一种自注意力机制以获取输入数据的注意力权重，通过注意力值为每个信号特征生成特定的阈值，再经软阈值化操作消除无关冗余信息，以达到降噪效果。设计批归一化方法加入到时间卷积网络中，进一步优化模型的特征提取能力。使用设计的方法在制作的数据集上进行实验，验证所设计方法的抗噪性和有效性。

附图说明

图1是整体流程图；

图2是注意力降噪的残差时间卷积网络的模型图；

图3是不同信噪比数据集下的准确率对比图；

图4是不同信噪比数据集下的损失值对比图。

图5是模型诊断精度图。

具体实施方式

一种特征对齐域对抗神经网络故障诊断方法，其步骤为：

具体方法如下：

2.3)设置生成样本标签为1，真实样本标签为0；

其中，_fi ^s表示源域数据，_fi ^t表示目标域数据，表示极小化生成器损失函数，表示极大化判别器损失函数；

2.7)循环迭代训练模型，保存生成样本作为扩充数据。

4)轴承故障诊断：

4.2)混合样本输入判别器进行训练；

4.4)设置生成样本标签为0，输入模型训练生成器；

4.5)从训练好的模型中取出适量样本充当目标域样本；

卷积提取特征后进行全局平均池化，如式(3)所示：

4.7)最小化分类损失、域分类损失以及目标域熵损失；

L_DANN＝L_c(D_s,y_s)+L_c(D_T,y_T)+L_en(D_T,y_T)+λL_d(D_s,D_T) (7)

4.8)保存训练好的网络模型；

实施例1：

一、本发明方案的理论依据：

1、数据扩充

提出特征对齐的生成对抗模型，特征对齐的生成对抗网络可以分为两个部分：一个是生成器G，一个是判别器D。随机噪声通过生成器的反卷积操作生成样本，将低维噪声上采样为与真实样本维度相同的生成样本，随后将生成样本与真实样本混合输入至判别器中进行训练，输入数据通过判别器的卷积操作提取样本特征，通过最大均值差异衡量真实样本与生成样本间特征分布差异，减少特征分布间距离损失，反向更新参数，指导生成器生成符合真实样本特征分布的生成样本，数据扩充获得最大均值差异可由公式(1)所示：

其中，_fi ^s表示源域数据，_fi ^t表示目标域数据。表示极小化生成器损失函数，表示极大化判别器损失函数。

2、改进域对抗神经网络IDANN

IDNAA由三个部分组成，分别是特征提取器、标签分类器以及领域判别器。

特征提取器：通过构建多尺度注意力机制模块，提取领域判别不变下的分类相关特征。首先输入数据经特征提取模块得到输出特征，每个特征提取模块包括卷积层，注意力机制模块以及池化层组成。源域D_s和目标域D_t样本作为输入数据首先进行卷积操作，如式(2)所示：

其中，代表上一层的输出，/>代表当前输出，N代表卷积核数目，K代表卷积核，卷积核大小为3，b代表偏差，f(·)代表ReLU激活函数。

卷积提取特征后进行全局平均池化，如式(3)所示：

其中，m代表第m个通道，n代表该通道中的一个数据点，w代表当前通道样本数，v_m代表经全局平均池化计算得到的通道权重值。

池化后得到通道权重值经两层1*1卷积操作，得到最终的通道注意力权重v，对输入数据进行调整，并增加残差连接结构，得到输出特征。如式(4)所示：

其中，d代表通道维数，代表上一层输出，/>代表当前输出，v代表通道注意力权重。

输出特征经最大池化计算后，输入到下一个特征提取模块。如式(5)所示：

其中，w为池化区域大小3，为最大池化后输出值，/>为上一层输出特征。

输入数据经过三个特征提取模块得到最终输出特征，通过特征提取模块计算获得每个通道的重要程度，为每个特征赋予一个权重值，从而让模型重点关注某些特征通道，并抑制不重要的特征通道，提高模型的分类准确率。

标签分类器：最小化熵损失可以提高目标域样本分类自信程度，通过最小化熵损失训练模型标签分类器，使得目标域样本熵值达到最小。熵最小化技术可以让模型的决策边界远离边缘数据，提高模型分类器的自信程度。熵最小化如式(6)所示：

其中，代表目标域中第i个样本，N代表样本数，G(·)代表特征提取器，C(·)代表分类器。

输入数据经特征提取器G提取特征，输入到分类器C中，通过softmax函数计算该样本预测为每个类别的概率，计算熵值后进行累加得到我们最终目标函数。熵值越小，分类器的自信程度也就越高，可以更好的刻画目标域数据内不同类别样本的决策边界，提高模型泛化能力。

3、最小化分类损失、域分类损失以及目标域熵损失

基于带注意力机制特征提取器及基于熵最小化标签分类器的原理及具体实现过程，设计了一种改进域对抗神经网络。我们注意到模型优化目标函数发生了变化，最小熵损失函数应用于目标域样本，可以提高模型泛化能力。改进DANN总体损失可以由式(4.6)表示：

L_DANN＝L_c(D_s,y_s)+L_c(D_T,y_T)+L_en(D_T,y_T)+λL_d(D_s,D_T) (7)

其中，L_c(D_s,y_s)为源域数据域内分类损失，L_c(D_T,y_T)为目标域数据域内分类损失，L_en(D_T,y_T)为目标域数据最小熵损失，L_d(D_s,D_T)为两域数据域间分类损失，λ为领域判别损失的权重系数。

二、本发明技术方案的实现过程：

1、信号采集：利用传感器收集轴承的振动信号，选取数字信号的采样频率为5000Hz的轴承数据。

2、数据扩充：提出特征对齐的生成对抗模型，特征对齐的生成对抗网络可以分为两个部分：一个是生成器G，一个是判别器D。随机噪声通过生成器的反卷积操作生成样本，将低维噪声上采样为与真实样本维度相同的生成样本，随后将生成样本与真实样本混合输入至判别器中进行训练，输入数据通过判别器的卷积操作提取样本特征，通过最大均值差异衡量真实样本与生成样本间特征分布差异，减少特征分布间距离损失，反向更新参数，指导生成器生成符合真实样本特征分布的生成样本。

3、特征学习：通过改进特征对齐的生成对抗模型、改进域对抗神经网络组成的旋转机械故障诊断模型进行深层特征学习；

4、故障诊断：首先利用传感器收集轴承的振动信号，选取数字信号的采样频率5000Hz的轴承数据，将收集到的不平衡目标域一维振动数据输入到改进特征对齐的生成对抗模型中，得到可以更好的保留原始数据特征，以便生成高质量的类别平衡样本数据。将源域和目标域数据放入改进域对抗神经网络组成的旋转机械故障诊断模型中，建立多尺度注意力机制筛选出重要故障相关信息，提取域判别不变下分类相关特征，并构建熵最小标签分类器，提高模型泛化能力。改进的域对抗神经网络可以更好的识别目标域样本的故障类别，完成滚动轴承不平衡样本下的故障识别。

5、一种特征对齐域对抗神经网络故障诊断方法将CWRU数据集和实验室旋转机械滚动轴承PT300试验台产生的一维原始数据作为数据集作为对比实验。每个数据集收集七类振动数据，一类正常数据，故障数据分为三大类，分别是轴承内圈故障，外圈故障和滚动体故障，每类故障又分为两种，因此，一共六类故障数据和一类正常数据。在不同的转速下获得的数据成为目标域数据或者源域数据。

为评价模型故障诊断效果，在CWRU数据集下，将原始目标域振动数据预处理后输入特征对齐的生成对抗网络中进行扩充，扩充后的目标域样本与源域样本送入改进域对抗神经网络中进行故障诊断，实验准确度如表1所示：

表1：CWRU变工况准确率对比

表2：PT300试验台变工况准确率对比

其中A→B表示在A转速的数据集下训练，在B转速下数据集进行测试，此时A是源域，B是目标域，以此类推。从表1看，是基于CWRU数据集，进行域迁移学习实验。其中，源域为充足数据，每个类别包含500个真实样本，目标域不平衡比例设置为10:1。选取三次实验结果并计算均值，可以看到模型在不同跨域故障识别准确率均能保持在99％以上，即对于CWRU不平衡数据集时可以保持较高的识别率。从表2看，是基于LNU数据集，进行域迁移学习实验。其中，源域每个类别包含500个真实样本，目标域不平衡比例设置为10:1。选取三次实验结果并计算均值，可以看到模型在F→G迁移实验中表现效果较好，在G→H迁移实验中表现效果较差，但模型总体跨域故障识别准确率均能保持在90％以上，验证模型可以很好的学习到目标域的故障分类特征，对于PT300不平衡数据集也能保持良好的识别率。

本发明对所提出的故障诊断模型和旋转机械滚动轴承数据进行了详细阐述，本发明提出的模型由通过改进特征对齐的生成对抗模型、改进域对抗神经网络组成。首先针对不平衡小样本直接送入深度学习模型中容易出现过拟合的问题，提出改进特征对齐的生成对抗模型，通过改进的最大均值差异衡量生成样本和真实样本间的特征分布，通过不断缩小样本间分布距离，指导生成器生成更拟合真实样本的生成数据，将目标域不平衡小样本扩充至与源域数量相同且平衡状态。然后输入改进域对抗神经网络中进行训练，为更好实现模型的准确分类，构建多尺度注意力特征机制提取域内故障分类相关特征，提升模型识别能力，同时，熵最小化技术可以让模型决策边界远离边缘数据点，增加分类器自信程度，在面对目标域样本分类时，建立熵最小化分类器可以提高模型对于目标域样本的适配能力，增强模型泛化能力。最后将数据送入到分类器中得出分类结果。提出方法为旋转机械故障诊断的故障识别提供了一种高精度、高稳定的分类方法，为故障诊断提供了一种新的思路以及更智能的故障诊断方法。

Claims

1.一种特征对齐域对抗神经网络的故障诊断方法，其特征在于，步骤如下：

1)信号采集：利用传感器收集滚动轴承的原始一维振动信号，选取数字信号的采样频率为5000Hz的轴承数据；

3)特征学习：通过改进特征对齐的生成对抗模型、改进域对抗神经网络组成的旋转机械故障诊断模型进行深层特征学习；

4)轴承故障诊断：

4.2)混合样本输入判别器进行训练；

4.4)设置生成样本标签为0，输入模型训练生成器；

4.5)从训练好的模型中取出适量样本充当目标域样本；

4.7)最小化分类损失、域分类损失以及目标域熵损失；

4.8)保存训练好的网络模型；

2.根据权利要求1所述的一种特征对齐域对抗神经网络的故障诊断方法，其特征在于：所述的步骤2)中，具体方法如下：

2.3)设置生成样本标签为1，真实样本标签为0；

其中，f_i ^s表示源域数据，f_i ^t表示目标域数据，表示极小化生成器损失函数，表示极大化判别器损失函数；

2.7)循环迭代训练模型，保存生成样本作为扩充数据。

3.根据权利要求1所述的一种特征对齐域对抗神经网络的故障诊断方法，其特征在于：所述的步骤4.6)中，具体方法如下：

卷积提取特征后进行全局平均池化，如式(3)所示：

输入数据经特征提取器G提取特征，输入到分类器C中，通过softmax函数计算该样本预测为每个类别的概率，计算熵值后进行累加得到我们最终目标函数；熵值越小，分类器的自信程度越高，更好的刻画目标域数据内不同类别样本的决策边界，提高模型泛化能力。

4.根据权利要求1所述的一种特征对齐域对抗神经网络的故障诊断方法，其特征在于：所述的步骤4.7)中，具体方法如下：

L_DANN＝L_c(D_s,y_s)+L_c(D_T,y_T)+L_en(D_T,y_T)+λL_d(D_s,D_T)(7)其中，L_c(D_s,y_s)为源域数据域内分类损失，L_c(D_T,y_T)为目标域数据域内分类损失，L_en(D_T,y_T)为目标域数据最小熵损失，L_d(D_s,D_T)为两域数据域间分类损失，λ为领域判别损失的权重系数。