CN112179654B

CN112179654B - 基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法

Info

Publication number: CN112179654B
Application number: CN202011039284.7A
Authority: CN
Inventors: 张敏; 张训杰; 李贤均; 许文鑫
Original assignee: Southwest Jiaotong University
Current assignee: Southwest Jiaotong University
Priority date: 2020-09-28
Filing date: 2020-09-28
Publication date: 2022-02-01
Anticipated expiration: 2040-09-28
Also published as: CN112179654A

Abstract

本发明公开了一种基于GAF‑CNN‑BiGRU网络的滚动轴承故障识别方法，首先利用格拉姆角场将滚动轴承振动信号数据转换成二维图像，然后再利用CNN‑BiGRU网络模型完成故障分类；利用格拉姆角场将滚动轴承振动信号数据转换成二维图像，不仅保留了原始信号的完整信息，而且保留了数据对时间的依赖性；而CNN‑BiGRU网络模型中通过卷积单元实现对二维图像中空间特征的提取，进一步通过双向门控制单元筛选出其时间特征，从而提高故障分类的准确率。

Description

基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法

技术领域

本发明属于旋转机械故障识别技术领域，涉及滚动轴承故障识别，具体涉及基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法。

背景技术

滚动轴承作为旋转机械的核心部件，其健康状况将直接影响到旋转机械的性能、稳定性以及寿命。研究表明40％～50％的旋转机械故障都与滚动轴承失效有关，为保障旋转机械作业安全，对滚动轴承进行有效的故障诊断就显得意义重大。采用机器学习的智能故障诊断算法在滚动轴承故障诊断领域得到广泛运用。尽管这些方法已经取得了较好的效果，但机器学习算法一般结构较浅，从而限制了分类器在故障诊断问题中学习轴承信号中所包含的复杂非线性以及非平稳性关系的能力。

为解决这些问题，越来越多的深度学习模型应用在滚动轴承故障诊断领域。其中，卷积神经网络作为一种端到端的学习模型，极大地简化了故障诊断步骤，因此得到了广泛关注。由于卷积神经网络最本质的结构构想包括三个关键方面：局部连接、权值共享以及池化，这使得卷积神经网络更适合处理二维数据，其在计算机视觉领域尤其是在图像特征自动提取与图像分类识别中已经得到广泛运用并取得很好的效果。

因此，有学者将轴承振动信号转换为图像数据，进而使用二维卷积神经网络完成分类识别。Zhang等对轴承振动信号进行均分，再把分得的每一段信号按顺序作为图像矩阵的行，实现一维信号向二维图像的转换，最后通过卷积神经网络完成故障诊断(Zhang W，Peng G L,Li C H.Brearing Fault Diagnosis Based on Convolutional NeuralNetwork with 2-D Representation of Vibration Signals as Input[C].MATEC Web ofConferences,2017,95:13001)。张弘斌等采用连续小波变换提取轴承信号的时频特征，以此构建二维图像，并将三种相关联的图像融合在一起，输入至深度卷积神经网络以实现分类识别(张弘斌，袁奇，赵柄锡等.采用多通道样本和深度卷积神经网络的轴承故障诊断方法[J].西南交通大学学报,2020,54(8):1-10)。Hoang等将轴承信号的振幅进行归一化处理，并将其作为相应图像中所对应的像素值，得到各类信号的振动图像，之后同样由卷积神经网络通过对振动图像分类来识别轴承的故障状态(Hoang D T,Kang H J.Rolingelement bearing fault diagnosis using convlutionalneural network andvibration image[J].Cognitive Systems Research,2019,53:42-50)。以上模型通过图像转换，成功将滚动轴承故障诊断与二维卷积神经网络联系在一起，并取得了较满意的诊断结果。但诊断过程依然存在以下一些缺陷：由振动信号转换的二维图像多为灰度图像，包含的特征信息有限；同时，构建不同的二维图像并将之融合在一定程度上增加了图像转换的复杂性；另外轴承振动信号包含着对时间的依赖性，尤其是对于不同故障程度的振动信号，这种时间关系显得尤为重要。然而，传统卷积神经网络更多地是提取图像局部空间特征，难以将这种时间依赖特征提取出来，从而影响滚动轴承最终故障识别精度。

发明内容

本发明目的旨在针对传统卷积神经网络中二维图像包含特征信息有限以及难以有效识别图像特征对时间依赖性等技术现状，提供一种基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法，利用格拉姆角场方法将滚动轴承振动信号转换为囊括更丰富颜色特征信息的二维彩色图像，并提出基于二维卷积神经网络与双向门控循环单元相结合的诊断模型自动提取图像的空间特征与时间特征，最终实现滚动轴承故障的高精度识别。

本发明首先利用格拉姆角场(Gramian Angular Field，GAF)将滚动轴承振动信号转换成二维图像，再利用训练好的CNN-BiGRU诊断模型对滚动轴承振动信号进行识别，得出相应的故障类别。

本发明提供的基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法，包括以下步骤：

L1将接收的滚动轴承振动信号数据利用格拉姆场转换成二维图像；

L2将转换后的二维图像输入到训练好的CNN-BiGRU网络模型中，输出滚动轴承故障类别。

步骤L1中，将接收数据利用格拉姆场转换成二维图像的具体实现方式包括以下步骤：

L11将接收的滚动轴承振动信号数据进行归一化处理；

L12将归一化处理后的数据映射到极坐标系上；

L13依据映射到极坐标系上的数据通过格拉姆角场得到二维图像。

步骤L11中，将接收的数据按照公式(1)归一化到[-1,1]，或者按照公式(2)归一化到[0,1]：

式中，时间序列X＝{x₁,x₂,x₃,…,x_n}，表示滚动轴承振动信号样本，x_i表示样本中第i个滚动轴承振动信号，n表示样本中滚动轴承振动信号数量，max(X)表示样本中滚动轴承振动信号中的最大值，min(X)表示样本中滚动轴承振动信号中的最小值。

步骤L12中，按照以下公式对归一化处理后的数据进行编码，映射到极坐标系上：

式中，

表示归一化后的滚动轴承振动信号，取

表示归一化后的时间序列；t_i为x_i对应的时间戳，

表示时间戳时间戳集合，N是一个归一化因子，其将给定的单位圆半径区间[0,1]分成N等份，N与样本中滚动轴承振动信号数量n相等。由此得到N+1个分隔点{0,1,2,…,N}，舍弃第一个点0，将剩下N个点与时间序列数据关联起来，让其落在极坐标系中一个单位圆内。随着时间的增加，时间序列

会在极坐标系中编码成不同的角度与半径，并在这个单位圆内不断扭曲。

采用公式(3)的编码方式有两个重要的特性：①由于

所以φ_i∈[0,π]，而cosφ在φ_i∈[0,π]上是单调的；这就意味着当给定一段时间序列数据时，按照所提出的映射关系将在极坐标系中编码出一个唯一的映射结果，也就是具有双射关系；②与直角坐标系相反，极坐标系保持着绝对的时间相关性，通过不同间隔重新缩放的时间序列数据包含着不同的角度界限，这为在使用格拉姆角场将时间序列数据转换成图像数据时提供了不一样的信息粒度。

步骤L13中，可以将映射到极坐标系上的数据利用格拉姆角和场或格拉姆角差场得到二维图像。

所述格拉姆角和场的定义为：

所述格拉姆角和场的定义为：

式中，I为单位行向量[1,1,…,1]，

表示

的转置，

表示

转置。两个公式展示了从一维信号转换到二维图像的矩阵表示。利用格拉姆角场转换的优点包括：①提供了一种数据能够保持对时间依赖性的方法，从公式(4)和(5)可以看出，时间信息从矩阵的左上角一直运动到右下角；②以G(j,k)表示GASF或GADF第j行第k列对应的矩阵元素，G(j,k||j-k|＝l)表示了以l为时间间隔的叠加或是差异的时间相关性，主对角线G(j,j)作为l＝0时的特例，它包含了原始序列的完整信息。

步骤L2中，所述CNN-BiFRU网络模型包括顺次设置的一个及以上的卷积单元、双向门控制单元、全连接层和输出层。

所述卷积单元由卷积层和连接于其后的池化层组成，卷积层和池化层均采用常规CNN神经网络中的卷积层和池化层结构。卷积层通过卷积运算，学习输入图像的局部特征；池化层对输入的特征图进行下采样，去掉部分冗余信息。

所述双向门控制单元可以采用本领域已经披露的常规构成(Tao Q,Liu F,Li Y,et al.Air pollution forecasting using a deep learning model based on 1Dconvent and bidirectional GRU[J].IEEE Access,2019,7:76690-76698.)。本发明中，双向门控制单元包括两个常规的GRU和一个融合层，其中一个GRU对输入序列数据沿时间正序进行处理，另外一个GRU对输入序列数据沿时间逆序进行处理，然后将两个GRU的处理结果通过融合层进行合并得到双向门控制单元的输出结果。每个GRU层分别从正向和反向处理数据，确保模型不仅能由正序获得积聚依赖信息，而且也能从逆序获得来自未来的积聚依赖信息，保持对时间特征的敏感性，捕捉到可能被单向GRU忽略的特征信息，并进一步剔除冗余信息，达到丰富特征信息的目的。最终得到的特征信息包含有原始图像的空间特征与时间特征，将其展平后再送入全连接层。

所述全连接层采用的是Relu激活函数。全连接层用于对输入的数据进行重新整合并映射到样本标签空间。

所述输出层是利用softmax函数完成对故障的分类。

在优选实现方式中，所述CNN-BiGRU网络模型在各个池化层及GRU后都引入dropout层，使网络在运算过程中随机停止部分神经元参与工作，防止模型发生过拟合。

所述CNN-BiGRU网络模型的训练方法包括以下步骤：

S1将用于训练的滚动轴承振动信号数据利用格拉姆角场转换成二维图像，构建训练用二维图像数据；

S2将训练用二维图像数据输入到CNN-BiGRU网络模型；

S3判断CNN-BiGRU网络模型是否收敛，若模型收敛，即完成对CNN-BiGRU网络模型的训练；若模型不收敛，则进入步骤S4；

S4对CNN-BiGRU进行优化，然后返回步骤S2。

步骤S1中，将用于训练的滚动轴承振动信号数据利用格拉姆角场转换成二维图像的操作与步骤L1中的相同，这里不再详细介绍。所述训练用二维图像数据集进一步划分为训练集和验证集，在训练过程中利用验证集对训练结果进行验证，避免发生过拟合。

步骤S3中，本发明通过迭代次数是否超过阈值来判断模型是否收敛，当迭代次数超过阈值时，模型收敛，当迭代次数没有超过阈值时，迭代次数增加1，进入步骤S4。

步骤S4中，本发明采用Adam自适应优化算法对CNN-BiGRU网络模型参数进行优化。

与现有技术相比，本发明提供的基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法，具有如下十分突出的优点和有益技术效果：

1、本发明首先利用格拉姆角场将滚动轴承振动信号数据转换成二维图像，然后再利用CNN-BiGRU网络模型完成故障分类；利用格拉姆角场将滚动轴承振动信号数据转换成二维图像，不仅保留了原始信号的完整信息，而且保留了数据对时间的依赖性；而CNN-BiGRU网络模型中通过卷积单元实现对二维图像中空间特征的提取，进一步通过双向门控制单元筛选出其时间特征，从而提高故障分类的准确率。

2、本发明利用格拉姆角场将滚动轴承振动信号数据转换成二维图像，由于利用极坐标系能够实现滚动轴承振动信号序列与极坐标的唯一映射关系，也即具有双射关系，从而保留原始完整信号。

3、本发明利用格拉姆角场将滚动轴承振动信号数据转换成二维图像，由于极坐标保持着绝对的时间相关性，能够为图像转换提供相应的信息粒度，包含的信息越丰富，从而越有利于卷积神经网络从中提取特征。

4、本发明CNN-BiGRU网络模型通过双向门控制单元能够同时实现对正向序列数据和逆向序列数据的同时处理，进而能够捕获更多与时间特征相关的信息数据，提升CNN-BiGRU网络模型特征提取能力，进而有助于提高模型分类准确率。

附图说明

图1为本发明CNN-BiGRU网络模型结构原理图。

图2为双向门控制单元工作原理示意图。

图3为本发明CNN-BiGRU网络模型训练流程示意图。

图4为本发明CNN-BiGRU网络模型训练过程中利用格拉姆角场转换图像流程示意图。

图5为本发明实施例1中CNN-BiGRU网络模型训练过程中利用格拉姆角场转换得到的二维图像示意图；其中(a)对应正常滚动轴承，(b)对应内圈轻度损伤故障的滚动轴承，(c)对应内圈重度损伤故障的滚动轴承，(d)对应内圈重度损伤故障的滚动轴承。

图6为本发明实施例1中CNN-BiGRU网络模型训练过程中精度和损失值变化曲线；其中，(a)训练集和验证集对应的精度随迭代次数的变化曲线，(b)训练集和验证集对应的损失值随迭代次数的变化曲线。

图7为本发明实施例1中利用训练好的CNN-BiGRU网络模型对测试集中数据进行滚动轴承故障识别得到的混淆矩阵。

图8为本发明实施例1中不同识别模型对测试集中数据进行滚动轴承故障识别的测试准确率对比示意图。

图9为本发明实施例1中不同识别模型对测试集中数据提取的图像特征可视化图；其中(a)对应DNN网络模型，(b)对应CNN网络模型，(c)对应CNN-BiGRU网络模型。

具体实施方式

以下将结合附图给出本发明实施例，并通过实施例对本发明的技术方案进行进一步的清楚、完整说明。显然，所述实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明内容，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例，都属于本发明所保护的范围。

以下实施例和应用例使用的实验数据为美国凯斯西储大学(CWRU)的开放滚动轴承故障振动信号(W.A.Smith,R.B.Randall.Rolling element bearing diagnosticsusing the Case Western Reserve University data:a benchmark study[J].Mechanical Systems and Signal Processing,2015,64-65:100-131.)

以下实施例中使用的CNN-BiGRU网络模型，如图1所示，其包括顺次设置的四个卷积单元、双向门控制单元、全连接层和输出层。

每个卷积单元结构相同，均由卷积层和连接于其后的池化层组成，卷积层和池化层均采用常规CNN神经网络中的卷积层和池化层结构(Verstraete D,Ferrada A,DroguettE L,et al.Deep learning enabled fault diagnosis using time-frequency imageanalysis of rolling element bearings[J].Shock and Vibration,2017)。卷积层通过卷积运算，学习输入图像的局部特征；第一个卷积单元中卷积层的核大小为(32,3,3)，后面三个卷积单元中卷积层的核大小为(64,3,3)。池化层对输入的特征图进行下采样，去掉部分冗余信息，池化层的池化窗口大小均为(2,2)的最大值池化、均值池化或随机池化等。

双向门控制单元采用本领域已经披露的常规构成(Tao Q,Liu F,Li Y,et al.Airpollution forecasting using a deep learning model based on 1D convent andbidirectional GRU[J].IEEE Access,2019,7:76690-76698.)。如图2所示，双向门控制单元包括两个常规的GRU(Tao Q,Liu F,Li Y,et al.Air pollution forecasting using adeep learning model based on 1D convnets and bidirectional GRU[J].IEEEAccess,2019,7:76690–76698)和一个融合层，其中一个GRU对输入序列数据沿时间正序进行处理，另外一个GRU对输入序列数据沿时间逆序进行处理，然后将两个GRU的处理结果通过融合层将各自的输出合并在一起得到双向门控制单元的输出结果。

全连接层采用的是Relu激活函数，神经元个数为128。全连接层用于对输入的数据进行重新整合并映射到样本标签空间。

输出层是利用softmax函数完成对故障的分类。

上述CNN-BiGRU网络模型在各个池化层及GRU特征学习阶段后都引入dropout层，使网络在运算过程中随机停止部分神经元参与工作，防止模型发生过拟合。

实施例1

本实施例以内圈故障数据来对本发明提供的基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法进行详细解释。

本实施例选取12kHz采样频率下，驱动端轴承的同一故障位置的三种损伤直径(轻度0.007inch、中度0.014inch以及重度0.021inch)的振动信号和正常振动信号作为研究对象，按照一个样本长度为864个采样点，进行数据划分。为了获取足够训练用的数据，先将采集数据集中的数据采用重叠样本的方式对数据进行增强处理，以扩大训练用样本数量，即在对振动信号划分样本时，每一段信号与其后一段信号有部分重叠，这样既保证了对信号的充分利用，也进一步地扩充了样本的数量。通过该方式一共得到4000个样本数据，构成原始数据集。

本实施例中将原始数据中以2400个样本数据用于模型训练，构成训练集；以800个样本数据用于模型验证，构成验证集；训练集和验证集中的数据构成用于CNN-BiGRU网络模型训练的滚动轴承振动信号数据；剩余800个样本数据用于模型测试，构成测试集。

如图3及图4所示，本实施例首先利用训练集和验证集构成的用于CNN-BiGRU网络模型训练的滚动轴承振动信号数据对CNN-BiGRU网络模型进行训练，具体训练过程包括以下步骤：

S1将用于训练的滚动轴承振动信号数据利用格拉姆角场转换成二维图像，构建训练用二维图像数据，包括以下分步骤：

S11将用于训练的滚动轴承振动信号数据按照公式(1)归一化到[-1,1]：

式中，时间序列X＝{x₁,x₂,x₃,…,x_n}，表示用于训练的滚动轴承振动信号样本，这里指的是训练集和验证集中的数据，x_i表示样本中第i个滚动轴承振动信号，n表示样本中滚动轴承振动信号数量，max(X)表示样本中滚动轴承振动信号中的最大值，min(X)表示样本中滚动轴承振动信号中的最小值。

S12将归一化处理后的数据映射到极坐标系上。

本步骤中，按照以下公式对归一化处理后的数据进行编码，映射到极坐标系上：

式中，

表示归一化后的滚动轴承振动信号，取

表示归一化后的时间序列；t_i为x_i对应的时间戳，

S13依据映射到极坐标系上的数据通过格拉姆角场得到二维图像。

本实施例采用格拉姆角差场(GADF)，按照定义式(5)将映射到极坐标上的数据转换成二维图像，并将生成的二维图像的像素分辨率设置为100×100。

将四种状态图像样本分别取一张作为展示，如图5所示，其中左侧为振动信号时域波形图，有侧为转换的二维图像，且对应图像为信号的唯一转化结果，体现了二者之间的双射关系。从图中可以看出每类图片相同位置的深浅以及纹理形状都有着较大的差异，这是因为不同振动信号的幅值在时间上的依赖关系不一样，当轴承存在故障时，测得的振动数据表现出明显的冲击性，而正常轴承的信号就相对随机，只有轻微冲击性，这就导致每类轴承振动信号所转换的图片彼此之间都有较明显的区别，为做图像识别在方法上提供了可能性。

S2将训练用二维图像数据输入到CNN-BiGRU网络模型。

首先将设置的CNN-BiGRU网络模型进行初始化。本实施例中，设置CNN-BiGRU网络模型的模型参数w初始值，损失函数使用categorical_crossentropy函数，一次训练选择的样本数量batch_size为40，迭代次数阈值为64。

本实施例中，在将训练集中二维图像数据输入网络训练之前，先对图像数据进行归一化处理，即将所有图像乘以1/255缩放，然后输入CNN-BiGRU网络模型，利用损失函数得到损失值L。

S3判断CNN-BiGRU网络模型是否收敛，若模型收敛，即完成对CNN-BiGRU网络模型的训练；若模型不收敛，则进入步骤S4。

本实施例中，依据迭代次数判断模型是否收敛，若迭代次数没有达到设定迭代次数阈值，则迭代次数增加1后进入步骤S4，直至迭代次数达到其阈值。

S4对CNN-BiGRU网络模型进行优化，返回步骤S2。

本实施例采用Adam自适应优化算法对CNN-BiGRU网络模型参数进行优化，其学习率设置为0.001。

依据得到的损失值L，对模型参数w的优化过程为：

其中，第一项表示损失函数对系统中的参数w求导取得梯度，第二项表示利用Adam和梯度来对参数w进行优化更新，lr表示系统训练过程中的学习率，设置为0.001。

本实施中，随着训练迭代次数的增长，模型不断学习，其训练过程如图6所示，为了减少噪声的影响，使图像更具可读性，将每个精度和损失值都替换为指数移动平均值，从而使得曲线变得更为平滑。从图中可以看出，模型训练至20次迭代后，准确率和损失值逐渐趋于平稳，说明模型从训练集中已经学习到较好的规则。

在训练过程中，同时利用验证集中数据(同样需要对图像数据进行归一化处理)对训练的模型进行验证。结果如图6所示，训练曲线紧紧跟随验证曲线表明模型没有发生过拟合。

进一步利用训练好的CNN-BiGRU网络模型对测试集数据进行故障分类，以验证本发明的基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法的分类效果。

利用训练好的CNN-BiGRU网络模型按照以下步骤对测试集数据进行滚动轴承故障识别：

L1将测试集的滚动轴承振动信号数据利用格拉姆角场转换成二维图像，包括以下分步骤：

L11将测试集的滚动轴承振动信号数据按照公式(1)归一化到[-1,1]，或者按照公式(2)归一化到[0,1]：

式中，时间序列X＝{x₁,x₂,x₃,…,x_n}，表示测试集的滚动轴承振动信号样本，x_i表示样本中第i个滚动轴承振动信号，n表示样本中滚动轴承振动信号数量，max(X)表示样本中滚动轴承振动信号中的最大值，min(X)表示样本中滚动轴承振动信号中的最小值。

L12将归一化处理后的数据映射到极坐标系上；

式中，

表示归一化后的滚动轴承振动信号，取

表示归一化后的时间序列；t_i为x_i对应的时间戳，

L2将转换后的二维图像输入到训练好的CNN-BiGRU网络模型，输出滚动轴承故障类别。

本实施例中，在将测试集中二维图像数据输入网络训练之前，先对图像数据进行归一化处理，即将所有图像乘以1/255缩放，然后输入CNN-BiGRU网络模型。

通过对测试集的识别分类，得到的混淆矩阵如图7所示，图中横纵坐标的数字0～3分别表示试验轴承振动信号的类型(0表示正常，1表示内圈轻度损伤，2表示内圈中度损伤，3表示内圈重度损伤)，矩阵的对角线代表着每类状态的识别准确率。从图中可以看出，对于正常状态、内圈损伤轻度损伤状态以及内圈重度损伤状态的轴承，模型完全识别正确，即达到100％的准确率，而对于内圈中度损伤状态的轴承模型也能保证较高的识别准确率，只有极少数样本被误判到内圈重度损伤故障状态。实验的总准确率达到99.63％，表明本发明提供的基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法的可行性。

为了进一步验证本发明提供的基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法的有效性，将本方法与常见的深度学习算法CNN与深度神经网络(Deep Neural Network,DNN)以及支持向量机(Support Vector Machine,SVM)进行对比分析。在实验中，CNN的结构与CNN-BiGRU类似，CNN将CNN-BiGRU的门控循环单元替换为一层全连接层，并在该层使用dropout机制防止过拟合。除此之外，CNN的参数与CNN-BiGRU完全一致。而搭建的DNN网络主要包含两个隐藏层，其神经元个数分别设置为128与64，同时也在每层隐藏层中使用dropout来防止模型发生过拟合。由于SVM为浅层结构，这里首先提取图像的HOG(Histogramof Oriented Gradient,方向梯度直方图)特征，再利用SVM进行分类(参见朱梓倩，刘蓉，付瑜，等.基于振动云图HOG和SVM的变压器绕组松动故障诊断方法[J].高压电器,2019,55(11):227-231.)。

每个模型使用相同的训练集、验证集和测试集进行实验，实验的最终结果如图8所示。从图中可以看出三种深度学习方法的识别准确率都达到96％以上，远远高于SVM的识别准确率。这表明了深度学习方法在故障诊断领域有着极强的识别能力，同时也说明了本发明转换得到的图像集的可用性。而且，本发明提供的CNN-BiGRU模型的准确率比CNN与DNN都有所提高，表明本发明提出的滚动轴承故障识别方法具有更优越的效果。

为了验证本发明提出方法的特征提取能力，利用t-SNE降维技术(参见MAATEN L,HINTON G.Visualizing data using t-SNE[J].Journal of Machine LearningResearch,2008,9:2579)，将CNN、DNN与本文提出模型的全连接层提取到的图像特征进行二维平面可视化，如图9所示。从图中可以看出三种方法对图像数据都有着高效的特征提取性能，代表每种故障类型的故障特征在空间具有明显的可分性。但在空间聚簇性上，CNN-BiGRU明显优于CNN与DNN。比如代表内圈轻度损伤的特征在CNN与DNN的特征空间中分布在了不同的空间位置，而在CNN-BiGRU的特征空间中分布在了相似的空间位置；代表内圈重度损伤的特征也在CNN-BiGRU的特征空间中表现出更密集的聚簇性。这进一步提升了本文提出模型对于滚动轴承故障类别的识别精度。

实施例2

为了更进一步地验证本发明提供的基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法的可行性，本实施例进一步选取12kHz采样频率下，驱动端轴承同三种不同故障位置(内圈、滚动体和外圈)且同一故障程度(损伤直径为0.014inch)的振动信号与正常振动信号作为研究对象。按照实施例1相同的数据处理方法得到用于模型训练的训练集、验证集和测试集。然后按照实施例1提供步骤S1-S4的训练方法训练CNN-BiGRU网络模型。

再利用训练好的CNN-BiGRU网络模型按照实施例1中步骤L1-L2相同的识别方法对测试集数据进行滚动轴承故障识别。并利用相同的数据集通过常见的深度学习算法CNN与深度神经网络(Deep Neural Network,DNN)以及支持向量机(Support Vector Machine,SVM)进行训练和测试，具体操作过程见实施例1。

本实施例与其它方法的对比实验结果如表1所示，从表中可以看出CNN-BiGRU的准确率明显优于CNN与DNN以及SVM，这样进一步表明本发明提出滚动轴承故障识别方法拥有更好的识别稳定性，其对于滚动体损伤状态的轴承模型的识别准确率最低，这也与工程实际情况一致，而其它位置的识别率都能达到100％，测试集最终的识别总准确率达到99.28％。

表1不同网络模型故障识别结果

本发明通过格拉姆角场方法将滚动轴承振动信号转换为二维图像数据，在不丢失原始数据信息的前提下，保留了信号对于时间的依赖性。在此基础上，提出基于CNN-BiGRU网络的分类模型，利用CNN对于图像强大的自动提取特征能力提取关于图像的空间特征，再由BiGRU进一步筛选其时间特征，最终由分类器实现模式识别。上述实施例证明，本发明所使用的基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法对于滚动轴承不同故障程度以及不同故障位置的振动信号识别都取得了较好的效果，准确率均优于常见的深度学习算法与机器学习算法。通过特征可视化对比分析，本发明提出的CNN-BiGRU网络模型拥有更好特征提取能力，因此其故障识别准确率更高。因此，本文所提出的基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法对于滚动轴承故障模式识别有极高的实用价值，为智能故障诊断提供了一个可行的方案。

Claims

1.一种基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法，其特征在于包括以下步骤：

L1将接收的滚动轴承振动信号数据利用格拉姆场转换成二维图像；该步骤包括以下分步骤：

L11将接收的滚动轴承振动信号数据进行归一化处理；

将接收的数据按照公式(1)归一化到[-1,1]：

式中，时间序列X＝{x₁,x₂,x₃,…,x_n}，表示滚动轴承振动信号样本，x_i表示样本中第i个滚动轴承振动信号，n表示样本中滚动轴承振动信号数量，max(X)表示样本中滚动轴承振动信号中的最大值，min(X)表示样本中滚动轴承振动信号中的最小值；

L12将归一化处理后的数据映射到极坐标系上；

按照以下公式对归一化处理后的数据进行编码，映射到极坐标系上：

式中，

表示归一化后的滚动轴承振动信号，取

表示归一化后的时间序列；t_i为x_i对应的时间戳，

表示时间戳集合，N是一个归一化因子，其将给定的单位圆半径区间[0,1]分成N等份，N与样本中滚动轴承振动信号数量n相等；

L13依据映射到极坐标系上的数据通过格拉姆角场得到二维图像；

2.根据权利要求1所述基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法，其特征在于步骤L13中，将映射到极坐标系上的数据利用格拉姆角和场或格拉姆角差场得到二维图像。

3.根据权利要求2所述基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法，其特征在于所述格拉姆角和场的定义为：

所述格拉姆角差场的定义为：

式中，I为单位行向量[1，1，…，1]，

表示

的转置，

表示

的转置。

4.根据权利要求1所述基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法，其特征在于所述CNN-BiGRU网络模型包括顺次设置的一个及以上的卷积单元、双向门控制单元、全连接层和输出层。

5.根据权利要求4所述基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法，其特征在于所述双向门控制单元包括两个常规的GRU和一个融合层，其中一个GRU对输入序列数据沿时间正序进行处理，另外一个GRU对输入序列数据沿时间逆序进行处理，然后将两个GRU的处理结果通过融合层进行合并得到双向门控制单元的输出结果。

6.根据权利要求4或5所述基于GAF-CNN-BiGRU网络的滚动轴承故障识别方法，其特征在于所述CNN-BiGRU网络模型的训练方法包括以下步骤：

S2将训练用二维图像数据输入到CNN-BiGRU网络模型；

S4对CNN-BiGRU进行优化，然后返回步骤S2。