CN113155464B

CN113155464B - 面向轴承故障识别的cnn模型可视化优化方法

Info

Publication number: CN113155464B
Application number: CN202110351265.6A
Authority: CN
Inventors: 陈晓玲; 杨远翔; 谢平; 刘影; 董晓娇; 程生翠; 江国乾; 武鑫
Original assignee: Yanshan University
Current assignee: Yanshan University
Priority date: 2021-03-31
Filing date: 2021-03-31
Publication date: 2022-03-18
Anticipated expiration: 2041-03-31
Also published as: CN113155464A

Abstract

本发明提供一种面向轴承故障识别的CNN模型可视化优化方法，具体实施步骤如下：首先，使用轴承故障试验台的振动加速度传感器采集测试轴承的不同状态下驱动端和风扇端的高频振动加速度信号数据；然后，对轴承振动加速度信号数据做预处理，并划分为训练集、测试集和验证集；接着，搭建轴承故障识别CNN模型，并初始化，将样本图像与标签作为训练样本来训练完整的卷积神经网络模型，并记录完整的卷积神经网络模型中各层相关参数和超参数信息；最后，将轴承故障识别CNN模型可视化，并对可视化模型结果进行分析评估，并依照优化方法优化模型结构。本发明使用了三种可视化的方法，同时得到了基于可视化的参数优化方法和基于可视化判断网络模型的方法。

Description

面向轴承故障识别的CNN模型可视化优化方法

技术领域

本发明涉及轴承故障诊断及人工智能研究领域，特别涉及一种面向轴承故障识别的CNN模型可视化优化方法。

背景技术

近年来，深度学习技术获得飞速发展，卷积神经网络(Convolutional NeuralNetworks，简称CNN)作为具有重要地位的深度学习模型，在图像检测和识别、分类等领域已经取得了大量重要的成果。然而，CNN备受青睐的同时，也存在许多悬而未决难题，其中一个重要的难题就是深度学习模型的可解释性。研究可解释性的目的是希望能够阐述深度学习的运行机理、并探究深度学习模型可靠性的解释，进而寻找指导修改网络的方法，对已训练网络存在的缺陷进行检测与修复。

目前，CNN模型在可解释性研究上主要采用可视化技术，这是由CNN本身基于图像处理开发的模型特点所决定的。可视化技术目前分为两大类，一类是非参数化的方法：使用反卷积的方法对其求解出最大激活响应图像；另一类方法则着重分析卷积核中的参数，使用激活层数据和参数重构图像。

然而，传统CNN模型可视化研究的问题主要包括以下两点：第一，可视化的CNN模型训练对象往往都是具体对象，如：猫、狗、人脸、汽车等，缺少以振动信号图像的训练对象可视化研究；第二，可视化后的解释与优化方法通常与训练对象的属性特点有很强的相关性，具体对象的分析结果和优化方法通常并不适用。

为了解决以上问题，本发明将可视化优化方法运用于轴承故障识别的CNN模型中，并针对轴承故障振动信号图像进行可视化研究，最终提出了一种面向轴承故障识别的CNN模型可视化优化方法。

发明内容

针对现有技术存在的问题，本发明提供一种面向轴承故障识别的CNN模型可视化优化方法，主要将可视化优化方法运用于轴承故障识别的CNN模型中，得到了基于可视化的参数优化方法和基于可视化判断网络模型的方法，并依据该优化方法将分类失败的模型成功调整为分类准确率为99％以上的模型。

本发明提供了一种面向轴承故障识别的CNN模型可视化优化方法，具体实施步骤如下：

S1、将轴承故障试验台的振动加速度传感器用磁性底座粘到电机壳体的驱动端和风扇端的第一位置，通过振动加速度传感器采集测试轴承在不同状态下，电机壳体的驱动端和风扇端的振动加速度信号数据；

S2、对步骤S1采集的轴承振动加速度信号数据做预处理，并划分为训练集、测试集和验证集；

S21、对步骤S1采集的轴承振动加速度信号数据在用于训练模型的轴承故障数据的总体上进行归一化；

S22、通过时间随机映射与分布映射函数在轴承振动加速度信号数据的时间序列指标集上生成伪随机数，将该伪随机数作为后续图像分割的初始点；

S23、设计一个防止样本重复度过高的过滤器，对步骤S22获得的轴承振动加速度信号数据样本进行过滤筛选；

S24、将步骤S23得到的过滤筛选样本，通过相关程序将样本的一维时间序列转化为二维时间序列图像；

S25、通过灰度图像的阈值进行像素选择，将步骤S24得到的图像转换为灰度图像；

S26、按7:2:1的比例将步骤S25得到的轴承振动加速度信号数据的图像划分为训练集、测试集和验证集，并为每个数据集配上相应的标签；

S3、搭建轴承故障识别CNN模型，并初始化，将样本图像与标签作为训练样本来训练完整的卷积神经网络模型，并记录完整的卷积神经网络模型中各层相关参数和超参数信息；

S31、构建单层卷积神经网络的结构：

S311、设输入图像为x_ij和滤波器为f_pq，得卷积层的二维卷积表达式为：

式中，x_ij为输入图像(矩阵)，y_ij为输出多维向量，i与j均为像素位置坐标，坐标以图像左上角为原点，向右为正且为坐标第一元，向下为正且为坐标第二元建立，坐标范围为1≤i≤M，1≤j≤N；f_pq为滤波器，p与q均为滤波器的元素位置坐标，坐标以图像左上角为原点，向右为正且为坐标第一元，向下为正且为坐标第二元建立，坐标范围为1≤p≤m，1≤q≤n，通常情况下m，n都远远小于M，N；

S312、首先将r-1层的输入与r层卷积核进行卷积运算，然后将r层输出的卷积结果加上偏置b经过激活函数F进行激活，最后再进行池化运算，具体表达式如下：

式中，

代表卷积运算，w^(k)是第k层卷积核的权重参数，b为偏置，a^(k-1)为第k-1层单层卷积神经网络输出；

S32、将S31中构建的单层卷积神经网络进行堆叠，构成四层卷积神经网络，并在底层接入一层全连接层与一层最大平滑层(softmax层)，构成完整的卷积神经网络模型；

S33、利用反向传播算法(Backpropagation Algorithm，简称BP算法)对步骤S32得到的完整的卷积神经网络模型进行训练，得到深度学习模型：

S331、将输入数据从完整的卷积神经网络模型的输入层进入，经过模型映射至输出层，并将结果输出；

S332、定义一个具有真实分类标签和模型预测结果差异量化函数的损失函数，损失函数的值越小，表明预测值与真实值的差异越小，具体表达式为：

式中，y是该样本的真实类标，

是模型的预测结果；

S333、使用Mini-batch(下采样小样本批次)随机梯度下降方法对完整的卷积神经网络模型的参数进行更新，对于完整的卷积神经网络中第k层参数的具体表达式为：

W^(k)，b^(k) (4)

式中，W^(k)是第k层卷积核的权重参数矩阵，是卷积核中的所有权重的集合，b^(k)为第k层偏置，是一个可训练的常数；

求取损失函数对完整的卷积神经网络模型中第k层参数的偏导数，具体表达式为：

式中，

为完整的卷积神经网络模型损失函数，W^(k)是第k层卷积核的权重参数矩阵，是卷积核中的所有权重的集合，b^(k)为第k层偏置；

对于完整的卷积神经网络中第k层的输出如式(2)所示，由链式法则得如下公式：

式中，

为完整的卷积神经网络模型损失函数，W^(k)是第k层卷积核的权重参数矩阵，是卷积核中的所有权重的集合，b^(k)为第k层偏置，a^(k)为第k层单层卷积神经网络输出；

通过公式(6)和(7)，完整的卷积神经网络模型从输出层到输入层逐层依次进行参数更新，参数会随着每一次训练更新，直到达成终止条件；

根据上述分析，损失函数由交叉熵构成，损失函数的具体表达式如下：

式中，y_n为第n个样本的实际状态，

是模型的预测状态，θ为模型训练参数，是式(4)或者其他可训练参数；

S34、在每一次进行步骤S33之前，使用dropout算法将步骤S32中得到的卷积神经网络按一定比例随机忽略部分卷积核w^(k)和偏置b^(k)，被忽略的卷积核将不参与这一次S33中的参数训练过程；

S35、当训练结果达到提前终止条件，则结束训练；否则，运行至指定训练次数后终止训练；

S36、记录每次训练过程中各层相关参数和超参数的信息；

S4、将轴承故障识别CNN模型可视化，并对可视化模型结果进行分析评估，并依照优化方法优化模型结构；

S41、将完整的卷积神经网络模型中各层网络的权重w^(k)与偏置b^(k)通过油液采样法对网络进行采样统计；

S42、通过对完整的卷积神经网络模型的4维张量进行切片重构，使完整的卷积神经网络模型中激活层展示为常见的灰度图像；

S43、对步骤S33得到的深度学习模型进行求逆，并将训练得到的深度学习模型的输出作为反卷积模型的输入，得到原学习模型的输入数据，整体反卷积网络将根据原卷积网络结构反向重建，单层反卷积网络构建过程具体如下：

反卷积网络的卷积核是原网络卷积核的转置，具体公式如下：

W_re＝W^T (9)

式中，W是卷积网络卷积核权重；

反激活函数为原激活函数的反函数，公式如下：

F_re＝F^-1 (10)

式中，F为式(2)中的激活函数；

将原网络的第r层的结果进行反向池化，逆激活函数激活，与反卷积核进行卷积得到r-1层结果；

S44、对完整的卷积神经网络模型进行可视化分析评估和优化。

可优选的是，步骤2中轴承振动加速度信号数据做预处理的流程包括：全局归一化、随机初始点截取、移除高重复度样本、时间序列图像化、图像灰度化、灰度二值化和图像尺寸规整。

可优选的是，步骤S25中灰度图像的灰度范围为0到255，通过转换为二值灰度图像，从而将原有图像的尺寸放缩为正方形。

可优选的是，在步骤S31中，单层卷积神经网络，其包括卷积层、激活层和池化层，并按序依次排列。

可优选的是，在步骤S36中，所述相关参数包括：各个层的激活层输出结果、卷积核的权重、偏置和最大池化位置；所述超参数包括：各层卷积核个数、卷积核尺寸、卷积方式、激活函数类型和网络输出结果尺寸。

可优选的是，在步骤S4中，模型的可视化，其包括参数可视化、激活层可视化和反卷积可视化，所述反卷积可视化的方法由原卷积网络参数与超参数决定。

可优选的是，步骤S44的优化方法分为两种：第一种是通过调整完整的卷积神经网络模型的结构参数，寻找合适的结构，从而找到训练成本与训练效果之间的平衡点；第二种是根据轴承故障振动时间序列图像中的波形和条纹信息，强化目标图像与背景之间的对比度；同时当进行更加复杂的分类任务时，利用局部采集和复合输入的方式或者更深层次的网络，增加输入步骤3中神经网络的特征和细节，为神经网络的分类提供更多的分类依据。

可优选的是，所述Mini-batch随机梯度下降方法是随机梯度下降(SGD)和批量梯度下降(BGD)的折中，其中参数θ的迭代方式如下：

式中，l(θ_t；x⁽ⁱ⁾，y⁽ⁱ⁾)是网络的损失函数，x⁽ⁱ⁾，y⁽ⁱ⁾为样本。

本发明与现有技术相比，具有如下优点：

1.本发明使用了三种可视化的方法，包括对网络的参数，特征图进行了直接可视化，对深层特征图像进行反卷积可视化。

2.本发明在神经网络训练阶段，得到了基于可视化的参数优化方法和基于可视化判断网络模型的方法。

3.本发明对所学习到的特征的真实本质理解上十分局限、数据处理严重影响训练效果、边界轮廓表现能力匮乏、网络超参数选择意义不明等做出了一定解释，并依据该优化方法将分类失败的模型成功调整为分类准确率为99％以上的模型。

附图说明

图1为本发明面向轴承故障识别的CNN模型可视化优化方法的工作流程图；

图2a为本发明面向轴承故障识别的CNN模型可视化优化方法重振动信号预处理前时域波形图；

图2b为本发明面向轴承故障识别的CNN模型可视化优化方法重振动信号预处理后时域波形图；

图3为本发明面向轴承故障识别的CNN模型可视化优化方法的整体卷积神经网络结构图；

图4为本发明面向轴承故障识别的CNN模型可视化优化方法卷积神经网络的结构；

图5a为本发明面向轴承故障识别的CNN模型可视化优化方法轴承故障识别CNN系统图像扭曲示意图；

图5b为本发明面向轴承故障识别的CNN模型可视化优化方法轴承故障识别CNN系统劣质选择示意图；

图5c为本发明面向轴承故障识别的CNN模型可视化优化方法轴承故障识别CNN系统黑色图像示意图；

图5d为本发明面向轴承故障识别的CNN模型可视化优化方法轴承故障识别CNN系统残缺图像示意图；

图6为本发明面向轴承故障识别的CNN模型可视化优化方法应用优化方法前后准确率曲线图。

具体实施方式

为详尽本发明之技术内容、结构特征、所达成目的及功效，以下将结合说明书附图进行详细说明。

如图1所示，本发明是这样实现的：

S1、使用轴承故障试验台的振动加速度传感器采集测试轴承的不同状态下驱动端和风扇端的高频振动加速度信号数据；

S2、对轴承振动加速度信号数据做预处理，并划分为训练集、测试集和验证集；

S3、搭建轴承故障识别CNN模型，并初始化，将样本图像与标签作为训练样本来训练完整的卷积神经网络模型，并记录完整的卷积神经网络模型中各层相关参数和超参数信息，用于可视化模型；

S4、将轴承故障识别CNN模型可视化，并对可视化模型结果进行分析评估，并依照优化方法优化模型结构。

本发明方法，其包括原始信号预处理、搭建与初始化轴承识别CNN系统、CNN计算和可视化分析模块。

在本发明的一个优选实施方式中，本发明的面向轴承故障识别的CNN模型可视化优化方法，如图1所示，具体实施步骤如下：

步骤中的轴承振动故障数据来自Bearing Data Center(轴承数据中心)，该数据是通过加速度传感器来收集振动数据的。

S2、对步骤S1采集的轴承振动加速度信号数据做预处理，预处理结果如图2所示，并划分为训练集、测试集和验证集；

S22、为了截取轴承振动加速度信号数据片段作为输入，需要选择片段时间初始点，使用时间随机映射与分布映射函数在轴承振动加速度信号数据时间序列指标集上生成伪随机数，将该伪随机数作为图像分割的初始点；

S26、按7:2:1的比例将步骤S25得到的轴承振动加速度信号数据的图像划分为训练集、测试集和验证集，并为每个数据集配上相应的标签。

步骤2中轴承振动加速度信号数据做预处理的流程包括：全局归一化、随机初始点截取、移除高重复度样本、时间序列图像化、图像灰度化、灰度二值化和图像尺寸规整。

S3、将步骤S2得到的轴承振动故障信号数据的图像输入到本步骤中，来搭建轴承故障识别CNN模型，并初始化，将样本图像与标签作为训练样本来训练完整的卷积神经网络模型，并记录完整的卷积神经网络模型中各层相关参数和超参数信息。

S31、本模型由四个单层卷积神经网络、一个全连接层和一个softmax层构成。搭建的轴承故障识别CNN模型包含卷积层、池化层、激活层、全连接层和softmax层等层级单元组件，其中，卷积层、激活层、池化层按序排列构成单层卷积神经网络。构建单层卷积神经网络结构的具体步骤如下：

S311、设输入图像为x_ij和滤波器为f_pq，可得卷积层的二维卷积表达式为：

式中，

S33、利用反向传播算法(Backpropagation Algorithm，简称BP算法)对步骤S32得到的完整的卷积神经网络模型进行训练，得到深度学习模型。反向传播算法分为前向传播和反向传播过程，前向传播环节的工作是输入数据从输入层进入，经过模型映射至输出层的输出结果的过程；反向传播过程是模型训练的核心，本质是建立输入输出间的映射关系模型，通过不断训练迭代模型参数的方法，达到建立模型的目的：

式中，y是该样本的真实类标，

是模型的预测结果；

S333、因为深度学习模型的损失函数大多数为多变量高维实值函数，无法直接求最优解甚至不存在最优解，故需采用数值方法求损失函数的最小值；模型更新的实质是通过调整模型中的参数使得损失函数中的预测结果与真实结果差异尽量小，某参数值的增加或者减少需要从损失函数对该参数的梯度中得到。所以使用Mini-batch(下采样小样本批次)随机梯度下降方法对完整的卷积神经网络模型的参数进行更新，对于完整的卷积神经网络中第k层参数的具体表达式为：

W^(k)，b^(k) (4)

式中，

对于完整的卷积神经网络中第k层的输出如式(2)所示，由链式法则可得如下公式：

式中，

式中，y_n为第n个样本的实际状态，

是模型的预测状态，θ为模型训练参数，可以是式(4)或者其他可训练参数；

S34、由于深度学习模型常常因为其强大的函数拟合能力，产生过拟合问题。为防止过拟合问题，模型使用dropout算法进行随机丢弃。在每一次进行步骤S33之前，使用dropout算法将步骤S32中得到的卷积神经网络按一定比例随机忽略部分卷积核w^(k)和偏置b^(k)，被忽略的卷积核将不参与这一次S33中的参数训练过程；

S36、记录每次训练过程中各层相关参数和超参数的信息；

进一步地，步骤S312中的卷积核常为奇数长度的实值矩阵，卷积运算的实质是输入数据某位置的值与卷积核矩阵中某位置的值相乘，再根据某些运算法则构建输出结果，本模型采用乘积值全部相加作为卷积结果。

激活函数通常为一个不饱和非线性的函数，在本发明方法中使用ReLu函数，函数公式如下：

进行二维卷积运算，需考虑两个因素：为了维持卷积后的图像尺寸，需要对图像的尺寸进行填充，在本模型中选择向四周填充，填充后图像尺寸由卷积核尺寸与填充方式确定；对于图像的卷积，还需要考虑卷积遍历方式，选择卷积核f_pq遍历方式，使得卷积核能作用于整个图像。

在进行卷积运算和激活运算后，进行池化运算，本发明步骤S312中池化运算使用的是最大池化方法，具体为选定一定尺寸的区域，图像中该区域的最大值作为池化输出。同样的，池化运算也需要对整个图像进行遍历，在模型中选择与卷积方式相同。池化运算可以有效缩小图像，减少计算量。

W_re＝W^T (10)

式中，W是卷积网络卷积核权重；

反激活函数为原激活函数的反函数，公式如下：

F_re＝F^-1 (11)

式中，F为式(2)中的激活函数；

将原网络的第r层的结果进行反向池化，逆激活函数激活，与反卷积核进行卷积得到r-1层结果。需要注意的是，反卷积是由小尺寸向大尺寸映射的过程，反卷积结果不唯一，需要指定确定的卷积结果尺寸与卷积游走方法。反卷积方法由原卷积网络参数与超参数决定。

反卷积可视化是为了解决卷积神经网络面临超参数无法自动调整，严重依赖人工调整甚至只能随机调整的问题；通过反卷积可视化，可以得到超参数的调整方法，反卷积可视化依赖于反卷积网络进行实现，该方法其本质是找到模型输出结果对应的最可能的输入结果及其中间过程，实现上则是对进行分类的深度学习模型进行求逆，并将训练模型的输出作为反卷积模型的输入，得到的输出结果就是最可能的原学习模型输入数据。所以，根据深度学习模型的特点，需要对各个层级的数学模型进行求逆。

受计算与存储限制，反向池化采用将每个最大值的位置在训练过程中记录并保存的最大值记录法，具体为记录后对原输出进行反卷积时找到该最大值所处的反卷积图像位置，其他像素点上补零。

S44、对完整的卷积神经网络模型进行可视化分析评估和优化，优化的方向与方法分为两种，具体内容如下：

第一种是通过调整完整的卷积神经网络模型的结构参数，寻找合适的结构，从而找到训练成本与训练效果之间的平衡点；第二种是根据轴承故障振动时间序列图像中的波形和条纹信息，强化目标图像与背景之间的对比度；同时当进行更加复杂的分类任务时，利用局部采集和复合输入的方式或者更深层次的网络，增加输入步骤3中神经网络的特征和细节，为神经网络的分类提供更多的分类依据。

方法一：激活层可视化结果存在大量的黑色特征图，经对比，与成功分类模型早期可视化图像相似，表明卷积核的特征提取功能并未出现问题，分类失败的原因可能是参数更新缓慢。另一方面，成功分类(准确率97％以上)的模型存在一定比例的黑色特征，但占比较低。而分类失败的模型经过一定处理，某些黑色特征图会出现轮廓线。处理之后，仍然存在一定比例的图像是无法看到任何线条轮廓的。依据CNN的构成原理，黑色图像的特征不够明显且对后续神经网络层有不良的作用。

对于失败或准确率不足，过拟合现象明显的神经网络，若可视化后出现大量黑色激活层结果，应当考虑减少卷积层的通道数。若问题存在且黑色比例适当，应先考虑增加末端全连接网络的个数与层数，确定是否为回归划分能力不足，若增加后问题仍然存在或为了减少计算成本，则考虑增加卷积神经网络层数或使用多卷积核方法。

依据方法一，可以调整神经网络的结构参数，寻找到合适的结构，在训练成本与训练效果之间找到平衡点。

第二种是由可视化参数，超参数图像可知，整个训练过程主要分为两个阶段。

第一个阶段是成型，卷积核会倾向于做一定程度变化的复现或者是聚焦与抽取局部特征，该阶段中主要保证大多数的卷积核对图像都具有敏感性。因此，该阶段的权重和偏置都会发生剧烈的变化以快速地收敛到合适的值的附近；当然，权重和偏置的变化并不同步，即偏置收敛成功而权重还未完成收敛，反之亦然。

第二阶段是修整，该阶段是准确率超越人类分类能力的关键。在第一阶段中，神经网络已经初步完成了分类识别的工作，但准确率不高。为了达到更好水平，需要继续对权重和偏置进行调整。可视化显示，这一阶段权重与偏置的均值变化不大，方差明显增强。在数字图像处理领域中，对图像卷积加偏置可以理解为进行了有针对性地图像增强，新的卷积核针对不同的情况有了更好的应对和强化。这种迭代方向说明了CNN模型对振动图像的偏好是更加明亮，对比度更好的图像。

依据方法二，在使用CNN模型进行轴承故障分类诊断时，输入数据的大小，形状，灰度值等都需要做出合适的调整。对于轴承故障振动图像，需要更关注他的波形和条纹信息，所以要强化目标图像与背景之间的对比度；当进行更加复杂的10分类，20分类任务时，使用局部采集和复合输入的方式或者是使用更深层次的网络，减少前端池化保留图像特征，来增加输入进网络的特征和细节为网络的分类提供更多的分类依据。

步骤S25中灰度图像的灰度范围为0到255，通过转换为二值灰度图像，从而将原有图像的尺寸放缩为正方形。

在步骤S31中，单层卷积神经网络，其包括卷积层、激活层和池化层，并按序依次排列。

在步骤S36中，相关参数包括：各个层的激活层输出结果、卷积核的权重、偏置和最大池化位置；超参数包括：各层卷积核个数、卷积核尺寸、卷积方式、激活函数类型和网络输出结果尺寸。

在步骤S4中，模型的可视化，其包括参数可视化、激活层可视化和反卷积可视化，反卷积可视化的方法由原卷积网络参数与超参数决定。

具体而言，Mini-batch随机梯度下降方法是随机梯度下降(SGD)和批量梯度下降(BGD)的折中，其中参数θ的迭代方式如下：

以下结合实施例对本发明一种面向轴承故障识别的CNN模型可视化优化方法做进一步描述：

外部滚道故障是存在于轴承上的固定位置故障，因此该故障相对于轴承的负载区域的放置位置将直接影响到电机/轴承系统的轴承故障振动响应数据。为了量化这种影响，需要对风扇端轴承和驱动端轴承进行实验，将外部滚道故障分别放置在3点钟位置(正对于载荷位置)，6点钟位置(垂直于载荷位置)，以及第一位置。

S1、本实施例子中轴承振动故障数据来自Bearing Data Center，该数据使用的是加速度传感器来收集振动数据。将轴承故障试验台的振动加速度传感器用磁性底座粘到电机壳体以及电机壳体的驱动端和风扇端的第一位置，有时也会粘连在马达支撑的基板，通过DAT记录仪采集测试轴承在不同状态下，电机壳体的驱动端和风扇端的振动加速度信号数据，并在Matlab中进行了初步地数据处理和归纳。所有的采集数据文件都是Matlab(*.mat)格式，加速度传感器将以每秒12,000个样本点收集各个端的轴承振动故障数据。

S23、鉴于CNN工作机理，样本的冗余信息需要做出一定的规范和限制，设计一个防止样本重复度过高的过滤器，对步骤S22获得的轴承振动加速度信号数据样本进行过滤筛选；

S25、通过灰度图像的阈值969进行像素选择，将步骤S24得到的图像转换为0到255的灰度范围的灰度图像，将原有图像尺寸放缩为正方形，便于计算，整个预处理步骤按照步骤S21至S25从上到下依次进行；

S3、如图3所示，将步骤S2得到的轴承振动故障信号数据的图像输入到本步骤中，来搭建轴承故障识别CNN模型，并初始化，将样本图像与标签作为训练样本来训练完整的卷积神经网络模型，并记录完整的卷积神经网络模型中各层相关参数和超参数信息；

S31、本模型由四个单层卷积神经网络、一个全连接层和一个softmax层构成，搭建的轴承故障识别CNN模型包含卷积层、池化层、激活层、全连接层和softmax层等层级单元组件，其中，卷积层、激活层、池化层按序排列构成单层卷积神经网络。构建单层卷积神经网络的结构，如图4所示：

S312、在本模型中选择“Z字”型遍历法，行进步长为1单位像素。首先将r-1层的输入与r层卷积核进行卷积运算，然后将r层输出的卷积结果加上偏置b经过激活函数F进行激活，最后再进行池化运算，具体表达式如下：

式中，

式中，y是该样本的真实类标，

是模型的预测结果；

S333、损失函数迭代模型的方法为对模型中的参数进行梯度下降更新：

使用Mini-batch(下采样小样本批次)随机梯度下降方法对完整的卷积神经网络模型的参数进行更新，对于完整的卷积神经网络中第k层参数的具体表达式为：

W^(k)，b^(k) (4)

式中，

式中，

式中，y_n为第n个样本的实际状态，

是模型的预测状态，θ为模型训练参数，可以是式(4)或者其他可训练参数。

S34、由于深度学习模型常常因为其强大的函数拟合能力，产生过拟合问题。为防止过拟合问题，模型使用dropout算法(dropout算法具体为每次训练过程使得卷积神经网络按设计随机丢失神经元)进行随机丢弃。在每一次进行步骤S33之前，使用dropout算法将步骤S32中得到的卷积神经网络按一定比例随机忽略部分卷积核w^(k)和偏置b^(k)，被忽略的卷积核将不参与这一次S33中的参数训练过程；

S36、记录每次训练过程中各层相关参数和超参数的信息。

S41、将完整的卷积神经网络模型中各层网络的权重w^(k)与偏置b^(k)通过油液采样法对网络进行采样统计，最后呈现出参数随训练次数变化而变化的分布；

S43、反卷积可视化是将网络整体依据记录参数进行反向重构，对步骤S33得到的深度学习模型进行求逆，并将训练得到的深度学习模型的输出作为反卷积模型的输入，得到原学习模型的输入数据，整体反卷积网络将根据原卷积网络结构反向重建，单层反卷积网络构建过程具体如下：

W_re＝W^T (9)

式中，W是卷积网络卷积核权重；

反激活函数为原激活函数的反函数，公式如下：

F_re＝F^-1 (10)

式中，F为式(2)中的激活函数，对于使用ReLu函数的网络，其反函数是其本身；

将原网络的第r层的结果进行反向池化，逆激活函数激活，与反卷积核进行卷积得到r-1层结果，整体反卷积网络将根据原卷积网络结构反向重建。

S44、对完整的卷积神经网络模型进行可视化分析评估和优化，如图5所示，可视化的结果显示，结合卷积神经网络的神经科学机理和生物学基础分析，网络分类失败的表征包括图像扭曲：反卷积后根本看不出和原图像之间的相似点；劣质选择：与未完成优化的图像不同，这种图像看似是需要被优化的，但是在不断地训练之后完全没有什么变化。黑色图像：全黑或纯色的图像，无法正确认识该卷积核在关注什么信息，但不能确认是失败的，这和卷积核、激活函数有关，且受限于人眼分辨和显示问题；残缺图像：是有可能可以继续计算的对象，但该网络目前对此无能为力。

经过优化调整后的模型从图6a的训练集准确率和测试集准确率不收敛，到图6b的训练集和测试集准确率收敛至99％，说明该方法具有一定的有效性。

以上所述的实施例仅是对本发明的优选实施方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案做出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。

Claims

1.一种面向轴承故障识别的CNN模型可视化优化方法，其特征在于，其包括以下步骤：

S31、构建单层卷积神经网络的结构：

S311、设输入图像为x_ij和滤波器为f_pq，获得得卷积层的二维卷积表达式为：

式中，x_ij为输入图像矩阵，y_ij为输出多维向量，i与j均为像素位置坐标，坐标以图像左上角为原点，向右为正且为坐标第一元，向下为正且为坐标第二元建立，坐标范围为1≤i≤M，1≤j≤N；f_pq为滤波器，p与q均为滤波器的元素位置坐标，坐标以图像左上角为原点，向右为正且为坐标第一元，向下为正且为坐标第二元建立，坐标范围为1≤p≤m，1≤q≤n，通常情况下m，n都远远小于M，N；

式中，

S32、将S31中构建的单层卷积神经网络进行堆叠，构成四层卷积神经网络，并在底层接入一层全连接层与一层最大平滑层，构成完整的卷积神经网络模型；

S33、利用反向传播算法BP对步骤S32得到的完整的卷积神经网络模型进行训练，得到深度学习模型：

式中，y是该样本的真实类标，

是模型的预测结果；

S333、使用下采样小样本批次Mini-batch的随机梯度下降方法对完整的卷积神经网络模型的参数进行更新，对于完整的卷积神经网络中第k层参数的具体表达式为：

W^(k)，b^(k) (4)

式中，W^(k)是第k层卷积核的权重参数矩阵、是卷积核中的所有权重的集合，b^(k)为第k层偏置、是一个可训练的常数；

式中，

式中，

式中，y_n为第n个样本的实际状态，

S36、记录每次训练过程中各层相关参数和超参数的信息；

W_re＝W^T (9)

式中，W是卷积网络卷积核权重；

反激活函数为原激活函数的反函数，公式如下：

F_re＝F^-1 (10)

式中，F为式(2)中的激活函数；

2.根据权利要求1所述的面向轴承故障识别的CNN模型可视化优化方法，其特征在于，步骤2中轴承振动加速度信号数据做预处理的流程包括：全局归一化、随机初始点截取、移除高重复度样本、时间序列图像化、图像灰度化、灰度二值化和图像尺寸规整。

3.根据权利要求1所述的面向轴承故障识别的CNN模型可视化优化方法，其特征在于，步骤S25中灰度图像的灰度范围为0到255，再转换为二值灰度图像，并且将原有图像的尺寸放缩为正方形。

4.根据权利要求1所述的面向轴承故障识别的CNN模型可视化优化方法，其特征在于，在步骤S31中，单层卷积神经网络，其包括卷积层、激活层和池化层，并按序依次排列。

5.根据权利要求1或者4所述的面向轴承故障识别的CNN模型可视化优化方法，其特征在于，在步骤S36中，所述相关参数包括：各个层的激活层输出结果、卷积核的权重、偏置和最大池化位置；所述超参数包括：各层卷积核个数、卷积核尺寸、卷积方式、激活函数类型和网络输出结果尺寸。

6.根据权利要求1所述的面向轴承故障识别的CNN模型可视化优化方法，其特征在于，在步骤S4中，模型的可视化，其包括参数可视化、激活层可视化和反卷积可视化，所述反卷积可视化的方法由原卷积网络参数与超参数决定。

7.根据权利要求1或者6所述的面向轴承故障识别的CNN模型可视化优化方法，其特征在于，步骤S44的优化方法分为两种：第一种是通过调整完整的卷积神经网络模型的结构参数，寻找合适的结构，从而找到训练成本与训练效果之间的平衡点；第二种是根据轴承故障振动时间序列图像中的波形和条纹信息，强化目标图像与背景之间的对比度；同时当进行更加复杂的分类任务时，利用局部采集和复合输入的方式或者更深层次的网络，增加输入步骤3中神经网络的特征和细节，为神经网络的分类提供更多的分类依据。

8.根据权利要求1所述的面向轴承故障识别的CNN模型可视化优化方法，其特征在于，所述下采样小样本批次随机梯度下降方法是随机梯度下降SGD和批量梯度下降BGD的折中，其中参数θ的迭代方式如下：