CN117110446A

CN117110446A - 识别车轴疲劳裂纹声发射信号方法

Info

Publication number: CN117110446A
Application number: CN202310998406.2A
Authority: CN
Inventors: 林丽; 唐小雯; 彭庆伟; 刘晓晶
Original assignee: Dalian Jiaotong University
Current assignee: Dalian Jiaotong University
Priority date: 2023-08-09
Filing date: 2023-08-09
Publication date: 2023-11-24

Abstract

本发明提供一种识别车轴疲劳裂纹声发射信号方法，包括：获取安装在车轴处的声发射传感器采集的声发射信号；对声发射信号进行预处理，并向声发射信号添加属性标签得到处理后的声发射信号并将其划分为训练集和测试集；构建CNN‑BiLSTM网络模型，根据训练集对CNN‑BiLSTM网络模型进行训练；将测试集输入训练后的CNN‑BiLSTM网络模型，训练后的CNN‑BiLSTM网络模型将测试集分类为疲劳裂纹信号和非疲劳裂纹信号。通过CNN‑BiLSTM网络模型的卷积神经网络和双向长短期记忆网络对车轴混合有干扰信号的声发射信号进行识别分类，以实现对车轴疲劳裂纹的检测。

Description

识别车轴疲劳裂纹声发射信号方法

技术领域

本发明涉及声发射信号识别技术领域，具体而言，尤其涉及识别车轴疲劳裂纹声发射信号方法。

背景技术

在铁路车辆中，车轴是轮对子系统的一个基本组成部分，是铁路运营安全的一个关键因素。在列车运行过程中，静载荷和疲劳载荷会造成较大的扭转和弯曲应力，使车轴特定的部位发生应力集中，引发疲劳裂纹，进而导致车轴断裂。车轴断裂会造成极大的事故，其后果无法挽回。因此，需要一种检测方法来对车轴疲劳裂纹进行检测，及时发现故障。

声发射检测技术是一种成熟的技术手段，由于其动态监测和实时在线检测的优势，能够在旋转结构运转的时候实现检测，可以反映出声源动态响应特征，及时发现故障，目前已经成为故障诊断领域最受欢迎的检测方法之一。但是，声发射信号在传播过程中可能会受到某些信号的干扰，我们需要对收集到的声发射信号进行处理。特征参数分析和波形分析是声发射信号处理和分析的主要两大类方法，但是这两种方法的缺点也很明显。由于声发射源的信息会受到信号采集传感器的影响，导致信号源的特征被干扰，参数分析法是目前声发射技术的现有已经应用技术，但是仅提取几个参数特征，会丢失大量信息并导致误判；波形分析法是比参数分析法更为精确的处理方法，但是它并不能实现智能化识别，故需要一种方法能够将采集全部数据输入网络，包括大量信息又可实现智能化。

相比于参数分析法和波形分析法以及普通的机器学习方法，神经网络可以处理大规模的数据，性能更加优秀，是目前综合效果最好的机器学习方法。卷积神经网络(Convolutional Neural Network，CNN)是一种前馈神经网络，可以通过在卷积层、池化层、归一化层和全连接层中使用各种过滤器来提取丰富的特征，从而提高各种任务的执行能力，广泛的应用到了图像处理和自然语言处理领域。在机器状态诊断领域，一维的神经网络(1D-CNN)和二维的神经网络(2D-CNN)都是在信号的基础上使用的，1D-CNN在处理传感器信号方面具有巨大潜力。长短时记忆网络(LSTM)和传统的RNN网络，这些算法只能单向地利用过去的信息，即上一层神经元的信息更新当前的单元状态，不能利用未来的信息，即下一隐藏层神经元的信息来更新当前的单元状态，只靠单向的LSTM网络在很大程度上不能充分利用所获取的信息。双向RNN(Bidirectional RNN，即BRNN)，解决了LSTM和传统RNN不能利用未来信息的问题。双向长短期记忆网络(Bidirectional Long Short-Term Memorynetwork，BiLSTM)，这是一种特殊的BRNN，最早由美国学者Graves Alex提出，首次用于语义信息的语音处理，其结构本质上是具有两个不同方向的LSTM神经网络单元，二者相互合作构成的神经网络模型。BiLSTM相比于LSTM，不仅保留了LSTM的特性，而且在前后序列特征的抓取问题上能够更加有效地发挥它的优点，它可以通过正、反两个方向计算隐藏状态的数据，从而进一步有效地利用收集到的数据。在提出BiLSTM模型之后，其在语音识别、目标检测、故障诊断识别、寿命预测等不同的研究领域方向的应用发挥了重要的作用。

有鉴于此，本发明将利用卷积神经网络和向长短期记忆网络对车轴混合有干扰信号的声发射信号进行识别分类，以实现对车轴疲劳裂纹的检测。

发明内容

根据上述提出声发射源的信息被干扰，导致无法实现智能化识别的技术问题，而提供一种识别车轴疲劳裂纹声发射信号方法。本发明主要利用卷积神经网络和双向长短期记忆网络对车轴混合有干扰信号的声发射信号进行识别分类，以实现对车轴疲劳裂纹的检测。

本发明采用的技术手段如下：

本发明提供了一种识别车轴疲劳裂纹声发射信号方法，包括：

获取安装在车轴处的声发射传感器采集的声发射信号；

对所述声发射信号进行预处理，并向所述声发射信号添加属性标签得到处理后的所述声发射信号，所述属性标签包括裂纹、敲击和噪声；

将处理后的所述声发射信号划分为训练集和测试集；

构建CNN-BiLSTM网络模型，所述CNN-BiLSTM网络模型包括卷积神经网络和双向长短期记忆网络，根据所述训练集对所述CNN-BiLSTM网络模型进行训练；

将所述测试集输入训练后的所述CNN-BiLSTM网络模型，训练后的所述CNN-BiLSTM网络模型将所述测试集分类为疲劳裂纹信号和非疲劳裂纹信号。

进一步地，所述构建CNN-BiLSTM网络模型，包括：

构建所述卷积神经网络，所述卷积神经网络包括顺次设置的序列输入层、第一卷积层、第一修正单元、第一层归一化、第二卷积层、第二修正单元、第二层归一化和全局平均池化层；

构建所述双向长短期记忆网络，包括顺次设置的第一长短期记忆网络和第二长短期记忆网络，所述第一长短期记忆网络和所述第二长短期记忆网络的方向相反，将所述第一长短期记忆网络与所述全局平均池化层电连接；

设置全连接层，分别电连接所述第二长短期记忆网络、Softmax回归层；

设置分类输出层，电连接所述Softmax回归层。

进一步地，所述构建CNN-BiLSTM网络模型，还包括：

设置所述双向长短期记忆网络的隐藏单元数为160，初始学习率为0.001，最小批次处理样本个数为64、训练的最大迭代次数10，损失函数为交叉熵损失函数、输出模式为输出最后一个分类值、序列长度为最长序列长度。

进一步地，所述双向长短期记忆网络按照以下方式进行计算：

其中，→为沿顺时间顺序隐藏，←为沿逆时间顺序隐藏，x_t为输入序列，h_t为第t时刻的隐藏状态，h_t-1为第t-1时刻的隐藏状态。

进一步地，所述第一长短期记忆网络和所述第二长短期记忆网络均包括M个记忆单元，所述记忆单元包括遗忘门、输入门和输出门，所述遗忘门、所述输入门和所述输出门按照以下方式计算第t时刻的隐藏状态：

其中，O_t为所述输出门的输出值，tanh为双曲线正切的激活函数赋予第t-1时刻的生成输入状态和生成隐藏状态，C_t为第t时刻的记忆单元状态，σ为sigmoid激活函数，W_O为所述输出门的权重，b_O为所述输出门的偏置，f_t为所述遗忘门的输出值，C_t-1为第t-1时刻的记忆单元状态，i_t为所述输入门的输出值，为记忆单元状态，W_C为所述生成输入状态的权重，b_C为所述生成输入状态的偏置，W_i为所述输入门的权重，b_i为所述输入门的偏置，W_f为所述遗忘门的权重，b_f为所述遗忘门的偏置。

进一步地，所述根据所述训练集对所述CNN-BiLSTM网络模型进行训练，包括：

当所述训练集在所述双向长短期记忆网络得到迭代次数满足所述训练的最大迭代次数，所述CNN-BiLSTM网络模型完成训练。

进一步地，所述将处理后的所述声发射信号划分为训练集和测试集，包括：

所述训练集与所述测试集的比例为3：1。

较现有技术相比，本发明具有以下优点：

本发明提供的识别车轴疲劳裂纹声发射信号方法，包括：获取安装在车轴处的声发射传感器采集的声发射信号；对声发射信号进行预处理，并向声发射信号添加属性标签得到处理后的声发射信号，属性标签包括裂纹、敲击和噪声。将处理后的声发射信号划分为训练集和测试集；构建CNN-BiLSTM网络模型，CNN-BiLSTM网络模型包括卷积神经网络和双向长短期记忆网络，根据训练集对CNN-BiLSTM网络模型进行训练；将测试集输入训练后的CNN-BiLSTM网络模型，训练后的CNN-BiLSTM网络模型将测试集分类为疲劳裂纹信号和非疲劳裂纹信号。通过卷积神经网络进行特征提取，通过双向长短期记忆网络学习信息的长期双向依赖性的特性，增强模型提取上下文信息的能力，从而进一步提高网络模型的识别准确性，解决了传统的参数分析法难以提取出有效的特征参数，波形分析法不能实现智能化识别的这些缺陷。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为车轴疲劳裂纹声发射信号时域图。

图2为车轴敲击声发射信号时域图。

图3为车轴噪声信号时域图。

图4为本发明提供的识别车轴疲劳裂纹声发射信号方法的一种流程示意图。

图5为本发明提供的CNN-BiLSTM网络模型的一种结构示意图。

图6为学习率为1时Loss值以及准确率。

图7为学习率为0.1时Loss值以及准确率。

图8为学习率为0.01时Loss值以及准确率。

图9为学习率为0.001时Loss值以及准确率。

图10为学习率为0.0001时Loss值以及准确率。

图11为不同隐藏层单元数对识别准确率影响。

图12为MaxEpochs＝30时准确率和Loss曲线图；

图13为CNN-BiLSTM网络模型一种训练过程图；

图14是训练样本和测试样本准确度随迭代次数的变化；

图15是训练样本和测试样本Loss值随迭代次数的变化曲线；

图16是测试数据混淆矩阵；

图17是训练样本和测试样本准确率图；

图18是训练样本和测试样本Loss曲线图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

参照图1至图4，图1为车轴疲劳裂纹声发射信号时域图，图2为车轴敲击声发射信号时域图，图3为车轴噪声信号时域图，图4为本发明提供的识别车轴疲劳裂纹声发射信号方法的一种流程示意图，来说明本发明提供的识别车轴疲劳裂纹声发射信号方法的一种具体的实施例，包括：

获取安装在车轴处的声发射传感器采集的声发射信号；

对声发射信号进行预处理，并向声发射信号添加属性标签得到处理后的声发射信号，属性标签包括裂纹、敲击和噪声。

将处理后的声发射信号划分为训练集和测试集；

构建CNN-BiLSTM网络模型，CNN-BiLSTM网络模型包括卷积神经网络和双向长短期记忆网络，根据训练集对CNN-BiLSTM网络模型进行训练；

将测试集输入训练后的CNN-BiLSTM网络模型，训练后的CNN-BiLSTM网络模型将测试集分类为疲劳裂纹信号和非疲劳裂纹信号。

可以理解的是，CNN-BiLSTM网络模型也可称作卷积神经网络-双向长短期记忆网络模型，对声发射信号进行预处理指将声发射信号进行打乱处理，声发射信号包括裂纹声发射信号、敲击声发射信号和噪声声发射信号，根据他们自身的属性添加对应的属性标签。将处理后的声发射信号划分为训练集和测试集，进一步地，可以将训练集中的部分处理后的声发射信号作为验证集，用于调整CNN-BiLSTM网络模型的超参数和用于对CNN-BiLSTM网络模型的能力进行初步评估，查看CNN-BiLSTM网络模型训练的效果是否朝着坏的方向进行，验证集的作用是体现在训练的过程。通过查看训练数据和验证数据的损失值(Loss值)随着epoch的变化关系可以看出CNN-BiLSTM网络模型是否过拟合，如果是，可以及时停止训练，然后根据情况调整CNN-BiLSTM网络模型结构和参数，大大节省时间。

在将测试集输入训练后的CNN-BiLSTM网络模型之前，需要确定输入数据的特征数和CNN-BiLSTM网络模型输出的类别数，其中，特征数就是输入数据的大小，例如，输入车轴疲劳裂纹声发射信号数据长度为10602496、干扰信号数据的选择分别为长度为1224704的噪声信号数据和237568的敲击信号数据，当然，并不限于此。

较现有技术相比，本发明提供的识别车轴疲劳裂纹声发射信号方法具有以下优点：

本发明提供的识别车轴疲劳裂纹声发射信号方法，包括：获取安装在车轴处的声发射传感器采集的声发射信号；对声发射信号进行预处理，并向声发射信号添加属性标签得到处理后的声发射信号，属性标签包括裂纹、敲击和噪声。将处理后的声发射信号划分为训练集和测试集；构建CNN-BiLSTM网络模型，CNN-BiLSTM网络模型包括卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)，根据训练集对CNN-BiLSTM网络模型进行训练；将测试集输入训练后的CNN-BiLSTM网络模型，训练后的CNN-BiLSTM网络模型将测试集分类为疲劳裂纹信号和非疲劳裂纹信号。通过卷积神经网络进行特征提取，通过双向长短期记忆网络学习信息的长期双向依赖性的特性，增强模型提取上下文信息的能力，从而进一步提高网络模型的识别准确性，解决了传统的参数分析法难以提取出有效的特征参数，波形分析法不能实现智能化识别的这些缺陷。

在一些可选的实施中，参照图5，图5为本发明提供的CNN-BiLSTM网络模型的一种结构示意图，构建CNN-BiLSTM网络模型，包括：

构建卷积神经网络，卷积神经网络包括顺次设置的序列输入层、第一卷积层、第一修正单元、第一层归一化、第二卷积层、第二修正单元、第二层归一化和全局平均池化层；

构建双向长短期记忆网络，包括顺次设置的第一长短期记忆网络和第二长短期记忆网络，第一长短期记忆网络和第二长短期记忆网络的方向相反，将第一长短期记忆网络与全局平均池化层电连接；

设置全连接层，分别电连接第二长短期记忆网络、Softmax回归层；

设置分类输出层，电连接Softmax回归层。

可以理解的是，序列输入层作用是用于数据的输入，即训练集的数据通过序列输入层输入卷积神经网络。卷积层的作用是使用卷积核进行特征提取和特征映射，第一卷积层和第二卷积层使用的填充模式(PaddingMode)均为‘causal’(代表具有时序关系的卷积，即output[t]不依赖于input[t+1：])，填充值(PaddingValue)均为0，NumChannels(输入通道数)均为‘auto’。

修正单元采用ReLU激活函数，修正单元位于上层节点的输出和下层节点的输入之间，运行时激活神经网络中某一部分神经元，将激活信息向后传入下一层的神经网络，它能够从输入输出之间生成非线性映射，它的作用是为了增加神经网络模型的非线性，没有激活函数的每层都相当于矩阵相乘。

层归一化(Layer Normalization，LN)的作用是综合考虑一层所有维度的输入，计算该层的输入均值和方差，各个维度的输入被一个同规范化操作转变，从而使得这一层的分布变稳定，且无需存储mini-batch的均值和方差，额外的存储空间得到节省。

全局平均池化层(Global Average Pooling1D，GAP1D)的作用是对CNN中传统的全连接层进行替代，是对最后一层卷积的特征图求均值，能够使参数量得到降低，减少过拟合(正则化)，泛化能力得到增加。

具体的，一维卷积神经网络利用一维卷积核对一维数据进行卷积操作。在卷积层的运算中，尺寸为3×1的一维卷积核在一维输入数据中按照所设定的滑动步长朝一个方向进行滑动，在滑动过程中将每次滑动结束后卷积核与一维数据重合部分的数值相乘再求和，直到卷积核遍历了输入层的全部数据，此时就得到了最终的特征图，由于输入数据和卷积核均为一维的，所以经过一维卷积得到的特征图也是一维的，卷积方案按照以下方式计算：

其中，*为卷积操作的运算符，为第l层中的第i个卷积核的权重，/>为第l层中的第i个卷积核的偏置参数，X^(l)(j)为第l层中第j个局部区域；/>表示第l+1层中，第i个卷积核计算出的特定局部区域j在该卷积核的特征图中对应位置的特征值。

ReLU激活函数使卷积神经网络训练的速度得到加快，收敛速度更快，计算的复杂度得以降低，鲁棒性对于各种干扰更强，在没有无监督预训练时也能有较好的表现，按照以下方式计算：

f(x)表示在卷积层的输出数据上应用ReLU激活函数后得到的激活值。

其中，一层输出的变化往往会导致下一层的总输入发生高度相关的变化，尤其是对于输出可能发生很大变化的修正单元，这表明可以通过固定每层内输入总和的均值和方差来减少“协变量偏移”问题。

因此，计算同一层中所有隐藏单元的层归一化统计量，按照以下方式计算：

其中，H是第l层神经元的个数，一层网络共享一个均值和方差，μ为均值，σ为方差，为第l层的第i个神经元。

全局平均池化层对层归一化后输出的特征图取平均值，以大幅度降低神经网络训练时的参数，即有：

其中F^b为输入特征图第b个通道的平均值；n为每个通道的特征数量；x_ib为b个通道的第i个特征值。

在一些可选的实施例中，继续参照图4和图5，构建CNN-BiLSTM网络模型，还包括：

设置双向长短期记忆网络的隐藏单元数为160，初始学习率为0.001，最小批次处理样本个数为64、训练的最大迭代次数10，损失函数为交叉熵损失函数(crossentropyex)、输出模式为输出最后一个分类值(Last)、序列长度为最长序列长度(Longest)，当指定序列长度为“最长序列长度”时，会在双向长短期记忆网络运行过程中，会填充序列，使输入的所有序列的长度相等，等于输入序列中的最长序列长度。

可以理解的是，经过卷积神经网络(CNN)的一系列操作后特征值之间还具有一定相关性。将处理的特征数据输入双向长短期记忆网络(BiLSTM)进行相关性分析，BiLSTM用于提取不同加权空间特征构成的时序数据中的特征信息，经全连接层(FC)后输入给Softmax回归层。

在一些可选的实施例中，继续参照图4和图5，双向长短期记忆网络按照以下方式进行计算：

所述第一长短期记忆网络和所述第二长短期记忆网络均包括M个记忆单元，所述记忆单元包括遗忘门、输入门和输出门，所述遗忘门、所述输入门和所述输出门按照以下方式计算第t时刻的隐藏状态：

可以理解的是，双向长短时记忆网络在LSTM网络的基础上加上了一个相反方向的LSTM运算，形成经由两个不同方向的LSTM单元组成的两层结构。正向的LSTM单元用于处理前向的数据信息，而反向的LSTM单元用于获取并处理从逆向，也就是下一隐藏层的数据信息，这样的双向结构可以获取历史信息和未来信息，在整个时间数据上获取并充分利用更多的信息。

LSTM的计算过程可以概括成：通过对记忆单元中的信息遗忘和记忆新信息使得对后续时刻计算有用的信息得到传递，而无用的信息被丢弃，并在每个时间步都会输出隐藏状态。其中，遗忘、记忆与输出由通过上个时刻的隐层状态和当前输入计算出来。输入门控制的是当前时刻序列的输入，遗忘门控制的是上一时刻序列中存储的历史信息，输出门控制的是当前时刻的时间序列的输出。

当把当前时刻输入序列x_t和上一时刻隐藏状态的h_t-1输入时，输入门、输出门和遗忘门都会得到激活。遗忘门决定哪些信息应该被忽略，哪些应该被保留。sigmoid激活函数的使用，来自当前时刻输入序列x_t传输到上一时刻隐藏状态的h_t-1，因此，遗忘门的输出值介于0和1之间。每当该值非常接近0时，就表示信息将被清除，其有一种倾向，让更多的知识离自己更近。

输入门通过使用变换函数将值从0更改为1来确定更新哪些信息，其中，0代表不重要，1代表重要，然后tanh为双曲线正切的激活函数赋予上一时刻的生成输入状态和生成隐藏状态。计算记忆单元状态并将新值添加到记忆单元状态以反映变化。最后，输出门决定下一个要选择的隐藏状态。第t时刻的记忆单元状态C_t和第t时刻的隐藏状态h_t被转移到后续的时间步。

将双向长短期记忆网络(BiLSTM)输出的数据，即或/>经由全连接层输送至Softmax回归层进行归一化处理，并计算识别分类的结果，由分类输出层进行输出。

可以理解的是，Softmax回归层采用归一化指数函数，旨在用概率的形式把多分类的结果表露，即将多个神经元的输出，映射到0和1之间，从而实现多分类，对于多分类问题很有效，它是有监督的回归模型。

Softmax输出的结果可取多个，即类别标签y可以取多个不同的值。给定属性标签y可以取k个不同的实数值，代表k个类别，即y＝[1 2...k]^T，数据训练样本x⁽ⁱ⁾为n维向量，i＝1，2，…，w，输入的训练样本为x时，输出为类别j的概率，按照以方式进行计算：

对于给定的n维向量的样本，Softmax回归层通过假设函数估计x每一种分类结果出现的概率，假设函数按照以下方式计算：

其中，θ¹，θ²，…，θ^k为n维实数向量，即由训练集得到的softmax回归层的参数，y为类别标签，k取不同实数值，表示不同类别；x为输入的训练样本，x⁽ⁱ⁾为N维向量，i＝1，2，…，w，输入的训练样本为x时，输出为类别j的概率，表示给定的测试样本n维向量。

而起归一化分类结果概率分布的作用，使样本属于不同类的概率之和为1。

在一些可选的实施例中，继续参照图4，根据训练集对CNN-BiLSTM网络模型进行训练，包括：当训练集在双向长短期记忆网络得到迭代次数满足训练的最大迭代次数，CNN-BiLSTM网络模型完成训练。

在一些可选的实施例中，将处理后的声发射信号划分为训练集和测试集，包括：训练集与测试集的比例为3：1。

可以理解的是，在本实施例中训练集与测试集的比例为3：1为最优选项，当然，并不限于此，训练集与测试集的比例可以根据实际需求进行调整。参照表1，表1为训练集与测试集的比例对比表。

表1.不同训练集占比下模型性能对比

从表1中可以看出，测试集的识别准确率均在96％以上，随着训练集占比的增大，测试集识别准确率也在增加，到训练集占比为80％时，准确率达到最大，为99.54％。这说明输入到混合网络的训练数据数量越多，CNN-BiLSTM网络模型的学习性能越好，可以挖掘利用更多的数据信息，进而获得理想的识别效果。从训练时间来看，训练集所占的比例越大，训练所需的时间越多。出现这种状况的原因，在设置相同的最小批量处理样本个数MiniBatch Size下，训练集占比越大，完成一次迭代训练所需要的运算次数增多，致使训练所需的时间增多。通过分析不同训练集占比对CNN-BiLSTM网络模型的性能影响可得出，在保证CNN-BiLSTM网络模型有较高的识别率的前提下，为了节省实验时间成本，优先选取所需训练时间少的占比，因此优选训练集与测试集占比为75％：25％的情况。

在一些可选的实施例中，参照图6至图10，图6为学习率为1时Loss值以及准确率，图7为学习率为0.1时Loss值以及准确率，图8为学习率为0.01时Loss值以及准确率，图9为学习率为0.001时Loss值以及准确率，图10为学习率为0.0001时Loss值以及准确率，以研究不同学习率对网络性能的影响。实验中，将学习率分为五种不同情况设置，分别为1、0.1、0.01、0.001和0.0001，将隐藏层单元数设置为160，最大迭代次数(Max Epochs)设置为10，最小批量处理样本个数设置为64，其余参数设置默认，探究在五种学习率下训练过程中损失值(Loss值)以及准确率随迭代次数的变化过程，由图6至图10可知，当学习率为0.001时，识别效果更优。

在一些可选的实施例中，参照图11，图11为不同隐藏层单元数对识别准确率影响，一个神经网络包括有多个神经元“层”，输入层、隐藏层及输出层。除了输入层，输出层以外的层叫隐藏层，输入层负责接收输入及分发到隐藏层，因为用户看不见这些层，所以见做隐藏层，这些隐藏层负责所需的计算及输出结果给输出层，而用户则可以看到最终结果。多个隐藏层其实是对输入特征多层次的抽象，最终的目的就是为了更好的线性划分不同类型的数据。

但不是隐藏层数越多越好，首先，层数越多参数会爆炸式增多，而且到了一定层数，再往深了加隐藏层，分类效果的增强会越来越不明，所以需要对隐藏层单元的个数进行一个讨论，得到CNN-BiLSTM网络模型的最优隐藏层单元的个数。

分别选择隐藏层单元的个数为10、20、60、100、120、160、200、240、300进行实验，学习率设置为0.001，Max Epochs设置为10，批量处理样本数设置为64，其他参数默认，不同隐藏层单元数对应的识别准确率如图11所示。由图11可知，隐藏层单元个数在10～20时识别准确率呈上升趋势，隐藏层单元个数在20～120时识别准确率呈下降趋势，个数为200时识别准确率和160时很接近，个数为240和300时识别准确率有所下降，所需时间则是随着隐藏层单元个数的增加而增加，综合分析考虑识别准确率和时间成本得出，在隐藏层单元数为160时，模型的识别效果更佳，因此本实施选择隐藏层单元数为160。

在一些可选的实施例中，参照图12，图12为MaxEpochs＝30时准确率和Loss曲线图，在本实施例中，探究最小批量处理样本个数的大小(Mini Batch Size)对CNN-BiLSTM网络模型的性能影响，不同Mini Batch Size下的识别准确率和所需时间如表2所示。

表2.最小批量处理样本个数的对比表

在实验中选择的Batch Size为16，32，64，128，256，Max Epochs设置为10，隐藏层单元个数设置为160，学习率设置为0.001，其他参数默认。综合分析识别准确率和所用时间为来选择合适的Mini Batch Size。由表2可以看出，随着Mini Batch Size的增大，所需时间在减小，准确率也不断变小。当Mini Batch Size为16时，识别准确率最高，但所需时间也最多，时间成本巨大。其后随着Mini Batch Size的增加准确率不断减小，到256时准确率低于99％。在本实施例中，综合分析考虑准确率以及时间成本，选择Mini Batch Size为64时，模型诊断效果较好。

在一些可选的实施例中，图13至图15，图13为CNN-BiLSTM网络模型一种训练过程图，图14是训练样本和测试样本准确度随迭代次数的变化，图15是训练样本和测试样本Loss值随迭代次数的变化曲线，选定双向长短期记忆网络(BiLSTM)最佳的参数设置，即学习率为0.001、隐藏层单元个数为160、批量处理样本个数64、Max Epochs10。为验证选定参数设置的可信度，在此基础上对CNN-BiLSTM网络模型进行10次重复实验验证。取最后一次实验的模型训练过程如图13所示，训练样本和测试样本准确度随迭代次数的变化如图14所示，训练样本和测试样本Loss值随迭代次数的变化曲线如图15所示，实验10次每次的识别结果及准确率平均值如表5所示。

表5.实验结果对比表

在一些可选的实施例中，参照图16，图16是测试数据混淆矩阵，CNN-BiLSTM网络模型训练完成并保存后，利用测试集的2946组数据对CNN-BiLSTM网络模型进行分类识别测试，得到裂纹信号和非裂纹信号的分类识别混淆矩阵图，如图16所示。当查看混淆矩阵时，可以看出CNN-BiLSTM网络模型是否可以正确区分两类信号：即疲劳裂纹信号类和其他信号(非裂纹信号)类。如图16所示，非裂纹信号的值为352，裂纹信号的值为2584，裂纹信号误判为非裂纹信号的值为10，非裂纹信号误判为裂纹信号的值为0。所以，裂纹信号数据的正确分类识别值为99.61％，非裂纹信号的正确分类识别值为100％，根据以下公式可以得到准确率Accurary和召回率Recall：

/>

其中，TP为被正确识别分类的数据，FN为被错误识别分类的数据，N为测试集样本总数，N_a为被正确识别分类的测试集样本个数。

根据上述公式计算得到准确率Accurary为99.66％和召回率Recall为0.9966。

在一些可选的实施例中，参照图17和图18，图17是训练样本和测试样本准确率图，图18是训练样本和测试样本Loss曲线图，由图17和图18可知，本发明提供的识别车轴疲劳裂纹声发射信号方法利用卷积神经网络和双向长短期记忆网络对车轴混合有干扰信号的声发射信号进行识别分类，获得了99.66％的准确度、0.9966的召回率和0.013的Loss值，在分类识别方面效果很好。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种识别车轴疲劳裂纹声发射信号方法，其特征在于，包括：

获取安装在车轴处的声发射传感器采集的声发射信号；

将处理后的所述声发射信号划分为训练集和测试集；

2.根据权利要求1所述的识别车轴疲劳裂纹声发射信号方法，其特征在于，所述构建CNN-BiLSTM网络模型，包括：

设置分类输出层，电连接所述Softmax回归层。

3.根据权利要求2所述的识别车轴疲劳裂纹声发射信号方法，其特征在于，所述构建CNN-BiLSTM网络模型，还包括：

4.根据权利要求2所述的识别车轴疲劳裂纹声发射信号方法，其特征在于，所述双向长短期记忆网络按照以下方式进行计算：

5.根据权利要求4所述的识别车轴疲劳裂纹声发射信号方法，其特征在于，所述第一长短期记忆网络和所述第二长短期记忆网络均包括M个记忆单元，所述记忆单元包括遗忘门、输入门和输出门，所述遗忘门、所述输入门和所述输出门按照以下方式计算第t时刻的隐藏状态：

6.根据权利要求3所述的识别车轴疲劳裂纹声发射信号方法，其特征在于，所述根据所述训练集对所述CNN-BiLSTM网络模型进行训练，包括：

7.根据权利要求1所述的识别车轴疲劳裂纹声发射信号方法，其特征在于，所述将处理后的所述声发射信号划分为训练集和测试集，包括：

所述训练集与所述测试集的比例为3：1。