CN115527207B

CN115527207B - 基于深度神经网络的列车闸调器控制杆螺母故障检测方法

Info

Publication number: CN115527207B
Application number: CN202211267037.1A
Authority: CN
Inventors: 马金涛; 马凌宇; 秦昌
Original assignee: Harbin Kejia General Mechanical and Electrical Co Ltd
Current assignee: Harbin Kejia General Mechanical and Electrical Co Ltd
Priority date: 2022-10-17
Filing date: 2022-10-17
Publication date: 2023-04-28
Anticipated expiration: 2042-10-17
Also published as: CN115527207A

Abstract

基于深度神经网络的列车闸调器控制杆螺母故障检测方法，解决了现有检测器检测列车闸调器控制杆螺母故障效果差的问题，属于铁路列车故障检测领域。本发明包括：获取过车的铁路列车的图像，截取列车闸调器控制杆螺母图像，输入至故障检测模型中，获得检测结果；故障检测模型包括对象流分支、像素流分支和非极大值抑制模块，对象流分支对列车闸调器控制杆螺母的特征图像进行目标检测；像素流分支提取出特征图中的像素特征编码变量，根据像素特征编码变量对检测到的目标进行边界细化，再输入至非极大值抑制模块，输出列车闸调器控制杆螺母的分类信息和位置信息；如果没有检测到列车闸调器控制杆螺母，上传故障报文。

Description

基于深度神经网络的列车闸调器控制杆螺母故障检测方法

技术领域

本发明涉及一种基于深度神经网络的列车闸调器控制杆螺母故障检测方法，属于铁路列车故障检测领域。

背景技术

随着深度神经网络技术的发展和日益增长的工业需求，目标检测越来越受到人们的重视，并取得了显著的成绩。目标检测主要目标是精确的识别出感兴趣物体的类别，以及定位出在图像中具体位置。目标定位是指用一个矩形边界框标记出整个对象，在目标定位的过程中，边界框通常不能紧凑的标记整个对象。如，SSD目标检测网络使用的是基于Anchor的方法，检测器在目标定位时采用边界回归方法获得边界框，回归从Anchor到GT的偏移量。这种逐点回归的机制不能直接感知整个对象，导致定位误差。

在列车安全检测中，列车闸调器控制杆螺母故障检测是一个研究难点。列车闸调器控制杆螺母属于较小的部件。现有的目标检测网络主要关注大中型目标，然而由于列车闸调器控制杆螺母的尺寸相对较小，经过神经网络的下采样处理后，像素数目越来越少，导致提取的目标特征不明显，检测器的检测效果差。通过提高列车闸调器控制杆螺母的检测能力，将有助于目标检测技术在列车安全检测领域中的应用，进一步提高目标检测技术的实际应用价值。

发明内容

针对现有检测器检测列车闸调器控制杆螺母故障效果差的问题，本发明提供一种基于深度神经网络的列车闸调器控制杆螺母故障检测方法。

本发明提供一种基于深度神经网络的列车闸调器控制杆螺母故障检测方法，方法包括：

S1、获取过车的铁路列车的图像，截取列车闸调器控制杆螺母图像；

S2、将列车闸调器控制杆螺母图像输入至故障检测模型中，故障检测模型输出检测结果；

故障检测模型包括SSD特征提取网络、对象流分支、像素流分支和非极大值抑制模块，列车闸调器控制杆螺母图像输入至SSD特征提取网络，提取出特征图；

对象流分支用于对特征图进行目标检测，得到列车闸调器控制杆螺母的类别特征class、边界框特征box及Anchor特征编码；

像素流分支提取出特征图中的像素特征编码变量，根据像素特征编码变量对边界框特征box进行聚类，生成二进制掩码M，根据二进制掩码M对边界框特征box进行边界细化，得到细化后的边界框特征及类别特征class；

细化后的边界框特征及类别特征class输入至非极大值抑制模块，输出列车闸调器控制杆螺母的分类信息和位置信息；

S3、如果检测结果中没有检测到列车闸调器控制杆螺母，则图像为故障图像，上传故障报文，否则转入S1，获取下一张图像。

作为优选，故障检测模型包括SSD特征提取网络、Anchor-目标检测器、像素编码模块、聚类模块、上采样模块、边界细化模块和非极大值抑制模块；

列车闸调器控制杆螺母图像输入至SSD特征提取网络，提取出特征图，同时输入至Anchor-目标检测器和像素编码模块，

Anchor-目标检测器输出列车闸调器控制杆螺母的类别特征class、边界框特征box及像素x_j的Anchor特征编码q_j；

根据类别特征class、边界框特征box及Anchor特征编码q_j获得class_j、box_j、box_j、σ_j和center_j；

class_j表示像素x_j的物体的类别；box_j表示像素x_j相对于边界框的四周的偏移量，σ_j表示像素x_j处的p_j和q_j的固定边距；center_j代表该像素x_j处包含物体的概率；

像素编码模块对输入的特征图进行处理，输出像素特征编码变量p_j；

将所有预测特征图的像素x_j的值分组为元组{class_j，box_j，center_j，q_j，σ_j}，输入至聚类模块；

聚类模块根据像素特征编码变量p_j对元组进行聚类,生成二进制掩码M，得到信息A{class_j，box_j，center_j，M}；

信息A输入至上采样模块，进行上采样后输出至边界细化模块；

Anchor-目标检测器输出的边界框特征box同时输入至边界细化模块，边界细化模块根据二进制掩码M对边界框特征box进行边界细化，细化后的边界框特征及{class_j，box_j，center_j}及类别特征class输入至非极大值抑制模块，非极大值抑制模块输出列车闸调器控制杆螺母的分类信息和位置信息。

作为优选，类别特征class输入至像素类别提取模块提取出class_j；边界框特征box输入至边界回归模块，提取box_j；

box_j输入至边距提取模块，得到σ_j；

Anchor特征编码p_j输入至概率提取模块，得到center_j。

作为优选，二进制掩码M为：

作为优选，根据二进制掩码M对边界框特征box进行边界细化：

式中：x表示细化后边界，X表示边界框特征box中左边界水平坐标的离散变量；M'∈R^h×w表示M的前景通道；P(X＝i|M')表示掩码的后验概率。

作为优选，

式中：P(X＝i)表示掩码的先验概率；

P(M′|X＝i)表示掩码的似然概率；

w表示图像高度。

作为优选，SSD特征提取网络包括依次连接的卷积层4_3、VGG16网络、卷积层fc7、卷积层Conv6_2、卷积层Conv7_2、卷积层Conv8_2和卷积层Conv9_2、池化层和全连接层。

作为优选，对故障检测模型进行训练的样本数据集采用在铁路列车轨道周围搭设的成像设备收集到列车图像，使用labelImg标注软件进行类别标注，数据集标签为列车闸调器控制杆螺，通过对样本数据集中数据进行旋转、裁剪、加噪完成样本数据集的扩增。

本发明的有益效果，本发明为了为减小定位误差，在保证检测速度的前提下，引入像素级别的实例分割任务。本发明为一种包含对象流和像素流的双分支结构，根据实例分割任务生成的目标掩码直接获取边界框。对象流分支负责预测感兴趣对象的类别和边界框，像素流分支负责生成实例感知的像素掩码。将对象流生成的分类和定位特征引入到像素流中来弥补对象级别信息的不足。最终，基于实例感知的分割掩码生成对象的最小封闭边界框，完成目标定位任务。本发明通过改进SSD网络结构，解决了SSD目标检测对列车闸调器控制杆螺母故障检测不佳的问题，同时提高了SSD目标检测网络对目标的定位能力。

附图说明

图1和图2为采用现有SSD网络结构对列车闸调器控制杆螺母故障进行检测获得的类别信息和位置信息；

图3为本发明的检测模型的原理示意图；

图4为SSD特征提取网络的原理示意图；

图5和图6为本发明的检测模型对列车闸调器控制杆螺母故障进行检测获得的类别信息和位置信息。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

下面结合附图和具体实施例对本发明作进一步说明，但不作为本发明的限定。

SSD网络使用VGG16作为基准网络，SSD网络采用FPN进行目标检测并利用不同输出层的大小不同的特征图进行检测，然后经过池化层和全连接层及检测器得到分类置信度和位置信息，最后合并每个输出层的检测结果，通过非极大值抑制模块NMS输出最终的分类和定位结果；

然而，在SSD基准网络的一系列卷积、池化之后，在第一个卷积层输出的检测特征图的大小比原始图像减小了1/8，导致检测目标的边缘和纹理等大部分细节丢失，而后续特征图的特征信息丢失的更多，尤其是对小目标的特征信息。在网络训练阶段，列车闸调器控制杆螺母故障特征信息的不足严重影响网络参数的学习，导致列车闸调器控制杆螺母故障检测精度低和定位不准确。如图1和图2展示了SSD目标检测网络的检测效果，可以看到SSD网络对列车闸调器控制杆螺母的漏检和定位上的偏差。

边界框是对象实例掩码的最小封闭矩形，因此，将目标定位转换为像素级别任务更为合理，即根据目标掩码直接获取边界框，更为直接、准确，小目标检测效果也更好。

实例分割使用目标检测技术检测感兴趣的对象，然后为每个感兴趣对象的每个像素标记特定的标签，即生成实例感知的像素类别。例如，Mask R-CNN遵循自上而下的两阶段分割范式，首先用边界框标记感兴趣的对象，然后为每个对象的像素标记类别掩码。这种掩码生成方式在很大程度上依赖于在目标检测阶段获得的边界框，并且容易受到其定位误差的影响。

另外一种实例分割方式是直接预测每个像素的特征，然后应用聚类过程对每个对象实例掩码进行分组。然而，这些方法的瓶颈是它们的聚类过程。例如，很难确定簇的数量或簇的中心位置，导致性能无法与基于边界框的方法进行比较。这些缺陷的根源主要在于对象级别信息的利用不足。

通过以上分析，采用边界回归方法获得边界框的方式会产生定位误差。

在实例分割任务中，目标检测阶段获得的对象边界框对生成实例感知的像素类别至关重要，同时也可以解决实例掩码聚类过程中难确定簇的中心位置的问题。

本实施方式的基于深度神经网络的列车闸调器控制杆螺母故障检测方法，包括：

步骤1、获取过车的铁路列车的图像，截取列车闸调器控制杆螺母图像；

步骤2、将列车闸调器控制杆螺母图像输入至故障检测模型中，故障检测模型输出检测结果；

步骤3、如果检测结果中没有检测到列车闸调器控制杆螺母，则图像为故障图像，上传故障报文，否则转入步骤1，获取下一张图像。

本实施方式的故障检测模型设计了包含对象流和像素流的双分支结构。对象流分支负责预测感兴趣对象的类别和边界框，像素流分支负责生成实例感知的像素掩码。将对象流生成的分类和定位特征引入到像素流中来弥补对象级别信息的不足。最终，基于实例感知的分割掩码生成对象的最小封闭边界框，完成目标定位任务。对象流分支关注对象级别的信息，包括对象类别、位置等，它由各种基于回归的检测器形成。此外，在对象流分支添加了一个与分类和回归分支并行的新分支，以提取每个Anchor的对象特征，对象流分支负责生成检测结果，并将通过后续的像素级别信息进行细化。像素流分支关注像素级别信息，提取该流中每个像素的特征，然后使用对象级别信息生成实例掩码。

优选实施例中，如图3所示，故障检测模型包括SSD特征提取网络、Anchor-目标检测器、像素编码模块、聚类模块、上采样模块、边界细化模块和非极大值抑制模块；

实例分割的目的是为每个像素分配一个实例感知类别。以前的基于分割的方法直接使用相似的特征编码对像素进行聚类来完成这项任务。然而，由于对象在二维图像平面中的数量和位置的不确定性，往往不能使用预定义的像素类别。本实施方式双分支结构采用像素特征编码和Anchor特征编码。Anchor特征编码表示实例的对象级别上下文特征，而像素特征编码表示图像上每个位置的像素级别上下文特征，它学习每个像素与相应实例之间的关系。在像素特征编码中，使用Anchor特征编码作为实例的聚类中心对像素进行聚类，避免了基于分割的方法中查找聚类中心位置和数量的困难。本实施方式使用双分支结构来学习像素特征编码、Anchor特征编码和Anchor边界框。在像素流分支中，计算像素特征编码变量p_j。在对象流分支中，添加了一个与分类和回归分支并行的新分支，以提取每个Anchor的对象特征编码变量q_j。在对象流边界回归输出后，添加边距提取模块(1×1的卷积层)，计算Anchor边界框变量σ_j。将所有预测特征图的同一位置x_j的值分组为元组{class_j，box_j，center_j，q_j，σ_j}，其中class_j代表该像素处的物体的类别，box_j代表该像素相对于框的四周的偏移量，center_j代表该像素处包含物体的概率。对于图像中的每个实例Anchor和每个像素，Anchor特征编码和像素特征编码之间的距离决定了该像素属于实例Anchor的掩码的可能性，并且Anchor边界为该可能性提供了一个明确的边界，以决定最终掩码。

优选实施例中，本实施方式的类别特征class输入至像素类别提取模块提取出class_j；边界框特征box输入至边界回归模块，提取box_j；

box_j输入至边距提取模块，得到σ_j；

Anchor特征编码p_j输入至概率提取模块，得到center_j。

在推断期间，Anchor特征编码和像素特征编码用于掩模生成。在经过非极大值抑制模块应用于{class_j，box_j，center_j，q_j，σ_j}的元组之后，使用这些元组作为参数获取一组实例Anchor S_k。优选实施例中，S_k的二进制掩码M为：

Q_k表示S_k对应的q_j；

在训练过程中，S_k表示每个GT实例，Q_k表示每个GT实例的Anchor特征编码。如果像素x_j属于S_k表示的GT掩码，则将像素特征编码p_j和Anchor特征编码Q_k更接近，否则将它们远离。为了对前景和背景的pi执行这种策略，采用铰链损失的策略：

式中：K表示GT的数目；B_k表示位于S_k的边界框内的像素特征编码；N_k表示B_k中像素特征编码的数量；

是一个指示函数，如果像素p_j位于的GT中，则为1，否则为0；[x]₊＝max(0,x)；σ_a和σ_b表示两种幅度差值，损失的第一项将像素特征编码p_j和Anchor特征编码Q_k之间的距离拉到边缘σ_a内，第二项将距离推到边缘σ_b外。

在训练期间，本专利算法使用可学习边距取代固定边距，可以优化像素特征编码p_i和Anchor特征编码之间的距离。固定边距σ_a和σ_b需要手动设置，很难确定最佳值，对于多尺度对象的训练并不友好。从训练中学习灵活的边距σ_j，无需手动设置，使用高斯函数：

式中：φ(x_i,S_k)表示像素x_ji属于实例S_k掩码的概率；∑_k表示边距σ_j；将像素x_i的像素特征编码p_j和实例S_k的Anchor特征编码Q_k之间的距离映射到范围为[0,1]的值中。当p_j接近Q_k时，φ(x_j,S_k)为1，否则为0。预测的σ_j给出了每个实例Anchor的可学习边距。对于实例S_k，当φ(x_j,S_k)应用于图像中的每个像素x_j时，生成该实例的前景、背景概率图。它可以通过二元分类损失进行优化：

式中：L(·)表示一个二元分类损失函数，使用铰链损失来获得更好的性能；G(x_j,S_k)表示像素x_j的GT标签，用于判断它是否在S_k的掩码中，该掩码是二进制值。

像素级别信息有利于检测任务，特别是对于对象边界定位。本实施方式设计了边界细化模块(Mask Boundary Refinement Module,MBRB)，生成边界框时，将引入实例感知掩码信息以生成更精确的边界框。优选实施例中，边界细化模块根据二进制掩码M对边界框特征box进行边界细化：

边界回归的方式为边界框的生成提供了先验信息，用离散变量的方式表示边界框坐标。式中：x表示细化后边界，X表示边界框特征box中左边界水平坐标的离散变量；M'∈R^h ^×w表示M的前景通道；P(X＝i|M')表示掩码的后验概率。

优选实施例中，

式中：P(X＝i)表示掩码的先验概率；

P(M′|X＝i)表示掩码的似然概率；

w表示图像高度。

式中：

s表示边界对其相邻像素的影响超参数；掩码的边缘通常很难确定，无法明确

公式，本专利首先使用尺寸为2s+1的一维卷积来估计，然后使用Sigmoid函数归一化；P(X＝i)使用高斯分布公式计算：

式中：α表示归一化指数；μ和σ_x表示：

μ＝x_r,σ_x＝γw_b

式中：w_b表示BBox的宽度；x_r表示边界框左边界的水平坐标；γ表示回归边界权重参数。

优选实施例中，本实施方式SSD特征提取网络包括依次连接的卷积层Conv4_3、VGG16网络、卷积层fc7、卷积层Conv6_2、卷积层Conv7_2、卷积层Conv8_2和卷积层Conv9_2、池化层和全连接层。

将VGG16的最后两个全连接层更改为卷积层后添加了四个卷积层，使其对尺度变化具有更强的鲁棒性。

优选实施例中，对故障检测模型进行训练的样本数据集采用在铁路列车轨道周围搭设的成像设备收集到列车图像，使用labelImg标注软件进行类别标注，数据集标签为列车闸调器控制杆螺，通过对样本数据集中数据进行旋转、裁剪、加噪完成样本数据集的扩增，数据扩增操作能够使后续检测网络的泛化能力增强，降低网络过拟合的概率。

本实施方式在SSD算法的基础上，通过对目标检测任务与实例分割任务的分析，发现边界框是对象掩码的最小闭合矩形，因此根据对象掩码直接获取边界框，更为直接和准确。在检测网络的基础上，设计了包含对象流和像素流的双分支结构。对象级别的目标检测任务利用实例分割的像素级别信息减少定位误差，提高了列车闸调器控制杆螺母检测的精度。实验结果表明，本实施方式改进的SSD算法提高了对列车闸调器控制杆螺母检测的效果。训练后，检测结果如下，对列车闸调器控制杆螺母识别效果得到明显增强。

虽然在本文中参照了特定的实施方式来描述本发明，但是应该理解的是，这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是，可以对示例性的实施例进行许多修改，并且可以设计出其他的布置，只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是，可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中的特征。还可以理解的是，结合单独实施例所描述的特征可以使用在其他实施例中。

Claims

1.基于深度神经网络的列车闸调器控制杆螺母故障检测方法，其特征在于，所述方法包括：

对象流分支用于对特征图进行目标检测，得到列车闸调器控制杆螺母的类别特征class1、边界框特征box及Anchor特征编码；

像素流分支提取出特征图中的像素特征编码变量，根据像素特征编码变量对元组{class1_j，box_j，center_j，q_j，σ_j}进行聚类，生成二进制掩码M，根据二进制掩码M对边界框特征box进行边界细化，得到细化后的边界框特征及类别特征class2；

class1_j表示像素x_j的物体的类别；box_j表示像素x_j相对于边界框的四周的偏移量，σ_j表示像素x_j处的像素特征编码变量p_j和Anchor特征编码q_j的固定边距；center_j代表该像素x_j处包含物体的概率；

细化后的边界框特征及{class1_j，box_j，center_j}及类别特征class2输入至非极大值抑制模块，输出列车闸调器控制杆螺母的分类信息和位置信息；

2.根据权利要求1所述的深度神经网络的列车闸调器控制杆螺母故障检测方法，其特征在于，所述故障检测模型包括SSD特征提取网络、Anchor-目标检测器、像素编码模块、聚类模块、上采样模块、边界细化模块和非极大值抑制模块；

Anchor-目标检测器输出列车闸调器控制杆螺母的类别特征class1、边界框特征box及像素x_j的Anchor特征编码q_j；

根据类别特征class1、边界框特征box及Anchor特征编码q_j获得class1_j、box_j、σ_j和center_j；

将所有预测特征图的像素x_j的值分组为元组{class1_j，box_j，center_j，q_j，σ_j}，输入至聚类模块；

聚类模块根据像素特征编码变量p_j对元组进行聚类,生成二进制掩码M，得到信息A{class1_j，box_j，center_j，M}；

Anchor-目标检测器输出的边界框特征box同时输入至边界细化模块，边界细化模块根据二进制掩码M对边界框特征box进行边界细化，细化后的边界框特征及{class1_j，box_j，center_j}及类别特征class2输入至非极大值抑制模块，非极大值抑制模块输出列车闸调器控制杆螺母的分类信息和位置信息。

3.根据权利要求2所述的深度神经网络的列车闸调器控制杆螺母故障检测方法，其特征在于，所述类别特征class1输入至像素类别提取模块提取出class1_j；边界框特征box输入至边界回归模块，提取box_j；

box_j输入至边距提取模块，得到σ_j；

Anchor特征编码p_j输入至概率提取模块，得到center_j。

4.根据权利要求2所述的深度神经网络的列车闸调器控制杆螺母故障检测方法，其特征在于，二进制掩码M为：

5.根据权利要求2所述的深度神经网络的列车闸调器控制杆螺母故障检测方法，其特征在于，根据二进制掩码M对边界框特征box进行边界细化：

6.根据权利要求5所述的深度神经网络的列车闸调器控制杆螺母故障检测方法，其特征在于，

式中：P(X＝i)表示掩码的先验概率；

P(M′|X＝i)表示掩码的似然概率；

h表示图像高度。

7.根据权利要求1所述的深度神经网络的列车闸调器控制杆螺母故障检测方法，其特征在于，所述SSD特征提取网络包括依次连接的卷积层Conv4_3、VGG16网络、卷积层fc7、卷积层Conv6_2、卷积层Conv7_2、卷积层Conv8_2和卷积层Conv9_2、池化层和全连接层。

8.根据权利要求1所述的深度神经网络的列车闸调器控制杆螺母故障检测方法，其特征在于，对故障检测模型进行训练的样本数据集采用在铁路列车轨道周围搭设的成像设备收集到列车图像，使用labelImg标注软件进行类别标注，数据集标签为列车闸调器控制杆螺，通过对样本数据集中数据进行旋转、裁剪、加噪完成样本数据集的扩增。

9.一种计算机可读的存储设备，所述存储设备存储有计算机程序，其特征在于，所述计算机程序被执行时实现如权利要求1至8任一所基于深度神经网络的列车闸调器控制杆螺母故障检测方法。

10.一种闸调器控制杆圆销和圆销开口销丢失检测装置，包括存储设备、处理器以及存储在所述存储设备中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序实现如权利要求1至8任一所述基于深度神经网络的列车闸调器控制杆螺母故障检测方法。