CN112766195A

CN112766195A - 一种电气化铁路弓网燃弧视觉检测方法

Info

Publication number: CN112766195A
Application number: CN202110102075.0A
Authority: CN
Inventors: 权伟; 郭少鹏; 周宁; 邹栋; 张卫华; 卢学民; 刘跃平; 向梦; 郑杰
Original assignee: Southwest Jiaotong University
Current assignee: Southwest Jiaotong University
Priority date: 2021-01-26
Filing date: 2021-01-26
Publication date: 2021-05-07
Anticipated expiration: 2041-01-26
Also published as: CN112766195B

Abstract

本发明提供了一种电气化铁路弓网燃弧视觉检测方法，涉及计算机图形识别技术领域。首先对存在燃弧的弓网图像进行掩码标注，然后将标注后的图像作为多维特征融合分割网络的数据集对网路进行训练，分割网络采用深度卷积网络，由特征提取模块、多维特征融合模块和头模块构成，弓网图像通过分割网络进行前向推理，网络分割头子模块输出结果两倍上采样后所得特征图作为弓网图像的分割结果。在多维特征融合模块中加入深度可分离卷积与分组卷积，同通道注意力和空间注意力机制的加入使得网络更加关注燃弧区域特征，训练完成后该网络能够准确地检测出弓网图像中是否发生了燃弧现象，对模型进行在线学习及自适应切换也能够提高网络的准确性与鲁棒性。

Description

一种电气化铁路弓网燃弧视觉检测方法

技术领域

本发明涉及计算机图形图像识别技术领域。

技术背景

弓网系统是电气化铁路供电系统中的关键组成部分，确保弓网良好的受流性能是列车高速运行的重要安全保障，弓网燃弧是影响弓网间良好受流的一个重要因素。因此研究基于计算机视觉的弓网燃弧视觉检测算法，实现对弓网燃弧鲁棒得实时、准确检测，对于提高弓网检测系统的自动化、智能化水平和保证弓网系统的安全、稳定运行有重要的意义。

目前针对弓网燃弧检测主要有两类方法，一类是基于非视觉的方法，主要通过检测电流和电压信号的变化实现。但列车过电压或负载变化等原因，也会引起电流和电压信号的变化，容易导致误报。H.L.Lan等人认为燃弧声可以作为燃弧现象的检测参数，但是因为声音传感器很难区分电弧声和环境噪声，这种方法未被广泛采用。传统的弓网燃弧检测采用通过紫外传感器检测、红外热成像仪检测或者紫外成像仪检测的方法。代富强等人通过对弓网燃弧光谱的提取与分析，研制了基于特征紫外光和光子计数技术的弓网燃弧检测系统，但是由于紫外传感器检测易受到太阳光中的紫外光干扰，误报、漏报率非常大。胡怡等人基于红外图像和光谱诊断法，对降弓过程中弓网燃弧等离子体的温度以及受电弓滑板、接触线的温升情况进行了研究，但会出现由于弓网燃弧能量较低导致温度变化不明显而漏检的情况。

另一类弓网燃弧检测是基于视觉的方法，Ma等人利用基于离散小波的方法和基于霍夫变换的方法，从弓网图像中提取与磨损有关的特征来判断燃弧是否出现。Wang等人使用图像处理检测受电弓和悬链线接之间的接触点类确定弓网燃弧的存在。Ayudin等人提取摄像头中的一帧，然后通过检查受电弓边缘的接触线位置来检测弓网燃弧。Karakose等人将阈值方法应用于SDRAM(双口RAM)构造的图像矩阵来检测出燃弧，此外，他们还模拟了受电弓和接触网之间的相互作用，以及将当前状态分为三类：危险、安全和缺陷。上述研究主要采用从图像中提取与弓网关系特征，据此判断是否有燃弧发生，且没有针对单帧图像提取燃弧信息。

发明内容

本发明的目的是提供一种电气化铁路弓网燃弧视觉检测方法，它能够有效地实现弓网燃弧像素级分割，从而判别是否有燃弧现象发生。

本发明的目的是通过以下技术方案来实现的：一种电气化铁路弓网燃弧视觉检测方法，包括以下步骤：

步骤一：弓网燃弧数据集获取与制作

通过安装在电力机车车顶的摄像头采集图像生成分辨率为1920像素×1080像素的图像库，并对图像库中所有图片进行中央裁剪和尺度归一化处理，处理后的图像分辨率变换为512像素×512像素，所有处理后的图像组成原始数据集；通过程序自动筛选的方式过滤数据集中的噪声图像和冗余图像并保证数据集的均衡性和多样性，使用LabelMe标注工具标注出图像中的燃弧边界点并生成对应掩码，所有的图像及其掩码共同构成电气化铁路弓网燃弧数据集，数据集按照7:2:1的比例划分为训练集、测试集、验证集；

步骤二：多维特征融合分割网络构建

该网络包括特征提取模块、多维特征融合模块和头模块；

(1)特征提取模块采用在COCO数据集上预训练的ResNet-50网络；ResNet-50网络每次输入弓网燃弧数据集中的一幅图像img，其conv2_x输出对图像img下采样四倍后形成128像素×128像素×256通道的特征图C2，conv3_x输出对图像img下采样八倍后形成64像素×64像素×512通道的特征图C3，conv4_x输出对图像img下采样十六倍后形成32像素×32像素×1024通道的特征图C4，conv5_x输出对图像img下采样三十二倍后形成16像素×16像素×2048通道的特征图C5；

(2)多维特征融合模块包括可级联增强特征金字塔子模块和多维特征注意力子模块；可级联增强特征金字塔子模块首先分别将输入特征图C2、特征图C3、特征图C4、特征图C5的通道归一化为128通道，对应输出特征图A2、特征图A3、特征图A4、特征图A5，然后对特征图A2、特征图A3、特征图A4、特征图A5进行尺度提升增强和尺度下降增强后对应输出特征图F2、特征图F3、特征图F4、特征图F5；定义卷积核大小为3像素×3像素，输入通道数、输出通道数均为128通道，跨度、边界填充均为1像素，分组数为128的卷积层；定义卷积核大小为1像素×1像素，输入通道数、输出通道数均为128通道，跨度、边界填充均为1像素，分组数为1组的卷积层；BN层，Relu激活层的组合成为深度可分离卷积层；

(2.1)尺度提升增强过程：将特征图A5通过双线性插值方式尺度提升一倍后，与特征图A4元素维度相加，相加所得的特征图Tup4经深度可分离卷积层输出特征图B4，将特征图B4通过双线性插值方式尺度提升一倍后，与特征图A3元素维度相加，相加所得的特征图Tup3经深度可分离卷积层输出特征图B3，将特征图B3通过双线性插值方式尺度提升一倍后，与特征图A2元素维度相加，相加所得的特征图Tup2经深度可分离卷积层输出特征图B2，通过尺度提升增强获得特征图B2、特征图B3、特征图B4；

(2.2)尺度下降增强过程：将特征图B2通过双线性插值方式尺度下降一倍后，与特征图B3元素维度相加，相加所得的特征图Tdown3经深度可分离卷积层输出特征图F3，将特征图F3通过双线性插值方式尺度下降一倍后，与特征图B4元素维度相加，相加所得的特征图Tdown4经深度可分离卷积层输出特征图F4，将特征图F4通过双线性插值方式尺度下降一倍后，与特征图A5元素维度相加，相加所得的特征图Tdown5经深度可分离卷积层输出特征图F5，通过尺度下降增强获得特征图F3、特征图F4、特征图F5；

(2.3)将特征图B2重命名为特征图F2；多维特征注意力子模块首先将特征图F3、特征图F4、特征图F5分别采用双线性插值的方式提升到与特征图F2相同的尺度，输出特征图F3up、特征图F4up、特征图F5up，然后将特征图F2、特征图F3up、特征图F4up、特征图F5up在通道维度级联得到特征图Fuse，并对特征图Fuse进行分组卷积得到特征图Fg，最终对特征图Fg采用通道注意力机制和空间注意力机制输出特征图Fen；

(2.3.1)分组卷积过程：采用卷积核大小为3像素×3像素、输入通道数为512通道、输出通道数为128通道，跨度、边界填充均为1像素，分组数为四组的卷积层对Fuse进行卷积，输出特征图Fg；

(2.3.2)通道注意力机制为：首先在特征图Fg的每一通道上进行全局最大池化得到1像素×1像素×128通道的通道权重特征向量vf，然后将通道权重特征向量vf经过输入层节点数为128，隐藏层节点数为32，输出层节点数为128，激活函数为Sigmoid的全连接网络输出通道权重向量v，最终将通道权重向量v与特征图Fg每一通道进行逐元素相乘，得到特征图Fca；

(2.3.3)空间注意力机制为：首先在特征图Fca每一位置的所有通道上进行全局最大池化得到128像素×128像素×1通道的特征图Fsa1，然后将特征图Fsa1经过卷积核大小为3像素×3像素，输入通道数、输出通道数均为1通道，跨度、边界填充均为1像素，分组数为1组的卷积层和Sigmoid激活函数输出空间权重特征图Fsa2，最终将空间权重特征图Fsa2与特征图Fca的每一通道特征图进行逐元素相乘输出128像素×128像素×128通道的特征图Fen；

(3)头模块包括分隔头子模块、边界框头子模块，分割头子模块和边界框头子模块都包含一个特征再提取层，且该两个子模块的特征再提取层具有相同的结构，共九层，每个结构都包含：卷积核大小为3像素×3像素，输入通道数为128通道，输出通道数为256通道，跨度、边界填充均为1像素，分组数为1组的卷积层；BN层，Relu激活层，卷积核大小为3像素×3像素，输入通道数、输出通道数均为256通道，跨度、边界填充均为1像素，分组数为1组的卷积层；BN层，Relu激活层，卷积核大小为3像素×3像素，输入通道数、输出通道数均为256通道，跨度、边界填充均为1像素，分组数为1组的卷积层；BN层，Relu激活层；

(3.1)分割头子模块，首先将特征图Fen经过特征再提取层得到特征图Fst1，然后将特征图Fst1经过卷积核大小为3像素×3像素，输入通道数为256通道，输出通道数为1通道，跨度、边界填充均为1像素，分组数为1组的卷积层；BN层、Sigmoid激活层输出128像素×128像素×1通道的特征图Fst2；通过双线性插值的方式将特征图Fst2尺度提升至512像素×512像素，输出特征图Fs；特征图Fs每一位置上的像素值，代表图像img在相同位置上的像素属于燃弧的概率；

(3.2)边界框头子模块，首先将特征图Fen经过特征再提取层得到特征图Fbt，然后将特征图Fbt经过卷积核大小为3像素×3像素，输入通道数为256通道、输出通道数为4通道，跨度、边界填充均为1像素，分组数为1组的卷积层；BN层、Sigmoid激活层输出128像素×128像素×4通道的特征图Fb；图像img划分为128个×128个，4像素×4像素的像素块，每个位置的像素块与特征图Fb相同位置的像素一一对应，且特征图Fb在该位置的四个通道上各自的像素值分别代表其对应位置像素块所含燃弧的最小包围矩形框中心点的横坐标、中心点纵坐标、宽和高；

步骤三：多维特征融合分割网络训练

网络构建完成后，使用步骤一中的电气化铁路弓网燃弧数据集对多维特征融合分割网络进行训练；初始学习率设置为0.001；首先采用Adam优化器训练200轮，再使用SGD优化器训练300轮，学习率策略选择余弦退火并在训练初始阶段进行模型预热；

多维特征融合分割网络的损失函数为

其中α为平衡因子用来平衡正负样本数量，p为当前像素网络预测其属于燃弧的概率，γ为调制系数，能使得网络更加注重于较难区分的样本，y为当前像素的标签；

边界框回归任务损失函数为

其中A为预测框，B为真实框，C为包含A和B的最小外接矩形框；

中心点损失函数为交叉熵损失函数

多维特征融合分割网络所有参数中，ResNet-50网络直接采用预训练好的权重，其他参数均采用Kaiming He初始化；

训练完成后，网络具备对弓网燃弧的分割能力；将训练好的模型复制一份，其中一份作为在线运行模型，另一份作为在线学习模型；

步骤四：图像输入

在实时处理情况下，提取安装在电力机车或动车车顶摄像头采集并保存在存储区的原始弓网燃弧视频图像，作为待检测图像；在离线处理情况下，将已采集的弓网燃弧视频分解为多个帧组成的图像序列，按照时间顺序逐个提取帧图像作为输入图像，将输入图像归一化为512像素×512像素×3通道大小的图像，如果输入图像为空，则流程中止；

步骤五：弓网燃弧检测

使用步骤三训练所得在线运行模型对步骤四所得图像进行前向推理，分割分支输出图像掩码作为未处理结果，对所得结果依次进行开运算、闭运算、开运算，对边界框分支所得结果进行非极大值抑制，若存在抑制后边界框中内半径超过3像素的燃弧区域，则认为该图像中包含燃弧，跳入步骤六；否则，认为当前图像无燃弧，已完成该帧图像检测，跳入步骤四；

步骤六：数据扩充及模型在线学习

将步骤五所得含有燃弧的图像帧和在线运行模型在该图像上推理所得掩码作为训练数据，采用该训练数据对在线学习模型进行在线训练，并将含有燃弧的图像帧和其掩码保存在图像库中，若图像库中新增图像帧数量达到人工设定阈值30000张，跳入步骤七；否则，跳入步骤四；

步骤七：模型自适应切换

对比在线运行模型和在线学习模型在验证集上AP值的大小，若在线学习模型在验证集上AP值较大，则在线运行模型的参数值替换为在线学习模型的参数值；否则，在线学习模型的参数值替换为在线运行模型的参数值；完成以上操作后跳入步骤四。

所述的噪声图像和冗余图像，其中噪声图像指过明、过暗和不包含弓网信息的图像，冗余图像指相似度超过80％的图像。

所述的燃弧区域是指分割分支输出图像掩码中元素值大于0.6的元素形成的连通区域。

本发明与现有技术相比的优点和效果：

该方法首先对存在燃弧的弓网图像进行掩码标注，然后将受弓网图像及其掩码标注作为多维特征融合分割网络的数据集对网路进行训练，分割网络采用深度卷积网络，由特征提取模块、多维特征融合模块和头模块构成，在燃弧检测过程中，弓网图像通过分割网络进行前向推理，网络分割头子模块输出结果两倍上采样后所得特征图作为弓网图像的分割结果，根据分割结果判断弓网图像中是否含有燃弧，完成对弓网燃弧的检测任务。本发明在多维特征融合模块中加入深度可分离卷积与分组卷积，在极大程度保留原有信息的同时显著减少了网络的计算量，同通道注意力和空间注意力机制的加入使得网络更加关注燃弧区域特征，一定程度上提升了网络效果，训练完成后该网络能够准确地检测出弓网图像中是否发生了燃弧现象，并燃弧的像素级分割结果，对模型进行在线学习及自适应切换也能够提高网络的准确性与鲁棒性。此外，本发明方法对不同的铁路和机车情况均可以处理且可以作为燃弧能量等级分析的前级网络，实际应用过程中只需要根据具体情况改造和增强数据集，适当配置相关参数，即可实现对弓网燃弧的准确监测，具有较强的场景适应能力和可扩展性。

附图说明

图1为本发明的示意图。

图2为本发明的流程图。

具体实施方式：

实施例：

本发明的方法可用于不同电气化铁路路线和机车情况，能够对各种弓网监控视频图像进行燃弧的检测及像素级分割。

具体来说，在采用该方法对弓网燃弧进行检测分割时，首先采用电气化铁路机车车顶监控摄像头拍摄的弓网图像构成弓网图像库，并将弓网图像尺度归一化为512×512像素大小，其深度为3通道，使用LabelMe标注工具标注出图像中燃弧边界点并生成对应掩码，所有弓网图像及其掩码共同构成电气化铁路弓网燃弧数据集，数据集按照7:2:1的比例划分为训练集、测试集、验证集。然后将受弓网图像及其掩码标注作为多维特征融合分割网络的数据集对网路进行训练，分割网络采用深度卷积网络，由特征提取模块、多维特征融合模块和头模块构成，在燃弧检测过程中，弓网图像通过分割网络进行前向推理，网络分割头子模块输出结果两倍上采样后所得特征图作为弓网图像分割结果，根据分割结果判断弓网图像中是否含有燃弧，完成对弓网燃弧的检测任务。本发明在多维特征融合模块中加入深度可分离卷积与分组卷积，在极大程度保留原有信息的同时显著减少了网络的计算量，同通道注意力和空间注意力机制的加入使得网络更加关注燃弧区域特征，一定程度上提升了网络效果，训练完成后该网络能够准确地检测出弓网图像中是否发生了燃弧现象，并燃弧的像素级分割结果，对模型进行在线学习及自适应切换也能够提高网络的准确性与鲁棒性。此外，本发明方法对不同的铁路和机车情况均可以处理且可以作为燃弧能量等级分析的前级网络，实际应用过程中只需要根据具体情况改造和增强数据集，适当配置相关参数，即可实现对弓网燃弧的准确监测，具有较强的场景适应能力和可扩展性。

本发明方法可通过任何计算机编程语言(如python语言)编程实现，基于本方法的检测系统可以在任何PC或者嵌入式系统中实现弓网燃弧实时检测分割应用。