CN111626170B

CN111626170B - 一种铁路边坡落石侵限检测的图像识别方法

Info

Publication number: CN111626170B
Application number: CN202010432481.9A
Authority: CN
Inventors: 刘孜学; 王富斌; 严瑾; 余超; 李高丰; 王学林; 谢联莲; 苏恺; 虞凯; 樊伟; 杨捷; 杨岗; 易立富; 高柏松
Original assignee: China Railway Eryuan Engineering Group Co Ltd CREEC
Current assignee: China Railway Eryuan Engineering Group Co Ltd CREEC
Priority date: 2020-05-20
Filing date: 2020-05-20
Publication date: 2023-05-23
Anticipated expiration: 2040-05-20
Also published as: CN111626170A

Abstract

本发明公开了铁路异物侵限领域的一种铁路边坡落石侵限检测的图像识别方法，方法的步骤包括：A，获取视频序列图像，并标记出包含铁轨的限界区域；B，基于预设的落石侵限检测图像识别模型，识别出所述限界区域里是否有落石，其中，落石侵限检测图像识别模型是基于YOLOv3算法对图像中的落石进行识别。本发明的方法的有益效果在于，采用本发明的模型，在实时落石识别时，准确率较高，另外，充分利用了YOLOv3算法中的先验框，无需对铁轨图像进行前后背景分离，就能快速进行落石的识别，识别方法具备较高的可靠性、稳定性和准确性。

Description

一种铁路边坡落石侵限检测的图像识别方法

技术领域

本发明涉及铁路异物侵限领域，特别是一种铁路边坡落石侵限检测的图像识别方法。

背景技术

近年来我国的铁路建设进程迅速发展，铁路客货运输量不断增加，列车运行速度不断提高，列车在露天环境中高速行驶时触发行车安全问题的环境因素也明显增加，给铁路安全监控带来巨大的压力。其中铁路异物侵限是一个重要且亟待解决的安全问题，严重影响到列车的运行安全。

异物侵限是指铁路线路周边受滑坡、崩塌落石及洪水等自然灾害影响造成的沙土落石、滞留在道上作业的工作人员及工器具、动物、行人等影响正常行车的障碍物侵入铁路界限范围内，危及行车安全。我国普速铁路特别是山区铁路其线路周边危岩耸立，易发生边坡落石侵入铁路界限内的自然灾害事件，存在引发重大行车事故的安全隐患。

目前我国对边坡落石的监测技术人仍停留在人工定期巡检，配合对易发生落石的危险山体采用边坡围岩、支挡的围护措施来监测和防护边坡落石，这种监测手段不仅耗费人力物力，而且无法有效预警和避免铁路轨道边坡落石侵限突发事故。此类主动避免边坡落石的方式虽能一定程度上避免异物入侵事故，但该方法和依靠列车司机反应的被动停车方式同样达不到自动识别、自动预警的目的，单一且可靠性不高。

现有技术中，也有相关基于视觉分析的山区铁路边坡落石检测方法提出，例如公开号为CN105809679B的发明专利“一种基于视觉分析的山区铁路边坡落石检测方法”，该专利方法步骤为：首先识别铁轨区域，然后对铁轨区域内图像进行分割，检测出前景目标，最后通过深度学习对目标进行分类，剔除干扰目标。具有视频分析方法的检测范围广、成本低等优点，同时提高了落石图像检测的准确性。但是，由于该方案需要对图像进行前后背景分离，并且采用深度学习的分类方法，因此对图像处理的流程较多，处理的速度较低，需要进一步改进。

发明内容

本发明改进了上述落石识别的算法，采用YOLOv3算法，利用了YOLOv3算法中的先验框，无需对铁轨图像进行前后背景分离，并且对超参数进行了针对应用场景的微调，提出了一种铁路边坡落石侵限检测的图像识别方法。

为了实现上述发明目的，本发明提供了以下技术方案：

一种铁路边坡落石侵限检测的图像识别方法，包括以下步骤：

A，获取视频序列图像，并标记出包含铁轨的限界区域；

B，基于预设的落石侵限检测图像识别模型，识别出限界区域里是否有落石，落石侵限检测图像识别模型基于YOLOv3算法对图像中的落石进行识别；

步骤B包括以下步骤：

S11，通过预设的落石侵限检测图像识别模型，判断限界区域内的移动物体是否为列车，如果不是，则执行步骤S12；

S12，在视频序列图像中，采用检测框标记限界区域内的移动物体，检测框根据YOLOv3网络算法生成，并获取检测框的中心点坐标；

S13，在视频序列图像中，根据检测框的中心点坐标，判断限界区域内的移动物体是否丢失，如果没有丢失，则执行步骤S14；

S14，在视频序列图像中，根据检测框的中心点坐标，判断限界区域内的移动物体是否静止，如果是静止的，则执行步骤S15；

S15，通过落石侵限检测图像识别模型，判断限界区域内的移动物体是否为落石。

作为本发明的优选方案，落石侵限检测图像识别模型是通过“列车”目标图片和“落石”目标图片对YOLOv3网络进行训练得到的，并对YOLOv3网络的超参数进行了设置，设置包括：

输出层节点个数设置为类别个数，类别个数为4，包括列车、行人、落石、工作人员四个类别；

设置yolo层random＝1；设置ignore_thresh＝0.7，ignore_thresh是参与计算的IOU阈值大小；设置训练步数steps为70000步，其中，前30000步学习率以0.0001收敛，后40000步学习率以0.00001收敛；设置saturation＝1.5；设置exposure＝1.5；设置hue＝0.1；设置batch/subdivision＝4。

作为本发明的优选方案，落石侵限检测图像识别模型的训练包括以下步骤：

第一步，将训练集图像进行预处理，获取预处理后的图像，预处理包括图像预处理、数据预处理和数据增强；

第二步，对预处理后的图像进行卷积提取特征；

第三步，边界值预测；

第四步，类别预测，输出识别概率。

作为本发明的优选方案，步骤S11包括以下步骤：

将视频序列图像输入落石侵限检测图像识别模型，输出列车识别得分结果；

当列车识别得分结果大于预设的列车识别阈值，则判断视频序列图像限界区域内的移动物体是列车，否则就不是列车。

作为本发明的优选方案，步骤S15包括以下步骤：

将含有限界区域内的静止物体的图像输入落石侵限检测图像识别模型，输出落石识别得分结果；

当落石识别得分结果大于预设的落石识别阈值，则判断限界区域内的静止物体是落石，否则就不是落石。

作为本发明的优选方案，步骤S13包括以下步骤：

令y_i＝y_right＝y_left，若x_left-m＜x_i＜x_right-m，判定为限界区域内的移动物体没有丢失，(x_i,y_i)是检测框的中心点坐标，i为视频序列图像的序列号，限界区域左侧边缘线的像素坐标矩阵为[x_left-m,y_left]，右侧边缘线的像素坐标矩阵为[x_right+m，y_right]，m是划定限界区域时，横坐标平移的像素值，x_left是铁轨左侧内边缘线的像素横坐标，y_left是铁轨左侧内边缘线的像素纵坐标，x_right是铁轨右侧内边缘线的像素横坐标，y_right是铁轨右侧内边缘线的像素纵坐标。

作为本发明的优选方案，步骤S14包括以下步骤：

获取视频序列图像中检测框的中心点坐标；

获取未丢失的限界区域内的移动物体首次出现时相应的检测框的中心点坐标(x₁,y₁)；

获取视频序列图像中第i帧图像中，未丢失的限界区域内的移动物体相应的检测框的中心点坐标(x_i,y_i)，其中i为视频序列图像的序列号，i＝2,3……K，K为视频序列图像的总数；

计算检测框的中心点坐标(x_i,y_i)和检测框的中心点坐标(x₁,y₁)之间的欧氏距离，计算公式为：

当d_i＝0时，则未丢失的限界区域内的移动物体在序号为i的帧图像中处于静止状态。

基于相同的构思，还提出了一种基于图像的铁路限界区域识别装置，包括至少一个处理器，以及与至少一个处理器通信连接的存储器；存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述任一项的方法。

与现有技术相比，本发明的有益效果：

本发明提出的一种铁路边坡落石侵限检测的图像识别方法，该方法利用落石侵限检测图像识别模型对图像中的落石进行识别，由于落石侵限检测图像识别模型是通过大量的落石图像预先训练的到，因此在实时识别时，准确率较高，另外，落石侵限检测图像识别模型是通过YOLOv3算法训练得到的，充分利用了YOLOv3算法中的先验框，无需对铁轨图像进行前后背景分离，就能快速进行落石的识别，解决了铁路背景图像复杂、落石分类难、难以快速准确识别等问题，识别方法具备较高的可靠性、稳定性和准确性。

附图说明：

图1为本发明实施例1中一种铁路边坡落石侵限检测的图像识别方法的流程图；

图2为本发明实施例1中检测落石、列车的图像识别算法示意图；

图3为本发明实施例1中落石数据集制作、图像识别网络训练示意图。

具体实施方式

下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例，凡基于本发明内容所实现的技术均属于本发明的范围。

实施例1

一种铁路边坡落石侵限检测的图像识别方法的流程图如图1所示，该方法的步骤包括：

A，获取视频序列图像，并标记出包含铁轨的限界区域；

B，基于预设的落石侵限检测图像识别模型，识别出所述限界区域里的落石。

其中，步骤A包括以下步骤：

步骤1：通过铁路监控视频得到视频序列图像，并且将视频序列图像拆分成帧图像作为输入，并调整每帧图像的像素尺寸为(m×n)，其中，m是每帧图像的像素点的横坐标，n是每帧图像的像素点的纵坐标，作为优选方案，每帧图像的像素尺寸为500×375。

步骤2：包括但不限于使用霍夫线检测识别铁路场景。使用霍夫线检测识别铁路场景的步骤包括：

步骤2-1：对帧图像进行边缘二值化处理。

步骤2-2：处理完的单通道二值化帧图片作为霍夫线变换的输入，进而检测到铁路背景图片中两条铁轨的内外边缘共4条线及其像素坐标矩阵。

步骤3：根据铁轨内边缘两条线及其像素坐标矩阵标记限界区域。具体步骤为：

步骤3-1：选取步骤2-2中得到的2条内边缘线的像素坐标矩阵，设左侧内边缘线的像素坐标矩阵为[x_left,y_left]，设右侧内边缘线的像素坐标矩阵为[x_right,y_right]。

步骤3-2：维持左侧内边缘线在图像坐标系中的纵坐标不变，其横坐标向左平移m个像素，此时新的左侧内边缘线的像素坐标矩阵为[x_left-m,y_left]。

步骤3-3：同理，维持右侧内边缘线在图像坐标系中的纵坐标不变，其横坐标向右平移m个像素，此时新的右侧内边缘线的像素坐标矩阵为[x_right+m,y_right]。

步骤3-4：x_left-m和x_right+m两条新的内边缘线围起来的区域为限界区域。

作为优选方案，当铁路线路为直线时，m＝(X₀-L₀)AA'/2L₀ mm，其中，X₀是标准轨距铁路的建筑物基本限界长度基准值，L₀是轨距值，L₀＝1435mm，AA'＝x_right-x_left，表示在图像坐标系中轨距的像素距离。通常当铁路线路为直线时，X₀＝4880mm，L₀＝1435mm，故m＝1.2·(x_right-x_left)。

当铁路线路为曲线时，m＝(X-L)·AA'/2L，X＝X₀+2W，X₀是标准轨距铁路的建筑物基本限界长度基准值，L是轨距，W是线路极限弯曲情况下单侧加宽量，W取W1和W2中较大的值，W1是轨道曲线内侧加宽量，W2是轨道曲线外侧加宽量，AA'＝x_right-x_left，表示在图像坐标系中轨距的像素距离。当加宽量W＝553mm，轨距L＝1435mm时，标准轨距铁路的建筑物基本限界长度的最大值为X_max＝4880+2W＝4880+1106＝5986mm。因此，X取值范围是[4880,5986]，单位mm。

特别的，还需要考虑到左侧内边缘线横坐标向左平移m个像素后移出了图像的区域，因此，如果x_left-m≤0，则令x_left-m＝0。

同理，右侧内边缘线横坐标向右平移m个像素后可能移出图像的区域，因此，如果x_right+m≥500，则令x_right+m＝500(500是每帧图像的像素点为500×375时，横坐标的最大值)。

其中，步骤B包括以下步骤：

S11，通过训练得到的落石侵限检测图像识别模型，判断所述限界区域内的移动物体是否为列车，如果不是，则执行步骤S12；

S12，在所述视频序列图像中，采用检测框标记所述限界区域内的移动物体，所述检测框根据YOLOv3网络算法生成，并获取所述检测框的中心点坐标；

S13，在所述视频序列图像中，根据所述检测框的中心点坐标，判断所述限界区域内的移动物体是否丢失，如果没有丢失，则执行步骤S14；

S14，在所述视频序列图像中，根据所述检测框的中心点坐标，判断所述限界区域内的移动物体是否静止，如果是静止的，则执行步骤S15；

S15，通过所述落石侵限检测图像识别模型，判断所述限界区域内的移动物体是否为落石。

作为优选方案，落石侵限检测图像识别模型是通过“列车”目标图片和“落石”目标图片对YOLOv3网络进行训练得到的，并对YOLOv3网络的超参数进行了设置，所述设置包括：

针对输出层节点个数改为4(代表类别个数，列车、行人、落石、工作人员)；

设置yolo层random＝1，目的是增加不同的分辨率，或者增大图片本身分辨率；

设置ignore_thresh＝0.7，ignore_thresh指得是参与计算的IOU阈值大小。当预测的检测框与ground true的IOU大于ignore_thresh的时候，参与loss的计算，进而修正隐藏层参数；这样修改的目的是由于我们数据集中落石很多，很多比较小的落石并不影响到行车安全，也就不需要参与loss训练；

设置训练步数(steps＝30000，40000)，其中，前30000步学习率以0.0001收敛，后40000步学习率以0.00001收敛；

设置saturation＝1.5，增加饱和度以增加训练样本；

设置exposure＝1.5，增加曝光以增加训练样本；

设置hue＝0.1通过调整色调来增加训练样本；

设置batch/subdivision＝4；为一次性读取输入图片张数，以便适应该场景下落实检测。

其中，步骤S11包括以下步骤：

将视频序列图像输入已经训练好的落石侵限检测图像识别模型，输出列车识别得分结果；

当所述列车识别得分结果大于预设的列车识别阈值，此时，设定的列车识别阈值为0.7，则判断限界区域内的移动物体是列车，表示该时刻下行车正常，无需报警，继续处理下一帧图片；否则就不是列车。

步骤S15包括以下步骤：

将含有限界区域内的物体的图像输入训练好的落石侵限检测图像识别模型，输出落石识别得分结果；

当所述落石识别得分结果大于预设的落石识别阈值，此时，设定的列车识别阈值为0.7，则判断限界区域内的静止物体是落石，表示有理由相信该物体为落石，影响行车安全，直接报警，否则就不是落石。

步骤S12是基于以下思路实现的：

在Yolov1网络算法中，输入图片划分为S*S的栅格，每个栅格负责检测中心落在该栅格中的物体。每一个栅格预测B个检测框，以及这些检测框的置信度。置信度反映了该栅格是否含有物体，以及这个检测框的坐标预测有多准。Yolov1网络算法直接回归检测框的宽、高，因此预测精度有限，学习难度较高。所以在Yolov2网络算法中，改进为回归基于先验框的变化值，这样网络的学习难度降低，整体精度提升不小。Yolov3沿用了Yolov2中关于检测框的技巧，并且使用k-means算法对数据集中的标签框进行聚类，得到类别中心点的9个框，作为先验框。在Yolov3网络算法的设计中，还借鉴了特征金字塔的思想，小尺寸特征图用于检测大尺寸物体，而大尺寸特征图检测小尺寸物体。

Yolov3总共输出3个特征图，第一个特征图下采样32倍，第二个特征图下采样16倍，第三个下采样8倍。每个特征图的每个栅格中，都配置3个不同的先验框，所以得到最后三个特征图。三张特征图就是整个Yolo输出的检测结果，检测框位置(4维)、检测置信度(1维)、类别(4维)都在其中。检测框位置用像素坐标值(x，y，w，h)表示，x、y分别为检测框中心点的坐标值；w、h为检测框的宽和高。检测置信度即判断概率值score，当进行“列车”识别时，score为列车识别概率值，当进行“落石”识别时，score为落石识别概率值。后续的判断中，分别以该检测框作为限界区域内移动物体判断的依据。

在落石判断之前，首先进行了限界区域内的移动物体是否为列车的判断，其次，进行了限界区域内的移动物体是否丢失的判断，并且还判断了限界区域内的移动物体是否静止，也就是在落石识别之前，对输入的视频序列图像进行了筛选，减少了用于识别的图像，提高了识别的效率。

S13包括以下步骤：

令y_i＝y_right＝y_left，若x_left-m＜x_i＜x_right-m时，判定为所述限界区域内的移动物体没有丢失，(x_i,y_i)是所述检测框的中心点坐标，i为视频序列图像的序列号，限界区域左侧内边缘线的像素坐标矩阵为[x_left-m,y_left]，右侧内边缘线的像素坐标矩阵为[x_right+m,y_right]，m是划定所述限界区域时，横坐标平移的像素值，其中，左侧内边缘线的像素坐标矩阵为[x_left,y_left]，设右侧内边缘线的像素坐标矩阵为[x_right,y_right]。如果该移动图像丢失，则说明该移动物体已经落到限界区域以外，不会对铁路交通造成威胁，则不做是否为落石的判断，如果该移动物体没有丢失，则说明该移动物体在限界区域，需要进行识别。当视频序列图像中有多个移动物体时，将分别对每个物体进行跟踪判断。

S14包括以下步骤：

获取视频序列图像中第i帧图像中，未丢失的限界区域内的移动物体相应的检测框的中心点坐标(x_i,y_i)，其中i为所述视频序列图像的序列号，i＝2,3……K；

当d_i＝0时，则未丢失的所述限界区域内的移动物体在序号为i的帧图像中处于静止状态，否则，该移动物体仍然处于移动状态，有可能移出限界区域。对未丢失的移动物体和静止物体，均要进行是否是落石的判断。

用于落石识别的落石侵限检测图像识别模型的训练过程如图2所示，41为数据集制作，根据铁路侵限检测的需要数据集可以是落石、行人、列车等，42为被训练的目标检测网络模型。图3为数据集制作的步骤，首先使用labelimg软件对帧图片中的检测物(可以是落石、行人、列车等)进行人工标记，标记的主要信息有(x_min,y_min,x_max,y_max,label)；训练集用于训练神经网络，验证集用于改进网络，测试集测试网络的泛化能力。

图3中还给出了根据训练集训练得到落石侵限检测图像识别模型的过程，训练集图像依次通过图像预处理、卷积提取特征、边界值预测和类别预测，输出识别概率。具体步骤为：

第一步，图像预处理。包括了步骤：将训练集图像输入预处理函数，并完成数据增强。该预处理函数处理包括图像的预处理和数据预处理，并定义了输入图像的大小、采样的方式，预处理函数主要用于批量剪切图片、图片灰度处理、二值化处理、缩放处理、丰富数据等操作。当样本量比较少时候，把已有的图翻转，平移，雾化，去燥等方法，增加用于训练的样本量。数据增强是基于yolov3算法，采用了随机水平翻转、随机裁剪、随机旋转来增加数据的多样性和鲁棒性。

第二步，卷积提取特征。深度学习的方式都是通过卷积提取特征，yolov3提取卷积特征使用的基网络是darknet53，该网络有53层卷积层，yolov3借鉴了残差网络Residual一起来提取特征。

第三步，边界值预测。边界值预测对应有2中不同的方式，一种是基于yolo和SSD回归的方式，另一种是RCNN系列边界框预测的方式。

基于yolo和SSD回归的方式，实现边界值预测的步骤包括：

首先，将输入图片分为S*S个网格，每一个网格单元格检测中心点落在该格子内的目标；

其次，每一个网格单元格会预测B个边界框(bounding box)以及边界框的置信度(confidence score)，还要给出预测出C个类别概率值；

最后，将所有的网格生成的检测框使用NMS算法(非极大值抑制)输入筛选过的检测边界框。

第四步，多数网络在边界框预测的同时进行了类别的预测；分类部分利用已经获得的建议框，通过全连接层和softmax计算每一个建议框的类别并输入其概率值，yolov3在卷积层之后通过连接一个全连接层和softmax进行类别的预测和边界框预测。

以上所述，仅为本发明具体实施方式的详细说明，而非对本发明的限制。相关技术领域的技术人员在不脱离本发明的原则和范围的情况下，做出的各种替换、变型以及改进均应包含在本发明的保护范围之内。

Claims

1.一种铁路边坡落石侵限检测的图像识别方法，其特征在于，包括以下步骤：

A，获取视频序列图像，并标记出包含铁轨的限界区域；

B，基于预设的落石侵限检测图像识别模型，识别出所述限界区域里是否有落石，所述落石侵限检测图像识别模型基于YOLOv3算法对图像中的落石进行识别；

所述步骤B包括以下步骤：

S11，通过预设的落石侵限检测图像识别模型，判断所述限界区域内的移动物体是否为列车，如果不是，则执行步骤S12；

S15，通过所述落石侵限检测图像识别模型，判断所述限界区域内的移动物体是否为落石；

所述步骤S13包括以下步骤：

令y_i＝y_right＝y_left，若x_left-m＜x_i＜x_right-m，判定为所述限界区域内的移动物体没有丢失，所述(x_i,y_i)是所述检测框的中心点坐标，i为所述视频序列图像的序列号，所述限界区域左侧边缘线的像素坐标矩阵为[x_left-m,y_left]，右侧边缘线的像素坐标矩阵为[x_right+m,y_right]，m是划定所述限界区域时，横坐标平移的像素值，x_left是铁轨左侧内边缘线的像素横坐标，y_left是铁轨左侧内边缘线的像素纵坐标，x_right是铁轨右侧内边缘线的像素横坐标，y_right是铁轨右侧内边缘线的像素纵坐标；

所述步骤S14包括以下步骤：

获取所述视频序列图像中检测框的中心点坐标；

获取未丢失的所述限界区域内的移动物体首次出现时相应的检测框的中心点坐标(x₁,y₁)；

获取所述视频序列图像中第i帧图像中，未丢失的所述限界区域内的移动物体相应的检测框的中心点坐标(x_i,y_i)，其中i为所述视频序列图像的序列号，i＝2,3……K，K为所述视频序列图像的总数；

计算所述检测框的中心点坐标(x_i,y_i)和所述检测框的中心点坐标(x₁,y₁)之间的欧氏距离，计算公式为：

当d_i＝0时，则未丢失的所述限界区域内的移动物体在序号为i的帧图像中处于静止状态。

2.如权利要求1所述的一种铁路边坡落石侵限检测的图像识别方法，其特征在于，所述落石侵限检测图像识别模型是通过“列车”目标图片和“落石”目标图片对YOLOv3网络进行训练得到的，并对所述YOLOv3网络的超参数进行了设置，所述设置包括：

输出层节点个数设置为类别个数，所述类别个数为4，包括列车、行人、落石、工作人员四个类别；

3.如权利要求1所述的一种铁路边坡落石侵限检测的图像识别方法，其特征在于，所述落石侵限检测图像识别模型的训练包括以下步骤：

第一步，将训练集图像进行预处理，获取预处理后的图像，所述预处理包括图像预处理、数据预处理和数据增强；

第二步，对预处理后的图像进行卷积提取特征；

第三步，边界值预测；

第四步，类别预测，输出识别概率。

4.如权利要求1所述的一种铁路边坡落石侵限检测的图像识别方法，其特征在于，所述步骤S11包括以下步骤：

将所述视频序列图像输入所述落石侵限检测图像识别模型，输出列车识别得分结果；

当所述列车识别得分结果大于预设的列车识别阈值，则判断所述视频序列图像限界区域内的移动物体是列车，否则就不是列车。

5.如权利要求1所述的一种铁路边坡落石侵限检测的图像识别方法，其特征在于，所述步骤S15包括以下步骤：

将含有所述限界区域内的静止物体的图像输入所述落石侵限检测图像识别模型，输出落石识别得分结果；

当所述落石识别得分结果大于预设的落石识别阈值，则判断所述限界区域内的静止物体是落石，否则就不是落石。

6.一种铁路边坡落石侵限检测的图像识别装置，其特征在于，包括至少一个处理器，以及与所述至少一个处理器通信连接的存储器；所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至5中任一项所述的方法。