CN110516532A

CN110516532A - 基于计算机视觉的无人机铁路轨道线路识别方法

Info

Publication number: CN110516532A
Application number: CN201910625187.7A
Authority: CN
Inventors: 李晓峰; 郭玉新; 贾利民; 秦勇
Original assignee: Beijing Jiaotong University
Current assignee: Beijing Jiaotong University
Priority date: 2019-07-11
Filing date: 2019-07-11
Publication date: 2019-11-29
Anticipated expiration: 2039-07-11
Also published as: CN110516532B

Abstract

本发明提供了基于计算机视觉的无人机铁路轨道线路识别方法，属于铁路轨道线路识别技术领域。该方法利用无人机机载摄像头获取铁路轨道视频图像，并进行预处理；利用脉冲耦合神经网络的方法识别视频图像中的轨道线路；利用三阶贝兹曲线拟合的方法得到轨道线路所在的直线段或曲线段；根据轨道线路所在的直线段或曲线段计算得到无人机飞行的局部目标点。本发明通过识别铁路轨道线路，获取了铁路轨道范围，实时计算飞行的局部目标点，实现了无人机自主沿线飞行，弥补了GPS导航定位精度不足的缺陷；基于计算机视觉，采用单个高清相机对轨道线路进行识别和保持，不需要额外的高精度传感器，成本较低。可以与航位推算、GPS或北斗等信息融合，进行综合应用。

Description

基于计算机视觉的无人机铁路轨道线路识别方法

技术领域

本发明涉及铁路轨道线路识别技术领域，具体涉及一种基于计算机视觉的无人机铁路轨道线路识别方法。

背景技术

保障铁路运营环境的安全至关重要，目前我国铁路巡线工作基本依靠人工作业，西部地区铁路特别是进藏铁路线路环境恶劣、地形复杂，在无人区和高原缺氧的情况下采用传统的人工作业极为困难，而基于无人机的轨道线路自主巡线是一个很有前景的解决方案。

实现无人机自主巡线首先需要实现其自主沿线飞行，目前无人机飞行多采用GPS导航定位，但GPS位置信息由于卫星自身、信号传播过程以及地面接收设备的影响会产生一定的误差，并且铁路线路的坐标信息稀疏，无法作为实时的局部目标位置。

发明内容

本发明的目的在于提供一种基于计算机视觉的无人机铁路轨道线路识别方法，以解决上述背景技术中存在的至少一个技术问题。

为了实现上述目的，本发明采取了如下技术方案：

本发明提供的一种基于计算机视觉的无人机铁路轨道线路识别方法，该方法包括如下流程步骤：

步骤S110：利用无人机机载摄像头获取铁路轨道视频图像，并进行预处理；

步骤S120：利用脉冲耦合神经网络的方法识别所述视频图像中的轨道线路；

步骤S130：利用三阶贝兹曲线拟合的方法得到所述轨道线路所在的直线段或曲线段；

步骤S140：根据所述轨道线路所在的直线段或曲线段计算得到无人机飞行的局部目标点。

优选的，所述步骤S110中所述预处理包括：利用白平衡消除环境光的影响；根据前一帧的识别结果提取感兴趣区域；将感兴趣区域转换为单通道亮度图像。

优选的，所述白平衡处理包括：利用灰度世界法消除环境光的影响，变换后使得图像中R、G、B三个分量的平均值趋于同一个灰度值；

所述提取感兴趣区域包括：若图像为第一帧或上一帧图像没有识别结果时，取图像的下半部分区域；若上一帧图像有识别结果时，以消失点纵坐标为上界，以图像底部为下界，由两条线形形状向外侧扩展，提取识识别结果附近的梯形区域；具体的，假设h为图像高度,w为图像宽度，消失点坐标为(u₀，v₀)，左侧和右侧识别结果中纵坐标大的端点坐标分别为(x₀，h)和(x₁，h)，则梯形区域四个顶点的坐标分别为(mnx(0，x₀-60)，h)，(5u₀/6，v₀)(7u₀/6，v₀)，(min(w，x₁+60)，h)；

所述将图像转换为单通道亮度图像包括：将图像由BGR模式转为HLS模式，取其中的L分量，代表图像的亮度信息；将亮度值以4个值为一级分级量化，得到最终的单通道亮度图像。

优选的，所述步骤S120中，所述脉冲耦合神经网络方法为：利用简化的脉冲耦合神经网络迭代处理单通道亮度图像，得到像素被激发的二值图像，然后利用图像熵判断迭代处理的停止时刻。

优选的，以单通道亮度值作为馈入单元，初始神经元状态均为未激发，与权值矩阵作卷积运算计算连接单元；利用馈入单元和连接单元计算神经元内部状态，与动态阈值比较后得到输出，大于动态阈值则输出255，阈值增大，小于动态阈值则输出0，阈值减小，输出结果为亮度值大的像素被激发的二值图像；判断二值图像的熵值是否大于阈值或迭代处理的次数是否大于10次，满足其中一个条件则停止处理，否则继续迭代处理；其中，

简化的脉冲耦合神经网络模型为：

其中，t为迭代次数，像素的坐标为(i，j)，F为馈入单元，quantized_I为分级量化后的亮度信息，L为连接单元，W为大小为3×3的权值矩阵，权值大小与距离成反比，U为内部状态，Y为输出，Θ为动态阈值，β取值0.2，step取值20，V_T取值2。

优选的，所述步骤S120中，利用连通域处理，选取二值图像中面积最大的两个连通域，去除噪声点，得到轨道线路。

优选的，首先找到二值图像中的所有连通域；然后根据连通域的长宽比wh筛选出符合条件的连通域，wh＞10||wh＜0.1；最后在符合条件的连通域中选择面积最大的两个连通域作为轨道线路。

优选的，所述步骤S130中，所述的三阶贝兹曲线拟合方法为：将拟合点按纵坐标排序，确定起始点和终止点，然后计算贝兹曲线的控制点坐标，得到拟合结果；

三阶贝兹曲线的定义如式(3)所示，式中P₀为起始点，P₁和P₂为控制点，P₃为终止点，参数t正比于每两点间的欧式距离之和，Q(t)为曲线上的一点，T(t)为关于参数t的向量，M是权值矩阵，P是由起始点、终止点和控制点的矩阵；

将得到的轮廓点按纵坐标排序，其中，纵坐标最小的点作为起始点，纵坐标最大的点作为终止点，将定义转换为式(4)计算得到控制点；

P＝(T(t)M)+Q(t) (4)

然后将乘法计算转换为大量加法计算，代入参数值求得拟合结果。

优选的，所述步骤S130中，利用与上一帧识别结果之间的距离，和识别结果自身左右之间的距离，判断结果的正确性；

计算识别结果与上一次识别结果之间的距离，基于无人机的偏移判断识别结果是否在一定的移动范围内，若距离大于50像素，则判断识别结果为轨道两侧轨道轮廓类似物的干扰；

计算本次识别结果左右两条直线或曲线之间的距离，判断是否大于20像素，若大于该阈值则确认识别结果为一组铁路轨道，否则判断识别结果都在其中一侧钢轨上。

优选的，所述步骤S140具体包括：

当拟合结果为曲线时，利用最小二乘法延长所述拟合结果；利用消失点校正相机的姿态角；利用逆透视变换还原图像的正确比例；利用标准轨距对应的正确比例求得目标点距离，利用偏航角关系求得目标点角度；

利用消失点校正相机的姿态角，

式中，pitch为相机俯仰角，yaw为相机偏航角，height为图像高度，width为图像宽度，vp.x为消失点横坐标，vp.y为消失点纵坐标，dx为像素在u轴方向的尺寸，dy为像素在v轴方向的尺寸，计算可得真实的相机姿态角；

利用逆透视变换还原图像中物体的正确比例：逆透视变换过程将相机平面旋转至与铁路轨道平面平行，首先需要将图像由像素坐标系转换到相机坐标系，再乘以旋转矩阵，然后再转换到像素坐标系；其中，旋转矩阵为：

式中，

s2＝sin(-yaw)c2＝cos(-yaw)，

s3＝sin(-roll)c3＝cos(-roll)；

利用标准轨距对应比例求得目标点距离：利用偏航角等关系求得目标点角度；局部目标点取拟合结果左侧线段在鸟瞰图上纵坐标为0的点；已知标准轨距为1435mm，根据对应比例关系求得目标点距离，拟合结果为直线情况下的比例关系为scale＝1435/(r_u-l_u)，其中r_u为右侧直线横坐标，l_u为左侧直线横坐标，拟合结果为曲线情况下的比例关系为scale＝1435/|R_l-R_r|，其中R_l为左侧曲线在鸟瞰图中的半径，R_r为右侧曲线在鸟瞰图中的半径。

在鸟瞰图中，目标点与相机位置之间的角度为目标点偏离图像平面中心线的角度θ，目标点角度为：des_θ＝θ-yaw。

本发明有益效果：通过识别铁路轨道线路，获取了铁路轨道范围，实时计算飞行的局部目标点，实现了无人机自主沿线飞行，弥补了GPS导航定位精度不足的缺陷，是支撑无人机完成自主巡线的基础。基于计算机视觉，采用单个高清相机对轨道线路进行识别和保持，不需要额外的高精度传感器，成本较低。可以与航位推算、GPS或北斗等信息融合，进行综合应用。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例1所述的基于计算机视觉的无人机铁路轨道线路识别方法流程图。

图2为本发明实施例1所述的基于计算机视觉的无人机铁路轨道线路识别方法中定义的坐标系关系示意图。

图3为本发明实施例2所述的基于计算机视觉的无人机铁路轨道线路识别方法流程图。

图4为本发明实施例2中利用脉冲耦合神经网络的方法识别轨道线路的流程图。

图5为本发明实施例2中利用三阶贝兹曲线拟合得到轨道线路所在直线段或曲线段的流程图。

图6为本发明实施例2中利用消失点校正姿态角时消失点坐标和俯仰角、偏航角之间的关系示意图。

图7为本发明实施例中提取梯形感兴趣区域的示意图。

图8为本发明实施例2中逆透视变换过程的示意图。

具体实施方式

下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或模块，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、模块和/或它们的组。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解，下面将结合附图以具体实施例为例做进一步的解释说明，且实施例并不构成对本发明实施例的限定。

本领域普通技术人员应当理解的是，附图只是一个实施例的示意图，附图中的部件或装置并不一定是实施本发明所必须的。

实施例

如图1至图2所示，本发明实施例提供一种基于计算机视觉的无人机铁路轨道线路识别方法，包括如下流程步骤：

所述提取感兴趣区域包括：若图像为第一帧或上一帧图像没有识别结果时，取图像的下半部分区域；若上一帧图像有识别结果时，以消失点纵坐标为上界，以图像底部为下界，由两条线形形状向外侧扩展，提取识结果附近的梯形区域。

如图7所示，假设h为图像高度,w为图像宽度，消失点坐标为(u₀，v₀)，左侧和右侧识别结果中纵坐标大的端点坐标分别为(x₀，h)和(x₁，h)，则梯形区域四个顶点的坐标分别为(max(0，x₀-60)，h)，(5u₀/6，v₀)，(7u₀/6，v₀)，(min(w，x₁+60)，h)所述将图像转换为单通道亮度图像包括：将图像由BGR模式转为HLS模式，取其中的L分量，代表图像的亮度信息；将亮度值以4个值为一级分级量化，得到最终的单通道亮度图像。

简化的脉冲耦合神经网络模型为：

其中t为迭代次数，下标ij为像素的坐标为(i，j)，F为馈入单元，quantized_I为分级量化后的亮度信息，L为连接单元，W为大小为3×3的权值矩阵，权值大小与距离成反比，U为内部状态，Y为输出，Θ为动态阈值，β取值0.2，step取值20，V_T取值2。

P＝(T(t)M)⁺Q(t) (4)

优选的，所述步骤S140具体包括：

利用消失点校正相机的姿态角；利用逆透视变换还原图像的正确比例；利用标准轨距对应的正确比例求得目标点距离，利用偏航角关系求得目标点角度；

利用最小二乘法延长所述拟合结果；

利用消失点校正相机的姿态角，

式中，

s2＝sin(-yaw)c2＝cos(-yaw)，

s3＝sin(-roll)c3＝cos(-roll)；

实施例2

如图3所示，本发明实施例2提供一种基于计算机视觉的无人机铁路轨道线路识别方法，包括如下流程步骤：

步骤S1.通过机载摄像头获取铁路轨道视频图像，并进行预处理，包括：

(1)白平衡处理。利用灰度世界法消除环境光的影响，变换后使得图像中R、G、B三个分量的平均值趋于同一个灰度值。

(2)提取感兴趣区域。若图像为第一帧或上一帧图像没有识别结果时，取图像的下半部分区域；若上一帧图像有识别结果时，以消失点纵坐标为上界，以图像底部为下界，由两条线形形状向外侧扩展，提取识结果附近的梯形区域。

如图7所示，假设h为图像高度,w为图像宽度，消失点坐标为(u₀，v₀)，左侧和右侧识别结果中纵坐标大的端点坐标分别为(x₀，h)和(x₁，h)，则梯形区域四个顶点的坐标分别为(max(0，x₀-60)，h)，(5u₀/6，v₀)，(7u₀/6，v0)，(min(w，x₁+60)，h)。所述将图像转换为单通道亮度图像包括：将图像由BGR模式转为HLS模式，取其中的L分量，代表图像的亮度信息；将亮度值以4个值为一级分级量化，得到最终的单通道亮度图像。

(3)将图像转换为单通道亮度图像。首先，将图像由BGR模式转为HLS模式，取其中的L分量，代表图像的亮度信息，然后将亮度值以4个值为一级分级量化，得到最终的单通道亮度图像。

步骤S2.利用脉冲耦合神经网络的方法识别轨道线路，具体流程如图4所示；

首先以单通道亮度值作为馈入单元，初始神经元状态均为未激发，与权值矩阵作卷积运算计算连接单元，然后利用馈入单元和连接单元计算神经元内部状态，与动态阈值比较后得到输出，大于动态阈值则输出255，阈值增大，小于动态阈值则输出0，阈值减小，输出结果为亮度值大的像素被激发的二值图像。然后判断图像的熵值是否大于阈值或迭代处理的次数是否大于10次，满足其中一个条件则停止处理，否则继续迭代处理。简化的脉冲耦合神经网络模型如式(1)。

步骤S2.利用脉冲耦合神经网络的方法识别轨道线路的后续步骤连通域处理，首先找到二值图像中的所有连通域，然后根据连通域的长宽比η筛选出符合条件的连通域，如式(2)所示。最后在符合条件的连通域中选择面积最大的两个作为轨道形状的轮廓。

η＞10||η＜0.1 (2)

步骤S3.利用三阶贝兹曲线拟合的方法得到轨道线路所在直线段或曲线段；具体流程如图5所示。

三阶贝兹曲线的定义如式(3)所示，式中P₀为起始点，P₁和P₂为控制点，P₃为终止点，参数t正比于每两点间的欧式距离之和，Q(t)为曲线上的一点，T(t)为关于参数t的向量，M是权值矩阵，P是由起始点、终止点和控制点的矩阵。

首先将得到的轮廓点按纵坐标排序，其中纵坐标最小的点作为起始点，纵坐标最大的点作为终止点，将定义转换为式(4)计算得到控制点。

P＝(T(y)M)⁺Q(t) (4)

然后将乘法计算转换为大量加法计算，代入参数值求得近似拟合结果。

步骤S3.利用三阶贝兹曲线拟合方法的后续步骤为进行识别结果的再确认，包括：

(1)计算识别结果与上一次识别结果之间的距离，基于无人机的轻微偏移判断识别结果是否在一定的移动范围内，若距离大于50像素，则判断识别结果为轨道两侧诸如挡土墙、路基边缘等类似轨道轮廓的物体的干扰；

(2)计算本次识别结果左右两条直线或曲线之间的距离，判断是否大于20像素，若大于该阈值则确认识别结果为一组铁路轨道，否则判断识别结果都在其中一侧钢轨上。

步骤S4.通过机载相机的姿态角等关系计算得到无人机飞行的局部目标点，包括：

(1)延长拟合结果。当拟合结果为曲线时，无法简单确定延长后的切线斜率，在鸟瞰图中，可将拟合结果看作圆曲线，利用最小二乘法拟合圆即可得到曲线的延长结果。

(2)利用消失点校正相机的姿态角，消失点坐标和相机姿态角之间的关系如图6所示。由图可以得到式(5)，式中pitch为相机俯仰角，yaw为相机偏航角，height为图像高度，width为图像宽度，vp.x为消失点横坐标，vp.y为消失点纵坐标，dx为像素在u轴方向的尺寸，dy为像素在v轴方向的尺寸，计算可得真实的相机姿态角。

(3)利用逆透视变换还原图像中物体的正确比例。如图8所示，逆透视变换过程将相机平面旋转至与铁路轨道平面平行，首先需要将图像由像素坐标系转换到相机坐标系，再乘以旋转矩阵，然后再转换到像素坐标系。其中旋转矩阵为式(6)。

式中，

s2＝sin(-yaw)c2＝cos(-yaw)

s3＝sin(-roll)c3＝cos(-roll)

(4)利用标准轨距对应比例求得目标点距离，利用偏航角等关系求得目标点角度。局部目标点取拟合结果左侧线段在鸟瞰图上纵坐标为0的点。已知标准轨距为1435mm，根据对应比例关系求得目标点距离，拟合结果为直线和曲线情况下比例关系分别为式(7)和式(8)。

scale＝1435/(r_u-l_u) (7)

scale＝1435/|R_l-R_r| (8)

式中r_u为右侧直线横坐标，l_u为左侧直线横坐标，r_l为左侧曲线在鸟瞰图中的半径，R_r为右侧曲线在鸟瞰图中的半径。

在鸟瞰图中，目标点与相机位置之间的角度为目标点偏离图像平面中心线的角度θ，但在原图中，还要考虑相机本身存在的偏航角yaw，目标点角度为式(9)。

des_θ＝θ-yaw (9)

所述步骤利用并行编程提高处理速度，满足无人机飞行过程中实时获取飞行目标的要求。

综上所述，本发明实施例提出的方法通过识别铁路轨道线路，获取了铁路轨道范围，实时计算飞行的局部目标点，实现了无人机自主沿线飞行，弥补了GPS导航定位精度不足的缺陷，是支撑无人机完成自主巡线的基础。基于计算机视觉，采用单个高清相机对轨道线路进行识别和保持，不需要额外的高精度传感器，成本较低；可以与航位推算、GPS或北斗等信息融合，进行综合应用。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，包括如下流程步骤：

2.根据权利要求1所述的基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，所述步骤S110中所述预处理包括：利用白平衡消除环境光的影响；根据前一帧的识别结果提取感兴趣区域；将感兴趣区域转换为单通道亮度图像。

3.根据权利要求2所述的基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，

所述白平衡处理包括：利用灰度世界法消除环境光的影响，变换后使得图像中R、G、B三个分量的平均值趋于同一个灰度值；

所述提取感兴趣区域包括：若图像为第一帧或上一帧图像没有识别结果时，取图像的下半部分区域；若上一帧图像有识别结果时，以消失点纵坐标为上界，以图像底部为下界，由两条线形形状向外侧扩展，提取识识别结果附近的梯形区域；具体的，假设h为图像高度,w为图像宽度，消失点坐标为(u₀，v₀)，左侧和右侧识别结果中纵坐标大的端点坐标分别为(x₀，h)和(x₁，h)，则梯形区域四个顶点的坐标分别为(max(0，x₀-60)，h)，(5u₀/6，v₀)，(7u₀/6，v₀)，(min(w，x₁+60)，h)；

4.根据权利要求1所述的基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，所述步骤S120中，所述脉冲耦合神经网络方法为：利用简化的脉冲耦合神经网络迭代处理单通道亮度图像，得到像素被激发的二值图像，然后利用图像熵判断迭代处理的停止时刻。

5.根据权利要求4所述的基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，以单通道亮度值作为馈入单元，初始神经元状态均为未激发，与权值矩阵作卷积运算计算连接单元；利用馈入单元和连接单元计算神经元内部状态，与动态阈值比较后得到输出，大于动态阈值则输出255，阈值增大，小于动态阈值则输出0，阈值减小，输出结果为亮度值大的像素被激发的二值图像；判断二值图像的熵值是否大于阈值或迭代处理的次数是否大于10次，满足其中一个条件则停止处理，否则继续迭代处理；其中，

简化的脉冲耦合神经网络模型为：

6.根据权利要求1所述的基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，所述步骤S120中，利用连通域处理，选取二值图像中面积最大的两个连通域，去除噪声点，得到轨道线路。

7.根据权利要求6所述的基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，首先找到二值图像中的所有连通域；然后根据连通域的长宽比η筛选出符合条件的连通域，η＞10||η＜0.1；最后在符合条件的连通域中选择面积最大的两个连通域作为轨道线路。

8.根据权利要求1所述的基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，所述步骤S130中，所述的三阶贝兹曲线拟合方法为：将拟合点按纵坐标排序，确定起始点和终止点，然后计算贝兹曲线的控制点坐标，得到拟合结果；

P＝(T(t)M)⁺Q(t) (4)

9.根据权利要求8所述的基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，所述步骤S130中，利用与上一帧识别结果之间的距离，和识别结果自身左右之间的距离，判断结果的正确性；

10.根据权利要求9所述的基于计算机视觉的无人机铁路轨道线路识别方法，其特征在于，所述步骤S140具体包括：

利用消失点校正相机的姿态角，

式中，

s2＝sin(-yaw)c2＝cos(-yaw)，

s3＝sin(-roll)c3＝cos(-roll)；