一种高速铁路接触网吊弦部件的图片识别方法
技术领域
本发明涉及了一种识别高速铁路接触网图像处理方法,尤其是涉及了一种高速铁路接触网吊弦部件的图像识别方法。
背景技术
高速铁路接触网巡检系统通过对吊弦部件的针对性拍摄虽然可通过获取大量吊弦图片,但仍需要人工翻阅所有吊弦图片,来判断吊弦的状态。这样的操作模式耗费大量的时间和人工成本,且容易受到工作人员知识、经验等自身条件因素的影响。因此,如果能够在高速铁路接触网巡检系统中实现高速铁路接触网重要部件的定位和识别,对于高速铁路接触网巡检具有重要意义。借助于图像处理技术对高速铁路巡检系统拍摄的吊弦部件图片进行识别是实现吊弦部件状态自动识别的关键一步,也是亟需解决的难题之一。
发明内容
为了解决背景技术中的问题,本发明提出了一种高速铁路接触网吊弦部件的图像识别方法,能高效定位吊弦部件的位置并具有良好的稳定性。
本发明的技术方案包括以下步骤:
本发明主要包括利用训练集图片训练得到高速铁路接触网吊弦部件检测模型、以及利用该模型对训练集中不包含的高速铁路接触网图片进行吊弦部件定位结果预测这两个过程。
方法包括以下步骤:
1)采集高速铁路接触网图像中包含吊弦部件的样本图片,样本图片包含完整的高速铁路接触网吊弦部件,吊弦部件具体分为不同产品型号的多种类别,具体可以例如为“德系吊弦”和“日系吊弦”两种类型;
具体地所述样本图片中的吊弦部件完整地包括上部连接、中部绞线和下部连接的三个部分。其中“德系吊弦”、“日系吊弦”按比例1:1进行采集。
2)遍历采集的样本图片并统一缩放,以0.4的缩放比例对样本图片的长宽进行调整,缩放后的样本图片利用标注工具对样本图片中存在的不同产品型号的多种类别的吊弦部件进行真实定位框标注,具体实施即对“德系吊弦”、“日系吊弦”两种类型进行标注,得到吊弦部件的类别和其在样本图片上的真实定位框,从而构成训练集,训练集内的样本图片均为同一固定大小;
3)训练网络的结构描述:将训练集的样本图片输入设计构建的训练网络进行训练,获得高速铁路接触网吊弦部件检测模型;
4)利用高速铁路接触网吊弦部件检测模型对待测高速铁路接触网图片进行吊弦部件定位结果预测。
所述的高速铁路接触网图像中包含吊弦部件的样本图片是指在铁路巡检车车厢上部安装摄像头,以高速铁路接触网吊弦部件作为目标物,正对目标物进行定点触发拍摄采集获得的图片。
所述的训练网络包含特征提取模块、粗略调整模块、传输连接模块和精细调整模块,其中粗略调整模块和精细调整模块各自引出粗略调整损失函数和精细调整损失函数通过反向传播对训练网络的网络参数进行监督学习,具体包括有:
3.1)采用VGG16基础网络的特征提取部分作为特征提取模块,特征提取模块并利用VGG16基础网络的初始权重对输入网络的训练集图片依次进行5次固定大小的卷积操作和固定步长的下采样处理,输出得到四幅不同尺度的特征图;
3.2)然后在四幅特征图上进行先验框设置,利用粗略调整模块对先验框进行前景、背景概率预测获得前景、背景分类概率值,保留并调整前景分类概率值大于0.5的先验框,得到四幅特征图上的粗略调整定位框;
3.3)对于四幅特征图依次进行高低层特征图信息融合,传输连接模块通过权重卷积操作完成前景、后景特征信息与吊弦部件特征信息之间的信息转换(粗略调整模块里利用的信息是框里的是前景还是背景的信息,精细调整模块利用的信息是框里的是不是吊弦、是哪类吊弦的信息,因此进行转换),获得精细调整模块所需要的四幅吊弦部件特征信息图;
3.4)在四幅吊弦部件特征信息图上映射步骤3.2)中获得的粗略调整定位框,由精细调整模块进行权重卷积操作得到对粗略调整定位框的类别预测概率值,选择类别预测概率值最大对应的类别作为该粗略调整定位框的预测类别,并在粗略调整定位框的基础上进行精细调整,获得精细调整框;
3.5)损失函数+监督学习:将步骤3.2)获得的前景、背景分类概率值和粗略调整定位框以及步骤3.4)获得的精细调整定位框分别带入各自的损失函数进行损失函数值的计算,并根据粗略调整损失函数的反向传播来更新特征提取模块的网络参数、粗略调整模块的网络参数;根据精细调整损失函数的反向传播来更新传输连接模块的网络参数、精细调整模块的网络参数;
3.6)重复上述步骤对训练集的样本图片按照固定学习率、固定训练次数,完成训练网络的网络参数更新,保留训练网络的结构和网络参数,最终训练获得高速铁路接触网吊弦部件检测模型。
关于特征图的描述所述步骤3.1)中,VGG16基础网络对输入的图片I进行连续5次的由卷积和下采样依次连接构成的组合操作,以第2次卷积操作及其下采样处理后获得的特征提取图作为粗略调整模块输出的第1幅特征图;按顺序将第3、4、5次卷积操作及其各自下采样处理后获得的特征提取图作为粗略调整模块输出的第2、3、4幅特征图。
假设输入图片I的像素大小为M*N,第1幅特征图经过2次下采样处理(卷积操作不改变特征图大小),其大小为M/4像素*N/4像素;第2幅特征图经过3次下采样处理,其大小为M/8像素*N/8像素;同理,第3、4幅特征图大小依次为M/16像素*N/16像素和M/32像素*N/32像素。由此可知,4幅不同尺度的特征图分辨率分别为输入图片的1/4、1/8、1/16、1/32。
所述步骤3.2)中,在四幅特征图上进行先验框设置采用以下方式生成:
3.2.1)以固定矩形作为长宽比为1:1的基础框,将该基础框按照另外两种不同长宽比进行变形,分别得到另外两种的基础框;
具体地,例如以长为16像素、宽为16像素的矩形作为长宽比为1:1的基础框;将该基础框按照长宽比为3:1进行变形,得到长为27像素、宽为9像素的基础框;同理,按照长宽比为5:1进行变形,得到长为35像素、宽为7像素的基础框;
3.2.2)将3.2.1)中获得的三种不同长宽比的基础框以框矩形的中心点为准进行重叠组合,重叠组合是指这三个基础框叠在一起中心点重合,完成重叠组合后对特征提取模块输出的第1幅特征图上的每个像素点进行遍历,遍历时将中心点与该像素点重合,每个基础框获得一个先验框,则在第1幅特征图上得到M/4*N/4*3个先验框,依次对第2、3、4幅特征图的像素点进行遍历,四幅特征图总共可以得到(M/4*N/4+M/8*N/8+M/16*N/16+M/32*N/32)*3个先验框,M、N分别表示输入的样本图片横纵坐标方向宽度和高度上的像素点数量;
3.2.3)同一长宽比的先验框在不同的特征图下映射回原始的样本图片(输入图片),映射回原始样本图片的大小不同而实现多尺度检测。
以长宽比为1:1的先验框为例,其第1幅特征图上占有16像素*16像素的面积,由于第1幅特征图分辨率为输入图片1/4,因此该先验框映射回原始的样本图片的面积为64像素*64像素;同理,由于第2、3、4幅特征图分辨率为输入图片1/8、1/16、1/32,因此该先验框由第2、3、4幅特征图映射回输入图片的面积为128像素*128像素、256像素*256像素、512像素*512像素。
在实际网络训练过程中,在对特征图边缘像素点遍历时预先设置的先验框在映射回输入图片时,存在先验框超出输入图片的长、宽范围。对此类先验框不送入粗略调整模块的训练。
所述步骤3.2)中,粗略调整模块是用依次进行的利用自身权重进行卷积操作、sigmoid函数映射对所有在原始的样本图片长、宽范围内的先验框进行数值在0-1之间的前景、背景分类概率预测,以及获得一组基于先验框坐标(x,y)、长宽(w,h)的粗略调整偏移量(Δx,Δy,Δw,Δh),Δx,Δy,Δw,Δh分别表示先验框的中心点坐标、长宽的粗略调整偏移值;
粗略调整模块首先剔除前景、背景分类概率值在阈值0.5以下的先验框,该类先验框被认为“仅包含背景、无检测目标”不进行坐标的粗略调整且不送入精细调整模块;再将阈值在0.5及以上的先验框依照粗略调整模块同步给出的粗略调整偏移量(Δx,Δy,Δw,Δh),依据粗略调整偏移量对先验框坐标(x,y)、长宽(w,h)进行粗略调整,获得粗略调整定位框,使得粗略调整定位框相比先验框包含更多的前景。
所述步骤3.3)中,传输连接模块是:首先将四幅特征图的每幅特征图经过依次进行的卷积操作、线性整流函数、再卷积后完成对特征图的重新提取,获得每幅特征图的下一层特征图,四幅下一层特征图具有不同的图像分辨率,图像分辨率越大越低级,按照图像分辨率对下一层特征图进行排序;再将四幅下一层特征图均依次进行反卷积后将图像分辨率排序后每相邻的两幅进行相加获得三幅融合特征图,三幅融合特征图和最大图像分辨率的下一层特征图反卷积后的结果一起构成了四幅融合后的特征图,完成高低层特征图的信息融合,通过这样借助高层特征图中的信息来帮助低层特征图提升对输入图片的信息理解;将融合后的特征图经过依次进行的线性整流函数、卷积、线性整流函数后完成前景、后景特征信息与吊弦部件特征信息之间的信息转换,获得精细调整模块所需要的四幅吊弦部件特征信息图。
所述步骤3.4)中,精细调整模块对各个粗略调整定位框进行K+1种类别的概率预测,得到K+1个类别预测值,K为吊弦部件的类别总数,K+1个类别为吊弦部件的所有类别加上背景类别,例如三种类别分别对应“背景类”、“德系吊弦类”、“日系吊弦类”,其中对于非背景类别的其他类别获得该类别对应的坐标精细调整值;将类别预测值大于等于阈值0.7的类别作为粗略调整定位框的预测类别,若出现2类或以上的类别预测值均大于等于0.7则选类别预测值最大的类别作为粗略调整定位框的预测类别,并按照类别所对应的坐标精细调整值对粗略调整定位框进行精细调整得到精细调整定位框,调整方式和粗略调整模块中的一致,使精细调整定位框更准确地定位到吊弦部件。
所述的步骤3.5)中,在训练网络的训练过程中进行监督学习,训练网络的总体损失函数包括粗略调整损失函数和精细调整损失函数,粗略调整损失函数包含对先验框前景、背景错误预测的惩罚和对前景先验框(实际中是前景的先验框,而不是概率预测出来值在0.5以上的)不正确的坐标调整惩罚,精细调整损失函数包含对粗略调整结果中错误分类的惩罚和不正确的坐标调整的惩罚,具体如下:
式中,L表示粗略调整模块和精细调整模块整体的损失函数数值,p
i和x
i代表第i个先验框在粗略调整模块中前景、背景的分类概率值和粗略调整的坐标调整偏移值;c
i和t
i代表第i个先验框在精细调整模块中多分类概率值和精细调整的坐标调整偏移值;N
arm代表样本图片中所有先验框中与该样本图片中所有真实定位框之间交叠面积在70%及以上的先验框数量;N
odm代表样本图片中所有的先验框与该样本图片中同类别的真实定位框交叠面积在70%及以上的先验框数量之和;l
i *表示先验框与标注的真实定位框交叠面积是否在70%及以上,
表示若先验框与标注的真实定位框交叠面积在70%以上则为1,否则为0;g
i *表示标注的真实定位框其中心点坐标及长宽大小;
L
b为在粗略调整模块中先验框前景、背景分类概率的二分类交叉熵损失函数,由于
的存在,该损失函数L
b只对与真实定位框交叠面积在70%及以上的先验框进行二分类交叉熵损失计算;L
r为在粗略调整模块/精细调整模块中的坐标调整偏移损失函数,仅对满足交叠面积在70%及以上的先验框进行坐标调整损失计算;L
m为精细调整模块中的多分类损失函数,是对粗略调整定位框最终的错误分类的惩罚;
通过计算以上损失函数数值L来对粗略调整模块以及精细调整模块中出现的误判情况进行惩罚,在粗略调整损失函数反向传播过程中调整特征提取模块和粗略调整模块的网络参数大小,在精细调整函数反向传播过程中调整传输连接模块和精细调整模块的网络参数大小,完成各个模块网络参数数值的更新和训练,获得最优的模型作为高速铁路接触网吊弦部件检测模型。
具体实施中,训练网络经多次优化更新后得到高速铁路接触网吊弦部件检测模型,利用该模型可对训练集中不包含的其他高速铁路接触网图片进行吊弦部件定位结果预测。预测过程中将不再进行粗略调整损失函数以及精细调整损失函数的计算以及相关的反向传播运算,将精细调整模块得到的分类以及定位结果采用非极大值抑制的方法进行筛选,得到最终简洁的定位、分类预测结果。
本发明首先利用卷积神经网络对高速铁路接触网图像进行特征提取,并在特征图上生成密集分布的先验框;其次利用对先验框进行位置、尺寸的第一次粗略调整,获取先验框中可能存在正样本的粗调候选框;最后对粗调候选框的位置、尺寸进行第二次的精细调整,并根据分类分数值确定高速铁路接触网部件的类别。
本发明具有的有益的效果是:
相比于以往的高速铁路接触网吊弦部件识别方法,本发明方法准确率高,鲁棒性好,且对高速铁路接触网其他部件具有通用性;
根据高速铁路接触网吊弦部件的特点,本发明选择了具有特定长宽比的先验框的属性,符合吊弦部件在实际图片中的拍摄比例;
由于RefineDet算法是基于粗调候选框的精调结果,具有二次位置、尺寸级联修正的优点,而在高速铁路接触网部件的检测过程中图像背景中常常包括结构与吊弦类似的部件,并且容易受到拍摄条件及拍摄背景的影响,比如拍摄不全、背景复杂等,将RefineDet算法应用到高速铁路接触网吊弦部件的定位检测中能够在一定程度上减少其他部件对吊弦部件的干扰,提高对吊弦部件的特征提取能力,进而提高队吊弦部件的定位的准确率。
本发明方法完全不受图片中存在的其他部件的影响,且在吊弦部件有部分未拍摄到的情况下也能够准确地检测与定位出待检测图片中的吊弦部件,具有较强的抗干扰能力。
综合上述,本发明能够实现高速铁路接触网部件的自动识别,具有较高的准确率,并且具有稳定性好,抗干扰能力强,通用性高等优点,具有良好的鲁棒性,能够应用于高速铁路接触网巡检监控系统。
附图说明
图1为实施例训练样本图片。
图2为实施例本方法高速铁路接触网吊弦部件的检测与定位结果图。
图3为实施例本方法在存在类似其他部件的吊弦部件检测与定位结果图。
图4为实施例本方法对于垂直拍摄角度下的吊弦部件检测与定位结果图。
图5为实施例本方法对于水平拍摄角度下的吊弦部件检测与定位结果图。
图6为实施例本方法在隧道内部光照条件下的吊弦部件检测与定位结果图。
图7为实施例本方法在拍摄不全情况下的吊弦部件检测与定位结果图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步详细说明。
按照本发明发明内容方法完整实施的实施例及其实施过程如下:
采集的样本图片共有3300张:训练集图片3000张,包含有“德系吊弦”结构的图片为2000张,包含有“日系吊弦”结构的图片为1000张;测试集图片300张,包含有“德系吊弦”结构的图片为200张,包含有“日系吊弦”结构的图片为100张。样本图片中若包含任一吊弦部件,则该样本图片为正样本图片;若样本图片中不包含任意吊弦部件,则该样本图片为负样本图片。如图1所示,第一行图片为负样本图片,第二行图片为正样本图片。样本图片经过归一化操作,为相同尺寸,即将其送入网络时的输入图片大小均为2504×1940像素。
采用高速铁路接触网吊弦部件检测模型对测试集图片进行测试,得到的测试结果如表1所示:
表1高速铁路接触网吊弦部件检测模型检测结果
从表1中可以看出,高速铁路接触网吊弦部件检测模型在测试集上的表现,在包含有“德系吊弦”结构的200张图片、共340个德系吊弦中,检测正确的个数达到324个,“德系吊弦”定位准确率为95.3%、误检率为0.05%;在包含有“日系吊弦”结构的100张图片、共100个日系吊弦中,检测正确的个数达到99个,“日系吊弦”定位准确率为99%、误检率为0%。因此,高速铁路接触网吊弦部件检测模型可以完成高速铁路网吊弦图片的吊弦定位及吊弦分类。
图2为拍摄背景露天且较为简单的情况下,本发明方法的定位和分类结果示意。
本发明实施例同时对多种不同拍摄情况进行测试:
①当拍摄背景露天、但拍摄画面中在存在类似其他部件时,高速铁路接触网吊弦部件检测模型可以准确排除类似部件对吊弦分类的干扰,完成针对吊弦的定位和分类,具体的实施例结果如图3所示;
②当拍摄背景露天、拍摄角度存在差异的情况下,高速铁路接触网吊弦部件检测模型可以对画面中处于垂直状态和水平状态的吊弦完成定位和分类,画面中吊弦处于垂直状态的实施例结果如图4所示、处于水平状态的实施例结果如图5所示;
③当拍摄背景在复杂环境即隧道内部的情况下,高速铁路接触网吊弦部件检测模型可以排除隧背景信息杂乱对吊弦定位的干扰,完成对吊弦的定位和分类,具体的实施例结果如图6所示;
④当拍摄由于其他原因造成吊弦结构不齐全的情况下,高速铁路接触网吊弦部件检测模型可以利用图片中仅有的吊弦特征信息完成对“半根”吊弦的定位和分类(吊弦不是齐全的,只有一半,可以直接叫“半根吊弦”),具体的实施例结果如图7所示。
垂直和水平拍摄角度是目前巡检车辆固定的两种拍摄角度。图4、图5表示在两种拍摄角度下吊弦部件的定位和分类效果。从实验结果来看,本方法完全不受图片中两种角度的影响,能够准确地定位出待检测图片中的吊弦部件,并完成分类。本方法具有较强的适应能力,能满足不同拍摄角度下的定位及分类要求。
从图7中可以看到,在吊弦拍摄不全的情况下,本发明方法也能够准确地定位到图像中部分的吊弦部件,并根据部分吊弦部件的信息给出吊弦的分类结果。这在一定程度上弥补了巡检车在快速行驶情况下的拍摄不及时的缺点,可以有效地降低巡检系统对硬件触发的高依赖。
由此可见,本发明能够实现高速铁路接触网吊弦部件的自动定位及分类,具有较高的准确率,并且具有稳定性好,抗干扰能力强,通用性高等优点,对不同环境下的吊弦检测具有鲁棒性,能够应用于隧道巡检系统或者是高速铁路巡检车辆系统。
上述具体实施方式用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。