CN111553236B

CN111553236B - 基于道路前景图像的路面病害目标检测与实例分割方法

Info

Publication number: CN111553236B
Application number: CN202010324404.1A
Authority: CN
Inventors: 罗文婷; 陈泽斌; 胡辉; 李林
Original assignee: Fujian Agriculture and Forestry University
Current assignee: Fujian Agriculture and Forestry University
Priority date: 2020-04-23
Filing date: 2020-04-23
Publication date: 2022-06-07
Anticipated expiration: 2040-04-23
Also published as: CN111553236A

Abstract

本发明涉及一种基于道路前景图像的路面病害目标检测与实例分割方法。通过双目相机采集道路前景图像并获取图像景深信息；然后通过K‑means聚类算法分析最佳的锚框(Anchors)尺寸，并调整模型参数以使得Mask‑RCNN模型精准稳定的对路面病害进行目标识别；制定目标重叠过滤策略，将重复检测的目标进行过滤；最后，根据预测框的四个顶点进行坐标系转换，并结合深度图像信息获取病害的真实面积，从而自动生成路面病害明细表。本发明可以实现路面病害在原图中的定位及轮廓实例分割，通过两个分支(mask branch)并行识别，将最终得到的结果融合到一张图像中，大大提高了识别的准确率；为道路养护部门的检测作业，安全性评价及养护决策提供一定的辅助支撑。

Description

基于道路前景图像的路面病害目标检测与实例分割方法

技术领域

本发明涉及道路自动检测技术领域，特别是一种基于道路前景图像的路面病害目标检测与实例分割方法。

背景技术

目前，路面病害数据已基本实现自动化采集，诸如美国WayLink公司研发的DHDV，武大卓越科技研发的ZOYON-RTM，以及中公高科研发的CiCS等路面检测设备，为路面病害自动识别算法的研究提供了数据基础。路面病害的检测作业，特别是高速公路，是养护部门每年不可或缺的工作。早期的病害识别手段主要是通过人为手动标定出病害范围和类型，由于采集的2D激光图像路面范围都是固定的，因此可根据病害在图像上的位置坐标换算为实际的真实面积。我国的高速公路里程已跃居世界第一，若继续采用人工肉眼识别病害信息，不仅要耗费大量的人力和精力，更的降低了工作效率。

近年来，随着人工智能、深度学习的快速发展，利用深层神经网络根据目标特点，自动学习并提取出特征是主流的研究方向。对于路面病害检测的方法主要有两种：第一种为单阶段的目标检测模型，典型代表有YOLOV3模型和SSD模型，诸如此类模型通过一系列卷积计算提取出病害特征，最终输出预测框的图像坐标。激光图像不受周边环境干扰，故单阶段检测模型在2D激光图像数据集上表现较好，但是此类模型无法得到路面病害的实际轮廓信息，同时，激光设备昂贵且易受路面水渍影响。第二种为语义分割模型，典型代表有全卷积神经网络以及自编码器结构的U-net模型。语义分割模型通过卷积、池化和上采样，最终输出只有病害轮廓信息的图像，并未输出预测框位置，无法计算实际的面积。

综上所述，现有的路面病害识别算法存在一定的局限性，主要问题是未能同时得到预测框的位置坐标和病害的实际轮廓信息，不能进行病害信息统计，模型泛化能力弱。同时，大多数模型使用的图像数据都是由昂贵的激光设备采集的。

发明内容

本发明的目的在于提供一种基于道路前景图像的路面病害目标检测与实例分割方法，可以实现路面病害在原图中的定位及轮廓实例分割，通过两个分支(maskbranch)并行识别，将最终得到的结果融合到一张图像中，大大提高了识别的准确率；为道路养护部门的检测作业，安全性评价及养护决策提供一定的辅助支撑。

为实现上述目的，本发明的技术方案是：一种基于道路前景图像的路面病害目标检测与实例分割方法，包括如下步骤：

步骤S1、利用双目相机采集道路前景图像，并生成道路前景景深图像；

步骤S2、筛选出海量数据中路面存在病害的图像，并使用多边形标注工具构建测试数据集；

步骤S3、使用K-means聚类算法获取最佳的锚框尺寸，调整Mask-RCNN模型包括学习率、迭代次数的参数，并开始对Mask-RCNN模型进行训练；

步骤S4、将步骤S3中训练得到的Mask-RCNN模型的权重作为路面病害特征检测器，对测试数据集进行识别，同时，结合深度图像将图像坐标转换为相机坐标，并计算路面病害在路面中的真实面积；

步骤S5、制定目标重叠过滤策略，剔除重复检测的目标信息；

步骤S6、以表格的形式自动将模型识别生成的路面病害明细信息保存至本地磁盘。

在本发明一实施例中，所述步骤S2具体实现如下：

步骤S21、图像筛选：筛选出存在路面病害的路面前景图像，所述路面病害，包括：纵缝、横缝、龟裂、坑槽、修补条及修补块；

步骤S22、数据标定：根据路面病害的形态特征，选择labelme多边形标注工具进行标定，分别给不同类型的路面病害对应的标签，若一张图像中存在两个及以上的同一种类型病害时需要在标签后面加上序号。

在本发明一实施例中，所述步骤S3具体实现如下：

步骤S31、获取最佳的锚框尺寸：从步骤S22数据标定所生成的json文件中提取出四个顶点坐标，采用K-means聚类算法获取最佳的锚框尺寸，以欧式距离衡量距离大小，使用误差的平方和作为聚类的目标函数，计算公式如式(1)、(2)所示：

式(1)中，D₁₂表示欧式距离，x_i表示横坐标，y_i表示纵坐标；式(2)中SSE表示误差平方和，c_i表示第i个簇的质心，u_j表示当前预测得到簇的质心；

步骤S32、模型参数调整：在Mask-RCNN模型训练初期根据验证数据集的损失值下降速度和变化趋势，调整学习率和迭代次数，具体调整方式为：若模型收敛速度较慢则终止训练，调高学习率后重新训练；反之，若模型损失值下降速度很快并且起伏变化大，调低学习率以避免模型出现无法收敛状况；当模型在验证数据集上的损失值趋于稳定时，停止训练模型，若已达到迭代轮数模型还未收敛，则设置在上一次训练结束保存的权重基础上增加迭代轮数继续训练；

步骤S33、训练Mask-RCNN模型：Mask-RCNN模型在训练过程中先通过前向传播得到预测值，然后与真实标签对比计算损失值，Mask-RCNN模型引入了maskbranch网络，因此整体的损失函数需要将其作为一个损失项纳入其中，损失函数的计算表达式如(3)所示：

L＝L_cls+L_box+L_mask (3)

式(3)中，L_cls表示模型目标分类损失值；L_box表示预测框回归损失；L_mask表示预测的目标掩膜损失。

在本发明一实施例中，所述步骤S4具体实现如下：

步骤S41、病害识别：调用Mask-RCNN模型的权重进行路面病害自动识别，以预测框和真实标签区域之间的交集大小，即联合交叉域为置信度，将IoU大于0.7的判定为识别正确，反之为识别错误，并计算每一类别的平均精度AP值，AP值大小为P-R曲线与坐标轴所围成的面积，最终，求所有路面病害类别AP值的平均数；准确率P、召回率R的计算公式如(4)、(5)所示：

式(4)、(5)中，N_TP表示被正确识别的样本数；N_FP表示被错识别为目标的样本数；N_FN代表属于目标范畴，但未被识别出来的样本数；

步骤S42、图像坐标与相机坐标转换：根据三角形相似原理，将检测得到的目标区域坐标转换为相机坐标系中的坐标，数学表达式如式(6)和(7)所示：

式(6)、(7)中，x、y表示图像坐标系中的横、纵坐标；X_c、Y_c则表示相机坐标系中的横、纵坐标；Z_c为图像景深值；f表示相机焦距；

步骤S43、计算病害在路面上的真实面积：根据步骤S42中转化得到的相机坐标，结合相机焦距和景深值大小计算实际面积，长度、宽度和面积的计算公式如(8)、(9)、(10)所示：

S＝width×length (10)

其中，width、length分别表示宽度、长度；x_max、x_min分别代表预测框的最大、最小横坐标；y_max、y_min分别代表最大、最小纵坐标；S表示真实面积。

在本发明一实施例中，所述步骤S5具体实现方式为：当一张图像中出现两个同一类型的病害时，根据预测得到的矩形区域中心点位置和病害类别名称判断目标是否出现重叠，具体计算公式如(11)、(12)所示，当判别式(13)成立时，即两个目标的重合度大于50％，过滤掉面积较小的目标，并将这些图像另存为到本地文件夹，以便进行回溯检查。

其中，W表示宽度；H表示高度；X表示横坐标；Y表示纵坐标；C表示中心点(x,y)位置坐标，式(11)、(12)求解结果分别代表矩形a、矩形b的各个参数信息，当式(13)成立时，即目标出现了重叠。

相较于现有技术，本发明具有以下有益效果：本发明方法可以实现路面病害在原图中的定位及轮廓实例分割，通过两个分支(mask branch)并行识别，将最终得到的结果融合到一张图像中，大大提高了识别的准确率；为道路养护部门的检测作业，安全性评价及养护决策提供一定的辅助支撑。

附图说明

图1为本发明实施例的流程图

图2为本发明实施例的深度图像。

图3为本发明实施例的采集设备图像。

图4为本发明实施例的真实数据标签样本图像。

图5为本发明实施例的自动识别效果图像。

具体实施方式

下面结合附图，对本发明的技术方案进行具体说明。

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示，本实施例提供了一种基于道路前景图像的路面病害目标检测与实例分割方法，包括以下步骤：

步骤S1：利用双目相机与GPS的组合车载设备采集路面前景图像，并生成深度图像。

步骤S2：对采集得到的前景图像通过人工筛选出具有病害的图像，并使用lableme多边形标注工具构建数据集；

步骤S3：使用K-means聚类算法获取最佳的锚框尺寸，微调模型学习率及迭代次数等参数，并开始对Mask-RCNN模型进行训练；

步骤S4：将步骤S3中训练得到的权重作为路面病害特征检测器，对测试数据集进行识别。同时，结合深度图像将图像坐标转换为相机坐标，并计算病害在路面中的真实面积；

步骤S5：制定目标重叠过滤策略，剔除重复检测的目标信息；

步骤S6：以表格的形式自动将模型识别生成的路面病害明细信息(病害类别、坐标信息，实际面积等)保存至本地磁盘。

在本实施例中，所述步骤S2具体包括以下步骤：

步骤S21：图像筛选：通过肉眼筛选出存在病害(纵缝、横缝、龟裂、坑槽、修补条及修补块)的路面前景图像，用以构建数据集。

步骤S22：数据标定：根据路面病害的形态特征，选择labelme多边形标注工具进行标定，分别给不同类型的病害对应的标签，值得注意的是，当一张图像中存在两个及以上的同一种类型病害时需要在标签后面加上序号(例如：“龟裂1”、“龟裂2”)便于区分。之所以使用labelme是因为路面病害形状不规则，需要用多边形工具进行标定。

在本实施例中，所述步骤S3具体包括以下步骤：

步骤S31：K-means聚类算法：锚框尺寸影响着模型在特征提取阶段生成的候选框(Region Proposal Network,RPN)大小。路面病害形状的长与宽差异大，因此，从步骤S22数据标定所生成的json文件中提取出四个顶点(左上、右上、左下、右下)坐标，采用聚类算法获取最佳的锚框尺寸，以欧式距离衡量距离大小，使用误差的平方和作为聚类的目标函数，计算公式如式(1)、(2)所示。

式(1)中，D₁₂表示欧式距离，x_i表示横坐标，y_i表示纵坐标；式(2)中SSE表示误差平方和，c_i表示第i个簇的质心，u_j表示当前预测得到簇的质心。

步骤S32：模型参数微调：在Mask-RCNN模型训练初期根据验证数据集的损失值下降速度和变化趋势，调整学习率和迭代次数，具体调整方式为：若模型收敛速度较慢则终止训练，调高学习率后重新训练；反之，若模型损失值下降速度很快并且起伏变化大，调低学习率以避免模型出现无法收敛状况；当模型在验证数据集上的损失值趋于稳定时，停止训练模型，若已达到迭代轮数模型还未收敛，则设置在上一次训练结束保存的权重基础上增加迭代轮数继续训练。

步骤S33：训练Mask-RCNN模型：Mask-RCNN模型在训练过程中先通过前向传播得到预测值，然后与真实标签对比计算损失值，Mask-RCNN模型引入了mask branch网络，因此整体的损失函数需要将其作为一个损失项纳入其中，损失函数的计算表达式如(3)所示：当初始学习率为0.0005，迭代300轮后，模型的损失值为0.02并趋于稳定，此时模型性能达到最佳停止训练。

L＝L_cls+L_box+L_mask (3)

式(3)中，L_cls表示模型目标分类损失值；L_box表示预测框回归(Bounding boxregression)损失；L_mask表示预测的目标掩膜(目标轮廓)损失。

在本实施例中，所述步骤S4具体包括以下步骤：

步骤S41：病害识别：模型训练结束后会自动生成“.h5”格式的权重文件，调用此权重进行路面病害自动识别，以预测框和真实标签区域之间的交集大小，即联合交叉域(Intersection of Union，IoU)为置信度，将IoU大于0.7的判定为识别正确，反之为识别错误。并计算每一类别的平均精度(Average Precision，AP)。AP值大小为P-R曲线与坐标轴所围成的面积，最终，求所有病害类别AP值的平均数(mean,Average Precision，mAP)。准确率P、召回率R的计算公式如(4)、(5)所示：

步骤S42：图像坐标与相机坐标转换：根据三角形相似原理，将检测得到的目标区域坐标转换为相机坐标系中的坐标，数学表达式如式(6)和(7)所示：

S＝width×length (10)

在本实施例中，步骤S5具体内容为：当一张图像中出现两个同一类型的病害时，根据预测得到的矩形区域中心点位置和病害类别名称判断目标是否出现重叠。具体计算公式如(11)、(12)所示。当判别式(13)成立时，即两个目标的重合度大于50％，过滤掉面积较小的目标。并将这些图像另存为到本地文件夹，以便进行回溯检查过滤。

在本实施例中，步骤S6具体内容为：根据《公路技术状况评定标准》JTG5210-2018，将Mask-RCNN模型自动识别所得到的信息按照指定格式保存至本地硬盘。

较佳的，本实施例还提供以下示例：

(1)基于K-means聚类算法获取最佳的锚框尺寸

Mask-RCNN在特征提取过程中会生成指定个的锚框，这些锚定的尺寸决定模型是否能够生成与真实病害标签一致的预测框，是影响识别效果关键的一步。因此，本实例提取标注所生成的“.json”文件中的四个顶点位置坐标(左上、右上、左下、右下)，并通过K-means聚类算法，以欧式距离衡量距离大小，使用误差的平方和作为聚类的目标函数。最终聚类准确率为80.4％，也就是数据集中的80.4％数据对于Mask-RCNN模型训练是有效的。

(2)基于Mask-RCNN模型的前景图像路面病害目标检测与实例分割方法

本实例采用Mask-RCNN模型对路面病害进行自动识别，Mask-RCNN具有目标检测与实例分割两个并行分支(mask branch)，其中目标检测分支是获取预测框的位置，而实例分割分支则是对预测框内的目标进行像素级分割，模型输出的图像是二者识别结果的融合。

(3)基于深度图像及重叠目标过滤策略自动生成路面病害明细表

本实例使用的双目相机与GPS组合车载设备，不仅能够采集路面前景图像，还可以生成对应的深度图像，如图2所示。首先结合预测框信息与深度图像及相机参数，将图像坐标转为世界坐标，获取路面病害的真实面积；然后，通过预测框长宽与中心点之间的关系判断同一类目标是否重复检测，从而过滤重叠的目标；最终，根据《公路技术状况评定标准》JTG5210-2018以指定的格式自动生成路面病害明细表。

具体的，本实例提供了一种基于道路前景图像的路面病害目标检测与实例分割方法，包括以下步骤：

在本实例中，具体实施方式如下：

(1)设备参数及其工作原理

本实例采用双目相机与GPS组合车载设备进行数据采集，如图3所示。此设备在采集前景图像的同时也生成对应的深度图像，本实例根据深度值及相机参数计算真实的路面病害面积，并且由GPS设备获取病害所在的经纬度坐标，以便获取病害所在的道路真实位置。

1)数据库构建

数据库的建立。本实例采用双目相机及GPS的组合车载设备获取路面前景图像数据并生成深度图像；使用labelme多边形标注工具标定病害图像，最终生成json文件用以储存多边形各个顶点的坐标，同时也生成图像标签样本，如图4所示。

2)模型参数的调整及训练

步骤1：基于K-means聚类算法获取最佳的锚框尺寸：本实例利用K-means聚类算法获取锚框尺寸，对真实标签的长度(横坐标差的绝对值)，宽度(纵坐标差的绝对值)进行聚类，以欧式距离衡量距离大小，使用误差的平方和作为聚类的目标函数，确定锚定尺寸。数学表达式如(1)、(2)所示。

步骤2：学习率和迭代轮数调整：观察Mask-RCNN模型训练初期在验证数据集上的损失值(val_loss)下降速度和趋势(模型收敛的速度)，判断学习率的设置是否合理，若模型收敛速度慢则是学习率设置过低；反之，若损失值下降非常快但变化起伏大，可调低学习率以避免模型出现无法收敛状况。当Mask-RCNN模型在验证数据集上的损失值趋于稳定时，可停止训练模型，若已达到迭代轮数模型还未收敛可在上一次训练结束保存的权重基础上增加迭代轮数继续训练。

步骤3：训练Mask-RCNN模型：Mask-RCNN模型先通过前向传播得到一个预测值，然后与计算预测结果与真实标签的损失值，损失函数的数学表达式如(3)所示；最终通过反向传播操作更新学习率，让模型更充分的学习目标特征信息，同时调整模型的收敛速度以降低损失值。经调试，当模型的初始学习率为0.0005，迭代300轮后，模型在验证数据集上的损失值为0.02并且不再下降，此时Mask-RCNN在测试数据集的mAP值为81.5％，图5展示了Mask-RCNN模型的目标检测与实例分割效果图像。

L＝L_cls+L_box+L_mask (3)

(3)基于深度图像信息及重叠目标过滤策略自动生成路面病害明细表

1)计算路面病害的实际面积

本实例使用的双目相机及GPS组合车载设备，在采集前景图像的同时生成了深度图像，并将深度值、经纬度、里程等信息存储到txt文件中。然后结合相机参数，通过Mask-RCNN模型对测试数据集进行识别得到对应的预测框图像坐标，并根据相似三角形原理将图像坐标转为世界坐标，转换公式如(4)、(5)，从而获取路面病害的真实面积。计算面积的公式如式(6)、(7)、(8)所示。

S＝width×length (8)

2)目标过滤策略

Mask-RCNN模型识别结果可能存在单个目标重复检测的现象，本实施例通过预测框长宽与中心点之间的关系判断同一类目标是否重复检测，从而过滤重合度超过50％且面积较小的目标。重合度判断数学表达式如(9)、(10)、(11)所示。

3)自动生成路面病害明细表

最终，结合Mask-RCNN模型识别结果，计算实际面积并过滤重读检测目标，再根据《公路技术状况评定标准》JTG5210-2018以指定的格式自动生成路面病害明细表。

本实施例通过K-means聚类算法获取最佳的锚框尺寸，微调学习率、迭代轮数等参数，最终构建一个具有两个并行分支网络的Mask-RCNN模型，从而实现对前景图像路面病害的目标检测及实例分割。该模型具有以下优点：

(1)Mask-RCNN不同于单阶段的目标检测模型，其不仅能够预测病害在图像中所在的位置，还可以对预测框内的目标进行像素级分割，两个分支相辅相成既能得到检测与分割结果，又可以提高识别精度。

(2)通过K-means聚类算法分析最佳锚框尺寸，提高了Mask-RCNN模型的识别准确率及泛化能力，最终的mAP值为81.5％。

(3)结合相机参数及深度图像信息进行坐标系转换，可获取路面病害真实面积，以生成路面病害明细表。为道路养护部门的检测作业，安全性评价及养护决策提供一定的辅助支撑。

以上是本发明的较佳实施例，凡依本发明技术方案所作的改变，所产生的功能作用未超出本发明技术方案的范围时，均属于本发明的保护范围。

Claims

1.一种基于道路前景图像的路面病害目标检测与实例分割方法，其特征在于，包括如下步骤：

步骤S6、以表格的形式自动将模型识别生成的路面病害明细信息保存至本地磁盘；

所述步骤S4具体实现如下：

步骤S41、病害识别：调用Mask-RCNN模型的权重进行路面病害自动识别，以预测框和真实标签区域之间的交集大小，即联合交叉域为置信度，将联合交叉域IoU大于0.7的判定为识别正确，反之为识别错误，并计算每一类别的平均精度AP值，AP值大小为P-R曲线与坐标轴所围成的面积，最终，求所有路面病害类别AP值的平均数；准确率P、召回率R的计算公式如(4)、(5)所示：

S＝width×length (10)

其中，width、length分别表示宽度、长度；x_max、x_min分别代表预测框的最大、最小横坐标；y_max、y_min分别代表最大、最小纵坐标；S表示真实面积；

所述步骤S5具体实现方式为：当一张图像中出现两个同一类型的病害时，根据预测得到的矩形区域中心点位置和病害类别名称判断目标是否出现重叠，具体计算公式如(11)、(12)所示，当判别式(13)成立时，即两个目标的重合度大于50％，过滤掉面积较小的目标，并将这些图像另存为到本地文件夹，以便进行回溯检查；

2.根据权利要求1所述的基于道路前景图像的路面病害目标检测与实例分割方法，其特征在于，所述步骤S2具体实现如下：

3.根据权利要求2所述的基于道路前景图像的路面病害目标检测与实例分割方法，其特征在于，所述步骤S3具体实现如下：

L＝L_cls+L_box+L_mask (3)