CN110717886A

CN110717886A - 复杂环境下基于机器视觉的路面坑塘检测方法

Info

Publication number: CN110717886A
Application number: CN201910829118.8A
Authority: CN
Inventors: 丁俊杰; 郭唐仪; 练智超; 刘悦; 邓洁仪; 朱永璇; 周钰汀; 郭玉洁; 孙豪; 郝浪; 吕亦江; 伊特格勒; 朱云霞
Original assignee: Nanjing Tech University
Current assignee: Nanjing Tech University
Priority date: 2019-09-03
Filing date: 2019-09-03
Publication date: 2020-01-21

Abstract

本发明提出了一种复杂环境下基于机器视觉的路面坑塘检测方法，首先利用进行了像素级标注的交通监控图像训练语义分割模型；其次，对交通监控视频进行背景建模获得交通监控背景图像，利用语义分割模型对背景图像进行分割，提取图像中的道路；随后，对提取的道路进行二值化，分割出路面上颜色较深且面积较大的区域，并采用支持向量机对这些区域进行分类，获得路面坑塘候选区域；最后，输出存在被语义分割模型划分为路面坑塘子区域的候选区域。通过本发明有效减少了复杂背景对检测任务的干扰，提高了算法的鲁棒性，并提高了检测精度。

Description

复杂环境下基于机器视觉的路面坑塘检测方法

技术领域

本发明属于机器视觉技术领域，具体为一种复杂环境下基于机器视觉的路面坑塘检测方法。

背景技术

依托于人工智能、云计算、物联网等新一代信息技术，借助视频监控、GPS、移动终端等感知设备，越来越多的路面坑塘自动检测技术被研究者们提出。传统的方法通常是对不同的道路坑塘进行针对性的特征分析，然后依赖于这些特征进行目标检测；同时，也有部分研究者使用已有数据集训练神经网络以期对各类路面坑塘进行识别。但是，对于监控视角下复杂道路场景图像来说，其具有背景复杂、目标尺度较小、纹理特征退化等特点，与此同时，现有路面坑塘数据量较小，不加改进的照搬现有方法对该类图像进行目标检测，得到的效果较为有限。

发明内容

本发明提出了一种复杂环境下基于机器视觉的路面坑塘检测方法。

实现本发明的技术解决方案为：一种复杂环境下基于机器视觉的路面坑塘检测方法，具体步骤为：

步骤1、将进行了像素级标注的交通监控图像作为训练样本来训练语义分割模型；

步骤2、获取待检测的交通监控视频，对其进行背景建模，排除视频中的运动物体，获得交通监控背景图像；

步骤3、使用训练好的语义分割模型对交通监控背景图像进行分割，提取图像中的道路；

步骤4、对提取的道路进行二值化，分割出路面上的类坑塘区域；

步骤5、利用基于路面坑塘样本集训练得到的支持向量机对步骤4分割得到的区域进行分类，如果支持向量机判断该区域为路面坑塘，则将其作为候选区域，否则排除这一区域；

步骤6、判断所有候选区域中是否存在被语义分割模型划分为路面坑塘的子区域，如果存在，则判断这一区域为路面坑塘区域。

优选地，步骤1中所述语义分割模型为具有编码-解码结构的卷积神经神经网络或采取空洞卷积策略的卷积神经网络。

优选地，步骤1中所述语义分割模型包括基础层、与基础层的输出端连接的金字塔池化模块、与金字塔池化模块的输出端连接的N个依次连接的卷积层；其中：

所述基础层为采用空洞卷积策略预训练过的ResNet网络；

所述金字塔池化模块用于通过四个扩张率不同的空洞卷积提取四种不同尺度下的特征图，且将四张特征图进行上采样使其尺度均与ResNet网络的输出特征图相同，然后将ResNet的输出特征图与上采样后的四张特征图拼接作为输出。

优选地，步骤1中训练语义分割模型的具体方法为：将交通监控图像作为语义分割模型的输入，并将交通监控图像进行像素级标注后的掩膜作为真值，采用多分类损失函数，不断比较真值和模型输出的预测值，使用反向传播算法不断优化神经网络参数，当迭代次数达到设定值，或者损失函数值小于设定阈值，得到网络参数最优解，其中，损失函数具体为：

其中，Y代表样本的one-hot向量，

代表softmax输出的向量。

优选地，步骤3中所述提取的道路包括被语义分割模型分割为正常路面及路面坑塘的子区域。

优选地，步骤4中所述类坑塘区域是指像素的灰度值小于15，像素总个数大于200的连通区域。

优选地，步骤5中基于路面坑塘样本集训练得到支持向量机的过程具体为：

提取路面坑塘样本集中正样本及负样本的LBP纹理特征，利用LBP纹理特征进行支持向量机的训练。

本发明与现有技术相比，其显著优点为：

1、本发明基于传统特征的检测手段和基于深度学习的语义分割模型进行路面坑塘的检测，两者具有互补性，提高了检测精度；

2、本发明使用基于深度学习的语义分割模型对复杂道路场景进行分割，仅在道路这一感兴趣区域上查找坑塘，保留了路面和坑塘的空间位置关系，有效减少了复杂背景对检测任务的干扰，提高了算法的鲁棒性。

附图说明

图1为本发明一种复杂环境下基于机器视觉的路面坑塘检测方法流程图。

图2为本发明的语义分割模型网络结构图。

图3为本发明的正常路面与路面坑塘对比图。

图4为本发明中ResNet网络结构示意图。

具体实施方式

如图1所示，一种复杂环境下基于机器视觉的路面坑塘检测方法，具体步骤为：

进一步的实施例中，所述语义分割模型可以使用但不限于使用具有编码-解码结构的卷积神经神经网络或采取空洞卷积策略的卷积神经网络。

如图2、4所示，进一步的实施例中，所述语义分割模型的基础层为采用空洞卷积策略预训练过的ResNet网络；基础层的输出连接金字塔池化模块，其中金字塔池化模块通过四个扩张率不同的空洞卷积提取四种不同尺度下的特征图，将这四张特征图进行上采样使其尺度均与ResNet的输出特征图相同，随后将ResNet的输出特征图与上采样后的四张特征图拼接作为金字塔池化模块的输出；最后，金字塔池化模块的输出连接N个卷积层进一步提取特征并输出语义分割预测图。

进一步的实施例中，训练语义分割模型的具体方法为：将交通监控图像作为语义分割模型的输入，并将交通监控图像进行像素级标注后的掩膜作为真值，采用多分类损失函数，不断比较真值和模型输出的预测值，使用反向传播算法不断优化神经网络参数，当迭代次数达到设定值，或者损失函数值小于设定阈值，得到网络参数最优解，其中，损失函数具体为：

其中，Y代表样本的one-hot向量，

代表softmax输出的向量。

本发明中，所述语义分割模型用于区分属于感兴趣目标的前景像素F(x,y)及不属于感兴趣目标的背景像素B(x,y)，其中，感兴趣目标是指包括但不限于正常路面、路面坑塘、车辆、行人等事物。

进一步的实施例中，对交通监控进行背景建模的方法可以但不限于使用差分背景建模、GMM、SACON、VIBE等各类背景建模方法，在本实施例中采用GMM背景建模获得交通监控背景图像。

进一步的实施例中，所述提取的道路应包含被语义分割模型分割为正常路面及路面坑塘的子区域，如图3所示。

进一步的实施例中，所述类坑塘区域是指所有像素灰度值I(x,y)小于15、像素个数S大于200的连通区域。

进一步的实施例中，基于路面坑塘样本集训练得到支持向量机的过程具体为：

将所有交通监控图像中的路面坑塘截取出来，统一缩放成48×48像素大小的图片作为正样本集P，将交通监控图像中不包含路面坑塘的区域分割成若干个48×48像素大小的图片作为负样本集N，提取所有正负样本的LBP纹理特征，使用这些LBP纹理特征进行支持向量机的训练，其中，支持向量机的核函数选用线性核函数，惩罚因子C设定为1.319。

步骤6、判断所有候选区域中是否存在被语义分割模型划分为路面坑塘的子区域Sub(x,y)，如果存在，则判断这一区域为路面坑塘区域。

Claims

1.一种复杂环境下基于机器视觉的路面坑塘检测方法，其特征在于，具体步骤为：

2.根据权利要求1所述的复杂环境下基于机器视觉的路面坑塘检测方法，其特征在于，步骤1中所述语义分割模型为具有编码-解码结构的卷积神经神经网络或采取空洞卷积策略的卷积神经网络。

3.根据权利要求1所述的复杂环境下基于机器视觉的路面坑塘检测方法，其特征在于，步骤1中所述语义分割模型包括基础层、与基础层的输出端连接的金字塔池化模块、与金字塔池化模块的输出端连接的N个依次连接的卷积层；其中：

所述基础层为采用空洞卷积策略预训练过的ResNet网络；

4.根据权利要求1所述的复杂环境下基于机器视觉的路面坑塘检测方法，其特征在于，步骤1中训练语义分割模型的具体方法为：将交通监控图像作为语义分割模型的输入，并将交通监控图像进行像素级标注后的掩膜作为真值，采用多分类损失函数，不断比较真值和模型输出的预测值，使用反向传播算法不断优化神经网络参数，当迭代次数达到设定值，或者损失函数值小于设定阈值，得到网络参数最优解，其中，损失函数具体为：

其中，Y代表样本的one-hot向量，

代表softmax输出的向量。

5.根据权利要求1所述的复杂环境下基于机器视觉的路面坑塘检测方法，其特征在于，步骤3中所述提取的道路包括被语义分割模型分割为正常路面及路面坑塘的子区域。

6.根据权利要求1所述的复杂环境下基于机器视觉的路面坑塘检测方法，其特征在于，步骤4中所述类坑塘区域是指像素的灰度值小于15，像素总个数大于200的连通区域。

7.根据权利要求1所述的复杂环境下基于机器视觉的路面坑塘检测方法，其特征在于，步骤5中基于路面坑塘样本集训练得到支持向量机的过程具体为：