CN116229409A

CN116229409A - 一种引入全局特征和多尺度特征的人行横道线检测方法

Info

Publication number: CN116229409A
Application number: CN202211536442.9A
Authority: CN
Inventors: 程淑红; 王晓晨; 张仕军; 张典范; 徐宇泽
Original assignee: Yanshan University
Current assignee: Yanshan University
Priority date: 2022-12-02
Filing date: 2022-12-02
Publication date: 2023-06-06

Abstract

本发明公开了一种引入全局特征和多尺度特征的人行横道线检测方法，属于图像处理、计算机视觉技术领域，步骤包括路况图像采集，构建人行横道线数据集；对人行横道线数据集中的路况图像预处理；根据目标检测算法构建人行横道线检测模型；通过人行横道线检测模型对路况图像进行检测，并生成标注预测框的路况图像；采用的损失函数将目标真实框的参数与预测框解码后的参数进行对比，进行人行横道线检测模型训练；对测试集和车前摄像头实时拍摄的前方路况图像进行检测，将数据集中的人行横道线标出并输出识别准召率，以验证改进模型的效果。本发明能够现对复杂交通场景中的人行横道线准确检测，从而辅助车辆实现智能驾驶中人行横道线场景判断的任务。

Description

一种引入全局特征和多尺度特征的人行横道线检测方法

技术领域

本发明涉及图像处理、计算机视觉技术领域，尤其是一种引入全局特征和多尺度特征的人行横道线检测方法。

背景技术

无人驾驶汽车的核心技术是车辆对于道路环境的感知能力，车辆感知道路中关键信息、做出判断并下达运动控制指令，从而保障车辆合规行驶和交通安全。如今交通路况愈加趋于严峻繁杂，人行横道线区域仍然是行人在交通场景中通行的最主要区域，因此准确识别人行横道线在路况中的位置成为规范道路交通秩序、保障行人安全的关键因素，在检测过程中要使检测的准召率尽可能保持在较高水平以应对各种复杂的路况变化。

计算机视觉中目标检测方法主要分为特征法、模型法和深度学习法。特征法主要通过对被检测物体与其它背景区域之间的色彩差异及物体间距离等某些特定特征完成检测，但容易受到光照、噪声等因素的影响造成误检。模型法主要是分析图像获得模型参数，建立模型以进行检测物体标志的提取，虽然对噪声、光照等有很好的适用性，但建立的模型往往不能适用于复杂场景，且检测时间随着模型复杂程度的增加而增加。基于深度学习的目标检测算法飞速发展并在检测任务中取得了更好的成绩，将图片输入进网络中通过多层卷积操作提取出图像的深层语义特征即可完成对目标的学习和识别，很好的解决了实时检测物体过程中光照不均匀、环境噪声过大等问题，网络模型通用性较强，且在硬件算力的支持实时推理检测。因此，使用深度学习算法对路况中的人行横道线进行检测任务。

在实际交通路况中，人行横道线容易因磨损产生缺陷，也容易被车辆和行人遮挡，且因车辆行驶方向不同导致呈现的尺度和形状不同，进而影响检测模型的准召率。

发明内容

本发明需要解决的技术问题是提供一种引入全局特征和多尺度特征的人行横道线检测方法，实现对复杂交通场景中的人行横道线准确检测，从而辅助车辆实现智能驾驶中人行横道线场景判断的任务。

为解决上述技术问题，本发明所采用的技术方案是：

一种引入全局特征和多尺度特征的人行横道线检测方法，包括以下步骤：

S1、路况图像采集，构建人行横道线数据集；

S2、对人行横道线数据集中的路况图像预处理；

S3、根据目标检测算法构建人行横道线检测模型；

S4、通过人行横道线检测模型对路况图像进行检测，并生成标注预测框的路况图像；

S5、采用的损失函数将目标真实框的参数与预测框解码后的参数进行对比，进行人行横道线检测模型训练；

S6、调用训练好的人行横道线检测模型，对测试集和车前摄像头实时拍摄的前方路况图像进行检测，将数据集中的人行横道线标出并输出识别准召率，以验证改进模型的效果。

本发明技术方案的进一步改进在于：S1中，将车前行车记录仪拍摄的实际路况中不同角度、不同大小、不同遮挡或缺陷面积的人行横道线图片标注为数据集，图片像素为4000*3000，共计3000张。

本发明技术方案的进一步改进在于：S2中，对人行横道线数据集采用马赛克数据增强方法，在训练网络前对训练集中的每四张图片分别随机进行翻转、剪裁、缩放、色域变化等操作，并且放置为四个不同方向。

本发明技术方案的进一步改进在于：S3中，所述人行横道线检测模型由主干特征提取网络、加强特征提取网络、预测网络共3个网络组成，在主干特征提取网络输出的三个不同深度的特征图后增加了自注意力模块，在加强特征提取网络输出的三个不同深度的特征图后增加了多尺度模块。

本发明技术方案的进一步改进在于：S4中，具体包括以下步骤：

S4.1输入待测路况图像，将图像尺寸调整为416×416；

S4.2主干特征提取网络提取表层语义信息；

主干特征提取网络通过一系列卷积操作压缩输入图片的宽高并扩张其通道数，提取出3个具有表层语义信息的有效特征图，传入自注意力模块以捕捉图像的全局信息；

S4.3将具有表层语义信息的有效特征图引入自注意力模块，捕捉图像全局信息；

S4.4将特征层输入引入多尺度模块的加强特征提取网络，提取高级语义特征信息；

通过上下采样和特征融合获得高级语义特征信息，并将输出图像分别划分为含有13×13、26×26、52×52个网格的三个有效特征层；

S4.5将高级语义特征信息传入多尺度模块，以增大图像的感受野；

S4.6将高级语义信息传到预测网络，生成标注预测框的路况图像；

通过聚类算法在每个特征层的每个网格上生成3个先验框用于检测不同形状的物体，之后计算出每个先验框中是否包含物体、物体种类及调整参数，最终经过非极大值抑制处理生成预测框并将预测结果标注在图片上，完成检测任务。

本发明技术方案的进一步改进在于：S4.3中，具体包括以下步骤：

S4.3.1将主干特征提取网络输出的特征图经过输出通道大小不同的1x1卷积得到f(x)、g(x)和h(x)，其中，f(x)的输出为[C/8,W,H]，g(x)的输出为[C/8,W,H]，h(x)的输出为[C,W,H]；

S4.3.2将f(x)的转置和g(x)矩阵乘，具体为s_ij＝f(x_i)^Tg(x_j)，得到输出为[N,N](N＝W x H)的矩阵S，将S看做一个表示长H宽W特征图上各个像素点相关性的矩阵；再将S矩阵逐行归一化得到β矩阵，具体为

S4.3.3将h(x)最后两个维度展平为[C,N]，将β矩阵的N种注意力权重应和h(x)逐像素点相乘得到自适应的注意力特征图，具体为

得到N个新的像素点作为输出特征图，继续后续计算。

本发明技术方案的进一步改进在于：S4.5中，多尺度模块引入至加强特征提取网络输出的三个不同深度的特征图后，所述多尺度模块包含了上下文模块和普通卷积层，最终将上下文模块和普通卷积层拼接以检测小、中、大尺度的图像；

在多尺度模块中采用堆叠较小卷积核的策略，将2个串联的3×3卷积层和3个3×3的卷积层并联，在达到大卷积核效果的同时减少了模型参数量；上下文模块获取深度图中更大感受野的上下文信息，并通过单层卷积层对上下文信息进行特征拼接和合并。

本发明技术方案的进一步改进在于：S5中，所述损失函数包括正样本回归损失函数、置信度损失函数和预测种类损失函数。

由于采用了上述技术方案，本发明取得的技术进步是：

1、本发明引入的多尺度检测模块通过对上下文进行建模增加了对关键特征层的感受野，自注意力模块使模型可以很好的处理图像中长范围、多层次的依赖关系，使模型可以学习到关于人行横道线的全局信息；相比于同类型深度学习模型和改进前的原版模型，本算法对行人和人行横道线检测准确率和召回率都有提升，更好的满足智能驾驶场景中人行横道线检测模型对精度的需求。

2、本发明使用马赛克数据增强方法，在训练集中增加了不同尺度的目标，在训练网络前每次对训练集中的每四张图片分别随机进行翻转、剪裁、缩放、色域变化等操作，并且放置为四个不同方向，提升了人行横道线检测模型的鲁棒性。

3、本发明在提高感受野、关注全局信息和减小参数量之间取得很好的平衡，保证了模型训练和推理的效率，实验证明本方法可以在复杂交通场景中实时识别人行横道线并在图中标出。

附图说明

图1为本发明中人行横道线检测系统结构图；

图2为本发明中人行横道线检测模型流程图；

图3为本发明中检测主干特征提取网络后引入的自注意力模块结构图；

图4为本发明中检测加强特征提取网络后引入的多尺度模块结构图。

具体实施方式

下面结合附图及实施例对本发明做进一步详细说明：

当前实际交通路况中，因人行横道线存在缺陷和遮挡，且人行横道线对于车辆存在角度变化和距离变化，导致检测算法对人行横道线的准召率较低。针对上述问题，本发明提供了一种引入全局特征和多尺度特征的人行横道线检测方法，对人行横道线达到较高检测精度的同时保持了较高的计算效率，可满足智能驾驶场景检测任务的需求。

S1、路况图像采集，构建人行横道线数据集；

为进行模型训练、验证和测试，将车前行车记录仪拍摄的3000张图片标注为数据集。数据集均为实际路况中不同角度、不同大小、不同遮挡或缺陷面积的人行横道线图片，图片像素为4000*3000，图片中的人行横道线均通过LabelImg被规范标注。

S2、对人行横道线数据集中的路况图像预处理；

本实施例对人行横道线数据集采用马赛克数据增强方法，在训练网络前对训练集中的每四张图片分别随机进行翻转、剪裁、缩放、色域变化等操作，并且放置为四个不同方向。

S3、根据目标检测算法构建人行横道线检测模型；

目标检测算法由主干特征提取网络、加强特征提取网络、预测网络共3个网络组成。本方案对网络结构进行改造，在主干特征提取网络输出的三个不同深度的特征图后增加了自注意力模块，在加强特征提取网络输出的三个不同深度的特征图后增加了多尺度模块，具体如图1所示。

如图2所示，具体包括以下步骤：

S4.1输入待测路况图像，将图像尺寸调整为416×416；

S4.2主干特征提取网络提取表层语义信息；

在主干特征提取网络输出的三个不同深度的特征图后增加了自注意力模块，使模型在关注图像局部的细节的同时可以额外关注图像的全局信息。

自注意力模块结构图具体如图3所示，具体包括以下步骤：

得到N个新的像素点作为输出特征图，继续后续计算。

模型中引入的自注意力模块与原网络卷积操作相辅相成，利用图像远处部分的互补特征而不是固定形状的局部区域来检测图像，使网络在每层深度特征图都关注全局关键特征，可优化对不同缺陷和遮挡情况人行横道线的检测效果。

通过上下采样和特征融合获得高级语义特征信息，并将输出图像分别划分为含有13×13、26×26、52×52个网格的三个有效特征层。

多尺度模块引入至加强特征提取网络输出的三个不同深度的特征图后，多尺度模块具体结构如图4所示，包含了上下文模块和普通卷积层，最终将上下文模块和普通卷积层拼接以检测小、中、大尺度的图像，可优化对不同角度和不同尺寸人行横道线的检测效果。

为了在获得更大感受野的同时保持较少的参数，在多尺度模块中采用堆叠较小卷积核的策略，将2个串联的3×3卷积层和3个3×3的卷积层并联，在达到大卷积核效果的同时减少了模型参数量；上下文模块获取深度图中更大感受野的上下文信息，并通过单层卷积层对上下文信息进行特征拼接和合并。

选取以下3类损失函数进行计算并训练：

正样本回归损失函数：选取完全重叠度(Complete Intersection Over Union，简称ciou)为指标，其包含了目标与先验框之间的距离、重叠率、尺度以及惩罚项，使得先验框回归变得更加稳定；

置信度损失函数：将实际存在目标的预测结果置信度的值与1对比；实际不存在目标的预测结果置信度的值与0对比；

预测种类损失函数：将实际上存在目标的预测类与真实类对比；

最后计算正样本回归损失函数、置信度损失函数、预测种类损失函数三个损失值的和，并返回为一个损失值进行训练优化。

实验表明本方法能从远距离多角度实时识别出不同缺陷和遮挡情况的人行横道线并在图中标出，准召率优于同类深度学习算法和原版算法，同时也证明该方法具有强鲁棒性，能适应不同智能驾驶场景。

综上所述，本发明能够现对复杂交通场景中的人行横道线准确检测，从而辅助车辆实现智能驾驶中人行横道线场景判断的任务。

Claims

1.一种引入全局特征和多尺度特征的人行横道线检测方法，其特征在于：包括以下步骤：

S1、路况图像采集，构建人行横道线数据集；

S2、对人行横道线数据集中的路况图像预处理；

S3、根据目标检测算法构建人行横道线检测模型；

2.根据权利要求1所述的一种引入全局特征和多尺度特征的人行横道线检测方法，其特征在于：S1中，将车前行车记录仪拍摄的实际路况中不同角度、不同大小、不同遮挡或缺陷面积的人行横道线图片标注为数据集，图片像素为4000*3000，共计3000张。

3.根据权利要求1所述的一种引入全局特征和多尺度特征的人行横道线检测方法，其特征在于：S2中，对人行横道线数据集采用马赛克数据增强方法，在训练网络前对训练集中的每四张图片分别随机进行翻转、剪裁、缩放、色域变化等操作，并且放置为四个不同方向。

4.根据权利要求1所述的一种引入全局特征和多尺度特征的人行横道线检测方法，其特征在于：S3中，所述人行横道线检测模型由主干特征提取网络、加强特征提取网络、预测网络共3个网络组成，在主干特征提取网络输出的三个不同深度的特征图后增加了自注意力模块，在加强特征提取网络输出的三个不同深度的特征图后增加了多尺度模块。

5.根据权利要求1所述的一种引入全局特征和多尺度特征的人行横道线检测方法，其特征在于：S4中，具体包括以下步骤：

S4.1输入待测路况图像，将图像尺寸调整为416×416；

S4.2主干特征提取网络提取表层语义信息；

6.根据权利要求5所述的一种引入全局特征和多尺度特征的人行横道线检测方法，其特征在于：S4.3中，具体包括以下步骤：

S4.3.2将f(x)的转置和g(x)矩阵乘，具体为s_ij＝f(x_i)^Tg(x_j)，得到输出为[N,N](N＝Wx H)的矩阵S，将S看做一个表示长H宽W特征图上各个像素点相关性的矩阵；再将S矩阵逐行归一化得到β矩阵，具体为

得到N个新的像素点作为输出特征图，继续后续计算。

7.根据权利要求5所述的一种引入全局特征和多尺度特征的人行横道线检测方法，其特征在于：S4.5中，多尺度模块引入至加强特征提取网络输出的三个不同深度的特征图后，所述多尺度模块包含了上下文模块和普通卷积层，最终将上下文模块和普通卷积层拼接以检测小、中、大尺度的图像；

8.根据权利要求1所述的一种引入全局特征和多尺度特征的人行横道线检测方法，其特征在于：S5中，所述损失函数包括正样本回归损失函数、置信度损失函数和预测种类损失函数。