CN114882469B

CN114882469B - 一种基于dl-ssd模型的交通标志检测方法及系统

Info

Publication number: CN114882469B
Application number: CN202210359011.3A
Authority: CN
Inventors: 高尚兵; 李�杰; 汪长春; 蔡创新; 陈浩霖; 于永涛; 李翔; 朱全银; 胡序洋; 李少凡; 张正伟
Original assignee: Huaiyin Institute of Technology
Current assignee: Huaiyin Institute of Technology
Priority date: 2022-04-07
Filing date: 2022-04-07
Publication date: 2023-08-25
Anticipated expiration: 2042-04-07
Also published as: CN114882469A

Abstract

本发明公开了一种基于DL‑SSD模型的交通标志检测方法及系统，对预先获取的交通标志原始图像进行标记，生成标签文件，利用原始的SSD目标检测框架的主干网络进行特征提取，同时在主干网络前三层浅层网络的特征图和后三层扩张卷积层添加两个分支；将浅层网络提取到的特征输入到跨尺度聚合特征融合方法Ca‑FPN特征融合方式得到高分辨特征图；在每个扩张卷积层中使用通道注意力机制位置通道注意力机制PCA，提取到不同分辨率的特征图；在特征图的每个位置生成多个候选框；设置特定阈值排除置信度的候选框，从而确定交通标志位置，同时使用softmax分类函数进行交通标志分类。本发明可用于检测并识别图像中的交通标识和位置，同时对交通标识的小目标检测也具有较好的鲁棒性。

Description

一种基于DL-SSD模型的交通标志检测方法及系统

技术领域

本发明属于语义分割、图像处理及智能驾驶领域，具体涉及一种基于DL-SSD模型的交通标志检测方法及系统。

背景技术

交通标志图像识别已经成为近些年来计算机视觉、图像处理、模式是被等领域的热点研究方向。交通标志识别技术已经有着十分重要的研究与应用价值。目前，在训练交通标志模型时，常用方式为：将自然场景图像作为训练样本，对卷积神经网络进行训练，得到交通标志图像识别模型，通过图片像素的标注从而识别出图像中不同的类别。随着智能化系统被应用到车辆驾驶领域中，越来越多的车辆上配置了能够实现自动驾驶功能或者辅助驾驶功能的智能系统。

在最新的交通标志图像识别模型进行检测时会出现：(1)考虑不到环境对交通标志检测效果的影响；(2)在训练时由于自然场景的影响使得神经网络对交通标识图像语义特征提取效果较差，从而会直接导致训练出来的模型对交通标志识别的准确度降低。因此需要一种针对自然场景中的交通标志图像可能出现磨损、遮挡等情况，依然能提高交通标志检测准确度的检测方法。

发明内容

发明目的：针对现阶段相关交通标志检测框架检测的效果不佳，检测精度不够的情况，提供一种基于DL-SSD模型的交通标志检测方法及系统。

技术方案：本发明提供一种基于DL-SSD模型的交通标志检测方法，包括以下步骤：

(1)对预先获取的交通标志原始图像进行标记，生成标签文件；

(2)将标签文件和原始图像进行预处理输入到DL-SSD目标检测主干网络进行特征提取；

(3)使用DL-SSD目标检测主干网络前三层卷积层提取到不同尺度的特征图添加第一个分支进行特征融合；所述第一个分支采用跨尺度聚合特征融合方法Ca-FPN特征融合方式；

(4)使用主干网络后三层扩张卷积层添加第二个分支位置通道注意力机制PCA的运算进行特征提取；

(5)第一分支和第二分支生成不同尺度的特征图，在特征图的每个位置生成多个候选框；

(6)设置特定阈值排除置信度的候选框，从而确定交通标志位置，同时使用softmax分类函数进行交通标志分类。

进一步地，步骤(2)所述的DL-SSD目标检测主干网络为VGG16的卷积层，将VGG16的两层全连接层替换为卷积层，同时之后添加三个扩张卷积层，使用分别为1、2、4扩展参数的扩张卷积将原先3×3的视野分别调整为3×3、7×7和15×15便于进行特征提取。

进一步地，所述步骤(3)实现过程如下：

前三层卷积层分别为Fc7层、Conv8_2层、Conv9_2层，这三层所提取到对应特征图为R1、R2、R3，且三个特征图R1、R2、R3特征尺度不一的；将特征图R1、R2、R3的结点作为输入，不同的特征结点进行相互连接，将同尺度的特征节点实现跳跃输入连接，确保将尺度小的特征图也能够融合到尺度较大的特征图中，同时将第三层结点的输入连接少于2个的结点进行移除；最后将Ca-FPN特征融合效果输出，用1×1的卷积进行处理输出特征图为RC1。

进一步地，所述步骤(4)实现过程如下：

后三层扩张卷积层分别为Dconv10、Dconv11和Dconv12对应提取的特征图为D1、D2、D3，将D1、D2、D3作为第二个分支的输入，每个特征图添加位置通道注意力机制PCA的运算需要满足公式：

其中，U_c表示c个特征映射在(i，j)位置上的通道特征值，表示特征图大小为H×W的c个特征映射在卷积核(i，j)位置上的通道权重进行矩阵相乘，根据通道权重来获取每个位置的信息，增强其特征表现能力；D1、D2、D3通过PCA产生的特征图分别为DC1、DC2、DC3作为下一阶段的输入。

进一步地，步骤(5)所述的特征图根据标签文件和训练图片的类别生成多个位置不一的候选框区域，并同时输入到最终的检测层进行分类回归。

基于相同的发明构思，本发明还提供一种基于DL-SSD模型的交通标志检测系统，包括：

图像预处理模块：读预先获取车载记录仪拍摄视频中的交通标志原始图像，标记图像中交通标志位置，生成标签文件；

特征提取模块：将交通标志标记图像输入到DL-SSD模型中，通过多个卷积层和三个扩张卷积运算得到多个不同尺度的具有交通标志目标的特征图；

跨尺度聚合特征融合模块：使用DL-SSD目标检测主干网络前三层卷积提取到不同尺度的特征图添加采用跨尺度聚合特征融合方法Ca-FPN特征融合方式的第一个分支进行特征融合；

位置通道注意力机制模块：使用主干网络后三层扩张卷积层添加第二个分支位置通道注意力机制PCA的运算进行特征提取；

交通标志检测和可视化模块：将训练好的可以识别交通标志的权重文件，对交通视频和图像进行检测，实时检测到交通标志的位置信息和对应的交通标志的类别同时给出相关的准确度信息生成对应的检测图像。

有益效果：与现有技术相比，本发明的有益效果：1、通过改进SSD目标检测模型主干网络后三层的卷积层替换成扩展卷积，扩大图像的感受野；2、第一个分支采用跨尺度聚合特征融合方法Ca-FPN达到不同尺度特征结点进行连接的效果；3、使用位置通道注意力机制PCA将后三层通过扩展卷积操作得到的特征图进行权重矩阵相乘得到局部特征；4、改进后的DL-SSD目标检测模型对比原来的SSD框架的平均精度AP(Average Precision)提升了8个百分点；5、本发明针对自然场景中的交通标志图像可能出现磨损、遮挡等情况，对交通标志的检测也非常准确。

附图说明

图1是基于DL-SSD模型的交通标志检测方法的流程图；

图2是本发明提出的基于DL-SSD目标检测模型示意图；

图3是位置通道注意力机制PCA的模型结构示意图；

图4是采用DL-SSD目标检测模型后得到的检测的公认的指标数据值；

图5是采用DL-SSD目标检测模型后得到的检测交通标识效果图。

具体实施方式

下面结合附图对本发明作进一步详细说明。

本实施方式中涉及大量变量，现将各变量作如下说明。如表1所示。

表1 变量说明表

变量	变量说明
		Fc7	3×3，通道数为1024的卷积核
Conv8_2	1×1，通道数为1024的卷积核
		Conv9_2	1×1，通道数为256的卷积核
R1	Fc7层提取到的特征图
		R2	Conv8_2层提取到的特征图
R3	Conv9_2层提取到的特征图
		RC1	通过Ca-FPN特征融合得到的特征图
Dconv10	3×3，扩展率为1×1，通道数为512的卷积核
		Dconv11	1×1，扩展率为3×3，通道数为128的卷积核
Dconv12	1×1，扩展率为5×5，通道数为128的卷积核
		D1	Dconv10层提取到的特征图
D2	Dconv11层提取到的特征图
		D3	Dconv12层提取到的特征图
DC1	特征图D1通过PCA处理后的特征图
		DC2	特征图D2通过PCA处理后的特征图
DC3	特征图D3通过PCA处理后的特征图

本发明提供一种基于DL-SSD模型的交通标志检测方法，通过采集交通标志图像并进行标记制作成交通标志数据集，利用原始的SSD目标检测框架的主干网络进行特征提取，同时在主干网络前三层浅层网络的特征图和后三层扩张卷积(Dilation Conv)层添加两个分支；将浅层网络提取到的特征输入到跨尺度聚合特征融合方法Ca-FPN(Cross-scaleaggregation feature pyramid)特征融合方式得到高分辨特征图；在每个扩张卷积(Dilation Conv)层中使用通道注意力机制位置通道注意力机制PCA(position-channelattention)，从而增强特征通道对小目标的交通标志特征的提取效果；提取到不同分辨率的特征图，每个特征图都会生成若干大小不一的候选框，通过非极大值抑制和softmax分类函数可以保留最符合要求的候选框并进行交通标识的类别分类。如图1所示，具体包括以下步骤：

步骤1：预先获取车载记录仪拍摄视频中的交通标志图像，用labelme软件标记图像中交通标志位置，生成标签文件。

将截取的车载记录仪拍摄的交通标示原始图像进行预处理是将图像尺寸设置为[300,300]像素大小。

步骤2：将标签文件和原始图像进行预处理输入到DL-SSD目标检测主干网络进行特征提取。

DL-SSD目标检测主干网络为VGG16的卷积层，将VGG16的两层全连接层替换为卷积层，同时之后添加三个扩张卷积(Dilation Conv)层，使用分别为1、2、4扩展参数的扩张卷积将原先3×3的视野分别调整为3×3、7×7和15×15便于进行特征提取。

步骤3：使用DL-SSD目标检测主干网络前三层卷积提取到不同尺度的特征图添加第一个分支进行特征融合。

前三层卷积层分别为Fc7层、Conv8_2层、Conv9_2层，这三层所提取到对应特征图为R1、R2、R3，且三个特征图R1、R2、R3特征尺度不一的。第一个分支采用跨尺度聚合特征融合方法Ca-FPN(Cross-scale aggregation feature pyramid)特征融合方式，具体步骤如下，将特征图R1、R2、R3的结点作为输入，不同的特征结点进行相互连接，将同尺度的特征节点实现跳跃输入连接，确保将尺度小的特征图也能够融合到尺度较大的特征图中，同时将第三层结点的输入连接少于2个的结点进行移除。最后将Ca-FPN特征融合效果输出，用1×1的卷积进行处理输出特征图为RC1。

步骤4：使用主干网络后三层扩张卷积(Dilation Conv)层添加第二个分支，该分支结合通道注意力机制进行特征提取。

后三层扩张卷积(Dilation Conv)层分别为Dconv10、Dconv11和Dconv12对应提取的特征图为D1、D2、D3，将D1、D2、D3作为第二个分支的输入，每个特征图添加位置通道注意力机制PCA(position-channel attention)的运算需要满足一下的公式：

其中，U_c表示c个特征映射在(i，j)位置上的通道特征值，表示特征图大小为H×W的c个特征映射在卷积核(i，j)位置上的通道权重进行矩阵相乘，根据通道权重来获取每个位置的信息，从而增强其特征表现能力。D1、D2、D3通过PCA产生的特征图分别为DC1、DC2、DC3作为下一阶段的输入。位置通道注意力机制PCA的模型结构如图3所示，特征图D1、D2、D3的输入到PCA层，其特征图的大小为H×W×Cn，其中Cn为D1、D2、D3提取到的特征图的特征通道数，将特征通过卷积层和平均池化层进行处理后，在进行ReLu激活函数进行激活，同时在另一个分支进行位置通道矩阵相乘，再通过C×C的位置通道注意力权重相乘进行通道矫正，得到激活和矫正的特征图再进行像素点的相乘和相加得到处理后的H×W×Cn的特征图。

步骤5：第一分支和第二分支生成不同尺度的特征图，在特征图的每个位置生成多个候选框。

第一分支输出的特征图RC1和第二分支的输出特征图DC1、DC2、DC3会根据标签文件和训练图片的类别生成多个位置不一的候选框区域(bbox)，并同时输入到最终的检测层进行分类回归。

步骤6：设置特定阈值排除置信度的候选框，从而确定交通标志位置，同时使用softmax分类函数进行交通标志分类。

设置Iou(Intersection over Union)特定阈值将一部分重合或者不正确的候选框bbox排除，保留置信度高的候选框，最终完成交通标志的位置确定。通过softmax函数进行交通标志类别分类。在进行目标检测时会生成非常多的候选框区域(bbox)，当出现交通标志目标时，会出现很多的框选中该目标，设定相关的Iou(Intersection over Union)的阈值目的是为了排除那些预选框中Iou较小的候选框，保留能够检测交通标志的候选框。

将改进的DL-SSD目标检测框架与原始的SSD目标检测框架同时训练中国交通标志数据集(CCTSDB)中标注的3500张图片得到可以检测交通标志的权重文件，将训练好的权重文件通过中国交通标志数据集划分10％的数据进行检测，检测mAP(mean AveragePrecision)指标如图4所示，得到对应的mandatory，warning，prohibitory的mAP分别为79％，87％和89％，对比原始的SSD目标检测框架在平均精度mAP提升了6个百分点，现在的精度在85％左右。

本发明还提出一种基于DL-SSD模型的交通标志检测系统，如图2所示，包括：

交通标志检测和可视化模块：将训练好的可以识别交通标志的权重文件，对交通视频和图像进行检测，实时检测到交通标志的位置信息和对应的交通标志的类别同时给出相关的准确度信息生成对应的检测图像，如图5所示。

Claims

1.一种基于DL-SSD模型的交通标志检测方法，其特征在于，包括以下步骤：

(6)设置特定阈值排除置信度的候选框，从而确定交通标志位置，同时使用softmax分类函数进行交通标志分类；

步骤(2)所述的DL-SSD目标检测主干网络为VGG16的卷积层，将VGG16的两层全连接层替换为卷积层，同时之后添加三个扩张卷积层，使用分别为1、2、4扩展参数的扩张卷积将原先3×3的视野分别调整为3×3、7×7和15×15便于进行特征提取；

所述步骤(3)实现过程如下：

前三层卷积层分别为Fc7层、Conv8_2层、Conv9_2层，这三层所提取到对应特征图为R1、R2、R3，且三个特征图R1、R2、R3特征尺度不一的；将特征图R1、R2、R3的结点作为输入，不同的特征结点进行相互连接，将同尺度的特征节点实现跳跃输入连接，确保将尺度小的特征图也能够融合到尺度较大的特征图中，同时将第三层结点的输入连接少于2个的结点进行移除；最后将Ca-FPN特征融合效果输出，用1×1的卷积进行处理输出特征图为RC1；

所述步骤(4)实现过程如下：

2.根据权利要求1所述的一种基于DL-SSD模型的交通标志检测方法，其特征在于，步骤(5)所述的特征图根据标签文件和训练图片的类别生成多个位置不一的候选框区域，并同时输入到最终的检测层进行分类回归。

3.一种采用权利要求1-2任一所述方法的基于DL-SSD模型的交通标志检测系统，其特征在于，包括：