CN114913493A

CN114913493A - 一种基于深度学习的车道线检测方法

Info

Publication number: CN114913493A
Application number: CN202210441263.0A
Authority: CN
Inventors: 贾晨; 李泽智; 宋廷伦; 张武; 张恒于
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2022-04-25
Filing date: 2022-04-25
Publication date: 2022-08-16

Abstract

本发明公开了一种基于深度学习的车道线检测方法，步骤如下：获取Tusimple图像数据集；将调整后的车道线图像作为车道线检测神经网络模型的训练数据集；搭建车道线检测神经网络模型，确定损失函数，训练车道线检测神经网络模型直至收敛，以得到最佳模型；加载最佳模型参数，将道路图像输入最佳模型，分别得到判定为不同车道线的各个点集；对不同类别的车道线使用二次多项式进行拟合，并将拟合后的车道线叠加在原始图像上实现车道线检测的可视化。本发明的方法在保证准确率的同时提高了检测速度，满足实时性的要求。

Description

一种基于深度学习的车道线检测方法

技术领域

本发明属于车辆自动驾驶技术领域，具体涉及一种基于深度学习的车道线检测方法。

背景技术

自动驾驶技术是近年来的一个热门话题，随着汽车工业技术与人工智能领域的飞速发展，自动驾驶技术逐渐从科幻走向现实。自动驾驶技术的主要研究内容是：环境感知、定位导航、路径规划、运动控制；其中，环境感知是利用多种传感器对道路交通环境进行检测和处理，帮助自动驾驶车辆了解周围环境信息，为控制算法提供交通环境信息；车道线检测是环境感知中的重要一环，车辆通过摄像头获取道路图像，检测出当前道路的车道线信息，以完成车辆的一系列辅助驾驶行为，包括车道保持，自适应巡航等辅助功能。

基于深度学习的车道线检测方法依赖于大数据，通过模型自主学习得到车道线的特征，得到特征后利用聚类算法进行聚类，最后利用多项式拟合出车道线。在道路中的大多数情景均能做到较好的准确性，算法鲁棒性强，但是上述方法检测过程较为复杂，且参数量和计算量都较大，同时对计算机硬件的要求较高，由此难以满足自动驾驶对实时性的要求。

发明内容

针对于上述现有技术的不足，本发明的目的在于提供一种基于深度学习的车道线检测方法，以解决现有的车道线检测方法检测过程较为复杂，参数量和计算量都较大，同时对计算机硬件的要求较高，难以满足自动驾驶对实时性的要求的问题；本发明的方法在保证准确率的同时提高了检测速度，满足实时性的要求。

为达到上述目的，本发明采用的技术方案如下：

本发明的一种基于深度学习的车道线检测方法，步骤如下：

步骤S1：获取Tusimple图像数据集；

步骤S2：对Tusimple图像数据集中车道线图像进行数据增强，并将增强后的车道线图像的分辨率调整为512×256(宽×高)，将调整后的图像作为车道线检测神经网络模型的训练数据集；

步骤S3：搭建车道线检测神经网络模型，确定损失函数，利用步骤S2中的训练数据集训练车道线检测神经网络模型直至收敛，以得到最佳模型；

步骤S4：加载最佳模型参数，将道路图像输入最佳模型，分别得到判定为不同车道线的各个点集；

步骤S5：对不同类别的车道线使用二次多项式进行拟合，并将拟合后的车道线叠加在原始图像上实现车道线检测的可视化。

进一步地，所述步骤S2中的数据增强包括：旋转，水平翻转，随机裁剪和添加高斯白噪声。

进一步地，所述神经网络模型由编码网络、解码网络、增强感受野模块、CBAM模块和两个特征融合模块组成；所述编码网络包括依次连接的预处理模块和五个残差层，所述解码网络包括依次连接的三个卷积上采样模块和一个输出模块。

进一步地，所述预处理模块包括：一个卷积核大小为7×7、步长为2、填充为3的卷积层和一个核为3×3、步长为1、填充为1的最大池化层，该预处理模块的输入图片分辨率为512×256(宽×高)，输出后的图片宽高各自减半。

进一步地，每个残差层由两个残差块组成，每个残差块由两条分支组成，第一条分支中包含两个卷积核大小为3×3的深度可分离卷积；第二条分支为一个卷积核大小为1×1的卷积层，第二条分支用于保证输入特征图和输出特征图的分辨率和维度相同；第二残差层、第三残差层添加通道注意力机制，在第四残差层、第五残差层中引入空洞卷积，扩张率分别为2和4；在上述编码网络过程中输出第一残差层、第二残差层和第五残差层得到的特征图(out1、out2和out5)，第五残差层输出的特征图(out5)通过增强感受野模块后再通过CBAM模块得到带有注意力权重的特征图后进入解码网络；第五残差层输出的特征图(out5)经过第一卷积上采样模块后通过第一特征融合模块，该第一特征融合模块同时与第二残差层输出的特征图相连接，第一特征融合模块的末端与第二卷积上采样模块相连，经过第二卷积上采样模块的特征图通过第二特征融合模块，该第二特征融合模块同时与第一残差层输出的特征图相连接，第一特征融合模块的末端与第三卷积上采样模块相连，经过第三卷积上采样模块的特征图通过输出模块，最终得到具有六个通道的特征图。

进一步地，所述增强感受野模块由四条并联的分支组成，第一条分支为1×1卷积，作用等同于残差网络中的残差结构，第二条分支为一个3×3的卷积且扩张率为3，第三条分支为两个3×3的卷积，扩张率分别为3和6，第四条分支为全局最大池化，将第二条分支和第三条分支的结果融合后通过一个1×1卷积，之后再与第一通道和第四通道进行融合，在该增强感受野模块的输入和输出处分别有一个1×1卷积，用于缩减与恢复通道数，降低四条分支中的计算量，加快网络运行速度。

进一步地，所述CBAM模块包括一个通道注意力(Channel Attention)和一个空间注意力(Spatial Attention)，输入通过通道注意力产生输入的权重后乘以自身得到新特征图，再通过空间注意力产生新特征图的权重后乘以自身得到输出,输出结果进入解码网络中的第一卷积上采样模块。

进一步地，所述特征融合模块包括两个输入，第一输入来自解码网络，第二输入来自编码网络；第一输入通过空间注意力(Spatial Attention)计算后得到带有注意力机制的权重，将第二输入乘以所述权重得到新的特征图后与初始的第一输入进行融合即在通道维度上进行拼接(concat)，得到的结果继续输出至解码网络进入卷积上采样模块。

进一步地，所述三个卷积上采样模块均依次包括一个1×1的普通卷积，一个上采样以及一个卷积核大小为3×3的深度可分离卷积。

进一步地，所述输出模块包括一个1×1的普通卷积和一个卷积核大小为3×3、输出通道数为6的深度可分离卷积；所述深度可分离卷积操作后均进行Batch Normalization归一化和ReLU非线性激活函数处理。

进一步地，所述步骤S3中的损失函数为交叉熵损失函数和OHEM损失函数，所述车道线检测神经网络模型中采用的网络为多分类语义分割网络，包括背景和五条车道线，使用交叉熵损失函数进行训练，设定其最大迭代次数为100，初始学习率为1e-2，学习率调整策略为指数衰减调整策略，在完成100次训练后停止训练，使用OHEM损失函数继续训练，根据交叉熵损失的大小对样本排列，筛选出其中的损失大的样本，并将损失用于反向传播的计算，设定其最大迭代次数为100，初始学习率为1e-4，在损失值达到稳定时停止训练。

进一步地，所述步骤S4中的道路图像中包含车道线且车道线数目不超过五条，将道路图像输入到最佳模型后得到的输出为六个通道的特征图，即特征图中的每个像素对应六个类别(背景及五条车道线)，对特征图进行softmax后得到车道线像素概率图，搜寻对应各车道线的预测点(x,y)组成点集[(x₁,y₁),(x₂,y₂),……(x_n,y_n)]，其中(x_i,y_i),i＝1,2,…n代表区分为一条车道线的像素点。

进一步地，所述步骤S5中使用二次多项式y＝a₁x²+a₂x+b,对区分为一类车道线的点集[(x₁,y₁),(x₂,y₂),……(x_n,y_n)]进行拟合，其中,a₁,a₂,b为待求解参数，a₁为二次多项式中的二次项系数，a₂为二次多项式中的一次项系数，b为二次多项式中的常数项，利用点集求解出系数a₁,a₂,b后，在输入图像上按二次多项式y＝a₁x²+a₂x+b绘制车道线，选取不同的颜色绘制不同车道线，实现车道线检测的可视化。

本发明的有益效果：

本发明的方法中提出一种网络结构，包括编码网络和解码网络，在编码网络中使用残差结构并将其中的3×3卷积替换为深度可分离卷积，结构简单，极大程度的减少了计算量和参数量，同时在编码网络和解码网络连接过程中使用增强感受野模块和CBAM模块，在降低各分支中计算量的同时兼顾提取不同感受野的功能，并且使网络更关注含有用信息的通道和区域，在解码网络的上采样过程中融合解码网络中输出的特征图，以获得更完整的信息，在充分发挥深度学习优势的同时，较大的提高车道线检测的速度，同时满足自动驾驶对于准确性和实时性的要求。

附图说明

图1是本发明方法的流程图；

图2是本发明中网络模型架构图；

图3是本发明中预处理模块网络结构图；

图4是本发明中各个残差层网络结构图；

图5是本发明中残差块网络结构图；

图6是本发明中增强感受野模块网络结构图；

图7是本发明中CBAM模块网络结构图；

图8是本发明中特征融合模块网络结构图；

图9是本发明中卷积上采样模块网络结构图；

图10是本发明中输出模块网络结构图。

具体实施方式

为了便于本领域技术人员的理解，下面结合实施例与附图对本发明作进一步的说明，实施方式提及的内容并非对本发明的限定。

参照图1所示，本发明的一种基于深度学习的车道线检测方法，步骤如下：

步骤S1：从网络获取Tusimple图像数据集；

其中，所述步骤S2中的数据增强包括：旋转，水平翻转，随机裁剪和添加高斯白噪声。

如图2所示，所述神经网络模型由编码网络、解码网络、增强感受野模块、CBAM模块和两个特征融合模块组成；所述编码网络包括依次连接的预处理模块和五个残差层，所述解码网络包括依次连接的三个卷积上采样模块和一个输出模块。

如图3所示，所述预处理模块包括：一个卷积核大小为7×7、步长为2、填充为3的卷积层和一个核为3×3、步长为1、填充为1的最大池化层，该预处理模块的输入图片分辨率为512×256(宽×高)，输出后的图片宽高各自减半。

如图4-图5所示，每个残差层由两个残差块组成，每个残差块由两条分支组成，第一条分支中包含两个卷积核大小为3×3的深度可分离卷积；第二条分支为一个卷积核大小为1×1的卷积层，第二条分支用于保证输入特征图和输出特征图的分辨率和维度相同；第二残差层、第三残差层添加通道注意力机制，在第四残差层、第五残差层中引入空洞卷积，扩张率分别为2和4；在上述编码网络过程中输出第一残差层、第二残差层和第五残差层得到的特征图(out1、out2和out5)，第五残差层输出的特征图(out5)通过增强感受野模块后再通过CBAM模块得到带有注意力权重的特征图后进入解码网络；第五残差层输出的特征图(out5)经过第一卷积上采样模块后通过第一特征融合模块，该第一特征融合模块同时与第二残差层输出的特征图相连接，第一特征融合模块的末端与第二卷积上采样模块相连，经过第二卷积上采样模块的特征图通过第二特征融合模块，该第二特征融合模块同时与第一残差层输出的特征图相连接，第一特征融合模块的末端与第三卷积上采样模块相连，经过第三卷积上采样模块的特征图通过输出模块，最终得到具有六个通道的特征图。

如图6所示，所述增强感受野模块由四条并联的分支组成，第一条分支为1×1卷积，作用等同于残差网络中的残差结构，第二条分支为一个3×3的卷积且扩张率为3，第三条分支为两个3×3的卷积，扩张率分别为3和6，第四条分支为全局最大池化，将第二条分支和第三条分支的结果融合后通过一个1×1卷积，之后再与第一通道和第四通道进行融合，在该增强感受野模块的输入和输出处分别有一个1×1卷积，用于缩减与恢复通道数，降低四条分支中的计算量，加快网络运行速度。

如图7所示，所述CBAM模块包括一个通道注意力(Channel Attention)和一个空间注意力(Spatial Attention)，输入通过通道注意力产生输入的权重后乘以自身得到新特征图，再通过空间注意力产生新特征图的权重后乘以自身得到输出,输出结果进入解码网络中的第一卷积上采样模块。

如图8所示，所述特征融合模块包括两个输入，第一输入来自解码网络，第二输入来自编码网络；第一输入通过空间注意力(Spatial Attention)计算后得到带有注意力机制的权重，将第二输入乘以所述权重得到新的特征图后与初始的第一输入1进行融合即在通道维度上进行拼接(concat)，得到的结果继续输出至解码网络进入卷积上采样模块。

如图9所示，所述三个卷积上采样模块均依次包括一个1×1的普通卷积，一个上采样以及一个卷积核大小为3×3的深度可分离卷积。

如图10所示，所述输出模块包括一个1×1的普通卷积和一个卷积核大小为3×3、输出通道数为6的深度可分离卷积；所述深度可分离卷积操作后均进行BatchNormalization归一化和ReLU非线性激活函数处理。

其中，所述步骤S3中的损失函数为交叉熵损失函数和OHEM损失函数，所述车道线检测神经网络模型中采用的网络为多分类语义分割网络，包括背景和五条车道线，使用交叉熵损失函数进行训练，设定其最大迭代次数为100，初始学习率为1e-2，学习率调整策略为指数衰减调整策略，在完成100次训练后停止训练，使用OHEM损失函数继续训练，根据交叉熵损失的大小对样本排列，筛选出其中的损失大的样本，并将损失用于反向传播的计算，设定其最大迭代次数为100，初始学习率为1e-4，在损失值达到稳定时停止训练。

所述道路图像中包含车道线且车道线数目不超过五条，将道路图像输入到最佳模型后得到的输出为六个通道的特征图，即特征图中的每个像素对应六个类别(背景及五条车道线)，对特征图进行softmax后得到车道线像素概率图，搜寻对应各车道线的预测点(x,y)组成点集[(x₁,y₁),(x₂,y₂),……(x_n,y_n)]，其中(x_i,y_i),i＝1,2,…n代表区分为一条车道线的像素点。

步骤S5：对不同类别的车道线使用二次多项式进行拟合，并将拟合后的车道线叠加在原始图像上实现车道线检测的可视化；

所述使用二次多项式y＝a₁x²+a₂x+b,对区分为一类车道线的点集[(x₁,y₁),(x₂,y₂),……(x_n,y_n)]进行拟合，其中,a₁,a₂,b为待求解参数，a₁为二次多项式中的二次项系数，a₂为二次多项式中的一次项系数，b为二次多项式中的常数项，利用点集求解出系数a₁,a₂,b后，在输入图像上按二次多项式y＝a₁x²+a₂x+b绘制车道线，选取不同的颜色绘制不同车道线，实现车道线检测的可视化。

本发明具体应用途径很多，以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以作出若干改进，这些改进也应视为本发明的保护范围。

Claims

1.一种基于深度学习的车道线检测方法，其特征在于，步骤如下：

步骤S1：获取Tusimple图像数据集；

步骤S2：对Tusimple图像数据集中车道线图像进行数据增强，并将增强后的车道线图像的分辨率调整为512×256，将调整后的图像作为车道线检测神经网络模型的训练数据集；

2.根据权利要求1所述的基于深度学习的车道线检测方法，其特征在于，所述步骤S2中的数据增强包括：旋转，水平翻转，随机裁剪和添加高斯白噪声。

3.根据权利要求1所述的基于深度学习的车道线检测方法，其特征在于，所述神经网络模型由编码网络、解码网络、增强感受野模块、CBAM模块和两个特征融合模块组成；所述编码网络包括依次连接的预处理模块和五个残差层，所述解码网络包括依次连接的三个卷积上采样模块和一个输出模块。

4.根据权利要求3所述的基于深度学习的车道线检测方法，其特征在于，所述预处理模块包括：一个卷积核大小为7×7、步长为2、填充为3的卷积层和一个核为3×3、步长为1、填充为1的最大池化层，该预处理模块的输入图片分辨率为512×256，输出后的图片宽高各自减半。

5.根据权利要求3所述的基于深度学习的车道线检测方法，其特征在于，每个残差层由两个残差块组成，每个残差块由两条分支组成，第一条分支中包含两个卷积核大小为3×3的深度可分离卷积；第二条分支为一个卷积核大小为1×1的卷积层，第二条分支用于保证输入特征图和输出特征图的分辨率和维度相同；第二残差层、第三残差层添加通道注意力机制，在第四残差层、第五残差层中引入空洞卷积，扩张率分别为2和4；在上述编码网络过程中输出第一残差层、第二残差层和第五残差层得到的特征图，第五残差层输出的特征图通过增强感受野模块后再通过CBAM模块得到带有注意力权重的特征图后进入解码网络；第五残差层输出的特征图经过第一卷积上采样模块后通过第一特征融合模块，该第一特征融合模块同时与第二残差层输出的特征图相连接，第一特征融合模块的末端与第二卷积上采样模块相连，经过第二卷积上采样模块的特征图通过第二特征融合模块，该第二特征融合模块同时与第一残差层输出的特征图相连接，第一特征融合模块的末端与第三卷积上采样模块相连，经过第三卷积上采样模块的特征图通过输出模块，最终得到具有六个通道的特征图。

6.根据权利要求3所述的基于深度学习的车道线检测方法，其特征在于，所述增强感受野模块由四条并联的分支组成，第一条分支为1×1卷积，作用等同于残差网络中的残差结构；第二条分支为一个3×3的卷积且扩张率为3；第三条分支为两个3×3的卷积，扩张率分别为3和6；第四条分支为全局最大池化，将第二条分支和第三条分支的结果融合后通过一个1×1卷积，之后再与第一通道和第四通道进行融合；在该增强感受野模块的输入和输出处分别有一个1×1卷积，用于缩减与恢复通道数，降低四条分支中的计算量，加快网络运行速度。

7.根据权利要求3所述的基于深度学习的车道线检测方法，其特征在于，所述CBAM模块包括一个通道注意力和一个空间注意力，输入通过通道注意力产生输入的权重后乘以自身得到新特征图，再通过空间注意力产生新特征图的权重后乘以自身得到输出,输出结果进入解码网络中的第一卷积上采样模块。

8.根据权利要求7所述的基于深度学习的车道线检测方法，其特征在于，所述特征融合模块包括两个输入，第一输入来自解码网络，第二输入来自编码网络；第一输入通过空间注意力计算后得到带有注意力机制的权重，将第二输入乘以所述权重得到新的特征图后与初始的第一输入进行融合即在通道维度上进行拼接，得到的结果继续输出至解码网络进入卷积上采样模块。

9.根据权利要求3所述的基于深度学习的车道线检测方法，其特征在于，所述三个卷积上采样模块均依次包括一个1×1的普通卷积，一个上采样以及一个卷积核大小为3×3的深度可分离卷积。

10.根据权利要求3所述的基于深度学习的车道线检测方法，其特征在于，所述输出模块包括一个1×1的普通卷积和一个卷积核大小为3×3、输出通道数为6的深度可分离卷积；所述深度可分离卷积操作后均进行Batch Normalization归一化和ReLU非线性激活函数处理。