CN108399398A

CN108399398A - 一种基于深度学习的无人驾驶汽车障碍物识别检测方法

Info

Publication number: CN108399398A
Application number: CN201810240723.7A
Authority: CN
Inventors: 李吉成; 杨红心; 朱波; 廖载霖
Original assignee: Wuhan Yun Heng Intelligent Technology Co Ltd
Current assignee: Wuhan Yun Heng Intelligent Technology Co Ltd
Priority date: 2018-03-22
Filing date: 2018-03-22
Publication date: 2018-08-14

Abstract

本发明公开了一种基于深度学习的无人驾驶汽车障碍物识别检测方法，首先对传感器输出的图像进行预处理，将预处理后的图像送入卷积层进行处理，解析通过卷积层处理后的图像，获取目标类别、目标概率以及目标坐标，将目标类别和目标概率相乘计算出每个目标的各个类别对应的概率向量，根据概率向量中的元素与设定阈值的进行比较，根据比较结果获得目标对应的类别，以及获得目标对应的坐标。本发明通过深度卷积神经网络对图像特征进行提取分析，对图像中的目标进行深度学习，从而有效的识别检测出障碍物，使汽车更好的感知外界环境，提高汽车的安全性。

Description

一种基于深度学习的无人驾驶汽车障碍物识别检测方法

技术领域

本发明属于计算机视觉领域，具体涉及一种基于深度学习的无人驾驶汽车障碍物识别检测方法，用于目标的检测。

背景技术

随着汽车保有量的越来越多，道路交通安全问题日渐严峻。据统计，90％以上的交通事故是由人为因素引起的，因此，如何减少和避免交通事故的发生，已成为交通安全领域亟待解决的问题。一直以来，汽车无人驾驶技术被视为最有效的解决方案，其发展备受瞩目。《中国制造2025》中明确提出，到2020年，掌握智能辅助驾驶总体技术及各项关键技术；到2025年，掌握自动驾驶总体技术及各项关键技术。汽车的自动化和智能化是汽车产业未来发展的重要方向。

无人驾驶汽车主要零部件包括激光雷达、单/双目摄像头、超声波雷达、毫米波雷达和主控系统等。作为无人驾驶汽车的“眼睛”，可以利用双目摄像头的成像视差来测算周围物体和汽车之间的距离，同时也被用来识别车道线、红绿灯和各种交通指示牌，以及周围的行人和车辆等物体。作为无人驾驶汽车感知外界环境的最主要途径之一，摄像头在无人驾驶中发挥着重要的作用，对摄像头采集的图像进行精确的识别和检测，是无人驾驶汽车安全的重要保证。

无人驾驶汽车障碍物识别检测算法的核心是如何精确的提取出图像中物体的特征，对提取出的物体进行分类和坐标回归。目前汽车上广泛使用的驾驶辅助系统(ADAS)中还没有利用摄像头对目标进行有效的识别检测，普遍的是利用超声波雷达和毫米波雷达对前方障碍物进行检测，而雷达的价格比摄像头的要高很多。即使使用摄像头对目标进行识别检测，大都采用的是传统的特征匹配算法，这种算法虽然对硬件的要求低，但是精度不高，无法胜任日益复杂的无人驾驶任务。国外的一些先进的基于计算机视觉的驾驶辅助系统可以利用摄像头对障碍物进行有效的识别检测，并且已经用于汽车上了，但该技术已被国外垄断，国内仍需对该技术进行探索。

发明内容

根据现有技术存在的上述问题，本发明提供了一种基于深度学习的无人驾驶汽车障碍物识别检测方法。

为了实现上述发明目的，本发明采用以下技术方案：

一种基于深度学习的无人驾驶汽车障碍物识别检测方法，包括以下步骤：

步骤1、预处理步骤，

对摄像头传感器采集的图像进行预处理，并将预处理之后的图像缩放成416×416的像素大小；

步骤2、进入第一卷积层处理，具体为：

步骤2.1、经过步骤1处理后的图像进入第一卷积层进行处理，第一卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为32，输出图像的维度为416×416×32；

步骤2.2、经过步骤2.1处理后的图像进入了第一池化层，第一池化层采用最大值池化方法，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为208×208×32；

步骤3、进入第二卷积层处理，具体为：

步骤3.1、经过步骤2.2处理后的图像进入第二卷积层进行处理，第二卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为64，输出图像的维度为208×208×64；

步骤3.2、经过步骤3.1处理后的图像进入了第二池化层，第二池化层采用最大值池化方法，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为104×104×64；

步骤4、进入第三卷积层和第四卷积层处理，具体为：

步骤4.1、经过步骤3.2处理后的图像进入了第三卷积层进行处理，第三卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为64，输出图像的维度为104×104×64；

步骤4.2、经过步骤4.1处理后的图像进入了第四卷积层进行处理，第四卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为128，输出图像的维度为104×104×128；

步骤4.3、经过步骤4.2处理后的图像进入了第三池化层进行处理，第三池化层采用最大值池化方法进行处理，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为52×52×128；

步骤5、进入第五卷积层至第八卷积层处理，具体为：

步骤5.1、经过步骤4.3处理后的图像进入了第五卷积层进行处理，第五卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为128，输出图像的维度为52×52×128；

步骤5.2、经过步骤5.1处理后的图像进入了第六卷积层进行处理，第六卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为256，输出图像的维度为52×52×256；

步骤5.3、经过步骤5.2处理后的图像进入了第七卷积层进行处理，第七卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为128，输出图像的维度为52×52×128；

步骤5.4、经过步骤5.3处理后的图像进入了第八卷积层进行处理，第八卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为256，输出图像的维度为52×52×256；

步骤5.5、经过步骤5.4处理后的图像进入了第四池化层进行处理，第四池化层采用最大值池化方法进行处理，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为26×26×256；

步骤6、进入第九卷积层至第十二卷积层处理，具体为：

步骤6.1、经过步骤5.5处理后的图像进入第九卷积层进行处理，第九卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为256，输出图像的维度为26×26×256；

步骤6.2、经过步骤6.1处理后的图像进入第十卷积层进行处理，第十卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为26×26×512；

步骤6.3、经过步骤6.2处理后的图像进入第十一卷积层进行处理，第十一卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为256，输出图像的维度为26×26×256；

步骤6.4、经过步骤6.3处理后的图像进入第十二卷积层进行处理，第十二卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为26×26×512；

步骤6.5、经过步骤6.4处理后的图像进入了第五池化层进行处理，第五池化层采用最大值池化方法进行处理，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为13×13×512；

步骤7、进入第十三卷积层至第十八卷积层进行处理，具体为：

步骤7.1、经过步骤6.5处理后的图像进入第十三卷积层进行处理，第十三卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为13×13×512；

步骤7.2、经过步骤7.1处理后的图像进入第十四卷积层进行处理，第十四卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024；

步骤7.3、经过步骤7.2处理后的图像进入第十五卷积层进行处理，第十五卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为13×13×512；

步骤7.4、经过步骤7.3处理后的图像进入第十六卷积层进行处理，第十六卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024；

步骤7.5、经过步骤7.4处理后的图像进入第十七卷积层进行处理，第十七卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为13×13×512；

步骤7.6、经过步骤7.5处理后的图像进入第十八卷积层进行处理，第十八卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024；

步骤8、进入第十九卷积层至第二十一卷积层进行处理，具体为：

步骤8.1、经过步骤7.6处理后的图像进入第十九卷积层进行处理，第十九卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024；

步骤8.2、经过步骤8.1处理后的图像进入第二十卷积层进行处理，第二十卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024；

步骤8.3、经过步骤8.2处理后的图像进入第二十一卷积层进行处理，第二十一卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024；

步骤9、进入输出卷积层进行处理，

经过步骤8.3处理后的图像进入输出卷积层进行处理，输出卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为60，输出图像的维度为13×13×60，即13×13×(5×(7+1+4))，

其中，13×13为单元的维度，5为每个单元预测的候选窗口的维度，7为识别的目标类别维度，目标类别包括行人、自行车、摩托车、电动车、汽车、猫和狗，1为目标的概率维度，4为目标的坐标维度，

步骤10、步骤9输出的图像的维度为13×13×5×12，解析步骤9输出的图像中的目标类别、目标概率、以及目标坐标，将目标类别和目标概率相乘计算出每个目标的各个类别对应的概率向量，将概率向量中的元素与设定阈值的进行比较，根据比较结果获得目标对应的类别，以及获得目标对应的坐标。

发明与现有技术相比，具有以下优点和效果：

与现有技术相比，本发明全面分析摄像头采集的图像信息，从提高无人驾驶汽车感知能力的角度出发，通过深度卷积神经网络对图像特征进行提取分析，对图像中的物体(行人、机动车、非机动车等障碍物)进行深度学习，从而有效的识别检测出障碍物，使汽车更好的感知外界环境，提高汽车的安全性。

附图说明

图1是无人驾驶汽车主要零部件的示意图。

图2是本发明的深度卷积神经网络的架构图。

具体实施方式

以下结合附图对本发明的技术方案作进一步的详细描述。

如图2所示，一种基于深度学习的无人驾驶汽车障碍物识别检测方法，包括9个Section(按图中虚线划分)，具体步骤如下：

步骤1、预处理步骤。

摄像头传感器采集的图像进行预处理，预处理包括去均值处理和方差单位化处理。并将预处理之后的图像缩放成416×416的像素大小，因为图像是彩色图，具有RGB三个通道，故送入卷积神经网络的图像大小为416×416×3。

步骤2、进入第一卷积层处理。

步骤2.1、经过步骤1处理后的图像进入第一卷积层进行处理，第一卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为32，输出图像的维度为416×416×32。

步骤2.2、经过步骤2.1处理后的图像进入了第一池化层，第一池化层采用最大值池化方法，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为208×208×32。

步骤3、进入第二卷积层处理。

步骤3.1、经过步骤2.2处理后的图像进入第二卷积层进行处理，第二卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为64，输出图像的维度为208×208×64。

步骤3.2、经过步骤3.1处理后的图像进入了第二池化层，第二池化层采用最大值池化方法，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为104×104×64。

步骤4、进入第三卷积层和第四卷积层处理。

步骤4.1、经过步骤3.2处理后的图像进入了第三卷积层进行处理，第三卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为64，输出图像的维度为104×104×64。

步骤4.2、经过步骤4.1处理后的图像进入了第四卷积层进行处理，第四卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为128，输出图像的维度为104×104×128。

步骤4.3、经过步骤4.2处理后的图像进入了第三池化层进行处理，第三池化层采用最大值池化方法进行处理，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为52×52×128。

步骤5、进入第五卷积层至第八卷积层处理。

步骤5.1、经过步骤4.3处理后的图像进入了第五卷积层进行处理，第五卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为128，输出图像的维度为52×52×128。

步骤5.2、经过步骤5.1处理后的图像进入了第六卷积层进行处理，第六卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为256，输出图像的维度为52×52×256。

步骤5.3、经过步骤5.2处理后的图像进入了第七卷积层进行处理，第七卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为128，输出图像的维度为52×52×128。

步骤5.4、经过步骤5.3处理后的图像进入了第八卷积层进行处理。第八卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为256，输出图像的维度为52×52×256。

步骤5.5、经过步骤5.4处理后的图像进入了第四池化层进行处理，第四池化层采用最大值池化方法进行处理，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为26×26×256。

步骤6、进入第九卷积层至第十二卷积层处理。

步骤6.1、经过步骤5.5处理后的图像进入第九卷积层进行处理，第九卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为256，输出图像的维度为26×26×256。

步骤6.2、经过步骤6.1处理后的图像进入第十卷积层进行处理，第十卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为26×26×512。

步骤6.3、经过步骤6.2处理后的图像进入第十一卷积层进行处理，第十一卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为256，输出图像的维度为26×26×256。

步骤6.4、经过步骤6.3处理后的图像进入第十二卷积层进行处理，第十二卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为26×26×512。

步骤6.5、经过步骤6.4处理后的图像进入了第五池化层进行处理，第五池化层采用最大值池化方法进行处理，池化窗口大小为2×2，池化滑动窗口步长为2，故池化后输出的图像维度为13×13×512。

步骤7、进入第十三卷积层至第十八卷积层进行处理。

步骤7.1、经过步骤6.5处理后的图像进入第十三卷积层进行处理，第十三卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为13×13×512。

步骤7.2、经过步骤7.1处理后的图像进入第十四卷积层进行处理，第十四卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024。

步骤7.3、经过步骤7.2处理后的图像进入第十五卷积层进行处理，第十五卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为13×13×512。

步骤7.4、经过步骤7.3处理后的图像进入第十六卷积层进行处理，第十六卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024。

步骤7.5、经过步骤7.4处理后的图像进入第十七卷积层进行处理，第十七卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为512，输出图像的维度为13×13×512。

步骤7.6、经过步骤7.5处理后的图像进入第十八卷积层进行处理，第十八卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024。

步骤8、进入第十九卷积层至第二十一卷积层进行处理。

步骤8.1、经过步骤7.6处理后的图像进入第十九卷积层进行处理，第十九卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024。

步骤8.2、经过步骤8.1处理后的图像进入第二十卷积层进行处理，第二十卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024。

步骤8.3、经过步骤8.2处理后的图像进入第二十一卷积层进行处理，第二十一卷积层的卷积核大小为3×3，卷积滑动窗口步长为1，卷积后的输出特征数为1024，输出图像的维度为13×13×1024。

步骤9、进入输出卷积层进行处理。

经过步骤8.3处理后的图像进入输出卷积层进行处理，输出卷积层的卷积核大小为1×1，卷积滑动窗口步长为1，卷积后的输出特征数为60，故输出图像的维度为13×13×60。

即经过步骤9处理后的图像的维度为13×13×(5×(7+1+4))，

其中，13×13为单元(cell)的维度，5为每个单元(cell)预测的候选窗口(anchorboxes)的维度，7为识别的目标(也即障碍物)类别维度，目标类别包括行人、自行车、摩托车、电动车、汽车、猫和狗，1为目标的概率维度，4为目标的坐标维度。

步骤10、步骤9输出的图像的维度为13×13×5×12，解析步骤9输出的图像中的目标类别(13×13×5×7)、目标概率(13×13×5×1)、以及目标坐标(13×13×5×4)，，将目标类别和目标概率相乘计算出每个目标的各个类别对应的概率向量，根据概率向量中的元素与设定阈值的进行比较，根据比较结果获得目标对应的类别，以及获得目标对应的坐标。

由此，本发明就可以识别出图像的目标的类别以及目标在图像中的相对位置。将识别出来的结果送入主控系统中综合分析，汽车就能够更好的感知外界环境，从而保障行车安全。

以上是对本发明的具体实施例进行了描述，仅仅是对本发明精神作举例说明。本发明所属领域的技术人员可以在权利要求的范围内对所描述的具体实施例做任何修改、补充或采用类似的方式替代，这并不影响本发明的实质内容。

Claims

1.一种基于深度学习的无人驾驶汽车障碍物识别检测方法，其特征在于，包括以下步骤：