CN111860175A

CN111860175A - 一种基于轻量化网络的无人机影像车辆检测方法及装置

Info

Publication number: CN111860175A
Application number: CN202010573599.3A
Authority: CN
Inventors: 孙显; 刁文辉; 付琨; 许滔; 尹文昕; 李�浩; 王佩瑾; 刘迎飞
Original assignee: Aerospace Information Research Institute of CAS
Current assignee: Aerospace Information Research Institute of CAS
Priority date: 2020-06-22
Filing date: 2020-06-22
Publication date: 2020-10-30
Anticipated expiration: 2040-06-22
Also published as: CN111860175B

Abstract

本发明涉及一种基于轻量化网络的无人机影像车辆检测方法及装置，属于视觉目标检测领域，包括：获取无人机的机载摄像头采集的目标区域图像，并对所述目标区域图像进行预处理；将预处理后的目标区域图像输入至预先训练的轻量化检测网络，获取所述预先训练的轻量化检测网络输出的目标区域初始车辆检测结果；采用非极大值抑制算法对所述目标区域初始车辆检测结果进行筛选，获取目标区域的最终车辆检测结果；本发明提供的技术方案解决了SSD目标检测模型的计算量和参数量太大导致无人机平台无法实时检测车辆目标且检测准确率低的问题。

Description

一种基于轻量化网络的无人机影像车辆检测方法及装置

技术领域

本发明涉及视觉目标检测领域，具体涉及一种基于轻量化网络的无人机影像车辆检测方法及装置。

背景技术

车辆目标实时检测在交通流量监测、交通规划、车辆引导指挥等方面起着极其重要的作用。随着无人机技术的发展，其灵活性、机动性、便捷性使得无人机在交通流量监测等方面得到了广泛的应用，常被用于车辆目标检测。由于无人机的软硬件功耗大且电池容量有限，导致其载荷和续航时间受到了严重的制约。因此，工业界对无人机的低功耗要求越来越严格。为解决这个问题，现有的优化方案主要是对无人机的电池、发动机等硬件进行优化；但是除了这些因素造成电能消耗外，更重要的是无人机所搭载的软件算法，尤其是其核心算法，即车辆目标检测算法。

现有的目标检测算法普遍采用深度学习技术，这类算法虽然准确率较高，但常见的算法的网络结构复杂、参数量大、计算量大，而无人机搭载的处理器性能有限，在运行这类复杂的算法时，无法满足实时性需求。常见的轻量级检测算法如MobileNet-SSD等，在该平台上对车辆目标检测的准确率很低。因此，有必要提出一种实时性好、计算量小、准确率高的车辆目标实时检测方法，一方面减小算法模型的参数量和计算量，另一方面保证检测模型的准确率。

发明内容

针对现有技术的不足，本发明的目的是提供一种能够解决SSD目标检测模型的计算量和参数量太大导致无人机平台无法实时检测车辆目标且检测准确率低的问题的车辆目标检测方法及装置。

本发明的目的是采用下述技术方案实现的：

本发明提供了一种基于轻量化网络的无人机影像车辆检测方法，其改进之处在于，所述方法包括：

获取无人机的机载摄像头采集的目标区域图像，并对所述目标区域图像进行预处理；

将预处理后的目标区域图像输入至预先训练的轻量化检测网络，获取所述预先训练的轻量化检测网络输出的目标区域初始车辆检测结果；

采用非极大值抑制算法对所述目标区域初始车辆检测结果进行筛选，获取目标区域的最终车辆检测结果。

优选的，所述预先训练的轻量化检测网络的获取过程包括：

步骤1.获取无人机的机载摄像头采集的实景图像数据，并对所述实景图像数据中图像进行预处理；

步骤2.人工标注所述实景图像数据中图像中车辆的车辆类别和矩形边界框；

步骤3.对所述实景图像数据进行数据增强，并将增强后的实景图像数据划分为训练数据和测试数据；

步骤4.利用所述训练数据和测试数据对初始轻量化神经网络模型进行训练，并将训练完成的初始轻量化神经网络模型作为所述预先训练的轻量化检测网络。

进一步的，所述预处理包括：

对图像进行裁切，并将裁切后的图像缩小至512*512；

其中，所述裁切过程中裁切窗口尺寸为720*720，裁切窗口的重叠尺寸为200像素。

进一步的，所述数据增强包括：平移、旋转、尺度缩放、亮度变化和/或高斯模糊。

进一步的，所述初始轻量化神经网络模型包括：

第一特征提取单元，用于将输入图像依次经过2组3*3的标准卷积层，得到高256，宽256，通道数为64的特征图；

第二特征提取单元，用于将第一特征提取单元输出的特征图经过动态特征卷积块，得到高128，宽128，通道数为128的特征图；

第三特征提取单元，用于将第二特征提取单元输出的特征图经过自适应感受野模块，得到高128，宽128，通道数为128的特征图；

第四特征提取单元，用于将第二特征提取单元输出的特征图依次经过三组动态特征卷积块，分别获取各组动态特征卷积块输出的高64，宽64，通道数为256的特征图，高32，宽32，通道数为512的特征图和高16，宽16，通道数为512的特征图；

第五特征提取单元，用于将所述高16，宽16，通道数为512的特征图依次经过四组3*3的标准卷积，分别获取各3*3的标准卷积输出的高8，宽8，通道数为512的特征图，高4，宽4，通道数为256的特征图，高2，宽2，通道数为256的特征图和高1，宽1，通道数为256的特征图；

定位子网络，用于对所述高64，宽64，通道数为256的特征图，高32，宽32，通道数为512的特征图，高16，宽16，通道数为512的特征图，高8，宽8，通道数为512的特征图，高4，宽4，通道数为256的特征图，高2，宽2，通道数为256的特征图和高1，宽1，通道数为256的特征图进行逐像素预测，获取定位偏移值；

分类子网络，对所述高64，宽64，通道数为256的特征图，高32，宽32，通道数为512的特征图，高16，宽16，通道数为512的特征图，高8，宽8，通道数为512的特征图，高4，宽4，通道数为256的特征图，高2，宽2，通道数为256的特征图和高1，宽1，通道数为256的特征图进行逐像素预测，获取分类置信度。

进一步的，所述动态特征卷积块，包括：

第一特征提取子单元，用于将输入特征图F0依次经过1*3和3*1的深度可分离卷积，获取特征图F1，其中，F1和F0的尺寸相同；

第二特征提取子单元，用于将F1经过全局最大池化得到特征图F1_M，并将F1经过全局平均池化得到特征图F1_A，其中，F1_M和F1_A的高宽尺寸均为1*1，通道数与F1相同。

第三特征提取子单元，用于将F1_M和F1_A沿通道维度进行拼接，得到特征向量F1_C，将F1_C拉直后依次送入两组全连接网络，得到特征F1_B，将F1_B经过Sigmoid函数输出激活值F1_BA，其中，F1_B的通道数量与F1_M的通道数量相同；

第四特征提取子单元，用于将激活值F1_BA与特征图F1相乘得到特征图F1_S，将特征图F1_S与特征图F1相加，得到特征图F2；

第五特征提取子单元，用于将特征图F2依次经过1*3和3*1的深度可分离卷积，获取特征图F3；

第六特征提取子单元，用于将特征图F3与特征图F0相加后经过一组3*3的标准卷积，得到高128，宽128，通道数为128的特征图。

进一步的，所述自适应感受野模块包括：

第一自适应感受野子模块，用于将输入特征图F0经过1*1的标准卷积，得到的特征图F_A，其中，F_A与F0的尺寸相同；

第二自适应感受野子模块，用于将输入特征图F0依次经过3*1和1*3的标准卷积，得到特征图F_B，其中，F_B和F0的尺寸相同；

第三自适应感受野子模块，用于将输入特征图F0经过3*3且空洞率为2的深度可分离卷积，得到特征图F_C，其中，F_C和F0的尺寸相同；

第四自适应感受野子模块，用于将输入特征图F0经过3*3且空洞率为6的深度可分离卷积，得到特征图F_D，其中，F_D和F0的尺寸相同；

第五自适应感受野子模块，用于将输入特征图F0经过3*3且空洞率为12的深度可分离卷积，得到特征图F_E，其中，F_E和F0的尺寸相同；

第六自适应感受野子模块，用于将F0、F_A、F_B、F_C、F_D、F_E相加，得到特征图F1；

第七自适应感受野子模块，用于将特征图F1经过1*1的标准卷积，得到高128，宽128，通道数为128的特征图。

进一步的，所述步骤4包括：

基于所述训练数据和测试数据，采用梯度下降算法对初始轻量化神经网络模型进行训练。

基于同一发明构思，本发明还提供了一种基于轻量化网络的无人机影像车辆检测装置，其改进之处在于，所述装置包括：

第一获取模块，用于获取无人机的机载摄像头采集的目标区域图像，并对所述目标区域图像进行预处理；

检测模块，用于将预处理后的目标区域图像输入至预先训练的轻量化检测网络，获取所述预先训练的轻量化检测网络输出的目标区域初始车辆检测结果；

第二获取模块，用于采用非极大值抑制算法对所述目标区域初始车辆检测结果进行筛选，获取目标区域的最终车辆检测结果。

与最接近的现有技术相比，本发明具有的有益效果：

本发明提供的一种基于轻量化网络的无人机影像车辆检测方法及装置，首先获取无人机的机载摄像头采集的目标区域图像，并对所述目标区域图像进行预处理，其次，将预处理后的目标区域图像输入至预先训练的轻量化检测网络，获取所述预先训练的轻量化检测网络输出的目标区域初始车辆检测结果，最后，采用非极大值抑制算法对所述目标区域初始车辆检测结果进行筛选，获取目标区域的最终车辆检测结果；与现有技术相比，该方案中的轻量化检测网络减少模型骨干网络的参数量和计算量，以提高模型的检测速度，从而减少对硬件的需求，使之更适用于计算资源有限的车辆目标实时检测平台；

进一步的，轻量化检测网络中提出的自适应感受野模块用于辅助构建骨干网络，在增加少量参数的情况下，从最浅层增大模型的感受野，从而提高后续各层的特征表达能力，以提高模型的检测准确率。本发明的方法具有参数量少、计算量少、实时性好、准确率高的优点，可以实现无人机影像车辆目标实时检测任务。

附图说明

图1是本发明提供的一种基于轻量化网络的无人机影像车辆检测方法流程图；

图2是本发明实施例中初始轻量化神经网络模型的结构示意图；

图3是本发明实施例中动态特征卷积块的结构示意图；

图4是本发明实施例中自适应感受野模块的结构示意图；

图5是本发明提供的一种基于轻量化网络的无人机影像车辆检测装置的结构示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步的详细说明。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

为了解决现有技术中所存在的参数量大、计算量大、实时性差、准确率低的问题，本发明基于SSD的基本架构，设计一种基于轻量化网络的无人机影像车辆检测方法，利用动态特征卷积块和自适应感受野模块构建骨干网络，以减少模型的计算量和运行时间，同时提高模型的准确率，如图1所示，所述方法包括：

101获取无人机的机载摄像头采集的目标区域图像，并对所述目标区域图像进行预处理；

102将预处理后的目标区域图像输入至预先训练的轻量化检测网络，获取所述预先训练的轻量化检测网络输出的目标区域初始车辆检测结果；

103采用非极大值抑制算法对所述目标区域初始车辆检测结果进行筛选，获取目标区域的最终车辆检测结果。

本发明提供的最优实施例中，可以将预先训练的轻量化检测网络在TensorFlow框架下转换为可执行的PB文件，并将该文件部署到无人机车辆目标检测平台上，进而金鱼该检测平台获取目标区域的最终车辆检测结果。

具体的，本发明提供的实施例中，所述预先训练的轻量化检测网络的获取过程包括：

进一步的，在上述实施过程中，可以基于如下步骤实现所述步骤1至步骤3：

a.选择类似于露天停车场、车站等停靠有大量车辆的场地，在这些区域上空以不同高度、不同姿态、不同角度进行自由飞行，同时保持机载摄像头朝向地面，并保证摄像头视野范围内包含车辆目标；

b.机载摄像头每2秒拍摄1张1280*720的高分辨率图像，并同时将图像保存在指定目录；

c.利用数据标注软件对图像中的车辆目标进行标注，对每个目标均标注出车辆类别和矩形边界框；

d.利用平移、旋转、尺度缩放、亮度变化和/或高斯模糊等方式对所述实景图像数据进行数据增强；

例如，对图像的预处理包括对各图像作裁切、翻转、平移、亮度变化等方法。对原图的裁切窗口尺寸为720*720，裁切窗口的重叠尺寸为200像素，裁切后的图像被缩小至512*512的分辨率。将裁切后的图像作翻转、平移、亮度变化，以实现样本数量的扩增；

再例如，对所述训练数据按照概率0.5进行水平和垂直方向的随机翻转，角度-20度到20度，步距1度的图像随机旋转操作，90度、180度、270度的固定角度随机旋转操作，以及图像尺寸0.25到4倍随机缩放操作。

e.将所有扩增后的图像按照1:1的数量比例划分为训练集和测试集。

其中，上述方案中的预处理可以包括：

对图像进行裁切，并将裁切后的图像缩小至512*512；

进一步的，上述步骤4中的初始轻量化神经网络模型，如图2所示，包括：

图2中，3*3Conv表示标准卷积块，DFC表示动态特征卷积块，ARFM表示自适应感受野模块。

其中，所述动态特征卷积块，如图3所示，包括：

图3中，DW表示深度可分离卷积，GMP表示全局最大池化，GAP表示全局平均池化，FC表示全连接层，Conv表示标准卷积块，Sigmoid表示激活函数，C表示拼接，·表示点乘，+表示相加；

所述自适应感受野模块，如图4所示，包括：

图4中，DW表示深度可分离卷积，Conv表示标准卷积块，+表示逐元素相加；

进一步的，所述步骤4包括：

例如，基于如下步骤实现所述步骤4：

(4.a)将预定义的锚框与目标边框匹配，交并比高于0.5的锚框设为正样本，低于0.1的设为负样本，同时使用类别负样本挖掘方法再选择一些负样本，最终负样本与正样本比例为3:1；

(4.b)网络的定位损失函数与分类的损失函数的权重系数分别设置为1.2和0.8，定位损失函数采用平滑的二次函数，分类损失函数采用交叉熵损失函数；

(4.c)模型由均值为0、标准差为0.01的正态分布进行随机初始化，优化器采用随机梯度下降算法对网络进行端到端训练。

基于同一发明构思，本发明还提供了一种基于轻量化网络的无人机影像车辆检测装置，如图5所示，所述装置包括：

优选的，所述预先训练的轻量化检测网络的获取过程包括：

进一步的，所述预处理包括：

对图像进行裁切，并将裁切后的图像缩小至512*512；

进一步的，所述初始轻量化神经网络模型包括：

进一步的，所述动态特征卷积块，包括：

进一步的，所述自适应感受野模块包括：

进一步的，所述步骤4包括：

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。

Claims

1.一种基于轻量化网络的无人机影像车辆检测方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述预先训练的轻量化检测网络的获取过程包括：

3.如权利要求1或2所述的方法，其特征在于，所述预处理包括：

对图像进行裁切，并将裁切后的图像缩小至512*512；

4.如权利要求2所述的方法，其特征在于，所述数据增强包括：平移、旋转、尺度缩放、亮度变化和/或高斯模糊。

5.如权利要求2所述的方法，其特征在于，所述初始轻量化神经网络模型包括：

6.如权利要求5所述的方法，其特征在于，所述动态特征卷积块，包括：

7.如权利要求5所述的方法，其特征在于，所述自适应感受野模块包括：

8.如权利要求2所述的方法，其特征在于，所述步骤4包括：

9.一种基于轻量化网络的无人机影像车辆检测装置，其特征在于，所述装置包括：