CN109101926A

CN109101926A - 基于卷积神经网络的空中目标检测方法

Info

Publication number: CN109101926A
Application number: CN201810924226.9A
Authority: CN
Inventors: 张庆辉; 万晨霞; 卞山峰
Original assignee: Zhengzhou Aiyi Electronic Technology Co ltd; Henan University of Technology
Current assignee: Zhengzhou Aiyi Electronic Technology Co ltd; Henan University of Technology
Priority date: 2018-08-14
Filing date: 2018-08-14
Publication date: 2018-12-28

Abstract

本发明公开了一种基于卷积神经网络的空中目标检测方法，旨在解决现有检测方法对空中目标的检测精度低、无法适用的技术问题。本发明包括制作空中目标图像数据集，搭建基于Caffe深度学习框架的SSD模型并对其进行池化、反卷积、级联连接的改造，使用损失函数对检测模型进行优化，采用Softmax算法对特征进行分类，然后训练得到最终用于检测空中目标的检测模型。本发明的有益技术效果在于：适用于空中目标的尺寸规格，检测精度高。

Description

基于卷积神经网络的空中目标检测方法

技术领域

本发明涉及机器学习技术领域，具体涉及一种基于卷积神经网络的空中目标检测方法。

背景技术

随着防空武器光电跟踪的迅速发展，空中目标检测面临巨大挑战。空中目标相比地面目标所处空域背景较为简单平缓，但远处空中目标成像较小，并且容易受到光照、云雾干扰。近处的一些目标如小鸟快速灵活地机动难以捕捉，镜头晃动容易造成画面模糊失真，而且出于跟踪要求，检测速度需满足实时性。

传统的目标检测算法主要有帧差法、光流法、特征匹配法、背景建模法、阈值分割法。帧差法快捷且主动性好，但只能检测静态背景中的移动物体；光流法和特征匹配法检测精度和匹配度高，但需要手动初始化目标，缺乏自主性且计算量大；背景建模法利于目标和背景的自动分割，但模型的建立和更新较为耗时，尤其是动态背景，容易对结果产生干扰；阈值分割法对背景简单的情况便捷高效，但对于复杂的背景效果并不理想。

近年，随着深度学习的发展，基于卷积神经网络的深度学习在图像识别、图像检测和图像分割等领域都取得了显著成就。与传统的算法相比，避免了对图像目标的手工提取特征，能够提高模型的泛化能力。申请人于2018年1月17 日提出了申请号为“2018100446701”发明名称为“基于神经网络的道路目标检测方法”的发明专利申请，上述申请基于TensorFlow框架利用常规SSD网络模型来提高检测速度，但是这种方法对小目标的检测则是通过添加不同尺寸的特征图来实现的，并不足以适应空中目标的尺寸规格。

发明内容

本发明提供一种基于卷积神经网络的空中目标检测方法以解决现有的目标检测方法不足以适应空中目标尺寸规格的技术问题。

为解决上述技术问题，本发明采用如下技术方案：

设计一种基于卷积神经网络的空中目标检测方法，包括以下步骤：

步骤1、制作空中目标静态和视频图像数据集；

步骤2、搭建Caffe深度学习框架，其中模型的配置利用常规SSD模型完成，并采用VGG-16网络结构对步骤1中的图像数据集进行特征提取；

步骤3、采用池化、反卷积结构以及级联连接，对步骤2中的常规SSD模型进行改进；

步骤4、用交叉熵代价函数作为置信度损失函数，并与预测框与真实框之间的位置损失函数进行加权求和，得到总体的损失函数进行优化；

步骤5、对优化后的特征利用SoftMax算法进行分类得到检测结果。

进一步的，步骤1包括以下处理：按照VOC数据集格式标准构建空中目标检测数据集；其中每张图对应一个标签，标签标明了图片名称，图片中目标的类别以及目标外接矩形的坐标和宽高；所述空中目标检测数据集包含28段、2.1 万帧视频图像，以及1400张静态图像，分为鸟类、战斗机、直升机、客机四类目标。

进一步的，步骤3包括以下处理：(1)通过反卷积结构来连接较低层的特征图，通过池化结构来连接上层的特征图，反卷积结构仅使用带有批量归一化的反卷积层；(2)同时执行池化和反卷积以创建不同层的特征图，每个层通过池化和/或反卷积后得到相同大小的特征图；(3)采用级联连接，将(2)中得到的相同大小的特征图连接起来。

进一步的，步骤4中置信度损失函数定义为：其中：表示第i个默认框与类别为 p的第j个真实框相匹配，p为目标类别种类，表示第i个默认框为类别p的置信度，

进一步的，步骤4中位置损失函数定义为：其中，(cx，cy)为默认框的中心，(w)为默认框的宽，(h)为默认框的高，g表示真实框的位置，d表示默认框的位置，l表示表示默认框相对于真实框的偏移量。

进一步的，步骤4中总体的目标损失函数定义为：其中：α＝0.5，N为默认框的个数。

与现有技术相比，本发明的有益技术效果在于：

1.本发明采用的Caffe网络框架相较于TensorFlow网络结构更加简单，操作更方便。

2.本发明采用池化和反卷积结构以及级联连接对常规SSD模型进行改进， VGG-16网络提取出的特征图每次卷积后通过池化连接到上层特征图，通过反卷积连接到下层特征图，采用级联连接将经过池化和反卷积处理后的特征图连接起来，使SSD模型可以通过共享权重统一不同层中的默认框，以此来提高SSD 模型检测小目标的能力，同时也能提高检测精度。

附图说明

图1是本发明基于神经网络的空中目标检测方法的目标数据集；

图2是本发明基于神经网络的空中目标检测方法的SSD模型结构示意图；

图3是本发明基于神经网络的空中目标检测方法对SSD模型进行改进的示意图；

图4是本发明基于神经网络的空中目标检测方法在改进SSD模型下空中目标检测的结果图；

图5是本发明基于神经网络的空中目标检测方法在常规SSD和改进SSD模型下训练空中目标鸟类的Precision-Recall曲线图；

图6是本发明基于神经网络的空中目标检测方法在常规SSD和改进SSD模型下训练空中目标战斗机的Precision-Recall曲线图；

图7是本发明基于神经网络的空中目标检测方法在常规SSD和改进SSD模型下训练空中目标直升机的Precision-Recall曲线图；

图8是本发明基于神经网络的空中目标检测方法在常规SSD和改进SSD模型下训练空中目标客机的Precision-Recall曲线图。

具体实施方式

下面结合附图和实施例来说明本发明的具体实施方式，但以下实施例只是用来详细说明本发明，并不以任何方式限制本发明的范围。

以下实施例中所涉及或依赖的程序均为本技术领域的常规程序或简单程序，本领域技术人员均能根据具体应用场景做出常规选择或者适应性调整。

实施例1：一种基于卷积神经网络的空中目标检测方法，参见图1至图3，首先，按照VOC数据集格式标准构建空中目标数据集。数据集中每张图对应一个标签，标签标明了图片名称，图片中目标的类别以及目标外接矩形的坐标和宽高。数据集包含28段2.1万帧视频图像，以及1400张静态图像，分为鸟类 (空中飞行的鸟)，战斗机(军用固定翼飞机)，直升机(旋翼飞机)，客机(大小型客机)四类目标。数据集中大多目标处于飞行状态，背景除天空外，也包括地面和海面的场景。

将上述空中目标训练集的文件夹放在基于Caffe深度学习框架的SSD模型 data文件夹下，参见图2，运用多个卷积核对特征图进行多次卷积产生一系列固定大小的默认框，以及每一个框包含物体实例的可能性，常规的SSD模型一共产生38*38*4+19*19*6+10*10*6+5*5*6+3*3*4+1*1*4＝8732个默认框，本实施例在VGG-16部分新增了Conv3层，使默认框个数增加至8732+75*75*4＝31232 个，更有利于小目标的检测。但仅通过默认框的增加对于空中目标的检测效果提升并不明显，因此，本实施例对每次卷积后产生特征图进行处理，具体操作如下：通过池化将较低层中的特征图连接到上层的特征图，参见图3(a),通过反卷积将上层的特征图连接到下层特征，参见图3(b)，以conv9层的特征图为例，对其下层的conv8、conv7、conv4、conv3进行池化，上层的conv10、conv11 进行反卷积，得到与conv9层相同大小的特征图；将下层池化和上层反卷积的特征图进行级联连接并送入softmax分类层，参见图3(c)，进而得到所需的默认框。默认框进入分类层前，需要利用损失函数进行优化，上述损失函数为置信度损失函数与位置损失函数的加权和，置信度损失函数的表达式为：其中：表示第i个默认框与类别为p的第j个真实框相匹配，p为目标类别种类，表示第i个默认框为类别p的置信度，位置损失函数的表达式为：其中，(cx，cy)为默认框的中心，(w)为默认框的宽，(h)为默认框的高，g表示真实框的位置，d表示默认框的位置，l表示表示默认框相对于真实框的偏移量；总体的损失函数表达式为：N为默认框的个数，α取0.5。

空中训练集中的图像每次进入上述检测模型，经特征提取、优化、分类等操作产生的参数会被检测模型加以保留，并作为下次检测的参考，此即为机器学习，将上述训练集中的所有图像依次输入检测模型这一过程为检测模型的训练，训练后的检测模型即为最终需要的检测模型。此时，将测试集中的图像输入该最终的检测模型即可得出该图像中含有的空中目标的类别和位置。

图4为本实施例改进的SSD模型下空中目标检测的结果图，(a)中目标为林间飞行的鸟，背景中含有大面积的树林，环境比较复杂，(b)中目标为战斗机，背景颜色与右侧的目标颜色较为接近，(c)中目标位直升机，背景则比较复杂，含有高山、白云、地面目标等，(d)中目标为客机，其与背景颜色较为相近，而且右侧含有对比度较为明显的遮挡物，(e)中目标位客机，距离较远，图像中目标弱小，(f)为快速飞行的鸟。由该结果可知本实施例对于大面积遮挡、目标弱小、复杂背景、光照影响、运动模糊等多种影响检测效果的因素下仍能准确检测出目标。

图5是本发明在SSD和改进的SSD模型下训练空中目标鸟类的 Precision-Recall曲线图；图6是本发明在SSD和改进的SSD模型下训练空中目标战斗机的Precision-Recall曲线图；图7是本发明在SSD和改进的SSD模型下训练空中目标直升机的Precision-Recall曲线图；图8是本发明在SSD和改进的SSD模型下训练空中目标客机的Precision-Recall曲线图。曲线下的面积表示的是检测精度，对曲线求积分可以得出，原来的SSD算法平均检测精度mAP＝0.51，而改进后的SSD算法平均检测精度mAP＝0.72，平均检测精度提高了0.21。

上面结合附图和实施例对本发明作了详细的说明，但是，所属技术领域的技术人员能够理解，在不脱离本发明宗旨的前提下，还可以对上述实施例中的各个具体参数进行变更，形成多个具体的实施例，均为本发明的常见变化范围，在此不再一一详述。

Claims

1.一种基于卷积神经网络的空中目标检测方法，其特征在于，包括以下步骤：

步骤1、制作空中目标的图像数据集，包括训练集和测试集，其中，70％的图像为训练集，30％的图像为测试集；

步骤2、搭建Caffe深度学习框架，其中模型的配置利用常规SSD模型完成，并采用VGG-16网络进行特征提取；

步骤5、对优化后的特征利用SoftMax算法进行分类，进而得到初步的检测模型；

步骤6、利用步骤1中的训练集对步骤5所述的初步的检测模型进行训练，得到最终的检测模型；

步骤7、将测试集输入步骤6中最终的训练模型，得出测试结果。

2.根据权利要求1所述的基于卷积神经网络的空中目标检测方法，其特征在于，所述步骤1包括以下处理：按照VOC数据集格式标准构建空中目标检测数据集；其中每张图对应一个标签，标签标明了图片名称，图片中目标的类别以及目标外接矩形的坐标和宽高。

3.根据权利要求2所述的基于卷积神经网络的空中目标检测方法，其特征在于，所述空中目标检测数据集包含28段、2.1万帧视频图像，以及1400张静态图像，分为鸟类、战斗机、直升机、客机四类目标。

4.根据权利要求1所述的基于卷积神经网络的空中目标检测方法，其特征在于，所述步骤3包括以下处理：

(1)通过反卷积结构来连接较低层的特征图，通过池化结构来连接上层的特征图，反卷积结构仅使用带有批量归一化的反卷积层；

(2)同时执行池化和反卷积以创建不同层的特征图，每个层通过池化或反卷积后得到相同大小的特征图；

(3)采用级联连接，将(2)中得到的相同大小的特征图连接起来。

5.根据权利要求1所述的基于卷积神经网络的空中目标检测方法，其特征在于，所述步骤4中置信度损失函数定义为：其中：表示第i个默认框与类别为p的第j个真实框相匹配，p为目标类别种类，表示第i个默认框为类别p的置信度，

6.根据权利要求1所述的基于卷积神经网络的空中目标检测方法，其特征在于，所述步骤4中位置损失函数定义为：其中，(cx，cy)为默认框的中心，(w)为默认框的宽，(h)为默认框的高，g表示真实框的位置，d表示默认框的位置，l表示表示默认框相对于真实框的偏移量。

7.根据权利要求1所述的基于卷积神经网络的空中目标检测方法，其特征在于，所述步骤4中总体的目标损失函数定义为：其中：α＝0.5，N为默认框的个数。