CN112580558A

CN112580558A - 红外图像目标检测模型构建方法、检测方法、装置及系统

Info

Publication number: CN112580558A
Application number: CN202011560701.2A
Authority: CN
Inventors: 刘晴; 徐召飞; 王水根
Original assignee: Iray Technology Co Ltd
Current assignee: Iray Technology Co Ltd
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2021-03-30

Abstract

本发明提供一种红外图像目标检测模型构建方法、检测方法、装置及系统，构建方法包括：对初始红外图片集进行标注及预处理以获得训练样本集；利用训练样本集进行训练获得红外图像目标检测模型，红外目标检测模型包括特征提取主干网络以及与特征提取主干网络连接的检测网络；特征提取主干网络包括q个卷积模块，卷积模块包括依次连接的深度可分卷积及第一卷积核；检测网络为采用SSD网络的n个特征层进行检测，SSD网络包括m个特征层，且n<m；该红外图像目标检测模型构建方法通过增大卷积核及简化SSD检测器，在保证特征提取精度的同时减少数据传输和计算时间，实现轻量化检测以更易于部署移动端设备。

Description

红外图像目标检测模型构建方法、检测方法、装置及系统

技术领域

本发明涉及计算机信息处理技术领域，特别涉及一种红外图像目标检测模型构建方法、检测方法、装置及系统。

背景技术

在智能交通和安防领域中，通过红外镜头对周边环境进行监测，是实现24小时全面监控的重要手段。由于红外图像对比度低、细节少等特点，使得其相对于普通的RGB图像缺少更多的信息，增加了在红外图像上进行目标检测的难度。在算力有限的平台上，对红外图像中的人和车辆进行较为精准的检测识别是目前要解决的重点技术难题。

近年来，深度神经网络在目标检测和识别领域取得了很深的进展，在各类场景中都取得了极好的识别效果。然而现有的基于深度学习的目标检测算法大多应用于RGB彩色图像，通常可以较为容易的提取其颜色、纹理等特征用于网络训练，得到较为精确的识别和定位。而对于红外图像，主要是通过提取其轮廓特征进行识别，所以一般的深度目标检测网络不能很好的直接迁移应用于红外图像。同时大部分的深度目标检测网络结构复杂，内部参数多，会消耗大量的计算和存储资源，很难部署在常见的终端监控设备上运行。

传统的运动目标检测算法相对参数少，运算简单，容易部署，但是只能检测出图像中的运动目标，很难满足实际应用场景的业务需求。在实际应用中，无论是安防还是交通，都需要对静止的目标进行检测和识别。

因此使用轻量级的深度神经网络进行目标检测是实现算法在实际应用中满足实时性、精确性的重要手段，如何设计适用于红外图像的轻量级深度目标检测网络也是实现智能交通和安防应用的重要需求。

发明内容

为解决上述技术问题，本发明提供了一种红外图像目标检测模型构建方法、检测方法、装置及系统，其能有效实现红外图像目标检测的轻量化。

本发明提供的技术方案如下：

第一方面，提供一种红外图像目标检测模型构建方法，所述构建方法包括如下步骤：

对获取的初始红外图片集进行标注及预处理以获得训练样本集；

利用所述训练样本集进行训练获得红外图像目标检测模型；

其中，所述红外目标检测模型包括特征提取主干网络以及与所述特征提取主干网络连接的检测网络；

所述特征提取主干网络包括q个卷积模块，所述卷积模块包括依次连接的深度可分卷积及第一卷积核，q为正整数；

所述检测网络为采用SSD网络的n个特征层对所述特征提取主干网络输出的n个特征输出层进行检测以获得检测结果的网络，所述SSD网络包括m个特征层，且n<m，n、m均为正整数。

在一种较佳的实施方式中，所述构建方法还包括：预先构建用于训练获得所述红外图像目标检测模型的红外目标检测网络，其包括如下步骤：

搭建所述特征提取主干网络，包括如下子步骤：将所述深度可分卷积及第一卷积核依次连接以构建第二卷积核，且将所述第二卷积核的输入与输出连接以构建卷积模块；将p个卷积层和q个所述卷积模块依次连接以搭建所述特征提取主干网络；设置输出通道递增规则及降采样规则，p、q均为正整数；

将所述检测网络的输入端与所述特征提取主干网络的输出端建立连接；

搭建所述检测网络，包括如下子步骤：基于所述SSD网络设置用于对所述特征提取主干网络输出的n个特征输出层进行检测以获得检测结果的n个特征层；设置所述SSD网络中用于检测的n个特征层进行特征锚定的锚定框选取策略及参数。

在一种较佳的实施方式中，所述搭建所述特征提取主干网络包括如下子步骤：将5×5深度可分卷积及1×1卷积核依次连接以构建所述第二卷积核，且将所述第二卷积核的输入与输出连接以构建卷积模块；将1个3×3卷积层和10个所述卷积模块依次连接以搭建所述特征提取主干网络；设置输出通道递增规则及降采样规则；

搭建所述检测网络包括如下子步骤：基于所述SSD网络设置用于对所述特征提取主干网络输出的第9层、第11层两个特征输出层进行检测的19×19和10×10两个特征层；设置在所述SSD网络中用于检测的19×19和10×10两个特征层进行特征锚定的锚定框选取策略及参数。

在一种较佳的实施方式中，所述对获取的初始红外图片集进行标注及预处理以获得训练样本集，包括如下步骤：

对初始红外图片集进行标注以获得检测框、检测框位置信息、检测框中目标类型标签；

对标注后的所述初始红外图片集进行预处理，所述预处理包括图片尺寸调节、归一化及数据增强。

在一种较佳的实施方式中，所述数据增强包括如下子步骤：

在归一化后的红外图片集中随机选取k张图片，k为不小于2的整数；

分别对k张图片进行剪裁以获得不同尺寸且均为矩形的子图片；

从所述子图片中选取j张图片并缩小至相同尺寸，将同样大小的j张子图片拼接成一张训练图片，所述训练图片与归一化后的图片尺寸相同，j为不小于2的整数；

更新所述训练图片中检测框位置信息；

重复执行上述步骤至对所述红外图片集中所有红外图片进行处理。

在一种较佳的实施方式中，所述检测结果包括目标的锚定框、标签及置信度，在训练获得所述红外图像目标检测模型后，所述模型构建方法还包括：

对所述检测结果进行后处理，包括如下子步骤：

初筛：在预先构建的用于存放所述锚定框的候选框集合中筛选并去除所述置信度低于预设概率阈值的锚定框；

转移：将剩余锚定框按照置信度排序，将置信度最高的锚定框G转移移至预先构建的目标集合中；

交并比筛查：遍历所述构建框集合，筛选并去除与所述锚定框G交并比超过预设交并比阈值的锚定框；

重复执行所述转移、交并比筛查步骤，至所述候选框集合中为空，所述目标集合中的锚定框为目标锚定框。

第二方面，提供一种红外图像目标检测方法，所述检测方法包括：

获取待检测红外图片；

将所述待检测图片输入所述如权利要求1-6任意一项所述的红外图像目标检测模型以获得检测结果，所述检测结果为包括目标的锚定框、标签及置信度的红外图片。

第三方面，提供一种红外图像目标检测模型构建装置，所述构建装置包括：

预处理模块，用于对获取的初始红外图片集进行标注及预处理以获得训练样本集；

训练模块，利用所述训练样本集进行训练获得红外图像目标检测模型；

第四方面，提供一种红外图像目标检测装置，所述检测装置包括：

获取模块，用于获取待检测红外图片；

检测模块，用于将所述待检测图片输入所述的红外图像目标检测模型以获得检测结果，所述检测结果为包括目标的锚定框、标签及置信度的红外图片。

第五方面，提供一种计算机系统，包括：

一个或多个处理器；以及

与所述一个或多个处理器关联的存储器，所述存储器用于存储程序指令，所述程序指令在被所述一个或多个处理器读取执行时，执行如下操作：

利用所述训练样本集进行训练获得红外图像目标检测模型；

所述特征提取主干网络包括q个卷积模块，所述卷积模块包括依次连接的深度可分卷积及第一卷积核，q正整；

本发明相比现有技术而言的有益效果在于：

本发明提供一种红外图像目标检测模型构建方法、检测方法、装置及系统，所述构建方法包括如下步骤：对获取的初始红外图片集进行标注及预处理以获得训练样本集；利用所述训练样本集进行训练获得红外图像目标检测模型，其中的红外目标检测模型包括特征提取主干网络以及与所述特征提取主干网络连接的检测网络；特征提取主干网络包括q个卷积模块，卷积模块包括依次连接的深度可分卷积及第一卷积核；检测网络为采用SSD网络的n个特征层对特征提取主干网络输出的n个特征输出层进行检测以获得检测结果的网络，SSD网络包括m个特征层，且n<m；该方法在红外目标检测模型时通过增大其中的特征提取主干网络中的卷积核的大小，从而扩大感受野，降低网络深度，保证特征提取精度的同时，减少了计算开销，实现了轻量级检测模型的构建；且检测网络通过简化SSD检测器获得，只采用SSD检测器中的部分检测层获取目标锚定框，以减小数据传输和计算时间，使检测网络更易于部署移动端设备；

进一步，在对获取的初始红外图片集进行标注及预处理以获得训练样本集时，预处理过程中的数据增强采用了随机拼接的方法，通过随机裁剪、缩放和拼接这一系列操作，实现了将大目标的缩放为小目标的操作，丰富了数据集中的目标部分，也丰富了数据集中的背景部分，同时平衡了训练数据中小目标的分布，加强了网络对红外小目标的检测精度。

需要说明的是，本申请的方案只要实现其中任一技术效果即可。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的红外图像目标检测模型构建方法的流程图；

图2是本发明实施例一提供的卷积模块的结构示意图；

图3是本发明实施例一提供的特征提取主干网络的结构示意图；

图4是本发明实施例一提供的锚定框计算策略逻辑示意图；

图5是本发明实施例一提供的SSD网络结构图；

图6是本发明实施例二提供的红图像目标检测方法的流程图；

图7、8分别是本发明实施例二提供的红外图像目标检测结果；

图9是本发明实施例五提供的计算机系统的架构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

针对当前红外检测过程中对于静止的目标检测的检测模型结构复杂、计算量较大、计算时间长且很难部署在常见的终端监控设备上的现状，本实施例提供一种红外图像目标检测模型构建方法及检测方法，能通过简化检测模型以实现高精度、高效性、轻量级的红外图像目标检测。

下面将结合具体实施例对红外图像目标检测模型构建方法、检测方法、装置及系统作进一步说明。

实施例一

结合图1所示，本实施例提供一种红外图像目标检测模型构建方法，该构建方法至少包括如下步骤：

S1、对获取的初始红外图片集进行标注及预处理以获得训练样本集。

在实际应用中，常用于在红外图片中识别人/车目标。因此，可在不同时间段内采用红外成像摄像头对着路口进行拍摄，红外成像仪器距离地面高十米左右的视角采集清晰可识别的红外图片，筛选掉无目标、不清晰等不合格图片后共获得两万余张甚至更多数量的红外人车图片作为初始红外图片集。

步骤S1具体包括如下子步骤：

S11、对初始红外图片集中的红外图片进行标注以获得检测框、检测框位置信息、检测框中目标类型标签。

具体地，对红外图片中的红外数据进行标注，通常以矩形的检测框的形式将目标对象标出，并在判断出检测框中目标类型后标注其类型(人或车)，并标注其在所在的红外图片中的位置。标注位置时，在一种实施方式中，以图片的左上角为坐标原点[0，0]，使用[x1,y1,x2,y2]的形式记录检测框的位置检测矩形框的右下角横坐标，y2表示检测框的右下角纵坐标。所有标注信息以xml文件的形式进行保存。需要说明的是，上述标注可通过现有的标注手段获得，如使用labelImg软件进行标注等，此处不作具体描述。

S12、对标注后的所述初始红外图片集进行预处理，预处理包括图片尺寸调节、归一化及数据增强，在一种较佳的实施方式中，依次执行上述步骤以完成预处理过程。

具体地，由于网络需要输出固定大小的红外图片，所以首先需要对所有红外图片进行拉伸，将红外图片大小调整至所需大小。

以及，为了避免出现数值问题以及加快网络收敛，需要对输入数据做归一化处理。此处归一化处理具体包括：首先计算红外图片中所有像素点的均值和标准差，然后将输入图片的每个象素值都减去均值，再除以标准差，得到归一化处理后的红外图片。

进一步，初始红外图片集中的红外图片包含大量的小目标，并且这些小目标的分布并不均匀，且由于红外图片数据相对于一般的彩色图片数据包含的信息更少，对于小目标的检测也更为艰难。训练样本集中不同大小的目标分布特点都会影响检测网络的训练精度，因此需要对用于训练的红外图片数据进行数据增强，丰富数据集，增强检测网络的鲁棒性，增强检测网络对小目标的检测能力。

具体地，本实施例中数据增强包括如下步骤：

Sa1、在归一化后的红外图片集中随机选取k张图片，k为不小于2的整数；

Sa2、分别对k张图片进行随意剪裁以获得不同尺寸且均为矩形的子图片；

Sa3、从所述子图片中选取j张图片并缩小至相同尺寸，将同样大小的j张子图片拼接成一张训练图片，所述训练图片与归一化后的图片尺寸相同，j为不小于2的整数；

Sa4、更新所述训练图片中检测框位置信息。

示例性的，首先从数据集中随机选取四张图片；从这四张图片上分别进行随机裁剪，裁剪下大小不同的新图片；将裁剪得到的四张新图片都缩小到同样大小，之后按照左上、左下、右上、右下的顺序拼成一张与正常普通同样大小的图作为训练图片；按照裁剪的结果对标注框的坐标进行相应的调整；重复执行上述步骤至对所述红外图片集中全部红外图片进行处理，则完成数据增强过程。

本实施例在数据预处理阶段采用随机拼接的数据增强方法，通过随机裁剪、缩放和拼接这一系列操作，实现了将大目标的缩放为小目标的操作，丰富了数据集中的目标部分，也丰富了数据集中的背景部分，同时平衡了训练数据中小目标的分布，加强了网络对红外小目标的检测精度。

S2、利用训练样本集进行训练获得红外图像目标检测模型。该红外目标检测网络包括特征提取主干网络以及与所述特征提取主干网络连接的检测网络。

本实施例中需要预先构建用于进行训练获得红外图像目标检测模型的红外目标检测网络，因此本实施例还包括步骤：S0、预先构建红外目标检测网络。

其中，所述特征提取主干网络包括q个卷积模块(q为正整数)，卷积模块包括依次连接的深度可分卷积及第一卷积核；检测网络采用SSD网络的n个特征层对所述特征提取主干网络输出的n个特征输出层进行检测以获得检测结果，所述SSD网络包括m个特征层，且n<m。

具体的，步骤S0包括如下子步骤：

S01、搭建所述特征提取主干网络，包括如下子步骤：

S01-1、将所述深度可分卷积及第一卷积核依次连接以构建第二卷积核，且将所述第二卷积核的输入与输出连接以构建卷积模块；

S01-2、将p个卷积层和q个所述卷积模块依次连接以搭建所述特征提取主干网络(p、q均为正整数)；

S01-3、设置输出通道递增规则及降采样规则。

在一种优选地实施方式中，步骤S01包括如下子步骤：

S01-1'、将5×5深度可分卷积及1×1卷积核依次连接以构建所述第二卷积核，且将所述第二卷积核的输入与输出连接以构建卷积模块；

S01-2'、将1个3×3卷积层和10个所述卷积模块依次连接以搭建所述特征提取主干网络；

S01-3'、设置输出通道递增规则及降采样规则。

需要说明的是，S01-1'-S01-3'仅为一种示例性的说明，步骤S01的可执行方案并不仅限于此。

需要说明的是，本领域常用的用于对图片作特征提取的卷积核为3×3卷积核，如图2所示为卷积模块结构图，本实施例通过将5×5深度可分卷积及1×1卷积核依次连接的方式以增大卷积核大小，具体为通过设置5×5深度可分卷积增加特征提取能力以扩大感受野，且通过设置1×1卷积核控制输出通道数；以及，借鉴残差结构的思想，将新构成的输入和输出连接，以降低网络深度，在保证特征特征提取精度同时，减少了计算开销，实现了轻量级的特征提取主干网络的搭建。并且，输入和输出连接的同时设置池化以控制输出大小一致，以及设置通道填充以保持通道相同，从而实现最终输出结果维度大小相同，可以相加。

图3所示为特征提取主干网络结构图，特征提取主干网络由1个3×3卷积层和10个所述卷积模块依次连接搭建而成。基于上述卷积模块，可实现其中的输出通道数等间隔递增，每隔两个卷积模块做一次降采样。

S02、将所述检测网络的输入端与所述特征提取主干网络的输出端建立连接，实现特征提取主干网络通过检测网络的相应特征层进行检测。

S03、搭建所述检测网络，其包括如下子步骤：

S03-1、基于SSD网络设置用于对所述特征提取主干网络输出的n个特征输出层进行检测以获得检测结果的n个特征层，所述SSD网络包括m个特征层，且n<m，n、m均为正整数；

S03-2、设置所述SSD网络中用于检测的n个特征层进行特征锚定的锚定框选取策略及参数。

在一种优选地实施方式中，步骤S03包括如下子步骤：

S03-1'、基于所述SSD网络设置用于对所述特征提取主干网络输出的第9层、第11层两个特征输出层进行检测的19×19和10×10两个特征层。

具体地，在常见的SSD框架结构中，通常取6个大小不同层级的特征层进行检测，依次为19×19、10×10、5×5、3×3、2×2、1×1，以满足适应对不同尺度目标检测的目的。但是，由于GPU的特殊结构，网络层数越多，消耗在数据传输上的时间就越多，因此减少SSD选取的特征层数有助于减少计算量。同时考虑到通常需要进行检测的设备的部署位置相对于待检测的目标具有一定的高度和距离，很少出现占据画面比例较大的目标出现，所以舍弃特征尺度小的较高层级的特征输出层不会影响检测回归的精度，同时又有助于提升运行推理速度。因此在SSD网络结构设计中仅选取19×19和10×10特征层上进行检测。

S03-2'设置在所述SSD网络中用于检测的19×19和10×10两个特征层进行特征锚定的锚定框选取策略及参数。

步骤S03-2具体包括如下子步骤：

S03-2-1、对每个点设定一大一小两个正方形的锚定框，以及多个长方形锚定框。

具体的，参照图4所示为一种SSD锚定框计算策略，所述的首先在每个点都会有一大一小两个正方形的锚定框，小正方形的边长用min_size来表示，大正方形的边长用max_size来表示(min_size与max_size的值每一层都不同)。同时多个长方形锚定框的数目在不同层级会有差异，以min_size为基准，使用不同的长宽比率来生成大小不同的长方形框，通常一个比率ratio对应着两个矩形框。本实施例中，19×19特征层上，min_size＝30，max_size＝78，ratio＝[2,3]，每个点生成6个锚定框，10×10特征层上，min_size＝78，max_size＝126，ratio＝[2,3]，每个点生成6个锚定框，一共生成2766个锚定框。

S03-2-2、通过SSD网络两个卷积进行卷积后输出各个锚定框上的分类和位置预测结果；

参照图5所示的SSD网络结构图所示：将SSD与特征提取主干网络相连接，分别抽取主干网络第9层和第11层的输出特征作为SSD网络的输入层。SSD网络通过两个卷积进行卷积后输出各个锚定框上的分类和位置预测结果。当类别为N类时，每个锚定框上的分类预测结果使用N+1个值表示，分别表示该锚定框在各个类别上的置信度，其中第一类表示背景。每个锚定框上的位置回归预测结果使用4个值表示，分别表示预测定位结果相对于锚定框的偏移量，记为：[center_x_offset,center_y_offset,h_offset,w_offset]，分别表示位置预测回归结果在锚定框中心点坐标位置上的偏移量和锚定框长宽上的偏移量。需要经过如下转换才能将相对于锚定框的回归定位预测结果转换为相对于原图的[center_x,center_y,h,w]形式标记框：

center_x＝center_x_offset×center_variance*priors_center_x+priors_center_x,

center_y＝center_y_offset×center_variance*priors_center_y+priors_center_y,

h＝exp(h_offset×size_variance*priors_h)×priors_h,

w＝exp(w_offset×size_variance*priors_w)×priors_h,

其中，center_x和center_y表示检测框的中心点坐标，h和w分别表示检测框的长宽，priors_center_x、priors_center_x、priors_h、priors_w分别表示锚定框的中心点坐标和长宽，center_variance和size_variance为表示尺度变换的定值，通常设定为0.1和0.2，exp()为自然数e的指数函数。

自此，完成红外目标检测网络的构建，且检测模型输出的检测结果包括目标的锚定框、标签及置信度。

在一种优选地实施方式中，在完成红外目标检测网络的构建，所述模型构建方法还包括：

S3、对所述检测结果进行后处理，后处理主要采用非极大抑制约束(NMS)，其包括如下子步骤：

S31、初筛：在预先构建的用于存放所述锚定框的候选框集合中筛选并去除所述置信度低于预设概率阈值的锚定框；

S32、转移：将剩余锚定框按照置信度排序，将置信度最高的锚定框G转移移至预先构建的目标集合中；

S33、交并比筛查：遍历所述候选框集合，筛选并去除与所述锚定框G交并比超过预设交并比阈值的锚定框，其中，交并比阈值设置为0.2-0.6；

重复执行所述步骤S32、S33，至所述候选框集合为空，所述目标集合中的锚定框为目标锚定框。

具体地，在目标检测过程中，目标附近的锚定框预测回归结果通常会与其他锚定框存在包含和交叉等情况，通过建立非极大抑制约束(NMS)，对网络输出的检测结果进行筛选，抑制那些置信度较低的锚定框预测回归结果，从而给出最终的红外人测目标检测结果。

在进行NMS抑制过程前，首先通过概率阈值初步筛选掉所有置信度过低的锚定框预测回归结果，且在一种实施方式中概率阈值设定为0.2-0.5之间。然后将相对于锚定框的回归定位预测结果转换为相对于训练样本集中标注框的表达方式，再进行抑制过程。

在获取训练样本集，完成红外目标检测网络构建以及设置好标注、预处理及后处理步骤后，将红外目标检测网络在训练样本集上进行训练获得红外图像目标检测模型，该模型可用于红外图像目标检测。

综上，该方法通过在训练红外目标检测模型，通过增大其中的特征提取主干网络中的卷积核的大小，从而扩大感受野，降低网络深度，保证特征提取精度的同时，减少了计算开销，实现了轻量级检测模型的构建；检测网络通过简化SSD检测器获得，只采用SSD检测器中的部分检测层获取目标锚定框，以减小数据传输和计算时间，使检测网络更易于部署移动端设备；

本实施例的方案只要实现其中任一技术效果即可。

实施例二

如图6所示，本实施例提供一种红外图像目标检测方法，所述检测方法包括：

S10、获取待检测红外图片；

S20、将获取的待检测红外图片输入实施例一中训练获得的所述红外图像目标检测模型以获得检测结果，所述检测结果为包括目标的锚定框、标签及置信度的红外图片。示例性地，当应用于人/车目标识别时，通过上述方法获得的检测结果图下图7、8所示。如图7、8可知，输出的红外图片中包括锚定人/车目标的锚定框、锚定框中目标类型标签(当锚定框中是人时用person表示，当锚定框中是车时用vehicle)及在相应类别上的置信度。

红外图像目标检测方法在执行过程中模型对红外图片的处理过程及所取得的有益效果请参照实施例一中的描述，本实施例中不作赘述。

实施例三

为执行上述实施例一中的红外图像目标检测模型构建方法，本实施例提供一种与之对应的红外图像目标检测模型构建装置，所述装置至少包括：

训练模块，利用所述训练样本集上进行训练获得红外图像目标检测模型；

其中，所述红外图像目标检测模型包括特征提取主干网络以及与所述特征提取主干网络连接的检测网络；

所述检测网络为采用SSD网络的n个特征层对所述特征提取主干网络输出的n个特征输出层进行检测以获得检测结果的网络，所述SSD网络包括m个特征层，且n<m。

在一种较佳的实施方式中，所述构建装置还包括：红外目标检测网络构建模块，包括：

特征提取主干网络搭建单元，用于：将所述深度可分卷积及第一卷积核依次连接以构建第二卷积核，且将所述第二卷积核的输入与输出连接以构建卷积模块；将p个卷积层和q个所述卷积模块依次连接以搭建所述特征提取主干网络；设置输出通道递增规则及降采样规则，p、q均为正整数；

检测网络搭建单元，用于：基于所述SSD网络设置用于对所述特征提取主干网络输出的n个特征输出层进行检测以获得检测结果的n个特征层；设置所述SSD网络中用于检测的n个特征层进行特征锚定的锚定框选取策略及参数。

特征提取主干网络搭建单元还用于：将5×5深度可分卷积及1×1卷积核依次连接以构建所述第二卷积核，且将所述第二卷积核的输入与输出连接以构建卷积模块；将1个3×3卷积层和10个所述卷积模块依次连接以搭建所述特征提取主干网络；设置输出通道递增规则及降采样规则；

检测网络搭建单元还用于：基于所述SSD网络设置用于对所述特征提取主干网络输出的第9层、第11层两个特征输出层进行检测的19×19和10×10两个特征层；设置在所述SSD网络中用于检测的19×19和10×10两个特征层进行特征锚定的锚定框选取策略及参数。

训练样本集构建模块，用于对获取的初始红外图片集进行标注及预处理以获得训练样本集，包括：

标注单元，用于对初始红外图片集进行标注以获得检测框、检测框位置信息、检测框中目标类型标签；

预处理单元，用于对标注后的所述初始红外图片集进行预处理，所述预处理单元包括图片尺寸调节子单元、归一化子单元及数据增强子单元。

所述数据增强子单元用于：

分别对k张图片进行随意剪裁以获得不同尺寸且均为矩形的子图片；

更新所述训练图片中检测框位置信息；

后处理模块，用于对所述检测结果进行后处理，包括：

初筛单元：用于在预先构建的用于存放所述锚定框的候选框集合中筛选并去除所述置信度低于预设概率阈值的锚定框；

转移单元：用于将剩余锚定框按照置信度排序，将置信度最高的锚定框G转移移至预先构建的目标集合中；

交并比筛查单元：用于遍历所述构建框集合，筛选并去除与所述锚定框G交并比超过预设交并比阈值的锚定框；

所述交并比筛查单元的输出与所述转移单元输入连接，用于重复执行所述转移、交并比筛查步骤，至所述候选框集合中为空，所述目标集合中的锚定框为目标锚定框。

需要说明的是：上述实施例提供的红外图像目标检测模型构建装置在触发红外图像目标检测模型构建方法业务时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的红外图像目标检测模型构建装置与实施例一提供的红外图像目标检测模型构建方法的实施例属于同一构思，即该装置是基于该方法的，其具体实现过程详见方法实施例，这里不再赘述。

实施例四

为执行上述实施例二中的红外图像目标检测方法，本实施例提供一种与之对应的红外图像目标检测装置，所述装置至少包括：

获取模块，用于获取待检测红外图片；

检测模块，用于将所述待检测图片输入如实施例一所述的红外图像目标检测模型以获得检测结果，所述检测结果为包括目标的锚定框、标签及置信度的红外图片。

需要说明的是：上述实施例提供的红外图像目标检测装置在触发红外图像目标检测业务时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的红外图像目标检测装置与实施例二提供的红外图像目标检测方法的实施例属于同一构思，即该装置是基于该方法的，其具体实现过程详见方法实施例，这里不再赘述。

实施例五

对应上述方法和装置，本实施例提供一种计算机系统，包括：

一个或多个处理器；以及

与所述一个或多个处理器关联的存储器，所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时，执行如下操作：

利用所述训练样本集进行训练获得红外图像目标检测模型；

其中，图9示例性的展示出了计算机系统的架构，具体可以包括处理器1510，视频显示适配器1511，磁盘驱动器1512，输入/输出接口1513，网络接口1514，以及存储器1520。上述处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514，与存储器1520之间可以通过通信总线1530进行通信连接。

其中，处理器1510可以采用通用的CXU(Central Xrocessing Unit，中央处理器)、微处理器、应用专用集成电路(AXXlication SXecific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本申请所提供的技术方案。

存储器1520可以采用ROM(Read Only Memory，只读存储器)、RAM(Random AccessMemory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器1520可以存储用于控制计算机系统1500运行的操作系统1521，用于控制计算机系统1500的低级别操作的基本输入输出系统(BIOS)。另外，还可以存储网页浏览器1523，数据存储管理系统1524，以及图标字体处理系统1525等等。上述图标字体处理系统1525就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之，在通过软件或者固件来实现本申请所提供的技术方案时，相关的程序代码保存在存储器1520中，并由处理器1510来调用执行。

输入/输出接口1513用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

网络接口1514用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线1530包括一通路，在设备的各个组件(例如处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514，与存储器1520)之间传输信息。

另外，该计算机系统1500还可以从虚拟资源对象领取条件信息数据库1541中获得具体领取条件的信息，以用于进行条件判断，等等。

需要说明的是，尽管上述设备仅示出了处理器1510、视频显示适配器1511、磁盘驱动器1512、输入/输出接口1513、网络接口1514，存储器1520，总线1530等，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本申请方案所必需的组件，而不必包含图中所示的全部组件。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，云服务器，或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的数据下，即可以理解并实施。

尽管已描述了本发明实施例中的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例中范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种红外图像目标检测模型构建方法，其特征在于，所述构建方法包括如下步骤：

利用所述训练样本集进行训练获得红外图像目标检测模型；

2.根据权利要求1所述的模型构建方法，其特征在于，所述构建方法还包括：预先构建用于训练获得所述红外图像目标检测模型的红外目标检测网络，其包括如下步骤：

3.根据权利要求2所述的模型构建方法，其特征在于，

所述搭建所述特征提取主干网络包括如下子步骤：将5×5深度可分卷积及1×1卷积核依次连接以构建所述第二卷积核，且将所述第二卷积核的输入与输出连接以构建卷积模块；将1个3×3卷积层和10个所述卷积模块依次连接以搭建所述特征提取主干网络；设置输出通道递增规则及降采样规则；

4.根据权利要求2或3所述的模型构建方法，其特征在于，所述对获取的初始红外图片集进行标注及预处理以获得训练样本集，包括如下步骤：

5.根据权利要求4所述的模型构建方法，其特征在于，所述数据增强包括如下子步骤：

更新所述训练图片中检测框位置信息；

6.根据权利要求2、3、5任意一项所述的模型构建方法，其特征在于，所述检测结果包括目标的锚定框、标签及置信度，在训练获得所述红外图像目标检测模型后，所述模型构建方法还包括：

对所述检测结果进行后处理，包括如下子步骤：

7.一种红外图像目标检测方法，其特征在于，所述检测方法包括：

获取待检测红外图片；

8.一种红外图像目标检测模型构建装置，其特征在于，所述构建装置包括：

9.一种红外图像目标检测装置，其特征在于：所述检测装置包括：

获取模块，用于获取待检测红外图片；

检测模块，用于将所述待检测图片输入所述如权利要求1-6任意一项所述的红外图像目标检测模型以获得检测结果，所述检测结果为包括目标的锚定框、标签及置信度的红外图片。

10.一种计算机系统，其特征在于，包括：

一个或多个处理器；以及

利用所述训练样本集进行训练获得红外图像目标检测模型；