CN106845406A

CN106845406A - 基于多任务级联卷积神经网络的头肩检测方法及装置

Info

Publication number: CN106845406A
Application number: CN201710042383.2A
Authority: CN
Inventors: 程炜; 刘军; 魏园波
Original assignee: Shenzhen Infinova Ltd
Current assignee: Shenzhen Infinova Ltd
Priority date: 2017-01-20
Filing date: 2017-01-20
Publication date: 2017-06-13

Abstract

本发明公开一种基于多任务级联卷积神经网络的头肩检测方法及装置，其中，该基于多任务级联卷积神经网络的头肩检测方法，包括如下步骤:对每帧输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像；根据第一级卷积神经网络依次对多个不同尺寸的目标图像第一次卷积及池化处理，并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框；根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理，并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框，以及输出目标头肩框。本发明的技术方案能够提高头肩检测准确性和可靠性，适合行人数量的统计。

Description

基于多任务级联卷积神经网络的头肩检测方法及装置

技术领域

本发明涉及图像处理技术领域，尤其涉及一种基于多任务级联卷积神经网络的头肩检测方法及装置。

背景技术

随着计算机视觉和图像处理技术的快速发展，头肩检测通常用于人数统计及人形定位，在一定程度上可替代行人检测。目前，传统的头肩检测方法通常采用haar特征加adaboost级联，或者hog特征加svm分类器，但由于这些方法都是通过人工设计的特征提取低层次抽象特征，背景、光照、姿态等干扰很容易影响到头肩检测的效果，进一步导致头肩检测性能的严重降低，检测的精确性不能达到要求。

有鉴于此，有必要对上述头肩检测方法进行进一步的改进。

发明内容

为解决上述至少一技术问题，本发明的主要目的是提供一种基于多任务级联卷积神经网络的头肩检测方法。

为实现上述目的，本发明采用的一个技术方案为：提供一种基于多任务级联卷积神经网络的头肩检测方法，包括如下步骤:

S10、对每帧输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像，所述目标图像包含有头肩框；

S20、根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理，并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框；

S30、根据第二级卷积神经网络依次对多个侯选头肩框进行第二次卷积及池化处理，并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框，以及

S40、输出目标头肩框。

其中，所述步骤S30之后步骤S40之前，还包括步骤S301、根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理，并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框，其中，第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。

其中，所述步骤S10，具体包括：

以设定的缩放因子对每帧输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像。

其中，所述步骤S20，具体包括：

根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理，以得到多个头肩框的位置坐标及对应的分类置信度；

根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框；以及

采用非极大值抑制方法合并相邻两个重叠率大于50％的一头肩框，形成候选头肩框。

其中，所述步骤S30，具体包括：

根据第二级卷积神经网络依次对多个不同尺寸的目标图像中的候选头肩框进行第二次卷积及池化处理，以得到多个候选头肩框的位置坐标及对应的分类置信度，所述第二次卷积及池化处理的候选头肩框尺寸归一化为24x24x3；

根据第分类置信度筛选出大于预设的第二置信度阈值的多个候选头肩框；以及

采用方法合并相邻两个重叠率大于30％的一候选头肩框，形成目标头肩框。

为实现上述目的，本发明采用的另一个技术方案为：提供一种基于多任务级联卷积神经网络的头肩检测装置，包括：

缩放模块，用于对每帧输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像，以及根据多个目标图像建立多尺寸金字塔模型图像，所述目标图像包含有头肩框；

第一级卷积神经网络模块，用于根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理，并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框；

第二级卷积神经网络模块，用于根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理，并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框，以及

输出模块，用于输出目标头肩框。

其中，还包括第三级卷积神经网络模块，用于根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理，并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框，其中，第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。

其中，所述缩放模块具体用于，

其中，所述第一级卷积神经网络模块，具体用于，

依次对多个不同尺寸的目标图像进行第一次卷积及池化处理，以得到多个头肩框的位置坐标及对应的分类置信度；

其中，所述第二级卷积神经网络模块，具体用于，

依次对多个不同尺寸的目标图像中的候选头肩框进行第二次卷积及池化处理，以得到多个候选头肩框的位置坐标及对应的分类置信度，所述第二次卷积及池化处理的候选头肩框尺寸归一化为24x24x3；

采用非极大值抑制方法合并相邻两个重叠率大于30％的一候选头肩框，形成目标头肩框。

本发明的技术方案主要通过对每帧输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像，所述目标图像包含有头肩框；以及根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理，并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框；然后根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理，并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框，通过缩放图像和级联筛选符合要求的头肩框，从而可以提取出精确的头肩框，适合行人数量的统计。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1为本发明一实施例基于多任务级联卷积神经网络的头肩检测方法的结构示意图；

图2a为图1中第一级卷积神经网络卷积计算过程示意图；

图2b为图1中第二级卷积神经网络卷积计算过程示意图；

图2c为图1中第三级卷积神经网络卷积计算过程示意图；

图3为本发明一实施例基于多任务级联卷积神经网络的头肩检测装置的模块方框图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明，本发明中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

请参照图1，在本发明实施例中，该基于多任务级联卷积神经网络的头肩检测方法，包括如下步骤：

S10、对输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像，所述目标图像包含有头肩框；

S30、根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理，并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框，以及

S40、输出目标头肩框。

本实施例中，先采用对输入图像进行多级缩放处理，经处理结果为多个具有不同尺寸的目标图像，这些图标图像可以取相同的定点作为公共点，部分叠加在一起，形成多尺寸金字塔模型图像。应当指出的是，上述的目标图像中包含有头肩框，以方便下述的分析处理步骤；然后通过第一级卷积神经网络的卷积和池化操作，并根据设定的第一阈值对目标头肩框进行筛选，得到头肩置信度高的候选头肩框；在通过第二级卷积神经网络的卷积和池化操作，并根据设定的第二阈值对候选头肩框进行筛选，得到头肩置信度高的候选头肩框，最后输出该头肩框，如此，通过两级卷积神经网络卷积处理，能够提高头肩框检测的可靠性和准确性。

本发明的技术方案主要通过对输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像，所述目标图像包含有头肩框；以及根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理，并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框；然后根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理，并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框，通过缩放图像和级联筛选符合要求的头肩框，从而可以提取出精确的头肩框，适合行人数量的统计。

请参照图1，在一些实施例中，所述步骤S30之后步骤S40之前，还包括步骤S301、根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理，并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框，其中，第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。

请参照图2c，本实施例中，可以将候选头肩框尺寸归一化到48x48x3，依次输入到第三级卷积神经网络模块中，经过第三级卷积神经网络内部的一系列卷积和池化操作，输出长度为12的向量，分表表示头肩分类置信度，头肩框坐标。通过设定的阈值将头肩分类置信度低于阈值的头肩框去除，将剩下的头肩框作为输出。通过采用第三级卷积神经网络的卷积，可以对头肩框进行过滤处理，如此，以筛选出更为准确的头肩框信息。

在一些实施例中，所述步骤S10，具体包括：

以设定的缩放因子对输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像。

本实施例中，该缩放因子具体为0.7937，当然本实施例中，多级缩放处理时，还可以设定图像缩放尺寸阈值，当前图像小于阈值时，不再进行缩放处理。上述缩放因子0.7937同时兼顾了头肩检测的时间和精度，可以理解的，还可以选用其他的缩放因子，此处不作限制。

在一些实施例中，所述步骤S20，具体包括：

请参照图2a，本实施例中，可以将多个尺寸的图像依次输入到第一级卷积神经网络模块，经过第一级卷积神经网络内部一系列卷积和池化操作，输出每个头肩框位置坐标以及相应的分类置信度，具体的，第一级卷积神经网络由3部分组成，分别为输入层，多个卷积层，输出层。输入层为输入不同尺寸的目标图像，是自适应输入尺寸。例如，输入图像的尺寸为(m,n,3)，其中，m，n分别表示长乘宽，3表示选用3x3卷积核，经过10个3x3卷积核以及2x2最大值池化计算得到((m-2)/2,(m-2)/2,10)，接下来经过16个3x3卷积核计算得到((m-2)/2-2,(m-2)/2-2,16)，在接下来经过32个3x3卷积核得到((m-2)/2-4,(m-2)/2-4,32)，最后得到((m-2)/2-4,(m-2)/2-4,2)和((m-2)/2-4,(m-2)/2-4,4)，即为当前的所有头肩候选框的分类置信度和坐标；然后根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框；以及采用非极大值抑制方法合并相邻两个重叠率大于50％的一头肩框，得到多个候选头肩框。

在一些实施例中，所述步骤S30，具体包括：

请参照图2b，本实施例中，可以将多个尺寸的图像依次输入到第二级卷积神经网络模块，经过第二级卷积神经网络内部一系列卷积和池化操作，输出每个头肩框位置坐标以及相应的分类置信度，具体的，第二级卷积神经网络由4部分组成，分别为输入层，多个卷积层，全连接层，输出层。输入层为目标头肩框并归一化到(24,24,3)，经过28个3x3卷积核以及3x3最大值池化计算得到(11,11,28)，接下来经过48个3x3卷积核以及3x3最大值池化计算得到(4,4,48)，在接下来经过64个3x3卷积核得到128维全连接层，最后得到25维的输出向量，即为当前的所有头肩候选框的分类置信度、坐标和头肩轮廓关键点。然后根据分类置信度筛选出大于预设的第二置信度阈值的多个头肩框；以及采用非极大值抑制方法合并相邻两个重叠率大于30％的一头肩框，得到多个目标头肩框。

请参照图3，本实施例中，该基于多任务级联卷积神经网络的头肩检测装置，包括:

缩放模块10，用于对输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像，所述目标图像包含有头肩框；

第一级卷积神经网络模块20，用于根据第一级卷积神经网络依次对多个不同尺寸的目标图像进行第一次卷积及池化处理，并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框；

第二级卷积神经网络模块30，用于根据第二级卷积神经网络依次对多个候选头肩框进行第二次卷积及池化处理，并根据第二次卷积及池化处理的结果筛选出满足预设第二阈值的多个目标头肩框，以及

输出模块50，用于输出目标头肩框。

本实施例中，先通过缩放模块10，对输入图像进行多级缩放处理，经处理结果为多个具有不同尺寸的目标图像，这些图标图像可以取相同的定点作为公共点，部分叠加在一起，形成多尺寸金字塔模型图像。应当指出的是，上述的目标图像中包含有头肩框，以方便下述的分析处理步骤；然后通过第一级卷积神经网络模块，采用第一级卷积神经网络的卷积和池化操作，并根据设定的第一阈值对目标头肩框进行筛选，得到头肩置信度高的候选头肩框；在通过第二级卷积神经网络模块，采用第二级卷积神经网络的卷积和池化操作，并根据设定的第二阈值对候选头肩框进行筛选，得到头肩置信度高的候选头肩框，最后输出该头肩框，如此，通过两级卷积神经网络的卷积处理，能够提高头肩框检测的可靠性和准确性。

在一具体的实施例中，还包括第三级卷积神经网络模块40，用于根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理，并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框，其中，第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。

本实施例中，通过第三级卷积神经网络模块40，可以继续将目标头肩框尺寸归一化到48x48x3，依次输入到第三级卷积神经网络模块40，经过第三级卷积神经网络内部的一系列卷积和池化操作，输出长度为12的向量，分表表示头肩分类置信度，头肩框坐标。通过设定的阈值将头肩分类置信度低于阈值的头肩框去除，将剩下的头肩框作为输出。通过采用第三级卷积神经网络的卷积对头肩框进行处理，如此，以筛选出更为准确的头肩框信息。

在一具体的实施例中，所述缩放模块10具体用于，

本实施例中，该该缩放因子为0.7937，当然本实施例中，多级缩放处理时，还可以设定图像缩放尺寸阈值，当前图像小于阈值时，不再进行缩放处理。上述缩放因子0.7937同时兼顾了头肩检测的时间和精度，可以理解的，还可以选用其他的缩放因子，此处不作限制。缩放模块10主要用于建立多尺寸金字塔模型图像。

在一具体的实施例中，所述第一级卷积神经网络模块20，具体用于，

本实施例中，第一级卷积神经网络模块20，可以将多个尺寸的图像依次输入到第一级卷积神经网络模块20，经过第一卷积神经网络内部一系列卷积和池化操作，输出每个头肩框位置坐标以及相应的分类置信度，具体的，第一级卷积神经网络由3部分组成，分别为输入层，多个卷积层，输出层。输入层为输入不同尺寸的目标图像，是自适应输入尺寸，然后根据分类置信度筛选出大于预设的第一置信度阈值的多个头肩框；以及采用非极大值抑制方法合并相邻两个重叠率大于50％的一头肩框，得到多个候选头肩框。应该指出的，利用第一级卷积神经网络时需要对其进行训练，具体的，将训练集中所有图片缩放成预定大小，并为每个图片定义是否为头肩的标签信息，使用梯度下降法和反向传播算法进行训练。

在一具体的实施例中，所述第二级卷积神经网络模块30，具体用于，

本实施例中，第二级卷积神经网络模块30可以将多个尺寸的图像依次输入到第二级卷积神经网络模块30，经过第二级卷积神经网络内部一系列卷积和池化操作，输出每个头肩框位置坐标以及相应的分类置信度，具体的，第二级卷积神经网络由4部分组成，分别为输入层，多个卷积层，全连接层，输出层。输入层为目标头肩框并归一化到(24,24,3)，然后根据分类置信度筛选出大于预设的第二置信度阈值的多个头肩框；以及采用非极大值抑制方法合并相邻两个重叠率大于30％的一头肩框，得到多个目标头肩框。应该指出的，利用第二级卷积神经网络时需要对其进行训练，具体的，将第一级卷积神经网络误检的样本作为第二级卷积神经网络的输入，如果负样本数目低于某个阈值将进行负样本挖掘，并给每个正样本加上标签信息以及轮廓关键点信息，负样本只需要加上标签信息不需要轮廓关键点信息，同样采用梯度下降法和反向传播算法进行训练。上述的第三极卷积神经网络的训练和第二级卷积神经网络的训练类似，此处不再赘述。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是在本发明的发明构思下，利用本发明说明书及附图内容所作的等效结构变换，或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims

1.一种基于多任务级联卷积神经网络的头肩检测方法，其特征在于，所述基于多任务级联卷积神经网络的头肩检测方法，包括如下步骤:

S40、输出目标头肩框。

2.如权利要求1所述的基于多任务级联卷积神经网络的头肩检测方法，其特征在于，所述步骤S30之后步骤S40之前，还包括步骤S301、根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理，并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框，其中，第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。

3.如权利要求1所述的基于多任务级联卷积神经网络的头肩检测方法，其特征在于，所述步骤S10，具体包括：

4.如权利要求1所述的基于多任务级联卷积神经网络的头肩检测方法，其特征在于，所述步骤S20，具体包括：

5.如权利要求1所述的基于多任务级联卷积神经网络的头肩检测方法，其特征在于，所述步骤S30，具体包括：

6.一种基于多任务级联卷积神经网络的头肩检测装置，其特征在于，所述基于多任务级联卷积神经网络的头肩检测装置，包括:

缩放模块，用于对每帧输入图像依次进行多级缩放处理，得到具有多个不同尺寸的目标图像，所述目标图像包含有头肩框；

第一级卷积神经网络模块，用于根据第一级卷积神经网络依次对多个不同尺寸的目标图像中的头肩框进行第一次卷积及池化处理，并根据第一次卷积及池化处理的结果筛选出满足预设第一阈值的多个候选头肩框；

输出模块，用于输出目标头肩框。

7.如权利要求6所述的基于多任务级联卷积神经网络的头肩检测装置，其特征在于，还包括第三级卷积神经网络模块，用于根据第三级卷积神经网络依次对多个候选头肩框进行第三次卷积及池化处理，并根据第三次卷积及池化处理的结果筛选出满足预设第三阈值的多个目标头肩框，其中，第三次卷积及池化处理的候选头肩框尺寸归一化为48x48x3。

8.如权利要求6所述的基于多任务级联卷积神经网络的头肩检测装置，其特征在于，所述缩放模块具体用于，

9.如权利要求6所述的基于多任务级联卷积神经网络的头肩检测装置，其特征在于，所述第一级卷积神经网络模块，具体用于，

10.如权利要求6所述的基于多任务级联卷积神经网络的头肩检测装置，其特征在于，所述第二级卷积神经网络模块，具体用于，