CN107480585B

CN107480585B - 基于dpm算法的目标检测方法

Info

Publication number: CN107480585B
Application number: CN201710544443.0A
Authority: CN
Inventors: 赵小明; 何国经; 刘小敏; 程思
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2017-07-06
Filing date: 2017-07-06
Publication date: 2020-10-30
Anticipated expiration: 2037-07-06
Also published as: CN107480585A

Abstract

本发明涉及一种基于DPM算法的目标检测方法，其特征在于，包括如下步骤：(a)根据阈值离线训练获得双尺度滤波器；(b)读取待检测图像；(c)提取ROI区域；(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域；(e)根据所述第一区域和所述第二区域计算HOG特征金字塔；(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域；(g)将所述目标区域映射到所述待检测图像以完成目标位置的检测。本发明去除大量无用背景区域，提高了检测效率，对不同尺度的目标检测时存在对小目标漏检的问题，使全局多尺度目标得到检测，提升了检测结果的准确性，使DPM算法更好的应用于实际工程中。

Description

基于DPM算法的目标检测方法

技术领域

本发明属于图像目标检测技术领域，具体涉及一种基于DPM算法的目标检测方法。

背景技术

对象检测技术是计算机视觉的关键技术和研究热点之一。可变性部件模型(Deformable Part Model，简称DPM)算法由Felzenszwalb于2008年提出，是一种基于部件的检测方法，对目标的形变具有很强的鲁棒性。目前DPM已成为众多分类、分割、姿态估计等算法的核心部分，Felzenszwalb本人也因此被VOC授予"终身成就奖"。作为现今最流行的对象检测算法之一，在对象检测领域著名的PASCAL VOC竞赛中多次取得优异的成绩。DPM算法使用根滤波器和若干个部件滤波器来描述目标的结构，通过根滤波器来描述目标的整体轮廓，通过若干个部件滤波器来描述目标的各个组成部分，通过计算根滤波器和部件滤波器响应以及部件模型相对根模型位置偏移的综合得分，判断是否存在待检测目标。对于容易发生形变的目标，该设计方案使得目标检测更加准确。训练过程通过隐藏支持向量机(Latent Support Vector Machine，简称Latent-SVM)数据学习可变形部件模型的问题简化为二分类问题，提高系统整体检测性能。但DPM算法的检测过程存在滑动窗口全局搜索检测目标导致时间长、虚警多的问题。因此，选取更准确合适方法，去除红外图像冗杂背景区域，减少滑动窗口数量，实现算法的实时性需求是DPM算法待解决问题之一。同时单模板的检测存在检测时小目标漏检的问题。

因此，如何提供一种高效、准确的目标检测方法已经成为目前研究的热点问题。

发明内容

为了解决现有技术中存在的上述问题，本发明提供了一种基于DPM算法的目标检测方法。

本发明的一个实施例提供了一种基于DPM算法的目标检测方法，包括：

(a)根据阈值离线训练获得双尺度滤波器；

(b)读取待检测图像；

(c)提取所述待检测图像的ROI区域；

(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域；

(e)根据所述第一区域和所述第二区域计算HOG特征金字塔；

(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域；

(g)将所述目标区域映射到所述待检测图像以完成目标位置的检测。

在本发明的一个实施例中，步骤(a)包括：

(a1)对样本图像中的训练目标进行标注获得标注区域信息；

(a2)根据所述阈值和所述标注区域信息将所述训练目标划分为第一训练目标和第二训练目标；

(a3)对所述第一训练目标离线训练获得第一根滤波器和部件滤波器，对所述第二训练目标离线训练获得第二根滤波器。

在本发明的一个实施例中，步骤(e)包括:

(e1)根据所述第一区域计算第一HOG特征金字塔；

(e2)根据所述第二区域计算第二HOG特征金字塔。

在本发明的一个实施例中，步骤(f)包括：

(f1)利用所述第一根滤波器、所述部件滤波器分别与所述第一HOG特征金字塔进行卷积获得第一卷积结果；

(f2)利用所述第二根滤波器与所述所述第二HOG特征金字塔进行卷积获得第二卷积结果；

(f3)根据所述第一卷积结果和第二卷积结果计算得分并获得目标区域。

在本发明的一个实施例中，所述标注区域信息包括：高像素值、宽像素值、位置坐标。

在本发明的一个实施例中，步骤(a2)包括：

(a21)获取所述高像素值和所述宽像素值的最小值为第一像素值；

(a22)若所述第一像素值大于阈值，则所述训练目标为第一训练目标；否则，所述训练目标为第二训练目标。

在本发明的一个实施例中，所述离线训练方法采用Latent-SVM训练方法。

在本发明的一个实施例中，步骤(c)包括：

(c1)对所述待检测图像进行阈值分割获得二值化图像；

(c2)对所述二值化图像进行噪点消除和空洞填充处理；

(c3)用外接矩形标记所述二值化图像的高亮连通区域；

(c4)根据所述高亮连通区域的面积和宽高比剔除不符合区域获取剩余高亮连通区域；

(c5)将所述剩余高亮连通区域向外进行扩展以获得所述ROI区域。

在本发明的一个实施例中，步骤(d)包括：

(d1)获取所述ROI区域的宽像素值和高像素值的最小值作为第二像素值；

(d2)若所述第二像素值大于所述阈值，则所述ROI区域存入并拼接为所述第一区域；否则，所述ROI区域存入并拼接为所述第二区域。

在本发明的一个实施例中，步骤(g)包括：

(g1)将所述目标区域映射到所述待检测图像；

(g2)利用非极大值抑制算法，用矩形框标出检测物体以完成所述目标位置的检测。

与现有技术相比，本发明具有如下有益效果：

1、通过对ROI区域的提取，去除大量无用背景区域，改进了传统DPM检测算法需要不断对大量背景区域进行滑动窗扫描带来的检测时间长问题，提高了检测效率，使DPM算法更好的应用于实际工程中。

2、通过采用双尺度滤波器，对不同尺度的目标检测时存在对小目标漏检的问题，使全局多尺度目标得到检测，提升了检测结果的准确性。

附图说明

图1为本发明实施例提供的一种基于DPM算法的目标检测方法的流程示意图；

图2为本发明实施例提供的一种基于DPM算法的目标检测方法的原理图。

具体实施方式

下面结合具体实施例对本发明做进一步详细的描述，但本发明的实施方式不限于此。

实施例一

请参见图1，为本发明实施例提供的一种基于DPM算法的目标检测方法的流程示意图；其中，所述基于DPM算法的目标检测方法包括：

(a)根据阈值离线训练获得双尺度滤波器；

(b)读取待检测图像；

(c)提取待检测图像的感兴趣(region of interest，简称ROI)区域；

(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域；

(e)根据所述第一区域和所述第二区域计算梯度直方图(Histogram of OrientedGradient，简称HOG)特征金字塔；

其中，步骤(a)包括：

(a1)对样本图像中的训练目标进行标注获得标注区域信息；

其中，步骤(e)包括：

(e1)根据所述第一区域计算第一HOG特征金字塔；

(e2)根据所述第二区域计算第二HOG特征金字塔。

其中，步骤(f)包括：

(f2)利用所述第二根滤波器与所述第二HOG特征金字塔进行卷积获得第二卷积结果；

其中，所述标注区域信息包括：高像素值、宽像素值、位置坐标。

其中，步骤(a2)包括：

其中，所述离线训练方法采用Latent-SVM训练方法。

其中，步骤(c)包括：

(c1)对所述待检测图像进行阈值分割获得二值化图像；

(c2)对所述二值化图像进行噪点消除和空洞填充处理；

(c3)用外接矩形标记所述二值化图像的高亮连通区域；

其中，步骤(d)包括：

其中，步骤(g)包括：

(g1)将所述目标区域映射到所述待检测图像；

与现有技术相比，本发明实施例具有如下有益效果：

1、通过对ROI区域的提取，去除大量无用背景区域，改进了传统DPM检测算法需要不断对大量背景区域进行滑动窗扫描带来的检测时间长问题，提高了检测效率，使DPM检测算法更好的应用于实际工程中。

实施例二

请参见图1、图2，图1为本发明实施例提供的一种基于DPM算法的目标检测方法的流程示意图；图2为本发明实施例提供的一种基于DPM算法的目标检测方法的原理图。本实施例在实施例一的基础上，以检测人形目标为例详细阐述了该目标检测方法的原理和步骤如下。

步骤一、根据阈值离线训练获得双尺度滤波器；对于单帧红外目标检测，拍摄大量包含人形的红外样本图像，对样本图片分类后使用Latent-SVM训练方法将检测问题转换为分类问题训练，训练人形目标的根滤波器和部件滤波器，分别得到训练目标的双尺度根滤波器。具体步骤如下：

S11：对于单帧红外目标检测，拍摄大量包含人形目标的红外样本图像。

S12：采用矩形框对样本图像中的人形目标进行手动标注，获取人形目标标注区域信息，包括：标注区域的高像素值和宽像素值(即标注区域的大小)，标注区域的位置等信息。

S13：选取标注区域高像素值和宽像素值较小的值作为第一像素值，取阈值为80个像素值，当第一像素值大于阈值时将所述标注区域存为文本1作为第一训练目标，当第一像素值小于阈值时将所述标注区域存为文本2作为第二训练目标。

S14：通过Latent-SVM训练方法分别对第一训练目标和第二训练目标进行训练获得第一根滤波器和第二根滤波器，具体包括如下步骤：

S141：获取训练数据集。训练数据集由正样本集合P和负样本集合N组成，正样本集合实际上是一些图片-矩形框对(I,B)，其中I是图片，B是框定目标的矩形。正样本中并没有指定人形目标每个部分的矩形框，这些参数将通过学习得到，将第一训练目标作为正样本集，初始负样本集从不包含人形目标的样本图片中随机截取。

S142：第一初始根滤波器初始化。输入正样本集和负样本集训练第一初始根滤波器，根据训练数据标注区域大小的统计值选择第一初始根滤波器的尺寸。

首选计算正样本集合的标注区域宽像素值、高像素值的均值，作为第一初始根滤波器的宽高比，对正样本中标注区域面积进行排序，选择大于80％的标注区域面积作为第一初始根滤波器的面积，得到第一初始根滤波器的尺寸。然后将这些截取的正样本非均匀地缩放到第一初始根滤波器大小的尺寸和宽高比。使用Latent-SVM训练方法训练得到第一初始根滤波器的大小和位置。同时，将大于80％标注区域面积的第一训练目标作为新的正样本集。

S143：第一初始根滤波器更新。给定步骤S141训练得到的第一初始根滤波器大小和位置，对于训练数据集中的每个标注区域矩形框，在第一初始根滤波器位置、大小和标注区域矩形框位置、大小显著重叠(重叠50％以上)的条件下，找到第一初始根滤波器得分最高的一个位置。第一初始根滤波器在检测窗口的得分为：

其中，F0表示第一初始根滤波器，H是特征金字塔，P＝(x，y，l)表示金字塔第l层(x，y)位置的一个细胞单元。

是将w*h大小子窗口的特征串接起来得到的向量。

输出得分最高的第一初始根滤波器的位置和大小作为更新后的第一初始根滤波器的位置和大小。

S144：用得到的新的正样本集和初始负样本集重新训练第一初始根滤波器，如此迭代两次，输出第一初始根滤波器的位置和大小。

S145：将第二训练目标作为正样本集，重复步骤S141～S143输出第二初始根滤波器的位置和大小。

S146：根据第一初始根滤波器的位置和大小计算对应的部件滤波器的位置和特征参数。

S147：根据第一初始滤波器、第二初始滤波器的位置和大小，部件滤波器的位置和特征参数计算输出第一根滤波器特征向量、部件滤波器特征向量、第二根滤波器特征向量。

步骤二、检测过程。提取待检测图片的HOG特征金字塔。通过HOG描述子提取图像特征。HOG描述子是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度直方图来构成特征。

其中，DPM的根滤波器的尺寸是固定的，但待检测图片尺寸是变化的。为了检测不同尺寸的人形目标，需要进行多尺度分析。给一个待检测图片，对待检测图片进行缩放，得到一系列待检测图片计算HOG金字塔特征，得到HOG特征金字塔。HOG特征金字塔顶层的特征可以在大范围内捕获粗糙的梯度直方图，HOG特征金字塔底层的特征捕获小范围的精细尺度梯度直方图。根滤波器的位置定义了检测窗口。部件滤波器所在层的HOG细胞单元尺寸是根滤波器所在层的细胞单元尺寸的一半。发现使用高分辨率的特征来定义部件滤波器对于获得高识别率是必要的，这样部件滤波器相比于根滤波器就可以表示更细腻的边缘信息。例如在建立人脸模型时，根滤波器用来捕获脸的边界这些粗糙信息，部件滤波器可以捕获眼镜、鼻子、嘴这些细节信息。

具体分为以下步骤：

S21：读取待检测红外图像。

S22：提取ROI区域。

S221：阈值分割。

由于待检测红外图像的灰度图像为单峰，因此选取单高斯滤波模型进行阈值分割。计算待检测红外图像平均像素值μ和方差δ，如下所示：

其中，W和H分别为待检测红外图像的宽和高，f(x,y)为待检测红外图像每点像素值。

阈值计算如下：

T＝μ+θ*σ

通过设定θ的值调整合适阈值对待检测红外图像进行二值化操作。

S222：对二值化后图像进行噪点消除和孔洞填充，使用先膨胀后腐蚀的形态学操作处理图像。

S223：用外接矩形标记二值化的高亮连通区域。对标记后的高亮连通区域进行面积、长宽比等物理判断。当面积大小或长宽比大小不符合实际经验值时，例如对于人形目标，连通区域的经验值为长宽比为3:1，剔除不可能区域；进一步排除错误区域，加速计算。

S224：对每个高亮连通区域向外适当扩展，保证人形目标的完整性以获得ROI区域。

S23：根据所述阈值将所述ROI区域拼接为第一区域和第二区域。依次扫描所有ROI区域，根据ROI区域宽像素值和高像素值的最小值进行合并，当该值小于80像素值时，ROI区域标记为第一区域；大于80像素值时，ROI区域标记为第二区域。将标记为第一区域的若干ROI区域进行合并拼接保存为第一区域，将标记为第二区域的若干ROI区域进行合并拼接保存为第二区域。此时两区域中存放的分别为宽像素值和高像素值小于80的疑似目标集合和宽像素值和高像素值大于80的疑似目标集合。

S24：根据所述第一区域和所述第二区域计算HOG特征金字塔。利用第一区域计算得到部件第一HOG特征金字塔，利用所第二区域进行计算获得第二HOG特征金字塔。

S25：根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域。

通过划窗方式，根据第一根滤波器设定检测窗口大小，将第一HOG特征金字塔逐像素计算，利用第一根滤波器、部件滤波器与第一HOG特征金字塔卷积得到第一卷积结果，根据第一卷积结果计算第一根滤波器得分、部件滤波器得分、变形花费，计算第一区域中得分最高的位置区域即为第一目标区域。

根据第二根滤波器设定检测窗口大小，第二根滤波器与所述第二HOG特征金字塔进行卷积获得第二卷积结果。再根据第二卷积结果计算第二根滤波器得分，计算第二区域中得分最高的位置区域即为第二目标区域。

其中，检测窗口的得分是根滤波器的分数加上各个部件滤波器分数的总和，每个部件滤波器得分是此部件滤波器的各个空间位置得分的最大值，每个部件滤波器的空间位置得分是部件滤波器在该子窗口上部件滤波器的得分减去变形花费。根滤波器和部件滤波器的得分都是通过计算检测窗口内的梯度直方图和检测窗口内所含向量个数的点积来获得的。这里所说的向量是指将检测窗口划分为由若干个8*8像素大小组成的向量单元，每个向量单元对应4*9维向量，所有向量单元的向量维数和为检测窗口内所含向量单元个数与每个向量单元维数的乘积。检测窗口得分等于：根滤波器得分+n个部件滤波器的得分总和-每部分部件偏移+偏置量。

其中，因为第二根滤波器对应的为小尺寸目标，因此在计算第二区域得分的时候只需要计算第二根滤波器得分，不需要计算对应的部件滤波器得分。

S26：所述目标区域映射到所述待检测图像以完成目标位置的检测。

S261：即将第一目标区域和第二目标区域映射到原图，得到初步检测结果。

S262：将初步检测结果利用非极大值抑制算法用矩形框标出人形目标物体，输出检测结果。

与现有技术相比，本发明实施例具有如下有益效果：

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于DPM算法的目标检测方法，其特征在于，包括如下步骤：

(a)根据阈值离线训练获得双尺度滤波器；所述双尺度滤波器用于对不同尺度的人形目标进行检测；

(b)读取待检测图像；

(c)提取所述待检测图像的ROI区域；

(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域；

(e)根据所述第一区域和所述第二区域计算HOG特征金字塔；

(g)将所述目标区域映射到所述待检测图像以完成人形目标位置的检测；

步骤(a)包括：

(a1)对样本图像中的训练目标进行标注获得标注区域信息；

2.根据权利要求1所述的目标检测方法，其特征在于，步骤(e)包括：

(e1)根据所述第一区域计算第一HOG特征金字塔；

(e2)根据所述第二区域计算第二HOG特征金字塔。

3.根据权利要求2所述的目标检测方法，其特征在于，步骤(f)包括：

4.根据权利要求1所述的目标检测方法，其特征在于，所述标注区域信息包括：高像素值、宽像素值、位置坐标。

5.根据权利要求4所述的目标检测方法，其特征在于，步骤(a2)包括：

6.根据权利要求1所述的目标检测方法，其特征在于，所述离线训练所采用的方法为Latent-SVM训练方法。

7.根据权利要求1所述的目标检测方法，其特征在于，步骤(c)包括：

(c1)对所述待检测图像进行阈值分割获得二值化图像；

(c2)对所述二值化图像进行噪点消除和空洞填充处理；

(c3)用外接矩形标记所述二值化图像的高亮连通区域；

8.根据权利要求1所述的目标检测方法，其特征在于，步骤(d)包括：

9.根据权利要求1所述的目标检测方法，其特征在于，步骤(g)包括：

(g1)将所述目标区域映射到所述待检测图像；