CN107480585A - 基于dpm算法的目标检测方法 - Google Patents

基于dpm算法的目标检测方法 Download PDF

Info

Publication number
CN107480585A
CN107480585A CN201710544443.0A CN201710544443A CN107480585A CN 107480585 A CN107480585 A CN 107480585A CN 201710544443 A CN201710544443 A CN 201710544443A CN 107480585 A CN107480585 A CN 107480585A
Authority
CN
China
Prior art keywords
area
target
pixel value
wave filter
detection method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710544443.0A
Other languages
English (en)
Other versions
CN107480585B (zh
Inventor
赵小明
何国经
刘小敏
程思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201710544443.0A priority Critical patent/CN107480585B/zh
Publication of CN107480585A publication Critical patent/CN107480585A/zh
Application granted granted Critical
Publication of CN107480585B publication Critical patent/CN107480585B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10048Infrared image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Abstract

本发明涉及一种基于DPM算法的目标检测方法,其特征在于,包括如下步骤:(a)根据阈值离线训练获得双尺度滤波器;(b)读取待检测图像;(c)提取ROI区域;(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域;(e)根据所述第一区域和所述第二区域计算HOG特征金字塔;(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域;(g)将所述目标区域映射到所述待检测图像以完成目标位置的检测。本发明去除大量无用背景区域,提高了检测效率,对不同尺度的目标检测时存在对小目标漏检的问题,使全局多尺度目标得到检测,提升了检测结果的准确性,使DPM算法更好的应用于实际工程中。

Description

基于DPM算法的目标检测方法
技术领域
本发明属于图像目标检测技术领域,具体涉及一种基于DPM算法的目标检测方法。
背景技术
对象检测技术是计算机视觉的关键技术和研究热点之一。可变性部件模型(Deformable PartModel,简称DPM)算法由Felzenszwalb于2008年提出,是一种基于部件的检测方法,对目标的形变具有很强的鲁棒性。目前DPM已成为众多分类、分割、姿态估计等算法的核心部分,Felzenszwalb本人也因此被VOC授予"终身成就奖"。作为现今最流行的对象检测算法之一,在对象检测领域著名的PASCAL VOC竞赛中多次取得优异的成绩。DPM算法使用根滤波器和若干个部件滤波器来描述目标的结构,通过根滤波器来描述目标的整体轮廓,通过若干个部件滤波器来描述目标的各个组成部分,通过计算根滤波器和部件滤波器响应以及部件模型相对根模型位置偏移的综合得分,判断是否存在待检测目标。对于容易发生形变的目标,该设计方案使得目标检测更加准确。训练过程通过隐藏支持向量机(Latent SupportVector Machine,简称Latent-SVM)数据学习可变形部件模型的问题简化为二分类问题,提高系统整体检测性能。但DPM算法的检测过程存在滑动窗口全局搜索检测目标导致时间长、虚警多的问题。因此,选取更准确合适方法,去除红外图像冗杂背景区域,减少滑动窗口数量,实现算法的实时性需求是DPM算法待解决问题之一。同时单模板的检测存在检测时小目标漏检的问题。
因此,如何提供一种高效、准确的目标检测方法已经成为目前研究的热点问题。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于DPM算法的目标检测方法。
本发明的一个实施例提供了一种基于DPM算法的目标检测方法,包括:
(a)根据阈值离线训练获得双尺度滤波器;
(b)读取待检测图像;
(c)提取所述待检测图像的ROI区域;
(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域;
(e)根据所述第一区域和所述第二区域计算HOG特征金字塔;
(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域;
(g)将所述目标区域映射到所述待检测图像以完成目标位置的检测。
在本发明的一个实施例中,步骤(a)包括:
(a1)对样本图像中的训练目标进行标注获得标注区域信息;
(a2)根据所述阈值和所述标注区域信息将所述训练目标划分为第一训练目标和第二训练目标;
(a3)对所述第一训练目标离线训练获得第一根滤波器和部件滤波器,对所述第二训练目标离线训练获得第二根滤波器。
在本发明的一个实施例中,步骤(e)包括:
(e1)根据所述第一区域计算第一HOG特征金字塔;
(e2)根据所述第二区域计算第二HOG特征金字塔。
在本发明的一个实施例中,步骤(f)包括:
(f1)利用所述第一根滤波器、所述部件滤波器分别与所述第一HOG特征金字塔进行卷积获得第一卷积结果;
(f2)利用所述第二根滤波器与所述所述第二HOG特征金字塔进行卷积获得第二卷积结果;
(f3)根据所述第一卷积结果和第二卷积结果计算得分并获得目标区域。
在本发明的一个实施例中,所述标注区域信息包括:高像素值、宽像素值、位置坐标。
在本发明的一个实施例中,步骤(a2)包括:
(a21)获取所述高像素值和所述宽像素值的最小值为第一像素值;
(a22)若所述第一像素值大于阈值,则所述训练目标为第一训练目标;否则,所述训练目标为第二训练目标。
在本发明的一个实施例中,所述离线训练方法采用Latent-SVM训练方法。
在本发明的一个实施例中,步骤(c)包括:
(c1)对所述待检测图像进行阈值分割获得二值化图像;
(c2)对所述二值化图像进行噪点消除和空洞填充处理;
(c3)用外接矩形标记所述二值化图像的高亮连通区域;
(c4)根据所述高亮连通区域的面积和宽高比剔除不符合区域获取剩余高亮连通区域;
(c5)将所述剩余高亮连通区域向外进行扩展以获得所述ROI区域。
在本发明的一个实施例中,步骤(d)包括:
(d1)获取所述ROI区域的宽像素值和高像素值的最小值作为第二像素值;
(d2)若所述第二像素值大于所述阈值,则所述ROI区域存入并拼接为所述第一区域;否则,所述ROI区域存入并拼接为所述第二区域。
在本发明的一个实施例中,步骤(g)包括:
(g1)将所述目标区域映射到所述待检测图像;
(g2)利用非极大值抑制算法,用矩形框标出检测物体以完成所述目标位置的检测。
与现有技术相比,本发明具有如下有益效果:
1、通过对ROI区域的提取,去除大量无用背景区域,改进了传统DPM检测算法需要不断对大量背景区域进行滑动窗扫描带来的检测时间长问题,提高了检测效率,使DPM算法更好的应用于实际工程中。
2、通过采用双尺度滤波器,对不同尺度的目标检测时存在对小目标漏检的问题,使全局多尺度目标得到检测,提升了检测结果的准确性。
附图说明
图1为本发明实施例提供的一种基于DPM算法的目标检测方法的流程示意图;
图2为本发明实施例提供的一种基于DPM算法的目标检测方法的原理图。
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
实施例一
请参见图1,为本发明实施例提供的一种基于DPM算法的目标检测方法的流程示意图;其中,所述基于DPM算法的目标检测方法包括:
(a)根据阈值离线训练获得双尺度滤波器;
(b)读取待检测图像;
(c)提取待检测图像的感兴趣(region of interest,简称ROI)区域;
(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域;
(e)根据所述第一区域和所述第二区域计算梯度直方图(Histogram of OrientedGradient,简称HOG)特征金字塔;
(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域;
(g)将所述目标区域映射到所述待检测图像以完成目标位置的检测。
其中,步骤(a)包括:
(a1)对样本图像中的训练目标进行标注获得标注区域信息;
(a2)根据所述阈值和所述标注区域信息将所述训练目标划分为第一训练目标和第二训练目标;
(a3)对所述第一训练目标离线训练获得第一根滤波器和部件滤波器,对所述第二训练目标离线训练获得第二根滤波器。
其中,步骤(e)包括:
(e1)根据所述第一区域计算第一HOG特征金字塔;
(e2)根据所述第二区域计算第二HOG特征金字塔。
其中,步骤(f)包括:
(f1)利用所述第一根滤波器、所述部件滤波器分别与所述第一HOG特征金字塔进行卷积获得第一卷积结果;
(f2)利用所述第二根滤波器与所述第二HOG特征金字塔进行卷积获得第二卷积结果;
(f3)根据所述第一卷积结果和第二卷积结果计算得分并获得目标区域。
其中,所述标注区域信息包括:高像素值、宽像素值、位置坐标。
其中,步骤(a2)包括:
(a21)获取所述高像素值和所述宽像素值的最小值为第一像素值;
(a22)若所述第一像素值大于阈值,则所述训练目标为第一训练目标;否则,所述训练目标为第二训练目标。
其中,所述离线训练方法采用Latent-SVM训练方法。
其中,步骤(c)包括:
(c1)对所述待检测图像进行阈值分割获得二值化图像;
(c2)对所述二值化图像进行噪点消除和空洞填充处理;
(c3)用外接矩形标记所述二值化图像的高亮连通区域;
(c4)根据所述高亮连通区域的面积和宽高比剔除不符合区域获取剩余高亮连通区域;
(c5)将所述剩余高亮连通区域向外进行扩展以获得所述ROI区域。
其中,步骤(d)包括:
(d1)获取所述ROI区域的宽像素值和高像素值的最小值作为第二像素值;
(d2)若所述第二像素值大于所述阈值,则所述ROI区域存入并拼接为所述第一区域;否则,所述ROI区域存入并拼接为所述第二区域。
其中,步骤(g)包括:
(g1)将所述目标区域映射到所述待检测图像;
(g2)利用非极大值抑制算法,用矩形框标出检测物体以完成所述目标位置的检测。
与现有技术相比,本发明实施例具有如下有益效果:
1、通过对ROI区域的提取,去除大量无用背景区域,改进了传统DPM检测算法需要不断对大量背景区域进行滑动窗扫描带来的检测时间长问题,提高了检测效率,使DPM检测算法更好的应用于实际工程中。
2、通过采用双尺度滤波器,对不同尺度的目标检测时存在对小目标漏检的问题,使全局多尺度目标得到检测,提升了检测结果的准确性。
实施例二
请参见图1、图2,图1为本发明实施例提供的一种基于DPM算法的目标检测方法的流程示意图;图2为本发明实施例提供的一种基于DPM算法的目标检测方法的原理图。本实施例在实施例一的基础上,以检测人形目标为例详细阐述了该目标检测方法的原理和步骤如下。
步骤一、根据阈值离线训练获得双尺度滤波器;对于单帧红外目标检测,拍摄大量包含人形的红外样本图像,对样本图片分类后使用Latent-SVM训练方法将检测问题转换为分类问题训练,训练人形目标的根滤波器和部件滤波器,分别得到训练目标的双尺度根滤波器。具体步骤如下:
S11:对于单帧红外目标检测,拍摄大量包含人形目标的红外样本图像。
S12:采用矩形框对样本图像中的人形目标进行手动标注,获取人形目标标注区域信息,包括:标注区域的高像素值和宽像素值(即标注区域的大小),标注区域的位置等信息。
S13:选取标注区域高像素值和宽像素值较小的值作为第一像素值,取阈值为80个像素值,当第一像素值大于阈值时将所述标注区域存为文本1作为第一训练目标,当第一像素值小于阈值时将所述标注区域存为文本2作为第二训练目标。
S14:通过Latent-SVM训练方法分别对第一训练目标和第二训练目标进行训练获得第一根滤波器和第二根滤波器,具体包括如下步骤:
S141:获取训练数据集。训练数据集由正样本集合P和负样本集合N组成,正样本集合实际上是一些图片-矩形框对(I,B),其中I是图片,B是框定目标的矩形。正样本中并没有指定人形目标每个部分的矩形框,这些参数将通过学习得到,将第一训练目标作为正样本集,初始负样本集从不包含人形目标的样本图片中随机截取。
S142:第一初始根滤波器初始化。输入正样本集和负样本集训练第一初始根滤波器,根据训练数据标注区域大小的统计值选择第一初始根滤波器的尺寸。
首选计算正样本集合的标注区域宽像素值、高像素值的均值,作为第一初始根滤波器的宽高比,对正样本中标注区域面积进行排序,选择大于80%的标注区域面积作为第一初始根滤波器的面积,得到第一初始根滤波器的尺寸。然后将这些截取的正样本非均匀地缩放到第一初始根滤波器大小的尺寸和宽高比。使用Latent-SVM训练方法训练得到第一初始根滤波器的大小和位置。同时,将大于80%标注区域面积的第一训练目标作为新的正样本集。
S143:第一初始根滤波器更新。给定步骤S141训练得到的第一初始根滤波器大小和位置,对于训练数据集中的每个标注区域矩形框,在第一初始根滤波器位置、大小和标注区域矩形框位置、大小显著重叠(重叠50%以上)的条件下,找到第一初始根滤波器得分最高的一个位置。第一初始根滤波器在检测窗口的得分为:
其中,F0表示第一初始根滤波器,H是特征金字塔,p=(x,y,l)表示金字塔第l层(x,y)位置的一个细胞单元。φ(H,p,w,h)是将w*h大小子窗口的特征串接起来得到的向量。
输出得分最高的第一初始根滤波器的位置和大小作为更新后的第一初始根滤波器的位置和大小。
S144:用得到的新的正样本集和初始负样本集重新训练第一初始根滤波器,如此迭代两次,输出第一初始根滤波器的位置和大小。
S145:将第二训练目标作为正样本集,重复步骤S141~S143输出第二初始根滤波器的位置和大小。
S146:根据第一初始根滤波器的位置和大小计算对应的部件滤波器的位置和特征参数。
S147:根据第一初始滤波器、第二初始滤波器的位置和大小,部件滤波器的位置和特征参数计算输出第一根滤波器特征向量、部件滤波器特征向量、第二根滤波器特征向量。
步骤二、检测过程。提取待检测图片的HOG特征金字塔。通过HOG描述子提取图像特征。HOG描述子是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度直方图来构成特征。
其中,DPM的根滤波器的尺寸是固定的,但待检测图片尺寸是变化的。为了检测不同尺寸的人形目标,需要进行多尺度分析。给一个待检测图片,对待检测图片进行缩放,得到一系列待检测图片计算HOG金字塔特征,得到HOG特征金字塔。HOG特征金字塔顶层的特征可以在大范围内捕获粗糙的梯度直方图,HOG特征金字塔底层的特征捕获小范围的精细尺度梯度直方图。根滤波器的位置定义了检测窗口。部件滤波器所在层的HOG细胞单元尺寸是根滤波器所在层的细胞单元尺寸的一半。发现使用高分辨率的特征来定义部件滤波器对于获得高识别率是必要的,这样部件滤波器相比于根滤波器就可以表示更细腻的边缘信息。例如在建立人脸模型时,根滤波器用来捕获脸的边界这些粗糙信息,部件滤波器可以捕获眼镜、鼻子、嘴这些细节信息。
具体分为以下步骤:
S21:读取待检测红外图像。
S22:提取ROI区域。
S221:阈值分割。
由于待检测红外图像的灰度图像为单峰,因此选取单高斯滤波模型进行阈值分割。计算待检测红外图像平均像素值μ和方差δ,如下所示:
其中,W和H分别为待检测红外图像的宽和高,f(x,y)为待检测红外图像每点像素值。
阈值计算如下:
T=μ+θ*σ
通过设定θ的值调整合适阈值对待检测红外图像进行二值化操作。
S222:对二值化后图像进行噪点消除和孔洞填充,使用先膨胀后腐蚀的形态学操作处理图像。
S223:用外接矩形标记二值化的高亮连通区域。对标记后的高亮连通区域进行面积、长宽比等物理判断。当面积大小或长宽比大小不符合实际经验值时,例如对于人形目标,连通区域的经验值为长宽比为3:1,剔除不可能区域;进一步排除错误区域,加速计算。
S224:对每个高亮连通区域向外适当扩展,保证人形目标的完整性以获得ROI区域。
S23:根据所述阈值将所述ROI区域拼接为第一区域和第二区域。依次扫描所有ROI区域,根据ROI区域宽像素值和高像素值的最小值进行合并,当该值小于80像素值时,ROI区域标记为第一区域;大于80像素值时,ROI区域标记为第二区域。将标记为第一区域的若干ROI区域进行合并拼接保存为第一区域,将标记为第二区域的若干ROI区域进行合并拼接保存为第二区域。此时两区域中存放的分别为宽像素值和高像素值小于80的疑似目标集合和宽像素值和高像素值大于80的疑似目标集合。
S24:根据所述第一区域和所述第二区域计算HOG特征金字塔。利用第一区域计算得到部件第一HOG特征金字塔,利用所第二区域进行计算获得第二HOG特征金字塔。
S25:根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域。
通过划窗方式,根据第一根滤波器设定检测窗口大小,将第一HOG特征金字塔逐像素计算,利用第一根滤波器、部件滤波器与第一HOG特征金字塔卷积得到第一卷积结果,根据第一卷积结果计算第一根滤波器得分、部件滤波器得分、变形花费,计算第一区域中得分最高的位置区域即为第一目标区域。
根据第二根滤波器设定检测窗口大小,第二根滤波器与所述第二HOG特征金字塔进行卷积获得第二卷积结果。再根据第二卷积结果计算第二根滤波器得分,计算第二区域中得分最高的位置区域即为第二目标区域。
其中,检测窗口的得分是根滤波器的分数加上各个部件滤波器分数的总和,每个部件滤波器得分是此部件滤波器的各个空间位置得分的最大值,每个部件滤波器的空间位置得分是部件滤波器在该子窗口上部件滤波器的得分减去变形花费。根滤波器和部件滤波器的得分都是通过计算检测窗口内的梯度直方图和检测窗口内所含向量个数的点积来获得的。这里所说的向量是指将检测窗口划分为由若干个8*8像素大小组成的向量单元,每个向量单元对应4*9维向量,所有向量单元的向量维数和为检测窗口内所含向量单元个数与每个向量单元维数的乘积。检测窗口得分计算公式为:
其中,F0.φ(H,P0)为根滤波器得分,Fi.φ(H,Pi)为第i个部件滤波器得分,di.δ(p0,vi,pi)为每部分部件偏移,b为偏置量。
其中,因为第二根滤波器对应的为小尺寸目标,因此在计算第二区域得分的时候只需要计算第二根滤波器得分,不需要计算对应的部件滤波器得分。
S26:所述目标区域映射到所述待检测图像以完成目标位置的检测。
S261:即将第一目标区域和第二目标区域映射到原图,得到初步检测结果。
S262:将初步检测结果利用非极大值抑制算法用矩形框标出人形目标物体,输出检测结果。
与现有技术相比,本发明实施例具有如下有益效果:
1、通过对ROI区域的提取,去除大量无用背景区域,改进了传统DPM检测算法需要不断对大量背景区域进行滑动窗扫描带来的检测时间长问题,提高了检测效率,使DPM算法更好的应用于实际工程中。
2、通过采用双尺度滤波器,对不同尺度的目标检测时存在对小目标漏检的问题,使全局多尺度目标得到检测,提升了检测结果的准确性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于DPM算法的目标检测方法,其特征在于,包括如下步骤:
(a)根据阈值离线训练获得双尺度滤波器;
(b)读取待检测图像;
(c)提取所述待检测图像的ROI区域;
(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域;
(e)根据所述第一区域和所述第二区域计算HOG特征金字塔;
(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域;
(g)将所述目标区域映射到所述待检测图像以完成目标位置的检测。
2.根据权利要求1所述的目标检测方法,其特征在于,步骤(a)包括:
(a1)对样本图像中的训练目标进行标注获得标注区域信息;
(a2)根据所述阈值和所述标注区域信息将所述训练目标划分为第一训练目标和第二训练目标;
(a3)对所述第一训练目标离线训练获得第一根滤波器和部件滤波器,对所述第二训练目标离线训练获得第二根滤波器。
3.根据权利要求2所述的目标检测方法,其特征在于,步骤(e)包括:
(e1)根据所述第一区域计算第一HOG特征金字塔;
(e2)根据所述第二区域计算第二HOG特征金字塔。
4.根据权利要求3所述的目标检测方法,其特征在于,步骤(f)包括:
(f1)利用所述第一根滤波器、所述部件滤波器分别与所述第一HOG特征金字塔进行卷积获得第一卷积结果;
(f2)利用所述第二根滤波器与所述第二HOG特征金字塔进行卷积获得第二卷积结果;
(f3)根据所述第一卷积结果和第二卷积结果计算得分并获得目标区域。
5.根据权利要求2所述的目标检测方法,其特征在于,所述标注区域信息包括:高像素值、宽像素值、位置坐标。
6.根据权利要求5所述的目标检测方法,其特征在于,步骤(a2)包括:
(a21)获取所述高像素值和所述宽像素值的最小值为第一像素值;
(a22)若所述第一像素值大于阈值,则所述训练目标为第一训练目标;否则,所述训练目标为第二训练目标。
7.根据权利要求1所述的目标检测方法,其特征在于,所述离线训练方法采用Latent-SVM训练方法。
8.根据权利要求1所述的目标检测方法,其特征在于,步骤(c)包括:
(c1)对所述待检测图像进行阈值分割获得二值化图像;
(c2)对所述二值化图像进行噪点消除和空洞填充处理;
(c3)用外接矩形标记所述二值化图像的高亮连通区域;
(c4)根据所述高亮连通区域的面积和宽高比剔除不符合区域获取剩余高亮连通区域;
(c5)将所述剩余高亮连通区域向外进行扩展以获得所述ROI区域。
9.根据权利要求1所述的目标检测方法,其特征在于,步骤(d)包括:
(d1)获取所述ROI区域的宽像素值和高像素值的最小值作为第二像素值;
(d2)若所述第二像素值大于所述阈值,则所述ROI区域存入并拼接为所述第一区域;否则,所述ROI区域存入并拼接为所述第二区域。
10.根据权利要求1所述的目标检测方法,其特征在于,步骤(g)包括:
(g1)将所述目标区域映射到所述待检测图像;
(g2)利用非极大值抑制算法,用矩形框标出检测物体以完成所述目标位置的检测。
CN201710544443.0A 2017-07-06 2017-07-06 基于dpm算法的目标检测方法 Active CN107480585B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710544443.0A CN107480585B (zh) 2017-07-06 2017-07-06 基于dpm算法的目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710544443.0A CN107480585B (zh) 2017-07-06 2017-07-06 基于dpm算法的目标检测方法

Publications (2)

Publication Number Publication Date
CN107480585A true CN107480585A (zh) 2017-12-15
CN107480585B CN107480585B (zh) 2020-10-30

Family

ID=60596389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710544443.0A Active CN107480585B (zh) 2017-07-06 2017-07-06 基于dpm算法的目标检测方法

Country Status (1)

Country Link
CN (1) CN107480585B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010063A (zh) * 2017-12-27 2018-05-08 天津天地伟业投资管理有限公司 一种基于视频的运动目标进入或离开区域的检测方法
CN108154130A (zh) * 2017-12-29 2018-06-12 深圳市神州云海智能科技有限公司 一种目标图像的检测方法、装置及存储介质、机器人
CN108229380A (zh) * 2017-12-29 2018-06-29 深圳市神州云海智能科技有限公司 一种目标图像的检测方法、装置及存储介质、机器人
CN108416254A (zh) * 2018-01-17 2018-08-17 上海鹰觉科技有限公司 一种用于人流行为识别和人数统计的统计系统以及方法
CN109035292A (zh) * 2018-08-31 2018-12-18 北京智芯原动科技有限公司 基于深度学习的运动目标检测方法及装置
CN109241819A (zh) * 2018-07-07 2019-01-18 西安电子科技大学 基于快速多尺度及联合模板匹配的多目标行人检测方法
CN110443097A (zh) * 2018-05-03 2019-11-12 北京中科晶上超媒体信息技术有限公司 一种视频目标实时提取优化方法及系统
CN110740231A (zh) * 2019-09-27 2020-01-31 浙江省北大信息技术高等研究院 视频数据标注方法、装置、电子设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120076361A1 (en) * 2009-06-03 2012-03-29 Hironobu Fujiyoshi Object detection device
CN106407943A (zh) * 2016-09-28 2017-02-15 天津工业大学 金字塔层定位的快速dpm行人检测

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120076361A1 (en) * 2009-06-03 2012-03-29 Hironobu Fujiyoshi Object detection device
CN106407943A (zh) * 2016-09-28 2017-02-15 天津工业大学 金字塔层定位的快速dpm行人检测

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吕瑞等: "基于稀疏多尺度分割和级联形变模型的行人检测算法", 《武汉大学学报》 *
康珮珮等: "车辆检测中可变形部件模型的改进与应用", 《计算机工程与应用》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010063A (zh) * 2017-12-27 2018-05-08 天津天地伟业投资管理有限公司 一种基于视频的运动目标进入或离开区域的检测方法
CN108154130A (zh) * 2017-12-29 2018-06-12 深圳市神州云海智能科技有限公司 一种目标图像的检测方法、装置及存储介质、机器人
CN108229380A (zh) * 2017-12-29 2018-06-29 深圳市神州云海智能科技有限公司 一种目标图像的检测方法、装置及存储介质、机器人
CN108229380B (zh) * 2017-12-29 2022-02-15 深圳市神州云海智能科技有限公司 一种目标图像的检测方法、装置及存储介质、机器人
CN108154130B (zh) * 2017-12-29 2022-04-15 深圳市神州云海智能科技有限公司 一种目标图像的检测方法、装置及存储介质、机器人
CN108416254A (zh) * 2018-01-17 2018-08-17 上海鹰觉科技有限公司 一种用于人流行为识别和人数统计的统计系统以及方法
CN110443097A (zh) * 2018-05-03 2019-11-12 北京中科晶上超媒体信息技术有限公司 一种视频目标实时提取优化方法及系统
CN109241819A (zh) * 2018-07-07 2019-01-18 西安电子科技大学 基于快速多尺度及联合模板匹配的多目标行人检测方法
CN109035292A (zh) * 2018-08-31 2018-12-18 北京智芯原动科技有限公司 基于深度学习的运动目标检测方法及装置
CN109035292B (zh) * 2018-08-31 2021-01-01 北京智芯原动科技有限公司 基于深度学习的运动目标检测方法及装置
CN110740231A (zh) * 2019-09-27 2020-01-31 浙江省北大信息技术高等研究院 视频数据标注方法、装置、电子设备及介质

Also Published As

Publication number Publication date
CN107480585B (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN107480585A (zh) 基于dpm算法的目标检测方法
CN110543837B (zh) 一种基于潜在目标点的可见光机场飞机检测方法
CN108346159A (zh) 一种基于跟踪-学习-检测的视觉目标跟踪方法
CN101859382B (zh) 一种基于最大稳定极值区域的车牌检测与识别的方法
CN102542289B (zh) 一种基于多高斯计数模型的人流量统计方法
CN103049763B (zh) 一种基于上下文约束的目标识别方法
CN102682287B (zh) 基于显著度信息的行人检测方法
CN106529448A (zh) 利用聚合通道特征进行多视角人脸检测的方法
CN110135296A (zh) 基于卷积神经网络的机场跑道fod检测方法
CN107742099A (zh) 一种基于全卷积网络的人群密度估计、人数统计的方法
CN108053419A (zh) 基于背景抑制和前景抗干扰的多尺度目标跟踪方法
CN105701483B (zh) 一种融合多光谱遥感数据和夜间灯光遥感数据的城市边界提取方法
CN104616032A (zh) 基于深度卷积神经网络的多摄像机系统目标匹配方法
CN105404857A (zh) 一种基于红外的夜间智能车前方行人检测方法
CN106815583B (zh) 一种基于mser和swt相结合的夜间车辆车牌定位方法
Zhang et al. Study on traffic sign recognition by optimized Lenet-5 algorithm
CN101930549B (zh) 基于第二代曲线波变换的静态人体检测方法
CN105718912B (zh) 一种基于深度学习的车辆特征物检测方法
CN103310194A (zh) 视频中基于头顶像素点梯度方向的行人头肩部检测方法
CN107944354B (zh) 一种基于深度学习的车辆检测方法
CN109902618A (zh) 一种海面船只识别方法和装置
CN109376740A (zh) 一种基于视频的水尺读数检测方法
CN110866430A (zh) 一种车牌识别方法及装置
CN111915583B (zh) 复杂场景中基于车载红外热像仪的车辆和行人检测方法
CN113240623B (zh) 一种路面病害检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant