CN107480585B - 基于dpm算法的目标检测方法 - Google Patents

基于dpm算法的目标检测方法 Download PDF

Info

Publication number
CN107480585B
CN107480585B CN201710544443.0A CN201710544443A CN107480585B CN 107480585 B CN107480585 B CN 107480585B CN 201710544443 A CN201710544443 A CN 201710544443A CN 107480585 B CN107480585 B CN 107480585B
Authority
CN
China
Prior art keywords
region
target
training
filter
pixel value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710544443.0A
Other languages
English (en)
Other versions
CN107480585A (zh
Inventor
赵小明
何国经
刘小敏
程思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201710544443.0A priority Critical patent/CN107480585B/zh
Publication of CN107480585A publication Critical patent/CN107480585A/zh
Application granted granted Critical
Publication of CN107480585B publication Critical patent/CN107480585B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10048Infrared image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于DPM算法的目标检测方法,其特征在于,包括如下步骤:(a)根据阈值离线训练获得双尺度滤波器;(b)读取待检测图像;(c)提取ROI区域;(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域;(e)根据所述第一区域和所述第二区域计算HOG特征金字塔;(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域;(g)将所述目标区域映射到所述待检测图像以完成目标位置的检测。本发明去除大量无用背景区域,提高了检测效率,对不同尺度的目标检测时存在对小目标漏检的问题,使全局多尺度目标得到检测,提升了检测结果的准确性,使DPM算法更好的应用于实际工程中。

Description

基于DPM算法的目标检测方法
技术领域
本发明属于图像目标检测技术领域,具体涉及一种基于DPM算法的目标检测方法。
背景技术
对象检测技术是计算机视觉的关键技术和研究热点之一。可变性部件模型(Deformable Part Model,简称DPM)算法由Felzenszwalb于2008年提出,是一种基于部件的检测方法,对目标的形变具有很强的鲁棒性。目前DPM已成为众多分类、分割、姿态估计等算法的核心部分,Felzenszwalb本人也因此被VOC授予"终身成就奖"。作为现今最流行的对象检测算法之一,在对象检测领域著名的PASCAL VOC竞赛中多次取得优异的成绩。DPM算法使用根滤波器和若干个部件滤波器来描述目标的结构,通过根滤波器来描述目标的整体轮廓,通过若干个部件滤波器来描述目标的各个组成部分,通过计算根滤波器和部件滤波器响应以及部件模型相对根模型位置偏移的综合得分,判断是否存在待检测目标。对于容易发生形变的目标,该设计方案使得目标检测更加准确。训练过程通过隐藏支持向量机(Latent Support Vector Machine,简称Latent-SVM)数据学习可变形部件模型的问题简化为二分类问题,提高系统整体检测性能。但DPM算法的检测过程存在滑动窗口全局搜索检测目标导致时间长、虚警多的问题。因此,选取更准确合适方法,去除红外图像冗杂背景区域,减少滑动窗口数量,实现算法的实时性需求是DPM算法待解决问题之一。同时单模板的检测存在检测时小目标漏检的问题。
因此,如何提供一种高效、准确的目标检测方法已经成为目前研究的热点问题。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于DPM算法的目标检测方法。
本发明的一个实施例提供了一种基于DPM算法的目标检测方法,包括:
(a)根据阈值离线训练获得双尺度滤波器;
(b)读取待检测图像;
(c)提取所述待检测图像的ROI区域;
(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域;
(e)根据所述第一区域和所述第二区域计算HOG特征金字塔;
(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域;
(g)将所述目标区域映射到所述待检测图像以完成目标位置的检测。
在本发明的一个实施例中,步骤(a)包括:
(a1)对样本图像中的训练目标进行标注获得标注区域信息;
(a2)根据所述阈值和所述标注区域信息将所述训练目标划分为第一训练目标和第二训练目标;
(a3)对所述第一训练目标离线训练获得第一根滤波器和部件滤波器,对所述第二训练目标离线训练获得第二根滤波器。
在本发明的一个实施例中,步骤(e)包括:
(e1)根据所述第一区域计算第一HOG特征金字塔;
(e2)根据所述第二区域计算第二HOG特征金字塔。
在本发明的一个实施例中,步骤(f)包括:
(f1)利用所述第一根滤波器、所述部件滤波器分别与所述第一HOG特征金字塔进行卷积获得第一卷积结果;
(f2)利用所述第二根滤波器与所述所述第二HOG特征金字塔进行卷积获得第二卷积结果;
(f3)根据所述第一卷积结果和第二卷积结果计算得分并获得目标区域。
在本发明的一个实施例中,所述标注区域信息包括:高像素值、宽像素值、位置坐标。
在本发明的一个实施例中,步骤(a2)包括:
(a21)获取所述高像素值和所述宽像素值的最小值为第一像素值;
(a22)若所述第一像素值大于阈值,则所述训练目标为第一训练目标;否则,所述训练目标为第二训练目标。
在本发明的一个实施例中,所述离线训练方法采用Latent-SVM训练方法。
在本发明的一个实施例中,步骤(c)包括:
(c1)对所述待检测图像进行阈值分割获得二值化图像;
(c2)对所述二值化图像进行噪点消除和空洞填充处理;
(c3)用外接矩形标记所述二值化图像的高亮连通区域;
(c4)根据所述高亮连通区域的面积和宽高比剔除不符合区域获取剩余高亮连通区域;
(c5)将所述剩余高亮连通区域向外进行扩展以获得所述ROI区域。
在本发明的一个实施例中,步骤(d)包括:
(d1)获取所述ROI区域的宽像素值和高像素值的最小值作为第二像素值;
(d2)若所述第二像素值大于所述阈值,则所述ROI区域存入并拼接为所述第一区域;否则,所述ROI区域存入并拼接为所述第二区域。
在本发明的一个实施例中,步骤(g)包括:
(g1)将所述目标区域映射到所述待检测图像;
(g2)利用非极大值抑制算法,用矩形框标出检测物体以完成所述目标位置的检测。
与现有技术相比,本发明具有如下有益效果:
1、通过对ROI区域的提取,去除大量无用背景区域,改进了传统DPM检测算法需要不断对大量背景区域进行滑动窗扫描带来的检测时间长问题,提高了检测效率,使DPM算法更好的应用于实际工程中。
2、通过采用双尺度滤波器,对不同尺度的目标检测时存在对小目标漏检的问题,使全局多尺度目标得到检测,提升了检测结果的准确性。
附图说明
图1为本发明实施例提供的一种基于DPM算法的目标检测方法的流程示意图;
图2为本发明实施例提供的一种基于DPM算法的目标检测方法的原理图。
具体实施方式
下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。
实施例一
请参见图1,为本发明实施例提供的一种基于DPM算法的目标检测方法的流程示意图;其中,所述基于DPM算法的目标检测方法包括:
(a)根据阈值离线训练获得双尺度滤波器;
(b)读取待检测图像;
(c)提取待检测图像的感兴趣(region of interest,简称ROI)区域;
(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域;
(e)根据所述第一区域和所述第二区域计算梯度直方图(Histogram of OrientedGradient,简称HOG)特征金字塔;
(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域;
(g)将所述目标区域映射到所述待检测图像以完成目标位置的检测。
其中,步骤(a)包括:
(a1)对样本图像中的训练目标进行标注获得标注区域信息;
(a2)根据所述阈值和所述标注区域信息将所述训练目标划分为第一训练目标和第二训练目标;
(a3)对所述第一训练目标离线训练获得第一根滤波器和部件滤波器,对所述第二训练目标离线训练获得第二根滤波器。
其中,步骤(e)包括:
(e1)根据所述第一区域计算第一HOG特征金字塔;
(e2)根据所述第二区域计算第二HOG特征金字塔。
其中,步骤(f)包括:
(f1)利用所述第一根滤波器、所述部件滤波器分别与所述第一HOG特征金字塔进行卷积获得第一卷积结果;
(f2)利用所述第二根滤波器与所述第二HOG特征金字塔进行卷积获得第二卷积结果;
(f3)根据所述第一卷积结果和第二卷积结果计算得分并获得目标区域。
其中,所述标注区域信息包括:高像素值、宽像素值、位置坐标。
其中,步骤(a2)包括:
(a21)获取所述高像素值和所述宽像素值的最小值为第一像素值;
(a22)若所述第一像素值大于阈值,则所述训练目标为第一训练目标;否则,所述训练目标为第二训练目标。
其中,所述离线训练方法采用Latent-SVM训练方法。
其中,步骤(c)包括:
(c1)对所述待检测图像进行阈值分割获得二值化图像;
(c2)对所述二值化图像进行噪点消除和空洞填充处理;
(c3)用外接矩形标记所述二值化图像的高亮连通区域;
(c4)根据所述高亮连通区域的面积和宽高比剔除不符合区域获取剩余高亮连通区域;
(c5)将所述剩余高亮连通区域向外进行扩展以获得所述ROI区域。
其中,步骤(d)包括:
(d1)获取所述ROI区域的宽像素值和高像素值的最小值作为第二像素值;
(d2)若所述第二像素值大于所述阈值,则所述ROI区域存入并拼接为所述第一区域;否则,所述ROI区域存入并拼接为所述第二区域。
其中,步骤(g)包括:
(g1)将所述目标区域映射到所述待检测图像;
(g2)利用非极大值抑制算法,用矩形框标出检测物体以完成所述目标位置的检测。
与现有技术相比,本发明实施例具有如下有益效果:
1、通过对ROI区域的提取,去除大量无用背景区域,改进了传统DPM检测算法需要不断对大量背景区域进行滑动窗扫描带来的检测时间长问题,提高了检测效率,使DPM检测算法更好的应用于实际工程中。
2、通过采用双尺度滤波器,对不同尺度的目标检测时存在对小目标漏检的问题,使全局多尺度目标得到检测,提升了检测结果的准确性。
实施例二
请参见图1、图2,图1为本发明实施例提供的一种基于DPM算法的目标检测方法的流程示意图;图2为本发明实施例提供的一种基于DPM算法的目标检测方法的原理图。本实施例在实施例一的基础上,以检测人形目标为例详细阐述了该目标检测方法的原理和步骤如下。
步骤一、根据阈值离线训练获得双尺度滤波器;对于单帧红外目标检测,拍摄大量包含人形的红外样本图像,对样本图片分类后使用Latent-SVM训练方法将检测问题转换为分类问题训练,训练人形目标的根滤波器和部件滤波器,分别得到训练目标的双尺度根滤波器。具体步骤如下:
S11:对于单帧红外目标检测,拍摄大量包含人形目标的红外样本图像。
S12:采用矩形框对样本图像中的人形目标进行手动标注,获取人形目标标注区域信息,包括:标注区域的高像素值和宽像素值(即标注区域的大小),标注区域的位置等信息。
S13:选取标注区域高像素值和宽像素值较小的值作为第一像素值,取阈值为80个像素值,当第一像素值大于阈值时将所述标注区域存为文本1作为第一训练目标,当第一像素值小于阈值时将所述标注区域存为文本2作为第二训练目标。
S14:通过Latent-SVM训练方法分别对第一训练目标和第二训练目标进行训练获得第一根滤波器和第二根滤波器,具体包括如下步骤:
S141:获取训练数据集。训练数据集由正样本集合P和负样本集合N组成,正样本集合实际上是一些图片-矩形框对(I,B),其中I是图片,B是框定目标的矩形。正样本中并没有指定人形目标每个部分的矩形框,这些参数将通过学习得到,将第一训练目标作为正样本集,初始负样本集从不包含人形目标的样本图片中随机截取。
S142:第一初始根滤波器初始化。输入正样本集和负样本集训练第一初始根滤波器,根据训练数据标注区域大小的统计值选择第一初始根滤波器的尺寸。
首选计算正样本集合的标注区域宽像素值、高像素值的均值,作为第一初始根滤波器的宽高比,对正样本中标注区域面积进行排序,选择大于80%的标注区域面积作为第一初始根滤波器的面积,得到第一初始根滤波器的尺寸。然后将这些截取的正样本非均匀地缩放到第一初始根滤波器大小的尺寸和宽高比。使用Latent-SVM训练方法训练得到第一初始根滤波器的大小和位置。同时,将大于80%标注区域面积的第一训练目标作为新的正样本集。
S143:第一初始根滤波器更新。给定步骤S141训练得到的第一初始根滤波器大小和位置,对于训练数据集中的每个标注区域矩形框,在第一初始根滤波器位置、大小和标注区域矩形框位置、大小显著重叠(重叠50%以上)的条件下,找到第一初始根滤波器得分最高的一个位置。第一初始根滤波器在检测窗口的得分为:
Figure GDA0002658844990000081
其中,F0表示第一初始根滤波器,H是特征金字塔,P=(x,y,l)表示金字塔第l层(x,y)位置的一个细胞单元。
Figure GDA0002658844990000091
是将w*h大小子窗口的特征串接起来得到的向量。
输出得分最高的第一初始根滤波器的位置和大小作为更新后的第一初始根滤波器的位置和大小。
S144:用得到的新的正样本集和初始负样本集重新训练第一初始根滤波器,如此迭代两次,输出第一初始根滤波器的位置和大小。
S145:将第二训练目标作为正样本集,重复步骤S141~S143输出第二初始根滤波器的位置和大小。
S146:根据第一初始根滤波器的位置和大小计算对应的部件滤波器的位置和特征参数。
S147:根据第一初始滤波器、第二初始滤波器的位置和大小,部件滤波器的位置和特征参数计算输出第一根滤波器特征向量、部件滤波器特征向量、第二根滤波器特征向量。
步骤二、检测过程。提取待检测图片的HOG特征金字塔。通过HOG描述子提取图像特征。HOG描述子是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度直方图来构成特征。
其中,DPM的根滤波器的尺寸是固定的,但待检测图片尺寸是变化的。为了检测不同尺寸的人形目标,需要进行多尺度分析。给一个待检测图片,对待检测图片进行缩放,得到一系列待检测图片计算HOG金字塔特征,得到HOG特征金字塔。HOG特征金字塔顶层的特征可以在大范围内捕获粗糙的梯度直方图,HOG特征金字塔底层的特征捕获小范围的精细尺度梯度直方图。根滤波器的位置定义了检测窗口。部件滤波器所在层的HOG细胞单元尺寸是根滤波器所在层的细胞单元尺寸的一半。发现使用高分辨率的特征来定义部件滤波器对于获得高识别率是必要的,这样部件滤波器相比于根滤波器就可以表示更细腻的边缘信息。例如在建立人脸模型时,根滤波器用来捕获脸的边界这些粗糙信息,部件滤波器可以捕获眼镜、鼻子、嘴这些细节信息。
具体分为以下步骤:
S21:读取待检测红外图像。
S22:提取ROI区域。
S221:阈值分割。
由于待检测红外图像的灰度图像为单峰,因此选取单高斯滤波模型进行阈值分割。计算待检测红外图像平均像素值μ和方差δ,如下所示:
Figure GDA0002658844990000101
Figure GDA0002658844990000102
其中,W和H分别为待检测红外图像的宽和高,f(x,y)为待检测红外图像每点像素值。
阈值计算如下:
T=μ+θ*σ
通过设定θ的值调整合适阈值对待检测红外图像进行二值化操作。
S222:对二值化后图像进行噪点消除和孔洞填充,使用先膨胀后腐蚀的形态学操作处理图像。
S223:用外接矩形标记二值化的高亮连通区域。对标记后的高亮连通区域进行面积、长宽比等物理判断。当面积大小或长宽比大小不符合实际经验值时,例如对于人形目标,连通区域的经验值为长宽比为3:1,剔除不可能区域;进一步排除错误区域,加速计算。
S224:对每个高亮连通区域向外适当扩展,保证人形目标的完整性以获得ROI区域。
S23:根据所述阈值将所述ROI区域拼接为第一区域和第二区域。依次扫描所有ROI区域,根据ROI区域宽像素值和高像素值的最小值进行合并,当该值小于80像素值时,ROI区域标记为第一区域;大于80像素值时,ROI区域标记为第二区域。将标记为第一区域的若干ROI区域进行合并拼接保存为第一区域,将标记为第二区域的若干ROI区域进行合并拼接保存为第二区域。此时两区域中存放的分别为宽像素值和高像素值小于80的疑似目标集合和宽像素值和高像素值大于80的疑似目标集合。
S24:根据所述第一区域和所述第二区域计算HOG特征金字塔。利用第一区域计算得到部件第一HOG特征金字塔,利用所第二区域进行计算获得第二HOG特征金字塔。
S25:根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域。
通过划窗方式,根据第一根滤波器设定检测窗口大小,将第一HOG特征金字塔逐像素计算,利用第一根滤波器、部件滤波器与第一HOG特征金字塔卷积得到第一卷积结果,根据第一卷积结果计算第一根滤波器得分、部件滤波器得分、变形花费,计算第一区域中得分最高的位置区域即为第一目标区域。
根据第二根滤波器设定检测窗口大小,第二根滤波器与所述第二HOG特征金字塔进行卷积获得第二卷积结果。再根据第二卷积结果计算第二根滤波器得分,计算第二区域中得分最高的位置区域即为第二目标区域。
其中,检测窗口的得分是根滤波器的分数加上各个部件滤波器分数的总和,每个部件滤波器得分是此部件滤波器的各个空间位置得分的最大值,每个部件滤波器的空间位置得分是部件滤波器在该子窗口上部件滤波器的得分减去变形花费。根滤波器和部件滤波器的得分都是通过计算检测窗口内的梯度直方图和检测窗口内所含向量个数的点积来获得的。这里所说的向量是指将检测窗口划分为由若干个8*8像素大小组成的向量单元,每个向量单元对应4*9维向量,所有向量单元的向量维数和为检测窗口内所含向量单元个数与每个向量单元维数的乘积。检测窗口得分等于:根滤波器得分+n个部件滤波器的得分总和-每部分部件偏移+偏置量。
其中,因为第二根滤波器对应的为小尺寸目标,因此在计算第二区域得分的时候只需要计算第二根滤波器得分,不需要计算对应的部件滤波器得分。
S26:所述目标区域映射到所述待检测图像以完成目标位置的检测。
S261:即将第一目标区域和第二目标区域映射到原图,得到初步检测结果。
S262:将初步检测结果利用非极大值抑制算法用矩形框标出人形目标物体,输出检测结果。
与现有技术相比,本发明实施例具有如下有益效果:
1、通过对ROI区域的提取,去除大量无用背景区域,改进了传统DPM检测算法需要不断对大量背景区域进行滑动窗扫描带来的检测时间长问题,提高了检测效率,使DPM算法更好的应用于实际工程中。
2、通过采用双尺度滤波器,对不同尺度的目标检测时存在对小目标漏检的问题,使全局多尺度目标得到检测,提升了检测结果的准确性。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (9)

1.一种基于DPM算法的目标检测方法,其特征在于,包括如下步骤:
(a)根据阈值离线训练获得双尺度滤波器;所述双尺度滤波器用于对不同尺度的人形目标进行检测;
(b)读取待检测图像;
(c)提取所述待检测图像的ROI区域;
(d)根据所述阈值将所述ROI区域拼接为第一区域和第二区域;
(e)根据所述第一区域和所述第二区域计算HOG特征金字塔;
(f)根据所述双尺度滤波器和所述HOG特征金字塔获取目标区域;
(g)将所述目标区域映射到所述待检测图像以完成人形目标位置的检测;
步骤(a)包括:
(a1)对样本图像中的训练目标进行标注获得标注区域信息;
(a2)根据所述阈值和所述标注区域信息将所述训练目标划分为第一训练目标和第二训练目标;
(a3)对所述第一训练目标离线训练获得第一根滤波器和部件滤波器,对所述第二训练目标离线训练获得第二根滤波器。
2.根据权利要求1所述的目标检测方法,其特征在于,步骤(e)包括:
(e1)根据所述第一区域计算第一HOG特征金字塔;
(e2)根据所述第二区域计算第二HOG特征金字塔。
3.根据权利要求2所述的目标检测方法,其特征在于,步骤(f)包括:
(f1)利用所述第一根滤波器、所述部件滤波器分别与所述第一HOG特征金字塔进行卷积获得第一卷积结果;
(f2)利用所述第二根滤波器与所述第二HOG特征金字塔进行卷积获得第二卷积结果;
(f3)根据所述第一卷积结果和第二卷积结果计算得分并获得目标区域。
4.根据权利要求1所述的目标检测方法,其特征在于,所述标注区域信息包括:高像素值、宽像素值、位置坐标。
5.根据权利要求4所述的目标检测方法,其特征在于,步骤(a2)包括:
(a21)获取所述高像素值和所述宽像素值的最小值为第一像素值;
(a22)若所述第一像素值大于阈值,则所述训练目标为第一训练目标;否则,所述训练目标为第二训练目标。
6.根据权利要求1所述的目标检测方法,其特征在于,所述离线训练所采用的方法为Latent-SVM训练方法。
7.根据权利要求1所述的目标检测方法,其特征在于,步骤(c)包括:
(c1)对所述待检测图像进行阈值分割获得二值化图像;
(c2)对所述二值化图像进行噪点消除和空洞填充处理;
(c3)用外接矩形标记所述二值化图像的高亮连通区域;
(c4)根据所述高亮连通区域的面积和宽高比剔除不符合区域获取剩余高亮连通区域;
(c5)将所述剩余高亮连通区域向外进行扩展以获得所述ROI区域。
8.根据权利要求1所述的目标检测方法,其特征在于,步骤(d)包括:
(d1)获取所述ROI区域的宽像素值和高像素值的最小值作为第二像素值;
(d2)若所述第二像素值大于所述阈值,则所述ROI区域存入并拼接为所述第一区域;否则,所述ROI区域存入并拼接为所述第二区域。
9.根据权利要求1所述的目标检测方法,其特征在于,步骤(g)包括:
(g1)将所述目标区域映射到所述待检测图像;
(g2)利用非极大值抑制算法,用矩形框标出检测物体以完成所述目标位置的检测。
CN201710544443.0A 2017-07-06 2017-07-06 基于dpm算法的目标检测方法 Active CN107480585B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710544443.0A CN107480585B (zh) 2017-07-06 2017-07-06 基于dpm算法的目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710544443.0A CN107480585B (zh) 2017-07-06 2017-07-06 基于dpm算法的目标检测方法

Publications (2)

Publication Number Publication Date
CN107480585A CN107480585A (zh) 2017-12-15
CN107480585B true CN107480585B (zh) 2020-10-30

Family

ID=60596389

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710544443.0A Active CN107480585B (zh) 2017-07-06 2017-07-06 基于dpm算法的目标检测方法

Country Status (1)

Country Link
CN (1) CN107480585B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108010063A (zh) * 2017-12-27 2018-05-08 天津天地伟业投资管理有限公司 一种基于视频的运动目标进入或离开区域的检测方法
CN108229380B (zh) * 2017-12-29 2022-02-15 深圳市神州云海智能科技有限公司 一种目标图像的检测方法、装置及存储介质、机器人
CN108154130B (zh) * 2017-12-29 2022-04-15 深圳市神州云海智能科技有限公司 一种目标图像的检测方法、装置及存储介质、机器人
CN108416254A (zh) * 2018-01-17 2018-08-17 上海鹰觉科技有限公司 一种用于人流行为识别和人数统计的统计系统以及方法
CN110443097A (zh) * 2018-05-03 2019-11-12 北京中科晶上超媒体信息技术有限公司 一种视频目标实时提取优化方法及系统
CN109241819A (zh) * 2018-07-07 2019-01-18 西安电子科技大学 基于快速多尺度及联合模板匹配的多目标行人检测方法
CN109035292B (zh) * 2018-08-31 2021-01-01 北京智芯原动科技有限公司 基于深度学习的运动目标检测方法及装置
CN110740231A (zh) * 2019-09-27 2020-01-31 浙江省北大信息技术高等研究院 视频数据标注方法、装置、电子设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120076361A1 (en) * 2009-06-03 2012-03-29 Hironobu Fujiyoshi Object detection device
CN106407943A (zh) * 2016-09-28 2017-02-15 天津工业大学 金字塔层定位的快速dpm行人检测

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120076361A1 (en) * 2009-06-03 2012-03-29 Hironobu Fujiyoshi Object detection device
CN106407943A (zh) * 2016-09-28 2017-02-15 天津工业大学 金字塔层定位的快速dpm行人检测

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于稀疏多尺度分割和级联形变模型的行人检测算法;吕瑞等;《武汉大学学报》;20161130;第41卷(第11期);第1544-1549页 *
车辆检测中可变形部件模型的改进与应用;康珮珮等;《计算机工程与应用》;20161231;第20卷(第52期);全文 *

Also Published As

Publication number Publication date
CN107480585A (zh) 2017-12-15

Similar Documents

Publication Publication Date Title
CN107480585B (zh) 基于dpm算法的目标检测方法
CN108960245B (zh) 轮胎模具字符的检测与识别方法、装置、设备及存储介质
CN108918536B (zh) 轮胎模具表面字符缺陷检测方法、装置、设备及存储介质
CN109101924B (zh) 一种基于机器学习的路面交通标志识别方法
CN109934847B (zh) 弱纹理三维物体姿态估计的方法和装置
CN109118473B (zh) 基于神经网络的角点检测方法、存储介质与图像处理系统
CN108346159A (zh) 一种基于跟踪-学习-检测的视觉目标跟踪方法
CN111582126B (zh) 基于多尺度行人轮廓分割融合的行人重识别方法
CN110751154B (zh) 一种基于像素级分割的复杂环境多形状文本检测方法
CN109886086B (zh) 基于hog特征和线性svm级联分类器的行人检测方法
CN114049499A (zh) 用于连续轮廓的目标对象检测方法、设备及存储介质
CN112307919A (zh) 一种基于改进YOLOv3的单证图像中数字信息区域识别方法
CN116030396A (zh) 一种用于视频结构化提取的精确分割方法
Lee et al. Real-time automatic vehicle management system using vehicle tracking and car plate number identification
CN114882204A (zh) 船名自动识别方法
CN111274964A (zh) 一种基于无人机视觉显著性分析水面污染物的检测方法
Ning et al. Rethinking the backbone architecture for tiny object detection
CN107679467B (zh) 一种基于hsv和sdalf的行人重识别算法实现方法
CN113159146A (zh) 样本生成、目标检测模型训练、目标检测方法及装置
CN108985294B (zh) 一种轮胎模具图片的定位方法、装置、设备及存储介质
CN115937492B (zh) 一种基于特征识别的变电设备红外图像识别方法
Işikdoğan et al. Automatic recognition of Turkish fingerspelling
CN115953744A (zh) 一种基于深度学习的车辆识别追踪方法
CN116030472A (zh) 文字坐标确定方法及装置
CN113658223B (zh) 一种基于深度学习的多行人检测与跟踪方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant