CN108229380B - 一种目标图像的检测方法、装置及存储介质、机器人 - Google Patents

一种目标图像的检测方法、装置及存储介质、机器人 Download PDF

Info

Publication number
CN108229380B
CN108229380B CN201711480428.0A CN201711480428A CN108229380B CN 108229380 B CN108229380 B CN 108229380B CN 201711480428 A CN201711480428 A CN 201711480428A CN 108229380 B CN108229380 B CN 108229380B
Authority
CN
China
Prior art keywords
image
filter
target image
feature map
hog feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711480428.0A
Other languages
English (en)
Other versions
CN108229380A (zh
Inventor
徐栋
辛冠希
王可可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Smart Dynamics Co ltd
Original Assignee
Smart Dynamics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Smart Dynamics Co ltd filed Critical Smart Dynamics Co ltd
Priority to CN201711480428.0A priority Critical patent/CN108229380B/zh
Publication of CN108229380A publication Critical patent/CN108229380A/zh
Application granted granted Critical
Publication of CN108229380B publication Critical patent/CN108229380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种目标图像的检测方法、装置及存储介质、机器人,通过BING算法快速选择出可能含有目标的候选区域,替代了DPM算法中暴力搜索的滑窗方法,然后将得到的候选区域交给DPM做进一步筛选。其次,将DPM算法中最耗时的HOG特征金字塔计算去掉,从根源上解决计算HOG特征金字塔耗时的问题,DPM算法的运行速度随之大幅度提升。

Description

一种目标图像的检测方法、装置及存储介质、机器人
技术领域
本发明涉及图像处理技术领域,尤其涉及一种目标图像的检测方法、装置及存储介质、机器人。
背景技术
现有的可变型部件模型(DPM)算法在行人检测中表现出很好的鲁棒性,但在实际应用中,DPM算法的运行速度还远远不够,尤其是在嵌入式设备中。主要原因是因为DPM算法使用的HOG特征是高维特征,并且计算了HOG特征金字塔(多层HOG特征)来处理不同尺寸的行人,这是DPM运行速度的瓶颈所在。
而BING算法的优点是较高的召回率,运行速度非常快,具有可扩展性,不足之处是BING算法在高召回率的同时,也会产生较多的误检区域,不适合单独使用做目标检测。
发明内容
本发明实施例提供一种目标图像的检测方法、装置及存储介质、机器人。
第一方面,本发明实施例提供了一种目标图像的检测方法,包括步骤:
从待检测的视频中依次读取一帧图像;
利用基于BING的objectness算法,生成可能含有目标图像的候选框;
计算所述图像的HOG特征图;
将预设DPM模型中的根滤波器尺寸大小缩放至与所述候选框中的所述HOG特征图的尺寸大小匹配;
利用动态规划算法,计算根滤波器和部件滤波器得分;
根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像。
第二方面,本发明实施例还提供了一种目标图像的检测装置,所述装置包括:
图像读取模块,用于从待检测的视频中依次读取一帧图像;
候选框生成模块,用于利用基于BING的objectness算法,生成可能含有目标图像的候选框;
特征图计算模块,用于计算所述图像的HOG特征图;
缩放模块,用于将预设DPM模型中的根滤波器尺寸大小缩放至与所述候选框中的所述HOG特征图的尺寸大小匹配;
得分计算模块,用于利用动态规划算法,计算根滤波器和部件滤波器得分;
判定模块,用于根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像。
第三方面,本发明实施例还提供了一种存储介质,其存储有计算机程序,其中,所述计算机程序使得计算机执行如上面所述的目标图像的检测方法。
第四方面,本发明实施例还提供了一种机器人,包括存储器和处理器,所述处理器和所述存储器通过总线连接;所述存储器用于存储一组程序代码,所述处理器用于调用所述存储器中存储的程序代码,执行如上面所述的目标图像的检测方法。
本发明实施例提供的目标图像的检测方法、装置及存储介质、机器人,通过使用object proposal的BING方法,快速生成可能含有目标的候选框,然后将这些候选框交给DPM算法来处理,替代了DPM中基于暴力搜索的滑窗方法,使候选框的数量大幅度下降,运行速度也随之提升。例如1080P大小的图像,若使用滑窗方法,滤波器大小为100*300,步长为1,候选框数量级为106,而BING算法筛选出的候选框数量一般控制在103左右。
另外,本发明将DPM算法中最耗时的HOG特征金字塔计算去掉,只求原图的HOG特征图,其中包含原图分辨率的HOG特征图,以及两倍分辨率大小的HOG特征图,分别用于与根滤波器和部件滤波器匹配响应。计算量大幅度下降,从根源上解决计算HOG特征金字塔耗时的问题,DPM算法的运行速度也随之大幅度提升。
综上所述,首先,本发明通过BING算法快速选择出可能含有目标的候选区域,替代了DPM算法中暴力搜索的滑窗方法,然后将得到的候选区域交给DPM做进一步筛选。其次,将DPM算法中最耗时的HOG特征金字塔计算去掉,从根源上解决计算HOG特征金字塔耗时的问题,DPM算法的运行速度随之大幅度提升。
附图说明
图1是本发明实施例提供的目标图像的检测方法的实现流程示意图。
图2是本发明实施例提供的目标图像的检测装置的详细模块示意图。
图3是本发明实施例提供的机器人的模块示意图。
具体实施方式
请参照附图中的图式,其中相同的组件符号代表相同的组件,本发明的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所示例的本发明的具体实施例,其不应被视为限制本发明未在此详述的其它具体实施例。
本发明原理以上述文字来说明,其并不代表为一种限制,本领域技术人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。本发明的原理使用许多其它泛用性或特定目的运算、通信环境或组态来进行操作。
行人检测(Pedestrian Detection)是利用计算机视觉技术判断图像或者视频序列中是否存在行人并给予精确定位。该技术可与行人重识别和行人跟踪等技术结合,应用于智能机器人、人工智能系统、车辆辅助驾驶系统、智能视频监控、人体行为分析、智能交通等领域。由于行人兼具刚性和柔性物体的特性,外观易受穿着、尺度、遮挡、姿态和视角等影响,使得行人检测成为计算机视觉领域中一个既具有研究价值同时又极具挑战性的热门课题。
传统基于统计学习的行人检测算法主要包含两方面的研究,一类是基于全局特征的行人检测算法,将人作为一个整体来提取特征,然后用分类器进行训练,进而检测行人。另一类算法在行人检测中引入部件和姿态的概念,提取每个部件的特征,然后训练行人检测分类器。相比第一类算法,后者在处理行人检测中遮挡、姿态和视角变化等问题有更好的鲁棒性。DPM(Deformable Part Model)算法是该类算法的代表,是一个非常成功的目标检测算法。该方法依据检测窗口的得分判断是否含有待检测的目标,而检测窗口的得分是根滤波器的分数加上各个部件滤波器的分数的总和。
此外,目标建议(object proposal)的方法现在比较流行,该类方法可以生成可能含有目标的候选框,代表性算法有BING、EdgeBoxes、Selective Search等。其中,BING算法的优点是较高的召回率,运行速度非常快,具有可扩展性。
因此,本发明基于BING与DPM融合的方式来快速检测行人。
以下将进行详细说明本发明实施例提供的目标图像的检测方法。
请参阅图1,所示为本发明实施例提供的目标图像的检测方法,主要包括如下步骤:
在步骤S101中,从待检测的视频中依次读取一帧图像;
在本发明实施例中,在所述从待检测的视频中依次读取一帧图像的步骤之前,还包括:
载入DPM模型,其中,所述DPM模型包括根滤波器和部件滤波器;
载入待检测的视频。
在一些实施例中,DPM模型的建立,具体包括以下步骤:
1.准备正负训练样本;
2.初始化训练模型参数,设置训练模型尺寸(如5*15);
3.提取正负样本hog特征;
4.利用Latent SVM对提取的特征进行训练,得到目标检测的根滤波器和部件滤波器以及相应的参数;
5.重复1-4,训练不同尺度的模型(如10*30),直到训练至少两种不同尺度的模型。
在步骤S102中,利用基于BING的objectness算法,生成可能含有目标图像的候选框;
在一些实施例中,所述利用基于BING的objectness算法,生成可能含有目标图像的候选框的步骤,具体包括:
1.对整张图像求梯度,然后由线性SVM训练得到一个BING特征;
2.计算每一个候选区域的得分:
Sl=<w,gl> (1)
L=(i,x,y) (2)
其中,sl代表过滤器得分,gl代表NG特征,l表示坐标,i表示尺度,(x,y)表示窗口位置。所以(1)表示:在训练好的模型w上面,特征gl的一个得分值。运用非极大值抑制(NMS),为每个尺度提供一些建议窗口。相对于其他窗口(例如:100*100),一些尺度(例如:10*500)的窗口包含对象的可能性是很小的。因此我们定义对象状态得分(校准过滤器得分):
ol=vi*sl+ti (3)
其中vi,ti∈R,是针对不同尺度i的窗口,学习到的一个参数。分数越高,越可能是目标,否则越可能是背景,并将计算转化为(或近似)通过位运算来实现。
在本发明实施例中,在所述生成可能含有目标图像的候选框的步骤之后,还包括:
记录候选框在所述图像中的位置。
然而,可以理解的是,本发明实施例使用object proposal的BING方法,快速生成可能含有目标的候选框,并记录候选框的位置。该方式替代了DPM中基于暴力搜索的滑窗方法,大幅度的提高了算法性能。
在步骤S103中,计算所述图像的HOG特征图;
在本发明实施例中,由于DPM算法中计算HOG特征金字塔会非常耗时,本发明中只计算原始图像的HOG特征图,所述HOG特征图包括:原图分辨率的HOG特征图,以及两倍分辨率大小的HOG特征图,其中,所述原图分辨率的HOG特征图用于与根滤波器匹配响应;所述两倍分辨率大小的HOG特征图用于与部件滤波器匹配响应。
然而,可以理解的是,计算所述图像的HOG特征图的步骤之后,还包括:
通过坐标点的映射关系,确定所述候选框在HOG特征图中的位置。
如,记录候选框在所述图像中的位置,从而来确定所述候选框在HOG特征图中的位置。
在步骤S104中,将预设DPM模型中的根滤波器尺寸大小缩放至与所述候选框中的所述HOG特征图的尺寸大小匹配;
在步骤S105中,利用动态规划算法,计算根滤波器和部件滤波器得分;
在本发明实施例中,利用动态规划算法,计算根滤波器和部件滤波器得分的步骤,包括:
计算候选框中的所述原图分辨率的HOG特征图与根滤波器匹配得分;
若根滤波器得分大于第一阈值,则计算两倍分辨率大小的HOG特征图与部件滤波器匹配对应的分数。
在一些实施例中,先求出根滤波器在HOG特征所有位置的响应图,然后与模型中阈值比较,若大于阈值,则继续求部件滤波器与相应特征的响应,若小于则舍弃掉。最终得到每个位置的最终得分,然后根据阈值判定是否为目标。具体公式如下所示:
Figure BDA0001533697110000061
如上述公式,score为综合得分,其中R(x0,y0)为根模型的得分,中间项为各部件模型的得分,b是为了部件模型之间对齐而设置的偏移量。
在步骤S106中,根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像。
在本发明实施例中,根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像的步骤,包括:
将根滤波器和部件滤波器的综合响应得分与预设阈值进行比较;
若根滤波器和部件滤波器的综合响应得分大于或等于预设阈值,则判定所述候选框对应的图像为目标图像;
若根滤波器和部件滤波器的综合响应得分小于预设阈值,则判定所述候选框对应的图像为非目标图像。
作为本发明另一实施例,在判定所述待检测的视频中包括所述目标图像的步骤之后,还包括:
通过非极大值抑制对所述综合响应得分进行计算,以定位到目标图像的区域位置。
由上可知,本发明实施例提供的目标图像的检测方法,通过使用object proposal的BING方法,快速生成可能含有目标的候选框,然后将这些候选框交给DPM算法来处理,替代了DPM中基于暴力搜索的滑窗方法,使候选框的数量大幅度下降,运行速度也随之提升。例如1080P大小的图像,若使用滑窗方法,滤波器大小为100*300,步长为1,候选框数量级为106,而BING算法筛选出的候选框数量一般控制在103左右。
另外,本发明将DPM算法中最耗时的HOG特征金字塔计算去掉,只求原图的HOG特征图,其中包含原图分辨率的HOG特征图,以及两倍分辨率大小的HOG特征图,分别用于与根滤波器和部件滤波器匹配响应。计算量大幅度下降,从根源上解决计算HOG特征金字塔耗时的问题,DPM算法的运行速度也随之大幅度提升。
综上所述,首先,本发明通过BING算法快速选择出可能含有目标的候选区域,替代了DPM算法中暴力搜索的滑窗方法,然后将得到的候选区域交给DPM做进一步筛选。其次,将DPM算法中最耗时的HOG特征金字塔计算去掉,从根源上解决计算HOG特征金字塔耗时的问题,DPM算法的运行速度随之大幅度提升。
请参阅图2,为本发明实施例提供的目标图像的检测装置的模块示意图;为了便于说明,仅示出了与本发明实施例相关的部分。所述目标图像的检测装置100包括:图像读取模块101、候选框生成模块102、特征图计算模块103、缩放模块104、得分计算模块105、判定模块106。所述目标图像的检测装置可以是内置于机器人中的软件单元、硬件单元或者是软硬件结合的单元。
图像读取模块101,用于从待检测的视频中依次读取一帧图像;
候选框生成模块102,用于利用基于BING的objectness算法,生成可能含有目标图像的候选框;
特征图计算模块103,用于计算所述图像的HOG特征图;
缩放模块104,用于将预设DPM模型中的根滤波器尺寸大小缩放至与所述候选框中的所述HOG特征图的尺寸大小匹配;
得分计算模块105,用于利用动态规划算法,计算根滤波器和部件滤波器得分;
判定模块106,用于根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像。
由上可知,本发明实施例提供的目标图像的检测装置,通过BING算法快速选择出可能含有目标的候选区域,替代了DPM算法中暴力搜索的滑窗方法,然后将得到的候选区域交给DPM做进一步筛选。其次,将DPM算法中最耗时的HOG特征金字塔计算去掉,从根源上解决计算HOG特征金字塔耗时的问题,DPM算法的运行速度随之大幅度提升。
本发明实施例提供的目标图像的检测方法及装置属于同一构思,其具体实现过程详见说明书全文,此处不再赘述。
图3示出了本发明实施例提供的机器人的具体结构框图,该机器人1200可以用于实施上述实施例中提供的目标图像的检测方法/装置。
如图3所示,机器人可以包括有一个或一个以上(图中仅示出一个)计算机可读存储介质的存储器801、音频电路802、传输模块803、包括有一个或者一个以上(图中仅示出一个)处理核心的处理器804以及电源805等部件。本领域技术人员可以理解,图3中示出的机器人结构并不构成对机器人的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
存储器801可用于存储软件程序以及模块,如上述实施例中目标图像的检测方法/装置对应的程序指令/模块,处理器804通过运行存储在存储器801内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现目标图像的检测的功能。存储器801可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器801可进一步包括相对于处理器804远程设置的存储器,这些远程存储器可以通过网络连接至机器人。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
机器人通过传输模块803(例如Wi-Fi模块)访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图3示出了传输模块803,但是可以理解的是,其并不属于机器人的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器804是机器人的控制中心,利用各种接口和线路连接整个机器人的各个部分,通过运行或执行存储在存储器801内的软件程序和/或模块,以及调用存储在存储器801内的数据,执行机器人的各种功能和处理数据。可选的,处理器804可包括一个或多个处理核心;优选的,处理器804可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器804中。
机器人还包括给各个部件供电的电源805(比如电池),优选的,电源可以通过电源管理系统与处理器804逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源805还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,机器人还可以蓝牙模块等。在此不再赘述。另外,机器人还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行以下操作的指令:
从待检测的视频中依次读取一帧图像;
利用基于BING的objectness算法,生成可能含有目标图像的候选框;
计算所述图像的HOG特征图;
将预设DPM模型中的根滤波器尺寸大小缩放至与所述候选框中的所述HOG特征图的尺寸大小匹配;
利用动态规划算法,计算根滤波器和部件滤波器得分;
根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像。
在所述从待检测的视频中依次读取一帧图像的步骤之前,还包括:
载入DPM模型,其中,所述DPM模型包括根滤波器和部件滤波器;
载入待检测的视频。
在所述生成可能含有目标图像的候选框的步骤之后,还包括:
记录候选框在所述图像中的位置;
计算所述图像的HOG特征图的步骤之后,还包括:
通过坐标点的映射关系,确定所述候选框在HOG特征图中的位置。
所述HOG特征图包括:原图分辨率的HOG特征图,以及两倍分辨率大小的HOG特征图,其中,所述原图分辨率的HOG特征图用于与根滤波器匹配响应;所述两倍分辨率大小的HOG特征图用于与部件滤波器匹配响应。
利用动态规划算法,计算根滤波器和部件滤波器得分的步骤,包括:
计算候选框中的所述原图分辨率的HOG特征图与根滤波器匹配得分;
若根滤波器得分大于第一阈值,则计算两倍分辨率大小的HOG特征图与部件滤波器匹配对应的分数。
根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像的步骤,包括:
将根滤波器和部件滤波器的综合响应得分与预设阈值进行比较;
若根滤波器和部件滤波器的综合响应得分大于或等于预设阈值,则判定所述候选框对应的图像为目标图像;
若根滤波器和部件滤波器的综合响应得分小于预设阈值,则判定所述候选框对应的图像为非目标图像。
在判定所述待检测的视频中包括所述目标图像的步骤之后,还包括:
通过非极大值抑制对所述综合响应得分进行计算,以定位到目标图像的区域位置。
本发明实施例还提供了一种存储介质,其存储有计算机程序,其中,所述计算机程序使得计算机执行如上面所述的目标图像的检测方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,RandomAccess Memory)、磁盘或光盘等。
综上所述,虽然本发明已以优选实施例揭露如上,但上述优选实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。

Claims (9)

1.一种目标图像的检测方法,其特征在于,包括步骤:
从待检测的视频中依次读取一帧图像;
利用基于BING的objectness算法,生成可能含有目标图像的候选框;
计算所述图像的HOG特征图,所述HOG特征图包括:原图分辨率的HOG特征图以及两倍分辨率大小的HOG特征图,其中,所述原图分辨率的HOG特征图用于与根滤波器匹配响应;所述两倍分辨率大小的HOG特征图用于与部件滤波器匹配响应;
将预设DPM模型中的根滤波器尺寸大小缩放至与所述候选框中的所述HOG特征图的尺寸大小匹配;
利用动态规划算法,计算根滤波器和部件滤波器得分;
根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像。
2.如权利要求1所述的目标图像的检测方法,其特征在于,在所述从待检测的视频中依次读取一帧图像的步骤之前,还包括:
载入DPM模型,其中,所述DPM模型包括根滤波器和部件滤波器;
载入待检测的视频。
3.如权利要求1所述的目标图像的检测方法,其特征在于,在所述生成可能含有目标图像的候选框的步骤之后,还包括:
记录候选框在所述图像中的位置;
计算所述图像的HOG特征图的步骤之后,还包括:
通过坐标点的映射关系,确定所述候选框在HOG特征图中的位置。
4.如权利要求1所述的目标图像的检测方法,其特征在于,利用动态规划算法,计算根滤波器和部件滤波器得分的步骤,包括:
计算候选框中的所述原图分辨率的HOG特征图与根滤波器匹配得分;
若根滤波器得分大于第一阈值,则计算两倍分辨率大小的HOG特征图与部件滤波器匹配对应的分数。
5.如权利要求1所述的目标图像的检测方法,其特征在于,根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像的步骤,包括:
将根滤波器和部件滤波器的综合响应得分与预设阈值进行比较;
若根滤波器和部件滤波器的综合响应得分大于或等于预设阈值,则判定所述候选框对应的图像为目标图像;
若根滤波器和部件滤波器的综合响应得分小于预设阈值,则判定所述候选框对应的图像为非目标图像。
6.如权利要求3所述的目标图像的检测方法,其特征在于,在判定所述待检测的视频中包括所述目标图像的步骤之后,还包括:
通过非极大值抑制对所述综合响应得分进行计算,以定位到目标图像的区域位置。
7.一种目标图像的检测装置,其特征在于,所述装置包括:
图像读取模块,用于从待检测的视频中依次读取一帧图像;
候选框生成模块,用于利用基于BING的objectness算法,生成可能含有目标图像的候选框;
特征图计算模块,用于计算所述图像的HOG特征图,所述HOG特征图包括:原图分辨率的HOG特征图以及两倍分辨率大小的HOG特征图,其中,所述原图分辨率的HOG特征图用于与根滤波器匹配响应;所述两倍分辨率大小的HOG特征图用于与部件滤波器匹配响应;
缩放模块,用于将预设DPM模型中的根滤波器尺寸大小缩放至与所述候选框中的所述HOG特征图的尺寸大小匹配;
得分计算模块,用于利用动态规划算法,计算根滤波器和部件滤波器得分;
判定模块,用于根据根滤波器和部件滤波器的综合响应得分,判定所述候选框对应的图像是否为目标图像。
8.一种存储介质,其存储有计算机程序,其中,所述计算机程序使得计算机执行如权利要求1至6任一项所述的目标图像的检测方法。
9.一种机器人,其特征在于,包括存储器和处理器,所述处理器和所述存储器通过总线连接;所述存储器用于存储一组程序代码,所述处理器用于调用所述存储器中存储的程序代码,执行如权利要求1至6任一项所述的目标图像的检测方法。
CN201711480428.0A 2017-12-29 2017-12-29 一种目标图像的检测方法、装置及存储介质、机器人 Active CN108229380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711480428.0A CN108229380B (zh) 2017-12-29 2017-12-29 一种目标图像的检测方法、装置及存储介质、机器人

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711480428.0A CN108229380B (zh) 2017-12-29 2017-12-29 一种目标图像的检测方法、装置及存储介质、机器人

Publications (2)

Publication Number Publication Date
CN108229380A CN108229380A (zh) 2018-06-29
CN108229380B true CN108229380B (zh) 2022-02-15

Family

ID=62647160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711480428.0A Active CN108229380B (zh) 2017-12-29 2017-12-29 一种目标图像的检测方法、装置及存储介质、机器人

Country Status (1)

Country Link
CN (1) CN108229380B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886997B (zh) * 2019-01-23 2023-07-11 平安科技(深圳)有限公司 基于目标检测的识别框确定方法、装置及终端设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200236A (zh) * 2014-08-22 2014-12-10 浙江生辉照明有限公司 基于dpm的快速目标检测方法
CN106407943A (zh) * 2016-09-28 2017-02-15 天津工业大学 金字塔层定位的快速dpm行人检测
KR20170137273A (ko) * 2016-06-02 2017-12-13 중앙대학교 산학협력단 변형 가능한 파트 모델을 사용한 보행자 검출 장치 및 방법
CN107480585A (zh) * 2017-07-06 2017-12-15 西安电子科技大学 基于dpm算法的目标检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200236A (zh) * 2014-08-22 2014-12-10 浙江生辉照明有限公司 基于dpm的快速目标检测方法
KR20170137273A (ko) * 2016-06-02 2017-12-13 중앙대학교 산학협력단 변형 가능한 파트 모델을 사용한 보행자 검출 장치 및 방법
CN106407943A (zh) * 2016-09-28 2017-02-15 天津工业大学 金字塔层定位的快速dpm行人检测
CN107480585A (zh) * 2017-07-06 2017-12-15 西安电子科技大学 基于dpm算法的目标检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Fast Human Detection Using Deformable Part Model at the Selected Candidate Detection Positions;Xiaotian Wu et al;《RSKT 2015: Rough Sets and Knowledge Technology》;20151122;正文第3节 *
刘洋.基于金字塔层定位的DPM快速行人检测方法研究.《中国优秀硕士学位论文全文数据库信息科技辑》.2017, *
基于金字塔层定位的DPM快速行人检测方法研究;刘洋;《中国优秀硕士学位论文全文数据库信息科技辑》;20170815;正文第2.3节、第3.2节、第4.1节、第4.1节-第4.5节 *

Also Published As

Publication number Publication date
CN108229380A (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
JP6877630B2 (ja) アクションを検出する方法及びシステム
CN109697434B (zh) 一种行为识别方法、装置和存储介质
US11741701B2 (en) Autonomous task performance based on visual embeddings
CN100472556C (zh) 特定被摄体检测装置及方法
CN108491827B (zh) 一种车辆检测方法、装置及存储介质
CN110555481A (zh) 一种人像风格识别方法、装置和计算机可读存储介质
US11508157B2 (en) Device and method of objective identification and driving assistance device
CN107045631A (zh) 人脸特征点检测方法、装置及设备
US11574500B2 (en) Real-time facial landmark detection
CN110264495A (zh) 一种目标跟踪方法及装置
CN111079833A (zh) 图像识别方法、装置以及计算机可读存储介质
CN115342796A (zh) 基于视觉激光融合的地图构建方法、系统、装置及介质
CN111898566B (zh) 姿态估计方法、装置、电子设备和存储介质
CN108154130B (zh) 一种目标图像的检测方法、装置及存储介质、机器人
WO2022132407A1 (en) Event camera based navigation control
Khellal et al. Pedestrian classification and detection in far infrared images
CN108229380B (zh) 一种目标图像的检测方法、装置及存储介质、机器人
CN112199994B (zh) 一种实时检测rgb视频中的3d手与未知物体交互的方法和装置
US20210192345A1 (en) Method for generating labeled data, in particular for training a neural network, by using unlabeled partitioned samples
JP7487224B2 (ja) 手動作の対称性の認識方法及びシステム
CN115298705A (zh) 车牌识别方法、装置、电子设备及存储介质
CN115984723A (zh) 道路破损检测方法、系统、装置、存储介质及计算机设备
Baptista et al. Anticipating suspicious actions using a small dataset of action templates
Okuno et al. Body posture and face orientation estimation by convolutional network with heterogeneous learning
CN113807150A (zh) 数据处理、姿态预测方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant