CN105303163A - 一种目标检测的方法及检测装置 - Google Patents
一种目标检测的方法及检测装置 Download PDFInfo
- Publication number
- CN105303163A CN105303163A CN201510606852.XA CN201510606852A CN105303163A CN 105303163 A CN105303163 A CN 105303163A CN 201510606852 A CN201510606852 A CN 201510606852A CN 105303163 A CN105303163 A CN 105303163A
- Authority
- CN
- China
- Prior art keywords
- sorter
- image
- detected
- feature
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/53—Recognition of crowd images, e.g. recognition of crowd congestion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/44—Event detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种目标检测的方法,所述方法包括:获取包含目标的待检测图像;采用三级级联分类器对所述待检测图像进行三级分类;将三级分类后确定出的目标区域作为所述待检测图像的目标区域。本发明实施例还提供了一种目标检测的检测装置。通过本发明实施例可采用三级级联分类器对待检测图像进行目标区域定位,可快速又高精度地检测出目标区域。
Description
技术领域
本发明实施例涉及智能监控技术领域,具体涉及一种目标检测的方法及检测装置。
背景技术
随着城市化水平进一步提高,智慧城市已经成为现代化发展的重要方向。视频监控系统作为智慧城市的重要组成部分,也正朝着智能化和网络化方向发展。在智能视频监控中,对于目标(如车辆、行人等)进行快速的实时检测和定位,是智能监控的基础和前提。因此,如何快速地检测和定位目标,已成为国内外相关领域的研究热点。
现有技术中,目标检测的主要手段为:首先提取目标特征,然后,利用检测器对目标进行检测。在目标检测过程中,常用方案是生成金字塔图像,然后遍历整个金字塔图像,虽然可以精确的检测和定位目标,但是会生成大量的边框,需要对每个边框进行判断,降低了检测效率,从而,增加了检测时间,降低了用户体验。
发明内容
本发明实施例提供了一种目标检测的方法及检测装置,以期在确保检测精度的同时提高检测效率,并提高用户体验。
本发明实施例第一方面提供了一种目标检测的方法,包括:
获取包含目标的待检测图像;
采用三级级联分类器对所述待检测图像进行三级分类;
将三级分类后确定出的目标区域作为所述待检测图像的目标区域。
结合本实施例的第一方面,在第一方面的第一种可能的实施方式中,所述三级级联分类器包括第一级分类器、第二级分类器和第三级分类器,
所述采用三级级联分类器对所述待检测图像进行三级分类,包括:
采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域;
采用所述第二级分类器将所述候选区域按照预设方式进行部件处理以得到第一目标区域;
采用所述第三级分类器对所述第一目标区域进行分类以得到第二目标区域。
结合本实施例第一方面或第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,所述采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域,包括:
利用所述第一级分类器将所述待检测图像分成多层金字塔图像;
对所述多层金字塔图像中的每一层金字塔图像按照预设步长进行遍历,得到N个边框图像,其中,所述N为大于1的整数;
提取所述N个边框图像的灰度级特征;
采用预先训练好的随机森林对所述灰度级特征进行检测,得到M个边框图像,所述M为大于1且小于所述N的整数;
将所述M个边框图像进行聚类处理以生成候选区域。
结合本实施例第一方面或第一方面的第一种可能的实施方式,在第一方面的第三种可能的实施方式中,所述采用所述第二级分类器将所述候选区域按照预设方式进行部件处理以得到第一目标区域,包括:
将所述候选区域按照预设样本集中的分块方式分成K个分块,其中,K为大于1的整数;
采用所述第二级分类器分别对所述K个分块进行检测,得到与所述K个分块对应的K个阈值集;
分别将所述K个阈值集进行求和,得到K个目标值;
将所述K个目标值中大于预设阈值的目标值对应的候选区域组成第一目标区域。
结合本实施例第一方面或第一方面的第一种可能的实施方式,在第一方面的第四种可能的实施方式中,所述采用所述第三级分类器对所述第一目标区域进行分类以得到第二目标区域,包括:
提取所述样本集中的预设特征,所述预设特征为SIFT特征和/或HOG特征;
在所述第三级分类器中使用所述预设特征对所述第一目标区域进行检测,以得到第二目标区域。
结合本实施例第一方面或第一方面的第一种可能的实施方式,在第一方面的第五种可能的实施方式中,所述采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域之前,所述方法还包括:
构造第一级分类器,其中,所述第一级分类器的构造方法如下:
提取样本集中的灰度特征,所述灰度特征为灰度差分特征、类Harr特征和梯度幅值特征中的至少一个;
将所述灰度特征组成特征池;
随机选取所述特征池中的灰度特征作为训练对象;
对所述训练对象进行训练,以得到J棵训练树,其中,所述J为大于1的整数;
采用随机森林遍历所述J棵训练树以得到所述J棵训练树中的叶节点的得分值;
将所述得分值组成特征向量;
根据所述特征向量训练出目标检测模型,所述目标检测模型即为第一级分类器。
相应得,本发明实施例第二方面提供了一种目标检测的检测装置,包括:
获取单元,用于获取包含目标的待检测图像;
分类单元,用于采用三级级联分类器对所述获取单元获取到的待检测图像进行三级分类;
确定单元,用于将所述分类单元三级分类后确定出的目标区域作为所述待检测图像的目标区域。
结合本实施例的第二方面,在第二方面的第一种可能的实施方式中,所述三级级联分类器包括第一级分类器、第二级分类器和第三级分类器,
所述分类单元,包括:
第一分类单元,用于采用所述第一级分类器对所述获取单元获取到的待检测图像进行检测以得到所述待检测图像的候选区域;
第二分类单元,用于采用所述第二级分类器将所述第一分类单元分类得到的候选区域按照预设方式进行部件处理以得到第一目标区域;
第三分类单元,用于采用所述第三级分类器对所述第二分类单元分类得到的第一目标区域进行分类以得到第二目标区域。
结合本实施例第二方面或第二方面的第一种可能的实施方式,在第二方面的第二种可能的实施方式中,所述第一分类单元包括:
分层单元,用于利用所述第一级分类器将所述获取单元获取到的待检测图像分成多层金字塔图像;
遍历单元,用于对所述分层单元分层得到的多层金字塔图像中的每一层金字塔图像按照预设步长进行遍历,得到N个边框图像,其中,所述N为大于1的整数;
第一提取单元,用于提取所述遍历单元得到的N个边框图像的灰度级特征;
第一检测单元,用于采用预先训练好的随机森林对所述第一提取单元提取的灰度级特征进行检测,得到M个边框图像,所述M为大于1且小于所述N的整数;
聚类单元,用于将所述第一检测单元得到的M个边框图像进行聚类处理以生成候选区域。
结合本实施例第二方面或第二方面的第一种可能的实施方式,在第二方面的第三种可能的实施方式中,所述第二分类单元包括:
分块单元,用于将所述第一分类单元得到的候选区域按照预设样本集中的分块方式分成K个分块,其中,K为大于1的整数;
第二检测单元,用于采用所述第二级分类器分别对所述分块单元分块得到的K个分块进行检测,得到与所述K个分块对应的K个阈值集;
计算单元,用于分别将所述第二检测单元得到的K个阈值集进行求和,得到K个目标值;
组成单元,用于将所述计算单元计算出的K个目标值中大于预设阈值的目标值对应的候选区域组成第一目标区域。
结合本实施例第二方面或第二方面的第一种可能的实施方式,在第二方面的第四种可能的实施方式中,所述第三分类单元包括:
第二提取单元,用于提取所述样本集中的预设特征,所述预设特征为SIFT特征和/或HOG特征;
第三检测单元,用于在所述第三级分类器中使用所述第二提取单元提取的预设特征对所述第一目标区域进行检测,以得到第二目标区域。
结合本实施例第二方面或第二方面的第一种可能的实施方式,在第二方面的第五种可能的实施方式中,所述检测装置还包括:
构造单元,用于构造第一级分类器,其中,所述第一级分类器的构造方法如下:
提取样本集中的灰度特征,所述灰度特征为灰度差分特征、类Harr特征和梯度幅值特征中的至少一个;
将所述灰度特征组成特征池;
随机选取所述特征池中的灰度特征作为训练对象;
对所述训练对象进行训练,以得到J棵训练树,其中,所述J为大于1的整数;
采用随机森林遍历所述J棵训练树以得到所述J棵训练树中的叶节点的得分值;
将所述得分值组成特征向量;
根据所述特征向量训练出目标检测模型,所述目标检测模型即为第一级分类器。
通过本发明实施例可获取包含目标的待检测图像;采用三级级联分类器对所述待检测图像进行三级分类;将三级分类后确定出的目标区域作为所述待检测图像的目标区域,由此,采用三级级联分类器对待检测图像进行目标区域定位,可快速又高精度地检测出目标区域,因而,可提高用户体验。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种目标检测的方法的第一实施例流程示意图;
图2是本发明实施例提供的一种目标检测的方法的第二实施例流程示意图;
图3是本发明实施例提供的一种目标检测的检测装置的第一实施例结构示意图;
图4是本发明实施例提供的一种目标检测的检测装置的第二实施例结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例所描述的目标检测的检测装置可以包括视频矩阵、监控设备、带有检测功能的设备等等,上述检测装置仅是举例,而非穷举,包含但不限于上述终端。
请参阅图1,为本发明实施例提供的一种目标检测的方法的第一实施例流程示意图。本实施例中所描述的目标检测的方法,包括以下步骤:
S101、获取包含目标的待检测图像。
具体实现中,待检测图像包含目标的一张单独图像,或者,待检测图像可为视频中包含目标的一帧或者多帧图像,目标可为人或物。可选地,目标还可为其他物体,如:摄像头、小狗、手机等等。
S102、采用三级级联分类器对所述待检测图像进行三级分类。
具体实现中,三级级联分类器由三个不同的分类器组成。三级级联分类器由第一级分类器、第二级分类器和第三级分类器以级联方式组成的一个分类器。
可选地,第一级分类器的构造方法如下:提取样本集中的灰度特征,灰度特征可包括但不仅限于:灰度差分特征、类Harr特征和梯度幅值特征;将该灰度特征组成特征池;随机选取特征池中的灰度特征作为训练对象;对该训练对象进行训练,以得到J棵训练树,其中,所述J为大于1的整数;采用随机森林遍历该J棵训练树以得到该J棵训练树中的叶节点的得分值;将该得分值组成特征向量;根据该特征向量训练出目标检测模型,目标检测模型即为第一级分类器。具体地,第一级分类器的构造方式可如:提取样本集合选择简单的灰度特征,如灰度差分特征,类Harr特征,梯度幅值特征等,产生大量的特征,形成特征池,需要说明的是,由于灰度特征的提取方式可为将样本集中的图像转化为灰度图像,再提取灰度图像中的灰度特征,由于提取灰度特征过程中时间复杂度相对较低,因而,适合快速计算。对特征池里的灰度特征进行随机选择,并对选择的灰度特征进行训练以生成n棵随机树,将每一棵随机树深度记为d,每棵随机树中叶节点的得分值记为s,随机树阈值为t,同时,记录随机选择的特征;然后再用随机森林去检测样本集合,到达每棵随机数的叶节点时,获取该叶节点对应的得分值,将这些得分值组合成特征向量,这些特征向量就是自我学习得到的特征,根据学习到这些特征向量,再选用adaboost(SVM)训练出目标检测模型,该目标检测模型即为第一级分类器,可将第一级分类器理解为主要包含随机森林+adaboost(SVM)。可选地,第一级分类器不仅仅可为随机森林+adaboost(SVM),还可只为随机森林,或者,还可只为adaboost(SVM),还可以为贝叶斯分类器,第一级分类器不仅限于此。
可选地,第一级分类器中的随机森林和adaboost(SVM)可以迭代级联,在迭代次数不是太高的情况下,可实现快速检测。
可选地,第二级分类器、第三级分类器的构造方法可参照上述的第一级分类器。
S103、将三级分类后确定出的目标区域作为所述待检测图像的目标区域。
具体实现中,三级级联分类器确定出的目标区域即为待检测图像的目标区域。
通过本发明实施例获取包含目标的待检测图像;采用三级级联分类器对所述待检测图像进行三级分类;将三级分类后确定出的目标区域作为所述待检测图像的目标区域,由此,采用三级级联分类器对待检测图像进行目标区域定位,可快速又高精度地检测出目标区域。
请参阅图2,为本发明实施例提供的一种目标检测的方法的第二实施例流程示意图。本实施例中所描述的目标检测的方法,包括以下步骤:
S201、获取包含目标的待检测图像。
S202、采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域。
具体实现中,检测装置可对待检测图像进行粗检测,即利用第一级分类器对待检测图像进行检测,以提取候选区域。
可选地,利用第一级分类器对待检测图像进行检测的主要过程如下:利用第一级分类器将待检测图像分成多层金字塔图像;对多层金字塔图像中的每一层金字塔图像按照预设步长进行遍历,得到N个边框图像,其中,N为大于1的整数;提取N个边框图像的灰度级特征;采用预先训练好的随机森林对灰度级特征进行检测,得到M个边框图像,M为大于1且小于N的整数;将M个边框图像进行聚类处理以生成候选区域。具体地,第一级分类器检测对待检测图像进行检测时,首先生成多层金字塔图像,然后对每一层金字塔图像,按照预设步长进行遍历,产生大量的边框图像,其中预设步长可包括但不仅限于:2个像素点、4个像素点、8个像素点等等;对这些边框图像提取灰度特征,对该灰度特征采用训练好的随机森林进行检测,筛选出包含目标图像的目标边框图像。最后,对筛选出的目标边框图像采用随机森林产生自我学习特征,用训练好的adaboost(SVM)对该目标边框图像进行检测以进一步优化目标边框图像将优化后的目标边框图像进行组合聚类,生成候选区域。此处组合聚类主要是指采用聚类算法对目标边框图像进行处理。需要说明的是,整个第一级分类器对待检测图像进行检测的过程中,由于灰度特征时间复杂度低,随机森林检测速度快,这样可以快速地排除大量的没有目标的边框图像;
S203、采用所述第二级分类器将所述候选区域按照预设方式进行部件处理以得到第一目标区域。
具体实现中,检测装置可对候选区域进行进一步目标检测,即,从用第二级分类器对候选区域按照预设方式进行部件处理以得到第一目标区域。
可选地,采用第二级分类器将候选区域按照预设方式进行部件处理以得到第一目标区域的具体步骤可如下:检测装置将候选区域按照预设样本集中的分块方式分成K个分块,其中,K为大于1的整数;采用第二级分类器分别对K个分块进行检测,得到与K个分块对应的K个阈值集;分别将K个阈值集进行求和,得到K个目标值;将K个目标值中大于预设阈值的目标值对应的候选区域组成第一目标区域。可选地,预设样本集即为图像库中的所有或者一定数量的图像,其中,第一级分类器依据该预设样本集进行构造的。可选地,在目标为人的情况下,可将人分为三个部件,即头、上肢和下肢。在目标为车的情况下,可将车辆分为左上区域、左下区域、右上区域和右下区域。具体地,在样本集合中,可将目标分为几个部件,为了加速运算,仍然提取每个部件的灰度级特征,对部件用第二级分类器进行训练,弱分类器可选择决策树,训练出每个部件的阈值和目标阈值。对候选区域按照样本集中的部件处理方式进行分块,用决策树检测每个分块,得到每个分块的阈值,将每个分块对应的阈值进行相加,将大于目标阈值的候选区域保留,将保留的候选区域作为第一目标区域。
S204、采用所述第三级分类器对所述第一目标区域进行分类以得到第二目标区域。
具体实现中,检测装置可对第一目标区域进行进一步分类,其主要手段可采用第三级分类器对该第一目标区域进行分类以得到第二目标区域,该第二目标区域即为待检测图像的目标区域。
可选地,采用第三级分类器对第一目标区域进行分类以得到第二目标区域的主要步骤可如下:检测装置提取样本集中的预设特征,其中,预设特征为SIFT特征和/或HOG特征;在第三级分类器中使用预设特征对第一目标区域进行检测,以得到第二目标区域,其中,第二目标区域为待检测图像的目标区域。具体地,为了精确定位目标区域,可以选择复杂的特征对目标提取特征,预设特征可为方向梯度直方图(英文:HistogramofGradient,缩写:HOG)、尺度不变特征变换(英文:Scale-invariantfeaturetransform,缩写:SIFT)等。在第三级分类器中使用预设特征对第一目标区域进行检测,以得到第二目标区域。第三级分类器主要用于提取对第一目标区域中的精细特征,该精细特征可为预设特征,然后用检测器进行精确定位,检测器可以为adaboost。进而,因为第一级分类器和第二级分类器已经排除了大量的非目标区域,即使用复杂的特征提取,也可以快速的检测出目标,并且精度非常高。
S205、将所述第二目标区域作为所述待检测图像的目标区域。
本实施例中,检测装置可将上述三个分类器进行级联,形成三级级联分类器,第一级分类器主要实现粗检测以得到候选区域,第二级分类对候选区域进行部件处理得到第一目标区域,第三级分类器对第一目标区域进行进一步检测以得到第二目标区域,因为三级分类器均建立在灰度特征的基础上进行处理,且第一级分类器和第三级分类器均具有自主机器学习能力,因而,可快速又高精度地检测出目标区域。
请参阅图3,为本发明实施例提供的一种目标检测的检测装置的第一实施例结构示意图。本实施例中所描述的检测装置,包括:获取单元301、分类单元302和确定单元303,具体如下:
获取单元301,用于获取包含目标的待检测图像。
分类单元302,用于采用三级级联分类器对所述获取单元301获取到的待检测图像进行三级分类。
确定单元303,用于将所述分类单元302三级分类后确定出的目标区域作为所述待检测图像的目标区域。
作为一种可能的实施方式,所述三级级联分类器包括第一级分类器、第二级分类器和第三级分类器,所述分类单元302可包括:
第一分类单元,用于采用所述第一级分类器对所述获取单元获取到的待检测图像进行检测以得到所述待检测图像的候选区域;
第二分类单元,用于采用所述第二级分类器将所述第一分类单元分类得到的候选区域按照预设方式进行部件处理以得到第一目标区域;
第三分类单元,用于采用所述第三级分类器对所述第二分类单元分类得到的第一目标区域进行分类以得到第二目标区域。
进一步地,第一分类单元可包括:
分层单元,用于利用所述第一级分类器将所述获取单元获取到的待检测图像分成多层金字塔图像;
遍历单元,用于对所述分层单元分层得到的多层金字塔图像中的每一层金字塔图像按照预设步长进行遍历,得到N个边框图像,其中,所述N为大于1的整数;
第一提取单元,用于提取所述遍历单元得到的N个边框图像的灰度级特征;
第一检测单元,用于采用预先训练好的随机森林对所述第一提取单元提取的灰度级特征进行检测,得到M个边框图像,所述M为大于1且小于所述N的整数;
聚类单元,用于将所述第一检测单元得到的M个边框图像进行聚类处理以生成候选区域。
进一步地,所述第二分类单元可包括:
分块单元,用于将所述第一分类单元得到的候选区域按照预设样本集中的分块方式分成K个分块,其中,K为大于1的整数;
第二检测单元,用于采用所述第二级分类器分别对所述分块单元分块得到的K个分块进行检测,得到与所述K个分块对应的K个阈值集;
计算单元,用于分别将所述第二检测单元得到的K个阈值集进行求和,得到K个目标值;
组成单元,用于将所述计算单元计算出的K个目标值中大于预设阈值的目标值对应的候选区域组成第一目标区域。
进一步地,所述第三分类单元可包括:
第二提取单元,用于提取所述样本集中的预设特征,所述预设特征为SIFT特征和/或HOG特征;
第三检测单元,用于在所述第三级分类器中使用所述第二提取单元提取的预设特征对所述第一目标区域进行检测,以得到第二目标区域。
作为一种可能的实施方式,所述检测装置还可包括:
构造单元,用于构造第一级分类器,其中,所述第一级分类器的构造方法如下:
提取样本集中的灰度特征,所述灰度特征为灰度差分特征、类Harr特征和梯度幅值特征中的至少一个;
将所述灰度特征组成特征池;
随机选取所述特征池中的灰度特征作为训练对象;
对所述训练对象进行训练,以得到J棵训练树,其中,所述J为大于1的整数;
采用随机森林遍历所述J棵训练树以得到所述J棵训练树中的叶节点的得分值;
将所述得分值组成特征向量;
根据所述特征向量训练出目标检测模型,所述目标检测模型即为第一级分类器。
本实施例中,检测装置可将上述三个分类器进行级联,形成三级级联分类器,第一级分类器主要实现粗检测以得到候选区域,第二级分类对候选区域进行部件处理得到第一目标区域,第三级分类器对第一目标区域进行进一步检测以得到第二目标区域,因为三级分类器均建立在灰度特征的基础上进行处理,且第一级分类器和第三级分类器均具有自主机器学习能力,因而,可快速又高精度地检测出目标区域。
请参阅图4,为本发明实施例提供的一种目标检测的检测装置的第二实施例结构示意图。本实施例中所描述的检测装置,包括:至少一个输入设备1000;至少一个输出设备2000;至少一个处理器3000,例如CPU;和存储器4000,上述输入设备1000、输出设备2000、处理器3000和存储器4000通过总线5000连接。
其中,上述输入设备1000具体可为触摸屏、键盘、触控笔等等。
上述输出设备2000具体可为显示器。
上述存储器4000可以是高速RAM存储器,也可为非不稳定的存储器(non-volatilememory),例如磁盘存储器。上述存储器4000用于存储一组程序代码,上述输入设备1000、输出设备2000和处理器3000用于调用存储器4000中存储的程序代码,执行如下操作:
上述处理器3000,用于:
获取包含目标的待检测图像;
采用三级级联分类器对所述待检测图像进行三级分类;
将三级分类后确定出的目标区域作为所述待检测图像的目标区域。
作为一种可能的实施方式,所述三级级联分类器包括第一级分类器、第二级分类器和第三级分类器,上述处理器3000采用三级级联分类器对所述待检测图像进行三级分类,包括:
采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域;
采用所述第二级分类器将所述候选区域按照预设方式进行部件处理以得到第一目标区域;
采用所述第三级分类器对所述第一目标区域进行分类以得到第二目标区域。
进一步地,上述处理器3000采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域,包括:
利用所述第一级分类器将所述待检测图像分成多层金字塔图像;
对所述多层金字塔图像中的每一层金字塔图像按照预设步长进行遍历,得到N个边框图像,其中,所述N为大于1的整数;
提取所述N个边框图像的灰度级特征;
采用预先训练好的随机森林对所述灰度级特征进行检测,得到M个边框图像,所述M为大于1且小于所述N的整数;
将所述M个边框图像进行聚类处理以生成候选区域。
进一步地,上述处理器3000采用所述第二级分类器将所述候选区域按照预设方式进行部件处理以得到第一目标区域,包括:
将所述候选区域按照预设样本集中的分块方式分成K个分块,其中,K为大于1的整数;
采用所述第二级分类器分别对所述K个分块进行检测,得到与所述K个分块对应的K个阈值集;
分别将所述K个阈值集进行求和,得到K个目标值;
将所述K个目标值中大于预设阈值的目标值对应的候选区域组成第一目标区域。
进一步地,上述处理器3000采用所述第三级分类器对所述第一目标区域进行分类以得到第二目标区域,包括:
提取所述样本集中的预设特征,所述预设特征为SIFT特征和/或HOG特征;
在所述第三级分类器中使用所述预设特征对所述第一目标区域进行检测,以得到第二目标区域。
作为一种可能的实施方式,上述处理器3000采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域之前,还具体用于:
构造第一级分类器,其中,所述第一级分类器的构造方法如下:
提取样本集中的灰度特征,所述灰度特征为灰度差分特征、类Harr特征和梯度幅值特征中的至少一个;
将所述灰度特征组成特征池;
随机选取所述特征池中的灰度特征作为训练对象;
对所述训练对象进行训练,以得到J棵训练树,其中,所述J为大于1的整数;
采用随机森林遍历所述J棵训练树以得到所述J棵训练树中的叶节点的得分值;
将所述得分值组成特征向量;
根据所述特征向量训练出目标检测模型,所述目标检测模型即为第一级分类器。
具体实现中,本发明实施例中所描述的输入设备1000、输出设备2000和处理器3000可执行本发明实施例提供的一种目标检测的方法的第一实施例和第二实施例中所描述的实现方式,也可执行本发明实施例提供的一种目标检测的检测装置的第一实施例中所描述的终端的实现方式,在此不再赘述。
本实施例中,检测装置可将上述三个分类器进行级联,形成三级级联分类器,第一级分类器主要实现粗检测以得到候选区域,第二级分类对候选区域进行部件处理得到第一目标区域,第三级分类器对第一目标区域进行进一步检测以得到第二目标区域,因为三级分类器均建立在灰度特征的基础上进行处理,且第一级分类器和第三级分类器均具有自主机器学习能力,因而,可快速又高精度地检测出目标区域。
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任意一种信号处理方法的部分或全部步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可能可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明各个实施例上述方法的全部或部分步骤。其中,而前述的存储介质可包括:U盘、移动硬盘、磁碟、光盘、只读存储器(英文:Read-OnlyMemory,缩写:ROM)或者随机存取存储器(英文:RandomAccessMemory,缩写:RAM)等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (12)
1.一种目标检测的方法,其特征在于,包括:
获取包含目标的待检测图像;
采用三级级联分类器对所述待检测图像进行三级分类;
将三级分类后确定出的目标区域作为所述待检测图像的目标区域。
2.根据权利要求1所述的方法,其特征在于,所述三级级联分类器包括第一级分类器、第二级分类器和第三级分类器,
所述采用三级级联分类器对所述待检测图像进行三级分类,包括:
采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域;
采用所述第二级分类器将所述候选区域按照预设方式进行部件处理以得到第一目标区域;
采用所述第三级分类器对所述第一目标区域进行分类以得到第二目标区域。
3.根据权利要求1或2任一项所述的方法,其特征在于,所述采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域,包括:
利用所述第一级分类器将所述待检测图像分成多层金字塔图像;
对所述多层金字塔图像中的每一层金字塔图像按照预设步长进行遍历,得到N个边框图像,其中,所述N为大于1的整数;
提取所述N个边框图像的灰度级特征;
采用预先训练好的随机森林对所述灰度级特征进行检测,得到M个边框图像,所述M为大于1且小于所述N的整数;
将所述M个边框图像进行聚类处理以生成候选区域。
4.根据权利要求1或2任一项所述的方法,其特征在于,所述采用所述第二级分类器将所述候选区域按照预设方式进行部件处理以得到第一目标区域,包括:
将所述候选区域按照预设样本集中的分块方式分成K个分块,其中,K为大于1的整数;
采用所述第二级分类器分别对所述K个分块进行检测,得到与所述K个分块对应的K个阈值集;
分别将所述K个阈值集进行求和,得到K个目标值;
将所述K个目标值中大于预设阈值的目标值对应的候选区域组成第一目标区域。
5.根据权利要求1或2任一项所述的方法,其特征在于,所述采用所述第三级分类器对所述第一目标区域进行分类以得到第二目标区域,包括:
提取所述样本集中的预设特征,所述预设特征为SIFT特征和/或HOG特征;
在所述第三级分类器中使用所述预设特征对所述第一目标区域进行检测,以得到第二目标区域。
6.根据权利要求1或2任一项所述的方法,起特征在于,所述采用所述第一级分类器对所述待检测图像进行检测以得到所述待检测图像的候选区域之前,所述方法还包括:
构造第一级分类器,其中,所述第一级分类器的构造方法如下:
提取样本集中的灰度特征,所述灰度特征为灰度差分特征、类Harr特征和梯度幅值特征中的至少一个;
将所述灰度特征组成特征池;
随机选取所述特征池中的灰度特征作为训练对象;
对所述训练对象进行训练,以得到J棵训练树,其中,所述J为大于1的整数;
采用随机森林遍历所述J棵训练树以得到所述J棵训练树中的叶节点的得分值;
将所述得分值组成特征向量;
根据所述特征向量训练出目标检测模型,所述目标检测模型即为第一级分类器。
7.一种目标检测的检测装置,其特征在于,包括:
获取单元,用于获取包含目标的待检测图像;
分类单元,用于采用三级级联分类器对所述获取单元获取到的待检测图像进行三级分类;
确定单元,用于将所述分类单元三级分类后确定出的目标区域作为所述待检测图像的目标区域。
8.根据权利要求7所述的检测装置,其特征在于,所述三级级联分类器包括第一级分类器、第二级分类器和第三级分类器,
所述分类单元,包括:
第一分类单元,用于采用所述第一级分类器对所述获取单元获取到的待检测图像进行检测以得到所述待检测图像的候选区域;
第二分类单元,用于采用所述第二级分类器将所述第一分类单元分类得到的候选区域按照预设方式进行部件处理以得到第一目标区域;
第三分类单元,用于采用所述第三级分类器对所述第二分类单元分类得到的第一目标区域进行分类以得到第二目标区域。
9.根据权利要求7或8任一项所述的检测装置,其特征在于,所述第一分类单元包括:
分层单元,用于利用所述第一级分类器将所述获取单元获取到的待检测图像分成多层金字塔图像;
遍历单元,用于对所述分层单元分层得到的多层金字塔图像中的每一层金字塔图像按照预设步长进行遍历,得到N个边框图像,其中,所述N为大于1的整数;
第一提取单元,用于提取所述遍历单元得到的N个边框图像的灰度级特征;
第一检测单元,用于采用预先训练好的随机森林对所述第一提取单元提取的灰度级特征进行检测,得到M个边框图像,所述M为大于1且小于所述N的整数;
聚类单元,用于将所述第一检测单元得到的M个边框图像进行聚类处理以生成候选区域。
10.根据权利要求7或8任一项所述的检测装置,其特征在于,所述第二分类单元包括:
分块单元,用于将所述第一分类单元得到的候选区域按照预设样本集中的分块方式分成K个分块,其中,K为大于1的整数;
第二检测单元,用于采用所述第二级分类器分别对所述分块单元分块得到的K个分块进行检测,得到与所述K个分块对应的K个阈值集;
计算单元,用于分别将所述第二检测单元得到的K个阈值集进行求和,得到K个目标值;
组成单元,用于将所述计算单元计算出的K个目标值中大于预设阈值的目标值对应的候选区域组成第一目标区域。
11.根据权利要求7或8任一项所述的检测装置,其特征在于,所述第三分类单元包括:
第二提取单元,用于提取所述样本集中的预设特征,所述预设特征为SIFT特征和/或HOG特征;
第三检测单元,用于在所述第三级分类器中使用所述第二提取单元提取的预设特征对所述第一目标区域进行检测,以得到第二目标区域。
12.根据权利要求7或8任一项所述的检测装置,起特征在于,所述检测装置还包括:
构造单元,用于构造第一级分类器,其中,所述第一级分类器的构造方法如下:
提取样本集中的灰度特征,所述灰度特征为灰度差分特征、类Harr特征和梯度幅值特征中的至少一个;
将所述灰度特征组成特征池;
随机选取所述特征池中的灰度特征作为训练对象;
对所述训练对象进行训练,以得到J棵训练树,其中,所述J为大于1的整数;
采用随机森林遍历所述J棵训练树以得到所述J棵训练树中的叶节点的得分值;
将所述得分值组成特征向量;
根据所述特征向量训练出目标检测模型,所述目标检测模型即为第一级分类器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510606852.XA CN105303163B (zh) | 2015-09-22 | 2015-09-22 | 一种目标检测的方法及检测装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510606852.XA CN105303163B (zh) | 2015-09-22 | 2015-09-22 | 一种目标检测的方法及检测装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105303163A true CN105303163A (zh) | 2016-02-03 |
CN105303163B CN105303163B (zh) | 2019-03-01 |
Family
ID=55200409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510606852.XA Active CN105303163B (zh) | 2015-09-22 | 2015-09-22 | 一种目标检测的方法及检测装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105303163B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127161A (zh) * | 2016-06-29 | 2016-11-16 | 深圳市格视智能科技有限公司 | 基于级联多层检测器的快速目标检测方法 |
CN107729834A (zh) * | 2017-10-10 | 2018-02-23 | 北京万里红科技股份有限公司 | 一种基于差分块特征的快速虹膜检测方法 |
CN108960266A (zh) * | 2017-05-22 | 2018-12-07 | 阿里巴巴集团控股有限公司 | 图像目标检测方法及装置 |
CN110674690A (zh) * | 2019-08-21 | 2020-01-10 | 成都华为技术有限公司 | 检测方法、检测装置与检测设备 |
CN112153483A (zh) * | 2019-06-28 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 信息植入区域的检测方法、装置及电子设备 |
CN112668496A (zh) * | 2020-12-31 | 2021-04-16 | 深圳市商汤科技有限公司 | 入侵检测方法、装置、设备及存储介质 |
CN113449747A (zh) * | 2020-03-24 | 2021-09-28 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101477625A (zh) * | 2009-01-07 | 2009-07-08 | 北京中星微电子有限公司 | 人体上半身检测方法和系统 |
CN101719276A (zh) * | 2009-12-01 | 2010-06-02 | 北京中星微电子有限公司 | 一种检测图像中物体的方法和装置 |
CN103679187A (zh) * | 2012-09-12 | 2014-03-26 | 深圳先进技术研究院 | 图像识别方法和系统 |
WO2014094275A1 (en) * | 2012-12-20 | 2014-06-26 | Intel Corporation | Accelerated object detection filter using a video motion estimation module |
CN104636497A (zh) * | 2015-03-05 | 2015-05-20 | 四川智羽软件有限公司 | 一种视频数据智能检索方法 |
-
2015
- 2015-09-22 CN CN201510606852.XA patent/CN105303163B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101477625A (zh) * | 2009-01-07 | 2009-07-08 | 北京中星微电子有限公司 | 人体上半身检测方法和系统 |
CN101719276A (zh) * | 2009-12-01 | 2010-06-02 | 北京中星微电子有限公司 | 一种检测图像中物体的方法和装置 |
CN103679187A (zh) * | 2012-09-12 | 2014-03-26 | 深圳先进技术研究院 | 图像识别方法和系统 |
WO2014094275A1 (en) * | 2012-12-20 | 2014-06-26 | Intel Corporation | Accelerated object detection filter using a video motion estimation module |
CN104636497A (zh) * | 2015-03-05 | 2015-05-20 | 四川智羽软件有限公司 | 一种视频数据智能检索方法 |
Non-Patent Citations (1)
Title |
---|
方匡南,等: "随机森林方法研究综述", 《统计与信息论坛》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106127161A (zh) * | 2016-06-29 | 2016-11-16 | 深圳市格视智能科技有限公司 | 基于级联多层检测器的快速目标检测方法 |
CN108960266A (zh) * | 2017-05-22 | 2018-12-07 | 阿里巴巴集团控股有限公司 | 图像目标检测方法及装置 |
CN108960266B (zh) * | 2017-05-22 | 2022-02-08 | 阿里巴巴集团控股有限公司 | 图像目标检测方法及装置 |
CN107729834A (zh) * | 2017-10-10 | 2018-02-23 | 北京万里红科技股份有限公司 | 一种基于差分块特征的快速虹膜检测方法 |
CN112153483A (zh) * | 2019-06-28 | 2020-12-29 | 腾讯科技(深圳)有限公司 | 信息植入区域的检测方法、装置及电子设备 |
US12073621B2 (en) | 2019-06-28 | 2024-08-27 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for detecting information insertion region, electronic device, and storage medium |
CN110674690A (zh) * | 2019-08-21 | 2020-01-10 | 成都华为技术有限公司 | 检测方法、检测装置与检测设备 |
CN110674690B (zh) * | 2019-08-21 | 2022-06-14 | 成都华为技术有限公司 | 检测方法、检测装置与检测设备 |
CN113449747A (zh) * | 2020-03-24 | 2021-09-28 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置、设备和存储介质 |
CN112668496A (zh) * | 2020-12-31 | 2021-04-16 | 深圳市商汤科技有限公司 | 入侵检测方法、装置、设备及存储介质 |
WO2022141962A1 (zh) * | 2020-12-31 | 2022-07-07 | 深圳市商汤科技有限公司 | 入侵检测方法、装置、设备、存储介质和程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN105303163B (zh) | 2019-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109344736B (zh) | 一种基于联合学习的静态图像人群计数方法 | |
CN105303163A (zh) | 一种目标检测的方法及检测装置 | |
CN109978893A (zh) | 图像语义分割网络的训练方法、装置、设备及存储介质 | |
Zhang et al. | Pedestrian detection method based on Faster R-CNN | |
US20180114071A1 (en) | Method for analysing media content | |
CN112639873A (zh) | 基于单对象姿态估计器的多个对象的姿态跟踪设备和方法 | |
CN113642431A (zh) | 目标检测模型的训练方法及装置、电子设备和存储介质 | |
CN111814690B (zh) | 一种目标重识别方法、装置和计算机可读存储介质 | |
CN109325507A (zh) | 一种结合超像素显著性特征与hog特征的图像分类算法和系统 | |
Jiang et al. | Lightweight object detection network model suitable for indoor mobile robots | |
CN104050460B (zh) | 多特征融合的行人检测方法 | |
Tang et al. | Object detection based on convolutional neural network | |
Zhao et al. | Cbph-net: A small object detector for behavior recognition in classroom scenarios | |
CN114037056A (zh) | 一种生成神经网络的方法、装置、计算机设备和存储介质 | |
CN115187772A (zh) | 目标检测网络的训练及目标检测方法、装置及设备 | |
CN111985333A (zh) | 一种基于图结构信息交互增强的行为检测方法及电子装置 | |
Ibrahem et al. | Real-time weakly supervised object detection using center-of-features localization | |
CN117854155B (zh) | 一种人体骨骼动作识别方法及系统 | |
Nemade et al. | Image segmentation using convolutional neural network for image annotation | |
CN112036457A (zh) | 训练目标检测模型的方法及装置、目标检测方法及装置 | |
Liu et al. | Student behavior recognition from heterogeneous view perception in class based on 3-D multiscale residual dense network for the analysis of case teaching | |
Jindal et al. | Aircraft detection from remote sensing images using YOLOV5 architecture | |
Wang et al. | A dense-aware cross-splitnet for object detection and recognition | |
CN113822134A (zh) | 一种基于视频的实例跟踪方法、装置、设备及存储介质 | |
CN113963333A (zh) | 一种基于改进yolof模型的交通标志牌检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |