CN104680134B - 快速人体检测方法 - Google Patents
快速人体检测方法 Download PDFInfo
- Publication number
- CN104680134B CN104680134B CN201510059232.9A CN201510059232A CN104680134B CN 104680134 B CN104680134 B CN 104680134B CN 201510059232 A CN201510059232 A CN 201510059232A CN 104680134 B CN104680134 B CN 104680134B
- Authority
- CN
- China
- Prior art keywords
- image
- human body
- feature
- detecting method
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种快速人体检测方法,它包括,通过摄像头采集图像数据,使用图像的灰度通道特征、梯度幅度特征以及六个方向的梯度直方图特征等共计八个特征,训练多个图像尺度对应大小的分类器;对被检测图像进行运动信息检测,确定运动区域;使用分类器和运动检测的结果对被检测图像进行人体检测,最后输出检测目标的位置和数量,本发明的有益效果为:本发明的方法能保证在较高精度的情况下,速度大幅提高,并且能在低成本的平台上实时运行,降低成本,且方法简单,稳定性好。
Description
技术领域
本发明涉及图像处理和视觉技术领域,具体涉及一种快速人体检测的方法。
背景技术
在人们的交谈和彼此间的交互过程中,视觉信息显然是很重要的。通过视觉的模态,我们可以立即确定许多显著的关于他人的事实和特征,包括他们的位置、身份、大致的年龄、注意力的焦点、脸部表情、姿势、手势和一般的活动。这些视觉线索影响到了会话的内容和进程,并提供了一些上下文相关的信息,这些信息与言语不同,但与此相关,例如,一个手势或面部表情可能是一个关键的信号,一个注视的角度可能可以消除在言语中“这个”或者“在那边”的指带不明。换言之,在人与人的交互中,视觉和言语是联合表达,相互补充的通道。正如语音自动识别是试图构造能够感知人们交流的文字方面的机器,那么计算机视觉技术是用来构造能够“观察人”并自动感知相关视觉信息的机器。
计算机视觉是一门试图通过图像处理或视频处理而使计算机具备“看”的能力的计算学科。通过理解图像形成的几何和辐射线测定,接受器(相机)的属性和物理世界的属性,就有可能(至少在某些情况下)从图像中推断出关于事物的有用信息,例如一块织物的颜色、一圈染了色的痕迹的宽度、火星上一个移动机器人面前的障碍物的大小、监防系统中一张人脸的身份、海底植物的类型或者是MRI扫描图中的肿瘤位置。计算机视觉研究的就是如何能健壮、有效地完成这类的任务。最初计算机视觉被看作是人工智能的一个子方向,现在已成为一个活跃的研究领域并长达50年了。
传统上,计算机视觉研究是被一些主要的应用领域所推动的,例如生物视觉建模、机器人导航和操作、监防、医疗图像以及各种检查、检测和识别任务。近年来,涌现了多模态和感知交互,推动了一大批关于机器视觉的研究。这些努力的重心大多是集成多种感知模态(例如计算机视觉,语音和声音处理,触觉的输入/输出)到用户接口。尤其对于计算机视觉技术,主要的目标是在人机交互中采用视觉作为有效的输入模态。这种基于视频的传感是被动的、无插入的,因为它不需要与用户的交互或任何有特殊用途的装置;传感器也能够被用于视频会议和其他成像用途。这种技术在基于视觉的交互领域中具有良好的应用前景,例如游戏、生物测定学和准入,还有一般的多态接口,能将视觉信息和其他的语音、语言技术,触觉以及用户建模等相结合。其中人体检测技术,成为这其中一个重要的组成部分,发挥着重要的作用。
随着计算机视觉技术的发展,基于计算机视觉的智能监控系统得到了越来越广泛的应用,其功能与传统的监控系统相比也有了质的变化,不仅极大的扩展了传统的监控功能,而且降低了在监控方面投入的成本。在摄像机固定的情况下,对智能监控系统的关键技术进行了研究,并实现了具有实际应用功能的智能监控系统。目标的检测是智能监控系统要实现的第一步,也是至关重要的一步,检测出的目标的质量将直接关系到运动目标的分类和行为浅析等。因此要求检测出的运动目标信息要尽可能的完整。
发明内容
本发明提供一种快速人体检测的方法,使得人体检测在精度较高的情况下运行速度更快。
为实现上述目的,本发明采用以下技术方案:
一种快速人体检测方法,它包括以下步骤:
S1、分类器训练;
所述步骤S1具体包括:
S11、使用摄像头采集图像样本;
S12、利用步骤S11采集到的图像样本的图像特征进行分类器训练,得到多
个图像尺度对应大小的分类器;
S2、图像检测;
所述步骤S2具体包括:
S21、使用摄像头采集图像,并对图像进行预处理;
S22、对被检测的图像采用三帧差分法进行运动信息检测,确定运动区域;
S23、对被检测的图像进行四次尺度缩放,每个尺度使用训练好的分类器分
别进行特征提取,然后得到检测目标,如果上一帧有目标被检测出,则目
标区域扩大10%做为此帧的特征提取区域,如果上一帧无目标被检测出,则
只需要对检测到的运动区域进行特征提取;
S24、输出检测目标的位置和数量。
更进一步的技术方案是,所述步骤S11中的图像样本分为正样本和负样本,所述正样本包括人体的正面、侧面以及背面,所述负样本为未采集到人体形状或未采集到类似人体形状的图像样本。
更进一步的技术方案是,所述步骤S12中的图像特征包括灰度通道特征、梯度幅度特征或六个方向的梯度直方图特征。
更进一步的技术方案是,所述步骤S21中的预处理包括光照处理或图像增强处理。
更进一步的技术方案是,所述摄像头安装在终端上,所述终端包括机顶盒、电视或空调。
本技术方案中首先实现和改进是基于梯度方向直方图的人体检测方法,在实际应用中要求人体检测方法需要比较高的准确率,同时还需要有非常高的速度以达到实时的要求,伴随着这些需求,本机方案中方法同时加入了运动信息检测,实现了基于多分类器的快速人体检测方法,使得检测速度有大幅度提高;
本技术方案中使用了图像的灰度通道特征,梯度幅度特征以及六个方向的梯度直方图等特征,通过摄像头采集图像数据,训练多个图像尺度对应的分类器,这样的好处是检测时对图像只进行很少的尺度缩放,减少了如积分图和梯度直方图等时效较多的计算,从而提高运行速度,同时加入了运动信息检测,针对运动的区域进行特征值计算,进一步提高了运行速度。
与现有技术相比,本发明的有益效果是:
本发明的方法能保证在较高精度的情况下,速度大幅提高,并且能在低成本的平台上实时运行,降低成本,且方法简单,稳定性好。
具体实施方式
一种快速人体检测方法,它包括以下步骤:分类器训练;所述分类器训练具体包括通过摄像头采集图像样本,采集的图像样本分为正样本和负样本,正样本包括人体的正面、侧面以及背面,所述负样本为未采集到人体形状或未采集到类似人体形状的图像样本(例如,负样本包括没有人或没有类似人体的形状等);接着使用图像的灰度通道特征、梯度幅度特征或六个方向的梯度直方图特征等特征,训练多个图像尺度对应大小的分类器。所述六个方向的梯度直方图特征是指将180度,等分为六个部分,六条分割线代表六个方向。
图像检测,所述图像检测具体包括通过摄像头采集图像,接着对图像进行光照处理货图像增强等图像预处理;然后对被检测的图像采用三帧差分法进行运动信息检测,确定运动区域,三帧差分法利用连续三帧图像,通过图像间的“差分”、“与”以及“异或”操作,实现运动目标的准确检测,获得准确的运动信息,所述三帧差分法具体为:1、将第一帧图像与第二帧图像进行“差分”操作,得到第一差分图像,2、将第二帧图像与第三帧图像进行“差分”操作,得到第二差分图像,3、将第一差分图像与第二差分图像进行“与”操作,得到第三图像,4、将第二差分图像与第三图像进行“异或”操作,得到第四图像,5、将第三图像与第四图像进行“与”操作,得到检测结果图像,通过上述三帧差分法检测运动目标效果好,且易于实现,同时如需对多个运动目标运动检测时,可采用此方法进行初始分割;接着被检测的图像进行四次尺度缩放,每个尺度使用训练好的分类器分别进行特征提取,然后得到检测目标,四次尺度缩放的目的是减少积分图等复杂运算的次数,只需使用训练的多个尺度分类器分别进行特征提取,从而提高检测速度,如果上一帧有目标被检测出,则目标区域扩大10%做为此帧的特征提取区域,如果上一帧无目标被检测出,则只需要对检测到的运动区域进行特征提取,通过上述方式检测无需整帧检测,从而能提高检测速度;最后输出检测目标的位置和数量。
以上具体实施方式对本发明的实质进行详细说明,但并不能对本发明的保护范围进行限制,显而易见地,在本发明的启示下,本技术领域普通技术人员还可以进行许多改进和修饰,需要注意的是,这些改进和修饰都落在本发明的权利要求保护范围之内。
Claims (5)
1.一种快速人体检测方法,其特征在于,它包括以下步骤:
S1、分类器训练;
所述步骤S1具体包括:
S11、使用摄像头采集图像样本;
S12、利用步骤S11采集到的图像样本的图像特征进行分类器训练,得到多个图像尺度对应大小的分类器;
S2、图像检测;
所述步骤S2具体包括:
S21、使用摄像头采集图像,并对图像进行预处理;
S22、对被检测的图像采用三帧差分法进行运动信息检测,确定运动区域;
S23、对被检测的图像进行四次尺度缩放,每个尺度使用训练好的分类器分别进行特征提取,然后得到检测目标,如果上一帧有目标被检测出,则目标区域扩大10%做为此帧的特征提取区域,如果上一帧无目标被检测出,则只需要对检测到的运动区域进行特征提取;
S24、输出检测目标的位置和数量。
2.根据权利要求1所述的快速人体检测方法,其特征在于所述步骤S11中的图像样本分为正样本和负样本,所述正样本包括人体的正面、侧面以及背面,所述负样本为未采集到人体形状或未采集到类似人体形状的图像样本。
3.根据权利要求1所述的快速人体检测方法,其特征在于所述步骤S12中的图像特征包括灰度通道特征、梯度幅度特征或六个方向的梯度直方图特征。
4.根据权利要求1所述的快速人体检测方法,其特征在于所述步骤S21中的预处理包括光照处理或图像增强处理。
5.根据权利要求1所述的快速人体检测方法,其特征在于所述摄像头安装在终端上,所述终端包括机顶盒、电视或空调。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510059232.9A CN104680134B (zh) | 2015-02-04 | 2015-02-04 | 快速人体检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510059232.9A CN104680134B (zh) | 2015-02-04 | 2015-02-04 | 快速人体检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104680134A CN104680134A (zh) | 2015-06-03 |
CN104680134B true CN104680134B (zh) | 2018-01-12 |
Family
ID=53315152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510059232.9A Active CN104680134B (zh) | 2015-02-04 | 2015-02-04 | 快速人体检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104680134B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105404866B (zh) * | 2015-11-17 | 2018-10-30 | 四川长虹电器股份有限公司 | 一种多模式自动实施人体状态感知的实现方法 |
CN107464238B (zh) * | 2017-08-07 | 2018-07-17 | 三阳纺织有限公司 | 纺织品测试系统验证平台 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100589114C (zh) * | 2007-12-29 | 2010-02-10 | 北京中星微电子有限公司 | 图像中最大人脸的跟踪装置和方法 |
CN101609509B (zh) * | 2008-06-20 | 2012-02-15 | 中国科学院计算技术研究所 | 一种基于预分类器的图像物体检测方法及系统 |
CN101968884A (zh) * | 2009-07-28 | 2011-02-09 | 索尼株式会社 | 检测视频图像中的目标的方法和装置 |
KR20120072009A (ko) * | 2010-12-23 | 2012-07-03 | 한국전자통신연구원 | 다중 사용자의 인터렉션 인식 장치 및 방법 |
CN102867311B (zh) * | 2011-07-07 | 2015-11-25 | 株式会社理光 | 目标跟踪方法和目标跟踪设备 |
CN102722712B (zh) * | 2012-01-02 | 2014-04-16 | 西安电子科技大学 | 基于连续度的多尺度高分辨图像目标检测方法 |
CN102609682B (zh) * | 2012-01-13 | 2014-02-05 | 北京邮电大学 | 一种针对感兴趣区域的反馈式行人检测方法 |
CN102842045B (zh) * | 2012-08-03 | 2016-08-10 | 华侨大学 | 一种基于组合特征的行人检测方法 |
CN103218621B (zh) * | 2013-04-21 | 2015-12-02 | 北京航空航天大学 | 一种室外视频监控中多尺度车辆的识别方法 |
-
2015
- 2015-02-04 CN CN201510059232.9A patent/CN104680134B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN104680134A (zh) | 2015-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Materzynska et al. | The jester dataset: A large-scale video dataset of human gestures | |
WO2021129064A9 (zh) | 姿态获取方法、关键点坐标定位模型的训练方法和装置 | |
Rastgoo et al. | Real-time isolated hand sign language recognition using deep networks and SVD | |
CN105787478B (zh) | 基于神经网络和灵敏度参数的人脸转向识别方法 | |
Li et al. | Identifying emotions from non-contact gaits information based on microsoft kinects | |
CN109597485B (zh) | 一种基于双指角域特征的手势交互系统及其工作方法 | |
Meena | A study on hand gesture recognition technique | |
Geetha et al. | A vision based dynamic gesture recognition of indian sign language on kinect based depth images | |
CN105930767A (zh) | 一种基于人体骨架的动作识别方法 | |
Avola et al. | Deep temporal analysis for non-acted body affect recognition | |
Sincan et al. | Using motion history images with 3d convolutional networks in isolated sign language recognition | |
JP2017513144A (ja) | 顔認証方法およびシステム | |
dos Santos Anjo et al. | A real-time system to recognize static gestures of Brazilian sign language (libras) alphabet using Kinect. | |
CN107767335A (zh) | 一种基于人脸识别特征点定位的图像融合方法及系统 | |
CN109325408A (zh) | 一种手势判断方法及存储介质 | |
CN111209811B (zh) | 一种实时检测眼球注意力位置的方法及系统 | |
CN109409298A (zh) | 一种基于视频处理的视线追踪方法 | |
CN104156717A (zh) | 基于图像处理技术的驾驶员驾车打电话违章识别方法 | |
Sahana et al. | Hand sign recognition from depth images with multi-scale density features for deaf mute persons | |
CN116051631A (zh) | 光斑标注方法及系统 | |
CN104680134B (zh) | 快速人体检测方法 | |
CN109753922A (zh) | 基于稠密卷积神经网络的仿人机器人表情识别方法 | |
Osokin | Global context for convolutional pose machines | |
Abdullah et al. | Recognition and Evaluation of Stability Movements in Gymnastics Based on Deep Learning | |
Wei et al. | Occluded pedestrian detection based on depth vision significance in biomimetic binocular |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |