CN106599847A - 基于深度信息的人体检测方法 - Google Patents
基于深度信息的人体检测方法 Download PDFInfo
- Publication number
- CN106599847A CN106599847A CN201611158655.7A CN201611158655A CN106599847A CN 106599847 A CN106599847 A CN 106599847A CN 201611158655 A CN201611158655 A CN 201611158655A CN 106599847 A CN106599847 A CN 106599847A
- Authority
- CN
- China
- Prior art keywords
- human body
- image
- depth information
- feature
- depth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Abstract
本发明涉及人体检测技术,公开了一种基于深度信息的人体检测方法,解决人体检测受外部环境干扰大、适用性低的问题。包括图像预处理步骤和人体检测步骤;其中,图像预处理步骤包括:图像深度信息提取;对深度图像进行高斯图像金字塔下采样;对下采样后的图像进行梯度直方图;对梯度直方图后得到特征通道进行积分图运算;人体检测步骤包括:通过帧间运动信息,找到检测区域;采用基于离散AdaBoost算法的分类器对需要检测区域进行特征判断,检测该区域是否存在人体;对通过分类器判断为人体的窗口进行合并,在图像上标志出人体区域。本发明适用于VR。
Description
技术领域
本发明涉及人体检测技术,特别涉及基于深度信息的人体检测方法。
背景技术
近两年,由于VR、AR的热度与日俱增,各方巨头争抢市场占有率时,与之相关的各方面技术都得到进一步的推广与研究,而深度信息则是其中的核心。
人体检测作为计算机视觉领域备受关注的研究热点和前沿方向,它在机器人视觉、高级人机交互以及智能监控、智能交通、安全辅助驾驶等方面得到广泛的应用和推广。人体检测除了这些比较直接的应用外,还是实现人体动作、姿态识别和跟踪的技术基础,具有很深的理论研究价值和广泛的应用前景。
目前,根据图像的类型,人体检测可以分为两类:基于RGB图像的检测和基于深度图像的检测。前者已经取到了很大的进展,也是现在比较主流的实现方式,但是,基于RGB图像容易受到光照变化、阴影、物体遮挡以及复杂背景等外在因素的干扰,使得检测性能大打折扣。深度图像作为一种新型的数据描述方式,它保存的只是物体的空间位置信息,更重要的是具有保护隐私和维度小的优点。
积分通道特征是由dollar等人2009年提出的人体特征描述方法,使得人体检测不仅在检测速度上有了显著提高,而且检测质量也更加准确。积分通道特征主要是应用于RGB图像中人体的检测,而且最主要的一个通道特征就是像素灰度,为了能够在深度图像中适用,将其灰度特征通道替换为深度信息,而后,通过样本的训练得到基于深度图的分类器,从而能够在深度图像上进行人体检测。
发明内容
本发明要解决的技术问题是:提供一种基于深度信息的人体检测方法,解决人体检测受外部环境干扰大、适用性低的问题。
为解决上述问题,本发明采用的技术方案是:基于深度信息的人体检测方法,包括图像预处理步骤和人体检测步骤;其中,
图像预处理步骤包括:
s11、图像深度信息提取;
s12、对深度图像进行高斯图像金字塔下采样;
s13、对下采样后的图像进行梯度直方图,以获取特征通道;
s14、对梯度直方图后得到特征通道进行积分图运算;
人体检测步骤包括:
s21、通过帧间运动信息,找到检测区域;
s22、采用基于离散AdaBoost算法的分类器对需要检测区域进行特征提取;
s23、对通过分类器检测输出人体窗口进行合并,在图像上标志处人体区域。
进一步的,步骤s12输出图像分辨率是输入图像的四分之一。
进一步的,步骤s13之后总共获得8个特征通道,包括:采用了梯度直方图方法得到的6个梯度直方图特征通道,一个梯度幅值特征通道以及一个图像深度值特征通道。
进一步的,步骤s13包括:
s131、在每个深度像素上计算图像梯度幅值和梯度方向;
s132、将梯度方向在[0-180°]区间内量化为6个单位,梯度幅值通过HOG映射到这个区间内,共占据6个特征通道,再包括图像深度值占一个特征通道,梯度幅值占一个特征通道,总共8个特征通道。
进一步的,s131中,梯度幅值首先采用sobel算子从横向和纵向分别求梯度值,然后对同一个像素位置的横向和纵向梯度求平方和再开方得到其梯度值;梯度方向根据横向和纵向梯度值求取。
进一步的,步骤21根据上1帧人体所在位置确定当前图像检测区域。
进一步的,步骤22包括:训练多个检测窗口大小不同的分类器,其中弱分类器采用2层决策树,决策树及其权重通过离散AdaBoost算法学习得到,检测区域经过多个分类器计算判断是否包含人体。
本发明的有益效果是:由于在人体检测过程中,加入了帧间运动信息,排除了大部分非人体区域,同时,训练了多个不同尺度的分类器,分别对检测区域进行分类,有效提高了检测得准确度。
具体实施方式
本发明实现了一种基于深度信息的人体检测,使其能在智能家居、人机交互等平台上得到广泛应用,为了使本发明的目的、技术方案和优点更加清楚,以下对本发明实施步骤进行了进一步的详细说明。
基于深度信息的人体检测方法包括:s0、通过深度摄像头获取每帧图像;s1、对每一帧图像进行预处理;s2、对预处理后的图像进行人体检测。
本发明图像预处理包括以下步骤:
s11、对图像进行深度信息提取,如深度图像的高度和宽度以及检测窗口的大小;
s12、根据深度图像的高度和宽度以及检测窗口的大小,计算出输入图像需要做几层高斯金字塔下采样,比如输入图像分辨率为640*480,检测窗口54*54,那么需要依次做4次高斯金字塔下采样,每一层图像都是由上一层图像下采样得来的,4层图像分辨率分别为:640*480、320*240、160*120、80*60;
s13、下采样后的图像进行梯度直方图,其步骤包括:1)在每个深度像素上计算图像梯度幅值和梯度方向。其中梯度幅值采用sobel算子从横向和纵向分别求梯度值,然后对同一个像素位置的横向和纵向梯度求平方和再开方得到其梯度值,梯度方向根据横向和纵向梯度值求取;2)将梯度方向在[0-180°]区间内量化为6个单位,梯度幅值通过HOG映射到这个区间内,共占据6个特征通道,再包括图像深度值占一个特征通道,梯度幅值占一个特征通道,总共8个特征通道;
s14、对梯度直方图后得到8个特征通道进行积分图运算。
针对640*480分辨率图片进行人体检测时,分别将经过预处理的4层金字塔图像通过已有的分类器进行特征提取,由于加入了帧间运动信息,能够提前排除大部分非人脸的检测区域,只对待检测区域进行人体特征检测。本发明人体检测包含如下步骤:
s21、由前几帧图像检测出的人体位置,能够判断出其运动方向和粗略位置,将其映射到第1层金字塔图像中,标注人体所在的大致区域,当检测出第一层图像人体所在位置时,将其映射到第二层图像,得到检测区域,再在检测区域内进行检测,如此循环至最后一层金字塔图像;
s22、在标识出的检测区域,通过AdaBoost算法训练出的分类器对其进行特征提取,该分类器会自动在8个特征通道选择更具有鉴别力的特征进行计算,如果通过则证明符合人体特征;
s23、将4层图像所有检测到符合人体的窗口进行合并处理,得到当前图像人体的位置。
一般人体检测方法:需要对图像进行N次降采样缩放处理,比如相对于640*480分辨率的图片,在完成4次高斯金字塔降采样后,每两层金字塔之间还需要进行降采样处理,总共就需要处理4*N层图像,然后从各个尺度上进行特征提取,在经过分类器分类计算是否存在检测对象。本发明所采用的方法无需对图像进行缩放处理,每一层金字塔图像,只需要进行一次梯度直方图运算和积分图运算,得到积分通道特征,再经过多个分类器进行分类,获取人体位置。
以上描述了本发明的基本原理和主要的特征,说明书的描述只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (7)
1.基于深度信息的人体检测方法,其特征在于,包括图像预处理步骤和人体检测步骤;其中,
图像预处理步骤包括:
s11、图像深度信息提取;
s12、对深度图像进行高斯图像金字塔下采样;
s13、对下采样后的图像进行梯度直方图,以获取特征通道;
s14、对梯度直方图后得到特征通道进行积分图运算;
人体检测步骤包括:
s21、通过帧间运动信息,找到检测区域;
s22、采用基于离散AdaBoost算法的分类器对需要检测区域进行特征提取;
s23、对通过分类器检测输出人体窗口进行合并,在图像上标志处人体区域。
2.根据权利要求1所述的基于深度信息的人体检测方法,其特征在于,步骤s12输出图像分辨率是输入图像的四分之一。
3.根据权利要求1所述的基于深度信息的人体检测方法,其特征在于,步骤s13之后总共获得8个特征通道,包括:采用了梯度直方图方法得到的6个梯度直方图特征通道,一个梯度幅值特征通道以及一个图像深度值特征通道。
4.根据权利要求3所述的基于深度信息的人体检测方法,其特征在于,步骤s13包括:
s131、在每个深度像素上计算图像梯度幅值和梯度方向;
s132、将梯度方向在[0-180°]区间内量化为6个单位,梯度幅值通过HOG映射到这个区间内,共占据6个特征通道,再包括图像深度值占一个特征通道,梯度幅值占一个特征通道,总共8个特征通道。
5.根据权利要求4所述的基于深度信息的人体检测方法,其特征在于,s131中,梯度幅值首先采用sobel算子从横向和纵向分别求梯度值,然后对同一个像素位置的横向和纵向梯度求平方和再开方得到其梯度值;梯度方向根据横向和纵向梯度值求取。
6.根据权利要求1所述的基于深度信息的人体检测方法,其特征在于,步骤21根据上1帧人体所在位置确定当前图像检测区域。
7.根据权利要求1所述的基于深度信息的人体检测方法,其特征在于,步骤22包括:训练多个检测窗口大小不同的分类器,其中弱分类器采用2层决策树,决策树及其权重通过离散AdaBoost算法学习得到,检测区域经过多个分类器计算判断是否包含人体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611158655.7A CN106599847A (zh) | 2016-12-15 | 2016-12-15 | 基于深度信息的人体检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611158655.7A CN106599847A (zh) | 2016-12-15 | 2016-12-15 | 基于深度信息的人体检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106599847A true CN106599847A (zh) | 2017-04-26 |
Family
ID=58801465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611158655.7A Pending CN106599847A (zh) | 2016-12-15 | 2016-12-15 | 基于深度信息的人体检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106599847A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106997721A (zh) * | 2017-04-17 | 2017-08-01 | 深圳奥比中光科技有限公司 | 绘制2d地图的方法、装置及存储装置 |
CN107588511A (zh) * | 2017-09-21 | 2018-01-16 | 四川长虹电器股份有限公司 | 基于等高线及hog人体检测的空调能源管理系统及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186776A (zh) * | 2013-04-03 | 2013-07-03 | 西安电子科技大学 | 基于多特征和深度信息的人体检测方法 |
CN104182729A (zh) * | 2014-07-31 | 2014-12-03 | 四川长虹电器股份有限公司 | 基于arm嵌入式平台的行人检测方法 |
-
2016
- 2016-12-15 CN CN201611158655.7A patent/CN106599847A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186776A (zh) * | 2013-04-03 | 2013-07-03 | 西安电子科技大学 | 基于多特征和深度信息的人体检测方法 |
CN104182729A (zh) * | 2014-07-31 | 2014-12-03 | 四川长虹电器股份有限公司 | 基于arm嵌入式平台的行人检测方法 |
Non-Patent Citations (4)
Title |
---|
PIOTR DOLLAR 等: "Integral Channel Features", 《PROCEEDINGS OF THE BRITISH MACHINE VISION CONFERENCE》 * |
POITR DOLLAR 等: "The Fastest Pedestrian Detector in the West", 《PROCEEDINGS OF THE BRITISH MACHINE VISION CONFERENCE》 * |
樊重俊,刘臣,霍良安: "《大数据分析与应用》", 31 January 2016 * |
江源远: "基于计算机视觉的车辆前方行人检测算法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106997721A (zh) * | 2017-04-17 | 2017-08-01 | 深圳奥比中光科技有限公司 | 绘制2d地图的方法、装置及存储装置 |
CN107588511A (zh) * | 2017-09-21 | 2018-01-16 | 四川长虹电器股份有限公司 | 基于等高线及hog人体检测的空调能源管理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109670429B (zh) | 一种基于实例分割的监控视频多目标人脸检测方法及系统 | |
WO2019228211A1 (zh) | 基于车道线的智能驾驶控制方法和装置、电子设备 | |
CN102043950B (zh) | 基于canny算子和边缘点统计的车辆轮廓识别方法 | |
CN108009518A (zh) | 一种基于快速二分卷积神经网络的层次化交通标识识别方法 | |
CN104915642B (zh) | 前方车辆测距方法及装置 | |
CN105551264A (zh) | 一种基于车牌特征匹配的车速检测方法 | |
CN104077577A (zh) | 一种基于卷积神经网络的商标检测方法 | |
CN108280450A (zh) | 一种基于车道线的高速公路路面检测方法 | |
CN109918971B (zh) | 监控视频中人数检测方法及装置 | |
CN103632159B (zh) | 训练分类器、图像中文字区域检测的方法及系统 | |
WO2023279966A1 (zh) | 一种多车道线检测方法、装置及检测设备 | |
CN106056078B (zh) | 一种基于多特征回归式集成学习的人群密度估计方法 | |
CN107194946A (zh) | 一种基于fpga的红外显著物体检测方法 | |
CN106845458A (zh) | 一种基于核超限学习机的快速交通标识检测方法 | |
Su et al. | A new local-main-gradient-orientation HOG and contour differences based algorithm for object classification | |
Mammeri et al. | North-American speed limit sign detection and recognition for smart cars | |
CN110188607A (zh) | 一种多线程并行计算的交通视频目标检测方法及装置 | |
CN106599847A (zh) | 基于深度信息的人体检测方法 | |
CN107977608B (zh) | 一种应用于公路视频图像道路区域提取的方法 | |
CN106548195A (zh) | 一种基于改进型hog‑ulbp特征算子的目标检测方法 | |
CN108009480A (zh) | 一种基于特征识别的图像人体行为检测方法 | |
CN108647605A (zh) | 一种结合全局颜色与局部结构特征的人眼凝视点提取方法 | |
CN113221739A (zh) | 基于单目视觉的车距测量方法 | |
CN104966064A (zh) | 基于视觉的前方行人测距方法 | |
Nguyen et al. | Real-time pedestrian detection using a support vector machine and stixel information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170426 |
|
RJ01 | Rejection of invention patent application after publication |