CN107491712A - 一种基于rgb‑d图像的人体识别方法 - Google Patents

一种基于rgb‑d图像的人体识别方法 Download PDF

Info

Publication number
CN107491712A
CN107491712A CN201610405934.2A CN201610405934A CN107491712A CN 107491712 A CN107491712 A CN 107491712A CN 201610405934 A CN201610405934 A CN 201610405934A CN 107491712 A CN107491712 A CN 107491712A
Authority
CN
China
Prior art keywords
depth
hod
mrow
msub
window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610405934.2A
Other languages
English (en)
Inventor
廖鸿宇
陶学宇
孙放
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Thunderous Yun He Intellectual Technology Co Ltd
Original Assignee
Beijing Thunderous Yun He Intellectual Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Thunderous Yun He Intellectual Technology Co Ltd filed Critical Beijing Thunderous Yun He Intellectual Technology Co Ltd
Priority to CN201610405934.2A priority Critical patent/CN107491712A/zh
Publication of CN107491712A publication Critical patent/CN107491712A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种基于RGB‑D图像的人体识别方法,该方法通过构建一个面向深度的直方图(HOD),HOD对深度变化方向进行局部的编码并且依赖于一个深度信息的规模空间搜索;接着将视觉HOG与深度HOD相结合,提出Combo‑HOD检测方法,该方法依赖于深度图和RGB数据并将它们作为传感器输入数据;并与其他检测方法进行对比,结果显示该方法能够实现EER值为85%,是普通传感器直接获得的操作空间的4倍以上,证明图像深度和RGB‑D所提供的图像信息的结合会加宽可靠的人体识别任务的条件,多模态图像也会帮助人体检测并使得在一些单层图像检测器上变得可行。

Description

一种基于RGB-D图像的人体识别方法
技术领域
本发明属于计算机视觉和模式识别领域,尤其涉及一种基于RGB-D图像的人体识别方法。
背景技术
对于许多机器人、交互系统以及智能交通,人体识别是一个重要并且基础的部分。在这个项目中,摄像头和测距仪是目前比较通用的传感器。每个传感器的感知通道既有优点也有缺点,因此它们间的区别主要取决于所提供的图像和范围数据的可靠性。
许多机器人学方面的研究者对范围数据中识别人体的方法进行了研究。早期工作主要采用2D范围数据来完成这个任务,在3D范围数据中的人体识别及其相关工作又成为一个新的问题。
在计算机视觉中,从单个图片识别人体这个问题已经被研究过很长一段时间了。近期的工作主要采用基于部分的投票或者窗口卷动。在前者方法中,人体部分独立为一个人的出现进行投票;后者的窗口卷动方法中,通过在不同图像的尺度空间位置卷动一个固定长度的检测窗口,对窗口下的区域进行分类。其它工作主要是解决多模式的人体识别问题:提出一个可训练的2D范围数据和摄像头系统,采用立体音响系统并结合强图像和低分辨率摄像机来采集不同地图和光流的图像数据。上述检测方法在行人流动十分密集的情况下的检测性能会有所下降,从而导致表现的性能不佳。
发明内容
本发明的目的在于针对上述技术中存在的缺陷,提出了一种基于RGB-D图像的人体识别方法。首先,构建一个面向深度的直方图(HOD),HOD对深度变化方向进行局部的编码并且依赖于一个深度信息的规模空间搜索,此搜索方法将将检测过程速度提高到原来的3倍;接着,将视觉HOG与深度HOD相结合提出了Combo-HOD,这个检测方法依赖于深度图和RGB数据并将它们作为传感器输入数据。
为了实现上述目的,本发明提供的技术方案如下:一种基于RGB-D图像的人体识别方法,主要包括如下步骤:
步骤1、构建面向深度的直方图(HOD)
步骤1.1、运算法则:首先将固定长度的窗口划分成网格并计算每个网格对应的深度梯度值;接着将这些面向深度的梯度值累积到1D的直方图中;然后将每四个网格相结合形成一个描述信息块;最后将这些描述信息块收集在一起并将直方图标准化成L2-Hys单元长度,使得其在局部深度噪声下表现高水平的稳健性,HOD特征的结果被用于训练柔和的线性支持向量机(SVM)。
步骤1.2、深度图像处理:由于原始的深度图像主要由一些对真实的标准深度非常不均匀地编码的值组成,对于很远的物体,一个深度值的差异能够与一个15厘米的跳跃范围相对应,因此,采用公式d=8BFx/(Vmax-v)对原始范围深度图像数据进行处理来加强前景和后景的区分度;然后,将上述公式得到结果的d值乘上M/Dmax,其中M=100是一个常量,Dmax=20是一个以米为单位的最大考虑范围。这个处理步骤旨在提升图像强度的反差,在此,可以充分利用微软Kinect RGB-D传感器的优点来取消物理声音模型的非线性。
步骤1.3、深度信息的规模空间搜索:采用深度信息作为搜索过程的指导,创建一个快速在深度图的每个位置区分可兼容的范围的方法;
步骤1.3.1、计算基于深度范围的回归值s:从训练数集中计算得到平均人体身高Hm,地面位置和每个样本的高度能够被准确地注释,公式如下所示:
其中,Fy是IR摄像头的垂直焦距长度,Hm=1.74米是所监测到人体平均身高,Hw是计算基于深度范围的回归值s中以米为单位的窗口的高度。上述公式的左边部分代表了图像在半平面的投影高度Hm,这与摄像头所处的距离d相垂直。为了限制内存的使用,上述等式每个部分被量化到1/3的规模。
然后,计算深度图的每个像素点的范围s来生成一个范围地图,从这个范围地图中,推导出所有使用的范围S的列表,列表只包括图像中与人体表现相兼容的范围,这个方法避免了在一些不均匀搜索(例如图像金字塔)解决方案中对许多范围的考虑。
对于给定的范围列表S,S由每个图像计算得到,开始深度信息的规模空间搜索时,只有当搜索窗口的深度信息与S中的值相对应才能被送到SVM分类器进行下一步。在列表S选择一个范围s并检测该窗口下的深度值是否与每个规模空间的位置相符合。
步骤1.3.2、采用集成图像技术检测该窗口下的深度值是否与每个规模空间的位置相符合,在检测阶段,从列表S选取范围s,接着,对于每个搜索窗口位置,测试该搜索窗口下集成张量层中对应的s的范围集成:如果结果大于0,那么这里至少有一个在该窗口下兼容的深度像素点并且计算出HOD的值;否则,检测窗口不会被考虑并且继续整个过程。
步骤2、RGB-D人体检测:提出一个新型的检测器Combo-HOD,用于结合感知暗示,该检测器对于检测光照强度的变化的深度数据十分稳健,同时对于低信号强度的返回十分敏感并且会受到有限的深度分辨率的影响;图像数据在纹理和颜色方面十分饱满,并且有着高强度的角度分辨率。
步骤2.1、Combo-HOD的数据集训练分类:在图像数据训练方面采用的是HOG检测器,而在深度数据训练方面采用的是HOD检测器;
依赖于步骤1.3中所述的深度信息的规模空间搜索:每个时刻一个检测窗口有一个兼容的范围,在深度图中计算HOD描述信息块,同时,用同样的窗口在彩色图像中计算HOG描述信息块;当没有可以使用的深度图像后,检测器轻微地降低成为常用的HOG检测器;最后,对外在参数是否在两幅图像之间提供合适对应关系进行校准。
步骤2.2、结合HOG和HOD描述信息块:学习的SVM的决定函数为HOD/HOG描述信息块与SVM超平面的点乘加上SVM的偏移值。为了结合这两部分的信息,对于每个SVM的输出建立了一个S形函数,这个函数将这些值映射到一个概率轴上,从HOD检测器得到的概率值记作pD,而从HOG检测器得到的概率值记作pG,那么,通过信息滤波结合的方程如下所示:
其中p是检测到人体的概率,是在有效集合中的同等错误率点下的HOD检测器错误的负值的数量与HOG检测器错误的负值数量的比值,并且有
本发明具有如下有益效果:
1)本发明构建的面向深度的直方图(HOD),对深度变化方向进行局部的编码并且依赖于一个深度信息规模空间搜索,此搜索方法将将检测过程速度提高到原来的3倍。
2、提出的Combo-HOD检测方法为将视觉HOG与深度HOD相结合,该方法依赖于深度图和RGB数据并将它们作为传感器输入数据;并与其他检测方法进行对比,结果显示该方法能够实现EER值为85%,是普通传感器直接获得的操作空间的4倍以上。
附图说明
图1为本发明所述的基于RGB-D图像的人体识别方法流程图。
具体实施方式
概要
为了全面的理解本发明的各种原理,以下首先对本发明中用到的术语进行了说明:
微软Kinect RGB-D传感器
该传感器主要由一个红外线摄像头,一个红外线投影仪和一个标准的彩色摄像头组成;为了检测深度,传感器主要服从结构的红外光线的原则。深度图在每个像素的11个比特有640*480像素分辨率,然而并不是所有的比特被用来编码深度图,超出范围的值被标记成Vmax=1084,最小范围被标记成Vmin=290,最后只有794个值用于对每个像素点上的深度信息进行编码;
原始深度值v和度量深度d计算公式如下:
其中,B=0.075m,为红外线投影仪到红外线摄像头的距离,Fx是红外线摄像头在水平方向上的焦距;d以米为单位,d的负值会被舍弃掉;上述方程是一个双曲线的关系类似于在立体照相机系统中从点对点的对应关系推测其深度;
在一些实施例中,检测人体的距离在0米到8米,这个范围几乎比标准的四倍还要大,因为存在深度分辨能力的损失,86.9%的深度值用于区间0米到2.5米范围内的编码;留下的140个值用来描述2.5米到8米范围内的编码,这个影响服从公式1的双曲线特征;另一个方面,尤其是在很远的距离的时候,对于表面材料受到的影响十分突出,强烈的IR吸收表面会导致映射模式被一很低的信号强度反射回来,造成深度图像的损失。
面向梯度的直方图(HOG)
HOG目前是表现最佳并且被广为采用的用于视觉人体检测的方法之一,主要采用固定长度的检测窗口,这些窗口被均匀地划分成密集的小网格;对于每个网格,在每个像素之上计算其对应的梯度方向并且被采集到一个1D的直方图。事实上,局部外观和形状能够通过局部梯度的分布被特征化,而这些局部梯度的分布是除去了它们在网格中具体的位置。一组相邻的网格称之为一块,这些块被局部地用来使差异更加标准化。通过连接所有的直方图块建立描述信息块,描述信息块被用于训练线性支持向量机(SVM)。至于说人体检测,检测窗口在一些范围的图像之上被卷曲。对于每个位置和范围,HOG描述信息块被计算并用SVM学习方法将其分类。
具体说明
一种基于RGB-D图像的人体识别方法,该方法包括以下步骤:如附图1所示
步骤1、构建面向深度的直方图(HOD)
步骤1.1、运算法则:首先将固定长度的窗口划分成网格并计算每个网格对应的深度梯度值;接着将这些面向深度的梯度值累积到1D的直方图中;然后将每四个网格相结合形成一个描述信息块;最后将这些描述信息块收集在一起并将直方图标准化成L2-Hys单元长度,使得其在局部深度噪声下表现高水平的稳健性,HOD特征的结果被用于训练柔和的线性支持向量机(SVM)。
步骤1.2、深度图像处理:由于原始的深度图像主要由一些对真实的标准深度非常不均匀地编码的值组成,对于很远的物体,一个深度值的差异能够与一个15厘米的跳跃范围相对应,因此,采用公式1对原始范围深度图像数据进行处理来加强前景和后景的区分度;然后,将公式1中得到的结果d值乘上M/Dmax,其中M=100是一个常量,Dmax=20是一个以米为单位的最大考虑范围。这个处理步骤旨在提升图像强度的反差,在此,可以充分利用微软Kinect RGB-D传感器的优点来取消物理声音模型的非线性。
步骤1.3、深度信息的规模空间搜索:采用深度信息作为搜索过程的指导,创建一个快速在深度图的每个位置区分可兼容的范围的方法;
步骤1.3.1、计算基于深度范围的回归值s:从训练数集中计算得到平均人体身高Hm,地面位置和每个样本的高度能够被准确地注释,公式如下所示:
其中,Fy是IR摄像头的垂直焦距长度,Hm=1.74米是所监测到人体平均身高,Hw是计算基于深度范围的回归值s中以米为单位的窗口的高度。上述公式的左边部分代表了图像在半平面的投影高度Hm,这与摄像头所处的距离d相垂直。为了限制内存的使用,上述等式每个部分被量化到1/3的规模。
然后,计算深度图的每个像素点的范围s来生成一个范围地图,从这个范围地图中,推导出所有使用的范围S的列表,列表只包括图像中与人体表现相兼容的范围,这个方法避免了在一些不均匀搜索(例如图像金字塔)解决方案中对许多范围的考虑。
对于给定的范围列表S,S由每个图像计算得到,开始深度信息的规模空间搜索时,只有当搜索窗口的深度信息与S中的值相对应才能被送到SVM分类器进行下一步。在列表S选择一个范围s并检测该窗口下的深度值是否与每个规模空间的位置相符合。
步骤1.3.2、采用集成图像技术检测该窗口下的深度值是否与每个规模空间的位置相符合,在检测阶段,从列表S选取范围s,接着,对于每个搜索窗口位置,测试该搜索窗口下集成张量层中对应的s的范围集成:如果结果大于0,那么这里至少有一个在该窗口下兼容的深度像素点并且计算出HOD的值;否则,检测窗口不会被考虑并且继续整个过程。
集成图像技术的建立其自身是一个时间复杂度为O(N)的过程,其中N的值取决于非规模的初始图像的大小,集成图像技术的关键性好处在于计算一个集成区域只需要做四次减法。
集成张量是指多层的集成有着和范围S一样多的层数的图像,每层的集成张量是一个二元图像,图像中非白色像素点对应的是层数的规模。这使得测试一个搜索窗口是否包含至少一个特定范围中的像素点变为可能,集成张量的建立只需要在每幅图像实现一次。
步骤2、RGB-D人体检测:提出一个新型的检测器Combo-HOD,用于结合感知暗示,该检测器对于检测光照强度的变化的深度数据十分稳健,同时对于低信号强度的返回十分敏感并且会受到有限的深度分辨率的影响;图像数据在纹理和颜色方面十分饱满,并且有着高强度的角度分辨率。
步骤2.1、Combo-HOD的数据集训练分类:在图像数据训练方面采用的是HOG检测器,而在深度数据训练方面采用的是HOD检测器;
依赖于步骤3中所述的深度信息的规模空间搜索:每个时刻一个检测窗口有一个兼容的范围,在深度图中计算HOD描述信息块,同时,用同样的窗口在彩色图像中计算HOG描述信息块;当没有可以使用的深度图像D后,检测器轻微地降低成为常用的HOG检测器;最后,对外在参数是否在两幅图像之间提供合适对应关系进行校准。
步骤2.2、HOG和HOD描述信息块被分类后,学习的SVM的决定函数为HOD/HOG描述信息块与SVM超平面的点乘加上SVM的偏移值。为了结合这两部分的信息,对于每个SVM的输出建立了一个S形函数,这个函数将这些值映射到一个概率轴上,从HOD检测器得到的概率值记作pD,而从HOG检测器得到的概率值记作pG,那么,通过信息滤波结合的方程如下所示:
其中p是检测到人体的概率,是在有效集合中的同等错误率点下的HOD检测器错误的负值的数量与HOG检测器错误的负值数量的比值,并且有
以下描述为新型HOD检测器与其它基于深度的技术,视觉技术以及新型多模型的RGB-D检测方法Combo-HOD的对比。
对于给定的Kinect中的深度量化的重要性,评估了两个HOD变量:结果显示HOD11比HOD8在整个精确度的表现更佳,因为额外的3个比特用于编码深度图像有助于将人体从背景中消除。这个对于所有对于深度数据的预处理操作同样适用。对于HOD11,最好的预处理技术能够在理论上保证声音技术能够比ad-hoc启发法表现更佳。更加明确地,HOD11的EER有83%而HOD8的EER最好情况只有75%。
在对纯粹的视觉检测技术之上的深度信息的分布进行评价方面,本发明评价了视觉HOG检测器的和一个视觉的Adaboost检测器的表现。实验结果显示,两者的表现都比HOD11和Combo-HOD的表现要差很多。这个结果的主要原因是光强因素:这些数据集的环境并没有被理想化地照亮,黑暗区域导致了移动的人体出现模糊的情况,这是因为KinectRGB摄像头自动地扩大快门时间来生成更亮的图像;有着直接光照的背景区域导致了饱和的图像区域以及很差的对比。结果证实了在一系列条件下工作的人体检测系统的需求比单纯的视觉检测方法要广,同时,这也导致了对深度信息的采用。
在基于图像技术中与几何方法的对比也是显得同等重要,本发明评估了HOD11和BUTD,其中BUTD是一个3D人体检测,而它的数据是3D数据例如从传感器中获得的点云。结果显示,HOD11在EER的数值上更好一些,其值为72%。注意到BUTD仍然轻微地降低并且能够产生非常高的精确度(达到98%),然而,BUTD这个技术十分依赖于外观信息,因此,如果距离较远的话会造成分辨率降低的问题。尤其地,BUTD的范围图像分割在和粗糙量化的深度数据下表现不佳。然而,在深度分辨率几近于常数的近距离范围的情况下两者的表现不相上下,其EER均在86%左右。这个结果证实了基于外观方法的适当性会使得数据变得更加有质量。
同时,本发明将HOD对每幅图像的信息规模空间搜索方法和常规非信息HOD方法(记作HOD-)进行比较,HOD-采用以5%为范围增量并且不考虑图像内容的金字塔搜索;HOD范围是一个深度和每个新的深度图像变化的函数,声明了一个几乎三倍的在范围数量上的减量,这样能够搜索所有数据集中的所有图像,这表明在HOD和HOD-之间每幅图像大约可以提升三倍的处理时间。
最后,在与其他所有技术的对比后,所提出的Combo-HOD有着明显的优势,Combo-HOD实现了最高EER为85%。,这说明图像深度和RGB-D所提供的图像信息的结合会加宽可靠的人体识别任务的条件,多模态图像也会帮助人体检测并使得在一些单层图像提示检测器上变得可行。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内的所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于RGB-D图像的人体识别方法,其特征在于,包括如下步骤:
步骤1、构建面向深度的直方图(HOD)
步骤1.1、运算法则:首先将固定长度的窗口划分成网格并计算每个网格对应的深度梯度值;接着将这些面向深度的梯度值累积到1D的直方图中;然后将每四个网格相结合形成一个描述信息块;最后将这些描述信息块收集在一起并将直方图标准化成L2-Hys单元长度,使得其在局部深度噪声下表现高水平的稳健性,HOD特征的结果被用于训练柔和的线性支持向量机(SVM);
步骤1.2、深度图像处理:首先,根据公式d=8BFx/(Vmax-v)对原始范围深度图像数据进行处理来加强前景和后景的区分度;然后,将上述公式的结果d值乘上M/Dmax,其中M=100是一个常量,Dmax=20是一个以米为单位的最大考虑范围;
步骤1.3、深度信息的规模空间搜索:首先计算基于深度范围的回归值s;然后计算深度图的每个像素点的范围s来生成一个范围地图,从这个范围地图中,推导出所有使用的范围S的列表;在给定的范围列表S中选择一个范围s,采用集成图像技术检测该窗口下的深度值是否与每个规模空间的位置相符合,只有当搜索窗口的深度信息与给定的范围列表S中的值相对应才能被送到SVM分类器进行下一步;
步骤2、Combo-HOD:RGB-D人体检测
步骤2.1、Combo-HOD的数据集训练分类:依赖于步骤1.3中所述的深度信息的规模空间搜索:每个时刻一个检测窗口有一个兼容的范围,在深度图中计算HOD描述信息块;同时,采用同样的窗口在彩色图像中计算HOG描述信息块;当没有可以使用的深度图像后,检测器轻微地降低成为常用的HOG检测器;最后,对外在参数是否在两幅图像之间提供合适对应关系进行校准;
步骤2.2、结合HOG和HOD描述信息块:学习的SVM的决定函数为HOD/HOG描述信息块与SVM超平面的点乘加上SVM的偏移值;为了结合这两部分的信息,对于每个SVM的输出建立了一个S形函数,这个函数将这些值映射到一个概率轴上,从HOD检测器得到的概率值记作pD,从HOG检测器得到的概率值记作pG,通过信息滤波结合的方程如下所示:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>p</mi> <mo>=</mo> <msub> <mi>p</mi> <mi>D</mi> </msub> <mo>+</mo> <mi>k</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>p</mi> <mi>G</mi> </msub> <mo>-</mo> <msub> <mi>p</mi> <mi>D</mi> </msub> </mrow> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>k</mi> <mo>=</mo> <mfrac> <msubsup> <mi>&amp;sigma;</mi> <mi>D</mi> <mn>2</mn> </msubsup> <mrow> <msubsup> <mi>&amp;sigma;</mi> <mi>D</mi> <mn>2</mn> </msubsup> <mo>+</mo> <msubsup> <mi>&amp;sigma;</mi> <mi>D</mi> <mn>2</mn> </msubsup> </mrow> </mfrac> </mrow> </mtd> </mtr> </mtable> </mfenced>
其中p是检测到人体的概率,是在有效集合中的同等错误率点下的HOD检测器错误的负值的数量与HOG检测器错误的负值数量的比值,并且有
2.根据权利要求1所述的人体识别方法,其特征在于:步骤1.3中所述的计算基于深度范围的回归值s的方法如下:从训练数集中计算得到平均人体身高Hm,地面位置和每个样本的高度能够被准确地注释,公式如下所示:
<mrow> <mi>s</mi> <mo>=</mo> <mfrac> <mrow> <msub> <mi>F</mi> <mi>y</mi> </msub> <mo>&amp;CenterDot;</mo> <msub> <mi>H</mi> <mi>m</mi> </msub> </mrow> <mi>d</mi> </mfrac> <mo>&amp;CenterDot;</mo> <mfrac> <mn>1</mn> <msub> <mi>H</mi> <mi>w</mi> </msub> </mfrac> </mrow>
其中,Fy是IR摄像头的垂直焦距长度,Hm=1.74米是所监测到人体平均身高,Hw是计算基于深度范围的回归值s中以米为单位的窗口的高度。
3.根据权利要求1所述的人体识别方法,其特征在于:步骤1.3中所述采用集成图像技术检测该窗口下的深度值是否与每个规模空间的位置相符合,具体描述为:在检测阶段,从给定的列表S选取范围s,接着,对于每个搜索窗口位置,测试该搜索窗口下集成张量层中对应的s的范围集成,如果结果大于0,那么这里至少有一个在该窗口下兼容的深度像素点并且计算出HOD的值;否则,检测窗口不会被考虑并且继续整个过程。
CN201610405934.2A 2016-06-09 2016-06-09 一种基于rgb‑d图像的人体识别方法 Pending CN107491712A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610405934.2A CN107491712A (zh) 2016-06-09 2016-06-09 一种基于rgb‑d图像的人体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610405934.2A CN107491712A (zh) 2016-06-09 2016-06-09 一种基于rgb‑d图像的人体识别方法

Publications (1)

Publication Number Publication Date
CN107491712A true CN107491712A (zh) 2017-12-19

Family

ID=60641894

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610405934.2A Pending CN107491712A (zh) 2016-06-09 2016-06-09 一种基于rgb‑d图像的人体识别方法

Country Status (1)

Country Link
CN (1) CN107491712A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108209926A (zh) * 2018-01-08 2018-06-29 西安科技大学 基于深度图像的人体身高测量系统
CN109035305A (zh) * 2018-08-10 2018-12-18 中北大学 一种基于rgb-d低视角情况下的室内人体检测与跟踪方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971380A (zh) * 2014-05-05 2014-08-06 中国民航大学 基于rgb-d的行人尾随检测方法
CN103994765A (zh) * 2014-02-27 2014-08-20 北京工业大学 一种惯性传感器的定位方法
CN104598890A (zh) * 2015-01-30 2015-05-06 南京邮电大学 一种基于rgb-d视频的人体行为识别方法
CN104732222A (zh) * 2015-04-07 2015-06-24 中国科学技术大学 一种基于深度摄像头的多特征人体识别方法
CN105550687A (zh) * 2015-12-02 2016-05-04 西安电子科技大学 一种基于isa模型的rgb-d图像的多通道融合特征提取方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103994765A (zh) * 2014-02-27 2014-08-20 北京工业大学 一种惯性传感器的定位方法
CN103971380A (zh) * 2014-05-05 2014-08-06 中国民航大学 基于rgb-d的行人尾随检测方法
CN104598890A (zh) * 2015-01-30 2015-05-06 南京邮电大学 一种基于rgb-d视频的人体行为识别方法
CN104732222A (zh) * 2015-04-07 2015-06-24 中国科学技术大学 一种基于深度摄像头的多特征人体识别方法
CN105550687A (zh) * 2015-12-02 2016-05-04 西安电子科技大学 一种基于isa模型的rgb-d图像的多通道融合特征提取方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LUCIANO SPINELLO等: "People Detection in RGB-D Data", 《2011 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108209926A (zh) * 2018-01-08 2018-06-29 西安科技大学 基于深度图像的人体身高测量系统
CN109035305A (zh) * 2018-08-10 2018-12-18 中北大学 一种基于rgb-d低视角情况下的室内人体检测与跟踪方法
CN109035305B (zh) * 2018-08-10 2021-06-25 中北大学 一种基于rgb-d低视角情况下的室内人体检测与跟踪方法

Similar Documents

Publication Publication Date Title
CN110378196B (zh) 一种结合激光点云数据的道路视觉检测方法
CN104536009B (zh) 一种激光红外复合的地面建筑物识别及导航方法
CN107705288B (zh) 伪目标运动强干扰下的危险气体泄漏红外视频检测方法
CN112084869B (zh) 一种基于紧致四边形表示的建筑物目标检测方法
CN105740910A (zh) 一种车辆物件检测方法及装置
CN104700381A (zh) 一种基于显著目标的红外与可见光图像融合方法
CN105631852B (zh) 基于深度图像等高线的室内人体检测方法
CN102982334B (zh) 基于目标边缘特征与灰度相似性的稀疏视差获取方法
CN106503170B (zh) 一种基于遮挡维度的图像库构建方法
CN105678318B (zh) 交通标牌的匹配方法及装置
CN113326735B (zh) 一种基于YOLOv5的多模态小目标检测方法
CN103942786B (zh) 无人机可见光和红外图像的自适应团块目标检测方法
CN103106668A (zh) 基于颜色直方图来描述图像区域的方法和系统
CN107203743B (zh) 一种人脸深度跟踪装置及实现方法
CN113033315A (zh) 一种稀土开采高分影像识别与定位方法
CN109214331A (zh) 一种基于图像频谱的交通雾霾能见度检测方法
CN106295657A (zh) 一种视频数据结构化过程中提取人体高度特征的方法
CN106887002A (zh) 一种红外图像序列显著性检测方法
CN103065163A (zh) 一种基于静态图片的快速目标检测识别系统及方法
CN107491712A (zh) 一种基于rgb‑d图像的人体识别方法
CN114724094A (zh) 一种基于三维图像与雷达技术的闸道口车内人数计量系统
CN112699748B (zh) 基于yolo及rgb图像的人车距离估计方法
CN105447880A (zh) 一种票房人数核验方法、装置及系统
CN103136536A (zh) 对象检测系统和方法、图像的特征提取方法
CN110738123B (zh) 识别密集陈列商品的方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171219

WD01 Invention patent application deemed withdrawn after publication