CN108549855A - 面向智能家居场景的实时人形检测方法 - Google Patents

面向智能家居场景的实时人形检测方法 Download PDF

Info

Publication number
CN108549855A
CN108549855A CN201810280722.5A CN201810280722A CN108549855A CN 108549855 A CN108549855 A CN 108549855A CN 201810280722 A CN201810280722 A CN 201810280722A CN 108549855 A CN108549855 A CN 108549855A
Authority
CN
China
Prior art keywords
image
humanoid
real
background
household scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810280722.5A
Other languages
English (en)
Inventor
张晖
张迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201810280722.5A priority Critical patent/CN108549855A/zh
Publication of CN108549855A publication Critical patent/CN108549855A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Abstract

面向智能家居场景的实时人形检测方法,包括如下步骤:S1、预处理一张无人物的家居场景图像作为背景图;S2、预处理视频流中的每一帧图像,获取当前帧处理后的图像;S3、通过背景减除法对当前帧处理后的图像和预处理后的背景图进行处理,获人形所在区域的图像;S4、人形所在区域的图像中的每个像素的灰度值与设定好的阈值进行比较,获取掩码图,利用矩形拟合掩码图,获取人形图像;S5、分离人形图像的红色、绿色、蓝色通道图像,获取该人形图像的HOG特征;S6、通过SVM对人形图像的HOG特征进行训练,获取人形模型。该方法通过背景减除法分割人形图形,再利用矩形框拟合掩码图,提取人形图像的HOG特征,训练人形模型,可以快速准确的检测人形图像。

Description

面向智能家居场景的实时人形检测方法
技术领域
本发明属于智能识别技术领域,具体涉及一种面向智能家居场景的实时人形检测方法。
背景技术
人形检测是指在图像中检测是否有人形,对人形图像进行特征提取,通过提取的特征来对人形进行检测。
据申请人了解,家居场景下实时检测人形较为复杂,需要把视频流分解成一帧帧图片,使用背景减除法获取当前人形区域图,提取有效的特征来表述人形,并对特征进行训练得到人形模型。但当今市场上,具有人形检测功能的智能家居设备较为少见,大多人形检测产品检测效果并不理想,同时,这些产品过于依赖联网云端服务器,在没有网络的情况下无法进行工作,无法对多种电气设备进行有效控制。
手势识别是指在图像中获取人物的手势图像,从手势图像中提取特征,通过对识别提取的特征获取手势的含义。在家居场景下可以通过识别用户手势,达到控制家居电气设备的效果。用户使用简单的手势就能控制电视、空调、灯光等设备的运行。
据申请人了解,当今市场上,具有手势识别功能的智能家居设备较为少见,大多手势识别产品只能识别肢体动作,无法对手势进行识别,且识别效果并不理想,同时,这些产品过于依赖联网云端服务器,在没有网络的情况下无法进行工作,无法对多种电气设备进行有效控制。
本发明中的SVM指的是支持向量机,是常见的一种判别方法。在机器学习领域,通常用来进行模式识别、分类以及回归分析。SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中,使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。简单地说,就是升维和线性化.升维,就是把样本向高维空间做映射。但是作为分类、回归等问题来说,很可能在低维样本空间无法线性处理的样本集,在高维特征空间中却可以通过一个线性超平面实现线性划分(或回归)。
常用的核函数有以下4种:
线性核函数K(x,y)=x·y;
多项式核函数K(x,y)=[(x·y)+1]^d;
径向基函数K(x,y)=exp(-|x-y|^2/d^2);
二层神经网络核函数K(x,y)=tanh(a(x·y)+b)。
发明内容
本发明的目的在于:提供一种面向智能家居场景的实时人形检测方法,通过背景减除法分割人形图形,再利用矩形框拟合掩码图,提取人形图像的HOG特征,训练人形模型,可以快速准确的检测人形图像。
为了达到以上目的,提供一种面向智能家居场景的实时人形检测方法,包括如下步骤:
S1、选取一张无人物的家居场景图像作为背景图,使用gammma校正法对背景图进行颜色空间标准化,再通过高斯滤波处理获取预处理后的背景图;
S2、使用gammma校正法对实时采集的视频流中的的每一帧图像进行颜色空间标准化,再通过高斯滤波处理获取当前帧处理后的图像;
S3、通过背景减除法对当前帧处理后的图像和预处理后的背景图进行处理,获人形所在区域的图像;
S4、人形所在区域的图像中的每个像素的灰度值与设定好的阈值进行比较,获取掩码图,利用矩形拟合掩码图,截取当前帧处理后的图像中对应的矩形部分,获取人形图像;并调整大小为128×64;
S5、分离人形图像的红色通道图像、绿色通道图像、蓝色通道图像,将分离后的图像分成若干个小单元,统计每个小单元的梯度直方图,再将每3×3个小单元组成一个大单元,串联大单元中所有小单元的HOG特征,获取大单元的HOG特征,将人形图像内所有大单元的HOG特征归一化后串联。获取该人形图像的HOG特征;
S6、通过SVM对人形图像的HOG特征进行训练,获取人形模型。
本发明的优选方案是:步骤S3中,背景减除法是将当前帧处理后的图像对比预处理后的背景图,对比出人形所在区域的图像。
优选地,步骤S4中,设定好的阈值为50,判断图像中的像素灰度值是否大于阈值,若是,则该像素值置为255,否,则置为0,从而得到掩码图。
优选地,小单元包含6×6个像素。
优选地,步骤S5中,归一化采用(0,1)标准化,通过遍历大单元格内每个小单元格数据,并将最大值-最小值作为基数进行归一化处理:
其中,Min表示最小值,Min为0,Max表示最大值,Max为1。
优选地,步骤S6具体为:
S61、准备训练样本集合,包括正样本集和负样本集;
S62、手动裁剪样本,使样本尺寸保持一致;
S63、将裁剪后的所有正样本中相同的手势图像放在一个文件夹中,将裁剪后的所有负样本中相同的手势图像放在另一个文件夹中,之后将所有训练样本缩放到相同尺寸;
S64、提取所有样本的HOG特征,并赋予样本标签;
S65、将所有样本的HOG特征和样本标签输入SVM中训练;获取人形模型。
本发明有益效果为:该方法通过背景减除法分割人形图像,再用矩形框拟合掩码图,减少周围环境对人形检测的影响;通过提取人形图像的HOG特征,能有效地用特征表述人形图像,将提取的HOG特征使用SVM进行训练,得到人形模型,用于人形检测。能快速准确的对图像中的人形进行检测,适用于家居终端设备,提高了用户体验舒适度。
附图说明
下面结合附图对本发明作进一步的说明。
图1为本发明的方法流程示意图;
图2为本发明的对人形图像分割的流程示意框图;
图3为本发明的提取人形图像的HOG特征的流程示意框图。
具体实施方式
实施例一
请参阅图1,本实施例提供一种面向智能家居场景的实时人形检测方法,其中,步骤S1-S4为对人形图像分割的步骤,如图2所示;步骤S5为提取人形图像的HOG特征的步骤,如图3所示,包括如下步骤:
S1、选取一张无人物的家居场景图像作为背景图,使用gammma校正法对背景图进行颜色空间标准化,再通过高斯滤波处理获取预处理后的背景图Image0;
S2、使用gammma校正法对实时采集的视频流中的的每一帧图像进行颜色空间标准化,再通过高斯滤波处理获取当前帧处理后的图像;
S3、通过背景减除法对当前帧处理后的图像和预处理后的背景图Image0进行处理,获人形所在区域的图像Image1;
其中,Gamma校正是通过对图像的Gamma曲线进行编辑,以对图像进行非线性色调编辑的方法,检出图像信号中的深色部分和浅色部分,并使两者比例增大,从而提高图像对比度效果,降低图像局部的阴影和光照变化所造成的影响,同时可以抑制噪音的干扰;高斯滤波主要消除噪声对识别的影响。
S4、人形所在区域的图像Image1中的每个像素的灰度值与设定好的阈值进行比较,获取掩码图Image2,利用矩形拟合掩码图Image2,截取当前帧处理后的图像中对应的矩形部分,获取人形图像Image3;并调整大小为128×64;
S5、分离人形图像Image3的红色通道图像channel_r、绿色通道图像channel_g、蓝色通道图像channel_b,图像由红色、绿色、蓝色三个元素组成,R为红色通道,表示为1;G为绿色通道,表示为2;B为蓝色通道,表示为3;白色图像则为4,它是由1、2、3处的通道颜色混合而成。
将分离后的图像分成若干个小单元,每个小单元包含6×6个像素,统计每个小单元的梯度直方图,再将每3×3个小单元组成一个大单元,串联大单元中所有小单元的HOG特征,获取大单元的HOG特征,将人形图像内所有大单元的HOG特征归一化后串联。获取该人形图像的HOG特征;
S6、通过SVM对人形图像的HOG特征进行训练,获取人形模型。
步骤S3中,背景减除法是将当前帧处理后的图像对比预处理后的背景图,对比出人形所在区域的图像。
步骤S4中,设定好的阈值为50,判断图像中的像素灰度值是否大于阈值,若是,则该像素值置为255,否,则置为0,从而得到掩码图。
步骤S5中,归一化采用(0,1)标准化,通过遍历大单元格内每个小单元格数据,并将最大值-最小值作为基数进行归一化处理:
其中,Min表示最小值,Min为0,Max表示最大值,Max为1。
步骤S6具体为:
S61、准备训练样本集合,包括正样本集和负样本集;
S62、手动裁剪样本,使样本尺寸保持一致;
S63、将裁剪后的所有正样本中相同的手势图像放在一个文件夹中,将裁剪后的所有负样本中相同的手势图像放在另一个文件夹中,之后将所有训练样本缩放到相同尺寸;
S64、提取所有样本的HOG特征,并赋予样本标签;
S65、将所有样本的HOG特征和样本标签输入SVM中训练;获取人形模型。除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。

Claims (6)

1.面向智能家居场景的实时人形检测方法,其特征在于,包括如下步骤:
S1、选取一张无人物的家居场景图像作为背景图,使用gammma校正法对背景图进行颜色空间标准化,再通过高斯滤波处理获取预处理后的背景图;
S2、使用gammma校正法对实时采集的视频流中的的每一帧图像进行颜色空间标准化,再通过高斯滤波处理获取当前帧处理后的图像;
S3、通过背景减除法对当前帧处理后的图像和预处理后的背景图进行处理,获人形所在区域的图像;
S4、人形所在区域的图像中的每个像素的灰度值与设定好的阈值进行比较,获取掩码图,利用矩形拟合掩码图,截取当前帧处理后的图像中对应的矩形部分,获取人形图像;并调整大小为128×64;
S5、分离人形图像的红色通道图像、绿色通道图像、蓝色通道图像,将分离后的图像分成若干个小单元,统计每个小单元的梯度直方图,再将每3×3个小单元组成一个大单元,串联大单元中所有小单元的HOG特征,获取大单元的HOG特征,将人形图像内所有大单元的HOG特征归一化后串联。获取该人形图像的HOG特征;
S6、通过SVM对人形图像的HOG特征进行训练,获取人形模型。
2.根据权利要求1所述的面向智能家居场景的实时人形检测方法,其特征在于,所述步骤S3中,背景减除法是将当前帧处理后的图像对比预处理后的背景图,对比出人形所在区域的图像。
3.根据权利要求1所述的面向智能家居场景的实时人形检测方法,其特征在于,所述步骤S4中,设定好的阈值为50,判断图像中的像素灰度值是否大于阈值,若是,则该像素值置为255,否,则置为0,从而得到掩码图。
4.根据权利要求1所述的面向智能家居场景的实时人形检测方法,其特征在于,所述小单元包含6×6个像素。
5.根据权利要求1所述的面向智能家居场景的实时人形检测方法,其特征在于,所述步骤S5中,归一化采用(0,1)标准化,通过遍历大单元格内每个小单元格数据,并将最大值-最小值作为基数进行归一化处理:
其中,Min表示最小值,Min为0,Max表示最大值,Max为1。
6.根据权利要求1所述的面向智能家居场景的手势识别方法,其特征在于,所述步骤S6具体为:
S61、准备训练样本集合,包括正样本集和负样本集;
S62、手动裁剪样本,使样本尺寸保持一致;
S63、将裁剪后的所有正样本中相同的手势图像放在一个文件夹中,将裁剪后的所有负样本中相同的手势图像放在另一个文件夹中,之后将所有训练样本缩放到相同尺寸;
S64、提取所有样本的HOG特征,并赋予样本标签;
S65、将所有样本的HOG特征和样本标签输入SVM中训练;获取人形模型。
CN201810280722.5A 2018-04-02 2018-04-02 面向智能家居场景的实时人形检测方法 Pending CN108549855A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810280722.5A CN108549855A (zh) 2018-04-02 2018-04-02 面向智能家居场景的实时人形检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810280722.5A CN108549855A (zh) 2018-04-02 2018-04-02 面向智能家居场景的实时人形检测方法

Publications (1)

Publication Number Publication Date
CN108549855A true CN108549855A (zh) 2018-09-18

Family

ID=63517605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810280722.5A Pending CN108549855A (zh) 2018-04-02 2018-04-02 面向智能家居场景的实时人形检测方法

Country Status (1)

Country Link
CN (1) CN108549855A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978907A (zh) * 2019-03-22 2019-07-05 南京邮电大学 一种面向家居场景的学生坐姿检测方法
CN112101090A (zh) * 2020-07-28 2020-12-18 四川虹美智能科技有限公司 人体检测方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392932A (zh) * 2016-05-16 2017-11-24 安讯士有限公司 更新用于图像的背景减除的背景模型的方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392932A (zh) * 2016-05-16 2017-11-24 安讯士有限公司 更新用于图像的背景减除的背景模型的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NAVNEET DALAL等: "Histograms of Oriented Gradients for Human Detection", 《CVPR"05》 *
ZOUXY09: "目标检测的图像特征提取之(一)HOG特征", 《CSDN HTTPS://BLOG.CSDN.NET/ZOUXY09/ARTICLE/DETAILS/7929348》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978907A (zh) * 2019-03-22 2019-07-05 南京邮电大学 一种面向家居场景的学生坐姿检测方法
CN112101090A (zh) * 2020-07-28 2020-12-18 四川虹美智能科技有限公司 人体检测方法及装置
CN112101090B (zh) * 2020-07-28 2023-05-16 四川虹美智能科技有限公司 人体检测方法及装置

Similar Documents

Publication Publication Date Title
CN103955660B (zh) 一种批量二维码图像识别方法
CN107273832B (zh) 基于积分通道特征与卷积神经网络的车牌识别方法及系统
KR100422709B1 (ko) 영상 의존적인 얼굴 영역 추출방법
CN109918971B (zh) 监控视频中人数检测方法及装置
CN109190456B (zh) 基于聚合通道特征和灰度共生矩阵的多特征融合俯视行人检测方法
CN102637262B (zh) 一种自适应细菌计数方法
CN111126293A (zh) 一种火焰和烟雾异常情况检测方法及系统
CN114783003A (zh) 一种基于局部特征注意力的行人重识别方法和装置
CN108345867A (zh) 面向智能家居场景的手势识别方法
CN112329851A (zh) 一种图标检测方法、装置及计算机可读存储介质
CN110599514B (zh) 图像分割的方法、装置、电子设备及存储介质
CN108549855A (zh) 面向智能家居场景的实时人形检测方法
CN115731493A (zh) 基于视频图像识别的降水微物理特征参量提取与分析方法
CN106920266A (zh) 验证码的背景生成方法和装置
CN117475353A (zh) 基于视频的异常烟雾识别方法及系统
CN112364884A (zh) 一种移动物体侦测的方法
CN111830051A (zh) 一种基于深度学习的变电站设备漏油检测方法及检测系统
Jeong et al. Homogeneity patch search method for voting-based efficient vehicle color classification using front-of-vehicle image
Yang et al. Caption detection and text recognition in news video
CN104794445A (zh) 一种基于arm平台的动态人脸虹膜采集方法
CN108334823A (zh) 基于机器学习的高分辨率遥感影像集装箱区域检测方法
CN109410169B (zh) 一种图像背景干扰度的识别方法及装置
Kaur et al. Text Extraction from Natural Scene using PCA.
CN112949367A (zh) 基于视频流数据的工作服颜色检测方法及装置
Mubin et al. Identification of parking lot status using circle blob detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180918