CN108549855A

CN108549855A - 面向智能家居场景的实时人形检测方法

Info

Publication number: CN108549855A
Application number: CN201810280722.5A
Authority: CN
Inventors: 张晖; 张迪
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University; Nanjing University of Posts and Telecommunications
Priority date: 2018-04-02
Filing date: 2018-04-02
Publication date: 2018-09-18

Abstract

面向智能家居场景的实时人形检测方法，包括如下步骤：S1、预处理一张无人物的家居场景图像作为背景图；S2、预处理视频流中的每一帧图像，获取当前帧处理后的图像；S3、通过背景减除法对当前帧处理后的图像和预处理后的背景图进行处理，获人形所在区域的图像；S4、人形所在区域的图像中的每个像素的灰度值与设定好的阈值进行比较，获取掩码图，利用矩形拟合掩码图，获取人形图像；S5、分离人形图像的红色、绿色、蓝色通道图像，获取该人形图像的HOG特征；S6、通过SVM对人形图像的HOG特征进行训练，获取人形模型。该方法通过背景减除法分割人形图形，再利用矩形框拟合掩码图，提取人形图像的HOG特征，训练人形模型，可以快速准确的检测人形图像。

Description

面向智能家居场景的实时人形检测方法

技术领域

本发明属于智能识别技术领域，具体涉及一种面向智能家居场景的实时人形检测方法。

背景技术

人形检测是指在图像中检测是否有人形，对人形图像进行特征提取，通过提取的特征来对人形进行检测。

据申请人了解，家居场景下实时检测人形较为复杂，需要把视频流分解成一帧帧图片，使用背景减除法获取当前人形区域图，提取有效的特征来表述人形，并对特征进行训练得到人形模型。但当今市场上，具有人形检测功能的智能家居设备较为少见，大多人形检测产品检测效果并不理想，同时，这些产品过于依赖联网云端服务器，在没有网络的情况下无法进行工作，无法对多种电气设备进行有效控制。

手势识别是指在图像中获取人物的手势图像，从手势图像中提取特征，通过对识别提取的特征获取手势的含义。在家居场景下可以通过识别用户手势，达到控制家居电气设备的效果。用户使用简单的手势就能控制电视、空调、灯光等设备的运行。

据申请人了解，当今市场上，具有手势识别功能的智能家居设备较为少见，大多手势识别产品只能识别肢体动作，无法对手势进行识别，且识别效果并不理想，同时，这些产品过于依赖联网云端服务器，在没有网络的情况下无法进行工作，无法对多种电气设备进行有效控制。

本发明中的SVM指的是支持向量机，是常见的一种判别方法。在机器学习领域，通常用来进行模式识别、分类以及回归分析。SVM方法是通过一个非线性映射p，把样本空间映射到一个高维乃至无穷维的特征空间中，使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。简单地说，就是升维和线性化.升维，就是把样本向高维空间做映射。但是作为分类、回归等问题来说，很可能在低维样本空间无法线性处理的样本集，在高维特征空间中却可以通过一个线性超平面实现线性划分(或回归)。

常用的核函数有以下4种：

线性核函数K(x,y)＝x·y；

多项式核函数K(x,y)＝[(x·y)+1]^d；

径向基函数K(x,y)＝exp(-|x-y|^2/d^2)；

二层神经网络核函数K(x,y)＝tanh(a(x·y)+b)。

发明内容

本发明的目的在于：提供一种面向智能家居场景的实时人形检测方法，通过背景减除法分割人形图形，再利用矩形框拟合掩码图，提取人形图像的HOG特征，训练人形模型，可以快速准确的检测人形图像。

为了达到以上目的，提供一种面向智能家居场景的实时人形检测方法，包括如下步骤：

S1、选取一张无人物的家居场景图像作为背景图，使用gammma校正法对背景图进行颜色空间标准化，再通过高斯滤波处理获取预处理后的背景图；

S2、使用gammma校正法对实时采集的视频流中的的每一帧图像进行颜色空间标准化，再通过高斯滤波处理获取当前帧处理后的图像；

S3、通过背景减除法对当前帧处理后的图像和预处理后的背景图进行处理，获人形所在区域的图像；

S4、人形所在区域的图像中的每个像素的灰度值与设定好的阈值进行比较，获取掩码图，利用矩形拟合掩码图，截取当前帧处理后的图像中对应的矩形部分，获取人形图像；并调整大小为128×64；

S5、分离人形图像的红色通道图像、绿色通道图像、蓝色通道图像，将分离后的图像分成若干个小单元，统计每个小单元的梯度直方图，再将每3×3个小单元组成一个大单元，串联大单元中所有小单元的HOG特征，获取大单元的HOG特征，将人形图像内所有大单元的HOG特征归一化后串联。获取该人形图像的HOG特征；

S6、通过SVM对人形图像的HOG特征进行训练，获取人形模型。

本发明的优选方案是：步骤S3中，背景减除法是将当前帧处理后的图像对比预处理后的背景图，对比出人形所在区域的图像。

优选地，步骤S4中，设定好的阈值为50，判断图像中的像素灰度值是否大于阈值，若是，则该像素值置为255，否，则置为0，从而得到掩码图。

优选地，小单元包含6×6个像素。

优选地，步骤S5中，归一化采用(0,1)标准化，通过遍历大单元格内每个小单元格数据，并将最大值-最小值作为基数进行归一化处理：

其中，Min表示最小值，Min为0，Max表示最大值，Max为1。

优选地，步骤S6具体为：

S61、准备训练样本集合，包括正样本集和负样本集；

S62、手动裁剪样本，使样本尺寸保持一致；

S63、将裁剪后的所有正样本中相同的手势图像放在一个文件夹中，将裁剪后的所有负样本中相同的手势图像放在另一个文件夹中，之后将所有训练样本缩放到相同尺寸；

S64、提取所有样本的HOG特征，并赋予样本标签；

S65、将所有样本的HOG特征和样本标签输入SVM中训练；获取人形模型。

本发明有益效果为：该方法通过背景减除法分割人形图像，再用矩形框拟合掩码图，减少周围环境对人形检测的影响；通过提取人形图像的HOG特征，能有效地用特征表述人形图像，将提取的HOG特征使用SVM进行训练，得到人形模型，用于人形检测。能快速准确的对图像中的人形进行检测，适用于家居终端设备，提高了用户体验舒适度。

附图说明

下面结合附图对本发明作进一步的说明。

图1为本发明的方法流程示意图；

图2为本发明的对人形图像分割的流程示意框图；

图3为本发明的提取人形图像的HOG特征的流程示意框图。

具体实施方式

实施例一

请参阅图1，本实施例提供一种面向智能家居场景的实时人形检测方法，其中，步骤S1-S4为对人形图像分割的步骤，如图2所示；步骤S5为提取人形图像的HOG特征的步骤，如图3所示，包括如下步骤：

S1、选取一张无人物的家居场景图像作为背景图，使用gammma校正法对背景图进行颜色空间标准化，再通过高斯滤波处理获取预处理后的背景图Image0；

S3、通过背景减除法对当前帧处理后的图像和预处理后的背景图Image0进行处理，获人形所在区域的图像Image1；

其中，Gamma校正是通过对图像的Gamma曲线进行编辑，以对图像进行非线性色调编辑的方法，检出图像信号中的深色部分和浅色部分，并使两者比例增大，从而提高图像对比度效果，降低图像局部的阴影和光照变化所造成的影响，同时可以抑制噪音的干扰；高斯滤波主要消除噪声对识别的影响。

S4、人形所在区域的图像Image1中的每个像素的灰度值与设定好的阈值进行比较，获取掩码图Image2，利用矩形拟合掩码图Image2，截取当前帧处理后的图像中对应的矩形部分，获取人形图像Image3；并调整大小为128×64；

S5、分离人形图像Image3的红色通道图像channel_r、绿色通道图像channel_g、蓝色通道图像channel_b，图像由红色、绿色、蓝色三个元素组成，R为红色通道，表示为1；G为绿色通道，表示为2；B为蓝色通道，表示为3；白色图像则为4,它是由1、2、3处的通道颜色混合而成。

将分离后的图像分成若干个小单元，每个小单元包含6×6个像素，统计每个小单元的梯度直方图，再将每3×3个小单元组成一个大单元，串联大单元中所有小单元的HOG特征，获取大单元的HOG特征，将人形图像内所有大单元的HOG特征归一化后串联。获取该人形图像的HOG特征；

S6、通过SVM对人形图像的HOG特征进行训练，获取人形模型。

步骤S3中，背景减除法是将当前帧处理后的图像对比预处理后的背景图，对比出人形所在区域的图像。

步骤S4中，设定好的阈值为50，判断图像中的像素灰度值是否大于阈值，若是，则该像素值置为255，否，则置为0，从而得到掩码图。

步骤S5中，归一化采用(0,1)标准化，通过遍历大单元格内每个小单元格数据，并将最大值-最小值作为基数进行归一化处理：

其中，Min表示最小值，Min为0，Max表示最大值，Max为1。

步骤S6具体为：

S61、准备训练样本集合，包括正样本集和负样本集；

S62、手动裁剪样本，使样本尺寸保持一致；

S64、提取所有样本的HOG特征，并赋予样本标签；

S65、将所有样本的HOG特征和样本标签输入SVM中训练；获取人形模型。除上述实施例外，本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案，均落在本发明要求的保护范围。

Claims

1.面向智能家居场景的实时人形检测方法，其特征在于，包括如下步骤：

S6、通过SVM对人形图像的HOG特征进行训练，获取人形模型。

2.根据权利要求1所述的面向智能家居场景的实时人形检测方法，其特征在于，所述步骤S3中，背景减除法是将当前帧处理后的图像对比预处理后的背景图，对比出人形所在区域的图像。

3.根据权利要求1所述的面向智能家居场景的实时人形检测方法，其特征在于，所述步骤S4中，设定好的阈值为50，判断图像中的像素灰度值是否大于阈值，若是，则该像素值置为255，否，则置为0，从而得到掩码图。

4.根据权利要求1所述的面向智能家居场景的实时人形检测方法，其特征在于，所述小单元包含6×6个像素。

5.根据权利要求1所述的面向智能家居场景的实时人形检测方法，其特征在于，所述步骤S5中，归一化采用(0,1)标准化，通过遍历大单元格内每个小单元格数据，并将最大值-最小值作为基数进行归一化处理：

其中，Min表示最小值，Min为0，Max表示最大值，Max为1。

6.根据权利要求1所述的面向智能家居场景的手势识别方法，其特征在于，所述步骤S6具体为：

S61、准备训练样本集合，包括正样本集和负样本集；

S62、手动裁剪样本，使样本尺寸保持一致；

S64、提取所有样本的HOG特征，并赋予样本标签；