CN106485273A

CN106485273A - 一种基于hog特征与dnn分类器的人脸检测方法

Info

Publication number: CN106485273A
Application number: CN201610880082.2A
Authority: CN
Inventors: 谢昌颐; 李健夫
Original assignee: Hunan Rich Eye Electronic Technology Co Ltd
Current assignee: Hunan Rich Eye Electronic Technology Co Ltd
Priority date: 2016-10-09
Filing date: 2016-10-09
Publication date: 2017-03-08

Abstract

本发明涉及一种基于HOG特征与DNN分类器的人脸检测方法。基于二值化人脸图像提取HOG特征，结合DNN分类器进行人脸检测。在训练阶段，该方法首先对人脸正负样本进行二值化，然后针对二值人脸图像提取HOG特征，并基于该特征训练DNN分类器；在检测阶段，首先对待处理图像进行二值化，然后循环亚采样，在不同尺度下滑动提取块HOG特征，基于训练好的DNN分类器进行人脸检测。该方法的优势在于去除了人脸局部区域灰度变化对检测造成的影响，同时DNN分类器有利于从大量数据中提取抽象特征，提高分类器性能。

Description

一种基于HOG特征与DNN分类器的人脸检测方法

技术领域

本发明属于面向公共安全预警的视频图像处理领域，具体涉及一种人脸检测方法。

背景技术

随着视频监控系统的大规模应用，在车站、机场、街道等重要场所安装有大量监控摄像机，可获得充足的含有人员面部区域的视频图像，从而使得进一步基于人脸特征进行目标搜索、人员管控成为可能，在公共安全管理等领域有重要应用前景。人脸检测是其中一个重要的处理环节，相关算法的优劣直接决定人脸识别、人脸搜索等处理的效果和速度。

在人脸检测领域，基于Haar-like(哈尔)或HOG(Histogram of OrientedGradient，方向梯度直方图)特征构建人脸检测分类器是一类比较便于实现的技术手段，但其检测准确性目前并不能满足实际应用的需求。专利201210042789.8结合基于Haar-like特征的人脸分类器和基于HOG特征的人体分类器检测目标，利用头肩区域检测来降低人脸检测的错误率，该方法的缺陷是实际应用中人体经常存在遮挡，对此种情况不能准确地检测目标；专利201410553184.4采用多角度人脸分类器进行人脸检测，理论上可以适应人脸角度变化，但并未从实质上改进基于Haar-like特征的人脸检测方法，反而可能在每个角度都引起错误检测；专利201310377532.2基于HOG特征与SVM分类器进行人脸检测，对表情具有较好适应性，但基于灰度空间计算HOG特征的过程比较复杂，时间开销较大，不利于实时处理。同时上述方法都是在灰度空间进行处理，事实上实现与肤色无关的人脸检测并不需要获得人脸区域的具体灰度值，而是基于人脸区域五官结构、人脸区域与背景的差异进行检测，并且灰度图像存在一定的数据冗余，既增加额外计算量，同时又可能对人脸目标检测造成不利影响。

发明内容

本发明设计了一种基于HOG特征与DNN(Deep Neural Network，深度神经网络)分类器的人脸检测方法，该方法基于二值化人脸图像提取HOG特征，结合DNN分类器进行人脸检测。在训练阶段，该方法首先对人脸正负样本进行二值化，然后针对二值人脸图像提取HOG特征，并基于该特征训练DNN分类器；在检测阶段，首先对待处理图像进行二值化，然后循环亚采样，在不同尺度下滑动提取块HOG特征，基于训练好的DNN分类器进行人脸检测。该方法的优势在于去除了人脸局部区域灰度变化对检测造成的影响，同时DNN分类器有利于从大量数据中提取抽象特征，提高分类器性能。

下面对本发明中的技术方案阐述如下：

1、基于二值化图像提取HOG特征

Step1：原始图像为I(x,y)，二值化后为H(x,y)，亮区为1，暗区为0。

Step2：对二值图像，计算像素点(x,y)的水平和垂直梯度分别为

G_x(x,y)＝H(x+1,y)-H(x-1,y)

G_y(x,y)＝H(x,y+1)-H(x,y-1)

进一步计算该点的梯度幅值和方向分别为：

Step3：将原图按照常用的8×8像素划分为若干细胞元C_k，k表示其序号，计算每一个细胞元的加权梯度方向直方图。

(1)按照多次实验得到的60度的合理间距，将0度到360度划分为6等分，对每一个细胞元构造对应的直方图累加器s_k[i],i＝0,1,2,3,4,5，并初始化为0；

(2)对C_k中的每一个像素点，令i＝α(x,y)％6，其中％为整除运算，则对累加器进行加权累加，计算该细胞元加权梯度方向直方图为

s_k[i]＝s_k[i]+G(x,y)

Step4：将相邻10×10个细胞元(多次实验得到)组合成一个块，则该块的大小为80×80像素，在该块内按从左到右、从上到下的顺序将各细胞元的加权梯度直方图串联起来，得到具有600个元素的一维向量，即为该块的HOG特征。

2、基于训练好的DNN分类器进行人脸检测

在训练阶段，对海量人脸图像进行训练，生成人脸分类器，用于人脸检测，可分为：

Step1：从各种视频采集设备，以及互联网等渠道，获取海量具有人脸的图像，且含有光照、角度、表情等各种常见外界变化因素；

Step2：人工裁剪人脸区域，并缩放至归一化尺寸为80×80像素；

Step3：对尺寸归一化图像进行二值化；

Step4：提取二值化图像的HOG特征，作为正样本；

Step5：采集同样数量的不含人脸图像，归一化至相同尺寸，二值化，提取其HOG特征，作为负样本；

Step6：将正负样本图像作为输入，输出为对应的人脸或非人脸标志，通过训练建立DNN网络；

Step7：将上述训练好的DNN网络参数保存到文件，后续人脸检测时使用。

在检测阶段，利用训练好的DNN网络，将待处理图像按不同尺度计算其二值化后的HOG特征，循环亚采样，在不同尺度下滑动提取块HOG特征向量，输入到DNN网络，检测是否有人脸。

Step1：载入保存的DNN网络参数，建立DNN人脸检测网络；

Step2：将待处理图像二值化，设其宽度为width，高度为height；

Step3：提取二值化图像的细胞元加权梯度方向直方图；

Step4：按从左到右，从上到下的顺序，每次偏移2个像素(多次实验得到)，从原图中将10×10个细胞元组合成块，提取该块的HOG特征向量，作为输入数据传递给分类器，如果分类器判断为人脸，则输出该块的矩形区域顶点坐标，并将该块内所有原二值图像素值设为1；

Step5：将原二值图按步长1.1向下亚采样，重复step3～step5，直到width或height有一项小于等于最小人脸尺度80时停止。

本发明的优点在于：

1、基于二值图像计算HOG特征，减少数据冗余，降低局部无关灰度变化对检测结果的影响；

2、人脸目标的训练和检测基于二值图像的HOG特征进行，可强化突出训练样本和待检测目标的边缘分布规律，获得比单纯灰度图像更好的效果；

3、人脸目标的训练和检测基于DNN网络进行，相对于传统的浅层网络，DNN更有利于提取抽象信息，实现更好的分类效果。

附图说明

图1是本发明实施例的整体示意图；

图2-图4是二值化人脸区域示意图；

图5是像素点、细胞元、块的结构图。

具体实施方式

下面结合图示，对本发明的优选实施例作详细介绍。

本发明的人脸检测工作流程如图1所示，在训练阶段，准备人脸正负样本并手动裁剪、尺寸归一化，在二值化之后提取其HOG特征用于训练DNN分类器；在检测阶段，对原始图像进行二值化，按一定步长循环亚采样和最小窗口提取HOG特征，输入到DNN分类器进行检测，输出是否有人脸及人脸区域坐标。该方法利用人脸区域的梯度差异信息，结合DNN网络提取抽象特征的能力，能可靠地检测视频图像中的人脸区域，并降低人脸区域具体灰度值对检测的影响。

应当理解的是，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，比如更改应用领域等，而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

Claims

1.一种基于HOG特征与DNN分类器的人脸检测方法，基于二值化人脸图像提取HOG特征，Histogram of Oriented Gradient方向梯度直方图，结合DNN分类器进行人脸检测，DeepNeural Network深度神经网络，其特征在于，在训练阶段，首先对人脸正负样本进行二值化，然后针对二值人脸图像提取HOG特征，并基于该特征训练DNN分类器；在检测阶段，首先对待处理图像进行二值化，然后循环亚采样，在不同尺度下滑动提取块HOG特征，基于训练好的DNN分类器进行人脸检测。

2.根据权利要求1所述的一种基于HOG特征与DNN分类器的人脸检测方法，其特征在于，所述基于二值化图像提取HOG特征，具体步骤如下：

Step1.1：原始图像为I(x,y)，二值化后为H(x,y)，亮区为1，暗区为0；

Step1.2：对二值图像，计算像素点(x,y)的水平和垂直梯度分别为

G_x(x,y)＝H(x+1,y)-H(x-1,y)

G_y(x,y)＝H(x,y+1)-H(x,y-1)

进一步计算该点的梯度幅值和方向分别为：

G (x, y) = \sqrt{G_{x} {(x, y)}^{2} + G_{y} {(x, y)}^{2}}

α (x, y) = a r c (t a n (\frac{G_{y} (x, y)}{G_{x} (x, y)}))

Step1.3：将原图按照常用的8×8像素划分为若干细胞元C_k，k表示其序号，计算每一个细胞元的加权梯度方向直方图；

s_k[i]＝s_k[i]+G(x,y)

Step1.4：将相邻10×10个细胞元组合成一个块，则该块的大小为80×80像素，在该块内按从左到右、从上到下的顺序将各细胞元的加权梯度直方图串联起来，得到具有600个元素的一维向量，即为该块的HOG特征。

3.根据权利要求1所述的一种基于HOG特征与DNN分类器的人脸检测方法，其特征在于，所述基于训练好的DNN分类器进行人脸检测，具体步骤如下：

Step2.1：从各种视频采集设备，以及互联网等渠道，获取海量具有人脸的图像，且含有光照、角度、表情等各种常见外界变化因素；

Step2.2：人工裁剪人脸区域，并缩放至归一化尺寸为80×80像素；

Step2.3：对尺寸归一化图像进行二值化；

Step2.4：提取二值化图像的HOG特征，作为正样本；

Step2.5：采集同样数量的不含人脸图像，归一化至相同尺寸，二值化，提取其HOG特征，作为负样本；

Step2.6：将正负样本图像作为输入，输出为对应的人脸或非人脸标志，通过训练建立DNN网络；

Step2.7：将上述训练好的DNN网络参数保存到文件，后续人脸检测时使用；

在检测阶段，利用训练好的DNN网络，将待处理图像按不同尺度计算其二值化后的HOG特征，循环亚采样，在不同尺度下滑动提取块HOG特征向量，输入到DNN网络，检测是否有人脸；

Step3.1：载入保存的DNN网络参数，建立DNN人脸检测网络；

Step3.2：将待处理图像二值化，设其宽度为width，高度为height；

Step3.3：提取二值化图像的细胞元加权梯度方向直方图；

Step3.4：按从左到右，从上到下的顺序，每次偏移2个像素，从原图中将10×10个细胞元组合成块，提取该块的HOG特征向量，作为输入数据传递给分类器，如果分类器判断为人脸，则输出该块的矩形区域顶点坐标，并将该块内所有原二值图像素值设为1；

Step3.5：将原二值图按步长1.1向下亚采样，重复step3.3～step3.5，直到width或height有一项小于等于最小人脸尺度80时停止。