CN106529437A

CN106529437A - 一种人脸检测的方法和装置

Info

Publication number: CN106529437A
Application number: CN201610940885.2A
Authority: CN
Inventors: 庄正中
Original assignee: Guangzhou Kugou Computer Technology Co Ltd
Current assignee: Guangzhou Kugou Computer Technology Co Ltd
Priority date: 2016-10-25
Filing date: 2016-10-25
Publication date: 2017-03-22
Anticipated expiration: 2036-10-25
Also published as: CN106529437B

Abstract

本发明公开了一种人脸检测的方法和装置，涉及人脸识别领域，以缩短人脸识别所占用的时间。所述方法包括：对采集到的图片进行灰度化和尺寸归一化，以得到灰度图；计算所述灰度图上每个像素点的梯度值；根据每个像素点的梯度值，计算梯度积分图，使得所述梯度积分图中的每个元素指示其左上矩形区域内的轮廓点的数目；在窗口扫描时，基于所述梯度积分图筛选出第一级人脸区域。本发明用于人脸识别。

Description

一种人脸检测的方法和装置

技术领域

本发明涉及计算机领域，特别涉及一种人脸检测的方法和装置。

背景技术

当前随着人们安全意识的提高，视频监控正在快速普及。而在视频监控中，人脸检测技术作为一种可以识别出用户身份的重要手段。

在人脸检测的相关技术中，识别人脸的过程往往会占用大量的计算时间，造成用户等待时间过长，从而给用户带来不便。

发明内容

本发明实施例提供了一种人脸检测的方法和装置，以缩短人脸识别所占用的时间。所述技术方案如下：

一方面，提供一种人脸检测的方法，所述方法包括：

对采集到的图片进行灰度化和尺寸归一化，以得到灰度图；

计算所述灰度图上每个像素点的梯度值；

根据每个像素点的梯度值，计算梯度积分图，使得所述梯度积分图中的每个元素指示其左上矩形区域内的轮廓点的数目；

在窗口扫描时，基于所述梯度积分图筛选出第一级人脸区域。

可选地，所述根据每个像素点的梯度值，计算梯度积分图包括：

将梯度值大于第一阈值的像素点置1，并将梯度值不大于第一阈值的像素点置0，以形成与所述灰度图相同尺寸的二值轮廓矩阵；

对所述二值轮廓矩阵进行积分，使得得到的梯度积分矩阵中的每个元素指示其左上矩形区域内值等于1的点的总数。

可选地，所述在窗口扫描时，基于所述梯度积分图筛选人脸区域包括：

在窗口扫描时，若扫描区域内的轮廓点的数目大于第二阈值，则确定此扫描区域为人脸区域；

若扫描区域内的轮廓点的数目不大于第二阈值，则确定此扫描区域为背景区域。

可选地，在所述基于所述梯度积分图筛选出第一级人脸区域之后，所述方法还包括：

利用卷积神经网络从所述第一级人脸区域中进一步探测出第二级人脸区域；

对于每个扫描窗口，将扫描得到的第二级人脸区域进行内部合并，以得到第三级人脸区域；

利用卷积神经网络验证第三级人脸区域中的各个区域是否为人脸区域。

可选地，第三级人脸区域中被卷积神经网络验证通过的人脸区域为第四级人脸区域，所述方法还包括:

采用如下方式对各个扫描窗口的第四级人脸区域进行合并：

在两个第四级人脸区域相分离时，保留这两个第四级人脸区域；

在两个第四级人脸区域存在包含关系时，保留这两个第四级人脸区域中较大的第四级人脸区域，删除较小的第四级人脸区域；

在两个第四级人脸区域相交的情况下，若重合度大于第三阈值，则保留这两个第四级人脸区域中较大的第四级人脸区域，删除较小的第四级人脸区域；若重合度不大于第三阈值，则保留这两个第四级人脸区域。

可选地，所述对于每个扫描窗口，将扫描得到的第二级人脸区域进行内部合并包括：

确定所述第二级人脸区域中的一个区域是否与所述第二级人脸区域中的其他N个区域重合；

若是，则将这个区域和所述N个区域合并；若否，则删除这个区域；

其中，N为整数且大于等于1。

另一方面，提供一种人脸检测的装置，所述装置包括图片采集模块、处理模块和扫描模块，其中：

所述图片采集模块，用于采集用户图片；

所述处理模块，用于对采集到的图片进行灰度化和尺寸归一化，以得到灰度图；计算所述灰度图上每个像素点的梯度值；根据每个像素点的梯度值，计算梯度积分图，使得所述梯度积分图中的每个元素指示其左上矩形区域内的轮廓点的数目；

所述扫描模块，用于对所述灰度图进行扫描；

所述处理模块，还用于在所述扫描模块扫描时，基于所述梯度积分图筛选出第一级人脸区域。

可选地，所述处理模块具体用于：将梯度值大于第一阈值的像素点置1，并将梯度值不大于第一阈值的像素点置0，以形成与所述灰度图相同尺寸的二值轮廓矩阵；对所述二值轮廓矩阵进行积分，使得得到的梯度积分矩阵中的每个元素指示其左上矩形区域内值等于1的点的总数。

可选地，所述处理模块具体用于：在窗口扫描时，若扫描区域内的轮廓点的数目大于第二阈值，则确定此扫描区域为人脸区域；若扫描区域内的轮廓点的数目不大于第二阈值，则确定此扫描区域为背景区域。

可选地，在基于所述梯度积分图筛选出第一级人脸区域之后，所述处理模块还用于：利用卷积神经网络从所述第一级人脸区域中进一步探测出第二级人脸区域；对于每个扫描窗口，将扫描得到的第二级人脸区域进行内部合并，以得到第三级人脸区域；利用卷积神经网络验证第三级人脸区域中的各个区域是否为人脸区域。

可选地，第三级人脸区域中被卷积神经网络验证通过的人脸区域为第四级人脸区域，所述处理模块还用于：

采用如下方式对各个扫描窗口的第四级人脸区域进行合并：

可选地，所述处理模块在合并第二级人脸区域时具体用于：确定所述第二级人脸区域中的一个区域是否与所述第二级人脸区域中的其他N个区域重合；若是，则将这个区域和所述N个区域合并；若否，则删除这个区域；其中，N为整数且大于等于1。

另一方面，本发明还提供一种终端设备，所述终端设备包括摄像头、存储器和处理器，所述存储器上存储程序，当所述程序被所述处理器执行时执行上面所述任一种人脸识别的方法。

本发明实施例提供的人脸检测的方法、装置和终端设备，利用梯度积分图呈现轮廓点的数目，这样一来，在矩形窗口扫描的时候通过对扫描区域内轮廓点的检查，就可以确定扫描区域是否为第一级人脸区域。如此，可以节省后续大量的运算时间，进而缩短人脸识别所占用的时间。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的人脸检测的方法的流程图；

图2A是本发明实施例提供的人脸检测的方法的流程图；

图2B是一种梯度积分图的一部分的示意图；

图2C是一种卷积神经网络的示意图；

图3是本发明实施例提供的人脸检测的装置的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明实施例提供的人脸检测的方法的流程图。参照图1，所述方法可包括：

11、对采集到的图片进行灰度化和尺寸归一化，以得到灰度图。

在步骤11之前，图像采集工具(例如，摄像头、摄像机等)可对用户图像进行采集，得到采集图片。

在得到采集图片之后，可将图片转化为灰度图，并且统一调整为例如，最长边为200像素的图片。当然，如果图片尺寸比这个尺寸还小则不对图片尺寸进行调整。如此一来，可以对图片进行第一级的压缩和降维以提高后续处理的效率。处理后得到的是预处理过的灰度图。

12、计算所述灰度图上每个像素点的梯度值。

13、根据每个像素点的梯度值，计算梯度积分图，使得所述梯度积分图中的每个元素指示其左上矩形区域内的轮廓点的数目。

其中，本步骤所述根据每个像素点的梯度值，计算梯度积分图可具体为：将梯度值大于第一阈值的像素点置1，并将梯度值不大于第一阈值的像素点置0，以形成与所述灰度图相同尺寸的二值轮廓矩阵；对所述二值轮廓矩阵进行积分，使得得到的梯度积分矩阵中的每个元素指示其左上矩形区域内值等于1的点的总数。

其中，第一阈值可以为例如20、30等。

14、在窗口扫描时，基于所述梯度积分图筛选出第一级人脸区域。

其中，本步骤所述在窗口扫描时，基于所述梯度积分图筛选人脸区域可具体为：在窗口扫描时，若扫描区域内的轮廓点的数目大于第二阈值，则确定此扫描区域为人脸区域，即第一级人脸区域(初步确定出的人脸区域)；若扫描区域内的轮廓点的数目不大于第二阈值，则确定此扫描区域为背景区域。

需要指出的是，本文中提到的“第一阈值”、“第二阈值”以及后文中提到的“第三阈值”均可按照实际需求来设定，具体数值本发明并不限定。

在本发明实施例中，第一级人脸区域为最初识别出的人脸区域，由于精确度不高，因而不一定是真正的人脸区域。后文中的第二级人脸区域、第三级人脸区域、第四级人脸区域是精确度逐步提高的识别人脸区域即，级数越高，所代表的人脸区域的精确度就越高，越有可能是真正的人脸区域。

本发明实施例提供的人脸检测的方法，利用梯度积分图呈现轮廓点的数目，这样一来，在矩形窗口扫描的时候通过对扫描区域内轮廓点的检查，就可以确定扫描区域是否为第一级人脸区域。如此，可以节省后续大量的运算时间，进而缩短人脸识别所占用的时间。

在本发明实施例中，在步骤14基于所述梯度积分图筛选出第一级人脸区域之后，还可以基于卷积神经网络从初步筛选出的第一级人脸区域中选出精确度更高的人脸区域。本发明可以利用两套卷积神经网络模型的级联来识别人脸。例如，可第一次利用卷积神经网络从所述第一级人脸区域中进一步探测出第二级人脸区域。然后在对于每个扫描窗口，将扫描得到的第二级人脸区域进行内部合并，以得到第三级人脸区域之后，利用卷积神经网络验证第三级人脸区域中的各个区域是否为人脸区域。即，第一次利用卷积神经网络来从第一级人脸区域中进一步探测更接近真实人脸区域的第二级人脸区域，并在内部合并完成后，第二次利用卷积神经网络验证第三级人脸区域中的各个区域是否为人脸区域。如果通过验证，则从第三级人脸区域中选出被卷积神经网络验证通过的人脸区域作为第四级人脸区域。

本发明实施例可通过利用两套卷积神经网络模型的级联来识别人脸，提高识别人脸的精度。

在本发明实施例中，在窗口扫描时，一般使用多个不同尺寸大小的窗口并行进行扫描。因而，对于每个扫描窗口而言，都会扫描出一或多个第一级人脸区域。在利用两套卷积神经网络模型的级联来识别人脸时，对每个扫描窗口扫描出的一或多个第一级人脸区域都会利用卷积神经网络来进一步探测出第二级人脸区域。然后，对于每个扫描窗口，将扫描得到的第二级人脸区域进行内部合并。合并的具体过程可以为：确定所述第二级人脸区域中的一个区域是否与所述第二级人脸区域中的其他N个区域重合；若是，则将这个区域和所述N个区域合并；若否，则删除这个区域；其中，N为整数且大于等于1。合并得到的人脸区域即为第三级人脸区域。

本发明实施例中提供的人脸区域内部合并方式可以快速找出有效的识别人脸区域。

一般而言，第四级人脸区域为准确度较高的接近真实人脸区域的识别人脸区域。在本发明实施例中，在得到第四级人脸区域之后，可以采用如下方式对各个扫描窗口的第四级人脸区域进行合并：

通过对各个扫描窗口的第四级人脸区域进行合并，可以得出有效、完整的人脸识别区域。

图2A是本发明实施例提供的人脸检测的方法的流程图。参照图2A，所述方法可包括：

21、利用图像采集工具采集用户图片。

22、对采集到的图片进行灰度化和尺寸归一化，以得到灰度图。

具体地，可将灰度图统一的调整为最长边为200像素的图片。当然，如果图片比这个尺寸还小则不做调整。如此，可以对图片进行第一级的压缩和降维以提高后续处理的效率，这一步之后得到的是预处理过的灰度图。

23、计算所述灰度图上每个像素点的梯度值。

24、根据每个像素点的梯度值，计算梯度积分图，使得所述梯度积分图中的每个元素指示其左上矩形区域内的轮廓点的数目。

具体地，可将每个像素点的梯度值大于阈值(如20)置1，小于这个阈值的像素置0，并保存在与原图同尺寸的二维矩阵中，即得到轮廓的二值矩阵。对轮廓矩阵进行积分，使得得到的等尺寸的梯度积分矩阵每个元素保存了它左上矩形区域内值等于1的点的总数。

如图2B所示，图中“5”表示其左上方矩形区域内有5个轮廓点，6、7、10同理，因此右下区域内的轮廓点个数可以通过10+5-(6+7)＝2快速计算出来，因此只需要一次性计算出梯度积分图，往后就直接用复杂度极低的基本运算就可以得到红色区域内的轮廓点的总数。

这么做的意义在于：当使用矩形窗口扫描的时候，首先对扫描区域内进行轮廓检查，如果没有足够的轮廓点则表示这个区域属于背景区域，必定不是富含丰富轮廓信息的脸部，因此可以直接跳过从而节省后续大量的运算时间。

本发明实施例提供的梯度积分图的算法可如下：在每计算完一个像素点的梯度值后立即记录该点在该行的积分值，在计算完一行像素点的梯度值后立刻将上一行的积分累积到刚才这一行积分上，从而彻底完成该行积分图的运算。

程序实现的一种方式可如下所示：

25、进行多窗口扫描，并基于所述梯度积分图筛选出第一级人脸区域。

由于对图片中人脸的位置和大小是未知的，因此本发明实施例可采用不同尺寸的窗口在多线程下以较小步长移动窗口来并行扫描图片的策略。

在扫描过程中，若扫描区域内的轮廓点的数目大于第二阈值，则确定此扫描区域为人脸区域，即第一级人脸区域(初步确定出的人脸区域)；若扫描区域内的轮廓点的数目不大于第二阈值，则确定此扫描区域为背景区域。

26、利用卷积神经网络(CNN)从所述第一级人脸区域中进一步探测出第二级人脸区域。

在本发明实施例中，窗口到达的每一块矩形区域都会使用卷积神经网络分类器进行判断，判断结果是人脸的区域为第二级人脸区域。

如果出现判断结果是人脸的区域，扫描窗口可将移动步长缩短为例如1个像素距离，以便于更加仔细的查找。当在连续多次(例如3次)判断都不是人脸，步长则会重新提高到例如3～5像素以提高处理效率。

27、对于每个扫描窗口，将扫描得到的第二级人脸区域进行内部合并，以得到第三级人脸区域。

具体地，内部合并时，确定所述第二级人脸区域中的一个区域是否与所述第二级人脸区域中的其他N个区域重合；若是，则将这个区域和所述N个区域合并；若否，则删除这个区域；其中，N为整数且大于等于1。合并得到的人脸区域即为第三级人脸区域。

当然，在本发明实施例中，在存在重合的情况下，还可以确定重合度是否超过预设百分比(例如80％)，当探测到的矩形框两两之间重合度超过例如80％时，则可在下面关系矩阵对应位置打上勾，当矩形框与N个及以上的矩形框有重合则认为该区域被重复探测到存在人脸，因此该区域为人脸的置信度较高，则合并这几个矩形；而那些没有超过N的矩形则予以删除。

矩形	1	2	3	4	5	6
							1		√	√
2	√
							3	√
4					√	√
							5				√	√
6				√	√

28、利用卷积神经网络验证第三级人脸区域中的各个区域是否为人脸区域，并将验证通过的人脸区域置为第四级人脸区域。

29、对各个扫描窗口的第四级人脸区域进行合并。

具体地，可以采用如下方式对各个扫描窗口的第四级人脸区域进行合并：

本发明实施例提供的人脸检测方法，将梯度积分图应用于图像检测，可以加速检测过程，同时通过采用卷积神经网络的级联策略和并行窗口扫描中的合并策略可以提高人脸识别的精度。

本发明实施例提供的人脸识别方法中，使用两套卷积神经网络模型的级联来识别人脸。第一个用于探测人脸，为结构较简单的卷积神经网络，参照图2C。窗口区域的图像统一缩小成20*20像素大小传入输入图层，经过第一层使用5*5的卷积核分解成4个16*16像素大小的特征图，再经过下采样层降为4个8*8的特征图，接下来的卷积层通过不完全连接(drop out)得到8个4*4的特征图，再通过全连接得到50个节点，最后50个节点通过全连接到两个输出节点来表示输出结果。

第二个用于验证人脸，在参数和结构上稍微复杂一些以获取更高的准确率，即在第二层采用6个16*16的特征图，在第四层采用16个特征图，在倒数第二层采用100个节点，其他参数与上述模型一致。

使用两套卷积神经网络模型，先通过简单的神经网络进行判断，以获得较快的处理速率，在对各窗口获取到的矩形框进行内部合并后，再对合并后的矩形框区域内的图像使用较复杂的神经网络模型进行验证，确定图片中探测到的所有人脸区域。

图3是本发明实施例提供的一种人脸检测的装置的结构框图。参照图3，所述装置300包括图片采集模块301、处理模块302和扫描模块303。其中：

所述图片采集模块301，用于采集用户图片；

所述处理模块302，用于对采集到的图片进行灰度化和尺寸归一化，以得到灰度图；计算所述灰度图上每个像素点的梯度值；根据每个像素点的梯度值，计算梯度积分图，使得所述梯度积分图中的每个元素指示其左上矩形区域内的轮廓点的数目；

所述扫描模块303，用于对所述灰度图进行扫描；

所述处理模块302，还用于在所述扫描模块扫描时，基于所述梯度积分图筛选出第一级人脸区域。

本发明实施例提供的人脸检测的装置，利用梯度积分图呈现轮廓点的数目，这样一来，在矩形窗口扫描的时候通过对扫描区域内轮廓点的检查，就可以确定扫描区域是否为第一级人脸区域。如此，可以节省后续大量的运算时间，进而缩短人脸识别所占用的时间。

可选地，所述处理模块302具体用于：

可选地，在基于所述梯度积分图筛选出第一级人脸区域之后，所述处理模块302还用于：

可选地，第三级人脸区域中被卷积神经网络验证通过的人脸区域为第四级人脸区域，所述处理模块302还用于:

采用如下方式对各个扫描窗口的第四级人脸区域进行合并：

可选地，所述处理模块302在合并第二级人脸区域时具体用于：

其中，N为整数且大于等于1。

本发明实施例提供的人脸检测装置，将梯度积分图应用于图像检测，可以加速检测过程，同时通过采用卷积神经网络的级联策略和并行窗口扫描中的合并策略可以提高人脸识别的精度。

需要说明的是：上述实施例提供的用于人脸检测的装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的用于应用程序的装置和应用程序启动的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种人脸检测的方法，其特征在于，所述方法包括：

对采集到的图片进行灰度化和尺寸归一化，以得到灰度图；

计算所述灰度图上每个像素点的梯度值；

2.根据权利要求1所述的方法，其特征在于，所述根据每个像素点的梯度值，计算梯度积分图包括：

3.根据权利要求1或2所述的方法，其特征在于，所述在窗口扫描时，基于所述梯度积分图筛选人脸区域包括：

4.根据权利要求1所述的方法，其特征在于，在所述基于所述梯度积分图筛选出第一级人脸区域之后，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，第三级人脸区域中被卷积神经网络验证通过的人脸区域为第四级人脸区域，所述方法还包括:

采用如下方式对各个扫描窗口的第四级人脸区域进行合并：

6.根据权利要求4所述的方法，其特征在于，所述对于每个扫描窗口，将扫描得到的第二级人脸区域进行内部合并包括：

其中，N为整数且大于等于1。

7.一种人脸检测的装置，其特征在于，所述装置包括图片采集模块、处理模块和扫描模块，其中：

所述图片采集模块，用于采集用户图片；

所述扫描模块，用于对所述灰度图进行扫描；

8.根据权利要求7所述的装置，其特征在于，所述处理模块具体用于：

9.根据权利要求7或8所述的装置，其特征在于，所述处理模块具体用于：

10.根据权利要求7所述的装置，其特征在于，在基于所述梯度积分图筛选出第一级人脸区域之后，所述处理模块还用于：

11.根据权利要求10所述的装置，其特征在于，第三级人脸区域中被卷积神经网络验证通过的人脸区域为第四级人脸区域，所述处理模块还用于:

采用如下方式对各个扫描窗口的第四级人脸区域进行合并：

12.根据权利要求10所述的装置，其特征在于，所述处理模块在合并第二级人脸区域时具体用于：

其中，N为整数且大于等于1。