CN107977623A

CN107977623A - 一种鲁棒性人眼状态判断方法

Info

Publication number: CN107977623A
Application number: CN201711242919.1A
Authority: CN
Inventors: 刘晨曦; 吴琦; 肖潇; 龚纯斌
Original assignee: Ruishi Chikaku (shenzhen) Algorithm Technology Co Ltd
Current assignee: Ruishi Chikaku (shenzhen) Algorithm Technology Co Ltd
Priority date: 2017-11-30
Filing date: 2017-11-30
Publication date: 2018-05-01

Abstract

本发明公开一种鲁棒性人眼状态判断方法，包括如下步骤：步骤1，提取人脸图像中的弱特征：首先，将给定的人脸图像转换为单通道灰度图像并缩放，通过高斯滤波对图像进行噪声抑制；然后，作高斯自适应二值化，得到提取人脸弱特征后的图像。步骤2，将步骤1得到的图像输入训练好的卷积神经网络结构，网络处理图像的每个像素点，然后通过全连接网络层输出人眼状态结果，其中，所述卷积神经网络包含3个卷积层，3个下采样层和1个全连接层，其中，3个卷积层的卷积核大小为3*3，2个下采样层的核大小为2*2。此种方法可适用于各种场景，提高人眼睁闭状态识别能力，识别精度高，鲁棒性强，复杂度低，硬件要求低，实时性强。

Description

一种鲁棒性人眼状态判断方法

技术领域

本发明涉及一种鲁棒性人眼状态判断方法。

背景技术

随着科学技术水平的不断提高,计算机视觉越来越受到人们的关注。在计算机视觉中，人脸识别已成为一项通用技术，而在人脸识别的技术中，人的眼睛睁闭状态的识别可以有助于活体检测，疲劳驾驶判断，以及提升手机拍照或自拍的质量。在实际的环境中存在非常多且多变的干扰因素，如光照的明暗变化经常导致无法识别眼睛的睁闭状态；而精确的方法往往带来非常复杂的运算，实时性大打折扣。

目前有关眼睛睁闭状态的检测方法很多，基于计算机视觉的检测方法主要有：(1)从人脸图像中进行人的眼睛的检测和定位，当人的眼睛定位不准确时，会直接影响对眼睛睁闭状态的检测准确率；(2)从人脸图像中检测人眼关键点，根据人眼关键点计算上下眼皮的距离，通过阈值判断眼睛睁闭状态。由于不同的人眼睁闭程度不同，同一个人在不同的光照强度下也不同，该方法会存在较大误差，从而导致误判。

如专利申请号201510013052.7“一种基于眼睛特征的疲劳驾驶检测方法”，该方法在定位人脸之后，通过粗定位和精定位确定眼睛的位置，再通过复杂的特征和分类器识别人眼的睁闭状态，算法复杂度高，误差不断积累，计算精度低。

又如专利申请号201710356372.1“一种骑车疲劳驾驶预测方法”，该方法在获得候选人脸窗口后利用人脸特征点标记信息预测人眼区域，再根据眼睛特征点分割眼睛区域，最后再学习眼睛睁闭特征来判断闭合状态。该方法算法复杂，在嵌入式平台上较难实现实时。

通过以上分析，现有的人眼状态检测方法存在着睁闭眼状态需要人眼定位，人眼关键点睁闭眼阈值不统一的不足，有待改进。

发明内容

本发明的目的，在于提供一种鲁棒性人眼状态判断方法，其可适用于各种场景，提高人眼睁闭状态识别能力，识别精度高，鲁棒性强，复杂度低，硬件要求低，实时性强。

为了达成上述目的，本发明的解决方案是：

一种鲁棒性人眼状态判断方法，包括如下步骤：

步骤1，提取人脸图像中的弱特征：

步骤2，利用卷积神经网络对步骤1得到的图像提取睁闭眼特征，判断人眼状态。

上述步骤1包括如下具体内容：

首先，将给定的人脸图像转换为单通道灰度图像，并进行缩放后，通过高斯滤波对图像进行噪声抑制；

然后，对高斯滤波后的图像作高斯自适应二值化，得到提取人脸弱特征后的图像。

上述将给定的人脸图像转换为单通道灰度图像，再缩放为尺寸为100*100的图像。

上述对高斯滤波后的图像作高斯自适应二值化，得到提取人脸弱特征后的图像的具体内容是：将高斯滤波后的图像经过高斯加权再减去一个差值，得到阈值图像，将高斯滤波后的图像的每一个像素与阈值图像的每一个像素进行比较，若高斯滤波后的图像中像素值小于对应的阈值图像像素值的像素，置为0，若高斯滤波后的图像中像素值不小于对应的阈值图像像素值的像素，置为255，得到提取人脸弱特征后的图像。

上述步骤2的具体内容是：将步骤1得到的图像输入训练好的卷积神经网络结构，网络处理图像的每个像素点，然后通过全连接网络层输出人眼状态结果，其中，所述卷积神经网络包含3个卷积层，3个下采样层和1个全连接层，其中，3个卷积层的卷积核大小为3*3，2个下采样层的核大小为2*2。

上述卷积神经网络的训练阶段包括：

a、将大量标注好闭眼或者睁眼的人脸图像数据根据步骤1生成含有标注信息的人脸弱特征图像训练样本；

b、更新3个卷积层和1个全连接层参数，完成训练阶段，得到最优的网络模型参数。

上述步骤b中，利用随机梯度下降算法更新3个卷积层和1个全连接层参数。

上述卷积神经网络输出人眼状态结果的具体内容是：将待判断的提取弱特征后的图像输入到训练好的卷积神经网络中，得到一个输出值，若输出值大于等于判断阈值，那么判断为闭眼状态，否则判断为睁眼状态。

上述判断阈值的设定方法是：设0属于绝对闭眼状态，1属于绝对睁眼状态，睁眼和闭眼的中间值为0.5，因此将判断阈值设为0.5，若output大于等于0.5，那么判断为闭眼状态；若小于0.5，那么判断为睁眼状态。

采用上述方案后，本发明通过直接提取人脸图像弱特征，根据简单的神经网络识别出人眼睁闭状态，不需要人眼定位或人眼关键点检测。本发明适用于各种场景，不受背景干扰，识别精度高，鲁棒性强。同时，本发明计算复杂度低，检测速度快，大大降低人眼状态识别的硬件要求，稳定可靠，实时性强。

附图说明

图1是本发明的整体流程示意图；

图2是本发明中弱特征提取流程示意图；

图3是本发明中神经网络结构示意图；

图4是本发明神经网络训练阶段流程图；

图5是本发明神经网络预测阶段流程图。

具体实施方式

以下将结合附图，对本发明的技术方案进行详细说明。

如图1所示，本发明提供一种鲁棒性人眼状态判断方法，首先从人脸图像中提取弱特征,再根据神经网络学习人眼睁闭特征,最后根据人眼睁闭特征判断人眼状态；具体包括以下步骤：

步骤1，提取人脸图像中的弱特征：

配合图2所示，首先，对于给定的任意一幅人脸图像，将其转换为单通道灰度图像I0，并且缩放尺寸为100*100的图像，通过高斯滤波对图像进行噪声抑制得到滤波后图像I1；将图像缩放至100*100，可取得较为理想的效果。

接着对滤波后图像I1作高斯自适应二值化，所述高斯自适应二值化方法具体过程是：图像I1经过高斯加权再减去一个差值delta(根据具体情况进行设定)，得到阈值图像I2，将I1的每一个像素与I2的每一个像素进行比较，若I1中像素值小于对应的I2像素值的像素，置为0，若I1中像素值不小于对应的I2像素值的像素，置为255，得到提取人脸弱特征后的图像I3。

步骤2，利用卷积神经网络对图像I3提取睁闭眼特征，判断人眼状态；

如图3所示，利用卷积神经网络判断人眼睁闭状态的具体过程是：首先将图像I3输入训练好的卷积神经网络结构，网络处理图像的每个像素点，然后通过全连接网络层输出人眼状态结果。其中，所述卷积神经网络包含3个卷积层，3个下采样层和1个全连接层，其中，3个卷积层的卷积核大小为3*3，2个下采样层的核大小为2*2。

其中，卷积神经网络的学习过程包括训练阶段和预测阶段，训练阶段如图4所示，包括：

(1)将大量标注好闭眼或者睁眼的人脸图像数据根据步骤1生成含有标注信息的100*100的人脸弱特征图像训练样本；

(2)利用公知的随机梯度下降算法更新3个卷积层和1个全连接层参数，完成训练阶段，得到最优的网络模型参数；

所述预测阶段如图5，具体过程是：将提取人脸弱特征后的图像I3输入到训练好的网络中，得到一个输出值output，若output大于等于0.5，那么判断为闭眼状态；若小于0.5，那么判断为睁眼状态。需要说明的是，所述output的取值范围是[0,1]，0属于绝对闭眼状态，1属于绝对睁眼状态，睁眼和闭眼的中间值为0.5，因此在本实施例中，设定output的范围在[0.5,1]的情况就属于闭眼状态，output的范围在[0,0.5)的情况下就属于睁眼状态。

以上实施例仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明保护范围之内。

Claims

1.一种鲁棒性人眼状态判断方法，其特征在于包括如下步骤：

步骤1，提取人脸图像中的弱特征：

2.如权利要求1所述的一种鲁棒性人眼状态判断方法，其特征在于：所述步骤1包括如下具体内容：

3.如权利要求2所述的一种鲁棒性人眼状态判断方法，其特征在于：所述将给定的人脸图像转换为单通道灰度图像，再缩放为尺寸为100*100的图像。

4.如权利要求2所述的一种鲁棒性人眼状态判断方法，其特征在于：所述对高斯滤波后的图像作高斯自适应二值化，得到提取人脸弱特征后的图像的具体内容是：将高斯滤波后的图像经过高斯加权再减去一个差值，得到阈值图像，将高斯滤波后的图像的每一个像素与阈值图像的每一个像素进行比较，若高斯滤波后的图像中像素值小于对应的阈值图像像素值的像素，置为0，若高斯滤波后的图像中像素值不小于对应的阈值图像像素值的像素，置为255，得到提取人脸弱特征后的图像。

5.如权利要求1所述的一种鲁棒性人眼状态判断方法，其特征在于：所述步骤2的具体内容是：将步骤1得到的图像输入训练好的卷积神经网络结构，网络处理图像的每个像素点，然后通过全连接网络层输出人眼状态结果，其中，所述卷积神经网络包含3个卷积层，3个下采样层和1个全连接层，其中，3个卷积层的卷积核大小为3*3，2个下采样层的核大小为2*2。

6.如权利要求5所述的一种鲁棒性人眼状态判断方法，其特征在于：所述卷积神经网络的训练阶段包括：

7.如权利要求6所述的一种鲁棒性人眼状态判断方法，其特征在于：所述步骤b中，利用随机梯度下降算法更新3个卷积层和1个全连接层参数。

8.如权利要求5所述的一种鲁棒性人眼状态判断方法，其特征在于：所述卷积神经网络输出人眼状态结果的具体内容是：将待判断的提取弱特征后的图像输入到训练好的卷积神经网络中，得到一个输出值，若输出值大于等于判断阈值，那么判断为闭眼状态，否则判断为睁眼状态。

9.如权利要求8所述的一种鲁棒性人眼状态判断方法，其特征在于：所述判断阈值的设定方法是：设0属于绝对闭眼状态，1属于绝对睁眼状态，睁眼和闭眼的中间值为0.5，因此将判断阈值设为0.5，若output大于等于0.5，那么判断为闭眼状态；若小于0.5，那么判断为睁眼状态。