CN106485214A - 一种基于卷积神经网络的眼睛和嘴部状态识别方法 - Google Patents
一种基于卷积神经网络的眼睛和嘴部状态识别方法 Download PDFInfo
- Publication number
- CN106485214A CN106485214A CN201610860437.1A CN201610860437A CN106485214A CN 106485214 A CN106485214 A CN 106485214A CN 201610860437 A CN201610860437 A CN 201610860437A CN 106485214 A CN106485214 A CN 106485214A
- Authority
- CN
- China
- Prior art keywords
- feature
- layer
- mouth
- eyes
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 25
- 238000001514 detection method Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 10
- 238000013461 design Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012417 linear regression Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000013480 data collection Methods 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 229940079593 drug Drugs 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 210000005036 nerve Anatomy 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 230000001815 facial effect Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 8
- 210000002569 neuron Anatomy 0.000 description 8
- 238000005286 illumination Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241001282135 Poromitra oscitans Species 0.000 description 1
- 206010048232 Yawning Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000000744 eyelid Anatomy 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Abstract
本发明涉及一种基于卷积神经网络的眼睛和嘴部状态识别方法,通过该方法设计的SR‑Net网络对大量眼睛和嘴部不同状态的样本进行学习。面部状态识别可以视为眼睛和嘴部的状态识别。本发明能够更加准确的对眼睛和嘴部的状态进行识别分类。由于卷积神经网络避免了人工特征的抽取,对眼睛及嘴部状态的识别具有很高鲁棒性。并且该方法对佩戴墨镜的情况识别率得到提升,将眼睛态识别的平均准确率提高98.41%以上;对无眼镜下的眼睛状态平均识别率为98.92%,嘴部状态平均识别率为99.33%。
Description
技术领域
本发明涉及一种基于卷积神经网络的眼睛和嘴部状态识别方法,该方法能够适应光照变化以及眼镜遮挡的情况,属于图像识别技术领域,可应用于判定驾驶员的疲劳状态。
背景技术
眼睛和嘴部状态识别可认为等同于人脸面部状态的识别,是图像识别领域的重要内容,对信息安全、自动驾驶等技术有着直接的影响。根据美国国家统计和分析中心的报告,疲劳驾驶是引发交通事故的重要原因之一,因此,驾驶员疲劳检测技术的研究对于预防交通事故有着重要的意义。近年来,随着计算机硬件水平的提高,基于视觉的疲劳检测方法的不断发展。
基于视觉的驾驶员疲劳检测系统应用中,眨眼频率以及打哈欠状态是疲劳检测的重要指标。因此,眼睛和嘴部的状态检测是疲劳检测中的关键问题,由于光照变化以及佩戴墨镜等情况,增加了眼睛状态识别的难度,其状态识别的准确率对系统的性能及实际应用有重要影响。
传统检测眼睛状态的方法有很多种,第一类方法采用模板匹配方法判断眼睛状态,由于虹膜在眼睑中位置不固定,易产生误检。采用多模板匹配,检测效率低实时性差。第二类方法采用眼睛虹膜区域灰度投影曲线判断眼睛状态,对光照要求较高,适用的场景少。第三类方法使用基于LBP特征与SVM分类器结合的眼睛开闭检测,对驾驶员佩戴墨镜以及姿态变化有一定的局限性,鲁棒性差。第四类方法采用基于多特征融合的眼睛状态识别,该方法需要多个分类器进行决策融合,实时性较差。传统分类器的方法,需要人为选取合适的特征,将提取的特征输入到判别分类器中,特征的选取的合适与否,成为制约分类器效果的关键因素。
卷积神经网络对特征有更好的表达力、避免了人工特征选取过程,在卷积神经网络提出之前,由于缺乏类似的技术手段,图像识别领域一直局限于“先提取 特征,后模式识别”的框架,识别的准确性无法突破该技术框架的瓶颈,进展缓慢。
发明内容
本发明的目的是克服现有技术的上述不足,自主设计构建了红外图像采集系统(Infrared image acquisition system,简称IIA-S)获得待测数据集中的部分红外图像,结合卷积神经网络对特征有更好的表达力、避免了人工特征选取过程的优点。
提出一种针对面部状态识别、具有较好的抗眼镜遮挡性能、识别准确率高的状态识别网络(State recognition nets,简称SR-Net),并应用SR-Net完成对包含IIA-S采集结果在内的待测数据中眼睛和嘴部状态的识别方法的设计和验证。为此,本发明采用如下的技术方案:
1.采用红外光源、窄带滤光片配合工业镜头搭建用于采集待测图像的红外采集系统;
2.用上述步骤1中所搭建的系统采集部分待测的面部图像;
3.采用基于haar特征和AdaBoost算法的人脸检测算法或其他人脸检测算法检测出人脸区域;
4.由随机森林和线性回归结合的方法检测出步骤3得到的结果上包括眼睛、嘴部、鼻梁、眉骨和外侧主轮廓的人脸特征点的提取;
5.在上述步骤4确定人脸特征点的基础上结合正则化方法利用LBF特征检测出人脸的眼睛和嘴部区域;
6.构建SR-Net的核心结构卷积层;
7.构建SR-Net的降采样层,以减少计算量,提高特征的鲁棒性,提高模型的准确率;
8.采用修正线性单元构建SR-Net的全连接层,克服非线性激活函数常见的梯度消失的问题;
9.以一定的概率p(通常设为0.5)让隐藏层的部分神经元输出值设置为0设计SR-Net的Dropout,减少过拟合现象,进而提高网络的泛化能力;
10.构建训练样本集并选取相应的网络结构和迭代次数训练SR-Net的网络模型;
11.输入待测数据集,应用SR-Net模型完成眼睛和嘴部状态识别并输出结果。
与现有技术相比,本发明的有益效果是:
准确性高。本发明基于卷积神经网络的眼睛和嘴部状态识别方法,通过网络层对大量眼睛和嘴部不同状态的样本进行学习,能够准确的对眼睛和嘴部的状态进行识别分类,该识别的方法平均判别准确率达98%以上,相比其他的判别方法,有明显的提高;
适用范围广,该方法对佩戴墨镜的情况识别率得到提升,将眼睛状态识别的准确率提高到98%以上;
鲁棒性好。卷积神经网络避免了人工特征的抽取,使得提取的特征符合机器视觉的判断逻辑,加入降采样层后,提高了算法的鲁棒性;
通过正则化方法以及对SR-Net的降采样层的设计,降低该方法的计算量,有助于提高运行速度和实时性,对不同平台的移植和推广应用更加友好。
附图说明
图1为本发明的流程图。
图2为红外图像采集系统示意图。
图3为特征点检测结果。
图4为卷积神经网络基本结构。
图5为SR-Net网络卷积层卷积结果。
图6为部分眼睛嘴部部分训练样本。
具体实施方式
为使贵审查员能进一步了解本发明的结构、特征及其他目的,现结合所附较佳实施例详细说明如下,所说明的较佳实施例仅用于说明本发明的技术方案,并非限定本发明。
本发明的流程如图1所示,首先,采用基于haar特征结合AdaBoost算法(或 其他方式)检测出感兴趣的人脸区域,基于初步人脸检测结果由随机森林和线性回归结合的方法进行人脸特征点的检测,并提取眼睛和嘴部区域;然后根据卷积神经网络卷积层、降采样层和全连接层的基本结构构造和Lenet5网络结构,通过对局部感受视野卷积、权值共享和降采样对神经网络结构进行优化来减少网络中神经元个数以及权值以获得全新的Staterecognition nets(简称SR-Net)网络,使其选择的特征具有位移、缩放和扭曲不变性;最后应用该SR-Net识别待测数据的眼睛和嘴部区域。下面结合附图,对本发明技术方案的具体实施过程加以说明。
1.构建红外采集系统
为了有效克服复杂光照对图像产生的影响以及满足夜间使用的需求,图像采集系统选用主动红外光源(850nm)进行补光照明,同时采用850nm的窄带滤光片进行配合使用,减少其他波长光线的干扰,同时可以穿透墨镜,获取红外光谱下的眼睛图像进行分析。图2为基于红外照明的驾驶员面部图像采集系统。
2.检测人脸区域
本方法有适应性强、模块化程度高、可移植的特点,对人脸区域的检测结果没有特别的要求,可以采用基于haar特征和AdaBoost算法的人脸检测作为检测人脸区域检测的技术手段,也可采用Eigenface(PCA)算法、经典的模板匹配算法,或采用主分量分析进行降维和提取特征的特征脸方法等手段检测人脸区域。
3.检测人脸特征点并提取
将人脸区域内的人脸所有关键点的局部特征组合为LBF(Local Binary Feature)特征,利用LBF特征进行全局回归,通过级联获得形状增量,进行形变预测;利用LBF特征高度稀疏的特点,使得特征的提取与回归速度加快快,进一步满足实时性要求。通过回归分析进行分析预测判断,建立从输入信息到输出信息之间的映射关系,完成检测出的人脸区域内的包括眼睛、嘴部、鼻梁、眉骨和外侧主轮廓的人脸特征点的提取。
4.眼睛和嘴部区域提取
在已经确定人脸特征点的基础上,提取该人脸的眼镜和嘴部区域。人脸特征点的形状为S,从初始形状S0,通过级联的形式预测,形状增量ΔS不断进行调 整改善,经过t级回归后形状增量ΔSt,ΔSt定义如下:
ΔSt=WtΦt(I,St-1)
其中I为输入图像,St-1为上一级的形状,Φt为LBF特征映射函数,Wt为线性回归矩阵。 为第l个特征点周围区域回归获得,定义如下:
其中i为训练样本的数量,πl操作为从形状增量中获取(2l-1,2l)元素。为在第i个训练样本中第l个特征点的形状增量。中存放与相应叶子节点对应的二维向量。正则化方法可以有效的筛选出主要的噪声和判别性较弱的特征,降低学习的复杂度,达到更好地泛化性能。最后,利用LBF特征训练全局线性回归矩阵Wt。
人脸特征点及眼睛和嘴部区域检测结果如图3所示。
5.构建State recognition nets(SR-Net)
5.1SR-Net的卷积层
卷积神经网络直接以二维图像为输入,自动学习特征以及数据内部的隐含关系,避免了对图像进行复杂的预处理。图4是本方法研究所改进的卷积神经网络的(CNN)基本结构,包括卷积层、降采样层和全连接层。核心思想是通过局部感受野卷积、权值共享和降采样对神经网络结构进行优化,减少网络中神经元个数以及权值;采用降采样技术使特征具有位移、缩放和扭曲不变性。本文所使用State recognition nets(简称SR-Net)网络是Lenet5网络的一个变体。下面以CNN基本的网络结构的顺序,首先对SR-Net卷积层的组成进行说明。
卷积层是SR-Net的核心结构。SR-Net采用权值共享的方式,减少权值的数量,使得网络易于优化。其中每个卷积层含有多个特征平面,通过卷积核对上一层图像进行卷积,加上偏置得到当前层的特征图。不同的卷积核(权值矩阵)通过“滑动窗口”的方式提取输入图像不同位置的特征。通过网络的训练,卷积核可提取出某些有意义的特征。该过程可表示为:
其中:为第l层第j个特征图的输入;f(·)表示激活函数;为前一层第i个特征图与当前层第j个特征图之间的卷积核;为第l层第j个特征图的偏置;Mj为前一层中与当前层第j个特征图有链接的所有特征图。
图5为输入图像经过C1层中不同卷积核卷积之后特征映射图。由图可知,不同的卷积核提取到图像的不同特征,多个卷积层可以对输入的图像进行逐层抽象,获得更高层次的分布式特征表达。
5.2SR-Net的降采样层
降采样层的作用是对特征进行降维,减小计算复杂度,保持特征不变。它通常紧接着卷积层,根据缩放算法的不同,分为锐化(Max pooling)、平滑(Avg pooling)。对输入图像数据块的逐层缩放,让各层获得不同比例的局部感受野,使得模型获得图像中的缩放不变性,增强泛化能力。通过图像局部相关的原理,对图像进行抽样,保留图像整体结构信息的同时大大减少数据量。降采样层的一般表达形式如下定义:
其中,down(·)表示抽样函数,β和b都是输出特征的偏置,f(·)是降采样层神经元的激活函数。图4中,S1和S2表示降采样层,卷积核尺寸均为2*2,步长为2。
选取两个卷积层和全连接层相同的网络结构,使用相同的训练样本对有无降采样层的网络进行训练,实验结果如表1所示。
分析可知,降采样不但大大减少计算量,还可以提高特征的鲁棒性,提高准确率。
表1有无降采样层迭代100000次实验结果
5.3SR-Net的全连接层
全连接层上每一个神经元,均与上一层特征图中的所有神经元互相连接。与卷积层局部链接方式相比,全连接层的全连接方式会产生更多的网络参数。通过 之前的卷积层和降采样层已经降低了特征维数,大大减小了全连接层的计算量。每一个神经元的输出定义如下所示:
hW,b(x)=f(WTx+b)
其中,x为神经元的输入;hW,b(x)为神经元的输出;W为连接权重;b为偏置;f(·)为激活函数。
常用的非线性激活函数有Sigmoid函数和Tanh函数,但是以上函数容易出现梯度消失的问题,为了克服该问题,采用修正线性单元Rectified linear unit,其激活函数的定义为:
ReLU(x)=max(0,x)
该激活函数可以获得稀疏表达,并具有单侧抑制等优点,其表现通常优于其他激活函数。
5.4SR-Net的Dropout设计
在卷积神经网络中,如果训练样本较少且模型参数较多,训练出来的模型容易产生过拟合现象。在训练时dropout的策略就是以一定的概率p(通常设为0.5)让隐藏层的部分神经元输出值设置为0,用如下表达式说明:
ytrain=p×x
由于隐藏节点的随机性,其对应的网络结构都是不同的,但不同的网络结构又同时共享了隐藏层之间的权值。可以明显的减少过拟合现象,进而提高网络的泛化能力。
6.训练SR-Net(State recognition nets)
6.1构建训练数据集
选取20000张图片作为实验训练样本,其中睁眼图片7000张、闭眼图片5000张、张嘴图片4000张以及闭嘴图片4000张。训练时首先对正负样本进行灰度化,图片尺寸统一调整为36*28。部分样本如图6所示。
6.2选取网络结构并按相应迭代次数进行训练
卷积核的大小对特征的提取有着直接的关系,同时降采样层对网络计算复杂度也有相当的影响,因此要根据识别场景和方案实施环境的不同选取不同的卷积核和降采样层来设计SR-Net的网络结构。
对本方法而言,推荐的候选卷积层为3*3、5*5、9*9,降采样层为2*2、1*1。 推荐的最优候选结构为卷积层5*5、降采样层为2*2;将构建的训练数据集按相应迭代学习次数,推荐次数100000次,训练SR-Net,最终生成可使得识别率呈缓慢变化,分类性区域稳定的网络模型。
7.获得待测数据集及其眼睛、嘴部状态识别结果
7.1输入网络模型数据预处理
对待测数据集按照训练集的图像处理方法,即上述的检测人脸区域、特征点提取和眼睛嘴部区域提取,进行处理,最终获得相应的人脸图像的眼睛嘴部区域作为SR-Net模型输入数据。
7.2输出待测数据集识别结果
因SR-Net模型是基于深度学习理论获得的识别模型,对输入图像数据的尺寸、颜色空间等传统图像属性并不敏感,因此可选择不进行包括图像灰度化、尺寸规定化等内容待识别输入数据预处理,直接输入待测图像数据即可进行眼睛和嘴部状态的识别,最终输出该数据集的眼睛和嘴部状态。
Claims (11)
1.一种基于卷积神经网络的眼睛和嘴部状态识别方法,所述方法包括下列步骤:
(1)采用红外光源、窄带滤光片配合工业镜头搭建用于采集待测图像的红外采集系统;
(2)用步骤1中所搭建的系统采集部分待测的面部图像;
(3)采用基于haar特征和AdaBoost算法的人脸检测算法或其他人脸检测算法检测出人脸区域;
(4)由随机森林和线性回归结合的方法检测出步骤3得到的结果上包括眼睛、嘴部、鼻梁、眉骨和外侧主轮廓的人脸特征点的提取;
(5)在步骤4确定人脸特征点的基础上结合正则化方法利用LBF特征检测出人脸的眼睛和嘴部区域;
(6)构建SR-Net的核心结构卷积层;
(7)构建SR-Net的降采样层,以减少计算量,提高特征的鲁棒性,提高模型的准确率;
(8)采用修正线性单元构建SR-Net的全连接层,克服非线性激活函数常见的梯度消失的问题;
(9)以一定的概率p,通常设为0.5,让隐藏层的部分神经元输出值设置为0设计SR-Net的Dropout,减少过拟合现象,进而提高网络的泛化能力;
(10)构建训练样本集并选取相应的网络结构和迭代次数训练SR-Net的网络模型;
(11)输入待测数据集,应用SR-Net模型完成眼睛和嘴部状态识别并输出结果。
2.如权利要求1所述的方法,其特征在于,步骤(2)中,选用主动红外光源(850nm)进行补光照明,同时采用850nm的窄带滤光片进行配合使用,搭建的红外图像采集系统如图2。
3.如权利要求1所述的方法,步骤(3)中,本方法对人脸检测算法不敏感,可采用其他替代算法。
4.如权利要求1所述的方法,其特征在于,步骤(4)中,将人脸区域内的人脸所有关键点的局部特征组合为LBF,Local Binary Feature特征,利用LBF特征进行全局回归,通过级联获得形状增量,进行形变预测;利用LBF特征高度稀疏的特点,使得特征的提取与回归速度加快快,满足实时性要求,通过回归分析进行分析预测判断,建立从输入信息到输出信息之间的映射关系,完成检测出的人脸区域内的包括眼睛、嘴部、鼻梁、眉骨和外侧主轮廓的人脸特征点的提取。
5.如权利要求1所述的方法,步骤(5)中,在正则化方法可以筛选出主要的噪声,降低学习的复杂度,达到泛化性能,并利用LBF特征训练全局线性回归矩阵Wt。
6.如权利要求1所述的方法,其特征在于,步骤(6)、(7)、(8)中,采用改进自Lenet5的State recognition nets,简称SR-Net,能够自适应提取特征能力,使学习到的特征具有表征能力和推广性。
7.如权利要求1所述的方法,其特征在于,步骤(6)、(7)、(8)中,推荐的最优候选结构为卷积层5*5、降采样层为2*2,步长为2,训练迭代次数为100000次。
8.如权利要求1所述的方法,其特征在于,步骤(6)中通过网络的训练,卷积核提取出特征的过程可表示为:
其中:为第i层第j个特征图的输入;f(·)表示激活函数;为前一层第i个特征图与当前层第j个特征图之间的卷积核;为第l层第j个特征图的偏置;Mj为前一层中与当前层第j个特征图有链接的所有特征图,由图5可知,不同的卷积核提取到图像的不同特征,多个卷积层可以对输入的图像进行逐层抽象,获得高层次的分布式特征表达。
9.如权利要求1所述的方法,其特征在于,步骤(7)中,输入图像数据块的逐层缩放,让各层获得不同比例的局部感受野,使得模型获得图像中的缩放不变性,通过图像局部相关的原理,对图像进行抽样,保留图像整体结构信息的同时减少数据量,在100000次迭代时,有降采样层可将准确率提高3%到3.5%,训练时间缩短41%到65%。
10.如权利要求1所述的方法,其特征在于,步骤(8)中,修正线性单元的激活函数定义为:ReLU(x)=max(0,x)。
11.如权利要求1所述的方法,其特征在于,步骤(9)中,选20000张图片作为训练样本,睁眼图片7000张、闭眼图片5000张、张嘴图片4000张以及闭嘴图片4000张;训练时首先对正负样本进行灰度化,图片尺寸统一调整为36*28。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610860437.1A CN106485214A (zh) | 2016-09-28 | 2016-09-28 | 一种基于卷积神经网络的眼睛和嘴部状态识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610860437.1A CN106485214A (zh) | 2016-09-28 | 2016-09-28 | 一种基于卷积神经网络的眼睛和嘴部状态识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106485214A true CN106485214A (zh) | 2017-03-08 |
Family
ID=58267718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610860437.1A Pending CN106485214A (zh) | 2016-09-28 | 2016-09-28 | 一种基于卷积神经网络的眼睛和嘴部状态识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106485214A (zh) |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194346A (zh) * | 2017-05-19 | 2017-09-22 | 福建师范大学 | 一种汽车疲劳驾驶预测方法 |
CN107247934A (zh) * | 2017-05-27 | 2017-10-13 | 湖北天业云商网络科技有限公司 | 一种基于快速特征点定位的全天候哈欠检测方法及系统 |
CN107330378A (zh) * | 2017-06-09 | 2017-11-07 | 湖北天业云商网络科技有限公司 | 一种基于嵌入式图像处理的驾驶员行为检测系统 |
CN107729854A (zh) * | 2017-10-25 | 2018-02-23 | 南京阿凡达机器人科技有限公司 | 一种机器人的手势识别方法、系统及机器人 |
CN108229443A (zh) * | 2018-02-08 | 2018-06-29 | 三星电子(中国)研发中心 | 一种防闭眼的拍照方法和装置 |
CN108701214A (zh) * | 2017-12-25 | 2018-10-23 | 深圳市大疆创新科技有限公司 | 图像数据处理方法、装置及设备 |
CN108764185A (zh) * | 2018-06-01 | 2018-11-06 | 京东方科技集团股份有限公司 | 一种图像处理方法及装置 |
CN109297975A (zh) * | 2018-08-16 | 2019-02-01 | 奇酷互联网络科技(深圳)有限公司 | 移动终端及检测方法、存储装置 |
WO2019033570A1 (zh) * | 2017-08-17 | 2019-02-21 | 平安科技(深圳)有限公司 | 嘴唇动作分析方法、装置及存储介质 |
CN109522871A (zh) * | 2018-12-04 | 2019-03-26 | 北京大生在线科技有限公司 | 一种基于随机森林的人脸轮廓定位方法及系统 |
CN109635795A (zh) * | 2018-10-22 | 2019-04-16 | 小黄狗环保科技有限公司 | 一种基于vgg16网络模型提高瓶罐识别率的智能补光方法 |
CN109934171A (zh) * | 2019-03-14 | 2019-06-25 | 合肥工业大学 | 基于分层网络模型的驾驶员消极驾驶状态在线感知方法 |
CN110119676A (zh) * | 2019-03-28 | 2019-08-13 | 广东工业大学 | 一种基于神经网络的驾驶员疲劳检测方法 |
CN110163037A (zh) * | 2018-03-14 | 2019-08-23 | 北京航空航天大学 | 监测驾驶员状态的方法、设备、系统、处理器及存储介质 |
CN110334679A (zh) * | 2019-07-11 | 2019-10-15 | 厦门美图之家科技有限公司 | 人脸点处理方法及装置 |
CN110363093A (zh) * | 2019-06-19 | 2019-10-22 | 深圳大学 | 一种司机动作识别方法及装置 |
CN110399821A (zh) * | 2019-07-17 | 2019-11-01 | 上海师范大学 | 基于人脸表情识别的顾客满意度获取方法 |
CN110728179A (zh) * | 2019-09-04 | 2020-01-24 | 天津大学 | 一种采用多路卷积神经网络的猪脸识别方法 |
CN110909601A (zh) * | 2019-10-18 | 2020-03-24 | 武汉虹识技术有限公司 | 一种基于深度学习的美瞳识别方法及系统 |
CN112183220A (zh) * | 2020-09-04 | 2021-01-05 | 广州汽车集团股份有限公司 | 一种驾驶员疲劳检测方法及其系统、计算机存储介质 |
CN112382277A (zh) * | 2021-01-07 | 2021-02-19 | 博智安全科技股份有限公司 | 智能设备唤醒方法、智能设备和计算机可读存储介质 |
CN113435267A (zh) * | 2021-06-09 | 2021-09-24 | 江苏第二师范学院 | 一种基于改进的卷积神经网络的在线教育学生专注力判别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593425A (zh) * | 2009-05-06 | 2009-12-02 | 深圳市汉华安道科技有限责任公司 | 一种基于机器视觉的疲劳驾驶监控方法及系统 |
CN101908152A (zh) * | 2010-06-11 | 2010-12-08 | 电子科技大学 | 一种基于用户定制分类器的眼睛状态识别方法 |
CN104809445A (zh) * | 2015-05-07 | 2015-07-29 | 吉林大学 | 基于眼部和嘴部状态的疲劳驾驶检测方法 |
CN105118237A (zh) * | 2015-09-16 | 2015-12-02 | 苏州清研微视电子科技有限公司 | 用于疲劳驾驶预警系统的智能照明系统 |
CN105718913A (zh) * | 2016-01-26 | 2016-06-29 | 浙江捷尚视觉科技股份有限公司 | 一种鲁棒的人脸特征点定位方法 |
-
2016
- 2016-09-28 CN CN201610860437.1A patent/CN106485214A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101593425A (zh) * | 2009-05-06 | 2009-12-02 | 深圳市汉华安道科技有限责任公司 | 一种基于机器视觉的疲劳驾驶监控方法及系统 |
CN101908152A (zh) * | 2010-06-11 | 2010-12-08 | 电子科技大学 | 一种基于用户定制分类器的眼睛状态识别方法 |
CN104809445A (zh) * | 2015-05-07 | 2015-07-29 | 吉林大学 | 基于眼部和嘴部状态的疲劳驾驶检测方法 |
CN105118237A (zh) * | 2015-09-16 | 2015-12-02 | 苏州清研微视电子科技有限公司 | 用于疲劳驾驶预警系统的智能照明系统 |
CN105718913A (zh) * | 2016-01-26 | 2016-06-29 | 浙江捷尚视觉科技股份有限公司 | 一种鲁棒的人脸特征点定位方法 |
Non-Patent Citations (2)
Title |
---|
SHAOQING REN 等: "Face Alignment at 3000 FPS via Regressing Local Binary Features", 《CVPR2014》 * |
汪济民: "基于卷积神经网络的人脸检测和性别识别研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194346A (zh) * | 2017-05-19 | 2017-09-22 | 福建师范大学 | 一种汽车疲劳驾驶预测方法 |
CN107247934A (zh) * | 2017-05-27 | 2017-10-13 | 湖北天业云商网络科技有限公司 | 一种基于快速特征点定位的全天候哈欠检测方法及系统 |
CN107330378A (zh) * | 2017-06-09 | 2017-11-07 | 湖北天业云商网络科技有限公司 | 一种基于嵌入式图像处理的驾驶员行为检测系统 |
WO2019033570A1 (zh) * | 2017-08-17 | 2019-02-21 | 平安科技(深圳)有限公司 | 嘴唇动作分析方法、装置及存储介质 |
CN107729854A (zh) * | 2017-10-25 | 2018-02-23 | 南京阿凡达机器人科技有限公司 | 一种机器人的手势识别方法、系统及机器人 |
WO2019080203A1 (zh) * | 2017-10-25 | 2019-05-02 | 南京阿凡达机器人科技有限公司 | 一种机器人的手势识别方法、系统及机器人 |
CN108701214A (zh) * | 2017-12-25 | 2018-10-23 | 深圳市大疆创新科技有限公司 | 图像数据处理方法、装置及设备 |
CN108229443A (zh) * | 2018-02-08 | 2018-06-29 | 三星电子(中国)研发中心 | 一种防闭眼的拍照方法和装置 |
CN110163037A (zh) * | 2018-03-14 | 2019-08-23 | 北京航空航天大学 | 监测驾驶员状态的方法、设备、系统、处理器及存储介质 |
CN108764185A (zh) * | 2018-06-01 | 2018-11-06 | 京东方科技集团股份有限公司 | 一种图像处理方法及装置 |
CN108764185B (zh) * | 2018-06-01 | 2022-07-19 | 京东方科技集团股份有限公司 | 一种图像处理方法及装置 |
US11321952B2 (en) | 2018-06-01 | 2022-05-03 | Boe Technology Group Co., Ltd. | Computer-implemented method of alerting driver of vehicle, apparatus for alerting driver of vehicle, vehicle, and computer-program product |
CN109297975A (zh) * | 2018-08-16 | 2019-02-01 | 奇酷互联网络科技(深圳)有限公司 | 移动终端及检测方法、存储装置 |
CN109635795B (zh) * | 2018-10-22 | 2023-05-16 | 小黄狗环保科技有限公司 | 一种基于vgg16网络模型提高瓶罐识别率的智能补光方法 |
CN109635795A (zh) * | 2018-10-22 | 2019-04-16 | 小黄狗环保科技有限公司 | 一种基于vgg16网络模型提高瓶罐识别率的智能补光方法 |
CN109522871A (zh) * | 2018-12-04 | 2019-03-26 | 北京大生在线科技有限公司 | 一种基于随机森林的人脸轮廓定位方法及系统 |
CN109522871B (zh) * | 2018-12-04 | 2022-07-12 | 北京大生在线科技有限公司 | 一种基于随机森林的人脸轮廓定位方法及系统 |
CN109934171A (zh) * | 2019-03-14 | 2019-06-25 | 合肥工业大学 | 基于分层网络模型的驾驶员消极驾驶状态在线感知方法 |
CN110119676A (zh) * | 2019-03-28 | 2019-08-13 | 广东工业大学 | 一种基于神经网络的驾驶员疲劳检测方法 |
CN110119676B (zh) * | 2019-03-28 | 2023-02-03 | 广东工业大学 | 一种基于神经网络的驾驶员疲劳检测方法 |
CN110363093A (zh) * | 2019-06-19 | 2019-10-22 | 深圳大学 | 一种司机动作识别方法及装置 |
CN110334679B (zh) * | 2019-07-11 | 2021-11-26 | 厦门美图之家科技有限公司 | 人脸点处理方法及装置 |
CN110334679A (zh) * | 2019-07-11 | 2019-10-15 | 厦门美图之家科技有限公司 | 人脸点处理方法及装置 |
CN110399821A (zh) * | 2019-07-17 | 2019-11-01 | 上海师范大学 | 基于人脸表情识别的顾客满意度获取方法 |
CN110728179A (zh) * | 2019-09-04 | 2020-01-24 | 天津大学 | 一种采用多路卷积神经网络的猪脸识别方法 |
CN110909601A (zh) * | 2019-10-18 | 2020-03-24 | 武汉虹识技术有限公司 | 一种基于深度学习的美瞳识别方法及系统 |
CN112183220A (zh) * | 2020-09-04 | 2021-01-05 | 广州汽车集团股份有限公司 | 一种驾驶员疲劳检测方法及其系统、计算机存储介质 |
CN112382277A (zh) * | 2021-01-07 | 2021-02-19 | 博智安全科技股份有限公司 | 智能设备唤醒方法、智能设备和计算机可读存储介质 |
CN113435267A (zh) * | 2021-06-09 | 2021-09-24 | 江苏第二师范学院 | 一种基于改进的卷积神经网络的在线教育学生专注力判别方法 |
CN113435267B (zh) * | 2021-06-09 | 2023-06-23 | 江苏第二师范学院 | 一种基于改进的卷积神经网络的在线教育学生专注力判别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106485214A (zh) | 一种基于卷积神经网络的眼睛和嘴部状态识别方法 | |
US11195051B2 (en) | Method for person re-identification based on deep model with multi-loss fusion training strategy | |
CN108304788B (zh) | 基于深度神经网络的人脸识别方法 | |
CN105469034B (zh) | 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法 | |
Yan et al. | Multi-attributes gait identification by convolutional neural networks | |
CN108830157A (zh) | 基于注意力机制和3d卷积神经网络的人体行为识别方法 | |
CN106951867A (zh) | 基于卷积神经网络的人脸识别方法、装置、系统及设备 | |
CN107220635A (zh) | 基于多造假方式的人脸活体检测方法 | |
CN107194346A (zh) | 一种汽车疲劳驾驶预测方法 | |
CN107194376A (zh) | 面具造假卷积神经网络训练方法及人脸活体检测方法 | |
CN106599797A (zh) | 一种基于局部并行神经网络的红外人脸识别方法 | |
CN107292267A (zh) | 照片造假卷积神经网络训练方法及人脸活体检测方法 | |
CN107301396A (zh) | 视频造假卷积神经网络训练方法及人脸活体检测方法 | |
CN108647700A (zh) | 基于深度学习的多任务车辆部件识别模型、方法和系统 | |
CN109063626A (zh) | 动态人脸识别方法和装置 | |
Xu et al. | Face expression recognition based on convolutional neural network | |
CN106611156A (zh) | 一种自适应深度空间特征的行人识别方法和系统 | |
Lee et al. | Face and facial expressions recognition system for blind people using ResNet50 architecture and CNN | |
CN114492634A (zh) | 一种细粒度装备图片分类识别方法及系统 | |
CN114241458A (zh) | 一种基于姿态估计特征融合的驾驶员行为识别方法 | |
CN113221683A (zh) | 教学场景下基于cnn模型的表情识别方法 | |
Wu et al. | Facial expression recognition based on improved deep belief networks | |
Tunc et al. | Age group and gender classification using convolutional neural networks with a fuzzy logic-based filter method for noise reduction | |
Zhao et al. | Using an improved PSO-SVM model to recognize and classify the image signals | |
Vepuri | Improving facial emotion recognition with image processing and deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170308 |