CN108256426A - 一种基于卷积神经网络的人脸表情识别方法 - Google Patents
一种基于卷积神经网络的人脸表情识别方法 Download PDFInfo
- Publication number
- CN108256426A CN108256426A CN201711344904.6A CN201711344904A CN108256426A CN 108256426 A CN108256426 A CN 108256426A CN 201711344904 A CN201711344904 A CN 201711344904A CN 108256426 A CN108256426 A CN 108256426A
- Authority
- CN
- China
- Prior art keywords
- layer
- convolutional
- neural networks
- convolutional neural
- full articulamentum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种人脸表情识别方法,特别涉及一种基于卷积神经网络的人脸表情识别方法。本发明首先从视频中获取人脸图像,对获取到的人脸图像进行尺度归一化操作处理,得到尺寸相同的人脸图像,并对所述尺寸相同的人脸图像进行对齐预处理操作,得到预处理后的人脸图像;使用卷积神经网络对预处理后的人脸图像进行特征提取操作,得到人脸图像的特征,利用Softmax分类器对所述人脸图像的特征进行分类识别操作,利用卷积神经网络实现的人脸表情识别算法是一种端对端的过程,本方法只需对人脸图像做简单的预处理,然后送入卷积神经网络中,自动进行特征提取,并给出分类结果,不仅大幅度的提高了准确率,减少了可调参数,极大程度上简化了中间的处理步骤。
Description
技术领域
本发明涉及一种人脸表情识别方法,特别涉及一种基于卷积神经网络的人脸表情识别方法。
背景技术
视频人脸图像是平安城市基础视频平台中最基础也是最重要的数据之一,研究人脸表情对于舆情分析有重要的作用,而由于摄像机本身的原因,例如,摄像机镜头有灰尘或外界光照等因素的影响,使得获取的视频图像模糊、不清晰,从而对获取到的目标图像的表情识别有一定的影响,另一方面,由于现实场景中环境的复杂多样,使用传统的手工算法提取特征的速度变得更加缓慢,浪费了大量的人力物力。
目前,传统的人脸表情识别方法的特征提取处理算法包括Gabor小波算法、主成份分析算法、线性判别分析算法等;而常用的分类算法包括最近邻算法、支持向量机等。上述这些传统算法在人脸表情识别的实际应用上存在着自身的局限与不足,计算速度慢,准确率低,可设置调整的参数复杂多样,操作复杂。
发明内容
本发明为了克服上述现有技术的不足,提供了一种基于卷积神经网络的人脸表情识别方法,本发明不仅大幅度提高了人脸表情识别的准确率,还简化了操作步骤。
为实现上述目的,本发明采用了以下技术措施:
一种基于卷积神经网络的人脸表情识别方法,包括以下步骤:
S1、从视频中获取人脸图像;
S2、对获取到的人脸图像进行尺度归一化操作处理,得到尺寸相同的人脸图像,并对所述尺寸相同的人脸图像进行对齐预处理操作,得到预处理后的人脸图像;
S3、使用卷积神经网络对预处理后的人脸图像进行特征提取操作,得到人脸图像的特征;
S4、利用Softmax分类器对所述人脸图像的特征进行分类识别操作,得到表情识别结果。
优选的,步骤S3的具体操作步骤包括:
S31、创建卷积神经网络;
S32、利用卷积神经网络对预处理后的人脸图像进行特征提取操作,并通过反向传播算法对卷积神经网络的权重和偏置进行更新优化。
优选的,步骤S31中的卷积神经网络包括三个卷积层、三个池化层、三个全连接层,三个所述卷积层分别为第一卷积层、第二卷积层、第三卷积层,三个所述池化层分别为第一池化层、第二池化层、第三池化层,三个所述全连接层分别为第一全连接层、第二全连接层、第三全连接层;
步骤S32中的利用卷积神经网络对预处理后的人脸图像进行特征提取操作的具体步骤包括:预处理后的人脸图像依次经过数据输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一全连接层、第二全连接层、第三全连接层,得到人脸图像的特征。
优选的,所述第一卷积层的卷积核的大小设置为7×7,单位为像素,步长设置为4,单位为像素,填充设置为0,单位为像素;第二卷积层的卷积核的大小设置为5×5,单位为像素,步长设置为1,单位为像素,填充设置为2,单位为像素;第三卷积层的卷积核的大小设置为3×3,单位为像素,步长设置为1,单位为像素,填充设置为1,单位为像素;所述第一池化层、第二池化层、第三池化层的卷积核的大小均设置为3×3,单位为像素,步长设置为2,单位为像素,填充设置为0,单位为像素;第一全连接层的卷积核的大小设置为1×1,单位为像素,向量的维数设置为4096维;第二全连接层的卷积核的大小设置为1×1,单位为像素,向量的维数设置为4096维;第三全连接层的卷积核的大小设置为1×1,单位为像素,向量的维数设置为7维。
进一步的,步骤S32中的通过反向传播算法对卷积神经网络的权重和偏置进行更新优化的具体步骤包括:
S321、给定卷积神经网络一个样本(x,y),x为输入样本,y为预测的输出值,通过卷积神经网络对预处理后的人脸图像进行前向传播运算,得到第三全连接层的输出值hw,b(x);
S322、利用卷积神经网络中的第一卷积层、第二卷积层、第三卷积层、第一全连接层、第二全连接层中的每一个节点i和第三全连接层的输出值hw,b(x),得到第三全连接层的输出值hw,b(x)与实际输出值之间的差值即为残差;
S323、对于卷积神经网络的隐藏层单元,所述隐藏层单元包括第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一全连接层、第二全连接层,设m个样本的数据集为:{(x(1),y(1)),…,(x(m),y(m))},即m个样本的数据集包括m个样本(x,y),对于每一个样本(x,y)的代价函数J(W,b;x,y)为公式(1):
其中,W为卷积神经网络的权重,b为卷积神经网络的偏置,hW,b(x)为第三全连接层的输出值,x为输入样本,y为预测的输出值;
m个样本的数据集的整体误差为通过反向传播算法更新参数W,b的具体步骤如下:
首先计算输出层即为第三全连接层的残差
其中,为第一卷积层、第二卷积层、第三卷积层、第一全连接层、第二全连接层中的第l层第i个节点的激活值,为第l层第i个节点的输入加权和,为对求导数,yi为第i个节点的预测的输出值,nl为输出层;
第l层的第i个节点的残差为公式(3);
其中,为输出层的残差,表示从第1层到输出层求和,为l层第i个节点的权值,为l层第i个节点的输入加权和;
计算输出层的的偏导数,其中,公式(4)为对卷积神经网络的权重W求偏导数,公式(5)为对卷积神经网络的偏置b求偏导数;
为第l层第j个节点的激活值,为输出层第i个节点的残差;
利用公式(2)、(3)、(4)、(5)计算得出卷积神经网络的数据输入层的激活值、第一池化层的激活值、第二卷积层的激活值、第二池化层的激活值、第三卷积层的激活值、第三池化层的激活值、第一全连接层的激活值、第二全连接层的激活值以及输出层的激活值;
根据公式(6)计算输出层的残差
其中,为输出层的激活值即为样本(x,y)的实际输出值;
根据公式(7)计算数据输入层的激活值、第一池化层的激活值、第二卷积层的激活值、第二池化层的激活值、第三卷积层的激活值、第三池化层的激活值、第一全连接层的激活值、第二全连接层的激活值;
δ(l)=((W(l))Tδ(l+1))f′(z(l)) (7)
其中,l=nl-1,nl-2,…,2,W(l)为第l层的权值,δ(l+1)为输出层所有节点的残差之和,δ(l+1)为输出层的残差,z(l)为第l层的输入加权和;
根据公式(8)计算权重W的偏导数值,公式(9)计算偏置b的偏导数值;
其中,a(l)为第l层的激活值;
根据公式(8)和公式(9)对权重W和偏置b的不断求偏导数值,从而更新卷积神经网络的权重W和偏置b。
本发明的有益效果在于:
1)、本发明使用卷积神经网络对预处理后的人脸图像进行特征提取操作,得到人脸图像的特征,利用Softmax分类器对所述人脸图像的特征进行分类识别操作,利用卷积神经网络实现的人脸表情识别算法是一种端对端的过程,本方法只需对人脸图像做简单的预处理,然后送入卷积神经网络中,自动进行特征提取,并给出分类结果,不仅大幅度的提高了准确率,减少了可调参数,极大程度上简化了中间的处理步骤。
2)、本发明通过反向传播算法对卷积神经网络的权重和偏置参数进行更新优化,反向传播算法实际上是一个由局部到全部的计算过程,通过前向传播可以得到预测值,通过预测值和实际值的比较,形成误差,反向传播算法通过减小误差的方法,反向更新参数,从而大大提高了表情识别的识别率。
3)、所述第一卷积层的卷积核的大小设置为7×7,步长设置为4,填充设置为0;第二卷积层的卷积核的大小设置为5×5,步长设置为1,填充设置为2;第三卷积层的卷积核的大小设置为3×3,步长设置为1,填充设置为1;所述第一池化层、第二池化层、第三池化层的大小均设置为3×3,步长设置为2。设置特定的卷积核的大小,大大方便了以模块中心进行滑动卷积,同时卷积核设置为奇数就可以从图像的两边进行对称填充,方便填充;而且可以增加感受野,感受野为每个像素点和它周围的像素点强相关,使得学习的特征更具有全局性。
附图说明
图1为本发明的处理流程图;
图2为本发明的卷积神经网络的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种基于卷积神经网络的人脸表情识别方法,包括以下步骤:
S1、从视频中获取人脸图像;
S2、对获取到的人脸图像进行尺度归一化操作处理,得到尺寸相同的人脸图像,并对所述尺寸相同的人脸图像进行对齐预处理操作,得到预处理后的人脸图像;
所述尺度归一化操作处理是将得到的人脸图像缩放到规定的尺寸,得到尺寸相同的人脸图像,并对所述尺寸相同的人脸图像进行对齐预处理操作;
对齐预处理操作主要包括检测人脸图像的五个特征点,分别为双眼、鼻子、两个嘴角,然后利用双眼坐标,把人脸图像旋转到水平,利用剩余的三个点的坐标,计算得到仿射矩阵,利用仿射矩阵对图像进行变换,得到预处理后的人脸图像;
S3、使用卷积神经网络对预处理后的人脸图像进行特征提取操作,得到人脸图像的特征;
人脸图像的特征包括全局特征和局部特征,全局特征如人脸的轮廓,局部特征如人脸的眼睛等。
S4、利用Softmax分类器对所述人脸图像的特征进行分类识别操作,得到表情识别结果。
使用卷积神经网络对预处理后的人脸图像进行特征提取操作,得到人脸图像的特征的具体操作步骤包括:
S31、创建卷积神经网络;
S32、利用卷积神经网络对预处理后的人脸图像进行特征提取操作,并通过反向传播算法对卷积神经网络的权重和偏置进行更新优化。
如图2所示,步骤S31中的卷积神经网络包括三个卷积层、三个池化层、三个全连接层,三个所述卷积层分别为第一卷积层、第二卷积层、第三卷积层,三个所述池化层分别为第一池化层、第二池化层、第三池化层,三个所述全连接层分别为第一全连接层、第二全连接层、第三全连接层;步骤S32中的利用卷积神经网络对预处理后的人脸图像进行特征提取操作的具体步骤包括:预处理后的人脸图像依次经过数据输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一全连接层、第二全连接层、第三全连接层,得到人脸图像的特征。
所述第一卷积层的卷积核的大小设置为7×7,单位为像素,步长设置为4,单位为像素,填充设置为0,单位为像素;第二卷积层的卷积核的大小设置为5×5,单位为像素,步长设置为1,单位为像素,填充设置为2,单位为像素;第三卷积层的卷积核的大小设置为3×3,单位为像素,步长设置为1,单位为像素,填充设置为1,单位为像素;所述第一池化层、第二池化层、第三池化层的卷积核的大小均设置为3×3,单位为像素,步长设置为2,单位为像素,填充设置为0,单位为像素;第一全连接层的卷积核的大小设置为1×1,单位为像素,向量的维数设置为4096维;第二全连接层的卷积核的大小设置为1×1,单位为像素,向量的维数设置为4096维;第三全连接层的卷积核的大小设置为1×1,单位为像素,向量的维数设置为7维。图2中的Data表示所有样本;Loss表示所有样本的代价函数,即m个样本的数据集的整体误差为Label表示样本的标签,如:愉快愤怒两种表情,在程序中用01来表示,在检测过程中,输入一张测试图片,给出分类结果是0,即label为0,表情为愉快。
通过将第三池化层的输出连接成为一个一维向量,送入第一全连接层,第一全连接层的向量的维数设置为4096维;
第三全连接层根据输出的类别数来进行设置,第三全连接层的维数设置为7,因为表情分类可以划分为7类,大小为1×1,输出的每一维都是图片属于该类别的概率。
填充指的是在图像之间添加额外的像素,使得输出图像的大小与输入相同。
步骤S32中的通过反向传播算法对卷积神经网络的权重和偏置进行更新优化的具体步骤包括:
S321、给定卷积神经网络一个样本(x,y),x为输入样本,y为预测的输出值,通过卷积神经网络对预处理后的人脸图像进行前向传播运算,得到第三全连接层的输出值hw,b(x);
S322、利用卷积神经网络中的第一卷积层、第二卷积层、第三卷积层、第一全连接层、第二全连接层中的每一个节点i和第三全连接层的输出值hw,b(x),得到第三全连接层的输出值hw,b(x)与实际输出值之间的差值即为残差;
S323、对于卷积神经网络的隐藏层单元,所述隐藏层单元包括第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一全连接层、第二全连接层,设m个样本的数据集为:{(x(1),y(1)),…,(x(m),y(m))},即m个样本的数据集包括m个样本(x,y),对于每一个样本(x,y)的代价函数J(W,b;x,y)为公式(1):
其中,W为卷积神经网络的权重,b为卷积神经网络的偏置,hW,b(x)为第三全连接层的输出值,x为输入样本,y为预测的输出值;
m个样本的数据集的整体误差为通过反向传播算法更新参数W,b的具体步骤如下:
首先计算输出层即为第三全连接层的残差
其中,为第一卷积层、第二卷积层、第三卷积层、第一全连接层、第二全连接层中的第l层第i个节点的激活值,为第l层第i个节点的输入加权和,为对求导数,yi为第i个节点的预测的输出值,nl为输出层;
第l层的第i个节点的残差为公式(3),
其中,为输出层的残差,表示从第1层到输出层求和,为l层第i个节点的权值,为l层第i个节点的输入加权和;
计算输出层的的偏导数,其中,公式(4)为对卷积神经网络的权重W求偏导数,公式(5)为对卷积神经网络的偏置b求偏导数;
为第l层第j个节点的激活值,为输出层第i个节点的残差;
利用公式(2)、(3)、(4)、(5)计算得出卷积神经网络的数据输入层的激活值、第一池化层的激活值、第二卷积层的激活值、第二池化层的激活值、第三卷积层的激活值、第三池化层的激活值、第一全连接层的激活值、第二全连接层的激活值以及输出层的激活值;
根据公式(6)计算输出层的残差
其中,为输出层的激活值即为样本(x,y)的实际输出值;
根据公式(7)计算数据输入层的激活值、第一池化层的激活值、第二卷积层的激活值、第二池化层的激活值、第三卷积层的激活值、第三池化层的激活值、第一全连接层的激活值、第二全连接层的激活值;
δ(l)=((W(l))Tδ(l+1))f′(z(l)) (7)
其中,l=nl-1,nl-2,…,2,W(l)为第l层的权值,δ(l+1)为输出层所有节点的残差之和,δ(l+1)为输出层的残差,z(l)为第l层的输入加权和;
根据公式(8)计算权重W的偏导数值,公式(9)计算偏置b的偏导数值;
其中,a(l)为第l层的激活值;
根据公式(8)和公式(9)对权重W和偏置b的不断求偏导数值,从而更新卷积神经网络的权重W和偏置b。
人脸图像经过一个随机裁剪得到227×227大小的区域,经过第一卷积层,进行卷积之后人脸图像的大小为56×56,再经过第一池化层,相当于一个降采样,人脸图像的大小为28×28;人脸图像经过第二卷积层,图像的大小变为14×14,第二池化层的后图像大小为7×7;第三卷积层卷积核的大小为3×3,步长为1,填充为1,经过卷积之后,图像的大小不变,再经过第三池化层,得到图像的大小为7×7,人脸图像经过第一全连接层、第二全连接层、第三全连接层计算后将第三全连接层的结果输入到Softmax分类器中,得到一个计算值作为判断的结果。其中利用卷积神经网络进行特征提取时,使用反向传播算法来进行优化,对网络的权重和偏置参数进行更新优化。
利用Softmax分类器对所述人脸图像的特征进行分类识别操作,得到表情识别结果是现有技术,利用表情识别的训练集{(x(1),y(1)),…,(x(m),y(m))},其中m表示样本总数,x表示样本,标签y(i)∈{1,2,…,k},其中,k表示类别数,这里取值为7,因为表情识别分为生气,厌恶,害怕,愉快,难过,惊讶,无表情7类,从底层的像素特征,到眼睛鼻子嘴巴,最终提取到的是能够辨别人脸的全局特征。
综上所述,本发明只需对人脸图像做简单的预处理,然后送入卷积神经网络中,自动进行特征提取,并给出分类结果,不仅大幅度的提高了准确率,减少了可调参数,极大程度上简化了中间的处理步骤。
Claims (5)
1.一种基于卷积神经网络的人脸表情识别方法,其特征在于,包括以下步骤:
S1、从视频中获取人脸图像;
S2、对获取到的人脸图像进行尺度归一化操作处理,得到尺寸相同的人脸图像,并对所述尺寸相同的人脸图像进行对齐预处理操作,得到预处理后的人脸图像;
S3、使用卷积神经网络对预处理后的人脸图像进行特征提取操作,得到人脸图像的特征;
S4、利用Softmax分类器对所述人脸图像的特征进行分类识别操作,得到表情识别结果。
2.如权利要求1所述的一种基于卷积神经网络的人脸表情识别方法,其特征在于,步骤S3的具体操作步骤包括:
S31、创建卷积神经网络;
S32、利用卷积神经网络对预处理后的人脸图像进行特征提取操作,并通过反向传播算法对卷积神经网络的权重和偏置进行更新优化。
3.如权利要求2所述的一种基于卷积神经网络的人脸表情识别方法,其特征在于:步骤S31中的卷积神经网络包括三个卷积层、三个池化层、三个全连接层,三个所述卷积层分别为第一卷积层、第二卷积层、第三卷积层,三个所述池化层分别为第一池化层、第二池化层、第三池化层,三个所述全连接层分别为第一全连接层、第二全连接层、第三全连接层;
步骤S32中的利用卷积神经网络对预处理后的人脸图像进行特征提取操作的具体步骤包括:预处理后的人脸图像依次经过数据输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一全连接层、第二全连接层、第三全连接层,得到人脸图像的特征。
4.如权利要求3所述的一种基于卷积神经网络的人脸表情识别方法,其特征在于:所述第一卷积层的卷积核的大小设置为7×7,单位为像素,步长设置为4,单位为像素,填充设置为0,单位为像素;第二卷积层的卷积核的大小设置为5×5,单位为像素,步长设置为1,单位为像素,填充设置为2,单位为像素;第三卷积层的卷积核的大小设置为3×3,单位为像素,步长设置为1,单位为像素,填充设置为1,单位为像素;所述第一池化层、第二池化层、第三池化层的卷积核的大小均设置为3×3,单位为像素,步长设置为2,单位为像素,填充设置为0,单位为像素;第一全连接层的卷积核的大小设置为1×1,单位为像素,向量的维数设置为4096维;第二全连接层的卷积核的大小设置为1×1,单位为像素,向量的维数设置为4096维;第三全连接层的卷积核的大小设置为1×1,单位为像素,向量的维数设置为7维。
5.如权利要求3或4所述的一种基于卷积神经网络的人脸表情识别方法,其特征在于,步骤S32中的通过反向传播算法对卷积神经网络的权重和偏置进行更新优化的具体步骤包括:
S321、给定卷积神经网络一个样本(x,y),x为输入样本,y为预测的输出值,通过卷积神经网络对预处理后的人脸图像进行前向传播运算,得到第三全连接层的输出值hw,b(x);
S322、利用卷积神经网络中的第一卷积层、第二卷积层、第三卷积层、第一全连接层、第二全连接层中的每一个节点i和第三全连接层的输出值hw,b(x),得到第三全连接层的输出值hw,b(x)与实际输出值之间的差值即为残差;
S323、对于卷积神经网络的隐藏层单元,所述隐藏层单元包括第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第一全连接层、第二全连接层,设m个样本的数据集为:{(x(1),y(1)),…,(x(m),y(m))},即m个样本的数据集包括m个样本(x,y),对于每一个样本(x,y)的代价函数J(W,b;x,y)为公式(1):
其中,W为卷积神经网络的权重,b为卷积神经网络的偏置,hW,b(x)为第三全连接层的输出值,x为输入样本,y为预测的输出值;
m个样本的数据集的整体误差为通过反向传播算法更新参数W,b的具体步骤如下:
首先计算输出层即为第三全连接层的残差
其中,为第一卷积层、第二卷积层、第三卷积层、第一全连接层、第二全连接层中的第l层第i个节点的激活值,为第l层第i个节点的输入加权和,为对求导数,yi为第i个节点的预测的输出值,nl为输出层;
第l层的第i个节点的残差为公式(3);
其中,为输出层的残差,表示从第1层到输出层求和,为l层第i个节点的权值,为l层第i个节点的输入加权和;
计算输出层的的偏导数,其中,公式(4)为对卷积神经网络的权重W求偏导数,公式(5)为对卷积神经网络的偏置b求偏导数;
为第l层第j个节点的激活值,为输出层第i个节点的残差;
利用公式(2)、(3)、(4)、(5)计算得出卷积神经网络的数据输入层的激活值、第一池化层的激活值、第二卷积层的激活值、第二池化层的激活值、第三卷积层的激活值、第三池化层的激活值、第一全连接层的激活值、第二全连接层的激活值以及输出层的激活值;
根据公式(6)计算输出层的残差
其中,为输出层的激活值即为样本(x,y)的实际输出值;
根据公式(7)计算数据输入层的激活值、第一池化层的激活值、第二卷积层的激活值、第二池化层的激活值、第三卷积层的激活值、第三池化层的激活值、第一全连接层的激活值、第二全连接层的激活值;
δ(l)=((W(l))Tδ(l+1))f′(z(l)) (7)
其中,l=nl-1,nl-2,…,2,W(l)为第l层的权值,δ(l+1)为输出层所有节点的残差之和,δ(l+1)为输出层的残差,z(l)为第l层的输入加权和;
根据公式(8)计算权重W的偏导数值,公式(9)计算偏置b的偏导数值;
其中,a(l)为第l层的激活值;
根据公式(8)和公式(9)对权重W和偏置b的不断求偏导数值,从而更新卷积神经网络的权重W和偏置b。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711344904.6A CN108256426A (zh) | 2017-12-15 | 2017-12-15 | 一种基于卷积神经网络的人脸表情识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711344904.6A CN108256426A (zh) | 2017-12-15 | 2017-12-15 | 一种基于卷积神经网络的人脸表情识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108256426A true CN108256426A (zh) | 2018-07-06 |
Family
ID=62722847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711344904.6A Pending CN108256426A (zh) | 2017-12-15 | 2017-12-15 | 一种基于卷积神经网络的人脸表情识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108256426A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190564A (zh) * | 2018-09-05 | 2019-01-11 | 厦门集微科技有限公司 | 一种图像分析的方法、装置、计算机存储介质及终端 |
CN109222963A (zh) * | 2018-11-21 | 2019-01-18 | 燕山大学 | 一种基于卷积神经网络的心电异常识别分类方法 |
CN109376625A (zh) * | 2018-10-10 | 2019-02-22 | 东北大学 | 一种基于卷积神经网络的面部表情识别方法 |
CN109508650A (zh) * | 2018-10-23 | 2019-03-22 | 浙江农林大学 | 一种基于迁移学习的树种识别方法 |
CN109583419A (zh) * | 2018-12-13 | 2019-04-05 | 深圳市淘米科技有限公司 | 一种基于深度卷积网络的情绪预测系统 |
CN109815770A (zh) * | 2019-01-31 | 2019-05-28 | 北京旷视科技有限公司 | 二维码检测方法、装置及系统 |
CN109902716A (zh) * | 2019-01-22 | 2019-06-18 | 厦门美图之家科技有限公司 | 一种对齐分类模型的训练方法和图像分类方法 |
CN110008819A (zh) * | 2019-01-30 | 2019-07-12 | 武汉科技大学 | 一种基于图卷积神经网络的人脸表情识别方法 |
CN110039373A (zh) * | 2019-04-04 | 2019-07-23 | 华中科技大学 | 一种数控机床主轴热变形预测方法及系统 |
CN110210380A (zh) * | 2019-05-30 | 2019-09-06 | 盐城工学院 | 基于表情识别与心理学测试生成性格的分析方法 |
CN110390307A (zh) * | 2019-07-25 | 2019-10-29 | 首都师范大学 | 表情识别方法、表情识别模型训练方法及装置 |
CN110516575A (zh) * | 2019-08-19 | 2019-11-29 | 上海交通大学 | 基于残差域富模型的gan生成图片检测方法及系统 |
CN110866962A (zh) * | 2019-11-20 | 2020-03-06 | 成都威爱新经济技术研究院有限公司 | 一种基于卷积神经网络的虚拟人像与表情同步方法 |
CN110956116A (zh) * | 2019-11-26 | 2020-04-03 | 上海海事大学 | 基于卷积神经网络的人脸图像性别识别模型及识别方法 |
CN111967359A (zh) * | 2020-08-06 | 2020-11-20 | 南昌大学 | 一种基于注意力机制模块的人脸表情识别方法 |
CN112801238A (zh) * | 2021-04-15 | 2021-05-14 | 中国科学院自动化研究所 | 一种图像分类方法、装置、电子设备及存储介质 |
CN112825117A (zh) * | 2019-11-20 | 2021-05-21 | 北京眼神智能科技有限公司 | 基于头部特征的行为属性判断方法、装置、介质及设备 |
CN112825115A (zh) * | 2019-11-20 | 2021-05-21 | 北京眼神智能科技有限公司 | 基于单目图像的眼镜检测方法、装置、存储介质及设备 |
CN113887435A (zh) * | 2021-09-30 | 2022-01-04 | 北京百度网讯科技有限公司 | 人脸图像处理方法、装置、设备、存储介质及程序产品 |
CN114944005A (zh) * | 2022-07-25 | 2022-08-26 | 安徽交欣科技股份有限公司 | 基于roi-knn卷积神经网络的面部表情识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103400105A (zh) * | 2013-06-26 | 2013-11-20 | 东南大学 | 基于姿态归一化的非正面人脸表情识别方法 |
US20160275341A1 (en) * | 2015-03-18 | 2016-09-22 | Adobe Systems Incorporated | Facial Expression Capture for Character Animation |
CN106951867A (zh) * | 2017-03-22 | 2017-07-14 | 成都擎天树科技有限公司 | 基于卷积神经网络的人脸识别方法、装置、系统及设备 |
CN107045618A (zh) * | 2016-02-05 | 2017-08-15 | 北京陌上花科技有限公司 | 一种人脸表情识别方法及装置 |
CN107123033A (zh) * | 2017-05-04 | 2017-09-01 | 北京科技大学 | 一种基于深度卷积神经网络的服装搭配方法 |
CN107273864A (zh) * | 2017-06-22 | 2017-10-20 | 星际(重庆)智能装备技术研究院有限公司 | 一种基于深度学习的人脸检测方法 |
-
2017
- 2017-12-15 CN CN201711344904.6A patent/CN108256426A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103400105A (zh) * | 2013-06-26 | 2013-11-20 | 东南大学 | 基于姿态归一化的非正面人脸表情识别方法 |
US20160275341A1 (en) * | 2015-03-18 | 2016-09-22 | Adobe Systems Incorporated | Facial Expression Capture for Character Animation |
CN107045618A (zh) * | 2016-02-05 | 2017-08-15 | 北京陌上花科技有限公司 | 一种人脸表情识别方法及装置 |
CN106951867A (zh) * | 2017-03-22 | 2017-07-14 | 成都擎天树科技有限公司 | 基于卷积神经网络的人脸识别方法、装置、系统及设备 |
CN107123033A (zh) * | 2017-05-04 | 2017-09-01 | 北京科技大学 | 一种基于深度卷积神经网络的服装搭配方法 |
CN107273864A (zh) * | 2017-06-22 | 2017-10-20 | 星际(重庆)智能装备技术研究院有限公司 | 一种基于深度学习的人脸检测方法 |
Non-Patent Citations (1)
Title |
---|
张勇: "深度卷积神经网络在车牌和人脸检测领域的应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109190564A (zh) * | 2018-09-05 | 2019-01-11 | 厦门集微科技有限公司 | 一种图像分析的方法、装置、计算机存储介质及终端 |
CN109376625A (zh) * | 2018-10-10 | 2019-02-22 | 东北大学 | 一种基于卷积神经网络的面部表情识别方法 |
CN109508650A (zh) * | 2018-10-23 | 2019-03-22 | 浙江农林大学 | 一种基于迁移学习的树种识别方法 |
CN109222963A (zh) * | 2018-11-21 | 2019-01-18 | 燕山大学 | 一种基于卷积神经网络的心电异常识别分类方法 |
CN109583419A (zh) * | 2018-12-13 | 2019-04-05 | 深圳市淘米科技有限公司 | 一种基于深度卷积网络的情绪预测系统 |
CN109902716A (zh) * | 2019-01-22 | 2019-06-18 | 厦门美图之家科技有限公司 | 一种对齐分类模型的训练方法和图像分类方法 |
CN109902716B (zh) * | 2019-01-22 | 2021-01-29 | 厦门美图之家科技有限公司 | 一种对齐分类模型的训练方法和图像分类方法 |
CN110008819A (zh) * | 2019-01-30 | 2019-07-12 | 武汉科技大学 | 一种基于图卷积神经网络的人脸表情识别方法 |
CN110008819B (zh) * | 2019-01-30 | 2022-11-18 | 武汉科技大学 | 一种基于图卷积神经网络的人脸表情识别方法 |
CN109815770A (zh) * | 2019-01-31 | 2019-05-28 | 北京旷视科技有限公司 | 二维码检测方法、装置及系统 |
CN109815770B (zh) * | 2019-01-31 | 2022-09-27 | 北京旷视科技有限公司 | 二维码检测方法、装置及系统 |
CN110039373A (zh) * | 2019-04-04 | 2019-07-23 | 华中科技大学 | 一种数控机床主轴热变形预测方法及系统 |
CN110039373B (zh) * | 2019-04-04 | 2020-06-09 | 华中科技大学 | 一种数控机床主轴热变形预测方法及系统 |
CN110210380A (zh) * | 2019-05-30 | 2019-09-06 | 盐城工学院 | 基于表情识别与心理学测试生成性格的分析方法 |
CN110210380B (zh) * | 2019-05-30 | 2023-07-25 | 盐城工学院 | 基于表情识别与心理学测试生成性格的分析方法 |
CN110390307A (zh) * | 2019-07-25 | 2019-10-29 | 首都师范大学 | 表情识别方法、表情识别模型训练方法及装置 |
CN110516575A (zh) * | 2019-08-19 | 2019-11-29 | 上海交通大学 | 基于残差域富模型的gan生成图片检测方法及系统 |
CN110866962A (zh) * | 2019-11-20 | 2020-03-06 | 成都威爱新经济技术研究院有限公司 | 一种基于卷积神经网络的虚拟人像与表情同步方法 |
CN112825117A (zh) * | 2019-11-20 | 2021-05-21 | 北京眼神智能科技有限公司 | 基于头部特征的行为属性判断方法、装置、介质及设备 |
CN112825115A (zh) * | 2019-11-20 | 2021-05-21 | 北京眼神智能科技有限公司 | 基于单目图像的眼镜检测方法、装置、存储介质及设备 |
CN110956116A (zh) * | 2019-11-26 | 2020-04-03 | 上海海事大学 | 基于卷积神经网络的人脸图像性别识别模型及识别方法 |
CN110956116B (zh) * | 2019-11-26 | 2023-09-29 | 上海海事大学 | 基于卷积神经网络的人脸图像性别识别模型及识别方法 |
CN111967359A (zh) * | 2020-08-06 | 2020-11-20 | 南昌大学 | 一种基于注意力机制模块的人脸表情识别方法 |
CN112801238B (zh) * | 2021-04-15 | 2021-07-27 | 中国科学院自动化研究所 | 一种图像分类方法、装置、电子设备及存储介质 |
CN112801238A (zh) * | 2021-04-15 | 2021-05-14 | 中国科学院自动化研究所 | 一种图像分类方法、装置、电子设备及存储介质 |
CN113887435A (zh) * | 2021-09-30 | 2022-01-04 | 北京百度网讯科技有限公司 | 人脸图像处理方法、装置、设备、存储介质及程序产品 |
CN114944005A (zh) * | 2022-07-25 | 2022-08-26 | 安徽交欣科技股份有限公司 | 基于roi-knn卷积神经网络的面部表情识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108256426A (zh) | 一种基于卷积神经网络的人脸表情识别方法 | |
CN113065558B (zh) | 一种结合注意力机制的轻量级小目标检测方法 | |
CN109241982B (zh) | 基于深浅层卷积神经网络的目标检测方法 | |
CN111898406B (zh) | 基于焦点损失和多任务级联的人脸检测方法 | |
CN105069472B (zh) | 一种基于卷积神经网络自适应的车辆检测方法 | |
CN110033473B (zh) | 基于模板匹配和深度分类网络的运动目标跟踪方法 | |
CN114220035A (zh) | 一种基于改进yolo v4的快速害虫检测方法 | |
CN109886066A (zh) | 基于多尺度和多层特征融合的快速目标检测方法 | |
CN110909605B (zh) | 基于对比相关的跨模态行人重识别方法 | |
CN108537824B (zh) | 基于交替反卷积与卷积的特征图增强的网络结构优化方法 | |
CN108334847A (zh) | 一种真实场景下的基于深度学习的人脸识别方法 | |
CN110263833A (zh) | 基于编码-解码结构的图像语义分割方法 | |
CN111160249A (zh) | 基于跨尺度特征融合的光学遥感图像多类目标检测方法 | |
CN110414344A (zh) | 一种基于视频的人物分类方法、智能终端及存储介质 | |
CN109376637A (zh) | 基于视频监控图像处理的人数统计系统 | |
CN112528913A (zh) | 一种基于图像的砂石颗粒物粒径检测分析系统 | |
CN107767416A (zh) | 一种低分辨率图像中行人朝向的识别方法 | |
CN111680705A (zh) | 适于目标检测的mb-ssd方法和mb-ssd特征提取网络 | |
CN111539351A (zh) | 一种多任务级联的人脸选帧比对方法 | |
CN116343334A (zh) | 融合关节捕捉的三流自适应图卷积模型的动作识别方法 | |
CN116596966A (zh) | 一种基于注意力和特征融合的分割与跟踪方法 | |
US20240177525A1 (en) | Multi-view human action recognition method based on hypergraph learning | |
CN113627504B (zh) | 基于生成对抗网络的多模态多尺度特征融合目标检测方法 | |
CN111339950B (zh) | 一种遥感图像目标检测方法 | |
CN112488165A (zh) | 一种基于深度学习模型的红外行人识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180706 |
|
RJ01 | Rejection of invention patent application after publication |