CN106960185A - 线性判别深度信念网络的多姿态人脸识别方法 - Google Patents

线性判别深度信念网络的多姿态人脸识别方法 Download PDF

Info

Publication number
CN106960185A
CN106960185A CN201710141432.8A CN201710141432A CN106960185A CN 106960185 A CN106960185 A CN 106960185A CN 201710141432 A CN201710141432 A CN 201710141432A CN 106960185 A CN106960185 A CN 106960185A
Authority
CN
China
Prior art keywords
layer
belief network
face
depth belief
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710141432.8A
Other languages
English (en)
Other versions
CN106960185B (zh
Inventor
郭敏
丁晓
王健
马苗
肖冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Normal University
Original Assignee
Shaanxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Normal University filed Critical Shaanxi Normal University
Priority to CN201710141432.8A priority Critical patent/CN106960185B/zh
Publication of CN106960185A publication Critical patent/CN106960185A/zh
Application granted granted Critical
Publication of CN106960185B publication Critical patent/CN106960185B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

一种线性判别深度信念网络的多姿态人脸识别方法,由多姿态人脸图像预处理、训练深度信念网络、线性判别分析法初始化权值矩阵、线性判别深度信念网络参数调优、多姿态人脸图像识别步骤组成。本发明采用改进的线性判别分析法初始化深度信念网络最后一个隐层与输出层之间的权值矩阵,所构建的线性判别深度信念网络具有鲁棒性强、识别率高等优点,适用于多姿态人脸图像识别。

Description

线性判别深度信念网络的多姿态人脸识别方法
技术领域
本发明涉及图像分类、模式识别技术领域,具体涉及到多姿态人脸的识别。
背景技术
随着人工智能的不断发展,多姿态人脸识别已被广泛应用于智能人机交互、身份验证、驾驶员疲劳状态监控等方面,逐渐成为图像处理等技术领域的热门研究课题。多姿态人脸识别是在非限制条件下识别出人的头部姿态,从而判断人的身体状态和心理状态,比如仰头、低头、左转、右转等,具有非常重要的现实意义。
多姿态人脸识别主要包括三部分:多姿态人脸检测、特征提取以及识别。特征提取的好坏从本质上决定了识别的准确率。现阶段常用的人工提取特征方法有:本征脸法、局部特征法和模型法。这些特征提取方法计算较复杂,需要人工进行特征提取,特征提取过程中的信息损失较大,很难准确地表达从底层到高层的特征信息。
陈勇等人提出了一种基于Gabor特征和深度信念网络的近邻元分析(NCA)方法,提取Gabor多姿态人脸图像的尺度图并将其进行卷积融合,将融合后的直方图数据输入到深度信念网络中进行训练,结合NCA分析对训练样本进行线性变化,对多姿态人脸图像进行分类。赵志国等人采用深度信念网络与极限学习机(ELM)相结合进行低分辨率多姿态人脸识别,该方法将低分辨率和对应高分辨率图像作为深层网络结构输入数据,在整个深度信念网络模型顶层加上ELM进行分类学习,通过UMIST人脸库、ORL人脸库、FERET人脸库,验证了该方法具有识别率高、分类时间短等优点。苏铁明等人提出了一种基于深度学习和融入梯度信息的人脸姿态分类方法,提取人脸姿态图像灰度与灰度差组合特征,通过三层受限玻尔兹曼机(RBM)进行训练学习,提取姿态特征,通过Softmax分类器建立深度学习特征与人脸姿态标签的对应关系,实现人脸姿态分类。尹洪涛等人提出了一种基于离散余弦变换(DCT)和线性判别分析的人脸识别方法,对图像进行离散余弦变换求出DCT系数,按训练过程中选定的顺序选取DCT系数,并将选定的DCT系数作为人脸的特征进行线性判别分析,获得识别特征,利用最近邻分类器对人脸图像进行分类。
线性判别分析法是一种有效的特征提取方法,其目的是寻找一个线性变换矩阵V,使得样本类间离散度和类内离散度的比值最大,可以通过Fisher准则实现:
式中,Wopt是最优投影矩阵,V为一个线性变换矩阵,VT为V的转置矩阵,Sb是样本类间离散度矩阵,Sw是样本类内离散度矩阵,其中Sb为:
式中,i为1,...,C,C为类别数,Ni为输入的第i类有限图像总数,ui表示第i类样本的均值,u表示所有样本的均值,但是线性判别分析法存在秩限制问题。
上述深度信念网络模型具有较好的特征提取能力,但其网络模型的最后一个隐层与输出层之间的初始权值矩阵通常随机生成,这种权值矩阵映射得到的特征不能保证适合于分类任务。为了解决该问题,本发明提出了线性判别深度信念网络,使用线性判别分析法初始化深度信念网络最后一个隐层与输出层之间的权值矩阵,使网络更适合于分类任务。本发明中线性判别分析法重新定义了类间离散度矩阵,解决了传统线性判别分析法的秩限制问题,使得线性判别深度信念网络具有更好的健壮性和适应性。
发明内容
本发明所要解决的主要技术问题在于克服上述已有技术的不足,提供一种鲁棒性强、识别率高的线性判别深度信念网络的多姿态人脸识别方法。
解决上述技术问题所采用的技术方案由下述步骤组成:
(1)多姿态人脸图像预处理
将多姿态人脸数据库中取出的灰度图像分为训练图像和测试图像,用双三次插值法进行采样,将每一张采样图像转化为一维行向量,每一行向量表示一张图像;
(2)训练深度信念网络
设置深度信念网络输入层、隐层、输出层,输入层层数为1层、隐层层数为2~5层、输出层层数为1层,输入层节点数为625,隐层节点数为100~400,输出层节点数为5,将训练图像输入到深度信念网络中进行训练,得到网络初始参数空间:
θ=(W,b,c)
式中W为网络的权值,b为隐层的偏置,c为可视层的偏置;
(3)用线性判别分析法初始化权值矩阵
使用线性判别分析法初始化深度信念网络最后一个隐层与输出层之间的权值矩阵:
得到线性判别深度信念网络,式中Wnopt为最优投影矩阵,作为深度信念网络最后一个隐层与输出层之间的权值矩阵,V为一个线性变换矩阵,VT为V的转置矩阵,Sb'为样本类间离散度矩阵,Sw是样本类内离散度矩阵,式(1)中的类间离散度矩阵Sb'为:
式中,i、j为1,...,C,C为人脸姿态类别数,Ni为输入的第i类有限图像总数,Nj为输入的第j类有限图像总数,为第i类中第l个图像,为第j类中第z个图像,的转置,的转置;
(4)线性判别深度信念网络参数调优
采用反向传播法微调步骤(3)网络的初始参数θ,使网络参数达到最优;
(5)多姿态人脸图像识别
将预处理后的测试图像输入到步骤(4)线性判别深度信念网络中,第k个隐层第n个节点的特征向量由下式得到:
式中,n为1,2,...,5,m、k为有限的正整数,Dk-1为第k-1个隐层的节点数,为第k个隐层第n个节点的偏置,为连接第k-1个隐层第m个节点和第k个隐层第n个节点的权值,为第k-1个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像;
输入测试图像,在输出层得到多姿态人脸识别结果,由下式表示:
式中H为线性判别深度信念网络隐层总数,DH为第H个隐层的节点数,为输出层第n个节点的偏置,为连接第H个隐层第m个节点和输出层第n个节点的权值,为第H个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像,G为输入图像的识别结果,G为1时是正脸或左侧、G为2时是左侧25°或仰头、G为3时是左侧15°或低头、G为4时是右侧15°或正脸、G为5时是右侧25°或右侧。
在本发明的步骤(2)中,深度信念网络最佳由1个输入层、3个隐层、1个输出层构成,输入层的节点数最佳为625,3个隐层的节点数分别为400、400、200,输出层的节点数为5。
本发明采用了线性判别分析法初始化深度信念网络最后一个隐层与输出层之间的权值矩阵,完善了深度信念网络的分类功能。本发明中线性判别分析法重新定义了类间离散度矩阵,解决了传统线性判别分析法的秩限制问题,使得线性判别深度信念网络具有更好的健壮性和适应性。
本发明具有鲁棒性强、识别率高等优点,所构建的线性判别深度信念网络适用于多姿态人脸识别。
附图说明
图1是线性判别深度信念网络多姿态人脸识别流程图。
图2是FERET数据库中部分多姿态人脸图像。
图3是CMU PIE数据库中部分多姿态人脸图像。
具体实施方式
下面结合附图和实施例对本发明进一步详细说明,但本发明不限于这些实施例。
实施例1
在FERET人脸数据库中选取500张多姿态人脸图像,如图2所示,采用MATLAB 2013b软件进行多姿态人脸图像识别,如图1所示,其方法如下:
1、多姿态人脸图像预处理
从FERET人脸数据库中选取100个人,每个人5种姿态构成一个FERET多姿态人脸子库,5种姿态依次为:正脸、左侧25°、左侧15°、右侧15°、右侧25°,共500张灰度图像,选取其中250张作为训练图像,另外250张作为测试图像,用双三次插值法进行采样,采样人脸图像大小为25×25像素,将每一张采样图像转化为一维行向量,每一行向量表示一张图像。
2、训练深度信念网络
设置深度信念网络结构为:1个输入层、3个隐层、1个输出层,输入层节点数为625,3个隐层的节点数分别为400、400、200,输出层节点数为5,将训练图像输入到深度信念网络中进行训练,得到网络初始参数空间:
θ=(W,b,c)
式中W为网络的权值,b为隐层的偏置,c为可视层的偏置。
3、用线性判别分析法初始化权值矩阵
使用线性判别分析法初始化深度信念网络最后一个隐层与输出层之间的权值矩阵:
得到线性判别深度信念网络,式中Wnopt为最优投影矩阵,作为深度信念网络最后一个隐层与输出层之间的权值矩阵,V为一个线性变换矩阵,VT为V的转置矩阵,Sb'替换线性判别分析法中的Sb,是样本类间离散度矩阵,Sw是样本类内离散度矩阵,式(1)中Sb'为:
式中,i、j为1,...,C,C为人脸姿态类别数,Ni为输入的第i类有限图像总数,Nj为输入的第j类有限图像总数,为第i类中第l个图像,为第j类中第z个图像,的转置,的转置。
本实施例中的Sb'替换传统线性判别分析法中的Sb,采用了线性判别分析法初始化深度信念网络最后一个隐层与输出层之间的权值矩阵,完善了深度信念网络的分类功能,解决了传统线性判别分析法的秩限制问题,使得线性判别深度信念网络具有更好的健壮性和适应性。
4、线性判别深度信念网络参数调优
采用反向传播法微调步骤3网络的初始参数θ,使网络参数达到最优。
5、多姿态人脸图像识别
将预处理后的测试图像输入到步骤4线性判别深度信念网络中,第k个隐层第n个节点的特征向量由下式得到:
式中,n为1,2,...,5,m为有限的正整数,k是隐层的层数取1,2,3层,Dk-1为第k-1个隐层的节点数,为第k个隐层第n个节点的偏置,为连接第k-1个隐层第m个节点和第k个隐层第n个节点的权值,为第k-1个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像。
输入测试图像,在输出层得到多姿态人脸识别结果,由下式表示:
式中H为线性判别深度信念网络隐层总数,为输出层第n个节点的偏置,为连接第3个隐层第m个节点和输出层第n个节点的权值,为第3个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像,G为输入图像的识别结果。G为1时是正脸、G为2时是左侧25°、G为3时是左侧15°、G为4时是右侧15°、G为5时是右侧25°。
采用本实施例方法对FERET多姿态人脸数据子库中250张测试图像进行识别,各种姿态的正确识别率见表1。
表1实施例1测试图像的各姿态识别率
正确图像个数 错误图像个数 识别率(%)
正脸 50 0 100.00
左侧25° 46 4 92.00
左侧15° 48 2 96.00
右侧15° 49 1 98.00
右侧25° 50 0 100.00
由表1可见,采用本发明方法对FERET多姿态人脸数据子库中250张测试图像进行识别,平均识别率达到97.20%。
实施例2
在FERET人脸数据库中选取500张多姿态人脸图像,如图2所示,采用MATLAB 2013b软件进行多姿态人脸图像识别,如图1所示,其方法如下:
1、多姿态人脸图像预处理
多姿态人脸图像预处理步骤与实施例1相同。
2、训练深度信念网络
设置深度信念网络输入层、隐层、输出层,输入层层数为1层、隐层层数为2层、输出层层数为1层,输入层节点数为625,2个隐层的节点数分别为100、100,输出层节点数为5,将训练图像输入到深度信念网络中进行训练,得到网络初始参数空间:
θ=(W,b,c)
式中W为网络的权值,b为隐层的偏置,c为可视层的偏置。
3、用线性判别分析法初始化权值矩阵
用线性判别分析法初始化权值矩阵步骤与实施例1相同。
4、线性判别深度信念网络参数调优
线性判别深度信念网络参数调优步骤与实施例1相同。
5、多姿态人脸图像识别
将预处理后的测试图像输入到步骤4线性判别深度信念网络中,第k个隐层第n个节点的特征向量由下式得到:
式中,n为1,2,...,5,m为有限的正整数,k是隐层的层数取1,2层,Dk-1为第k-1个隐层的节点数,为第k个隐层第n个节点的偏置,为连接第k-1个隐层第m个节点和第k个隐层第n个节点的权值,为第k-1个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像。
输入测试图像,在输出层得到多姿态人脸识别结果,由下式表示:
式中H为线性判别深度信念网络隐层总数,为输出层第n个节点的偏置,为连接第2个隐层第m个节点和输出层第n个节点的权值,为第2个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像,G为输入图像的识别结果。G为1时是正脸、G为2时是左侧25°、G为3时是左侧15°、G为4时是右侧15°、G为5时是右侧25°。
实施例3
在FERET人脸数据库中选取500张多姿态人脸图像,如图2所示,采用MATLAB 2013b软件进行多姿态人脸图像识别,如图1所示,其方法如下:
1、多姿态人脸图像预处理
多姿态人脸图像预处理步骤与实施例1相同。
2、训练深度信念网络
设置深度信念网络输入层、隐层、输出层,输入层层数为1层、隐层层数为5层、输出层层数为1层,输入层节点数为625,5个隐层的节点数分别为400、400、400、400、400,输出层节点数为5,将训练图像输入到深度信念网络中进行训练,得到网络初始参数空间:
θ=(W,b,c)
式中W为网络的权值,b为隐层的偏置,c为可视层的偏置。
3、用线性判别分析法初始化权值矩阵
用线性判别分析法初始化权值矩阵步骤与实施例1相同。
4、线性判别深度信念网络参数调优
线性判别深度信念网络参数调优步骤与实施例1相同。
5、多姿态人脸图像识别
将预处理后的测试图像输入到步骤4线性判别深度信念网络中,第k个隐层第n个节点的特征向量由下式得到:
式中,n为1,2,...,5,m为有限的正整数,k是隐层的层数取1,2,3,4,5层,Dk-1为第k-1个隐层的节点数,为第k个隐层第n个节点的偏置,为连接第k-1个隐层第m个节点和第k个隐层第n个节点的权值,为第k-1个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像。
输入测试图像,在输出层得到多姿态人脸识别结果,由下式表示:
式中H为线性判别深度信念网络隐层总数,为输出层第n个节点的偏置,为连接第5个隐层第m个节点和输出层第n个节点的权值,为第5个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像,G为输入图像的识别结果。G为1时是正脸、G为2时是左侧25°、G为3时是左侧15°、G为4时是右侧15°、G为5时是右侧25°。
实施例4
在CMU PIE多姿态人脸数据库中选取340张多姿态人脸图像,如图3所示,采用MATLAB 2013b软件进行多姿态人脸图像识别,如图1所示,其方法如下:
1、多姿态人脸图像的预处理
CMU PIE人脸数据库有68个人,每个人选取5种姿态构成一个CMU PIE多姿态人脸子库,5种姿态依次为:左侧、仰头、低头、正脸、右侧,共340张灰度图像,选取其中170张作为训练图像,另外170张作为测试图像,用双三次插值法进行采样,采样人脸图像大小为25×25像素,将每一张采样图像转化为一维行向量,每一行向量表示一张图像。
2、训练深度信念网络
训练深度信念网络步骤与实施例1相同。
3、用线性判别分析法初始化权值矩阵
用线性判别分析法初始化权值矩阵步骤与实施例1相同。
4、线性判别深度信念网络参数调优
线性判别深度信念网络参数调优步骤与实施例1相同。
5、多姿态人脸图像识别
将预处理后的测试图像输入到步骤4线性判别深度信念网络中,第k个隐层第n个节点的特征向量由下式得到:
式中,n为1,2,...,5,m为有限的正整数,k是隐层的层数取1,2,3层,Dk-1为第k-1个隐层的节点数,为第k个隐层第n个节点的偏置,为连接第k-1个隐层第m个节点和第k个隐层第n个节点的权值,为第k-1个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像。
输入测试图像,在输出层得到多姿态人脸识别结果,由下式表示:
式中H为线性判别深度信念网络隐层总数,为输出层第n个节点的偏置,为连接第3个隐层第m个节点和输出层第n个节点的权值,为第3个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像,G为输入图像的识别结果。G为1时是左侧、G为2时是仰头、G为3时是低头、G为4时是正脸、G为5时是右侧。
采用本实施例方法对CMU PIE多姿态人脸数据子库中170张测试图像进行识别,各种姿态的正确识别率见表2。
表2实施例4测试图像的各姿态识别率
正确图像个数 错误图像个数 识别率(%)
左侧 34 0 100.00
仰头 29 5 85.30
低头 28 6 82.36
正脸 25 9 73.54
右侧 32 2 94.12
由表2可见,采用本发明方法对CMU PIE多姿态人脸数据子库中170张测试图像进行识别,平均识别率达到87.06%。
实施例5
在CMU PIE人脸数据库中选取340张多姿态人脸图像,如图3所示,采用MATLAB2013b软件进行多姿态人脸图像识别,如图1所示,其方法如下:
1、多姿态人脸图像预处理
多姿态人脸图像预处理步骤与实施例4相同。
2、训练深度信念网络
训练深度信念网络步骤与实施例2相同。
3、用线性判别分析法初始化权值矩阵
用线性判别分析法初始化权值矩阵步骤与实施例1相同。
4、线性判别深度信念网络参数调优
线性判别深度信念网络参数调优步骤与实施例1相同。
5、多姿态人脸图像识别
将预处理后的测试图像输入到步骤4线性判别深度信念网络中,第k个隐层第n个节点的特征向量由下式得到:
式中,n为1,2,...,5,m为有限的正整数,k是隐层的层数取1,2层,Dk-1为第k-1个隐层的节点数,为第k个隐层第n个节点的偏置,为连接第k-1个隐层第m个节点和第k个隐层第n个节点的权值,为第k-1个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像。
输入测试图像,在输出层得到多姿态人脸识别结果,由下式表示:
式中H为线性判别深度信念网络隐层总数,为输出层第n个节点偏置,为连接第2个隐层第m个节点和输出层第n个节点的权值,为第2个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像,G为输入图像的识别结果。G为1时是左侧、G为2时是仰头、G为3时是低头、G为4时是正脸、G为5时是右侧。
实施例6
在CMU PIE人脸数据库中选取340张多姿态人脸图像,如图3所示,采用MATLAB2013b软件进行多姿态人脸图像识别,如图1所示,其方法如下:
1、多姿态人脸图像预处理
多姿态人脸图像预处理步骤与实施例4相同。
2、训练深度信念网络
训练深度信念网络步骤与实施例3相同。
3、用线性判别分析法初始化权值矩阵
用线性判别分析法初始化权值矩阵步骤与实施例1相同。
4、线性判别深度信念网络参数调优
线性判别深度信念网络参数调优步骤与实施例1相同。
5、多姿态人脸图像识别
将预处理后的测试图像输入到步骤4线性判别深度信念网络中,第k个隐层第n个节点的特征向量由下式得到:
式中,n为1,2,...,5,m为有限的正整数,k是隐层的层数取1,2,3,4,5层,Dk-1为第k-1个隐层的节点数,为第k个隐层第n个节点的偏置,为连接第k-1个隐层第m个节点和第k个隐层第n个节点的权值,为第k-1个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像。
输入测试图像,在输出层得到多姿态人脸识别结果,由下式表示:
式中H为深度信念网络隐层总数,为输出层第n个节点偏置,为连接第5个隐层第m个节点和输出层第n个节点的权值,为第5个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像,G为输入图像的识别结果。G为1时是左侧、G为2时是仰头、G为3时是低头、G为4时是正脸、G为5时是右侧。

Claims (2)

1.一种线性判别深度信念网络的多姿态人脸识别方法,其特征由下述步骤组成:
(1)多姿态人脸图像预处理
将多姿态人脸数据库中取出的灰度图像分为训练图像和测试图像,用双三次插值法进行采样,将每一张采样图像转化为一维行向量,每一行向量表示一张图像;
(2)训练深度信念网络
设置深度信念网络输入层、隐层、输出层,输入层层数为1层、隐层层数为2~5层、输出层层数为1层,输入层节点数为625,隐层节点数为100~400,输出层节点数为5,将训练图像输入到深度信念网络中进行训练,得到网络初始参数空间:
θ=(W,b,c)
式中W为网络的权值,b为隐层的偏置,c为可视层的偏置;
(3)用线性判别分析法初始化权值矩阵
使用线性判别分析法初始化深度信念网络最后一个隐层与输出层之间的权值矩阵:
W n o p t = arg m a x V | V T S b ′ V | | V T S w V | - - - ( 1 )
得到线性判别深度信念网络,式中Wnopt为最优投影矩阵,作为深度信念网络最后一个隐层与输出层之间的权值矩阵,V为一个线性变换矩阵,VT为V的转置矩阵,Sb'为样本类间离散度矩阵,Sw是样本类内离散度矩阵,式(1)中的类间离散度矩阵Sb'为:
S b ′ = Σ i = 1 C - 1 Σ j = i + 1 C ( Σ l = 1 N i 1 N i y l ( i ) y l ( i ) T - Σ z = 1 N j 1 N j y z ( j ) y z ( j ) T ) - - - ( 2 )
式中,i、j为1,...,C,C为人脸姿态类别数,Ni为输入的第i类有限图像总数,Nj为输入的第j类有限图像总数,为第i类中第l个图像,为第j类中第z个图像,的转置,的转置;
(4)线性判别深度信念网络参数调优
采用反向传播法微调步骤(3)网络的初始参数θ,使网络参数达到最优;
(5)多姿态人脸图像识别
将预处理后的测试图像输入到步骤(4)线性判别深度信念网络中,第k个隐层第n个节点的特征向量由下式得到:
h n k ( x ) = 1 / ( 1 + e - ( b n k + Σ m = 1 D k - 1 w m n k h m k - 1 ( x ) ) ) - - - ( 3 )
式中,n为1,2,...,5,m、k为有限的正整数,Dk-1为第k-1个隐层的节点数,为第k个隐层第n个节点的偏置,为连接第k-1个隐层第m个节点和第k个隐层第n个节点的权值,为第k-1个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像;
输入测试图像,在输出层得到多姿态人脸识别结果,由下式表示:
G = arg n m a x ( b n H + 1 + Σ m = 1 D H w m n H + 1 h m H ( x ) ) - - - ( 4 )
式中H为线性判别深度信念网络隐层总数,DH为第H个隐层的节点数,为输出层第n个节点的偏置,为连接第H个隐层第m个节点和输出层第n个节点的权值,为第H个隐层第m个节点的特征向量,x为线性判别深度信念网络的输入图像,G为输入图像的识别结果,G为1时是正脸或左侧、G为2时是左侧25°或仰头、G为3时是左侧15°或低头、G为4时是右侧15°或正脸、G为5时是右侧25°或右侧。
2.根据权利要求1所述的线性判别深度信念网络的多姿态人脸识别方法,其特征在于在步骤(2)中,所述的深度信念网络由1个输入层、3个隐层、1个输出层构成,输入层的节点数为625,3个隐层的节点数分别为400、400、200,输出层的节点数为5。
CN201710141432.8A 2017-03-10 2017-03-10 线性判别深度信念网络的多姿态人脸识别方法 Active CN106960185B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710141432.8A CN106960185B (zh) 2017-03-10 2017-03-10 线性判别深度信念网络的多姿态人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710141432.8A CN106960185B (zh) 2017-03-10 2017-03-10 线性判别深度信念网络的多姿态人脸识别方法

Publications (2)

Publication Number Publication Date
CN106960185A true CN106960185A (zh) 2017-07-18
CN106960185B CN106960185B (zh) 2019-10-25

Family

ID=59470690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710141432.8A Active CN106960185B (zh) 2017-03-10 2017-03-10 线性判别深度信念网络的多姿态人脸识别方法

Country Status (1)

Country Link
CN (1) CN106960185B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427958A (zh) * 2018-02-02 2018-08-21 哈尔滨工程大学 基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法
CN109106384A (zh) * 2018-07-24 2019-01-01 安庆师范大学 一种心理压力状况预测方法及系统
CN109886984A (zh) * 2019-01-22 2019-06-14 浙江大学 利用前后景灰度差和深度学习网络的图像精确分割方法
CN109949452A (zh) * 2019-02-21 2019-06-28 广州维实信息科技有限公司 基于人脸识别的通道出入检测方法
CN110991247A (zh) * 2019-10-31 2020-04-10 厦门思泰克智能科技股份有限公司 一种基于深度学习与nca融合的电子元器件识别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530657A (zh) * 2013-09-26 2014-01-22 华南理工大学 一种基于加权l2抽取深度学习人脸识别方法
CN104732978A (zh) * 2015-03-12 2015-06-24 上海交通大学 基于联合深度学习的文本相关的说话人识别方法
CN105138975A (zh) * 2015-08-13 2015-12-09 济南大学 一种基于深度信念网络的人体肤色区域分割方法
CN105138973A (zh) * 2015-08-11 2015-12-09 北京天诚盛业科技有限公司 人脸认证的方法和装置
CN105243398A (zh) * 2015-09-08 2016-01-13 西安交通大学 基于线性判别分析准则的改进卷积神经网络性能的方法
CN105608450A (zh) * 2016-03-01 2016-05-25 天津中科智能识别产业技术研究院有限公司 基于深度卷积神经网络的异质人脸识别方法
CN106204779A (zh) * 2016-06-30 2016-12-07 陕西师范大学 基于多人脸数据采集策略和深度学习的课堂考勤方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530657A (zh) * 2013-09-26 2014-01-22 华南理工大学 一种基于加权l2抽取深度学习人脸识别方法
CN104732978A (zh) * 2015-03-12 2015-06-24 上海交通大学 基于联合深度学习的文本相关的说话人识别方法
CN105138973A (zh) * 2015-08-11 2015-12-09 北京天诚盛业科技有限公司 人脸认证的方法和装置
CN105138975A (zh) * 2015-08-13 2015-12-09 济南大学 一种基于深度信念网络的人体肤色区域分割方法
CN105243398A (zh) * 2015-09-08 2016-01-13 西安交通大学 基于线性判别分析准则的改进卷积神经网络性能的方法
CN105608450A (zh) * 2016-03-01 2016-05-25 天津中科智能识别产业技术研究院有限公司 基于深度卷积神经网络的异质人脸识别方法
CN106204779A (zh) * 2016-06-30 2016-12-07 陕西师范大学 基于多人脸数据采集策略和深度学习的课堂考勤方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
MIAOZHEN LIN 等: "LOW Resolution Face Recogniton with Pose Variations Using Deep Belief Networks", 《201 I 4TH INTERNATIONAL CONGRESS ON IMAGE AND SIGNAL PROCESSING》 *
YAN LIU 等: "Discriminative deep belief networks for visual data classification", 《PATTERN RECOGNITION》 *
孙劲光 等: "基于深度神经网络的特征加权融合人脸识别方法", 《计算机应用》 *
杨巨成 等: "基于深度学习的人脸识别方法研究综述", 《天津科技大学学报》 *
陈勇 等: "结合Gabor特征和深度信念网络的人脸姿态分类", 《半导体光电》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108427958A (zh) * 2018-02-02 2018-08-21 哈尔滨工程大学 基于深度学习的自适应权值卷积神经网络水下声纳图像分类方法
CN109106384A (zh) * 2018-07-24 2019-01-01 安庆师范大学 一种心理压力状况预测方法及系统
CN109886984A (zh) * 2019-01-22 2019-06-14 浙江大学 利用前后景灰度差和深度学习网络的图像精确分割方法
CN109949452A (zh) * 2019-02-21 2019-06-28 广州维实信息科技有限公司 基于人脸识别的通道出入检测方法
CN110991247A (zh) * 2019-10-31 2020-04-10 厦门思泰克智能科技股份有限公司 一种基于深度学习与nca融合的电子元器件识别方法
CN110991247B (zh) * 2019-10-31 2023-08-11 厦门思泰克智能科技股份有限公司 一种基于深度学习与nca融合的电子元器件识别方法

Also Published As

Publication number Publication date
CN106960185B (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
CN106960185A (zh) 线性判别深度信念网络的多姿态人脸识别方法
CN111723738B (zh) 一种基于迁移学习的煤岩壳质组显微图像分类方法及系统
CN102314614B (zh) 一种基于类共享多核学习的图像语义分类方法
CN105975931A (zh) 一种基于多尺度池化的卷积神经网络人脸识别方法
CN109344759A (zh) 一种基于角度损失神经网络的亲属识别方法
CN103984948B (zh) 一种基于人脸图像融合特征的软双层年龄估计方法
CN106803069A (zh) 基于深度学习的人群高兴程度识别方法
CN104636732B (zh) 一种基于序列深信度网络的行人识别方法
CN104866810A (zh) 一种深度卷积神经网络的人脸识别方法
CN108416318A (zh) 基于数据增强的合成孔径雷达图像目标深度模型识别方法
CN104318219A (zh) 基于局部特征及全局特征结合的人脸识别方法
CN110555060A (zh) 基于成对样本匹配的迁移学习方法
CN105891422A (zh) 基于源域迁移极限学习漂移补偿的电子鼻气体识别方法
CN109492750B (zh) 基于卷积神经网络和因素空间的零样本图像分类方法
CN104834941A (zh) 基于计算机输入下的稀疏自编码的脱机手写体识别方法
CN105913079A (zh) 基于目标域迁移极限学习的电子鼻异构数据识别方法
CN106778512A (zh) 一种基于lbp和深度学校的非限制条件下人脸识别方法
CN107491729B (zh) 基于余弦相似度激活的卷积神经网络的手写数字识别方法
CN105574475A (zh) 一种基于共同向量词典的稀疏表示分类方法
CN104008375A (zh) 基于特征融合的集成人脸识别方法
CN110414587A (zh) 基于渐进学习的深度卷积神经网络训练方法与系统
CN108229571A (zh) 基于kpca算法与深度信念网络的苹果表面病变图像识别方法
CN110443162A (zh) 一种用于伪装人脸识别的两段式训练方法
CN111783526B (zh) 一种利用姿势不变和图结构对齐的跨域行人重识别方法
CN105631477A (zh) 基于极限学习机和自适应提升的交通标志识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant