CN108921106B - 一种基于capsule的人脸识别方法 - Google Patents

一种基于capsule的人脸识别方法 Download PDF

Info

Publication number
CN108921106B
CN108921106B CN201810734121.7A CN201810734121A CN108921106B CN 108921106 B CN108921106 B CN 108921106B CN 201810734121 A CN201810734121 A CN 201810734121A CN 108921106 B CN108921106 B CN 108921106B
Authority
CN
China
Prior art keywords
network
sub
capsule
face
optimized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810734121.7A
Other languages
English (en)
Other versions
CN108921106A (zh
Inventor
薛方正
古俊波
刘阳阳
罗胜元
雷宏伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201810734121.7A priority Critical patent/CN108921106B/zh
Publication of CN108921106A publication Critical patent/CN108921106A/zh
Application granted granted Critical
Publication of CN108921106B publication Critical patent/CN108921106B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明涉及一种基于capsule的人脸识别方法,采用VGG网络+capsule网络训练网络模型得到优化后的网络模型,将多个人脸图像输入优化后的网络模型得到多个向量值,所有向量值构成人脸查询数据库;最后设置阈值,将未知人脸图像输入优化后的网络模型中得到待识别向量值,将该待识别向量值与所有已知向量值求欧氏距离,选出绝对值最小的距离作为最小距离,并将该最小距离与阈值进行比较:如果最小距离大于阈值,那么表示该未知人脸图像不在人脸查询数据库中;否则与待识别向量值求欧氏距离得到最小距离小的那个已知向量值所对应的人脸图像与未知人脸图像为同一人。该方法在有干扰情况下具有较高的识别精度。

Description

一种基于capsule的人脸识别方法
技术领域
本发明涉及计算机技术领域,尤其涉及机器视觉、深度学习技术领域,具体涉及一种基于capsule的人脸识别方法。
背景技术
随着时代的发展,人脸识别技术被广泛的应用于我们生活的方方面面,比如:服务机器人、安防领域、以及现在很火的利用人脸识别技术解锁我们的手机。虽然人脸识别技术已经被广泛的应用,但其并不是一项完全成熟的技术,在光照、背景、以及使用者表情的干扰下,现在的人脸识别技术并不能很好的工作,识别准确性低。
发明内容
针对现有技术存在预测准确率低的技术问题,本发明的目的是提供一种基于capsule的人脸识别方法,该识别方法的识别准确率高。
为实现上述目的,本发明采用如下技术方案:一种基于capsule的人脸识别方法,包括如下步骤:
S1:训练网络模型:
获取人脸图像数据集,将人脸图像数据集中的人脸图像依次输入VGG网络进行处理,并对应的输出的特征图集;
再将得到的所有特征图对应的转化为一维向量作为capsule网络的输入,并建立损失函数,根据损失函数的值更新VGG网络和capsule网络参数,经过多次迭代,多次更新VGG网络和capsule网络参数,最后得到优化后的网络模型;
S2:建立人脸查询数据库:将需要识别的人的图片输入优化后的网络模型得到他们对应的编码,将这些编码记为已知编码,将所有已知编码保存下来构成人脸查询数据库;
S3:未知人脸图像识别:设置阈值,并将未知人脸图像输入优化后的网络模型中,得到未知人脸图像对应的编码,记为待识别编码,将该待识别编码与所有已知人脸查询数据库中的已知编码求欧式距离,选出值最小的距离作为最小距离,并将该最小距离与阈值进行比较:
如果最小距离大于阈值,那么表示该未知人脸图像不在人脸查询数据库中;
如果最小距离小于或等于阈值,那么与待识别编码求欧氏距离得到最小距离小的那个已知编码为目标编码,所述目标编码对应的人脸图像与未知人脸图像为同一人。
作为改进,所述S1a中的VGG网为VGG16网络。
作为改进,所述1训练网络模型的训练方法为:将所述人脸图像数据集的人脸图像分为K组,每组由三张人脸图像组成,所述三张人脸图像分别为同一个人的两张不同人脸图像和一张不同人的人脸图像;
所述训练网络模型由第一子网络、第二子网络和第三子网络三个完全相同的子网络组成,每次迭代训练时,将一组人脸图像中的三张人脸图像分别输入第一子网络、第二子网络和第三子网络三条子网络中,所述每条子网络输出一个编码;
将得到的三个编码输入损失函数,根据损失函数的值分别更新第一子网络中的VGG网络参数和capsule网络参数、第二子网络中的VGG网络参数和capsule网络参数以及第三子网络中的VGG网络参数和capsule网络参数,所述三个网络的更新幅度一样,更新之后第一子网络、第二子网络和第三子网络的参数保持一致,经过多轮迭代得到优化后的第一子网络、优化后的第二子网络和优化后的第三子网络,优化后的第一子网络或优化后的第二子网络或优化后的第三子网络为优化后的训练网络模型。
作为改进,所述S1训练网络模型的步骤具体如下:
1)记第f组人脸图像为:(af,pf,nf),f=1,2,...K,其中af和pf分别表示第f组同一个人的两张不同人脸图像,nf表示第f组一张不同人的人脸图像;
预设迭代更新次数为Q;
2)令q=1,f取一个随机值,介于1-K之间;
3)将第f组人脸图像af输入第一子网络中的VGG网络进行处理,得到特征图a′f,再将所述特征图记a′f转化为一维向量a′f,i,i=1,2...49;
将第f组人脸图像pf输入第一子网络中的VGG网络进行处理,得到特征图p′f,再将所述特征图记p′f转化为一维向量p′f,i,i=1,2...49;
将第f组人脸图像nf输入第一子网络中的VGG网络进行处理,得到特征图n′f再将所述特征图记n′f转化为一维向量n′f,i,i=1,2...49;
4)令第一子网络中capsule网络的ui=a'f,i,输出v[2]标记为v[2] a|i
令第二子网络中capsule网络的ui=p'f,i,输出v[2]标记为v[2] p|i
令第三条网络中capsule网络的ui=n'f,i,输出v[2]标记为v[2] n|i
5)
Figure BDA00017215664000000310
其中,w[1] j为输入层到隐藏层的变换矩阵,j表示隐藏层神经元的个数,
Figure BDA00017215664000000311
表示ui通过变换矩阵之后的状态;
6)
Figure BDA0001721566400000031
其中,c[1] ij表示变换层的加权系数,s[1] j表示对
Figure BDA0001721566400000032
加权求和后的形成的新特征;
7)
Figure BDA0001721566400000033
其中,v[1] j表示隐藏层神经元的状态;
8)
Figure BDA0001721566400000034
其中,w[2] t表示隐藏层到输出层的变换矩阵,
Figure BDA0001721566400000035
表示v[1] j经过变换矩阵之后的状态,t为输出神经元的个数即1;
9)
Figure BDA0001721566400000036
其中,s[2] j表示对
Figure BDA0001721566400000037
进行加权求和之后形成的更高级的特征,c[2] jt为示隐藏层到输出层的加权系数,t的取值为1;
10)
Figure BDA0001721566400000038
其中,v[2]表示输出神经元的状态,输出并标记保存;
11)设损失函数为:
Figure BDA0001721566400000039
其中,α为经验值;
12)根据损失函数的值,利用梯度下降算法更新VGG16网络中的参数和capsule网络中的w[1] j及w[2] t,采用动态路由算法更新capsule网络中c[1] ij和c[2] jt
13)如果q≤Q,则令q=q+1,f再取一个介于1-K的随机值,并返回步骤3),否则执行下一步;
14)保存VGG16网络中的参数和capsule网络中的参数,得到优化后的网络模型。
作为改进,所述α的值为0.2。
相对于现有技术,本发明至少具有如下优点:
本发明应用现在最新的capsule网络,将其与当下流行的VGG16网络架构相结合,既能够很好的提取出图片的特征,也能够对于这些特征的变形、旋转、光照等干扰也具有很好的鲁棒性,在人脸识别上比现有技术效果更好。
具体实施方式
下面对本发明作进一步详细说明。
一种基于capsule的人脸识别方法,包括如下步骤:
S1:训练网络模型:
获取人脸图像数据集,将人脸图像数据集中的人脸图像依次输入VGG网络进行处理,并对应的输出的特征图集;
将得到所有特征图一一对应地转化为一维向量,每一张特征图对应的转化为49个长度为512的一维向量,将特征图集中的所有特征图全部对应的转化;
再将得到所有特征图对应的转化为一维向量作为capsule网络的输入,并建立损失函数,根据损失函数的值更新VGG网络和capsule网络参数,经过多次迭代,多次更新VGG网络和capsule网络参数,最后得到优化后的网络模型;经过capsule网络的计算,最终将一副人脸图像编码为一个向量。
实施时,将所述人脸图像数据集的人脸图像分为K组,每组由三张人脸图像组成,所述三张人脸图像分别为同一个人的两张不同人脸图像和一张不同人的人脸图像;即每组人脸图像中包括两个不同人的三张人脸图像;
所述训练网络模型由第一子网络、第二子网络和第三子网络三个完全相同的子网络组成,每次迭代训练时,将一组人脸图像中的三张人脸图像分别输入第一子网络、第二子网络和第三子网络三条子网络中,即一条自网络输入一张人脸图像,所述每条子网络输出一个编码;
将得到的三个编码输入损失函数,根据损失函数的值分别更新第一子网络中的VGG网络参数和capsule网络参数、第二子网络中的VGG网络参数和capsule网络参数以及第三子网络中的VGG网络参数和capsule网络参数,所述三个网络的更新幅度一样,更新之后第一子网络、第二子网络和第三子网络的参数保持一致,经过多轮迭代得到优化后的第一子网络、优化后的第二子网络和优化后的第三子网络,优化后的第一子网络或优化后的第二子网络或优化后的第三子网络为优化后的训练网络模型。
训练网络模型的步骤具体如下:
1)记第f组人脸图像为:(af,pf,nf),f=1,2,...K,其中af和pf分别表示第f组同一个人的两张不同人脸图像,nf表示第f组一张不同人的人脸图像;
预设迭代更新次数为Q;
2)令q=1,f取一个随机值,介于1-K之间;
3)将第f组人脸图像af输入第一子网络中的VGG网络进行处理,得到特征图a′f,再将所述特征图记a′f转化为一维向量a′f,i,i=1,2...49;
将第f组人脸图像pf输入第一子网络中的VGG网络进行处理,得到特征图p′f,再将所述特征图记p′f转化为一维向量p′f,i,i=1,2...49;
将第f组人脸图像nf输入第一子网络中的VGG网络进行处理,得到特征图n′f再将所述特征图记n′f转化为一维向量n′f,i,i=1,2...49;
4)令第一子网络中capsule网络的ui=a'f,i,输出v[2]标记为v[2] a|i
令第二子网络中capsule网络的ui=p'f,i,输出v[2]标记为v[2] p|i
令第三条网络中capsule网络的ui=n'f,i,输出v[2]标记为v[2] n|i
5)
Figure BDA0001721566400000051
其中,w[1] j为输入层到隐藏层的变换矩阵,j表示隐藏层神经元的个数,
Figure BDA0001721566400000052
表示ui通过变换矩阵之后的状态,变换矩阵可以看做是从不同的角度看特征(ui),从而得到新的特征;
6)
Figure BDA0001721566400000061
其中,c[1] ij表示变换层的加权系数,用于对得到的新的特征
Figure BDA0001721566400000062
进行加权,用于评价新特征的重要程度,s[1] j表示对
Figure BDA0001721566400000063
加权求和后的形成的新特征;
7)
Figure BDA0001721566400000064
其中,该步骤主要是为了对向量s[1] j进行压缩,使其的模长在0-1范围内,我们通过评价v[1] j的模长的大小来评价特征的显著程度,若特征越显著,其模长越长,v[1] j表示隐藏层神经元的状态;
8)
Figure BDA0001721566400000065
其中,w[2] t表示隐藏层到输出层的变换矩阵,表示从不同的角度看特征v[1] j,进而得到新的特征
Figure BDA0001721566400000066
Figure BDA0001721566400000067
表示v[1] j经过变换矩阵之后的状态,t为输出神经元的个数即1;
9)
Figure BDA0001721566400000068
其中,s[2] j表示对
Figure BDA0001721566400000069
进行加权求和之后形成的更高级的特征,c[2] jt为示隐藏层到输出层的加权系数,用于评价各个特征
Figure BDA00017215664000000610
的重要程度,t的取值为1;
10)
Figure BDA00017215664000000611
其中,v[2]表示输出神经元的状态,输出并标记保存;该步骤用于对s[2] t进行压缩,使其的模长在0-1之间,为了便于后面的计算,也即是将一副人脸的照片编码为一个向量;
11)设损失函数为:
Figure BDA00017215664000000612
其中,α为经验值,损失函数的具体意义就是使两张同一个人的照片经过网络后的输出他们的距离小于不同的人经过网络后的输出的距离,α用于衡量他们的距离差距,这里我们取α为0.2;
12)根据损失函数的值,利用梯度下降算法更新VGG16网络中的参数和capsule网络中的w[1] j及w[2] t,利用动态路由算法更新capsule网络中c[1] ij和c[2] jt,VGG16网络中的参数和capsule网络中参数的初始值是随机值;
13)如果q≤Q,则令q=q+1,f再取一个介于1-K的随机值,并返回步骤3),否则执行下一步;
14)保存VGG16网络中的参数和capsule网络中的参数,得到优化后的网络模型。
S2:建立人脸查询数据库:将需要识别的人的图片输入优化后的网络模型得到他们对应的编码,将这些编码记为已知编码,将所有已知编码保存下来构成人脸查询数据库。
S3:未知人脸图像识别:设置阈值,并将未知人脸图像输入优化后的网络模型中,得到未知人脸图像对应的编码,记为待识别编码,将该待识别编码与所有已知人脸查询数据库中的已知编码求欧氏距离,选出绝对值最小的距离作为最小距离,并将该最小距离与阈值进行比较:求欧氏距离是现有技术,为节约篇幅,本发明中不做详述;
如果最小距离大于阈值,那么表示该未知人脸图像不在人脸查询数据库中;
如果最小距离小于或等于阈值,那么与待识别编码求欧氏距离得到最小距离小的那个已知编码为目标编码,所述目标编码对应的人脸图像与未知人脸图像为同一人。
本发明利用经典的VGG16网络架构+capsule来实现人脸识别,在光照、背景、表情等干扰下达到的识别精度比当前的方法有了一定的提升。
网络架构:VGG16+capsule
VGG16:输入图像的大小是224*224*3。convN_M表示卷积核大小N*N,输出通道为M。
Figure BDA0001721566400000071
Capsule层:
我们将VGG16的输出作为capsule层的输入,具体的:VGG16的输出大小为7×7*512,因此我们将其拆分成7*7个1*512的单元,即capsule第一层的输入神经元个数为7*7即49个,每个神经元由1*512的向量组成可以理解为每个capsule神经元有512个属性,capsule第二层即隐藏层的神经元个数为10,第三层即输出层的神经元个数为1。
原理是:
首先将人脸数据集进行分组,分为K组,K的取值根据人脸数据集的大小而定,每一组3张图片,分别为同一个人的两张不同照片和一张不同的人的照片,记(ai,pi,ni)为一组,其中ai,pi分别表示同一个人的两张不同照片,ni表示不同的人的照片,i表示第i组,i=1,2,3,,,K。
使用3个参数完全相同的上述网络(VGG16+capsule),分别将(ai,pi,ni)输入进这3个网络,可以得到3个不同的v[2],将这3个不同的v[2]记为(v[2] a|i,v[2] p|i,v[2] n|i),其中输出(v[2] a|i,v[2] p|i,v[2] n|i)与输入(ai,pi,ni)一一对应,即ai的输出为v[2] a|i,pi的输出为v[2] p|i,ni的输出为v[2] n|i
然后根据损失函数的值利用梯度下降算法来优化网络的参数(除c[1] ij、c[2] jt外),c[1] ij、c[2] jt采用动态路由算法(成熟的算法)来进行更新。
具体的损失函数为
Figure BDA0001721566400000081
该损失函数的具体意义就是使两张同一个人的照片经过网络后的输出他们的距离小于不同的人经过网络后的输出的距离,α用于衡量他们的距离差距,这里我们取α为0.2。
训练完成后,我们只需要取这3个参数完全相同的网络中的一个作为我们的人脸识别网络,具体实施步骤:将需要识别的人的照片通过人脸识别网络可以得到一个输出,即为这个人的编码(即向量值),将许多不同的人的照片依次输入进人脸识别网络即可得到这些人的编码,将这些编码存入数据库,并设定一个阈值,用于评价是否是同一个人。在进行实时的人脸识别应用时,只需要通过摄像头将采集到的图片输入进人脸识别网络,进而得到一个编码,然后将这个编码与数据库的编码进行距离比较,得到一个与其最相近的编码,若采集到的图片的编码与其最近的数据库中的编码的距离小于我们设定的阈值,则判定这个人就是数据库中的这个编码对应的人;否则就判定无法识别这个人的身份。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种基于capsule的人脸识别方法,其特征在于:包括如下步骤:
S1:训练网络模型:
获取人脸图像数据集,将人脸图像数据集中的人脸图像依次输入VGG网络进行处理,并对应的输出特征图集;
再将得到的所有特征图对应的转化为一维向量作为capsule网络的输入,并建立损失函数,根据损失函数的值更新VGG网络和capsule网络参数,经过多次迭代,多次更新VGG网络和capsule网络参数,最后得到优化后的网络模型;
S2:建立人脸查询数据库:将需要识别的人的图片输入优化后的网络模型得到他们对应的编码,将这些编码记为已知编码,将所有已知编码保存下来构成人脸查询数据库;
S3:未知人脸图像识别:设置阈值,并将未知人脸图像输入优化后的网络模型中,得到未知人脸图像对应的编码,记为待识别编码,将该待识别编码与所有已知人脸查询数据库中的已知编码求欧式距离,选出值最小的距离作为最小距离,并将该最小距离与阈值进行比较:
如果最小距离大于阈值,那么表示该未知人脸图像不在人脸查询数据库中;
如果最小距离小于或等于阈值,那么与待识别编码求欧氏距离得到最小距离的那个已知编码为目标编码,所述目标编码对应的人脸图像与未知人脸图像为同一人。
2.如权利要求1所述的基于capsule的人脸识别方法,其特征在于:所述S1中的VGG网为VGG16网络。
3.如权利要求2所述的基于capsule的人脸识别方法,其特征在于:所述训练网络模型的训练方法为:将所述人脸图像数据集的人脸图像分为K组,每组由三张人脸图像组成,所述三张人脸图像分别为同一个人的两张不同人脸图像和一张不同人的人脸图像;
所述训练网络模型由第一子网络、第二子网络和第三子网络三个完全相同的子网络组成,每次迭代训练时,将一组人脸图像中的三张人脸图像分别输入第一子网络、第二子网络和第三子网络三条子网络中,所述第一子网络、第二子网络和第三子网络各输出一个编码;
将得到的三个编码输入损失函数,根据损失函数的值分别更新第一子网络中的VGG网络参数和capsule网络参数、第二子网络中的VGG网络参数和capsule网络参数以及第三子网络中的VGG网络参数和capsule网络参数,所述三个网络的更新幅度一样,更新之后第一子网络、第二子网络和第三子网络的参数保持一致,经过多轮迭代得到优化后的第一子网络、优化后的第二子网络和优化后的第三子网络,优化后的第一子网络或优化后的第二子网络或优化后的第三子网络为优化后的训练网络模型。
4.如权利要求3所述的基于capsule的人脸识别方法,其特征在于:所述S1训练网络模型的步骤具体如下:
1)记第f组人脸图像为:(af,pf,nf),f=1,2,...K,其中af和pf分别表示第f组同一个人的两张不同人脸图像,nf表示第f组一张不同人的人脸图像;
预设迭代更新次数为Q;
2)令q=1,f取一个随机值,介于1-K之间;
3)将第f组人脸图像af输入第一子网络中的VGG网络进行处理,得到特征图a′f,再将所述特征图a′f转化为一维向量a′f,i,i=1,2...49;
将第f组人脸图像pf输入第一子网络中的VGG网络进行处理,得到特征图p′f,再将所述特征图p′f转化为一维向量p′f,i,i=1,2...49;
将第f组人脸图像nf输入第一子网络中的VGG网络进行处理,得到特征图n′f再将所述特征图n′f转化为一维向量n′f,i,i=1,2...49;
4)令第一子网络中capsule网络的ui=a′f,i,输出v[2]标记为v[2] a|i
令第二子网络中capsule网络的ui=p′f,i,输出v[2]标记为v[2] p|i
令第三条网络中capsule网络的ui=n′f,i,输出v[2]标记为v[2] n|i
5)
Figure FDA0003057489350000021
其中,w[1] j为输入层到隐藏层的变换矩阵,j表示隐藏层神经元的个数,
Figure FDA0003057489350000022
表示ui通过变换矩阵之后的状态;
6)
Figure FDA0003057489350000023
其中,c[1] ij表示变换层的加权系数,s[1] j表示对
Figure FDA0003057489350000024
加权求和后的形成的新特征;
7)
Figure FDA0003057489350000025
其中,v[1] j表示隐藏层神经元的状态;
8)
Figure FDA0003057489350000031
其中,w[2] t表示隐藏层到输出层的变换矩阵,
Figure FDA0003057489350000032
表示v[1] j经过变换矩阵之后的状态,t为输出神经元的个数即1;
9)
Figure FDA0003057489350000033
其中,s[2] j表示对
Figure FDA0003057489350000034
进行加权求和之后形成的更高级的特征,c[2] jt为示隐藏层到输出层的加权系数,t的取值为1;
10)
Figure FDA0003057489350000035
其中,v[2]表示输出神经元的状态,输出并标记保存;
11)设损失函数为:
Figure FDA0003057489350000036
其中,α为经验值;
12)根据损失函数的值,利用梯度下降算法更新VGG16网络中的参数和capsule网络中的w[1] j及w[2] t,采用动态路由算法更新capsule网络中c[1] ij和c[2] jt
13)如果q≤Q,则令q=q+1,f再取一个介于1-K的随机值,并返回步骤3),否则执行下一步;
14)保存VGG16网络中的参数和capsule网络中的参数,得到优化后的网络模型。
5.如权利要求4所述的基于capsule的人脸识别方法,其特征在于:所述α的值为0.2。
CN201810734121.7A 2018-07-06 2018-07-06 一种基于capsule的人脸识别方法 Expired - Fee Related CN108921106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810734121.7A CN108921106B (zh) 2018-07-06 2018-07-06 一种基于capsule的人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810734121.7A CN108921106B (zh) 2018-07-06 2018-07-06 一种基于capsule的人脸识别方法

Publications (2)

Publication Number Publication Date
CN108921106A CN108921106A (zh) 2018-11-30
CN108921106B true CN108921106B (zh) 2021-07-06

Family

ID=64424457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810734121.7A Expired - Fee Related CN108921106B (zh) 2018-07-06 2018-07-06 一种基于capsule的人脸识别方法

Country Status (1)

Country Link
CN (1) CN108921106B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110197125A (zh) * 2019-05-05 2019-09-03 上海资汇信息科技有限公司 无约束条件下的人脸识别方法
US12008790B2 (en) 2019-09-24 2024-06-11 Apple Inc. Encoding three-dimensional data for processing by capsule neural networks
CN111126504A (zh) * 2019-12-27 2020-05-08 西北工业大学 多源不完备信息融合图像目标分类方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105975959A (zh) * 2016-06-14 2016-09-28 广州视源电子科技股份有限公司 基于神经网络的人脸特征提取建模、人脸识别方法及装置
CN106096535A (zh) * 2016-06-07 2016-11-09 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于双线性联合cnn的人脸验证方法
CN106372581A (zh) * 2016-08-25 2017-02-01 中国传媒大学 构建及训练人脸识别特征提取网络的方法
CN107578007A (zh) * 2017-09-01 2018-01-12 杭州电子科技大学 一种基于多特征融合的深度学习人脸识别方法
CN107609459A (zh) * 2016-12-15 2018-01-19 平安科技(深圳)有限公司 一种基于深度学习的人脸识别方法及装置
CN107679513A (zh) * 2017-10-20 2018-02-09 北京达佳互联信息技术有限公司 图像处理方法、装置及服务器
CN107895160A (zh) * 2017-12-21 2018-04-10 曙光信息产业(北京)有限公司 人脸检测与识别装置及方法
CN108090451A (zh) * 2017-12-20 2018-05-29 湖北工业大学 一种人脸识别方法及系统
CN108121446A (zh) * 2017-12-25 2018-06-05 邱亮南 交互方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10902243B2 (en) * 2016-10-25 2021-01-26 Deep North, Inc. Vision based target tracking that distinguishes facial feature targets

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096535A (zh) * 2016-06-07 2016-11-09 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于双线性联合cnn的人脸验证方法
CN105975959A (zh) * 2016-06-14 2016-09-28 广州视源电子科技股份有限公司 基于神经网络的人脸特征提取建模、人脸识别方法及装置
CN106372581A (zh) * 2016-08-25 2017-02-01 中国传媒大学 构建及训练人脸识别特征提取网络的方法
CN107609459A (zh) * 2016-12-15 2018-01-19 平安科技(深圳)有限公司 一种基于深度学习的人脸识别方法及装置
CN107578007A (zh) * 2017-09-01 2018-01-12 杭州电子科技大学 一种基于多特征融合的深度学习人脸识别方法
CN107679513A (zh) * 2017-10-20 2018-02-09 北京达佳互联信息技术有限公司 图像处理方法、装置及服务器
CN108090451A (zh) * 2017-12-20 2018-05-29 湖北工业大学 一种人脸识别方法及系统
CN107895160A (zh) * 2017-12-21 2018-04-10 曙光信息产业(北京)有限公司 人脸检测与识别装置及方法
CN108121446A (zh) * 2017-12-25 2018-06-05 邱亮南 交互方法和系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Convolutional Capsule Network for Classification of Breast Cancer Histology Images;Tomas Iesmantas 等;《International Conference Image Analysis and Recognition》;20180606;853–860 *
Dynamic Routing Between Capsules;Sara Sabour 等;《NIPS"17: Proceedings of the 31st International Conference on Neural Information Processing Systems》;20171231;3859–3869 *
FaceNet: A Unified Embedding for Face Recognition and Clustering;Florian Schroff 等;《2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)》;20151015;815-823 *
一种基于融合深度卷积神经网络与度量学习的人脸识别方法;吕璐 等;《现代电子技术》;20180501;第41卷(第9期);58-61,67 *
多任务学习及卷积神经网络在人脸识别中的应用;邵蔚元 等;《计算机工程与应用》;20160731;第52卷(第13期);32-37,88 *

Also Published As

Publication number Publication date
CN108921106A (zh) 2018-11-30

Similar Documents

Publication Publication Date Title
CN108537743B (zh) 一种基于生成对抗网络的面部图像增强方法
CN111798400B (zh) 基于生成对抗网络的无参考低光照图像增强方法及系统
CN110348330B (zh) 基于vae-acgan的人脸姿态虚拟视图生成方法
CN112766160B (zh) 基于多级属性编码器和注意力机制的人脸替换方法
CN110503680B (zh) 一种基于非监督的卷积神经网络单目场景深度估计方法
CN111783748B (zh) 人脸识别方法、装置、电子设备及存储介质
CN110572696B (zh) 一种变分自编码器与生成对抗网络结合的视频生成方法
CN109344731B (zh) 基于神经网络的轻量级的人脸识别方法
CN105184362B (zh) 基于参数量化的深度卷积神经网络的加速与压缩方法
WO2021052375A1 (zh) 目标图像生成方法、装置、服务器及存储介质
CN108921106B (zh) 一种基于capsule的人脸识别方法
WO2019227479A1 (zh) 人脸旋转图像的生成方法及装置
CN112801015B (zh) 一种基于注意力机制的多模态人脸识别方法
CN112818764B (zh) 一种基于特征重建模型的低分辨率图像人脸表情识别方法
CN110660020B (zh) 一种基于融合互信息的对抗生成网络的图像超分辨率方法
CN109934881A (zh) 图像编码方法、动作识别的方法及计算机设备
CN112560648B (zh) 一种基于rgb-d图像的slam方法
CN110135277B (zh) 一种基于卷积神经网络的人体行为识别方法
CN108537181A (zh) 一种基于大间距深度度量学习的步态识别方法
CN113610046B (zh) 一种基于深度视频联动特征的行为识别方法
CN110069992B (zh) 一种人脸图像合成方法、装置、电子设备及存储介质
CN113111760A (zh) 基于通道注意力的轻量化图卷积人体骨架动作识别方法
CN115484410B (zh) 基于深度学习的事件相机视频重建方法
CN116052218B (zh) 一种行人重识别方法
CN115239857B (zh) 图像生成方法以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210706