CN106650653A - 基于深度学习的人脸识别和年龄合成联合模型的构建方法 - Google Patents
基于深度学习的人脸识别和年龄合成联合模型的构建方法 Download PDFInfo
- Publication number
- CN106650653A CN106650653A CN201611155795.9A CN201611155795A CN106650653A CN 106650653 A CN106650653 A CN 106650653A CN 201611155795 A CN201611155795 A CN 201611155795A CN 106650653 A CN106650653 A CN 106650653A
- Authority
- CN
- China
- Prior art keywords
- age
- input
- feature
- identity
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 16
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 16
- 238000013135 deep learning Methods 0.000 title claims abstract description 15
- 238000012549 training Methods 0.000 claims abstract description 26
- 230000000694 effects Effects 0.000 claims abstract description 14
- 230000004927 fusion Effects 0.000 claims abstract description 5
- 230000009467 reduction Effects 0.000 claims abstract description 3
- 230000014509 gene expression Effects 0.000 claims description 39
- 230000006870 function Effects 0.000 claims description 35
- 239000011159 matrix material Substances 0.000 claims description 13
- 238000013507 mapping Methods 0.000 claims description 12
- 230000001815 facial effect Effects 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 230000007423 decrease Effects 0.000 claims description 6
- 230000032683 aging Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000012886 linear function Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 235000013399 edible fruits Nutrition 0.000 claims 1
- 210000004185 liver Anatomy 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 4
- 238000005286 illumination Methods 0.000 abstract description 2
- 230000036544 posture Effects 0.000 abstract 1
- 238000007781 pre-processing Methods 0.000 abstract 1
- 238000013527 convolutional neural network Methods 0.000 description 14
- 238000011160 research Methods 0.000 description 3
- 229930091051 Arenine Natural products 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000004899 motility Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/178—Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种基于深度学习的人脸识别和年龄合成联合模型的构建方法,该方法通过对输入的一对图像进行对齐和PCA和LDA降维的预处理;并通过一个经过训练得到的自动编码器,得到用于身份表示的特征和不同年龄段表示的特征共6组,然后对6对结果经过平行CNN,输出图像相似度,之后加权融合得到匹配结果;该发明对单独的人脸识别或者年龄检测以及共同任务均能得到很好的效果,对光照、姿势影响下的人脸识别也额能取得很好的效果;由于区分开了年龄与人脸身份的特征,因此对跨年龄的人脸识别也具有鲁棒性。并且,可视要求而定调整一些参数和权值,因此非常有灵活性。
Description
技术领域
本发明涉及计算机视觉领域,更具体地,涉及一种基于深度学习的人脸识别和年龄合成联合模型的构建方法。
背景技术
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。
由于人脸识别分类与验证均有很大的实际应用价值,所以此课题作为一个研究热点已经持续了多年时间。人脸识别在现实生活中有很广的应用前景。如安保门禁系统、公安刑侦破案、摄像监视系统、网络应用,身份辨识、支付系统中均需用到人脸识别。
然而人脸识别并不是个简单的任务。人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大,另外,人脸识别还受光照条件(例如白天和夜晚,室内和室外等)、人脸的很多遮盖物(例如口罩、墨镜、头发、胡须等)、年龄等多方面因素的影响。这些问题给人脸识别带来了莫大的挑战。
因此近来许多关于人脸识别研究热烈开展起来。因为一幅人脸图像的维度太大,首要任务是对人脸图像的一系列处理。如经典的主成分分析方法(PCA),通过线性变换原理将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量;还有线性判别分析(LDA),将带上标签的数据(点),通过投影的方法,投影到维度更低的空间中,使得投影后的点,会形成按类别区分,一簇一簇的情况,相同类别的点,将会在投影后的空间中更接近。这样将使不同类的数据更易于分类。在本发明中,将这两种算法都作为预处理的方法。
近年基于深度学习的人脸识别方法取得了很大进展。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络(CNN)是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能,基于CNN的方法的主要思想是:首先,对输入图像利用的CNN进行卷积提取局部特征,然后在全链接层通过矩阵相乘减少维数,同时通过反向传导的梯度下降法调整参数使得整个网络结构能输出与训练集结果相差最小的分类结果。网络中倒数第二,第三层的特征可被视为原图像的全局特征,在人脸验证模型中,这些特征将会使用各种方法组合计算出两张人脸图像属于同一个人的概率,通过与参考集一一比对以完成最终的识别过程。本发明将CNN方法用于身份识别过程。
虽然上述方法都取得了很大的进展,但在处理跨年龄的人脸识别方向还有待探索。年龄增长给人脸带来的巨大变化大大影响了人脸识别算法的精度。所以跨年龄的人脸识别仍需更有效的算法来解决。
发明内容
本发明提供一种基于深度学习的人脸识别和年龄合成联合模型的构建方法,该方法构建的模型可同时抑制身份表达和年龄表达的相关度,来达到年龄不变的人脸识别的目的。
为了达到上述技术效果,本发明的技术方案如下:
一种基于深度学习的人脸识别和年龄合成联合模型的构建方法,包括以下步骤:
S1:对图像进行切片预处理:根据双眼中心进行对齐,采用PCA和LDA的方式进行降维,以及达到增大类间差距的目的;
S2:编码:通过训练数据得到的一个自动编码器对输入特征向量进行编码。该编码器的目的是将原图特征通过某种编码方式合成新的特征,用于表达身份或者年龄的相关信息,对任何输入的图片,该编码器将生成六组不同的表达:
第一组为身份表达,对原特征减去平均脸后的映射编码,反映个体的身份的稳定信息;
第二组至第六组分别为幼年、少年、成年、中年、老年五个年龄段下原图像的合成图像的表达,这一部分的编码过程与上述相似,不同的是输入是原图信息,这五组编码器的作用是模拟老化过程来合成特定年龄组的图片,
然后通过损失函数和一定的约束规则来控制消除年龄对身份表达的影响,即在年龄合成中起到重要作用的特征,降低它在身份表达中起的作用;
S3:对每对图像进行身份匹配验证:测试图像与一幅训练图像作为一对,由编码器得到的六对特征分别通过平行CNN,Softmax层将给出输入的一对特征的相似度的大小;
令Ia,Ib为一对输入图像,则相似得分表示为:
s(Ia,Ib)=soft max(Ws|o(Ia)-o(Ib)|+bs)
其中,o()表示CNN中全连接层的输出,Ws和bs为softmax层的参数;
对这六个结果进行加权平均即可得到验证结果,其中身份表达占的比重较大;五对年龄合成的相似度表示在五个年龄段里的相似度,作为参考因素,占的比重比身份表达要小,由此将得到两幅图像匹配的概率:
score=as1+(1-a)(s2+s3+s4+s5+s6);
S4:对所有特征得到的相似得分结果进行余弦相似度融合,即可得到最终的结果。
进一步地,所述步骤S2中,使用的编码器由训练库中的数据训练得出,该编码器将生成6组不同的表达:
S21:第一组为身份表达,是对原特征减去平均脸后的映射编码,假设输入的第i个人的人脸图片表示为Xi训练库中所有人脸图像的均值为M,则Yi=Xi-M反映的是该脸的独特信息,然后对Yi进行编码:
假设编码由3层结构组成,每一层以上一层的输出作为输入,层数为j的输出表示为hj则编码过程可表示为hj=Wjσ(hj-1)+bj,第一层的输入为Yi,
则编码过程的映射表示为:
h=Wσ(Y+b)
同时,编码后的图像重构可表示为Y'=W'σ(h'+b')
这一部分参数W,b由最小化一个损失函数来获得,该损失函数表示原图减去平均脸的信息与由编码后重构的信息的距离的平方损失,该过程的损失函数表示为:
S22:第二组至第六组分别为幼年、少年、成年、中年、老年等5个年龄段下原图像的合成图像的表达,这一部分的编码过程与上述相似,不同的是输入是原图信息Xi,这一部分损失函数由每一组与库内同类同年龄组的原图的平方损失来表示,因此这里有5个不同的年龄合成的编码器,每一个编码器有不同的编码参数,因此损失函数为这5个编码器的生成的结果重构与原图的距离平方损失:
于是联合损失函数L=L1+L2,表示两个不同的编码过程中原特征与重构特征的损失,这一部分是表示对原图特征的共享;
S23:要抑制年龄对身份表达的影响,即对年龄合成很重要的那部分特征,应该削弱其在身份表达中的作用,用一个矩阵Φ来表示在编码过程中反映的原图特征的重要程度,可表示为其中令s(j)为Wj作用的特征,mkj=δ(s(j)-k)=1当且仅当s(j)=k,即,M为将编码参数映射为特征重要程度的矩阵;
表示身份表达过程中反映的特征重要性矩阵;表示年龄合成表现出来的特征重要性矩阵,然后对联合损失函数加入了一个约束:目的是减小身份表达和年龄表达之间的相关度;
S24:编码器的参数表示为θ={W,b},总损失函数L(θ)=L1+L2+L3通过最小化总损失函数来训练整个编码部分:W,b=arg minL(θ)对该式求解利用交替贪婪联合下降算法,先固定b,对W求梯度下降的最优解;再固定W,对b求梯度下降的最优解,直到迭代收敛。
进一步地,所述步骤S3中,平行CNN的训练步骤如下:
用训练库中人脸图像,分别以多尺度矩形框截取人脸图像的多个部分的图像,成对作为CNN的输入进行预训练,平行CNN的结构有九个层次,是由随机梯度下降来训练,输入层需要一对图像作为输入,接下来的三个卷积层通过最大池层提取判别图像分层的功能,然后用一个非线性激活函数用于对输入进行卷积运算后的数据,在这用修正的线性函数Relu为激活函数,完全连接层通过学习一个语义空间,使同一个人的一对图像的相似性得分被放大,而来自不同的人的图像对的相似度减小,除了卷积特征从输入的人脸纹理中提取,归一化的坐标的68个地标相结合,作为一个132维向量,也被纳入学习的歧视性空间,最后一层是一个softmax层产生的相似性输入图像对的分数,在输入的图像对之间,输入端到完全连接层的参数共享。
与现有技术相比,本发明技术方案的有益效果是:
本发明通过对输入的一对图像进行对齐和PCA和LDA降维的预处理;并通过一个经过训练得到的自动编码器,得到用于身份表示的特征和不同年龄段表示的特征共6组,然后对6对结果经过平行CNN,输出图像相似度,之后加权融合得到匹配结果;该发明对单独的人脸识别或者年龄检测以及共同任务均能得到很好的效果,对光照、姿势影响下的人脸识别也额能取得很好的效果;由于区分开了年龄与人脸身份的特征,因此对跨年龄的人脸识别也具有鲁棒性。并且,可视要求而定调整一些参数和权值,因此非常有灵活性。
附图说明
图1为本发明方法流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种基于深度学习的人脸识别和年龄合成联合模型的构建方法,包括以下步骤:
S1:对图像进行切片预处理:根据双眼中心进行对齐,采用PCA和LDA的方式进行降维,以及达到增大类间差距的目的;
S2:编码:通过训练数据得到的一个自动编码器对输入特征向量进行编码。该编码器的目的是将原图特征通过某种编码方式合成新的特征,用于表达身份或者年龄的相关信息,对任何输入的图片,该编码器将生成六组不同的表达:
第一组为身份表达,对原特征减去平均脸后的映射编码,反映个体的身份的稳定信息;
第二组至第六组分别为幼年、少年、成年、中年、老年五个年龄段下原图像的合成图像的表达,这一部分的编码过程与上述相似,不同的是输入是原图信息,这五组编码器的作用是模拟老化过程来合成特定年龄组的图片,
然后通过损失函数和一定的约束规则来控制消除年龄对身份表达的影响,即在年龄合成中起到重要作用的特征,降低它在身份表达中起的作用;
S3:对每对图像进行身份匹配验证:测试图像与一幅训练图像作为一对,由编码器得到的六对特征分别通过平行CNN,Softmax层将给出输入的一对特征的相似度的大小;
令Ia,Ib为一对输入图像,则相似得分表示为:
s(Ia,Ib)=soft max(Ws|o(Ia)-o(Ib)|+bs)
其中,o()表示CNN中全连接层的输出,Ws和bs为softmax层的参数;
对这六个结果进行加权平均即可得到验证结果,其中身份表达占的比重较大;五对年龄合成的相似度表示在五个年龄段里的相似度,作为参考因素,占的比重比身份表达要小,由此将得到两幅图像匹配的概率:
score=as1+(1-a)(s2+s3+s4+s5+s6);
S4:对所有特征得到的相似得分结果进行余弦相似度融合,即可得到最终的结果。
步骤S2中,使用的编码器由训练库中的数据训练得出,该编码器将生成6组不同的表达:
S21:第一组为身份表达,是对原特征减去平均脸后的映射编码,假设输入的第i个人的人脸图片表示为Xi训练库中所有人脸图像的均值为M,则Yi=Xi-M反映的是该脸的独特信息,然后对Yi进行编码:
假设编码由3层结构组成,每一层以上一层的输出作为输入,层数为j的输出表示为hj则编码过程可表示为hj=Wjσ(hj-1)+bj,第一层的输入为Yi,
则编码过程的映射表示为:
h=Wσ(Y+b)
同时,编码后的图像重构可表示为Y'=W'σ(h'+b')
这一部分参数W,b由最小化一个损失函数来获得,该损失函数表示原图减去平均脸的信息与由编码后重构的信息的距离的平方损失,该过程的损失函数表示为:
S22:第二组至第六组分别为幼年、少年、成年、中年、老年等5个年龄段下原图像的合成图像的表达,这一部分的编码过程与上述相似,不同的是输入是原图信息Xi,这一部分损失函数由每一组与库内同类同年龄组的原图的平方损失来表示,因此这里有5个不同的年龄合成的编码器,每一个编码器有不同的编码参数,因此损失函数为这5个编码器的生成的结果重构与原图的距离平方损失:
于是联合损失函数L=L1+L2,表示两个不同的编码过程中原特征与重构特征的损失,这一部分是表示对原图特征的共享;
S23:要抑制年龄对身份表达的影响,即对年龄合成很重要的那部分特征,应该削弱其在身份表达中的作用,用一个矩阵Φ来表示在编码过程中反映的原图特征的重要程度,可表示为其中令s(j)为Wj作用的特征,mkj=δ(s(j)-k)=1当且仅当s(j)=k,即,M为将编码参数映射为特征重要程度的矩阵;
表示身份表达过程中反映的特征重要性矩阵;表示年龄合成表现出来的特征重要性矩阵,然后对联合损失函数加入了一个约束:目的是减小身份表达和年龄表达之间的相关度;
S24:编码器的参数表示为θ={W,b},总损失函数L(θ)=L1+L2+L3通过最小化总损失函数来训练整个编码部分:W,b=arg min L(θ)对该式求解利用交替贪婪联合下降算法,先固定b,对W求梯度下降的最优解;再固定W,对b求梯度下降的最优解,直到迭代收敛。
步骤S3中,平行CNN的训练步骤如下:
用训练库中人脸图像,分别以多尺度矩形框截取人脸图像的多个部分的图像,成对作为CNN的输入进行预训练,平行CNN的结构有九个层次,是由随机梯度下降来训练,输入层需要一对图像作为输入,接下来的三个卷积层通过最大池层提取判别图像分层的功能,然后用一个非线性激活函数用于对输入进行卷积运算后的数据,在这用修正的线性函数Relu为激活函数,完全连接层通过学习一个语义空间,使同一个人的一对图像的相似性得分被放大,而来自不同的人的图像对的相似度减小,除了卷积特征从输入的人脸纹理中提取,归一化的坐标的68个地标相结合,作为一个132维向量,也被纳入学习的歧视性空间,最后一层是一个softmax层产生的相似性输入图像对的分数,在输入的图像对之间,输入端到完全连接层的参数共享。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (3)
1.一种基于深度学习的人脸识别和年龄合成联合模型的构建方法,其特征在于,包括以下步骤:
S1:对图像进行切片预处理:根据双眼中心进行对齐,采用PCA和LDA的方式进行降维,以及达到增大类间差距的目的;
S2:编码:通过训练数据得到的一个自动编码器对输入特征向量进行编码。该编码器的目的是将原图特征通过某种编码方式合成新的特征,用于表达身份或者年龄的相关信息,对任何输入的图片,该编码器将生成六组不同的表达:
第一组为身份表达,对原特征减去平均脸后的映射编码,反映个体的身份的稳定信息;
第二组至第六组分别为幼年、少年、成年、中年、老年五个年龄段下原图像的合成图像的表达,这一部分的编码过程与上述相似,不同的是输入是原图信息,这五组编码器的作用是模拟老化过程来合成特定年龄组的图片,
然后通过损失函数和一定的约束规则来控制消除年龄对身份表达的影响,即在年龄合成中起到重要作用的特征,降低它在身份表达中起的作用;
S3:对每对图像进行身份匹配验证:测试图像与一幅训练图像作为一对,由编码器得到的六对特征分别通过平行CNN,Softmax层将给出输入的一对特征的相似度的大小;
令Ia,Ib为一对输入图像,则相似得分表示为:
s(Ia,Ib)=soft max(Ws|o(Ia)-o(Ib)|+bs)
其中,o()表示CNN中全连接层的输出,Ws和bs为softmax层的参数;
对这六个结果进行加权平均即可得到验证结果,其中身份表达占的比重较大;五对年龄合成的相似度表示在五个年龄段里的相似度,作为参考因素,占的比重比身份表达要小,由此将得到两幅图像匹配的概率:
score=as1+(1-a)(s2+s3+s4+s5+s6);
S4:对所有特征得到的相似得分结果进行余弦相似度融合,即可得到最终的结果。
2.根据权利要求1所述的基于深度学习的人脸识别和年龄合成联合模型的构建方法,其特征在于,所述步骤S2中,使用的编码器由训练库中的数据训练得出,该编码器将生成6组不同的表达:
S21:第一组为身份表达,是对原特征减去平均脸后的映射编码,假设输入的第i个人的人脸图片表示为Xi训练库中所有人脸图像的均值为M,则Yi=Xi-M反映的是该脸的独特信息,然后对Yi进行编码:
假设编码由3层结构组成,每一层以上一层的输出作为输入,层数为j的输出表示为hj则编码过程可表示为hj=Wjσ(hj-1)+bj,第一层的输入为Yi,
则编码过程的映射表示为:
h=Wσ(Y+b)
同时,编码后的图像重构可表示为Y'=W'σ(h'+b')
这一部分参数W,b由最小化一个损失函数来获得,该损失函数表示原图减去平均脸的信息与由编码后重构的信息的距离的平方损失,该过程的损失函数表示为:
S22:第二组至第六组分别为幼年、少年、成年、中年、老年等5个年龄段下原图像的合成图像的表达,这一部分的编码过程与上述相似,不同的是输入是原图信息Xi,这一部分损失函数由每一组与库内同类同年龄组的原图的平方损失来表示,因此这里有5个不同的年龄合成的编码器,每一个编码器有不同的编码参数,因此损失函数为这5个编码器的生成的结果重构与原图的距离平方损失:
于是联合损失函数L=L1+L2,表示两个不同的编码过程中原特征与重构特征的损失,这一部分是表示对原图特征的共享;
S23:要抑制年龄对身份表达的影响,即对年龄合成很重要的那部分特征,应该削弱其在身份表达中的作用,用一个矩阵Φ来表示在编码过程中反映的原图特征的重要程度,可表示为其中令s(j)为Wj作用的特征,mkj=δ(s(j)-k)=1当且仅当s(j)=k,即,M为将编码参数映射为特征重要程度的矩阵;
表示身份表达过程中反映的特征重要性矩阵;表示年龄合成表现出来的特征重要性矩阵,然后对联合损失函数加入了一个约束:目的是减小身份表达和年龄表达之间的相关度;
S24:编码器的参数表示为θ={W,b},总损失函数L(θ)=L1+L2+L3通过最小化总损失函数来训练整个编码部分:W,b=argminL(θ)对该式求解利用交替贪婪联合下降算法,先固定b,对W求梯度下降的最优解;再固定W,对b求梯度下降的最优解,直到迭代收敛。
3.根据权利要求2所述的基于深度学习的人脸识别和年龄合成联合模型的构建方法,其特征在于,所述步骤S3中,平行CNN的训练步骤如下:
用训练库中人脸图像,分别以多尺度矩形框截取人脸图像的多个部分的图像,成对作为CNN的输入进行预训练,平行CNN的结构有九个层次,是由随机梯度下降来训练,输入层需要一对图像作为输入,接下来的三个卷积层通过最大池层提取判别图像分层的功能,然后用一个非线性激活函数用于对输入进行卷积运算后的数据,在这用修正的线性函数Relu为激活函数,完全连接层通过学习一个语义空间,使同一个人的一对图像的相似性得分被放大,而来自不同的人的图像对的相似度减小,除了卷积特征从输入的人脸纹理中提取,归一化的坐标的68个地标相结合,作为一个132维向量,也被纳入学习的歧视性空间,最后一层是一个softmax层产生的相似性输入图像对的分数,在输入的图像对之间,输入端到完全连接层的参数共享。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611155795.9A CN106650653B (zh) | 2016-12-14 | 2016-12-14 | 基于深度学习的人脸识别和年龄合成联合模型的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611155795.9A CN106650653B (zh) | 2016-12-14 | 2016-12-14 | 基于深度学习的人脸识别和年龄合成联合模型的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106650653A true CN106650653A (zh) | 2017-05-10 |
CN106650653B CN106650653B (zh) | 2020-09-15 |
Family
ID=58822094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611155795.9A Active CN106650653B (zh) | 2016-12-14 | 2016-12-14 | 基于深度学习的人脸识别和年龄合成联合模型的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106650653B (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194868A (zh) * | 2017-05-19 | 2017-09-22 | 成都通甲优博科技有限责任公司 | 一种人脸图像生成方法及装置 |
CN107578455A (zh) * | 2017-09-02 | 2018-01-12 | 西安电子科技大学 | 基于卷积神经网络的任意尺寸样本纹理合成方法 |
CN107578448A (zh) * | 2017-08-31 | 2018-01-12 | 广东工业大学 | 基于cnn的无标定曲面所包含拼接曲面个数识别方法 |
CN107679451A (zh) * | 2017-08-25 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 建立人脸识别模型的方法、装置、设备和计算机存储介质 |
CN107977629A (zh) * | 2017-12-04 | 2018-05-01 | 电子科技大学 | 一种基于特征分离对抗网络的人脸图像衰老合成方法 |
CN108090433A (zh) * | 2017-12-12 | 2018-05-29 | 厦门集微科技有限公司 | 人脸识别方法及装置、存储介质、处理器 |
CN108154131A (zh) * | 2018-01-02 | 2018-06-12 | 乌鲁木齐明华智能电子科技有限公司 | 身份证人脸识别比对的多重校验系统及方法 |
CN108596090A (zh) * | 2018-04-24 | 2018-09-28 | 北京达佳互联信息技术有限公司 | 人脸图像关键点检测方法、装置、计算机设备及存储介质 |
CN108960123A (zh) * | 2018-06-28 | 2018-12-07 | 南京信息工程大学 | 一种年龄估计方法 |
CN109034385A (zh) * | 2017-06-12 | 2018-12-18 | 辉达公司 | 用稀疏数据训练神经网络的系统和方法 |
CN109255289A (zh) * | 2018-07-27 | 2019-01-22 | 电子科技大学 | 一种基于统一式生成模型的跨衰老人脸识别方法 |
CN109636867A (zh) * | 2018-10-31 | 2019-04-16 | 百度在线网络技术(北京)有限公司 | 图像处理方法、装置及电子设备 |
CN109919052A (zh) * | 2019-02-22 | 2019-06-21 | 武汉捷丰天泽信息科技有限公司 | 刑侦模拟画像模型生成方法、刑侦模拟画像方法及装置 |
CN110135528A (zh) * | 2019-06-13 | 2019-08-16 | 上海鹰瞳医疗科技有限公司 | 年龄确定方法、眼部健康程度确定方法和装置 |
CN110197099A (zh) * | 2018-02-26 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 跨年龄人脸识别及其模型训练的方法和装置 |
CN110210515A (zh) * | 2019-04-25 | 2019-09-06 | 浙江大学 | 一种图像数据多标签分类方法 |
CN110598719A (zh) * | 2019-09-11 | 2019-12-20 | 南京师范大学 | 一种依据视觉属性描述自动生成人脸图像的方法 |
CN111052131A (zh) * | 2017-09-28 | 2020-04-21 | 松下知识产权经营株式会社 | 认证装置、认证系统、认证方法以及程序 |
CN111611877A (zh) * | 2020-04-30 | 2020-09-01 | 杭州电子科技大学 | 基于多时空信息融合的抗年龄干扰的人脸识别方法 |
CN111652049A (zh) * | 2020-04-17 | 2020-09-11 | 北京三快在线科技有限公司 | 人脸图像处理模型训练方法、装置、电子设备及存储介质 |
CN112149479A (zh) * | 2019-06-28 | 2020-12-29 | 西安光启未来技术研究院 | 人脸识别的方法、存储介质和电子装置 |
CN112651372A (zh) * | 2020-12-31 | 2021-04-13 | 北京眼神智能科技有限公司 | 基于人脸图像的年龄判断方法及装置、电子设备、存储介质 |
WO2021082087A1 (zh) * | 2019-10-30 | 2021-05-06 | 平安科技(深圳)有限公司 | 一种人脸识别方法、装置、存储介质和服务器 |
US11244226B2 (en) | 2017-06-12 | 2022-02-08 | Nvidia Corporation | Systems and methods for training neural networks with sparse data |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103824054A (zh) * | 2014-02-17 | 2014-05-28 | 北京旷视科技有限公司 | 一种基于级联深度神经网络的人脸属性识别方法 |
US20150006234A1 (en) * | 2013-07-01 | 2015-01-01 | International Business Machines Corporation | Process networking and resource optimization |
CN106022287A (zh) * | 2016-05-27 | 2016-10-12 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于深度学习与字典表示的跨年龄人脸验证方法 |
CN106203395A (zh) * | 2016-07-26 | 2016-12-07 | 厦门大学 | 基于多任务深度学习的人脸属性识别方法 |
-
2016
- 2016-12-14 CN CN201611155795.9A patent/CN106650653B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150006234A1 (en) * | 2013-07-01 | 2015-01-01 | International Business Machines Corporation | Process networking and resource optimization |
CN103824054A (zh) * | 2014-02-17 | 2014-05-28 | 北京旷视科技有限公司 | 一种基于级联深度神经网络的人脸属性识别方法 |
CN106022287A (zh) * | 2016-05-27 | 2016-10-12 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于深度学习与字典表示的跨年龄人脸验证方法 |
CN106203395A (zh) * | 2016-07-26 | 2016-12-07 | 厦门大学 | 基于多任务深度学习的人脸属性识别方法 |
Non-Patent Citations (3)
Title |
---|
GUOSHENG HU等: "When Face Recognition Meets with Deep Learning: An Evaluation of Convolutional Neural Networks for Face Recognition", 《2015 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION WORKSHOP (ICCVW) (2015)》 * |
LUOQI LIU等: "Deep Aging Face Verification With Large Gaps", 《IEEE TRANSACTIONS ON MULTIMEDIA》 * |
陈耀丹等: "基于卷积神经网络的人脸识别方法", 《东北师大学报(自然科学版)》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194868A (zh) * | 2017-05-19 | 2017-09-22 | 成都通甲优博科技有限责任公司 | 一种人脸图像生成方法及装置 |
US11244226B2 (en) | 2017-06-12 | 2022-02-08 | Nvidia Corporation | Systems and methods for training neural networks with sparse data |
CN109034385A (zh) * | 2017-06-12 | 2018-12-18 | 辉达公司 | 用稀疏数据训练神经网络的系统和方法 |
CN107679451A (zh) * | 2017-08-25 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 建立人脸识别模型的方法、装置、设备和计算机存储介质 |
CN107578448A (zh) * | 2017-08-31 | 2018-01-12 | 广东工业大学 | 基于cnn的无标定曲面所包含拼接曲面个数识别方法 |
CN107578455A (zh) * | 2017-09-02 | 2018-01-12 | 西安电子科技大学 | 基于卷积神经网络的任意尺寸样本纹理合成方法 |
CN107578455B (zh) * | 2017-09-02 | 2019-11-01 | 西安电子科技大学 | 基于卷积神经网络的任意尺寸样本纹理合成方法 |
CN111052131B (zh) * | 2017-09-28 | 2024-04-09 | 松下知识产权经营株式会社 | 认证装置、认证系统、认证方法以及存储介质 |
CN111052131A (zh) * | 2017-09-28 | 2020-04-21 | 松下知识产权经营株式会社 | 认证装置、认证系统、认证方法以及程序 |
CN107977629A (zh) * | 2017-12-04 | 2018-05-01 | 电子科技大学 | 一种基于特征分离对抗网络的人脸图像衰老合成方法 |
CN108090433A (zh) * | 2017-12-12 | 2018-05-29 | 厦门集微科技有限公司 | 人脸识别方法及装置、存储介质、处理器 |
CN108154131B (zh) * | 2018-01-02 | 2022-02-01 | 乌鲁木齐明华智能电子科技有限公司 | 身份证人脸识别比对的多重校验系统及方法 |
CN108154131A (zh) * | 2018-01-02 | 2018-06-12 | 乌鲁木齐明华智能电子科技有限公司 | 身份证人脸识别比对的多重校验系统及方法 |
CN110197099B (zh) * | 2018-02-26 | 2022-10-11 | 腾讯科技(深圳)有限公司 | 跨年龄人脸识别及其模型训练的方法和装置 |
CN110197099A (zh) * | 2018-02-26 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 跨年龄人脸识别及其模型训练的方法和装置 |
CN108596090A (zh) * | 2018-04-24 | 2018-09-28 | 北京达佳互联信息技术有限公司 | 人脸图像关键点检测方法、装置、计算机设备及存储介质 |
CN108960123A (zh) * | 2018-06-28 | 2018-12-07 | 南京信息工程大学 | 一种年龄估计方法 |
CN109255289A (zh) * | 2018-07-27 | 2019-01-22 | 电子科技大学 | 一种基于统一式生成模型的跨衰老人脸识别方法 |
CN109255289B (zh) * | 2018-07-27 | 2021-10-26 | 电子科技大学 | 一种基于统一式生成模型的跨衰老人脸识别方法 |
CN109636867A (zh) * | 2018-10-31 | 2019-04-16 | 百度在线网络技术(北京)有限公司 | 图像处理方法、装置及电子设备 |
CN109919052B (zh) * | 2019-02-22 | 2021-05-14 | 武汉捷丰天泽信息科技有限公司 | 刑侦模拟画像模型生成方法、刑侦模拟画像方法及装置 |
CN109919052A (zh) * | 2019-02-22 | 2019-06-21 | 武汉捷丰天泽信息科技有限公司 | 刑侦模拟画像模型生成方法、刑侦模拟画像方法及装置 |
CN110210515B (zh) * | 2019-04-25 | 2021-04-20 | 浙江大学 | 一种图像数据多标签分类方法 |
CN110210515A (zh) * | 2019-04-25 | 2019-09-06 | 浙江大学 | 一种图像数据多标签分类方法 |
CN110135528A (zh) * | 2019-06-13 | 2019-08-16 | 上海鹰瞳医疗科技有限公司 | 年龄确定方法、眼部健康程度确定方法和装置 |
CN112149479A (zh) * | 2019-06-28 | 2020-12-29 | 西安光启未来技术研究院 | 人脸识别的方法、存储介质和电子装置 |
CN110598719A (zh) * | 2019-09-11 | 2019-12-20 | 南京师范大学 | 一种依据视觉属性描述自动生成人脸图像的方法 |
WO2021082087A1 (zh) * | 2019-10-30 | 2021-05-06 | 平安科技(深圳)有限公司 | 一种人脸识别方法、装置、存储介质和服务器 |
CN111652049A (zh) * | 2020-04-17 | 2020-09-11 | 北京三快在线科技有限公司 | 人脸图像处理模型训练方法、装置、电子设备及存储介质 |
CN111611877A (zh) * | 2020-04-30 | 2020-09-01 | 杭州电子科技大学 | 基于多时空信息融合的抗年龄干扰的人脸识别方法 |
CN112651372A (zh) * | 2020-12-31 | 2021-04-13 | 北京眼神智能科技有限公司 | 基于人脸图像的年龄判断方法及装置、电子设备、存储介质 |
CN112651372B (zh) * | 2020-12-31 | 2024-08-02 | 北京眼神智能科技有限公司 | 基于人脸图像的年龄判断方法及装置、电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106650653B (zh) | 2020-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106650653A (zh) | 基于深度学习的人脸识别和年龄合成联合模型的构建方法 | |
CN104866829B (zh) | 一种基于特征学习的跨年龄人脸验证方法 | |
Liu et al. | Hard negative generation for identity-disentangled facial expression recognition | |
WO2022111236A1 (zh) | 一种结合注意力机制的面部表情识别方法及系统 | |
Gao et al. | Single sample face recognition via learning deep supervised autoencoders | |
CN110263912A (zh) | 一种基于多目标关联深度推理的图像问答方法 | |
CN106096535A (zh) | 一种基于双线性联合cnn的人脸验证方法 | |
CN107967458A (zh) | 一种人脸识别方法 | |
CN106951867A (zh) | 基于卷积神经网络的人脸识别方法、装置、系统及设备 | |
TWI719696B (zh) | 臉部影像重建方法與系統 | |
CN107977439A (zh) | 一种人脸图像库构建方法 | |
Kong et al. | Hierarchical attention and context modeling for group activity recognition | |
CN116403294B (zh) | 基于Transformer的多视图宽度学习活体检测方法、介质及设备 | |
Wu et al. | Occluded face recognition based on the deep learning | |
CN116386102A (zh) | 一种基于改进残差卷积网络inception块结构的人脸情绪识别方法 | |
Zou et al. | Application of facial symmetrical characteristic to transfer learning | |
CN105718898A (zh) | 基于稀疏无向概率图模型的人脸年龄估计方法、系统 | |
Li et al. | A multi-scale parallel convolutional neural network based intelligent human identification using face information | |
Liu et al. | 4D facial analysis: A survey of datasets, algorithms and applications | |
Kakani et al. | Segmentation-based ID preserving iris synthesis using generative adversarial networks | |
CN117115850A (zh) | 一种基于离线蒸馏的轻量级行人重识别方法 | |
Ye et al. | Swtface: a multi-branch network for masked face detection and recognition | |
CN113205044B (zh) | 一种基于表征对比预测学习的深度伪造视频检测方法 | |
Xu et al. | RETRACTED ARTICLE: Research on professional talent training technology based on multimedia remote image analysis | |
Gupta et al. | Survey paper on gender and emotion classification using facial expression detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |