CN111814706A - 基于多任务卷积神经网络的人脸识别及属性分类方法 - Google Patents

基于多任务卷积神经网络的人脸识别及属性分类方法 Download PDF

Info

Publication number
CN111814706A
CN111814706A CN202010673471.4A CN202010673471A CN111814706A CN 111814706 A CN111814706 A CN 111814706A CN 202010673471 A CN202010673471 A CN 202010673471A CN 111814706 A CN111814706 A CN 111814706A
Authority
CN
China
Prior art keywords
face
attribute
features
model
attribute classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010673471.4A
Other languages
English (en)
Other versions
CN111814706B (zh
Inventor
段贵多
罗光春
张栗粽
田玲
龚力
宋雪宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202010673471.4A priority Critical patent/CN111814706B/zh
Publication of CN111814706A publication Critical patent/CN111814706A/zh
Application granted granted Critical
Publication of CN111814706B publication Critical patent/CN111814706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及计算机视觉技术,其公开了一种基于多任务卷积神经网络的人脸识别及属性分类方法,在人脸识别任务和属性分类任务上同时达到较高的精确度。该方法包括以下步骤:S1、对人脸图像样本进行预处理;S2、通过设计的多任务卷积神经网络模型对预处理后的人脸图像样本提取出属性特征和人脸全局特征;S3、基于注意力机制计算不同属性与人脸识别任务的相关度,并根据相关度将属性特征融合进人脸特征中;S4、多任务卷积神经网络模型同时进行人脸识别任务和属性分类任务,并通过计算损失来训练优化模型;S5、利用优化后的模型对输入的人脸图像同时进行属性分类和人脸识别任务。

Description

基于多任务卷积神经网络的人脸识别及属性分类方法
技术领域
本发明涉及计算机视觉技术,具体涉及一种基于多任务卷积神经网络的人脸识别及属性分类方法。
背景技术
人脸识别是一种基于计算机的生物特征识别技术,与指纹识别、虹膜识别、声纹识别等其它生物特征识别技术的共同特点是用来识别的特征都是唯、并且不容易发生变化,可保证信息的不易伪造和不易混淆。人脸识别具有贴近人脸的视觉感知且容易获取并可以进行事后的检索等特点,因此已经广泛应用在安防监控、网上支付、门禁考勤等各个领域。属性作为识别目标的中间层表示,它提供了介于低维特征和高维标签之间的一个抽象功能。当人脸因为不同角度光照等外在元素产生大幅度变化时,许多人脸属性却并没有受到影响,因此通过提取人脸属性中不容易变化的语义信息,能提升人脸识别的准确率,同时人脸特征中所包含的全局信息与身份信息,也能进一步提升属性识别的准确率。
深度神经网络在人脸识别任务和属性分类任务上都达到了极高的准确率,但却很难设计一个多任务网络同时进行这两个任务,这其中最大的难点就是如何将人脸特征与属性特征进行融合。目前基于深度学习的多任务融合方式主要有两种,分别为基于聚合的方法和基于子空间学习的方法。
基于聚合的方法是利用网络提取属性特征和身份鉴别特征,然后在特征层面上进行简单连接。该方法往往要限定聚合的特征具有相同的维度,再进行元素求平均或者相乘的操作,得到融合后的特征。基于子空间学习的方法是将这两种特征串联起来,再将串联后的特征映射到一个更适合的子空间,然后采用相关算法来学习映射的参数。神经网络中经常使用全连接层来进行映射,全连接的参数则由模型的损失通过梯度下降算法进行优化。
这两种方法将属性特征与人脸特征进行融合后直接进行人脸识别任务,都没考虑到人脸特征所包含的身份信息对属性分类任务的帮助。同时人脸的属性相差很大,从局部特征(比如:嘴巴大小)到整体特征(比如:性别)与人脸识别任务的相关性显然并不一致。这两种方法对各个属性以等权重的方式融合进人脸识别任务中,会加入不少与任务无关的噪音,让模型难以同时在多个任务上达到较高精确度。
发明内容
本发明所要解决的技术问题是:提出一种基于多任务卷积神经网络的人脸识别及属性分类方法,在人脸识别任务和属性分类任务上同时达到较高的精确度。
本发明解决上述技术问题采用的技术方案是:
基于多任务卷积神经网络的人脸识别及属性分类方法,包括以下步骤:
S1、对人脸图像样本进行预处理;
S2、通过设计的多任务卷积神经网络模型对预处理后的人脸图像样本提取出属性特征和人脸全局特征;
S3、基于注意力机制计算不同属性与人脸识别任务的相关度,并根据相关度将属性特征融合进人脸特征中;
S4、多任务卷积神经网络模型同时进行人脸识别任务和属性分类任务,并通过计算损失来训练优化模型;
S5、利用优化后的模型对输入的人脸图像同时进行属性分类和人脸识别任务。
作为进一步优化,步骤S1具体包括:
S11、获取人脸图像样本数据集;
S12、对人脸图像样本数据集中的人脸图像样本进行人脸属性和身份的标注;
S13、将标注后的人脸图像样本按照比例划分为训练数据集和验证数据集;
S14、对所有的人脸图像样本进行人脸检测和对齐,并设置统一大小。
作为进一步优化,步骤S2中,所述设计的多任务卷积神经网络模型包括基础特征提取层、与基础特征提取层的输出连接的多个属性分类子模型和一个人脸识别子模型、与各个属性分类子模型的输出连接的注意力结构,与所述注意力结构的输出和人脸识别子模型的输出均连接的全连接层。
作为进一步优化,步骤S2具体包括:
S21、对于输入的每一张人脸图像样本,通过模型的基础特征层提取到其基础特征;
S22、提取得到基础特征后,通过各个子模型学习相应的任务;
S23、通过计算感受野的方式得到不同尺度的人脸全局特征,并将这些特征通过串联方式嵌入到属性分类子模型中,为其提供额外的全局信息与身份信息;
S24、获得属性分类子模型输出的属性特征Ai和人脸识别子模型输出的人脸全局特征F。
作为进一步优化,步骤S3具体包括:
S31、初始化多任务卷积神经网络模型的模型参数Wi与全连接层FC;
S32、对获得的所有的属性特征Ai都进行映射和归一化操作:Vi=norm(Ai*Wi),并初始化属性特征Ai与人脸全局特征F的关系度bi=0;
S33、通过关系度bi计算属性特征与人脸全局特征的耦合系数:
Figure BDA0002583193370000021
并且计算加权融合后的属性特征S;其中,e为自然常数,m表示人脸身份的类别数量;
S34、融合属性特征与人脸特征:U=concatenate(S,F),并通过全连接映射变换得到包含属性特征中语义信息的人脸特征:FS=FC(U);
S35、对所有的属性特征,计算人脸特征与其相似度,并更新关系度,bi=bi+dot(Vi,FS),dot表示点乘操作;
S36、重复执行步骤S33-S35共n次,获得不同人脸属性对于人脸全局特征的权重和最终包含相关语义信息的人脸特征,其中n为模型总共进行的任务数。
作为进一步优化,步骤S4中,所述通过计算损失来训练优化模型,具体包括:
(1)采用交叉熵损失函数来计算属性分类任务的损失:
Figure BDA0002583193370000031
yj表示样本j在属性i上所属于标签,分别用0和1表示负类和正类,y′j则表示模型在该处预测为正类的可能性,范围在0-1之间,其值越大,可能性就越大;
通过对所有的属性分类任务的损失进行相加,获得人脸属性分类任务的总体损失:
Figure BDA0002583193370000032
其中,k为属性分类任务的数量;
(2)采用三元组损失函数计算人脸识别任务的损失,该函数通过同时最小化anchor和positive之间的距离并且最大化anchor和negative之间的距离来进行优化,公式为:
Figure BDA0002583193370000033
其中,α为一个超参数,取值0.2;
(3)多任务卷积神经网络模型最终的损失函数如下:
L=λ×LA+LF
λ是一个超参数,取值0.4;
(4)基于最终的损失函数采用梯度下降算法对模型进行优化。
本发明的有益效果是:
将具有不同感受野大小的人脸全局特征融合属性分类子模型中,通过为其提供人脸全局信息与身份信息来提高属性分类的准确率,在得到属性特征后,再通过一个注意力结构自适应计算不同属性与人脸识别任务的相关性来将更为有效的语义信息提供给人脸识别子模型;
基于此方案,本发明能很好的解决人脸识别模型与属性分类模型特征交互不够和不同属性与人脸识别任务的相关性不一致的问题。本发明提出的多任务模型不仅能同时输出人脸识别和属性分类结果,还充分利用它们之间的相关性,互相提升了其准确率。
附图说明
图1为本发明基于多任务卷积神经网络的人脸识别及属性分类算法流程图;
图2为本发明所设计的多任务卷积神经网络模型的结构图;
图3为模型中的注意力算法示意图。
具体实施方式
本发明旨在提出一种基于多任务卷积神经网络的人脸识别及属性分类方法,在人脸识别任务和属性分类任务上同时达到较高的精确度。其核心思想是:针对现有的相关多任务方法在人脸识别任务与属性分类任务上缺乏足够的交互,以及没考虑不同属性与人脸识别任务相关性不一致的问题,设计了一个新的多任务网络模型。该模型先将具有不同感受野大小的人脸全局特征融合属性分类子模型中,通过为其提供人脸全局信息与身份信息来提高属性分类的准确率,在得到属性特征后,在通过一个注意力结构自适应的计算不同属性与人脸识别任务的相关性来将更为有效的语义信息提供给人脸识别子模型,最后对模型进行联合训练。
实施例:
本实施例中基于设计的多任务卷积神经网络模型先提取输入人脸的基础特征,然后将人脸识别子模型所包含的全局信息与身份信息融入属性分类子模型中来帮助提升属性分类的效果,再得到人脸的属性特征后,再利用一个注意力结构自适应的计算不同属性与人脸识别任务的相关性并根据相关性来提取其语义信息,来进一步提升人脸识别的精确度。
其具体实施如图1所示,包括以下步骤:
S1、对人脸图像样本进行预处理:
本步骤中,对开源的CelebA人脸数据集进行预处理操作,该数据集包含10,177个名人身份的202,599张人脸图片,每张照片不仅有所属身份标签,还有40个属性类别标签,包括:
黑头发、秃顶、刘海、金发、灰发、棕发、发际线后移、直发、戴帽子、卷发、弓眉、眼袋、浓眉、眼镜、窄眼、尖鼻、大鼻子、微笑、大嘴唇、嘴巴微张、胡茬、鬓角、双下巴、山羊胡子、小胡子、没有胡子、涂口红、高颧骨、粉脸颊、戴耳环、戴项链、打领带、有吸引力、模糊的、胖、浓妆、男性、鹅蛋脸、皮肤苍白、年轻。
具体预处理步骤为:
S11、选取属性标签:
上述40个属性标签中,部分属性标签较为稳定,短时间内不容易发生变化,比如性别、年轻等标签,其它标签则很容易在人脸的不同状态下发生变化,比如眼镜、微笑等。为了避免较易发生变化的人脸标签对人脸识别任务造成负面影响,我们只选取了部分不易发生变化的14个人脸属性进行属性分类任务,这些属性包括秃顶、发际线后移、弓眉、眼袋、浓眉、窄眼、高颧骨、尖鼻、大鼻子、大嘴唇、胖、男性、鹅蛋脸、年轻。
S12、属性和身份标签的标注:
属性分类结果均为二分类,我们分别用1和0表示属性的标签。1表示人脸图片包括该人脸属性,0表示不包括,比如:在男性标签中,1表示该样本为男性,0则表示为女性。人脸身份标签为1到10177之间的一个数字,两张人脸身份标签为同一个数字即表示他们属于同一个身份,若他们身份标签数字不同则表示他们不属于同一个身份。
S13、划分数据集:
通过随机分配的方法,将数据中的162080张人脸图片划分为训练集,将剩下的40519张图片划分为测试集。训练集中的数据将用于对模型进行训练,测试集中的数据将用于对训练的模型的性能进行评估。
S14、人脸检测和对齐:
用训练好的MTCNN算法对数据集的人脸照片进行人脸检测操作,来扩大人脸在整个图像中的占比,并利用算法检测出来的人脸五点坐标,对人脸进行一个对齐操作,再将得到的人脸图片大小设为224x224。
S2、通过设计的多任务卷积神经网络模型对预处理后的人脸图像样本提取出属性特征和人脸全局特征:
本步骤中,所述设计的多任务卷积神经网络模型如图2所示,其包括基础特征提取层、与基础特征提取层的输出连接的14个属性分类子模型和一个人脸识别子模型、与各个属性分类子模型的输出连接的注意力结构,与所述注意力结构的输出和人脸识别子模型的输出均连接的全连接层。整个网络的具体构成如下表所示:
Figure BDA0002583193370000051
Figure BDA0002583193370000061
表中conv表示卷积层,max表示最大池化层,avg表示平均池化层,fc表示全连接层。
通过向上述模型输入人脸图片Xi输入模型,输出人脸全局特征与最终的人脸属性特征。
具体子流程如下:
S21、基础特征提取:
将经过处理后的大小为224x224的人脸图片输入模型,并经过模型的基础特征提取层得到其初步特征,基础特征提取层包括:一层大小为7x7,深度为64,步长为2的卷积层;一层大小为3x3,步长为2的最大池化层;4层大小为3x3,深度为64,步长为2的卷积层;一层大小为2x2,步长为2的最大池化层。人脸识别子模型与属性分类子模型共享基础特征提取层的参数,输出的特征大小为56x56,深度为64。
S22、子模型学习特定任务:
模型在提取到图片基础特征后,为避免不同任务互相干扰,模型进行了分支,分为不同的子模型,每个子模型都学习特定的任务。我们这里定义了14个属性分类任务和一个人脸识别任务,所以这里分支后有了15个子模型,其中14个属性分类子模型的网络具体结构与大小一致,但不共享参数。
S23、获取人脸特征,嵌入属性分类子模型:
人脸识别子模型经过连续8层大小为3x3,深度为128,步长为2的卷积层conv_1和大小为2x2,步长为2的最大池化层max_1,得到大小为28x28,深度为128的人脸全局特征。
属性分类子模型经过连续4层大小为3x3,深度为128,步长为2的卷积层conv_1和大小为2x2,步长为2的最大池化层max_1,得到大小为28x28,深度为128的人脸属性特征。为了在属性分类任务中加入人脸全局信息与身份信息,我们将得到的人脸全局特征通过串联的方式嵌入属性分类子模型中,最终得到的属性特征大小为28x28,深度为256。
后面的con_2和max_2与前面的计算方式基本一致,人脸识别子模型经过max_2后得到的人脸全局特征,通过串联的方式嵌入属性分类子模型中,提取到的人脸全局特征大小为14x14,深度为512,属性特征大小为14x14,深度为1024。
随后人脸识别子模型与属性分类子模型经过conv_3后得到大小都为7x7,深度为512的人脸全局特征与属性特征,再经过一个全局平均池化层avg得到大小为512的一维人脸全局特征与属性特征。再通过大小为1000的全连接层分别对人脸全局特征与属性特征进行映射后,得到大小为1000的人脸全局特征和大小为1000的属性特征。这里的属性特征再经过一个大小为1的全连接层和sigmoid激活层后,即输出属性分类的结果。
S3、基于注意力机制计算不同属性与人脸识别任务的相关度,并根据相关度将属性特征融合进人脸特征中:
本步骤中,为了从人脸属性特征中提取到与人脸识别任务更为相关的语义信息,我们设计了一个注意力算法来计算不同属性与人脸识别任务的相关度,并根据相关度将属性特征融合进人脸特征中去,如图3所示。具体的子流程如下:
S31、获得上一步模型输出的属性特征Ai和人脸特征F,并初始化模型参数Wi与全连接层FC;
S32、对所有的14个属性特征都进行映射和归一化操作,Vi=norm(Ai*Wi)并初始化属性特征与人脸特征的关系度bi=0;
S33、通过关系度bi计算属性与人脸特征的耦合系数Ci=softmax(bi),并且计算加权融合后的属性特征S,softmax具体计算公式如下,e为自然常数,m表示人脸身份的类别数量。
Figure BDA0002583193370000071
S34、融合属性特征与人脸特征,U=concatenate(S,F),并通过全连接映射变换得到包含属性特征中语义信息的人脸特征,FS=FC(U);
S35、对所有的属性特征,计算人脸特征与其相似度,并更新关系度,bi=bi+dot(Vi,FS),dot表示点乘操作;
S36、将步骤S33到步骤S35重复执行n次,获得不同人脸属性对于人脸全局特征的权重和最终包含更相关的语义信息的人脸特征。
S4、多任务卷积神经网络模型同时进行人脸识别任务和属性分类任务,并通过计算损失来训练优化模型:
本步骤中,模型提取到人脸相应的属性特征与人脸特征后,就开始计算任务损失,并基于损失利用梯度下降算法对模型进行优化。
S41、属性分类任务的损失我们采用交叉熵损失函数来实现,具体公式如下:
Figure BDA0002583193370000072
yj表示样本j在属性i上所属于标签,分别用0和1表示负类和正类。y′j则表示模型在该处预测为正类的可能性,范围在0-1之间,其值越大,可能性就越大。交叉熵能衡量同一个随机变量中不同概率分布的差异程度,从式中可以看出,模型预测的概率值与标签差的越多交叉熵越大,反之则越小,所以我们用交叉熵来计算属性分类任务的损失函数。当分别计算出14个人脸属性的分类损失后,对它们进行相加,就得到人脸属性分类任务的总体损失。
Figure BDA0002583193370000081
S42、计算人脸识别任务的损失:
我们首先选取一张目标样本anchor,再选取一张与anchor属于同一类的样本positive和一张与anchor属于不同类的样本negative。当anchor与positive(正样本)的距离要小于anchor与negative之间的距离时,模型就能达到区分不同人脸的功能,为了加强模型的泛化能力,我们不仅要求anchor与negative(负样本)距离大于anchor与positive的距离,并且这个距离还要大于一个超参数α,该值我们取0.2大小时达到最好效果,公式如下:
Figure BDA0002583193370000082
最终的人脸识别损失函数我们采用Tripletloss来实现,该loss通过同时最小化anchor和positive之间的距离并且最大化anchor和negative之间的距离来进行优化,具体计算公式如下:
Figure BDA0002583193370000083
anchor样本我们进行随机选择,positive样本选择与anchor距离最远的同一类样本,negative选择与anchor最近的不同类样本,但若在整个训练集里选择最近的不同类样本的话,计算量比较大,同时模型可能因为数据存在的噪音而无法收敛,所以我们只选择在一个batch里最近的不同类样本。计算anchor样本和negative样本以及positive样本距离时,若在每次模型更新参数后就进行距离计算,会极大的增加模型训练时间,若只在开始进行距离计算的话,计算出的距离随着模型参数更新又会产生变化。因此我们选取了一个折衷的训练方法,每当整个训练数据集都进行训练后,重新计算一次样本之间的距离。
S43、人脸识别及属性分类多任务模型最终的损失函数如下:
L=λ×LA+LF
λ是一个超参数,经实验设为0.4时有较好效果,训练时网络的batch-size设为64,初始学习率设为0.001,采用Adam优化对网络进行优化。
S5、利用优化后的模型对输入的人脸图像同时进行属性分类和人脸识别任务:
模型训练完成后,我们能随意输入一张人脸图片并同时进行属性分类和人脸识别操作,具体子流程如下:
S51、对待识别的图片进行人脸检测和对齐操作,并将处理后的图片大小全都归一化为224x224;
S52、加载训练完成后的网络模型参数;
S53、将人脸图片输入多任务模型,并得到属性分类结果与最终的人脸特征。属性分类结果若大于0.5,则表示模型对该属性的预测结果为正类,若小于等于0.5,则表示模型对于该属性预测结果为负类。进行人脸识别操作时,我们需要先定义一个人脸库,并将人脸库中的所有人脸照片都通过模型提取到相应的人脸特征后,再将待识别人脸对应的人脸特征与人脸库中的特征进行距离计算,当它们之间的距离小于一个阈值时,我们就可以判断这两张人脸为同一个身份,否则,则判断为陌生人脸。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.基于多任务卷积神经网络的人脸识别及属性分类方法,其特征在于,包括以下步骤:
S1、对人脸图像样本进行预处理;
S2、通过设计的多任务卷积神经网络模型对预处理后的人脸图像样本提取出属性特征和人脸全局特征;
S3、基于注意力机制计算不同属性与人脸识别任务的相关度,并根据相关度将属性特征融合进人脸特征中;
S4、多任务卷积神经网络模型同时进行人脸识别任务和属性分类任务,并通过计算损失来训练优化模型;
S5、利用优化后的模型对输入的人脸图像同时进行属性分类和人脸识别任务。
2.如权利要求1所述的基于多任务卷积神经网络的人脸识别及属性分类方法,
其特征在于,步骤S1具体包括:
S11、获取人脸图像样本数据集;
S12、对人脸图像样本数据集中的人脸图像样本进行人脸属性和身份的标注;
S13、将标注后的人脸图像样本按照比例划分为训练数据集和验证数据集;
S14、对所有的人脸图像样本进行人脸检测和对齐,并设置统一大小。
3.如权利要求1所述的基于多任务卷积神经网络的人脸识别及属性分类方法,
其特征在于,步骤S2中,所述设计的多任务卷积神经网络模型包括基础特征提取层、与基础特征提取层的输出连接的多个属性分类子模型和一个人脸识别子模型、与各个属性分类子模型的输出连接的注意力结构,与所述注意力结构的输出和人脸识别子模型的输出均连接的全连接层。
4.如权利要求3所述的基于多任务卷积神经网络的人脸识别及属性分类方法,
其特征在于,步骤S2具体包括:
S21、对于输入的每一张人脸图像样本,通过模型的基础特征层提取到其基础特征;
S22、提取得到基础特征后,通过各个子模型学习相应的任务;
S23、通过计算感受野的方式得到不同尺度的人脸全局特征,并将这些特征通过串联方式嵌入到属性分类子模型中,为其提供额外的全局信息与身份信息;
S24、获得属性分类子模型输出的属性特征Ai和人脸识别子模型输出的人脸全局特征F。
5.如权利要求1所述的基于多任务卷积神经网络的人脸识别及属性分类方法,
其特征在于,步骤S3具体包括:
S31、初始化多任务卷积神经网络模型的模型参数Wi与全连接层FC;
S32、对获得的所有的属性特征Ai都进行映射和归一化操作:Vi=norm(Ai*Wi),并初始化属性特征Ai与人脸全局特征F的关系度bi=0;
S33、通过关系度bi计算属性特征与人脸全局特征的耦合系数:
Figure FDA0002583193360000021
并且计算加权融合后的属性特征S;其中,e为自然常数,m表示人脸身份的类别数量;
S34、融合属性特征与人脸特征:U=concatenate(S,F),并通过全连接映射变换得到包含属性特征中语义信息的人脸特征:FS=FC(U);
S35、对所有的属性特征,计算人脸特征与其相似度,并更新关系度,bi=bi+dot(Vi,FS),dot表示点乘操作;
S36、重复执行步骤S33-S35共n次,获得不同人脸属性对于人脸全局特征的权重和最终包含相关语义信息的人脸特征,其中n为模型总共进行的任务数。
6.如权利要求1所述的基于多任务卷积神经网络的人脸识别及属性分类方法,
其特征在于,步骤S4中,所述通过计算损失来训练优化模型,具体包括:
(1)采用交叉熵损失函数来计算属性分类任务的损失:
Figure FDA0002583193360000022
yj表示样本j在属性i上所属于标签,分别用0和1表示负类和正类,y′j则表示模型在该处预测为正类的可能性,范围在0-1之间,其值越大,可能性就越大;
通过对所有的属性分类任务的损失进行相加,获得人脸属性分类任务的总体损失:
Figure FDA0002583193360000023
其中,k为属性分类任务的数量;
(2)采用三元组损失函数计算人脸识别任务的损失,该函数通过同时最小化anchor和positive之间的距离并且最大化anchor和negative之间的距离来进行优化,公式为:
Figure FDA0002583193360000024
其中,α为一个超参数,取值0.2;
(3)多任务卷积神经网络模型最终的损失函数如下:
L=λ×LA+LF
λ是一个超参数,取值0.4;
(4)基于最终的损失函数采用梯度下降算法对模型进行优化。
CN202010673471.4A 2020-07-14 2020-07-14 基于多任务卷积神经网络的人脸识别及属性分类方法 Active CN111814706B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010673471.4A CN111814706B (zh) 2020-07-14 2020-07-14 基于多任务卷积神经网络的人脸识别及属性分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010673471.4A CN111814706B (zh) 2020-07-14 2020-07-14 基于多任务卷积神经网络的人脸识别及属性分类方法

Publications (2)

Publication Number Publication Date
CN111814706A true CN111814706A (zh) 2020-10-23
CN111814706B CN111814706B (zh) 2022-06-24

Family

ID=72842830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010673471.4A Active CN111814706B (zh) 2020-07-14 2020-07-14 基于多任务卷积神经网络的人脸识别及属性分类方法

Country Status (1)

Country Link
CN (1) CN111814706B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112507995A (zh) * 2021-02-05 2021-03-16 成都东方天呈智能科技有限公司 一种跨模型人脸特征向量的转换系统及方法
CN112733720A (zh) * 2021-01-12 2021-04-30 上海理工大学 一种基于烟花算法改进卷积神经网络的脸部识别方法
CN112801015A (zh) * 2021-02-08 2021-05-14 华南理工大学 一种基于注意力机制的多模态人脸识别方法
CN113029327A (zh) * 2021-03-02 2021-06-25 招商局重庆公路工程检测中心有限公司 基于度量注意力卷积神经网络的隧道风机预埋基础损伤识别方法
CN113378855A (zh) * 2021-06-22 2021-09-10 北京百度网讯科技有限公司 用于处理多任务的方法、相关装置及计算机程序产品
CN113537027A (zh) * 2021-07-09 2021-10-22 中国科学院计算技术研究所 基于面部划分的人脸深度伪造检测方法及系统
CN113850243A (zh) * 2021-11-29 2021-12-28 北京的卢深视科技有限公司 模型训练、人脸识别方法、电子设备及存储介质
CN114360009A (zh) * 2021-12-23 2022-04-15 电子科技大学长三角研究院(湖州) 一种复杂场景下的多尺度特征人脸属性识别系统及其方法
WO2022252635A1 (zh) * 2021-06-01 2022-12-08 平安科技(深圳)有限公司 多任务融合的人脸定位方法、装置、设备及存储介质
WO2023009054A1 (zh) * 2021-07-29 2023-02-02 脸萌有限公司 用于对象属性分类模型训练的方法、设备和存储介质
CN115794357A (zh) * 2023-01-16 2023-03-14 山西清众科技股份有限公司 一种自动搭建多任务网络的装置及方法
CN116563909A (zh) * 2023-03-15 2023-08-08 包头市易慧信息科技有限公司 基于融合注意力机制的视觉语义交互模块的人脸识别方法
CN116704248A (zh) * 2023-06-07 2023-09-05 南京大学 一种基于多语义不平衡学习的血清样本图像分类方法
WO2024179574A1 (zh) * 2023-03-02 2024-09-06 北京字跳网络技术有限公司 样本数据类别的识别方法、识别模型及其训练方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170147905A1 (en) * 2015-11-25 2017-05-25 Baidu Usa Llc Systems and methods for end-to-end object detection
CN109508654A (zh) * 2018-10-26 2019-03-22 中国地质大学(武汉) 融合多任务和多尺度卷积神经网络的人脸分析方法及系统
WO2019183758A1 (en) * 2018-03-26 2019-10-03 Intel Corporation Methods and apparatus for multi-task recognition using neural networks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170147905A1 (en) * 2015-11-25 2017-05-25 Baidu Usa Llc Systems and methods for end-to-end object detection
WO2019183758A1 (en) * 2018-03-26 2019-10-03 Intel Corporation Methods and apparatus for multi-task recognition using neural networks
CN109508654A (zh) * 2018-10-26 2019-03-22 中国地质大学(武汉) 融合多任务和多尺度卷积神经网络的人脸分析方法及系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
KAIPENG ZHANG等: "Joint Face Detection and Alignment Using Multitask Cascaded Convolutional Networks", 《IEEE SIGNAL PROCESSING LETTERS》, 26 August 2016 (2016-08-26), pages 1499 *
QIANGCHANG WANG等: "LS-CNN: Characterizing Local Patches at Multiple Scales for Face Recognition", 《IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY》, 11 October 2019 (2019-10-11), pages 1640, XP011768202, DOI: 10.1109/TIFS.2019.2946938 *
刘薇: "基于卷积神经网络的人脸属性识别研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 January 2020 (2020-01-15), pages 138 - 2066 *
董德轩: "基于深度学习的人脸检测算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 March 2018 (2018-03-15), pages 138 - 1303 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733720A (zh) * 2021-01-12 2021-04-30 上海理工大学 一种基于烟花算法改进卷积神经网络的脸部识别方法
CN112507995A (zh) * 2021-02-05 2021-03-16 成都东方天呈智能科技有限公司 一种跨模型人脸特征向量的转换系统及方法
CN112801015A (zh) * 2021-02-08 2021-05-14 华南理工大学 一种基于注意力机制的多模态人脸识别方法
CN113029327A (zh) * 2021-03-02 2021-06-25 招商局重庆公路工程检测中心有限公司 基于度量注意力卷积神经网络的隧道风机预埋基础损伤识别方法
WO2022252635A1 (zh) * 2021-06-01 2022-12-08 平安科技(深圳)有限公司 多任务融合的人脸定位方法、装置、设备及存储介质
CN113378855A (zh) * 2021-06-22 2021-09-10 北京百度网讯科技有限公司 用于处理多任务的方法、相关装置及计算机程序产品
CN113537027A (zh) * 2021-07-09 2021-10-22 中国科学院计算技术研究所 基于面部划分的人脸深度伪造检测方法及系统
CN113537027B (zh) * 2021-07-09 2023-09-01 中国科学院计算技术研究所 基于面部划分的人脸深度伪造检测方法及系统
WO2023009054A1 (zh) * 2021-07-29 2023-02-02 脸萌有限公司 用于对象属性分类模型训练的方法、设备和存储介质
CN113850243A (zh) * 2021-11-29 2021-12-28 北京的卢深视科技有限公司 模型训练、人脸识别方法、电子设备及存储介质
CN114360009A (zh) * 2021-12-23 2022-04-15 电子科技大学长三角研究院(湖州) 一种复杂场景下的多尺度特征人脸属性识别系统及其方法
CN114360009B (zh) * 2021-12-23 2023-07-18 电子科技大学长三角研究院(湖州) 一种复杂场景下的多尺度特征人脸属性识别系统及其方法
CN115794357A (zh) * 2023-01-16 2023-03-14 山西清众科技股份有限公司 一种自动搭建多任务网络的装置及方法
WO2024179574A1 (zh) * 2023-03-02 2024-09-06 北京字跳网络技术有限公司 样本数据类别的识别方法、识别模型及其训练方法
CN116563909A (zh) * 2023-03-15 2023-08-08 包头市易慧信息科技有限公司 基于融合注意力机制的视觉语义交互模块的人脸识别方法
CN116563909B (zh) * 2023-03-15 2024-07-26 包头市易慧信息科技有限公司 基于融合注意力机制的视觉语义交互模块的人脸识别方法
CN116704248A (zh) * 2023-06-07 2023-09-05 南京大学 一种基于多语义不平衡学习的血清样本图像分类方法

Also Published As

Publication number Publication date
CN111814706B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
CN111814706B (zh) 基于多任务卷积神经网络的人脸识别及属性分类方法
Fan et al. Label distribution-based facial attractiveness computation by deep residual learning
Agarwal et al. Face recognition using eigen faces and artificial neural network
CN112784763B (zh) 基于局部与整体特征自适应融合的表情识别方法及系统
Agarwal et al. Face recognition using principle component analysis, eigenface and neural network
WO2020114118A1 (zh) 面部属性识别方法、装置、存储介质及处理器
CN107145857A (zh) 人脸属性识别方法、装置和模型建立方法
WO2014078432A2 (en) Devices, systems, and methods for visual-attribute refinement
Shu et al. Age progression: Current technologies and applications
CN110134803A (zh) 基于哈希学习的图像数据快速检索方法
CN115995121A (zh) 一种基于attention模块的多模态的生物识别方法
CN117935339A (zh) 一种基于多模态融合的微表情识别方法
Yue et al. Multi-task adversarial autoencoder network for face alignment in the wild
CN106709442A (zh) 一种人脸识别方法
CN116311472A (zh) 基于多层次图卷积网络的微表情识别方法及装置
Hegde et al. Face and Emotion Recognition in Real Time using Machine Learning
Said et al. Face Recognition System
Grd et al. Transfer Learning with EfficientNetV2S for Automatic Face Shape Classification.
CN116438586A (zh) 行人属性识别系统及其训练方法、行人属性识别方法
Abdulabas et al. Face information forensics analysis based on facial aging: A Survey
Li et al. Recognition algorithm of athletes' partially occluded face based on a deep learning algorithm
Ibrahem et al. Age face invariant recognition model based on VGG face based DNN and support vector classifier
Ding Combining 2D facial texture and 3D face morphology for estimating people's soft biometrics and recognizing facial expressions
Alzahrani Artificial Intelligence Applied to Facial Image Analysis and Feature Measurement
CN113221799B (zh) 一种多头部姿态人脸表情识别方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant