CN111626115A - 一种人脸属性识别方法和装置 - Google Patents

一种人脸属性识别方法和装置 Download PDF

Info

Publication number
CN111626115A
CN111626115A CN202010313752.9A CN202010313752A CN111626115A CN 111626115 A CN111626115 A CN 111626115A CN 202010313752 A CN202010313752 A CN 202010313752A CN 111626115 A CN111626115 A CN 111626115A
Authority
CN
China
Prior art keywords
face attribute
face
data set
network model
attribute recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010313752.9A
Other languages
English (en)
Inventor
姚辉
芦燕云
陈晓华
孙广宇
索菲
梁华培
聂亚利
李欣
才智
章莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Zhongyunwei Technology Co ltd
Beijing Xicheng District Center School For Mental Retardation
Original Assignee
Chengdu Zhongyunwei Technology Co ltd
Beijing Xicheng District Center School For Mental Retardation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Zhongyunwei Technology Co ltd, Beijing Xicheng District Center School For Mental Retardation filed Critical Chengdu Zhongyunwei Technology Co ltd
Priority to CN202010313752.9A priority Critical patent/CN111626115A/zh
Publication of CN111626115A publication Critical patent/CN111626115A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种人脸属性识别方法和装置,其中,所述方法包括:生成包含人脸属性标签的人脸属性图像数据集;构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型;测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,获得第二人脸属性识别网络模型;将所述第二人脸属性识别网络模型嵌入,对采集的人脸数据进行人脸属性识别,基于构建的展示界面输出识别结果。采用本发明所述的方法,能够利用单网络模型同时识别出多个人脸属性,利用属性间潜在的关联关系,提升识别精度,并节省计算资源。

Description

一种人脸属性识别方法和装置
技术领域
本发明实施例涉及计算机视觉领域,具体涉及一种人脸属性识别方法和装置。另外,还涉及一种电子设备和存储介质。
背景技术
近年来,随着互联网信息时代的不断发展,以大数据和人工智能技术为核心的人脸识别技术开始在日常生活中被广泛应用。尤其是深度学习技术因其对复杂对象良好的刻画能力而在不断受到人们的关注,同时在工业界也逐渐被应用于各个方面。卷积神经网络(Convolutional Neural Network,CNN)是一种深度前馈人工神经网络,因为卷积神经网络避免了对图像的复杂前期处理,从而在图像识别领域得到了广泛的应用。计算机视觉是深度学习技术中最先取得突破性进展的领域,而人脸识别技术无疑是其发展的重点,其已经在公共治安、教育教学、刷脸支付等生活的方方面面有着广泛应用。然而,受复杂多变的面部表情、男女性别、不同年龄段以及多种多样的配饰等诸多因素影响,人脸属性识别目前仍然是一个难点问题。
人脸多属性识别是人脸认证、识别和搜索任务中的关键技术。目前,传统的基于深度学习的人脸属性识别算法在进行每一个人脸属性识别任务时,需采用各自独立的识别网络模型分别进行训练,计算难度高,资源消耗多,并且多个任务之间通常相对独立,难以协同,无法提升模型的泛化能力。而多任务学习即多个相关任务同时并行学习,多任务之间可共享底层特征,利用相关性互相促进学习,提升泛化效果。因此,如何设计实现基于单模型多任务的人脸属性识别方案成为当前迫切需要解决的问题。
发明内容
为此,本发明实施例提供一种人脸属性识别方法,以解决现有技术中存在的人脸属性识别方案计算难度高,资源消耗多,并且多个任务之间通常相对独立,无法提升模型的泛化能力的问题。
为了实现上述目的,本发明实施例提供如下技术方案:
本发明实施例提供的一种人脸属性识别方法,包括:生成包含人脸属性标签的人脸属性图像数据集;构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型;测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,获得第二人脸属性识别网络模型;将所述第二人脸属性识别网络模型嵌入,对采集的人脸数据进行人脸属性识别,基于构建的展示界面输出识别结果。
进一步的,所述生成包含人脸属性标签的人脸属性图像数据集,具体包括:处理面向人脸表情标签的人脸数据集,获得第一人脸数据集;处理面向人脸属性标签的人脸数据集,获得第二人脸数据集;利用所述第一人脸数据集和所述第二人脸数据集,生成针对人脸属性识别网络模型的人脸属性图像数据集。
进一步的,所述构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型,具体包括:将预设的Resnet18层残差网络结构作为基准网络,按照预设的构建方式在深度学习框架上预先构建基于多任务的人脸属性识别网络,并获得训练所述人脸属性识别网络需要的配置文件;将所述人脸属性图像数据集作为训练样本,训练在深度学习框架上预先构建好的所述人脸属性识别网络,获得第一人脸属性识别网络模型。
进一步的,所述测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,具体包括:测试所述第一人脸属性识别网络模型,获得测试结果;分析所述测试结果,对所述人脸属性图像数据集进行相应的调整;分析所述测试结果,对训练配置文件中的配置参数进行相应的调整,循环训练所述第一人脸属性识别网络模型并测试。
进一步的,所述处理面向人脸表情标签的人脸数据集,获得第一人脸数据集,具体包括:获得Fer2013数据集,对所述Fer2013数据集进行预处理,分别按照预设的人脸表情标签对所述人脸数据集中包含的人脸表情数据进行归类存放,获得第一人脸数据集。
进一步的,所述处理面向人脸属性标签的人脸数据集,获得第二人脸数据集,具体包括:获得CelebA数据集,对所述CelebA数据集进行预处理,分别按照预设的人脸属性标签对所述人脸数据集中包含的人脸表情数据进行归类存放,获得第二人脸数据集。
相应的,本发明实施例还提供一种人脸属性识别装置,包括:人脸属性图像数据集生成单元,生成包含人脸属性标签的人脸属性图像数据集;网络模型构建单元,用于构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型;网络模型测试及调整单元,用于测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,获得第二人脸属性识别网络模型;识别及展示单元,用于将所述第二人脸属性识别网络模型嵌入,对采集的人脸数据进行人脸属性识别,基于构建的展示界面输出识别结果。
进一步的,所述人脸属性图像数据集生成单元具体用于:处理面向人脸表情标签的人脸数据集,获得第一人脸数据集;处理面向人脸属性标签的人脸数据集,获得第二人脸数据集;利用所述第一人脸数据集和所述第二人脸数据集,生成针对人脸属性识别网络模型的人脸属性图像数据集。
进一步的,所述网络模型构建单元具体用于:将预设的Resnet18层残差网络结构作为基准网络,按照预设的构建方式在深度学习框架上预先构建基于多任务的人脸属性识别网络,并获得训练所述人脸属性识别网络需要的配置文件;将所述人脸属性图像数据集作为训练样本,训练在深度学习框架上预先构建好的所述人脸属性识别网络,获得第一人脸属性识别网络模型。
进一步的,所述网络模型测试及调整单元具体用于:测试所述第一人脸属性识别网络模型,获得测试结果;分析所述测试结果,对所述人脸属性图像数据集进行相应的调整;分析所述测试结果,对训练配置文件中的配置参数进行相应的调整,循环训练所述第一人脸属性识别网络模型并测试。
进一步的,所述处理面向人脸表情标签的人脸数据集,获得第一人脸数据集,具体包括:获得Fer2013数据集,对所述Fer2013数据集进行预处理,分别按照预设的人脸表情标签对所述人脸数据集中包含的人脸表情数据进行归类存放,获得第一人脸数据集。
进一步的,所述处理面向人脸属性标签的人脸数据集,获得第二人脸数据集,具体包括:获得CelebA数据集,对所述CelebA数据集进行预处理,分别按照预设的人脸属性标签对所述人脸数据集中包含的人脸表情数据进行归类存放,获得第二人脸数据集。
相应的,本申请还提供一种电子设备,包括:处理器和存储器;其中,所述存储器,用于存储人脸属性识别方法的程序,该电子设备通电并通过所述处理器运行该人脸属性识别方法的程序后,执行上述任意一项所述的人脸属性识别方法。
相应的,本申请还提供一种计算机可读存储介质,所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于被服务器执行如上任一项所述的人脸属性识别方法。
采用本发明所述的人脸属性识别方法,利用单网络模型同时识别出多个人脸属性,设计实现基于多任务的人脸多属性识别系统,不仅可以满足人脸多属性识别要求,还可以利用属性间潜在的关联关系,提升识别精度,并且,在计算资源有限的条件下可以大大节省计算力;所利用的人脸属性数据集来自两个公开人脸数据集;所利用的深度学习框架简单易懂,使用量巨大,维持庞大的开源网络模型库,方便知识共享;构建了展示界面,将人脸属性识别结果以更加直观的方式展示出来。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的实施附图。
图1为本发明实施例提供的一种人脸属性识别方法的流程图;
图2为本发明实施例提供的一种人脸属性识别装置的示意图;
图3为本发明实施例提供的一种电子设备的示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面根据本发明所述的人脸属性识别方法,对其实施例进行详细描述。如图1所示,其为本发明实施例提供的一种人脸属性识别方法的流程图,具体实现过程包括以下步骤:
步骤S101:生成包含人脸属性标签的人脸属性图像数据集。
在本发明实施例中,所述生成包含人脸属性标签的人脸属性图像数据集,具体实现过程可以包括:处理面向人脸表情标签的人脸数据集,获得第一人脸数据集;处理面向人脸属性标签的人脸数据集,获得第二人脸数据集;利用所述第一人脸数据集和所述第二人脸数据集,生成针对人脸属性识别网络模型的人脸属性图像数据集。
其中,所述处理面向人脸表情标签的人脸数据集,获得第一人脸数据集,具体包括:获得Fer2013数据集,对所述Fer2013数据集进行预处理,分别按照预设的人脸表情标签对所述人脸数据集中包含的人脸表情数据进行归类存放,获得第一人脸数据集。在具体实施过程中,可下载fer2013数据集,对数据集进行预处理,分别按照7种表情标签即高兴、生气、厌恶、伤心、中性、惊讶、恐惧来存放人脸表情数据。相应的,所述处理面向人脸属性标签的人脸数据集,获得第二人脸数据集,具体包括:获得CelebA数据集,对所述CelebA数据集进行预处理,分别按照预设的人脸属性标签对所述人脸数据集中包含的人脸表情数据进行归类存放,获得第二人脸数据集。在具体实施过程中,可下载CelebA数据集,对数据集进行预处理,分别按照4种人脸属性标签即性别、年龄、是否佩戴眼镜来存放人脸属性数据。
进一步的,可修改深度学习框架Caffe提供的create_imagenet.sh脚本文件并执行,将人脸图像数据转换成为预设的格式的数据集,通过修改将所有的图片随机打乱顺序并均处理成128*128尺寸的灰度图片。同时,利用Caffe提供的工具compute_image_mean来生成各个预设的格式(比如lmdb格式)数据集的均值文件,以便对处理的训练集进行减均值操作,提高相关计算的精准度和速度。
步骤S102:构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型。
上述步骤S101中生成包含人脸属性标签的人脸属性图像数据集之后,在本步骤中可所述人脸属性图像数据集作为训练样本训练构建的基于多任务的所述人脸属性识别网络模型。
在本发明实施例中,所述的构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型,具体实现过程可以包括:将预设的Resnet18层残差网络结构作为基准网络,按照预设的构建方式在深度学习框架上预先构建基于多任务的人脸属性识别网络,并获得训练所述人脸属性识别网络需要的配置文件。将所述人脸属性图像数据集作为训练样本,训练在深度学习框架上预先构建好的所述人脸属性识别网络,获得第一人脸属性识别网络模型。
在具体实施过程中,可将Resnet18作为基准网络,首先构建多维度数据层,将带有表情、性别、年龄、是否戴眼镜四个属性标签的数据集输入进预先构建好的所述人脸属性识别网络;然后在多维度数据层后面构建一个Concat层,对多维度数据层进行拼接,将拼接后的数据输入预先构建好的所述人脸属性识别网络(即Resnet18网络),网络配置参数在此不再详细展开赘述。
进一步的,可在Resnet18网络的最后一个池化层后构建一个Slice层对多维度数据进行切分,再分别连接各自的全连接层;在各自全连接层后面构建SoftMax层,用以输出最大概率的预测结果。然后,在深度学习框架Caffe框架上训练构建好的多任务人脸属性识别网络,将test_iter设置为4000次,将测试间隔设置为4000次,每100次迭代显示一次结果可以时刻关注网络训练的效果,迭代上限150000次,学习率设置为0.01,学习率变更策略为poly,采用GPU加速,训练时记录训练日志文件。
步骤S103:测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,获得第二人脸属性识别网络模型。
上述步骤S102中获得第一人脸属性识别网络模型之后,在本步骤中可进一步测试该第一人脸属性识别网络模型,并根据测试结果对配置参数进行调整。
在本发明实施例中,所述的测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,具体实现过程可以包括:测试所述第一人脸属性识别网络模型,获得测试结果;分析所述测试结果,对所述人脸属性图像数据集进行相应的调整;分析所述测试结果,对训练配置文件中的配置参数进行相应的调整,循环训练所述第一人脸属性识别网络模型并测试。
在具体实施过程中,通过测试所述第一人脸属性识别网络模型,可发现关于表情分类的准确率很低。通过分析原因可实现进一步的参数调整,比如:fer2013人脸表情数据库的标签有部分错误,或者说并不能很好地反映其图像内容;fer2013人脸表情数据库的肉眼准确率仅60%-70%。对此,可调整人脸属性数据集:经过分析和观察数据库,认为7种表情可以被划分为4种:恐惧、生气、厌恶、伤心都是消极情绪,可以被统一归类,因此,按照开心、惊讶、中性、消极重新分类表情数据库,重复上述步骤,调整网络训练参数,重新训练人脸属性识别网络模型。
步骤S104:将所述第二人脸属性识别网络模型嵌入,对采集的人脸数据进行人脸属性识别,基于构建的展示界面输出识别结果。
在上述步骤S103中获得第二人脸属性识别网络模型之后,在本步骤中可基于调整好的识别网络模型对采集的人脸数据进行人脸属性识别,输出识别结果。
在具体实施过程中,可利用Python编程,利用pyqt5中QLabel的基本窗口控件实现图片、图片路径、分类标签的显示,用QPushButton实现按钮,按钮功能为从文件夹中选择一张图片。代码主要由两个模块组成:人脸属性识别模块载入训练好的网络模型Caffemodel、测试用配置文件deploy.prototxt、标签文件来对图像进行属性识别,最终返回识别结果,即人脸属性信息;显示模块构建了一个展示窗口,通过按钮选择文件夹图片,将图片送入人脸属性识别模块,并将图片、图片路径、图片的属性信息显示出来。
采用本发明所述的人脸属性识别方法,利用单网络模型同时识别出多个人脸属性,设计实现基于多任务的人脸多属性识别系统,不仅可以满足人脸多属性识别要求,还可以利用属性间潜在的关联关系,提升识别精度,并且,在计算资源有限的条件下可以大大节省计算力;所利用的人脸属性数据集来自两个公开人脸数据集;所利用的深度学习框架简单易懂,使用量巨大,维持庞大的开源网络模型库,方便知识共享;构建了展示界面,将人脸属性识别结果以更加直观便捷的方式展示出来。
与上述提供的一种人脸属性识别方法相对应,本发明还提供一种人脸属性识别装置。由于该装置的实施例相似于上述方法实施例,所以描述的比较简单,相关之处请参见上述方法实施例部分的说明即可,下面描述一种人脸属性识别装置的实施例仅是示意性的。请参考图2所示,其为本发明实施例提供的一种人脸属性识别装置的示意图。
本发明所述的第一种人脸属性识别装置包括如下部分:
人脸属性图像数据集生成单元201,生成包含人脸属性标签的人脸属性图像数据集。
网络模型构建单元202,用于构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型。
网络模型测试及调整单元203,用于测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,获得第二人脸属性识别网络模型。
识别及展示单元204,用于将所述第二人脸属性识别网络模型嵌入,对采集的人脸数据进行人脸属性识别,基于构建的展示界面输出识别结果。
采用本发明所述的人脸属性识别装置,利用单网络模型同时识别出多个人脸属性,设计实现基于多任务的人脸多属性识别系统,不仅可以满足人脸多属性识别要求,还可以利用属性间潜在的关联关系,提升识别精度,并且,在计算资源有限的条件下可以大大节省计算力;所利用的人脸属性数据集来自两个公开人脸数据集;所利用的深度学习框架简单易懂,使用量巨大,维持庞大的开源网络模型库,方便知识共享;构建了展示界面,将人脸属性识别结果以更加直观便捷的方式展示出来。
与上述提供的人脸属性识别方法相对应,本发明还提供一种电子设备。由于该电子设备的实施例相似于上述方法实施例,所以描述的比较简单,相关之处请参见上述方法实施例部分的说明即可,下面描述的电子设备仅是示意性的。如图3所示,其为本发明实施例提供的一种电子设备的示意图。
该电子设备具体包括:处理器301和存储器302;其中,存储器302用于运行一个或多个程序指令,用于存储人脸属性识别方法的程序,该服务器通电并通过所述处理器301运行该人脸属性识别方法的程序后,执行上述任意一项所述的人脸属性识别方法。本发明所述的电子设备可以是指服务器。
与上述提供的一种人脸属性识别方法相对应,本发明还提供一种计算机存储介质。由于该计算机存储介质的实施例相似于上述方法实施例,所以描述的比较简单,相关之处请参见上述方法实施例部分的说明即可,下面描述的计算机存储介质仅是示意性的。
所述计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于被服务器执行上述所述的人脸属性识别方法。
在本发明实施例中,处理器或处理器模块可以是一种集成电路芯片,具有信号的处理能力。处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器读取存储介质中的信息,结合其硬件完成上述方法的步骤。
存储介质可以是存储器,例如可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
其中,非易失性存储器可以是只读存储器(Read-Only Memory,简称ROM)、可编程只读存储器(Programmable ROM,简称PROM)、可擦除可编程只读存储器(Erasable PROM,简称EPROM)、电可擦除可编程只读存储器(Electrically EPROM,简称EEPROM)或闪存。
易失性存储器可以是随机存取存储器(Random Access Memory,简称RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,简称SRAM)、动态随机存取存储器(Dynamic RAM,简称DRAM)、同步动态随机存取存储器(Synchronous DRAM,简称SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Rate SDRAM,简称DDRSDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM,简称ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,简称SLDRAM)和直接内存总线随机存取存储器(Direct Ram bus RAM,简称DRRAM)。
本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件与软件组合来实现。当应用软件时,可以将相应功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.一种人脸属性识别方法,其特征在于,包括:
生成包含人脸属性标签的人脸属性图像数据集;
构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型;
测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,获得第二人脸属性识别网络模型;
将所述第二人脸属性识别网络模型嵌入,对采集的人脸数据进行人脸属性识别,基于构建的展示界面输出识别结果。
2.根据权利要求1所述的人脸属性识别方法,其特征在于,所述生成包含人脸属性标签的人脸属性图像数据集,具体包括:
处理面向人脸表情标签的人脸数据集,获得第一人脸数据集;
处理面向人脸属性标签的人脸数据集,获得第二人脸数据集;
利用所述第一人脸数据集和所述第二人脸数据集,生成针对人脸属性识别网络模型的人脸属性图像数据集。
3.根据权利要求1所述的人脸属性识别方法,其特征在于,所述构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型,具体包括:
将预设的Resnet18层残差网络结构作为基准网络,按照预设的构建方式在深度学习框架上预先构建基于多任务的人脸属性识别网络,并获得训练所述人脸属性识别网络需要的配置文件;
将所述人脸属性图像数据集作为训练样本,训练在深度学习框架上预先构建好的所述人脸属性识别网络,获得第一人脸属性识别网络模型。
4.根据权利要求1所述的人脸属性识别方法,其特征在于,所述测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,具体包括:
测试所述第一人脸属性识别网络模型,获得测试结果;
分析所述测试结果,对所述人脸属性图像数据集进行相应的调整;
分析所述测试结果,对训练配置文件中的配置参数进行相应的调整,循环训练所述第一人脸属性识别网络模型并测试。
5.根据权利要求2所述的人脸属性识别方法,其特征在于,所述处理面向人脸表情标签的人脸数据集,获得第一人脸数据集,具体包括:获得Fer2013数据集,对所述Fer2013数据集进行预处理,分别按照预设的人脸表情标签对所述人脸数据集中包含的人脸表情数据进行归类存放,得到第一人脸数据集。
6.根据权利要求2所述的人脸属性识别方法,其特征在于,所述处理面向人脸属性标签的人脸数据集,获得第二人脸数据集,具体包括:获得CelebA数据集,对所述CelebA数据集进行预处理,分别按照预设的人脸属性标签对所述人脸数据集中包含的人脸表情数据进行归类存放,得到第二人脸数据集。
7.一种人脸属性识别装置,其特征在于,包括:
人脸属性图像数据集生成单元,生成包含人脸属性标签的人脸属性图像数据集;
网络模型构建单元,用于构建基于多任务的人脸属性识别网络模型,将所述人脸属性图像数据集作为训练样本训练所述人脸属性识别网络模型,获得第一人脸属性识别网络模型;
网络模型测试及调整单元,用于测试基于多任务的所述第一人脸属性识别网络模型,并根据测试结果对所述第一人脸属性识别网络模型的配置参数进行调整,获得第二人脸属性识别网络模型;
识别及展示单元,用于将所述第二人脸属性识别网络模型嵌入,对采集的人脸数据进行人脸属性识别,基于构建的展示界面输出识别结果。
8.根据权利要求7所述的人脸属性识别装置,其特征在于,所述人脸属性图像数据集生成单元具体用于:处理面向人脸表情标签的人脸数据集,获得第一人脸数据集;处理面向人脸属性标签的人脸数据集,获得第二人脸数据集;利用所述第一人脸数据集和所述第二人脸数据集,生成针对人脸属性识别网络模型的人脸属性图像数据集。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储人脸属性识别方法的程序,该电子设备通电并通过所述处理器运行该人脸属性识别方法的程序后,执行上述权利要求1-6任意一项所述的人脸属性识别方法。
10.一种计算机可读存储介质,其特征在于,该计算机存储介质中包含一个或多个程序指令,所述一个或多个程序指令用于被服务器执行如权利要求1-6任一项所述的人脸属性识别方法。
CN202010313752.9A 2020-04-20 2020-04-20 一种人脸属性识别方法和装置 Pending CN111626115A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010313752.9A CN111626115A (zh) 2020-04-20 2020-04-20 一种人脸属性识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010313752.9A CN111626115A (zh) 2020-04-20 2020-04-20 一种人脸属性识别方法和装置

Publications (1)

Publication Number Publication Date
CN111626115A true CN111626115A (zh) 2020-09-04

Family

ID=72259831

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010313752.9A Pending CN111626115A (zh) 2020-04-20 2020-04-20 一种人脸属性识别方法和装置

Country Status (1)

Country Link
CN (1) CN111626115A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203395A (zh) * 2016-07-26 2016-12-07 厦门大学 基于多任务深度学习的人脸属性识别方法
CN106529402A (zh) * 2016-09-27 2017-03-22 中国科学院自动化研究所 基于多任务学习的卷积神经网络的人脸属性分析方法
CN107247947A (zh) * 2017-07-07 2017-10-13 北京智慧眼科技股份有限公司 人脸属性识别方法及装置
CN108764207A (zh) * 2018-06-07 2018-11-06 厦门大学 一种基于多任务卷积神经网络的人脸表情识别方法
CN109886154A (zh) * 2019-01-30 2019-06-14 电子科技大学 基于Inception V3的多数据集联合训练的行人外观属性识别方法
CN110457984A (zh) * 2019-05-21 2019-11-15 电子科技大学 监控场景下基于ResNet-50的行人属性识别方法
WO2020001082A1 (zh) * 2018-06-30 2020-01-02 东南大学 一种基于迁移学习的人脸属性分析方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203395A (zh) * 2016-07-26 2016-12-07 厦门大学 基于多任务深度学习的人脸属性识别方法
CN106529402A (zh) * 2016-09-27 2017-03-22 中国科学院自动化研究所 基于多任务学习的卷积神经网络的人脸属性分析方法
CN107247947A (zh) * 2017-07-07 2017-10-13 北京智慧眼科技股份有限公司 人脸属性识别方法及装置
CN108764207A (zh) * 2018-06-07 2018-11-06 厦门大学 一种基于多任务卷积神经网络的人脸表情识别方法
WO2020001082A1 (zh) * 2018-06-30 2020-01-02 东南大学 一种基于迁移学习的人脸属性分析方法
CN109886154A (zh) * 2019-01-30 2019-06-14 电子科技大学 基于Inception V3的多数据集联合训练的行人外观属性识别方法
CN110457984A (zh) * 2019-05-21 2019-11-15 电子科技大学 监控场景下基于ResNet-50的行人属性识别方法

Similar Documents

Publication Publication Date Title
Hussain et al. A real time face emotion classification and recognition using deep learning model
CN111859960B (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
US9965717B2 (en) Learning image representation by distilling from multi-task networks
US20160364633A1 (en) Font recognition and font similarity learning using a deep neural network
CN110750523A (zh) 数据标注方法、系统、计算机设备和存储介质
CN111598153B (zh) 数据聚类的处理方法、装置、计算机设备和存储介质
CN115017288A (zh) 模型训练方法、模型训练装置、设备及存储介质
CN111950295A (zh) 一种训练自然语言处理模型的方法和系统
Puscasiu et al. Automated image captioning
Panicker et al. Image caption generator
WO2022222854A1 (zh) 一种数据处理方法及相关设备
Srinivas et al. A comprehensive survey of techniques, applications, and challenges in deep learning: A revolution in machine learning
CN116151233A (zh) 数据标注、生成方法、模型训练方法、设备和介质
Kaddoura A Primer on Generative Adversarial Networks
CN111445545B (zh) 一种文本转贴图方法、装置、存储介质及电子设备
CN116977714A (zh) 图像分类方法、装置、设备、存储介质和程序产品
CN117131272A (zh) 人工智能内容生成方法、模型及系统
CN116186312A (zh) 用于数据敏感信息发现模型的多模态数据增强方法
CN114519353B (zh) 模型的训练方法、情感消息生成方法和装置、设备、介质
CN111626115A (zh) 一种人脸属性识别方法和装置
US20230144138A1 (en) Machine learning algorithm search with symbolic programming
Islam A deep study of artificial intelligence: Machine learning in the browser using tensorflow
Jokela Person counter using real-time object detection and a small neural network
CN105808522A (zh) 一种语义联想的方法及装置
CN118097665B (zh) 基于多阶段序列的化学分子结构识别方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination