CN113128467B - 基于面部先验知识的低分辨率人脸超分辨与识别的方法 - Google Patents
基于面部先验知识的低分辨率人脸超分辨与识别的方法 Download PDFInfo
- Publication number
- CN113128467B CN113128467B CN202110510886.4A CN202110510886A CN113128467B CN 113128467 B CN113128467 B CN 113128467B CN 202110510886 A CN202110510886 A CN 202110510886A CN 113128467 B CN113128467 B CN 113128467B
- Authority
- CN
- China
- Prior art keywords
- resolution
- face
- super
- low
- mapping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000013507 mapping Methods 0.000 claims abstract description 44
- 239000011159 matrix material Substances 0.000 claims abstract description 28
- 238000010276 construction Methods 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims abstract description 7
- 238000011156 evaluation Methods 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 9
- 230000001815 facial effect Effects 0.000 claims description 6
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 210000000887 face Anatomy 0.000 description 4
- 240000004760 Pimpinella anisum Species 0.000 description 2
- 210000004709 eyebrow Anatomy 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000000256 facial nerve Anatomy 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
Description
技术领域
本发明涉及模式识别技术领域,具体而言,特别涉及一种基于面部先验知识的低分辨率人脸超分辨与识别的方法。
背景技术
目前,人脸识别技术已经相对成熟且应用研究十分广泛,普及到了现代社会生活的方方面面。但是,很多人脸识别系统是在人脸对象属于高质量图像的前提下工作,因此当现实世界由于各种原因导致人脸属于低分边图像时,如监控设备、距离等等,往往该系统表现出较差的性能,甚至不能识别。人脸超分辨技术,可以实现增强低分辨率人脸图像的分辨率,以产生相应的高分辨率人脸图像。因此,实现将人脸超分辨与人脸识别任务联结,可以直接提高人脸识别系统的鲁棒性,也可以用于寻找犯罪分子等其他人脸相关任务。
针对解决当高质量的图像库可用于识别低分辨率探头人脸图像的问题,现有的标准方法主要有三种:1) 向下采样注册图像(gallery images)至评测图像(probe images)的分辨率,然后执行识别。这类方法虽有效但会使得高分辨率注册图像中可用的其他具有辨别力的信息丢失。2)同时将LR评测和HR注册图像映射到公共空间,其中相应的LR和HR图像距离最近。3)将低分辨率图像重建到高分辨率的评测图像,然后用于识别。这类方法重点关注模型的超分辨技术,没有针对识别性能进行优化。另一方面,考虑到人脸图像是一个高度结构化的对象,其相对于自然图像具有明显的特定信息,因此有必要探索和利用面部的独特信息作为先验知识来促进面部细节增强。
综上所述,对于人脸识别任务,脸部的分辨率是至关重要的因素,尤其是嘴巴和眼睛、眉毛等关键区域的特征对于面部感知以及面部神经反应有直接影响。因此,将注意力选择作为先验知识并参与指导低分辨人脸到高分辨的恢复过程,对该人脸超分辨行为有大大的刺激作用,最后将其结果用于提高人脸识别任务的鲁棒性和实用性。
发明内容
本发明面向真实场景下人脸图像低分辨的现象,为解决目前人脸识别系统在该情况下性能下降的问题,采用基于面部先验知识的低分辨率人脸超分辨与识别的一体化技术来实现人脸细节增强和分辨率的提升。本发明提供了一种基于面部先验知识的低分辨率人脸超分辨与识别的方法。
本发明是通过如下技术方案实现的:一种基于面部先验知识的低分辨率人脸超分辨与识别的方法,具体包括以下步骤:
S2:对进行人脸超分辨,保存为;将SRCNN网络作为本步骤的超分辨骨干网络:先使用双三次(bicubic)插值将上采样到的同样大小,然后通过三层卷积神经网络做非线性映射,将其结果保存为,并由此得到映射矩阵;
S7:最后产生人脸超分辨与识别结果。
作为优选方案,步骤S1中,具体包括以下步骤:
作为优选方案,步骤S3中,具体包括以下步骤:
作为优选方案,步骤S4中,具体包括以下步骤:
作为优选方案,步骤S5中,具体包括以下步骤:
作为优选方案,步骤S5中,具体包括以下步骤:
S5-1:由预训练好的人脸解析网络(face parsing network, FPN)生成的面部解析图(parsing map),由此可得到其语义成分级的边缘信息semanticedge maps,记作,其中采用的是encoder-resnet-decoder的网络架构,首先是在4个下采样模块和4个上采用模块之间插入10个resnet blocks,然后是两个卷积层用来输出;
本发明由于采用了以上技术方案,与现有技术相比使其具有以下有益效果:本发明内容主要包括两部分,一是训练低分辨率和高分辨率组成的人脸对数据集,目的是学习LR-to-HR的非线性映射矩阵,为probe样本的超分辨操作提供支撑;二是同时将分辨率和高分辨率的人脸同时映射到公共空间来训练一个非线性转换器,目的是提高低质量人脸图像识别的准确性。值得一提的是,对于probe样本的超分辨,该发明不仅有效利用了与其相似高分辨人脸图像的映射矩阵,这很大程度上提高了模型效率,而且融合了人脸固有的语义成分先验知识,提升了人脸超分辨的性能的同时也实现了低分辨率人脸识别的目的,最终形成了一体化算法,有针对性地克服非受控环境下低分辨率人脸图像的识别难点问题。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明的方法流程图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
下面结合图1对本发明的实施例的基于面部先验知识的低分辨率人脸超分辨与识别的方法进行具体说明。
如图1所示,本发明提出了一种基于面部先验知识的低分辨率人脸超分辨与识别的方法,具体包括以下步骤:
S1:数据集构建;构建包含低分辨人脸和高分辨人脸对的训练数据集,以及高分辨的注册人脸数据库(galleryset)和低分辨人脸评测数据集(probeset);其中和来自不同的数据集,但是由相同的降级模型合成,目的是拟合真实世界中的低质量人脸图像。具体包括以下步骤:
S2:对进行人脸超分辨,保存为;将预训练好的SRCNN网络作为本步骤的超分辨骨干网络:先使用双三次(bicubic)插值将上采样到的同样大小,然后通过三层卷积神经网络做非线性映射,将其结果保存为,并由此得到映射矩阵;
S5-1:由预训练好的人脸解析网络(face parsing network, FPN)生成的面部解析图(parsing map),这些成分包括眉毛、眼睛、鼻子、嘴巴和皮肤这五个面部区域。由此可得到其语义成分级的边缘信息semanticedge maps,记作,其可作为先验知识在重建过程中起到约束作用。其中采用的是encoder-resnet-decoder的网络架构,首先是在4个下采样模块和4个上采用模块之间插入10个resnet blocks,然后是两个卷积层用来输出;
S7:最后产生人脸超分辨与识别结果。
在本发明的描述中,术语“多个”则指两个或两个以上,除非另有明确的限定,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制;术语“连接”、“安装”、“固定”等均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于面部先验知识的低分辨率人脸超分辨与识别的方法,其特征在于,具体包括以下步骤:
S2:对进行人脸超分辨,保存为;将SRCNN网络作为本步骤的超分辨骨干网络:先使用双三次(bicubic)插值将上采样到的同样大小,然后通过三层卷积神经网络做非线性映射,将其结果保存为,并由此得到映射矩阵;
具体包括以下步骤:
S5-1:由人脸解析网络(face parsing network, FPN)生成的面部解析图(parsing map),由此可得到其语义成分级的边缘信息semantic edge maps,记作,其中采用的是encoder-resnet-decoder的网络架构,首先是在4个下采样模块和4个上采用模块之间插入10个resnet blocks,然后是两个卷积层用来输出;
S7:最后产生人脸超分辨与识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110510886.4A CN113128467B (zh) | 2021-05-11 | 2021-05-11 | 基于面部先验知识的低分辨率人脸超分辨与识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110510886.4A CN113128467B (zh) | 2021-05-11 | 2021-05-11 | 基于面部先验知识的低分辨率人脸超分辨与识别的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113128467A CN113128467A (zh) | 2021-07-16 |
CN113128467B true CN113128467B (zh) | 2022-03-29 |
Family
ID=76781665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110510886.4A Active CN113128467B (zh) | 2021-05-11 | 2021-05-11 | 基于面部先验知识的低分辨率人脸超分辨与识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113128467B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693419A (zh) * | 2012-05-24 | 2012-09-26 | 武汉大学 | 基于多流形判别分析超分辨率的人脸识别方法 |
CN104899830A (zh) * | 2015-05-29 | 2015-09-09 | 清华大学深圳研究生院 | 一种图像超分辨方法 |
CN108447020A (zh) * | 2018-03-12 | 2018-08-24 | 南京信息工程大学 | 一种基于极深卷积神经网络的人脸超分辨率重建方法 |
WO2020118829A1 (zh) * | 2018-12-12 | 2020-06-18 | 深圳先进技术研究院 | 基于决策树的pet图像超分辨重建方法、装置、设备及介质 |
CN111768342A (zh) * | 2020-09-03 | 2020-10-13 | 之江实验室 | 基于注意力机制和多级反馈监督的人脸超分辨方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106203483B (zh) * | 2016-06-29 | 2019-06-11 | 天津大学 | 一种基于语义相关多模态映射方法的零样本图像分类方法 |
CN106250925B (zh) * | 2016-07-25 | 2019-06-11 | 天津大学 | 一种基于改进的典型相关分析的零样本视频分类方法 |
CN107657653A (zh) * | 2016-07-25 | 2018-02-02 | 同方威视技术股份有限公司 | 用于对三维表面的图像进行重建的方法、装置和系统 |
-
2021
- 2021-05-11 CN CN202110510886.4A patent/CN113128467B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102693419A (zh) * | 2012-05-24 | 2012-09-26 | 武汉大学 | 基于多流形判别分析超分辨率的人脸识别方法 |
CN104899830A (zh) * | 2015-05-29 | 2015-09-09 | 清华大学深圳研究生院 | 一种图像超分辨方法 |
CN108447020A (zh) * | 2018-03-12 | 2018-08-24 | 南京信息工程大学 | 一种基于极深卷积神经网络的人脸超分辨率重建方法 |
WO2020118829A1 (zh) * | 2018-12-12 | 2020-06-18 | 深圳先进技术研究院 | 基于决策树的pet图像超分辨重建方法、装置、设备及介质 |
CN111768342A (zh) * | 2020-09-03 | 2020-10-13 | 之江实验室 | 基于注意力机制和多级反馈监督的人脸超分辨方法 |
Non-Patent Citations (3)
Title |
---|
A robust face super-resolution algorithm and its application in low-resolution face recognition system;Shyam Singh Rajput 等,;《Multimedia Tools and Applications》;20200615;第79卷;第23909-23934页 * |
Low-resolution face recognition: a review;Zhifei Wang 等,;《The Visual Computer》;20130806;第30卷;第359-386页 * |
基于SRCNN和SSD网络的小目标检测方法;王烈 等,;《计算机仿真》;20200331;第37卷(第3期);第430-434页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113128467A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhong et al. | An end-to-end dense-inceptionnet for image copy-move forgery detection | |
CN111126307A (zh) | 联合稀疏表示神经网络的小样本人脸识别方法 | |
CN112801182A (zh) | 一种基于困难样本感知的rgbt目标跟踪方法 | |
CN113837290A (zh) | 一种基于注意力生成器网络的无监督非成对图像翻译方法 | |
Yu et al. | Augmented multi-scale spatiotemporal inconsistency magnifier for generalized DeepFake detection | |
CN113269848A (zh) | 基于注意力机制的遥感图像重构系统 | |
Wang et al. | Paccdu: pyramid attention cross-convolutional dual unet for infrared and visible image fusion | |
CN103605993B (zh) | 一种基于面向场景判别性分析的图像到视频人脸识别方法 | |
Zhao et al. | TAN-GFD: generalizing face forgery detection based on texture information and adaptive noise mining | |
CN113128467B (zh) | 基于面部先验知识的低分辨率人脸超分辨与识别的方法 | |
Han et al. | Self-supervised learning of Orc-Bert augmentator for recognizing few-shot oracle characters | |
CN110633631B (zh) | 一种基于部件幂集和多尺度特征的行人重识别方法 | |
Wang et al. | Iris image super resolution based on gans with adversarial triplets | |
CN117315241A (zh) | 一种基于transformer结构的场景图像语义分割方法 | |
CN116758397A (zh) | 基于深度学习的单模态诱导的多模态预训练方法及系统 | |
Chen et al. | Optimization of a training set for more robust face detection | |
Du et al. | Efficient spatial pyramid of dilated convolution and bottleneck network for zero-shot super resolution | |
CN113128624B (zh) | 一种基于多尺度字典的图网络人脸恢复方法 | |
Xiu et al. | Double discriminative face super-resolution network with facial landmark heatmaps | |
Guo et al. | Constructing New Backbone Networks via Space-Frequency Interactive Convolution for Deepfake Detection | |
Li et al. | V-ShadowGAN: generative adversarial networks for removing and generating shadows associated with vehicles based on unpaired data | |
Li et al. | Pixel Bleach Network for Detecting Face Forgery under Compression | |
Zhang et al. | A survey on face forgery detection of Deepfake | |
CN117612266B (zh) | 基于多尺度图像及特征层对齐的跨分辨率行人重识别方法 | |
Liu et al. | Image forgery localization based on fully convolutional network with noise feature |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |