CN113033288A - 一种基于生成对抗网络的侧脸图片生成正脸图片的方法 - Google Patents
一种基于生成对抗网络的侧脸图片生成正脸图片的方法 Download PDFInfo
- Publication number
- CN113033288A CN113033288A CN202110125259.9A CN202110125259A CN113033288A CN 113033288 A CN113033288 A CN 113033288A CN 202110125259 A CN202110125259 A CN 202110125259A CN 113033288 A CN113033288 A CN 113033288A
- Authority
- CN
- China
- Prior art keywords
- picture
- face
- front face
- generator
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于生成对抗网络的侧脸图片生成正脸图片的方法,该方法将收集的侧脸图片和正脸图片用于生成对抗网络的训练,随后再次收集侧脸图片,输入到训练好的生成对抗网络中,输出正脸图片。本发明的生成正脸图片的方法本发明生成正脸图片的方法通过双路径生成器保证了脸部局部细节的存在,并通过预测感官和轮廓的位置,加速轮廓子生成器提取有效特征,通过拼接的方式保证了两种特征都能作用与结果,从而生成高质量、可用于人脸识别的图像。本发明的方法保留了局部特征和全局特征,生成正脸图片具有准确高效的特点。
Description
技术领域
本发明涉人脸生成技术领域,尤其涉及一种基于生成对抗网络的侧脸图片生成正脸图片的方法。
背景技术
当前人脸识别系统以及人脸数据库都是以正脸图片作为标准数据,因此经过训练后的人脸识别模型对正脸的识别度有较好的表现,但是对输入为侧脸的数据表现极差。而在现实生活中,摄像头所捕获的数据多数为侧脸数据,无法直接应用于人脸识别系统。特别是对于安防领域或是智能家居领域。对于前者而言,公共场所会部署大量的摄像头用于搜寻、记录犯罪份子,而犯罪份子会刻意的躲避摄像头,使得摄像头无法捕获或者仅仅捕获到他的侧脸,而安防系统中的人脸识别模块可能会忽略掉侧脸数据;同样的,随着智能家居领域的不断发展,越来越多的物联网设备会安装在家居环境中,出于对个人隐私保护考虑,大部分设备都会搭配人脸识别模块,如果每一个设备使用时都需要用户正面设备,这也会给用户带来极大的不便。
侧脸问题由于信息的缺失本身就是病态的问题,传统的方法是将侧脸数据和正脸数据同时训练,提取侧脸和正脸的公共特征,但是这一方法无法给出侧脸对应的正脸图像,只能给出侧脸的特征,特征无法输入其他成熟的人脸识别模块;另一种方法是通过侧脸数据生成正脸,这一类方法采用的是全局特征或者局部加全局特征来生成正脸图片,使用全局特征会导致生成图片的细节较差,而采用局部加全局特征训练时很容易导致局部特征无效,从而导致模型生成的图像并不能包含全部的信息。
综上,现阶段方法的缺陷主要包括:
1.基于特征提取的方法无法应用于成熟的人脸识别模块;
2.基于特征生成的方法会造成细节的缺失或是特征的无效。
发明内容
针对现有技术中存在的问题,本发明提供了一种基于生成对抗网络的侧脸图片生成正脸图片的方法。
为实现上述目的,本发明采用的技术方案是:一种基于生成对抗网络的侧脸图片生成正脸图片的方法,具体包括以下步骤:
(1)收集侧脸图片和对应的正脸图片,将每张侧脸图片IP划分成侧脸感官图片集将对应的正脸图片IF划分成正脸感官图片集并标记出正脸的轮廓特征点KF和对应的感官位置LF;所述感官包括:左眼、右眼、嘴巴和鼻子;
(3)再次收集侧脸图片,输入到训练好的生成对抗网络中,输出正脸图片。
进一步地,所述生成对抗网络包括感官生成器、轮廓生成器、融合网络、正脸感官位置预测网络、正脸轮廓特征点预测网络和判别器;所述感官生成器、轮廓生成器均与融合网络连接,所述融合网络与判别器连接,所述轮廓生成器分别与正脸感官位置预测网络、正脸轮廓特征点预测网络连接。
进一步地,所述生成对抗网络的训练过程具体包括如下步骤:
(2.2)将步骤(2.1)生成的预测正脸轮廓图片和预测正脸感官图片集输入融合网络中进行融合,生成预测正脸图片Ipred,将预测正脸图片Ipred输入判别器中,以判别器损失函数LDiscriminator来判断预测正脸图片Ipred与正脸图片IF是否属于同一种概率分布下;
(2.3)将轮廓生成器中侧脸图片IP的高维特征作为正脸感官位置预测网络和正脸轮廓特征点预测网络的输入,输出预测正脸感官位置Lpred和预测正脸轮廓特征点Kpred,以生成器损失函数LGenerator来判断预测正脸感官位置Lpred与正脸感官位置LF的相似度以及判断预测正脸轮廓特征点Kpred与正脸的轮廓特征点KF的相似度,并且判断融合生成的正脸图片Ipred和真实的正脸图片IF的相似度;
(2.4)将不同的侧脸图片IP和对应的侧脸感官图片集以及与之对应的正脸图片IF,正脸感官和轮廓及感官位置KF、LF输入生成对抗网络中重复步骤(2.1)-(2.3),训练生成对抗网络,直至判别器损失函数LDiscriminator和生成器损失函数LGenerator均收敛时,完成对生成对抗网络的训练。
进一步地,所述判别器损失函数LDiscriminator为:
进一步地,所述生成器损失函数LGenerator为:
LGenerator=Lpix+λ1LId+λ2LLoc+λ3Ladv
其中,Lpix为像素损失函数,LId为身份损失函数,λ1为身份损失函数对应的系数,取值为0.3;LLoc为位置损失函数,λ2为位置损失函数对应的系数,取值为0.01;Ladv为对抗损失函数,λ3为对抗损失函数对应的系数,取值为0.001。
与现有技术相比,本发明具有如下有益效果:本发明的生成对抗网络中采用感官生成器和轮廓生成器,分别利用侧脸感官图片集和侧脸图片生成预测正脸感官图片集和预测正脸轮廓图片,再进一步融合成生成预测正脸图片。本发明生成正脸图片的方法通过双路径生成器保证了脸部局部细节的存在,并通过预测感官和轮廓的位置,加速轮廓子生成器提取有效特征,通过拼接的方式保证了两种特征都能作用与结果,从而生成高质量、可用于人脸识别的图像。本发明的方法保留了局部特征和全局特征,生成正脸图片具有准确高效的特点。
附图说明
图1是本发明基于生成对抗网络的侧脸图片生成正脸图片的方法的流程图;
图2是本发明生成对抗网络结构图;
图3是本发明的生成正脸图片的结果示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步的解释说明。
如图1是本发明基于生成对抗网络的侧脸图片生成正脸图片的方法的流程图,所述方法具体包括如下步骤:
(1)收集侧脸图片和对应的正脸图片,将每张侧脸图片IP,大小为416×416,划分成侧脸感官图片集并且侧脸感官图片集全部缩放至64×64;将对应的正脸图片IF,大小同样为416×416,划分成正脸感官图片集大小同样为64×64,并标记正脸的轮廓特征点KF,大小为17×2,标记对应的感官位置LF,大小为4×4;每张侧脸图片IP对应一张正脸图片IF;所述感官包括:左眼、右眼、嘴巴和鼻子;
(2)将侧脸图片IP、正脸图像IF和侧脸感官图片集正脸感官图集分别输入生成对抗网络中,训练生成对抗网络,当判别器损失函数LDiscriminator和生成器损失函数LGenerator均收敛时,完成对生成对抗网络的训练;具体包括如下子步骤:
(2.1)构建双生成器的生成对抗网络,所述生成对抗网络如图2所示,包括感官生成器、轮廓生成器、融合网络、正脸感官位置预测网络、正脸轮廓特征点预测网络和判别器;所述感官生成器、轮廓生成器均与融合网络连接,所述融合网络与判别器连接,所述轮廓生成器分别与正脸感官位置预测网络、正脸轮廓特征点预测网络连接。本发明中的感官生成器和轮廓生成器均采用Res-UNet结构。该方法使用两个生成器,两个生成器分别对应不同的功能,能够更好的提取人脸不同程度的特征,在更好的保留细节的同时也能够提取的人脸的轮廓特征,从而保证生成高质量的图片。
(2.3)将步骤(2.2)生成的预测正脸轮廓图片和预测正脸感官图片集输入融合网络中进行融合,生成预测正脸图片Ipred,将预测正脸图片Ipred输入判别器中,以判别器损失函数LDiscriminator来判断预测正脸图片Ipred与正脸图片IF是否属于同一种概率分布下,即P(Ipred)和P(IF)是否近似,此处P表示为概率,所述判别器损失函数LDiscriminator为:
(2.4)将轮廓生成器中侧脸图片IP的高维特征作为正脸感官位置预测网络和正脸轮廓特征点预测网络的输入,输出预测正脸感官位置Lpred和预测正脸轮廓特征点Kpred,以生成器损失函数LGenerator来判断预测正脸感官位置Lpred与正脸感官位置LF的相似度以及判断预测正脸轮廓特征点Kpred与正脸的轮廓特征点KF的相似度;所述生成器损失函数LGenerator为:
LGenerator=Lpix+λ1LId+λ2LLoc+λ3Ladv
其中,Lpix为像素损失函数,LId为身份损失函数,λ1为身份损失函数对应的系数,取值为0.3;LLoc为位置损失函数,λ2为位置损失函数对应的系数,取值为0.01;Ladv为对抗损失函数,λv为对抗损失函数对应的系数,取值为0.001。
其中,W表示输入图像的宽,H表示输入图像的高,N为一个batch的图像对大小,为输入的侧脸图像,为生成器生成的正脸图像,为预测感官右上角坐标,(xi3,yi)为感官右上角真实坐标,为预测高宽,(hi,wi)为真实高宽,为轮廓特征点坐标,(xj,yj)为轮廓特征点真实坐标,为预测人脸身份特征,为真实人脸身份特征,为预测人脸像素点值,为真实人脸像素点值。输入输出人脸图片的大小为416×416×3。
(2.5)将不同的侧脸图片IP和对应的侧脸感官图片集输入生成对抗网络中重复步骤(2.2)-(2.4),训练生成对抗网络,直至判别器损失函数LDiscriminator和生成器损失函数LGenerator均收敛时,完成对生成对抗网络的训练。通过判别器损失函数,保证了生成的人脸图像和真实的人脸图像处于同一种分布下,通过生成器损失函数保证了生成预测正脸图像与真实的正脸图像尽可能的相似。
(3)再次收集侧脸图片,输入到训练好的生成对抗网络中,输出正脸图片。
本发明将生成的预测正脸感官图片集和预测正脸轮廓图片直接进行融合生成预测正脸图片,而不是使用感官特征和轮廓特征,这避免了某一特征失效,从而生成高质量的预测正脸图片。通过预测感官的位置来帮助融合网络将感官和正脸轮廓进行拼接,这也能更好的生成预测正脸图片。通过预测感官损失和正脸轮廓特征点的位置加速子生成器更快的找到侧脸和正脸的公共特征子空间,从而更好的提取有用的特征。
因此,本发明通过设计侧脸生成正脸的生成对抗网络,充分挖掘侧脸和正脸之间的相关特征,并且生成预测正脸图片,极大的提高了侧脸识别的准确率,并且生成的预测正脸图片能够直接接入现有的人脸识别模块,极大的扩展了人脸识别应用的可用范围。
如图3,给出了不同角度下的侧脸图片生成正脸图片的效果图,通过本发明的方法将侧脸图片生成正脸图片,生成的正脸图片与真实的正脸图片基本相同,说明该方法具有鲁棒性,在不同角度的情况下都能够生成真实正脸相似的正脸图像;同时图3给出了用不同用户的侧脸图片生成正脸图片的效果图,生成的正脸图片与真实的正脸图片一致,说明本发明的方法具有普遍适用性。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。
Claims (5)
2.根据权利要求1所述基于生成对抗网络的侧脸图片生成正脸图片的方法,其特征在于,所述生成对抗网络包括感官生成器、轮廓生成器、融合网络、正脸感官位置预测网络、正脸轮廓特征点预测网络和判别器;所述感官生成器、轮廓生成器均与融合网络连接,所述融合网络与判别器连接,所述轮廓生成器分别与正脸感官位置预测网络、正脸轮廓特征点预测网络连接。
3.根据权利要求1所述基于生成对抗网络的侧脸图片生成正脸图片的方法,其特征在于,所述生成对抗网络的训练过程具体包括如下步骤:
(2.2)将步骤(2.1)生成的预测正脸轮廓图片和预测正脸感官图片集输入融合网络中进行融合,生成预测正脸图片Ipred,将预测正脸图片Ipred输入判别器中,以判别器损失函数LDiscriminator来判断预测正脸图片Ipred与正脸图片IF是否属于同一种概率分布下;
(2.3)将轮廓生成器中侧脸图片IP的高维特征作为正脸感官位置预测网络和正脸轮廓特征点预测网络的输入,输出预测正脸感官位置Lpred和预测正脸轮廓特征点Kpred,以生成器损失函数LGenerator来判断预测正脸感官位置Lpred与正脸感官位置LF的相似度以及判断预测正脸轮廓特征点Kpred与正脸的轮廓特征点KF的相似度,并且判断融合生成的正脸图片Ipred和真实的正脸图片IF的相似度;
5.根据权利要求1或3所述基于生成对抗网络的侧脸图片生成正脸图片的方法,其特征在于,所述生成器损失函数LGenerator为:
LGenerator=Lpix+λ1LId+λ2LLoc+λ3Ladv
其中,Lpix为像素损失函数,LId为身份损失函数,λ1为身份损失函数对应的系数,取值为0.3;LLoc为位置损失函数,λ2为位置损失函数对应的系数,取值为0.01;Ladv为对抗损失函数,λ3为对抗损失函数对应的系数,取值为0.001。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110125259.9A CN113033288B (zh) | 2021-01-29 | 2021-01-29 | 一种基于生成对抗网络的侧脸图片生成正脸图片的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110125259.9A CN113033288B (zh) | 2021-01-29 | 2021-01-29 | 一种基于生成对抗网络的侧脸图片生成正脸图片的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113033288A true CN113033288A (zh) | 2021-06-25 |
CN113033288B CN113033288B (zh) | 2022-06-24 |
Family
ID=76459801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110125259.9A Active CN113033288B (zh) | 2021-01-29 | 2021-01-29 | 一种基于生成对抗网络的侧脸图片生成正脸图片的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113033288B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110188667A (zh) * | 2019-05-28 | 2019-08-30 | 复旦大学 | 一种基于三方对抗生成网络的人脸摆正方法 |
CN110399811A (zh) * | 2019-07-08 | 2019-11-01 | 厦门市美亚柏科信息股份有限公司 | 一种人脸识别方法、装置及存储介质 |
US20200184053A1 (en) * | 2018-12-05 | 2020-06-11 | Bank Of America Corporation | Generative adversarial network training and feature extraction for biometric authentication |
CN111783658A (zh) * | 2020-07-01 | 2020-10-16 | 河北工业大学 | 基于双生成对抗网络的两阶段表情动画生成方法 |
CN111860362A (zh) * | 2020-07-24 | 2020-10-30 | 北京百度网讯科技有限公司 | 生成人脸图像校正模型及校正人脸图像的方法和装置 |
AU2020102678A4 (en) * | 2020-10-12 | 2021-01-28 | Arunmozhi, S. DR | Realistic electric load profiling system of textile mills by considering dynamic and stochastic behaviour using GAN |
-
2021
- 2021-01-29 CN CN202110125259.9A patent/CN113033288B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200184053A1 (en) * | 2018-12-05 | 2020-06-11 | Bank Of America Corporation | Generative adversarial network training and feature extraction for biometric authentication |
CN110188667A (zh) * | 2019-05-28 | 2019-08-30 | 复旦大学 | 一种基于三方对抗生成网络的人脸摆正方法 |
CN110399811A (zh) * | 2019-07-08 | 2019-11-01 | 厦门市美亚柏科信息股份有限公司 | 一种人脸识别方法、装置及存储介质 |
CN111783658A (zh) * | 2020-07-01 | 2020-10-16 | 河北工业大学 | 基于双生成对抗网络的两阶段表情动画生成方法 |
CN111860362A (zh) * | 2020-07-24 | 2020-10-30 | 北京百度网讯科技有限公司 | 生成人脸图像校正模型及校正人脸图像的方法和装置 |
AU2020102678A4 (en) * | 2020-10-12 | 2021-01-28 | Arunmozhi, S. DR | Realistic electric load profiling system of textile mills by considering dynamic and stochastic behaviour using GAN |
Also Published As
Publication number | Publication date |
---|---|
CN113033288B (zh) | 2022-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shi et al. | Key-word-aware network for referring expression image segmentation | |
CN110021051A (zh) | 一种基于生成对抗网络通过文本指导的人物图像生成方法 | |
CN104036546B (zh) | 一种基于自适应形变模型的任意视角人脸三维重构方法 | |
CN110852347A (zh) | 采用改进YOLO v3的火灾检测方法 | |
CN110390308B (zh) | 一种基于时空对抗生成网络的视频行为识别方法 | |
CN106934351A (zh) | 手势识别方法、装置及电子设备 | |
CN111104852B (zh) | 一种基于启发式高斯云变换的人脸识别技术 | |
CN111160291A (zh) | 基于深度信息与cnn的人眼检测方法 | |
CN111209811A (zh) | 一种实时检测眼球注意力位置的方法及系统 | |
CN105469042A (zh) | 一种改进型的人像比对方法 | |
CN116051948A (zh) | 基于注意力交互及反事实注意力的细粒度图像识别方法 | |
CN113158630B (zh) | 一种文本编辑图像方法、存储介质、电子设备及系统 | |
CN112700568B (zh) | 一种身份认证的方法、设备及计算机可读存储介质 | |
CN113033288B (zh) | 一种基于生成对抗网络的侧脸图片生成正脸图片的方法 | |
CN115830643B (zh) | 一种姿势引导对齐的轻量行人重识别方法 | |
Zheng et al. | Template‐Aware Transformer for Person Reidentification | |
CN114333038B (zh) | 对象识别模型的训练方法和对象识别方法、装置、设备 | |
CN110490053A (zh) | 一种基于三目摄像头深度估计的人脸属性识别方法 | |
CN110543824A (zh) | 基于双目视觉的施工安全判断方法 | |
CN113869151A (zh) | 一种基于特征融合的跨视角步态识别方法及系统 | |
CN114360033A (zh) | 基于图卷积融合网络的口罩人脸识别方法、系统及设备 | |
Zhou et al. | Fhedn: A context modeling feature hierarchy encoder-decoder network for face detection | |
Nguyen et al. | Facial Landmark Detection with Learnable Connectivity Graph Convolutional Network | |
CN110147828A (zh) | 一种基于语义信息的局部特征匹配方法及系统 | |
CN116523969B (zh) | 基于mscfm和mgfe的红外-可见光跨模态行人重识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |