CN111860045A - 人脸换脸方法、装置、设备及计算机存储介质 - Google Patents
人脸换脸方法、装置、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN111860045A CN111860045A CN201910344673.1A CN201910344673A CN111860045A CN 111860045 A CN111860045 A CN 111860045A CN 201910344673 A CN201910344673 A CN 201910344673A CN 111860045 A CN111860045 A CN 111860045A
- Authority
- CN
- China
- Prior art keywords
- face
- image
- face image
- expression
- diagram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000005286 illumination Methods 0.000 claims abstract description 85
- 230000014509 gene expression Effects 0.000 claims abstract description 76
- 238000010586 diagram Methods 0.000 claims abstract description 72
- 238000013256 Gubra-Amylin NASH model Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 25
- 230000001815 facial effect Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 11
- 210000000697 sensory organ Anatomy 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 4
- 239000003086 colorant Substances 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000036544 posture Effects 0.000 description 24
- 230000008859 change Effects 0.000 description 9
- 210000004709 eyebrow Anatomy 0.000 description 9
- 210000001508 eye Anatomy 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 210000000887 face Anatomy 0.000 description 5
- 238000003672 processing method Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008921 facial expression Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/97—Determining parameters from multiple pictures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种人脸换脸方法、装置、设备及计算机存储介质,该方法包括:获得第一人脸图像和第二人脸图像;识别第二人脸图像中的关键点,提取关键点圈定的区域的框图,得到第一表情姿态图;提取第二人脸图像中的光照信息,得到第一光照条件图;将第一表情姿态图、第一光照条件图和第一人脸图像输入生成式对抗网络GAN模型,得到将第一表情姿态图、第一光照条件图与第一人脸图像融合后的换脸图像。根据本发明实施例,能够通过剥离目标人脸上的表情以及光照信息来进行换脸操作,提高人脸换脸的自然程度。
Description
技术领域
本发明属于图像处理技术领域,尤其涉及一种人脸换脸方法、装置、设备及计算机存储介质。
背景技术
随着网络的发展,大众娱乐性质的社交软件不断增多,在许多具有直播、视频拍摄以及图像编辑等功能的社交软件中,人脸交换逐渐成为大众娱乐的新热点,具备了越来越广泛的应用场景。人脸交换或者说换脸技术,指的是在图像或者视频中将一个人的脸换成另一个人的脸。
但是,目前的换脸技术中,将人脸进行交换后得到的图像或者视频中,存在人脸的表情和光影不自然的情况,影响了人脸换脸的效果。并且,由于目前的换脸技术中,想要对人脸的表情和光照进行调整,需要分别设置不同的网络模型,使得最终得到的换脸结果与原始图像之间的失真较大,换脸效果不自然。
发明内容
本发明实施例提供一种人脸换脸方法、装置、设备及计算机存储介质,能够通过剥离目标人脸上的表情以及光照信息来进行换脸操作,提高人脸换脸的自然程度。
一方面,本发明实施例提供一种人脸换脸方法,方法包括:
获得第一人脸图像和第二人脸图像;
识别第二人脸图像中的关键点,提取关键点圈定的区域的框图,得到第一表情姿态图;
提取第二人脸图像中的光照信息,得到第一光照条件图;
将第一表情姿态图、第一光照条件图和第一人脸图像输入生成式对抗网络GAN模型,得到将第一表情姿态图、第一光照条件图与第一人脸图像融合后的换脸图像。
另一方面,本发明实施例提供了一种人脸换脸装置,装置包括:
图像获得模块,用于获得第一人脸图像和第二人脸图像;
表情提取模块,用于识别第二人脸图像中的关键点,提取关键点圈定的区域的框图,得到第一表情姿态图;
光照提取模块,用于提取第二人脸图像中的光照信息,得到第一光照条件图;
融合模块,用于将第一表情姿态图、第一光照条件图和第一人脸图像输入生成式对抗网络GAN模型,得到将第一表情姿态图、第一光照条件图与第一人脸图像融合后的换脸图像。
再一方面,本发明实施例提供了一种人脸换脸设备,设备包括:
处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现如以上任意一项的在人脸换脸方法。
再一方面,本发明实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如以上任意一项的人脸换脸方法。
本发明实施例的人脸换脸方法、装置、设备及计算机存储介质,能够分别将被替换的第二人脸图像中的光照信息以及关键点圈定的区域的框图进行提取,得到第一表情姿态图以及第一光照条件图,因此该第一表情姿态图内仅包含第二人脸图像中关键部位的表情信息,第一光照条件图仅包含第二人脸图像中的光照信息,之后将第一表情姿态图和第一光照条件图与第一人脸图进行融合,得到换脸图像。此时该表情换脸图像即为使用第一人脸图像替换第二人脸图像后的结果图。由于在本发明中,单独将第二人脸图像中的表情信息以及光照信息进行了提取,而表情信息除了能够反映人脸的表情之外,还可以反映人脸的姿态角度,因此之后直接将第一人脸图像按照所提取出来的表情信息和光照信息进行调整,使得得到的换脸图像的表情、姿态以及光照均足够自然,换脸效果更好。并且,由于本发明实施例仅通过一个GAN网络来进行换脸操作,降低了网络造成的失真误差,提高了换脸的自然程度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的人脸换脸方法的流程示意图;
图2是本发明一个实施例提供的GAN模型训练过程的流程示意图;
图3是GAN网络的工作过程示意图;
图4是第一表情姿态图的示意图;
图5是第一光照条件图的示意图;
图6是本发明一个实施例提供的人脸换脸装置的结构示意图;
图7是本发明一个实施例提供的人脸换脸设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了解决现有技术问题,本发明实施例提供了一种人脸换脸方法、装置、设备及计算机存储介质。下面首先对本发明实施例所提供的人脸换脸方法进行介绍。
图1示出了本发明一个实施例提供的人脸换脸方法的流程示意图。该方法包括:
步骤s11:获得第一人脸图像和第二人脸图像;
换脸操作,指的是用A人脸换掉图像或者视频中的B人脸,使得换脸后的图像或视频中的A人脸能够呈现原来B人脸的表情,并且尽可能的自然。其中,第一人脸图像指的即为上述A人脸的图像,第二人脸图像指的为上述B人脸的图像;并且,本发明中所提到的第一人脸图像和第二人脸图像是仅指得是人脸部分的图像,而不限定包含人的头发以及背景部分。
步骤s12:识别第二人脸图像中的关键点,提取关键点圈定的区域的框图,得到第一表情姿态图;
图4是第一表情姿态图的示意图;人脸图像中的关键点,指的是能够表征人脸特征的部分的特征点,用于区分不同人脸之间的区别,获取关键点的目的,是为了确定人脸各个部位的形状,之后据此即可表征人脸图像的表情和姿态,这里的表情指的是大笑、微笑、伤心等特征,姿态指的是人左右转头、上下转头、平面歪头以及正脸等人脸角度特征。而关键点在人脸上所圈定的区域的框图,这里的框图仅是用于表明关键点在人脸上所圈定的区域的轮廓,框图仅是特征点连接形成的图像,不包含人脸属性,如皮肤、光照等,因为本发明仅是想根据框图所圈定的轮廓,来确定第二人脸图像上的表情姿态信息,因为关键点圈定的框图的形状能够反映出人物的表情以及姿态。因此,通过提取上述框图,即能够将第二人脸图像上的表情信息提取出来。
步骤s13:提取第二人脸图像中的光照信息,得到第一光照条件图;
图5是第一光照条件图的示意图;由于人脸图像是需要在一定光线下拍摄的,因此,人脸图像上包含有当时拍摄时的光照信息,在不同的光照信息的条件下,人脸图像上的光影情况也会对应的变化,因此,若将人脸光照情况不同的两张人脸直接进行替换,则会导致最终换脸结果不自然的情况。而本发明通过将第二人脸图像中的光照信息提取出来与第一人脸图像进行融合,使得最终得到的换脸图像光照效果自然。
步骤s14:将第一表情姿态图、第一光照条件图和第一人脸图像输入生成式对抗网络GAN模型,得到将第一表情姿态图、第一光照条件图与第一人脸图像融合后的换脸图像。
需要注意的是,虽然本实施例中将提取表情信息作为步骤s12,将提取光照信息作为步骤s13,但是步骤S12和步骤S13并无先后顺序关系,可以先执行步骤s12再执行步骤s13,也可以先执行步骤s13再执行步骤s12,或者还可以通过两个进程并行处理步骤s12和步骤s13。本发明对以上两个步骤的先后顺序不作具体限定。
本发明实施例的人脸换脸方法,能够分别将被替换的第二人脸图像中的光照信息以及关键点圈定的区域的框图进行提取,得到第一表情姿态图以及第一光照条件图,因此该第一表情姿态图内仅包含第二人脸图像中关键部位的表情信息,第一光照条件图仅包含第二人脸图像中的光照信息,之后将第一表情姿态图和第一光照条件图与第一人脸图进行融合,得到换脸图像,此时该表情换脸图像即为使用第一人脸图像替换第二人脸图像后的结果图。由于在本发明中,单独将第二人脸图像中的表情信息以及光照信息进行了提取,而人脸的表情以及姿态(脸的角度等)均能够通过人脸的表情信息进行表征,人脸的光照信息能够反映人脸图像上的光影效果以及协调人脸与周围环境之间的自然程度,因此之后直接将第一人脸图像按照所提取出来的表情信息和光照信息进行调整,使得得到的换脸图像的表情、姿态以及光照均足够自然,换脸效果更好。
并且,由于本发明实施例仅通过一个GAN网络来进行换脸操作,相比分别通过不同的GAN网络来进行表情和光照换脸的方式,降低了由于GAN网络造成的失真误差,提高了换脸的自然程度。例如,假设每个GAN网络会造成0.3的误差,即通过一个GAN网络后,图像的真实程度为0.7,那么连续通过两个GAN网络后,图像的真实程度为0.7*0.7=0.49;因此本发明实施例的图像失真率更低。
其中,图3是GAN网络的工作过程示意图;GAN网络包括G网络和D网络,G为生成器generator,用于进行数据生成;D是discriminator判别器,负责判断数据是不是真值。在GAN网络训练过程中,过程为:G生成数据后输入D,D将G生成的数据与真值数据进行比较,依据比较误差调整自身参数以及G的参数。其中,G和D的参数调整可以采用梯度上升法或者梯度下降法,当然,本发明不限定GAN网络的内部参数的调整算法。
单纯的GAN网络,其输入为随机噪声Z,其输出一般也是随机的,即单纯的GAN网络输入输出均是不可控的。而本申请采用特定条件图并结合GAN网络形成了条件生成式对抗网络(Conditional Generative Adversarial Networks,CGAN),使输入输出均为可控的,从而保证整个换脸过程能够达到预期的效果。
是在人脸交换的场景下,本申请为第三代换脸图像处理方法。第一代换脸图像处理方法为简单的将人的头部换掉,得到的图像极不协调、自然。第二代换脸图像处理方法为特征点与特征点进行对齐的替换,局限性大,处理速度慢,且也达不到希望的自然程度。本申请不同于第一代换脸图像处理方法及第二代换脸图像处理方法,适用于多对多的应用,即适用于任意人脸换脸图像的处理,且得到的人脸图像高逼真自然,适用范围更广泛,且也大幅提高了处理速度。
在一种具体实施例中,步骤s12中,提取关键点圈定的区域的框图的过程,包括:提取并连接各个关键点,得到关键点组成的若干个封闭图形;使用第一预设颜色填充封闭图形,得到第一表情姿态图。
具体的,由于本发明前述实施例中提到,为了使关键点能够确定脸部部位的位置和形状,因此,每个部位处的关键点组合连接之后,组成的应该是能够包围对应部位的封闭图形(例如眼睛)。之后,由于本发明想要得到的表情姿态图是框图,也就是仅为轮廓图,因此需要采用预设颜色来对各个封闭图形进行填充,之后将颜色填充完成后的各个封闭图形进行提取,则得到第一表情姿态图。
作为优选的,若两个封闭图形的位置对称,则分别采用不同的颜色填充上述两个封闭图形。
由于人脸上存在有位置对称的部分,例如眉毛,眼睛等,这些对称的部分若不进行区分的话,后续GAN网络可能无法区分左右,如出现左右弄错的情况,例如将左眉毛的形状与第一人脸图像的右眉毛进行融合的话,则最终得到的换脸图像中的表情显然与第二人脸图像不同,进而导致换脸图像不自然的情况。因此,为了避免左右颠倒的问题,本实施例将对称的封闭图像采用不同的颜色进行填充,从而方便了后续GAN网络的识别。需要注意的是,在本发明中,各个部位处的封闭图形所对应的填充颜色是已经设定好的,例如右眉毛处的封闭图形填充绿色,左眉毛处的封闭图形填充红色,则后续GAN模型通过识别各个封闭图形的颜色以及整体位置,即可确定封闭图形所对应的部位,进而与第一人脸图像进行融合。当然,各个部位具体设置何种填充颜色,本发明不作限定。
在优选实施例中,关键点圈定的区域包括眉毛区域、眼睛区域、鼻子区域以及嘴唇区域。
具体的,上述实施例中,关键点圈定的区域限定为了五官部位的区域,这是因为五官是最能够反映人脸表情的部位,并且当人脸处于不同的角度姿态时,五官的形状显然也是不同的,因此依据五官的形状也能反映人脸的姿态。其中,关键点将眉毛区域也进行圈定的目的,是因为对于许多人来说,在做不同的表情和姿态时,除了眼睛、鼻子、嘴唇之外,眉毛也会相应的动作,因此眉毛的信息也能够反映表情信息。
另外,在一种优选实施例中,关键点圈定的区域还可以包含脸部轮廓。
这是由于不同人的人脸轮廓是不同的,因此在换脸过程中,若是不替换人脸轮廓的话,会使得替换后的人脸与其身体之间存在不协调的情况,导致换脸结果不自然。另外,脸部轮廓的形状,也能够直观的反映人脸的角度姿态情况。
以上仅为两种具体的实施例,主要应用于全脸均进行更换的场景中。在部分场景中,例如美颜场景下,用户可能仅需要进行眼部的更换,例如想要将自己的眼睛与明星的眼睛进行更换,这种情况下,关键点圈定的区域则可以仅包含眼睛区域。当然,关键点圈定的区域根据其所处的应用场景的需求而定,本发明对此不做限定。
另外,本发明中关键点的个数可以设置为68、87或137个,当然,还可以设置为其他数值,本发明不限定关键点的个数。
在一种优选实施例中,步骤s13的过程包括:
对第二人脸图像进行模糊处理,得到第一光照条件图。
其中,这里的模糊处理,指的是对图像中像素点的平滑处理,通过模糊处理,能够一定程度上滤除掉人脸图像中的人脸以及背景部分的属性信息,而仅保留下光照信息。
在另一种优选实施例中,步骤s13的过程包括:
步骤s131:将第二人脸图像的五官抠除,并用第二预设颜色填充五官所在区域;
步骤s132:使用第二人脸图像中脸颊处的光照填充上述颜色填充完成后的五官所在区域,得到第三人脸图像;
步骤s133:对第三人脸图像进行模糊处理,得到第一光照条件图。
具体的,在本实施例中,使用脸颊处的光照去填充五官区域,是因为脸颊的位置距离五官区域的距离相对均较近,因此光照的情况相对也较为接近,因此,使用脸颊处的光照填充五官区域后,再进行模糊处理之后,能够使得整个光照条件图中的光影更为自然。其中,由于上述操作的目的是为了得到光照条件图,而光照信息的颜色较浅,因此为了能够清晰的反映出光照的变换情况,上述第二预设颜色优选为白色,当然,也可以为接近白色的其他较浅的颜色,本发明对此不作限定。
其中,这里的模糊处理可以为高斯模糊或者拉普拉斯模糊处理,本发明对模糊处理的算法类型不作限定。
图2是本发明一个实施例提供的GAN模型训练过程的流程示意图;GAN网络的训练过程包括:
步骤s21:选择属于同一人的两张人脸图像分别作为第四人脸图像和第五人脸图像;
步骤s22:识别第五人脸图像中的关键点,提取关键点圈定的区域的框图,得到第二表情姿态图;
步骤s23:提取第五人脸图像中的光照信息,得到第二光照条件图;
步骤s24:将第二表情姿态图、第二光照条件图与第四人脸图像输入待训练的GAN网络内,得到第六人脸图像;
步骤s25:将第六人脸图像与第五人脸图像进行比对,依据比对误差调整GAN网络的内部参数;
步骤s26:判断当前的比对误差是否满足预设误差要求,若满足,则得到GAN模型,若不满足,选择不同的人脸图像,返回步骤s21。本步骤选择不同的人脸图像重复上述训练操作,直至得到的比对误差满足预设误差要求,则当前的GAN网络即为训练完成的GAN模型。
其中,本实施例在每次训练时,选择的是同一个的两张人脸图像,这样做的目的,是因为在GAN网络训练过程中,需要设置有真值,也就是理论上希望最终输出能够达到的目标图像,但是由于本发明的目的是对目前效果不够自然的换脸方法进行改进,因此若选择不属于同一人的两张人脸图像的话,很难得到其所对应的真值,而若选择表情相同的两个人的人脸图像,训练样本的获取又较为复杂。因此,本实施例直接采用同一人的两张表情不同的人脸图像,这样的话,在将人脸图像1中的人脸与人脸图像2中表情以及光照融合后,理论上的真值即为人脸图像2,也就是上述第五人脸图像。这种训练方式,简化了训练样本以及真值的获取过程,方便了GAN模型的训练。
另外,在获取训练样本时,可以包括同一个人的多组人脸图像,例如张女士的10组人脸图像,每组人脸图像包括两张表情不同的人脸图像;或者,训练样本还可以包括不同人的多组人脸图像,例如张女士的1组人脸图像,王女士的一组人脸图像等。当然,以上仅为几种具体的实现方式,本发明不限定上述训练样本的组成。
在其他实施例中,在训练GAN模型的过程中,也可以将GAN网络输出的待测试的换脸图像中的表情信息以及光照信息分别进行提取,得到待测试的表情姿态图以及待测试的光照条件图,之后将上述第二表情姿态图作为真值与该待测试的表情姿态图进行比对,将上述第二光照条件图作为真值与该待测试的光照条件图进行比对,来确定比对误差。这种情况下,训练样本则不必局限于同一人的两张人脸图像,而是任意两张人脸图像均可,这种方式进一步简化了训练样本的获取过程。当然,以上仅为几种具体的实现方式,本发明不限定GAN模型的具体的训练过程。
基于上述训练过程进行分析,由于目前像素点挨个替换的换脸方式,所使用的模型仅能对特定的两个人进行换脸或者是仅能换成固定某个人的人脸。而本发明中,通过训练GAN网络,使得后续在输入人脸图像、表情姿态图以及光照条件图后,能够以合适的方式将三者进行融合,从而得到表情和光照自然的换脸图像。由于本发明训练的仅是这个融合操作,并不限定于人脸图像是谁的,因此本发明并不限定于对固定两个人进行换脸,而是对任意两个人均可进行换脸,局限性小,能够实现多对多的换脸情况,适用范围更广。并且,本发明实施例相比像素点挨个替换的换脸方式,过程简单,换脸的速度和效率更高。
在一种优选实施例中,步骤s24之后,步骤s26之前,GAN网络的训练过程,还包括:将第六人脸图像与第四人脸图像进行特征映射人脸识别,依据识别结果调整GAN网络的内部参数。
具体的,在换脸完成后,第六人脸图像与第四人脸图像中应该是同一个人的脸,但是由于训练过程中,GAN网络的内部参数尚未调整完成以及误差的存在,会使得第六人脸图像与第四人脸图像之间存在一定的偏差。本实施例通过对第六人脸图像与第四人脸图像进行特征映射人脸识别,能够识别出第六人脸图像与第四人脸图像中是否是同一个人以及两者之间的区别情况,由于识别结果中两者差距越大,则表明GAN网络的内部参数的误差较大,因此,可以依据识别结果来辅助调整GAN网络的内部参数,从而使得最终训练得到的GAN模型的精确度更高,且提高了GAN模型的训练速度。
在一种实施例中,步骤s14中,得到换脸图像后,还包括:
用换脸图像替换第二人脸图像对应的原始图像中的人脸部分,得到换脸完成图像。
具体的,在得到换脸图像后,由于换脸图像仅包含人脸部分,因此还需要将该换脸图像替换所述第二人脸图像对应的原始图像中的人脸部分,得到换脸完成图像。
其中,第二人脸图像对应的原始图像为待换脸的视频中的视频帧。当然,第二人脸图像对应的原始图像还可以是从证件照或其他静态照片中识别出来的人脸图像,本发明对此不作限定。
本发明实施例提供了一种人脸换脸装置,图6是本发明一个实施例提供的人脸换脸装置的结构示意图;该装置包括:
图像获得模块1,用于获得第一人脸图像和第二人脸图像;
表情提取模块2,用于识别第二人脸图像中的关键点,提取关键点圈定的区域的框图,得到第一表情姿态图;
光照提取模块3,用于提取第二人脸图像中的光照信息,得到第一光照条件图;
融合模块4,用于将第一表情姿态图、第一光照条件图和第一人脸图像输入生成式对抗网络GAN模型,得到将第一表情姿态图、第一光照条件图与第一人脸图像融合后的换脸图像。
图7示出了本发明实施例提供的人脸换脸设备的硬件结构示意图。
在人脸换脸设备可以包括处理器301以及存储有计算机程序指令的存储器302。处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现上述实施例中的任意一种人脸换脸方法。
具体地,上述处理器301可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器302可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器302可在综合网关容灾设备的内部或外部。在特定实施例中,存储器302是非易失性固态存储器。在特定实施例中,存储器302包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
在一个示例中,人脸换脸设备还可包括通信接口303和总线310。其中,如图7所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
另外,结合上述实施例中的人脸换脸方法,本发明实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种人脸换脸方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种人脸换脸方法,其特征在于,包括:
获得第一人脸图像和第二人脸图像;
识别所述第二人脸图像中的关键点,提取所述关键点圈定的区域的框图,得到第一表情姿态图;
提取所述第二人脸图像中的光照信息,得到第一光照条件图;
将所述第一表情姿态图、所述第一光照条件图和所述第一人脸图像输入生成式对抗网络GAN模型,得到将所述第一表情姿态图、第一光照条件图与所述第一人脸图像融合后的换脸图像。
2.根据权利要求1所述的人脸换脸方法,其特征在于,所述提取所述关键点圈定的区域的框图的过程,包括:
提取并连接各个所述关键点,得到所述关键点组成的若干个封闭图形;
使用第一预设颜色填充所述封闭图形,得到所述第一表情姿态图。
3.根据权利要求2所述的人脸换脸方法,其特征在于,若两个所述封闭图形的位置对称,则分别采用不同的颜色填充上述两个封闭图形。
4.根据权利要求1所述的人脸换脸方法,其特征在于,所述提取所述第二人脸图像中的光照信息,得到第一光照条件图的过程包括:
对所述第二人脸图像进行模糊处理,得到所述第一光照条件图。
5.根据权利要求1所述的人脸换脸方法,其特征在于,所述提取所述第二人脸图像中的光照信息,得到第一光照条件图的过程包括:
将所述第二人脸图像的五官抠除,并用第二预设颜色填充五官所在区域;
使用所述第二人脸图像中脸颊处的光照填充上述颜色填充完成后的所述五官所在区域,得到第三人脸图像;
对所述第三人脸图像进行模糊处理,得到所述第一光照条件图。
6.根据权利要求1所述的人脸换脸方法,其特征在于,所述GAN网络的训练过程包括:
选择属于同一人的两张人脸图像分别作为第四人脸图像和第五人脸图像;
识别所述第五人脸图像中的关键点,提取所述关键点圈定的区域的框图,得到第二表情姿态图;
提取所述第五人脸图像中的光照信息,得到第二光照条件图;
将所述第二表情姿态图、所述第二光照条件图与所述第四人脸图像输入待训练的GAN网络内,得到第六人脸图像;
将所述第六人脸图像与所述第五人脸图像进行比对,依据比对误差调整所述GAN网络的内部参数;
选择不同的人脸图像,重复上述操作,直至得到的比对误差满足预设误差要求,得到所述GAN模型。
7.根据权利要求6所述的人脸换脸方法,其特征在于,所述得到第六人脸图像之后,选择不同的人脸图像之前,所述GAN网络的训练过程,还包括:
将所述第六人脸图像与所述第四人脸图像进行特征映射人脸识别,依据识别结果调整所述GAN网络的内部参数。
8.一种人脸换脸装置,其特征在于,所述装置包括:
图像获得模块,用于获得第一人脸图像和第二人脸图像;
表情提取模块,用于识别所述第二人脸图像中的关键点,提取所述关键点圈定的区域的框图,得到第一表情姿态图;
光照提取模块,用于提取所述第二人脸图像中的光照信息,得到第一光照条件图;
融合模块,用于将所述第一表情姿态图、所述第一光照条件图和所述第一人脸图像输入生成式对抗网络GAN模型,得到将所述第一表情姿态图、第一光照条件图与所述第一人脸图像融合后的换脸图像。
9.一种人脸换脸设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-7任意一项所述的在人脸换脸方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的人脸换脸方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910344673.1A CN111860045B (zh) | 2019-04-26 | 2019-04-26 | 人脸换脸方法、装置、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910344673.1A CN111860045B (zh) | 2019-04-26 | 2019-04-26 | 人脸换脸方法、装置、设备及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111860045A true CN111860045A (zh) | 2020-10-30 |
CN111860045B CN111860045B (zh) | 2024-06-18 |
Family
ID=72951703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910344673.1A Active CN111860045B (zh) | 2019-04-26 | 2019-04-26 | 人脸换脸方法、装置、设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111860045B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101320A (zh) * | 2020-11-18 | 2020-12-18 | 北京世纪好未来教育科技有限公司 | 模型训练方法、图像生成方法、装置、设备及存储介质 |
CN114387656A (zh) * | 2022-01-14 | 2022-04-22 | 平安科技(深圳)有限公司 | 基于人工智能的换脸方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020067088A (ko) * | 2001-02-15 | 2002-08-22 | 비쥬텍쓰리디(주) | 3차원 동화상 모델 얼굴 대체 방법 및 장치 |
CN108491775A (zh) * | 2018-03-12 | 2018-09-04 | 维沃移动通信有限公司 | 一种图像修正方法及移动终端 |
CN108776983A (zh) * | 2018-05-31 | 2018-11-09 | 北京市商汤科技开发有限公司 | 基于重建网络的人脸重建方法和装置、设备、介质、产品 |
CN109151340A (zh) * | 2018-08-24 | 2019-01-04 | 太平洋未来科技(深圳)有限公司 | 视频处理方法、装置及电子设备 |
CN109285205A (zh) * | 2018-10-29 | 2019-01-29 | 重庆中科云丛科技有限公司 | 一种人脸互换方法、系统、计算机可读存储介质及设备 |
CN109635745A (zh) * | 2018-12-13 | 2019-04-16 | 广东工业大学 | 一种基于生成对抗网络模型生成多角度人脸图像的方法 |
-
2019
- 2019-04-26 CN CN201910344673.1A patent/CN111860045B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020067088A (ko) * | 2001-02-15 | 2002-08-22 | 비쥬텍쓰리디(주) | 3차원 동화상 모델 얼굴 대체 방법 및 장치 |
CN108491775A (zh) * | 2018-03-12 | 2018-09-04 | 维沃移动通信有限公司 | 一种图像修正方法及移动终端 |
CN108776983A (zh) * | 2018-05-31 | 2018-11-09 | 北京市商汤科技开发有限公司 | 基于重建网络的人脸重建方法和装置、设备、介质、产品 |
CN109151340A (zh) * | 2018-08-24 | 2019-01-04 | 太平洋未来科技(深圳)有限公司 | 视频处理方法、装置及电子设备 |
CN109285205A (zh) * | 2018-10-29 | 2019-01-29 | 重庆中科云丛科技有限公司 | 一种人脸互换方法、系统、计算机可读存储介质及设备 |
CN109635745A (zh) * | 2018-12-13 | 2019-04-16 | 广东工业大学 | 一种基于生成对抗网络模型生成多角度人脸图像的方法 |
Non-Patent Citations (3)
Title |
---|
YUJUN SHEN等: "FaceID-GAN: Learning a Symmetry Three-Player GAN for Identity-Preserving Face Synthesis", PROCEEDINGS OF THE IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGMITION(CVPR), pages 821 - 830 * |
刘锦云;彭宏京;: "基于表情传输的交互式照片编辑", 中国图象图形学报, no. 10, pages 1390 - 1402 * |
姚震: "影视角色人脸追踪与替换的研究与应用", 中国优秀硕士学位论文全文数据库 信息科技辑, pages 2 - 5 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101320A (zh) * | 2020-11-18 | 2020-12-18 | 北京世纪好未来教育科技有限公司 | 模型训练方法、图像生成方法、装置、设备及存储介质 |
CN114387656A (zh) * | 2022-01-14 | 2022-04-22 | 平安科技(深圳)有限公司 | 基于人工智能的换脸方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111860045B (zh) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860044A (zh) | 人脸换脸方法、装置、设备及计算机存储介质 | |
CN109376582B (zh) | 一种基于生成对抗网络的交互式人脸卡通方法 | |
CN110147721B (zh) | 一种三维人脸识别方法、模型训练方法和装置 | |
CN109829396B (zh) | 人脸识别运动模糊处理方法、装置、设备及存储介质 | |
CN110969631B (zh) | 一种精细化照片染发方法及系统 | |
CN111833236B (zh) | 产生模拟用户的三维脸部模型的方法及装置 | |
CN108629339A (zh) | 图像处理方法及相关产品 | |
CN112221145B (zh) | 游戏脸模生成方法及装置、存储介质及电子设备 | |
CN110263768A (zh) | 一种基于深度残差网络的人脸识别方法 | |
CN112488067B (zh) | 人脸姿态估计方法、装置、电子设备和存储介质 | |
CN111860045B (zh) | 人脸换脸方法、装置、设备及计算机存储介质 | |
CN107563319A (zh) | 一种基于图像的亲子间人脸相似性度量计算方法 | |
CN113657195A (zh) | 人脸图像识别方法、设备、电子装置和存储介质 | |
CN109934112A (zh) | 一种人脸对齐方法和相机 | |
CN111951408B (zh) | 一种基于三维人脸的图像融合方法和设备 | |
CN116959113A (zh) | 步态识别方法及装置 | |
Prinosil et al. | Automatic hair color de-identification | |
CN111861948B (zh) | 图像处理方法、装置、设备及计算机存储介质 | |
CN114170651A (zh) | 表情识别方法、装置、设备及计算机存储介质 | |
CN106874839A (zh) | 脸部信息识别的方法及装置 | |
Xiao et al. | Single-image dehazing algorithm based on convolutional neural networks | |
CN115527254B (zh) | 人脸识别、模型训练方法、装置、电子设备及存储介质 | |
CN111861863B (zh) | 图像处理方法、装置、设备及计算机存储介质 | |
CN118474450B (zh) | 基于视频通话的数字人形像生成方法及系统 | |
CN114373221B (zh) | 一种融合几何结构特征图的手语识别方法、系统、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |