CN116363737B - 一种人脸图像属性编辑方法、系统、电子设备及存储介质 - Google Patents
一种人脸图像属性编辑方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116363737B CN116363737B CN202310635694.5A CN202310635694A CN116363737B CN 116363737 B CN116363737 B CN 116363737B CN 202310635694 A CN202310635694 A CN 202310635694A CN 116363737 B CN116363737 B CN 116363737B
- Authority
- CN
- China
- Prior art keywords
- face image
- attribute
- potential
- dimension
- codes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 239000013598 vector Substances 0.000 claims abstract description 72
- 238000009826 distribution Methods 0.000 claims abstract description 52
- 238000012986 modification Methods 0.000 claims abstract description 21
- 230000004048 modification Effects 0.000 claims abstract description 21
- 238000004590 computer program Methods 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 230000001815 facial effect Effects 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims 2
- 238000012545 processing Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008485 antagonism Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Abstract
本发明公开一种人脸图像属性编辑方法、系统、电子设备及存储介质,属于图像处理领域。首先分别高斯建模潜在代码各维度分布和在目标属性条件下的潜在代码各维度条件分布,然后计算各维度的KL散度,选择KL散度大于散度阈值的维度集合,作为目标属性对应的潜在代码修改子空间,并在潜在代码修改子空间中随机生成多个潜在代码,再在这多个潜在代码中选择和目标属性向量最相似的潜在代码,输入StyleGAN生成器来完成人脸图像属性编辑。本发明将目标属性与人脸图像的其他属性的维度空间完全解耦,可精准的控制人脸图像属性编辑,在将输入图像变换为具有目标属性的目标域人脸图像过程中,可以更少的改变原人脸图像的其他属性特征。
Description
技术领域
本发明涉及图像处理领域,特别是涉及一种人脸图像属性编辑方法、系统、电子设备及存储介质。
背景技术
人脸属性编辑是给定一张人脸图像以及待编辑的目标属性,然后将这张人脸图像变换为具有目标属性的新人脸图像,并尽量保证原人脸图像内的其他属性特征不变。人脸图像属性编辑是计算机视觉领域的一项重要技术,广泛用于内容生产、电影制作和娱乐视频中,例如变光头、变发型、变小孩、变明星脸等。
由于现代GAN(Generative Adversarial Networks,生成式对抗网络)可以生成各种逼真的合成图像,特别是像人脸这样的高度结构化图像。业内通常会预训练一种GAN来实现人脸图像的目标属性编辑。目前,由于StyleGAN潜在代码良好的属性解耦性,基于预训练StyleGAN编辑人脸图像属性非常流行,主要有以下三种方法:
第一种:训练过程:第一步先获取一个分类器,然后对人脸图像集进行分类,提取这些人脸图像的属性向量;第二步使用优化或者回归的方法提取这些人脸图像的潜在代码;第三步按属性对这些潜在代码分组,计算每个分组的潜在代码均值,得到一张属性到潜在代码映射表,同时计算全体潜在代码均值。推理过程:查找属性到潜在代码映射表,得到目标属性对应的潜在代码均值,减去全体潜在代码均值,加上人脸图像潜在代码,再输入StyleGAN生成器即可完成人脸图像属性编辑。
第二种:在图像生成器的内部,通过特定维度上特征的替换,将引入的目标人脸图像上的精细风格赋予在人脸图像上,这种方法能控制白皮肤、卷发等精细类型。
第三种:通过CLIP(Contrastive Language–Image Pre-training,基于对比学习的语言-图像预训练)对齐人脸图像和文本的属性,可以通过自然语言实现人脸属性编辑。
第一种和第二种方法不需要新的数据标注和昂贵的训练成本,但由于StyleGAN潜在代码并不是完全解耦,并不能精准的控制人脸图像属性编辑,也就是说将输入图像变换为具有目标属性的目标域人脸图像过程中,会多多少少改变人脸图像内原有的其他属性特征。第三种人脸属性编辑方法由于自然语言天生表达模糊性,不能精准控制复杂的人脸图像属性编辑。
发明内容
本发明的目的是提供一种人脸图像属性编辑方法、系统、电子设备及存储介质,可精准的控制人脸图像属性编辑,将输入图像变换为具有目标属性的目标域人脸图像过程中,可以更少的改变原人脸图像的其他属性特征。
为实现上述目的,本发明提供了如下方案:
一种人脸图像属性编辑方法,包括:
建立潜在代码到属性向量的映射器;
高斯建模人脸图像集中人脸图像的潜在代码各维度分布和目标属性条件下人脸图像的潜在代码各维度条件分布;
分别计算潜在代码各维度分布与目标属性条件下的潜在代码同一维度条件分布之间的KL散度;
选择KL散度大于散度阈值的维度集合,作为目标属性对应的潜在代码修改子空间;
在所述潜在代码修改子空间中随机生成多个潜在代码,并利用潜在代码到属性向量的映射器,获得随机生成的潜在代码对应的属性向量;
从随机生成的潜在代码对应的属性向量中选择与目标属性向量之间余弦距离最大的属性向量;
将选择的属性向量对应的潜在代码和待编辑人脸图像的潜在代码一起输入StyleGAN生成器,获得具有目标属性的人脸图像。
一种人脸图像属性编辑系统,包括:
映射器建立模块,用于建立潜在代码到属性向量的映射器;
高斯建模模块,用于高斯建模人脸图像集中人脸图像的潜在代码各维度分布和目标属性条件下人脸图像的潜在代码各维度条件分布;
KL散度计算模块,用于分别计算潜在代码各维度分布与目标属性条件下的潜在代码同一维度条件分布之间的KL散度;
维度选择模块,用于选择KL散度大于散度阈值的维度集合,作为目标属性对应的潜在代码修改子空间;
随机生成模块,用于在所述潜在代码修改子空间中随机生成多个潜在代码,并利用潜在代码到属性向量的映射器,获得随机生成的潜在代码对应的属性向量;
属性向量选择模块,用于从随机生成的潜在代码对应的属性向量中选择与目标属性向量之间余弦距离最大的属性向量;
合成模块,用于将选择的属性向量对应的潜在代码和待编辑人脸图像的潜在代码一起输入StyleGAN生成器,获得具有目标属性的人脸图像。
一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前述的人脸图像属性编辑方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如前述的人脸图像属性编辑方法。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开一种人脸图像属性编辑方法、系统、电子设备及存储介质,利用StyleGAN潜在代码符合高斯分布和语义解耦特性,先分别高斯建模潜在代码各维度分布和在目标属性条件下的潜在代码各维度条件分布,然后计算各维度的KL散度,选择KL散度大于散度阈值的维度集合,作为目标属性对应的潜在代码修改子空间,并在潜在代码修改子空间中随机生成多个潜在代码,再在这多个潜在代码中选择和目标属性向量最相似的潜在代码,输入StyleGAN生成器来完成人脸图像属性编辑。本发明将目标属性的维度空间与人脸图像的其他属性的维度空间完全解耦,可精准的控制人脸图像属性编辑,将输入图像变换为具有目标属性的目标域人脸图像过程中,可以更少的改变原人脸图像的其他属性特征。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种人脸图像属性编辑方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明利用StyleGAN潜在代码符合高斯分布和语义解耦特性,先分别高斯建模潜在代码各维度分布和在目标属性条件下的潜在代码各维度条件分布,然后利用信息论中的用来衡量分布距离的工具KL Divergence(KL散度),计算各维度分布距离,选择距离最大的前N个维度空间,并在这前N个维度空间随机生成多个潜在代码,再在这多个潜在代码中选择和目标属性向量最相似的潜在代码,输入StyleGAN生成器来完成人脸图像属性编辑。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明实施例提供了一种人脸图像属性编辑方法,包括:
步骤1:建立潜在代码到属性向量的映射器。
示例性的,映射器的建立过程如下:
获取一个分类器,分别分类人脸图像集中的人脸图像,提取得到这些人脸图像的属性向量,一张人脸图像对应一属性向量;使用优化或者回归的方法提取这些人脸图像的潜在代码,一张人脸图像对应一潜在代码;基于这些潜在代码和属性向量对,训练一个潜在代码到属性向量的映射器M。
步骤2:高斯建模人脸图像集中人脸图像的潜在代码各维度分布和目标属性条件下人脸图像的潜在代码各维度条件分布。
高斯建模人脸图像集中人脸图像的潜在代码各维度分布,具体步骤如下:
2.1.1 选择人脸图像集中的所有人脸图像;
2.1.2 得到这些人脸图像相应的StyleGAN生成器潜在代码;
2.1.3 高斯建模这些潜在代码各维度分布,具体来讲:
假定全体人脸图像集共有nn张人脸图像,每一张人脸图像有一个潜在代码。潜在代码是一le维向量(比如le等于256),若每一张人脸图像的潜在代码的维度为i(1≤ i ≤le),则对于nn张人脸图像,可得到均值mci和方差dci。
高斯建模人脸图像集中目标属性条件下人脸图像的潜在代码各维度条件分布,具体步骤如下:
2.2.1 按属性分组人脸图像集;
2.2.2 确定每个属性对应的人脸图像组的StyleGAN生成器潜在代码;
2.2.3 根据每个属性对应的人脸图像组的StyleGAN生成器潜在代码,高斯建模每个属性对应的各维度潜在代码分布,并从中获取目标属性对应的各维度潜在代码分布,作为目标属性条件下人脸图像的潜在代码各维度条件分布,具体来讲:
假定满足属性s的人脸图像集合有n张人脸图像,每一张人脸图像有一个潜在代码。潜在代码是一le维向量(比如le等于256),若每一张人脸图像的潜在代码的维度为i(1≤ i ≤ le),则对于n张人脸图像,可得到均值mi和方差di。
步骤3:分别计算潜在代码各维度分布与目标属性条件下的潜在代码同一维度条件分布之间的KL散度。
针对潜在代码向量的每一维度i,分别计算其分布和其在目标属性条件下的条件分布之间的KL Divergence。
步骤4:选择KL散度大于散度阈值的维度集合,作为目标属性对应的潜在代码修改子空间。
若KL散度大于散度阈值的维度有N个,则将这N个维度作为目标属性对应的潜在代码修改子空间。
步骤5:在所述潜在代码修改子空间中随机生成多个潜在代码,并利用潜在代码到属性向量的映射器,获得随机生成的潜在代码对应的属性向量。
对于每个维度,在中心为均值和长度为6倍标准差的一维区间(一维空间实际上就是一条线)均匀采样多个点(一个超参数),作为随机生成的潜在代码。
查找潜在代码到属性向量的映射器M,得到这些潜在代码对应的属性向量。
步骤6:从随机生成的潜在代码对应的属性向量中选择与目标属性向量之间余弦距离最大的属性向量。
计算向量间的cos距离(余弦距离),cos距离的值越大,向量间越相似,所以选择和目标属性向量最相似的属性向量,用于后续人脸图像的合成。
步骤7:将选择的属性向量对应的潜在代码和待编辑人脸图像的潜在代码一起输入StyleGAN生成器,获得具有目标属性的人脸图像。
利用StyleGAN生成器生成的合成人脸图像即为具有目标属性的人脸图像。
本发明只需要建立在已有的StyleGAN生成器上,不需要新的数据标注和昂贵的训练成本。与背景技术中基于预训练StyleGAN编辑人脸图像属性的第一种方法相比,本方法可以精准的控制人脸图像属性编辑,也就是说在将输入图像变换为具有目标属性的目标域人脸图像过程中,可以更少的改变原人脸图像的其他属性特征。
本发明实施例还提供了一种人脸图像属性编辑系统,包括:
映射器建立模块,用于建立潜在代码到属性向量的映射器;
高斯建模模块,用于高斯建模人脸图像集中人脸图像的潜在代码各维度分布和目标属性条件下人脸图像的潜在代码各维度条件分布;
KL散度计算模块,用于分别计算潜在代码各维度分布与目标属性条件下的潜在代码同一维度条件分布之间的KL散度;
维度选择模块,用于选择KL散度大于散度阈值的维度集合,作为目标属性对应的潜在代码修改子空间;
随机生成模块,用于在所述潜在代码修改子空间中随机生成多个潜在代码,并利用潜在代码到属性向量的映射器,获得随机生成的潜在代码对应的属性向量;
属性向量选择模块,用于从随机生成的潜在代码对应的属性向量中选择与目标属性向量之间余弦距离最大的属性向量;
合成模块,用于将选择的属性向量对应的潜在代码和待编辑人脸图像的潜在代码一起输入StyleGAN生成器,获得具有目标属性的人脸图像。
本发明实施例提供的人脸图像属性编辑系统与上述实施例所述的人脸图像属性编辑方法,其工作原理和有益效果类似,故此处不再详述,具体内容可参见上述方法实施例的介绍。
本发明还提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前述的人脸图像属性编辑方法。
此外,上述的存储器中的计算机程序通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
进一步地,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如前述的人脸图像属性编辑方法。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种人脸图像属性编辑方法,其特征在于,包括:
建立潜在代码到属性向量的映射器;
高斯建模人脸图像集中人脸图像的潜在代码各维度分布和目标属性条件下人脸图像的潜在代码各维度条件分布;
分别计算潜在代码各维度分布与目标属性条件下的潜在代码同一维度条件分布之间的KL散度;
选择KL散度大于散度阈值的维度集合,作为目标属性对应的潜在代码修改子空间;
在所述潜在代码修改子空间中随机生成多个潜在代码,并利用潜在代码到属性向量的映射器,获得随机生成的潜在代码对应的属性向量;
从随机生成的潜在代码对应的属性向量中选择与目标属性向量之间余弦距离最大的属性向量;
将选择的属性向量对应的潜在代码和待编辑人脸图像的潜在代码一起输入StyleGAN生成器,获得具有目标属性的人脸图像。
2.根据权利要求1所述的人脸图像属性编辑方法,其特征在于,所述建立潜在代码到属性向量的映射器,具体包括:
利用分类器对人脸图像集中的各人脸图像进行分类,并提取每张人脸图像的属性向量;
使用优化或者回归的方法提取每张人脸图像的潜在代码;
基于每张人脸图像的潜在代码和属性向量对,训练获得潜在代码到属性向量的映射器。
3.根据权利要求1所述的人脸图像属性编辑方法,其特征在于,高斯建模人脸图像集中人脸图像的潜在代码各维度分布,具体包括:
确定人脸图像集中每张人脸图像相应的StyleGAN生成器潜在代码;
高斯建模所有潜在代码的各维度分布。
4.根据权利要求1所述的人脸图像属性编辑方法,其特征在于,高斯建模人脸图像集中目标属性条件下人脸图像的潜在代码各维度条件分布,具体包括:
对人脸图像集中的人脸图像按属性分组,获得每个属性对应的人脸图像组;
确定每个属性对应的人脸图像组的StyleGAN生成器潜在代码;
根据每个属性对应的人脸图像组的StyleGAN生成器潜在代码,高斯建模每个属性对应的各维度潜在代码分布,并从中获取目标属性对应的各维度潜在代码分布,作为目标属性条件下人脸图像的潜在代码各维度条件分布。
5.根据权利要求1所述的人脸图像属性编辑方法,其特征在于,在所述潜在代码修改子空间中随机生成多个潜在代码,具体包括:
针对所述潜在代码修改子空间中的每个维度,在以均值为中心且长度为6倍标准差的一维区间中均匀采样多个点;所述均值和标准差为所述潜在代码修改子空间中的每个维度对应的高斯建模维度分布或维度条件分布的均值和标准差;
将所有维度均匀采样得到的点作为在所述潜在代码修改子空间中随机生成的潜在代码。
6.一种人脸图像属性编辑系统,其特征在于,包括:
映射器建立模块,用于建立潜在代码到属性向量的映射器;
高斯建模模块,用于高斯建模人脸图像集中人脸图像的潜在代码各维度分布和目标属性条件下人脸图像的潜在代码各维度条件分布;
KL散度计算模块,用于分别计算潜在代码各维度分布与目标属性条件下的潜在代码同一维度条件分布之间的KL散度;
维度选择模块,用于选择KL散度大于散度阈值的维度集合,作为目标属性对应的潜在代码修改子空间;
随机生成模块,用于在所述潜在代码修改子空间中随机生成多个潜在代码,并利用潜在代码到属性向量的映射器,获得随机生成的潜在代码对应的属性向量;
属性向量选择模块,用于从随机生成的潜在代码对应的属性向量中选择与目标属性向量之间余弦距离最大的属性向量;
合成模块,用于将选择的属性向量对应的潜在代码和待编辑人脸图像的潜在代码一起输入StyleGAN生成器,获得具有目标属性的人脸图像。
7.一种电子设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的人脸图像属性编辑方法。
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被执行时实现如权利要求1至5中任一项所述的人脸图像属性编辑方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310635694.5A CN116363737B (zh) | 2023-06-01 | 2023-06-01 | 一种人脸图像属性编辑方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310635694.5A CN116363737B (zh) | 2023-06-01 | 2023-06-01 | 一种人脸图像属性编辑方法、系统、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116363737A CN116363737A (zh) | 2023-06-30 |
CN116363737B true CN116363737B (zh) | 2023-07-28 |
Family
ID=86905298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310635694.5A Active CN116363737B (zh) | 2023-06-01 | 2023-06-01 | 一种人脸图像属性编辑方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116363737B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544486A (zh) * | 2013-10-31 | 2014-01-29 | 东南大学 | 基于自适应标记分布的人类年龄估计方法 |
CN108171770A (zh) * | 2018-01-18 | 2018-06-15 | 中科视拓(北京)科技有限公司 | 一种基于生成式对抗网络的人脸表情编辑方法 |
CN113421185A (zh) * | 2021-08-23 | 2021-09-21 | 武汉轻度科技有限公司 | 一种基于StyleGAN的移动端人脸年龄编辑方法 |
CN113743239A (zh) * | 2021-08-12 | 2021-12-03 | 青岛图灵科技有限公司 | 行人重识别方法、装置及电子设备 |
CN115482575A (zh) * | 2022-09-30 | 2022-12-16 | 电子科技大学 | 一种基于标记分布学习的面部表情识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113963087B (zh) * | 2021-10-12 | 2023-10-27 | 北京百度网讯科技有限公司 | 图像处理方法、图像处理模型训练方法、装置及存储介质 |
-
2023
- 2023-06-01 CN CN202310635694.5A patent/CN116363737B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544486A (zh) * | 2013-10-31 | 2014-01-29 | 东南大学 | 基于自适应标记分布的人类年龄估计方法 |
CN108171770A (zh) * | 2018-01-18 | 2018-06-15 | 中科视拓(北京)科技有限公司 | 一种基于生成式对抗网络的人脸表情编辑方法 |
CN113743239A (zh) * | 2021-08-12 | 2021-12-03 | 青岛图灵科技有限公司 | 行人重识别方法、装置及电子设备 |
CN113421185A (zh) * | 2021-08-23 | 2021-09-21 | 武汉轻度科技有限公司 | 一种基于StyleGAN的移动端人脸年龄编辑方法 |
CN115482575A (zh) * | 2022-09-30 | 2022-12-16 | 电子科技大学 | 一种基于标记分布学习的面部表情识别方法 |
Non-Patent Citations (2)
Title |
---|
Latent to Latent: A Learned Mapper for Identity Preserving Editing of Multiple Face Attributes in StyleGAN-generated Images;S. Khodadadeh, S. Ghadar, S. Motiian, W. -A. Lin, L. Bölöni and R. Kalarot;《2022 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)》;全文 * |
基于显著性目标检测网络的面部属性编辑方法;项家伟等;《国外电子测量技术》;第41卷(第5期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116363737A (zh) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zadeh et al. | Memory fusion network for multi-view sequential learning | |
KR102627802B1 (ko) | 가상 형상 생성 모델의 트레이닝 방법 및 가상 형상 생성 방법 | |
US10922866B2 (en) | Multi-dimensional puppet with photorealistic movement | |
Alexanderson et al. | Listen, denoise, action! audio-driven motion synthesis with diffusion models | |
Ghorbani et al. | ZeroEGGS: Zero‐shot Example‐based Gesture Generation from Speech | |
CN110555896B (zh) | 一种图像生成方法、装置以及存储介质 | |
WO2023072067A1 (zh) | 人脸属性编辑模型的训练以及人脸属性编辑方法 | |
CN109543165A (zh) | 基于循环卷积注意力模型的文本生成方法及装置 | |
Song et al. | AgeGAN++: Face aging and rejuvenation with dual conditional GANs | |
CN115424013A (zh) | 模型的训练方法、图像处理方法和设备、介质 | |
Chen et al. | Coogan: A memory-efficient framework for high-resolution facial attribute editing | |
CN113095038B (zh) | 基于多任务辨别器生成对抗网络的字体生成方法及装置 | |
JP2018055384A (ja) | 信号調整装置、信号生成学習装置、方法、及びプログラム | |
Hinz et al. | Image generation and translation with disentangled representations | |
CN116363737B (zh) | 一种人脸图像属性编辑方法、系统、电子设备及存储介质 | |
Cho et al. | Towards enhanced controllability of diffusion models | |
CN116611496A (zh) | 文本到图像的生成模型优化方法、装置、设备及存储介质 | |
Aspandi et al. | Audio-visual gated-sequenced neural networks for affect recognition | |
CN115690276A (zh) | 虚拟形象的视频生成方法、装置、计算机设备和存储介质 | |
Tripathi et al. | Facial expression recognition using data mining algorithm | |
Voß et al. | Augmented Co-Speech Gesture Generation: Including Form and Meaning Features to Guide Learning-Based Gesture Synthesis | |
Castillo-Arredondo et al. | PhotoHandler: manipulation of portrait images with StyleGANs using text | |
CN117152308B (zh) | 一种虚拟人动作表情优化方法与系统 | |
Sun et al. | AnyFace++: A Unified Framework for Free-style Text-to-Face Synthesis and Manipulation | |
Shaw et al. | Expressive modulation of neutral visual speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |