CN112907725B - 图像生成、图像处理模型的训练、图像处理方法和装置 - Google Patents

图像生成、图像处理模型的训练、图像处理方法和装置 Download PDF

Info

Publication number
CN112907725B
CN112907725B CN202110087579.XA CN202110087579A CN112907725B CN 112907725 B CN112907725 B CN 112907725B CN 202110087579 A CN202110087579 A CN 202110087579A CN 112907725 B CN112907725 B CN 112907725B
Authority
CN
China
Prior art keywords
image
expression
sample
target
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110087579.XA
Other languages
English (en)
Other versions
CN112907725A (zh
Inventor
张知行
郭益林
宋丛礼
万鹏飞
郑文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110087579.XA priority Critical patent/CN112907725B/zh
Publication of CN112907725A publication Critical patent/CN112907725A/zh
Application granted granted Critical
Publication of CN112907725B publication Critical patent/CN112907725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition

Abstract

本公开关于一种图像生成、图像处理模型的训练、图像处理方法和装置,涉及图像处理技术领域。方法包括:确定用于生成人脸图像的第一隐变量;将第一隐变量输入至编码器,得到第一隐变量的面部特征;获取目标表情参数;将第一隐变量的面部特征和目标表情参数输入至解码器中,通过解码器将第一隐变量对应的表情参数调整为目标表情参数,得到第二隐变量;基于第二隐变量,生成目标表情参数对应的面部表情图像。通过上述方案,实现了通过表情参数控制面部图像中的表情,而不对面部表情图像中的其他因素产生影响,从而提高了获取的面部表情图像的准确率,进而降低了获取面部表情图像的难度。

Description

图像生成、图像处理模型的训练、图像处理方法和装置
技术领域
本公开涉及图像处理技术领域,特别涉及一种图像生成、图像处理模型的训练、图像处理方法和装置。
背景技术
随着图像处理技术的发展,进行图像处理的方式越来越多。例如,通过图像处理模型进行图像处理。在使用图像处理模型执行图像处理任务之前,通常需要通过模型训练获取图像处理模型。在模型训练的过程中,需要用到大量的样本图像。例如,在进行表情控制的图像处理任务中,训练图像处理模型需要获取多个人脸表情图像。
相关技术中,通过拍摄图像的方法,采集多个人脸图像。这个过程中,为了保证采集到的多个人脸图像能够符合图像处理模型的训练需求,通过控制图像采集过程中除人脸表情外的其他图像因素不发生变化来采集多个人脸表情图像。
上述相关技术中,控制图像采集过程中除人脸表情外的其他图像因素不发生变化的难度较高,导致采集到的图像中符合要求的图像的准确率较低,造成获取样本图像的难度较高。
发明内容
本公开提供了一种图像生成、图像处理模型的训练、图像处理方法和装置,以至解决相关技术中获取样本图像的难度较高的问题。本公开的技术方案如下。
根据本公开实施例的第一方面,提供了一种图像生成方法,所述方法包括:
确定用于生成人脸图像的第一隐变量;
将所述第一隐变量输入至编码器,得到所述第一隐变量的面部特征;
获取目标表情参数;
将所述第一隐变量的面部特征和所述目标表情参数输入至解码器中,通过所述解码器将所述第一隐变量对应的表情参数调整为所述目标表情参数,得到第二隐变量;
基于所述第二隐变量,生成所述目标表情参数对应的面部表情图像。
在一些实施例中,所述编码器和所述解码器的训练方法包括:
获取待训练的编码器、待训练的解码器、样本图像和第一样本隐变量;
通过所述待训练的编码器和所述待训练的解码器,将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到第二样本隐变量;
根据第一虚拟人脸图像对应的表情参数和所述样本图像对应的表情参数之间的差值,确定表情信息损失参数,所述第一虚拟人脸图像为根据所述第二样本隐变量生成的虚拟人脸图像;
通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为第二虚拟人脸图像对应的表情参数,得到第三样本隐变量,所述第二虚拟人脸图像为根据所述第一样本隐变量生成的虚拟人脸图像;
根据所述第二虚拟人脸图像和第三虚拟人脸图像之间的差值,确定面部信息损失参数,所述第三虚拟人脸图像为根据所述第三样本隐变量生成的虚拟人脸图像;
基于所述表情信息损失参数和所述面部信息损失参数,对所述待训练的编码器和所述待训练的解码器进行模型训练,得到训练完成的编码器和解码器。
在一些实施例中,所述通过所述待训练的编码器和所述待训练的解码器,将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到第二样本隐变量,包括:
将所述样本图像输入至三维重建网络,得到所述样本图像对应的表情参数;
将所述第一样本隐变量输入至所述待训练的编码器中,得到所述第一样本隐变量的面部特征;
将所述第一样本隐变量的面部特征和所述样本图像对应的表情参数输入至解码器中,通过所述解码器将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到所述第二样本隐变量。
在一些实施例中,所述通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为第二虚拟人脸图像对应的表情参数,得到第三样本隐变量,包括:
将所述第一样本隐变量输入至图像生成网络,得到所述第二虚拟人脸图像;
将所述第二虚拟人脸图像输入至三维重建网络,得到所述第二虚拟人脸图像的表情参数;
通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为所述第二虚拟人脸图像对应的表情参数,得到所述第三样本隐变量。
在一些实施例中,所述获取目标表情参数,包括:
获取第一目标图像;
将所述第一目标图像输入至三维重建网络,得到所述目标表情参数。
根据本公开实施例的第二方面,提供了一种图像处理模型的训练方法,所述方法包括:
获取第二目标图像;
基于所述第二目标图像生成多个面部图像,所述多个面部图像的面部表情与所述第二目标图像的面部表情相同,所述多个面部图像基于本公开实施例的第一方面所述的图像生成方法生成;
将所述第二目标图像和所述多个面部图像确定为样本集合;
将第三目标图像输入至待训练的图像处理模型,通过所述待训练的图像处理模型对所述第三目标图像的面部特征进行更改,得到第四目标图像,所述第三目标图像为所述样本集合中的任一图像;
根据所述第四目标图像与所述第三图像的差值,确定所述图像处理模型的模型损失参数;
根据所述模型损失参数对所述待处理的图像处理模型进行参数调整,得到训练完成的图像处理模型。
根据本公开实施例的第三方面,提供了一种图像处理方法,所述方法应用于本公开实施例的第二方面所述图像处理模型,所述方法包括:
获取待更改面部表情的图像和目标表情图像;
将所述目标表情图像输入至三维重建网络,得到目标表情参数,所述目标表情参数为所述目标表情图像的表情参数;
将所述待更改面部表情的图像和所述目标表情参数输入至图像处理模型,得到更改面部表情后的图像,所述更改面部表情后的图像的面部表情与所述目标表情图像的面部表情相同。
根据本公开实施例的第四方面,提供了一种图像生成装置,所述装置包括:
第一确定单元,被配置为执行确定用于生成人脸图像的第一隐变量;
编码单元,被配置为执行将所述第一隐变量输入至编码器,得到所述第一隐变量的面部特征;
第一获取单元,被配置为执行获取目标表情参数;
解码单元,被配置为执行将所述第一隐变量的面部特征和所述目标表情参数输入至解码器中,通过所述解码器将所述第一隐变量对应的表情参数调整为所述目标表情参数,得到第二隐变量;
第一生成单元,被配置执行基于所述第二隐变量,生成所述目标表情参数对应的面部表情图像。
在一些实施例中,所述编码器和所述解码器的训练装置包括:
第二获取单元,被配置为执行获取待训练的编码器、待训练的解码器、样本图像和第一样本隐变量;
第一参数调整单元,被配置为执行通过所述待训练的编码器和所述待训练的解码器,将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到第二样本隐变量;
第二确定单元,被配置为执行根据第一虚拟人脸图像对应的表情参数和所述样本图像对应的表情参数之间的差值,确定表情信息损失参数,所述第一虚拟人脸图像为根据所述第二样本隐变量生成的虚拟人脸图像;
第二参数调整单元,被配置为执行通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为第二虚拟人脸图像对应的表情参数,得到第三样本隐变量,所述第二虚拟人脸图像为根据所述第一样本隐变量生成的虚拟人脸图像;
第三确定单元,被配置为执行根据所述第二虚拟人脸图像和第三虚拟人脸图像之间的差值,确定面部信息损失参数,所述第三虚拟人脸图像为根据所述第三样本隐变量生成的虚拟人脸图像;
第一模型训练单元,被配置为执行基于所述表情信息损失参数和所述面部信息损失参数,对所述待训练的编码器和所述待训练的解码器进行模型训练,得到训练完成的编码器和解码器。
在一些实施例中,所述第一参数调整单元包括:
第一参数提取子单元,被配置为执行将所述样本图像输入至三维重建网络,得到所述样本图像对应的表情参数;
编码子单元,被配置为执行将所述第一样本隐变量输入至所述待训练的编码器中,得到所述第一样本隐变量的面部特征;
解码子单元,被配置为执行将所述第一样本隐变量的面部特征和所述样本图像对应的表情参数输入至解码器中,通过所述解码器将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到所述第二样本隐变量。
在一些实施例中,所述第二参数调整单元包括:
图像生成子单元,被配置为执行将所述第一样本隐变量输入至图像生成网络,得到所述第二虚拟人脸图像;
第二参数提取子单元,被配置为执行将所述第二虚拟人脸图像输入至三维重建网络,得到所述第二虚拟人脸图像的表情参数;
参数调整子单元,被配置为执行通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为所述第二虚拟人脸图像对应的表情参数,得到所述第三样本隐变量。
在一些实施例中,所述第一获取单元被配置为执行获取第一目标图像;将所述第一目标图像输入至三维重建网络,得到所述目标表情参数。
根据本公开实施例的第五方面,提供了一种图像处理模型的训练装置,所述装置包括:
第三获取单元,被配置为执行获取第二目标图像;
第二生成单元,被配置执行基于所述第二目标图像生成多个面部图像,所述多个面部图像的面部表情与所述第二目标图像的面部表情相同,所述多个面部图像基于本公开实施例第四方面任一项所述的图像生成装置生成;
第四确定单元,被配置为执行将所述第二目标图像和所述多个面部图像确定为样本集合;
第一特征更改单元,被配置为执行将第三目标图像输入至待训练的图像处理模型,通过所述待训练的图像处理模型对所述第三目标图像的面部特征进行更改,得到第四目标图像,所述第三目标图像为所述样本集合中的任一图像;
第五确定单元,被配置为执行根据所述第四目标图像与所述第三图像的差值,确定所述图像处理模型的模型损失参数;
第二模型训练单元,被配置为执行根据所述模型损失参数对所述待处理的图像处理模型进行参数调整,得到训练完成的图像处理模型。
根据本公开实施例的第六方面,提供了一种图像处理装置,所述装置应用于本公开实施例第五方面所述图像处理模型,所述装置包括:
第四获取单元,被配置为执行获取待更改面部表情的图像和目标表情图像;
参数提取单元,被配置为执行将所述目标表情图像输入至三维重建网络,得到目标表情参数,所述目标表情参数为所述目标表情图像的表情参数;
第二特征更改单元,被配置为执行将所述待更改面部表情的图像和所述目标表情参数输入至图像处理模型,得到更改面部表情后的图像,所述更改面部表情后的图像的面部表情与所述目标表情图像的面部表情相同。
根据本公开实施例的第七方面,提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如本公开实施例第一方面中任一项所述的图像生成方法;或者,所述处理器被配置为执行所述指令,以实现如本公开实施例第二方面所述的图像处理模型的训练方法;或者,所述处理器被配置为执行所述指令,以实现如本公开实施例第三方面所述的图像处理方法。
根据本公开实施例的第八方面,提供了一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行时实现如本公开实施例第一方面中任一项所述的图像生成方法;或者,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行时实现如本公开实施例第二方面所述的图像处理模型的训练方法;或者,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行时实现如本公开实施例第三方面所述的图像处理方法。
根据本公开实施例的第九方面,提供了一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行如本公开实施例第一方面中任一项所述的图像生成方法;或者,所述计算机指令被处理器执行如本公开实施例第二方面所述的图像处理模型的训练方法;或者,所述计算机指令被处理器执行时实现如本公开实施例第三方面所述的图像处理方法。
在本公开实施例中,基于目标表情参数对第一隐变量进行调整,基于调整后的第二隐变量生成面部表情图像,由于在参数调整的过程中,只调整了第一隐变量中的表情参数,而对于第一隐变量中的其他参数并未进行调整,这样实现了通过表情参数控制面部图像中的表情,而不对面部表情图像中的其他因素产生影响,从而提高了获取的面部表情图像的准确率,进而降低了获取面部表情图像的难度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种图像生成方法的流程图;
图2是根据一示例性实施例示出的一种图像处理模型的训练方法的流程图;
图3是根据一示例性实施例示出的一种图像处理方法的流程图;
图4是根据一示例性实施例示出的一种编码器和解码器的训练方法的流程图;
图5是根据一示例性实施例示出的一种编码器和解码器的训练方法的流程图;
图6是根据一示例性实施例示出的一种三维重建网络的工作流程示意图;
图7是根据一示例性实施例示出的一种图像生成模型的工作流程示意图;
图8是根据一示例性实施例示出的一种图像生成方法的流程图;
图9是根据一示例性实施例示出的一种图像生成方法的流程图;
图10是根据一示例性实施例示出的一种图像处理模型的训练方法的流程图;
图11是根据一示例性实施例示出的一种图像处理方法的流程图;
图12是根据一示例性实施例示出的一种图像生成装置的框图;
图13是根据一示例性实施例示出的一种图像处理模型的训练装置的框图;
图14是根据一示例性实施例示出的一种图像处理装置的框图;
图15是根据一示例性实施例示出的一种终端的框图;
图16是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
随着图像处理技术的发展,进行图像处理的方式越来越多。例如,通过不同的图像处理模型执行不同的图像处理任务。在使用图像处理模型执行图像处理任务之前,通常需要对图像处理模型进行模型训练。在模型训练的过程中,需要用到大量的样本图像。例如,在进行表情控制的图像处理任务中,训练图像处理模型需要获取多个人脸表情图像。
相关技术中,通过拍摄图像的方法,采集多个人脸图像。这个过程中,为了保证采集到的多个人脸图像能够符合图像处理模型的训练需求,通过控制图像采集过程中除人脸表情外的其他图像因素不发生变化来采集多个人脸表情图像。
上述相关技术中,需要保证除人脸表情以外的其他图像因素均不发生变化,因此,需要保证被拍摄的人在保持静止的情况下变换不同的表情,该过程中控制人静止的合格率较低,造成获取样本图像的难度较高。
本公开实施例提供的方法能够应用在生成样本图像的场景下。例如,训练图像处理模型的场景。
在一些实施例中,通过本公开实施例提供的方法,能够根据需要生成同一目标对象的多个面部表情图像。相应的,该过程中更改表情参数,能够生成同一目标对象的不同面部表情的多个面部表情图像,基于该多个面部表情图像进行模型训练。
在一些实施例中,通过本公开实施例提供的方法,能够根据需要生成相同表情的不同目标对象的面部表情图像。相应的,该过程中更改初始图像参数,能够生成同一表情的多个面部表情图像,基于该多个面部表情图像进行模型训练。
在一些实施例中,通过本公开实施例提供的方法还能够通过相同表情的一组图像对图像处理模型进行模型训练,使得训练完成的图像处理模型能够对其他表情的图像进行处理,得到目标表情的图像。
图1是根据一示例性实施例示出的一种图像生成方法的流程图,如图1所示,图像生成方法包括以下步骤。
在步骤S11中,确定用于生成人脸图像的第一隐变量。
在步骤S12中,将该第一隐变量输入至编码器,得到该第一隐变量的面部特征。
在步骤S13中,获取目标表情参数。
在步骤S14中,将该第一隐变量的面部特征和该目标表情参数输入至解码器中,通过该解码器将该第一隐变量对应的表情参数调整为该目标表情参数,得到第二隐变量。
在步骤S15中,基于该第二隐变量,生成该目标表情参数对应的面部表情图像。
在本公开实施例中,基于目标表情参数对第一隐变量进行调整,基于调整后的第二隐变量生成面部表情图像,由于在参数调整的过程中,只调整了第一隐变量中的表情参数,而对于第一隐变量中的其他参数并未进行调整,这样实现了通过表情参数控制面部图像中的表情,而不对面部表情图像中的其他因素产生影响,从而提高了获取的面部表情图像的准确率,进而降低了获取面部表情图像的难度。
图2是根据一示例性实施例示出的一种图像处理模型的训练方法的流程图,如图2所示,图像处理模型的训练方法包括以下步骤。
在步骤S21中,获取第二目标图像。
在步骤S22中,基于该第二目标图像生成多个面部图像,该多个面部图像的面部表情与该第二目标图像的面部表情相同,该多个面部图像基于本公开实施例的第一方面该的图像生成方法生成。
在步骤S23中,将该第二目标图像和该多个面部图像确定为样本集合。
在步骤S24中,将第三目标图像输入至待训练的图像处理模型,通过该待训练的图像处理模型对该第三目标图像的面部特征进行更改,得到第四目标图像,该第三目标图像为该样本集合中的任一图像。
在步骤S25中,根据该第四目标图像与该第三图像的差值,确定该图像处理模型的模型损失参数。
在步骤S26中,根据该模型损失参数对该待处理的图像处理模型进行参数调整,得到训练完成的图像处理模型。
在本公开实施例中,通过模型生成样本集合对待训练的图像处理模型进行模型训练,这样无需采集样本集合,简化了模型训练过程中获取样本集合的过程,提高了模型训练的效率。
图3是根据一示例性实施例示出的一种图像处理方法的流程图,如图3所示,图像处理方法包括以下步骤。
在步骤S31中,获取待更改面部表情的图像和目标表情图像。
在步骤S32中,将该目标表情图像输入至三维重建网络,得到目标表情参数,该目标表情参数为该目标表情图像的表情参数。
在步骤S33中,将该待更改面部表情的图像和该目标表情参数输入至图像处理模型,得到更改面部表情后的图像,该更改面部表情后的图像的面部表情与该目标表情图像的面部表情相同。
在本公开实施中,通过图像处理模型对待更改面部表情的图像进行图像处理,使得该待更改面部表情的图像的表情的目标表情,从而实现对图像中面部表情的控制,简化了更改图像中面部表情的过程,提高了更改面部表情的精准度。
在本公开实施例提供的方法中,通过目标表情参数对第一隐变量进行调整的过程一般通过编码器和解码器实现。因此,在通过编码器和解码器对第一隐变量进行调整之前,需要对待训练的编码器和待训练的解码器进行训练,得到该编码器和解码器。参见图4,图4是根据一示例性实施例示出的一种编码器和解码器的训练方法的流程图,如图4所示,该方法包括以下步骤。
在步骤S41中,获取待训练的编码器、待训练的解码器、样本图像和第一样本隐变量。
其中,该待训练的编码器和待训练的解码器为开发人员设计的编码器和解码器。该待训练的编码器用于对输入数据进行编码,降低输入数据的维度。该待训练的解码器用于对编码器输出的数据进行解码。一般该待训练的编码器和待训练的解码器为以循环神经网络作为基础结构的神经网络。
该样本图像为包括面部特征的图像。面部特征为人、动物等能够产生表情的面部特征。该第一样本隐变量为待生成的面部图像的面部参数,用于指示表情对应的面部特征。
该第一样本隐变量与用于生成图像的图像生成模型要求的参数格式匹配,使得图像生成模型能够基于该第一样本隐变量生成图像。在一些实施例中,电子设备直接获取该第一样本隐变量。例如,接收用户输入的第一样本隐变量。在一些实施例中,电子设备获取样本图像参数,从该样本图像参数中,获取第一样本隐变量。其中,该样本图像参数包括第一样本隐变量和其他图像参数。例如,该其他图像参数包括图像背景参数、图像亮度参数、形状参数、纹理参数、目标对象的位置参数、目标对象的姿态参数中的至少一种。
需要说明的一点是,在本公开实施例中,对获取待训练的编码器和待训练的解码器的过程,以及获取样本图像和第一样本隐变量的过程的顺序不作具体限定。
在步骤S42中,通过该待训练的编码器和该待训练的解码器,将该第一样本隐变量对应的表情参数调整为该样本图像对应的表情参数,得到第二样本隐变量。
其中,第一样本隐变量对应的表情参数为第一样本隐变量中用于体现生成的图像的表情的参数。样本图像对应的表情参数为给样本图像中目标对象的表情所对应的参数。
在本步骤中,参见图5,提取样本图像对应的表情参数,基于该样本图像对应的表情参数对第一样本隐变量对应的表情参数进行调整,该过程通过以下步骤(1)-(3)实现,包括:
(1)将该样本图像输入至三维重建网络,得到该样本图像对应的表情参数。
该三维重建网络能够提取样本图像的图像参数。在一些实施例中,该三维重建网络为用于提取图像中的表情参数的三维重建网络。相应的,将该样本图像输入至三维重建网络中,通过该三维重建网络提取样本图像的表情特征,基于该表情特征确定该样本表情参数。在一些实施例中,参见图6,该三维重建网络为用于提取图像参数的三维重建网络。相应的,将样本图像输入至三维重建网络中,通过该三维重建网络提取样本图像的图像特征,基于该样本图像特征生成该样本图像的图像参数,从该样本图像的图像参数中提取样本表情参数。其中,该样本图像的图像参数至少包括样本表情参数,还包括图像背景参数、图像亮度参数、形状参数、纹理参数、目标对象的位置参数、目标对象的姿态参数中的至少一种。这些图像参数用于通过渲染器进行渲染,得到该样本图形对应的三维图像。
其中,该三维重建网络为任一能够提取图像参数的模型。例如,该三维重建网络为3DMM(3D Morphable Model,三维人脸形变统计模型)。3DMM常用于将二维图像转换成三维图像的过程中,用于统计二维图像中的形状和纹理等特征。
(2)将该第一样本隐变量输入至该待训练的编码器中,得到该第一样本隐变量的面部特征。
继续参见图5,在本步骤中,将第一样本隐变量输入至待训练的编码器中,通过编码器对第一样本隐变量进行特征提取,得到该第一样本隐变量的面部特征。
(3)将该第一样本隐变量的面部特征和该样本图像对应的表情参数输入至解码器中,通过该解码器将该第一样本隐变量对应的表情参数调整为该样本图像对应的表情参数,得到该第二样本隐变量。
继续参见图5,在本步骤中,编码器输出第一样本隐变量的编码结果,将该编码结果与样本图像对应的表情参数输入至解码器中。该解码器用于基于该样本图像对应的表情参数,调整该第一样本隐变量的面部特征中的表情特征,将调整后的面部特征进行解码,得到第二样本隐变量。
在本实现方式中,基于样本图像对应的表情参数,通过待训练的编码器和待训练的解码器对第一样本隐变量进行调整,得到第二样本隐变量,保证了通过待训练的编码器和待训练的解码器能够根据获取到的第二样本隐变量进行参数调整,提高了模型训练的准确性。
在步骤S43中,根据第一虚拟人脸图像对应的表情参数和该样本图像对应的表情参数之间的差值,确定表情信息损失参数。
其中,该第一虚拟人脸图像为根据该第二样本隐变量生成的虚拟人脸图像。
该表情信息损失参数为基于样本图像的表情参数与基于第一样本隐变量生成的虚拟表情图像的表情参数之间的差异确定的。继续参见图5,在本步骤中,基于的第二样本隐变量生成第一虚拟人脸图像,从该第一虚拟人脸图像中提取该第一虚拟人脸图像对应的表情参数,将该第一虚拟人脸图像对应的表情参数与样本图像对应的表情参数进行对比,得到表情信息损失参数。该过程通过以下步骤(1)-(3)实现,包括:
(1)将该第二样本隐变量输入至图像生成模型,得到第一虚拟人脸图像。
该图像生成模型为具有生成虚拟高清图像的能力的模型。例如,该图像生成模型为生成风格式对抗网络(StyleGAN,Style Generative Adversarial Networks)模型。参见图7,该StyleGAN能够基于输入的隐变量生成图像。其中,隐变量为生成的图像的图像参数。
(2)将该第一虚拟人脸图像输入至该三维重建网络,得到该第一虚拟人脸图像对应的表情参数。
本步骤与步骤S22中的步骤(1)相似,在此不再赘述。
(3)根据该第一虚拟人脸图像对应的表情参数和该样本图像对应的表情参数之间的差值,确定该表情信息损失参数。
在本步骤中,基于第一虚拟人脸图像对应的表情参数和样本图像对应的表情参数之间的相似度,确定该面部信息损失参数。在一些实施例中,通过表情信息损失函数确定该表情信息损失参数。相应的,分别将该第一虚拟人脸图像对应的表情参数和该样本图像对应的表情参数作为该表情信息损失函数的中变量的值,确定该表情信息损失函数中的变量为该第一虚拟人脸图像对应的表情参数和该样图像对应的本表情参数时,该表情信息损失函数的函数值,将该函数值确定为该表情信息损失参数。
在本实现方式中,通过第二样本隐变量生成第一虚拟人脸图像,再提取第一虚拟人脸图像的表情参数,基于样本图像对应的表情参数和从第一虚拟人脸图像提取的表情参数确定表情信息损失参数,这样通过对比第一虚拟人脸图像对应的表情参数和样本图像对应的表情参数的相似度,确定该表情信息损失参数,保证了表情信息损失参数只对表情参数进行对比,提高了表情信息损失参数的准确度。
另外,在本实现方式中,基于样本图像对应的表情参数,通过待训练的编码器和待训练的解码器对第一样本隐变量进行调整,通过确定调整后的第二样本隐变量生成的第一虚拟人脸图像对应的表情参数与样本图像对应的表情参数的差异,确定表情信息损失参数,以便通过该表情信息损失参数对待训练的编码器和待训练的解码器进行模型参数调整,从而保证了训练得到的编码器和解码器能够通过表情参数控制面部参数中的表情参数。
在步骤S44中,通过该待训练的编码器和该待训练的解码器,将该第二样本隐变量对应的表情参数调整为第二虚拟人脸图像对应的表情参数,得到第三样本隐变量。
其中,该第二虚拟人脸图像为根据该第一样本隐变量生成的虚拟人脸图像。继续参见图5,在本步骤中,根据第一样本隐变量生成第二虚拟人脸图像,第二虚拟人脸图像的表情参数对第二样本隐变量的表情参数进调整,得到第三样本隐变量。该过程通过以下步骤(1)-(3)实现,包括:
(1)将该第一样本隐变量输入至图像生成网络,得到该第二虚拟人脸图像。
本步骤与步骤S43中的步骤(1)相似,在此不再赘述。
(2)将该第二虚拟人脸图像输入至三维重建网络,得到该第二虚拟人脸图像的表情参数。
本步骤与步骤S42中的步骤(1)相似,在此不再赘述。
(3)通过该待训练的编码器和该待训练的解码器,将该第二样本隐变量对应的表情参数调整为该第二虚拟人脸图像对应的表情参数,得到该第三样本隐变量。
本步骤与步骤S42中的步骤(3)相似,在此不再赘述。
在本实现方式中,基于第二虚拟人脸图像对应的表情参数,通过待训练的编码器和待训练的解码器对第二样本隐变量进行调整,得到第三样本隐变量,保证了通过待训练的编码器和待训练的解码器能够根据获取到的第三样本隐变量进行参数调整,提高了模型训练的准确性。
在步骤S45中,根据该第二虚拟人脸图像和第三虚拟人脸图像之间的差值,确定面部信息损失参数。
其中,该第三虚拟人脸图像为根据该第三样本隐变量生成的虚拟人脸图像。
在本步骤中,根据第三样本隐变量生成第三虚拟人脸图像,根据该第三虚拟人脸图像和第二虚拟人脸图像之间的差值,确定该面部信息损失参数。其中,根据第三样本隐变量生成第三虚拟人脸图像的过程,与步骤S23中的步骤(1)相似,在此不再赘述。
在一些实现方式中,分别提取第三虚拟人脸图像和第二虚拟人脸图像的图像特征,基于该两个图像的图像特征之间的相似度,确定该面部信息损失参数。在一些实施例中,通过面部信息损失函数确定该面部信息损失参数。相应的,分别将该第三虚拟人脸图像和第二虚拟人脸图像的图像特征作为该面部信息损失函数的中变量的值,确定该面部信息损失函数中的变量为该第三虚拟人脸图像和第二虚拟人脸图像的图像特征时,该面部信息损失函数的函数值,将该函数值确定为该面部信息损失参数。
在本实现方式中,通过确定该第三虚拟人脸图像和第二虚拟人脸图像之间的图像差异,确定该面部信息损失参数,以便通过该面部信息损失参数对待训练的编码器和待训练的解码器进行模型参数调整,从而保证了训练得到的编码器和解码器能够通过表情参数控制面部参数中的表情参数,而不对面部参数生成的图像产生影响,提高了编码器和解码器的准确性。
在步骤S46中,基于该表情信息损失参数和该面部信息损失参数,对该待训练的编码器和该待训练的解码器进行模型训练,得到训练完成的编码器和解码器。
表情信息损失参数和面部信息损失参数收敛指表情信息损失参数小于第一预设阈值,和/或,面部信息损失参数小于第二预设阈值,确定完成训练 。其中,第一预设阈值和第二预设阈值根据需要进行设置,且第一预设阈值和第二预设阈值相同或者不同,在本公开实施例中,对此均不作具体限定。
在本步骤中,响应于表情信息损失参数和面部信息损失参数中存在至少一个损失参数不小于其对应的预设阈值,则通过该编码器和该解码器确定的表情信息损失参数和面部信息损失参数不收敛,继续执行步骤S43-S45,对编码器和解码器的参数进行调整,直到通过该编码器和该解码器确定的表情信息损失参数和面部信息损失参数收敛,得到训练完成的编码器和解码器。
在本公开实施例中,通过表情信息损失参数和面部信息损失参数对编码器和解码器进行训练,使得训练得到的编码器和解码器能够基于表情参数调整面部参数,生成调整后的面部参数,这样在生成面部表情图像的过程中,能够基于调整后的面部参数,生成该表情参数对应的准确定的面部表情图像,提高了获取面部表情图像的精确度,降低了获取面部表情图像的难度。
在完成编码器和解码器的训练后,能够基于编码器和解码器对第一隐变量进行调整,再基于调整后的第二隐变量生成图像。参见图8,将第一隐变量输入至编码器中,通过将编码器输出的面部特征与表情参数输入解码器中,通过解码器进行解码,得到第二隐变量,将该第二隐变量输入至图像生成模型,得到面部表情图像。在本公开实施例提供的方法中,通过编码器和解码器,实现对第一隐变量中表情参数的控制,从而生成目标表情参数的面部表情图像。参见图9,图9是根据一示例性实施例示出的一种图像生成方法的流程图,如图9所示,该方法包括以下步骤。
在步骤S91中,确定用于生成人脸图像的第一隐变量。
在一些实施例中,事先存储不同面部图像对应的第一隐变量,在本步骤中直接调用事先存储的任一第一隐变量。在一些实施例中,接收用户输入的第一隐变量。其中,该第一隐变量为与图像生成模型匹配的面部参数,以便图像生成模型能够基于该第一隐变量生成面部图像。
需要说明的一点是,该第一隐变量与第一样本隐变量相同或者不同,在本公开实施例中,对此不作具体限定。
在步骤S92中,将该第一隐变量输入至编码器,得到该第一隐变量的面部特征。
本步骤与步骤S42中的步骤(2)相似,在此不再赘述。
在步骤S93中,确定目标表情参数。
在一些实施例中,事先存储多种表情参数,在本步骤中,从事先存储的多种表情参数中确定该目标表情参数。其中,该事先存储的多种表情参数为用户输入的表情参数,或者,为模型训练过程中存储的样本图像的表情参数。相应的,在训练编码器和解码器的过程中,将提取的样本图像的表情参数进行存储。
在一些实施例中,从目标图像中提取该目标表情参数。该过程通过步骤(1)-(2)实现,包括:
(1)获取第一目标图像。
该第一目标图像为用于确认的具有目标面部表情的图像。在一些实施例中,接收用户输入的第一目标图像。
(2)将该第一目标图像输入至三维重建网络,得到该目标表情参数。
本步骤与步骤S42中的步骤(1)相似,在此不再赘述。
在本实现方式中,通过提取第一目标图像中的表情参数确定该表情参数,使表情参数可视化,提高了确定的表情参数的准确性。
在步骤S94中,将该第一隐变量的面部特征和该目标表情参数输入至解码器中,得到该调整后的面部特征。
该解码器用于基于该表情参数,调整该面部特征中的表情特征。
在步骤S95中,通过解码器对该调整后的面部特征进行解码,得到第二隐变量。
在步骤S96中,基于该第二隐变量,生成该目标表情参数面部表情图像。
该过程与步骤S43中的步骤(1)相似,在此不再赘述。
在本公开实施例中,基于目标表情参数对第一隐变量进行调整,基于调整后的第二隐变量生成面部表情图像,由于在参数调整的过程中,只调整了第一隐变量中的表情参数,而对于第一隐变量中的其他参数并未进行调整,这样实现了通过表情参数控制面部图像中的表情,而不对面部表情图像中的其他因素产生影响,从而提高了获取的面部表情图像的准确率,进而降低了获取面部表情图像的难度。
需要说明的一点是,在执行完步骤S91-S96后,能够重新调整目标表情参数或者调整第一隐变量再重复执行步骤S91-S96,实现得到多张图像。相应的,在一些实施例中,更改表情参数,得到新的表情参数;基于该第一隐变量和该新的表情参数,生成新的面部表情图像。在一些实施例中,更改第一隐变量,得到新的第一隐变量;基于该新的第一隐变量和该表情参数生成新的面部表情图像。
在本实现方式中,通过更改表情参数得到同一目标对象的不同面部表情图像,或者,通过更改第一隐变量得到相同表情的不同目标对象的面部表情图像,从而实现在对面部表情处理模型进行模型训练的过程中,能够基于不同的面部表情处理模型的要求,对面部表情图像进行标注,得到不同的训练样本,实现对面部表情处理模型进行模型训练,从而降低了获取模型训练的训练样本的难度。
在一些实施例中,通过步骤S91-S96生成多组样本图像,根据该多组样本图像训练图像处理模型,基于训练的图像处理模型对待处理的图像进行图像处理。参见图10,图10是根据一示例性实施例示出的一种图像处理模型的训练方法的流程图,如图10所示,该方法包括以下步骤。
在步骤S101中,获取第二目标图像。
本步骤与步骤S93中的步骤(1)相似,再次不再赘述。
在步骤S102中,基于该第二目标图像生成多个面部图像。
其中,该多个面部图像的面部表情与该第二目标图像的面部表情相同,该多个面部图像基于上述图像生成方法生成。相应的,在本步骤中,将第二目标图像的表情参数作为目标表情参数,通过步骤S91-S96生成多个面部图像。
在步骤S103中,将该第二目标图像和该多个面部图像确定为样本集合。
在本步骤中,将同一第二目标图像对应的多个面部图像确定为一个样本集合。
在步骤S104中,将第三目标图像输入至待训练的图像处理模型,通过该待训练的图像处理模型对该第三目标图像的面部特征进行更改,得到第四目标图像。
该第三目标图像为该样本集合中的任一图像。
在本步骤中,从样本集合中随机确定第三目标图像,将该第三目标图像输入至待训练的图像处理模型,得到第四目标图像。
在步骤S105中,根据该第四目标图像与该第三图像的差值,确定该图像处理模型的模型损失参数。
在本步骤中,确定第三目标图像和第四目标图像的图像特征,根据第三目标图像和第四目标图像的图像特征,确定第三目标图像和第四目标图像之间的差值,进而确定该模型损失参数。其中,该模型损失参数与第三图像和第四图像之间的差值正相关。
在步骤S106中,根据该模型损失参数对该待处理的图像处理模型进行参数调整,得到训练完成的图像处理模型。
响应于该模型损失参数小于第三预设阈值,确定该图像处理模型训练完成。响应于该模型损失参数不小于第三预设阈值,调整该图像处理模型的模型参数,重新执行步骤S101-106,直到该模型损失参数小于第三预设阈值。
在本公开实施例中,通过模型生成样本集合对待训练的图像处理模型进行模型训练,这样无需采集样本集合,简化了模型训练过程中获取样本集合的过程,提高了模型训练的效率。
在训练完图像处理模型后,能够通过该图像处理模型队待更改面部表情的图像进行面部表情更改。参见图11,图11是根据一示例性实施例示出的一种图像处理方法的流程图,如图11所示,该方法包括以下步骤。
在步骤S111中,获取待更改面部表情的图像和目标表情图像。
在步骤S112中,将该目标表情图像输入至三维重建网络,得到目标表情参数。
该目标表情参数为该目标表情图像的表情参数。
本步骤与步骤S22中的步骤(1)相似,再次不再赘述。
在步骤S113中,将该待更改面部表情的图像和该目标表情参数输入至图像处理模型,得到更改面部表情后的图像。
该更改面部表情后的图像的面部表情与该目标表情图像的面部表情相同。
在本公开实施中,通过图像处理模型对待更改面部表情的图像进行图像处理,使得该待更改面部表情的图像的表情的目标表情,从而实现对图像中面部表情的控制,简化了更改图像中面部表情的过程,提高了更改面部表情的精准度。
图12是根据一示例性实施例示出的一种图像生成装置框图。参照图12,该装置包括第一确定单元1201,编码单元1202,第一获取单元1203,解码单元1204和第一生成单元1205。
第一确定单元1201,被配置为执行确定用于生成人脸图像的第一隐变量;
编码单元1202,被配置为执行将该第一隐变量输入至编码器,得到该第一隐变量的面部特征;
第一获取单元1203,被配置为执行获取目标表情参数;
解码单元1204,被配置为执行将该第一隐变量的面部特征和该目标表情参数输入至解码器中,通过该解码器将该第一隐变量对应的表情参数调整为该目标表情参数,得到第二隐变量;
第一生成单元1205,被配置执行基于该第二隐变量,生成该目标表情参数对应的面部表情图像。
在一些实施例中,该编码器和该解码器的训练装置包括:
第二获取单元,被配置为执行获取待训练的编码器、待训练的解码器、样本图像和第一样本隐变量;
第一参数调整单元,被配置为执行通过该待训练的编码器和该待训练的解码器,将该第一样本隐变量对应的表情参数调整为该样本图像对应的表情参数,得到第二样本隐变量;
第二确定单元,被配置为执行根据第一虚拟人脸图像对应的表情参数和该样本图像对应的表情参数之间的差值,确定表情信息损失参数,该第一虚拟人脸图像为根据该第二样本隐变量生成的虚拟人脸图像;
第二参数调整单元,被配置为执行通过该待训练的编码器和该待训练的解码器,将该第二样本隐变量对应的表情参数调整为第二虚拟人脸图像对应的表情参数,得到第三样本隐变量,该第二虚拟人脸图像为根据该第一样本隐变量生成的虚拟人脸图像;
第三确定单元,被配置为执行根据该第二虚拟人脸图像和第三虚拟人脸图像之间的差值,确定面部信息损失参数,该第三虚拟人脸图像为根据该第三样本隐变量生成的虚拟人脸图像;
第一模型训练单元,被配置为执行基于该表情信息损失参数和该面部信息损失参数,对该待训练的编码器和该待训练的解码器进行模型训练,得到训练完成的编码器和解码器。
在一些实施例中,该第一参数调整单元包括:
第一参数提取子单元,被配置为执行将该样本图像输入至三维重建网络,得到该样本图像对应的表情参数;
编码子单元,被配置为执行将该第一样本隐变量输入至该待训练的编码器中,得到该第一样本隐变量的面部特征;
解码子单元,被配置为执行将该第一样本隐变量的面部特征和该样本图像对应的表情参数输入至解码器中,通过该解码器将该第一样本隐变量对应的表情参数调整为该样本图像对应的表情参数,得到该第二样本隐变量。
在一些实施例中,该第二参数调整单元包括:
图像生成子单元,被配置为执行将该第一样本隐变量输入至图像生成网络,得到该第二虚拟人脸图像;
第二参数提取子单元,被配置为执行将该第二虚拟人脸图像输入至三维重建网络,得到该第二虚拟人脸图像的表情参数;
参数调整子单元,被配置为执行通过该待训练的编码器和该待训练的解码器,将该第二样本隐变量对应的表情参数调整为该第二虚拟人脸图像对应的表情参数,得到该第三样本隐变量。
在一些实施例中,该第一获取单元1203被配置为执行获取第一目标图像;将该第一目标图像输入至三维重建网络,得到该目标表情参数。
在本公开实施例中,基于目标表情参数对第一隐变量进行调整,基于调整后的第二隐变量生成面部表情图像,由于在参数调整的过程中,只调整了第一隐变量中的表情参数,而对于第一隐变量中的其他参数并未进行调整,这样实现了通过表情参数控制面部图像中的表情,而不对面部表情图像中的其他因素产生影响,从而提高了获取的面部表情图像的准确率,进而降低了获取面部表情图像的难度。
图13是根据一示例性实施例示出的一种图像处理模型的训练装置框图。参照图13,该装置包括第三获取单元1301,第二生成单元1302,第四确定单元1303,第一获取单元1203,第一特征更改单元1304,第五确定单元1305和第二模型训练单元1306。
第三获取单元1301,被配置为执行获取第二目标图像;
第二生成单元1302,被配置执行基于该第二目标图像生成多个面部图像,该多个面部图像的面部表情与该第二目标图像的面部表情相同,该多个面部图像基于本公开实施例第四方面任一项该的图像生成装置生成;
第四确定单元1303,被配置为执行将该第二目标图像和该多个面部图像确定为样本集合;
第一特征更改单元1304,被配置为执行将第三目标图像输入至待训练的图像处理模型,通过该待训练的图像处理模型对该第三目标图像的面部特征进行更改,得到第四目标图像,该第三目标图像为该样本集合中的任一图像;
第五确定单元1305,被配置为执行根据该第四目标图像与该第三图像的差值,确定该图像处理模型的模型损失参数;
第二模型训练单元1306,被配置为执行根据该模型损失参数对该待处理的图像处理模型进行参数调整,得到训练完成的图像处理模型。
在本公开实施例中,通过模型生成样本集合对待训练的图像处理模型进行模型训练,这样无需采集样本集合,简化了模型训练过程中获取样本集合的过程,提高了模型训练的效率。
图14是根据一示例性实施例示出的一种图像处理装置框图。参照图14,该装置包括第四获取单元1401,参数提取单元1402和第二特征更改单元1403。
第四获取单元1401,被配置为执行获取待更改面部表情的图像和目标表情图像;
参数提取单元1402,被配置为执行将该目标表情图像输入至三维重建网络,得到目标表情参数,该目标表情参数为该目标表情图像的表情参数;
第二特征更改单元1403,被配置为执行将该待更改面部表情的图像和该目标表情参数输入至图像处理模型,得到更改面部表情后的图像,该更改面部表情后的图像的面部表情与该目标表情图像的面部表情相同。
在本公开实施中,通过图像处理模型对待更改面部表情的图像进行图像处理,使得该待更改面部表情的图像的表情的目标表情,从而实现对图像中面部表情的控制,简化了更改图像中面部表情的过程,提高了更改面部表情的精准度。
电子设备为终端或服务器。在一些实施例中,电子设备为用于提供本公开所提供的图像生成方法的终端。图15示出了本公开一个示例性实施例提供的终端1500的结构框图。在一些实施例中,该终端1500是便携式移动终端,比如:智能手机、平板电脑、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1500还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1500包括有:处理器1501和存储器1502。
在一些实施例中,处理器1501包括一个或多个处理核心,比如4核心处理器、8核心处理器等。在一些实施例中,处理器1501采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(ProgrammableLogic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。在一些实施例中,处理器1501也包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central Processing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1501集成有GPU(GraphicsProcessing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1501还包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
在一些实施例中,存储器1502包括一个或多个计算机可读存储介质,该计算机可读存储介质是非暂态的。存储器1502还包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1502中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1501所执行以实现本公开中方法实施例提供的图像生成方法。
在一些实施例中,终端1500还可选包括有:外围设备接口1503和至少一个外围设备。在一些实施例中,处理器1501、存储器1502和外围设备接口1503之间通过总线或信号线相连。各个外围设备通过总线、信号线或电路板与外围设备接口1503相连。可选地,外围设备包括:射频电路1504、显示屏1505、摄像头组件1506、音频电路1507、定位组件1508和电源1509中的至少一种。
外围设备接口1503可被用于将I/O(Input /Output,输入/输出)相关的至少一个外围设备连接到处理器1501和存储器1502。在一些实施例中,处理器1501、存储器1502和外围设备接口1503被集成在同一芯片或电路板上;在一些其他实施例中,处理器1501、存储器1502和外围设备接口1503中的任意一个或两个在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1504用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1504通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1504将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1504包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。在一些实施例中,射频电路1504通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1504还包括NFC(Near Field Communication,近距离无线通信)有关的电路,本公开对此不加以限定。
显示屏1505用于显示UI(User Interface,用户界面)。在一些实施例中,该UI包括图形、文本、图标、视频及其它们的任意组合。当显示屏1505是触摸显示屏时,显示屏1505还具有采集在显示屏1505的表面或表面上方的触摸信号的能力。在一些实施例中,该触摸信号作为控制信号输入至处理器1501进行处理。此时,显示屏1505还用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1505为一个,设置在终端1500的前面板;在另一些实施例中,显示屏1505为至少两个,分别设置在终端1500的不同表面或呈折叠设计;在另一些实施例中,显示屏1505是柔性显示屏,设置在终端1500的弯曲表面上或折叠面上。甚至,显示屏1505还设置成非矩形的不规则图形,也即异形屏。在一些实施例中显示屏1505采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1506用于采集图像或视频。可选地,摄像头组件1506包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1506还包括闪光灯。闪光灯是单色温闪光灯,或者,是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,用于不同色温下的光线补偿。
在一些实施例中,音频电路1507包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1501进行处理,或者输入至射频电路1504以实现语音通信。在一些实施例中,出于立体声采集或降噪的目的,麦克风为多个,分别设置在终端1500的不同部位。在一些实施例中,麦克风还是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1501或射频电路1504的电信号转换为声波。在一些实施例中,扬声器是传统的薄膜扬声器,或者,是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅能够将电信号转换为人类可听见的声波,也能够将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1507还包括耳机插孔。
定位组件1508用于定位终端1500的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。在一些实施例中,定位组件1508是基于美国的GPS(Global Positioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源1509用于为终端1500中的各个组件进行供电。在一些实施例中,电源1509是交流电、直流电、一次性电池或可充电电池。当电源1509包括可充电电池时,该可充电电池是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还用于支持快充技术。
在一些实施例中,终端1500还包括有一个或多个传感器1510。该一个或多个传感器1510包括但不限于:加速度传感器1511、陀螺仪传感器1512、压力传感器1513、指纹传感器1514、光学传感器1515以及接近传感器1516。
在一些实施例中,加速度传感器1511检测以终端1500建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1511用于检测重力加速度在三个坐标轴上的分量。在一些实施例中,处理器1501根据加速度传感器1511采集的重力加速度信号,控制显示屏1505以横向视图或纵向视图进行用户界面的显示。在一些实施例中,加速度传感器1511还用于游戏或者用户的运动数据的采集。
在一些实施例中,陀螺仪传感器1512检测终端1500的机体方向及转动角度,陀螺仪传感器1512与加速度传感器1511协同采集用户对终端1500的3D动作。处理器1501根据陀螺仪传感器1512采集的数据,能够实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
在一些实施例中,压力传感器1513设置在终端1500的侧边框和/或显示屏1505的下层。当压力传感器1513设置在终端1500的侧边框时,能够检测用户对终端1500的握持信号,由处理器1501根据压力传感器1513采集的握持信号进行左右手识别或快捷操作。当压力传感器1513设置在显示屏1505的下层时,由处理器1501根据用户对显示屏1505的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1514用于采集用户的指纹,由处理器1501根据指纹传感器1514采集到的指纹识别用户的身份,或者,由指纹传感器1514根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1501授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。在一些实施例中,指纹传感器1514被设置在终端1500的正面、背面或侧面。在一些实施例中,当终端1500上设置有物理按键或厂商Logo时,指纹传感器1514与物理按键或厂商Logo集成在一起。
光学传感器1515用于采集环境光强度。在一个实施例中,处理器1501根据光学传感器1515采集的环境光强度,控制显示屏1505的显示亮度。具体地,当环境光强度较高时,调高显示屏1505的显示亮度;当环境光强度较低时,调低显示屏1505的显示亮度。在另一个实施例中,处理器1501还根据光学传感器1515采集的环境光强度,动态调整摄像头组件1506的拍摄参数。
接近传感器1516,也称距离传感器,通常设置在终端1500的前面板。接近传感器1516用于采集用户与终端1500的正面之间的距离。在一个实施例中,当接近传感器1516检测到用户与终端1500的正面之间的距离逐渐变小时,由处理器1501控制显示屏1505从亮屏状态切换为息屏状态;当接近传感器1516检测到用户与终端1500的正面之间的距离逐渐变大时,由处理器1501控制显示屏1505从息屏状态切换为亮屏状态。
本领域技术人员能够理解,图15中示出的结构并不构成对终端1500的限定,能够包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在一些实施例中,电子设备为用于提供本公开所提供的图像生成方法的服务器。图16示出了本公开一个示例性实施例提供的服务器1600的结构框图。在一些实施例中,该服务器1600可因配置或性能不同而产生比较大的差异,包括一个或一个以上处理器(Central Processing Units,CPU)1601和一个或一个以上的存储器1602,其中,所述存储器801中存储有至少一条指令,所述至少一条指令由所述处理器1601加载并执行以实现上述各个方法实施例提供的目标对象的检索方法。当然,在一些实施例中,该服务器1600还具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器1600还包括其他用于实现设备功能的部件,在此不做赘述。
本公开实施例还提供了一种计算机可读存储介质,当该计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本公开实施例第一方面中任一项该的图像生成方法。
本公开实施例还提供了一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行时实现如本公开实施例第一方面中任一项所述的图像生成方法;或者,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行时实现如本公开实施例第二方面所述的图像处理模型的训练方法;或者,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行时实现如本公开实施例第三方面所述的图像处理方法。
本公开实施例还提供了一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行如本公开实施例第一方面中任一项所述的图像生成方法;或者,所述计算机指令被处理器执行如本公开实施例第二方面所述的图像处理模型的训练方法;或者,所述计算机指令被处理器执行时实现如本公开实施例第三方面所述的图像处理方法。
本领域普通技术人员能够理解实现上述实施例的全部或部分步骤能够通过硬件来完成,也能够通过程序来指令相关的硬件完成,程序能存储于一种计算机可读存储介质中,上述提到的存储介质是只读存储器、磁盘或光盘等。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中执行了详细描述,此处将不做详细阐述说明。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且能够在不脱离其范围执行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (16)

1.一种图像生成方法,其特征在于,所述方法包括:
确定用于生成人脸图像的第一隐变量;
将所述第一隐变量输入至编码器,得到所述第一隐变量的面部特征;
获取目标表情参数;
将所述第一隐变量的面部特征和所述目标表情参数输入至解码器中,通过所述解码器将所述第一隐变量对应的表情参数调整为所述目标表情参数,得到第二隐变量;
基于所述第二隐变量,生成所述目标表情参数对应的面部表情图像。
2.根据权利要求1所述的方法,其特征在于,所述编码器和所述解码器的训练方法包括:
获取待训练的编码器、待训练的解码器、样本图像和第一样本隐变量;
通过所述待训练的编码器和所述待训练的解码器,将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到第二样本隐变量;
根据第一虚拟人脸图像对应的表情参数和所述样本图像对应的表情参数之间的差值,确定表情信息损失参数,所述第一虚拟人脸图像为根据所述第二样本隐变量生成的虚拟人脸图像;
通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为第二虚拟人脸图像对应的表情参数,得到第三样本隐变量,所述第二虚拟人脸图像为根据所述第一样本隐变量生成的虚拟人脸图像;
根据所述第二虚拟人脸图像和第三虚拟人脸图像之间的差值,确定面部信息损失参数,所述第三虚拟人脸图像为根据所述第三样本隐变量生成的虚拟人脸图像;
基于所述表情信息损失参数和所述面部信息损失参数,对所述待训练的编码器和所述待训练的解码器进行模型训练,得到训练完成的编码器和解码器。
3.根据权利要求2所述的方法,其特征在于,所述通过所述待训练的编码器和所述待训练的解码器,将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到第二样本隐变量,包括:
将所述样本图像输入至三维重建网络,得到所述样本图像对应的表情参数;
将所述第一样本隐变量输入至所述待训练的编码器中,得到所述第一样本隐变量的面部特征;
将所述第一样本隐变量的面部特征和所述样本图像对应的表情参数输入至解码器中,通过所述解码器将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到所述第二样本隐变量。
4.根据权利要求2所述的方法,其特征在于,所述通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为第二虚拟人脸图像对应的表情参数,得到第三样本隐变量,包括:
将所述第一样本隐变量输入至图像生成网络,得到所述第二虚拟人脸图像;
将所述第二虚拟人脸图像输入至三维重建网络,得到所述第二虚拟人脸图像的表情参数;
通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为所述第二虚拟人脸图像对应的表情参数,得到所述第三样本隐变量。
5.根据权利要求1所述的方法,其特征在于,所述获取目标表情参数,包括:
获取第一目标图像;
将所述第一目标图像输入至三维重建网络,得到所述目标表情参数。
6.一种图像处理模型的训练方法,其特征在于,所述方法包括:
获取第二目标图像;
基于所述第二目标图像生成多个面部图像,所述多个面部图像的面部表情与所述第二目标图像的面部表情相同,所述多个面部图像基于权利要求1-5任一项所述的图像生成方法生成;
将所述第二目标图像和所述多个面部图像确定为样本集合;
将第三目标图像输入至待训练的图像处理模型,通过所述待训练的图像处理模型对所述第三目标图像的面部特征进行更改,得到第四目标图像,所述第三目标图像为所述样本集合中的任一图像;
根据所述第四目标图像与所述第三目标图像的差值,确定所述图像处理模型的模型损失参数;
根据所述模型损失参数对所述待处理的图像处理模型进行参数调整,得到训练完成的图像处理模型。
7.一种图像处理方法,其特征在于,所述方法应用于权利要求6所述图像处理模型,所述方法包括:
获取待更改面部表情的图像和目标表情图像;
将所述目标表情图像输入至三维重建网络,得到目标表情参数,所述目标表情参数为所述目标表情图像的表情参数;
将所述待更改面部表情的图像和所述目标表情参数输入至图像处理模型,得到更改面部表情后的图像,所述更改面部表情后的图像的面部表情与所述目标表情图像的面部表情相同。
8.一种图像生成装置,其特征在于,所述装置包括:
第一确定单元,被配置为执行确定用于生成人脸图像的第一隐变量;
编码单元,被配置为执行将所述第一隐变量输入至编码器,得到所述第一隐变量的面部特征;
第一获取单元,被配置为执行获取目标表情参数;
解码单元,被配置为执行将所述第一隐变量的面部特征和所述目标表情参数输入至解码器中,通过所述解码器将所述第一隐变量对应的表情参数调整为所述目标表情参数,得到第二隐变量;
第一生成单元,被配置执行基于所述第二隐变量,生成所述目标表情参数对应的面部表情图像。
9.根据权利要求8所述的装置,其特征在于,所述编码器和所述解码器的训练装置包括:
第二获取单元,被配置为执行获取待训练的编码器、待训练的解码器、样本图像和第一样本隐变量;
第一参数调整单元,被配置为执行通过所述待训练的编码器和所述待训练的解码器,将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到第二样本隐变量;
第二确定单元,被配置为执行根据第一虚拟人脸图像对应的表情参数和所述样本图像对应的表情参数之间的差值,确定表情信息损失参数,所述第一虚拟人脸图像为根据所述第二样本隐变量生成的虚拟人脸图像;
第二参数调整单元,被配置为执行通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为第二虚拟人脸图像对应的表情参数,得到第三样本隐变量,所述第二虚拟人脸图像为根据所述第一样本隐变量生成的虚拟人脸图像;
第三确定单元,被配置为执行根据所述第二虚拟人脸图像和第三虚拟人脸图像之间的差值,确定面部信息损失参数,所述第三虚拟人脸图像为根据所述第三样本隐变量生成的虚拟人脸图像;
第一模型训练单元,被配置为执行基于所述表情信息损失参数和所述面部信息损失参数,对所述待训练的编码器和所述待训练的解码器进行模型训练,得到训练完成的编码器和解码器。
10.根据权利要求9所述的装置,其特征在于,所述第一参数调整单元包括:
第一参数提取子单元,被配置为执行将所述样本图像输入至三维重建网络,得到所述样本图像对应的表情参数;
编码子单元,被配置为执行将所述第一样本隐变量输入至所述待训练的编码器中,得到所述第一样本隐变量的面部特征;
解码子单元,被配置为执行将所述第一样本隐变量的面部特征和所述样本图像对应的表情参数输入至解码器中,通过所述解码器将所述第一样本隐变量对应的表情参数调整为所述样本图像对应的表情参数,得到所述第二样本隐变量。
11.根据权利要求9所述的装置,其特征在于,所述第二参数调整单元包括:
图像生成子单元,被配置为执行将所述第一样本隐变量输入至图像生成网络,得到所述第二虚拟人脸图像;
第二参数提取子单元,被配置为执行将所述第二虚拟人脸图像输入至三维重建网络,得到所述第二虚拟人脸图像的表情参数;
参数调整子单元,被配置为执行通过所述待训练的编码器和所述待训练的解码器,将所述第二样本隐变量对应的表情参数调整为所述第二虚拟人脸图像对应的表情参数,得到所述第三样本隐变量。
12.根据权利要求8所述的装置,其特征在于,所述第一获取单元被配置为执行获取第一目标图像;将所述第一目标图像输入至三维重建网络,得到所述目标表情参数。
13.一种图像处理模型的训练装置,其特征在于,所述装置包括:
第三获取单元,被配置为执行获取第二目标图像;
第二生成单元,被配置执行基于所述第二目标图像生成多个面部图像,所述多个面部图像的面部表情与所述第二目标图像的面部表情相同,所述多个面部图像基于权利要求8-12任一项所述的图像生成装置生成;
第四确定单元,被配置为执行将所述第二目标图像和所述多个面部图像确定为样本集合;
第一特征更改单元,被配置为执行将第三目标图像输入至待训练的图像处理模型,通过所述待训练的图像处理模型对所述第三目标图像的面部特征进行更改,得到第四目标图像,所述第三目标图像为所述样本集合中的任一图像;
第五确定单元,被配置为执行根据所述第四目标图像与所述第三目标图像的差值,确定所述图像处理模型的模型损失参数;
第二模型训练单元,被配置为执行根据所述模型损失参数对所述待处理的图像处理模型进行参数调整,得到训练完成的图像处理模型。
14.一种图像处理装置,其特征在于,所述装置应用于权利要求13所述图像处理模型,所述装置包括:
第四获取单元,被配置为执行获取待更改面部表情的图像和目标表情图像;
参数提取单元,被配置为执行将所述目标表情图像输入至三维重建网络,得到目标表情参数,所述目标表情参数为所述目标表情图像的表情参数;
第二特征更改单元,被配置为执行将所述待更改面部表情的图像和所述目标表情参数输入至图像处理模型,得到更改面部表情后的图像,所述更改面部表情后的图像的面部表情与所述目标表情图像的面部表情相同。
15.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-5中任一项所述的图像生成方法;或者,所述处理器被配置为执行所述指令,以实现如权利要求6所述的图像处理模型的训练方法;或者,所述处理器被配置为执行所述指令,以实现如权利要求7所述的图像处理方法。
16.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1-5中任一项所述的图像生成方法;或者,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求6所述的图像处理模型的训练方法;或者,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求6所述的图像处理方法。
CN202110087579.XA 2021-01-22 2021-01-22 图像生成、图像处理模型的训练、图像处理方法和装置 Active CN112907725B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110087579.XA CN112907725B (zh) 2021-01-22 2021-01-22 图像生成、图像处理模型的训练、图像处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110087579.XA CN112907725B (zh) 2021-01-22 2021-01-22 图像生成、图像处理模型的训练、图像处理方法和装置

Publications (2)

Publication Number Publication Date
CN112907725A CN112907725A (zh) 2021-06-04
CN112907725B true CN112907725B (zh) 2023-09-26

Family

ID=76116947

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110087579.XA Active CN112907725B (zh) 2021-01-22 2021-01-22 图像生成、图像处理模型的训练、图像处理方法和装置

Country Status (1)

Country Link
CN (1) CN112907725B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113870399B (zh) * 2021-09-23 2022-12-02 北京百度网讯科技有限公司 表情驱动方法、装置、电子设备及存储介质
CN117894045A (zh) * 2022-10-08 2024-04-16 北京字跳网络技术有限公司 图像处理方法、装置、设备及存储介质
CN115984947B (zh) * 2023-02-21 2023-06-27 北京百度网讯科技有限公司 图像生成方法、训练方法、装置、电子设备以及存储介质
CN116229214B (zh) * 2023-03-20 2023-12-01 北京百度网讯科技有限公司 模型训练方法、装置及电子设备
CN116630147B (zh) * 2023-07-24 2024-02-06 北京隐算科技有限公司 一种基于强化学习的人脸图像编辑方法
CN116631042B (zh) * 2023-07-25 2023-10-13 数据空间研究院 表情图像生成、表情识别模型、方法、系统和存储器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110415166A (zh) * 2019-07-29 2019-11-05 腾讯科技(深圳)有限公司 融合图像处理模型的训练方法、图像处理方法、装置及存储介质
CN111582059A (zh) * 2020-04-20 2020-08-25 哈尔滨工程大学 一种基于变分自编码器的人脸表情识别方法
CN111652049A (zh) * 2020-04-17 2020-09-11 北京三快在线科技有限公司 人脸图像处理模型训练方法、装置、电子设备及存储介质
CN112233012A (zh) * 2020-08-10 2021-01-15 上海交通大学 一种人脸生成系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200090392A1 (en) * 2018-09-19 2020-03-19 XRSpace CO., LTD. Method of Facial Expression Generation with Data Fusion

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110415166A (zh) * 2019-07-29 2019-11-05 腾讯科技(深圳)有限公司 融合图像处理模型的训练方法、图像处理方法、装置及存储介质
CN111652049A (zh) * 2020-04-17 2020-09-11 北京三快在线科技有限公司 人脸图像处理模型训练方法、装置、电子设备及存储介质
CN111582059A (zh) * 2020-04-20 2020-08-25 哈尔滨工程大学 一种基于变分自编码器的人脸表情识别方法
CN112233012A (zh) * 2020-08-10 2021-01-15 上海交通大学 一种人脸生成系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
分层人脸模型及其真实感风格表情合成;熊磊,毕笃彦,何林远,李权合;计算机辅助设计与图形学学报;第25卷(第8期);全文 *

Also Published As

Publication number Publication date
CN112907725A (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN110502954B (zh) 视频分析的方法和装置
CN112907725B (zh) 图像生成、图像处理模型的训练、图像处理方法和装置
CN110992493B (zh) 图像处理方法、装置、电子设备及存储介质
CN109977775B (zh) 关键点检测方法、装置、设备及可读存储介质
CN109558837B (zh) 人脸关键点检测方法、装置及存储介质
CN110533585B (zh) 一种图像换脸的方法、装置、系统、设备和存储介质
CN111753784A (zh) 视频的特效处理方法、装置、终端及存储介质
CN112581358B (zh) 图像处理模型的训练方法、图像处理方法及装置
CN111613213B (zh) 音频分类的方法、装置、设备以及存储介质
CN110705614A (zh) 模型训练方法、装置、电子设备及存储介质
CN110991445B (zh) 竖排文字识别方法、装置、设备及介质
CN110677713B (zh) 视频图像处理方法及装置、存储介质
WO2022199102A1 (zh) 图像处理方法及装置
CN110152309B (zh) 语音通信方法、装置、电子设备及存储介质
CN112135191A (zh) 视频编辑方法、装置、终端及存储介质
CN112967261B (zh) 图像融合方法、装置、设备及存储介质
CN110942426B (zh) 图像处理的方法、装置、计算机设备和存储介质
CN114595019A (zh) 应用程序的主题设置方法、装置、设备及存储介质
CN111369434B (zh) 拼接视频封面生成的方法、装置、设备和存储介质
CN111488895B (zh) 对抗数据生成方法、装置、设备及存储介质
CN109388732B (zh) 音乐地图的生成和显示方法、装置及存储介质
CN112399080A (zh) 视频处理方法、装置、终端及计算机可读存储介质
CN110992954A (zh) 语音识别的方法、装置、设备及存储介质
CN113592874A (zh) 图像显示方法、装置和计算机设备
CN113763531B (zh) 三维人脸重建方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant