CN113139566B - 图像生成模型的训练方法及装置、图像处理方法及装置 - Google Patents
图像生成模型的训练方法及装置、图像处理方法及装置 Download PDFInfo
- Publication number
- CN113139566B CN113139566B CN202010067758.2A CN202010067758A CN113139566B CN 113139566 B CN113139566 B CN 113139566B CN 202010067758 A CN202010067758 A CN 202010067758A CN 113139566 B CN113139566 B CN 113139566B
- Authority
- CN
- China
- Prior art keywords
- target
- image
- target object
- generation model
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 83
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000003672 processing method Methods 0.000 title claims abstract description 25
- 238000012545 processing Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 241000887125 Chaptalia nutans Species 0.000 claims description 3
- 230000006854 communication Effects 0.000 description 36
- 238000004891 communication Methods 0.000 description 35
- 238000010586 diagram Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 18
- 230000005540 biological transmission Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 5
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000010295 mobile communication Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000012905 input function Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000010897 surface acoustic wave method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本公开关于一种图像生成模型的训练方法及装置、图像处理方法及装置。其中,该训练方法包括:获取包含目标对象的多个历史目标图像;对多个历史目标图像中的目标对象进行目标特征引导信息的识别,以得到多个包含目标对象的目标特征引导信息的样本图像,该目标特征引导信息用于引导生成具有目标特征的目标对象;将样本图像输入待训练的图像生成模型,得到训练输出图像,该训练输出图像包含目标对象;根据同一样本图像对应的训练输出图像和历史目标图像计算损失值,并利用损失值调整模型参数,直至满足预设收敛条件,得到图像生成模型。本公开实施例可以为后续准确地控制生成目标对象的特征提供条件。
Description
技术领域
本公开涉及图像生成技术领域,尤其涉及一种图像生成模型的训练方法及装置、图像处理方法及装置、电子设备和存储介质。
背景技术
随着计算机技术的发展,图像生成技术已经深入到我们生活中的方方面面,例如,图像生成技术可以帮助模拟生成人的头发。相关技术中,采用以下装置生成人的头发:首先输入一个512维的随机噪声,然后通过一个8层的全连接(fully connected,简称FC)网络进行特征重映射,最后通过合成网络(synthesis network)从低分辨率逐渐生成高分辨率的图像。
但是,上述生成头发的过程中,输入的是随机噪声,无法准确地控制生成的头发的特征。
发明内容
本公开提供一种图像生成模型的训练方法及装置、图像处理方法及装置、电子设备和存储介质,以至少解决无法准确地控制生成的头发的特征的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种图像生成模型的训练方法,包括:
获取包含目标对象的多个历史目标图像;
对多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,所述目标特征引导信息用于引导生成具有目标特征的所述目标对象;
将所述样本图像输入待训练的图像生成模型,得到训练输出图像,所述训练输出图像包含所述目标对象,所述目标对象具有与所述目标特征引导信息对应的目标特征;
根据同一所述样本图像对应的所述训练输出图像和所述历史目标图像计算损失值,并利用所述损失值调整模型参数,直至满足预设收敛条件,得到所述图像生成模型。
在一实施例中,所述目标对象的目标特征引导信息包括所述目标对象所对应的掩膜区域;
所述对多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,包括:
从所述历史目标图像中分割出所述目标对象,得到所述目标对象所对应的掩膜区域;
将所述目标对象所对应的所述掩膜区域设置为白色;
将设置为白色的所述掩膜区域贴回所述历史目标图像的对应区域,得到所述样本图像。
在一实施例中,所述目标对象的目标特征引导信息还包括所述目标对象的颜色;
所述对多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,还包括:
计算分割出的所述掩膜区域的平均颜色值;
将所述掩膜区域的所有像素值均设置为所述平均颜色值;
将设置后的掩膜区域贴回所述历史目标图像的对应区域,得到所述样本图像。
在一实施例中,所述目标对象的目标特征引导信息还包括所述掩膜区域的边缘信息;
所述对多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,还包括:
计算分割出的所述掩膜区域内所述目标对象的边缘信息;
将所述边缘信息贴回所述历史目标图像的对应区域,得到所述样本图像。
在一实施例中,所述目标对象的目标特征引导信息还包括所述目标对象的颜色和所述掩膜区域的边缘信息;
所述对多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,还包括:
计算分割出的所述掩膜区域的平均颜色值和所述目标对象的边缘信息;
将所述掩膜区域的所有像素值均设置为所述平均颜色值;
将设置后的掩膜区域和所述边缘信息贴回所述历史目标图像的对应区域,得到所述样本图像。
在一实施例中,所述目标对象包括头发,所述历史目标图像包括头发和人脸。
根据本公开实施例的第二方面,提供一种图像处理方法,包括:
获得待处理图像,所述待处理图像包含目标对象的目标特征引导信息;
将所述待处理图像输入对应的图像生成模型,得到包含所述目标对象的输出图像;
其中,所述图像生成模型采用上述图像生成模型的训练方法获得。
在一实施例中,所述目标对象的目标特征引导信息包括通过手工绘制或模板选择的所述目标对象的掩膜区域。
在一实施例中,所述目标对象的目标特征引导信息还包括通过手工绘制或模板选择的颜色;和/或
通过手工绘制或模板选择的所述掩膜区域的边缘信息。
根据本公开实施例的第三方面,提供一种图像生成模型的训练装置,包括:
获取模块,被配置为获取包含目标对象的多个历史目标图像;
识别模块,被配置为对所述获取模块获取的多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,所述目标特征引导信息用于引导生成具有目标特征的所述目标对象;
输入获得模块,被配置为将所述识别模块得到的所述样本图像输入待训练的图像生成模型,得到训练输出图像,所述训练输出图像包含所述目标对象,所述目标对象具有与所述目标特征引导信息对应的目标特征;
训练模块,被配置为根据所述输入获得模块得到的同一所述样本图像对应的所述训练输出图像和所述获取模块获取的所述历史目标图像计算损失值,并利用所述损失值调整模型参数,直至满足预设收敛条件,得到所述图像生成模型。
在一实施例中,所述目标对象的目标特征引导信息包括所述目标对象所对应的掩膜区域;
所述识别模块包括:
分割子模块,被配置为从所述历史目标图像中分割出所述目标对象,得到所述目标对象所对应的掩膜区域;
第一设置子模块,被配置为将所述分割子模块得到的所述目标对象所对应的所述掩膜区域设置为白色;
第一贴回子模块,被配置为将所述第一设置子模块设置为白色的所述掩膜区域贴回所述历史目标图像的对应区域,得到所述样本图像。
在一实施例中,所述目标对象的目标特征引导信息还包括所述目标对象的颜色;
所述识别模块还包括:
第一计算子模块,被配置为计算所述分割子模块分割出的所述掩膜区域的平均颜色值;
第二设置子模块,被配置为将所述掩膜区域的所有像素值均设置为所述第一计算子模块计算的所述平均颜色值;
第二贴回子模块,被配置为将所述第二设置子模块设置后的掩膜区域贴回所述历史目标图像的对应区域,得到所述样本图像。
在一实施例中,所述目标对象的目标特征引导信息还包括所述掩膜区域的边缘信息;
所述识别模块还包括:
第二计算子模块,被配置为计算所述分割子模块分割出的所述掩膜区域内所述目标对象的边缘信息;
第三贴回子模块,被配置为将所述第二计算子模块计算的所述边缘信息贴回所述历史目标图像的对应区域,得到所述样本图像。
在一实施例中,所述目标对象的目标特征引导信息还包括所述目标对象的颜色和所述掩膜区域的边缘信息;
所述识别模块还包括:
第三计算子模块,被配置为计算所述分割子模块分割出的所述掩膜区域的平均颜色值和所述目标对象的边缘信息;
第三设置子模块,被配置为将所述掩膜区域的所有像素值均设置为所述第三计算子模块计算的所述平均颜色值;
第四贴回子模块,被配置为将所述第三设置子模块设置后的掩膜区域和所述第三计算子模块计算的所述边缘信息贴回所述历史目标图像的对应区域,得到所述样本图像。
在一实施例中,所述目标对象包括头发,所述历史目标图像包括头发和人脸。
根据本公开实施例的第四方面,提供一种图像处理装置,包括:
获得模块,被配置为获得待处理图像,所述待处理图像包含目标对象的目标特征引导信息;
处理模块,被配置为将所述获得模块获得的所述待处理图像输入对应的图像生成模型,得到包含所述目标对象的输出图像;
其中,所述图像生成模型采用上述图像生成模型的训练装置获得。
在一实施例中,所述目标对象的目标特征引导信息包括通过手工绘制或模板选择的所述目标对象的掩膜区域。
在一实施例中,所述目标对象的目标特征引导信息还包括通过手工绘制或模板选择的颜色;和/或
通过手工绘制或模板选择的所述掩膜区域的边缘信息。
根据本公开实施例的第五方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述图像生成模型的训练方法。
根据本公开实施例的第六方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述图像生成模型的训练方法。
根据本公开实施例的第七方面,提供一种计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行上述图像生成模型的训练方法。
根据本公开实施例的第八方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现上述图像处理方法。
根据本公开实施例的第九方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述图像处理方法。
根据本公开实施例的第十方面,提供一种计算机程序产品,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行上述图像处理方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过对获取的多个历史目标图像中的目标对象进行目标特征引导信息的识别来得到多个样本图像,并基于样本图像、历史目标图像和训练输出图像生成图像生成模型,从而为后续准确地控制生成目标对象的特征提供条件。
通过获得包含目标对象的目标特征引导信息的待处理图像,并将待处理图像输入对应的图像生成模型,得到包含目标对象的输出图像,由于待处理图像包含目标对象的目标特征引导信息,该目标特征引导信息用于引导生成具有目标特征的目标对象,因此,使得输出图像可以包含具有目标特征的目标对象,从而达到准确地控制生成具有目标特征的目标对象的目的。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1A是本公开一示例性实施例示出的一种图像生成模型的训练方法的流程图。
图1B是本公开一示例性实施例示出的一种图像处理方法的流程图。
图2是本公开一示例性实施例示出的待处理图像的示意图一。
图3是本公开一示例性实施例示出的输出图像的示意图一。
图4是本公开一示例性实施例示出的待处理图像的示意图二。
图5是本公开一示例性实施例示出的输出图像的示意图二。
图6是本公开一示例性实施例示出的一种图像生成模型的训练装置的框图。
图7是本公开一示例性实施例示出的另一种图像生成模型的训练装置的框图。
图8是本公开一示例性实施例示出的另一种图像生成模型的训练装置的框图。
图9是本公开一示例性实施例示出的另一种图像生成模型的训练装置的框图。
图10是本公开一示例性实施例示出的另一种图像生成模型的训练装置的框图。
图11是本公开一示例性实施例示出的一种图像处理装置的框图。
图12是本公开一示例性实施例示出的一种电子设备的框图。
图13是本公开一示例性实施例示出的一种适用于图像生成模型的训练方法的设备的框图。
图14是本公开一示例性实施例示出的另一种电子设备的框图。
图15是本公开一示例性实施例示出的一种适用于图像处理方法的设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和装置的例子。
图1A是本公开一示例性实施例示出的一种图像生成模型的训练方法的流程图,如图1A所示,该图像生成模型的训练方法包括以下步骤:
在步骤S101中,获取包含目标对象的多个历史目标图像。
其中,目标对象可以包括头发,历史目标图像可以包括头发和人脸,例如包含人脸和头发的真实图像。
在步骤S102中,对多个历史目标图像中的目标对象进行目标特征引导信息的识别,以得到多个包含目标对象的目标特征引导信息的样本图像,上述目标特征引导信息用于引导生成具有目标特征的目标对象。
其中,目标对象的目标特征引导信息可以包括目标对象所对应的掩膜区域。
可选地,目标对象的目标特征引导信息还可以包括目标对象的颜色和上述掩膜区域的边缘信息中的至少一项。
在该实施例中,目标特征引导信息用于引导生成具有目标特征的目标对象,例如,头发所对应的掩膜区域用于引导生成发型(包括长发和短发),颜色用于引导生成头发的颜色,边缘信息用于引导生成头发发丝的走向。
在该实施例中,当目标对象的目标特征引导信息包括目标对象所对应的掩膜区域时,可以通过以下方式得到多个样本图像:从历史目标图像中分割出目标对象,得到目标对象所对应的掩膜区域;将目标对象所对应的掩膜区域设置为白色;将设置为白色的掩膜区域贴回历史目标图像的对应区域,得到样本图像。
可选地,当目标对象的目标特征引导信息还包括目标对象的颜色时,可以通过以下方式得到多个样本图像:计算分割出的掩膜区域的平均颜色值,并将掩膜区域的所有像素值均设置为上述平均颜色值,将设置后的掩膜区域贴回历史目标图像的对应区域,得到样本图像。
可选地,当目标对象的目标特征引导信息还包括掩膜区域的边缘信息时,可以通过以下方式得到多个样本图像:计算分割出的掩膜区域内目标对象的边缘信息,并将边缘信息贴回历史目标图像的对应区域,得到样本图像。
其中,可以采用拉普拉斯(laplacian)算子计算目标对象的边缘信息。
可选地,当目标对象的目标特征引导信息还包括目标对象的颜色和掩膜区域的边缘信息时,可以通过以下方式得到多个样本图像:计算分割出的掩膜区域的平均颜色值和目标对象的边缘信息,将掩膜区域的所有像素值均设置为平均颜色值,并将设置后的掩膜区域和计算的边缘信息贴回历史目标图像的对应区域,得到样本图像。
该实施例,通过对多个历史目标图像中的目标对象进行目标特征引导信息的识别,来得到多个包含目标对象的目标特征引导信息的样本图像,方便后续根据得到的样本图像和历史目标图像训练生成图像生成模型。
在步骤S103中,将样本图像输入待训练的图像生成模型,得到训练输出图像,该训练输出图像包含目标对象,目标对象具有与目标特征引导信息对应的目标特征。
在步骤S104中,根据同一样本图像对应的训练输出图像和历史目标图像计算损失值,并利用损失值调整模型参数,直至满足预设收敛条件,得到图像生成模型。
其中,可以通过判断损失值的变化是否小于预设阈值,即判断损失值的变化是否很小来判断图像生成模型是否收敛。
在该实施例中,若待训练的图像生成模型不收敛,则调整图像生成模型的参数,并重新选择一个样本图像输入待训练的图像生成模型,得到新的训练输出图像,然后根据重新选择的样本图像和新的训练输出图像计算损失值,若根据该损失值确定待训练的图像生成模型收敛,则停止训练,得到图像生成模型,若根据该损失值确定待训练的图像生成模型不收敛,则继续调整图像生成模型的参数,直至待训练的图像生成模型收敛。
例如,输入的样本图像为图像B,训练输出图像为图像C,样本图像对应的历史目标图像为图像A,即输出的目标为图像A,计算图像C和图像A的差别,并将该差别作为损失值,然后将该损失值反向传播来调整待训练的图像生成模型的参数,通过不断地迭代优化来使得最终得到的图像生成模型能够生成目标对象,例如能够生成真实性很高的头发。
上述实施例,通过对获取的多个历史目标图像中的目标对象进行目标特征引导信息的识别来得到多个样本图像,并基于样本图像、历史目标图像和训练输出图像生成图像生成模型,从而为后续准确地控制生成目标对象的特征提供条件。
图1B是本公开一示例性实施例示出的一种图像处理方法的流程图,如图1B所示,该图像处理方法包括:
在步骤S201中,获得待处理图像,该待处理图像包含目标对象的目标特征引导信息。
其中,目标对象的目标特征引导信息可以包括通过手工绘制或模板选择的目标对象的掩膜区域,该掩膜区域可以用于引导生成发型,该发型包括长发和短发。
可选地,目标对象的目标特征引导信息还可以包括以下至少一项:
11)通过手工绘制或模板选择的颜色。
该颜色可以用于引导生成头发的颜色。
12)通过手工绘制或模板选择的掩膜区域的边缘信息。
该边缘信息用于引导生成头发发丝的走向。
由此可见,该实施例可以通过多种方式获得目标对象的目标特征引导信息,实现手段灵活。
在步骤S202中,将待处理图像输入对应的图像生成模型,得到包含目标对象的输出图像,其中,上述图像生成模型采用图1A所示的图像生成模型的训练方法获得。
在该实施例中,事先采用图1A所示的图像生成模型的训练方法得到图像生成模型,将待处理图像输入对应的图像生成模型后,可以得到包含目标对象的输出图像。
例如,若待处理图像包含头发的掩膜区域和边缘信息,如图2所示,则得到的输出图像如图3所示。又例如,若待处理图像包含头发的掩膜区域和边缘信息,如图4所示,则得到的输出图像如图5所示。
通过图2至图5可以看出,通过更改待处理图像中头发的掩膜区域则可以更改发型。类似地,也可以通过上述方式更改头发的颜色和发丝走向,从而做到准确地控制生成头发的特征。
上述实施例,通过获得包含目标对象的目标特征引导信息的待处理图像,并将待处理图像输入对应的图像生成模型,得到包含目标对象的输出图像,由于待处理图像包含目标对象的目标特征引导信息,该目标特征引导信息用于引导生成具有目标特征的目标对象,因此,使得输出图像可以包含具有目标特征的目标对象,从而达到准确地控制生成具有目标特征的目标对象的目的。
图6是本公开一示例性实施例示出的一种图像生成模型的训练装置的框图。参照图6,该装置包括:
获取模块61被配置为获取包含目标对象的多个历史目标图像。
识别模块62被配置为对获取模块61获取的多个历史目标图像中的目标对象进行目标特征引导信息的识别,以得到多个包含目标对象的目标特征引导信息的样本图像,目标特征引导信息用于引导生成具有目标特征的目标对象。
输入获得模块63被配置为将识别模块62得到的样本图像输入待训练的图像生成模型,得到训练输出图像,训练输出图像包含目标对象,目标对象具有与目标特征引导信息对应的目标特征。
训练模块64被配置为根据输入获得模块63得到的同一样本图像对应的训练输出图像和获取模块61获取的历史目标图像计算损失值,并利用损失值调整模型参数,直至满足预设收敛条件,得到图像生成模型。
上述实施例,通过对获取的多个历史目标图像中的目标对象进行目标特征引导信息的识别来得到多个样本图像,并基于样本图像、历史目标图像和训练输出图像生成图像生成模型,从而为后续准确地控制生成目标对象的特征提供条件。
图7是本公开一示例性实施例示出的另一种图像生成模型的训练装置的框图,在该实施例中,目标对象的目标特征引导信息可以包括目标对象所对应的掩膜区域,如图7所示,在图6所示实施例的基础上,识别模块62可以包括:
分割子模块621被配置为从历史目标图像中分割出目标对象,得到目标对象所对应的掩膜区域。
第一设置子模块622被配置为将分割子模块621得到的目标对象所对应的掩膜区域设置为白色。
第一贴回子模块623被配置为将第一设置子模块622设置为白色的掩膜区域贴回历史目标图像的对应区域,得到样本图像。
图8是本公开一示例性实施例示出的另一种图像生成模型的训练装置的框图,在该实施例中,目标对象的目标特征引导信息还可以包括目标对象的颜色,如图8所示,在图7所示实施例的基础上,识别模块62还可以包括:
第一计算子模块624被配置为计算分割子模块621分割出的掩膜区域的平均颜色值。
第二设置子模块625被配置为将掩膜区域的所有像素值均设置为第一计算子模块624计算的平均颜色值。
第二贴回子模块626被配置为将第二设置子模块625设置后的掩膜区域贴回历史目标图像的对应区域,得到样本图像。
图9是本公开一示例性实施例示出的另一种图像生成模型的训练装置的框图,在该实施例中,目标对象的目标特征引导信息还可以包括掩膜区域的边缘信息,如图9所示,在图7所示实施例的基础上,识别模块62还可以包括:
第二计算子模块627被配置为计算分割子模块621分割出的掩膜区域内目标对象的边缘信息。
第三贴回子模块628被配置为将第二计算子模块627计算的边缘信息贴回历史目标图像的对应区域,得到样本图像。
图10是本公开一示例性实施例示出的另一种图像生成模型的训练装置的框图,在该实施例中,目标对象的目标特征引导信息还可以包括目标对象的颜色和掩膜区域的边缘信息,如图10所示,在图7所示实施例的基础上,识别模块62还可以包括:
第三计算子模块629被配置为计算分割子模块621分割出的掩膜区域的平均颜色值和目标对象的边缘信息。
第三设置子模块630被配置为将掩膜区域的所有像素值均设置为第三计算子模块629计算的平均颜色值。
第四贴回子模块631被配置为将第三设置子模块630设置后的掩膜区域和第三计算子模块629计算的边缘信息贴回历史目标图像的对应区域,得到样本图像。
图11是本公开一示例性实施例示出的一种图像处理装置的框图,如图11所示,该装置包括:
获得模块111被配置为获得待处理图像,待处理图像包含目标对象的目标特征引导信息。
处理模块112被配置为将获得模块111获得的待处理图像输入对应的图像生成模型,得到包含目标对象的输出图像。
其中,图像生成模型采用图6至图10任一图像处理装置获得。
上述实施例,通过获得包含目标对象的目标特征引导信息的待处理图像,并将待处理图像输入对应的图像生成模型,得到包含目标对象的输出图像,由于待处理图像包含目标对象的目标特征引导信息,该目标特征引导信息用于引导生成具有目标特征的目标对象,因此,使得输出图像可以包含具有目标特征的目标对象,从而达到准确地控制生成具有目标特征的目标对象的目的。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该装置的实施例中进行了详细描述,此处将不做详细阐述说明。
图12是本公开一示例性实施例示出的一种电子设备的框图。如图12所示,该电子设备包括处理器1210、用于存储处理器1210可执行指令的存储器1220;其中,处理器被配置为执行上述指令,以实现上述图像生成模型的训练方法。除了图12所示的处理器1210及存储器1220之外,该电子设备通常根据图像生成模型的训练的实际功能,还可以包括其他硬件,对此不再赘述。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器1220,上述指令可由处理器1210执行以完成上述图像生成模型的训练方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述图像生成模型的训练方法。
图13是本公开一示例性实施例示出的一种适用于图像生成模型的训练方法的设备的框图,如图13所示,本公开实施例给出一种适用于图像生成模型的训练方法的设备1300,包括:射频(Radio Frequency,RF)电路1310、电源1320、处理器1330、存储器1340、输入单元1350、显示单元1360、摄像头1370、通信接口1380、以及无线保真(WirelessFidelity,Wi-Fi)模块1390等部件。本领域技术人员可以理解,图13中示出的设备的结构并不构成对设备的限定,本申请实施例提供的设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图13对设备1300的各个构成部件进行具体的介绍:
RF电路1310可用于通信或通话过程中,数据的接收和发送。特别地,RF电路1310在接收到基站的下行数据后,发送给处理器1330处理;另外,将待发送的上行数据发送给基站。通常,RF电路1310包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。
此外,RF电路1310还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobilecommunication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code DivisionMultiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
Wi-Fi技术属于短距离无线传输技术,设备1300通过Wi-Fi模块1390可以连接接入点(Access Point,AP),从而实现数据网络的访问。Wi-Fi模块1390可用于通信过程中,数据的接收和发送。
设备1300可以通过通信接口1380与其他设备实现物理连接。可选的,通信接口1380与其他设备的通信接口通过电缆连接,实现设备1300和其他设备之间的数据传输。
由于在本申请实施例中,设备1300能够实现通信业务,向其他联系人发送信息,因此设备1300需要具有数据传输功能,即设备1300内部需要包含通信模块。虽然图13示出了RF电路1310、Wi-Fi模块1390、和通信接口1380等通信模块,但是可以理解的是,设备1300中存在上述部件中的至少一个或者其他用于实现通信的通信模块(如蓝牙模块),以进行数据传输。
例如,当设备1300为手机时,设备1300可以包含RF电路1310,还可以包含Wi-Fi模块1390;当设备1300为计算机时,设备1300可以包含通信接口1380,还可以包含Wi-Fi模块1390;当设备1300为平板电脑时,设备1300可以包含Wi-Fi模块。
存储器1340可用于存储软件程序以及模块。处理器1330通过运行存储在存储器1340的软件程序以及模块,从而执行设备1300的各种功能应用以及数据处理,并且当处理器1330执行存储器1340中的程序代码后,可以实现本公开实施例图1A中的部分或全部过程。
可选的,存储器1340可以主要包括存储程序区和存储数据区。其中,存储程序区可存储操作系统、各种应用程序(比如通信应用)以及人脸识别模块等;存储数据区可存储根据设备的使用所创建的数据(比如各种图片、视频文件等多媒体文件,以及人脸信息模板)等。
此外,存储器1340可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1350可用于接收用户输入的数字或字符信息,以及产生与设备1300的用户设置以及功能控制有关的键信号输入。
可选的,输入单元1350可包括触控面板1351以及其他输入设备1352。
其中,触控面板1351,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1351上或在触控面板1351附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1351可以包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1330,并能接收处理器1330发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1351。
可选的,其他输入设备1352可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1360可用于显示由用户输入的信息或提供给用户的信息以及设备1300的各种菜单。显示单元1360即为设备1300的显示系统,用于呈现界面,实现人机交互。
显示单元1360可以包括显示面板1361。可选的,显示面板1361可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置。
进一步的,触控面板1351可覆盖显示面板1361,当触控面板1351检测到在其上或附近的触摸操作后,传送给处理器1330以确定触摸事件的类型,随后处理器1330根据触摸事件的类型在显示面板1361上提供相应的视觉输出。
虽然在图13中,触控面板1351与显示面板1361是作为两个独立的部件来实现设备1300的输入和输入功能,但是在某些实施例中,可以将触控面板1351与显示面板1361集成而实现设备1300的输入和输出功能。
处理器1330是设备1300的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在存储器1340内的软件程序和/或模块,以及调用存储在存储器1340内的数据,执行设备1300的各种功能和处理数据,从而实现基于设备的多种业务。
可选的,处理器1330可包括一个或多个处理单元。可选的,处理器1330可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1330中。
摄像头1370,用于实现设备1300的拍摄功能,拍摄图片或视频。摄像头1370还可以用于实现设备1300的扫描功能,对扫描对象(二维码/条形码)进行扫描。
设备1300还包括用于给各个部件供电的电源1320(比如电池)。可选的,电源1320可以通过电源管理系统与处理器1330逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗等功能。
在示例性实施例中,设备1300可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图像生成模型的训练方法。
图14是本公开一示例性实施例示出的一种电子设备的框图。如图14所示,该电子设备包括处理器1410、用于存储处理器1410可执行指令的存储器1420;其中,处理器被配置为执行上述指令,以实现上述图像处理方法。除了图14所示的处理器1410及存储器1420之外,该电子设备通常根据图像处理的实际功能,还可以包括其他硬件,对此不再赘述。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器1420,上述指令可由处理器1410执行以完成上述图像处理方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述图像处理方法。
图15是本公开一示例性实施例示出的一种适用于图像处理方法的设备的框图,如图15所示,本公开实施例给出一种适用于图像处理方法的设备1500,包括:射频(RadioFrequency,RF)电路1510、电源1520、处理器1530、存储器1540、输入单元1550、显示单元1560、摄像头1570、通信接口1580、以及无线保真(Wireless Fidelity,Wi-Fi)模块1590等部件。本领域技术人员可以理解,图15中示出的设备的结构并不构成对设备的限定,本申请实施例提供的设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图15对设备1500的各个构成部件进行具体的介绍:
RF电路1510可用于通信或通话过程中,数据的接收和发送。特别地,RF电路1510在接收到基站的下行数据后,发送给处理器1530处理;另外,将待发送的上行数据发送给基站。通常,RF电路1510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。
此外,RF电路1510还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System of Mobilecommunication,GSM)、通用分组无线服务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code DivisionMultiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
Wi-Fi技术属于短距离无线传输技术,设备1500通过Wi-Fi模块1590可以连接接入点(Access Point,AP),从而实现数据网络的访问。Wi-Fi模块1590可用于通信过程中,数据的接收和发送。
设备1500可以通过通信接口1580与其他设备实现物理连接。可选的,通信接口1580与其他设备的通信接口通过电缆连接,实现设备1500和其他设备之间的数据传输。
由于在本申请实施例中,设备1500能够实现通信业务,向其他联系人发送信息,因此设备1500需要具有数据传输功能,即设备1500内部需要包含通信模块。虽然图15示出了RF电路1510、Wi-Fi模块1590、和通信接口1580等通信模块,但是可以理解的是,设备1500中存在上述部件中的至少一个或者其他用于实现通信的通信模块(如蓝牙模块),以进行数据传输。
例如,当设备1500为手机时,设备1500可以包含RF电路1510,还可以包含Wi-Fi模块1590;当设备1500为计算机时,设备1500可以包含通信接口1580,还可以包含Wi-Fi模块1590;当设备1500为平板电脑时,设备1500可以包含Wi-Fi模块。
存储器1540可用于存储软件程序以及模块。处理器1530通过运行存储在存储器1540的软件程序以及模块,从而执行设备1500的各种功能应用以及数据处理,并且当处理器1530执行存储器1540中的程序代码后,可以实现本公开实施例图1B中的部分或全部过程。
可选的,存储器1540可以主要包括存储程序区和存储数据区。其中,存储程序区可存储操作系统、各种应用程序(比如通信应用)以及人脸识别模块等;存储数据区可存储根据设备的使用所创建的数据(比如各种图片、视频文件等多媒体文件,以及人脸信息模板)等。
此外,存储器1540可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1550可用于接收用户输入的数字或字符信息,以及产生与设备1500的用户设置以及功能控制有关的键信号输入。
可选的,输入单元1550可包括触控面板1551以及其他输入设备1552。
其中,触控面板1551,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1551上或在触控面板1551附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1551可以包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1530,并能接收处理器1530发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1551。
可选的,其他输入设备1552可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1560可用于显示由用户输入的信息或提供给用户的信息以及设备1500的各种菜单。显示单元1560即为设备1500的显示系统,用于呈现界面,实现人机交互。
显示单元1560可以包括显示面板1561。可选的,显示面板1561可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置。
进一步的,触控面板1551可覆盖显示面板1561,当触控面板1551检测到在其上或附近的触摸操作后,传送给处理器1530以确定触摸事件的类型,随后处理器1530根据触摸事件的类型在显示面板1561上提供相应的视觉输出。
虽然在图15中,触控面板1551与显示面板1561是作为两个独立的部件来实现设备1500的输入和输入功能,但是在某些实施例中,可以将触控面板1551与显示面板1561集成而实现设备1500的输入和输出功能。
处理器1530是设备1500的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在存储器1540内的软件程序和/或模块,以及调用存储在存储器1540内的数据,执行设备1500的各种功能和处理数据,从而实现基于设备的多种业务。
可选的,处理器1530可包括一个或多个处理单元。可选的,处理器1530可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1530中。
摄像头1570,用于实现设备1500的拍摄功能,拍摄图片或视频。摄像头1570还可以用于实现设备1500的扫描功能,对扫描对象(二维码/条形码)进行扫描。
设备1500还包括用于给各个部件供电的电源1520(比如电池)。可选的,电源1520可以通过电源管理系统与处理器1530逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗等功能。
在示例性实施例中,设备1500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图像处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (19)
1.一种图像生成模型的训练方法,其特征在于,包括:
获取包含目标对象的多个历史目标图像;
对多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,包括:从所述历史目标图像中分割出所述目标对象,得到所述目标对象所对应的掩膜区域;将所述分割子模块得到的所述目标对象所对应的所述掩膜区域设置为白色,并将设置为白色的所述掩膜区域贴回所述历史目标图像的对应区域,得到所述样本图像;其中,所述目标特征引导信息包括所述掩膜区域并用于引导生成具有目标特征的所述目标对象;
将所述样本图像输入待训练的图像生成模型,得到训练输出图像,所述训练输出图像包含所述目标对象,所述目标对象具有与所述目标特征引导信息对应的目标特征;
根据同一所述样本图像对应的所述训练输出图像和所述历史目标图像计算损失值,并利用所述损失值调整模型参数,直至满足预设收敛条件,得到所述图像生成模型。
2.根据权利要求1所述的图像生成模型的训练方法,其特征在于,所述目标对象的目标特征引导信息还包括所述目标对象的颜色;
所述对多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,还包括:
计算分割出的所述掩膜区域的平均颜色值;
将所述掩膜区域的所有像素值均设置为所述平均颜色值;
将设置后的掩膜区域贴回所述历史目标图像的对应区域,得到所述样本图像。
3.根据权利要求1所述的图像生成模型的训练方法,其特征在于,所述目标对象的目标特征引导信息还包括所述掩膜区域的边缘信息;
所述对多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,还包括:
计算分割出的所述掩膜区域内所述目标对象的边缘信息;
将所述边缘信息贴回所述历史目标图像的对应区域,得到所述样本图像。
4.根据权利要求1所述的图像生成模型的训练方法,其特征在于,所述目标对象的目标特征引导信息还包括所述目标对象的颜色和所述掩膜区域的边缘信息;
所述对多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,还包括:
计算分割出的所述掩膜区域的平均颜色值和所述目标对象的边缘信息;
将所述掩膜区域的所有像素值均设置为所述平均颜色值;
将设置后的掩膜区域和所述边缘信息贴回所述历史目标图像的对应区域,得到所述样本图像。
5.根据权利要求1至4中任一项所述的图像生成模型的训练方法,其特征在于,所述目标对象包括头发,所述历史目标图像包括头发和人脸。
6.一种图像处理方法,其特征在于,包括:
获得待处理图像,所述待处理图像包含目标对象的目标特征引导信息;
将所述待处理图像输入对应的图像生成模型,得到包含所述目标对象的输出图像;
其中,所述图像生成模型采用权利要求1至5中任一项所述的图像生成模型的训练方法获得。
7.根据权利要求6所述的图像处理方法,其特征在于,所述目标对象的目标特征引导信息包括通过手工绘制或模板选择的所述目标对象的掩膜区域。
8.根据权利要求7所述的图像处理方法,其特征在于,所述目标对象的目标特征引导信息还包括通过手工绘制或模板选择的颜色;和/或
通过手工绘制或模板选择的所述掩膜区域的边缘信息。
9.一种图像生成模型的训练装置,其特征在于,包括:
获取模块,被配置为获取包含目标对象的多个历史目标图像;
识别模块,被配置为对所述获取模块获取的多个所述历史目标图像中的所述目标对象进行目标特征引导信息的识别,以得到多个包含所述目标对象的目标特征引导信息的样本图像,所述目标特征引导信息用于引导生成具有目标特征的所述目标对象;
所述识别模块包括:
分割子模块,被配置为从所述历史目标图像中分割出所述目标对象,得到所述目标对象所对应的掩膜区域;
第一设置子模块,被配置为将所述分割子模块得到的所述目标对象所对应的所述掩膜区域设置为白色;
第一贴回子模块,被配置为将所述第一设置子模块设置为白色的所述掩膜区域贴回所述历史目标图像的对应区域,得到所述样本图像;
输入获得模块,被配置为将所述识别模块得到的所述样本图像输入待训练的图像生成模型,得到训练输出图像,所述训练输出图像包含所述目标对象,所述目标对象具有与所述目标特征引导信息对应的目标特征;
训练模块,被配置为根据所述输入获得模块得到的同一所述样本图像对应的所述训练输出图像和所述获取模块获取的所述历史目标图像计算损失值,并利用所述损失值调整模型参数,直至满足预设收敛条件,得到所述图像生成模型。
10.根据权利要求9所述的图像生成模型的训练装置,其特征在于,所述目标对象的目标特征引导信息还包括所述目标对象的颜色;
所述识别模块还包括:
第一计算子模块,被配置为计算所述分割子模块分割出的所述掩膜区域的平均颜色值;
第二设置子模块,被配置为将所述掩膜区域的所有像素值均设置为所述第一计算子模块计算的所述平均颜色值;
第二贴回子模块,被配置为将所述第二设置子模块设置后的掩膜区域贴回所述历史目标图像的对应区域,得到所述样本图像。
11.根据权利要求9所述的图像生成模型的训练装置,其特征在于,所述目标对象的目标特征引导信息还包括所述掩膜区域的边缘信息;
所述识别模块还包括:
第二计算子模块,被配置为计算所述分割子模块分割出的所述掩膜区域内所述目标对象的边缘信息;
第三贴回子模块,被配置为将所述第二计算子模块计算的所述边缘信息贴回所述历史目标图像的对应区域,得到所述样本图像。
12.根据权利要求9所述的图像生成模型的训练装置,其特征在于,所述目标对象的目标特征引导信息还包括所述目标对象的颜色和所述掩膜区域的边缘信息;
所述识别模块还包括:
第三计算子模块,被配置为计算所述分割子模块分割出的所述掩膜区域的平均颜色值和所述目标对象的边缘信息;
第三设置子模块,被配置为将所述掩膜区域的所有像素值均设置为所述第三计算子模块计算的所述平均颜色值;
第四贴回子模块,被配置为将所述第三设置子模块设置后的掩膜区域和所述第三计算子模块计算的所述边缘信息贴回所述历史目标图像的对应区域,得到所述样本图像。
13.根据权利要求9至12中任一项所述的图像生成模型的训练装置,其特征在于,所述目标对象包括头发,所述历史目标图像包括头发和人脸。
14.一种图像处理装置,其特征在于,包括:
获得模块,被配置为获得待处理图像,所述待处理图像包含目标对象的目标特征引导信息;
处理模块,被配置为将所述获得模块获得的所述待处理图像输入对应的图像生成模型,得到包含所述目标对象的输出图像;
其中,所述图像生成模型采用权利要求9至13中任一项所述的图像生成模型的训练装置获得。
15.根据权利要求14所述的图像处理装置,其特征在于,所述目标对象的目标特征引导信息包括通过手工绘制或模板选择的所述目标对象的掩膜区域。
16.根据权利要求15所述的图像处理装置,其特征在于,所述目标对象的目标特征引导信息还包括通过手工绘制或模板选择的颜色;和/或
通过手工绘制或模板选择的所述掩膜区域的边缘信息。
17.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至5中任一项所述的图像生成模型的训练方法或者如权利要求6至8中任一项所述的图像处理方法。
18.一种存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至5中任一项所述的图像生成模型的训练方法或者如权利要求6至8中任一项所述的图像处理方法。
19.一种计算机程序产品,其特征在于,当所述计算机程序产品在电子设备上运行时,使得所述电子设备执行如权利要求1至5中任一项所述的图像生成模型的训练方法或者如权利要求6至8中任一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010067758.2A CN113139566B (zh) | 2020-01-20 | 2020-01-20 | 图像生成模型的训练方法及装置、图像处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010067758.2A CN113139566B (zh) | 2020-01-20 | 2020-01-20 | 图像生成模型的训练方法及装置、图像处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113139566A CN113139566A (zh) | 2021-07-20 |
CN113139566B true CN113139566B (zh) | 2024-03-12 |
Family
ID=76809342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010067758.2A Active CN113139566B (zh) | 2020-01-20 | 2020-01-20 | 图像生成模型的训练方法及装置、图像处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113139566B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113744158B (zh) * | 2021-09-09 | 2024-08-02 | 讯飞智元信息科技有限公司 | 图像生成方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108305296A (zh) * | 2017-08-30 | 2018-07-20 | 深圳市腾讯计算机系统有限公司 | 图像描述生成方法、模型训练方法、设备和存储介质 |
CN109903291A (zh) * | 2017-12-11 | 2019-06-18 | 腾讯科技(深圳)有限公司 | 图像处理方法及相关装置 |
CN109902660A (zh) * | 2019-03-18 | 2019-06-18 | 腾讯科技(深圳)有限公司 | 一种表情识别方法及装置 |
CN110023989A (zh) * | 2017-03-29 | 2019-07-16 | 华为技术有限公司 | 一种素描图像的生成方法及装置 |
CN110110592A (zh) * | 2019-03-26 | 2019-08-09 | 中国人民财产保险股份有限公司 | 业务处理方法、模型训练方法、设备及存储介质 |
-
2020
- 2020-01-20 CN CN202010067758.2A patent/CN113139566B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110023989A (zh) * | 2017-03-29 | 2019-07-16 | 华为技术有限公司 | 一种素描图像的生成方法及装置 |
CN108305296A (zh) * | 2017-08-30 | 2018-07-20 | 深圳市腾讯计算机系统有限公司 | 图像描述生成方法、模型训练方法、设备和存储介质 |
CN109903291A (zh) * | 2017-12-11 | 2019-06-18 | 腾讯科技(深圳)有限公司 | 图像处理方法及相关装置 |
CN109902660A (zh) * | 2019-03-18 | 2019-06-18 | 腾讯科技(深圳)有限公司 | 一种表情识别方法及装置 |
CN110110592A (zh) * | 2019-03-26 | 2019-08-09 | 中国人民财产保险股份有限公司 | 业务处理方法、模型训练方法、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
彩色图像数据库中目标特征数据挖掘方法;杨品林;《沈阳工业大学学报》;1-5 * |
Also Published As
Publication number | Publication date |
---|---|
CN113139566A (zh) | 2021-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110689500B (zh) | 一种人脸图像的处理方法、装置、电子设备及存储介质 | |
CN113132618B (zh) | 辅助拍照方法、装置、终端设备及存储介质 | |
US20230217366A1 (en) | Access method, access apparatus, and storage medium | |
CN110689479B (zh) | 一种人脸上妆方法、装置、设备及介质 | |
CN111027528B (zh) | 语种识别方法、装置、终端设备及计算机可读存储介质 | |
CN111314721B (zh) | 一种异常直播的确定方法、装置、设备及介质 | |
CN111339327A (zh) | 作品推荐方法及装置、服务器和存储介质 | |
CN110837398B (zh) | 一种显示快应用的卡片的方法及终端 | |
CN110647930B (zh) | 一种图像处理方法、装置及电子设备 | |
CN113554741B (zh) | 一种对象三维重建的方法、装置、电子设备及存储介质 | |
CN113709385B (zh) | 一种视频处理方法及装置、计算机设备和存储介质 | |
CN110796096B (zh) | 一种手势识别模型的训练方法、装置、设备及介质 | |
CN111625690B (zh) | 一种对象推荐方法、装置、设备及介质 | |
CN105791946A (zh) | 图像显示效果调整方法及装置 | |
CN113139566B (zh) | 图像生成模型的训练方法及装置、图像处理方法及装置 | |
CN110796034B (zh) | 一种目标对象识别方法、装置、设备及介质 | |
CN112581395A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN111797308B (zh) | 一种资源推荐方法、装置、电子设备及介质 | |
CN112637407A (zh) | 语音输入方法、装置及电子设备 | |
CN112948048A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN114187349B (zh) | 产品加工方法、装置、终端设备以及存储介质 | |
CN110928463B (zh) | 控制远程设备的方法、装置及系统、业务服务器和存储介质 | |
CN113205452A (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN113672193A (zh) | 音频数据播放方法与装置 | |
CN111200777A (zh) | 信号处理方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |