CN114418835A - 图像处理方法、装置、设备及介质 - Google Patents
图像处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114418835A CN114418835A CN202210089956.8A CN202210089956A CN114418835A CN 114418835 A CN114418835 A CN 114418835A CN 202210089956 A CN202210089956 A CN 202210089956A CN 114418835 A CN114418835 A CN 114418835A
- Authority
- CN
- China
- Prior art keywords
- image
- style
- sample
- image generator
- generator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 88
- 239000013598 vector Substances 0.000 claims abstract description 86
- 238000012549 training Methods 0.000 claims abstract description 71
- 238000000034 method Methods 0.000 claims abstract description 42
- 230000004927 fusion Effects 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 11
- 230000001815 facial effect Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 abstract description 34
- 230000000694 effects Effects 0.000 abstract description 14
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本公开实施例涉及一种图像处理方法、装置、设备及介质,其中该方法包括:训练生成第一图像生成器,以及训练生成第二图像生成器,第二图像生成器用于对输入的随机特征向量进行处理生成第二风格的目标对象图像;基于第一图像生成器和第二图像生成器分别对输入的样本特征向量进行处理,生成第一风格的样本图像和第二风格的样本图像作为配对样本数据;基于配对样本数据训练预设模型生成目标图像生成器,其中,目标图像生成器用于对第一风格的输入图像进行处理生成第二风格的输出图像。由此,实现了风格转换场景下高质量的配对样本数据的构建,保证了对图像进行风格转换的效果,提升了对图像进行风格转换的效率。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、设备及介质。
背景技术
对目标对象拍摄的图像进行风格转换,成为图像处理用户的一种热门需求。相关技术中,图像处理应用提供了多种图像参数的编辑控件,比如,包括亮度处理、贴纸添加处理、妆容转换处理等编辑控件,用户通过对编辑控件的编辑操作对图像参数进行调整,从而实现图像的风格转换。
然而,通过用户调整编辑控件来实现图像风格转换的方式依赖于用户的人工操作,转换效果难以保证,并且转换效率较低。
发明内容
为了解决上述技术问题,本公开提供了一种图像处理方法、装置、设备及介质,以解决现有技术中对图像进行风格转换时,转换效果难以保证以及转换效率较低的问题。
本公开实施例提供了一种图像处理方法,所述方法包括:训练生成第一图像生成器,其中,所述第一图像生成器用于对输入的随机特征向量进行处理生成第一风格的目标对象图像,以及训练生成第二图像生成器,所述第二图像生成器用于对输入的随机特征向量进行处理生成第二风格的目标对象图像;基于所述第一图像生成器和所述第二图像生成器分别对输入的样本特征向量进行处理,生成所述第一风格的样本图像和所述第二风格的样本图像作为配对样本数据;基于所述配对样本数据训练预设模型生成目标图像生成器,其中,所述目标图像生成器用于对所述第一风格的输入图像进行处理生成所述第二风格的输出图像。
本公开实施例还提供了一种图像处理装置,所述装置包括:训练模块,用于训练生成第一图像生成器,其中,所述第一图像生成器用于对输入的随机特征向量进行处理生成第一风格的目标对象图像,以及训练生成第二图像生成器,所述第二图像生成器用于对输入的随机特征向量进行处理生成第二风格的目标对象图像;样本生成模块,用于基于所述第一图像生成器和所述第二图像生成器分别对输入的样本特征向量进行处理,生成所述第一风格的样本图像和所述第二风格的样本图像作为配对样本数据;图像生成器生成模块,用于基于所述配对样本数据训练预设模型生成目标图像生成器,其中,所述目标图像生成器用于对所述第一风格的输入图像进行处理生成所述第二风格的输出图像。
本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的图像处理方法。
本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的图像处理方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
本公开实施例提供的人脸图像处理方案,训练可以基于输入的随机特征向量得到第一风格的目标对象图像的第一图像生成器,以及训练可以对输入的随机特征向量生成第二风格的目标对象图像的第二图像生成器,基于第一图像生成器和第二图像生成器分别对输入的样本特征向量进行处理,生成第一风格的样本图像和第二风格的样本图像作为配对样本数据,在提高配对样本数据集合获取效率的基础上,保证了配对样本数据的质量,通过配对样本数据训练预设模型生成目标图像生成器,其中,目标图像生成器用于对输入图像进行处理生成与第二风格匹配的输出图像。由此,实现了风格转换场景下高质量的配对样本数据的构建,克服了样本数据难以获取的问题,保证了对图像进行风格转换的效果,提升了对图像进行风格转换的效率。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例提供的一种图像处理方法的流程示意图;
图2为本公开实施例提供的另一种图像处理方法的流程示意图;
图3为本公开实施例提供的一种图像处理场景示意图;
图4为本公开实施例提供的另一种图像处理场景示意图;
图5为本公开实施例提供的另一种图像处理场景示意图;
图6为本公开实施例提供的另一种图像处理场景示意图;
图7为本公开实施例提供的另一种图像处理方法的流程示意图;
图8为本公开实施例提供的另一种图像处理方法的流程示意图;
图9为本公开实施例提供的另一种图像处理方法的流程示意图;
图10为本公开实施例提供的一种图像处理装置的结构示意图;
图11为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
为了解决上述问题,本公开实施例提供了一种图像处理方法,在该方法中训练用于生成第一风格的图像的图像生成器,以及用于生成第二风格图像的图像生成器,基于两个图像生成器来生成配对样本数据,由此,得到质量较好的训练样本数据,进而,基于训练样本数据训练得到用于风格转换的目标图像生成器。
从而,即使在有些场景下,难以获取第一风格的对象图像,以及对应的第二风格的图像来作为训练数据,也可能够根据上述图像生成器得到具有第二风格的样本图像对,克服了在风格转换模型的训练过程中,样本难以获取的问题,保证了风格转换的效果和效率。
下面结合具体的实施例对该方法进行介绍。
图1为本公开实施例提供的一种图像处理方法的流程示意图,该方法可以由图像处理装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法包括:
步骤101,训练生成第一图像生成器,其中,第一图像生成器用于对输入的随机特征向量进行处理生成第一风格的目标对象图像,以及训练生成第二图像生成器,第二图像生成器用于对输入的随机特征向量进行处理生成第二风格的目标对象图像。
其中,目标对象可以为人、可以为动物等,在此不作限制。输入的随机特征向量包括但不限于轮廓特征、像素颜色特征等。第一风格和第二风格可以为任意不同风格信息,比如,第一风格可以为“素风格的人脸”,第二风格可以为“港风风格的人脸”等。
在本实施例中,为了保证第一图像生成器的鲁棒性,根据多个第一预设指标随机采集第一风格的第一对象图像数据,该多个第一预设指标对应于目标对象的多个特征维度,以用于保证训练第一图像生成器的鲁棒性,比如,当目标对象为人脸时,则对应的第一预设指标包括:人脸角度指标类型、人脸年龄指标类型、人脸气质指标类型、人脸轮廓指标类型、人脸亮度指标类型等,其中,每个指标类型下可以包括多个指标值,以用于保证基于多个第一预设指标获取的人脸样本数据,不但覆盖了多个指标类型,在同一个指标类型下也具有不同的指标值(比如,具有各个人脸角度等)。
在本实施例中,根据第一对象图像数据训练生成对抗网络的参数,获取第一图像生成器,该第一图像生成器可以基于输入的随机特征向量得到对应的第一风格的目标对象图像。
在本实施例中,还训练可以对输入的随机特征向量进行处理生成第二风格的目标对象图像的第二图像生成器,该随机特征向量包括但不限于轮廓特征、像素颜色特征等。
在本公开的一个实施例中,如图2所示,训练生成第二图像生成器,包括:
步骤201,根据多个第二预设指标采集第二风格的第二对象图像数据。
为了保证第二图像生成器的鲁棒性,根据多个第二预设指标采集具有第二风格的第二对象图像数据,该多个第二预设指标可以对应于第二对象数据的多个不同的维度,比如,当第二对象图像数据对应于人脸时,则对应的第二预设指标可以包括人脸角度指标类型、人脸年龄指标类型、人脸气质指标类型、人脸轮廓指标类型、人脸亮度指标类型等,其中,每个指标类型下可以包括多个指标值,以用于保证基于多个第二预设指标获取的第二对象图像数据,不但覆盖了多个指标类型,在同一个指标类型下也具有不同的指标值(比如,具有各个人脸角度等)。
其中,需要说明的是,上述输入的随机特征向量可以是随机生成的,比如,可以是根据随机算法生成的任意维度具有第一风格或第二风格的特征,该输入的随机特征向量也可以是基于具有第一风格或者第二风格的目标对象图像提取得到的,基于真实目标对象图像提取的随机特征向量,可以保证训练得到的第一图像生成器和第二图像生成器输出的图像更加真实。
其中,需要说明的是,上述第二对象图像数据可以是随机生成的,比如,可以是根据随机算法生成的任意维度的人脸特征,该第二对象图像数据也可以是基于真实的目标对象图像提取得到的,基于真实目标对象图像提取的第二对象图像数据,可以保证训练得到的有关图像生成器输出的图像更加真实。
步骤202,通过第二对象图像数据训练第一图像生成器的网络参数,获取第三图像生成器。
在本实施例中,根据第二对象图像数据训练生成对抗网络的参数,获取第一图像生成器,该第一图像生成器可以基于输入的随机特征向量得到对应的第一风格的目标对象图像,训练得到第三图像生成器,该第三图像生成器可以用于根据输入的特征向量输出第一风格的目标对象图像。
步骤203,在通过第一图像生成器中对输入的特征信息进行上采样处理的过程中,确定第一图像生成器中小于或等于目标图像分辨率的第一网络,以及大于目标图像分辨率的第二网络。
在本实施例中,可以理解的是,第一图像生成器基于输入的特征信息逐层采样得到的第一风格的对象图像,比如,如图3所示,若是输入的是一个1*1分辨率的特征信息,则第一图像生成器的第一层网络参数对该特征信息上采样得到2*2分辨率的特征信息,进而,经过第二层网络参数对该特征信息进一步上采样得到4*4分辨率的特征信息,逐级上采样以得到对应的上采样后的目标对象图像(图中以512*512分辨率)。
同样的,若是第三图像生成器基于输入的特征信息逐层采样得到的第二风格的目标对象图像,比如,如图4所示,若是输入的是一个1*1分辨率的特征信息,则第三图像生成器的第一层网络参数对该特征信息上采样得到2*2分辨率的特征信息,进而,经过第二层网络参数对该特征信息进一步上采样得到4*4分辨率的特征信息,逐级上采样以得到对应的上采样后的第二风格的目标对象图像(图中以512*512分辨率)。
在本实施例中,为了保证输出的第二风格的目标对象图像和输出的第一风格的目标人脸图像的相似度,保证图像的风格转换的体验,也即是说,为了保证后续进行风格转换时,转换后的第二风格的目标对象图像与输入的第一风格的目标对象图像更为相似,比如,输入的是A用户的人脸图像,则输出的也为与A的五官相似的第二风格的人脸图像,将第一图像生成器和第三图像生成器进行融合以得到第二图像生成器。
然而,在融合过程中,不同的分辨率之间融合的参数的不同,将会导致第二图像生成器的图像生成效果不同,在本实施例中,根据实验数据确定融合边界层对应的目标图像分辨率,基于该目标图像分辨率进行图像生成器的融合会得到图像转换效果较好的第二图像生成器。
在本实施例中,在通过第一图像生成器中对输入的特征信息进行上采样处理的过程中,确定第一图像生成器中小于或等于目标图像分辨率的第一网络,以及大于目标图像分辨率的第二网络,比如,若是目标图像分辨率为16*16,则确定小于等于16*16的分辨率对应的第一网络,以及大于16*16的分辨率对应的第二网络。
步骤204,在通过第三图像生成器中对特征信息进行上采样处理的过程中,确定第三图像生成器中小于或等于目标图像分辨率的第三网络,以及大于目标图像分辨率的第四网络。
在本实施例中,在通过第三图像生成器中对输入的特征信息进行上采样处理的过程中,确定第三图像生成器中小于或等于目标图像分辨率的第三网络,以及大于目标图像分辨率的第四网络,比如,若是目标图像分辨率为16*16,则确定小于等于16*16的分辨率对应的第三网络,以及大于16*16的分辨率对应的第四网络。
步骤205,根据预设的第一融合参数将第一网络与第三网络融合,以及根据预设的第二融合参数将第二网络与第四网络融合,进而获取第二图像生成器。
在本实施例中,根据预设的第一融合参数将第一网络与第三网络融合,根据预设的第二融合参数将第二网络与第四网络融合,其中,基于不同的融合参数进行不同分辨率的网络融合,使得融合后的第二图像生成器的风格转换效果较好。其中,第一融合参数和第二融合参数可以为根据输入的特征向量,兼顾第一风格以及第二风格的任意融合参数,不同的融合参数对应的融合程度不同,比如,第一融合参数和第二融合参数可能对融合的参数类型以及权重值不同等。
在不同的应用场景中,根据融合参数对网络进行融合的方式不同,在一些可能的实施例中,可以对对应分辨率下的网络输出结果进行融合,融合时根据对应的融合参数进行融合,在另一些可能的实施例中,可以首先根据融合参数对对应网络下的网络参数权重等进行修改,根据修改后的网络参数得到对应的分辨率下的输出结果,将相同分辨率下的来源于不同的图像生成器的输出结果进行融合。
举例而言,如图5所示,继续以目标分辨率为16*16为例,将第一图像生成器和第三图像生成器的每个小于等于16*16的网络参数,进行融合,将第一图像生成器和第三图像生成器的每个大于16*16的网络参数,进行融合,融合后的网络层,既能根据输入的特征信息得到真实人脸的转换,也可能够根据输入的特征信息得到第二风格的图像,二者的融合,保证了对应的网络层可以输出兼顾第二风格和第二风格的特征信息。
在本公开的一个实施例中,如图6所示,在本实施例中,训练第一图像生成器和第三图像生成器后,将第一图像生成器和第三图像生成器融合,得到兼顾第一风格和第二风格的第二图像生成器,该第二图像生成器可以仅仅根据有关特征向量即可输出对应的兼顾第一风格和第二风格的目标对象图像,无需在实际场景中去真实构建对应的第二风格的对象真实图像等。在本实施例中,为了进一步提升配对样本数据的真实感,有关特征向量可以是图像编码器对对象真实图像进行特征提取得到的,由此,由于有关特征向量来源于对象真实图像,因此,确保训练处的目标图像生成器的输出效果更加自然。
步骤102,基于第一图像生成器和第二图像生成器分别对输入的样本特征向量进行处理,生成第一风格的样本图像和第二风格的样本图像作为配对样本数据。
在本实施例中,基于第一图像生成器和第二图像生成器分别对输入的样本特征向量进行处理,生成第一风格的样本图像和第二风格的样本图像作为配对样本数据,
步骤103,基于配对样本数据训练预设模型生成目标图像生成器,其中,目标图像生成器用于对第一风格的输入图像进行处理生成第二风格的输出图像。
在本实施例中,通过配对样本数据训练预设模型生成目标图像生成器,其中,目标图像生成器用于对输入图像进行处理生成与第二风格匹配的输出图像,保证了目标风格的图像转换的自然度以及效率。
在本公开的一个实施例中,若是目标图像生成器为GAN网络,则可以通过配对样本数据有监督的训练生成式对抗网络的参数,生成目标图像生成器,并且,在训练时为了进一步保证输出的第二风格图像和输入的第一风格的图像相似度(比如,当目标对象为人脸时,第二风格的输出图像和第一风格的输入图像看起来更像是同一个人等),则在训练过程中根据预设权重对配对样本数据的图像纹理进行加权融合调整输出图像的纹理。其中,预设权重可以根据实验数据标定,以保证输出图像的纹理和第一风格的输入图像的纹理更为接近,同时兼顾了第二风格的纹理的质感。
在本公开的一个实施例中,为了进一步保证输出的第二风格的图像与输入的第一风格的图像的相似度,还可以获取输入的第一风格的图像的背景图像以及头发、眼镜、衣帽等其他实体的纹理信息,将该纹理信息贴图到对应的第二风格的图像中。
其中,由于训练的人脸特征向量来源于对象真实图像,因此,此时生成的配对样本数据较为真实,在提高配对样本数据获取效率的基础上,保证了配对样本数据的质量,通过配对样本数据训练预设模型生成目标图像生成器可以用于智能终端等,克服了训练样本数据难以构建从而导致风格转换效果不好的问题,实现轻量级的图像的风格转换。
综上,本公开实施例的图像处理方法,训练可以基于输入的随机特征向量得到第一风格的目标对象图像的第一图像生成器,以及训练可以对输入的随机特征向量生成第二风格的目标对象图像的第二图像生成器,基于第一图像生成器和第二图像生成器分别对输入的样本特征向量进行处理,生成第一风格的样本图像和第二风格的样本图像作为配对样本数据,在提高配对样本数据集合获取效率的基础上,保证了配对样本数据的质量,通过配对样本数据训练预设模型生成目标图像生成器,其中,目标图像生成器用于对输入图像进行处理生成与第二风格匹配的输出图像。由此,实现了风格转换场景下高质量的配对样本数据的构建,克服了样本数据难以获取的问题,保证了对图像进行风格转换的效果,提升了对图像进行风格转换的效率。
正如以上实施例所提到的,配对样本数据的制作对最后风格转换的效果具有重要意义,因此,在本公开的实施例中,还保证了构建的配对样本数据的质量。
在本公开的一个实施例中,如图7所示,生成第一风格的样本图像和第二风格的样本图像作为配对样本数据,包括:
步骤701,将第一风格的对象真实图像输入到预先训练的图像编码器进行处理,提取第一样本特征向量。
步骤702,将第一样本特征向量输入到第一图像生成器,生成第一风格的对象参考图像。
在本实施例中,将第一风格的对象真实图像输入到预先训练的图像编码器进行处理,提取第一样本特征向量,进而,将第一样本特征向量输入到第一图像生成器,生成第一风格的对象参考图像。该对象参考图像由于是根据第一风格的对象真实图像的特征向量生成的,因此,与真实对象的关系较为紧密,可以后续作为样本数据来使用。
步骤703,将第一样本特征向量输入到第二图像生成器,生成第二风格的第一目标图像。
在本实施例中,将第一样本特征向量输入到第二图像生成器,生成第二风格的第一目标图像,该第一目标图像由于也是根据第一样本特征向量得到的,因此,与真实对象的关系较为紧密,可以后续作为样本数据来使用。
步骤704,将第一风格的对象参考图像作为第一风格的样本图像,以及将第二风格的第一目标图像作为第二风格的样本图像,生成预设第一比例的第一类配对样本数据。
在本实施例中,将第一风格的对象参考图像作为第一风格的样本图像,以及将第二风格的第一目标图像作为第二风格的样本图像,生成预设第一比例的第一类配对样本数据,其中,第一比例可以根据实验数据标定。
即如图8所示,将第一样本特征向量A输入到第二图像生成器,生成与对象真实图像S1对应的第二风格的第一目标图像S2,将第一样本特征向量A输入到第一图像生成器,生成与对象真实图像对应的参考人脸图像S3,从而生成的人脸配对数据集合包括:对象真实图像S1与对应的第二风格的第一目标图像S2,以及参考人脸图像S3与对应的第二风格的第一目标图像S2。
在本公开的一个实施例中,还可以将第一风格的对象真实图像作为第一风格的样本图像,以及将第二风格的第一目标图像作为第二风格的样本图像,生成预设第二比例的第二类配对样本数据,即将第一风格的样本图像和第二风格的样本图像作为配对样本,即将与对象真实图像S1对应的第二风格的第一目标图像S2作为配对样本数据。
在本公开的一个实施例中,将随机生成的第二样本特征向量输入到第一图像生成器,生成第一风格的对象随机图像,将第二样本特征向量输入到第二图像生成器,生成与第二风格的第二目标图像,在本实施例中,对象随机图像和对应的第二风格的第二目标图像也可以作为配对样本数据。将第一风格的对象随机图像作为第一风格的样本图像,以及将第二风格的第二目标图像作为第二风格的样本图像,生成预设第三比例的第三类配对样本数据。其中,第一比例、第二比例和第三比例之和为1,比例值可以根据场景需要标定,在一些可能的实施例中,第一比例、第二比例和第三比例可以分别为30%、50%、20%。
继续以图8所示的场景为例,如图9所示,将第一样本特征向量A输入到第二图像生成器,生成与对象真实图像S1对应的第二风格的第一目标图像S2,将第一样本特征向量A输入到第一图像生成器,生成第一风格的对象参考图像S3,还可以将随机生成的第二样本特征向量B输入到第一图像生成器,生成对象随机图像S4,将第二样本特征向量B输入到第二图像生成器,生成与第二样本特征向量对应的第二风格的第二目标图像S5,生成的配对样本数据包括:根据预设的第一比例采集的对象随机图像S4与对应的第二目标图像S5S5,根据预设的第二比例采集的对象真实图像S1与对应的第二风格的第一目标图像S2,以及根据预设的第三比例采集的对象参考图像S3与对应的第二风格的第一目标图像S2。
同样的,为了保证输出的第二风格图像和第一风格的输入图像或者是对象参考图像的相似度,在本实施例中,还对配对样本数据中配对图像的面部关键点的差异部位进行形变补偿处理,比如,识别人脸的关键点,基于配对图像之间人脸关键点之间的角度和距离生成缩放比例值以及旋转角度,基于缩放比例值和旋转角度调整第二风格的样本图像,以使得配对样本数据中的第二风格的样本图像和对应的第一风格的样本图像较为相似。
也可以对配对样本数据中配对图像的非面部关键点的差异部位进行贴图补偿处理,其中,非面部关键点包括但不限于面部装饰物,比如,人脸上的眼镜、胡子、以及图像背景等,从而,可以基于轮廓识别等方式将差异部位的图像区域抠图后贴图在对应的第二风格的样本图像中。
综上,本公开实施例的图像处理方法,可以根据有关图像生成器和第二图像生成器生成对应的配对样本数据,无需认为拍摄创建对应的配对图像,实现了对配对样本数据的自动获取,为提升图像的风格转换效果和效率提供了技术支撑。
为了实现上述实施例,本公开还提出了一种图像装置。
图10为本公开实施例提供的一种图像处理装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中实现人脸图像处理。如图10所示,该装置包括:
训练模块1010,用于训练生成第一图像生成器,其中,第一图像生成器用于对输入的随机特征向量进行处理生成第一风格的目标对象图像,以及训练生成第二图像生成器,第二图像生成器用于对输入的随机特征向量进行处理生成第二风格的目标对象图像;
样本生成模块1020,用于基于第一图像生成器和第二图像生成器分别对输入的样本特征向量进行处理,生成第一风格的样本图像和第二风格的样本图像作为配对样本数据;
图像生成器生成模块1030,用于基于配对样本数据训练预设模型生成目标图像生成器,其中,目标图像生成器用于对第一风格的输入图像进行处理生成第二风格的输出图像。
本公开实施例所提供的图像装置可执行本公开任意实施例所提供的图像处理方法,具备执行方法相应的功能模块和有益效果。
为了实现上述实施例,本公开还提出一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述实施例中的图像处理方法。
图11为本公开实施例提供的一种电子设备的结构示意图。
下面具体参考图11,其示出了适于用来实现本公开实施例中的电子设备1100的结构示意图。本公开实施例中的电子设备1100可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图11示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图11所示,电子设备1100可以包括处理器(例如中央处理器、图形处理器等)1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储器1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。在RAM 1103中,还存储有电子设备1100操作所需的各种程序和数据。处理器1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
通常,以下装置可以连接至I/O接口1105:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1106;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1107;包括例如磁带、硬盘等的存储器1108;以及通信装置1109。通信装置1109可以允许电子设备1100与其他设备进行无线或有线通信以交换数据。虽然图11示出了具有各种装置的电子设备1100,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1109从网络上被下载和安装,或者从存储器1108被安装,或者从ROM 1102被安装。在该计算机程序被处理器1101执行时,执行本公开实施例的图像处理方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:训练可以基于输入的随机特征向量得到第一风格的目标对象图像的第一图像生成器,以及训练可以对输入的随机特征向量生成第二风格的目标对象图像的第二图像生成器,基于第一图像生成器和第二图像生成器分别对输入的样本特征向量进行处理,生成第一风格的样本图像和第二风格的样本图像作为配对样本数据,在提高配对样本数据集合获取效率的基础上,保证了配对样本数据的质量,通过配对样本数据训练预设模型生成目标图像生成器,其中,目标图像生成器用于对输入图像进行处理生成与第二风格匹配的输出图像。由此,实现了风格转换场景下高质量的配对样本数据的构建,克服了样本数据难以获取的问题,保证了对图像进行风格转换的效果,提升了对图像进行风格转换的效率。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,本公开提供了一种图像处理方法,包括:训练生成第一图像生成器,其中,所述第一图像生成器用于对输入的随机特征向量进行处理生成第一风格的目标对象图像,以及训练生成第二图像生成器,所述第二图像生成器用于对输入的随机特征向量进行处理生成第二风格的目标对象图像;
基于所述第一图像生成器和所述第二图像生成器分别对输入的样本特征向量进行处理,生成所述第一风格的样本图像和所述第二风格的样本图像作为配对样本数据;
基于所述配对样本数据训练预设模型生成目标图像生成器,其中,所述目标图像生成器用于对所述第一风格的输入图像进行处理生成所述第二风格的输出图像。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述训练生成第一图像生成器,包括:
根据多个第一预设指标随机采集所述第一风格的第一对象图像数据;
根据所述第一对象图像数据训练生成对抗网络的参数,获取第一图像生成器。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述训练生成第二图像生成器,包括:
根据多个第二预设指标采集所述第二风格的第二对象图像数据;
通过所述第二对象图像数据训练所述第一图像生成器的网络参数,获取第三图像生成器;
在通过所述第一图像生成器中对输入的特征信息进行上采样处理的过程中,确定所述第一图像生成器中小于或等于目标图像分辨率的第一网络,以及大于所述目标图像分辨率的第二网络;
在通过所述第三图像生成器中对所述特征信息进行上采样处理的过程中,确定所述第三图像生成器中小于或等于所述目标图像分辨率的第三网络,以及大于所述目标图像分辨率的第四网络;
根据预设的第一融合参数将所述第一网络与所述第三网络融合,以及根据预设的第二融合参数将所述第二网络与所述第四网络融合,进而获取所述第二图像生成器。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述基于所述第一图像生成器和所述第二图像生成器分别对输入的样本特征向量进行处理,生成所述第一风格的样本图像和所述第二风格的样本图像作为配对样本数据,包括:
将所述第一风格的对象真实图像输入到预先训练的图像编码器进行处理,提取第一样本特征向量;
将所述第一样本特征向量输入到所述第一图像生成器,生成所述第一风格的对象参考图像;
将所述第一样本特征向量输入到所述第二图像生成器,生成所述第二风格的第一目标图像;
将所述第一风格的对象参考图像作为所述第一风格的样本图像,以及将所述第二风格的第一目标图像作为所述第二风格的样本图像,生成预设第一比例的第一类配对样本数据。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,还包括:
将所述第一风格的对象真实图像作为所述第一风格的样本图像,以及将所述第二风格的第一目标图像作为所述第二风格的样本图像,生成预设第二比例的第二类配对样本数据。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,还包括:
将随机生成的第二样本特征向量输入到所述第一图像生成器,生成所述第一风格的对象随机图像;
将所述第二样本特征向量输入到所述第二图像生成器,生成与所述第二风格的第二目标图像;
将所述第一风格的对象随机图像作为所述第一风格的样本图像,以及将所述第二风格的第二目标图像作为所述第二风格的样本图像,生成预设第三比例的第三类配对样本数据。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,还包括:
根据所述第一风格的对象图像数据和所述第一图像生成器,训练图像编码器的参数,以根据训练成的所述图像编码器对输入的真实图像提取对应的特征向量。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,还包括:
对所述配对样本数据中所述第一风格的样本图像和所述第二风格的样本图像之间的面部关键点的差异部位进行形变补偿处理;和/或,非面部关键点的差异部位进行贴图补偿处理。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述基于所述配对样本数据训练预设模型生成目标图像生成器,包括:
基于所述配对样本数据有监督的训练生成式对抗网络的参数,生成目标图像生成器,其中,在训练过程中根据预设权重对所述第一风格的样本图像和所述第二风格的样本图像的图像纹理进行加权融合调整输出图像的图像纹理。
根据本公开的一个或多个实施例,本公开提供了一种图像处理装置,包括:训练模块,用于训练生成第一图像生成器,其中,所述第一图像生成器用于对输入的随机特征向量进行处理生成第一风格的目标对象图像,以及训练生成第二图像生成器,所述第二图像生成器用于对输入的随机特征向量进行处理生成第二风格的目标对象图像;
样本生成模块,用于基于所述第一图像生成器和所述第二图像生成器分别对输入的样本特征向量进行处理,生成所述第一风格的样本图像和所述第二风格的样本图像作为配对样本数据;
图像生成器生成模块,用于基于所述配对样本数据训练预设模型生成目标图像生成器,其中,所述目标图像生成器用于对所述第一风格的输入图像进行处理生成所述第二风格的输出图像。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述训练模块,具体用于:
根据多个第一预设指标随机采集所述第一风格的第一对象图像数据;
根据所述第一对象图像数据训练生成对抗网络的参数,获取第一图像生成器。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述训练模块,具体用于:
根据多个第二预设指标采集所述第二风格的第二对象图像数据;
通过所述第二对象图像数据训练所述第一图像生成器的网络参数,获取第三图像生成器;
在通过所述第一图像生成器中对输入的特征信息进行上采样处理的过程中,确定所述第一图像生成器中小于或等于目标图像分辨率的第一网络,以及大于所述目标图像分辨率的第二网络;
在通过所述第三图像生成器中对所述特征信息进行上采样处理的过程中,确定所述第三图像生成器中小于或等于所述目标图像分辨率的第三网络,以及大于所述目标图像分辨率的第四网络;
根据预设的第一融合参数将所述第一网络与所述第三网络融合,以及根据预设的第二融合参数将所述第二网络与所述第四网络融合,进而获取所述第二图像生成器。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述样本生成模块,具体用于:
将所述第一风格的对象真实图像输入到预先训练的图像编码器进行处理,提取第一样本特征向量;
将所述第一样本特征向量输入到所述第一图像生成器,生成所述第一风格的对象参考图像;
将所述第一样本特征向量输入到所述第二图像生成器,生成所述第二风格的第一目标图像;
将所述第一风格的对象参考图像作为所述第一风格的样本图像,以及将所述第二风格的第一目标图像作为所述第二风格的样本图像,生成预设第一比例的第一类配对样本数据。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述样本生成模块,具体用于:
将所述第一风格的对象真实图像作为所述第一风格的样本图像,以及将所述第二风格的第一目标图像作为所述第二风格的样本图像,生成预设第二比例的第二类配对样本数据。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述样本生成模块,具体用于:
将随机生成的第二样本特征向量输入到所述第一图像生成器,生成所述第一风格的对象随机图像;
将所述第二样本特征向量输入到所述第二图像生成器,生成与所述第二风格的第二目标图像;
将所述第一风格的对象随机图像作为所述第一风格的样本图像,以及将所述第二风格的第二目标图像作为所述第二风格的样本图像,生成预设第三比例的第三类配对样本数据。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述图像生成器生成模块,具体用于:
根据所述第一风格的对象图像数据和所述第一图像生成器,训练图像编码器的参数,以根据训练成的所述图像编码器对输入的真实图像提取对应的特征向量。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,还包括:
补偿处理模块,用于对所述配对样本数据中所述第一风格的样本图像和所述第二风格的样本图像之间的面部关键点的差异部位进行形变补偿处理;和/或,非面部关键点的差异部位进行贴图补偿处理。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述图像生成器生成模块,具体用于:
基于所述配对样本数据有监督的训练生成式对抗网络的参数,生成目标图像生成器,其中,在训练过程中根据预设权重对所述第一风格的样本图像和所述第二风格的样本图像的图像纹理进行加权融合调整输出图像的图像纹理。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
Claims (12)
1.一种图像处理方法,其特征在于,包括:
训练生成第一图像生成器,其中,所述第一图像生成器用于对输入的随机特征向量进行处理生成第一风格的目标对象图像,以及训练生成第二图像生成器,所述第二图像生成器用于对输入的随机特征向量进行处理生成第二风格的目标对象图像;
基于所述第一图像生成器和所述第二图像生成器分别对输入的样本特征向量进行处理,生成所述第一风格的样本图像和所述第二风格的样本图像作为配对样本数据;
基于所述配对样本数据训练预设模型生成目标图像生成器,其中,所述目标图像生成器用于对所述第一风格的输入图像进行处理生成所述第二风格的输出图像。
2.根据权利要求1所述的方法,其特征在于,所述训练生成第一图像生成器,包括:
根据多个第一预设指标随机采集所述第一风格的第一对象图像数据;
根据所述第一对象图像数据训练生成对抗网络的参数,获取第一图像生成器。
3.根据权利要求1所述的方法,其特征在于,所述训练生成第二图像生成器,包括:
根据多个第二预设指标采集所述第二风格的第二对象图像数据;
通过所述第二对象图像数据训练所述第一图像生成器的网络参数,获取第三图像生成器;
在通过所述第一图像生成器中对输入的特征信息进行上采样处理的过程中,确定所述第一图像生成器中小于或等于目标图像分辨率的第一网络,以及大于所述目标图像分辨率的第二网络;
在通过所述第三图像生成器中对所述特征信息进行上采样处理的过程中,确定所述第三图像生成器中小于或等于所述目标图像分辨率的第三网络,以及大于所述目标图像分辨率的第四网络;
根据预设的第一融合参数将所述第一网络与所述第三网络融合,以及根据预设的第二融合参数将所述第二网络与所述第四网络融合,进而获取所述第二图像生成器。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一图像生成器和所述第二图像生成器分别对输入的样本特征向量进行处理,生成所述第一风格的样本图像和所述第二风格的样本图像作为配对样本数据,包括:
将所述第一风格的对象真实图像输入到预先训练的图像编码器进行处理,提取第一样本特征向量;
将所述第一样本特征向量输入到所述第一图像生成器,生成所述第一风格的对象参考图像;
将所述第一样本特征向量输入到所述第二图像生成器,生成所述第二风格的第一目标图像;
将所述第一风格的对象参考图像作为所述第一风格的样本图像,以及将所述第二风格的第一目标图像作为所述第二风格的样本图像,生成预设第一比例的第一类配对样本数据。
5.根据权利要求4所述的方法,其特征在于,还包括:
将所述第一风格的对象真实图像作为所述第一风格的样本图像,以及将所述第二风格的第一目标图像作为所述第二风格的样本图像,生成预设第二比例的第二类配对样本数据。
6.根据权利要求5所述的方法,其特征在于,还包括:
将随机生成的第二样本特征向量输入到所述第一图像生成器,生成所述第一风格的对象随机图像;
将所述第二样本特征向量输入到所述第二图像生成器,生成与所述第二风格的第二目标图像;
将所述第一风格的对象随机图像作为所述第一风格的样本图像,以及将所述第二风格的第二目标图像作为所述第二风格的样本图像,生成预设第三比例的第三类配对样本数据。
7.根据权利要求4所述的方法,其特征在于,还包括:
根据所述第一风格的对象图像数据和所述第一图像生成器,训练图像编码器的参数,以根据训练成的所述图像编码器对输入的真实图像提取对应的特征向量。
8.根据权利要求1所述的方法,其特征在于,还包括:
对所述配对样本数据中所述第一风格的样本图像和所述第二风格的样本图像之间的面部关键点的差异部位进行形变补偿处理;和/或,非面部关键点的差异部位进行贴图补偿处理。
9.根据权利要求1-8任一所述的方法,其特征在于,所述基于所述配对样本数据训练预设模型生成目标图像生成器,包括:
基于所述配对样本数据有监督的训练生成式对抗网络的参数,生成目标图像生成器,其中,在训练过程中根据预设权重对所述第一风格的样本图像和所述第二风格的样本图像的图像纹理进行加权融合调整输出图像的图像纹理。
10.一种图像处理装置,其特征在于,包括:
训练模块,用于训练生成第一图像生成器,其中,所述第一图像生成器用于对输入的随机特征向量进行处理生成第一风格的目标对象图像,以及训练生成第二图像生成器,所述第二图像生成器用于对输入的随机特征向量进行处理生成第二风格的目标对象图像;
样本生成模块,用于基于所述第一图像生成器和所述第二图像生成器分别对输入的样本特征向量进行处理,生成所述第一风格的样本图像和所述第二风格的样本图像作为配对样本数据;
图像生成器生成模块,用于基于所述配对样本数据训练预设模型生成目标图像生成器,其中,所述目标图像生成器用于对所述第一风格的输入图像进行处理生成所述第二风格的输出图像。
11.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-9中任一所述的图像处理方法。
12.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-9中任一所述的图像处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210089956.8A CN114418835B (zh) | 2022-01-25 | 2022-01-25 | 图像处理方法、装置、设备及介质 |
PCT/CN2023/072054 WO2023143118A1 (zh) | 2022-01-25 | 2023-01-13 | 图像处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210089956.8A CN114418835B (zh) | 2022-01-25 | 2022-01-25 | 图像处理方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114418835A true CN114418835A (zh) | 2022-04-29 |
CN114418835B CN114418835B (zh) | 2024-07-26 |
Family
ID=81277611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210089956.8A Active CN114418835B (zh) | 2022-01-25 | 2022-01-25 | 图像处理方法、装置、设备及介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114418835B (zh) |
WO (1) | WO2023143118A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023143118A1 (zh) * | 2022-01-25 | 2023-08-03 | 北京字跳网络技术有限公司 | 图像处理方法、装置、设备及介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180240257A1 (en) * | 2017-02-21 | 2018-08-23 | Adobe Systems Incorporated | Deep high-resolution style synthesis |
US20200134797A1 (en) * | 2018-10-31 | 2020-04-30 | Boe Technology Group Co., Ltd. | Image style conversion method, apparatus and device |
CN111402112A (zh) * | 2020-03-09 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN111402151A (zh) * | 2020-03-09 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN112232425A (zh) * | 2020-10-21 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质及电子设备 |
US20210027517A1 (en) * | 2019-07-26 | 2021-01-28 | Beijing Xiaomi Mobile Software Co., Ltd. | Image processing method, apparatus, and storage medium |
CN112381717A (zh) * | 2020-11-18 | 2021-02-19 | 北京字节跳动网络技术有限公司 | 图像处理方法、模型训练方法、装置、介质及设备 |
CN113240576A (zh) * | 2021-05-12 | 2021-08-10 | 北京达佳互联信息技术有限公司 | 风格迁移模型的训练方法、装置、电子设备及存储介质 |
CN113837934A (zh) * | 2021-11-26 | 2021-12-24 | 北京市商汤科技开发有限公司 | 图像生成方法及装置、电子设备和存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109741244A (zh) * | 2018-12-27 | 2019-05-10 | 广州小狗机器人技术有限公司 | 图片生成方法及装置、存储介质及电子设备 |
US11275973B2 (en) * | 2019-04-15 | 2022-03-15 | Noblis, Inc. | Adapting pre-trained classification algorithms |
CN112132208B (zh) * | 2020-09-18 | 2023-07-14 | 北京奇艺世纪科技有限公司 | 图像转换模型的生成方法、装置、电子设备及存储介质 |
CN113393544B (zh) * | 2020-09-30 | 2024-07-19 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置、设备及介质 |
CN112991150A (zh) * | 2021-02-08 | 2021-06-18 | 北京字跳网络技术有限公司 | 风格图像生成方法、模型训练方法、装置和设备 |
CN114418835B (zh) * | 2022-01-25 | 2024-07-26 | 北京字跳网络技术有限公司 | 图像处理方法、装置、设备及介质 |
-
2022
- 2022-01-25 CN CN202210089956.8A patent/CN114418835B/zh active Active
-
2023
- 2023-01-13 WO PCT/CN2023/072054 patent/WO2023143118A1/zh unknown
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180240257A1 (en) * | 2017-02-21 | 2018-08-23 | Adobe Systems Incorporated | Deep high-resolution style synthesis |
US20200134797A1 (en) * | 2018-10-31 | 2020-04-30 | Boe Technology Group Co., Ltd. | Image style conversion method, apparatus and device |
US20210027517A1 (en) * | 2019-07-26 | 2021-01-28 | Beijing Xiaomi Mobile Software Co., Ltd. | Image processing method, apparatus, and storage medium |
CN111402112A (zh) * | 2020-03-09 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN111402151A (zh) * | 2020-03-09 | 2020-07-10 | 北京字节跳动网络技术有限公司 | 图像处理方法、装置、电子设备及计算机可读介质 |
CN112232425A (zh) * | 2020-10-21 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、存储介质及电子设备 |
CN112381717A (zh) * | 2020-11-18 | 2021-02-19 | 北京字节跳动网络技术有限公司 | 图像处理方法、模型训练方法、装置、介质及设备 |
CN113240576A (zh) * | 2021-05-12 | 2021-08-10 | 北京达佳互联信息技术有限公司 | 风格迁移模型的训练方法、装置、电子设备及存储介质 |
CN113837934A (zh) * | 2021-11-26 | 2021-12-24 | 北京市商汤科技开发有限公司 | 图像生成方法及装置、电子设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
王晓红;卢辉;麻祥才;: "基于生成对抗网络的风格化书法图像生成", 包装工程, no. 11, 10 June 2020 (2020-06-10) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023143118A1 (zh) * | 2022-01-25 | 2023-08-03 | 北京字跳网络技术有限公司 | 图像处理方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114418835B (zh) | 2024-07-26 |
WO2023143118A1 (zh) | 2023-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111784565B (zh) | 图像处理方法、迁移模型训练方法、装置、介质及设备 | |
CN112989904B (zh) | 风格图像生成方法、模型训练方法、装置、设备和介质 | |
CN111784566B (zh) | 图像处理方法、迁移模型训练方法、装置、介质及设备 | |
CN112562019A (zh) | 图像色彩调整方法及装置、计算机可读介质和电子设备 | |
CN112785669B (zh) | 一种虚拟形象合成方法、装置、设备及存储介质 | |
CN112581635B (zh) | 一种通用的快速换脸方法、装置、电子设备和存储介质 | |
CN115965840A (zh) | 图像风格迁移和模型训练方法、装置、设备和介质 | |
CN110689546A (zh) | 个性化头像的生成方法、装置、设备及存储介质 | |
CN114004905A (zh) | 人物风格形象图的生成方法、装置、设备及存储介质 | |
CN114913061A (zh) | 一种图像处理方法、装置、存储介质及电子设备 | |
CN111967397A (zh) | 人脸影像处理方法和装置、存储介质和电子设备 | |
CN118212687A (zh) | 人体姿势图像生成方法、装置、设备及介质 | |
CN113920023B (zh) | 图像处理方法及装置、计算机可读介质和电子设备 | |
CN114049417A (zh) | 虚拟角色图像的生成方法、装置、可读介质及电子设备 | |
CN114418835B (zh) | 图像处理方法、装置、设备及介质 | |
CN117456062A (zh) | 数字人生成模型的生成器训练方法、数字人生成方法及装置 | |
CN110619602A (zh) | 一种图像生成方法、装置、电子设备及存储介质 | |
CN116030321A (zh) | 生成图像的方法、装置、电子设备和存储介质 | |
CN113240599B (zh) | 图像调色方法及装置、计算机可读存储介质、电子设备 | |
CN116188251A (zh) | 模型构建方法、虚拟形象生成方法、装置、设备、介质 | |
CN112070888B (zh) | 图像生成方法、装置、设备和计算机可读介质 | |
CN113850716A (zh) | 模型训练方法、图像处理方法、装置、电子设备及介质 | |
CN114092712A (zh) | 图像生成方法、装置、可读介质和电子设备 | |
CN116310615A (zh) | 图像处理方法、装置、设备及介质 | |
CN113409208A (zh) | 图像处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |