CN115937020A - 图像处理方法、装置、设备、介质和程序产品 - Google Patents
图像处理方法、装置、设备、介质和程序产品 Download PDFInfo
- Publication number
- CN115937020A CN115937020A CN202211392868.1A CN202211392868A CN115937020A CN 115937020 A CN115937020 A CN 115937020A CN 202211392868 A CN202211392868 A CN 202211392868A CN 115937020 A CN115937020 A CN 115937020A
- Authority
- CN
- China
- Prior art keywords
- image
- style
- loss function
- migration
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 25
- 238000013508 migration Methods 0.000 claims abstract description 179
- 230000005012 migration Effects 0.000 claims abstract description 179
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000006870 function Effects 0.000 claims description 91
- 238000012545 processing Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012937 correction Methods 0.000 claims description 10
- 238000012546 transfer Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 7
- 230000037308 hair color Effects 0.000 description 25
- 230000007704 transition Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 9
- 230000000007 visual effect Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000003709 image segmentation Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
Abstract
本公开涉及一种图像处理方法、装置、设备、存储介质和程序产品,该方法包括:获取原始图像和参考风格图像;利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。本公开实施例中利用风格迁移模型输出的目标风格图像校正风格迁移模型的参数,使得利用风格迁移模型得到的图像风格效果自然,能够满足实际业务需求。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种图像处理方法、装置、设备、介质和程序产品。
背景技术
目前,智能终端功能的不断发展,图像风格迁移在终端设备上具有广泛的应用需求场景。即利用风格迁移模型将用户提供的照片或视频中的目标对象的风格转换为预设风格。例如:利用风格迁移模型将用户提供的照片中的头发颜色为预设的头发颜色(将黑色头发转换为紫色头发)。
但是,风格迁移后的图像风格效果不自然,不能满足实际业务需求。
发明内容
为了解决上述技术问题,本公开实施例提供了一种图像处理方法、装置、设备、存储介质和程序产品,利用风格迁移模型输出的目标风格图像校正风格迁移模型的参数,使得利用风格迁移模型得到的图像风格效果自然,能够满足实际业务需求。
第一方面,本公开实施例提供一种图像处理方法,所述方法包括:
获取原始图像和参考风格图像;
利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;
基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。
第二方面,本公开实施例提供一种图像处理装置,所述装置包括:
图像获取模块,用于获取原始图像和参考风格图像;
图像处理模块,用于利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;
模型校正模块,用于基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。
第三方面,本公开实施例提供一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述第一方面中任一项所述的图像处理方法。
第四方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面中任一项所述的图像处理方法。
第五方面,本公开实施例提供一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现如上述第一方面中任一项所述的图像处理方法。
本公开实施例提供了一种图像处理方法、装置、设备、存储介质和程序产品,该方法包括:获取原始图像和参考风格图像;利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。本公开实施例中利用风格迁移模型输出的目标风格图像校正风格迁移模型的参数,使得利用风格迁移模型得到的图像风格效果自然,能够满足实际业务需求。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例中的图像处理方法的流程示意图;
图2为本公开实施例中的图像处理方法的流程示意图;
图3为本公开实施例中的图像处理装置的结构示意图;
图4为本公开实施例中的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图像处理是一种具有巨大的社会和经济效益的实用技术,被广泛应用于各行各业以及人们日常生活中。图像处理中最常见的一个需求是改变图像风格(即风格迁移),其目标是保持待处理图像的内容信息(例如,人脸、动物等)的同时,将待处理图像中的风格转换为预设风格。例如,将待处理图像中的头发颜色变成预设的头发颜色(将黑色头发转换为紫色头发)。
上述风格迁移方法可以是基于风格转换(Style Transfer)模型或风格生成对抗网络(Style GAN)实现的风格迁移方法。
目前常用的风格迁移模型,基于给定的参考文本和参考图像,使用风格生成式对抗网络转换方法得到其隐编码,然后头发映射器根据隐编码和条件输入(发型条件、发色条件)预测隐编码相应的变化,最后修改后的隐编码将被送入风格生成式对抗网络产生对应的风格迁移后的图像。
具体的,发色迁移是指将一幅待处理图像A中的头发区域的轮廓和纹理与预设的头发颜色融合在一起,从而生成一张具有图像A的头发区域的轮廓和纹理以及预设的头发颜色的合成图像C。
在上述风格迁移模型使用之前,需要对风格迁移模型中的参数进行校正。本公开实施例中提供了一种图像处理方法,包括:获取原始图像和参考风格图像;利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。本公开实施例中利用风格迁移模型输出的目标风格图像校正风格迁移模型的参数,使得利用风格迁移模型得到的图像风格效果自然,能够满足实际业务需求。
进一步,本公开实施例中提供的风格迁移模型可以是肤色迁移模型,衣服风格迁移模型、发色迁移模型等等。在本公开实施例中,以风格迁移模型是发色迁移模型为例进行说明。
下面将结合附图,对本申请实施例提出的图像处理方法进行详细介绍。
图1为本公开实施例中的一种图像处理方法的流程图,本实施例可适用于对图像中的目标对象进行处理的情况,该方法可以由图像处理装置执行,该图像处理装置可以采用软件和/或硬件的方式实现,该图像处理装置可配置于电子设备中。
例如:所述电子设备可以是移动终端、固定终端或便携式终端,例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统(PCS)设备、个人导航设备、个人数字助理(PDA)、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。
再如:所述电子设备可以是服务器,其中,所述服务器可以是实体服务器,也可以是云服务器,服务器可以是一个服务器,或者服务器集群。
如图1所述,本公开实施例提供的图像处理方法主要包括步骤S101-S103。
S101、获取原始图像和参考风格图像。
在本公开的一个实施方式中,所述原始图像和参考风格图像均可以是高清人脸数据集中的任意一个图像,也可以是通过爬虫技术从网络中获取到的包括图像,还可以是通过摄像装置拍摄得到的图像,还可以是视频片段中截取的一个视频帧。需要说明的是,本公开实施例中仅对获取原始图像和参考风格图像的方式,进行简单介绍,而非限定。
在本公开的一个实施例中,所述原始图像和所述参考风格图像中均包括头发区域,且两个图像中头发区域的颜色和/或纹理信息不相同。
具体的,原始图像和所述参考风格图像均可以是一个包括背景图和头发区域的图像,其中,背景图包括:场景区域、人物的脸部区域,以及人物的身体区域等等。所述原始图像和所述参考风格图像还可以是仅包括头发区域的图像。其中,头发区域是指图像中头发所覆盖的区域。
在本公开的一个实施方式中,在所述原始图像和所述参考风格图像是仅包括头发区域的图像的情况下,获取原始图像,包括:获取包括背景图和头发区域的原始图像,对上述原始图像进行分割处理,得到头发区域对应的图像,将头发区域对应的图像作为原始图像。获取参考风格图像,包括:获取包括背景图和头发区域的参考风格图像,对上述参考风格图像进行分割处理,得到头发区域对应的图像,将头发区域对应的图像作为参考风格图像。
在本公开实施例中,对所述原始图像进行分割处理和对所述参考风格图像进行分割处理的方法是相同的,本公开实施例中不再具体限定具体的图像分割方式。
在本公开的一个实施方式中,对原始图像进行分割处理,分割结果可以是一个二值掩膜,掩膜中取值为1的像素对应原始图像中属于头发区域的像素,取值为0的像素对应原始图像中不属于头发区域的像素;又例如,分割结果可记录头发区域的边界位置信息,根据该边界位置信息可以确定头发区域在原始图像中的位置。
在本公开的一个实施方式中,头发区域分割的方法至少包括以下几类:第一:传统的图像分割算法;例如,基于颜色空间的图像分割算法。第二:基于深度学习的图像分割算法;例如,利用预训练的卷积神经网络对图像进行分割,该神经网络可以采用UNet、SegNet等结构。第三:基于特征点检测的图像分割算法;例如,先检测图像中的头发特征点,然后将头发特征点按照预设的顺序连接,形成封闭的区域,即为头发区域。再如:先检测图像中的人脸特征点,然后将人脸特征点按照预设的顺序连接,形成人脸区域,将人脸区域之外的部分区域确定为头发区域。
需要说明的是,本公开实施例中仅对头发区域的分割方式进行说明,而非限定。
在本公开的一个实施方式中,需要采集多批次的原始图像和参考风格图像,均执行本公开实施例中提供的图像处理方法,以提高风格迁移模型的准确度,提高风格迁移的自然度。
S102、利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像。
在本公开实施例中,所述风格迁移模型可以是任意一种学习模型,可选的,上述风格迁移模型由风格生成式对抗网络和从自然语言监督中学习可迁移的视觉模型构成。通过结合风格生成式对抗网络强大的图像合成能力和从自然语言监督中学习可迁移的视觉模型惊人的图像文本表征能力,使得上述神经网络具备很好的图像篡改效果。
在本公开实施例中,以上述风格迁移模型是发色迁移模型为例进行说明。风格迁移模型主要包括:风格生成式对抗网络和从自然语言监督中学习可迁移的视觉模型。其中,所述从自然语言监督中学习可迁移的视觉模型包括文本编码器和图像编码器,所述文本编码器用于文本发型提示信息和文本头发颜色提示信息。图像编码器主要用于接收参考图像,得到发型参考图像信息和头发颜色参考图像信息。将上述文本发型提示信息和发型参考图像信息进行合并,得到发型信息,将文本头发颜色提示信息和头发颜色参考图像信息进行合并,得到头发颜色信息。将所述发型信息和所述头发颜色信息作为风格生成式对抗网络的条件输入。
风格生成式对抗网络中的编码器用于接收原始图像,对提取原始图像中的语义信息。风格生成式对抗网络的不同层对应于生成图像中不同语义级别的信息,本实施例中采用三个具有相同网络结构的子头发映射器Mc、Mm、Mf,负责预测潜应预测高、中、低语义级别中头发编辑的隐编码变化Δw=(wc,wm,wf)。更具体地说,wc、wm、wf分别对应于高语义层次、中等语义层次和低语义层次。
本公开实施例中,根据发型信息和发色信息在风格生成式对抗网络中对应的语义级别将它们分别喂入不同的子头发映射器中。具体的,使用来自从自然语言监督中学习可迁移的视觉模型的发型信息作为子头发映射器Mc和子头发映射器Mm的条件输入,并使用来自头发颜色信息作为子头发映射器Mf的条件输入。这种做法提升了神经网络模型对于发型、发色编辑的解耦能力。最后通过输入条件对隐编码的直接控制,得到一个目标风格图像。
S103、基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。
在本公开的一个实施方式中,所述基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型,包括:采用预设风格复制方式将所述参考风格图像的风格信息复制至所述原始图像上得到,得到引导风格图像;基于所述目标风格图像和所述引导风格图像确定图像损失函数;利用所述图像损失函数校正所述风格迁移模型中包括的各个损失函数的权重值。
在本公开的一个实施方式中,将所述参考风格图像的直方图分布复制至所述原始图像上,得到引导风格图像。
其中,由于直方图可以表示颜色的分布情况,通过直方图匹配算法将参考风格图像的直方图分布复制给原始图像,从而让原始图像拥有参考风格图像的风格信息。
具体的,针对原始图像和参考风格图像,分别计算图像归一化之后的直方图统计,得到概率密度分布,使用cumsum函数将概率密度分布累加,得到累计分布,即得到原始图像的累计分布和参考风格图像的累计分布。
针对原始图像的每个像素值,确定该像素值在原始图像的累计分布中的下标,在参考风格图像的累计分布中查找对应的下标,将该下标对应在参考风格图像中对应的像素值替换原始图像中的该像素值。例如:原始图像对应的第一个像素值,第一个像素值原始图像对应的累计分布的下标是a1,则在参考风格图像的累计分布中查找下标是a1的累计分布,参考风格图像中下标a1的累计分布对应的像素值是127,将原始图像对应的第一个像素值修改为127。针对原始图像中的每个像素点均执行上述操作,以将参考风格图像的直方图分布复制至原始图像上,得到引导风格图像。
在本公开实施例中,引导风格图像是由参考风格图像的直方图分布复制至原始图像上的得到的,可以更好的表达发色迁移的效果。将目标风格图像和所述引导风格图像之间的差异,作为图像损失函数,来进行梯度回传,调整神经网络模型的参数,得到训练后的发色迁移模型。以优化风格迁移模型中损失函数的设计,能明显提升风格迁移后的自然度。
在本公开实施例中,所述图像损失函数用于表示所述目标风格图像和所述引导风格图像之间的图像相似性表示。
在本公开实施例中,通过计算目标风格图像与引导风格图像之间的余弦相似性来表示两个图像之间的差异,两个图像之间的余弦相似性越大,则表明目标风格图像和所述引导风格图像之间的差异小,表明发色迁移模型的训练成果好。两个图像之间的余弦相似性越小,则表明目标风格图像和所述引导风格图像之间的差异大,表明风格迁移模型的训练成果较差,需要进一步调参进行训练。
在本公开的一个实施方式中,所述损失函数包括如下一个或多个:文本篡改损失函数、图像篡改损失函数和属性保持损失函数,所述文本篡改损失函数用于表示所述第一图像与预设文本描述之间的相似性,所述图像篡改损失函数用于表示所述第一图像与所述参考图像之间的相似性,所述属性保持损失函数用于表示所述第一图像的内容信息与所述输入图像的内容信息之间的相似性。
在本公开实施例中,主要介绍了风格迁移模型中的各个损失函数。文本篡改损失函数用于约束风格迁移模型输出的目标风格图像与给定文本描述之间的相似性。不管是发型还是头发颜色,在从自然语言监督中学习可迁移的视觉模型的隐空间中度量文本与目标风格图像的余弦相似度。图像篡改损失函数用于指导从参考风格图像到目标风格图像的发型或头发颜色转移。将目标风格图像与参考风格图像的头发区域均经过从自然语言监督中学习可迁移的视觉模型的图像编码器嵌入到从自然语言监督中学习可迁移的视觉模型的隐空间中进而度量两个图像之间的余弦相似性。对于发色转移,图像篡改损失函数是指目标风格图像中的头发区域与参考风格图像头发区域的平均颜色差异。属性保持损失函数用于表示所述目标风格图像的背景图与原始图像的背景图之间的相似性。
在本公开的一个实施方式中,利用所述图像损失函数校正所述风格迁移模型中包括的各个损失函数的权重值,包括:基于所述图像损失函数、文本篡改损失函数、图像篡改损失函数和属性保持损失函数以及各个损失函数对应的当前权重值确定总损失函数;基于所述总损失函数进行梯度回传,调整所述风格迁移模型中包括的各个损失函数对应的权重值。
在本公开实施例中,可以根据图像损失函数以及其对应的权重值、文本篡改损失函数以及其对应的权重值、图像篡改损失函数以及其对应的权重值和属性保持损失函数以及其对应的权重值,计算总损失函数。
进一步的,根据总损失函数,利用梯度回传的方式调整各个损失函数对应的新的权重值。反复重复上述权重值的确定方式,进行迭代计算,直到总损失函数满足确定条件之后,确定风格迁移模型训练完成。
在上述实施例的基础上,所述基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型,包括:将所述目标风格图像和所述原始图像输入至所述风格迁移模型,得到风格回迁图像;基于所述原始图像和所述风格回迁图像确定所述风格迁移模型的迁移质量;在所述风格迁移模型的迁移质量未满足风格迁移需求时,校正所述风格迁移模型。
在本公开的一个实施方式中,所述基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型,包括:将所述目标风格图像和所述原始图像输入至所述风格迁移模型,得到风格回迁图像;基于所述原始图像和所述风格回迁图像确定所述风格迁移模型的迁移质量;在所述风格迁移模型的迁移质量未满足风格迁移需求时,校正所述风格迁移模型。
在本公开的实施例中,利用风格迁移模型将原始图像中的风格信息迁移至目标风格图像上,得到风格回迁图像。
在本公开的一个实施方式中,基于所述原始图像和所述风格回迁图像确定所述风格迁移模型的迁移质量,包括:计算所述原始图像和所述风格回迁图像之间的图像相似度;基于所述图像相似度判断所述风格迁移模型的迁移质量是否满足风格迁移需求。
在本公开的一个实施方式中,在风格迁移是通过风格迁移模型来处理时,如果原始图像和风格回迁图像之间的图像相似度越高,则表明风格迁移模型对原始图像中的内容信息改变越少。如果原始图像和风格回迁图像之间的图像相似度越低,则风格迁移模型对原始图像中的内容信息改变越多,风格迁移模型质量较差,可能需要再次进行训练。
在本公开的一个实施方式中,基于所述图像相似度判断所述风格迁移模型的迁移质量是否满足风格迁移需求,包括:如果所述图像相似度大于或等于相似度阈值,则确定风格迁移模型的迁移质量满足风格迁移需求;如果所述图像相似度小于所述相似度阈值,则确定风格迁移模型的迁移质量不满足风格迁移需求。
其中,所述相似度阈值可以根据实际情况进行设置,例如:在所述原始图像中的内容信息占据比例较多,而参考风格图像中的风格信息占据比例较少时,所述相似度阈值可以大一些。在所述原始图像中的内容信息占据比例较小,而参考风格图像中的风格信息占据比例较多时,所述相似度阈值可以小一些。以提高风格迁移质量评估的准确性。
例如:在将参考分割图像中的头发颜色信息迁移到原始图像中的头发区域中时,如果头发区域在原始图像中占据的面积较大,而内容信息(比如:人脸、背景、身体部分)占据的面积较小(例如:自拍图像中头发区域占据面积较大),此时相似度阈值可以设置的小一些。如果头发区域在原始图像中占据的面积较小,而内容信息(比如:人脸、背景、身体部分)占据的面积较小(例如:远景图像中头发区域占据面积较小),此时相似度阈值可以设置的大一些。
在本公开实施例中,将得到的两张图像的图像相似度与相似度阈值进行比较,如果图像相似度大于相似度阈值,表明风格迁移质量越好,风格迁移模型对原始图像中的内容信息改变越少,该风格迁移方法可以投入使用。如果图像相似度小于相似度阈值,表明风格迁移质量越差,风格迁移模型对原始图像中的内容信息改变越多,风格迁移模型质量较差,可能需要再次进行训练。
在本公开的一个实施方式中,在所述原始图像是多张图像时,基于所述图像相似度判断所述风格迁移模型的迁移质量是否满足风格迁移需求,包括:针对每个原始图像对应所述风格回迁图像,计算所述原始图像和所述风格回迁图像之间的图像相似度;计算多个所述图像相似度的平均值,得到相似度平均值;基于所述相似度平均值判断所述风格迁移模型的迁移质量是否满足风格迁移需求。
在本公开实施例中,如果仅仅采用一张待编辑图像对风格迁移质量进行评估,可能会存在一定的误差,本公开实施例中,采用多张原始图像对风格迁移模型的迁移质量进行评估。其中,每张原始图像均存在其对应的风格回迁图像,每张原始图像对应的风格回迁图像可以相同,也可以不同,本公开实施例中不具体限定。
在本公开实施例中,每张原始图像都有其对应的图像相似度,进而可以得到多个图像相似度。其中,所述原始图像对应的图像相似度可以是指,将原始图像对应的参考风格图像中的风格信息迁移到原始图像中,得到目标风格图像,将原始图像中的风格信息迁移到目标风格图像中,得到风格回迁图像,原始图像与风格回迁图像之间的图像相似度。
进一步的,得到多个图像相似度之后,计算多个图像相似度的评估值,得到相似度平均值,基于相似度平均值判断所述风格迁移模型的迁移质量是否满足风格迁移需求。
在本公开实施例中,“基于相似度平均值判断所述风格迁移模型的迁移质量是否满足风格迁移需求”的流程与上述实施例中提供的“基于所述图像相似度判断所述风格迁移模型的迁移质量是否满足风格迁移需求”的流程相同,具体可参照上述实施例中的描述,本公开实施例中不再赘述。
本公开实施中,使用一定数量的原始图像进行测试,分别计算每张原始图像对应的图像相似度,再计算相似度平均值,相似度平均值越小,说明风格迁移方法对图像内容改变越少。
在本公开的一个实施方式中,所述图像相似性,通过如下一个或者多个参数确定:两个图像之间的余弦相似性;两个图像之间的峰值信噪比;两个图像之间的结构相似性;两个图像之间的平均结构相似性。
在本公开的一个实施方式中,在所述图像相似度通过多个相似度参数来确定时,可以将多个相似度参数进行归一化处理之后,求取多个相似度参数的平均值作为两个图像之间的图像相似度。
在本公开的一个实施方式中,在所述图像相似度通过多个相似度参数来确定时,可以将多个相似度参数进行归一化处理之后,求取多个相似度参数的加权平均值作为两个图像之间的图像相似度。其中,每个相似度参数对应的权重值可以根据风格迁移模型的应用场景进行设置,本公开实施例中不具体限定。
在本公开实施例中,余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估两个图像的相似度。余弦值越接近1,就表明两个向量的夹角越接近0度,也就是两个向量越相似。
在本公开实施例中,分别对两个图像分别进行特征提取,得到两个高维特征向量,根据余弦计算公式计算两个高维特征向量之间的余弦值,计算两个图像之间的图像相似度。
在本公开实施例中,峰值信噪比是一个广泛应用于评价图像质量的客观标准。峰值信噪比越大,表示图像失真越小,两个图像之间的相似度越大。其中,两个图像之间的峰值信噪比是待编辑图像与第二图像之间的均方误差相对于(2^n-1)^2的对数值,其中,n为采样值,可以根据实际情况进行设置。
在本公开实施例中,结构相似性(Structural Similarity,SSIM),是一种衡量两张图像相似度的指标。SSIM基于两个图像的亮度(Luminance)、对比度(Contrast)和结构(Structure)代入预设的SSIM计算公式中得到。
在本公开实施例中,可以利用滑动窗将待编辑图像和第二图像进行分块(blocks)。计算每个图像块的平均值、标准差、协方差,然后得到每个图像块的SSIM,再对每个图像块的SSIM求平均值,即为平均结构相似性(Mean SSIM,MSSSIM)。考虑到滑动窗的分块影响,可以采用高斯加权(圆对称高斯加权)计算每个图像块的平均值、标准差、协方差,然后得到每个图像块的SSIM,再对每个图像块的SSIM求平均即得到MSSIM。
在上述实施例的基础上,本公开实施例还提供一种图像处理方法,如图2所示,本公开实施例中提供的图像处理方法包括步骤S201和S202。
S201、获取待处理图像。
其中,所述待处理图像是指需要对图像中包括的头发区域进行颜色迁移的图像,颜色迁移是指将颜色A替换为颜色B。其中,所述颜色B为风格迁移模型中预设的颜色。所述待处理图像可以是用户通过终端设备上的图像采集装置采集到的图像,也可以是通过截取视频帧截取到的图像,本公开实施例中不限定待处理图像的获取方式。
S202、将所述待处理图像输入至校正后的风格迁移模型中,得到输出图像;其中,所述输出图像中的目标对象与所述待处理图像中的目标对象的风格信息不一致。
在本公开实施例中,由于风格迁移模型训练过程中,引入了目标风格图像和引导风格图像之间的图像损失函数,对风格迁移模型进行优化,使得训练完成的发色迁移模型进行发色迁移时,提高输出图像中头发颜色的自然度。
本公开实施例在风格迁移模型训练过程中,引入了目标风格图像和引导风格图像之间的损失函数设计,能明显提升风格编辑后的自然度,提高用户使用体验。
图3为本公开实施例中的一种图像处理装置的结构示意图,本实施例可适用于图像处理的情况,该图像处理装置可以采用软件和/或硬件的方式实现,该图像处理装置可配置于电子设备中。
如图3所述,本公开实施例提供的图像处理装置30主要包括:图像获取模块31、图像处理模块32和模型校正模块33。
其中,图像获取模块31,用于获取原始图像和参考风格图像;图像处理模块32,用于利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;模型校正模块33,用于基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。
在本公开的一个实施方式中,模型校正模块33,包括:引导风格图像确定单元,用于采用预设风格复制方式将所述参考风格图像的风格信息复制至所述原始图像上得到,得到引导风格图像;图像损失函数确定单元,用于基于所述目标风格图像和所述引导风格图像确定图像损失函数;损失函数校正单元,用于利用所述图像损失函数校正所述风格迁移模型中包括的各个损失函数的权重值。
在本公开的一个实施方式中,所述图像损失函数用于表示所述目标风格图像和所述引导风格图像之间的图像相似性表示。
在本公开的一个实施方式中,所述损失函数包括如下一个或多个:文本篡改损失函数、图像篡改损失函数和属性保持损失函数,所述文本篡改损失函数用于表示所述第一图像与预设文本描述之间的相似性,所述图像篡改损失函数用于表示所述第一图像与所述参考图像之间的相似性,所述属性保持损失函数用于表示所述第一图像的内容信息与所述输入图像的内容信息之间的相似性。
在本公开的一个实施方式中,损失函数校正单元,具体用于基于所述图像损失函数、文本篡改损失函数、图像篡改损失函数和属性保持损失函数以及各个损失函数对应的当前权重值确定总损失函数;基于所述总损失函数进行梯度回传,调整所述风格迁移模型中包括的各个损失函数对应的权重值。
在本公开的一个实施方式中,模型校正模块33,包括:风格回迁图像确定单元,用于将所述目标风格图像和所述原始图像输入至所述风格迁移模型,得到风格回迁图像;迁移质量确定单元,用于基于所述原始图像和所述风格回迁图像确定所述风格迁移模型的迁移质量;模型校正单元,用于在所述风格迁移模型的迁移质量未满足风格迁移需求时,校正所述风格迁移模型。
在本公开的一个实施方式中,迁移质量确定单元,具体用于计算所述原始图像和所述风格回迁图像之间的图像相似度;基于所述图像相似度判断所述风格迁移模型的迁移质量是否满足风格迁移需求。
在本公开的一个实施方式中,所述图像相似性,通过如下一个或者多个参数确定:两个图像之间的余弦相似性;两个图像之间的峰值信噪比;两个图像之间的结构相似性;两个图像之间的平均结构相似性。
在本公开的一个实施方式中,所述装置还包括:待处理图像获取模块,用于获取待处理图像;输出图像确定模块,用于将所述待处理图像输入至校正后的风格迁移模型中,得到输出图像;其中,所述输出图像中的目标对象与所述待处理图像中的目标对象的风格信息不一致。
本公开实施例提供的图像处理装置,可执行本公开方法实施例所提供的图像处理方法中所执行的步骤,具备执行步骤和有益效果此处不再赘述。
图4为本公开实施例中的一种电子设备的结构示意图。下面具体参考图4,其示出了适于用来实现本公开实施例中的电子设备400的结构示意图。本公开实施例中的电子设备400可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)、可穿戴终端设备等等的移动终端以及诸如数字TV、台式计算机、智能家居设备等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理以实现如本公开所述的实施例的图像块训练集的确定方法。在RAM 403中,还存储有终端设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许终端设备400与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的终端设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码,从而实现如上所述的图像块训练集的确定方法。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该终端设备执行时,使得该终端设备:获取原始图像和参考风格图像;利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。
可选的,当上述一个或者多个程序被该终端设备执行时,该终端设备还可以执行上述实施例所述的其他步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,本公开提供了一种图像处理方法,包括:
获取原始图像和参考风格图像;利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。
根据本公开的一个或多个实施例,本公开提供了一种图像处理装置,所述装置包括:图像获取模块,用于获取原始图像和参考风格图像;图像处理模块,用于利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;模型校正模块,用于基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。
根据本公开的一个或多个实施例,本公开提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开提供的任一所述的图像处理方法。
根据本公开的一个或多个实施例,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开提供的任一所述的图像处理方法。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现如上所述的图像处理方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
Claims (13)
1.一种图像处理方法,其特征在于,包括:
获取原始图像和参考风格图像;
利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;
基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。
2.根据权利要求1所述的方法,其特征在于,所述基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型,包括:
采用预设风格复制方式将所述参考风格图像的风格信息复制至所述原始图像上得到,得到引导风格图像;
基于所述目标风格图像和所述引导风格图像确定图像损失函数;
利用所述图像损失函数校正所述风格迁移模型中包括的各个损失函数的权重值。
3.根据权利要求2所述的方法,其特征在于,所述图像损失函数用于表示所述目标风格图像和所述引导风格图像之间的图像相似性表示。
4.根据权利要求2所述的方法,其特征在于,所述损失函数包括如下一个或多个:文本篡改损失函数、图像篡改损失函数和属性保持损失函数,所述文本篡改损失函数用于表示所述第一图像与预设文本描述之间的相似性,所述图像篡改损失函数用于表示所述第一图像与所述参考图像之间的相似性,所述属性保持损失函数用于表示所述第一图像的内容信息与所述输入图像的内容信息之间的相似性。
5.根据权利要求4所述的方法,其特征在于,利用所述图像损失函数校正所述风格迁移模型中包括的各个损失函数的权重值,包括:
基于所述图像损失函数、文本篡改损失函数、图像篡改损失函数和属性保持损失函数以及各个损失函数对应的当前权重值确定总损失函数;
基于所述总损失函数进行梯度回传,调整所述风格迁移模型中包括的各个损失函数对应的权重值。
6.根据权利要求1所述的方法,其特征在于,所述基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型,包括:
将所述目标风格图像和所述原始图像输入至所述风格迁移模型,得到风格回迁图像;
基于所述原始图像和所述风格回迁图像确定所述风格迁移模型的迁移质量;
在所述风格迁移模型的迁移质量未满足风格迁移需求时,校正所述风格迁移模型。
7.根据权利要求6所述的方法,其特征在于,基于所述原始图像和所述风格回迁图像确定所述风格迁移模型的迁移质量,包括:
计算所述原始图像和所述风格回迁图像之间的图像相似度;
基于所述图像相似度判断所述风格迁移模型的迁移质量是否满足风格迁移需求。
8.根据权利要求3或7所述的方法,其特征在于,所述图像相似性,通过如下一个或者多个参数确定:
两个图像之间的余弦相似性;
两个图像之间的峰值信噪比;
两个图像之间的结构相似性;
两个图像之间的平均结构相似性。
9.根据权利要求1所述的方法,其特征在于,还包括:
获取待处理图像;
将所述待处理图像输入至校正后的风格迁移模型中,得到输出图像;其中,所述输出图像中的目标对象与所述待处理图像中的目标对象的风格信息不一致。
10.一种图像处理装置,其特征在于,包括:
图像获取模块,用于获取原始图像和参考风格图像;
图像处理模块,用于利用风格迁移模型将所述参考风格图像中目标对象的风格迁移至所述原始图像的目标对象上,得到目标风格图像;
模型校正模块,用于基于所述原始图像、所述参考风格图像和所述目标风格图像校正所述风格迁移模型。
11.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一项所述的方法。
13.一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现如权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211392868.1A CN115937020B (zh) | 2022-11-08 | 2022-11-08 | 图像处理方法、装置、设备、介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211392868.1A CN115937020B (zh) | 2022-11-08 | 2022-11-08 | 图像处理方法、装置、设备、介质和程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115937020A true CN115937020A (zh) | 2023-04-07 |
CN115937020B CN115937020B (zh) | 2023-10-31 |
Family
ID=86556589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211392868.1A Active CN115937020B (zh) | 2022-11-08 | 2022-11-08 | 图像处理方法、装置、设备、介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115937020B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118135050A (zh) * | 2024-05-06 | 2024-06-04 | 深圳市奇迅新游科技股份有限公司 | 美术资源的调整方法、设备及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107481185A (zh) * | 2017-08-24 | 2017-12-15 | 深圳市唯特视科技有限公司 | 一种基于视频图像优化的风格转换方法 |
US20190244060A1 (en) * | 2018-02-02 | 2019-08-08 | Nvidia Corporation | Domain Stylization Using a Neural Network Model |
CN110598781A (zh) * | 2019-09-05 | 2019-12-20 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN111652830A (zh) * | 2020-06-28 | 2020-09-11 | Oppo广东移动通信有限公司 | 图像处理方法及装置、计算机可读介质及终端设备 |
CN112561785A (zh) * | 2020-12-21 | 2021-03-26 | 东华大学 | 基于风格迁移的丝绸文物图像数据扩充方法 |
CN112581361A (zh) * | 2020-12-30 | 2021-03-30 | 北京达佳互联信息技术有限公司 | 图像风格迁移模型的训练方法、图像风格迁移方法及装置 |
CN112818820A (zh) * | 2021-01-28 | 2021-05-18 | 北京达佳互联信息技术有限公司 | 图像生成模型训练方法、图像生成方法、装置及电子设备 |
US20210383589A1 (en) * | 2020-06-05 | 2021-12-09 | Unity IPR ApS | Methods and systems for optimal transport of non-linear transformations |
CN113822793A (zh) * | 2021-07-16 | 2021-12-21 | 华南理工大学 | 图像处理方法、装置和存储介质及电子设备 |
CN113869429A (zh) * | 2021-09-29 | 2021-12-31 | 北京百度网讯科技有限公司 | 模型训练方法及图像处理方法 |
CN114723974A (zh) * | 2022-03-09 | 2022-07-08 | 杨晨煜 | 一种基于神经网络的智能仿妆系统及仿妆生成方法 |
CN115186056A (zh) * | 2022-07-01 | 2022-10-14 | Oppo广东移动通信有限公司 | 文本风格迁移方法、装置、电子设备及存储介质 |
-
2022
- 2022-11-08 CN CN202211392868.1A patent/CN115937020B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107481185A (zh) * | 2017-08-24 | 2017-12-15 | 深圳市唯特视科技有限公司 | 一种基于视频图像优化的风格转换方法 |
US20190244060A1 (en) * | 2018-02-02 | 2019-08-08 | Nvidia Corporation | Domain Stylization Using a Neural Network Model |
CN110598781A (zh) * | 2019-09-05 | 2019-12-20 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备及存储介质 |
US20210383589A1 (en) * | 2020-06-05 | 2021-12-09 | Unity IPR ApS | Methods and systems for optimal transport of non-linear transformations |
CN111652830A (zh) * | 2020-06-28 | 2020-09-11 | Oppo广东移动通信有限公司 | 图像处理方法及装置、计算机可读介质及终端设备 |
CN112561785A (zh) * | 2020-12-21 | 2021-03-26 | 东华大学 | 基于风格迁移的丝绸文物图像数据扩充方法 |
CN112581361A (zh) * | 2020-12-30 | 2021-03-30 | 北京达佳互联信息技术有限公司 | 图像风格迁移模型的训练方法、图像风格迁移方法及装置 |
CN112818820A (zh) * | 2021-01-28 | 2021-05-18 | 北京达佳互联信息技术有限公司 | 图像生成模型训练方法、图像生成方法、装置及电子设备 |
CN113822793A (zh) * | 2021-07-16 | 2021-12-21 | 华南理工大学 | 图像处理方法、装置和存储介质及电子设备 |
CN113869429A (zh) * | 2021-09-29 | 2021-12-31 | 北京百度网讯科技有限公司 | 模型训练方法及图像处理方法 |
CN114723974A (zh) * | 2022-03-09 | 2022-07-08 | 杨晨煜 | 一种基于神经网络的智能仿妆系统及仿妆生成方法 |
CN115186056A (zh) * | 2022-07-01 | 2022-10-14 | Oppo广东移动通信有限公司 | 文本风格迁移方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
PEI WANG, YIJUN LI: "Rethinking and Improving the Robustness of Image Style Transfer", 《ARXIV:2104.05623》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118135050A (zh) * | 2024-05-06 | 2024-06-04 | 深圳市奇迅新游科技股份有限公司 | 美术资源的调整方法、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115937020B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543714B (zh) | 数据特征的获取方法、装置、电子设备及存储介质 | |
CN111476309A (zh) | 图像处理方法、模型训练方法、装置、设备及可读介质 | |
CN113034648A (zh) | 图像处理方法、装置、设备和存储介质 | |
CN113689372A (zh) | 图像处理方法、设备、存储介质及程序产品 | |
CN113222983A (zh) | 图像处理方法、装置、可读介质和电子设备 | |
CN110689478B (zh) | 图像风格化处理方法、装置、电子设备及可读介质 | |
CN115937020B (zh) | 图像处理方法、装置、设备、介质和程序产品 | |
CN109359727B (zh) | 神经网络的结构确定方法、装置、设备及可读介质 | |
CN111402113A (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN113902636A (zh) | 图像去模糊方法及装置、计算机可读介质和电子设备 | |
CN114037990A (zh) | 一种字符识别方法、装置、设备、介质及产品 | |
CN113140012A (zh) | 图像处理方法、装置、介质及电子设备 | |
CN117171573A (zh) | 多模态模型的训练方法、装置、设备和存储介质 | |
CN116935166A (zh) | 模型训练方法、图像处理方法及装置、介质、设备 | |
CN115205157B (zh) | 图像处理方法和系统、电子设备和存储介质 | |
CN111784726A (zh) | 人像抠图方法和装置 | |
CN110619602A (zh) | 一种图像生成方法、装置、电子设备及存储介质 | |
CN115546554A (zh) | 敏感图像的识别方法、装置、设备和计算机可读存储介质 | |
CN116644783A (zh) | 模型训练方法、对象处理方法及装置、电子设备、介质 | |
CN111737575B (zh) | 内容分发方法、装置、可读介质及电子设备 | |
CN117115070A (zh) | 图像评估方法、装置、设备、存储介质和程序产品 | |
CN116310615A (zh) | 图像处理方法、装置、设备及介质 | |
CN115829827A (zh) | 人脸图像处理方法、装置、设备及介质 | |
CN115937338B (zh) | 图像处理方法、装置、设备及介质 | |
CN114429420B (zh) | 图像的生成方法、装置、可读介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |