CN112669308A - 基于风格迁移的图像生成方法、系统、设备及存储介质 - Google Patents
基于风格迁移的图像生成方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN112669308A CN112669308A CN202110014885.0A CN202110014885A CN112669308A CN 112669308 A CN112669308 A CN 112669308A CN 202110014885 A CN202110014885 A CN 202110014885A CN 112669308 A CN112669308 A CN 112669308A
- Authority
- CN
- China
- Prior art keywords
- image
- style
- style migration
- images
- image generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013508 migration Methods 0.000 title claims abstract description 96
- 230000005012 migration Effects 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000005286 illumination Methods 0.000 claims abstract description 12
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000009877 rendering Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000005070 sampling Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Image Processing (AREA)
Abstract
本发明提供了一种基于风格迁移的图像生成方法、系统、设备及存储介质,该方法包括:采集需要风格迁移的内容图像和对应不同风格的风格图像;将所述风格图像和所述需要风格迁移的内容图像分别输入图像生成模型的编码网络,得到风格图像编码和内容图像编码;将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像。本发明基于图像风格迁移技术,建立全新的图像生成模型,能够实现轻量级、快速的图像不同时段下重新渲染的图像生成任务,解决了单一场景下,图像单一的情况,实现在不同时段光照条件下,生成高分辨率、高质量图像。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于风格迁移的图像生成方法、系统、设备及存储介质。
背景技术
随着OTA(Online Travel Agency,在线旅行社)行业的发展,和智能设备的进步,图像的数量呈指数级增长。人们对图片的多样性和质量的要求也越来越高。随着个人和企业的版权意识提升,高质量图片的生产和采购成本也逐年提升,如何快速生产出高质量、丰富多样的图像成为各个企业和研究人员关注的重点。
随着硬件(如GPU)设备的快速发展,深度学习在近年来成为学术与工业界关注的重点,利用深度学习方法来实现图像生成也随之成为是近来研究的热点。然而,针对现有版权图像采购成本高,图像库缺失严重的问题,现有算法无法生成高质量、高分辨率的不同光照条件下渲染图像。
发明内容
针对现有技术中的问题,本发明的目的在于提供一种基于风格迁移的图像生成方法、系统、设备及存储介质,实现在不同时段光照条件下,生成高分辨率、高质量图像,提升用户体验,丰富图像库,提升图像利用率。
本发明实施例提供一种基于风格迁移的图像生成方法,包括如下步骤:
采集需要风格迁移的内容图像和对应不同风格的风格图像;
将所述风格图像和所述需要风格迁移的内容图像分别输入图像生成模型的编码网络,得到风格图像编码和内容图像编码;
将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像。
在一些实施例中,将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像,包括如下步骤:
将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码器,得到编码图像;
将所述编码图像输入所述解码网络的解码层,得到风格迁移后的生成图像。
在一些实施例中,将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码器包括:
将各个所述内容图像编码分别和所对应的风格图像编码组合后,输入所述图像生成模型的解码网络中不同解码器的AdaIN模块,得到各个所述解码器输出的编码图像。
在一些实施例中,所述图像生成模型为生成式对抗网络,所述图像生成模型包括生成器,所述生成器包括所述编码网络和所述解码网络。
在一些实施例中,所述采集需要风格迁移的内容图像,包括如下步骤:
采集具有第一分辨率的原始内容图像;
获取所述原始内容图像的多个具有第二分辨率的子图像,所述第二分辨率小于所述第一分辨率;
将所述子图像作为需要风格迁移的内容图像。
在一些实施例中,所述得到风格迁移后的生成图像之后,还包括如下步骤:
将各个所述子图像所对应的生成图像融合,得到所述原始内容图像所对应的的增强图像。
在一些实施例中,获取所述原始内容图像的多个具有第二分辨率的子图像,包括如下步骤:
将所述原始内容图像拆分得到多个不同移位版本的移位子图像;
对每一个移位子图像进行双线性下采样得到具有第二分辨率的子图像。
在一些实施例中,将所述原始内容图像拆分得到多个不同移位版本的移位子图像,包括如下步骤:
确定各个移位子图像的移位位置像素点;
对于各个移位子图像,在其移位位置像素点处保留所述原始内容图像对应位置的像素值,其他位置的像素值置为0,得到具有第一分辨率的移位子图像。
在一些实施例中,所述将各个所述子图像所对应的生成图像融合,得到所述原始内容图像所对应的的增强图像,包括如下步骤:
根据各个所述子图像中像素点位置与所述原始内容图像的像素点位置的对应关系,将各个具有第二分辨率的所述生成图像融合,得到具有第一分辨率的增强图像。
在一些实施例中,所述对应不同风格的风格图像为对应于不同光照条件的风格图像;
所述风格迁移后的生成图像为所述内容图像对应于不同光照条件下的风格迁移图像。
本发明实施例还提供一种基于风格迁移的图像生成系统,用于实现所述的基于风格迁移的图像生成方法,其特征在于,所述系统包括:
图像采集模块,用于采集需要风格迁移的内容图像和对应不同风格的风格图像;
图像编码模块,用于将所述风格图像和所述内容图像分别输入图像生成模型的编码网络,得到风格图像编码和内容图像编码;
图像解码模块,用于将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像。
本发明实施例还提供一种基于风格迁移的图像生成设备,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行所述的基于风格迁移的图像生成方法的步骤。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的基于风格迁移的图像生成方法的步骤。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
本发明的基于风格迁移的图像生成方法、系统、设备及存储介质具有如下有益效果:
本发明基于图像风格迁移技术,建立全新的图像生成模型,能够实现轻量级、快速的图像不同时段下重新渲染的图像生成任务,解决了单一场景下,图像单一的情况,实现在不同时段光照条件下,生成高分辨率、高质量图像,大幅度节约人工运营成本,降低图像采购成本,提高图像利用效率,丰富图像库,提升用户体验,打造在线旅行社的品牌形象。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1是本发明一实施例的基于风格迁移的图像生成方法的流程图;
图2是本发明一实施例的图像生成模型的生成器的结构示意图;
图3是本发明一实施例的图像增强的示意图;
图4是本发明一实施例的基于风格迁移的图像生成系统的结构示意图;
图5是本发明一实施例的基于风格迁移的图像生成设备的结构示意图;
图6是本发明一实施例的计算机可读存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的步骤。例如,有的步骤还可以分解,而有的步骤可以合并或部分合并,因此,实际执行的顺序有可能根据实际情况改变。
如图1所示,本发明实施例提供一种基于风格迁移的图像生成方法,包括如下步骤:
S100:采集需要风格迁移的内容图像和对应不同风格的风格图像;
S200:将所述风格图像和所述需要风格迁移的内容图像分别输入图像生成模型的编码网络,得到风格图像编码和内容图像编码;
S300:将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像。
本发明的图像生成方法基于图像风格迁移技术,通过步骤S100采集不同风格的风格图像和需要风格迁移的内容图像,并通过步骤S200和S300采用全新的图像生成模型生成不同风格的图像,能够实现轻量级、快速的图像不同时段下重新渲染的图像生成任务,解决了单一场景下,图像单一的情况,实现在不同时段光照条件下,生成高分辨率、高质量图像,大幅度节约人工运营成本,降低图像采购成本,提高图像利用效率,丰富图像库,提升用户体验。
在该实施例中,所述步骤S100中,采集得到的对应不同风格的风格图像为对应于不同光照条件的风格图像。所述步骤S300中,所述风格迁移后的生成图像为所述内容图像对应于不同光照条件下的风格迁移图像。因此,本发明可以实现不同光照条件下的图像风格迁移,得到更多种图像资源。不同光照条件可以是不同时段的光照条件,也可以是不同天气状态的光照条件。
具体地,在该实施例中,所述步骤S100中,收集所期望得到的时段光照图像数据,即为风格图像Xs;收集需要转变光照情况的图像,即为内容图像Xc。
在该实施例中,所述步骤S200和步骤S300中采用的图像生成模型为生成式对抗网络,所述图像生成模型包括生成器,所述生成器包括所述编码网络和所述解码网络。生成式对抗网络(GAN,Generative Adversarial Networks)是深度学习中的一种无监督学习网络。与传统基于CNN(卷积神经网络)的图像生成方法有所不同,基于生成式对抗网络的图像生成方法具有生成图像速度快、风格多样、质量高等特点。
所述图像生成模型还可以包括判别器,所述判别器用于基于神经网络来判断所述生成器输出的生成图像是否为真实的。在所述图像生成模型的训练过程中,通过所述生成器和所述判别器相互博弈,优化所述生成器的输出结果。
如图2所示,为该实施例的基于风格迁移的图像生成模型的示意图。其中,S表示风格图像编码,C表示内容图像编码。所述图像生成模型G_gen包括编码网络G_e和解码网络G_d。
具体地,在该实施例中,所述步骤S200包括如下步骤:
所述步骤S300:将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像,包括如下步骤:
将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码器,得到编码图像;
将所述编码图像输入所述解码网络的解码层,得到风格迁移后的生成图像。
在该实施例中,将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码器包括:
将各个所述内容图像编码分别和所对应的风格图像编码组合后,输入所述图像生成模型的解码网络中不同解码器的AdaIN模块,得到各个所述解码器输出的编码图像。此处将各个所述内容图像编码分别和所对应的风格图像编码组合,即将一需要迁移的内容图像编码和其所对应的一风格图像编码形成一组合,输入到一解码器的AdaIN模块中,该解码器输出的即为对应于该组合的风格迁移后的生成图像。
具体地,所述步骤S300包括如下步骤:
其中,H和W分别代表图像的长和高,2代表一个非常小的实数。
在该实施例中,为了提高生成图像的质量和生成图像的效率,所述图像生成方法进一步还可以包括图像增强。如图3所示,具体地,所述步骤S100中,采集需要风格迁移的内容图像,包括如下步骤:
采集具有第一分辨率的原始内容图像;
获取所述原始内容图像的多个具有第二分辨率的子图像,所述第二分辨率小于所述第一分辨率,即所述原始内容图像为高分辨率的原始输入图像,各个所述子图像为处理后具有所述原始内容图像一部分图像信息的具有中分辨率的内容图像;
如图3所示,在该实施例中,所述步骤S300:得到风格迁移后的生成图像之后,还包括如下步骤:
具体地,在该实施例中,获取所述原始内容图像的多个具有第二分辨率的子图像,包括如下步骤:
将所述原始内容图像拆分得到N个不同移位版本的移位子图像不同移位版本的子图像,所述移位子图像与所述原始内容图像的分辨率相同,即也具有第一分辨率;N的值为预设的子图像数量;具体地,即为对于每个移位子图像,根据每间隔N个像素保留Xc,对于其他位置的中间像素用0去替代,得到移位后高分辨率图像;
在该实施例中,将所述原始内容图像拆分得到多个不同移位版本的移位子图像,包括如下步骤:
确定各个移位子图像的移位位置像素点,例如对于图3中的第一个子图像来说,其移位位置像素点即对应于原始内容图像中第一行第一列像素点、第三行第一列像素点、第五行第一列像素点、第一行第三列像素点、第三行第三列像素点……;
对于各个移位子图像,在其移位位置像素点处保留所述原始内容图像对应位置的像素值,其他位置的像素值置为0,得到具有第一分辨率的移位子图像。
然后再经过双线性下采样后,只保留有像素值的部分,即得到对应的只有移位位置像素点的图像信息的子图像。
如图3所示,在该实施例中,所述将各个所述子图像所对应的生成图像融合,得到所述原始内容图像所对应的的增强图像,包括如下步骤:
如图4所示,本发明实施例还提供一种基于风格迁移的图像生成系统,用于实现所述的基于风格迁移的图像生成方法,其特征在于,所述系统包括:
图像采集模块M100,用于采集需要风格迁移的内容图像和对应不同风格的风格图像;
图像编码模块M200,用于将所述风格图像和所述内容图像分别输入图像生成模型的编码网络,得到风格图像编码和内容图像编码;
图像解码模块M300,用于将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像。
本发明的图像生成系统基于图像风格迁移技术,采用图像采集模块M100采集不同风格的风格图像和需要风格迁移的内容图像,并采用图像编码模块M200和图像解码模块M300利用全新的图像生成模型生成不同风格的图像,能够实现轻量级、快速的图像不同时段下重新渲染的图像生成任务,解决了单一场景下,图像单一的情况,实现在不同时段光照条件下,生成高分辨率、高质量图像,大幅度节约人工运营成本,降低图像采购成本,提高图像利用效率,丰富图像库,提升用户体验。
进一步地,所述图像采集模块M100采集得到的对应不同风格的风格图像为对应于不同光照条件的风格图像。所述图像解码模块M300得到的所述风格迁移后的生成图像为所述内容图像对应于不同光照条件下的风格迁移图像。因此,本发明可以实现不同光照条件下的图像风格迁移,得到更多种图像资源。不同光照条件可以是不同时段的光照条件,也可以是不同天气状态的光照条件。
进一步地,所述图像编码模块M200和所述图像解码模块M300所采用的图像生成模型为生成式对抗网络,所述图像生成模型包括生成器,所述生成器包括所述编码网络和所述解码网络。所述图像生成模型还可以包括判别器,所述判别器用于基于神经网络来判断所述生成器输出的生成图像是否为真实的。所述图像生成系统还可以包括模型训练模块,用于训练所述图像生成模型,并在所述图像生成模型的训练过程中,通过所述生成器和所述判别器相互博弈,优化所述生成器的输出结果。
进一步地,所述图像解码模块M300将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像,包括:所述图像解码模块M300将各个所述内容图像编码分别和所对应的风格图像编码组合后,输入所述图像生成模型的解码网络中不同解码器的AdaIN模块,得到各个所述解码器输出的编码图像;将所述编码图像输入所述解码网络的解码层,得到风格迁移后的生成图像。
进一步地,在该实施例中,所述图像生成系统还包括子图像生成模块,用于将所述原始内容图像拆分得到多个不同移位版本的移位子图像;对每一个移位子图像进行双线性下采样得到具有第二分辨率的子图像;将所述子图像作为输入到所述图像生成模型的需要风格迁移的内容图像。具体移位子图像的生成方式可以采用上述图像生成方法的实施例中的移位子图像生成方式。
进一步地,在该实施例中,所述图像生成系统还包括图像融合模块,用于根据各个所述子图像中像素点位置与所述原始内容图像的像素点位置的对应关系,将各个具有第二分辨率的所述生成图像融合,得到具有第一分辨率的增强图像。
本发明实施例还提供一种基于风格迁移的图像生成设备,包括处理器;存储器,其中存储有所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行所述的基于风格迁移的图像生成方法的步骤。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。
下面参照图5来描述根据本发明的这种实施方式的电子设备600。图5显示的电子设备600仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同系统组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书上述基于风格迁移的图像生成方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图1中所示的步骤。
所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备700(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备600交互的设备通信,和/或与使得该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
所述基于风格迁移的图像生成设备中,所述存储器中的程序被处理器执行时实现所述的基于风格迁移的图像生成方法的步骤,因此,所述计算机存储介质也可以获得上述基于风格迁移的图像生成方法的技术效果。
本发明实施例还提供一种计算机可读存储介质,用于存储程序,所述程序被处理器执行时实现所述的基于风格迁移的图像生成方法的步骤。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上执行时,所述程序代码用于使所述终端设备执行本说明书上述基于风格迁移的图像生成方法部分中描述的根据本发明各种示例性实施方式的步骤。
参考图6所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上执行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
所述计算机存储介质中的程序被处理器执行时实现所述的基于风格迁移的图像生成方法的步骤,因此,所述计算机存储介质也可以获得上述基于风格迁移的图像生成方法的技术效果。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (13)
1.一种基于风格迁移的图像生成方法,其特征在于,包括如下步骤:
采集需要风格迁移的内容图像和对应不同风格的风格图像;
将所述风格图像和所述需要风格迁移的内容图像分别输入图像生成模型的编码网络,得到风格图像编码和内容图像编码;
将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像。
2.根据权利要求1所述的基于风格迁移的图像生成方法,其特征在于,将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像,包括如下步骤:
将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码器,得到编码图像;
将所述编码图像输入所述解码网络的解码层,得到风格迁移后的生成图像。
3.根据权利要求2所述的基于风格迁移的图像生成方法,其特征在于,将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码器包括:
将各个所述内容图像编码分别和所对应的风格图像编码组合后,输入所述图像生成模型的解码网络中不同解码器的AdaIN模块,得到各个所述解码器输出的编码图像。
4.根据权利要求1所述的基于风格迁移的图像生成方法,其特征在于,所述图像生成模型为生成式对抗网络,所述图像生成模型包括生成器,所述生成器包括所述编码网络和所述解码网络。
5.根据权利要求1所述的基于风格迁移的图像生成方法,其特征在于,所述采集需要风格迁移的内容图像,包括如下步骤:
采集具有第一分辨率的原始内容图像;
获取所述原始内容图像的多个具有第二分辨率的子图像,所述第二分辨率小于所述第一分辨率;
将所述子图像作为需要风格迁移的内容图像。
6.根据权利要求5所述的基于风格迁移的图像生成方法,其特征在于,所述得到风格迁移后的生成图像之后,还包括如下步骤:
将各个所述子图像所对应的生成图像融合,得到所述原始内容图像所对应的的增强图像。
7.根据权利要求6所述的基于风格迁移的图像生成方法,其特征在于,获取所述原始内容图像的多个具有第二分辨率的子图像,包括如下步骤:
将所述原始内容图像拆分得到多个不同移位版本的移位子图像;
对每一个移位子图像进行双线性下采样得到具有第二分辨率的子图像。
8.根据权利要求7所述的基于风格迁移的图像生成方法,其特征在于,将所述原始内容图像拆分得到多个不同移位版本的移位子图像,包括如下步骤:
确定各个移位子图像的移位位置像素点;
对于各个移位子图像,在其移位位置像素点处保留所述原始内容图像对应位置的像素值,其他位置的像素值置为0,得到具有第一分辨率的移位子图像。
9.根据权利要求8所述的基于风格迁移的图像生成方法,其特征在于,所述将各个所述子图像所对应的生成图像融合,得到所述原始内容图像所对应的的增强图像,包括如下步骤:
根据各个所述子图像中像素点位置与所述原始内容图像的像素点位置的对应关系,将各个具有第二分辨率的所述生成图像融合,得到具有第一分辨率的增强图像。
10.根据权利要求1所述的基于风格迁移的图像生成方法,其特征在于,所述对应不同风格的风格图像为对应于不同光照条件的风格图像;
所述风格迁移后的生成图像为所述内容图像对应于不同光照条件下的风格迁移图像。
11.一种基于风格迁移的图像生成系统,用于实现权利要求1至10中任一项所述的基于风格迁移的图像生成方法,其特征在于,所述系统包括:
图像采集模块,用于采集需要风格迁移的内容图像和对应不同风格的风格图像;
图像编码模块,用于将所述风格图像和所述内容图像分别输入图像生成模型的编码网络,得到风格图像编码和内容图像编码;
图像解码模块,用于将所述风格图像编码和所述内容图像编码输入所述图像生成模型的解码网络,得到风格迁移后的生成图像。
12.一种基于风格迁移的图像生成设备,其特征在于,包括:
处理器;
存储器,其中存储有所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至10中任一项所述的基于风格迁移的图像生成方法的步骤。
13.一种计算机可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现权利要求1至10中任一项所述的基于风格迁移的图像生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110014885.0A CN112669308B (zh) | 2021-01-06 | 2021-01-06 | 基于风格迁移的图像生成方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110014885.0A CN112669308B (zh) | 2021-01-06 | 2021-01-06 | 基于风格迁移的图像生成方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112669308A true CN112669308A (zh) | 2021-04-16 |
CN112669308B CN112669308B (zh) | 2024-05-24 |
Family
ID=75413252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110014885.0A Active CN112669308B (zh) | 2021-01-06 | 2021-01-06 | 基于风格迁移的图像生成方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112669308B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113327194A (zh) * | 2021-06-30 | 2021-08-31 | 北京百度网讯科技有限公司 | 图像风格迁移方法、装置、设备和存储介质 |
CN113554549A (zh) * | 2021-07-27 | 2021-10-26 | 深圳思谋信息科技有限公司 | 文本图像的生成方法、装置、计算机设备和存储介质 |
CN114331820A (zh) * | 2021-12-29 | 2022-04-12 | 北京字跳网络技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN115861312A (zh) * | 2023-02-24 | 2023-03-28 | 季华实验室 | 基于风格迁移正样本生成的oled干膜缺陷检测方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102019101845A1 (de) * | 2018-02-02 | 2019-08-08 | Nvidia Corporation | Photorealistische Bildstilisierung unter Verwendung eines Neuronalen-Netzwerkmodells |
KR20190112428A (ko) * | 2018-03-26 | 2019-10-07 | 한국전자통신연구원 | 통합 3d 객체모델 생성 및 의미론적 스타일전이 장치 및 방법 |
CN110310221A (zh) * | 2019-06-14 | 2019-10-08 | 大连理工大学 | 一种基于生成对抗网络的多域图像风格迁移方法 |
WO2020088280A1 (zh) * | 2018-11-01 | 2020-05-07 | 北京达佳互联信息技术有限公司 | 图像风格迁移方法和系统 |
US20200226724A1 (en) * | 2019-01-11 | 2020-07-16 | Adobe Inc. | Transferring Image Style to Content of a Digital Image |
CN111598776A (zh) * | 2020-04-29 | 2020-08-28 | Oppo广东移动通信有限公司 | 图像处理方法、图像处理装置、存储介质与电子设备 |
CN111784565A (zh) * | 2020-07-01 | 2020-10-16 | 北京字节跳动网络技术有限公司 | 图像处理方法、迁移模型训练方法、装置、介质及设备 |
CN111932445A (zh) * | 2020-07-27 | 2020-11-13 | 广州市百果园信息技术有限公司 | 对风格迁移网络的压缩方法及风格迁移方法、装置和系统 |
WO2020238120A1 (en) * | 2019-05-30 | 2020-12-03 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | System and method for single-modal or multi-modal style transfer and system for random stylization using the same |
CN112115452A (zh) * | 2019-06-20 | 2020-12-22 | 北京京东尚科信息技术有限公司 | 用于生成验证码图像的方法和装置 |
-
2021
- 2021-01-06 CN CN202110014885.0A patent/CN112669308B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102019101845A1 (de) * | 2018-02-02 | 2019-08-08 | Nvidia Corporation | Photorealistische Bildstilisierung unter Verwendung eines Neuronalen-Netzwerkmodells |
KR20190112428A (ko) * | 2018-03-26 | 2019-10-07 | 한국전자통신연구원 | 통합 3d 객체모델 생성 및 의미론적 스타일전이 장치 및 방법 |
WO2020088280A1 (zh) * | 2018-11-01 | 2020-05-07 | 北京达佳互联信息技术有限公司 | 图像风格迁移方法和系统 |
US20200226724A1 (en) * | 2019-01-11 | 2020-07-16 | Adobe Inc. | Transferring Image Style to Content of a Digital Image |
WO2020238120A1 (en) * | 2019-05-30 | 2020-12-03 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | System and method for single-modal or multi-modal style transfer and system for random stylization using the same |
CN110310221A (zh) * | 2019-06-14 | 2019-10-08 | 大连理工大学 | 一种基于生成对抗网络的多域图像风格迁移方法 |
CN112115452A (zh) * | 2019-06-20 | 2020-12-22 | 北京京东尚科信息技术有限公司 | 用于生成验证码图像的方法和装置 |
CN111598776A (zh) * | 2020-04-29 | 2020-08-28 | Oppo广东移动通信有限公司 | 图像处理方法、图像处理装置、存储介质与电子设备 |
CN111784565A (zh) * | 2020-07-01 | 2020-10-16 | 北京字节跳动网络技术有限公司 | 图像处理方法、迁移模型训练方法、装置、介质及设备 |
CN111932445A (zh) * | 2020-07-27 | 2020-11-13 | 广州市百果园信息技术有限公司 | 对风格迁移网络的压缩方法及风格迁移方法、装置和系统 |
Non-Patent Citations (1)
Title |
---|
吴岳;宋建国;: "基于改进AdaIN的图像风格迁移", 软件导刊, no. 09 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113327194A (zh) * | 2021-06-30 | 2021-08-31 | 北京百度网讯科技有限公司 | 图像风格迁移方法、装置、设备和存储介质 |
CN113554549A (zh) * | 2021-07-27 | 2021-10-26 | 深圳思谋信息科技有限公司 | 文本图像的生成方法、装置、计算机设备和存储介质 |
CN113554549B (zh) * | 2021-07-27 | 2024-03-29 | 深圳思谋信息科技有限公司 | 文本图像的生成方法、装置、计算机设备和存储介质 |
CN114331820A (zh) * | 2021-12-29 | 2022-04-12 | 北京字跳网络技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN115861312A (zh) * | 2023-02-24 | 2023-03-28 | 季华实验室 | 基于风格迁移正样本生成的oled干膜缺陷检测方法 |
CN115861312B (zh) * | 2023-02-24 | 2023-05-26 | 季华实验室 | 基于风格迁移正样本生成的oled干膜缺陷检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112669308B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112669308A (zh) | 基于风格迁移的图像生成方法、系统、设备及存储介质 | |
CN109389661B (zh) | 一种动画文件转化方法及装置 | |
Song et al. | A GPU-accelerated wavelet decompression system with SPIHT and Reed-Solomon decoding for satellite images | |
CN111079532A (zh) | 一种基于文本自编码器的视频内容描述方法 | |
CN112950471A (zh) | 视频超分处理方法、装置、超分辨率重建模型、介质 | |
CN117121015A (zh) | 利用冻结语言模型的多模态少发式学习 | |
CN114529574A (zh) | 基于图像分割的图像抠图方法、装置、计算机设备及介质 | |
CN111768466A (zh) | 图像填充方法、装置、设备及存储介质 | |
CN115082306A (zh) | 一种基于蓝图可分离残差网络的图像超分辨率方法 | |
CN113962192B (zh) | 汉字字体生成模型的生成方法、汉字字体生成方法及装置 | |
CN113569068B (zh) | 描述内容生成方法、视觉内容的编码、解码方法、装置 | |
CN116958325A (zh) | 图像处理模型的训练方法、装置、电子设备及存储介质 | |
Luhman et al. | High fidelity image synthesis with deep vaes in latent space | |
CN116168108A (zh) | 文本生成图像的方法及装置、存储介质及电子设备 | |
CN115601235A (zh) | 一种图像超分辨率网络训练方法、装置、设备及存储介质 | |
US20230186608A1 (en) | Method, device, and computer program product for video processing | |
CN115482353A (zh) | 重建网络的训练方法、重建方法、装置、设备和介质 | |
CN114399708A (zh) | 一种视频动作迁移深度学习系统和方法 | |
CN114333069A (zh) | 对象的姿态处理方法、装置、设备及存储介质 | |
CN114973224A (zh) | 一种文字识别方法、装置、电子设备及存储介质 | |
CN113902631A (zh) | 图像处理方法、电子设备和存储介质 | |
CN113592074A (zh) | 一种训练方法、生成方法及装置、电子设备 | |
CN112419216A (zh) | 图像去干扰方法、装置、电子设备及计算机可读存储介质 | |
CN113947692A (zh) | 一种通过k-means聚类进行多任务增强的分类系统及方法 | |
CN113762260A (zh) | 一种版面图片的处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |