CN114943640A - 基于gan网络结构的两阶段瓷砖图像风格化方法 - Google Patents
基于gan网络结构的两阶段瓷砖图像风格化方法 Download PDFInfo
- Publication number
- CN114943640A CN114943640A CN202210658171.8A CN202210658171A CN114943640A CN 114943640 A CN114943640 A CN 114943640A CN 202210658171 A CN202210658171 A CN 202210658171A CN 114943640 A CN114943640 A CN 114943640A
- Authority
- CN
- China
- Prior art keywords
- image
- fscale
- style
- texture
- equal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 239000000919 ceramic Substances 0.000 title claims abstract description 15
- 239000013598 vector Substances 0.000 claims abstract description 30
- 230000008569 process Effects 0.000 claims description 24
- 230000004927 fusion Effects 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 9
- 230000016776 visual perception Effects 0.000 abstract description 2
- 230000000903 blocking effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 6
- 238000013508 migration Methods 0.000 description 5
- 230000005012 migration Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/32—Indexing scheme for image data processing or generation, in general involving image mosaicing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Image Processing (AREA)
Abstract
本发明提出了一种基于GAN网络结构的两阶段瓷砖图像风格化方法,可快速实现对大尺寸瓷砖纹理图像的风格化。首先实现对纹理图像块与风格图像的生成。输入大尺寸瓷砖纹理图像和一系列风格样图,并将大尺寸瓷砖纹理图像进行全局分块,得到众多纹理图像块。同时将风格样图对应的特征向量进行加权融合,通过CAN网络生成风格图像。其次进行图像风格化操作。将前一阶段得到的纹理图像块和风格图像,依次通过AdaIN‑自编码GAN网络生成风格化图像块。对生成的图像块进行全局拼接,并进行水平、垂直、中心方向的接缝填补,形成最终的瓷砖风格化图像。该发明生成的瓷砖图像,风格效果较为突出,并且图像整体看上去较为自然,不存在明显的接缝,具有较好的视觉感受。
Description
技术领域
本发明涉及图像生成领域,提出了一种基于GAN网络结构的两阶段瓷砖图像风格化方法,该方法能够快速地对大尺寸瓷砖图像进行风格化,生成图像符合人的直观感受,对工业瓷砖图像设计具有很好的参考意义。
背景技术
现阶段用户对瓷砖图像提出了更多的个性化需求,瓷砖图像个性化设计工作越来越受到设计师们的关注。在传统设计方法中,设计师往往通过色调变换技术实现个性化瓷砖图像设计:即对已采集的瓷砖图像,通过色调变换算法或者传统的图像处理算法,改变瓷砖图像的整体色调以满足相关要求。
在深度学习领域,随着风格迁移技术被提出,解决了传统方法中图像整体色调单一的问题,并且生成图像能够融入一定的风格特征。随后,Johnson等人提出了快速风格迁移网络结构,通过对风格样图进行训练,将样图中的风格信息存入网络结构参数中,从而在图像生成阶段,能够将输入纹理图像快速转化为风格化图像输出。Zhou等人在此基础上进行改进,提出了纹理合成GAN网络结构,实现了对风格化超分图像的快速生成。Zheng等人提出了AdaIN-自编码GAN网络结构,将输入风格图像与内容图像经过编码器压缩成特征矩阵,并通过AdaIN与Mask将图像内容与风格信息进行融合,并融合后的特征图输送到解码器进行输出。实验证明,训练后的网络可以实现对任意风格图像的快速迁移,输出的风格化图像能够很好地与输入样图的风格特征相吻合。
然而这些网络结构在很大程度上依赖于GPU计算资源:随着输入瓷砖图像尺寸不断增大,网络中间层大量特征图被保存,当前GPU很可能无法支持对这些特征图的容纳与计算。由于实际工业瓷砖图像具有庞大的图像尺寸,现有的风格迁移相关网络结构难以直接得以运用。
发明内容
本发明的目的在于解决现有技术中存在的问题,并提供一种基于GAN网络结构的两阶段瓷砖图像风格化方法。
本发明的发明构思是:首先实现对纹理图像块与风格图像的生成。输入大尺寸瓷砖纹理图像和一系列风格样图,并将大尺寸瓷砖纹理图像进行全局分块,得到众多纹理图像块。同时将风格样图对应的特征向量进行加权融合,通过CAN网络生成风格图像。其次进行图像风格化操作。将前一阶段得到的纹理图像块和风格图像,依次通过AdaIN-自编码GAN网络生成风格化图像块。对生成的图像块进行全局拼接,并进行水平、垂直、中心方向的接缝填补,形成最终的瓷砖风格化图像。
本发明具体采用的技术方案如下:
一种基于GAN网络结构的两阶段瓷砖图像风格化方法,所述方法包含如下步骤:
S1:在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,对v1~vk进行加权融合得到特征向量v,并将特征向量v输入到CAN网络结构中,生成风格图像Sraw;
S2:定义风格特征尺度fscale,并基于风格特征尺度fscale对Sraw进行双三次线性插值图像缩放,得到风格图像S;
S3:输入瓷砖纹理图像Craw,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充,得到纹理图像C,否则直接设置纹理图像C=Craw;
S5:沿纹理图像C垂直接缝处进行图像块划分,形成m×(n-1)个大小相等但互不重叠的图像块沿纹理图像C水平接缝处进行图像块划分,形成(m-1)×n个大小相等但互不重叠的图像块沿纹理图像C中心接缝处进行图像块划分,形成(m-1)×(n-1)个大小相等但互不重叠的图像块
S9:对图像O(4)进行裁切,得到最终瓷砖风格化图像O。
作为优选,S1的具体实现过程如下:
S11、在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,其中风格池中的所有图像及其特征向量,通过事先训练好的CAN网络随机生成得到;所有风格样图的大小为256×256像素,通道数为3,包含RGB通道;所有特征向量维度数为128,且每一分量满足均值为0,方差为1的正态分布;
S12、对k个特征向量v1~vk进行加权融合,得到特征向量v;且特征向量v的生成遵循如下加权融合公式:
S13、将特征向量v输入到CAN网络结构中,生成风格图像Sraw;且Sraw生成遵循如下公式:
Sraw=CAN(v)
其中:CAN()代表CAN网络。
作为优选,S2的具体实现过程如下:
S21、定义风格特征尺度fscale,其中fscale取值必须为偶数,并且不能小于32;
S22、基于风格特征尺度fscale对风格图像Sraw进行双三次线性插值图像缩放,得到风格图像S;且S生成遵循如下公式:
S=Bicubic_resize(v,fscale)
其中:Bicubic_resize(,)代表双三次线性插值函数。
作为优选,S3的具体实现过程如下:
S31、输入瓷砖纹理图像Craw,其中Craw来源于工业瓷砖图像,图像大小为W×h像素,通道数为3,包含RGB通道;
S32、判断输入的纹理图像Craw的图形尺寸是否满足风格特征尺度fscale的整数倍,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充从而得到纹理图像C,否则直接设置C=Craw,对应的计算公式如下:
其中,Overlap_resize为图像重叠平铺函数,纹理图像C的大小为gw×gh像素,通道数为3,包含RGB三个通道;且满足:
gw=m*fscale
gh=n*fscale
式中:mod表示求余函数。
作为优选,S4的具体实现过程如下:
将纹理图像C全局划分成m×n个大小相等但互不重叠的纹理图像块其中i,j均为整数,且满足0≤i≤m-1,0≤j≤n-1;图像块的大小为fscale×fscale,左上角的起始点在图像C中坐标为(i*fscale,j*fscale)。
作为优选,S5的具体实现过程如下:
S51、垂直接缝处图像块划分:沿纹理图像C的垂直接缝处进行图像块划分,共划分成m×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-1,0≤j≤n-2;图像块的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为(i*fscale,(j+1/2)*fscale);
S52、水平接缝处图像块划分:沿纹理图像C的水平接缝处进行图像块划分,共划分成(m-1)×n个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-1;图像块的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,j*fscale);
S53、中心接缝处图像块划分:沿纹理图像C的中心接缝处进行图像块划分,共划分成(m-1)×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-2;图像块的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,(j+1/2*fscale)。
作为优选,S6的具体实现过程如下:
作为优选,S7的具体实现过程如下:
作为优选,S8的具体实现过程如下:
作为优选,S9的具体实现过程如下:
对图像O(4)进行裁切,得到最终瓷砖风格化图像O,其中图像O大小为w×h,其左上角的起始点在图像O(4)中的坐标为(0,0)。
本发明相对于现有技术而言,具有以下有益效果:
本发明结合CAN网络和AdaIN-GAN网络特点,生成具有融合特性的风格图像,并且在该风格图像的基础上实现对瓷砖纹理图像的风格化。本发明还利用了瓷砖纹理图像具有结构自相似性的特点,为了能够解决大尺度瓷砖的风格化问题,将大尺寸的瓷砖图像切分成多个自相似性较强的瓷砖图像块,并设计一种图像融合的方法,对拼接后的风格化图像进行接缝填补。相较于大部分风格迁移网络及其相关算法,本发明不仅适用于对任意风格图像的风格化操作,而且能够支持在较短时间、有限GPU资源条件下生成大尺寸、视觉效果理想的瓷砖风格化图像。本发明在实际瓷砖图像设计工作当中具有广泛应用价值。
此外,本发明创新性地提出了风格特征尺度这一概念。通过调整风格特征尺度的大小,能让输出图像展现出不同程度的风格特征,增强瓷砖图像设计工作过程的可交互性,具有现实意义。
附图说明
图1为基于GAN网络结构的两阶段瓷砖图像风格化方法的流程图。
图2为CAN网络生成风格图像示例。
图3为图像重叠平铺示意图。
图4为图像块划分示意图。
图5为图像块拼接示意图。
图6为图像块拼接对比实验。
图7为不同风格特征尺度取值效果。
图8为瓷砖风格化图像输出示例。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。本发明各个实施例中的技术特征在没有相互冲突的前提下,均可进行相应组合。
在本发明的一个较佳实施例中,提供了一种基于GAN网络结构的两阶段瓷砖图像风格化方法,该方法的算法流程如图1所示。下面具体对该方法的实现方式进行详细描述,今天包含如下S1~S9步骤:
S1:在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,对v1~vk进行加权融合得到特征向量v,并将特征向量v输入到CAN网络结构中,生成风格图像Sraw。
在本实施例中,上述S1的具体实现过程如下:
S11、在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,其中风格池中的所有图像及其特征向量,通过事先训练好的CAN网络随机生成得到;所有风格样图的大小为256×256像素,通道数为3,包含RGB通道;所有特征向量维度数为128,且每一分量满足均值为0,方差为1的正态分布;
S12、对k个特征向量v1~vk进行加权融合,得到特征向量v;且特征向量v的生成遵循如下加权融合公式:
S13、将特征向量v输入到CAN网络结构中,生成风格图像Sraw;且Sraw生成遵循如下公式:
Sraw=CAN(v)
其中:CAN()代表CAN网络,即创意生成对抗网络Creative Adversarial Network。
如图2所示,为CAN网络生成风格图像示例,在该实例中由两张风格样图和对应的两个特征向量v1和v2,两者融合时的权重系数为a1=0.55,a2=0.45,最终输出的风格图像可以很好地融合两张风格样图各自的特征。
S2:定义风格特征尺度fscale,并基于风格特征尺度fscale对Sraw进行双三次线性插值图像缩放,得到风格图像S。
在本实施例中,上述S2的具体实现过程如下:
S21、定义风格特征尺度fscale,其中fscale取值必须为偶数,并且不能小于32;fscale的取值大小将影响输出风格化图像的呈现效果;
S22、基于风格特征尺度fscale对风格图像Sraw进行双三次线性插值图像缩放,得到风格图像S;且S生成遵循如下公式:
S=Bicubic_resize(v,fscale)
其中:Bicubic_resize(,)代表双三次线性插值函数。
S3:输入瓷砖纹理图像Craw,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充,得到纹理图像C,否则直接设置纹理图像C=Craw。
在本实施例中,上述S3的具体实现过程如下:
S31、输入瓷砖纹理图像Craw,其中Craw来源于工业瓷砖图像,图像大小为w×h像素,通道数为3,包含RGB通道;
S32、判断输入的纹理图像Craw的图形尺寸是否满足风格特征尺度fscale的整数倍,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充从而得到纹理图像C,否则直接设置C=Craw,对应的计算公式如下:
其中,Overlap_resize为图像重叠平铺函数,纹理图像C的大小为gw×gh像素,通道数为3,包含RGB三个通道;且满足:
gw=m*fscale
gh=n*fscale
式中:mod表示求余函数。
如图3所示,为一个示例中的图像重叠平铺示意图,在该实例中图像的宽度和高度方向均不满足fscale的整数倍,因此需要通过图像重叠平铺函数Overlap_resize对其进行处理,使其宽度和高度方向进行延伸,最终图像的宽度和高度方向均满足fscale的整数倍。
在本实施例中,上述S4的具体实现过程如下:
将纹理图像C全局划分成m×n个大小相等但互不重叠的纹理图像块其中i,j均为整数,且满足0≤i≤m-1,0≤j≤n-1;图像块的大小为fscale×fscale,左上角的起始点在图像C中坐标为(e*fscale,j*fscale)。
图4为其中一个示例的图像块划分示意图。需要说明的是,由于纹理图像C被全局划分成了相邻但互不重叠的纹理图像块,因此整个纹理图像中不同纹理图像块之间会出现沿水平方向和垂直方向的接缝,水平方向的接缝即为水平接缝,垂直方向的接缝即为垂直接缝,而水平方向与垂直方向的交点即为中心接缝,如图4中(a)所示。将纹理图像C全局划分的示意图如图4中(b)所示。
S5:沿纹理图像C垂直接缝处进行图像块划分,形成m×(n-1)个大小相等但互不重叠的图像块沿纹理图像C水平接缝处进行图像块划分,形成(m-1)×n个大小相等但互不重叠的图像块沿纹理图像C中心接缝处进行图像块划分,形成(m-1)×(n-1)个大小相等但互不重叠的图像块
在本实施例中,上述S5的具体实现过程如下:
S51、垂直接缝处图像块划分:如图4中(c),所示沿纹理图像C的垂直接缝处进行图像块划分,共划分成m×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-1,0≤j≤n-2;图像块的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为(i*fscale,(j+1/2)*fscale);
S52、水平接缝处图像块划分:如图4中(d),沿纹理图像C的水平接缝处进行图像块划分,共划分成(m-1)×n个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-1;图像块的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,j*fscale);
S53、中心接缝处图像块划分:如图4中(e),沿纹理图像C的中心接缝处进行图像块划分,共划分成(m-1)×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-2;图像块的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,(j+1/2)*fscale)。
在本实施例中,上述S6的具体实现过程如下:
需要说明的是,具有AdaIN的GAN网络是指在GAN网络中加入AdaIN(自适应实例归一化)。AdaIN层是一个在生成对抗网络和风格化领域中应用非常广泛的归一化层,具体原理不再赘述。在本实施例中,具有AdaIN的GAN网络AdaIN_GAN可直接调用现有技术文献中的已有模型来实现,具体参见:Xu Z,Wilber M J,Fang C,et al.Learning from multi-domain artistic images for arbitrary style transfer.2019.本实施例所调用的AdaIN_GAN的代码参见https://github.com/nightldj/behance_release。
在本实施例中,上述S7的具体实现过程如下:
在本实施例中,上述S8的具体实现过程如下:
S9:对图像O(4)进行裁切,得到最终瓷砖风格化图像O。
在本实施例中,上述S9的具体实现过程如下:
对图像O(4)进行裁切,得到最终瓷砖风格化图像O,其中图像O大小为w×h,其左上角的起始点在图像O(4)中的坐标为(0,0)。
由此可见,本发明的上述S1~S9所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,通过对生成的图像块进行全局拼接,并进行水平、垂直、中心方向的接缝填补,形成最终的瓷砖风格化图像。为了展示不同的拼接方式所起的作用,本发明中设置了一组对比实验,图6为图像块拼接对比实验的结果,其中原始的纹理图像和风格图像分别如图6中(a)和(b)所示,没有任何接缝处理的生成图像如图6中(c)所示,仅做垂直接缝拼接的生成图像如图6中(d)所示,仅做垂直和水平接缝拼接的生成图像如图6中(e)所示,本发明中做水平、垂直、中心方向的接缝拼接的生成图像如图6中(f)所示。可以明显发现,本发明生成的瓷砖图像,风格效果较为突出,并且图像整体看上去较为自然,不存在明显的接缝,具有较好的视觉感受。
另外,本发明创新性地提出了风格特征尺度fscale这一概念。通过调整风格特征尺度fscale的大小,能让输出图像展现出不同程度的风格特征,增强瓷砖图像设计工作过程的可交互性,具有现实意义。为了对比不通话fscale的取值对输出风格化图像的呈现效果的影响,本发明中涉及了对比试验。如图7所示,为不同风格特征尺度取值效果对比,其中原始的纹理图像和风格图像分别如图7中(a)和(b)所示,在风格特征尺度fscale分别去128、256、512、1024的情况下,其生成图像分别如图7中(c)、(d)、(e)和(f)所示,可以明细发现通过调整风格特征尺度fscale的大小能够直接影响输出图像出现的风格特征效果,以便于实际应用中根据实际希望呈现的效果来调整具体的风格化程度。
如图8所示,进一步展示了营业本发明生成的若干示例性的瓷砖风格图像,由此可见本发明能够很好地对工业瓷砖图像进行风格化,且不存在明显的拼接痕迹,具有良好的工业应用价值。
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
Claims (10)
1.一种基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于,所述方法包含如下步骤:
S1:在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,对v1~vk进行加权融合得到特征向量v,并将特征向量v输入到CAN网络结构中,生成风格图像Sraw;
S2:定义风格特征尺度fscale,并基于风格特征尺度fscale对Sraw进行双三次线性插值图像缩放,得到风格图像S;
S3:输入瓷砖纹理图像Craw,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充,得到纹理图像C,否则直接设置纹理图像C=Craw;
S5:沿纹理图像C垂直接缝处进行图像块划分,形成m×(n-1)个大小相等但互不重叠的图像块沿纹理图像C水平接缝处进行图像块划分,形成(m-1)×n个大小相等但互不重叠的图像块沿纹理图像C中心接缝处进行图像块划分,形成(m-1)×(n-1)个大小相等但互不重叠的图像块
S9:对图像O(4)进行裁切,得到最终瓷砖风格化图像O。
2.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S1的具体实现过程如下:
S11、在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,其中风格池中的所有图像及其特征向量,通过事先训练好的CAN网络随机生成得到;所有风格样图的大小为256×256像素,通道数为3,包含RGB通道;所有特征向量维度数为128,且每一分量满足均值为0,方差为1的正态分布;
S12、对k个特征向量v1~vk进行加权融合,得到特征向量v;且特征向量v的生成遵循如下加权融合公式:
S13、将特征向量v输入到CAN网络结构中,生成风格图像Sraw;且Sraw生成遵循如下公式:
Sraw=CAN(v)
其中:CAN()代表CAN网络。
3.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S2的具体实现过程如下:
S21、定义风格特征尺度fscale,其中fscale取值必须为偶数,并且不能小于32;
S22、基于风格特征尺度fscale对风格图像Sraw进行双三次线性插值图像缩放,得到风格图像S;且S生成遵循如下公式:
S=Bicubic_resize(v,fscale)
其中:Bicubic_resize(,)代表双三次线性插值函数。
4.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S3的具体实现过程如下:
S31、输入瓷砖纹理图像Craw,其中Craw来源于工业瓷砖图像,图像大小为w×h像素,通道数为3,包含RGB通道;
S32、判断输入的纹理图像Craw的图形尺寸是否满足风格特征尺度fscale的整数倍,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充从而得到纹理图像C,否则直接设置C=Craw,对应的计算公式如下:
其中,Overlap_resize为图像重叠平铺函数,纹理图像C的大小为gw×gh像素,通道数为3,包含RGB三个通道;且满足:
gw=m*fscale
gh=n*fscale
式中:mod表示求余函数。
6.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S5的具体实现过程如下:
S51、垂直接缝处图像块划分:沿纹理图像C的垂直接缝处进行图像块划分,共划分成m×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-1,0≤j≤n-2;图像块的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为(i*fscale,(j+1/2)*fscale);
S52、水平接缝处图像块划分:沿纹理图像C的水平接缝处进行图像块划分,共划分成(m-1)×n个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-1;图像块的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,j*fscale);
9.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S8的具体实现过程如下:
10.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S9的具体实现过程如下:
对图像O(4)进行裁切,得到最终瓷砖风格化图像O,其中图像O大小为w×h,其左上角的起始点在图像O(4)中的坐标为(0,0)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210658171.8A CN114943640B (zh) | 2022-06-10 | 2022-06-10 | 基于gan网络结构的两阶段瓷砖图像风格化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210658171.8A CN114943640B (zh) | 2022-06-10 | 2022-06-10 | 基于gan网络结构的两阶段瓷砖图像风格化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114943640A true CN114943640A (zh) | 2022-08-26 |
CN114943640B CN114943640B (zh) | 2024-05-31 |
Family
ID=82909996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210658171.8A Active CN114943640B (zh) | 2022-06-10 | 2022-06-10 | 基于gan网络结构的两阶段瓷砖图像风格化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114943640B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544718A (zh) * | 2012-07-13 | 2014-01-29 | 卡西欧计算机株式会社 | 图像处理装置以及画面风格变换方法 |
CN108470320A (zh) * | 2018-02-24 | 2018-08-31 | 中山大学 | 一种基于cnn的图像风格化方法及系统 |
US20180357800A1 (en) * | 2017-06-09 | 2018-12-13 | Adobe Systems Incorporated | Multimodal style-transfer network for applying style features from multi-resolution style exemplars to input images |
CN113628101A (zh) * | 2021-08-12 | 2021-11-09 | 杭州电子科技大学 | 基于gan网络结构的三阶段瓷砖图像生成方法 |
-
2022
- 2022-06-10 CN CN202210658171.8A patent/CN114943640B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103544718A (zh) * | 2012-07-13 | 2014-01-29 | 卡西欧计算机株式会社 | 图像处理装置以及画面风格变换方法 |
US20180357800A1 (en) * | 2017-06-09 | 2018-12-13 | Adobe Systems Incorporated | Multimodal style-transfer network for applying style features from multi-resolution style exemplars to input images |
CN108470320A (zh) * | 2018-02-24 | 2018-08-31 | 中山大学 | 一种基于cnn的图像风格化方法及系统 |
CN113628101A (zh) * | 2021-08-12 | 2021-11-09 | 杭州电子科技大学 | 基于gan网络结构的三阶段瓷砖图像生成方法 |
Non-Patent Citations (1)
Title |
---|
吴岳;宋建国;: "基于改进AdaIN的图像风格迁移", 软件导刊, no. 09, 15 September 2020 (2020-09-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN114943640B (zh) | 2024-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7110000B2 (en) | Synthesis of progressively-variant textures and application to arbitrary surfaces | |
JP3031613B2 (ja) | カラー/濃淡画像入力出力装置と入力出力方法 | |
JPH1091809A (ja) | 関数演算プロセッサ制御マシンの操作方法 | |
EP2887305B1 (en) | Resizing an image | |
CN112258655A (zh) | 一种应用于vr虚拟银行的三维网格简化方法 | |
Qu et al. | Focus+ context route zooming and information overlay in 3D urban environments | |
US20200279415A1 (en) | Efficiently Computed Distance Fields | |
JP5067501B2 (ja) | 多色ベクトル画像処理装置および方法 | |
JP2003116016A (ja) | テーブル作成方法、テーブル作成装置、記憶媒体及びプログラム | |
US7623739B2 (en) | Method and computing system for creating and displaying images with animated microstructures | |
JPH06274650A (ja) | 画像合成装置 | |
KR20010050918A (ko) | 아웃라인 스무딩 처리 방법 및 그 장치 | |
CN114943640A (zh) | 基于gan网络结构的两阶段瓷砖图像风格化方法 | |
US20080088640A1 (en) | Outline font brightness value correction system, method and program | |
JP3448930B2 (ja) | 画像表示装置 | |
CN116302282A (zh) | 基于d3的矩阵数据可视化图形生成及数据处理方法 | |
JPH0799587A (ja) | 色変換方法および色変換装置 | |
CN102402531A (zh) | 地理信息符号处理方法及系统 | |
JP3507685B2 (ja) | 画像通信表示システムおよびそのプログラム記憶媒体 | |
CN116260974B (zh) | 一种视频缩放方法和系统、计算机可读存储介质 | |
CN118037549B (zh) | 一种基于视频内容理解的视频增强方法及系统 | |
US5581675A (en) | Method of and apparatus for converting format of an image having linear color variation | |
Brooks et al. | Integrating procedural textures with replicated image editing | |
JPH04165473A (ja) | 二次元画像の変形装置 | |
JPH07200801A (ja) | 変形画像作成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |