CN114943640B - 基于gan网络结构的两阶段瓷砖图像风格化方法 - Google Patents

基于gan网络结构的两阶段瓷砖图像风格化方法 Download PDF

Info

Publication number
CN114943640B
CN114943640B CN202210658171.8A CN202210658171A CN114943640B CN 114943640 B CN114943640 B CN 114943640B CN 202210658171 A CN202210658171 A CN 202210658171A CN 114943640 B CN114943640 B CN 114943640B
Authority
CN
China
Prior art keywords
image
fscale
style
texture
equal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210658171.8A
Other languages
English (en)
Other versions
CN114943640A (zh
Inventor
陆剑锋
石梦韬
李黎
卢宇航
赵唯皓
尉晨浩
包涛旗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Hangzhou Dianzi University Shangyu Science and Engineering Research Institute Co Ltd
Original Assignee
Hangzhou Dianzi University
Hangzhou Dianzi University Shangyu Science and Engineering Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University, Hangzhou Dianzi University Shangyu Science and Engineering Research Institute Co Ltd filed Critical Hangzhou Dianzi University
Priority to CN202210658171.8A priority Critical patent/CN114943640B/zh
Publication of CN114943640A publication Critical patent/CN114943640A/zh
Application granted granted Critical
Publication of CN114943640B publication Critical patent/CN114943640B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4046Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Image Processing (AREA)

Abstract

本发明提出了一种基于GAN网络结构的两阶段瓷砖图像风格化方法,可快速实现对大尺寸瓷砖纹理图像的风格化。首先实现对纹理图像块与风格图像的生成。输入大尺寸瓷砖纹理图像和一系列风格样图,并将大尺寸瓷砖纹理图像进行全局分块,得到众多纹理图像块。同时将风格样图对应的特征向量进行加权融合,通过CAN网络生成风格图像。其次进行图像风格化操作。将前一阶段得到的纹理图像块和风格图像,依次通过AdaIN‑自编码GAN网络生成风格化图像块。对生成的图像块进行全局拼接,并进行水平、垂直、中心方向的接缝填补,形成最终的瓷砖风格化图像。该发明生成的瓷砖图像,风格效果较为突出,并且图像整体看上去较为自然,不存在明显的接缝,具有较好的视觉感受。

Description

基于GAN网络结构的两阶段瓷砖图像风格化方法
技术领域
本发明涉及图像生成领域,提出了一种基于GAN网络结构的两阶段瓷砖图像风格化方法,该方法能够快速地对大尺寸瓷砖图像进行风格化,生成图像符合人的直观感受,对工业瓷砖图像设计具有很好的参考意义。
背景技术
现阶段用户对瓷砖图像提出了更多的个性化需求,瓷砖图像个性化设计工作越来越受到设计师们的关注。在传统设计方法中,设计师往往通过色调变换技术实现个性化瓷砖图像设计:即对已采集的瓷砖图像,通过色调变换算法或者传统的图像处理算法,改变瓷砖图像的整体色调以满足相关要求。
在深度学习领域,随着风格迁移技术被提出,解决了传统方法中图像整体色调单一的问题,并且生成图像能够融入一定的风格特征。随后,Johnson等人提出了快速风格迁移网络结构,通过对风格样图进行训练,将样图中的风格信息存入网络结构参数中,从而在图像生成阶段,能够将输入纹理图像快速转化为风格化图像输出。Zhou等人在此基础上进行改进,提出了纹理合成GAN网络结构,实现了对风格化超分图像的快速生成。Zheng等人提出了AdaIN-自编码GAN网络结构,将输入风格图像与内容图像经过编码器压缩成特征矩阵,并通过AdaIN与Mask将图像内容与风格信息进行融合,并融合后的特征图输送到解码器进行输出。实验证明,训练后的网络可以实现对任意风格图像的快速迁移,输出的风格化图像能够很好地与输入样图的风格特征相吻合。
然而这些网络结构在很大程度上依赖于GPU计算资源:随着输入瓷砖图像尺寸不断增大,网络中间层大量特征图被保存,当前GPU很可能无法支持对这些特征图的容纳与计算。由于实际工业瓷砖图像具有庞大的图像尺寸,现有的风格迁移相关网络结构难以直接得以运用。
发明内容
本发明的目的在于解决现有技术中存在的问题,并提供一种基于GAN网络结构的两阶段瓷砖图像风格化方法。
本发明的发明构思是:首先实现对纹理图像块与风格图像的生成。输入大尺寸瓷砖纹理图像和一系列风格样图,并将大尺寸瓷砖纹理图像进行全局分块,得到众多纹理图像块。同时将风格样图对应的特征向量进行加权融合,通过CAN网络生成风格图像。其次进行图像风格化操作。将前一阶段得到的纹理图像块和风格图像,依次通过AdaIN-自编码GAN网络生成风格化图像块。对生成的图像块进行全局拼接,并进行水平、垂直、中心方向的接缝填补,形成最终的瓷砖风格化图像。
本发明具体采用的技术方案如下:
一种基于GAN网络结构的两阶段瓷砖图像风格化方法,所述方法包含如下步骤:
S1:在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,对v1~vk进行加权融合得到特征向量v,并将特征向量v输入到CAN网络结构中,生成风格图像Sraw
S2:定义风格特征尺度fscale,并基于风格特征尺度fscale对Sraw进行双三次线性插值图像缩放,得到风格图像S;
S3:输入瓷砖纹理图像Craw,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充,得到纹理图像C,否则直接设置纹理图像C=Craw
S4:将纹理图像C划分成m×n个大小相等但互不重叠的纹理图像块并根据图像中的划分位置形成垂直接缝、水平接缝和中心接缝;
S5:沿纹理图像C垂直接缝处进行图像块划分,形成m×(n-1)个大小相等但互不重叠的图像块沿纹理图像C水平接缝处进行图像块划分,形成(m-1)×n个大小相等但互不重叠的图像块/>沿纹理图像C中心接缝处进行图像块划分,形成(m-1)×(n-1)个大小相等但互不重叠的图像块/>
S6:针对纹理图像块依次将每个纹理图像块和风格图像S配对输入到具有AdaIN的GAN网络中,得到风格化图像块/>
S7:对所有图像块进行全局拼接,得到风格图像O(1)
S8:将所有图像块拼接到图像O(1)垂直接缝处,得到图像O(2);将所有图像块拼接到图像O(2)水平接缝处,得到图像O(3);将所有图像块/>拼接到图像O(3)水平接缝处,得到图像O(4)
S9:对图像O(4)进行裁切,得到最终瓷砖风格化图像O。
作为优选,S1的具体实现过程如下:
S11、在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,其中风格池中的所有图像及其特征向量,通过事先训练好的CAN网络随机生成得到;所有风格样图的大小为256×256像素,通道数为3,包含RGB通道;所有特征向量维度数为128,且每一分量满足均值为0,方差为1的正态分布;
S12、对k个特征向量v1~vk进行加权融合,得到特征向量v;且特征向量v的生成遵循如下加权融合公式:
其中,ah为权重系数,且满足
S13、将特征向量v输入到CAN网络结构中,生成风格图像Sraw;且Sraw生成遵循如下公式:
Sraw=CAN(v)
其中:CAN()代表CAN网络。
作为优选,S2的具体实现过程如下:
S21、定义风格特征尺度fscale,其中fscale取值必须为偶数,并且不能小于32;
S22、基于风格特征尺度fscale对风格图像Sraw进行双三次线性插值图像缩放,得到风格图像S;且S生成遵循如下公式:
S=Bicubic_resize(v,fscale)
其中:Bicubic_resize(,)代表双三次线性插值函数。
作为优选,S3的具体实现过程如下:
S31、输入瓷砖纹理图像Craw,其中Craw来源于工业瓷砖图像,图像大小为W×h像素,通道数为3,包含RGB通道;
S32、判断输入的纹理图像Craw的图形尺寸是否满足风格特征尺度fscale的整数倍,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充从而得到纹理图像C,否则直接设置C=Craw,对应的计算公式如下:
其中,Overlap_resize为图像重叠平铺函数,纹理图像C的大小为gw×gh像素,通道数为3,包含RGB三个通道;且满足:
gw=m*fscale
gh=n*fscale
式中:mod表示求余函数。
作为优选,S4的具体实现过程如下:
将纹理图像C全局划分成m×n个大小相等但互不重叠的纹理图像块其中i,j均为整数,且满足0≤i≤m-1,0≤j≤n-1;图像块/>的大小为fscale×fscale,左上角的起始点在图像C中坐标为(i*fscale,j*fscale)。
作为优选,S5的具体实现过程如下:
S51、垂直接缝处图像块划分:沿纹理图像C的垂直接缝处进行图像块划分,共划分成m×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-1,0≤j≤n-2;图像块/>的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为(i*fscale,(j+1/2)*fscale);
S52、水平接缝处图像块划分:沿纹理图像C的水平接缝处进行图像块划分,共划分成(m-1)×n个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-1;图像块/>的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,j*fscale);
S53、中心接缝处图像块划分:沿纹理图像C的中心接缝处进行图像块划分,共划分成(m-1)×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-2;图像块/>的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,(j+1/2*fscale)。
作为优选,S6的具体实现过程如下:
针对纹理图像块依次将每个纹理图像块和风格图像S配对输入到具有AdaIN的GAN网络中,分别得到对应的风格化图像块/>且风格化图像块/>生成过程遵循如下公式:
其中输出图像块和输入图像块/>S大小相同,通道数都为3(RGB通道);AdaIN_GAN表示具有AdaIN的GAN网络,预先在256×256像素的风格样图和纹理图像样本集上进行训练。
作为优选,S7的具体实现过程如下:
对所有图像块进行全局拼接,得到风格图像O(1),其中O(1)的大小为fscala×fscale,/>在图像O(1)中起始点坐标与/>相同。
作为优选,S8的具体实现过程如下:
S81、垂直接缝拼接:记图像块为图像O(1)垂直接缝处与图像块/>对应位置的图像块,对S6生成的图像块/>按照如下公式进行图像融合,得到更新后的图像块/>
其中矩阵α2大小为fscale×fscale,·为矩阵点乘;将所有更新后的图像块覆盖到图像O(1)中对应图像块/>所在的位置,得到图像O(2)
S82、水平接缝拼接:记图像块为图像O(2)水平接缝处与图像块/>对应位置的图像块,对S6生成的图像块/>按照如下公式进行图像融合,得到更新后的图像块/>
其中α3为α2的转置矩阵,·为矩阵点乘;将所有更新后的图像块覆盖到图像O(2)中对应图像块/>所在的位置,得到图像O(3)
S83、中心接缝拼接:记图像块为图像O(3)水平接缝处与图像块/>对应位置的图像块,对S6生成的图像块/>按照如下公式进行图像融合,得到更新后的图像块/>
其中矩阵α4大小为fscale×fscale,·为矩阵点乘;将所有更新后的图像块覆盖到图像O(3)中对应图像块/>所在的位置,得到图像O(4)
作为优选,S9的具体实现过程如下:
对图像O(4)进行裁切,得到最终瓷砖风格化图像O,其中图像O大小为w×h,其左上角的起始点在图像O(4)中的坐标为(0,0)。
本发明相对于现有技术而言,具有以下有益效果:
本发明结合CAN网络和AdaIN-GAN网络特点,生成具有融合特性的风格图像,并且在该风格图像的基础上实现对瓷砖纹理图像的风格化。本发明还利用了瓷砖纹理图像具有结构自相似性的特点,为了能够解决大尺度瓷砖的风格化问题,将大尺寸的瓷砖图像切分成多个自相似性较强的瓷砖图像块,并设计一种图像融合的方法,对拼接后的风格化图像进行接缝填补。相较于大部分风格迁移网络及其相关算法,本发明不仅适用于对任意风格图像的风格化操作,而且能够支持在较短时间、有限GPU资源条件下生成大尺寸、视觉效果理想的瓷砖风格化图像。本发明在实际瓷砖图像设计工作当中具有广泛应用价值。
此外,本发明创新性地提出了风格特征尺度这一概念。通过调整风格特征尺度的大小,能让输出图像展现出不同程度的风格特征,增强瓷砖图像设计工作过程的可交互性,具有现实意义。
附图说明
图1为基于GAN网络结构的两阶段瓷砖图像风格化方法的流程图。
图2为CAN网络生成风格图像示例。
图3为图像重叠平铺示意图。
图4为图像块划分示意图。
图5为图像块拼接示意图。
图6为图像块拼接对比实验。
图7为不同风格特征尺度取值效果。
图8为瓷砖风格化图像输出示例。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施例的限制。本发明各个实施例中的技术特征在没有相互冲突的前提下,均可进行相应组合。
在本发明的一个较佳实施例中,提供了一种基于GAN网络结构的两阶段瓷砖图像风格化方法,该方法的算法流程如图1所示。下面具体对该方法的实现方式进行详细描述,今天包含如下S1~S9步骤:
S1:在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,对v1~vk进行加权融合得到特征向量v,并将特征向量v输入到CAN网络结构中,生成风格图像Sraw
在本实施例中,上述S1的具体实现过程如下:
S11、在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,其中风格池中的所有图像及其特征向量,通过事先训练好的CAN网络随机生成得到;所有风格样图的大小为256×256像素,通道数为3,包含RGB通道;所有特征向量维度数为128,且每一分量满足均值为0,方差为1的正态分布;
S12、对k个特征向量v1~vk进行加权融合,得到特征向量v;且特征向量v的生成遵循如下加权融合公式:
其中,ah为权重系数,且满足
S13、将特征向量v输入到CAN网络结构中,生成风格图像Sraw;且Sraw生成遵循如下公式:
Sraw=CAN(v)
其中:CAN()代表CAN网络,即创意生成对抗网络Creative Adversarial Network。
如图2所示,为CAN网络生成风格图像示例,在该实例中由两张风格样图和对应的两个特征向量v1和v2,两者融合时的权重系数为a1=0.55,a2=0.45,最终输出的风格图像可以很好地融合两张风格样图各自的特征。
S2:定义风格特征尺度fscale,并基于风格特征尺度fscale对Sraw进行双三次线性插值图像缩放,得到风格图像S。
在本实施例中,上述S2的具体实现过程如下:
S21、定义风格特征尺度fscale,其中fscale取值必须为偶数,并且不能小于32;fscale的取值大小将影响输出风格化图像的呈现效果;
S22、基于风格特征尺度fscale对风格图像Sraw进行双三次线性插值图像缩放,得到风格图像S;且S生成遵循如下公式:
S=Bicubic_resize(v,fscale)
其中:Bicubic_resize(,)代表双三次线性插值函数。
S3:输入瓷砖纹理图像Craw,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充,得到纹理图像C,否则直接设置纹理图像C=Craw
在本实施例中,上述S3的具体实现过程如下:
S31、输入瓷砖纹理图像Craw,其中Craw来源于工业瓷砖图像,图像大小为w×h像素,通道数为3,包含RGB通道;
S32、判断输入的纹理图像Craw的图形尺寸是否满足风格特征尺度fscale的整数倍,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充从而得到纹理图像C,否则直接设置C=Craw,对应的计算公式如下:
其中,Overlap_resize为图像重叠平铺函数,纹理图像C的大小为gw×gh像素,通道数为3,包含RGB三个通道;且满足:
gw=m*fscale
gh=n*fscale
式中:mod表示求余函数。
如图3所示,为一个示例中的图像重叠平铺示意图,在该实例中图像的宽度和高度方向均不满足fscale的整数倍,因此需要通过图像重叠平铺函数Overlap_resize对其进行处理,使其宽度和高度方向进行延伸,最终图像的宽度和高度方向均满足fscale的整数倍。
S4:将纹理图像C划分成m×n个大小相等但互不重叠的纹理图像块并根据图像中的划分位置形成垂直接缝、水平接缝和中心接缝。
在本实施例中,上述S4的具体实现过程如下:
将纹理图像C全局划分成m×n个大小相等但互不重叠的纹理图像块其中i,j均为整数,且满足0≤i≤m-1,0≤j≤n-1;图像块/>的大小为fscale×fscale,左上角的起始点在图像C中坐标为(e*fscale,j*fscale)。
图4为其中一个示例的图像块划分示意图。需要说明的是,由于纹理图像C被全局划分成了相邻但互不重叠的纹理图像块,因此整个纹理图像中不同纹理图像块之间会出现沿水平方向和垂直方向的接缝,水平方向的接缝即为水平接缝,垂直方向的接缝即为垂直接缝,而水平方向与垂直方向的交点即为中心接缝,如图4中(a)所示。将纹理图像C全局划分的示意图如图4中(b)所示。
S5:沿纹理图像C垂直接缝处进行图像块划分,形成m×(n-1)个大小相等但互不重叠的图像块沿纹理图像C水平接缝处进行图像块划分,形成(m-1)×n个大小相等但互不重叠的图像块/>沿纹理图像C中心接缝处进行图像块划分,形成(m-1)×(n-1)个大小相等但互不重叠的图像块/>
在本实施例中,上述S5的具体实现过程如下:
S51、垂直接缝处图像块划分:如图4中(c),所示沿纹理图像C的垂直接缝处进行图像块划分,共划分成m×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-1,0≤j≤n-2;图像块/>的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为(i*fscale,(j+1/2)*fscale);
S52、水平接缝处图像块划分:如图4中(d),沿纹理图像C的水平接缝处进行图像块划分,共划分成(m-1)×n个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-1;图像块/>的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,j*fscale);
S53、中心接缝处图像块划分:如图4中(e),沿纹理图像C的中心接缝处进行图像块划分,共划分成(m-1)×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-2;图像块/>的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,(j+1/2)*fscale)。
S6:针对纹理图像块依次将每个纹理图像块和风格图像S配对输入到具有AdaIN的GAN网络中,得到风格化图像块/>
在本实施例中,上述S6的具体实现过程如下:
针对纹理图像块依次将每个纹理图像块和风格图像S配对输入到具有AdaIN的GAN网络中,分别得到对应的风格化图像块/>且风格化图像块/>生成过程遵循如下公式:
其中输出图像块和输入图像块/>S大小相同,通道数都为3(RGB通道);AdaIN_GAN表示具有AdaIN的GAN网络,预先在256×256像素的风格样图和纹理图像样本集上进行训练。
需要说明的是,具有AdaIN的GAN网络是指在GAN网络中加入AdaIN(自适应实例归一化)。AdaIN层是一个在生成对抗网络和风格化领域中应用非常广泛的归一化层,具体原理不再赘述。在本实施例中,具有AdaIN的GAN网络AdaIN_GAN可直接调用现有技术文献中的已有模型来实现,具体参见:Xu Z,Wilber M J,Fang C,et al.Learning from multi-domain artistic images for arbitrary style transfer.2019.本实施例所调用的AdaIN_GAN的代码参见https://github.com/nightldj/behance_release。
S7:对所有图像块进行全局拼接,得到风格图像O(1)
在本实施例中,上述S7的具体实现过程如下:
对所有图像块进行全局拼接,得到风格图像O(1),其中O(1)的大小为fscale×fscale,/>在图像O(1)中起始点坐标与/>相同。
如图5所示,为一个示例中的图像块拼接示意图,其中图5中(a)示出了垂直接缝、水平接缝和中心接缝,其具体形式与图4类似。所有图像块进行全局拼接的示意图如图5中(b)所示。
S8:将所有图像块拼接到图像O(1)垂直接缝处,得到图像O(2);将所有图像块拼接到图像O(2)水平接缝处,得到图像O(3);将所有图像块/>拼接到图像O(3)水平接缝处,得到图像O(4)
在本实施例中,上述S8的具体实现过程如下:
S81、垂直接缝拼接:如图5中(c)所示,记图像块为图像O(1)垂直接缝处与图像块/>对应位置的图像块,对S6生成的图像块/>按照如下公式进行图像融合,得到更新后的图像块/>
其中矩阵α2大小为fscale×fscale,·为矩阵点乘;将所有更新后的图像块覆盖到图像O(1)中对应图像块/>所在的位置,得到图像O(2)
S82、水平接缝拼接:如图5中(d)所示,记图像块为图像O(2)水平接缝处与图像块/>对应位置的图像块,对S6生成的图像块/>按照如下公式进行图像融合,得到更新后的图像块/>
其中α3为α2的转置矩阵,·为矩阵点乘;将所有更新后的图像块覆盖到图像O(2)中对应图像块/>所在的位置,得到图像O(3)
S83、中心接缝拼接:如图5中(e)所示,记图像块为图像O(3)水平接缝处与图像块/>对应位置的图像块,对S6生成的图像块/>按照如下公式进行图像融合,得到更新后的图像块/>
其中矩阵α4大小为fscale×fscale,·为矩阵点乘;将所有更新后的图像块覆盖到图像O(3)中对应图像块/>所在的位置,得到图像O(4)
S9:对图像O(4)进行裁切,得到最终瓷砖风格化图像O。
在本实施例中,上述S9的具体实现过程如下:
对图像O(4)进行裁切,得到最终瓷砖风格化图像O,其中图像O大小为w×h,其左上角的起始点在图像O(4)中的坐标为(0,0)。
由此可见,本发明的上述S1~S9所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,通过对生成的图像块进行全局拼接,并进行水平、垂直、中心方向的接缝填补,形成最终的瓷砖风格化图像。为了展示不同的拼接方式所起的作用,本发明中设置了一组对比实验,图6为图像块拼接对比实验的结果,其中原始的纹理图像和风格图像分别如图6中(a)和(b)所示,没有任何接缝处理的生成图像如图6中(c)所示,仅做垂直接缝拼接的生成图像如图6中(d)所示,仅做垂直和水平接缝拼接的生成图像如图6中(e)所示,本发明中做水平、垂直、中心方向的接缝拼接的生成图像如图6中(f)所示。可以明显发现,本发明生成的瓷砖图像,风格效果较为突出,并且图像整体看上去较为自然,不存在明显的接缝,具有较好的视觉感受。
另外,本发明创新性地提出了风格特征尺度fscale这一概念。通过调整风格特征尺度fscale的大小,能让输出图像展现出不同程度的风格特征,增强瓷砖图像设计工作过程的可交互性,具有现实意义。为了对比不通话fscale的取值对输出风格化图像的呈现效果的影响,本发明中涉及了对比试验。如图7所示,为不同风格特征尺度取值效果对比,其中原始的纹理图像和风格图像分别如图7中(a)和(b)所示,在风格特征尺度fscale分别去128、256、512、1024的情况下,其生成图像分别如图7中(c)、(d)、(e)和(f)所示,可以明细发现通过调整风格特征尺度fscale的大小能够直接影响输出图像出现的风格特征效果,以便于实际应用中根据实际希望呈现的效果来调整具体的风格化程度。
如图8所示,进一步展示了营业本发明生成的若干示例性的瓷砖风格图像,由此可见本发明能够很好地对工业瓷砖图像进行风格化,且不存在明显的拼接痕迹,具有良好的工业应用价值。
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

Claims (10)

1.一种基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于,所述方法包含如下步骤:
S1:在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,对v1~vk进行加权融合得到特征向量v,并将特征向量v输入到CAN网络结构中,生成风格图像Sraw
S2:定义风格特征尺度fscale,并基于风格特征尺度fscale对Sraw进行双三次线性插值图像缩放,得到风格图像S;
S3:输入瓷砖纹理图像Craw,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充,得到纹理图像C,否则直接设置纹理图像C=Craw
S4:将纹理图像C划分成m×n个大小相等但互不重叠的纹理图像块并根据图像中的划分位置形成垂直接缝、水平接缝和中心接缝;
S5:沿纹理图像C垂直接缝处进行图像块划分,形成m×(n-1)个大小相等但互不重叠的图像块沿纹理图像C水平接缝处进行图像块划分,形成(m-1)×n个大小相等但互不重叠的图像块/>沿纹理图像C中心接缝处进行图像块划分,形成(m-1)×(n-1)个大小相等但互不重叠的图像块/>
S6:针对纹理图像块依次将每个纹理图像块和风格图像S配对输入到具有AdaIN的GAN网络中,得到风格化图像块/>
S7:对所有图像块进行全局拼接,得到风格图像O(1)
S8:将所有图像块拼接到图像O(1)垂直接缝处,得到图像O(2);将所有图像块/>拼接到图像O(2)水平接缝处,得到图像O(3);将所有图像块/>拼接到图像O(3)水平接缝处,得到图像O(4)
S9:对图像O(4)进行裁切,得到最终瓷砖风格化图像O。
2.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S1的具体实现过程如下:
S11、在风格池中选定k张风格样图以及对应的k个特征向量v1~vk,其中风格池中的所有图像及其特征向量,通过事先训练好的CAN网络随机生成得到;所有风格样图的大小为256×256像素,通道数为3,包含RGB通道;所有特征向量维度数为128,且每一分量满足均值为0,方差为1的正态分布;
S12、对k个特征向量v1~vk进行加权融合,得到特征向量v;且特征向量v的生成遵循如下加权融合公式:
其中,ah为权重系数,且满足
S13、将特征向量v输入到CAN网络结构中,生成风格图像Sraw;且Sraw生成遵循如下公式:
Sraw=CAN(v)
其中:CAN()代表CAN网络。
3.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S2的具体实现过程如下:
S21、定义风格特征尺度fscale,其中fscale取值必须为偶数,并且不能小于32;
S22、基于风格特征尺度fscale对风格图像Sraw进行双三次线性插值图像缩放,得到风格图像S;且S生成遵循如下公式:
S=Bicubic_resize(v,fscale)
其中:Bicubic_resize(,)代表双三次线性插值函数。
4.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S3的具体实现过程如下:
S31、输入瓷砖纹理图像Craw,其中Craw来源于工业瓷砖图像,图像大小为w×h像素,通道数为3,包含RGB通道;
S32、判断输入的纹理图像Craw的图形尺寸是否满足风格特征尺度fscale的整数倍,如果Craw图像尺寸不为fscale的整数倍,需要对Craw进行图像重叠平铺填充从而得到纹理图像C,否则直接设置C=Craw,对应的计算公式如下:
其中,Overlap_resize为图像重叠平铺函数,纹理图像C的大小为gw×gh像素,通道数为3,包含RGB三个通道;且满足:
gw=m*fscale
gh=n*fscale
式中:mod表示求余函数。
5.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S4的具体实现过程如下:
将纹理图像C全局划分成m×n个大小相等但互不重叠的纹理图像块其中i,j均为整数,且满足0≤i≤m-1,0≤j≤n-1;图像块/>的大小为fscale×fscale,左上角的起始点在图像C中坐标为(i*fscale,j*fscale)。
6.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S5的具体实现过程如下:
S51、垂直接缝处图像块划分:沿纹理图像C的垂直接缝处进行图像块划分,共划分成m×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-1,0≤j≤n-2;图像块/>的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为(i*fscale,(j+1/2)*fscale);
S52、水平接缝处图像块划分:沿纹理图像C的水平接缝处进行图像块划分,共划分成(m-1)×n个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-1;图像块/>的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,j*fscale);
S53、中心接缝处图像块划分:沿纹理图像C的中心接缝处进行图像块划分,共划分成(m-1)×(n-1)个大小相等但互不重叠的图像块其中i,j为整数,且满足0≤i≤m-2,0≤j≤n-2;图像块/>的大小为fscale×fscale,左上角的起始点在纹理图像C中的坐标为((i+1/2)*fscale,(j+1/2)*fscale)。
7.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S6的具体实现过程如下:
针对纹理图像块依次将每个纹理图像块和风格图像S配对输入到具有AdaIN的GAN网络中,分别得到对应的风格化图像块/>且风格化图像块/>生成过程遵循如下公式:
其中输出图像块和输入图像块/>S大小相同,通道数都为3;AdaIN_GAN表示具有AdaIN的GAN网络,预先在256×256像素的风格样图和纹理图像样本集上进行训练。
8.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S7的具体实现过程如下:
对所有图像块进行全局拼接,得到风格图像O(1),其中O(1)的大小为fscale×fscale,/>在图像O(1)中起始点坐标与/>相同。
9.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S8的具体实现过程如下:
S81、垂直接缝拼接:记图像块为图像O(1)垂直接缝处与图像块/>对应位置的图像块,对S6生成的图像块/>按照如下公式进行图像融合,得到更新后的图像块/>
其中矩阵α2大小为fscale×fscale,·为矩阵点乘;将所有更新后的图像块覆盖到图像O(1)中对应图像块/>所在的位置,得到图像O(2)
S82、水平接缝拼接:记图像块为图像O(2)水平接缝处与图像块/>对应位置的图像块,对S6生成的图像块/>按照如下公式进行图像融合,得到更新后的图像块/>
其中α3为α2的转置矩阵,·为矩阵点乘;将所有更新后的图像块覆盖到图像O(2)中对应图像块/>所在的位置,得到图像O(3)
S83、中心接缝拼接:记图像块为图像O(3)水平接缝处与图像块/>对应位置的图像块,对S6生成的图像块/>按照如下公式进行图像融合,得到更新后的图像块/>
其中矩阵α4大小为fscale×fscale,·为矩阵点乘;将所有更新后的图像块覆盖到图像O(3)中对应图像块/>所在的位置,得到图像O(4)
10.根据权利要求1所述的基于GAN网络结构的两阶段瓷砖图像风格化方法,其特征在于S9的具体实现过程如下:
对图像O(4)进行裁切,得到最终瓷砖风格化图像O,其中图像O大小为w×h,其左上角的起始点在图像O(4)中的坐标为(0,0)。
CN202210658171.8A 2022-06-10 2022-06-10 基于gan网络结构的两阶段瓷砖图像风格化方法 Active CN114943640B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210658171.8A CN114943640B (zh) 2022-06-10 2022-06-10 基于gan网络结构的两阶段瓷砖图像风格化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210658171.8A CN114943640B (zh) 2022-06-10 2022-06-10 基于gan网络结构的两阶段瓷砖图像风格化方法

Publications (2)

Publication Number Publication Date
CN114943640A CN114943640A (zh) 2022-08-26
CN114943640B true CN114943640B (zh) 2024-05-31

Family

ID=82909996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210658171.8A Active CN114943640B (zh) 2022-06-10 2022-06-10 基于gan网络结构的两阶段瓷砖图像风格化方法

Country Status (1)

Country Link
CN (1) CN114943640B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544718A (zh) * 2012-07-13 2014-01-29 卡西欧计算机株式会社 图像处理装置以及画面风格变换方法
CN108470320A (zh) * 2018-02-24 2018-08-31 中山大学 一种基于cnn的图像风格化方法及系统
CN113628101A (zh) * 2021-08-12 2021-11-09 杭州电子科技大学 基于gan网络结构的三阶段瓷砖图像生成方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10565757B2 (en) * 2017-06-09 2020-02-18 Adobe Inc. Multimodal style-transfer network for applying style features from multi-resolution style exemplars to input images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544718A (zh) * 2012-07-13 2014-01-29 卡西欧计算机株式会社 图像处理装置以及画面风格变换方法
CN108470320A (zh) * 2018-02-24 2018-08-31 中山大学 一种基于cnn的图像风格化方法及系统
CN113628101A (zh) * 2021-08-12 2021-11-09 杭州电子科技大学 基于gan网络结构的三阶段瓷砖图像生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于改进AdaIN的图像风格迁移;吴岳;宋建国;;软件导刊;20200915(第09期);全文 *

Also Published As

Publication number Publication date
CN114943640A (zh) 2022-08-26

Similar Documents

Publication Publication Date Title
JP3031613B2 (ja) カラー/濃淡画像入力出力装置と入力出力方法
CN107358649A (zh) 地形文件的处理方法和装置
GB2457646A (en) Data decompression of textures including large colour discontinuities
JPS63271290A (ja) 文字パタ−ン生成方式
CN104732479A (zh) 对图像进行调整大小
JP4407875B2 (ja) 文字表示装置および文字表示方法、その文字表示方法を制御するための制御プログラムおよびその制御プログラムが記録された記録媒体
CN111681165A (zh) 图像处理方法、装置、计算机设备和计算机可读存储介质
US5982386A (en) Image boundary correction by fractal processing
CN114943640B (zh) 基于gan网络结构的两阶段瓷砖图像风格化方法
JP3791259B2 (ja) アウトラインスムージング処理方法
US7956861B2 (en) Method for checkerboard-based vector to raster conversion
JPWO2010095178A1 (ja) 多色ベクトル画像処理装置および方法
WO2010051719A1 (zh) 一种视频图像 4/3 倍放大方法
KR20060124673A (ko) 그래픽 객체들을 렌더링하는 방법
US7734118B2 (en) Automatic image feature embedding
JPH0793531A (ja) 画像処理装置
WO2016053233A1 (en) Generation of images at lower resolution
JP3509397B2 (ja) マルコフモデル画像符号化装置
JPH1069549A (ja) 画像処理方法
WO2006075695A1 (ja) 文字図形表示装置、プログラムおよび記録媒体
JP3517982B2 (ja) 図形描画装置
JPH08272351A (ja) 画像処理装置
CN118298128A (zh) 三维网格处理方法、装置、设备及可读存储介质
JP4117810B2 (ja) ベクトルデータのキャラクタ変換方法
JP2625046B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant