CN109146989A - 一种通过搭建神经网络生成花鸟艺术字图像的方法 - Google Patents
一种通过搭建神经网络生成花鸟艺术字图像的方法 Download PDFInfo
- Publication number
- CN109146989A CN109146989A CN201810749559.2A CN201810749559A CN109146989A CN 109146989 A CN109146989 A CN 109146989A CN 201810749559 A CN201810749559 A CN 201810749559A CN 109146989 A CN109146989 A CN 109146989A
- Authority
- CN
- China
- Prior art keywords
- image
- images
- bird
- input
- flower
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 19
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims description 36
- 238000010606 normalization Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000001902 propagating effect Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000001143 conditioned effect Effects 0.000 claims description 3
- 230000008521 reorganization Effects 0.000 claims description 3
- 230000003213 activating effect Effects 0.000 claims description 2
- 238000013461 design Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000010422 painting Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000002268 wool Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种通过搭建神经网络生成花鸟艺术字图像的方法,包括以下步骤:(1)提出一个新的图像数据集,即ChineseArtCharacter360,包含360个汉字对应的360幅花鸟艺术字图像;(2)使用8‑connect块构建卷积神经网络作为生成器,构建马尔可夫卷积神经网络作为判别器并设计GLS损失函数作为网络总的损失函数;(3)将构建的图像数据集输入到生成器和判别器进行训练;(4)使用训练好的生成器进行花鸟艺术字图像的生成。本方法针对解决的问题可视作图像到图像的转换问题,通过搭建卷积神经网络,并设计GLS损失函数,可基于简单的输入获取任意汉字对应的花鸟艺术字图像,从而加速甚至省去传统复杂的手工和特殊画具的绘制过程。
Description
技术领域
本发明属于计算机图像处理技术领域,尤其涉及一种通过搭建神经网络生成花鸟艺术字图像的方法。
背景技术
花鸟艺术字是中国民间特有的艺术瑰宝,它既是一种汉字字体也是一种艺术画。花鸟字因其笔画多用花鸟图案而得名,即把字的笔画用花、鸟、鱼、草、虫、山、水等图案代替,以基本字形组成,集书法绘画为一体。然而获取一个汉字对应的花鸟艺术字图像需要专业级别作画水准并结合特殊的画具如用竹片、麻布、海绵、羊毛等经过精心制作而成。因此,促进花鸟字艺术的弘扬与发展,让更多的人得以欣赏甚至通过计算机自己创作花鸟字具有重要意义。本发明试图将花鸟艺术字图像生成的问题视作图像到图像的转换问题,即通过输入汉字的粗线条图像,如手写毛笔字体图像,进而获取对应的彩色花鸟艺术字图像。为此,使用提出的方法搭建神经网络,可基于简单的输入获取任意汉字对应的花鸟艺术字图像,从而加速甚至省去传统复杂的手工和特殊画具的绘制过程。
近年来,深度卷积神经网络在各类图像处理任务取得了飞速的发展,例如生成对抗网络在Ian J.Goodfellow等的文章“Generative Adversarial Nets”(NIPS,2014)中提出,作为一种生成模型在各类图像生成任务中取得了不断发展与突破。该网络在训练过程中,生成器负责生成图像并将其输入判别器,而判别器负责接收真实图像和生成图像并识别区分该接收样本是否为真实图像。生成器与判别器在训练过程中扮演着对抗学习的角色。原始的生成对抗网络存在着难以训练的缺点,如训练过程中当判别器越好时,生成器梯度消失越严重。另外训练的最终甚至出现模式坍塌(collapse mode)现象,即所生成样本出现重复、缺失多样性。许多基于生成对抗网络的变体被提出试图解决生成对抗网络的难以训练以及不稳定的问题,如通过去掉最大池化层、全连接层而加入BN层即批归一化层,并在生成器中除输出层使用tanh激活函数外其余层使用ReLU激活函数,判别器则使用leakyReLU激活函数以达到稳定训练和缓解模式坍塌问题的效果,然而这些网络的生成器输入是随机噪声向量,生成的样本图像不可控,不符合图像到图像的转换问题。与此同时,人们开始将生成对抗网络应用到图像转换的任务中,例如试图解决同一场景白天图像和夜晚图像之间互相转换的风格迁移问题,以及航空摄像图和地图、提包鞋子边缘图像和真实图像、灰度图像和彩色图像之间互相转换的问题等。不难发现其中和花鸟艺术字图像生成最相近的是提包鞋子边缘图像到真实图像的转换,但由于提包和鞋子图像纹理形式等较为简单,并且在这种任务下该这些网络结构往往需要数万图像作为训练数据集,显然无法解决花鸟艺术字图像生成任务中训练数据集少、图像纹理多变而复杂的问题;而在解决灰度图像到彩色图像的转换任务中,灰度图像有着强烈的纹理等图像细节的提醒,又与花鸟艺术字图像生成网络的输入是简单的汉字粗线条图像如手写毛笔字体图像等黑白二值图像不同。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种通过搭建神经网络生成花鸟艺术字图像的方法,基于简单的输入获取任意汉字对应的花鸟艺术字图像,从而加速甚至省去传统复杂的手工和特殊画具的绘制过程。
为了达到上述目的,本发明采用以下技术方案:
本发明一种通过搭建神经网络生成花鸟艺术字图像的方法,包括下述步骤:
(1)构建一个新的图像数据集,将该图像数据集作为训练的真实目标图像,同时进行网络输入源图像的准备,即目标花鸟艺术字对应汉字的粗线条图像;
(2)使用8-connect块构建卷积神经网络作为生成器,构建马尔可夫卷积神经网络作为判别器并设计GLS损失函数作为网络损失函数;
(3)将构建的图像数据集输入到生成器和判别器进行训练;
(4)使用训练好的生成器进行花鸟艺术字图像的生成。
作为优选的技术方案,所述步骤(1)中,构建一个新的图像数据集ChineseArtCharacter360,具体方法为:
(1-1)通过网络搜索引擎获取公开、公益性的花鸟艺术字图像,并对图像进行去噪处理、调整分辨率大小处理,选出360个汉字对应的360幅花鸟字图像,作为训练的真实目标图像即为360幅target图像;
(1-2)同时进行网络输入源图像的准备,即目标花鸟艺术字对应汉字的粗线条图像360幅,此为360幅input图像;
(1-3)将input图像和target图像组成成对图像的数据集作为网络训练与测试的数据集。
作为优选的技术方案,所述步骤(2)中,每个8-connect块内部数据流分支形成数字“8”形状,具体计算表达式为:
out=F(R(F(in)+in))+R(F(in)+in)
上述式子中in为8-connect块的输入,out为输出,F为卷积、归一化,R为ReLU激活操作;
(2-1-1)提取图像整体的粗特征,以分别对其卷积、归一化、ReLU激活为一组操作,重复改组操作3次;
(2-1-2)取图像局部的深层特征,将在第一步中得到的特征输出经过8次8-connect块,每个8-connect块输出特征图通道数保持不变;
(2-1-3)生成图像,分别重复进行3次反卷积恢复通道数为3。
作为优选的技术方案,所述步骤(2)中,构建判别器的具体方法为:
(2-2-1)将输入图像对在通道维度上拼接,即两幅通道数为3的图像拼接为通道数为6的特征图;
(2-2-2)通过5次卷积操作,其中卷积核大小4×4,步长为2,前四次卷积每次输出通道数为输入通道数的2倍,最后一次卷积输出通道数降为1,即最终得到30×30×1的特征大小作为输出;
(2-2-3)除最后一次卷积直接输出结果,前面每次卷积后均进行归一化处理,并使用正半轴斜率为1、负半轴斜率为0.2的Leakly ReLU函数进行激活。
作为优选的技术方案,所述步骤(2)中,设计GLS损失函数表达式为:
其中,为条件对抗损失,为L1距离损失,为结构相似性损失,α、β分别为权重系数;
GLS损失函数中损失部分具体表达式为:
GLS损失函数中LL1(G)损失部分具体表达式为:
上述和中x为成对图像数据集(input,target)中的input图像,y为target图像,G为生成器网络,D为判别器网络;
GLS损失函数中LSSIM(G)损失部分具体表达式为:
上式中G为生成器网络,p为x的取13×13像素大小的图像窗口中心,N为窗口数量,x为成对图像数据集(input,target)中的input图像,y为target图像,μx为x的均值,μy为y的均值,σx为x的标准差,σy为y的标准差,σxy为x和y的协方差,c1和c2默认为分别取0.02和0.03。
作为优选的技术方案,所述步骤(3)中,将图像数据集输入到生成器和判别器进行训练的具体过程如下:
(3-1)将所提供的成对图像数据集中的input图像输入到生成器中,得到生成图像fake-target;
(3-2)当将fake-target和input作为生成图像对,输入到判别器中时,计算损失并反向传播梯度,生成器调整参数趋向于生成与目标图像更接近的图像;
(3-3)当将target和input作为真实图像对,输入到判别器中时,计算损失并反向传播梯度,判别器调整参数趋向于提高对fake-target与target的区分能力;
(3-4)当达到平衡即当判别器无法区分成对图像是真实图像对还是生成图像对时,训练完成。
作为优选的技术方案,所述步骤(4)中,训练好的生成器用于生成花鸟艺术字图像的具体方法为:
输入汉字粗线条图像例如手写毛笔字体图像,经过前向传播即可快速得到对应的彩色花鸟艺术字图像。
本发明与现有技术相比,具有如下优点和有益效果:
(1)、本发明针对中国民间花鸟艺术字展开研究,通过搭建神经网络能够快速自动生成花鸟艺术字图像,可省去传统的手工以及特殊画具的绘制过程,促进艺术汉字的弘扬与发展。
(2)、本发明提出的ChineseArtCharacter360数据集,包含360幅花鸟艺术字图像,经过去噪、统一分辨率大小等,可用于进一步对花鸟艺术字图像进行研究。
(3)、本发明提出了改进的神经网络结构,其中提出8-connect构建卷积神经网络作为生成器,提取图像更丰富、多层次的特征,同时可减少网络参数计算量;使用马尔可夫卷积神经网络作为判别器,对图像判别时分块判别,促进生成局部块信息更好的图像。
(4)、本发明提出了GLS损失函数作为网络损失函数,即将对抗损失、L1距离损失和SSIM损失作为总的网络损失函数,其中L1损失部分有减少模糊作用,SSIM损失使生成图像的局部信息、颜色以及对比度等更加符合人类的视觉系统。
(5)、不同于传统或者当前大多数的卷积神经网络,训练数据量往往需要几千甚至数万,本发明提出的网络仅使用360幅图像作为网络训练测试数据集即可达到较好的生成效果。
本发明可以运用到如下领域:
(1)、中国民间花鸟艺术字的自动生成,省去传统复杂的手工以及特殊画具的绘制过程;
(2)、实验室研究,如深度学习卷积神经网络在图像到图像转换领域的研究;
(3)、图像风格迁移,对不同域、不同风格图像间的迁移、融合提供思路。
附图说明
图1为本发明提出方法的整体流程图。
图2为整体网络结构图。
图3为本发明提出的8-connect块构建的生成器网络结构图。
图4为8-connect块内部结构图。
图5为本发明判别器网络结构图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
如图1所示,本发明一种通过搭建神经网络生成花鸟艺术字图像的方法,包括下述步骤:
首先,提出一个花鸟艺术字图像数据集合ChineseArtCharacter360,包含360个汉字对应的360幅花鸟艺术字图像,将其作为训练的真实目标图像,同时进行网络输入源图像的准备,即目标花鸟艺术字对应汉字的粗线条图像。
其次,使用8-connect构建神经网络作为生成器和马尔可夫卷积神经网络作为判别器。
再次,使用所提出的GLS损失函数作为网络损失函数。
最后,通过训练网络后移除判别器最终仅使用生成器即可用于花鸟艺术字图像的生成。
为进一步详细阐述本发明的技术方案,本实施例对主要技术要点做如下说明:
1、准备图像数据集;
本发明中为构建图像数据集ChineseArtCharacter360,首先通过网络搜索引擎获取公开、公益性的花鸟艺术字图像。为达到更好的训练效果,可通过基础的图像处理操作进行图像增强,如对图像进行去噪、调整分辨率大小等处理,后选出360个较具有代表性的汉字对应的360幅花鸟字图像,所谓具有代表性即横(一)、竖(丨)、撇(丿)、点(丶)、折(乛)等笔画均有呈现并出现频率大致相同。选出的花鸟艺术字图像作为训练的真实目标图像即为360幅target图像。同时进行网络输入源图像的准备,即目标花鸟艺术字对应汉字的粗线条图像如手写毛笔字体图像360幅,此为360幅input图像。最后,将input图像和target图像组成成对图像的数据集作为网络训练测试数据集。
2、构建生成对抗网络;
整个网络结构如图2所示。构建整个网络包括三部分:使用8-connect块构建卷积神经网络作为生成器,构建马尔可夫卷积神经网络作为判别器和设计GLS损失函数作为网络总的损失函数。
(1)构建生成器网络:
所构建的生成器网络结构如图3所示,对输入的源图像即input图像,调整为大小为256×256×3,其中3代表通道数。
第一步提取图像整体的粗特征,以分别对其卷积、归一化、ReLU激活为一组操作,重复改组操作3次:其中第一次使用的卷积核大小为7×7,卷积步长为1,输出通道数增至64;第二次使用的卷积核大小为3×3,卷积步长为2,输出通道数增至128;第三次使用的卷积核大小为3×3,卷积步长为2,输出通道数增至256。
第二步为了进一步提取图像局部的深层特征,使用提出的8-connect块构建卷积神经网络作为生成器,其中每个8-connect块内部数据流分支形成数字“8”形状,如图4所示,具体计算表达式为:
out=F(R(F(in)+in))+R(F(in)+in)
上述式子中in为8-connect块的输入,out为输出,F为卷积(卷积核大小为3×3,步长为1,通道数维持不变)、归一化,R为ReLU激活操作。使用8-connect块可进一步提取和保留图像特征信息,缓解训练过程中梯度弥散或爆炸问题,同时减少网络参数计算量。将在第一步中得到的输出经过8次8-connect块,每个8-connect块输出特征图通道数始终保持256。
最后生成图像,分别重复进行3次反卷积恢复通道数为3。
(2)构建判别器网络:
如图5所示的马尔可夫判别器网络结构,该判别器网络结构设计构思最先在lsola等的文章“lmage-to-image translation with conditional adversarial networks.”(CVPR,2017)中提出。原始生成对抗网络的判别器,直接经过数次卷积得到1×1×1的输出,将判别的真假以一个标量,即概率作为判别器输出,1表示真实目标图像而0表示生成图像。这里所使用的马尔科夫判别器仅是对输入图像卷积得到30×30×1的张量大小作为输出,当张量元素全为1表示真实图像对,张量元素全为0表示生成图像对。马尔可夫判别器将输入图像分块进行判别,即对局部块信息独立判别,可进一步提升判别器网络对真实目标图像和生成图像的判别能力。
本实施中判别器首先将输入图像对在通道维度上拼接,即两幅通道数为3的图像拼接为通道数为6的特征图,并通过5次卷积操作,其中卷积核大小4×4,步长为2,前四次卷积每次输出通道数为输入通道数的2倍,最后一次卷积输出通道数降为1,即最终得到30×30×1的特征大小作为输出。值得注意的是,除最后一次卷积直接输出结果,前面每次卷积后均进行归一化处理,并使用正半轴斜率为1、负半轴斜率为0.2的Leakly ReLU函数进行激活。
(3)设计GLS损失函数:
本发明使用所提出的GLS损失函数:
其中,为条件对抗损失,为L1距离损失,为结构相似性损失,α、β分别为权重系数,取值50~100较佳。而则是使用了MirzaM等的文章“Conditional GenerativeAdversarialNets”(Computer Science,2014:2672-2680)提出的带约束条件的生成对抗网络的损失函数,具体表达式为:
在GLS损失中损失部分为具体表达式为:
其中,x为成对图像数据集(input,target)中的input图像,y为target图像。G为8-resnet生成网络,D为判别器。
此外,GLS损失使用到了Wang等的文章“Image quality assessment:from errorvisibility to structural similarity”(IEEE Transactions on Image Processing 13(4)(2004)600-612)提出的SSIM评估指数定义。SSIM综合评估图像的局部信息、颜色以及对比度等,值越高越符合人类的视觉系统感受,意味着图像质量越好。由于网络损失函数定义为损失越小网络优化结果更好,故基于SSIM提出的部分为具体表达式为:
其中,G为生成网络,p为x的取13×13像素大小的图像窗口中心,N为窗口数量,x为成对图像数据集(input,target)中的input图像,y为target图像,μx为x的均值,μy为y的均值,σx为x的标准差,σy为y的标准差,σxy为x和y的协方差,c1和c2默认为分别取0.02和0.03。
3、训练网络:
将所提供的成对图像数据集输入到生成器和判别器进行交替训练,使用Adam优化算法,在本实施方式中使用深度学习框架tensorflow推荐默认设置的超参数(learning_rate=0.001,beta1=0.9,beta2=0.999,epsilon=1e-08),训练批大小为1,训练数据集大小为300,验证集大小为60,共200个训练周期。
训练过程中,将所提供的成对图像数据集中的input图像输入到生成器中,得到生成图像fake-target;当将fake-target和input作为生成图像对,在通道维度上进行拼接即通道数变成6后输入到判别器中时,计算损失并反向传播梯度,生成器调整参数进行优化而趋向于生成与真实目标图像对更接近的生成图像对;当将target图像和input图像作为真实目标图像对,同样经过在通道维度上进行拼接输入到判别器中时,计算损失并反向传播梯度,判别器调整参数趋向于提高对fake-target与target的区分能力。两者形成一种对抗训练的关系,即生成器致力于生成判别器更难判别的图像,判别器则不断对比真实图像对和生成图像对的误差损失,当达到平衡即当判别器无法区分成对图像是真实图像对还是生成图像对时,训练完成,并保存模型。
4、使用训练好的模型进行花鸟艺术字的生成:
通过移除马尔可夫判别器,仅使用8-connect构造的生成器网络即可生成花鸟艺术字图像:输入汉字粗线条图像手写毛笔字体图像,经过前向传播即可快速得到对应的彩色花鸟艺术字图像。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (7)
1.一种通过搭建神经网络生成花鸟艺术字图像的方法,其特征在于,包括下述步骤:
(1)构建一个新的图像数据集,将该图像数据集作为训练的真实目标图像,同时进行网络输入源图像的准备,即目标花鸟艺术字对应汉字的粗线条图像;
(2)使用8-connect块构建卷积神经网络作为生成器,构建马尔可夫卷积神经网络作为判别器并设计GLS损失函数作为网络损失函数;
(3)将构建的图像数据集输入到生成器和判别器进行训练;
(4)使用训练好的生成器进行花鸟艺术字图像的生成。
2.根据权利要求1所述通过搭建神经网络生成花鸟艺术字图像的方法,其特征在于,所述步骤(1)中,构建一个新的图像数据集ChineseArtCharacter360,具体方法为:
(1-1)通过网络搜索引擎获取公开、公益性的花鸟艺术字图像,并对图像进行去噪处理、调整分辨率大小处理,选出360个汉字对应的360幅花鸟字图像,作为训练的真实目标图像即为360幅target图像;
(1-2)同时进行网络输入源图像的准备,即目标花鸟艺术字对应汉字的粗线条图像360幅,此为360幅input图像;
(1-3)将input图像和target图像组成成对图像的数据集作为网络训练与测试的数据集。
3.根据权利要求1所述通过搭建神经网络生成花鸟艺术字图像的方法,其特征在于,所述步骤(2)中,每个8-connect块内部数据流分支形成数字“8”形状,具体计算表达式为:
out=F(R(F(in)+in))+R(F(in)+in)
上述式子中in为8-connect块的输入,out为输出,F为卷积、归一化,R为ReLU激活操作;
(2-1-1)提取图像整体的粗特征,以分别对其卷积、归一化、ReLU激活为一组操作,重复改组操作3次;
(2-1-2)取图像局部的深层特征,将在第一步中得到的特征输出经过8次8-connect块,每个8-connect块输出特征图通道数保持不变;
(2-1-3)生成图像,分别重复进行3次反卷积恢复通道数为3。
4.根据权利要求1所述通过搭建神经网络生成花鸟艺术字图像的方法,其特征在于,所述步骤(2)中,构建判别器的具体方法为:
(2-2-1)将输入图像对在通道维度上拼接,即两幅通道数为3的图像拼接为通道数为6的特征图;
(2-2-2)通过5次卷积操作,其中卷积核大小4×4,步长为2,前四次卷积每次输出通道数为输入通道数的2倍,最后一次卷积输出通道数降为1,即最终得到30×30×1的特征大小作为输出;
(2-2-3)除最后一次卷积直接输出结果,前面每次卷积后均进行归一化处理,并使用正半轴斜率为1、负半轴斜率为0.2的Leakly ReLU函数进行激活。
5.根据权利要求1所述通过搭建神经网络生成花鸟艺术字图像的方法,其特征在于,所述步骤(2)中,设计GLS损失函数表达式为:
其中,为条件对抗损失,为L1距离损失,为结构相似性损失,α、β分别为权重系数;
GLS损失函数中损失部分具体表达式为:
GLS损失函数中LL1(G)损失部分具体表达式为:
上述和中x为成对图像数据集(input,target)中的input图像,y为target图像,G为生成器网络,D为判别器网络;
GLS损失函数中LSSIM(G)损失部分具体表达式为:
上式中G为生成器网络,p为x的取13×13像素大小的图像窗口中心,N为窗口数量,x为成对图像数据集(input,target)中的input图像,y为target图像,μx为x的均值,μy为y的均值,σx为x的标准差,σy为y的标准差,σxy为x和y的协方差,c1和c2默认为分别取0.02和0.03。
6.根据权利要求1所述通过搭建神经网络生成花鸟艺术字图像的方法,其特征在于,所述步骤(3)中,将图像数据集输入到生成器和判别器进行训练的具体过程如下:
(3-1)将所提供的成对图像数据集中的input图像输入到生成器中,得到生成图像fake-target;
(3-2)当将fake-target和input作为生成图像对,输入到判别器中时,计算损失并反向传播梯度,生成器调整参数趋向于生成与目标图像更接近的图像;
(3-3)当将target和input作为真实图像对,输入到判别器中时,计算损失并反向传播梯度,判别器调整参数趋向于提高对fake-target与target的区分能力;
(3-4)当达到平衡即当判别器无法区分成对图像是真实图像对还是生成图像对时,训练完成。
7.根据权利要求1所述通过搭建神经网络生成花鸟艺术字图像的方法,其特征在于,所述步骤(4)中,训练好的生成器用于生成花鸟艺术字图像的具体方法为:
输入汉字粗线条图像,经过前向传播即可快速得到对应的彩色花鸟艺术字图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810749559.2A CN109146989B (zh) | 2018-07-10 | 2018-07-10 | 一种通过搭建神经网络生成花鸟艺术字图像的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810749559.2A CN109146989B (zh) | 2018-07-10 | 2018-07-10 | 一种通过搭建神经网络生成花鸟艺术字图像的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109146989A true CN109146989A (zh) | 2019-01-04 |
CN109146989B CN109146989B (zh) | 2023-02-14 |
Family
ID=64800237
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810749559.2A Active CN109146989B (zh) | 2018-07-10 | 2018-07-10 | 一种通过搭建神经网络生成花鸟艺术字图像的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109146989B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109784479A (zh) * | 2019-01-16 | 2019-05-21 | 上海西井信息科技有限公司 | 基于神经网络的闸杆防砸方法、系统、设备及存储介质 |
CN109903351A (zh) * | 2019-03-02 | 2019-06-18 | 复旦大学 | 基于卷积神经网络和传统编码相结合的图像压缩方法 |
CN110069664A (zh) * | 2019-04-24 | 2019-07-30 | 北京博视未来科技有限公司 | 动漫作品封面图提取方法及其系统 |
CN110443864A (zh) * | 2019-07-24 | 2019-11-12 | 北京大学 | 一种基于单阶段少量样本学习的艺术字体自动生成方法 |
CN111161137A (zh) * | 2019-12-31 | 2020-05-15 | 四川大学 | 一种基于神经网络的多风格国画花生成方法 |
CN111353995A (zh) * | 2020-03-31 | 2020-06-30 | 成都信息工程大学 | 一种基于生成对抗网络的宫颈单细胞图像数据生成方法 |
CN112053303A (zh) * | 2020-09-08 | 2020-12-08 | 河海大学 | 一种用于水下auv的视频图像实时增强方法 |
CN112069769A (zh) * | 2019-05-24 | 2020-12-11 | 北京大学 | 一种针对特效字的智能字效迁移方法 |
CN112287938A (zh) * | 2020-10-29 | 2021-01-29 | 苏州浪潮智能科技有限公司 | 一种文本分割方法、系统、设备以及介质 |
CN112927180A (zh) * | 2020-10-15 | 2021-06-08 | 内蒙古鄂尔多斯资源股份有限公司 | 一种基于生成对抗网络的羊绒羊毛光学显微镜图像识别方法 |
CN113870412A (zh) * | 2020-06-30 | 2021-12-31 | 阿里巴巴集团控股有限公司 | 一种航空场景图像的处理方法、装置以及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101185327A (zh) * | 2005-05-31 | 2008-05-21 | 三星电子株式会社 | 发送和接收部分字体文件的方法和设备 |
JP2010009517A (ja) * | 2008-06-30 | 2010-01-14 | Canon Inc | パターン検出器の学習装置、学習方法及びプログラム |
CN107577651A (zh) * | 2017-08-25 | 2018-01-12 | 上海交通大学 | 基于对抗网络的汉字字体迁移系统 |
CN107862377A (zh) * | 2017-11-14 | 2018-03-30 | 华南理工大学 | 一种基于文本‑图像生成对抗网络模型的分组卷积方法 |
-
2018
- 2018-07-10 CN CN201810749559.2A patent/CN109146989B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101185327A (zh) * | 2005-05-31 | 2008-05-21 | 三星电子株式会社 | 发送和接收部分字体文件的方法和设备 |
JP2010009517A (ja) * | 2008-06-30 | 2010-01-14 | Canon Inc | パターン検出器の学習装置、学習方法及びプログラム |
CN107577651A (zh) * | 2017-08-25 | 2018-01-12 | 上海交通大学 | 基于对抗网络的汉字字体迁移系统 |
CN107862377A (zh) * | 2017-11-14 | 2018-03-30 | 华南理工大学 | 一种基于文本‑图像生成对抗网络模型的分组卷积方法 |
Non-Patent Citations (1)
Title |
---|
SONGHUA XU 等: "Automatic Generation of Artistic Chinese Calligraphy", 《IEEE INTELLIGENT SYSTEMS》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109784479A (zh) * | 2019-01-16 | 2019-05-21 | 上海西井信息科技有限公司 | 基于神经网络的闸杆防砸方法、系统、设备及存储介质 |
CN109903351A (zh) * | 2019-03-02 | 2019-06-18 | 复旦大学 | 基于卷积神经网络和传统编码相结合的图像压缩方法 |
CN110069664A (zh) * | 2019-04-24 | 2019-07-30 | 北京博视未来科技有限公司 | 动漫作品封面图提取方法及其系统 |
CN110069664B (zh) * | 2019-04-24 | 2021-04-06 | 北京博视未来科技有限公司 | 动漫作品封面图提取方法及其系统 |
CN112069769A (zh) * | 2019-05-24 | 2020-12-11 | 北京大学 | 一种针对特效字的智能字效迁移方法 |
CN112069769B (zh) * | 2019-05-24 | 2022-07-26 | 北京大学 | 一种针对特效字的智能字效迁移方法及系统 |
CN110443864A (zh) * | 2019-07-24 | 2019-11-12 | 北京大学 | 一种基于单阶段少量样本学习的艺术字体自动生成方法 |
CN110443864B (zh) * | 2019-07-24 | 2021-03-02 | 北京大学 | 一种基于单阶段少量样本学习的艺术字体自动生成方法 |
CN111161137A (zh) * | 2019-12-31 | 2020-05-15 | 四川大学 | 一种基于神经网络的多风格国画花生成方法 |
CN111353995A (zh) * | 2020-03-31 | 2020-06-30 | 成都信息工程大学 | 一种基于生成对抗网络的宫颈单细胞图像数据生成方法 |
CN111353995B (zh) * | 2020-03-31 | 2023-03-28 | 成都信息工程大学 | 一种基于生成对抗网络的宫颈单细胞图像数据生成方法 |
CN113870412A (zh) * | 2020-06-30 | 2021-12-31 | 阿里巴巴集团控股有限公司 | 一种航空场景图像的处理方法、装置以及电子设备 |
CN112053303A (zh) * | 2020-09-08 | 2020-12-08 | 河海大学 | 一种用于水下auv的视频图像实时增强方法 |
CN112053303B (zh) * | 2020-09-08 | 2024-04-05 | 河海大学 | 一种用于水下auv的视频图像实时增强方法 |
CN112927180A (zh) * | 2020-10-15 | 2021-06-08 | 内蒙古鄂尔多斯资源股份有限公司 | 一种基于生成对抗网络的羊绒羊毛光学显微镜图像识别方法 |
CN112927180B (zh) * | 2020-10-15 | 2022-11-15 | 内蒙古鄂尔多斯资源股份有限公司 | 一种基于生成对抗网络的羊绒羊毛光学显微镜图像识别方法 |
CN112287938A (zh) * | 2020-10-29 | 2021-01-29 | 苏州浪潮智能科技有限公司 | 一种文本分割方法、系统、设备以及介质 |
CN112287938B (zh) * | 2020-10-29 | 2022-12-06 | 苏州浪潮智能科技有限公司 | 一种文本分割方法、系统、设备以及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109146989B (zh) | 2023-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109146989B (zh) | 一种通过搭建神经网络生成花鸟艺术字图像的方法 | |
Golts et al. | Unsupervised single image dehazing using dark channel prior loss | |
WO2021253939A1 (zh) | 一种用于眼底视网膜血管图像分割的粗糙集神经网络方法 | |
CN108830913B (zh) | 基于用户颜色引导的语义级别线稿上色方法 | |
CN110222722A (zh) | 交互式图像风格化处理方法、系统、计算设备及存储介质 | |
CN110321813A (zh) | 基于行人分割的跨域行人重识别方法 | |
CN111724299B (zh) | 一种基于深度学习的超现实主义绘画图像风格迁移方法 | |
CN111161137B (zh) | 一种基于神经网络的多风格国画花生成方法 | |
CN111861906B (zh) | 一种路面裂缝图像虚拟增广模型建立及图像虚拟增广方法 | |
CN107463954B (zh) | 一种模糊异谱图像的模板匹配识别方法 | |
CN110310345A (zh) | 一种基于自动分工隐聚类生成对抗网络的图像生成方法 | |
CN108038859A (zh) | 基于pso和综合评价准则的pcnn图分割方法及装置 | |
CN109920021A (zh) | 一种基于正则化宽度学习网络的人脸素描合成方法 | |
CN110276753A (zh) | 基于特征空间统计信息映射的目标自适应隐藏方法 | |
Silva et al. | Mangan: Assisting colorization of manga characters concept art using conditional gan | |
CN115908602A (zh) | 一种将风景照片转换为中国山水画的风格迁移方法 | |
CN113706407B (zh) | 基于分离表征的红外可见光图像融合方法 | |
Sheng et al. | SRNet: Sparse representation-based network for image denoising | |
CN112767277B (zh) | 一种基于参考图像的深度特征排序去模糊方法 | |
Guan et al. | DiffWater: Underwater image enhancement based on conditional denoising diffusion probabilistic model | |
Zhang et al. | New image processing: VGG image style transfer with gram matrix style features | |
CN108876750A (zh) | 一种基于非局部相似性低秩矩阵的图像去除泊松噪声的方法 | |
CN115018729B (zh) | 一种面向内容的白盒图像增强方法 | |
Zeng et al. | Controllable face aging | |
CN113569780B (zh) | 一种基于梯度对抗攻击和生成对抗模型的人脸图片年龄转换方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |