CN110570346B

CN110570346B - 一种基于循环生成对抗网络对书法进行风格迁移的方法

Info

Publication number: CN110570346B
Application number: CN201910764034.0A
Authority: CN
Inventors: 刘晶; 向朋霞
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2019-08-19
Filing date: 2019-08-19
Publication date: 2022-11-04
Anticipated expiration: 2039-08-19
Also published as: CN110570346A

Abstract

本发明公开了一种基于循环生成对抗网络对书法进行风格迁移的方法，首先在word中制作要迁移的风格A和风格B两种风格的两种字体作为训练样本；然后根据样本制作两种风格数据集，依次更新生成器权重和判别器权重，得到生成器训练生成的图片和判别器判别真伪的结果；最后将训练样本输入判别器和生成器中进行训练更新，经过二者的博弈以后，生成器的伪造技术越来越厉害，判别器的鉴别技术也越来越厉害，直到判别器再也分不出数据是真实的数据还是生成器生成的数据，即对抗的过程达到动态的平衡，得到最后的训练效果，输出风格迁移后的图片。本发明解决了现有技术中存在的无配对的文字图片找不到对应目标的问题。

Description

一种基于循环生成对抗网络对书法进行风格迁移的方法

技术领域

本发明属于图片处理方法技术领域，具体涉及一种基于循环生成对抗网络对书法进行风格迁移的方法。

背景技术

中国古代有很多书法大家，他们遗留下来的真迹往往价值千金，成为后人争先恐后临摹的对象。但在历史的长河中，由于众多原因，这些大家们的一部分作品已经损毁，而且古代有些汉字是当时没有的，所以可能有大量的汉字是没有某种书法风格存在的，使得传杨优秀文化过程中存在一定的缺陷。

作为中国传统优秀文化的书法，我们应该大力传承和发扬，为文化强国做出贡献。而大量书法作品在流传的过程中被人为或非人为损坏，留存较少，对于风格迁移的方法大多要求输入的图片是成对出现的，而两种不同的书法风格很难有配对的文字图片，会出现找不到训练目标的问题。为了让人们见到更多的优秀书法作品，基于此如何来扩充这些书法大家风格数据成为我们待解决的问题。

发明内容

本发明的目的是提供一种基于循环生成对抗网络对书法进行风格迁移的方法，解决了现有技术中存在的无配对的文字图片找不到对应目标的问题。

本发明所采用的技术方案是，一种基于循环生成对抗网络对书法进行风格迁移的方法，具体按照以下步骤实施：

步骤1、在word中制作要迁移的风格A和风格B两种风格的两种字体各n页，输出为图片jpg格式，得到2n张图片，作为训练样本；

步骤2、根据步骤1中的样本，制作两种风格数据集，依次更新生成器权重和判别器权重，得到生成器训练生成的图片和判别器判别真伪的结果；

步骤3、将步骤1中制作的训练样本输入步骤2中的判别器和生成器中进行训练更新，经过二者的博弈以后，生成器的伪造技术越来越厉害，判别器的鉴别技术也越来越厉害，直到判别器再也分不出数据是真实的数据还是生成器生成的数据，即对抗的过程达到动态的平衡，得到最后的训练效果，输出风格迁移后的图片。

本发明的特点还在于，

步骤2具体按照以下步骤实施：

步骤2.1、将所述步骤1中有2n张图片的训练样本中的每张图片随机裁出m张i×i大小的图片，得到风格A和风格B的图片各n×m张，图片大小均为i×i，即为所需要的数据集，其中n为裁剪前图片的张数，m为裁剪后图片张数，i为裁剪出的图片的边长；

步骤2.2、设置循环生成对抗网络，由两个对称的生成对抗网络GAN构成一个环形网络，两个生成对抗网络GAN共享两个生成器，并各自带一个判别器，即共有两个生成器，记为生成器G和生成器F，和两个判别器，记为判别器D_X和判别器D_Y，每个生成对抗网络GAN有两个损失函数，分别为生成器的重建损失和判别器的判别损失；

步骤2.3、生成器G负责把步骤2.1中裁剪后的风格A的图片训练成风格B的样子，然后更新重建损失，得到生成图片，判别器D_Y将步骤2.1中裁剪后的风格B的图片和步骤2.3中生成器G生成图片作为输入，更新判别损失，尝试预测其为原始图片还是生成器的生成图片；

步骤2.4、生成器F负责把步骤2.1中裁剪后的风格B的图片训练成风格A的样子，然后更新重建损失，得到生成图片，判别器D_X将步骤2.1中裁剪后的风格A的图片和步骤2.4中生成器F生成图片作为输入，更新判别损失，尝试预测其为原始图片还是生成器的生成图片。

步骤3具体按照以下步骤实施：

步骤3.1、选取步骤2.1中裁剪后的任意一张风格A的图片x作为样本输入生成器G中，所输入的图片x经过生成器训练，生成一张风格B的图片y'，即G(x)＝y'；

步骤3.2、选取步骤2.1中裁剪后的任意一张风格B的图片y作为样本输入生成器F中，所输入的图片y经过生成器训练，生成一张风格A的图片x'，即F(y)＝x'；

步骤3.3、创建两个判别器D_X和判别器D_Y：

判别器D_X：输入步骤3.2生成的图片x'或步骤2.1中裁剪后的任意一张风格A的图片x，输出16x16矩阵，各个元素越接近0.9，损失函数值越小；

判别器D_Y：输入步骤3.1生成的图片y'或步骤2.1中裁剪后的任意一张风格B的图片y，输出16x16矩阵，各个元素越接近0.9，损失函数值越小；

损失函数值越小，说明该网络训练生成的图片越接近目标图片，即风格迁移越成功。

步骤3.3中损失函数具体计算如下：

步骤3.3.1、判别器D_Y损失函数：将步骤3.2中风格B的图片y输入到判别器D_Y中，输出概率值D_Y(y)；将步骤3.1中生成图片y'即图片G(x)输入到判别器D_Y中，输出概率值D_Y(G(x))，其对抗损失函数表示为：

L_GAN(G,D_Y,X,Y)＝E_y～pdata(y)[logD_Y(y)]+E_x～pdata(x)[log(1-D_Y(G(x)))]

L_GAN(G,D_Y,X,Y)表示整个判别器D_Y的损失函数，其中，E_y～pdata(y)表示风格B的图片y服从真实数据概率分布的期望；E_x～pdata(x)表示生成图片y'即图片G(x)服从生成数据概率分布的期望；D_Y(y)表示图片y输入判别器后的输出值，该输出值表示该图片为真实图片的概率；D_Y(G(x))表示生成图片y'即图片G(x)输入判别器后的输出值，该输出值表示该图片为真实图片的概率；

当D_Y(y)≈D_Y(G(x))，则y≈G(x)，经过生成器G训练后的图片y'即图片G(x)为风格转移后的图片，则生成器G训练完成；

步骤3.3.2，判别器D_X损失函数：将步骤3.1中风格A的图片x输入到判别器D_X中，输出概率值D_X(x)；将步骤3.2中生成图片x'即图片F(x)输入到判别器D_X中，输出概率值D_X(F(y))，其对抗损失函数如下所示：

L_GAN(F,D_X,Y,X)＝E_x～pdata(x)[logD_X(x)]+E_y～pdata(y)[log(1-D_X(F(y)))]

L_GAN(F,D_X,Y,X)表示整个判别器D_X的损失函数，其中，E_x～pdata(x)表示图片x服从真实数据概率分布的期望；E_y～pdata(y)表示生成图片x'即图片F(y)服从生成数据概率分布的期望；D_X(x)表示图片x输入判别器后的输出值，该输出值表示该图片为真实图片的概率；D_X(F(y))表示图片x'即图片G(y)输入判别器后的输出值，该输出值表示该图片为真实图片的概率；

当D_X(x)≈D_X(F(y))，则x≈F(y)，经过生成器F训练后的图片x'即图片F(y)为风格转移后的图片，则生成器F训练完成；

步骤3.3.3、循环一致性损失：把步骤3.1中生成的图片y'即图片G(x)再经过生成器F训练，得到图片F(G(x))；把步骤3.2中生成的图片x'即图片F(y)再经过生成器G训练，得到图片G(F(y))；循环一致性损失定义如下所示：

L_cyc(F，G，X，Y)＝E_x～pdata(x)[||F(G(x))-x||₁]+E_y～pdata(y)[||G(F(y))-y||₁]

其中，F(G(x))是步骤3.1中的图片x通过生成器G生成的图片y'再通过生成器F训练出来的图片，G(F(y))是步骤3.2中的图片y通过生成器F生成的图片x'再通过生成器G训练出来的图片；||F(G(x))-x||₁表示通过两次生成器训练生成的图片F(G(x))与原风格A的图片x做均方误差，||G(F(y))-y||₁是通过两次生成器训练生成的图片G(F(y))与原风格B的图片y做均方误差，值越小说明训练生成的图片效果越好；

步骤3.3.4、最终的损失函数为步骤3.3.1中判别器损失、步骤3.3.2中判别器损失和步骤3.3.3中循环一致性损失的总和，表示如下：

L_total＝L_GAN(F,D_Y,X,Y)+L_GAN(G,D_X,X,Y)+λL_cyc(F,G,X,F)

其中λ为常数，L_total表示图片风格迁移效果的总体损失，损失值越小表明训练越成功，也就是训练生成的图片风格越接近目标图片风格。

λ＝10。

本发明的有益效果是，一种基于循环生成对抗网络对书法进行风格迁移的方法，主要基于循环生成对抗网络进行训练，从而得到书法的风格迁移，能够为各种大家风格的书法扩充数据。基于循环生成对抗网络进行的书法风格迁移，可以类似于数字博物馆一样实现人机交互，可以把自己的字体训练成自己喜欢的字体。基于循环生成对抗网络进行的书法风格迁移,可以创造新的字体，比如可以把日文的字体用来做训练，训练出新的字体。

附图说明

图1是本发明基于循环生成对抗网络对书法进行风格迁移的方法中的流程图；

图2(a)是本发明基于循环生成对抗网络对书法进行风格迁移的方法中的循环生成对抗网络结构图；

图2(b)是图2(a)的展开图，为前向循环一致性损失图；

图2(c)是图2(a)的展开图，向后循环一致性损失图；

图3是本发明基于循环生成对抗网络对书法进行风格迁移的方法中的生成器结构；

图4是本发明基于循环生成对抗网络对书法进行风格迁移的方法中判别器结构。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明一种基于循环生成对抗网络对书法进行风格迁移的方法，流程图如图1所示，具体按照以下步骤实施：

步骤2、根据步骤1中的样本，制作两种风格数据集，依次更新生成器权重和判别器权重，得到生成器训练生成的图片和判别器判别真伪的结果，具体按照以下步骤实施：

步骤3、将步骤1中制作的训练样本输入步骤2中的判别器和生成器中进行训练更新，经过二者的博弈以后，生成器的伪造技术越来越厉害，判别器的鉴别技术也越来越厉害，直到判别器再也分不出数据是真实的数据还是生成器生成的数据，即对抗的过程达到动态的平衡，得到最后的训练效果，输出风格迁移后的图片，具体按照以下步骤实施：

步骤3.3、创建两个判别器D_X和判别器D_Y：

判别器D_Y：输入步骤3.1生成的图片y'或步骤2.1中裁剪后的任意一张风格B的图片y，输出16x16矩阵，各个元素越接近0.9，损失函数值越小；～

步骤3.3中损失函数具体计算如下：

L_GAN(G,D_Y,X,Y)＝E_y～pdata(y)[logD_Y(y)]+E_x～pdata(x)[log(1-D_Y(G(x)))]

L_GAN(F,D_X,Y,X)＝E_x～pdata(x)[logD_X(x)]+E_y～pdata(y)[log(1-D_X(F(y)))]L_GAN(F,D_X,Y,X)表示整个判别器D_X的损失函数，其中，E_x～pdata(x)表示图片x服从真实数据概率分布的期望；E_y～pdata(y)表示生成图片x'即图片F(y)服从生成数据概率分布的期望；D_X(x)表示图片x输入判别器后的输出值，该输出值表示该图片为真实图片的概率；D_X(F(y))表示图片x'即图片G(y)输入判别器后的输出值，该输出值表示该图片为真实图片的概率；

L_total＝L_GAN(F,D_Y,X,Y)+L_GAN(G,D_X,X,Y)+λL_cyc(F,G,X,F)

其中λ为常数，λ＝10，用来调节比重，L_total表示图片风格迁移效果的总体损失，损失值越小表明训练越成功，也就是训练生成的图片风格越接近目标图片风格。

本发明一种基于循环生成对抗网络对书法进行风格迁移的方法中，所输入的图片经过生成器网络计算，具体为：先经过三个卷积模块，然后经过6个残差块，最后经过两个反卷积模块和一个卷积模块，最终输出。如图3所示在生成器网络结构图中：(1)编码：第一步利用卷积神经网络，即Conv Layer从输入图象中提取特征，将图片压缩成256个64*64的特征向量；(2)转换：通过组合图片的不相近特征，将两种风格图片的特征向量进行转换，本发明中使用了6层残差块即Resnet模块，每个残差块是一个由两个卷积层构成的神经网络层，能够达到在转换时同时保留原始图片特征的目标；(3)解码：利用反卷积层，即DeConvLayer完成从特征向量中还原出低级特征的工作，最后得到生成图片。在判别器中具体为：先通过四个卷积层，即Conv Layer从图片中提取特征，再通过添加产生一维输出的卷积层来确定提取的特征是否属于特定类别。最后输出概率值。如图4所示，将一张图片作为输入，先通过四个卷积层，即Conv Layer从图片中提取特征，再通过添加产生一维输出的卷积层(Conv Layer)来确定提取的特征是否属于特定类别。最后通过输出概率值，预测其为原始图片还是生成器的生成图片。

图2(a)为循环生成对抗网络结构图，其中X，Y为两个样本，G和F为两个生成网络，D_X和D_Y为两个判别器，图2(b)和图2(c)为图2(a)的展开图。图2(b)为前向循环一致性损失图，即为图片X通过生成器G生成图片Y'，然后再通过生成器F训练出图片X'，其中Cycle-consistency loss为循环一致性损失。图2(b)为向后循环一致性损失图，即为Y样本通过生成器F生成图片X'，然后再通过生成器G训练出图片Y'，其中Cycle-consistency loss为循环一致性损失。

Claims

1.一种基于循环生成对抗网络对书法进行风格迁移的方法，其特征在于，具体按照以下步骤实施：

所述步骤2具体按照以下步骤实施：

步骤2.4、生成器F负责把步骤2.1中裁剪后的风格B的图片训练成风格A的样子，然后更新重建损失，得到生成图片，判别器D_X将步骤2.1中裁剪后的风格A的图片和步骤2.4中生成器F生成图片作为输入，更新判别损失，尝试预测其为原始图片还是生成器的生成图片；

2.根据权利要求1所述的一种基于循环生成对抗网络对书法进行风格迁移的方法，其特征在于，所述步骤3具体按照以下步骤实施：

步骤3.3、创建两个判别器D_X和判别器D_Y：

3.根据权利要求2所述的一种基于循环生成对抗网络对书法进行风格迁移的方法，其特征在于，所述步骤3.3中损失函数具体计算如下：

L_GAN(G,D_Y,X,Y)＝E_y～pdata(y)[logD_Y(y)]+E_x～pdata(x)[log(1-D_Y(G(x)))]，

L_GAN(F,D_X,Y,X)＝E_x～pdata(x)[logD_X(x)]+E_y～pdata(y)[log(1-D_X(F(y)))]

L_cyc(F,G,X,Y)＝E_x～pdata(x)[||F(G(x))-x||₁]+E_y～pdata(y)[||G(F(y))-y||₁]

L_total＝L_GAN(F,D_Y,X,Y)+L_GAN(G,D_X,X,Y)+λL_cyc(F,G,X,F)

4.根据权利要求3所述的一种基于循环生成对抗网络对书法进行风格迁移的方法，其特征在于，λ＝10。