CN111667008A

CN111667008A - 一种基于特征融合的个性化汉字字体图片生成方法

Info

Publication number: CN111667008A
Application number: CN202010510661.4A
Authority: CN
Inventors: 王存睿; 黄星宇
Original assignee: Dalian Minzu University
Current assignee: Dalian Minzu University
Priority date: 2020-06-08
Filing date: 2020-06-08
Publication date: 2020-09-15

Abstract

一种基于特征融合的个性化汉字字体图片生成方法，S1、汉字转化为图片：S2、模型构建，S3、训练模型、S4、生成字体图像集获取、S5、汉字类型判别S6、字体生成。与现有的技术相比，本发明只需要字体设计者提供670个左右的字体，就能够生成对应汉字的全部个性化汉字字体。该本发明将极大提高汉字字库的制作效率，减轻了字体设计对于人工的依赖，极大的缩短了字库制作的周期，使得字库的生成变得简单方便。而且为多个行业的应用和推广提供了可靠依据。能够丰富电影、电视、广告等数字媒体和文化行业的字体材料，为其多元化设计提供素材。

Description

一种基于特征融合的个性化汉字字体图片生成方法

技术领域

本发明涉及计算机图形学与人工智能领域，尤其涉及一种基于特征融合的个性化汉字字体图片生成方法。

背景技术

随着互联网的兴起，现在越来越多的人喜欢在不同情况下使用个性化字体。一方面，不同得字体风格可以灵活地表达个性，赋予文本以作家独特的特征和标志。另一方面，个性化字体风格中的字形带来动态视觉感知，能够在各种社交网络媒体中吸引更多注意力。然而，创建手写中文字库仍然是一项耗时且费力的工作，具有较长的生产周期。现在电子设备上可用的手写字体主要由商业公司的专业字体设计者制作，字库的设计是一个非常耗时的工作，与只包含26个字母的英文字体库不同，常用字符集GB2312由6763个汉字组成，此外由于汉字的结构复杂，形状多样，也增加中文字库的制作难度。而目前，中文字库的制作大多依赖于人工经验和设计，即使由专业的字体设计人员来设计一套完整的字库也需要花费2-3年的时间，自动化程度很低，制作周期长，效率底下。

随着生成对抗网络(GAN)的发展，可以合成更真实和更高质量的字形。然而，整个生成过程是无法控制和不可预测的。在生成的字体中通常包含模糊和重影得伪图像。此外，对于具有复杂结构和或草书手写风格的字符，这些端到端方法通常产生具有不合理笔画或和不正确结构的结果。

发明内容

本发明的目的是提供一种有效减轻人工设计成本和精力，自动化程度高，生成个性化字体匹配程度高的基于特征融合的个性化汉字字体图片生成方法。

本发明解决现有技术问题所采用的技术方案：一种基于特征融合的个性化汉字字体图片生成方法，包括以下步骤：

S1、汉字转化为图片：将GB2312国际码标准字库中每种字体下的汉字以独立图片形式保存至字库图集中，从字库图集中将同种字体下选取预设数量的汉字图片复制为训练汉字图集；字体设计人员对所述训练汉字图集中的每个汉字进行个性化设计，得到个性化字体汉字并将个性化字体汉字分别以独立图片形式保存至训练汉字个性化图集中；并使字库图集和训练汉字个性化图集中每幅图片的大小相同；

S2、模型构建：生成对抗网络模型包括预训练的字体特征提取网络、生成器及判别器；所述预训练的字体特征提取网络是对字体特征提取网络VGG16进行训练,训练时，随机选取字库图集中75％的图片作为训练集，剩余25％的图片作为测试集，并保存训练参数；生成器采用编码器-解码器结构,判别器为卷积神经网络；所述编码器包含5个向下采样层，每层采用一个卷积核为5×5步长为2的卷积层，批量规范化层以及LReLu层构成，所述解码器包含5个向上采样层，每层采用一个卷积核为5×5步长为2的反卷积层，批量规范化层以及ReLu层；

S3、训练模型：在保持预训练的字体特征提取网络的训练参数不变的条件下，利用步骤S1得到的训练汉字图集输入到生成对抗网络模型的编码器中，当生成对抗网络模型损失函数的值最小时训练完成；

S4、生成字体图像集获取：将训练汉字图集分别输入训练完成的生成对抗网络模型及字体特征提取网络中分别得到字体特征编码字体特征向量；将字体特征向量、字体特征编码与字体类别向量组合到一起作为特征组合向量集，所述字体类别向量是一个64维的随机向量；将所述特征组合向量集输入到生成对抗网络模型的解码器中生成具有目标字体风格的图像作为训练生成字体图像集；

S5、汉字类型判别：将所述训练汉字个性化图集与训练生成字体图像集输入到判别器中，并通过判别器的损失函数对训练生成字体图像集中的汉字图像与训练汉字个性化图集中的汉字图像之间的差异进行判别；所述判别器的损失函数中包括对抗损失函数、字体类别损失函数、像素匹配损失函数；若损失函数L未达到最小值，说明训练生成字体图像集与训练汉字个性化图集中的汉字有差异，则重复步骤S3，重新训练模型得到更新的网络参数；

判别器的损失函数L如下：

L＝w_advL_adv+w₁L₁+w_cateL_cate

其中，L_adv为对抗损失函数，表示判别器对于生成字体图像集中的汉字图像与训练汉字个性化图集中的汉字图像之间的判别损失：其中，D(·)是由判别器输出的结果数据，G(z)是由生成器输出的结果数据；pdata表示真实样本分布；pinput表示噪声分布；L₁为像素匹配损失函数；x为训练汉字个性化图集中的汉字图像，Z为噪声；L_cate为字体类别损失函数，w_adv，w₁，w_cate为权重系数；

S6、字体生成：经过步骤S4的判别，若训练汉字个性化图集与训练生成字体图像集的判别结果为无差异，则将字库图集作为输入数据重复步骤S4得到生成字体图像集。

所述训练汉字图集为根据汉字使用频率以及汉字的笔画结构从所述字库图集中人工选取的670个汉字图片。

字库图集和个性化字体汉字图片集中每幅图片的大小均为224*224。

编码器-解码器之间添加连接层，对应层之间进行跳跃连接。

所述判别器采用3个级联的Conv-BN-LReLu网络结构，最后采用两层全连接神经网络。同时鉴别器不单单在最后输出层鉴别图片的真伪，并且在鉴别器的中间层特征也进行鉴别。

本发明的有益效果在于：与现有的技术相比，本发明只需要字体设计者提供670个左右的字体，就能够生成对应汉字的全部个性化汉字字体。该本发明将极大提高汉字字库的制作效率，减轻了字体设计对于人工的依赖，极大的缩短了字库制作的周期，使得字库的生成变得简单方便。而且为多个行业的应用和推广提供了可靠依据。能够丰富电影、电视、广告等数字媒体和文化行业的字体材料，为其多元化设计提供素材。

附图说明

图1是本发明的流程图。

图2是本发明的网络结构。

图3是本发明由宋体生成瑞虎宋体的字体生成效果。

图4是本发明由黑体生成瑞虎宋体的字体生成效果。

图5是本发明由金陵粗宋生成的手写刻印宋体的字体生成效果。

图6是本发明由金陵细宋生成的手写刻印宋体的字体生成效果。

具体实施方式

以下结合附图及具体实施方式对本发明进行说明：

如图1所示，一种基于特征融合的个性化汉字字体图片生成方法，包括以下步骤：

S1、汉字转化为图片：将GB2312国际码标准字库中每种字体下的汉字以独立图片形式保存至字库图集中，从字库图集中将同种字体下选取预设数量的汉字图片复制为训练汉字图集；字体设计人员对所述训练汉字图集中的每个汉字进行个性化设计，得到个性化字体汉字并将个性化字体汉字分别以独立图片形式保存至训练汉字个性化图集中；并使字库图集和训练汉字个性化图集中每幅图片的大小优选缩放为224*224。

经验证，为保证本发明的生成效果，优选训练汉字图集为根据汉字使用频率以及汉字的笔画结构从所述字库图集中人工选取的670个汉字图片(通常选取常见的670个汉字图片)。

S2、模型构建：生成对抗网络模型包括预训练的字体特征提取网络、生成器及判别器(如图2所示)；预训练的字体特征提取网络是对字体特征提取网络VGG16进行训练,训练时，随机选取字库图集中75％的图片作为训练集，剩余25％的图片作为测试集，并保存训练参数，训练时通过对网络参数进行微调使得该网络能够识别不同汉字字体的内容；生成器采用编码器-解码器结构,判别器为卷积神经网络；其中编码器包含5个向下采样层，每层采用一个卷积核为5×5步长为2的卷积层，批量规范化层以及LReLu层构成，其中，解码器包含5个向上采样层，每层采用一个卷积核为5×5步长为2的反卷积层，批量规范化层以及ReLu层；编码器与解码器的对应层进行跳跃连接；判别器采用3个级联的Conv-BN-LReLu网络结构，最后采用两层全连接神经网络。同时鉴别器不单单在最后输出层鉴别图片的真伪，并且在判别器的中间层特征也进行鉴别。

S3、训练生成对抗网络模型：在保持预训练的字体特征提取网络的训练参数不变的条件下，利用步骤S1得到的训练汉字图集输入到生成对抗网络模型的编码器中，当生成对抗网络模型损失函数的值最小时训练完成；该网络模型为一种端到端的神经网络，不需要人工干预，即可对输入端的汉子图片进行个性化生成。

S4、生成字体图像集获取：将训练汉字图集分别输入训练完成的生成对抗网络模型及字体特征提取网络中分别得到字体特征编码及维度为14×14×512的字体特征向量；将字体特征向量、字体特征编码字体类别随机向量组合到一起作为特征组合向量集，具体地，字体类别向量是一个64维的随机向量；将所述特征组合向量集输入到生成对抗网络模型的解码器中生成具有目标字体风格的图像作为训练生成字体图像集；

S5、汉字类型判别：将所述训练汉字个性化图集与训练生成字体图像集输入到判别器中，并通过判别函数对训练生成字体图像集中的汉字图像与训练汉字个性化图集中的汉字图像之间的差异进行判别；为了生成更高质量汉字字体图像，本发明不仅要关心设计师提供的一种类型的字体风格，同时也要考虑其他字体的风格。所以在生成网络的解码器与编码器之间加入随机高斯噪声的类别嵌入，使模型能够同时学习多种字体样式。为了防止模型将样式混合之后生成与提供的标准字体不一样的结果，引入字体类别损失函数，本申请字体字类别损失采用sigmoid交叉熵损失函数L_cate。

最后将3种损失函数组合起来，不同的损失函数具有不同的权重，采用加权求和的方式，因此公式(1)展示的判别器的损失函数中包括对抗损失函数、字体类别损失函数、像素匹配损失函数；若损失函数L未达到最小说明有差异，则重复步骤S3，重新训练模型得到更新的网络参数；

判别函数L如下：

L＝w_advL_adv+w₁L₁+w_cateL_cate (1)

如公式(2)所示，假设输入字体x服从Pdata分布，通过与判别器D的博弈，生成器将噪声Pz生成Pdata,在模型的训练阶段，生成器尝试生成真实的结果去欺骗判别器，而判别器的目标是分辨生成结果与真实结果间的区别。L_adv代表判别器对于生成图像与真实图像之间的判别损失。

S6、个性化汉字生成：经过步骤S4的判别，若训练汉字个性化图集与训练生成字体图像集的判别结果为无差异，则将字库图集作为输入数据重复步骤S4得到生成字体图像集；

S7、构建模型评级体系，评级模型的字体生成质量：

依据中文汉字的结构特征及笔画数量将汉字定义为3种类别：简单、中等、困难，在3个类别中分别随机选择20个生成的字体进行图像质量定量评价：峰值信噪比、结构相似性、笔画完整性，进行模型的评价。最终输出的效果图如图3-6所示。

以上内容是结合具体的优选技术方案对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于特征融合的个性化汉字字体图片生成方法，其特征在于，包括以下步骤：

判别器的损失函数L如下：

L＝w_advL_adv+w₁L₁+w_cateL_cate

2.根据权利要求1所述的一种基于特征融合的个性化汉字字体图片生成方法，其特征在于，所述训练汉字图集为根据汉字使用频率以及汉字的笔画结构从所述字库图集中人工选取的670个汉字图片。

3.根据权利要求1所述的一种基于特征融合的个性化汉字字体图片生成方法，其特征在于，字库图集和个性化字体汉字图片集中每幅图片的大小均为224*224。

4.根据权利要求1所述的一种基于特征融合的个性化汉字字体图片生成方法，其特征在于，编码器-解码器之间添加连接层，对应层之间进行跳跃连接。

5.根据权利要求1所述的一种基于特征融合的个性化汉字字体图片生成方法，其特征在于，所述判别器采用3个级联的Conv-BN-LReLu网络结构，最后采用两层全连接神经网络。同时鉴别器不单单在最后输出层鉴别图片的真伪，并且在鉴别器的中间层特征也进行鉴别。