CN108510569A

CN108510569A - 一种基于多通道的艺术字生成方法及系统

Info

Publication number: CN108510569A
Application number: CN201810078035.5A
Authority: CN
Inventors: 刘家瑛; 杨帅; 连宙辉; 郭宗明
Original assignee: Peking University
Current assignee: Peking University
Priority date: 2018-01-26
Filing date: 2018-01-26
Publication date: 2018-09-07
Anticipated expiration: 2038-01-26
Also published as: CN108510569B

Abstract

本发明提供一种基于多通道的艺术字生成方法及系统，该方法步骤包括：提取源文字图像和目标文字图像的偏移图像；将源文字图像、源文字图像的偏移图像和源艺术字图像按通道合并为多通道源图像立方；初始化目标艺术字图像，将该初始化的目标艺术字图像、目标文字图像、目标文字图像的偏移图像按通道合并为多通道目标图像立方；迭代查找目标图像立方中每个图像块在源图像立方中的相似图像块，并使用相似图像块的艺术字图像通道更新目标图像立方对应的通道，直到收敛或者目标图像立方的更新程度小于一设定阈值；提取目标图像立方的艺术字图像通道，生成目标艺术字图像。

Description

一种基于多通道的艺术字生成方法及系统

技术领域

本发明涉及图像纹理合成技术领域，具体涉及一种基于多通道的艺术字生成方法及系统。

背景技术

随着多媒体技术的发展和人们审美情趣的提升，越来越多的人开始关注视觉信息的美观程度。其中，文字作为日常生活中最重要的部分之一，对其进行美化，生成艺术字，提升其主观视觉质量成为了一个重要的研究热点。

艺术字生成的关键在于对文字进行纹理合成，将色彩丰富的纹理信息添加到目标文字上。一种用于纹理合成的方法是基于样本的纹理复制技术。这类技术使用从源纹理图中复制纹理像素或者纹理块的方式在目标图像中合成新的纹理。但是这些方法忽略了艺术字中纹理的多样性和复杂性，因此其合成结果与源艺术字可能相差较大，变得呆板而单一。另一种用于纹理合成的方法是基于统计的纹理合成技术。这类技术对源纹理图中的纹理进行统计上的建模，将纹理描述为统计数字，然后调整目标纹理图使之具有相同的统计数字。这类技术因为建模的准确性问题，难以精确模仿源纹理的视觉特征，合成结果杂乱并且具有很多瑕疵。

因此本发明在进行纹理合成之前采用了偏移通道的提取，采用偏移通道来对纹理围绕文字的空间位置分布进行描述，通过保证偏移通道的一致性，达到艺术字中纹理在空间分布上的一致性，有效减少了复制纹理块时的歧义性问题，防止不同纹理间的混杂，从而提升了生成的艺术字的视觉质量。

发明内容

针对上述问题，本发明的目的是提出一种基于多通道的艺术字生成方法及系统，使用偏移通道来引导纹理合成工作，使生成的艺术字在局部纹理特征和全局纹理分布上与源艺术字更加一致，具有更准确的结构和细节，生成的艺术字更加自然美观。

为实现上述目的，本发明采用的技术方案如下：

一种基于多通道的艺术字生成方法，步骤包括：

提取源文字图像和目标文字图像的偏移图像；

将源文字图像、源文字图像的偏移图像和源艺术字图像按通道合并为多通道源图像立方；

初始化目标艺术字图像，将该初始化的目标艺术字图像、目标文字图像、目标文字图像的偏移图像按通道合并为多通道目标图像立方；

迭代查找目标图像立方中每个图像块在源图像立方中的相似图像块，并使用相似图像块的艺术字图像通道更新目标图像立方对应的通道，直到收敛或者目标图像立方的更新程度小于一设定阈值5.0，该更新程度是指目标图像立方上一次迭代结果与这一次迭代结果所有像素值之间的均方误差；

提取目标图像立方的艺术字图像通道，生成目标艺术字图像。

上述方法中，先提取源文字图像和目标文字图像的文字骨架，再计算源文字图像和目标文字图像中每个像素到文字骨架的欧式距离，根据和得到源文字图像和目标文字图像的偏移图像，其中O_S和O_T分别表示源文字图像和目标文字图像的偏移图像，S_S和S_T分别表示源文字图像和目标文字图像的文字骨架，像素p位于偏移图像上，像素q表示位于文字骨架上，dist(p,q)表示像素p和像素q的欧式距离。

上述方法中，所述源文字图像、目标文字图像、源艺术字图像、目标艺术字图像为单通道或多通道。

上述方法中，初始化目标艺术字图像是指对目标艺术字图像的各通道的值进行初始化，包括初始化为随机数，全部初始化为0，或者等值初始化为目标文字图像的灰度值。

上述方法中，图像块相似的度量准则如下式：

其中，Ψ_iT表示目标图像立方的图像块Ψ_T的第i个通道；Ψ_iS表示源图像立方的图像块Ψ_S的第i个通道；每个通道是一个m*m(长为m宽为m)的矩阵；λ_i是用来平衡不同通道的权重，根据实际生成的艺术字效果来取值；表示矩阵的Frobenius范数，也可以用其他矩阵相似度如L1范数、L2范数等衡量准则代替。

上述方法中，所述使用相似图像块的艺术字图像通道更新目标图像立方对应的通道，是指使用源图像立方的图像块的艺术字图像通道Ψ_jS的像素值替换目标图像立方的图像块的艺术字图像通道Ψ_jT中对应的像素值，其中j为对应艺术字图像通道的下标索引；对于被多个图像块包含的像素，通过将每个相似的图像块提供的像素值取均值进行替换。

一种基于多通道的艺术字生成系统，包括存储器和处理器，所述存储器存储计算机程序，所述程序被配置为由所述处理器执行，所述程序包括用于执行上述方法中各步骤的指令。

本发明方法在给定一张源文字图像和一张对应的源艺术字图像的样例后，首先提取源文字图像和目标文字图像的文字骨架。然后计算源文字图像和目标文字图像中每个像素点到文字骨架的偏移量，获得偏移图像。将源文字图像、源文字图像的偏移图像和源艺术字图像按通道合并为多通道源图像立方，将目标文字图像、目标文字图像的偏移图像和随机初始化的目标艺术字图像按通道合并为多通道目标图像立方。对目标图像立方中每一个图像块在源图像立方中寻找相似图像块，并用相似图像块更新目标图像立方中目标艺术字图像通道部分的像素。迭代相似图像块寻找和像素更新这两个过程，直到收敛或者目标图像立方的更新程度小于一设定阈值。最终从目标图像立方中提取得到目标文字对应的艺术字图像。

本发明方法可以在纹理合成的过程中，充分利用纹理相对于文字骨架的位置信息，通过综合考虑纹理在偏移通道、文字结构通道和艺术字纹理通道的相似性，使生成的艺术字在局部纹理特征和全局纹理分布上与源艺术字更加一致，具有更准确的结构和细节，既能有效描述纹理在艺术字中的空间分布，又能保持纹理的局部外观，使生成的艺术字更加自然美观，有效提升了目标文字的艺术价值。

附图说明

图1为本实施例的一种基于多通道的艺术字生成方法流程图。

图2为本实施例的一种基于多通道的艺术字生成方法演示图。

图3A至图3C为通过本发明方法生成的艺术字效果对比图。

具体实施方式

为使本发明的上述特征和优点能更明显易懂，下文特举实施例，并配合所附图作详细说明如下。

本实施例提供一种基于多通道的艺术字生成方法，以源文字图像、目标文字图像为单通道，源艺术字图像、目标艺术字图像为R、G、B三通道为例，图1为其流程图，以图2为例，演示利用本方法基于源文字及其艺术字“火”，由目标文字“术”生成目标艺术字“术”的过程，具体步骤如下：

步骤1：对输入的源文字图像T_S，使用形态学骨架提取操作提取其文字骨架S_S，计算Ts中每一个像素到骨架S_S的距离，从而得到源文字图像的偏移图像O_S。具体而言，O_S中像素p处的值的定义为其中像素q位于文字骨架上，dist(p,q)表示像素p和像素q的欧式距离。使用相同的方法，可以得到目标文字图像T_T的偏移图像O_T。

步骤2：将源艺术字图像A_S的三个通道{R_S,G_S,B_S}，单通道的源文字图像T_S，以及单通道的偏移图像O_S，组合成五通道的源图像立方I_S，即I_S＝cat(R_S,G_S,B_S,T_S,O_S)，其中，cat(·,·)表示联合多个通道操作，例如一张长宽分别为H和W的三通道彩色源艺术字图像A_S可以表示为其长宽分别为H和W的R、G、B三通道的联合：A_S＝cat(R_S,G_S,B_S)，是一个长为H，宽为W，通道数为3(简记为H*W*3)的三维矩阵。

步骤3：对目标艺术字图像A_T的三个通道{R_T,G_T,B_T}进行初始化，例如初始化为随机数，或者全部初始化为0，或者使用目标文字图像T_T初始化A_T：R_T＝G_T＝B_T＝T_T等等。使用步骤2的方法，将A_T、T_T、O_T组合成五通道的目标图像立方I_T，即I_T＝cat(R_T,G_T,B_T,T_T,O_T)。

步骤4：对I_T中的每一个图像块Ψ_T，在I_S中找到与之最相似的块Ψ_S。其中图像块Ψ_T表示在I_T中大小为m*m*5的图像块，其中m表示长和宽，5表示通道数。相似图像块Ψ_S的定义类似。块相似的度量准则如式(1)所示：

其中，Ψ_RT、Ψ_GT、Ψ_BT、Ψ_TT、Ψ_OT表示Ψ_T的5个通道，每个通道是一个m*m的矩阵。Ψ_RS、Ψ_GS、Ψ_BS、Ψ_TS、Ψ_OS表示Ψ_S的5个通道，每个通道是一个m*m的矩阵。λ₁、λ₂、λ₃是用来平衡不同通道的权重，通常为λ₁＝1、λ₂＝10、λ₃＝0.01；表示矩阵的Frobenius范数，也可以用其他矩阵相似度例如L1范数，L2范数等衡量准则代替。

步骤5：在步骤4中，为Ψ_T找到了相似图像块Ψ_S，使用Ψ_RS、Ψ_GS、Ψ_BS的像素值替换Ψ_RT、Ψ_GT、Ψ_BT中对应的像素，以更新I_T。对于被多个图像块包含的像素，通过将每个相似图像块提供的像素值取均值进行替换。

步骤6：重复步骤4和步骤5，直到收敛或者I_T的更新程度小于一设定阈值5.0。

步骤7：提取I_T的前三个通道R_T、G_T、B_T，组成目标艺术字图像A_T＝cat(R_T,G_T,B_T)。

根据以上方法可以在纹理合成的过程中，充分利用纹理相对于文字骨架的位置信息，通过综合考虑纹理在偏移通道、文字结构通道和艺术字纹理通道的相似性，使生成的艺术字在局部纹理特征和全局纹理分布上与源艺术字更加一致，具有更准确的结构和细节，有效提升了目标文字的艺术价值。

图3A至图3C为通过本方法生成的目标艺术字，由图可知生成的艺术字效果很理想。

本发明使用的多通道方法，不限制通道个数，不限制艺术字图像为三通道彩色图像，不限制文字图像为单通道灰色图像，依据艺术字图像和文字图像具体的图像格式，可构建包含任意通道个数的图像立方，并提取对应通道个数的图像块。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内，本发明的保护范围应以权利要求书所述为准。

Claims

1.一种基于多通道的艺术字生成方法，步骤包括：

提取源文字图像和目标文字图像的偏移图像；

迭代查找目标图像立方中每个图像块在源图像立方中的相似图像块，并使用相似图像块的艺术字图像通道更新目标图像立方对应的通道，直到收敛或者目标图像立方的更新程度小于一设定阈值；

2.根据权利要求1所述的方法，其特征在于，先提取源文字图像和目标文字图像的文字骨架，再计算源文字图像和目标文字图像中每个像素到文字骨架的欧式距离，根据和得到源文字图像和目标文字图像的偏移图像，其中O_S和O_T分别为源文字图像和目标文字图像的偏移图像，S_S和S_T分别为源文字图像和目标文字图像的文字骨架，像素p位于偏移图像上，像素q位于文字骨架上，dist(p,q)为像素p和像素q的欧式距离。

3.根据权利要求1所述的方法，其特征在于，所述源文字图像、目标文字图像、源艺术字图像、目标艺术字图像为单通道或多通道。

4.根据权利要求1所述的方法，其特征在于，所述初始化目标艺术字图像是指对目标艺术字图像的各通道的值进行初始化，包括初始化为随机数，全部初始化为0，或者等值初始化为目标文字图像的灰度值。

5.根据权利要求1所述的方法，其特征在于，图像块相似程度依据的公式为：

其中，Ψ_iT为目标图像立方的图像块Ψ_T的第i个通道；Ψ_iS为源图像立方的图像块Ψ_S的第i个通道；每个通道为一个长×宽为m*m的矩阵；λ_i为平衡不同通道的权重；为矩阵的Frobenius范数。

6.根据权利要求5所述的方法，其特征在于，还可为矩阵相似度L1范数或L2范数。

7.根据权利要求1所述的方法，其特征在于，所述使用相似图像块的艺术字图像通道更新目标图像立方对应的通道，是指使用源图像立方的图像块的艺术字图像通道Ψ_jS的像素值替换目标图像立方的图像块的艺术字图像通道Ψ_jT中对应的像素值，其中，j为对应艺术字图像通道的下标索引。

8.根据权利要求7所述的方法，其特征在于，对于被多个图像块包含的像素，通过将每个相似的图像块提供的像素值取均值进行替换。

9.根据权利要求1所述的方法，其特征在于，所述阈值取5.0。

10.一种基于多通道的艺术字生成系统，包括存储器和处理器，所述存储器存储计算机程序，所述程序被配置为由所述处理器执行，所述程序包括用于执行上述权利要求1-9任一所述方法中各步骤的指令。