CN105335746B

CN105335746B - 一种基于shear变换和引导滤波器的书法字提取方法

Info

Publication number: CN105335746B
Application number: CN201510418664.4A
Authority: CN
Inventors: 许鹏飞; 章勇勤; 马嘉琳; 王磊; 汤战勇; 陈晓璇; 郭军; 肖云
Original assignee: Northwest University
Current assignee: Northwest University
Priority date: 2015-07-16
Filing date: 2015-07-16
Publication date: 2018-07-20
Anticipated expiration: 2035-07-16
Also published as: CN105335746A

Abstract

本发明公开了一种基于shear变换和引导滤波器的书法字提取方法，属于图像处理领域。所述发明包括将书法作品进行色彩空间转换并提取第一通道，并且将书法作品的二值化图像作为形质模板，接着分别对第一通道和形质模板进行shear变换得到第一图像集合和第二图像集合，将二者在引导滤波器中进行处理，并对处理结果进行逆shear变换，最终将变换结果进行融合得到融合后图像。本发明通过使用了引导滤波器和shear变换，使得得到的结果带有更多方向上的细节，以便更好地提取书法作品中汉字的形质和神采信息，提高了汉字信息提取的准确性，并结合融合处理将不同方向上提取的书法字的信息进行相互补充，保证了图像中汉字神采信息的完整性，弥补了现有技术中存在缺陷。

Description

一种基于shear变换和引导滤波器的书法字提取方法

技术领域

本发明属于图像处理领域，特别涉及一种基于shear变换和引导滤波器的书法字提取方法。

背景技术

在中国书法艺术研究和历史文化遗产保护领域中，为能够从中国古代书法作品中更完整、更准确地提取汉字的形质和神采信息而采用图像预处理和图像分割的方法。目前对汉字信息的提取方法主要是采用将图像去噪、边缘检测和图像分割等相结合的方法以对汉字的形质信息进行提取。

北京大学拥有的专利“一种图片文字检测的方法”(公开号：CN101122952，授权日：2008年2月13日，申请日：2007年9月21日)中公开了一种图片文字检测的方法。该方法首先合并原图在各个颜色分量上的边缘图，得到累积边缘图；然后把累积边缘图中的边缘点置为其在原图中的相应颜色，根据边缘点颜色的不同，用聚类的方法把累积边缘图分解成若干张子边缘图；最后在每张子边缘图中，多次进行水平和垂直投影，根据投影图进行垂直方向和水平方向的区域分割，定位图片中的文字区域。

Xiaoqing Lu等人在文献“Xiaoqing Lu,Zhi Tang,Yan Liu,Liangcai Gao，TingWang,Zhipeng Wang.‘Stroke-based Character Segmentation of Low-quality Imageson Ancient Chinese Tablet’[C],201312th International Conference on DocumentAnalysis and Recognition”中提出了一种基于Stroke的低质量古代碑图像中汉字提取方法。该方法的具体步骤包括：(1)对原始碑图像进行去噪预处理；(2)对去噪后的图像应用基于映射的分割方法得到初始分割结果；(3)利用自适应Otsu方法设置最小强度阈值，以获得Stroke滤波掩模，并使用该掩模对去噪后图像进行滤波处理，以得到Stroke的强度信息；(4)结合步骤2中得到的分割结果和步骤3中得到的滤波掩模以选择具有较高Stroke强度的连同成分作为初始种子；(5)基于种子窗口内的引导信息，使用一个迭代的过程，以提取碑图像中含有的汉字信息；(6)迭代结束后，得到的分割结果即为提取的汉字信息。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：

上述两种方法在实现过程中均主要关注文字的形质信息，而没有考虑文字的神采信息，从而导致检测的文字信息不够完整，给后期书法作品的研究工作带来不利影响。

发明内容

为了解决现有技术的问题，本发明提供了一种基于shear变换和引导滤波器的书法字提取方法，所述基于shear变换和引导滤波器的书法字提取方法，包括：

获取待处理书法作品，将所述待处理书法作品的色彩空间转换至预设色彩空间，提取转换后的所述待处理书法作品中的第一通道；

将所述转换后的待处理书法作品进行二值化处理，得到二值化图像，将所述二值化图像作为形质模板；

将所述第一通道进行shear变换，得到变换后的第一图像集合，将所述形质模板进行所述shear变换，得到变换后的第二图像集合；

结合所述第一图像集合，将所述第二图像集合在预设的引导滤波器中进行处理，得到处理结果，对所述处理结果进行逆shear变换，得到变换图像集合，对所述变换图像集合进行融合处理，得到融合后图像。

可选的，所述将所述转换后的待处理书法作品进行二值化处理，得到二值化图像，将所述二值化图像作为形质模板，包括：

将所述转换后的待处理书法作品从彩色图像转换为灰度图像，获取所述灰度图像中每个像素的像素值；

确定预设阈值，获取所述像素值中大于所述预设阈值的像素的第一像素平均值和所占的第一比例，以及所述像素值中不大于所述预设阈值的像素的第二平均值和所占的第二比例；

遍历所述预设阈值的取值，获取遍历过程中所述灰度图像中目标区域与背景区域的差值，当所述差值最大时，将所述预设阈值的取值作为二值化区分阈值；

根据所述二值化区分阈值对所述灰度图像进行二值化处理，得到二值化图像，将所述二值化图像作为形质模板。

可选的，所述将所述第一通道进行shear变换，得到变换后的第一图像集合，将所述形质模板进行所述shear变换，得到变换后的第二图像集合，包括：

建立shear矩阵s0；

对所述shear矩阵中的参数进行替换，得到替换shear矩阵A_sh；

根据所述第一通道，结合所述矩阵A_sh进行shear变换，得到变换后的图像L_sh，以及由所述变换后的图像L_sh构成的第一图像集合；

根据所述形质模板，结合所述矩阵A_sh进行shear变换，得到变换后的图像C_sh，以及由所述变换后的图像C_sh构成的第二图像集合。

可选的，所述结合所述第一图像集合，将所述第二图像集合在预设的引导滤波器中进行处理，得到处理结果，对所述处理结果进行逆shear变换，得到变换图像集合，对所述变换图像集合进行融合处理，得到融合后图像，包括：

构建引导滤波器，所述引导滤波器中使用的线性变换公式(1)为

其中，I_o(x,y)是滤波输出图像中坐标位置为(x,y)处的像素值，a_k和b_k是线性系数，I_g(x,y)是引导图像中坐标位置为(x,y)处的像素值，ω_k是以像素点(x,y)为中心,半径为r的一个局部窗口。

将所述第一图像集合作为引导图像，将所述第二图像集合作为输入图像，在所述引导滤波器中通过所述线性变换公式进行处理，得到处理结果；

建立逆shear矩阵s′₀，将逆shear矩阵中的参数进行替换，得到替换逆shear矩阵A_sh′，结合所述矩阵A_sh′进行逆shear变换，得到变换后的图像R'_sh，以及由所述变换后的图像R'_sh构成的变换图像集合；

将所述变换图像集合进行融合处理，得到融合后图像。

本发明提供的技术方案带来的有益效果是：

通过使用了引导滤波器和shear变换，使得得到的结果带有更多方向上的细节，以便更好地提取书法作品中汉字的形质和神采信息，提高了汉字信息提取的准确性，并结合融合处理将不同方向上提取的书法字的信息进行相互补充，保证了图像中汉字神采信息的完整性，弥补了现有技术中存在缺陷。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的一种基于shear变换和引导滤波器的书法字提取方法的流程示意图；

图2(a)是本发明提供的灰度图像中的第一通道的示意图；

图2(b)是本发明提供的形质模板的示意图；

图3(a)是本发明提供的第一通道在第一方向上的进行shear变换后的示意图；

图3(b)是本发明提供的第一通道在第二方向上的进行shear变换后的示意图；

图3(c)是本发明提供的第一通道在第三方向上的进行shear变换后的示意图；

图4(a)是本发明提供的形质模板在第一方向上的进行shear变换后的示意图；

图4(b)是本发明提供的形质模板在第二方向上的进行shear变换后的示意图；

图4(c)是本发明提供的形质模板在第三方向上的进行shear变换后的示意图；

图5(a)是本发明提供的在第一方向上进行引导滤波后的结果示意图；

图5(b)是本发明提供的在第二方向上进行引导滤波后的结果示意图；

图5(c)是本发明提供的在第三方向上进行引导滤波后的结果示意图；

图6(a)是本发明提供的第一方向上进行逆shear变换后的结果示意图；

图6(b)是本发明提供的第二方向上进行逆shear变换后的结果示意图；

图6(c)是本发明提供的第三方向上进行逆shear变换后的结果示意图；

图7是本发明提供的图像融合后的示意图；

图8(a)是本发明提供的相对于第一原始图像，OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图；

图8(b)是本发明提供的相对于第一原始图像的局部放大图像，OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图；

图9(a)是本发明提供的相对于第二原始图像，OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图；

图9(b)是本发明提供的相对于第二原始图像的局部放大图像，OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图；

图10(a)是本发明提供的相对于第三原始图像，OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图；

图10(b)是本发明提供的相对于第三原始图像的局部放大图像，OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图。

具体实施方式

为使本发明的结构和优点更加清楚，下面将结合附图对本发明的结构作进一步地描述。

实施例一

本发明提供了本发明提供了一种基于shear变换和引导滤波器的书法字提取方法，所述基于shear变换和引导滤波器的书法字提取方法，如图1所示，包括：

11、获取待处理书法作品，将所述待处理书法作品的色彩空间转换至预设色彩空间，提取转换后的所述待处理书法作品中的第一通道；

12、将所述转换后的待处理书法作品进行二值化处理，得到二值化图像，将所述二值化图像作为形质模板；

13、将所述第一通道进行shear变换，得到变换后的第一图像集合，将所述形质模板进行所述shear变换，得到变换后的第二图像集合；

14、结合所述第一图像集合，将所述第二图像集合在预设的引导滤波器中进行处理，得到处理结果，对所述处理结果进行逆shear变换，得到变换图像集合，对所述变换图像集合进行融合处理，得到融合后图像。

在实施中，为了解决现有技术中存在的对书法作品中的文字进行提取时，往往仅能提取到文字的在起承转合处的笔划信息等形质信息，不能提取到文字的字体的颜色以及印章等神采信息，这样会导致采集到的文字信息不够完整，给后期书法作品的研究工作带来不利影响。为了解决上述问题，本发明提供了一种基于shear变换和引导滤波器的书法字提取方法，该方法具体包括：

首先，将待处理书法作品进行色彩空间的转换，这里涉及到的色彩空间的转换，其实是从常用的色彩空间RGB转换至预设色彩空间CIE-Lab，CIE L*a*b*(CIE-LAB)是惯常用来描述人眼可见的所有颜色的最完备的色彩模型。它是为这个特殊目的而由国际照明委员会(Commission Internationale dEclairage，CIE)提出的。三个基本坐标表示颜色的亮度(L*,L*＝0生成黑色而L*＝100指示白色)，它在红色/品红色和绿色之间的位置(a*负值指示绿色而正值指示品红)和它在黄色和蓝色之间的位置(b*负值指示蓝色而正值指示黄色)。这里之所以使用Lab色彩空间替换原有的RGB色彩空间，是因为Lab色彩空间具有更高的色彩饱和度，有利于图像的后期处理。在进行色彩空间转换后，提取第一通道，这里即为L通道数值。

其次，将转换后的待处理书法作品进行二值化处理，将处理后的二值化图像作为形质模板，以便后续步骤使用。

再次，将之前提取到的第一通道即L通道数值进行shear变换，具体的进行三个方向上的shear变换，得到与每个方向对应的图像，这些图像构成第一图像集合，将前一步得到的形质模板同样进行三个方向上的shear变换，得到与每个方向对应的图像，这些图像构成第二图像集合。

最后，将第一图像集合与第二图像集合在引导滤波器中进行预设的线性变换，得到变换后的处理结果，并且对得到的处理结果进行与前面shear变换相逆的逆shear变换，得到变换图像集合，进而对变换图像集合进行融合处理，得到带有更加完整的字体的形质和神采信息的融合后图像。

本发明提供了一种基于shear变换和引导滤波器的书法字提取方法，包括将待处理书法作品进行色彩空间转换并提取第一通道，并且将书法作品的二值化图像作为形质模板，接着分别对第一通道和形质模板进行shear变换得到第一图像集合和第二图像集合，将二者在引导滤波器中进行处理，并对处理结果进行逆shear变换，最终将变换结果进行融合得到带有形质和神采信息的融合后图像。通过使用了引导滤波器和shear变换，使得得到的结果带有更多方向上的细节，以便更好地提取书法作品中汉字的形质和神采信息，提高了汉字信息提取的准确性，并结合融合处理将不同方向上提取的书法字的信息进行相互补充，保证了图像中汉字神采信息的完整性，弥补了现有技术中存在缺陷。

可选的，将所述转换后的待处理书法作品进行二值化处理，得到二值化图像，将所述二值化图像作为形质模板，包括：

在实施中，通过如下公式将彩色的待处理书法作品书法图像转换为灰度图像，

G＝0.233r+0.587g+0.114b

接着，再使用以下公式计算图像G的平均像素值；

其中，u表示G的平均像素值，f(x,y)表示图像中坐标为(x,y)处像素的像素值，M和N分别表示图像的长度和宽度。

假设对待处理书法图像转换后的灰度图像进行二值化处理的预设阈值为T，则统计G中像素值大于T的像素占图像的第一比例w₁以及G中像素值不大于T的像素占图像的第二比例w₂，并计算G中像素值大于T的像素的第一像素平均值u₁以及G中像素值小于等于T的像素的第二像素值平均u₂；

其中，W₁和W₂分别表示G中像素值大于T的像素数和像素值不大于T的像素数， i表示图像中像素的像素值，n(i)表示像素值等于i的像素数。

为了确定进行二值化处理的最佳阈值，需要遍历阈值Q的每一种可能的取值，使用以下公式计算类间差异值

D＝w₁×(u₁-u)×(u₁-u)+w₂×(u₂-u)×(u₂-u)

其中，D表示二值化处理过程中目标部分和背景部分两类之间的差异值，当D达到最大时，即可得到二值化的最佳阈值Q，然后再使用下式对书法图像进行二值化处理。

通过上述步骤，能够将待处理的书法作品转换为更有利于后续处理的二值化图像。

建立shear矩阵s0；

对所述shear矩阵中的参数进行替换，得到替换shear矩阵A_sh；

在实施中，shear变换的具体步骤如下：

步骤一、图像的Shear变换可以通过Shear矩阵来实现。

则Shear变换可定义为：

L_sh＝S(L,A_sh)＝A_sh*L

L′＝{L_sh|sh∈[-1,1]}

其中，S(·)表示Shear变换操作，L为图像的L通道图像，L_sh是Shear变换后的图像，L'是Shear变换后图像的集合{L_-1,L₀,L₁}。使用Shear矩阵对第一通道进行shear变换，变换后图像L_sh中位置为(x',y')处的像素值L_sh(x',y')可以通过下面两个公式得到。

L_sh(x',y')＝L(x,y)

其中，(x',y')为变换后图像中某个像素的坐标信息，(x,y)为变换前图像中某个像素的坐标信息，L(x,y)表示在shear变换前图像中坐标为(x,y)处的像素值，Lsh(x',y')表示图像L(x,y)在shear变换后的第sh个图像中坐标为(x',y')处的像素值。而在整个Shear变换过程中，图像中各对应像素的值保持不变。

经过以上shear变换，可获得第一通道在3个方向上的shear变换后的第一图像集合L_sh＝{L_-1,L₀,L₁}。

通过上述步骤，分别完成了对第一通道以及形质模板的shear变换，从而便于进行下一步在引导滤波器中的处理。

将所述变换图像集合进行融合处理，得到融合后图像。

在实施中，构建的引导滤波器就是对引导图像的一个线性变换，即通过如下线性变换公式进行：

为了使输入图像和输出图像之间的差异最小，即需要在窗口ω_k中使以下的函数达到最小化：

E＝∑((I_o(x,y)-I(x,y))²+εa_k ²)

＝∑((a_kI_g(x,y)+b_k-I(x,y))²+εa_k ²)

其中，I(x,y)是输入图像中坐标位置为(x,y)处的像素值，E是I_o(x,y)和I(x,y)之间的差异值，ε是一个防止a_k的值过大的正则化参数。当E达到最小时a_k和b_k分别为：

其中，σ_k ²和μ_k分别为在窗口ω_k内I_g(x,y)的均值和方差，为I(x,y)在窗口ω_k内的均值，|ω|是窗口ω_k内像素点的个数。

值得注意的是，由于一个像素可能被多个窗口所覆盖，因此，可以根据计算得到的参数a_k和b_k，通过以下公式计算得到滤波输出I_o(x,y)。

其中，和是覆盖像素(x,y)的所有窗口系数的均值。

因此，分别以形质模板C经过shear变换后得到的C_sh＝{C_-1,C₀,C₁}作为引导滤波器的输入图像，对应的，以第一通道经过shear变换后得到的L_sh＝{L_-1,L₀,L₁}作为引导滤波器的引导图像，使用引导滤波器可得到对应的滤波结果R_sh＝{R_-1,R₀,R₁}，这些滤波结果即为在待处理书法作品图像不同shear变换方向上利用引导滤波器提取获得的书法字的形质和神采信息。

为了得到更好的处理结果，还需要分别对引导滤波的结果R_sh使用对应的逆shear矩阵在3个方向上进行逆shear变换，得到变换图像R′_sh(sh＝-1,0,1)。

则逆Shear变换可定义为：

R'_sh＝S′(R_sh,A′_sh)＝A′_sh*R_sh

R'＝{R_sh′|sh＝[-1,1]}

其中，S′(·)表示逆Shear变换操作，R_sh为逆shear变换前图像，R'_sh是R_sh经过逆Shear变换后的图像，R'是逆Shear变换后图像的集合。若使用逆Shear矩阵A_sh′对图像进行逆Shear变换，变换后图像中位置为(x″,y″)处的像素值R'_sh(x″,y″)可以通过下面两个公式得到。

R′_sh(x″,y″)＝R_sh(x′,y′)

其中，R′_sh(x″,y″)表示逆shear变换后的图像集的第sh个图像中坐标位置为(x″,y″)处的像素值，R_sh(x′,y′)表示变换前图像中坐标位置为(x′,y′)处的像素值。在整个逆Shear变换过程中，图像中各对应像素的值保持不变。

在经过逆shear变换后，可以得到一个由逆shear变换后的变换图像集合R′＝{R′_sh|sh＝-1,0,1}。

由于不同方向上的引导滤波结果包含不同的细节信息，因此对前一步得到的变换图像集合R′＝{R′_sh|sh＝-1,0,1}，利用如下公式进行图像融合可以得到更加完整的字体的形质和神采。即：

f(x,y)＝min(R′_sh(x,y)),sh＝-1,0,1

其中R′_sh(x,y)是逆shear变换后图像R′_sh在坐标(x,y)处的像素值，f(x,y)是图像融合结果在坐标(x,y)处的像素值，min(·)是取最小操作。则f(x,y)为最终提取获得含有书法作品中汉字形质和神采信息的图像。

这里使用了图像融合技术，可以很好的解决了传统方法提取书法作品中汉字的神采信息不完整的问题，能够很好地将不同方向上提取的书法字的信息进行相互补充，以提高了图像中汉字神采信息的完整性。

本发明的效果可以通过以下仿真进一步说明。

仿真1，对本发明中书法图像中汉字形质和神采信息提取方法的仿真。

仿真1的仿真条件是在MATLAB R2013a软件下进行，引导滤波的参数ε＝0.1¹⁰，r＝4。

参照图2至图7，对书法图像黄庭坚的《松风阁诗》局部进行仿真实验。在书法图像保存较为完好，“文房四宝”的印记显而易见，如图2(a)所示。形质模板中包含了汉字的主要形质信息，如图2(b)所示。首先利用shear变换矩阵对书法作品图像的L通道及其形质模板进行shear变换，可得到多个方向上的变换后图像，如图3和图4所示；然后分别以书法作品图像L通道经过shear变换后的图像作为引导滤波器的引导图像，以形质模板经过shear变换后的图像作为引导滤波器的输入图像，进而进行引导滤波处理，即可获得不同方向上书法字的形质和神采信息；最后对滤波结果进行逆shear变换，并变换后结果进行图像融合处理，即可得到更为完整的书法字的形质和神采信息。这些信息能够真实反映笔墨浓度变化和笔锋的走势。在结果图像中，书法家在书写汉字时笔画的虚实以及笔锋的突变和渐变都能够较好地展示。

仿真2，对本发明方法和现有的贴图像中汉字信息提取方法进行对比分析的仿真。

仿真2的仿真条件是在MATLAB R2013a软件下进行。引导滤波器的参数ε＝0.1¹⁰和r＝4。本发明方法主要与Otsu,Fast Fuzzy C-means(FFCM)以及Multi Channels andGuided Filters(MCGF)进行对比分析，以证明出本发明方法在书法作品中对汉字的神采信息的提取方面具有显著优势。实验结果的对比与分析描述如下：

参照图8，图9和图10，对于书法图像，应当同时考虑汉字的形质信息和神采信息的提取。首先，对于汉字的形质信息提取方面，所有的方法都比较准确的提取书法图像中汉字的形质信息。但是本发明方法提取结果形质信息更加完整，如图8和图9中所示。在汉字的神采信息的提取中，对于飞白中牵丝区域，Otsu，FFCM和MCGF提取结果已经完全损失或只有小部分保留，如图8和图10所示。对于枯笔所写笔画，提取难度很大，OTSU，FFCM和MCGF损失大部分信息，如图8和图9所示。然而与之形成对比的是，本发明方法在形质信息和神采信息的提取方面具有较高的准确性，无论对于飞白区域还是枯笔笔画都能保留绝大多数信息，真实的反映毛笔雄浑的力度和飘逸的笔法。

需要说明的是：上述实施例提供的固定装置进行胶液涂覆的实施例，仅作为该固定装置中在实际应用中的说明，还可以根据实际需要而将上述固定装置在其他应用场景中使用，其具体实现过程类似于上述实施例，这里不再赘述。

上述实施例中的各个序号仅仅为了描述，不代表各部件的组装或使用过程中得先后顺序。

以上所述仅为本发明的实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于shear变换和引导滤波器的书法字提取方法，其特征在于，所述基于shear变换和引导滤波器的书法字提取方法，包括：

结合所述第一图像集合，将所述第二图像集合在预设的引导滤波器中进行处理，得到处理结果，对所述处理结果进行逆shear变换，得到变换图像集合，对所述变换图像集合进行融合处理，得到融合后图像，包括：

其中，I_o(x,y)是滤波输出图像中坐标位置为(x,y)处的像素值，a_k和b_k是线性系数，I_g(x,y)是引导图像中坐标位置为(x,y)处的像素值，ω_k是以像素点(x,y)为中心,半径为r的一个局部窗口；

将所述变换图像集合进行融合处理，得到融合后图像。

2.根据权利要求1所述的基于shear变换和引导滤波器的书法字提取方法，其特征在于，所述将所述转换后的待处理书法作品进行二值化处理，得到二值化图像，将所述二值化图像作为形质模板，包括：

3.根据权利要求1所述的基于shear变换和引导滤波器的书法字提取方法，其特征在于，所述将所述第一通道进行shear变换，得到变换后的第一图像集合，将所述形质模板进行所述shear变换，得到变换后的第二图像集合，包括：

建立shear矩阵s₀；

对所述shear矩阵中的参数进行替换，得到替换shear矩阵A_sh；