CN105335746A - 一种基于shear变换和引导滤波器的书法字提取方法 - Google Patents

一种基于shear变换和引导滤波器的书法字提取方法 Download PDF

Info

Publication number
CN105335746A
CN105335746A CN201510418664.4A CN201510418664A CN105335746A CN 105335746 A CN105335746 A CN 105335746A CN 201510418664 A CN201510418664 A CN 201510418664A CN 105335746 A CN105335746 A CN 105335746A
Authority
CN
China
Prior art keywords
image
shear
calligraphy
transformed
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510418664.4A
Other languages
English (en)
Other versions
CN105335746B (zh
Inventor
许鹏飞
章勇勤
马嘉琳
王磊
汤战勇
陈晓璇
郭军
肖云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest University
Original Assignee
Northwest University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest University filed Critical Northwest University
Priority to CN201510418664.4A priority Critical patent/CN105335746B/zh
Publication of CN105335746A publication Critical patent/CN105335746A/zh
Application granted granted Critical
Publication of CN105335746B publication Critical patent/CN105335746B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/02Affine transformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于shear变换和引导滤波器的书法字提取方法,属于图像处理领域。所述发明包括将书法作品进行色彩空间转换并提取第一通道,并且将书法作品的二值化图像作为形质模板,接着分别对第一通道和形质模板进行shear变换得到第一图像集合和第二图像集合,将二者在引导滤波器中进行处理,并对处理结果进行逆shear变换,最终将变换结果进行融合得到融合后图像。本发明通过使用了引导滤波器和shear变换,使得得到的结果带有更多方向上的细节,以便更好地提取书法作品中汉字的形质和神采信息,提高了汉字信息提取的准确性,并结合融合处理将不同方向上提取的书法字的信息进行相互补充,保证了图像中汉字神采信息的完整性,弥补了现有技术中存在缺陷。

Description

一种基于shear变换和引导滤波器的书法字提取方法
技术领域
本发明属于图像处理领域,特别涉及一种基于shear变换和引导滤波器的书法字提取方法。
背景技术
在中国书法艺术研究和历史文化遗产保护领域中,为能够从中国古代书法作品中更完整、更准确地提取汉字的形质和神采信息而采用图像预处理和图像分割的方法。目前对汉字信息的提取方法主要是采用将图像去噪、边缘检测和图像分割等相结合的方法以对汉字的形质信息进行提取。
北京大学拥有的专利“一种图片文字检测的方法”(公开号:CN101122952,授权日:2008年2月13日,申请日:2007年9月21日)中公开了一种图片文字检测的方法。该方法首先合并原图在各个颜色分量上的边缘图,得到累积边缘图;然后把累积边缘图中的边缘点置为其在原图中的相应颜色,根据边缘点颜色的不同,用聚类的方法把累积边缘图分解成若干张子边缘图;最后在每张子边缘图中,多次进行水平和垂直投影,根据投影图进行垂直方向和水平方向的区域分割,定位图片中的文字区域。
XiaoqingLu等人在文献“XiaoqingLu,ZhiTang,YanLiu,LiangcaiGao,TingWang,ZhipengWang.‘Stroke-basedCharacterSegmentationofLow-qualityImagesonAncientChineseTablet’[C],201312thInternationalConferenceonDocumentAnalysisandRecognition”中提出了一种基于Stroke的低质量古代碑图像中汉字提取方法。该方法的具体步骤包括:(1)对原始碑图像进行去噪预处理;(2)对去噪后的图像应用基于映射的分割方法得到初始分割结果;(3)利用自适应Otsu方法设置最小强度阈值,以获得Stroke滤波掩模,并使用该掩模对去噪后图像进行滤波处理,以得到Stroke的强度信息;(4)结合步骤2中得到的分割结果和步骤3中得到的滤波掩模以选择具有较高Stroke强度的连同成分作为初始种子;(5)基于种子窗口内的引导信息,使用一个迭代的过程,以提取碑图像中含有的汉字信息;(6)迭代结束后,得到的分割结果即为提取的汉字信息。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
上述两种方法在实现过程中均主要关注文字的形质信息,而没有考虑文字的神采信息,从而导致检测的文字信息不够完整,给后期书法作品的研究工作带来不利影响。
发明内容
为了解决现有技术的问题,本发明提供了一种基于shear变换和引导滤波器的书法字提取方法,所述基于shear变换和引导滤波器的书法字提取方法,包括:
获取待处理书法作品,将所述待处理书法作品的色彩空间转换至预设色彩空间,提取转换后的所述待处理书法作品中的第一通道;
将所述转换后的待处理书法作品进行二值化处理,得到二值化图像,将所述二值化图像作为形质模板;
将所述第一通道进行shear变换,得到变换后的第一图像集合,将所述形质模板进行所述shear变换,得到变换后的第二图像集合;
结合所述第一图像集合,将所述第二图像集合在预设的引导滤波器中进行处理,得到处理结果,对所述处理结果进行逆shear变换,得到变换图像集合,对所述变换图像集合进行融合处理,得到融合后图像。
可选的,所述将所述转换后的待处理书法作品进行二值化处理,得到二值化图像,将所述二值化图像作为形质模板,包括:
将所述转换后的待处理书法作品从彩色图像转换为灰度图像,获取所述灰度图像中每个像素的像素值;
确定预设阈值,获取所述像素值中大于所述预设阈值的像素的第一像素平均值和所占的第一比例,以及所述像素值中不大于所述预设阈值的像素的第二平均值和所占的第二比例;
遍历所述预设阈值的取值,获取遍历过程中所述灰度图像中目标区域与背景区域的差值,当所述差值最大时,将所述预设阈值的取值作为二值化区分阈值;
根据所述二值化区分阈值对所述灰度图像进行二值化处理,得到二值化图像,将所述二值化图像作为形质模板。
可选的,所述将所述第一通道进行shear变换,得到变换后的第一图像集合,将所述形质模板进行所述shear变换,得到变换后的第二图像集合,包括:
建立shear矩阵s0;
对所述shear矩阵中的参数进行替换,得到替换shear矩阵Ash
根据所述第一通道,结合所述矩阵Ash进行shear变换,得到变换后的图像Lsh,以及由所述变换后的图像Lsh构成的第一图像集合;
根据所述形质模板,结合所述矩阵Ash进行shear变换,得到变换后的图像Csh,以及由所述变换后的图像Csh构成的第二图像集合。
可选的,所述结合所述第一图像集合,将所述第二图像集合在预设的引导滤波器中进行处理,得到处理结果,对所述处理结果进行逆shear变换,得到变换图像集合,对所述变换图像集合进行融合处理,得到融合后图像,包括:
构建引导滤波器,所述引导滤波器中使用的线性变换公式(1)为
I o ( x , y ) = a k I g ( x , y ) + b k , ∀ ( x , y ) ∈ ω k , - - - ( 1 )
其中,Io(x,y)是滤波输出图像中坐标位置为(x,y)处的像素值,ak和bk是线性系数,Ig(x,y)是引导图像中坐标位置为(x,y)处的像素值,ωk是以像素点(x,y)为中心,半径为r的一个局部窗口。
将所述第一图像集合作为引导图像,将所述第二图像集合作为输入图像,在所述引导滤波器中通过所述线性变换公式进行处理,得到处理结果;
建立逆shear矩阵s′0,将逆shear矩阵中的参数进行替换,得到替换逆shear矩阵Ash′,结合所述矩阵Ash′进行逆shear变换,得到变换后的图像R'sh,以及由所述变换后的图像R'sh构成的变换图像集合;
将所述变换图像集合进行融合处理,得到融合后图像。
本发明提供的技术方案带来的有益效果是:
通过使用了引导滤波器和shear变换,使得得到的结果带有更多方向上的细节,以便更好地提取书法作品中汉字的形质和神采信息,提高了汉字信息提取的准确性,并结合融合处理将不同方向上提取的书法字的信息进行相互补充,保证了图像中汉字神采信息的完整性,弥补了现有技术中存在缺陷。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种基于shear变换和引导滤波器的书法字提取方法的流程示意图;
图2(a)是本发明提供的灰度图像中的第一通道的示意图;
图2(b)是本发明提供的形质模板的示意图;
图3(a)是本发明提供的第一通道在第一方向上的进行shear变换后的示意图;
图3(b)是本发明提供的第一通道在第二方向上的进行shear变换后的示意图;
图3(c)是本发明提供的第一通道在第三方向上的进行shear变换后的示意图;
图4(a)是本发明提供的形质模板在第一方向上的进行shear变换后的示意图;
图4(b)是本发明提供的形质模板在第二方向上的进行shear变换后的示意图;
图4(c)是本发明提供的形质模板在第三方向上的进行shear变换后的示意图;
图5(a)是本发明提供的在第一方向上进行引导滤波后的结果示意图;
图5(b)是本发明提供的在第二方向上进行引导滤波后的结果示意图;
图5(c)是本发明提供的在第三方向上进行引导滤波后的结果示意图;
图6(a)是本发明提供的第一方向上进行逆shear变换后的结果示意图;
图6(b)是本发明提供的第二方向上进行逆shear变换后的结果示意图;
图6(c)是本发明提供的第三方向上进行逆shear变换后的结果示意图;
图7是本发明提供的图像融合后的示意图;
图8(a)是本发明提供的相对于第一原始图像,OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图;
图8(b)是本发明提供的相对于第一原始图像的局部放大图像,OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图;
图9(a)是本发明提供的相对于第二原始图像,OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图;
图9(b)是本发明提供的相对于第二原始图像的局部放大图像,OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图;
图10(a)是本发明提供的相对于第三原始图像,OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图;
图10(b)是本发明提供的相对于第三原始图像的局部放大图像,OTSU、FFCM、MCGF以及本发明采用的图像处理的结果对比示意图。
具体实施方式
为使本发明的结构和优点更加清楚,下面将结合附图对本发明的结构作进一步地描述。
实施例一
本发明提供了本发明提供了一种基于shear变换和引导滤波器的书法字提取方法,所述基于shear变换和引导滤波器的书法字提取方法,如图1所示,包括:
11、获取待处理书法作品,将所述待处理书法作品的色彩空间转换至预设色彩空间,提取转换后的所述待处理书法作品中的第一通道;
12、将所述转换后的待处理书法作品进行二值化处理,得到二值化图像,将所述二值化图像作为形质模板;
13、将所述第一通道进行shear变换,得到变换后的第一图像集合,将所述形质模板进行所述shear变换,得到变换后的第二图像集合;
14、结合所述第一图像集合,将所述第二图像集合在预设的引导滤波器中进行处理,得到处理结果,对所述处理结果进行逆shear变换,得到变换图像集合,对所述变换图像集合进行融合处理,得到融合后图像。
在实施中,为了解决现有技术中存在的对书法作品中的文字进行提取时,往往仅能提取到文字的在起承转合处的笔划信息等形质信息,不能提取到文字的字体的颜色以及印章等神采信息,这样会导致采集到的文字信息不够完整,给后期书法作品的研究工作带来不利影响。为了解决上述问题,本发明提供了一种基于shear变换和引导滤波器的书法字提取方法,该方法具体包括:
首先,将待处理书法作品进行色彩空间的转换,这里涉及到的色彩空间的转换,其实是从常用的色彩空间RGB转换至预设色彩空间CIE-Lab,CIEL*a*b*(CIE-LAB)是惯常用来描述人眼可见的所有颜色的最完备的色彩模型。它是为这个特殊目的而由国际照明委员会(CommissionInternationaledEclairage,CIE)提出的。三个基本坐标表示颜色的亮度(L*,L*=0生成黑色而L*=100指示白色),它在红色/品红色和绿色之间的位置(a*负值指示绿色而正值指示品红)和它在黄色和蓝色之间的位置(b*负值指示蓝色而正值指示黄色)。这里之所以使用Lab色彩空间替换原有的RGB色彩空间,是因为Lab色彩空间具有更高的色彩饱和度,有利于图像的后期处理。在进行色彩空间转换后,提取第一通道,这里即为L通道数值。
其次,将转换后的待处理书法作品进行二值化处理,将处理后的二值化图像作为形质模板,以便后续步骤使用。
再次,将之前提取到的第一通道即L通道数值进行shear变换,具体的进行三个方向上的shear变换,得到与每个方向对应的图像,这些图像构成第一图像集合,将前一步得到的形质模板同样进行三个方向上的shear变换,得到与每个方向对应的图像,这些图像构成第二图像集合。
最后,将第一图像集合与第二图像集合在引导滤波器中进行预设的线性变换,得到变换后的处理结果,并且对得到的处理结果进行与前面shear变换相逆的逆shear变换,得到变换图像集合,进而对变换图像集合进行融合处理,得到带有更加完整的字体的形质和神采信息的融合后图像。
本发明提供了一种基于shear变换和引导滤波器的书法字提取方法,包括将待处理书法作品进行色彩空间转换并提取第一通道,并且将书法作品的二值化图像作为形质模板,接着分别对第一通道和形质模板进行shear变换得到第一图像集合和第二图像集合,将二者在引导滤波器中进行处理,并对处理结果进行逆shear变换,最终将变换结果进行融合得到带有形质和神采信息的融合后图像。通过使用了引导滤波器和shear变换,使得得到的结果带有更多方向上的细节,以便更好地提取书法作品中汉字的形质和神采信息,提高了汉字信息提取的准确性,并结合融合处理将不同方向上提取的书法字的信息进行相互补充,保证了图像中汉字神采信息的完整性,弥补了现有技术中存在缺陷。
可选的,将所述转换后的待处理书法作品进行二值化处理,得到二值化图像,将所述二值化图像作为形质模板,包括:
将所述转换后的待处理书法作品从彩色图像转换为灰度图像,获取所述灰度图像中每个像素的像素值;
确定预设阈值,获取所述像素值中大于所述预设阈值的像素的第一像素平均值和所占的第一比例,以及所述像素值中不大于所述预设阈值的像素的第二平均值和所占的第二比例;
遍历所述预设阈值的取值,获取遍历过程中所述灰度图像中目标区域与背景区域的差值,当所述差值最大时,将所述预设阈值的取值作为二值化区分阈值;
根据所述二值化区分阈值对所述灰度图像进行二值化处理,得到二值化图像,将所述二值化图像作为形质模板。
在实施中,通过如下公式将彩色的待处理书法作品书法图像转换为灰度图像,
G=0.233r+0.587g+0.114b
接着,再使用以下公式计算图像G的平均像素值;
u = Σ x = 1 , y = 1 x = M , y = N f ( x , y ) M × N
其中,u表示G的平均像素值,f(x,y)表示图像中坐标为(x,y)处像素的像素值,M和N分别表示图像的长度和宽度。
假设对待处理书法图像转换后的灰度图像进行二值化处理的预设阈值为T,则统计G中像素值大于T的像素占图像的第一比例w1以及G中像素值不大于T的像素占图像的第二比例w2,并计算G中像素值大于T的像素的第一像素平均值u1以及G中像素值小于等于T的像素的第二像素值平均u2
w 1 = W 1 M × N
w 2 = W 2 M × N
u 1 = Σ i × n ( i ) W 1 i > T
u 2 = Σ i × n ( i ) W 2 i ≤ T
其中,W1和W2分别表示G中像素值大于T的像素数和像素值不大于T的像素数,i表示图像中像素的像素值,n(i)表示像素值等于i的像素数。
为了确定进行二值化处理的最佳阈值,需要遍历阈值Q的每一种可能的取值,使用以下公式计算类间差异值
D=w1×(u1-u)×(u1-u)+w2×(u2-u)×(u2-u)
其中,D表示二值化处理过程中目标部分和背景部分两类之间的差异值,当D达到最大时,即可得到二值化的最佳阈值Q,然后再使用下式对书法图像进行二值化处理。
通过上述步骤,能够将待处理的书法作品转换为更有利于后续处理的二值化图像。
可选的,所述将所述第一通道进行shear变换,得到变换后的第一图像集合,将所述形质模板进行所述shear变换,得到变换后的第二图像集合,包括:
建立shear矩阵s0;
对所述shear矩阵中的参数进行替换,得到替换shear矩阵Ash
根据所述第一通道,结合所述矩阵Ash进行shear变换,得到变换后的图像Lsh,以及由所述变换后的图像Lsh构成的第一图像集合;
根据所述形质模板,结合所述矩阵Ash进行shear变换,得到变换后的图像Csh,以及由所述变换后的图像Csh构成的第二图像集合。
在实施中,shear变换的具体步骤如下:
步骤一、图像的Shear变换可以通过Shear矩阵来实现。
其中,k∈[-2(ndir),2(ndir)],k∈Z,Z表示整数集合,ndir是方向参数(ndir∈N),图像的第一通道即L通道经过Shear变换后可以得到2(ndir+1)+1个变换后图像。在本发明中ndir=0,令则其对应的shear矩阵可改写为替换shear矩阵 A s h = 1 0 s h 1 , sh∈[-1,1]。
则Shear变换可定义为:
Lsh=S(L,Ash)=Ash*L
L′={Lsh|sh∈[-1,1]}
其中,S(·)表示Shear变换操作,L为图像的L通道图像,Lsh是Shear变换后的图像,L'是Shear变换后图像的集合{L-1,L0,L1}。使用Shear矩阵对第一通道进行shear变换,变换后图像Lsh中位置为(x',y')处的像素值Lsh(x',y')可以通过下面两个公式得到。
x ′ y ′ = A s h x y = 1 0 s h 1 x y = ( x , s h × x + y )
Lsh(x',y')=L(x,y)
其中,(x',y')为变换后图像中某个像素的坐标信息,(x,y)为变换前图像中某个像素的坐标信息,L(x,y)表示在shear变换前图像中坐标为(x,y)处的像素值,Lsh(x',y')表示图像L(x,y)在shear变换后的第sh个图像中坐标为(x',y')处的像素值。而在整个Shear变换过程中,图像中各对应像素的值保持不变。
经过以上shear变换,可获得第一通道在3个方向上的shear变换后的第一图像集合Lsh={L-1,L0,L1}。
步骤二、对之前得到的形质模板C进行与步骤一中相同内容的处理步骤,在进行完后,得到在3个方向上的shear变换得到Csh(sh=-1,0,1),形质模板C通过shear变换矩阵 A s h = 1 0 s h 1 , sh∈[-1,1]得到第二图像集合Csh={C-1,C0,C1}。
通过上述步骤,分别完成了对第一通道以及形质模板的shear变换,从而便于进行下一步在引导滤波器中的处理。
可选的,所述结合所述第一图像集合,将所述第二图像集合在预设的引导滤波器中进行处理,得到处理结果,对所述处理结果进行逆shear变换,得到变换图像集合,对所述变换图像集合进行融合处理,得到融合后图像,包括:
构建引导滤波器,所述引导滤波器中使用的线性变换公式(1)为
I o ( x , y ) = a k I g ( x , y ) + b k , ∀ ( x , y ) ∈ ω k , - - - ( 1 )
其中,Io(x,y)是滤波输出图像中坐标位置为(x,y)处的像素值,ak和bk是线性系数,Ig(x,y)是引导图像中坐标位置为(x,y)处的像素值,ωk是以像素点(x,y)为中心,半径为r的一个局部窗口。
将所述第一图像集合作为引导图像,将所述第二图像集合作为输入图像,在所述引导滤波器中通过所述线性变换公式进行处理,得到处理结果;
建立逆shear矩阵s′0,将逆shear矩阵中的参数进行替换,得到替换逆shear矩阵Ash′,结合所述矩阵Ash′进行逆shear变换,得到变换后的图像R'sh,以及由所述变换后的图像R'sh构成的变换图像集合;
将所述变换图像集合进行融合处理,得到融合后图像。
在实施中,构建的引导滤波器就是对引导图像的一个线性变换,即通过如下线性变换公式进行:
I o ( x , y ) = a k I g ( x , y ) + b k , ∀ ( x , y ) ∈ ω k , - - - ( 1 )
其中,Io(x,y)是滤波输出图像中坐标位置为(x,y)处的像素值,ak和bk是线性系数,Ig(x,y)是引导图像中坐标位置为(x,y)处的像素值,ωk是以像素点(x,y)为中心,半径为r的一个局部窗口。
为了使输入图像和输出图像之间的差异最小,即需要在窗口ωk中使以下的函数达到最小化:
E=∑((Io(x,y)-I(x,y))2+εak 2)
=∑((akIg(x,y)+bk-I(x,y))2+εak 2)
其中,I(x,y)是输入图像中坐标位置为(x,y)处的像素值,E是Io(x,y)和I(x,y)之间的差异值,ε是一个防止ak的值过大的正则化参数。当E达到最小时ak和bk分别为:
a k = ( σ k 2 + ϵ ) - 1 ( 1 | ω | Σ ( x , y ) ∈ ω k I g ( x , y ) I ( x , y ) - μ k I ‾ k )
b k = I ‾ k - a k μ k
其中,σk 2和μk分别为在窗口ωk内Ig(x,y)的均值和方差,为I(x,y)在窗口ωk内的均值,|ω|是窗口ωk内像素点的个数。
值得注意的是,由于一个像素可能被多个窗口所覆盖,因此,可以根据计算得到的参数ak和bk,通过以下公式计算得到滤波输出Io(x,y)。
I o ( x , y ) = a ‾ x y I g ( x , y ) + b ‾ x y
其中,是覆盖像素(x,y)的所有窗口系数的均值。
因此,分别以形质模板C经过shear变换后得到的Csh={C-1,C0,C1}作为引导滤波器的输入图像,对应的,以第一通道经过shear变换后得到的Lsh={L-1,L0,L1}作为引导滤波器的引导图像,使用引导滤波器可得到对应的滤波结果Rsh={R-1,R0,R1},这些滤波结果即为在待处理书法作品图像不同shear变换方向上利用引导滤波器提取获得的书法字的形质和神采信息。
为了得到更好的处理结果,还需要分别对引导滤波的结果Rsh使用对应的逆shear矩阵在3个方向上进行逆shear变换,得到变换图像R′sh(sh=-1,0,1)。
对于图像的逆Shear变换可以通过逆Shear矩阵来实现。其中k∈[-2(ndir),2(ndir)],k∈Z,Z表示整数集合,ndir是方向参数(ndir∈N),本发明中的ndir=0,令则其对应的逆shear矩阵可改写为 A s h ′ = 1 0 - s h 1 . 对于Rsh的逆Shear变换过程如下:
则逆Shear变换可定义为:
R'sh=S′(Rsh,A′sh)=A′sh*Rsh
R'={Rsh′|sh=[-1,1]}
其中,S′(·)表示逆Shear变换操作,Rsh为逆shear变换前图像,R'sh是Rsh经过逆Shear变换后的图像,R'是逆Shear变换后图像的集合。若使用逆Shear矩阵Ash′对图像进行逆Shear变换,变换后图像中位置为(x″,y″)处的像素值R'sh(x″,y″)可以通过下面两个公式得到。
x ′ ′ y ′ ′ = A s h ′ x ′ y ′ = 1 0 - s h 1 x ′ y ′ = ( x ′ , - s h × x ′ + y ′ )
R′sh(x″,y″)=Rsh(x′,y′)
其中,R′sh(x″,y″)表示逆shear变换后的图像集的第sh个图像中坐标位置为(x″,y″)处的像素值,Rsh(x′,y′)表示变换前图像中坐标位置为(x′,y′)处的像素值。在整个逆Shear变换过程中,图像中各对应像素的值保持不变。
在经过逆shear变换后,可以得到一个由逆shear变换后的变换图像集合R′={R′sh|sh=-1,0,1}。
由于不同方向上的引导滤波结果包含不同的细节信息,因此对前一步得到的变换图像集合R′={R′sh|sh=-1,0,1},利用如下公式进行图像融合可以得到更加完整的字体的形质和神采。即:
f(x,y)=min(R′sh(x,y)),sh=-1,0,1
其中R′sh(x,y)是逆shear变换后图像R′sh在坐标(x,y)处的像素值,f(x,y)是图像融合结果在坐标(x,y)处的像素值,min(·)是取最小操作。则f(x,y)为最终提取获得含有书法作品中汉字形质和神采信息的图像。
这里使用了图像融合技术,可以很好的解决了传统方法提取书法作品中汉字的神采信息不完整的问题,能够很好地将不同方向上提取的书法字的信息进行相互补充,以提高了图像中汉字神采信息的完整性。
本发明提供了一种基于shear变换和引导滤波器的书法字提取方法,包括将待处理书法作品进行色彩空间转换并提取第一通道,并且将书法作品的二值化图像作为形质模板,接着分别对第一通道和形质模板进行shear变换得到第一图像集合和第二图像集合,将二者在引导滤波器中进行处理,并对处理结果进行逆shear变换,最终将变换结果进行融合得到带有形质和神采信息的融合后图像。通过使用了引导滤波器和shear变换,使得得到的结果带有更多方向上的细节,以便更好地提取书法作品中汉字的形质和神采信息,提高了汉字信息提取的准确性,并结合融合处理将不同方向上提取的书法字的信息进行相互补充,保证了图像中汉字神采信息的完整性,弥补了现有技术中存在缺陷。
本发明的效果可以通过以下仿真进一步说明。
仿真1,对本发明中书法图像中汉字形质和神采信息提取方法的仿真。
仿真1的仿真条件是在MATLABR2013a软件下进行,引导滤波的参数ε=0.110,r=4。
参照图2至图7,对书法图像黄庭坚的《松风阁诗》局部进行仿真实验。在书法图像保存较为完好,“文房四宝”的印记显而易见,如图2(a)所示。形质模板中包含了汉字的主要形质信息,如图2(b)所示。首先利用shear变换矩阵对书法作品图像的L通道及其形质模板进行shear变换,可得到多个方向上的变换后图像,如图3和图4所示;然后分别以书法作品图像L通道经过shear变换后的图像作为引导滤波器的引导图像,以形质模板经过shear变换后的图像作为引导滤波器的输入图像,进而进行引导滤波处理,即可获得不同方向上书法字的形质和神采信息;最后对滤波结果进行逆shear变换,并变换后结果进行图像融合处理,即可得到更为完整的书法字的形质和神采信息。这些信息能够真实反映笔墨浓度变化和笔锋的走势。在结果图像中,书法家在书写汉字时笔画的虚实以及笔锋的突变和渐变都能够较好地展示。
仿真2,对本发明方法和现有的贴图像中汉字信息提取方法进行对比分析的仿真。
仿真2的仿真条件是在MATLABR2013a软件下进行。引导滤波器的参数ε=0.110和r=4。本发明方法主要与Otsu,FastFuzzyC-means(FFCM)以及MultiChannelsandGuidedFilters(MCGF)进行对比分析,以证明出本发明方法在书法作品中对汉字的神采信息的提取方面具有显著优势。实验结果的对比与分析描述如下:
参照图8,图9和图10,对于书法图像,应当同时考虑汉字的形质信息和神采信息的提取。首先,对于汉字的形质信息提取方面,所有的方法都比较准确的提取书法图像中汉字的形质信息。但是本发明方法提取结果形质信息更加完整,如图8和图9中所示。在汉字的神采信息的提取中,对于飞白中牵丝区域,Otsu,FFCM和MCGF提取结果已经完全损失或只有小部分保留,如图8和图10所示。对于枯笔所写笔画,提取难度很大,OTSU,FFCM和MCGF损失大部分信息,如图8和图9所示。然而与之形成对比的是,本发明方法在形质信息和神采信息的提取方面具有较高的准确性,无论对于飞白区域还是枯笔笔画都能保留绝大多数信息,真实的反映毛笔雄浑的力度和飘逸的笔法。
需要说明的是:上述实施例提供的固定装置进行胶液涂覆的实施例,仅作为该固定装置中在实际应用中的说明,还可以根据实际需要而将上述固定装置在其他应用场景中使用,其具体实现过程类似于上述实施例,这里不再赘述。
上述实施例中的各个序号仅仅为了描述,不代表各部件的组装或使用过程中得先后顺序。
以上所述仅为本发明的实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种基于shear变换和引导滤波器的书法字提取方法,其特征在于,所述基于shear变换和引导滤波器的书法字提取方法,包括:
获取待处理书法作品,将所述待处理书法作品的色彩空间转换至预设色彩空间,提取转换后的所述待处理书法作品中的第一通道;
将所述转换后的待处理书法作品进行二值化处理,得到二值化图像,将所述二值化图像作为形质模板;
将所述第一通道进行shear变换,得到变换后的第一图像集合,将所述形质模板进行所述shear变换,得到变换后的第二图像集合;
结合所述第一图像集合,将所述第二图像集合在预设的引导滤波器中进行处理,得到处理结果,对所述处理结果进行逆shear变换,得到变换图像集合,对所述变换图像集合进行融合处理,得到融合后图像。
2.根据权利要求1所述的基于shear变换和引导滤波器的书法字提取方法,其特征在于,所述将所述转换后的待处理书法作品进行二值化处理,得到二值化图像,将所述二值化图像作为形质模板,包括:
将所述转换后的待处理书法作品从彩色图像转换为灰度图像,获取所述灰度图像中每个像素的像素值;
确定预设阈值,获取所述像素值中大于所述预设阈值的像素的第一像素平均值和所占的第一比例,以及所述像素值中不大于所述预设阈值的像素的第二平均值和所占的第二比例;
遍历所述预设阈值的取值,获取遍历过程中所述灰度图像中目标区域与背景区域的差值,当所述差值最大时,将所述预设阈值的取值作为二值化区分阈值;
根据所述二值化区分阈值对所述灰度图像进行二值化处理,得到二值化图像,将所述二值化图像作为形质模板。
3.根据权利要求1所述的基于shear变换和引导滤波器的书法字提取方法,其特征在于,所述将所述第一通道进行shear变换,得到变换后的第一图像集合,将所述形质模板进行所述shear变换,得到变换后的第二图像集合,包括:
建立shear矩阵s0;
对所述shear矩阵中的参数进行替换,得到替换shear矩阵Ash
根据所述第一通道,结合所述矩阵Ash进行shear变换,得到变换后的图像Lsh,以及由所述变换后的图像Lsh构成的第一图像集合;
根据所述形质模板,结合所述矩阵Ash进行shear变换,得到变换后的图像Csh,以及由所述变换后的图像Csh构成的第二图像集合。
4.根据权利要求1所述的基于shear变换和引导滤波器的书法字提取方法,其特征在于,所述结合所述第一图像集合,将所述第二图像集合在预设的引导滤波器中进行处理,得到处理结果,对所述处理结果进行逆shear变换,得到变换图像集合,对所述变换图像集合进行融合处理,得到融合后图像,包括:
构建引导滤波器,所述引导滤波器中使用的线性变换公式(1)为
I o ( x , y ) = a k I g ( x , y ) + b k , ∀ ( x , y ) ∈ ω k , - - - ( 1 )
其中,Io(x,y)是滤波输出图像中坐标位置为(x,y)处的像素值,ak和bk是线性系数,Ig(x,y)是引导图像中坐标位置为(x,y)处的像素值,ωk是以像素点(x,y)为中心,半径为r的一个局部窗口。
将所述第一图像集合作为引导图像,将所述第二图像集合作为输入图像,在所述引导滤波器中通过所述线性变换公式进行处理,得到处理结果;
建立逆shear矩阵s′0,将逆shear矩阵中的参数进行替换,得到替换逆shear矩阵Ash′,结合所述矩阵Ash′进行逆shear变换,得到变换后的图像R'sh,以及由所述变换后的图像R'sh构成的变换图像集合;
将所述变换图像集合进行融合处理,得到融合后图像。
CN201510418664.4A 2015-07-16 2015-07-16 一种基于shear变换和引导滤波器的书法字提取方法 Expired - Fee Related CN105335746B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510418664.4A CN105335746B (zh) 2015-07-16 2015-07-16 一种基于shear变换和引导滤波器的书法字提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510418664.4A CN105335746B (zh) 2015-07-16 2015-07-16 一种基于shear变换和引导滤波器的书法字提取方法

Publications (2)

Publication Number Publication Date
CN105335746A true CN105335746A (zh) 2016-02-17
CN105335746B CN105335746B (zh) 2018-07-20

Family

ID=55286262

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510418664.4A Expired - Fee Related CN105335746B (zh) 2015-07-16 2015-07-16 一种基于shear变换和引导滤波器的书法字提取方法

Country Status (1)

Country Link
CN (1) CN105335746B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056129A (zh) * 2016-05-16 2016-10-26 西安邮电大学 一种融合多种特征的监控视频图像过曝光区域检测方法
CN106709893A (zh) * 2016-12-28 2017-05-24 西北大学 一种全天时雾霾图像清晰化恢复方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030059115A1 (en) * 2000-08-31 2003-03-27 Shinya Nakagawa Character recognition system
CN101533517A (zh) * 2009-04-15 2009-09-16 北京联合大学 一种基于结构特征的中国书画印章图像自动提取方法
CN103020917A (zh) * 2012-12-29 2013-04-03 中南大学 一种基于显著性检测的中国古代书法绘画图像复原方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030059115A1 (en) * 2000-08-31 2003-03-27 Shinya Nakagawa Character recognition system
CN101533517A (zh) * 2009-04-15 2009-09-16 北京联合大学 一种基于结构特征的中国书画印章图像自动提取方法
CN103020917A (zh) * 2012-12-29 2013-04-03 中南大学 一种基于显著性检测的中国古代书法绘画图像复原方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056129A (zh) * 2016-05-16 2016-10-26 西安邮电大学 一种融合多种特征的监控视频图像过曝光区域检测方法
CN106709893A (zh) * 2016-12-28 2017-05-24 西北大学 一种全天时雾霾图像清晰化恢复方法
CN106709893B (zh) * 2016-12-28 2019-11-08 西北大学 一种全天时雾霾图像清晰化恢复方法

Also Published As

Publication number Publication date
CN105335746B (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
CN110619642B (zh) 一种票据图像中印章与背景文字分离方法
CN106296666B (zh) 一种彩色图像去阴影方法和应用
CN103020917B (zh) 一种基于显著性检测的中国古代书法绘画图像复原方法
CN104834890B (zh) 一种对书法作品中文字神采信息的提取方法
CN107316077A (zh) 一种基于图像分割及边缘检测的脂肪细胞自动计数方法
CN107516316B (zh) 一种在fcn中引入聚焦机制对静态人体图像进行分割的方法
CN109035273B (zh) 一种免疫层析试纸卡的图像信号快速分割方法
CN112614062B (zh) 菌落计数方法、装置及计算机存储介质
CN106096613A (zh) 基于角点特征的图像多目标检测方法及装置
GB2478593A (en) Segmentation of cell nuclei in histological sections
CN103646247A (zh) 一种乐谱识别方法
CN102930576A (zh) 一种基于特征流的抽象线条画生成方法
Shaikh et al. A novel approach for automatic number plate recognition
CN108171220A (zh) 基于全卷积神经网络与crf技术的道路自动识别方法
CN104021566A (zh) 基于GrabCut算法的舌诊图像自动分割方法
JP5939023B2 (ja) コンピュータプログラム及び画像抽出装置
CN105373798B (zh) 一种基于k近邻抠图和数学形态学的书法字提取方法
CN105093289A (zh) 一种基于图像处理的地震层位识别方法
CN103455816B (zh) 一种笔画宽度提取方法、装置及一种文字识别方法、系统
CN105335746B (zh) 一种基于shear变换和引导滤波器的书法字提取方法
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
DE112019004112T5 (de) System und verfahren zur analyse mikroskopischer bilddaten und zur erzeugung eines annotierten datensatzes zum training der klassifikatoren
CN112070684B (zh) 基于形态先验特征的甲骨刻辞文字修复方法
Swaileh et al. Versailles-FP dataset: wall detection in ancient floor plans
CN104102911A (zh) 一种基于aoi的子弹表观缺陷检测系统的图像处理算法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180720

Termination date: 20190716

CF01 Termination of patent right due to non-payment of annual fee