CN101533517B - 一种基于结构特征的中国书画印章图像自动提取方法 - Google Patents

一种基于结构特征的中国书画印章图像自动提取方法 Download PDF

Info

Publication number
CN101533517B
CN101533517B CN2009100823737A CN200910082373A CN101533517B CN 101533517 B CN101533517 B CN 101533517B CN 2009100823737 A CN2009100823737 A CN 2009100823737A CN 200910082373 A CN200910082373 A CN 200910082373A CN 101533517 B CN101533517 B CN 101533517B
Authority
CN
China
Prior art keywords
image
seal
calligraphy
painting
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009100823737A
Other languages
English (en)
Other versions
CN101533517A (zh
Inventor
娄海涛
胡正坤
鲍泓
张南
王迪菲
王真真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Union University
Original Assignee
Beijing Union University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Union University filed Critical Beijing Union University
Priority to CN2009100823737A priority Critical patent/CN101533517B/zh
Publication of CN101533517A publication Critical patent/CN101533517A/zh
Application granted granted Critical
Publication of CN101533517B publication Critical patent/CN101533517B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种基于结构特征的中国书画印章图像自动提取方法,其步骤包括:1)对输入图像进行颜色分层;2)基于连通区域的图像分割;3)基于印章结构特征的图像区域过滤;4)在输入图像中提取印章图像。本发明利用基于机器学习的中国书画颜色分层分析模型,实现了书画作品基于色层的同质区域粒度级别的图像分割。在此基础上提出了一种基于印章轮廓模板和内部结构复杂度的书画印章提取方法,该提取方法能够从整幅书画作品或书画作品局部图像中准确地自动提取出印章图像的全部信息,据此可以实现一个利用印章图像作为关键信息的基于内容的中国书画图像检索和语义标注系统,为中国书画作品的检索、鉴定以及分类等奠定了基础。

Description

一种基于结构特征的中国书画印章图像自动提取方法
技术领域
本发明涉及一种图像提取领域,特别是关于一种基于结构特征的中国书画印章图像自动提取方法。
背景技术
中国书画作品是中国艺术文化中的重要组成部分。其中印章作为中国书画″四绝″之一(″四绝″即诗、书、画、印),已经成为文人书画作品中不可分割的重要部分,它包含大量与作者相关的高层语义信息,具有相当重要的艺术和文化价值。
20世纪90年代以来,随着计算机技术和图像处理技术的迅速发展,基于内容的图像检索(CBIR,Content Based Image Retrieval)技术在数字图像检索领域得到广泛的应用。CBIR是图像检索中的主要技术之一,其利用图像的低层视觉特征描述,如图像的纹理、颜色、形状及在空间的分布规律等特征对图像进行区域分割和场景语义信息的提取,从而实现检索。但是由于″语义鸿沟″的存在,使得CBIR技术的应用受到很大限制,尤其在书画作品的基于内容的检索方面表现的更为突出。这主要是由于艺术和文化的传承性造成的,中国书画作品中所使用的绘画技法、画面构图、颜色运用以及表现形式和主题等的相似性,使得书画作品的低层视觉特征趋于一致,因此单纯的利用低层视觉特征进行检索很难满足用户需求。解决CBIR中“语义鸿沟”问题已经成为现阶段的研究焦点。
随着中国书画作品数字化的深入,大量的书画作品被以数字图像的形式保存下来,如何能够通过图像本身或者其草图对书画的数字图像和相关信息进行检索成为书画数字化领域的核心课题之一。针对中国书画作品的数字图像检索领域中的“语义鸿沟”问题,可以利用印章图像中包含的高层语义信息进行辅助检索,解决提取书画作品语义信息的关键问题。由此可见,印章图像提取是获得上述高层语义信息的基础。
在针对中国书画的数字图像研究领域,宾夕法尼亚州立大学的James.Wang等人在论文“Studying digital imagery of ancient paintings by mixtures of stochasticmodels”中采用了多尺度小波变换后的特征系数描述中国书画的数字图像的纹理特征,提出了二维多尺度隐马尔科夫模型(2D-MHMMs)对于吴昌硕、唐寅、张大千等五位的中国书画的数字图像进行建模并构建分类器,以实现对未知书画图像的自动分类,但这种方法缺乏可扩展性。
国内,中科院计算所的黄庆明等在论文“An effective method to detect andcategorize digitized traditional Chinese paintings”中基于Tamura等人提出的一组对应人类视觉感知的纹理特征集,采用自相关纹理特征来描述中国书画数字图像的复杂程度,针对中国画中工笔画和写意画的特性提出使用边缘大小直方图来测量图像边缘的稀疏程度和粒度。而在另一篇论文“Visual Ontology Construction forDigitized Art Image Retrieval”中提出了将图像分析和领域本体技术相结合的书画图像语义自动分类算法。
在印章的数字图像研究领域,目前主要集中在对规范的公章或会计和法人印章上。针对书画作品中印章图像的研究,只有2008年娄海涛、鲍泓等提出的一种自动提取中国书画作品中印章图像的方法(专利号:200710143946.3),该提取方法仅利用到印章图像的颜色特征,不能有效的提取书画作品中非红色的印章图像,且阀值多,提取率受印章图像大小的限制,没有充分利用印章图像的结构特征。目前国内外对中国书画作品中印章图像自动提取的研究鲜有人涉足,特别是基于结构特征的提取方法。
印章一般是由质地较为坚硬的金、银、铜、玉石等材料雕刻而成。将章料的底面(即“印面”)打磨平整,再在印面上雕刻文字或图案,即为“印文”。使用时,将印面沾取印泥后钤盖在书画作品上,形成印章图像。因此,印章图像的颜色即为印泥的颜色,通常呈现红色,还有少数为蓝色或其它颜色。印章图像有阴阳文,阳文印(也称朱文印)没有底色,字体为印泥颜色;阴文印(也称白文印)底色为印泥颜色,字体是白色,即背景颜色。印泥有厚薄、干湿,有蜜印、水印、油印之分,这些都能使同一印章的不同印文图像发生变化;同一枚印章钤盖在不同的纸或绢上,钤盖时用力轻重的不同,不同的背景颜色和纹理等,都会使图像发生变化;书画作品在装裱过程中,各种纸张或绢帛的伸缩延展也会导致印章图像发生变化;再考虑到印泥新旧,纸绢的包浆(纸绢上的光泽)等因素,可以遇到的变化是很多的。历代书画家都对印章情有独钟,一位画家往往拥有几枚到几十枚不同的印章。为配合书画作品的意境或画家个人的情趣,常会在一幅作品中的不同位置钤盖一枚或数枚不同的印章。此外,书画作品中往往还钤盖有一枚或数枚收藏家的印章,且钤盖位置及其背景变化复杂,难以确定。故而针对书画作品中印章图像的自动提取较难实现。
发明内容
针对上述问题,本发明的目的是提供一种基于结构特征的中国书画印章图像自动提取方法。
为实现上述目的,本发明采取以下技术方案:一种基于结构特征的中国书画印章图像自动提取方法,其步骤包括:1)对输入图像进行颜色分层;2)基于连通区域的图像分割;3)基于印章结构特征的图像区域过滤;4)在输入图像中提取印章图像。
所述步骤1)的对输入图像进行颜色分层,包括以下步骤:i)将所述输入图像从RGB颜色空间转换到CIE Lab颜色空间;ii)对转换后的输入图像进行颜色分层,得到各颜色层图像。
所述步骤2)的基于连通区域的图像分割,包括以下步骤:a)使用图像滤波方法对所述各颜色层图像进行噪声处理;b)对颜色层图像进行基于数学形态学的区域合并,形成孤立图像的连通区域;c)基于所述连通区域外接矩形的图像分割。
所述步骤3)的基于印章结构特征的图像区域过滤,包括以下步骤:I)利用印章轮廓模板过滤分割后的图像区域;II)利用边缘检测算法基于印章内部结构特征过滤印章图像区域。
所述步骤2)中连通区域的计算方法,可使用种子填充算法、扫描线填充算法或边填充算法。
所述步骤3)中的印章轮廓模板包括矩形模板、椭圆形模板、葫芦形、瓦当形或刀形。
本发明由于采取以上技术方案,其具有以下优点:1、本发明利用基于机器学习的中国书画颜色分层分析模型,实现了书画作品基于色层的同质区域粒度级别的图像分割,使一幅作品中的不同形状、颜色和大小的印章分别归属到不同的色层,并形成相对孤立的图像区域,因此可以对全部印章图像同时进行提取。2、本发明在书画颜色分层的基础上提出了一种基于印章外部轮廓模板和内部结构复杂度的书画印章提取方法,该提取方法能够从整幅书画作品或书画作品局部图像中准确地自动提取出印章图像的全部信息,据此可以实现一个利用印章图像作为关键信息的基于内容的中国书画图像检索和语义标注系统,克服了现有提取方法中由于印章颜色、钤盖位置及其背景变化复杂而导致的印章提取困难的缺陷,为中国书画作品的检索、鉴定以及分类等奠定了基础。
附图说明
图1是本发明的流程示意图
图2是本发明的基于书画图像颜色分层模型分层前的图像
图3是本发明的基于书画图像颜色分层模型分层后红色图层的二值图
图4是本发明的基于书画图像颜色分层模型分层后黄色图层的二值图
图5是本发明的基于书画图像颜色分层模型分层后蓝色图层的二值图
图6是本发明的基于书画图像颜色分层模型分层后绿色图层的二值图
图7是本发明的基于书画图像颜色分层模型分层后白色图层的二值图
图8是本发明的基于书画图像颜色分层模型分层后黑色图层的二值图
图9是本发明的基于书画图像颜色分层模型分层后杂色图层的二值图
图10是本发明的基于书画图像颜色分层模型分层后红色图层图像
图11是本发明的基于书画图像颜色分层模型分层后黄色图层图像
图12是本发明的基于书画图像颜色分层模型分层后蓝色图层图像
图13是本发明的基于书画图像颜色分层模型分层后绿色图层图像
图14是本发明的基于书画图像颜色分层模型分层后白色图层图像
图15是本发明的基于书画图像颜色分层模型分层后黑色图层图像
图16是本发明的基于书画图像颜色分层模型分层后杂色图层图像
图17是本发明中图3所示红色图层去除噪声后的二值图
图18是本发明中图17所示二值图连通区域伪彩色标识图像
图19是本发明中数学形态学方法所使用的结构元素
图20是本发明中图17所示二值图膨胀后的效果
图21是本发明中图20所示图像腐蚀后的效果图
图22是本发明中图21所示图像的分割区域图像
图23是本发明中所设计的矩形模板图
图24是本发明中图23所示矩形模板图的距离-角度关系图
图25是本发明中所设计的椭圆形模板图
图26是本发明中图25所示椭圆模板图的距离-角度关系图
图27是本发明中从图22中选取的区域图像
图28是本发明中由图27所示二值图像生成的自适应矩形模板图的距离-角度关系图
图29是本发明中图27所示二值图像轮廓的距离-角度关系图
图30是本发明中图27所示的二值图像轮廓与其对应矩形模板的差值曲线图
图31是本发明中图5所示图层中的区域图像
图32是本发明中图27所示二值图的边缘图
图33是采用本发明方法从图2中提取到的印章图像
图34是本发明选用的当代画家徐悲鸿的一幅奔马图
图35是基于本发明方法从图33所示实施例中提取的印章图像
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
虽然在中国书画的数字图像中进行印章图像提取非常困难,但印章图像本身的外部轮廓和内部结构特征仍有一定规律可循。印章图像的外部轮廓主要体现在印章图像的边栏上。边栏有矩形、圆形、椭圆形和异形之分。根据对从宋朝至清朝172名书画家的3191款印章图像的统计分析表明,印章图像的外部轮廓特征多为矩形、圆形和椭圆形,其中矩形的占93.77%,圆形和椭圆的占5.14%,但印章图像的大小规格不一,且一般印章图像都不十分完整。
印章图像除具有上述外部轮廓特征之外,其内部结构也因章法(布局)而具有一定的规律。其中,格栏一般可以分为田字格、日字格、井字格等,印文也有二字、四字、六字等之分,但实际情况远比这复杂。印章章法注重结构,印文布局讲究虚实结合。但由于文字体势不同,往往要在简单的印字上添加笔画,在复杂的印字上减少笔画,以达到讲求平衡、老实、大方、端正的目的。综上所述,可以利用以上特征对书画作品中的印章图像进行自动提取。
本发明通过常规方法获取一幅包含印章信息的中国书画作品或作品局部的数字图像,利用图像处理的组合方法,对中国书画作品中的印章图像进行识别,并逐个提取出来。
如图1所示,印章图像自动提取方法步骤如下:
1、对书画图像进行颜色分层:将数字化的中国书画图像输入电脑,使用基于机器学习的书画图像颜色分层模型对书画图像进行颜色分层。
i)将输入书画图像从RGB颜色空间转换到CIE Lab颜色空间
计算机中图像颜色的描述一般采用RGB颜色空间,本发明针对在CIE Lab颜色空间描述的中国书画图像颜色分层模型,将输入的书画图像进行图像空间的转换。即借助XYZ颜色空间,将书画图像由RGB颜色空间转换到CIE Lab颜色空间。从RGB到XYZ颜色空间的转换依推荐标准不同而不同,本实例采用在标准光源D65(即色温为6504°K的日光)下的转换关系:
X Y Z = 0.412411 0.357585 0.180454 0.212649 0.715169 0.072182 0.019332 0.119195 0.950390 R G B
其中,X、Y、Z和R、G、B分别为各自颜色空间中对应颜色分量。再由XYZ颜色空间转换到CIE Lab颜色空间:
L=116f(Y/Y0)-16
a=500[f(X/X0)-f(Y/Y0)]
b=200[f(Y/Y0)-f(Z/Z0)]
其中,L、a、b为CIE Lab颜色空间中的各分量,X0,Y0,Z0是XYZ国际坐标制中参考白点的三色刺激值。在函数f(t)中,当t>(6/29)3时,f(t)=t1/3;否则,
f ( t ) = 1 3 ( 29 6 ) 2 t + 16 / 116
将图像在CIE Lab空间中每个像素点的a和b分量使用其极坐标(C*,hab)表示,
C * = a 2 + b 2
hab=arctan(b/a)
ii)对转换后的书画图像进行颜色分层
本发明在书画图像颜色分层模型中定义了红、黄、蓝、绿、白、黑,共6个颜色集。书画图像颜色分层模型使用BP神经网络对上述颜色集进行分类。输入书画图像各像素点的CIE Lab空间的分量(L,C*,hab)ij,其中i∈[1,h],j∈[1,w],i、j为整数,h为书画图像垂直方向的最大像素数目,w为书画图像水平方向的最大像素数目。本步骤利用书画图像颜色分层模型中的三层BP神经网络进行逐像素点的网络计算,输出各像素点所属的色层标号,并用三位二进制表示其所属的颜色层标号,如颜色层1的三位二进制为001。BP神经网络的结构包括输入层、隐层和输出层。其中,训练函数选用Levenberg_Marquardt的BP算法训练函数trainlm,隐层传递函数选用正切S型传递函数tansig。输出层传递函数采用线性传递函数purelin,学习函数采用梯度下降动量学习规则learngdm,性能分析函数采用MSE。
之后根据各像素点所属的色层标号实现图像分层,即根据输出的各像素点所属色层标号构造各层的掩码矩阵mask:n为色层标号,本实施例中n=1,2,...,6,对应6个颜色集。取像素点(i,j)的输出outij,若outij=n,在掩码矩阵中色层n对应的元素maskij=1,反之maskij=0,掩码矩阵mask在RGB空间中可以利用二值图直观表示。
如图2~图9所示,书画图像分层前与图像分层后的各分层的二值图的效果对比。如图10~图16所示,在RGB颜色空间中利用上述的各层二值图像与原图像按像素点做与运算,可以实现对图像各颜色层的分层。
2、基于连通区域的图像分割
对步骤1中分得的各颜色层图像进行噪声处理,针对处理后的各层图像进行基于数学形态学的区域合并,计算各连通区域的外接矩形,对区域合并后的各层图像进行分割。
a)对各颜色层图像进行噪声处理
如图3~图9所示,图像分层后的各层图像是由一些大小不等的孤立不连通的区域构成的。一般在各层图像上都包含有极小面积的图像区域,即噪声,究其原因可归结为书画作品的颜料、材质、保存状况以及包浆等因素。为提高基于印章结构特征的图像区域过滤的计算效率,可对分层后的各层图像中显然不可能为印章图像的区域进行过滤。
考虑到印章图像生成的过程,其特点在于颜色一致且连续,加之印章图像的颜色与背景颜色有差异,印章图像必然为一个或一组孤立并连通的区域。又由于印章图像一般具有一定结构,因此其连通区域的总像素数不可能太小,否则不能被识别为印章。综上所述,本实施例选取8邻域种子填充算法对各层二值图进行连通区域标识,设阀值为9,则连通区域面积小于9的图像区域将被作为噪声滤除。对书画图像的红色图层的噪声处理结果如图17所示。
本步骤中,噪声处理除采用以上方法外,还可选用其它现有的图像滤波方法或它们的组合,如自适应滤波器、中值滤波器和高斯滤波器等,也可以根据实际需要自行设计图像过滤方法。
b)对处理后的颜色层图像进行基于数学形态学的区域合并
如图18所示,书画图像右下角印章的边框区域和印文区域被分割到3个不同的区域内,因此根据印章的结构特征,印章的边框区域和印文区域并不一定连通。考虑到印章的印文包含在印章边框之内,则其连通区域的必然相邻,于是可以使用数学形态学的方法对各层二值图像中的上述连通区域进行合并,以达到属于同一枚印章的图像区域尽可能的落在同一连通区域内的目的。如图19所示,选取结构元素S,对各层二值图像进行膨胀,其逻辑方程为:
Figure G2009100823737D00071
其中,A为经噪声处理后的分层图像。如图20所示,3个不连通的印章区域利用上述操作实现合并。
针对膨胀后的图像,可以再次利用结构元素S进行腐蚀操作。其公式为:
AΘS = { z | ( S ) z ⊆ A }
其中,A为经膨胀处理后的分层图像。如图21所示,上述操作可以去除膨胀所得的非连接像素点,形成孤立图像的连通区域。
c)基于连通区域外接矩形的图像分割
针对各层二值图像中基于数学形态学合并后的各连通区域,计算其外接矩形。求连通区域外接矩形,可以通过计算连通区域内各像素点的最大和最小坐标值imax、imin、jmax、jmin来进行,其中i∈[1,h],j∈[1,w],i、j为整数,h为书画图像的垂直方向的最大像素数目,w为书画图像的水平方向的最大像素数,可得连通区域的外接矩形的起点为(imin,jmin),水平和垂直跨度值分别为imax-imin,jmax-jmin。根据各连通区域的外接矩形和各层二值图像之间存在的位置对应关系,对图像进行分割。以红色图层为例,在书画图像中分割提取得到16个图像区域,部分图像区域如图22所示。
步骤a)和步骤c)中涉及到连通区域的计算方法,除使用到8邻域种子填充算法外,还可以选用4邻域种子填充算法、扫描线填充算法和边填充方法等。
步骤c)中连通区域合并方法,除采用基于数学形态学的合并方法外,还可以采用其他现有的连通区域合并方法,或自行设计合并方法。对于数学形态学处理方法,除膨胀法和腐蚀法外,也可以根据实际情况自行选取不同的结构元素来进行。
3、基于印章结构特征的图像区域过滤
对步骤2中分割后的图像区域,利用印章图像的外部轮廓模板进行匹配,滤除不符合印章图像外部轮廓模板特征的图像区域。再利用边缘检测方法提取剩余图像的边缘特征,计算剩余图像区域的内部结构复杂度,滤除不满足印章内部结构复杂度指标的图像区域。
I)利用印章轮廓模板过滤图像区域
如图22所示,可以发现印章图像区域的轮廓多为矩形、圆形或椭圆形等规则形状,而其它图像区域则不具备这种规则的轮廓特征。这是由于中国书画一般用毛笔绘制或书写,非印章区域的书画图像轮廓一般为不规则形状,由此可以利用印章的外部轮廓特征对图像区域进行过滤。针对书画图像中印章的轮廓多为矩形、圆形或椭圆形等规则形状的特性,分别设计了矩形模板和椭圆形模板,其中矩形模板的设计如下:
如图23所示,针对分割后的任意图像区域,计算其最小外接矩形,设外接矩形的长、宽分别为H,W,中心为O。将O点作为坐标系的原点,模板上的任意点(x,y)到原点O的线段长度为D,与x正半轴的夹角为θ,θ∈[0,2π],则有:
D = x 2 + y 2
θ=arctan(y/x)
则矩形模板中,长度D与夹角θ的关系如图24所示。
如图25所示,椭圆形模板通过计算图像区域的最小外接矩形的内切椭圆获得。椭圆形模板上的各点到原点O的线段长度D和与x正半轴的夹角θ的计算方法同上,则在椭圆模板中,长度D与夹角θ的关系如图26所示。印章轮廓模板除采用矩形模板和椭圆形模板外,也可根据需要设计葫芦形、瓦当形、刀形等其它模板。
由于印章轮廓的形状、大小是根据图像区域而变化的,因此利用上述方法可以针对不同形状、大小的图像区域生成其相应的自适应印章轮廓模板。如图27所示,针对基于区域分割后的图像区域,根据上述印章轮廓模板设计的方法生成该区域的二值图像轮廓模板,其长度D与夹角θ的关系如图28所示。二值图像轮廓模板匹配的过程如下:
依次选取二值图像轮廓模板上的点(x,y),做点(x,y)到坐标原点O的线段。假设线段上的各像素点与区域内的二值图像像素点的交集中,距离坐标原点O最远的像素点的坐标为(x′max,y′max),则点(x′max,y′max)到原点O线段的长度D′和与x正半轴的夹角θ′,θ′∈[0,2π]为:
D ′ = x max ′ 2 + y max ′ 2
θ=arctan(y′max/x′max)
其中,D′和θ′的关系如图29所示。计算二值图像轮廓模板上的点(x,y)和二值图像轮廓上的点(x′max,y′max)到原点O的距离差值ΔD:
ΔD=D-D′
如图30所示,通过距离差值ΔD可得矩形模板和图27所示的二值图像轮廓模板的差值曲线。
进一步根据距离差值ΔD和线段长度D计算二值图像轮廓模板的相符率η:
η = ΔD D
设通过实验经验获得的相符阀值为δ,本实例取δ=0.2。若二值图像轮廓模板的相符率η不大于相符阀值δ,则认为该二值图像轮廓上的点(x′max,y′max)与对应的二值图像轮廓模板上的点(x,y)相符。再计算容错率μ:
μ = num ( η > δ ) m
其中num(η>δ)为二值图像轮廓上与二值图像轮廓不相符的点的像素数目。设通过实验经验获得的容错阀值为ε,本实例取ε=0.2。若容错率μ小于容错阀值ε,则认为该二值图像所对应的图像区域符合印章轮廓模板,反之不符。最后,对不符合印章轮廓模板的图像区域进行剔除。
2)基于印章内部结构特征过滤图像区域
由于步骤1)中经印章轮廓模板过滤后的剩余图像区域,仅包含有具有印章轮廓特征的图像区域。对这些图像区域的分析表明,印章图像区域因章法特性具有相对复杂的内部结构,而如图31所示,对于剩余图像区域中的非印章区域一般不具备相应的复杂内部结构。本发明提出了一种根据印章内部结构复杂程度判断图像区域是否为印章图像的检测方法,该方法给出了一个衡量印章内部结构复杂程度的描述算子——结构复杂度。具体实施方法如下:
首先利用边缘提取方法提取各剩余图像区域的边缘信息,本实例采用Canny边缘检测算子进行印章图像的边缘提取,结构复杂度SC表示为:
SC=Edge/Dia
其中,Edge为边缘提取后的图像区域内的像素点总和,Dia为图像外接矩形的对角线长度。设复杂度阀值ω为通过大量实验获得的经验值,本实例当中,ω取6.0。若结构复杂度SC大于复杂度阀值ω时,其对应的图像区域为印章区域,反之为非印章区域。边缘检测方法,除本实施例中采用的Canny算子外,也可采用Sobel算子,Roberts算子和拉普拉斯算子等边缘检测算子,或根据实际情况自行设计其它边缘检测算法,以及对已有方法的改进。如图32所示,实心灰色线段表示对角线。
4、提取印章图像
如图33所示,满足印章外部轮廓的特征和内部结构特征的图像区域即为印章图像区域,根据印章图像区域和书画图像之间存在的位置对应关系,即根据印章图像区域的外接矩形在书画图像中提取出印章图像。
如图34、图35所示,本实施例对中国著名画家徐悲鸿的《奔马》中包含的两枚印章图像进行提取。在收集的大量书画作品数字图像的基础上,随机选择了其中200幅作为样本,并以50幅样本为一组,共分成4组图像建立实验样本库。通过本发明的方法所建立的模型进行测试,提取率E达到81.72%。
综上所述,本发明利用基于机器学习的中国书画颜色分层分析模型,实现了书画作品基于色层的同质区域粒度级别的图像分割。在此基础上提出了一种基于印章轮廓模板和内部结构复杂度的书画印章提取方法,该提取方法能够从整幅书画作品或书画作品局部图像中准确地自动提取出印章图像的全部信息,据此可以实现一个利用印章图像作为关键信息的基于内容的中国书画图像检索和语义标注系统,为中国书画作品的检索、鉴定以及分类等奠定了基础。

Claims (3)

1.一种基于结构特征的中国书画印章图像自动提取方法,其步骤包括:
1)对输入图像进行颜色分层:
i)将所述输入图像从RGB颜色空间转换到CIE Lab颜色空间;
ii)对转换后的输入图像进行颜色分层,得到各颜色层图像;
2)基于连通区域的图像分割:
a)使用图像滤波方法对所述各颜色层图像进行噪声处理;
b)对颜色层图像进行基于数学形态学的区域合并,形成孤立图像的连通区域;
c)基于所述连通区域外接矩形的图像分割;
3)基于印章结构特征的图像区域过滤:
I)利用印章轮廓模板过滤分割后的图像区域:首先针对书画图像中印章的的外部轮廓特征设计印章轮廓模板;然后针对基于区域分割后的图像区域,根据印章轮廓模板设计的方法生成该区域的二值图像轮廓模板,二值图像轮廓模板匹配的过程如下:依次选取二值图像轮廓模板上的点(x,y),做点(x,y)到坐标原点O的线段;假设线段上的各像素点与区域内的二值图像像素点的交集中,距离坐标原点O最远的像素点的坐标为(x′max,y′max),则点(x′max,y′max)到原点O线段的长度D′和与x正半轴的夹角θ′,θ′∈[0,2π]为:
D ′ = x max ′ 2 + y max ′ 2
θ′=arctan(y′max/x′max)
计算二值图像轮廓模板上的点(x,y)和二值图像轮廓上的点(x′max,y′max)到原点O的距离差值ΔD:
ΔD=D-D′
进一步根据距离差值ΔD和线段长度D计算二值图像轮廓模板的相符率η:
η = ΔD D
设通过实验经验获得的相符阀值为δ,若二值图像轮廓模板的相符率η不大于相符阀值δ,则认为该二值图像轮廓上的点(x′max,y′max)与对应的二值图像轮廓模板上的点(x,y)相符;再计算容错率μ:
μ = num ( η > δ ) m
其中num(η>δ)为二值图像轮廓上与二值图像轮廓不相符的点的像素数目;设通过实验经验获得的容错阀值为ε,若容错率μ小于容错阀值ε,则认为该二值图像所对应的图像区域符合印章轮廓模板,反之不符;最后对不符合印章轮廓模板的图像区域进行剔除;
II)利用边缘检测算法基于印章内部结构特征过滤印章图像区域:利用边缘提取方法提取各剩余图像区域的边缘信息并计算结构复杂度,结构复杂度SC表示为:
SC=Edge/Dia
其中,Edge为边缘提取后的图像区域内的像素点总和,Dia为图像外接矩形的对角线长度;设复杂度阀值ω为通过大量实验获得的经验值,若结构复杂度大于复杂度阀值ω时,其对应的图像区域为印章区域,反之为非印章区域;
4)在输入图像中提取印章图像。
2.如权利要求1的一种基于结构特征的中国书画印章图像自动提取方法,其特征在于:所述步骤2)中连通区域的计算方法,使用种子填充算法、扫描线填充算法或边填充算法。
3.如权利要求1或2所述的一种基于结构特征的中国书画印章图像自动提取方法,其特征在于:所述步骤3)中的印章轮廓模板包括矩形模板、椭圆形模板、葫芦形、瓦当形或刀形。
CN2009100823737A 2009-04-15 2009-04-15 一种基于结构特征的中国书画印章图像自动提取方法 Expired - Fee Related CN101533517B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100823737A CN101533517B (zh) 2009-04-15 2009-04-15 一种基于结构特征的中国书画印章图像自动提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100823737A CN101533517B (zh) 2009-04-15 2009-04-15 一种基于结构特征的中国书画印章图像自动提取方法

Publications (2)

Publication Number Publication Date
CN101533517A CN101533517A (zh) 2009-09-16
CN101533517B true CN101533517B (zh) 2012-05-23

Family

ID=41104094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100823737A Expired - Fee Related CN101533517B (zh) 2009-04-15 2009-04-15 一种基于结构特征的中国书画印章图像自动提取方法

Country Status (1)

Country Link
CN (1) CN101533517B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103035014A (zh) * 2011-09-29 2013-04-10 索尼公司 图像处理设备和方法,以及成像设备和方法
CN102404649A (zh) * 2011-11-30 2012-04-04 江苏奇异点网络有限公司 水印位置自适应的视频水印添加方法
CN102831397A (zh) * 2012-07-23 2012-12-19 常州蓝城信息科技有限公司 一种基于几何匹配和分合算法的人脸识别方法
CN103049904B (zh) * 2012-11-30 2016-04-20 北京华夏力鸿商品检验有限公司 一种图像提取方法及其系统、电子证书制作方法及其系统
CN103440671B (zh) * 2013-08-23 2016-12-28 方正国际软件有限公司 一种印章检测方法及系统
CN103729832A (zh) * 2014-01-21 2014-04-16 厦门美图网科技有限公司 一种基于Lab色彩模式进行祛除彩噪的图像增强的方法
CN104391878A (zh) * 2014-10-31 2015-03-04 小米科技有限责任公司 图书检索方法和装置
CN105335746B (zh) * 2015-07-16 2018-07-20 西北大学 一种基于shear变换和引导滤波器的书法字提取方法
CN106934846B (zh) * 2015-12-29 2020-05-22 深圳先进技术研究院 一种布料图像处理方法及系统
CN107403405A (zh) * 2016-05-20 2017-11-28 富士通株式会社 图像处理装置、图像处理方法以及信息处理装置
CN108345891A (zh) * 2017-01-23 2018-07-31 北京京东尚科信息技术有限公司 图书轮廓提取方法和装置
CN107194400B (zh) * 2017-05-31 2019-12-20 北京天宇星空科技有限公司 一种财务报销全票据图片识别处理方法
CN107292280A (zh) * 2017-07-04 2017-10-24 盛世贞观(北京)科技有限公司 一种印鉴字体自动识别方法及识别装置
CN108154503A (zh) * 2017-12-13 2018-06-12 西安交通大学医学院第附属医院 一种基于图像处理的白癜风病情诊断系统
CN108109117A (zh) * 2017-12-14 2018-06-01 柳州智视科技有限公司 一种基于运动物体的颜色实时变换的方法
CN108197642B (zh) * 2017-12-25 2021-11-30 山东浪潮云服务信息科技有限公司 一种印章鉴别方法及装置
CN109993749A (zh) * 2017-12-29 2019-07-09 北京京东尚科信息技术有限公司 提取目标图像的方法和装置
CN108596223A (zh) * 2018-04-11 2018-09-28 珠海博明视觉科技有限公司 一种自动生成物体数据集的方法
CN108830133B (zh) * 2018-04-17 2020-02-21 平安科技(深圳)有限公司 合同影像图片的识别方法、电子装置及可读存储介质
CN110533049B (zh) * 2018-05-23 2023-05-02 富士通株式会社 提取印章图像的方法和装置
CN109300119B (zh) * 2018-09-11 2020-10-30 石家庄铁道大学 钢结构表面锈蚀区域的检测方法、检测装置及终端设备
CN109447068A (zh) * 2018-10-26 2019-03-08 信雅达系统工程股份有限公司 一种从图像中分离印章并校准印章的方法
CN109344917A (zh) * 2018-11-08 2019-02-15 李凯兵 一种毒蛾属昆虫的物种鉴别方法及鉴别系统

Also Published As

Publication number Publication date
CN101533517A (zh) 2009-09-16

Similar Documents

Publication Publication Date Title
CN101533517B (zh) 一种基于结构特征的中国书画印章图像自动提取方法
Lu et al. Salient object detection using concavity context
CN105205488B (zh) 基于Harris角点和笔画宽度的文字区域检测方法
Sumathi et al. A survey on various approaches of text extraction in images
CN104299009B (zh) 基于多特征融合的车牌字符识别方法
CN101763440B (zh) 对搜索图像的过滤方法
CN101122999B (zh) 一种自动提取中国书画作品中印章图像的方法
CN109409384A (zh) 基于细粒度图像的图像识别方法、装置、介质及设备
CN103473551A (zh) 基于sift算子的台标识别方法及系统
CN105718552A (zh) 基于服装手绘草图的服装图像检索方法
CN107945244A (zh) 一种基于人脸照片的简笔画生成方法
Tian et al. Natural scene text detection with MC–MR candidate extraction and coarse-to-fine filtering
CN105931241B (zh) 一种自然场景图像的自动标注方法
CN102968637A (zh) 一种复杂背景图像文字分割方法
CN104361096B (zh) 一种基于特征富集区域集合的图像检索方法
CN102629322A (zh) 一种基于边界点笔画形状的字符特征提取方法及应用
CN107480585A (zh) 基于dpm算法的目标检测方法
CN105957124A (zh) 具有重复场景元素的自然图像颜色编辑方法及装置
CN105808665A (zh) 一种新的基于手绘草图的图像检索方法
CN112906550A (zh) 一种基于分水岭变换的静态手势识别方法
CN107357834A (zh) 一种基于视觉显著性融合的图像检索方法
CN109858501A (zh) 一种两相流流型特征提取方法
CN104809721A (zh) 一种漫画分割方法及装置
CN102609891B (zh) 一种基于纹理特征的数字图像被动盲取证方法
CN103065152B (zh) 一种视频中数字时钟的识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20160415

CF01 Termination of patent right due to non-payment of annual fee