CN110533049A - 提取印章图像的方法和装置 - Google Patents
提取印章图像的方法和装置 Download PDFInfo
- Publication number
- CN110533049A CN110533049A CN201810501423.XA CN201810501423A CN110533049A CN 110533049 A CN110533049 A CN 110533049A CN 201810501423 A CN201810501423 A CN 201810501423A CN 110533049 A CN110533049 A CN 110533049A
- Authority
- CN
- China
- Prior art keywords
- seal
- image
- pixel
- region
- color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
- G06V10/464—Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种提取印章图像的方法,包括:在图像中识别印章区域;提取印章区域中的笔划;确定所提取的笔划的主颜色特征;扩大印章区域;确定扩大后的印章区域中的前景像素和背景像素,其中前景像素为对应于所述主颜色特征的像素,背景像素为除前景像素以外的像素;获得扩大后的印章区域的灰度图像;在灰度图像中相对于背景像素增强前景像素以获得增强图像;去除增强图像中的噪声以获得印章图像。
Description
技术领域
本公开涉及提取印章图像的方法和装置,尤其涉及古籍文档中印章图像的提取。
背景技术
印章,又称图章,用作印于文件上表示鉴定或签署的文具,一般通过在印章上施加颜料再印压在文档上,而有些印章则施加于蜡或火漆上、信封上以形成蜡印。制作材质有金属、木头、石头、玉石等。本文提及的印章图像,含义为经印章印压所形成的图像。
传统的印章提取方法一般通过提取图像中满足特定形状及颜色的区域来实现印章检测功能,这些算法往往适用于清晰的现代文档图像。而对于特殊类型的现代文档、特殊的印章以及古籍文档和印章,传统的印章提取方法无法做到准确地提取印章图像。
以古籍文档为例,在古籍中,作为一种特殊的古籍信息元素,印章(也称钤印)包含了重要的古籍版本信息。在古籍普查中有专门的钤印表,著录古籍在递藏过程中所钤盖的印章信息,包括印章释文、所有者朝代、所有者姓名、印文类型、印章形状等。在古籍数字资源库开发过程中,古籍钤印及释文也成为可检索的对象,以提供对版本源流、藏书文化研究的重要支撑。由于中国古籍文档种类繁多,钤印也形状各异,且大多文档纸张退化现象严重,传统方法在古籍文档图像中并不适用。因此,目前针对古籍文档图像中的印章提取、检索与分析工作大多通过手工完成,耗时耗力。而针对古籍文档,现有的印章图像提取方法也无法完整、准确地提取出印章图像。
因此,作为示例,本文以古籍文档的印章图像提取进行说明,旨在提供一种能够对包括古籍文档在内的具有印章的文档进行印章提取的技术,需要注意的是,本发明也适用于具有印章的现代文档的印章图像提取。
应该注意,上面对技术背景的介绍只是为了方便对本申请的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本申请的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
在下文中将给出关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图确定本公开的关键或重要部分,也不是意图限定本公开的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
为了实现本公开的目的,根据本公开的一个方面,提供了提取印章图像的方法,包括:在图像中识别印章区域;提取印章区域中的笔划;确定所提取的笔划的主颜色特征;扩大印章区域;确定扩大后的印章区域中的前景像素和背景像素,其中前景像素为对应于所述主颜色特征的像素,背景像素为除所述前景像素以外的像素;获得扩大后的印章区域的灰度图像;在灰度图像中相对于背景像素增强前景像素以获得增强图像;去除增强图像中的噪声以获得印章图像。
根据本公开的另一方面,还提供了印章提取装置,包括:至少一个处理器,被配置成执行提取印章图像的方法。
通过根据本公开的印章图像提取技术实现的提取印章图像的方法,对包括古籍文档在内的具有印章的文档中的印章进行提取,相比于现有技术,提升了印章图像提取的准确率。
附图说明
参照下面结合附图对本公开实施方式的说明,会更加容易地理解本公开的以上和其它目的、特点和优点,在附图中:
图1是示出使用Faster R-CNN对图像中的对象进行提取的系统框图;
图2A是示出使用Faster R-CNN提取的某一类型的古籍中的印章图像的提取框的示意图;
图2B是示出使用Faster R-CNN提取的另一类型的古籍中的印章图像的提取框的示意图;
图3是示出仅使用Faster R-CNN提取古籍中的印章图像存在的偏差的示意图;
图4示出了根据本发明的一个实施方式的方法步骤的流程图;
图5是示出使用SSR方法提取笔划前和提取笔划后的对比图;
图6是示出扩大印章提取框覆盖区域后的示意图;
图7A是示出在灰度图像中利用颜色特征保留前景和去除背景后的结果的示意图;
图7B是示出在灰度图像中利用颜色特征去除前景和保留背景后的结果的示意图;
图7C是示出对图7A和图7B进行进一步处理的示意图;
图7D是示出对图7C进行二值化处理后的示意图;
图8A是示出所提取的二值化印章图像的示意图;
图8B是示出所提取的印章图像的示意图;
图9是示出可用来实现根据本公开的实施方式的印章图像提取方法的装置的通用机器的结构简图。
具体实施方式
在下文中将结合附图对本公开的示例性实施方式进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,本领域技术人员在实现实施方式的过程中可以做出很多特定于实施方式的决定,以便实现实施方式,并且这些决定可能会随着实施方式的不同而有所改变。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本公开,在附图中仅仅示出了与根据本公开的方案密切相关的部件,而省略了与本公开关系不大的其他细节。
下面参考附图描述这里公开的示例性实施例。应当注意,出于清楚的目的,在附图和描述中省略了有关所属技术领域的技术人员知道但是与示例性实施例无关的部分和过程的表示和说明。
本领域的技术人员可以理解,示例性实施例的各方面可以被实施为系统、方法或计算机程序产品。因此,示例性实施例的各个方面可以具体实现为以下形式,即,可以是完全硬件实施例、完全软件实施例(包括固件、驻留软件、微代码等)、或组合软件部分与硬件部分的实施例,本文可以一般称为"电路"、"模块"或"系统"。此外,示例性实施例的各个方面可以采取体现为一个或多个计算机可读介质的计算机程序产品的形式,该计算机可读介质上面体现有计算机可读程序代码。可以例如通过计算机网络来分发计算机程序,或者计算机程序可以位于一个或更多个远程服务器上,或被嵌入设备的存储器中。
可以使用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质例如可以是,但不限于电的、磁的、光的、电磁的、红外线的、或半导体的系统、设备或装置、或前述各项的任何适当的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括以下:有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储装置、磁存储装置、或前述各项的任何适当的组合。在本文语境中,计算机可读存储介质可以是任何含有或存储供指令执行系统、设备或装置使用的或与指令执行系统、设备或装置相联系的程序的有形介质。
计算机可读信号介质可以包括例如在基带中或作为载波的一部分传播的其中带有计算机可读程序代码的数据信号。这样的传播信号可以采取任何适当的形式,包括但不限于电磁的、光的或其任何适当的组合。
计算机可读信号介质可以是不同于计算机可读存储介质的、能够传达、传播或传输供指令执行系统、设备或装置使用的或与指令执行系统、设备或装置相联系的程序的任何一种计算机可读介质。
体现在计算机可读介质中的程序代码可以采用任何适当的介质传输,包括但不限于无线、有线、光缆、射频等等、或上述各项的任何适当的组合。
用于执行这里公开的示例性实施例的各方面的操作的计算机程序代码可以以一种或多种程序设计语言的任何组合来编写,所述程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++之类,还包括常规的过程式程序设计语言,诸如"C"程序设计语言或类似的程序设计语言。
以下参照按照示例性实施例的方法、设备(系统)和计算机程序产品的流程图和/或框图来描述这里公开的示例性实施例的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理设备的处理器以生产出一种机器,使得通过计算机或其它可编程数据处理设备执行的这些指令产生用于实现流程图和/或框图中的方框中规定的功能/操作的装置。
也可以把这些计算机程序指令存储在能够指引计算机或其它可编程数据处理设备以特定方式工作的计算机可读介质中,使得存储在计算机可读介质中的指令产生一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令的制造品。
也可以把计算机程序指令加载到计算机或其它可编程数据处理设备上,导致在计算机或其它可编程数据处理设备上执行一系列操作步骤以产生计算机实现的过程,使得在计算机或其它可编程设备上执行的指令提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
图1是示出使用Faster R-CNN对图像中的对象进行提取的系统框图。
传统地,图像中对象的提取通常采用基于内容的图像检索CBIR,即直接采用图像内容进行图像信息查询的检索,在图像数据库中检索与用户所提交样本图像在内容上一致或相似的图像集合的过程,通过对图像底层特征的比较来实现检索。包括特征抽取、相似度量、图像匹配、用户反馈等方向。基于色彩特征的检索方法是CBIR的主要方法之一,它所抽取的特征向量是颜色直方图,虽然能够较好地反映图像中各种颜色的频率分布,而且对图像中对象的旋转以及观察位置的变化不敏感。基于图像特征提取以实现图像检索的过程以及CBIR这一概念,被广泛应用于各种研究领域,如统计学、模式识别、信号处理和计算机视觉。
但是在古籍印章图像的提取方面,CBIR存在较大的弊端。原因在于:古籍文档从主题到表现手法,再到绘画书法技巧,颜料和纸张的运用等方面,同一类作品大都具有较强的低层视觉特征的一致性。其次,由于古籍作品由于其丰富的文化背景,而包含了更加复杂的语义信息。所以在单纯利用低层视觉特征的,基于内容的图像检索技术,进行古籍作品中的对象提取,很难达到良好效果。
近些年,提出了卷积神经网络(Convolutional Neural Network,CNN),其是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。它包括卷积层(convolutional layer)和池化层(pooling layer)。CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习,所以在使用CNN时,避免了显式的特征抽取,而隐式地从训练数据中进行学习;再者由于同一特征映射面上的神经元权值相同,所以网络可以并行学习,这也是卷积网络相对于神经元彼此相连网络的一大优势。卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。
而后,CNN又经历了R-CNN和Fast R-CNN的演进,直到Ross B.Girshick在2016年提出了新的Faster R-CNN,在结构上,Faster R-CNN已经将特征抽取、建议提取、Bbox回归、分类都整合在一个网络中,使得综合性能有较大提高,在检测速度方面尤为明显。
在本发明中,参照图1,使用Faster R-CNN对印章图像进行初步提取。首先,在101处向CNN网络输入任意尺寸的图片;经过CNN网络前向传播至共享卷积层102,一方面得到供RPN网络输入的特征110,另一方面继续前向传播至特有卷积层103,产生更高维度的特征图104;供RPN网络输入的特征图经过RPN区域推荐网络的滑动窗111、卷积层/全连接层112和113、得到区域建议114和区域得分115,并对区域得分115采用非极大值抑制,将排名靠前的区域得分的区域建议输出给ROI池化层106;高维特征图104、区域建议105、区域建议114被输入到ROI池化层106,ROI池化层106的输出通过全连接层107后,输出该区域的分类得分108以及回归后的bounding-box 109。由于Faster R-CNN对于本领域技术人员是公知的,本文仅对其在本公开的实施方式中的应用进行描述,而不对其原理进行更为详细的描述。
图2A和图2B示出了使用Faster R-CNN提取的不同类型的古籍中的印章图像,显然,图2A和图2B均示出了正确提取的示例。然而,发明人在使用Faster R-CNN对大量古籍提取印章图像的过程中发现,即使采用这种方法也常常由于诸如前景图像与背景图像的混叠、古籍中杂乱的比划、多个印章的接近、重叠等原因而存在例如图3中所示的提取偏差的问题。在图3中,可以看到,算法自动生成的印章识别矩形框301不仅覆盖了待提取印章的一部分,还覆盖了其它印章的部分。
接下来,将结合图4至图8B对根据本公开的实施方式的印章图像提取方法进行描述。
图4示出了根据本发明的实施方式的方法步骤的流程图。
在图4的步骤401中,使用如图1所示的Faster-RCNN对古籍文档进行印章图像的初步提取。具体的提取方法可参见图1所示框图,以及Ross B.Girshick在2016年提出了Faster R-CNN的相关说明,由于这部分内容对于本领域技术人员是公知的,因此即使本文不对其原理进行更详细的描述,本领域技术人员也能够实现步骤401。
在步骤402中,对通过步骤401所提取的印章区域中的笔划进行进一步提取。在这里所使用的笔划提取方法是基于笔画稳定区域(Stable Stroke Region,SSR)的笔划提取技术。对典型的中国古籍文档图像来说,印章区域一般为封闭的红色笔画密集区域。针对这一特点,首先通过颜色空间变化,在更符合人类感知颜色原理的颜色空间中增强图像中红色的区域。同时,利用文字区域在不同的阈值下能够保持较稳定的笔画特征这一特点并结合封闭区域判断等技术,可提取出文档图像中的红色印章笔划区域。由于SSR对于本领域技术人员是公知的,因此即使本文不对其原理进行更详细的描述,本领域技术人员也能够实现步骤402。图5是使用SSR方法提取笔划前和提取笔划后的对比图。
在提取了笔划后,在步骤403中,在颜色空间例如RGB颜色空间中对笔划的颜色进行统计以获得笔划的主颜色特征,例如可以基于颜色空间中各个通道的数值来确定主颜色特征,主颜色特征的一个示例的含义为:主颜色(例如红色)的数值(例如R值)与其他颜色(例如蓝色和绿色)的每个颜色的数值(例如B值或G值)的差值之和大于预定阈值,即(R-B)+(R-G)>threshold。另一个示例的含义可以例如是:在(R-B)+(R-G)>threshold时,主颜色的数值(例如R值)处于经计算的数值区间中,该经计算的数值区间可以是笔划中所有像素的主颜色值中的最小值与最大值所形成的数值区间,而主颜色特征也不限于上述含义。需要明确的是,确定主颜色特征的目的在于,在后续步骤中确定未提取印章区域中具有与该印章的主颜色特征相同或相似的特征的像素,以完整、准确地检测出印章区域。因此,基于上述描述,本领域技术人员能够预见到其他确定主颜色特征的方式。
如图3所示,其示出了未覆盖完整印章的检测框301,因此为了提取完整的印章图像,在图4的步骤404中,执行扩大印章区域的操作,根据一种实施方式,以检测框301的中心为基准,在长度和宽度方向上,将长度和宽度分别扩大为相同/不同的预定倍数(大于1的实数),当然本领域技术人员能够预见到其它扩大印章检测区域以包括完整的印章图像的方式。图6中的框601是图3中的框301扩大后的框的图示,正如图6所示出的,框601已经能够覆盖完整的印章图像。
但是,从图6可以看出,框601仍然包含不属于印章的噪声,在本示例中,噪声包括框601下部区域的其他印章部分以及待检测印章区域中的不属于印章的古籍文字部分。接下来,将描述如何去除这些噪声。
在步骤405中,确定扩大后的印章区域中的前景像素和背景像素,其中前景像素为对应于主颜色特征的像素,背景像素为除前景像素以外的像素;在本示例的古籍图像中,印章图像中的像素为前景像素,除去印章图像中的像素的其他像素即为背景像素。
接下来,在步骤406中,获得扩大后的印章区域的灰度图像,并在该灰度图像中相对于背景像素增强前景像素以获得增强图像,这个步骤操作的目的是将前景与背景分离,从而可以获得具有主颜色特征的印章图像的部分。由于古籍图像的前景图像(印章)的颜色通常具有颜色(如红色),而背景(包括纸张和书法等)颜色通常不具有颜色(如黑色和白色),因此利用颜色信息可以达到分离前景和背景的目的,根据上述描述,本领域技术人员知晓如何分离。
图7A示出了在灰度图像中利用前景和背景中像素的颜色特征保留前景(印章)、去除背景(书法和纸张等)的结果F_layer的图示,这里的保留可以是维持/基本维持/少量增加/大量增加像素的灰度值,这里的去除可以是少量减少/大量减少像素的灰度值,由于前景背景分离方法对于本领域技术人员是公知的,因此即使本文不对其原理进行更详细的描述,本领域技术人员也能够实现步骤406。本文的前景与背景分类的方法使用了“SEPARATION OF OVERLAPPED COLOR PLANES FOR DOCUMENT IMAGES”,Danian Zheng etal.,Proceedings of 2010IEEE 17TH International Conference on Image Processing中描述的方法,其全部内容在此被引入本公开内容。
但是,可以看到,图7A的经前景背景分离后的图像并没有完全地将前景与背景彻底分离,因此考虑进行进一步处理,采用与图7A涉及的处理方法类似的方法在灰度图像中利用颜色特征去除前景(印章)、保留背景(书法和纸张等),同样地,这里的保留可以是维持/基本维持/少量增加/大量增加像素的灰度值,这里的去除可以是少量减少/大量减少像素的灰度值。图7B示出了经过这样的处理的结果B_layer。
然后,使用下面的公式进行进一步的计算:
(255-F_layer)+B_layer)/2
通过该公式的计算,得到了如图7C所示的结果,可以看出,经过上述处理,最大程度地相对于背景增强了前景。接下来,使用例如OTSU的二值化方法对图7C所示的图像进行进一步处理,得到图7D所示的二值图像。
最大类间方差法OTSU是一种自适应的阈值确定的方法。它是按图像的灰度特性,将图像分成背景和目标两部分。背景和目标之间的类间方差越大,说明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。由于OTSU对于本领域技术人员是公知的,因此即使本文不对其原理进行更详细的描述,本领域技术人员也能够加以实现。
虽然图7D的图像已经分离了前景和背景,但能够注意到,在下部区域中仍然存在不属于待提取印章的其他印章的部分以及其他较小的连接噪声。
针对图7D的二值图像,可以采用例如连通域分析方法的图像处理中的后处理方法进行处理从而实现多个待提取区域的分离。下面对连通域分析方法作简要介绍:一幅图像二值化处理后往往包含多个区域,需要通过标记把它们分别提取出来。标记分割后图像中各区域的简单而有效的方法是检查各像素与其相邻像素的连通性。在二值图像中,背景区像素的值为0,目标区域的像素值为1。假设对一幅图像从左向右,从上向下进行扫描,要标记当前正被扫描的像素需要检查它与在它之前被扫描到的若干个近邻像素的连通性。考虑4连通的情形。对图像进行逐像素扫描。假如当前像素值为0,就移动到下一个扫描的位置。假如当前像素值为1,检查它左边和上边的两个邻接像素。这两个像素值和标记的组合有四种情况要考虑。这样即可保证所有的连通域都被标记出来。之后再通过对不同的标记赋予不同的颜色或将其加上边框即可完成标记。由于例如连通域标记方法的图像后处理方法对于本领域技术人员是公知的,因此即使本文不对其原理进行更详细的描述,本领域技术人员也能够加以实现。
借助例如连通域分析方法的图像后处理方法处理如图7D所示的二值图像,能够得到如图8A所示的二值化印章图像。
基于目前得到的图8A,利用例如边缘检测方法可以确定图8A的二值化印章图像的边缘,从而得到如图8B所示的最终确定的提取框801。而提取框801围成的区域即为最终提取的印章图像区域。
在各种实施方式中,在图像中识别印章区域使用深度学习方法可以为RCNN、FAST-RCNN或FASTER-RCNN。
由于最终提取的印章图像区域是正确提取的印章图像区域,因此该正确提取的印章图像可以被补充到各种实施方式中的例如RCNN、FAST-RCNN或FASTER-RCNN深度学习方法的训练集中进行学习,从而可以使得深度学习方法的初步提取准确率获得提升。
尽管上文仅结合古籍中的印章图像提取描述本公开的实施方式,但是对于本领域技术人员明显的是,本公开的实施方式同样可以应用于其它各种类型文档中的印章图像的提取。
图9是示出可用来实现根据本公开的实施方式的信息处理装置和信息处理方法的通用机器900的结构简图。通用机器900可以是例如计算机系统。应注意,通用机器900只是一个示例,并非暗示对本公开的方法和装置的使用范围或者功能的局限。也不应将通用机器900解释为对上述信息处理方法和信息处理装置中示出的任一组件或其组合具有依赖或需求。
在图9中,中央处理单元(CPU)901根据只读存储器(ROM)902中存储的程序或从存储部分908加载到随机存取存储器(RAM)903的程序执行各种处理。在RAM 903中,还根据需要存储当CPU 901执行各种处理等等时所需的数据。CPU 901、ROM 902和RAM 903经由总线904彼此连接。输入/输出接口905也连接到总线904。
下述部件也连接到输入/输出接口905:输入部分906(包括键盘、鼠标等等)、输出部分907(包括显示器,例如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分908(包括硬盘等)、通信部分909(包括网络接口卡例如LAN卡、调制解调器等)。通信部分909经由网络例如因特网执行通信处理。根据需要,驱动器910也可连接到输入/输出接口905。可拆卸介质911例如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器910上,使得从中读出的计算机程序可根据需要被安装到存储部分908中。
在通过软件实现上述系列处理的情况下,可以从网络例如因特网或从存储介质例如可拆卸介质911安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图9所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质911。可拆卸介质911的例子包含磁盘(包含软盘)、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 902、存储部分908中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
此外,本公开还提出了一种存储有计算机可读的程序指令的计算机程序产品。所述指令代码由计算机读取并执行时,可执行上述根据本公开的信息处理方法。相应地,用于承载这种程序指令的上面列举的各种存储介质也包括在本公开的范围内。
上面已通过框图、流程图和/或实施方式进行了详细描述,阐明了根据本公开的实施方式的装置和/或方法的具体实施方式。当这些框图、流程图和/或实施方式包含一个或多个功能和/或操作时,本领域的技术人员明白,这些框图、流程图和/或实施方式中的各功能和/或操作可以通过各种硬件、软件、固件或实质上它们的任意组合而单独地和/或共同地实施。在一种实施方式中,本说明书中描述的主题的几个部分可通过特定用途集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)或其他集成形式实现。然而,本领域的技术人员会认识到,本说明书中描述的实施方式的一些方面能够全部或部分地在集成电路中以在一个或多个计算机上运行的一个或多个计算机程序的形式(例如,以在一个或多个计算机系统上运行的一个或多个计算机程序的形式)、以在一个或多个处理器上运行的一个或多个程序的形式(例如,以在一个或多个微处理器上运行的一个或多个程序的形式)、以固件的形式、或以实质上它们的任意组合的形式等效地实施,并且,根据本说明书中公开的内容,设计用于本公开的电路和/或编写用于本公开的软件和/或固件的代码完全是在本领域技术人员的能力范围之内。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。涉及序数的术语并不表示这些术语所限定的特征、要素、步骤或组件的实施顺序或者重要性程度,而仅仅是为了描述清楚起见而用于在这些特征、要素、步骤或组件之间进行标识。
综上,在根据本公开的实施方式中,本公开提供了如下方案,但不限于此:
方案1.一种提取印章图像的方法,包括:
在图像中识别印章区域;
提取所述印章区域中的笔划;
确定所提取的笔划的主颜色特征;
扩大所述印章区域;
确定扩大后的印章区域中的前景像素和背景像素,其中所述前景像素为对应于所述主颜色特征的像素,所述背景像素为除所述前景像素以外的像素;
获得扩大后的印章区域的灰度图像;
在所述灰度图像中相对于所述背景像素增强所述前景像素以获得增强图像;
去除所述增强图像中的噪声以获得印章图像。
方案2.根据方案1所述的方法,所述主颜色特征指的是主颜色的颜色值与其他颜色的每个颜色的颜色值的差值之和大于预设阈值。
方案3.根据方案1所述的方法,在去除所述增强图像中的噪声之前还包括对所述增强图像进行二值化处理。
方案4.根据方案3所述的方法,所述二值化处理为OTSU方法。
方案5.根据方案1所述的方法,还包括基于所获得的印章图像确定所述印章的印章区域以更新识别印章区域的深度学习方法所使用的训练集。
方案6.根据方案1所述的方法,其中所述噪声包括不属于所述印章的其他印章的部分。
方案7.根据方案6所述的方法,其中通过连通域分析方法去除不属于所述印章的所述其他印章的部分。
方案8.根据方案1所述的方法,其中所述提取所述印章区域中的笔划使用笔划提取方法,所述笔划提取方法为SSR方法。
方案9.根据方案1所述的方法,其中所述在图像中识别印章区域使用深度学习方法,所述深度学习方法为RCNN、FAST-RCNN或FASTER-RCNN。
方案10.根据方案1所述的方法,所述主颜色特征指的是当主颜色的颜色值与其他颜色的每个颜色的颜色值的差值之和大于预设阈值时,主颜色的数值处于经计算的数值区间中,其中所述经计算的数值区间是笔划中所有像素的主颜色值中的最小值与最大值所形成的数值区间。
方案11.根据方案1所述的方法,扩大所述印章区域是指将所述印章区域的长度和宽度分别扩大为相同或不同的预定倍数。
方案12.根据方案1所述的方法,所述在所述灰度图像中相对于所述背景像素增强所述前景像素以获得增强图像包括:基于在所述灰度图像中利用前景和背景中像素的颜色特征保留前景和去除背景以及在所述灰度图像中利用前景和背景中像素的颜色特征去除前景和保留背景来获得所述增强图像。
方案13.一种印章提取装置,包括:
至少一个处理器,被配置成执行前述方案之一所述的方法。
方案14.一种存储有计算机可读的程序指令的计算机可读介质,当所述程序指令由计算机执行时,用于实现提取印章图像的方法。
尽管上面已经通过对本公开的具体实施方式的描述对本公开进行了披露,但是,应该理解,本领域的技术人员可在所附权利要求的精神和范围内设计对本公开的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本公开的保护范围内。
Claims (10)
1.一种提取印章图像的方法,包括:
在图像中识别印章区域;
提取所述印章区域中的笔划;
确定所提取的笔划的主颜色特征;
扩大所述印章区域;
确定扩大后的印章区域中的前景像素和背景像素,其中所述前景像素为对应于所述主颜色特征的像素,所述背景像素为除所述前景像素以外的像素;
获得扩大后的印章区域的灰度图像;
在所述灰度图像中相对于所述背景像素增强所述前景像素以获得增强图像;
去除所述增强图像中的噪声以获得印章图像。
2.根据权利要求1所述的方法,所述主颜色特征指的是主颜色的颜色值与其他颜色的每个颜色的颜色值的差值之和大于预设阈值。
3.根据权利要求1所述的方法,在去除所述增强图像中的噪声之前还包括对所述增强图像进行二值化处理。
4.根据权利要求3所述的方法,所述二值化处理为OTSU方法。
5.根据权利要求1所述的方法,还包括基于所获得的印章图像确定所述印章的印章区域以更新识别印章区域的深度学习方法所使用的训练集。
6.根据权利要求1所述的方法,其中所述噪声包括不属于所述印章的其他印章的部分。
7.根据权利要求6所述的方法,其中通过连通域分析方法去除不属于所述印章的所述其他印章的部分。
8.根据权利要求1所述的方法,其中所述提取所述印章区域中的笔划使用笔划提取方法,所述笔划提取方法为SSR方法。
9.根据权利要求1所述的方法,其中所述在图像中识别印章区域使用深度学习方法,所述深度学习方法为RCNN、FAST-RCNN或FASTER-RCNN。
10.一种印章提取装置,包括:
至少一个处理器,被配置成执行前述权利要求之一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810501423.XA CN110533049B (zh) | 2018-05-23 | 2018-05-23 | 提取印章图像的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810501423.XA CN110533049B (zh) | 2018-05-23 | 2018-05-23 | 提取印章图像的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110533049A true CN110533049A (zh) | 2019-12-03 |
CN110533049B CN110533049B (zh) | 2023-05-02 |
Family
ID=68657539
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810501423.XA Active CN110533049B (zh) | 2018-05-23 | 2018-05-23 | 提取印章图像的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110533049B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508145A (zh) * | 2020-12-16 | 2021-03-16 | 平安银行股份有限公司 | 电子印章生成及验证方法、装置、电子设备及存储介质 |
CN113255686A (zh) * | 2021-07-15 | 2021-08-13 | 恒生电子股份有限公司 | 图像中印章的识别方法、装置、处理设备及存储介质 |
CN114979589A (zh) * | 2021-02-26 | 2022-08-30 | 深圳怡化电脑股份有限公司 | 图像处理方法、装置、电子设备及介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101533517A (zh) * | 2009-04-15 | 2009-09-16 | 北京联合大学 | 一种基于结构特征的中国书画印章图像自动提取方法 |
CN101599124A (zh) * | 2008-06-03 | 2009-12-09 | 汉王科技股份有限公司 | 一种从视频图像中分割字符的方法和装置 |
US20100067785A1 (en) * | 2008-09-17 | 2010-03-18 | Fuji Xerox Co., Ltd. | Image processing apparatus, image forming apparatus and computer readable medium |
WO2011112522A2 (en) * | 2010-03-10 | 2011-09-15 | Microsoft Corporation | Text enhancement of a textual image undergoing optical character recognition |
JP2012181618A (ja) * | 2011-02-28 | 2012-09-20 | Fujitsu Frontech Ltd | 画像処理プログラムおよび画像処理装置 |
CN102842035A (zh) * | 2012-07-11 | 2012-12-26 | 北京京北方信息技术有限公司 | 一种针对凭证影像的矩形印章定位方法及装置 |
CN104298982A (zh) * | 2013-07-16 | 2015-01-21 | 深圳市腾讯计算机系统有限公司 | 一种文字识别方法及装置 |
CN104408721A (zh) * | 2014-11-25 | 2015-03-11 | 西安交通大学 | 基于背景密度估计的印章图像提取方法 |
CN104834890A (zh) * | 2015-02-13 | 2015-08-12 | 浙江大学 | 一种对书法作品中文字神采信息的提取方法 |
CN106326895A (zh) * | 2015-06-16 | 2017-01-11 | 富士通株式会社 | 图像处理装置和图像处理方法 |
CN107403405A (zh) * | 2016-05-20 | 2017-11-28 | 富士通株式会社 | 图像处理装置、图像处理方法以及信息处理装置 |
-
2018
- 2018-05-23 CN CN201810501423.XA patent/CN110533049B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101599124A (zh) * | 2008-06-03 | 2009-12-09 | 汉王科技股份有限公司 | 一种从视频图像中分割字符的方法和装置 |
US20100067785A1 (en) * | 2008-09-17 | 2010-03-18 | Fuji Xerox Co., Ltd. | Image processing apparatus, image forming apparatus and computer readable medium |
CN101533517A (zh) * | 2009-04-15 | 2009-09-16 | 北京联合大学 | 一种基于结构特征的中国书画印章图像自动提取方法 |
WO2011112522A2 (en) * | 2010-03-10 | 2011-09-15 | Microsoft Corporation | Text enhancement of a textual image undergoing optical character recognition |
JP2012181618A (ja) * | 2011-02-28 | 2012-09-20 | Fujitsu Frontech Ltd | 画像処理プログラムおよび画像処理装置 |
CN102842035A (zh) * | 2012-07-11 | 2012-12-26 | 北京京北方信息技术有限公司 | 一种针对凭证影像的矩形印章定位方法及装置 |
CN104298982A (zh) * | 2013-07-16 | 2015-01-21 | 深圳市腾讯计算机系统有限公司 | 一种文字识别方法及装置 |
CN104408721A (zh) * | 2014-11-25 | 2015-03-11 | 西安交通大学 | 基于背景密度估计的印章图像提取方法 |
CN104834890A (zh) * | 2015-02-13 | 2015-08-12 | 浙江大学 | 一种对书法作品中文字神采信息的提取方法 |
CN106326895A (zh) * | 2015-06-16 | 2017-01-11 | 富士通株式会社 | 图像处理装置和图像处理方法 |
CN107403405A (zh) * | 2016-05-20 | 2017-11-28 | 富士通株式会社 | 图像处理装置、图像处理方法以及信息处理装置 |
Non-Patent Citations (1)
Title |
---|
葛怀东等: "古籍书影中钤印提取技术的探讨", 《计算机应用与软件》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112508145A (zh) * | 2020-12-16 | 2021-03-16 | 平安银行股份有限公司 | 电子印章生成及验证方法、装置、电子设备及存储介质 |
CN112508145B (zh) * | 2020-12-16 | 2023-05-23 | 平安银行股份有限公司 | 电子印章生成及验证方法、装置、电子设备及存储介质 |
CN114979589A (zh) * | 2021-02-26 | 2022-08-30 | 深圳怡化电脑股份有限公司 | 图像处理方法、装置、电子设备及介质 |
CN114979589B (zh) * | 2021-02-26 | 2024-02-06 | 深圳怡化电脑股份有限公司 | 图像处理方法、装置、电子设备及介质 |
CN113255686A (zh) * | 2021-07-15 | 2021-08-13 | 恒生电子股份有限公司 | 图像中印章的识别方法、装置、处理设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110533049B (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Komura et al. | Machine learning methods for histopathological image analysis | |
Gandhi et al. | Preprocessing of non-symmetrical images for edge detection | |
Shahab et al. | An open approach towards the benchmarking of table structure recognition systems | |
Yi et al. | Localizing text in scene images by boundary clustering, stroke segmentation, and string fragment classification | |
Wu et al. | Research on image text recognition based on canny edge detection algorithm and k-means algorithm | |
JP5174040B2 (ja) | 画像の構成要素と背景とを区別するためにコンピュータで実行される方法および画像の構成要素と背景とを区別するためのシステム | |
CN104077447B (zh) | 基于纸质平面数据的城市三维空间矢量建模方法 | |
Chen et al. | A computer‐aided diagnosis system for differentiation and delineation of malignant regions on whole‐slide prostate histopathology image using spatial statistics and multidimensional DenseNet | |
CN107527054B (zh) | 基于多视角融合的前景自动提取方法 | |
Li et al. | Patch transformer for multi-tagging whole slide histopathology images | |
CN110533049A (zh) | 提取印章图像的方法和装置 | |
Sharma et al. | CPD: Faster RCNN-based DragonBall comic panel detection | |
Elanwar et al. | Extracting text from scanned Arabic books: a large-scale benchmark dataset and a fine-tuned Faster-R-CNN model | |
Chen et al. | A knowledge-based system for extracting text-lines from mixed and overlapping text/graphics compound document images | |
JP2022067086A (ja) | デジタル化された筆記の処理 | |
CN103617423B (zh) | 基于色彩参数的图像拆分识别方法 | |
JP2023501161A (ja) | 領域レベルアノテーションのブーストラッピングを使用した画像処理ベースのオブジェクト分類 | |
Zhang et al. | Computational method for calligraphic style representation and classification | |
Razzaghi et al. | Image retargeting using nonparametric semantic segmentation | |
Ghoshal et al. | SVM and MLP based segmentation and recognition of text from scene images through an effective binarization scheme | |
Fan et al. | A robust proposal generation method for text lines in natural scene images | |
Calvo-Zaragoza et al. | Document analysis for music scores via machine learning | |
Nair et al. | Segmentation of highly unstructured handwritten documents using a neural network technique | |
Rigaud et al. | Adaptive contour classification of comics speech balloons | |
Nazemi et al. | Mathematical information retrieval (MIR) from scanned pdf documents and MathML conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |