CN106157250B - 去除文档图像中的印记的方法和设备 - Google Patents
去除文档图像中的印记的方法和设备 Download PDFInfo
- Publication number
- CN106157250B CN106157250B CN201510136941.2A CN201510136941A CN106157250B CN 106157250 B CN106157250 B CN 106157250B CN 201510136941 A CN201510136941 A CN 201510136941A CN 106157250 B CN106157250 B CN 106157250B
- Authority
- CN
- China
- Prior art keywords
- connected component
- picture
- gray
- file
- marking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000011156 evaluation Methods 0.000 claims abstract description 48
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006854 communication Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/457—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种去除文档图像中的印记的方法和设备。根据本发明的去除文档图像中的印记的方法包括:从文档图像对应的二值图像中提取连通分量;基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及基于所述组合中的灰度阈值,去除文档图像中的印记。根据本发明的方法和设备能够有效地、准确地去除文档图像中的印记。
Description
技术领域
本发明一般地涉及图像处理领域。具体而言,本发明涉及一种能够有效地、准确地去除文档图像中的印记的方法和设备。
背景技术
近年来,扫描仪相关的技术取得了飞速的发展。例如,在扫描文档图像的背透检测和去除、文档版面分析、光学字符识别等技术方面,技术人员已经做出许多工作以提高处理效果。然而,仅仅在这些方面做出改进是不够的,为了获得总体更好的技术效果,需要在相关技术的每一方面都取得提高。
例如,扫描文档图像中经常出现各种印记。例如,水印,用来表明该扫描文档图像的出处或者归属,比如,复印标记(copymark),用来防止复印件被非法使用。这些印记作为严重的背景噪声,为光学字符识别等处理增加了很大的难度。而且,这些印记会严重影响读者的阅读体验。图1示出了带有水印的扫描文档图像的示例。图2示出了带有复印标记的扫描文档图像的示例。
传统的去除印记的方法通常基于像素处理。显然,基于像素的处理只能利用像素级的信息,信息有限导致处理起来相对困难,处理结果相对不够准确。
因此,期望一种能够有效地、准确地去除文档图像中的印记的方法和设备。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明的目的是针对现有技术的上述问题,提出了一种能够有效地、准确地去除文档图像中的印记的方法和设备。
为了实现上述目的,根据本发明的一个方面,提供了一种去除文档图像中的印记的方法,该方法包括:从文档图像对应的二值图像中提取连通分量;基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及基于所述组合中的灰度阈值,去除文档图像中的印记。
根据本发明的另一个方面,提供了一种去除文档图像中的印记的设备,该设备包括:提取装置,被配置为:从文档图像对应的二值图像中提取连通分量;聚类装置,被配置为:基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;搜索装置,被配置为:在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及精细去除装置,被配置为:基于所述组合中的灰度阈值,去除文档图像中的印记。
另外,根据本发明的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述方法。
此外,根据本发明的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本发明的上述方法。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中:
图1示出了带有水印的扫描文档图像的示例;
图2示出了带有复印标记的扫描文档图像的示例;
图3示出了根据本发明的实施例的去除文档图像中的印记的方法的流程图;
图4示出了图1中示出的带有水印的扫描文档图像示例对应的二值图像;
图5示出了图2示出的带有复印标记的扫描文档图像示例对应的二值图像;
图6示出了提取的连通分量的示例;
图7示出了图1中示出的带有水印的扫描文档图像示例的去除印记结果;
图8示出了图2中示出的带有复印标记的扫描文档图像示例的去除印记结果;
图9示出了根据本发明实施例的去除文档图像中的印记的设备的结构方框图;以及
图10示出了可用于实施根据本发明实施例的方法和设备的计算机的示意性框图。
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行详细描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施方式的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明关系不大的其他细节。另外,还需要指出的是,在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。
本发明的基本思想是利用连通分量级别的信息,并且利用连通分量的聚类来去除文档图像中的印记,重点在于如何获得最佳或次佳的聚类半径/灰度阈值。
下面将参照图3描述根据本发明的实施例的去除文档图像中的印记的方法的流程。
图3示出了根据本发明的实施例的去除文档图像中的印记的方法的流程图。如图3所示,根据本发明的实施例的去除文档图像中的印记的方法包括如下步骤:从文档图像对应的二值图像中提取连通分量(步骤S1);基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心(步骤S2);在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T)(步骤S3);以及基于所述组合中的灰度阈值,去除文档图像中的印记(步骤S4)。
在步骤S1中,从文档图像对应的二值图像中提取连通分量。
首先,对文档图像进行二值化处理,以得到与文档图像对应的二值图像。二值化处理是图像处理领域的常见处理,在此不再赘述,二值化阈值可以由本领域技术人员根据经验指定。图4示出了图1中示出的带有水印的扫描文档图像示例对应的二值图像。图5示出了图2示出的带有复印标记的扫描文档图像示例对应的二值图像。
然后,从二值图像中提取连通分量(connected component)。连通分量是二值图像中的连接的黑色像素点构成的连通区域。提取连通分量的方法是图像处理领域的技术人员所熟知的,在此不再赘述。图6示出了提取的连通分量的示例,其中也示出了连通分量的外接矩形,又称包围盒。
在步骤S2中,基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心。
本发明的一个基本思想是文档图像中的内容千变万化,但是其中的印记,如水印和复印标记在一个文档图像中是基本不变并且重复出现的,所以最容易聚类到一起形成最大的簇的连通分量应该对应着文档图像中的印记。
聚类连通分量所基于的特征可以是连通分量的灰度特征。连通分量的灰度特征包括:与连通分量中包括的所有黑像素点对应的、文档图像中的像素点的灰度值的最小值。
优选地,聚类连通分量所基于的特征还可以包括连通分量的固有特征。连通分量的固有特征包括:在二值图像中,连通分量中包括的黑像素点的个数、连通分量中包括的黑像素点的个数与该连通分量的包围盒中的像素点的个数的比值、连通分量的包围盒的长宽比中的至少一个。
为了使得本发明的方法能够应用于不同的文档图像,需要对连通分量的灰度特征、连通分量的固有特征进行归一化。连通分量的灰度特征针对整个文档图像进行归一化,并赋予预定权重;连通分量的固有特征针对整个二值图像进行归一化,并赋予预定权重。
例如,假设xi是连通分量的一个特征,是所有连通分量的该特征的平均值,wi是预先定义的该特征的权重,则该特征归一化后的结果为:假设以上4个特征都被利用来进行聚类,则每一个特征相当于一个维度,四个特征构成一个四维的特征向量。根据经验可以给定对应于四维特征向量的四个权重,其中0.5是连通分量的灰度特征的权重。
基于连通分量的灰度特征(优选地还基于连通分量的固有特征),聚类连通分量,得到一个聚类中心的具体做法例如是在特征空间中,统计每个连通分量作为聚类中心时,在给定聚类半径的范围内连通分量的数目;将所统计的最大数目对应的连通分量确定为聚类中心。
也就是说,给定一个聚类半径,看就此聚类半径而言,以哪个连通分量为中心,能够获得包含最大数目的连通分量的簇。将这样的最大簇的中心处的连通分量确定为聚类中心。
寻找聚类中心的方法不限于此,也可采用其它的聚类方法。
这样的聚类中心代表的是背景(印记)连通分量的中心,因为背景连通分量通常具有类似的形状和灰度值,而前景(文字)连通分量通常具有不同的形状、尺寸、灰度值。
为了区分前景连通分量和背景连通分量,仅有聚类中心显然是不够的,还需要适当的聚类半径。另外,聚类连通分量是从二值图像角度出发的,而从文档图像角度出发,可以设置适当的灰度阈值来区分前景和背景。也就是说,既可以利用聚类中心和聚类半径将连通分量分类为前景和背景,然后利用二值图像中的连通分量与文档图像中的像素之间的对应性,确定文档图像中的背景印记。也可以直接利用灰度阈值在文档图像中区分出背景印记。
在步骤S3中,搜索用于分类前景和背景的聚类半径和灰度阈值。
设计适当的评价值,使得当聚类半径R和灰度阈值T最佳时评价值最大。当评价值高于第一评价阈值且不为最大值时,聚类半径R和灰度阈值T取次佳值。这样,可以将评价值作为准则找到最佳或次佳的聚类半径R和灰度阈值T。
评价值可以基于连通分量的灰度特征。如上所述,连通分量的灰度特征包括:与连通分量中包括的所有黑像素点对应的、文档图像中的像素点的灰度值的最小值。
评价值还可以基于连通分量的灰度特征和在二值图像中连通分量中包括的黑像素点的个数两者。
评价值反映基于聚类中心和聚类半径的连通分量分类结果与基于灰度阈值的连通分量分类结果的匹配程度。这是因为当聚类半径和灰度阈值均最合适的时候,基于两者的分类结果最一致。
应注意,聚类半径R和灰度阈值T都具有取值范围。在取值范围内,以一定的步长,可以得到有限个取值。有限个聚类半径R和有限个灰度阈值T可以构成有限个组合(R,T)。对于每一组合(R,T),都可以计算对应的评价值f(R,T)。
聚类半径R的范围例如是从0到最大值,最大值为特征空间中聚类中心与距其最远的特征向量之间的距离。根据经验,也可给定一个聚类半径R的经验范围(5,8)。灰度阈值T的范围例如是从0到255。
搜索满足评价值条件的组合(R,T)的过程相当于一个二维查找的过程。因此,可以同时变化聚类半径R和灰度阈值T,在有限个组合(R,T)中寻找评价值最大或者评价值高于第一评价阈值的组合(R,T)。也可以采用迭代方式,即首先固定聚类半径R和灰度阈值T中的一个,如聚类半径R,然后变化另一个,如灰度阈值T,找到最佳的灰度阈值T,然后固定灰度阈值T,再找最佳的聚类半径R,最终得到组合(R,T)。
关于迭代方式,举例来说,首先在聚类半径R的取值范围内选定一个聚类半径R的取值,根据该取值,可以在特征空间中,根据聚类中心和聚类半径R,将连通分量分为前景(文字)连通分量和背景(印记)连通分量,即以聚类中心为原点,聚类半径R决定的圆内的特征向量对应的连通分量是背景(印记)连通分量,圆外的特征向量对应的连通分量是前景(文字)连通分量。根据灰度阈值T也能将连通分量分为前景连通分量和背景连通分量。这时,评价值f(R,T)=C(T),表示在聚类半径R已经确定的情况下,根据灰度阈值T划分的结果与根据聚类半径R划分的结果的匹配程度。
C(T)的计算方法例如如公式(1)所示。
(公式1)
其中,n是根据聚类半径R划分的背景连通分量的数量,m是根据聚类半径R划分的前景连通分量的数量,B是根据聚类半径R划分的背景连通分量的黑像素个数,B′是根据聚类半径R划分的前景连通分量的黑像素个数,G是与根据聚类半径R划分的背景连通分量中包括的所有黑像素点对应的、文档图像中的像素点的灰度值的最小值,G′是与根据聚类半径R划分的前景连通分量中包括的所有黑像素点对应的、文档图像中的像素点的灰度值的最小值,和是G和G′的平均值。
表明根据灰度阈值T划分的背景连通分量与根据聚类半径R划分的背景连通分量的比率。
其中,用来排除特别黑的连通分量,因为这样的连通分量必然是前景连通
分量,借此限制条件可以减少计算量。当然,可以去除这一限制条件,改写为
另外,这里B是根据聚类半径R划分的背景连通分量的黑像素个数,是采用黑像素个数进行统计。也可以使得所有B=1,从而采用连通分量的个数进行统计。
表明根据灰度阈值T划分的前景连通分量与根据聚类半径R划分的前景连通分量的比率。
其中,用来排除特别白的连通分量,因为这样的连通分量必然是背景连通
分量,借此限制条件可以减少计算量。当然,可以去除这一限制条件,改写为
另外,这里B′是根据聚类半径R划分的前景连通分量的黑像素个数,是采用黑像素个数进行统计。也可以使得所有B’=1,从而采用连通分量的个数进行统计。
综上所述,公式(1)也可改为如下的公式(2)
(公式2)
而且,上述公式(1)和公式(2)中的B和B’可统一取值为1。
在固定聚类半径R的情况下,变化灰度阈值T,可以得到多个C(T),选取其中最大的C(T)对应的灰度阈值T,然后固定灰度阈值T,以类似方法选取聚类半径R,得到组合(R,T)。
当然,也可以先固定灰度阈值T,找聚类半径R,然后再固定聚类半径R,找灰度阈值T,以得到组合(R,T)。
顺便提及,评价值除了可以作为准则找到最佳或次佳的聚类半径R和灰度阈值T之外,还可以用来判断文档图像中是否包括印记。如果评价值低于根据经验给定的第二评价阈值,则可以判断为文档图像中不包括印记。
在步骤S4中,基于所述组合中的灰度阈值,去除文档图像中的印记。
如上所述,可以根据组合中的灰度阈值,将连通分量分为前景(文字)连通分量和背景(印记)连通分量。从文档图像中去除被判断为背景(印记)连通分量对应的像素,就可以有效地、准确地去除文档图像中的印记。
当然,也可以理解,还可以基于聚类中心和组合中的聚类半径,去除文档图像中的印记。
相比较而言,优选基于灰度阈值去除文档图像中的印记的方式,因为对于区分前景文字和背景噪声,灰度是最明显的标准。基于聚类半径R的分离结果只能看作一个大致的分离结果,而在灰度空间中基于灰度阈值T的分离结果则是更加精确的结果。
图7示出了图1中示出的带有水印的扫描文档图像示例的去除印记结果。图8示出了图2中示出的带有复印标记的扫描文档图像示例的去除印记结果。
下面,将参照图9描述根据本发明实施例的去除文档图像中的印记的设备。
图9示出了根据本发明实施例的去除文档图像中的印记的设备的结构方框图。如图9所示,根据本发明的去除设备900包括:提取装置91,被配置为:从文档图像对应的二值图像中提取连通分量;聚类装置92,被配置为:基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;搜索装置93,被配置为:在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及精细去除装置94,被配置为:基于所述组合中的灰度阈值,去除文档图像中的印记。
在一个实施例中,连通分量的灰度特征包括:与连通分量中包括的所有黑像素点对应的、文档图像中的像素点的灰度值的最小值。
在一个实施例中,聚类装置92被进一步配置为:基于连通分量的灰度特征和连通分量的固有特征,聚类连通分量,以得到一个聚类中心;其中,所述连通分量的固有特征包括:在二值图像中,连通分量中包括的黑像素点的个数、连通分量中包括的黑像素点的个数与该连通分量的包围盒中的像素点的个数的比值、连通分量的包围盒的长宽比中的至少一个。
在一个实施例中,连通分量的灰度特征针对整个文档图像进行归一化,并赋予预定权重。连通分量的固有特征针对整个二值图像进行归一化,并赋予预定权重。
在一个实施例中,聚类装置92被进一步配置为:在灰度特征的特征空间中,统计每个连通分量作为聚类中心时,在给定聚类半径的范围内连通分量的数目;将所统计的最大数目对应的连通分量确定为聚类中心。
在一个实施例中,评价值还基于在二值图像中连通分量中包括的黑像素点的个数。
在一个实施例中,评价值反映基于聚类中心和聚类半径的连通分量分类结果与基于灰度阈值的连通分量分类结果的匹配程度。
在一个实施例中,去除设备900还包括判断装置,被配置为:在所述评价值低于第二评价阈值的情况下,判断为文档图像中不包括印记。
在一个实施例中,去除设备900还包括:粗去除装置,被配置为:基于所述聚类中心和所述组合中的聚类半径,去除文档图像中的印记。
在一个实施例中,精细去除装置94被进一步配置为:去除其灰度特征大于灰度阈值的连通分量。
在一个实施例中,印记包括水印和/或复印标记。
由于在根据本发明的去除设备900中所包括的各个装置和单元中的处理分别与上面描述的去除方法中所包括的各个步骤中的处理类似,因此为了简洁起见,在此省略这些装置和单元的详细描述。
此外,这里尚需指出的是,上述设备中各个组成装置、单元可以通过软件、固件、硬件或其组合的方式进行配置。配置可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。在通过软件或固件实现的情况下,从存储介质或网络向具有专用硬件结构的计算机(例如图10所示的通用计算机1000)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
图10示出了可用于实施根据本发明实施例的方法和设备的计算机的示意性框图。
在图10中,中央处理单元(CPU)1001根据只读存储器(ROM)1002中存储的程序或从存储部分1008加载到随机存取存储器(RAM)1003的程序执行各种处理。在RAM 1003中,还根据需要存储当CPU 1001执行各种处理等等时所需的数据。CPU 1001、ROM 1002和RAM 1003经由总线1004彼此连接。输入/输出接口1005也连接到总线1004。
下述部件连接到输入/输出接口1005:输入部分1006(包括键盘、鼠标等等)、输出部分1007(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分1008(包括硬盘等)、通信部分1009(包括网络接口卡比如LAN卡、调制解调器等)。通信部分1009经由网络比如因特网执行通信处理。根据需要,驱动器1010也可连接到输入/输出接口1005。可拆卸介质1011比如磁盘、光盘、磁光盘、半导体存储器等等可以根据需要被安装在驱动器1010上,使得从中读出的计算机程序根据需要被安装到存储部分1008中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1011安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图10所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1011。可拆卸介质1011的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 1002、存储部分1008中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其它实施方式中使用,与其它实施方式中的特征相组合,或替代其它实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
尽管上面已经通过对本发明的具体实施例的描述对本发明进行了披露,但是,应该理解,上述的所有实施例和示例均是示例性的,而非限制性的。本领域的技术人员可在所附权利要求的精神和范围内设计对本发明的各种修改、改进或者等同物。这些修改、改进或者等同物也应当被认为包括在本发明的保护范围内。
附记
1.一种去除文档图像中的印记的方法,包括:
从文档图像对应的二值图像中提取连通分量;
基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;
在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及
基于所述组合中的灰度阈值,去除文档图像中的印记。
2.如附记1所述的方法,其中,所述连通分量的灰度特征包括:与连通分量中包括的所有黑像素点对应的、文档图像中的像素点的灰度值的最小值。
3.如附记1所述的方法,还基于连通分量的固有特征,聚类连通分量,以得到一个聚类中心;其中,所述连通分量的固有特征包括:在二值图像中,连通分量中包括的黑像素点的个数、连通分量中包括的黑像素点的个数与该连通分量的包围盒中的像素点的个数的比值、连通分量的包围盒的长宽比中的至少一个。
4.如附记1所述的方法,所述基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心包括:
在灰度特征的特征空间中,统计每个连通分量作为聚类中心时,在给定聚类半径的范围内连通分量的数目;
将所统计的最大数目对应的连通分量确定为聚类中心。
5.如附记1所述的方法,其中,所述评价值还基于在二值图像中连通分量中包括的黑像素点的个数。
6.如附记1所述的方法,其中,所述评价值反映基于聚类中心和聚类半径的连通分量分类结果与基于灰度阈值的连通分量分类结果的匹配程度。
7.如附记1所述的方法,其中,如果所述评价值低于第二评价阈值,则判断为文档图像中不包括印记。
8.如附记1所述的方法,还包括:基于所述聚类中心和所述组合中的聚类半径,去除文档图像中的印记。
9.如附记1所述的方法,其中,所述基于所述组合中的灰度阈值,去除文档图像中的印记包括:
去除其灰度特征大于灰度阈值的连通分量。
10.如附记1所述的方法,其中,所述印记包括水印和/或复印标记。
11.一种去除文档图像中的印记的设备,包括:
提取装置,被配置为:从文档图像对应的二值图像中提取连通分量;
聚类装置,被配置为:基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;
搜索装置,被配置为:在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及
精细去除装置,被配置为:基于所述组合中的灰度阈值,去除文档图像中的印记。
12.如附记11所述的设备,其中,所述连通分量的灰度特征包括:与连通分量中包括的所有黑像素点对应的、文档图像中的像素点的灰度值的最小值。
13.如附记11所述的设备,其中,所述聚类装置被进一步配置为:基于连通分量的灰度特征和连通分量的固有特征,聚类连通分量,以得到一个聚类中心;其中,所述连通分量的固有特征包括:在二值图像中,连通分量中包括的黑像素点的个数、连通分量中包括的黑像素点的个数与该连通分量的包围盒中的像素点的个数的比值、连通分量的包围盒的长宽比中的至少一个。
14.如附记11所述的设备,所述聚类装置被进一步配置为:
在灰度特征的特征空间中,统计每个连通分量作为聚类中心时,在给定聚类半径的范围内连通分量的数目;
将所统计的最大数目对应的连通分量确定为聚类中心。
15.如附记11所述的设备,其中,所述评价值还基于在二值图像中连通分量中包括的黑像素点的个数。
16.如附记11所述的设备,其中,所述评价值反映基于聚类中心和聚类半径的连通分量分类结果与基于灰度阈值的连通分量分类结果的匹配程度。
17.如附记11所述的设备,还包括判断装置,被配置为:在所述评价值低于第二评价阈值的情况下,判断为文档图像中不包括印记。
18.如附记11所述的设备,还包括:粗去除装置,被配置为:基于所述聚类中心和所述组合中的聚类半径,去除文档图像中的印记。
19.如附记11所述的设备,其中,所述精细去除装置被进一步配置为:去除其灰度特征大于灰度阈值的连通分量。
20.如附记11所述的设备,其中,所述印记包括水印和/或复印标记。
Claims (10)
1.一种去除文档图像中的印记的方法,包括:
从文档图像对应的二值图像中提取连通分量;
基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;
在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及
基于所述组合中的灰度阈值,去除文档图像中的印记。
2.如权利要求1所述的方法,其中,所述连通分量的灰度特征包括:与连通分量中包括的所有黑像素点对应的、文档图像中的像素点的灰度值的最小值。
3.如权利要求1所述的方法,还基于连通分量的固有特征,聚类连通分量,以得到一个聚类中心;其中,所述连通分量的固有特征包括:在二值图像中,连通分量中包括的黑像素点的个数、连通分量中包括的黑像素点的个数与该连通分量的包围盒中的像素点的个数的比值、连通分量的包围盒的长宽比中的至少一个。
4.如权利要求1所述的方法,所述基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心包括:
在灰度特征的特征空间中,统计每个连通分量作为聚类中心时,在给定聚类半径的范围内连通分量的数目;
将所统计的最大数目对应的连通分量确定为聚类中心。
5.如权利要求1所述的方法,其中,所述评价值还基于在二值图像中连通分量中包括的黑像素点的个数。
6.如权利要求1所述的方法,其中,所述评价值反映基于聚类中心和聚类半径的连通分量分类结果与基于灰度阈值的连通分量分类结果的匹配程度。
7.如权利要求1所述的方法,其中,如果所述评价值低于第二评价阈值,则判断为文档图像中不包括印记。
8.如权利要求1所述的方法,还包括:基于所述聚类中心和所述组合中的聚类半径,去除文档图像中的印记。
9.如权利要求1所述的方法,其中,所述基于所述组合中的灰度阈值,去除文档图像中的印记包括:
去除其灰度特征大于灰度阈值的连通分量。
10.一种去除文档图像中的印记的设备,包括:
提取装置,被配置为:从文档图像对应的二值图像中提取连通分量;
聚类装置,被配置为:基于连通分量的灰度特征,聚类连通分量,以得到一个聚类中心;
搜索装置,被配置为:在聚类半径R和灰度阈值T的取值范围内,搜索使得基于连通分量的灰度特征的评价值高于第一评价阈值的组合(R,T);以及
精细去除装置,被配置为:基于所述组合中的灰度阈值,去除文档图像中的印记。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510136941.2A CN106157250B (zh) | 2015-03-26 | 2015-03-26 | 去除文档图像中的印记的方法和设备 |
US14/965,548 US9881228B2 (en) | 2015-03-26 | 2015-12-10 | Method and apparatus for removing a mark in a document image |
JP2016008296A JP6686460B2 (ja) | 2015-03-26 | 2016-01-19 | 文書画像におけるマークの除去方法及び除去装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510136941.2A CN106157250B (zh) | 2015-03-26 | 2015-03-26 | 去除文档图像中的印记的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106157250A CN106157250A (zh) | 2016-11-23 |
CN106157250B true CN106157250B (zh) | 2019-03-01 |
Family
ID=56975874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510136941.2A Expired - Fee Related CN106157250B (zh) | 2015-03-26 | 2015-03-26 | 去除文档图像中的印记的方法和设备 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9881228B2 (zh) |
JP (1) | JP6686460B2 (zh) |
CN (1) | CN106157250B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115497109B (zh) * | 2022-11-17 | 2023-03-24 | 山东思玛特教育科技有限公司 | 基于智能翻译的文字图像预处理方法 |
CN116596924B (zh) * | 2023-07-17 | 2023-10-20 | 山东唐乐生物科技股份有限公司 | 基于机器视觉的甜菊糖苷质量检测方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101042735A (zh) * | 2006-03-23 | 2007-09-26 | 株式会社理光 | 图像二值化方法和装置 |
CN101266654A (zh) * | 2007-03-14 | 2008-09-17 | 中国科学院自动化研究所 | 基于连通分量和支持向量机的图像文本定位方法和装置 |
CN101576958A (zh) * | 2009-06-15 | 2009-11-11 | 西安交通大学 | 一种基于形状特征的带边框矩形印章图形提取方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5272764A (en) * | 1989-12-08 | 1993-12-21 | Xerox Corporation | Detection of highlighted regions |
JP3601658B2 (ja) * | 1997-12-19 | 2004-12-15 | 富士通株式会社 | 文字列抽出装置及びパターン抽出装置 |
US6542629B1 (en) * | 1999-07-22 | 2003-04-01 | Xerox Corporation | Digital imaging method and apparatus for detection of document security marks |
US6674900B1 (en) * | 2000-03-29 | 2004-01-06 | Matsushita Electric Industrial Co., Ltd. | Method for extracting titles from digital images |
US7263227B2 (en) * | 2002-04-25 | 2007-08-28 | Microsoft Corporation | Activity detector |
JP2007019734A (ja) * | 2005-07-06 | 2007-01-25 | Konica Minolta Business Technologies Inc | 画像形成装置 |
US7899247B2 (en) * | 2007-01-24 | 2011-03-01 | Samsung Electronics Co., Ltd. | Apparatus and method of segmenting an image according to a cost function and/or feature vector and/or receiving a signal representing the segmented image in an image coding and/or decoding system |
US8351691B2 (en) * | 2008-12-18 | 2013-01-08 | Canon Kabushiki Kaisha | Object extraction in colour compound documents |
JP2011055304A (ja) * | 2009-09-02 | 2011-03-17 | Murata Machinery Ltd | 画像処理装置 |
AU2010257298B2 (en) * | 2010-12-17 | 2014-01-23 | Canon Kabushiki Kaisha | Finding text regions from coloured image independent of colours |
-
2015
- 2015-03-26 CN CN201510136941.2A patent/CN106157250B/zh not_active Expired - Fee Related
- 2015-12-10 US US14/965,548 patent/US9881228B2/en active Active
-
2016
- 2016-01-19 JP JP2016008296A patent/JP6686460B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101042735A (zh) * | 2006-03-23 | 2007-09-26 | 株式会社理光 | 图像二值化方法和装置 |
CN101266654A (zh) * | 2007-03-14 | 2008-09-17 | 中国科学院自动化研究所 | 基于连通分量和支持向量机的图像文本定位方法和装置 |
CN101576958A (zh) * | 2009-06-15 | 2009-11-11 | 西安交通大学 | 一种基于形状特征的带边框矩形印章图形提取方法 |
Non-Patent Citations (3)
Title |
---|
Doucument image binarization based on topographic ananlysis using a water flow model;In-Kwon Kim 等;《Pattern Recognition》;20020131;第35卷(第1期);第265-277页 |
基于背景估计和边缘检测的文档图像二值化;许海洋 等;《计算机应用于软件》;20140831;第31卷(第8期);第196-200页 |
复杂的中文文档图像版面分析研究;党兴;《中国优秀硕士学位论文全文数据库-信息科技辑》;20110115(第1期);第I138-1164页 |
Also Published As
Publication number | Publication date |
---|---|
JP6686460B2 (ja) | 2020-04-22 |
CN106157250A (zh) | 2016-11-23 |
US20160283817A1 (en) | 2016-09-29 |
US9881228B2 (en) | 2018-01-30 |
JP2016184396A (ja) | 2016-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7171042B2 (en) | System and method for classification of images and videos | |
US7627176B2 (en) | Apparatus, method, and computer program for analyzing document layout | |
CN101567048B (zh) | 图像辨别装置及图像检索装置 | |
CN106940702A (zh) | 连接短文本中实体提及与语义知识库中实体的方法和设备 | |
JP2010205277A (ja) | 画像内容を比較する方法及びコンピュータシステム | |
CN107492084B (zh) | 基于随机性的典型成团细胞核图像合成方法 | |
JP2012190455A (ja) | 編集可能な文書生成のための形状のパラメータ化 | |
JP4772819B2 (ja) | 画像検索装置および画像検索方法 | |
US20220262153A1 (en) | Systems and methods for processing a table of information in a document | |
US11600088B2 (en) | Utilizing machine learning and image filtering techniques to detect and analyze handwritten text | |
JP6690089B2 (ja) | 帳票認識方法、帳票認識装置、及び帳票認識プログラム | |
JP2012059269A (ja) | 文字を含む画像を処理する方法及び装置 | |
CN104573683B (zh) | 字符串识别方法和装置 | |
De | Automatic data extraction from 2D and 3D pie chart images | |
CN108268641A (zh) | 发票信息识别方法及发票信息识别装置、设备和存储介质 | |
CN106157250B (zh) | 去除文档图像中的印记的方法和设备 | |
CN104966109A (zh) | 医疗化验单图像分类方法及装置 | |
US20190220693A1 (en) | Systems and methods for image matching | |
JP2011128924A (ja) | マンガ画像からテキストを抽出するマンガ画像解析装置、プログラム、検索装置及び方法 | |
TWI714321B (zh) | 資料庫更新方法和裝置、電子設備、電腦儲存介質 | |
CN110210561B (zh) | 神经网络的训练方法、目标检测方法及装置、存储介质 | |
Úbeda et al. | Pattern spotting in historical documents using convolutional models | |
CN108334602B (zh) | 数据标注方法和装置、电子设备、计算机存储介质 | |
CN106295484B (zh) | 提取文档边界的方法和装置 | |
JP3529036B2 (ja) | 文書付き画像の分類方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190301 Termination date: 20210326 |
|
CF01 | Termination of patent right due to non-payment of annual fee |