CN105719243B - 图像处理装置和方法 - Google Patents

图像处理装置和方法 Download PDF

Info

Publication number
CN105719243B
CN105719243B CN201410734194.8A CN201410734194A CN105719243B CN 105719243 B CN105719243 B CN 105719243B CN 201410734194 A CN201410734194 A CN 201410734194A CN 105719243 B CN105719243 B CN 105719243B
Authority
CN
China
Prior art keywords
picture
background
image
pixel
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410734194.8A
Other languages
English (en)
Other versions
CN105719243A (zh
Inventor
谢术富
刘威
范伟
孙俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN201410734194.8A priority Critical patent/CN105719243B/zh
Priority to US14/946,147 priority patent/US9524559B2/en
Priority to JP2015236467A priority patent/JP6569500B2/ja
Publication of CN105719243A publication Critical patent/CN105719243A/zh
Application granted granted Critical
Publication of CN105719243B publication Critical patent/CN105719243B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本公开涉及图像处理装置和方法,图像处理装置包括:图像获取单元,其获取包含像素的图像;图片查找单元,其从图像中查找图片区域;背景获取单元,其在图像的不包括图片区域的非图片区域和图片区域中,分别执行背景连通域获取过程以分别获取非图片背景连通域和图片背景连通域;前景获取单元,其分别通过将非图片背景连通域和图片背景连通域从非图片区域和图片区域中去除,来分别获取非图片区域的非图片前景区域和图片区域的图片前景区域;以及合并单元,其将非图片区域的非图片前景区域和图片区域的图片前景区域进行合并,以获取最终图像前景区域。本公开可以更有效地提取文档前景区域。

Description

图像处理装置和方法
技术领域
本公开涉及图像处理领域,具体地涉及用于背透去除的装置和方法。
背景技术
这个部分提供了与本公开有关的背景信息,这不一定是现有技术。
在一些两面都存在书写或者印刷文字/图片的文档中,由于反面文档内容的影响,在正面文档的背景区域中会存在反面背透的文字或图片。同样的现象也存在于反面文档中。这种现象称为背透(show-through或bleed-through),如图1A和图1B所示。通常,扫描文档图像里面的背透去除方法主要有两类:一类是只根据单面图像的信息来去除背透;另一类是根据两面图像的信息来去除背透。与第一类方法相比,第二类方法会根据两面图像的信息来得到文档图像的前景区域。由于利用了更多的信息,因而能够比较精确地去除背透区域。在第二类方法中,一个比较关键的地方在于有效地提取文档图像的前景区域。
如图2A和图2B所示,文档图像的前景层包括图片和文字两部分。很多传统的局部二值化/全局二值化方法可以用来提取图像的前景层。例如,根据设定的颜色或亮度阈值,将图像像素分类为前景像素和背景像素。然而,这些局部二值化/全局二值化方法只利用了单个像素或在局部区域内的信息。在一些文档的图片区域里,某些像素的颜色与背景像素的颜色非常接近,因而会被错误地分类为背景像素。这会导致前景像素的丢失。尽管有些方法可以用来定位文本行,然而,图像中的图片具有复杂的颜色分布及不规则的形状,这些方法很难有效地提取图片区域的前景层。因此,本公开将提出一种有效的提取文档前景区域的方案。
发明内容
这个部分提供了本公开的一般概要,而不是其全部范围或其全部特征的全面披露。
本公开的目的在于提供一种图像处理装置和图像处理方法,其可以不直接定位文档图像的前景层,而是通过检测相对容易定位的背景层,然后在检测到背景层之后将背景层去除,从而更有效地得到文档图像的前景层。
根据本公开的一方面,提供了一种图像处理装置,包括:图像获取单元,其获取包含像素的图像;图片查找单元,其从图像中查找图片区域;背景获取单元,其在图像的不包括图片区域的非图片区域和图片区域中,分别执行背景连通域获取过程以分别获取非图片背景连通域和图片背景连通域,非图片背景连通域中的每一个像素都被认为是非图片背景像素,而图片背景连通域中的每一个像素都被认为是图片背景像素;前景获取单元,其分别通过将非图片背景连通域和图片背景连通域从非图片区域和图片区域中去除,来分别获取非图片区域的非图片前景区域和图片区域的图片前景区域,非图片前景区域中的每一个像素都被认为是非图片前景像素,而图片前景区域中的每一个像素都被认为是图片前景像素;以及合并单元,其将非图片区域的非图片前景区域和图片区域的图片前景区域进行合并,以获取最终图像前景区域,图像前景区域中的每一个像素都被认为是图像前景像素。
根据本公开的另一方面,提供了一种图像处理方法,该方法包括:获取包含像素的图像;从图像中查找图片区域;在图像的不包括图片区域的非图片区域和图片区域中,分别执行背景连通域获取过程以分别获取非图片背景连通域和图片背景连通域,非图片背景连通域中的每一个像素都被认为是非图片背景像素而图片背景连通域中的每一个像素都被认为是图片背景像素;分别通过将非图片背景连通域和图片背景连通域从非图片区域和图片区域中去除,来分别获取非图片区域的非图片前景区域和图片区域的图片前景区域,非图片前景区域中的每一个像素都被认为是非图片前景像素,而图片前景区域中的每一个像素都被认为是图片前景像素;以及将非图片区域的非图片前景区域和图片区域的图片前景区域进行合并,以获取最终图像前景区域,图像前景区域中的每一个像素都被认为是图像前景像素。
根据本公开的另一方面,提供了一种程序产品,该程序产品包括存储在其中的机器可读指令代码,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据本公开的图像处理方法。
根据本公开的另一方面,提供了一种机器可读存储介质,其上携带有根据本公开的程序产品。
使用根据本公开的图像处理装置和方法,可以将文档图像划分为候选图片区域以及非候选图片区域。然后,定位这两类区域的背景层。在检测到这两类区域的背景层之后,将其背景层去除,从而得到了文档图像的初始前景层。最后,对文档的初始前景层去除小的噪声后得到最终的前景层图像,从而更有效地得到文档图像的前景层。
这个概要中的描述和特定例子只是为了示意的目的,而不旨在限制本公开的范围。
附图说明
在此描述的附图只是为了所选实施例的示意的目的而非全部可能的实施,并且不旨在限制本公开的范围。在附图中:
图1A和图1B示出了本公开的技术方案所针对的存在背透的示例图像;
图2A示例性示出包括图片区域和文字区域的输入图像;
图2B示出图2A的输入图像的前景层;
图3为根据本公开的技术方案的基本思路的流程图;
图4为根据本公开的实施例的图像处理装置的框图;
图5为根据本公开的实施例的图像处理装置的一部分的框图;
图6示例性示出本公开的实施例中的连通域的外接矩形;
图7为根据本公开的实施例的图像处理装置的一部分的框图;
图8为根据本公开的另一个实施例的图像处理装置的框图;
图9为根据本公开的实施例的图像处理装置的一部分的框图;
图10为根据本公开的实施例的图像处理装置的一部分的框图;
图11为根据本公开的实施例的图像处理方法的流程图;
图12A示例性示出初始前景像素层;
图12B示例性示出针对图12A的初始前景像素层的二值化距离图像;
图12C示例性示出针对图12A的初始前景像素层的最终前景图像层;
图13示例性示出从源图像中裁剪得到的图像块;以及
图14为其中可以实现根据本公开的实施例的图像处理装置和方法的通用个人计算机的示例性结构的框图。
虽然本公开容易经受各种修改和替换形式,但是其特定实施例已作为例子在附图中示出,并且在此详细描述。然而应当理解的是,在此对特定实施例的描述并不打算将本公开限制到公开的具体形式,而是相反地,本公开目的是要覆盖落在本公开的精神和范围之内的所有修改、等效和替换。要注意的是,贯穿几个附图,相应的标号指示相应的部件。
实施方式
现在参考附图来更加充分地描述本公开的示例。以下描述实质上只是示例性的,而不旨在限制本公开、应用或用途。
下面提供了示例实施例,以便本公开将会变得详尽,并且将会向本领域技术人员充分地传达其范围。阐述了众多的特定细节如特定单元、装置和方法的示例,以提供对本公开的实施例的详尽理解。对于本领域技术人员而言将会明显的是,不需要使用特定的细节,示例实施例可以用许多不同的形式来实施,它们都不应当被解释为限制本公开的范围。在某些示例实施例中,没有详细地描述众所周知的过程、众所周知的结构和众所周知的技术。
图1A和图1B示出了本公开的技术方案所针对的存在背透的示例图像。当例如对文档进行扫描时,通常会发生所谓的背透现象,亦即在其中一页能看到另一页的内容。如图1A和图1B所示,在得到的扫描图像中,既存在由前景像素组成的正常图像部分,又存在由背透像素组成的背透图像。显然,背透像素的存在严重影响了文档的可读性,并进而可能会影响到自动字符识别。因此,有必要去除扫描图像中的背透部分。
如上面提到的那样,去除背透的方法主要是根据单面图像的信息和根据两面图像的信息来去除背透。在第二种方法中,关键在于有效地提取文档图像的前景层。图2A示出包括图片区域和文字区域的输入图像,而图2B示出该输入图像的前景层。在图2B中,黑色像素表示前景像素,而白色像素表示背景像素。很多传统的局部/全局二值化方法可以用来提取图像的前景层。然而,这些方法只利用了单个像素或在局部区域内的信息。而且,在一些文档的图片区域里,某些像素的颜色与背景像素的颜色非常接近,因而会被错误地分类为背景像素。这会导致前景像素的丢失。尽管有些方法可以用来定位文本行,然而图像中的图片具有复杂的颜色分布及不规则的形状,这些方法很难有效的提取图片区域的前景层。因此,本公开提出一种有效的提取文档前景区域的方案。
根据本公开的技术方案的基本思路并不直接定位图像的前景层,而是通过检测相对容易定位的背景层。然后,在检测到背景层之后将背景层去除,从而得到图像的前景层。
图3示出根据本公开的技术方案的基本思路的流程图。如图3所示,从输入图像中定位候选图片区域,同时获取去除候选图片区域之外的非候选图片区域。亦即,在此图像被划分为两部分:候选图片区域和非候选图片区域。接下来,在候选图片区域以及非候选图片区域中,分别通过连通域分析来检测各自的背景区域。然后,在候选图片区域以及非候选图片区域中,分别将背景区域去除,以得到候选图片区域以及非候选图片区域的前景区域。接下来,将得到的候选图片区域以及非候选图片区域的前景区域进行合并(未示出),以输出该输入图像的前景区域。
上面简要描述了根据本公开的技术方案的基本思路。接下来参考附图来进一步详细地描述本公开的技术方案。
图4示出了根据本公开的实施例的图像处理装置400。如图4所示,根据本公开的实施例的图像处理装置400可以包括图像获取单元410、图片查找单元420、背景获取单元430、前景获取单元440以及合并单元450。
图像获取单元410可以获取包含像素的图像如给定的输入图像I(x,y)。
接下来,图片查找单元420可以从图像中查找图片区域。根据本公开的一个实施例,图片查找单元420可以针对输入图像I(x,y)执行如连通域获取过程,以获取图片区域。结合图2A和图2B,图片查找单元420可能将对应于图2B中的4个黑色阴影部分的图2A中的4幅图片定位为图片区域,而将除了所定位的图片区域之外的区域定位为非图片区域。
然后,背景连通域获取单元430可以在图像的不包括图片区域的非图片区域和图片区域中,分别执行背景连通域获取过程以分别获取非图片背景连通域和图片背景连通域。在非图片背景连通域中的每一个像素都可以作为非图片背景像素,而在图片背景连通域中的每一个像素都可以作为图片背景像素。根据本公开的一个实施例,假定输入图像I(x,y)存在颜色均匀的背景,针对其非图片区域,尺寸比较大的连通域可以被定位成该非图片区域的背景连通域(以下也称为CCbg)。同样,针对其图片区域,尺寸比较大的连通域也可以被定位成该图片区域的背景连通域。此外,在获取非图片背景连通域和图片背景连通域的过程中,每个像素可以被赋值为其所属连通域的标记如(1~n)。
接下来,前景获取单元440可以分别通过将非图片背景连通域和图片背景连通域从非图片区域和图片区域中去除,来获取非图片区域的非图片前景区域和图片区域的图片前景区域。在非图片前景区域中的每一个像素都可以作为非图片前景像素,而在图片前景区域中的每一个像素都可以作为图片前景像素。根据本公开的一个实施例,针对输入图像I(x,y)的非图片区域,在定位到背景连通域CCbg之后,可以将属于该背景连通域CCbg的背景像素去除,从而得到该非图片区域的初始前景图像例如Maskfore,init
其中,label(bg)表示背景连通域CCbg的标记,而label(x,y)表示像素(x,y)所属连通域的标记。同样,针对输入图像I(x,y)的图片区域,也可以在定位到背景连通域之后,将属于该背景连通域的背景像素去除,从而得到该图片区域的初始前景图像。
然后,合并单元450可以将非图片区域的非图片前景区域和图片区域的图片前景区域进行合并,以获取最终的图像前景区域,该图像前景区域中的每一个像素可以作为图像前景像素。
使用如图4所示的图像处理装置400,可以不直接定位文档图像的前景层,而是通过检测相对容易定位的背景层,然后在检测到背景层之后将背景层去除,从而更有效地得到文档图像的前景层。
根据本公开的另一实施例,如图5所示,图片查找单元420还可以包括第一梯度图像获取单元4201、第一图像转换单元4202、候选图片连通域获取单元4203、图片选择单元4204以及图片标记单元4205。
第一梯度图像获取单元4201可以基于图像的像素信息来获取图像的梯度图像。根据本公开的一个实施例,给定一幅输入图像I(x,y),第一梯度图像获取单元4201可以通过如Sobel算子来计算该输入图像相应的梯度图像IGrad(x,y)。当然,也可以采用本领域公知的其它算子来计算图像相应的梯度图像。
接下来,第一图像转换单元4202可以将图像的梯度图像转换成二值图像。例如,第一图像转换单元4202可以通过全局阈值化方法,将输入图像I(x,y)的梯度图像IGrad(x,y)转换为二值图像MaskGrad(x,y):
当然,也可以采用本领域公知的其它方法来选择阈值t,或采用本领域公知的其它方法将梯度图像转换为二值图像。
然后,候选图片连通域获取单元4203可以对二值图像执行连通域分析算法,以获取候选图片连通域。根据本公开的一个实施例,如在上述二值图像MaskGrad(x,y)上,候选图片连通域获取单元4203可以定位值为“1”的像素的连通域:CC(1)1、CC(1)2、…,CC(1)n,以作为候选图片连通域,其中,每个值为“1”的像素可以被赋值为其所属连通域的标记(1~n)。
然而,所定位的候选图片连通域可能具有不同的尺寸。通常,可以判定尺寸比较大的候选图片连通域为候选图片区域。接下来,图片选择单元4204可以选择尺寸(如高度或宽度)大于预定阈值的候选图片连通域作为图片区域。为了满足界定连通域的尺寸,可以为连通域(如其高度或宽度)设置预定阈值,该预定阈值可以通过经验值来确定。
然后,图片标记单元4205可以标记图片区域的边界,以将图片区域与非图片区域分离。根据本公开的一个实施例,图片标记单元4205可以将位于尺寸比较大的候选图片连通域(即图片区域)外接矩形上的像素设置为前景像素(值为“1”),如图6所示:
其中,x0、y0、x1、y1分别表示候选图片连通域的外接矩形的坐标,即外接矩形的宽度w为x1-x0,而外接矩形的高度h为y1-y0
根据本公开的又一实施例,如图7所示,背景获取单元430还可以包括第二梯度图像获取单元4301、第二图像转换单元4302、划分单元4303、候选背景获取单元4304以及背景选择单元4305。
第二梯度图像获取单元4301可以基于图像的像素信息来获取图像的梯度图像。根据本公开的一个实施例,如上述给定的输入图像I(x,y),第二梯度图像获取单元4301可以通过如Sobel算子来计算该输入图像相应的梯度图像IGrad(x,y)。同样,也可以采用本领域公知的其它算子来计算图像相应的梯度图像。
接下来,第二图像转换单元4302可以将图像的梯度图像转换成二值图像。根据本公开的一个实施例,第二图像转换单元4302可以通过如全局阈值化方法,将输入图像I(x,y)的梯度图像IGrad(x,y)转换为二值图像MaskGrad(x,y)。同样,也可以采用本领域公知的其它方法来选择阈值t,或采用本领域公知的其它方法将梯度图像转换为二值图像。
接下来,划分单元4303可以将图像的二值图像划分为非图片区域和图片区域。根据本公开的一个实施例,如在二值图像MaskGrad(x,y)上,划分单元4303可以将像素值为“1”的连通域CC(1)1、CC(1)2、…,CC(1)n划分为图片区域,而将像素值为“0”的连通域CC(0)1、CC(0)2、…,CC(0)n划分为非图片区域。
然后,候选背景获取单元4304可以分别对非图片区域和图片区域执行连通域分析算法,以分别获取非图片区域的候选背景连通域和图片区域的候选背景连通域。通常,针对非图片区域,如在RMaskGrad(x,y)图像中,值为“0”的像素具有较小的梯度响应,因此,值为“0”的像素将对应非图片区域背景像素。因此,根据本公开的一个实施例,如在二值图像RMaskGrad(x,y)中,候选背景获取单元4304可以分别在非图片区域和图片区域中定位像素值为“0”的连通域CC(0)1、CC(0)2、…,CC(0)n,以作为非图片区域和图片区域的候选背景连通域,其中,每个值为“0”的像素可以分别被赋值为其所属连通域的标记(1~n)。
在本实施例中,针对单独的非图片区域和图片区域,可以假定它们都存在颜色均匀的背景。因而,无论非图片区域或图片区域的候选背景区域都可能是一个尺寸比较大的连通域。
接下来,背景选择单元4305可以分别在非图片区域和图片区域中选择具有最大尺寸的候选背景连通域作为非图片区域的非图片背景连通域和图片区域的图片背景连通域。根据本公开的一个实施例,针对非图片区域,尺寸最大的候选背景连通域可以被标记为背景连通域CCbg
CC(0)max=argmaxi=1,2...,nsize(CC(0)i) (4)
其中,size(CC(0)i)表示候选背景连通域CC(0)i包含背景像素的数目,wCC(0)i和hCC(0)i分别表示该候选背景连通域外接矩形的宽度和高度(如图6所示)。
此外,本领域技术人员将会意识到的是,由于所获取的文档图像的前景层中可能存在噪声,所以还可以进行对该前景层的修正过程。因此,提供了根据本公开的另一个实施例的图像处理装置。图8示出了根据本公开的另一个实施例的图像处理装置800。除了修正单元860之外,如图8所示的图像处理装置800的其它组成部分与如图4所示的图像处理装置400相同,本公开对此不再重复。
如图8所示,除了图像获取单元410、图片查找单元420、背景获取单元430、前景获取单元440以及合并单元450之外,图像处理装置800可以进一步包括修正单元860。
如图9所示,修正单元860可以进一步包括背景颜色获取单元8601、背景颜色计算单元8602、二值距离图像计算单元8603、计数单元8604以及设置单元8605。
背景颜色获取单元8601可以基于图像中非图片背景连通域中的非图片背景像素的信息来获取图像的参考背景颜色。例如,根据背景获取单元430获取的非图片背景连通域CCbg,非图片背景区域的颜色均值(即参考背景颜色)可以估计得到:
可选地,具有最大频数的颜色也可以被当作参考背景颜色。具体地,每个非图片背景像素的颜色被量化到格子(bin)(例如,0、1、…、31,共32个bin)里,然后,可以计算每个非图片背景像素在这些bin里的直方图:h1、h2、…、hd,其中,具有最大值的bin里像素的平均颜色值可以被作为参考背景颜色。
接下来,背景颜色计算单元8602可以计算图像中的每个像素的颜色和图像的参考背景颜色之间的距离以获取距离图。根据本公开的一个实施例,可以根据输入图像I(x,y)颜色图像和由背景颜色获取单元8601获取的参考背景颜色来计算距离图像dist(x,y):
dist(x,y)=|I(x,y)-colorbg| (7)
其中,|·|表示L1(几何)距离。
然后,二值距离图像计算单元8603可以基于距离图来计算二值距离图像。根据本公开的一个实施例,二值距离图像计算单元8603可以基于背景颜色计算单元8602计算的距离图像dist(x,y),通过例如全局二值化方法(如OTSU)来获取一幅距离二值图像(下文也称为模板图像)Maskdist(x,y):
其中,t2是根据OTSU算法计算得到的阈值。当然,也可以采用本领域公知的其它方法来计算二值距离图。在这幅距离二值图像(模板图像)里,值为“1”的像素表示该像素具有很高的概率是前景像素。
接下来,计数单元8604可以计数二值距离图像的以图像前景像素为中心的一定范围内的参考图像前景像素的数目。根据本公开的一个实施例,在初始前景图像Maskfore,init里,计数单元8604可以计数模板图像Maskdist的以初始图像前景像素为中心的一定范围内的参考前景像素的数目。可选地,计数单元8604也可以对初始图像前景区域中的每个连通域来计算在模板图像Maskdist里对应区域包含的参考图像前景像素的数目:
Numfore(CCi)=#{Maskdist(x,y)=1},x0≤x≤x1,y0≤y≤y1 (9)
其中,x0、y0、x1、y1分别表示连通域CC(0)i的外接矩形的坐标。
接下来,设置单元8605可以将参考图像前景像素的数目小于第二预定阈值的图像前景像素设置为图像的背景像素。根据本实施例,如果Numfore(CCi)的值小于第二预定阈值,则该连通域被认为是无效的。亦即,对所有判断为无效的连通域,将属于这些连通域的前景像素设置为背景像素,从而得到最终的前景像素层。
如图12A、图12B和图12C分别示例性示出初始前景像素层Maskfore,init、针对图12A的初始前景像素层Maskfore,init的二值化距离图像和针对图12A的初始前景像素层Maskfore,init的最终前景图像层Maskfore
此外,对于那些图片区域,每个图片区域可以当作一幅单独的图像进行处理。如图13所示,图像中的流程图是一个比较大的连通域,并从原始图像中裁剪出来。与前面类似的非图片前景层提取方法被应用于该图像块,以提取图像块的前景层。
使用如图8所示的图像处理装置800,可以将文档图像划分为图片区域及非图片区域,然后去定位这两类区域的背景层。在检测到背景层之后将背景层去除,从而得到文档图像的初始前景层。最后,对文档的初始前景层去除小的噪声后得到最终的前景层图像,继而可以解决由于文档中存在多种类型的颜色及复杂的图片区域而难于提取图片区域的前景层的问题。
根据本公开的又一实施例,如图10所示,修正单元860可以进一步包括图片修正单元8606、图片颜色距离计算单元8607以及图片前景保留单元8608。
图片修正单元8606可以基于图片背景连通域中的图片背景像素的信息,来获取图片区域的背景颜色。
然后,图片颜色距离计算单元8607可以计算图片区域的背景颜色和图像的参考背景颜色之间的距离以获取背景颜色距离。根据本实施例,假定图片区域的背景颜色记为colorbg,k,图片颜色距离计算单元8607可以计算图片区域的背景颜色colorbg,k和图像的参考背景颜色colorbg之间的距离:
dif=|colorbg,k-colorbg| (10)。
接下来,图片前景保留单元8608可以在背景颜色距离大于阈值的情况下,保留图片区域的全部作为图片区域的图片前景区域。即根据本实施例,如果dif的值超过设定的阈值,这意味着候选图片区域的背景颜色与整幅图像的背景颜色不同,因而整幅候选图片区域都被保留下来。否则,与上面相类似的前景提取方法将用来提取该候选图片区域的前景。
下面结合图11来描述根据本公开的实施例的图像处理的方法。如图11所示,根据本公开的实施例的图像处理的方法开始于步骤S1110。在步骤S1110中,获取包含像素的图像。
接下来,在步骤S1120中,从图像中查找图片区域。
接下来,在步骤S1130中,在图像的不包括图片区域的非图片区域和图片区域中,分别执行背景连通域获取过程以分别获取非图片背景连通域和图片背景连通域,非图片背景连通域中的每一个像素都被认为是非图片背景像素,而图片背景连通域中的每一个像素都被认为是图片背景像素。
接下来,在步骤S1140中,分别通过将非图片背景连通域和图片背景连通域从非图片区域和图片区域中去除,来分别获取非图片区域的非图片前景区域和图片区域的图片前景区域,非图片前景区域中的每一个像素都被认为是非图片前景像素,而图片前景区域中的每一个像素都被认为是图片前景像素。
接下来,在步骤S1150中,将非图片区域的非图片前景区域和图片区域的图片前景区域进行合并,以获取最终图像前景区域,图像前景区域中的每一个像素都被认为是图像前景像素。在这之后,过程结束。
根据本公开的又一实施例,还可以执行从图像中查找图片区域的步骤,该步骤进一步包括:基于图像的像素信息来获取图像的梯度图像;将图像的梯度图像转换成二值图像;对二值图像执行连通域分析算法,以获取候选图片连通域;选择尺寸大于第一预定阈值的候选图片连通域作为图片区域;以及标记图片区域的边界,以将其与非图片区域分离的步骤。
根据本公开的又一实施例,执行获取过程进一步包括:基于图像的像素信息来获取图像的梯度图像;将图像的梯度图像转换成二值图像;将图像的二值图像划分为非图片区域和图片区域;分别对非图片区域和图片区域执行连通域分析算法,以分别获取非图片区域的候选背景连通域和图片区域的候选背景连通域;以及分别在非图片区域和图片区域中选择具有最大尺寸的候选背景连通域作为非图片区域的非图片背景连通域和图片区域的图片背景连通域的步骤。
根据本公开的又一实施例,还可以执行进一步修正过程的步骤,该修正过程包括:基于图像中非图片背景连通域中的非图片背景像素的信息,来获取图像的背景颜色;计算图像中的每个像素的颜色和图像的背景颜色之间的距离以获取距离图;基于距离图来计算二值距离图像;计数二值距离图像的以图像前景像素为中心的一定范围内的参考图像前景像素的数目;以及将参考图像前景像素的数目小于第二预定阈值的图像前景像素设置为图像的背景像素的步骤。
根据本公开的又一实施例,修正过程可以进一步包括:基于图片背景连通域中的图片背景像素的信息,来获取图片区域的背景颜色;计算图片区域的背景颜色和图像的参考背景颜色之间的距离以获取背景颜色距离;以及在背景颜色距离大于阈值的情况下,保留图片区域的全部作为图片区域的图片前景区域。
根据本公开的又一实施例,获取图像的背景颜色的过程进一步包括:将每个非图片背景像素的颜色量化到格子中;计算每个非图片背景像素在相应的格子里的直方图;以及选择具有最大值的格子作为所述图像的参考背景颜色。
根据本公开的实施例的图像处理方法的上述步骤的各种具体实施方式前面已经作过详细描述,在此不再重复说明。
显然,根据本公开的图像处理方法的各个操作过程可以以存储在各种机器可读的存储介质中的计算机可执行程序的方式实现。
而且,本公开的目的也可以通过下述方式实现:将存储有上述可执行程序代码的存储介质直接或者间接地提供给系统或设备,并且该系统或设备中的计算机或者中央处理单元(CPU)读出并执行上述程序代码。此时,只要该系统或者设备具有执行程序的功能,则本公开的实施方式不局限于程序,并且该程序也可以是任意的形式,例如,目标程序、解释器执行的程序或者提供给操作系统的脚本程序等。
上述这些机器可读存储介质包括但不限于:各种存储器和存储单元,半导体设备,磁盘单元例如光、磁和磁光盘,以及其它适于存储信息的介质等。
另外,计算机通过连接到因特网上的相应网站,并且将依据本公开的计算机程序代码下载和安装到计算机中然后执行该程序,也可以实现本公开的技术方案。
图14为其中可以实现根据本公开的实施例的图像处理装置和方法的通用个人计算机的示例性结构的框图。
如图14所示,CPU 1301根据只读存储器(ROM)1302中存储的程序或从存储部分1308加载到随机存取存储器(RAM)1303的程序执行各种处理。在RAM 1303中,也根据需要存储当CPU 1301执行各种处理等等时所需的数据。CPU 1301、ROM 1302和RAM 1303经由总线1304彼此连接。输入/输出接口1305也连接到总线1304。
下述部件连接到输入/输出接口1305:输入部分1306(包括键盘、鼠标等等)、输出部分1307(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,以及扬声器等)、存储部分1308(包括硬盘等)、通信部分1309(包括网络接口卡比如LAN卡、调制解调器等)。通信部分1309经由网络比如因特网执行通信处理。根据需要,驱动器1310也可连接到输入/输出接口1305。可拆卸介质1311比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1310上,使得从中读出的计算机程序根据需要被安装到存储部分1308中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1311安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图14所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1311。可拆卸介质1311的示例包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 1302、存储部分1308中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
在本公开的装置和方法中,显然,各单元或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上虽然结合附图详细描述了本公开的实施例,但是应当明白,上面所描述的实施方式只是用于说明本公开,而并不构成对本公开的限制。对于本领域的技术人员来说,可以对上述实施方式作出各种修改和变更而没有背离本公开的实质和范围。因此,本公开的范围仅由所附的权利要求及其等效含义来限定。
关于包括以上实施例的实施方式,还公开下述的附记:
附记1.一种图像处理装置,包括:
图像获取单元,其获取包含像素的图像;
图片查找单元,其从所述图像中查找图片区域;
背景获取单元,其在所述图像的不包括所述图片区域的非图片区域和所述图片区域中分别执行背景连通域获取过程,以分别获取非图片背景连通域和图片背景连通域,所述非图片背景连通域中的每一个像素都被认为是非图片背景像素,而所述图片背景连通域中的每一个像素都被认为是图片背景像素;
前景获取单元,其分别通过将所述非图片背景连通域和所述图片背景连通域从所述非图片区域和所述图片区域中去除,来分别获取所述非图片区域的非图片前景区域和所述图片区域的图片前景区域,所述非图片前景区域中的每一个像素都被认为是非图片前景像素,而所述图片前景区域中的每一个像素都被认为是图片前景像素;以及
合并单元,其将所述非图片区域的非图片前景区域和所述图片区域的图片前景区域进行合并,以获取最终的图像前景区域,所述图像前景区域中的每一个像素都被认为是图像前景像素。
附记2.根据附记1所述的装置,其中,所述图片查找单元包括:
第一梯度图像获取单元,其基于所述图像的像素信息来获取所述图像的梯度图像;
第一图像转换单元,其将所述图像的梯度图像转换成二值图像;
候选图片连通域获取单元,其对所述二值图像执行连通域分析算法,以获取候选图片连通域;
图片选择单元,其选择尺寸大于第一预定阈值的候选图片连通域作为所述图片区域;以及
图片标记单元,其标记所述图片区域的边界,以将其与所述非图片区域分离。
附记3.根据附记1所述的装置,其中,所述背景获取单元包括:
第二梯度图像获取单元,其基于所述图像的像素信息来获取所述图像的梯度图像;
第二图像转换单元,其将所述图像的梯度图像转换成二值图像;
划分单元,其将所述图像的二值图像划分为所述非图片区域和所述图片区域;
候选背景获取单元,其分别对所述非图片区域和所述图片区域执行连通域分析算法,以分别获取所述非图片区域的候选背景连通域和所述图片区域的候选背景连通域;以及
背景选择单元,其分别在所述非图片区域和所述图片区域中选择具有最大尺寸的候选背景连通域作为所述非图片区域的非图片背景连通域和所述图片区域的图片背景连通域。
附记4.根据附记1至3中任一项所述的装置,进一步包括修正单元,所述修正单元包括:
背景颜色获取单元,其基于所述图像中非图片背景连通域中的非图片背景像素的信息,来获取所述图像的参考背景颜色;
背景颜色计算单元,其计算所述图像中的每个像素的颜色和所述图像的参考背景颜色之间的距离以获取距离图;
二值距离图像计算单元,其基于所述距离图来计算二值距离图像;
计数单元,其计数所述二值距离图像的以所述图像前景像素为中心的一定范围内的参考图像前景像素的数目;以及
设置单元,其将所述参考图像前景像素的数目小于第二预定阈值的所述图像前景像素设置为所述图像的背景像素。
附记5.根据附记4所述的装置,所述修正单元进一步包括:
图片修正单元,其基于所述图片背景连通域中的图片背景像素的信息,来获取所述图片区域的背景颜色;
图片颜色距离计算单元,其计算所述图片区域的背景颜色和所述图像的参考背景颜色之间的距离以获取背景颜色距离;以及
图片前景保留单元,其在所述背景颜色距离大于阈值的情况下,保留所述图片区域的全部作为所述图片区域的图片前景区域。
附记6.根据附记4所述的装置,其中,所述背景颜色获取单元进一步包括:
颜色量化单元,其将每个非图片背景像素的颜色量化到格子bin中;
直方图计算单元,其计算每个非图片背景像素在相应的格子bin里的直方图;以及
颜色选择单元,其选择具有最大值的格子bin里像素的平均颜色值作为所述图像的参考背景颜色。
附记7.根据附记4所述的装置,其中,所述计数单元对所述图像前景区域中的每个连通域来计算在所述二值距离图像里对应区域包含的参考图像前景像素的数目。
附记8.根据附记4所述的装置,其中,所述二值距离图像计算单元通过OTSU算法来计算二值距离图像。
附记9.根据附记1所述的装置,其中,所述非图片区域和所述图片区域都存在颜色均匀的背景。
附记10.一种图像处理方法,包括:
获取包含像素的图像;
从所述图像中查找图片区域;
在所述图像的不包括所述图片区域的非图片区域和所述图片区域中,分别执行背景连通域获取过程以分别获取非图片背景连通域和图片背景连通域,所述非图片背景连通域中的每一个像素都被认为是非图片背景像素而所述图片背景连通域中的每一个像素都被认为是图片背景像素;
分别通过将所述非图片背景连通域和所述图片背景连通域从所述非图片区域和所述图片区域中去除,来分别获取所述非图片区域的非图片前景区域和所述图片区域的图片前景区域,所述非图片前景区域中的每一个像素都被认为是非图片前景像素,而所述图片前景区域中的每一个像素都被认为是图片前景像素;以及
将所述非图片区域的非图片前景区域和所述图片区域的图片前景区域进行合并,以获取最终图像前景区域,所述图像前景区域中的每一个像素都被认为是图像前景像素。
附记11.根据附记6所述的方法,其中,从所述图像中查找图片区域进一步包括:
基于所述图像的像素信息来获取所述图像的梯度图像;
将所述图像的梯度图像转换成二值图像;
对所述二值图像执行连通域分析算法,以获取候选图片连通域;
选择尺寸大于第一预定阈值的候选图片连通域作为所述图片区域;以及
标记所述图片区域的边界,以将其与所述非图片区域分离。
附记12.根据附记6所述的方法,其中,所述获取过程进一步包括:
基于所述图像的像素信息来获取所述图像的梯度图像;
将所述图像的梯度图像转换成二值图像;
将所述图像的二值图像划分为所述非图片区域和所述图片区域;
分别对所述非图片区域和所述图片区域执行连通域分析算法,以分别获取所述非图片区域的候选背景连通域和所述图片区域的候选背景连通域;以及
分别在所述非图片区域和所述图片区域中选择具有最大尺寸的候选背景连通域作为所述非图片区域的非图片背景连通域和所述图片区域的图片背景连通域。
附记13.根据附记10至12中任一项所述的方法,进一步包括修正过程,所述修正过程包括:
基于所述图像中非图片背景连通域中的非图片背景像素的信息,来获取所述图像的背景颜色;
计算所述图像中的每个像素的颜色和所述图像的背景颜色之间的距离以获取距离图;
基于所述距离图来计算二值距离图像;
计数所述二值距离图像的以所述图像前景像素为中心的一定范围内的参考图像前景像素的数目;以及
将所述参考图像前景像素的数目小于第二预定阈值的所述图像前景像素设置为所述图像的背景像素。
附记14.根据附记13所述的方法,进一步包括:
基于所述图片背景连通域中的图片背景像素的信息,来获取所述图片区域的背景颜色;
计算所述图片区域的背景颜色和所述图像的参考背景颜色之间的距离以获取背景颜色距离;以及
在所述背景颜色距离大于阈值的情况下,保留所述图片区域的全部作为所述图片区域的图片前景区域。
附记15.根据附记13所述的方法,其中,获取所述图像的背景颜色进一步包括:
将每个非图片背景像素的颜色量化到格子bin中;
计算每个非图片背景像素在相应的格子bin里的直方图;以及
选择具有最大值的格子bin里像素的平均颜色值作为所述图像的参考背景颜色。
附记16.根据附记13所述的方法,其中,对所述图像前景区域中的每个连通域来计算在所述二值距离图像里对应区域包含的参考图像前景像素的数目。
附记17.根据附记13所述的方法,其中,通过OTSU算法来计算二值距离图像。
附记18.根据附记10所述的方法,其中,所述非图片区域和所述图片区域都存在颜色均匀的背景。
附记19.一种机器可读存储介质,其上携带有包括存储在其中的机器可读指令代码的程序产品,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据附记10-18中任何一项所述的方法。

Claims (10)

1.一种图像处理装置,包括:
图像获取单元,其获取包含像素的图像;
图片查找单元,其从所述图像中查找图片区域;
背景获取单元,其在所述图像的不包括所述图片区域的非图片区域和所述图片区域中分别执行背景连通域获取过程,以分别获取非图片背景连通域和图片背景连通域,所述非图片背景连通域中的每一个像素都被认为是非图片背景像素,而所述图片背景连通域中的每一个像素都被认为是图片背景像素;
前景获取单元,其分别通过将所述非图片背景连通域和所述图片背景连通域从所述非图片区域和所述图片区域中去除,来分别获取所述非图片区域的非图片前景区域和所述图片区域的图片前景区域,所述非图片前景区域中的每一个像素都被认为是非图片前景像素,而所述图片前景区域中的每一个像素都被认为是图片前景像素;以及
合并单元,其将所述非图片区域的非图片前景区域和所述图片区域的图片前景区域进行合并,以获取最终的图像前景区域,所述图像前景区域中的每一个像素都被认为是图像前景像素。
2.根据权利要求1所述的装置,其中,所述图片查找单元包括:
第一梯度图像获取单元,其基于所述图像的像素信息来获取所述图像的梯度图像;
第一图像转换单元,其将所述图像的梯度图像转换成二值图像;
候选图片连通域获取单元,其对所述二值图像执行连通域分析算法,以获取候选图片连通域;
图片选择单元,其选择尺寸大于第一预定阈值的候选图片连通域作为所述图片区域;以及
图片标记单元,其标记所述图片区域的边界,以将其与所述非图片区域分离。
3.根据权利要求1所述的装置,其中,所述背景获取单元包括:
第二梯度图像获取单元,其基于所述图像的像素信息来获取所述图像的梯度图像;
第二图像转换单元,其将所述图像的梯度图像转换成二值图像;
划分单元,其将所述图像的二值图像划分为所述非图片区域和所述图片区域;
候选背景获取单元,其分别对所述非图片区域和所述图片区域执行连通域分析算法,以分别获取所述非图片区域的候选背景连通域和所述图片区域的候选背景连通域;以及
背景选择单元,其分别在所述非图片区域和所述图片区域中选择具有最大尺寸的候选背景连通域作为所述非图片区域的非图片背景连通域和所述图片区域的图片背景连通域。
4.根据权利要求1至3中任一项所述的装置,进一步包括修正单元,所述修正单元包括:
背景颜色获取单元,其基于所述图像中非图片背景连通域中的非图片背景像素的信息,来获取所述图像的参考背景颜色;
背景颜色计算单元,其计算所述图像中的每个像素的颜色和所述图像的参考背景颜色之间的距离以获取距离图;
二值距离图像计算单元,其基于所述距离图来计算二值距离图像;
计数单元,其计数所述二值距离图像的以所述图像前景像素为中心的一定范围内的参考图像前景像素的数目;以及
设置单元,其将所述参考图像前景像素的数目小于第二预定阈值的所述图像前景像素设置为所述图像的背景像素。
5.根据权利要求4所述的装置,所述修正单元进一步包括:
图片修正单元,其基于所述图片背景连通域中的图片背景像素的信息,来获取所述图片区域的背景颜色;
图片颜色距离计算单元,其计算所述图片区域的背景颜色和所述图像的参考背景颜色之间的距离以获取背景颜色距离;以及
图片前景保留单元,其在所述背景颜色距离大于阈值的情况下,保留所述图片区域的全部作为所述图片区域的图片前景区域。
6.根据权利要求4所述的装置,其中,所述背景颜色获取单元进一步包括:
颜色量化单元,其将每个非图片背景像素的颜色量化到格子bin中;
直方图计算单元,其计算每个非图片背景像素在相应的格子bin里的直方图;以及
颜色选择单元,其选择具有最大值的格子bin里像素的平均颜色值作为所述图像的参考背景颜色。
7.根据权利要求4所述的装置,其中,所述计数单元对所述图像前景区域中的每个连通域来计算在所述二值距离图像里对应区域包含的参考图像前景像素的数目。
8.根据权利要求4所述的装置,其中,所述二值距离图像计算单元通过OTSU算法来计算二值距离图像。
9.根据权利要求1所述的装置,其中,所述非图片区域和所述图片区域都存在颜色均匀的背景。
10.一种图像处理方法,包括:
获取包含像素的图像;
从所述图像中查找图片区域;
在所述图像的不包括所述图片区域的非图片区域和所述图片区域中,分别执行背景连通域获取过程以分别获取非图片背景连通域和图片背景连通域,所述非图片背景连通域中的每一个像素都被认为是非图片背景像素而所述图片背景连通域中的每一个像素都被认为是图片背景像素;
分别通过将所述非图片背景连通域和所述图片背景连通域从所述非图片区域和所述图片区域中去除,来分别获取所述非图片区域的非图片前景区域和所述图片区域的图片前景区域,所述非图片前景区域中的每一个像素都被认为是非图片前景像素,而所述图片前景区域中的每一个像素都被认为是图片前景像素;以及
将所述非图片区域的非图片前景区域和所述图片区域的图片前景区域进行合并,以获取最终图像前景区域,所述图像前景区域中的每一个像素都被认为是图像前景像素。
CN201410734194.8A 2014-12-04 2014-12-04 图像处理装置和方法 Active CN105719243B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410734194.8A CN105719243B (zh) 2014-12-04 2014-12-04 图像处理装置和方法
US14/946,147 US9524559B2 (en) 2014-12-04 2015-11-19 Image processing device and method
JP2015236467A JP6569500B2 (ja) 2014-12-04 2015-12-03 画像処理装置及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410734194.8A CN105719243B (zh) 2014-12-04 2014-12-04 图像处理装置和方法

Publications (2)

Publication Number Publication Date
CN105719243A CN105719243A (zh) 2016-06-29
CN105719243B true CN105719243B (zh) 2018-09-07

Family

ID=56094754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410734194.8A Active CN105719243B (zh) 2014-12-04 2014-12-04 图像处理装置和方法

Country Status (3)

Country Link
US (1) US9524559B2 (zh)
JP (1) JP6569500B2 (zh)
CN (1) CN105719243B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101547862B1 (ko) * 2014-12-17 2015-08-31 스타십벤딩머신 주식회사 영상 합성 방법 및 시스템
US9805662B2 (en) * 2015-03-23 2017-10-31 Intel Corporation Content adaptive backlight power saving technology
US10332262B2 (en) * 2017-02-16 2019-06-25 Adobe Inc. Removal of background information from digital images
CN108573469A (zh) * 2017-03-07 2018-09-25 富士通株式会社 图像处理装置和方法
CN108647680B (zh) * 2018-04-28 2021-11-12 北京盒子鱼教育科技有限公司 图像定位框检测方法和装置
US10885689B2 (en) * 2018-07-06 2021-01-05 General Electric Company System and method for augmented reality overlay
CN110865856B (zh) * 2018-08-27 2022-04-22 华为技术有限公司 一种界面元素颜色显示方法及装置
CN109389165A (zh) * 2018-09-29 2019-02-26 南京理工大学 基于巡检机器人的变压器油位计识别方法
CN110298813A (zh) * 2019-06-28 2019-10-01 北京金山安全软件有限公司 一种处理图片的方法、装置及电子设备
CN111681244B (zh) * 2020-05-29 2022-06-21 山东大学 叶片图像分割方法、系统、设备及存储介质
CN112464720B (zh) * 2020-10-27 2021-11-23 中电金信软件有限公司 文档图像处理、模型训练方法、装置和计算机设备
CN118195887B (zh) * 2024-03-06 2024-08-23 北京衔远有限公司 图片前景保持模型的训练方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009103477A (ja) * 2007-10-22 2009-05-14 Xanavi Informatics Corp 車載機、そのメータ表示方法
CN102663388A (zh) * 2012-03-27 2012-09-12 复旦大学 从背景图片中对手写体字符进行分割的方法
CN102750718A (zh) * 2012-05-31 2012-10-24 山东神思电子技术股份有限公司 一种背景蒙版生成方法
CN103336965A (zh) * 2013-07-18 2013-10-02 江西省电力公司检修分公司 基于轮廓差异及区块主方向直方图的前景与特征提取方法
CN103473780A (zh) * 2013-09-22 2013-12-25 广州市幸福网络技术有限公司 一种人像背景抠图的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040096102A1 (en) * 2002-11-18 2004-05-20 Xerox Corporation Methodology for scanned color document segmentation
KR100524072B1 (ko) * 2003-06-28 2005-10-26 삼성전자주식회사 화질 개선 방법
TWI479891B (zh) * 2007-06-26 2015-04-01 Apple Inc 動態背光調適
US8582876B2 (en) * 2011-11-15 2013-11-12 Microsoft Corporation Hybrid codec for compound image compression

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009103477A (ja) * 2007-10-22 2009-05-14 Xanavi Informatics Corp 車載機、そのメータ表示方法
CN102663388A (zh) * 2012-03-27 2012-09-12 复旦大学 从背景图片中对手写体字符进行分割的方法
CN102750718A (zh) * 2012-05-31 2012-10-24 山东神思电子技术股份有限公司 一种背景蒙版生成方法
CN103336965A (zh) * 2013-07-18 2013-10-02 江西省电力公司检修分公司 基于轮廓差异及区块主方向直方图的前景与特征提取方法
CN103473780A (zh) * 2013-09-22 2013-12-25 广州市幸福网络技术有限公司 一种人像背景抠图的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
文档图像的层分割研究;林杰;《中国优秀硕士学位论文全文数据库_信息科技辑》;20050315(第1期);第3.3节,图3.3 *

Also Published As

Publication number Publication date
JP2016110647A (ja) 2016-06-20
US20160163059A1 (en) 2016-06-09
US9524559B2 (en) 2016-12-20
CN105719243A (zh) 2016-06-29
JP6569500B2 (ja) 2019-09-04

Similar Documents

Publication Publication Date Title
CN105719243B (zh) 图像处理装置和方法
CN105868758B (zh) 图像中文本区域检测方法、装置及电子设备
CN108229509B (zh) 用于识别物体类别的方法及装置、电子设备
CN111145209B (zh) 一种医学图像分割方法、装置、设备及存储介质
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
JP5174040B2 (ja) 画像の構成要素と背景とを区別するためにコンピュータで実行される方法および画像の構成要素と背景とを区別するためのシステム
US20190019055A1 (en) Word segmentation system, method and device
CN111291629A (zh) 图像中文本的识别方法、装置、计算机设备及计算机存储介质
US11455502B2 (en) Learning device, classification device, learning method, classification method, learning program, and classification program
CN109117814B (zh) 图像处理方法、装置、电子设备及介质
CN112749696B (zh) 一种文本检测方法及装置
CN105096347A (zh) 图像处理装置和方法
CN109598185A (zh) 图像识别翻译方法、装置、设备及可读存储介质
KR20230030259A (ko) 제품 결함 검출 학습을 위한 딥러닝 기반 데이터 증강 방법
CN112733858B (zh) 基于字符区域检测的图像文字快速识别方法及装置
CN113609984A (zh) 一种指针式仪表读数识别方法、装置及电子设备
CN114881698A (zh) 广告合规审核方法、装置、电子设备及存储介质
CN106295627A (zh) 用于识别文字牛皮癣图片的方法及装置
CN116433704A (zh) 一种基于中心点的细胞核分割方法及相关设备
CN112200789B (zh) 一种图像识别的方法及装置、电子设备和存储介质
JP6686460B2 (ja) 文書画像におけるマークの除去方法及び除去装置
CN110298236A (zh) 一种基于深度学习的盲文图像自动识别方法和系统
CN112884074B (zh) 基于决策树的图像设计方法、设备、存储介质及装置
CN114549833A (zh) 一种实例分割方法、装置、电子设备及存储介质
CN110443811B (zh) 一种复杂背景叶片图像的全自动分割方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant