CN105469027B - 针对文档图像的水平和垂直线检测和移除 - Google Patents

针对文档图像的水平和垂直线检测和移除 Download PDF

Info

Publication number
CN105469027B
CN105469027B CN201510621501.6A CN201510621501A CN105469027B CN 105469027 B CN105469027 B CN 105469027B CN 201510621501 A CN201510621501 A CN 201510621501A CN 105469027 B CN105469027 B CN 105469027B
Authority
CN
China
Prior art keywords
bianry image
bounding box
horizontal
vertical
vertical line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510621501.6A
Other languages
English (en)
Other versions
CN105469027A (zh
Inventor
方刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Laboratory USA Inc
Original Assignee
Konica Minolta Laboratory USA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Laboratory USA Inc filed Critical Konica Minolta Laboratory USA Inc
Publication of CN105469027A publication Critical patent/CN105469027A/zh
Application granted granted Critical
Publication of CN105469027B publication Critical patent/CN105469027B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及针对文档图像的水平和垂直线检测和移除。用于文档图像的垂直和水平线检测方法包括:基于多个二值化阈值从输入灰度文档图像产生多个二值图像;独立地检测所述多个二值图像中的每个中的水平线和垂直线;以及合并来自所述多个二值图像的检测结果。用于每个二值图像的线检测处理包括:使用垂直线或水平线作为结构元素来应用开运算;以及基于笔划宽度分析来移除不是垂直线或水平线的连接成分。使用水平投影和垂直投影来获得检测到的线的边界。

Description

针对文档图像的水平和垂直线检测和移除
技术领域
本发明涉及文档图像处理,具体地,本发明涉及用于检测和移除文档图像中的水平线和垂直线的方法。
背景技术
文档图像通常指的是表示包含大量文本的文档的页面的数字图像。文档图像常常包含线,具体地,包含水平线和垂直线,诸如表格线、文本的下划线等。因为字符(字母和其它符号)通常是文档图像分析(诸如光学字符识别(OCR)、文档认证等)的焦点,所以常常期望移除线。这些线一般沿着一个方向很长,如果这些线未被明确地移除,则在之后进行的连接成分(connected component)分析中可能引起误差和错误。已经提出了用于线检测和移除的各种方法,诸如霍夫变换、游程长度编码、形态学分析等。然而,当这些方法应用于实际文档上时,它们通常受图像质量以及图像的二值化程度的影响。例如,不适当的二值化阈值可能使基于形态学的线检测失败。
发明内容
本发明针对一种线检测和移除方法以及相关设备,基本上消除由于现有技术的限制和缺点而导致的问题中的一个或多个。
本发明的目的是提供一种线检测和移除方法,能够检测各种质量的文档图像中的水平线和垂直线。
本发明的另外的特征和优点将在下面的描述中进行陈述,并且部分地根据本说明书将是清楚的,或者可以通过实施本发明来获悉。本发明的目标和其它优点将通过在撰写的说明书及其权利要求书以及附图中具体指出的结构来实现和达成。
为了实现这些和/或其它目的,如所实施的和广义地描述的,本发明提供一种用于检测和移除灰度文档图像中的垂直线和水平线的方法,该方法包括以下步骤:使用多个不同的二值化条件来从灰度文档图像产生多个第一二值图像;独立地检测所述多个第一二值图像中的每个第一二值图像中的水平线和垂直线,以产生与所述多个第一二值图像对应的多组边界框,每组边界框包括多个边界框,每个边界框表示检测到的垂直线或水平线;将所述多组边界框合并为表示在灰度图像中检测到的垂直线和水平线的合并的一组边界框;从灰度文档图像产生第二二值图像;以及使用表示检测到的线的所述合并的一组边界框对第二二值图像进行处理以从该第二二值图像移除水平线和垂直线。
在以上方法中,针对每个第一二值图像的检测步骤可以包括以下步骤:(a)获得与第一二值图像的每个像素相关联的笔划宽度,其中,与给定像素相关联的笔划宽度被定义为包括该像素的连续前景像素的水平游程长度和垂直游程长度中的较小者;(b)使用垂直线作为结构元素来对第一二值图像执行开运算;(c)从通过步骤(b)产生的第一二值图像提取连接成分;(d)针对每个连接成分中的每个垂直像素列,计算该列的高度和与该列中的所有像素相关联的笔划宽度的中间值的比率,如果该比率小于预定阈值则从第一二值图像移除该像素列;(e)垂直地投影通过步骤(d)产生的第一二值图像以产生垂直投影直方图,并获得垂直投影直方图的所有非零部分的水平边界作为检测到的垂直线的左边界和右边界;(f)针对垂直投影直方图的每个非零部分,水平地投影通过步骤(d)产生的第一二值图像的对应的垂直切片以产生第一水平投影直方图,并水平地投影步骤(b)之前的第一二值图像的对应的垂直切片以产生第二水平投影直方图;以及(g)针对第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应的非零部分,并获得其顶边界和底边界作为检测到的垂直线的顶边界和底边界。
在另一方面,本发明提供一种用于检测和移除二值文档图像中的垂直线的方法,该方法包括以下步骤:(a)获得与二值图像的每个像素相关联的笔划宽度,其中,与给定像素相关联的笔划宽度被定义为包括该像素的连续前景像素的水平游程长度和垂直游程长度中的较小者;(b)使用垂直线作为结构元素来对二值图像执行开运算;(c)从通过步骤(b)产生的二值图像提取连接成分;(d)针对每个连接成分中的每个像素列,计算该列的高度和与该列中的所有像素相关联的笔划宽度的中间值的比率,如果该比率小于预定阈值,则从二值图像移除该像素列;(e)垂直地投影通过步骤(d)产生的二值图像以产生垂直投影直方图,并获得垂直投影直方图的所有非零部分的水平边界作为检测到的垂直线的左边界和右边界;(f)针对垂直投影直方图的每个非零部分,水平地投影通过步骤(d)产生的二值图像的对应的垂直切片以产生第一水平投影直方图,并水平地投影步骤(b)之前的二值图像的对应的垂直切片以产生第二水平投影直方图;(g)针对第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应的非零部分,并获得其顶边界和底边界作为检测到的垂直线的顶边界和底边界;(h)使用检测到的垂直线的左边界、右边界、顶边界和底边界对二值图像进行处理以从该二值图像移除垂直线。
在另一方面,本发明提供一种用于检测和移除灰度文档图像中的垂直线和水平线的计算机装置,该计算机装置包括:用于使用多个不同的二值化条件来从灰度文档图像产生多个第一二值图像的部件;用于独立地检测所述多个第一二值图像中的每个第一二值图像中的水平线和垂直线以产生与所述多个第一二值图像对应的多组边界框的部件,每组边界框包括多个边界框,每个边界框表示检测到的垂直线或水平线;用于将所述多组边界框合并为表示在灰度图像中检测到的垂直线和水平线的合并的一组边界框的部件;用于从灰度文档图像产生第二二值图像的部件;以及用于使用表示检测到的线的所述合并的一组边界框对第二二值图像进行处理以从该第二二值图像移除水平线和垂直线的部件。
另外,在以上计算机装置中,多个二值化条件可以是多个不同的二值化阈值。
另外,在以上计算机装置中,还可以包括:用于在用于产生所述多个第一二值图像的部件的处理之前,对灰度文档图像进行偏斜校正、去噪声和下采样的部件;以及用于在用于合并的部件的处理之前,扩大所述合并的一组边界框的大小的部件。
另外,在以上计算机装置中,用于对每个第一二值图像进行检测的部件可以包括:(a)用于获得与第一二值图像的每个像素相关联的笔划宽度的部件,其中,与给定像素相关联的笔划宽度被定义为包括该像素的连续前景像素的水平游程长度和垂直游程长度中的较小者;(b)用于使用垂直线作为结构元素来对第一二值图像执行开运算的部件;(c)用于从通过部件(b)产生的第一二值图像提取连接成分的部件;以及(d)用于针对每个连接成分中的每个垂直像素列,进行以下处理的部件:计算该列的高度和与该列中的所有像素相关联的笔划宽度的中间值的比率,如果该比率小于预定阈值,则从第一二值图像移除该像素列。
另外,在以上计算机装置中,用于对每个第一二值图像进行检测的部件在部件(d)的处理之后还可以包括:(e)用于垂直地投影通过部件(d)产生的第一二值图像以产生垂直投影直方图并获得垂直投影直方图的所有非零部分的水平边界作为检测到的垂直线的左边界和右边界的部件。
另外,在以上计算机装置中,用于对每个第一二值图像进行检测的部件在部件(e)的处理之后还可以包括:(f)用于针对垂直投影直方图的每个非零部分,进行以下处理的部件:水平地投影通过部件(d)产生的第一二值图像的对应的垂直切片以产生第一水平投影直方图,并水平地投影部件(b)的处理之前的第一二值图像的对应的垂直切片以产生第二水平投影直方图;以及(g)用于针对第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应的非零部分并获得其顶边界和底边界作为检测到的垂直线的顶边界和底边界的部件。
应当理解,前面的大体描述和下面的详细描述都是示例性的和说明性的,并且意图提供如要求保护的本发明的进一步说明。
附图说明
图1示意性地例示根据本发明的实施例的用于文档图像的垂直和水平线检测和移除方法。
图2A和2B示意性地例示图1的方法的线检测处理。
图3示意性地例示可以实现本发明的实施例的数据处理设备。
具体实施方式
本发明的实施例提供用于文档图像的垂直和水平线检测方法,该方法基于多个二值化阈值从输入灰度文档图像产生多个二值图像,使用相同过程从这些多个二值图像中的每个独立地检测水平线和垂直线,并合并检测结果。对每个二值图像的线检测处理应用笔划宽度分析。
该线检测处理是高度有效的。通常,线检测结果受灰度图像的二值化程度的影响。如果二值图像太亮,则一些细线在二值图像中可能消失而不能被检测到。如果二值图像太暗,则一些线将变得太粗和/或与相邻的线或其它图像成分合并,使它们被判断为不是线。常常难以正确地判断输入图像来设置适当的二值化阈值。因此,通过使用本文中所描述的多二值化技术,并合并来自多个二值化图像的线检测结果,可以在各种质量的文档图像中有效地检测垂直线和水平线。
参照图1至图2B来描述水平和垂直线检测和移除方法。输入文档图像是灰度图像,其中,每个像素具有多比特像素值,例如从0至255。如果原始图像(例如,由扫描仪产生的图像)是彩色图像,则可以首先将它转换为灰度图像;可替代地,可以将每个颜色通道看作灰度图像。
如图1所示,首先,可选地将预处理(包括偏斜校正、去噪声、下采样等)应用于灰度输入图像(步骤S11)。为了方便起见,进行了预处理的灰度图像仍被称为输入灰度图像。
对输入灰度图像多次进行二值化,每次使用不同的全局二值化阈值,以获得多个二值图像(1比特图像)(步骤S12)。二值化阈值可以是从1至254的任何值。对于相对较亮的输入灰度图像,可以使用一组相对低的阈值,而对于正常暗度的输入灰度图像,相对较高的阈值是期望的。可以使用任何期望数量的二值图像。在典型的应用中,三个不同的二值图像足以给出令人满意的结果。作为使用不同的二值化阈值的替代方案,通过调整其它二值化参数(如果二值化算法使用其它参数)或者通过应用不同的二值化算法,来产生多个二值图像。
将线检测处理独立地应用于每个二值图像(处理S13),并将来自所有二值图像的结果——检测到的线——合并在一起以生成最终的线检测结果(步骤S14)。
在本公开中,假定背景为白色,像素值为0,并假定前景(文本、图形等)为黑色,像素值为1。应当注意,针对黑色与白色以及文本与背景的像素值的定义是有关选择的问题;这里所描述的实现可以被容易地修改以适应不同的像素值定义。
以下参照图2A和图2B来描述应用于每个二值图像的线检测处理S13。
首先,执行笔划宽度分析以获得与二值图像的每个像素相关联的笔划宽度(步骤S21)。这里,与给定像素相关联的笔划宽度被定义为包括该给定像素的连续黑色像素在水平方向和垂直方向上的游程长度中的较小者。白色像素(背景)的笔划宽度为零。如果黑色像素是线或字符笔划的一部分,则笔划宽度将趋向于与文档中的线或字符笔划的典型宽度相同。如果黑色像素是图形元素的一部分,则其笔划宽度将趋向于大得多。笔划宽度将被用在后面的线检测处理的各个步骤中。
通过使用垂直线作为结构元素来对二值输入图像执行开运算(步骤S22)。开是涉及使用相同结构元素的先腐蚀(erosion)、后膨胀(dilation)的形态学运算。开运算(opening operation)可以被认为是提取二值图像中的结构元素可以放入的那些图像元素。优选地,在步骤S22中,结构元素是相对短的垂直线。在一种具体实现中,结构元素长为25个像素,宽为1个像素。可以使用其它长度,诸如从10至100个像素。为了方便起见,所得的二值图像被称为滤波图像。
接着,提取滤波图像的连接成分,并基于中间笔划宽度和列高度,一次一列地执行分析以移除某些连接成分或其部分(步骤S23)。在该步骤中,对于每个连接分量,枚举了包含在该每个连接分量中的所有1个像素宽的垂直像素列。沿着每个像素列,从步骤S21的结果取回沿着该列的像素的笔划宽度,并计算该列的这些笔划宽度的中间值。如果该列的高度和笔划宽度的这个中间值的比率大于预定阈值,则该像素列保持为实线的一部分。否则,该像素列被视为不是实线的一部分而被移除。在一个例子中,预定阈值是20,但是可以使用其它合适的值,诸如10和30之间的值。尽管在该步骤中,每个像素列被单独处理,但是如果整个连接成分事实上不是垂直线,则结果是该整个连接成分将被移除。为了方便起见,所得的图像被称为垂直线图像。
接着,确定垂直线的水平位置(步骤S24)。为了实现该步骤,垂直地投影来自步骤S23的垂直线图像,并获得该投影的直方图(被称为垂直投影直方图)。垂直投影直方图的每个非零部分对应于垂直线(或合并在一起的多个垂直线)。通过分析该直方图,获得垂直线的水平位置和宽度(步骤S24)。
接下来的一组步骤确定每个垂直线的顶边界和底边界(步骤S251至S253,合称为步骤S25)。对于垂直投影直方图的每个非零部分,水平地投影垂直线图像的对应垂直切片(是图像在与垂直投影直方图的非零部分对应的水平位置处的垂直切片)以产生该图像切片的直方图(被称为第一水平投影直方图)(步骤S251)。同时,也在水平方向上投影原始二值图像(即,开运算之前的二值图像)的相同切片以产生另一直方图(被称为第二水平投影直方图)(步骤S252)。第二水平投影直方图将具有在垂直位置上与第一水平投影直方图中的非零部分对应的非零部分,并且还(可能)具有与原始二值图像的不是垂直线的其它成分对应的其它非零部分。因此,对于第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应非零部分,并获得其顶边界和底边界作为在该位置处检测到的垂直线的顶边界和底边界(步骤S253)。
对垂直投影直方图的所有非零部分执行步骤S251至S253。结果,识别二值图像中的所有垂直线,并获得它们的四个边界。
这使对给定二值图像的垂直线检测结束。结果,获得每个垂直线的边界框。
可以使用类似于步骤S22至S253的、适当修改即通过在每个步骤中切换垂直和水平(包括顶/底和左/右、垂直列和水平行)的步骤来检测二值图像中的水平线。在步骤S21中计算的笔划宽度可以在水平线检测中使用,所以不需要重复步骤S21。
在对多个二值图像中的所有二值图像执行了垂直和水平线检测步骤之后,比较来自所有二值图像的检测到的线(边界框),并将这些检测到的线合并为一组边界框,该一组边界框构成垂直和水平线检测处理的输出(图1,步骤S14)。当合并时,如果来自一个二值图像的边界框完全位于来自另一个二值图像的边界框内,则省略第一个边界框;如果来自两个不同二值图像的两个边界框基本上重叠,即,这两个边界框中的一个的至少50%与另一个重叠,则用界定这两个边界框的新的边界框取代这两个边界框。
返回参照图1,如果在步骤S11中已经对灰度输入图像进行了下采样,则使检测到的线的边界框的大小重新回到灰度输入图像的原始大小(步骤S15)。使用线检测结果,可以产生长的垂直线和水平线被移除的干净的二值图像(步骤S16)。在移除步骤中,高度对宽度比率较大的所有的垂直线都被移除。对于水平线移除,所述方法应被设计为移除包括文本下划线的水平线,同时保留与这些下划线交叉的文本笔划。例如,可以使用在标题为“Horizontal and Vertical Line Detection and Removal for Document Images”的共有的专利申请(基于美国专利申请No.14/502,820的中国专利申请)中描述的线移除方法。
这里所描述的水平和垂直线检测和移除方法可以在诸如如图4中所示的计算机120的数据处理系统中实现。计算机120包括处理器121、存储装置(例如,硬盘驱动器)122以及内部存储器(例如,RAM)123。存储装置122存储软件程序,该软件程序被读出到RAM 123并被处理器121执行以实现所述方法。
在一个方面,本发明是一种由数据处理系统执行的方法。在另一方面,本发明是一种在计算机可用的非暂时性介质中具体化的计算机装置,所述计算机可用的非暂时性介质具有嵌入在其中的用于控制数据处理设备执行所述方法的计算机可读程序代码。在另一方面,本发明在数据处理系统中具体化。
本领域技术人员将清楚的是,在不脱离本发明的精神或范围的情况下,可以在本发明的水平和垂直线检测和移除方法以及相关设备中进行各种修改和变化。因此,意图是本发明覆盖落在所附权利要求及其等同的范围内的修改和变化。

Claims (13)

1.一种用于检测和移除灰度文档图像中的垂直线和水平线的方法,该方法包括以下步骤:
使用不同的多个二值化条件来从所述灰度文档图像产生多个第一二值图像;
独立地检测所述多个第一二值图像中的每个第一二值图像中的水平线和垂直线,以产生与所述多个第一二值图像对应的多组边界框,每组边界框包括多个边界框,每个边界框表示检测到的垂直线或水平线;
将所述多组边界框合并为表示在灰度图像中检测到的垂直线和水平线的一组合并的边界框,其中,在进行所述合并时,如果来自所述多组边界框中的一组边界框完全位于来自所述多组边界框中的另一组边界框内,则省略所述一组边界框,如果所述一组边界框的至少50%与所述另一组边界框重叠,则用界定所述一组边界框和所述另一组边界框的一组新的边界框取代所述一组边界框和所述另一组边界框;
从所述灰度文档图像产生第二二值图像;以及
使用表示检测到的线的所述一组合并的边界框对第二二值图像进行处理以从该第二二值图像移除水平线和垂直线。
2.根据权利要求1所述的方法,其中,所述多个二值化条件是不同的多个二值化阈值。
3.根据权利要求1或2所述的方法,还包括以下步骤:
在产生所述多个第一二值图像之前,对灰度文档图像进行偏斜校正、去噪声和下采样;以及
在合并步骤之后,扩大所述一组合并的边界框的大小。
4.根据权利要求1或2所述的方法,其中,针对每个第一二值图像的检测步骤包括以下步骤:
(a)获得与第一二值图像的每个像素相关联的笔划宽度,其中,与给定像素相关联的笔划宽度被定义为包括该像素的连续前景像素的水平游程长度和垂直游程长度中的较小者;
(b)使用垂直线作为结构元素来对第一二值图像执行开运算;
(c)从通过步骤(b)产生的第一二值图像提取连接成分;以及
(d)针对每个连接成分中的每个垂直像素列,计算该列的高度和与该列中的所有像素相关联的笔划宽度的中间值的比率,如果该比率小于预定阈值,则从第一二值图像移除该像素列。
5.根据权利要求4所述的方法,其中,针对每个第一二值图像的检测步骤在步骤(d)之后还包括以下步骤:
(e)垂直地投影通过步骤(d)产生的第一二值图像以产生垂直投影直方图,并获得垂直投影直方图的所有非零部分的水平边界作为检测到的垂直线的左边界和右边界。
6.根据权利要求5所述的方法,其中,针对每个第一二值图像的检测步骤在步骤(e)之后还包括以下步骤:
(f)针对垂直投影直方图的每个非零部分,水平地投影通过步骤(d)产生的第一二值图像的对应的垂直切片以产生第一水平投影直方图,并水平地投影步骤(b)之前的第一二值图像的对应的垂直切片以产生第二水平投影直方图;以及
(g)针对第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应的非零部分,并获得其顶边界和底边界作为检测到的垂直线的顶边界和底边界。
7.一种用于检测和移除二值文档图像中的垂直线的方法,包括以下步骤:
(a)获得与二值图像的每个像素相关联的笔划宽度,其中,与给定像素相关联的笔划宽度被定义为包括该像素的连续前景像素的水平游程长度和垂直游程长度中的较小者;
(b)使用垂直线作为结构元素来对二值图像执行开运算;
(c)从通过步骤(b)产生的二值图像提取连接成分;
(d)针对每个连接成分中的每个像素列,计算该列的高度和与该列中的所有像素相关联的笔划宽度的中间值的比率,如果该比率小于预定阈值,则从二值图像移除该像素列;
(e)垂直地投影通过步骤(d)产生的二值图像以产生垂直投影直方图,并获得垂直投影直方图的所有非零部分的水平边界作为检测到的垂直线的左边界和右边界;
(f)针对垂直投影直方图的每个非零部分,水平地投影通过步骤(d)产生的二值图像的对应的垂直切片以产生第一水平投影直方图,并水平地投影步骤(b)之前的二值图像的对应的垂直切片以产生第二水平投影直方图;
(g)针对第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应的非零部分,并获得其顶边界和底边界作为检测到的垂直线的顶边界和底边界;
(h)使用检测到的垂直线的左边界、右边界、顶边界和底边界对二值图像进行处理以从该二值图像移除垂直线。
8.一种用于检测和移除灰度文档图像中的垂直线和水平线的计算机装置,包括:
用于使用不同的多个二值化条件来从所述灰度文档图像产生多个第一二值图像的部件;
用于独立地检测所述多个第一二值图像中的每个第一二值图像中的水平线和垂直线以产生与所述多个第一二值图像对应的多组边界框的部件,每组边界框包括多个边界框,每个边界框表示检测到的垂直线或水平线;
用于将所述多组边界框合并为表示在灰度图像中检测到的垂直线和水平线的一组合并的边界框的部件,其中,在进行所述合并时,如果来自所述多组边界框中的一组边界框完全位于来自所述多组边界框中的另一组边界框内,则省略所述一组边界框,如果所述一组边界框的至少50%与所述另一组边界框重叠,则用界定所述一组边界框和所述另一组边界框的一组新的边界框取代所述一组边界框和所述另一组边界框;
用于从所述灰度文档图像产生第二二值图像的部件;以及
用于使用表示检测到的线的所述一组合并的边界框对第二二值图像进行处理以从该第二二值图像移除水平线和垂直线的部件。
9.根据权利要求8所述的计算机装置,其中,所述多个二值化条件是不同的多个二值化阈值。
10.根据权利要求8或权利要求9所述的计算机装置,还包括:
用于在用于产生所述多个第一二值图像的部件的处理之前,对灰度文档图像进行偏斜校正、去噪声和下采样的部件;以及
用于在用于合并的部件的处理之前,扩大所述一组合并的边界框的大小的部件。
11.根据权利要求8或9所述的计算机装置,其中,用于对每个第一二值图像进行检测的部件包括:
(a)用于获得与第一二值图像的每个像素相关联的笔划宽度的部件,其中,与给定像素相关联的笔划宽度被定义为包括该像素的连续前景像素的水平游程长度和垂直游程长度中的较小者;
(b)用于使用垂直线作为结构元素来对第一二值图像执行开运算的部件;
(c)用于从通过部件(b)产生的第一二值图像提取连接成分的部件;以及
(d)用于针对每个连接成分中的每个垂直像素列,进行以下处理的部件:计算该列的高度和与该列中的所有像素相关联的笔划宽度的中间值的比率,如果该比率小于预定阈值,则从第一二值图像移除该像素列。
12.根据权利要求11所述的计算机装置,其中,用于对每个第一二值图像进行检测的部件在部件(d)的处理之后还包括:
(e)用于垂直地投影通过部件(d)产生的第一二值图像以产生垂直投影直方图并获得垂直投影直方图的所有非零部分的水平边界作为检测到的垂直线的左边界和右边界的部件。
13.根据权利要求12所述的计算机装置,其中,用于对每个第一二值图像进行检测的部件在部件(e)的处理之后还包括:
(f)用于针对垂直投影直方图的每个非零部分,进行以下处理的部件:水平地投影通过部件(d)产生的第一二值图像的对应的垂直切片以产生第一水平投影直方图,并水平地投影部件(b)的处理之前的第一二值图像的对应的垂直切片以产生第二水平投影直方图;以及
(g)用于针对第一水平投影直方图的每个非零部分,识别第二水平投影直方图的对应的非零部分并获得其顶边界和底边界作为检测到的垂直线的顶边界和底边界的部件。
CN201510621501.6A 2014-09-30 2015-09-25 针对文档图像的水平和垂直线检测和移除 Active CN105469027B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/502,796 2014-09-30
US14/502,796 US9495343B2 (en) 2014-09-30 2014-09-30 Horizontal and vertical line detection and removal for document images

Publications (2)

Publication Number Publication Date
CN105469027A CN105469027A (zh) 2016-04-06
CN105469027B true CN105469027B (zh) 2019-04-09

Family

ID=53785520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510621501.6A Active CN105469027B (zh) 2014-09-30 2015-09-25 针对文档图像的水平和垂直线检测和移除

Country Status (4)

Country Link
US (1) US9495343B2 (zh)
EP (1) EP3002712A3 (zh)
JP (1) JP6262176B2 (zh)
CN (1) CN105469027B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3167408T3 (da) * 2014-07-10 2024-03-04 Sanofi Aventis Deutschland Anordning og fremgangsmåde til udførelse af optisk tegngenkendelse
US10136103B2 (en) 2015-11-23 2018-11-20 Lexmark International, Inc. Identifying consumer products in images
US9990561B2 (en) * 2015-11-23 2018-06-05 Lexmark International, Inc. Identifying consumer products in images
JP6780271B2 (ja) * 2016-03-23 2020-11-04 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
RU2626661C1 (ru) * 2016-06-24 2017-07-31 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и подсистема определения содержащих документ фрагментов цифрового изображения
US10275888B2 (en) * 2016-09-16 2019-04-30 Oracle International Corporation Algorithmic method for detection of documents in images
US10083353B2 (en) * 2016-10-28 2018-09-25 Intuit Inc. Identifying document forms using digital fingerprints
CN110199317A (zh) * 2016-12-27 2019-09-03 马吕斯·利奥迪努 使用手持设备对木板的自动检测、计数和测量
CN106951902B (zh) * 2017-03-27 2020-10-20 深圳怡化电脑股份有限公司 一种图像二值化处理方法及装置
JP7030425B2 (ja) * 2017-05-22 2022-03-07 キヤノン株式会社 画像処理装置、画像処理方法、プログラム
JP7057915B2 (ja) * 2017-08-30 2022-04-21 国立大学法人岩手大学 オブジェクト検出システム、オブジェクト検出方法
CN108345893B (zh) * 2018-03-15 2021-01-26 京东方科技集团股份有限公司 一种直线检测方法、装置、计算机存储介质及终端
CN109409247B (zh) * 2018-09-30 2022-05-13 阿波罗智联(北京)科技有限公司 交通标志识别方法和装置
CN111797838A (zh) * 2019-04-08 2020-10-20 上海怀若智能科技有限公司 一种图片类文档盲去噪系统、方法及装置
CN111814780B (zh) * 2020-07-08 2023-05-26 重庆农村商业银行股份有限公司 一种票据图像处理方法、装置、设备及存储介质
US11727700B2 (en) 2021-06-11 2023-08-15 Capital One Services, Llc Line removal from an image
CN113705524A (zh) * 2021-09-06 2021-11-26 上海景吾智能科技有限公司 图像中垂直线检测方法及系统
CN116363129B (zh) * 2023-05-31 2023-08-22 山东辰欣佛都药业股份有限公司 一种滴眼剂生产用智能灯检系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949249A (zh) * 2005-10-11 2007-04-18 株式会社理光 表格提取方法和设备
CN101727582A (zh) * 2008-10-22 2010-06-09 富士通株式会社 文档图像二值化方法及其装置,以及文档图像处理器
CN103761520A (zh) * 2013-12-05 2014-04-30 南京理工大学 基于笔划宽度的文档图像无参二值化方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04302375A (ja) * 1991-03-29 1992-10-26 Eastman Kodak Japan Kk 画像二値化装置
JPH11232382A (ja) * 1998-02-10 1999-08-27 Hitachi Ltd 罫線抽出方法及び罫線除去方法
JP4077094B2 (ja) * 1998-12-11 2008-04-16 富士通株式会社 カラー文書画像認識装置
US6282326B1 (en) * 1998-12-14 2001-08-28 Eastman Kodak Company Artifact removal technique for skew corrected images
US6674900B1 (en) * 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
JP4100885B2 (ja) * 2001-07-11 2008-06-11 キヤノン株式会社 帳票認識装置、方法、プログラムおよび記憶媒体
US6873728B2 (en) * 2002-01-16 2005-03-29 Eastman Kodak Company Vertical black line removal implementation
JP2004334743A (ja) * 2003-05-12 2004-11-25 Daemon:Kk 罫線の抽出方法、罫線の符号化方法及び罫線抽出プログラム
JP4791295B2 (ja) * 2006-08-31 2011-10-12 富士通株式会社 罫線抽出プログラム、罫線抽出装置、罫線抽出方法
US8265393B2 (en) * 2007-05-01 2012-09-11 Compulink Management Center, Inc. Photo-document segmentation method and system
CN103383732B (zh) * 2012-05-04 2016-12-14 富士通株式会社 图像处理方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1949249A (zh) * 2005-10-11 2007-04-18 株式会社理光 表格提取方法和设备
CN101727582A (zh) * 2008-10-22 2010-06-09 富士通株式会社 文档图像二值化方法及其装置,以及文档图像处理器
CN103761520A (zh) * 2013-12-05 2014-04-30 南京理工大学 基于笔划宽度的文档图像无参二值化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A Scale Space Approach Segmenting Words from Historical Handwritten Documents;R.MANMATHA等;《IEEE》;20051231;第1212-1225页
Line Removal and Restoration of Handwritten Strokes;Arvind K R等;《IEEE》;20071231;第13-15页

Also Published As

Publication number Publication date
EP3002712A2 (en) 2016-04-06
JP2016071855A (ja) 2016-05-09
EP3002712A3 (en) 2016-05-11
CN105469027A (zh) 2016-04-06
JP6262176B2 (ja) 2018-01-17
US9495343B2 (en) 2016-11-15
US20160092417A1 (en) 2016-03-31

Similar Documents

Publication Publication Date Title
CN105469027B (zh) 针对文档图像的水平和垂直线检测和移除
CN105469026B (zh) 针对文档图像的水平和垂直线检测和移除
US10896349B2 (en) Text detection method and apparatus, and storage medium
CN110033471B (zh) 一种基于连通域分析和形态学操作的框线检测方法
CN109409366B (zh) 基于角点检测的畸变图像校正方法及装置
WO2020140698A1 (zh) 表格数据的获取方法、装置和服务器
CN101453575B (zh) 一种视频字幕信息提取方法
US9251614B1 (en) Background removal for document images
JP4626886B2 (ja) デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置
CN104424482A (zh) 图像处理设备和图像处理方法
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
US20060245650A1 (en) Precise grayscale character segmentation apparatus and method
CN104376318A (zh) 在保留交叉字符笔划的同时去除文档图像中的下划线和表格线
JP5547226B2 (ja) 画像処理装置、及び画像処理方法
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN105303190B (zh) 一种基于对比度增强法的降质文档图像二值化方法
US9355311B2 (en) Removal of graphics from document images using heuristic text analysis and text recovery
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
US9076058B2 (en) Methods, systems and apparatus for determining orientation in a document image
Boiangiu et al. Handwritten documents text line segmentation based on information energy
US11570331B2 (en) Image processing apparatus, image processing method, and storage medium
JP6354316B2 (ja) 画像検出装置及びプログラム
JP4244692B2 (ja) 文字認識装置及び文字認識プログラム
CN107092909B (zh) 基于三角形相似定理的角度检测算法
Soumya et al. Enhancement and segmentation of historical records

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant