CN102196112B - 用于检测页边界的方法和装置 - Google Patents

用于检测页边界的方法和装置 Download PDF

Info

Publication number
CN102196112B
CN102196112B CN201010116618.6A CN201010116618A CN102196112B CN 102196112 B CN102196112 B CN 102196112B CN 201010116618 A CN201010116618 A CN 201010116618A CN 102196112 B CN102196112 B CN 102196112B
Authority
CN
China
Prior art keywords
page boundary
page
straightway
boundary
straight line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010116618.6A
Other languages
English (en)
Other versions
CN102196112A (zh
Inventor
胥立丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to CN201010116618.6A priority Critical patent/CN102196112B/zh
Priority to US13/037,132 priority patent/US8675969B2/en
Priority to JP2011044288A priority patent/JP5055449B2/ja
Publication of CN102196112A publication Critical patent/CN102196112A/zh
Application granted granted Critical
Publication of CN102196112B publication Critical patent/CN102196112B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00708Size or dimensions
    • H04N1/0071Width
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00729Detection means
    • H04N1/00734Optical detectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00742Detection methods
    • H04N1/00748Detecting edges, e.g. of a stationary sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/04Scanning arrangements
    • H04N2201/0402Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207
    • H04N2201/0434Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207 specially adapted for scanning pages of a book

Abstract

本发明公开了一种用于检测页边界的方法和装置,其能够准确地检测全部页边界并应对许多种类的复杂情况。所述方法包括:边缘图像检测步骤,用于从书本文档图像检测边缘图像;水平页边界检测步骤,用于检测边缘图像上的顶页边界和底页边界;装订中心线检测步骤,用于通过寻找左页和右页在顶页边界和底页边界上的交点来检测装订中心线;页宽度确定步骤,用于确定书本文档图像的页宽度;和垂直页边界确定步骤,用于通过使用顶页边界、底页边界、装订中心线和页宽度来确定左页边界和右页边界。

Description

用于检测页边界的方法和装置
技术领域
本发明涉及图像处理方法及其装置。更具体地,本发明涉及用于检测在中心部分具有装订弯曲(curvature)的书本文档图像的页边界的方法及其装置,所述方法及其装置主要应用于从平板扫描仪、MFP等得到的图像。
背景技术
图像扫描仪的一个问题是,当扫描仪扫描展开的书本文档时,书本的装订部分上升到玻璃台板之上并由此离开扫描仪的焦平面。因此,装订部分的图像畸变、变暗、模糊或劣化,这在本领域中是公知的。对于相对厚的书本文档,所述问题变得更加严重。
为了补偿装订部分中的图像劣化,检测准确的页边界对于基于图像处理的补偿技术是非常重要的步骤。例如,日本专利公开No.5-161000、No.5-161001、No.5-161002和No.6-164852中公开的技术需要通过检测页边界来测量整个文档页的高度,并然后在整个弯曲的页上执行校正。但是,以上的文献都没有教导用于检测页边界的特定方法。
美国专利No.6330050B1公开了一种页边界识别手段,所述页边界识别手段在预先选择的范围上逐条图像行地比较图像亮度数据与自适应阈值,以由此计算页边界的位置。但是,所公开的手段的目的仅在于找到装订部分中的页边界,并且不能应对一些复杂的图像。例如,对于具有比书本页(book page)大的书本封面(book cover)的书本文档图像,所述手段可能会失败。并且,以上的文献均不涉及找到垂直页边界的问题。
鉴于以上的情况,需要一种用于检测书本文档图像的页边界的方法及其装置,所述方法及其装置能够准确地检测书本文档图像的全部页边界,并且/或者能够应对许多种类的复杂情况,包括上述的大的书本封面、存在于页边界附近的其它干扰物等。
发明内容
因此,本发明的目的是提供一种用于检测页边界的方法及其装置,其中,能够准确地检测书本文档图像的全部页边界。
本发明的另一目的是提供一种用于检测页边界的方法及其装置,其中,能够应对许多种类的复杂情况,包括比书本页大的书本封面、存在于页边界附近的其它的干扰物等。
根据本发明的第一方面,提供一种用于检测书本文档图像的页边界的方法,所述方法包括:边缘图像检测步骤,用于从书本文档图像检测边缘图像;水平页边界检测步骤,用于检测边缘图像上的顶页边界和底页边界;装订中心线检测步骤,用于通过寻找左页和右页在顶页边界和底页边界上的交点来检测装订中心线;页宽度确定步骤,用于确定书本文档图像的页宽度;和垂直页边界确定步骤,用于通过使用顶页边界、底页边界、装订中心线和页宽度来确定左页边界和右页边界。
水平页边界检测步骤还包含:直线段检测步骤,用于检测边缘图像上的多条直线段;直线部分选择步骤,用于从所述多条直线段选择顶页边界和底页边界的直线部分;和弯曲部分检测步骤,用于基于顶页边界和底页边界的直线部分来检测边缘图像上的顶页边界和底页边界的弯曲部分。
优选地,在直线段检测步骤中,执行在后面描述的预处理。
优选地,在直线部分选择步骤中,基于在后面描述的一些选择准则来执行选择。
根据本发明的第二方面,提供一种用于检测书本文档图像的页边界的装置,所述装置包括:边缘图像检测部件,用于从书本文档图像检测边缘图像;水平页边界检测部件,用于检测边缘图像上的顶页边界和底页边界;装订中心线检测部件,用于通过寻找左页和右页在顶页边界和底页边界上的交点来检测装订中心线;页宽度确定部件,用于确定书本文档图像的页宽度;和垂直页边界确定部件,用于通过使用顶页边界、底页边界、装订中心线和页宽度来确定左页边界和右页边界。
水平页边界检测部件还包含:直线段检测部件,用于检测边缘图像上的多条直线段;直线部分选择部件,用于从所述多条直线段选择顶页边界和底页边界的直线部分;和弯曲部分检测部件,用于基于顶页边界和底页边界的直线部分来检测边缘图像上的顶页边界和底页边界的弯曲部分。
优选地,在直线段检测部件中,执行在后面描述的预处理。
优选地,在直线部分选择部件中,基于后面描述的一些选择准则来执行选择。
从参照附图对示例性实施例的以下详细描述,本发明的进一步的目的、特征和优点将变得明显。
附图说明
被包含于说明书中并构成其一部分的附图示出本发明的实施例,并与描述一起用于解释本发明的原理。
图1示出示例性的书本文档图像。
图2示出书本文档图像的页模型。
图3是表示实现根据本发明的页边界检测方法的示例性一般过程的流程图。
图4示出图1所示的书本文档图像的边缘图像。
图5是表示根据本发明的水平页边界检测步骤的示例性过程的流程图。
图6示出在页边界附近存在干扰物的情况下选择水平页边界的直线部分的原理。
图7示出跟踪水平页边界的弯曲部分的过程。
图8(a)示出检测页角点(corner point)的示意性过程,图8(b)示出检测页角点的示例过程。
图9示出根据本发明的页边界检测方法的一个示例性结果。
图10示出根据本发明的页边界检测方法的另一个示例性结果。
图11是表示根据本发明的页边界检测装置的示例性一般配置的框图。
图12是表示根据本发明的水平页边界检测部件的示例性配置的框图。
具体实施方式
现在参照附图详细描述本发明的示例性实施例。应注意,除非另外特别说明,否则,在实施例中阐述的组件和步骤不限制本发明的范围。
以下的描述在本质上仅是解释性的,决不是意在限制本发明、其应用或用途。
本领域技术人员已知的技术、方法和装置可能不被详细讨论,但在适当的情况下意在成为说明书的一部分。
页模型
图1示出从图像扫描仪获得的示例性展开书本文档图像。从图1明显可见,图像具有左页和右页,并且,中心装订部分的图像在一定程度上畸变、变暗、模糊或劣化。并且,在页边界附近存在干扰物,在这种情况下为标签和大的书本封面。
图2示出书本文档图像的页模型。在图2中,附图标记A和B分别表示左页和右页。附图标记C表示左页和右页在顶页边界和底页边界上的交点。另外,附图标记1表示装订中心线,附图标记2表示水平页边界,其中,顶侧的为顶页边界,底侧的为底页边界。从图2可以看出,可通过两个部分来模拟各水平页边界:直线部分2a和装订中心线1附近的弯曲部分2b。并且,在顶页边界上,弯曲部分在直线部分之下;而在底页边界上,弯曲部分在直线部分之上。并且,附图标记3表示包含左页边界和右页边界的垂直页边界。垂直页边界可大致被视为直线。最后,附图标记W表示右页的页宽度,其是装订中心线和右页边界之间的垂直距离。类似地定义左页的页宽度。附图标记H表示右页的页高度,其是右页的顶页边界和底页边界之间的垂直距离。类似地定义左页的页高度。
以下,将基于图2所示的页模型来描述根据本发明的页边界检测方法及装置。
页边界检测方法
将参照图3来描述根据本发明的页边界检测方法的一般过程。
图3是表示实现根据本发明的页边界检测方法的示例性一般过程的流程图300。
在步骤310处,从输入的书本文档图像检测边缘图像。
在步骤320处,从所述边缘图像检测包含顶页边界和底页边界的水平页边界。
在步骤330处,通过寻找左页和右页在顶页边界和底页边界上的交点来检测装订中心线。
在步骤340处,确定书本文档图像的页宽度。
在步骤350处,基于顶页边界、底页边界、装订中心线和页宽度来确定包含左页边界和右页边界的垂直页边界。
最后,通过上述步骤的实施,对于输入的书本文档图像确定了全部的和准确的页边界。基于用以上方式确定的全部的页边界,可进一步校正代表中心装订部分的图像部分的畸变。
图3中的流程图简要示出根据本发明的页边界检测方法的基本步骤。以下,将更加详细地描述以上各步骤的示例性过程。
第一步骤即步骤310是从输入的书本文档图像检测边缘图像。在图像处理的领域中,许多的边缘检测算法是公知的,诸如Sobel算子、Canny算子等。在产生的二值边缘图像中,各像素代表所述点是否是边缘点。在各边缘点处,图像亮度急剧变化,或者更正式而言,具有明显的不连续性。图4示出图1所示的书本文档图像的示例性边缘图像。
下面,将参照图5更加详细地描述根据本发明的检测水平页边界的示例性过程。
如图5的流程图500所示,首先,在步骤510处,检测边缘图像上的多条直线段。如图像处理领域的技术人员公知的那样,可通过对于边缘图像执行例如Hough变换来容易地检测多条直线段。
在本发明中,为了使直线段检测处理更快并且为了仅检测非常可能处于水平页边界上的直线段,优选采用对于边缘图像的以下预处理。
这里,假定书本文档图像的背景区域是黑色的;并且,在背景区域中不存在许多噪声。
在边缘图像的顶侧,可以如下实施处理。对于边缘图像的各列,从顶到底进行寻找,并且,仅保留所遇到的前几个边缘点(例如,前三个边缘点)。还应注意,这里,要求各保留的边缘点在其顶侧具有较暗的颜色并在其底侧具有较亮的颜色。从图1明显可见该预处理的原理。在图1所示的书本文档图像中,由于存在尺寸比书本页大的书本封面,因此所遇到的第一个边缘点可能不属于顶页边界;而是,它可能属于书本封面。在其它的情形下,还存在所遇到的第一个边缘点可能属于页边界附近存在的干扰物的可能性。因此,需要保留首先遇到的几个边缘点。并且,由于书本文档图像的背景区域是黑色的,属于诸如书本封面的物体的图像区域通常较亮,并且,属于页边界近旁的图像区域甚至更亮,因此,在顶页边界的情况下,要求各保留的边缘点的顶侧具有较暗的颜色,而其底侧具有较亮的颜色。
边缘图像的底侧的情况类似。但是,这里,对于边缘图像的各列,作为替代从底到顶进行寻找,并且,仅保留所遇到的前几个边缘点(例如,前三个边缘点)。另一不同在于,要求各保留的边缘点在其底侧具有较暗的颜色并在其顶侧具有较亮的颜色,这与顶侧的情况相反。
顺便说一句,在以上的预处理中,当从顶到底寻找时或当从底到顶寻找时,对于边缘图像的各列保留前三个边缘点。但是,应注意,所保留的边缘点的数量仅是示例性的,并不意在限制本发明的保护范围。实际上,取决于实际的情形,本领域技术人员可采取两个边缘点、四个边缘点或更多个边缘点。
在以上的预处理之后,通过仅仅使用从顶到底寻找时所保留的边缘点和从底到顶寻找时所保留的边缘点,来检测多条直线段。例如,对于所有保留的边缘点执行Hough变换,以得到多条直线段。以上的预处理之后的Hough变换的计算量显著减少,这可有助于提高本发明的页边界检测方法的处理速度。
下面,在步骤520处,从步骤510中检测的多条直线段之中选择顶页边界和底页边界的直线部分。
从所述多条检测的直线段,选择四条直线段作为分别与左页的顶页边界和底页边界以及右页的顶页边界和底页边界对应的水平页边界的直线部分。选择准则如下。
a)在顶侧,左页的顶页边界的直线段和右页的顶页边界的直线段(其构成直线段对)大致处于同一条直线上(它们不必要正好处于同一条直线上)。类似的准则适用于底侧。也就是说,在底侧,左页的底页边界的直线段和右页的底页边界的直线段大致处于同一条直线上。
b)在顶侧,如果多于一个的直线段对满足准则a),那么计算上面的直线段对和下面的直线段对之间的垂直距离。如果所计算的垂直距离比预定阈值D(例如,50个像素,但是,可基于实际的情形和需要来确定该阈值)大,那么选择上面的直线段对作为顶页边界的直线部分;否则,选择下面的直线段对作为顶页边界的直线部分。另一方面,在底侧,在多于一个的直线段对满足准则a)的情况下,如果所计算的垂直距离比预定阈值D大,那么选择下面的直线段对作为底页边界的直线部分;否则,选择上面的直线段对作为底页边界的直线部分。
顺便说一句,当在步骤510处检测直线段时,可以进行控制,以确保对于左页的顶侧和底侧中的每一个以及对于右页的顶侧和底侧中的每一个检测到最多两条直线段。例如,对于图4中的边缘图像的左上部分,如果检测到三条或更多条直线段,那么仅保留两条最长的。在这种情况下,最多两个直线段对可能满足准则a)。但是,对于本领域技术人员很显然的是,本发明不限于此。
图6示出从满足以上准则a)的多个直线段对选择水平页边界的直线部分的例子。在图6中,除了代表顶页边界的直线段对以外,左页和右页的顶部的粗体印刷直线对也可被检测为另外的直线段对。在这种情况下,这两对之间的垂直距离比预定阈值D大,由此,适当地选择上面的直线段对作为顶页边界的直线部分。另一方面,在图6的底侧,适当地选择下面的直线段对作为底页边界的直线部分。
与此相对照,回过来参照图1,在左页和右页的顶部不存在这样的粗体印刷直线对,而是存在尺寸比书本页大的书本封面,由此,书本封面也在书本文档图像中显示出来。因此,在图1中,除了代表顶页边界的直线段对以外,代表书本封面的、在顶页边界近旁的直线段对也可被检测为另外的直线段对。在这种情况下,这两对之间的垂直距离比预定阈值D小,由此,适当地选择下面的直线段对作为顶页边界的直线部分。并且,应注意,在图1中,在书本页的顶部的标签也可被检测为潜在的直线段的候选。但是,在标签的情况下,其垂直距离将比预定阈值D大,由此,与水平页边界附近的粗体印刷直线对的情况类似,代表标签的直线段将不被选择为顶页边界的直线部分。
以上的准则确保,即使当存在书本封面或干扰物(诸如水平页边界附近的标签和粗体印刷直线对)时,仍可适当地定位正确的水平页边界。因此,与现有技术中的页边界检测方法相比,根据本发明的页边界检测方法能够应对各种更复杂的情况。
在选择水平页边界的直线部分之后,在步骤530处,基于顶页边界和底页边界的直线部分,在边缘图像上检测顶页边界和底页边界的弯曲部分。
更具体而言,可根据直线部分和弯曲部分之间的位置关系来跟踪弯曲部分。图7作为例子给出左页的顶页边界的情况。所述过程可被如下实施。从左页的顶页边界的直线部分上的初始点(例如,所述初始点可位于装订中心线附近,但是,其位置不限于此),向着右下方向(参见图7中的箭头F)寻找边缘点,以得到左页的顶页边界的弯曲部分。可类似地检测右页的顶页边界、左页的底页边界和右页的底页边界的弯曲部分(将分别向着左下方向、右上方向和左上方向进行寻找)。
到现在为止,检测到水平页边界。
下面,根据图3的流程图的步骤330,检测装订中心线。
如图7所示,可容易地确定左页和右页在水平页边界上的交点(图7仅示出顶页边界上的交点C)。在确定交点(例如如图7所示的顶侧的交点C)之后,通过画出通过该交点并且与水平页边界(例如,顶页边界)的直线部分正交的直线,来确定装订中心线。顺便说一句,虽然采用顶侧的交点和顶页边界的直线部分来检测装订中心线的以上过程可能更准确,但是本发明不限于此。另外,在理论上,也可通过连接顶页边界上的交点和底页边界上的交点来检测装订中心线。但是,由于通常难以精确地找到交点,因此该过程可能不是非常准确。
在检测到装订中心线之后,如图3所示,在步骤340处确定书本文档图像的页宽度。
为了确定页宽度,可采用各种过程。例如,用于得到页宽度的一种方法是从用户界面得到书本文档的宽高比的值。之后,根据顶页边界和底页边界的直线部分之间的垂直距离来计算页高度。最后,可根据所获得的宽高比和所计算的页高度来计算页宽度。
用于得到页宽度的另一种方法基于页角点的检测。图8(a)作为例子给出左上页角点的情况,但是,本领域技术人员很容易想到,可通过类似的方法检测包括右上页角点、左下页角点和右下页角点的所有其它页角点。在图8(a)中,左上页角点G是两条线L1和L2的交点。更具体而言,线L1是左页的顶页边界的直线部分。线L2由以下的过程确定:(在图8(a)的情况下向左)寻找与线L1连接的边缘点;去除处于线L1上的边缘点;最后,在去除之后剩余的所找到的边缘点上拟合直线,以获得线L2。在获得线L1和L2之后,可通过线L1和L2的交点容易地确定左上页角点G。图8(b)示出检测页角点的示例过程,其与图8(a)中检测页角点的示意性过程对应。一旦检测到页角点,就能够容易地根据所检测到的页角点和所检测到的装订中心线来计算页宽度。更具体而言,页宽度是所检测到的页角点和装订中心线之间的垂直距离。
要注意,由于扫描变形,左页的页宽度和右页的页宽度可能不相同。因此,在基于页角点的检测来得到页宽度的以上方法中,需要分开地计算左页和右页的页宽度(顺便说一句,虽然采用顶侧的页角点的过程可能更准确,但是本发明不限于此)。相比而言,在基于宽高比和页高度来得到页宽度的以上方法中,仅需要执行一次计算。
应注意,上述方法在本质上仅是解释性的。
下面,根据图3的流程图,基于在以上的各步骤320-340中获得的顶页边界、底页边界、装订中心线和页宽度来确定垂直页边界。
更具体而言,可如下实施找到垂直页边界的示例性过程。通过参照装订中心线和页宽度来确定垂直页边界的水平位置(参照图2)。然后,可通过画出在确定的水平位置处与水平页边界的直线部分正交的两条垂直线(一条用于左页边界,另一条用于右页边界),来确定垂直页边界。在先前已在步骤340中检测到页角点的情况下,可通过画出在一个左页角点和一个右页角点处与水平页边界的直线部分正交的两条垂直线,来直接确定垂直页边界(顺便说一句,虽然采用顶侧的页角点的过程可能更准确,但是本发明不限于此)。在这种情况下,不必在步骤340中确定页宽度。
图9和图10示出本发明的页边界检测的示例性结果。更具体而言,图9示出使用本发明的方法所获得的图1中的书本文档图像的页边界检测结果。图10示出使用本发明的方法所获得的另一书本文档图像的页边界检测结果。与图9中的书本相比,图10中的书本相对薄。从这些图可以看出,即使在存在书本封面(参照图9)或页边界附近的干扰物(参照图9和图10中的标签)的各种复杂情况下,根据本发明的页边界检测方法仍可准确地检测书本文档图像的全部页边界。与现有技术的页边界检测方法相比,这是大大有利的。
页边界检测装置
以下,将简要描述根据本发明的示例性的页边界检测装置。
图11是表示根据本发明的页边界检测装置的示例性一般配置的框图。
从图11可以看出,根据本发明的页边界检测装置1100可包含边缘图像检测部件1110、水平页边界检测部件1120、装订中心线检测部件1130、页宽度确定部件1140和垂直页边界确定部件1150。显然,页边界检测装置1100还可根据实际需要而包含图11中没有示出的其它部件。
边缘图像检测部件1110被配置为从输入的书本文档图像检测边缘图像。边缘图像检测部件1110所采用的边缘检测方法可以是Sobel算子、Canny算子等。
水平页边界检测部件1120被配置为从边缘图像检测顶页边界和底页边界。图12是表示根据本发明的水平页边界检测部件的示例性一般配置的框图。图12所示的水平页边界检测部件1200包含直线段检测部件1210、直线部分选择部件1220和弯曲部分检测部件1230。更具体而言,直线段检测部件1210优选在上述的预处理之后检测边缘图像上的多条直线段。直线部分选择部件1220通过应用上述的选择准则a)和b),从所检测到的多条直线段之中选择顶页边界和底页边界的直线部分。弯曲部分检测部件1230基于顶页边界和底页边界的直线部分,来检测边缘图像上的顶页边界和底页边界的弯曲部分。最终,可通过水平页边界检测部件1120来检测水平页边界。
现在返回到图11。装订中心线检测部件1130被配置为通过寻找左页和右页在顶页边界和底页边界上的交点来检测装订中心线。
页宽度确定部件1140被配置为确定书本文档图像的页宽度。页宽度确定部件1140可采用各种不同的方法来确定页宽度。一种方法是从用户界面得到书本文档的宽高比的值,根据顶边界和底边界的直线部分之间的垂直距离来计算页高度,并且根据宽高比和页高度来获得页宽度。另一种方法基于如前所述的页角点的检测。
垂直页边界确定部件1150被配置为基于分别由水平页边界检测部件1120、装订中心线检测部件1130和页宽度确定部件1140所确定的顶页边界和底页边界、装订中心线以及页宽度,来确定左页边界和右页边界。
应注意,所有以上的部件都是用于实施本发明的页边界检测方法的示例性优选模块。但是,以上并没有穷尽性地描述用于实施各步骤的模块。一般地,在存在执行某过程的步骤的情况下,就存在用于实施同一过程的相应的功能模块或部件。
另外,应注意,在图11和图12中,可将两个或更多个部件组合成一个部件,只要可以实现它们的功能即可;另一方面,可将任何一个部件分成多个部件,只要可以实现类似的功能即可。
可以以各种方式实施本发明的页边界检测方法和装置。例如,可以通过软件、硬件、固件或它们的任意组合来实施本发明的页边界检测方法和装置。此外,在一些实施例中,本发明还可被实施为记录在记录介质中的程序,包括用于实施根据本发明的页边界检测方法的机器可读指令。因此,本发明还涵盖存储用于实施根据本发明的页边界检测方法的程序的记录介质。
虽然已参照示例性实施例描述了本发明,但应理解,本发明不限于所公开的示例性实施例。对于本领域技术人员显然的是,可在不背离本发明的范围和精神的条件下修改以上的示例性实施例。所附的权利要求的范围应被赋予最宽的解释,以包含所有这样的修改以及等同的结构和功能。

Claims (10)

1.一种用于检测书本文档图像的页边界的方法,包括:
边缘图像检测步骤,用于从书本文档图像检测边缘图像;
水平页边界检测步骤,用于检测边缘图像上的顶页边界和底页边界;
装订中心线检测步骤,用于通过寻找左页和右页在顶页边界和底页边界上的交点来检测装订中心线;
页宽度确定步骤,用于确定书本文档图像的页宽度;和
垂直页边界确定步骤,用于通过使用顶页边界、底页边界、装订中心线和页宽度来确定左页边界和右页边界,
其中,水平页边界检测步骤进一步包括:
直线段检测步骤,用于检测边缘图像上的多条直线段;
直线部分选择步骤,用于从所述多条直线段选择顶页边界和底页边界的直线部分;和
弯曲部分检测步骤,用于基于顶页边界和底页边界的直线部分来检测边缘图像上的顶页边界和底页边界的弯曲部分,
其中,基于以下的选择准则来执行直线部分选择步骤:
a)在顶侧,左页的顶页边界的直线段和右页的顶页边界的直线段大致处于同一条直线上,并且,在底侧,左页的底页边界的直线段和右页的底页边界的直线段大致处于同一条直线上;
b)在顶侧,在多于一个的直线段对满足准则a)的情况下,如果上面的直线段对和下面的直线段对之间的垂直距离比预定阈值大,那么选择上面的直线段对作为顶页边界的直线部分,否则,选择下面的直线段对作为顶页边界的直线部分;在底侧,在多于一个的直线段对满足准则a)的情况下,如果上面的直线段对和下面的直线段对之间的垂直距离比预定阈值大,那么选择下面的直线段对作为底页边界的直线部分,否则,选择上面的直线段对作为底页边界的直线部分。
2.根据权利要求1的方法,
其中,在直线段检测步骤中,执行以下的预处理:
对于边缘图像的各列,从顶到底寻找并且仅保留所遇到的前几个边缘点,其中,要求从顶到底寻找时的各保留的边缘点在其顶侧具有较暗的颜色并在其底侧具有较亮的颜色,并且
对于边缘图像的各列,从底到顶寻找并且仅保留所遇到的前几个边缘点,其中,要求从底到顶寻找时的各保留的边缘点在其底侧具有较暗的颜色并在其顶侧具有较亮的颜色;
其中,通过仅使用从顶到底寻找时保留的边缘点和从底到顶寻找时保留的边缘点,来检测所述多条直线段。
3.根据权利要求1或2的方法,其中,页宽度确定步骤进一步包括:
从用户界面获得书本文档的宽高比的值;
根据顶页边界和底页边界的直线部分之间的垂直距离来确定书本文档图像的页高度;和
根据宽高比和页高度来计算页宽度。
4.根据权利要求1或2的方法,其中,页宽度确定步骤进一步包括:
根据顶页边界和底页边界来检测边缘图像上的书本文档图像的页角点;和
根据页角点和装订中心线来计算页宽度。
5.根据权利要求1或2的方法,其中,在垂直页边界确定步骤中,通过参照装订中心线和页宽度来确定垂直页边界的水平位置,并且,通过画出在所确定的水平位置处与水平页边界的直线部分正交的两条垂直线来确定垂直页边界。
6.一种用于检测书本文档图像的页边界的装置,包括:
边缘图像检测部件,用于从书本文档图像检测边缘图像;
水平页边界检测部件,用于检测边缘图像上的顶页边界和底页边界;
装订中心线检测部件,用于通过寻找左页和右页在顶页边界和底页边界上的交点来检测装订中心线;
页宽度确定部件,用于确定书本文档图像的页宽度;和
垂直页边界确定部件,用于通过使用顶页边界、底页边界、装订中心线和页宽度来确定左页边界和右页边界,
其中,水平页边界检测部件进一步包括:
直线段检测部件,用于检测边缘图像上的多条直线段;
直线部分选择部件,用于从所述多条直线段选择顶页边界和底页边界的直线部分;和
弯曲部分检测部件,用于基于顶页边界和底页边界的直线部分来检测边缘图像上的顶页边界和底页边界的弯曲部分,
其中,直线部分选择部件基于以下的选择准则来选择顶页边界和底页边界的直线部分:
a)在顶侧,左页的顶页边界的直线段和右页的顶页边界的直线段大致处于同一条直线上,并且,在底侧,左页的底页边界的直线段和右页的底页边界的直线段大致处于同一条直线上;
b)在顶侧,在多于一个的直线段对满足准则a)的情况下,如果上面的直线段对和下面的直线段对之间的垂直距离比预定阈值大,那么选择上面的直线段对作为顶页边界的直线部分,否则,选择下面的直线段对作为顶页边界的直线部分;在底侧,在多于一个的直线段对满足准则a)的情况下,如果上面的直线段对和下面的直线段对之间的垂直距离比预定阈值大,那么选择下面的直线段对作为底页边界的直线部分,否则,选择上面的直线段对作为底页边界的直线部分。
7.根据权利要求6的装置,
其中,在直线段检测部件中,执行以下的预处理:
对于边缘图像的各列,从顶到底寻找并且仅保留所遇到的前几个边缘点,其中,要求从顶到底寻找时的各保留的边缘点在其顶侧具有较暗的颜色并在其底侧具有较亮的颜色,并且
对于边缘图像的各列,从底到顶寻找并且仅保留所遇到的前几个边缘点,其中,要求从底到顶寻找时的各保留的边缘点在其底侧具有较暗的颜色并在其顶侧具有较亮的颜色;
其中,在直线段检测部件中,通过仅使用从顶到底寻找时保留的边缘点和从底到顶寻找时保留的边缘点,来检测所述多条直线段。
8.根据权利要求6或7的装置,其中,页宽度确定部件进一步包括:
从用户界面获得书本文档的宽高比的值的部件;
根据顶页边界和底页边界的直线部分之间的垂直距离来确定书本文档图像的页高度的部件;和
根据宽高比和页高度来计算页宽度的部件。
9.根据权利要求6或7的装置,其中,页宽度确定部件进一步包括:
根据顶页边界和底页边界来检测边缘图像上的书本文档图像的页角点的部件;和
根据页角点和装订中心线来计算页宽度的部件。
10.根据权利要求6或7的装置,其中,在垂直页边界确定部件中,通过参照装订中心线和页宽度来确定垂直页边界的水平位置,并且,通过画出在所确定的水平位置处与水平页边界的直线部分正交的两条垂直线来确定垂直页边界。
CN201010116618.6A 2010-03-01 2010-03-01 用于检测页边界的方法和装置 Active CN102196112B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201010116618.6A CN102196112B (zh) 2010-03-01 2010-03-01 用于检测页边界的方法和装置
US13/037,132 US8675969B2 (en) 2010-03-01 2011-02-28 Method and apparatus for detecting page boundaries
JP2011044288A JP5055449B2 (ja) 2010-03-01 2011-03-01 ページ境界を検出する方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010116618.6A CN102196112B (zh) 2010-03-01 2010-03-01 用于检测页边界的方法和装置

Publications (2)

Publication Number Publication Date
CN102196112A CN102196112A (zh) 2011-09-21
CN102196112B true CN102196112B (zh) 2014-09-24

Family

ID=44505287

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010116618.6A Active CN102196112B (zh) 2010-03-01 2010-03-01 用于检测页边界的方法和装置

Country Status (3)

Country Link
US (1) US8675969B2 (zh)
JP (1) JP5055449B2 (zh)
CN (1) CN102196112B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8131009B2 (en) * 2008-11-11 2012-03-06 Xerox Corporation Automatic spine creation from book covers without spines
JP2012256109A (ja) * 2011-06-07 2012-12-27 Sony Corp 情報処理装置、プログラム及び情報処理方法
US10289924B2 (en) 2011-10-17 2019-05-14 Sharp Laboratories Of America, Inc. System and method for scanned document correction
CN103366165B (zh) * 2012-03-30 2016-06-29 富士通株式会社 图像处理装置、图像处理方法以及设备
US9426416B2 (en) * 2012-10-17 2016-08-23 Cisco Technology, Inc. System and method for utilizing a surface for remote collaboration
CN105279510B (zh) * 2015-10-10 2018-09-04 上海中信信息发展股份有限公司 文档图像装订孔的自动定位方法及装置
KR101761641B1 (ko) 2015-10-20 2017-08-08 주식회사 셀바스에이아이 엣지 라인을 검출하여 분할선을 획득하는 장치 및 방법
EP3449420A4 (en) 2016-04-28 2019-11-27 Hewlett-Packard Development Company, L.P. EXTRACTING AN IMAGE FROM A DOCUMENT PAGE FROM AN ELECTRONICALLY BROWN IMAGE INCLUDING NON-UNIFORM BACKGROUND CONTENT
US10121088B2 (en) * 2016-06-03 2018-11-06 Adobe Systems Incorporated System and method for straightening curved page content
CN107358150B (zh) * 2017-06-01 2020-08-18 深圳赛飞百步印社科技有限公司 物体边框识别方法、装置和高拍仪
CN111402281B (zh) * 2020-03-12 2023-11-10 上海合合信息科技股份有限公司 一种书籍边缘检测方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1655576A (zh) * 2004-01-09 2005-08-17 三星电子株式会社 图像扫描方法和装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054098A (en) * 1990-05-21 1991-10-01 Eastman Kodak Company Method of detecting the skew angle of a printed business form
JP3136721B2 (ja) 1991-12-05 2001-02-19 ミノルタ株式会社 原稿読み取り装置
JP3163703B2 (ja) 1991-12-05 2001-05-08 ミノルタ株式会社 原稿読み取り装置
JP3175250B2 (ja) 1991-12-05 2001-06-11 ミノルタ株式会社 原稿読み取り装置
JPH06164852A (ja) 1992-11-16 1994-06-10 Minolta Camera Co Ltd 原稿読み取り装置
JP3821860B2 (ja) * 1994-03-15 2006-09-13 コニカミノルタビジネステクノロジーズ株式会社 画像読取装置
JP3670692B2 (ja) * 1994-05-12 2005-07-13 株式会社リコー 画像読み取り装置
US5677776A (en) * 1994-09-29 1997-10-14 Minolta Co., Ltd. Image reader for processing an image of a document
JPH08154154A (ja) * 1994-09-29 1996-06-11 Minolta Co Ltd 画像読み取り装置
US6721066B2 (en) * 1994-11-18 2004-04-13 Minolta Co., Ltd. Image processor
JPH08154157A (ja) * 1994-11-28 1996-06-11 Ricoh Co Ltd 本原稿画像読み取り装置
JP3631333B2 (ja) * 1996-08-23 2005-03-23 シャープ株式会社 画像処理装置
JP4037512B2 (ja) * 1997-04-15 2008-01-23 コニカミノルタビジネステクノロジーズ株式会社 画像読取装置
US6330050B1 (en) * 1997-07-24 2001-12-11 Ricoh Company, Ltd Image processing device for providing correction of a curvature distortion of a bound portion of a spread book
JPH11143986A (ja) * 1997-10-17 1999-05-28 Internatl Business Mach Corp <Ibm> ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体
JP3634626B2 (ja) * 1998-05-22 2005-03-30 株式会社リコー 画像読取装置
US6954290B1 (en) * 2000-11-09 2005-10-11 International Business Machines Corporation Method and apparatus to correct distortion of document copies
US6987880B2 (en) * 2001-03-22 2006-01-17 Sharp Laboratories Of America, Inc. Efficient document boundary determination
US7145699B2 (en) * 2001-03-30 2006-12-05 Sharp Laboratories Of America, Inc. System and method for digital document alignment
JP3917421B2 (ja) * 2001-12-26 2007-05-23 株式会社リコー 画像輝度補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体
JP4141235B2 (ja) * 2002-02-08 2008-08-27 株式会社リコー 画像補正装置及びプログラム
JP4006242B2 (ja) * 2002-02-27 2007-11-14 株式会社リコー 画像補正装置、プログラム、記憶媒体及び画像補正方法
US20050226503A1 (en) * 2004-04-07 2005-10-13 Bailey James R Scanned image content analysis
US7330604B2 (en) * 2006-03-02 2008-02-12 Compulink Management Center, Inc. Model-based dewarping method and apparatus
JP4991411B2 (ja) * 2006-07-28 2012-08-01 キヤノン株式会社 画像処理方法
US8223361B2 (en) * 2006-10-11 2012-07-17 Sharp Laboratories Of America, Inc. Empty job detection for direct print
JP4784500B2 (ja) * 2006-12-08 2011-10-05 日本電気株式会社 画像傾き補正装置及び画像傾き補正方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1655576A (zh) * 2004-01-09 2005-08-17 三星电子株式会社 图像扫描方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP平11-341230A 1999.12.10

Also Published As

Publication number Publication date
US8675969B2 (en) 2014-03-18
JP2011181071A (ja) 2011-09-15
JP5055449B2 (ja) 2012-10-24
CN102196112A (zh) 2011-09-21
US20110211755A1 (en) 2011-09-01

Similar Documents

Publication Publication Date Title
CN102196112B (zh) 用于检测页边界的方法和装置
US8477390B2 (en) Image processor, image processing method, and computer program product
CN105205439B (zh) 指纹重叠区域面积的计算方法及电子装置
US8213687B2 (en) Image processing methods, image processing systems, and articles of manufacture
CN102496018B (zh) 一种文档倾斜检测方法及系统
EP2449531B1 (en) Skew detection
US9002106B2 (en) Image processing apparatus, image processing method, and storage medium
JP4955096B2 (ja) 検出装置、検出方法、検出プログラム、および記録媒体
US8970916B2 (en) Image processing apparatus and method of supplementing pixel value
CN102801897B (zh) 图像处理装置和图像处理方法
CN102801896B (zh) 图像处理装置和图像处理方法
CN111047615B (zh) 基于图像的直线检测方法、装置以及电子设备
WO2010140159A2 (en) Edge detection
CN104079750A (zh) 图像处理装置及区域确定方法
US10235576B2 (en) Analysis method of lane stripe images, image analysis device, and non-transitory computer readable medium thereof
JP5958101B2 (ja) 画像処理方法及び画像処理装置
US8442348B2 (en) Image noise reduction for digital images using Gaussian blurring
CN104487966A (zh) 文档分类
CN113557520A (zh) 字符处理及字符识别方法、存储介质和终端设备
JP2009151759A (ja) 画像処理方法及び画像処理装置
US20130272615A1 (en) Image processing device and pixel interpolation method
CN113239733A (zh) 一种多车道车道线检测方法
JP2007206963A (ja) 画像処理装置及び画像処理方法及びプログラム及び記憶媒体
JP7440821B2 (ja) 画像処理装置、方法、および、コンピュータプログラム
CN102196148B (zh) 图像处理方法、图像处理设备和图像扫描设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant