JP5055449B2 - ページ境界を検出する方法及び装置 - Google Patents

ページ境界を検出する方法及び装置 Download PDF

Info

Publication number
JP5055449B2
JP5055449B2 JP2011044288A JP2011044288A JP5055449B2 JP 5055449 B2 JP5055449 B2 JP 5055449B2 JP 2011044288 A JP2011044288 A JP 2011044288A JP 2011044288 A JP2011044288 A JP 2011044288A JP 5055449 B2 JP5055449 B2 JP 5055449B2
Authority
JP
Japan
Prior art keywords
page boundary
page
straight line
boundary
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011044288A
Other languages
English (en)
Other versions
JP2011181071A (ja
Inventor
シュ リーフェン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JP2011181071A publication Critical patent/JP2011181071A/ja
Application granted granted Critical
Publication of JP5055449B2 publication Critical patent/JP5055449B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00708Size or dimensions
    • H04N1/0071Width
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00729Detection means
    • H04N1/00734Optical detectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00742Detection methods
    • H04N1/00748Detecting edges, e.g. of a stationary sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/04Scanning arrangements
    • H04N2201/0402Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207
    • H04N2201/0434Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207 specially adapted for scanning pages of a book

Description

本発明は、画像処理方法及びその装置に関する。更に詳細には、本発明は、中央部分に綴じによる湾曲を有する書籍の文書画像のページ境界を検出する方法及びその装置に関する。それらはフラットベッドスキャナ、MFP等から取得された画像に主に適用される。
画像スキャナに関する1つの問題は、スキャナが見開きの書籍の文書を走査する場合に、書籍の綴じ部分がガラス原稿台から浮き上がるため、スキャナの焦点面から離れることである。そのため、綴じ部分の画像は歪むか、影が付くか、ぼやけるか、又は劣化する。これは当業界において周知である。相対的に厚い書籍の文書の場合、この問題は更に深刻になる。
綴じ部分の画像劣化を補償するためには、正確なページ境界を検出することが画像処理に基づく補償技術の非常に重要なステップである。例えば、特許文献1、2、3及び4に開示されている技術は、ページ境界の検出により文書のページ全体の高さを測定する必要があり、その後に湾曲したページ全体にわたり補正を実行している。しかし、上記の文献の何れにおいてもページ境界を検出する特定の方法は教示されない。
特許文献5には、事前選択範囲にわたり画線毎に画像濃度データと適応閾値とを比較することによりページ境界の位置を計算するページ境界認識手段が開示されている。しかし、開示された手段は綴じ部分のページ境界を見つけることのみを目的とし、一部の複雑な画像を処理できない。例えば、この手段は書籍のページより大きい表紙を有する書籍の文書画像を処理できない場合がある。更に、上記の全文献は垂直ページ境界を見つける、という問題を扱わない。
上記の点を考慮して、書籍の文書画像の完全なページ境界を正確に検出でき且つ/又は上述の書籍の大きい表紙、ページ境界付近に存在する他の障害物等を含む多くの種類の複雑な状態を処理できる書籍の文書画像のページ境界を検出する方法及びその装置が必要とされる。
特開平5−161000号公報 特開平5−161001号公報 特開平5−161002号公報 特開平6−164852号公報 米国特許第6,330,050B1号公報
従って、本発明の目的は、書籍の文書画像の完全なページ境界を正確に検出できるページ境界を検出する方法及びその装置を提供することである。
本発明の別の目的は、書籍のページより大きい表紙、ページ境界付近に存在する他の障害物等を含む多くの種類の複雑な状態を処理できるページ境界を検出する方法及びその装置を提供することである。
本発明の第1の態様によると、書籍の文書画像のページ境界を検出する方法であって、書籍の文書画像からエッジ画像を検出するエッジ画像検出ステップと、エッジ画像において上側ページ境界及び下側ページ境界を検出する水平ページ境界検出ステップと、上側ページ境界及び下側ページ境界における左ページ及び右ページの交点を探索することにより綴じ中心線を検出する綴じ中心線検出ステップと、書籍の文書画像のページ幅を判定するページ幅判定ステップと、上側ページ境界、下側ページ境界、綴じ中心線及びページ幅を使用することにより左側ページ境界及び右側ページ境界を判定する垂直ページ境界判定ステップとを有する方法が提供される。
水平ページ境界検出ステップは、エッジ画像において複数の直線区分を検出する直線区分検出ステップと、複数の直線区分から上側ページ境界及び下側ページ境界の直線部分を選択する直線部分選択ステップと、上側ページ境界及び下側ページ境界の直線部分に基づいてエッジ画像において上側ページ境界及び下側ページ境界の湾曲部分を検出する湾曲部分検出ステップとを更に有する。
直線区分検出ステップにおいて、以下に説明する前処理が実行されるのが好ましい。
直線部分選択ステップにおいて、選択は以下に説明するいくつかの選択基準に基づいて実行されるのが好ましい。
本発明の第2の態様によると、書籍の文書画像のページ境界を検出する装置であって、書籍の文書画像からエッジ画像を検出するエッジ画像検出手段と、エッジ画像において上側ページ境界及び下側ページ境界を検出する水平ページ境界検出手段と、上側ページ境界及び下側ページ境界における左ページ及び右ページの交点を探索することにより綴じ中心線を検出する綴じ中心線検出手段と、書籍の文書画像のページ幅を判定するページ幅判定手段と、上側ページ境界、下側ページ境界、綴じ中心線及びページ幅を使用することにより左側ページ境界及び右側ページ境界を判定する垂直ページ境界判定手段とを有する装置が提供される。
水平ページ境界検出手段は、エッジ画像において複数の直線区分を検出する直線区分検出手段と、複数の直線区分から上側ページ境界及び下側ページ境界の直線部分を選択する直線部分選択手段と、上側ページ境界及び下側ページ境界の直線部分に基づいてエッジ画像において上側ページ境界及び下側ページ境界の湾曲部分を検出する湾曲部分検出手段とを更に有する。
直線区分検出手段において、以下に説明する前処理が実行されるのが好ましい。
直線部分選択手段において、選択は以下に説明するいくつかの選択基準に基づいて実行されるのが好ましい。
本発明の更なる目的、特徴及び利点は、添付の図面を参照して好適な実施形態の以下の詳細な説明を読むことにより明らかとなるだろう。
本明細書の一部に組み込まれ且つそれを構成する添付の図面は、本発明の実施形態を図示し、説明と共に本発明の原理を説明するために用いられる。
書籍の文書画像の一例を示す図である。 書籍の文書画像のページモデルを示す図である。 本発明に係るページ境界検出方法を実現する一般的な処理の一例を示すフローチャートである。 図1に示す書籍の文書画像のエッジ画像を示す図である。 本発明に係る水平ページ境界検出ステップの処理の一例を示すフローチャートである。 障害物がページ境界付近に存在する場合に水平ページ境界の直線部分を選択する原理を示す図である。 水平ページ境界の湾曲部分を追跡する処理を示す図である。 ページの角点を検出する概略的な処理を示す図である。 ページの角点を検出する処理の一例を示す図である。 本発明に係るページ境界検出方法の結果の一例を示す図である。 本発明に係るページ境界検出方法の結果の別の例を示す図である。 本発明に係るページ境界検出装置の一般的な構成の一例を示すブロック図である。 本発明に係る水平ページ境界検出手段の構成の一例を示すブロック図である。
図面を参照して、本発明の好適な実施形態を以下に詳細に説明する。尚、特に指示がない限り、実施形態において説明される構成要素及びステップは本発明の範囲を限定しない。
以下の説明は単に例証するものであり、本発明、本発明の応用例又は用途を限定することを意図しない。
当業者には既知である技術、方法及び装置は詳細に説明されないが、必要に応じて本明細書の一部であることが意図される。
ページモデル
図1に、画像スキャナから取得された見開きの書籍の文書画像の一例を示す。図1から明らかであるように、画像は左ページ及び右ページを有し、中央の綴じ部分の画像は若干歪むか、影が付くか、ぼやけるか又は劣化する。更に、本例においては、付箋及び書籍の大きい表紙である障害物がページ境界付近に存在する。
図2に、書籍の文書画像のページモデルを示す。図2において、図中符号Aは左ページを示し、図中符号Bは右ページを示す。図中符号Cは、上側ページ境界及び下側ページ境界における左ページ及び右ページの交点を示す。更に、図中符号1は綴じ中心線を示す。図中符号2は水平ページ境界を示し、上側の水平ページ境界は上側ページ境界であり、下側の水平ページ境界は下側ページ境界である。図2から分かるように、各水平ページ境界は2つの部分、すなわち直線部分2a及び綴じ中心線1付近の湾曲部分2bにモデル化可能である。更に、上側ページ境界において湾曲部分は直線部分の下方に存在するが、下側ページ境界において湾曲部分は直線部分の上方に存在する。更に、図中符号3は、左側ページ境界及び右側ページ境界を含む垂直ページ境界を示す。垂直ページ境界は略直線であると考えられる。最後に、図中符号Wは右ページのページ幅を示し、これは綴じ中心線と右側ページ境界との間の垂直距離である。左ページのページ幅は同様に定義される。図中符号Hは右ページのページ高さを示し、これは右ページの上側ページ境界と下側ページ境界との間の垂直距離である。左ページのページ高さは同様に定義される。
図2に示すページモデルに基づいて、本発明に係るページ境界検出方法及び装置を以下に説明する。
ページ境界検出方法
図3を参照して、本発明に係るページ境界検出方法の一般的な処理を説明する。
図3は、本発明に係るページ境界検出方法を実現する一般的な処理の一例を示すフローチャート300である。
ステップ310において、エッジ画像が、入力された書籍の文書画像から検出される。
ステップ320において、上側ページ境界及び下側ページ境界を含む水平ページ境界が前記エッジ画像から検出される。
ステップ330において、綴じ中心線が上側ページ境界及び下側ページ境界における左ページ及び右ページの交点を探索することにより検出される。
ステップ340において、書籍の文書画像のページ幅が判定される。
ステップ350において、左側ページ境界及び右側ページ境界を含む垂直ページ境界が上側ページ境界、下側ページ境界、綴じ中心線及びページ幅に基づいて判定される。
最後に、上述のステップを実現することにより、完全、且つ正確なページ境界が、入力された書籍の文書画像に対して判定される。上記の方法で判定された完全なページ境界に基づいて、中央の綴じ部分を表す画像部分の歪みが更に補正されてもよい。
図3のフローチャートは、本発明に係るページ境界検出方法の基本ステップを簡潔に示す。上記の種々のステップの処理の例を以下に更に詳細に説明する。
第1のステップ、すなわちステップ310は、入力された書籍の文書画像からエッジ画像を検出するためのものである。画像処理の分野において、Sobel演算子、Canny演算子等の多くのエッジ検出アルゴリズムが周知である。作成された2値エッジ画像において、各画素は当該点がエッジ点であるか否かを示す。各エッジ点において、画像の輝度は急激に変化し、より形式的には不連続性が顕著である。図4に、図1に示す書籍の文書画像のエッジ画像の一例を示す。
次に、図5を参照して、本発明に係る水平ページ境界を検出する処理の一例を更に詳細に説明する。
図5のフローチャート500に示すように、最初にステップ510において、エッジ画像における複数の直線区分が検出される。画像処理の当業者には周知であるように、複数の直線区分は、例えばハフ変換をエッジ画像に実行することにより容易に検出可能である。
本発明において、直線区分検出処理をより高速にするため及び水平ページ境界上に存在する可能性が非常に高い直線区分のみを検出するために、エッジ画像に対する以下の前処理を採用することが好ましい。
ここで、書籍の文書画像の背景領域は黒色であり、且つ背景領域にはノイズが少ないと仮定する。
エッジ画像の上側において、処理は以下のように実行されてもよい。エッジ画像の列毎に、探索は上から下へ実行され、最初に見つけたいくつかのエッジ点(例えば、最初の3つのエッジ点)のみが確保される。尚、この場合、確保された各エッジ点は、その上側により暗い色を有し、且つその下側により明るい色を有する必要がある。この前処理の原理は図1から明らかである。図1に示す書籍の文書画像において、書籍のページよりサイズが大きい書籍の表紙が存在するため、最初に見つけたエッジ点は上側ページ境界ではなく書籍の表紙に属する場合がある。また、他の状況において、最初に見つけたエッジ点はページ境界付近に存在する障害物に属する可能性がある。従って、最初に見つけたいくつかのエッジ点を確保する必要がある。更に、書籍の文書画像の背景領域が黒色であり、書籍の表紙等の物体に属する画像領域が、通常はより明るく、且つページ境界の近傍に属する画像領域が更に明るいため、上側ページ境界の場合、確保された各エッジ点の上側はより暗い色を有し、且つその下側はより明るい色を有する必要がある。
エッジ画像の下側の場合も同様である。しかし、この場合、エッジ画像の列毎に、探索は下から上へ実行され、最初に見つけたいくつかのエッジ点(例えば、最初の3つのエッジ点)のみが確保される。別の相違点は、確保された各エッジ点がその下側により暗い色を有し、且つその上側により明るい色を有する必要があることであり、これは上側の場合の逆である。
尚、上記の前処理において、上から下への探索時又は下から上への探索時にエッジ画像の列毎に最初の3つのエッジ点が確保される。しかし、確保されたエッジ点の数は単なる例示であり、本発明の保護範囲を限定することを意図しない。現実には、実際の状況に応じて、2つのエッジ点、4つのエッジ点又はそれ以上のエッジ点が当業者により使用されてもよい。
上記の前処理後、複数の直線区分は、上から下への探索時に確保されたエッジ点及び下から上への探索時に確保されたエッジ点のみを使用することにより検出される。例えば、確保された全エッジ点に対してハフ変換を実行して複数の直線区分を取得する。上記の前処理後のハフ変換に対する計算量は大幅に減少する。これは、本発明のページ境界検出方法の処理速度の向上に寄与する。
次に、ステップ520において、上側ページ境界及び下側ページ境界の直線部分がステップ510で検出された複数の直線区分から選択される。
検出された複数の直線区分から、4つの直線区分が左ページの上側ページ境界及び下側ページ境界、並びに右ページの上側ページ境界及び下側ページ境界にそれぞれ対応する水平ページ境界の直線部分として選択される。選択基準は以下の通りである。
a)上側において、左ページの上側ページ境界の直線区分及び右ページの上側ページ境界の直線区分(これらは直線区分の対を構成する)は略同一直線上に存在する(それらが正確に同一直線上に存在する必要はない)。同様の基準が下側に適用される。すなわち、下側において、左ページの下側ページ境界の直線区分及び右ページの下側ページ境界の直線区分は略同一直線上に存在する。
b)上側において、2つ以上の直線区分の対が基準a)を満たす場合、上方の直線区分の対と下方の直線区分の対との間の垂直距離が計算される。計算された垂直距離が所定の閾値D(例えば50画素であるが、この閾値は実際の状況及び要求に基づいて判定されてもよい)より長い場合、上方の直線区分の対が上側ページ境界の直線部分として選択される。当該垂直距離が所定の閾値D以下である場合、下方の直線区分の対が上側ページ境界の直線部分として選択される。一方、下側において、2つ以上の直線区分の対が基準a)を満たす場合、計算された垂直距離が所定の閾値Dより長い場合は下方の直線区分の対が下側ページ境界の直線部分として選択される。当該垂直距離が所定の閾値D以下である場合、上方の直線区分の対が下側ページ境界の直線部分として選択される。
尚、ステップ510において直線区分を検出する場合、左ページの上側及び下側、並びに右ページの上側及び下側の各々に対して最大で2つの直線区分が検出されることを保証するように制御されてもよい。例えば、図4のエッジ画像の左上部分に対して3つ以上の直線区分が検出される場合、最も長い2つの直線区分のみが確保される。そのような場合、最大で2つの直線区分の対が基準a)を満たしてもよい。しかし、本発明がそれに限定されないことは当業者には容易に明らかである。
図6に、上記の基準a)を満たす複数の直線区分の対から水平ページ境界の直線部分を選択する一例を示す。図6において、上側ページ境界を表す直線区分の対に加えて、左ページ及び右ページ上の印刷された太い直線の対が別の直線区分の対として更に検出可能である。この場合、これら2つの対の間の垂直距離は所定の閾値Dより長いため、上方の直線区分の対が上側ページ境界の直線部分として適切に選択される。一方、図6の下側において、下方の直線区分の対が下側ページ境界の直線部分として適切に選択される。
これに対して、図1に戻ると、左ページ及び右ページ上にそのような印刷された太い直線の対は存在しない。その代わり、書籍のページよりサイズが大きい書籍の表紙が存在するため、書籍の表紙が書籍の文書画像内に更に出現する。従って、図1において、上側ページ境界を表す直線区分の対に加えて、書籍の表紙を表す上側ページ境界の近傍の直線区分の対が別の直線区分の対として更に検出可能である。この場合、これら2つの対の間の垂直距離が所定の閾値Dより短いため、下方の直線区分の対が上側ページ境界の直線部分として適切に選択される。更に図1において、書籍のページ上の付箋が潜在的な直線区分候補として更に検出可能である。しかし、付箋の場合、水平ページ境界付近の印刷された太い直線の対の場合と同様に、その垂直距離が所定の閾値Dより長いため、付箋を表す直線区分は上側ページ境界の直線部分として選択されない。
上記の基準は、書籍の表紙又は障害物(水平ページ境界付近の付箋及び印刷された太い直線の対等)が存在する場合であっても、正確な水平ページ境界が依然として適切に配置可能であることを保証する。従って、従来技術のページ境界検出方法と比較して、本発明に係るページ境界検出方法は種々の更に複雑な状態を処理できる。
水平ページ境界の直線部分の選択後、ステップ530において、上側ページ境界及び下側ページ境界の湾曲部分が上側ページ境界及び下側ページ境界の直線部分に基づいてエッジ画像において検出される。
更に詳細には、湾曲部分は直線部分と湾曲部分との位置関係に従って追跡されてもよい。図7は、一例として左ページの上側ページ境界の例を示す。処理は以下のように実行可能である。左ページの上側ページ境界の直線部分上の始点(例えば、この始点は綴じ中心線付近に位置してもよいが、その位置はこれに限定されない)から右下方向(図7の矢印Fを参照)に向けてエッジ点を探索することにより、左ページの上側ページ境界の湾曲部分を取得する。右ページの上側ページ境界、左ページの下側ページ境界及び右ページの下側ページ境界の湾曲部分は同様に検出可能である(探索はそれぞれ、左下方向、右上方向及び左上方向に向けて実行される)。
以上により、水平ページ境界が検出される。
次に、図3のフローチャートのステップ330に従って、綴じ中心線が検出される。
図7に示すように、水平ページ境界における左ページ及び右ページの交点(図7は、上側ページ境界上の交点Cのみを示す)は容易に判定されてもよい。交点、例えば図7に示す上側の交点Cの判定後、この交点を通過し且つ水平ページ境界(例えば上側ページ境界)の直線部分と直交する直線を引くことにより綴じ中心線が判定される。尚、綴じ中心線を検出するために上側の交点及び上側ページ境界の直線部分を使用する上記の処理はより正確である場合があるが、本発明はそれに限定されない。更に、理論上、綴じ中心線は上側ページ境界上の交点と下側ページ境界上の交点とを接続することにより検出されてもよい。しかし、交点を正確に見つけることが一般に困難であるため、この処理は精度が低い場合がある。
綴じ中心線の検出後、図3に示すように、ステップ340において書籍の文書画像のページ幅が判定される。
ページ幅を判定するために種々の処理が採用されてもよい。例えばページ幅を取得する1つの方法は、ユーザインタフェースから書籍の文書の幅対高さの比の値を取得することである。その後、ページ高さが上側ページ境界の直線部分と下側ページ境界の直線部分との間の垂直距離に従って計算される。最後に、ページ幅が取得された幅対高さの比及び計算されたページ高さに従って計算されてもよい。
ページ幅を取得する別の方法は、ページの角点の検出に基づく。図8(a)は一例としてページの左上の角点の例を示すが、ページの右上の角点、ページの左下の角点、ページの右下の角点を含むページの他の角点の全てが同様の方法により検出されてもよいことが当業者には容易に着想される。図8(a)において、ページの左上の角点Gは2本の線L1及びL2の交点である。更に詳細には、線L1は左ページの上側ページ境界の直線部分である。線L2は以下の処理により判定される。線L1に接続されるエッジ点を探索し(図8(a)の例では左に向けて)、線L1上に存在するエッジ点を除去し、最後に、見つけたエッジ点のうち除去後に残ったエッジ点上に直線を描くことにより線L2を取得する。線L1及びL2の取得後、ページの左上の角点Gは線L1及び線L2の交点により容易に判定可能である。図8(b)に、ページの角点を検出する処理の一例を示す。これは、図8(a)におけるページの角点を検出する概略的な処理に対応する。ページの角点が検出されると、ページ幅は検出されたページの角点及び検出された綴じ中心線に従って容易に計算可能である。更に詳細には、ページ幅は検出されたページの角点と綴じ中心線との間の垂直距離である。
尚、走査の歪みにより、左ページのページ幅及び右ページのページ幅が同一ではない場合がある。従って、ページの角点の検出に基づいてページ幅を取得する上記の方法において、左ページのページ幅及び右ページのページ幅を別個に計算する必要がある(尚、ページの上側の角点を使用する処理はより正確である場合があるが、本発明はそれに限定されない)。それに対して、幅対高さの比及びページ高さに基づいてページ幅を取得する上記の方法では計算は1度のみ実行される必要がある。
尚、上述の方法は単なる例示である。
次に、図3のフローチャートに従って、垂直ページ境界が上述の種々のステップ320〜340において取得された上側ページ境界、下側ページ境界、綴じ中心線及びページ幅に基づいて判定される。
更に詳細には、垂直ページ境界を見つける処理の一例は以下のように実行されてもよい。垂直ページ境界の水平位置は、綴じ中心線及びページ幅を参照することにより判定される(図2を参照)。その後、垂直ページ境界は、判定された水平位置において水平ページ境界の直線部分と直交する2本の垂線(一方は左側ページ境界に対し、他方は右側ページ境界に対する)を引くことにより判定可能である。ページの角点がステップ340において事前に検出されている場合、垂直ページ境界は、左ページの1つの角点及び右ページの1つの角点において水平ページ境界の直線部分と直交する2本の垂線を引くことにより、直接判定されてもよい(尚、ページの上側の角点を使用する処理はより正確である場合があるが、本発明はそれに限定されない)。この場合、ステップ340においてページ幅を判定する必要がない。
図9及び図10に、本発明のページ境界検出の結果の例を示す。更に詳細には、図9は本発明の方法を使用して取得された図1の書籍の文書画像のページ境界検出結果を示す図である。図10は、本発明の方法を使用して取得された別の書籍の文書画像のページ境界検出結果を示す図である。図10の書籍は図9の書籍と比較して相対的に薄い。これらの図面から分かるように、書籍の表紙(図9を参照)又はページ境界付近の障害物(図9及び図10の付箋を参照)が存在する種々の複雑な状態においても、本発明に係るページ境界検出方法は書籍の文書画像の完全なページ境界を依然として正確に検出できる。これは、従来技術のページ境界検出方法より非常に有利である。
ページ境界検出装置
本発明に係るページ境界検出装置の一例を以下に簡潔に説明する。
図11は、本発明に係るページ境界検出装置の一般的な構成の一例を示すブロック図である。
図11から分かるように、本発明に係るページ境界検出装置1100は、エッジ画像検出手段1110、水平ページ境界検出手段1120、綴じ中心線検出手段1130、ページ幅判定手段1140及び垂直ページ境界判定手段1150を有してもよい。実際の要求に従って、ページ境界検出装置1100が図11に示さない他の手段を更に有してもよいことは明らかである。
エッジ画像検出手段1110は、入力された書籍の文書画像からエッジ画像を検出するように構成される。エッジ画像検出手段1110により採用されるエッジ検出方法は、Sobel演算子、Canny演算子等であってもよい。
水平ページ境界検出手段1120は、エッジ画像から上側ページ境界及び下側ページ境界を検出するように構成される。図12は、本発明に係る水平ページ境界検出手段の一般的な構成の一例を示すブロック図である。図12に示す水平ページ境界検出手段1200は、直線区分検出手段1210、直線部分選択手段1220及び湾曲部分検出手段1230を備える。更に詳細には、直線区分検出手段1210は、好ましくは上述の前処理後に、エッジ画像において複数の直線区分を検出する。直線部分選択手段1220は、上述の選択基準a)及びb)を適用することにより検出された複数の直線区分から上側ページ境界及び下側ページ境界の直線部分を選択する。湾曲部分検出手段1230は、上側ページ境界及び下側ページ境界の直線部分に基づいてエッジ画像において上側ページ境界及び下側ページ境界の湾曲部分を検出する。最後に、水平ページ境界は水平ページ境界検出手段1120により検出可能である。
次に、図11を再度参照する。綴じ中心線検出手段1130は、上側ページ境界及び下側ページ境界における左ページ及び右ページの交点を探索することにより綴じ中心線を検出するように構成される。
ページ幅判定手段1140は、書籍の文書画像のページ幅を判定するように構成される。ページ幅判定手段1140は、ページ幅を判定するために種々の異なる方法を採用してもよい。1つの方法は、ユーザインタフェースから書籍の文書の幅対高さの比の値を取得し、上側ページ境界の直線部分と下側ページ境界の直線部分との間の垂直距離に従ってページ高さを計算し、幅対高さの比及びページ高さに従ってページ幅を取得することである。他の方法は、前述のようにページの角点の検出に基づく。
垂直ページ境界判定手段1150は、水平ページ境界検出手段1120により判定された上側ページ境界及び下側ページ境界、綴じ中心線検出手段1130により判定された綴じ中心線、並びにページ幅判定手段1140により判定されたページ幅に基づいて左側ページ境界及び右側ページ境界を判定するように構成される。
尚、上記の手段の全ては、本発明のページ境界検出方法を実現する好適なモジュールの例である。しかし、種々のステップを実現するモジュールの全てが上述されたわけではない。一般に、ある特定の処理を実行するステップが存在する場合、同一処理を実現する対応する機能モジュール又は手段が存在する。
更に図11及び図12において、各々の機能が達成可能である限り、2つ以上の手段は1つの手段として組み合わされてもよい。一方、同様の機能が達成可能である限り、どんな1つの手段が複数の手段に分割されてもよい。
種々の方法で本発明のページ境界検出方法及び装置を実行できる。例えばソフトウェア、ハードウェア、ファーウェア又はそれらの何らかの組み合わせで本発明のページ境界検出方法及び装置を実行できる。更にいくつかの実施形態において、本発明は、本発明に係るページ境界検出方法を実現する機械可読命令を含む記録媒体に記録されたプログラムとして更に実現されてもよい。従って、本発明は、本発明に係るページ境界検出方法を実現するプログラムを格納した記録媒体を更に含む。
好適な実施形態を参照して本発明を説明したが、本発明は開示された好適な実施形態に限定されないことが理解されるべきである。上記の好適な実施形態が本発明の趣旨の範囲から逸脱せずに変更可能であることは当業者には明らかである。以下の特許請求の範囲の範囲は、そのような変更、並びに等価の構造及び機能の全てを含むように広範に解釈されるべきである。

Claims (4)

  1. 書籍の文書画像のページ境界を検出する方法であって、
    前記書籍の文書画像からエッジ画像を検出するエッジ画像検出ステップと、
    前記エッジ画像において上側ページ境界及び下側ページ境界を検出する水平ページ境界検出ステップと、
    前記上側ページ境界及び前記下側ページ境界における左ページ及び右ページの交点を探索することにより綴じ中心線を検出する綴じ中心線検出ステップと、
    前記書籍の文書画像のページ幅を判定するページ幅判定ステップと、
    前記上側ページ境界、前記下側ページ境界、前記綴じ中心線及び前記ページ幅を用いることにより左側ページ境界及び右側ページ境界を判定する垂直ページ境界判定ステップとを有し、
    前記水平ページ境界検出ステップは、
    前記エッジ画像において複数の直線区分を検出する直線区分検出ステップと、
    前記複数の直線区分から前記上側ページ境界及び前記下側ページ境界の直線部分を選択する直線部分選択ステップと、
    前記上側ページ境界及び前記下側ページ境界の前記直線部分に基づいて前記エッジ画像において前記上側ページ境界及び前記下側ページ境界の湾曲部分を検出する湾曲部分検出ステップとを更に有し、
    前記直線区分検出ステップにおいて、前記エッジ画像の列毎に、上から下へ探索し且つ上から下への探索時に各々がその上側により暗い色を有し且つその下側により明るい色を有する必要がある最初に見つけたいくつかのエッジ点のみを確保し、
    前記エッジ画像の列毎に、下から上へ探索し且つ下から上への探索時に各々がその下側により暗い色を有し且つその上側により明るい色を有する必要がある最初に見つけたいくつかのエッジ点のみを確保するという前処理が実行され、
    前記複数の直線区分は、上から下への探索時に確保された前記エッジ点及び下から上へ探索時に確保された前記エッジ点のみを使用することにより検出される方法。
  2. 書籍の文書画像のページ境界を検出する方法であって、
    前記書籍の文書画像からエッジ画像を検出するエッジ画像検出ステップと、
    前記エッジ画像において上側ページ境界及び下側ページ境界を検出する水平ページ境界検出ステップと、
    前記上側ページ境界及び前記下側ページ境界における左ページ及び右ページの交点を探索することにより綴じ中心線を検出する綴じ中心線検出ステップと、
    前記書籍の文書画像のページ幅を判定するページ幅判定ステップと、
    前記上側ページ境界、前記下側ページ境界、前記綴じ中心線及び前記ページ幅を用いることにより左側ページ境界及び右側ページ境界を判定する垂直ページ境界判定ステップとを有し、
    前記水平ページ境界検出ステップは、
    前記エッジ画像において複数の直線区分を検出する直線区分検出ステップと、
    前記複数の直線区分から前記上側ページ境界及び前記下側ページ境界の直線部分を選択する直線部分選択ステップと、
    前記上側ページ境界及び前記下側ページ境界の前記直線部分に基づいて前記エッジ画像において前記上側ページ境界及び前記下側ページ境界の湾曲部分を検出する湾曲部分検出ステップとを更に有し、
    前記直線部分選択ステップは、
    a)上側において、前記左ページの前記上側ページ境界の前記直線区分及び前記右ページの前記上側ページ境界の前記直線区分は略同一直線上に存在し、下側において、前記左ページの前記下側ページ境界の前記直線区分及び前記右ページの前記下側ページ境界の前記直線区分は略同一直線上に存在し、
    b)前記上側において、2つ以上の直線区分の対が基準a)を満たす場合、上方の直線区分の対と下方の直線区分の対との間の垂直距離が所定の閾値より長い場合は前記上方の直線区分の対が前記上側ページ境界の前記直線部分として選択され、前記垂直距離が前記所定の閾値以下である場合は前記下方の直線区分の対が前記上側ページ境界の前記直線部分として選択され、前記下側において2つ以上の直線区分の対が基準a)を満たす場合、上方の直線区分の対と下方の直線区分の対との間の垂直距離が所定の閾値より長い場合は前記下方の直線区分の対が前記下側ページ境界の前記直線部分として選択され、前記垂直距離が前記所定の閾値以下である場合は前記上方の直線区分の対が前記下側ページ境界の前記直線部分として選択されるという選択基準に基づいて実行される方法。
  3. 書籍の文書画像のページ境界を検出する装置であって、
    前記書籍の文書画像からエッジ画像を検出するエッジ画像検出手段と、
    前記エッジ画像において上側ページ境界及び下側ページ境界を検出する水平ページ境界検出手段と、
    前記上側ページ境界及び前記下側ページ境界における左ページ及び右ページの交点を探索することにより綴じ中心線を検出する綴じ中心線検出手段と、
    前記書籍の文書画像のページ幅を判定するページ幅判定手段と、
    前記上側ページ境界、前記下側ページ境界、前記綴じ中心線及び前記ページ幅を使用することにより左側ページ境界及び右側ページ境界を判定する垂直ページ境界判定手段とを有し、
    前記水平ページ境界検出手段は、
    前記エッジ画像において複数の直線区分を検出する直線区分検出手段と、
    前記複数の直線区分から前記上側ページ境界及び前記下側ページ境界の直線部分を選択する直線部分選択手段と、
    前記上側ページ境界及び前記下側ページ境界の前記直線部分に基づいて前記エッジ画像において前記上側ページ境界及び前記下側ページ境界の湾曲部分を検出する湾曲部分検出手段とを更に有し、
    前記直線区分検出手段では、
    前記エッジ画像の列毎に、上から下へ探索し且つ上から下への探索時に各々がその上側により暗い色を有し且つその下側により明るい色を有する必要がある最初に見つけたいくつかのエッジ点のみを確保し、
    前記エッジ画像の列毎に、下から上へ探索し且つ下から上への探索時に各々がその下側により暗い色を有し且つその上側により明るい色を有する必要がある最初に見つけたいくつかのエッジ点のみを確保するという前処理を実行し、
    前記複数の直線区分は、上から下への探索時に確保された前記エッジ点及び下から上へ探索時に確保された前記エッジ点のみを用いることにより検出される装置。
  4. 書籍の文書画像のページ境界を検出する装置であって、
    前記書籍の文書画像からエッジ画像を検出するエッジ画像検出手段と、
    前記エッジ画像において上側ページ境界及び下側ページ境界を検出する水平ページ境界検出手段と、
    前記上側ページ境界及び前記下側ページ境界における左ページ及び右ページの交点を探索することにより綴じ中心線を検出する綴じ中心線検出手段と、
    前記書籍の文書画像のページ幅を判定するページ幅判定手段と、
    前記上側ページ境界、前記下側ページ境界、前記綴じ中心線及び前記ページ幅を使用することにより左側ページ境界及び右側ページ境界を判定する垂直ページ境界判定手段とを有し、
    前記水平ページ境界検出手段は、
    前記エッジ画像において複数の直線区分を検出する直線区分検出手段と、
    前記複数の直線区分から前記上側ページ境界及び前記下側ページ境界の直線部分を選択する直線部分選択手段と、
    前記上側ページ境界及び前記下側ページ境界の前記直線部分に基づいて前記エッジ画像において前記上側ページ境界及び前記下側ページ境界の湾曲部分を検出する湾曲部分検出手段とを更に有し、
    前記直線部分選択手段は、
    a)上側において、前記左ページの前記上側ページ境界の前記直線区分及び前記右ページの前記上側ページ境界の前記直線区分は略同一直線上に存在し、下側において、前記左ページの前記下側ページ境界の前記直線区分及び前記右ページの前記下側ページ境界の前記直線区分は略同一直線上に存在し、
    b)前記上側において2つ以上の直線区分の対が基準a)を満たす場合、上方の直線区分の対と下方の直線区分の対との間の垂直距離が所定の閾値より長い場合は前記上方の直線区分の対が前記上側ページ境界の前記直線部分として選択され、前記垂直距離が前記所定の閾値以下である場合は前記下方の直線区分の対が前記上側ページ境界の前記直線部分として選択され、前記下側において2つ以上の直線区分の対が基準a)を満たす場合、上方の直線区分の対と下方の直線区分の対との間の垂直距離が所定の閾値より長い場合は前記下方の直線区分の対が前記下側ページ境界の前記直線部分として選択され、前記垂直距離が前記所定の閾値以下である場合は前記上方の直線区分の対が前記下側ページ境界の前記直線部分として選択されるという選択基準に基づいて前記上側ページ境界の前記直線部分及び前記下側ページ境界の前記直線部分を選択する装置。
JP2011044288A 2010-03-01 2011-03-01 ページ境界を検出する方法及び装置 Active JP5055449B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201010116618.6 2010-03-01
CN201010116618.6A CN102196112B (zh) 2010-03-01 2010-03-01 用于检测页边界的方法和装置

Publications (2)

Publication Number Publication Date
JP2011181071A JP2011181071A (ja) 2011-09-15
JP5055449B2 true JP5055449B2 (ja) 2012-10-24

Family

ID=44505287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011044288A Active JP5055449B2 (ja) 2010-03-01 2011-03-01 ページ境界を検出する方法及び装置

Country Status (3)

Country Link
US (1) US8675969B2 (ja)
JP (1) JP5055449B2 (ja)
CN (1) CN102196112B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8131009B2 (en) * 2008-11-11 2012-03-06 Xerox Corporation Automatic spine creation from book covers without spines
JP2012256109A (ja) * 2011-06-07 2012-12-27 Sony Corp 情報処理装置、プログラム及び情報処理方法
US10289924B2 (en) 2011-10-17 2019-05-14 Sharp Laboratories Of America, Inc. System and method for scanned document correction
CN103366165B (zh) * 2012-03-30 2016-06-29 富士通株式会社 图像处理装置、图像处理方法以及设备
US9426416B2 (en) * 2012-10-17 2016-08-23 Cisco Technology, Inc. System and method for utilizing a surface for remote collaboration
CN105279510B (zh) * 2015-10-10 2018-09-04 上海中信信息发展股份有限公司 文档图像装订孔的自动定位方法及装置
KR101761641B1 (ko) 2015-10-20 2017-08-08 주식회사 셀바스에이아이 엣지 라인을 검출하여 분할선을 획득하는 장치 및 방법
WO2017188960A1 (en) * 2016-04-28 2017-11-02 Hewlett-Packard Development Company, L.P. Extracting a document page image from an electronically scanned image having a non-uniform background content
US10121088B2 (en) * 2016-06-03 2018-11-06 Adobe Systems Incorporated System and method for straightening curved page content
CN107358150B (zh) * 2017-06-01 2020-08-18 深圳赛飞百步印社科技有限公司 物体边框识别方法、装置和高拍仪
CN111402281B (zh) * 2020-03-12 2023-11-10 上海合合信息科技股份有限公司 一种书籍边缘检测方法及装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054098A (en) * 1990-05-21 1991-10-01 Eastman Kodak Company Method of detecting the skew angle of a printed business form
JP3163703B2 (ja) 1991-12-05 2001-05-08 ミノルタ株式会社 原稿読み取り装置
JP3136721B2 (ja) 1991-12-05 2001-02-19 ミノルタ株式会社 原稿読み取り装置
JP3175250B2 (ja) 1991-12-05 2001-06-11 ミノルタ株式会社 原稿読み取り装置
JPH06164852A (ja) 1992-11-16 1994-06-10 Minolta Camera Co Ltd 原稿読み取り装置
JP3821860B2 (ja) * 1994-03-15 2006-09-13 コニカミノルタビジネステクノロジーズ株式会社 画像読取装置
JP3670692B2 (ja) * 1994-05-12 2005-07-13 株式会社リコー 画像読み取り装置
US5677776A (en) * 1994-09-29 1997-10-14 Minolta Co., Ltd. Image reader for processing an image of a document
JPH08154154A (ja) * 1994-09-29 1996-06-11 Minolta Co Ltd 画像読み取り装置
US6721066B2 (en) * 1994-11-18 2004-04-13 Minolta Co., Ltd. Image processor
JPH08154157A (ja) * 1994-11-28 1996-06-11 Ricoh Co Ltd 本原稿画像読み取り装置
JP3631333B2 (ja) * 1996-08-23 2005-03-23 シャープ株式会社 画像処理装置
JP4037512B2 (ja) * 1997-04-15 2008-01-23 コニカミノルタビジネステクノロジーズ株式会社 画像読取装置
US6330050B1 (en) * 1997-07-24 2001-12-11 Ricoh Company, Ltd Image processing device for providing correction of a curvature distortion of a bound portion of a spread book
JPH11143986A (ja) * 1997-10-17 1999-05-28 Internatl Business Mach Corp <Ibm> ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体
JP3634626B2 (ja) * 1998-05-22 2005-03-30 株式会社リコー 画像読取装置
US6954290B1 (en) * 2000-11-09 2005-10-11 International Business Machines Corporation Method and apparatus to correct distortion of document copies
US6987880B2 (en) * 2001-03-22 2006-01-17 Sharp Laboratories Of America, Inc. Efficient document boundary determination
US7145699B2 (en) * 2001-03-30 2006-12-05 Sharp Laboratories Of America, Inc. System and method for digital document alignment
JP3917421B2 (ja) * 2001-12-26 2007-05-23 株式会社リコー 画像輝度補正装置、画像読取装置、画像形成装置、プログラム及び記憶媒体
JP4141235B2 (ja) * 2002-02-08 2008-08-27 株式会社リコー 画像補正装置及びプログラム
JP4006242B2 (ja) * 2002-02-27 2007-11-14 株式会社リコー 画像補正装置、プログラム、記憶媒体及び画像補正方法
KR20050073189A (ko) * 2004-01-09 2005-07-13 삼성전자주식회사 이미지 스캐닝 방법 및 장치
US20050226503A1 (en) * 2004-04-07 2005-10-13 Bailey James R Scanned image content analysis
US7330604B2 (en) * 2006-03-02 2008-02-12 Compulink Management Center, Inc. Model-based dewarping method and apparatus
JP4991411B2 (ja) * 2006-07-28 2012-08-01 キヤノン株式会社 画像処理方法
US8223361B2 (en) * 2006-10-11 2012-07-17 Sharp Laboratories Of America, Inc. Empty job detection for direct print
JP4784500B2 (ja) * 2006-12-08 2011-10-05 日本電気株式会社 画像傾き補正装置及び画像傾き補正方法

Also Published As

Publication number Publication date
CN102196112A (zh) 2011-09-21
US20110211755A1 (en) 2011-09-01
CN102196112B (zh) 2014-09-24
US8675969B2 (en) 2014-03-18
JP2011181071A (ja) 2011-09-15

Similar Documents

Publication Publication Date Title
JP5055449B2 (ja) ページ境界を検出する方法及び装置
US8457403B2 (en) Method of detecting and correcting digital images of books in the book spine area
US9509884B2 (en) Skew detection
US8213687B2 (en) Image processing methods, image processing systems, and articles of manufacture
JP4955096B2 (ja) 検出装置、検出方法、検出プログラム、および記録媒体
EP2438574A2 (en) Edge detection
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
KR101011908B1 (ko) 디지털 이미지의 노이즈 감소 방법 및 이를 이용한 이미지 처리 장치
US7693329B2 (en) Bound document scanning method and apparatus
JP3989341B2 (ja) 画像処理装置
KR20080034757A (ko) 화상형성장치 및 화상형성방법
JP7440821B2 (ja) 画像処理装置、方法、および、コンピュータプログラム
JP5453215B2 (ja) 画像処理装置、画像形成装置、および画像処理方法
JP2012095173A (ja) 画像処理装置、画像形成装置、および画像処理方法
US20140270573A1 (en) Method for background removal in binary document image by estimating linearity of image components
JP4049296B2 (ja) カラー画像情報処理方法、該方法の実行に用いるプログラム、及びカラー画像情報処理装置
JP6008826B2 (ja) 画像処理装置、画像形成装置、および画像処理方法
CN102196148B (zh) 图像处理方法、图像处理设备和图像扫描设备
US20240029213A1 (en) Document-occluding artifact removal
JPH11288453A (ja) 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム
Prachanucroa et al. Marginal noise removal for scanned document images by projection profile based method
JPH06259550A (ja) エッジ抽出方法
JP2009272728A (ja) 画像補正装置、画像補正方法、画像補正プログラム及び記録媒体
Ohk et al. A Method of Restoring the Shadow Distortion in a Bounded Book Scanned Image by Using Non-Edge Segment

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120702

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120730

R151 Written notification of patent or utility model registration

Ref document number: 5055449

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3