JP6262176B2 - 文書画像における縦線および横線の検出および削除 - Google Patents

文書画像における縦線および横線の検出および削除 Download PDF

Info

Publication number
JP6262176B2
JP6262176B2 JP2015148126A JP2015148126A JP6262176B2 JP 6262176 B2 JP6262176 B2 JP 6262176B2 JP 2015148126 A JP2015148126 A JP 2015148126A JP 2015148126 A JP2015148126 A JP 2015148126A JP 6262176 B2 JP6262176 B2 JP 6262176B2
Authority
JP
Japan
Prior art keywords
vertical
binary image
binary
horizontal
projection histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015148126A
Other languages
English (en)
Other versions
JP2016071855A (ja
Inventor
ファーン ガーン
ファーン ガーン
Original Assignee
コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド
コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド, コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド filed Critical コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド
Publication of JP2016071855A publication Critical patent/JP2016071855A/ja
Application granted granted Critical
Publication of JP6262176B2 publication Critical patent/JP6262176B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns

Description

本発明は、文書画像の処理、特に文書画像における横線および縦線の検出および削除のための方法に関する。
文書画像とは一般的に、かなりの量のテキストを含む複数ページの文書を表すデジタル画像のことを言う。文書画像は、しばしば線を含み、たとえば表を構成する直線、テキストにおける下線などのように、特に縦線および横線を含む。一般的に、光学文字認識(OCR)や文書認証などの文書画像解析の焦点は、文字(文字およびその他の記号)であり、線を削除することがしばしば要求される。これらの線は、通常は一方向に長く、はっきりと削除されない場合には、後続する連結成分解析においてエラーや誤りが発生しかねない。これまでにも、たとえばハフ変換(Hough transform)、ランレングス符号化(run length coding)、モルフォロジー解析(morphology analysis)などの、線の検出および削除に関する様々な方法が提案されてきた。しかしながら、実際の文書に対してこれらの方法を適用すると、画質や、画像がどのくらい適切に二値化されているかということによって、しばしば影響される。たとえば、不適切な二値化閾値は、モルフォロジーに基づく線の検出を失敗させる原因となりうる。
本発明は、関連する技術の制限および不利益に起因する一つ以上の問題を十分に解決する、線の検出および削除方法ならびに関連する装置を対象とする。
本発明の目的は、様々な画質の文書画像における横線および縦線を検出できる、線の検出および削除方法を提供することである。
本発明の追加の特徴および利点は以下の説明に記載され、ある程度は説明から明らかであり、または本発明の実施により知ることができる。本発明の目的および他の利点は、それについて記載された明細書、特許請求の範囲および添付の図面において特に示された構造によって実現および達成される。
これらの目的および/または他の目的を達成するために、具体的および広く記述されているように、本発明は、グレースケール文書画像における縦線および横線の検出および削除のための方法であって、複数の異なる二値化条件を用いて、前記グレースケール文書画像から複数の第1の二値画像を生成するステップと、前記複数の第1の二値画像に対応する複数のバウンディングボックスセットを生成するために、前記複数の第1の二値画像の各々において横線および縦線を個別に検出するステップと、ここで、各バウンディングボックスセットは、検出された縦線または横線をそれぞれ示す複数のバウンディングボックスを含み、前記複数のバウンディングボックスセットを、前記グレースケール文書画像において検出された縦線および横線を示す一つの統合バウンディングボックスセットとして統合するステップと、前記グレースケール文書画像から第2の二値画像を生成するステップと、前記検出された線を示す前記統合バウンディングボックスセットを用いて、前記第2の二値画像から横線および縦線を削除するために、前記第2の二値画像を処理するステップと、を含む。
上記の方法において、第1の二値画像の各々に対する、前記検出するステップは、前記第1の二値画像の各画素に関連する線幅を取得するステップ(a)と、ここで、対象の画素に関連する前記線幅は、前記画素を含んで連続する前景画素の横方向および縦方向のランレングスのうち、より小さい方のランレングスとして定義され、縦線を構成要素として用いて、前記第1の二値画像に対してオープニング処理を実行するステップ(b)と、前記ステップ(b)によって生成された前記第1の二値画像から連結成分を抽出するステップ(c)と、各連結成分における画素の各縦方向の列について、前記列における全ての画素に関連する前記線幅の平均値に対する前記列の高さの比率を計算し、前記比率が所定の閾値よりも小さい場合に、前記第1の二値画像から前記画素の列を削除するステップ(d)と、縦方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記第1の二値画像を縦方向に射影し、前記縦方向射影ヒストグラムの全ての非ゼロ部分の横方向の境界を、前記検出された縦線の左右の境界として取得するステップ(e)と、前記縦方向射影ヒストグラムの各非ゼロ部分に対して、第1の横方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記第1の二値画像の対応する縦方向スライスを横方向に射影し、かつ第2の横方向射影ヒストグラムを生成するために、前記ステップ(b)より前の前記第1の二値画像の対応する縦方向スライスを横方向に射影するステップ(f)と、前記第1の横方向射影ヒストグラムの各非ゼロ部分に対して、前記第2の横方向射影ヒストグラムの対応する非ゼロ部分を特定し、上下の境界を、前記検出された縦線の前記上下の境界として取得するステップ(g)と、を含む。
他の態様において、本発明は、文書画像に基づく二値画像における縦線の検出および削除のための方法であって、前記二値画像の各画素に関連する線幅を取得するステップ(a)と、ここで、対象の画素に関連する前記線幅は、前記画素を含んで連続する前景画素の横方向および縦方向のランレングスのうち、より小さい方のランレングスとして定義され、縦線を構成要素として用いて、前記二値画像に対してオープニング処理を実行するステップ(b)と、前記ステップ(b)によって生成された前記二値画像から連結成分を抽出するステップ(c)と、各連結成分における画素の各列について、前記列における全ての画素の前記線幅の平均値に対する前記列の高さの比率を計算し、前記比率が所定の閾値よりも小さい場合に、前記二値画像から前記画素の列を削除するステップ(d)と、縦方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記二値画像を縦方向に射影し、前記縦方向射影ヒストグラムの全ての非ゼロ部分の横方向の境界を、前記検出された縦線の左右の境界として取得するステップ(e)と、前記縦方向射影ヒストグラムの各非ゼロ部分に対して、第1の横方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記二値画像の対応する縦方向スライスを横方向に射影し、かつ第2の横方向射影ヒストグラムを生成するために、前記ステップ(b)より前の前記二値画像の対応する縦方向スライスを横方向に射影するステップ(f)と、前記第1の横方向射影ヒストグラムの各非ゼロ部分に対して、前記第2の横方向射影ヒストグラムの対応する非ゼロ部分を特定し、上下の境界を、前記検出された縦線の前記上下の境界として取得するステップ(g)と、前記検出された縦線の前記左右の境界および前記上下の境界を用いて、前記二値画像から縦線を削除するために、前記二値画像を処理するステップ(h)と、を含む。
他の態様において、本発明は、情報処理装置を制御するために、コンピュータープログラムおよびコンピュータープログラムを内部に格納したコンピューターが使用可能な非一時的媒体(たとえば、メモリーまたは記憶装置)を提供し、コンピュータープログラムは、情報処理装置に上記の方法を実行させるために構成される。
前述の概要および以下の詳述は、いずれも典型例および説明を示すものであり、特許請求の範囲に記載された発明の仔細な説明を提供することを目的としている。
本発明の実施形態に係る文書画像の縦線および横線の検出および削除方法を説明する概略図である。 図1の方法による線の検出処理を説明する概略図である。 図1の方法による線の検出処理を説明する概略図である。 本発明の実施形態に係る方法が実装される情報処理装置の構成を示す概略図である。
本発明の実施形態は、複数の二値化閾値に基づいて、入力するグレースケール文書画像から複数の二値画像を生成し、同一の手順を個別に用いてこれらの複数の二値画像の各々から横線および縦線を検出し、検出結果を統合する、文書画像のための縦線および横線の検出方法を提供する。各二値画像に対する線の検出処理は、線幅解析を適用する。
この線の検出処理は、非常に効果的である。一般的に、線の検出結果は、グレースケール画像がどのように二値化されるかによって影響を受ける。二値画像が明るすぎると、二値画像における細い線は消えてしまい、検出されないことがある。二値画像が暗すぎると、線が太くなりすぎること、および/または近接した線やその他の画像の構成要素と統合されてしまうことにより、線ではないと判断されることがある。適切な二値化閾値を設定して、入力画像を正しく判断することは、多くの場合難しい。そこで、ここで説明される複数の二値化という技術を用いて、複数の二値画像からの線の検出結果を統合することによって、様々な画質の文書画像における縦線および横線が効果的に検出される。
横線および縦線の検出および削除方法は、図1〜2Bを参照して説明される。入力文書画像はグレースケール画像であって、各画素は、たとえば0から255のマルチビットの画素値を有する。元の画像(たとえば、スキャナーによって生成された画像)がカラー画像である場合は、初めにグレースケール画像に変換されるか、または、各カラーチャンネルがグレースケール画像として扱われる。
図1に示すように、初めに、歪み補正、ノイズ除去、ダウンサンプリングなどを含む前処理が、グレースケールの入力画像に対して任意で適用される(ステップS11)。便宜上、前処理がなされたグレースケール画像についても、入力グレースケール画像と呼ぶ。
複数の二値画像(1ビット画像)を取得するために、入力グレースケール画像は複数回二値化され、各回の二値化は、広範囲にわたり異なる二値化閾値を用いる(ステップS12)。二値化閾値は1から254までの任意の値である。比較的明るい入力グレースケール画像に対しては、比較的低めの閾値が使用され、一方で、通常の暗さの入力グレースケール画像に対しては、比較的高めの閾値が要求される。任意の望ましい数の二値画像が使用される。一般的なアプリケーションにおいては、満足できる結果を得るために、3つの異なる二値画像があれば十分である。異なる二値化閾値を使用することに代えて、二値化アルゴリズムが他の二値化パラメータを使用する場合には他の二値化パラメータを調整することによって、または異なる二値化アルゴリズムを適用することによって、複数の二値画像が生成されてもよい。
線の検出処理は、二値画像の各々に対して個別に適用され(ステップS13の処理)、全ての二値画像からの結果、すなわち検出された線の結果は、最終的な線の検出結果を出すために一つに統合される(ステップS14)。
本開示において、背景は画素値0の白であると仮定され、前景(テキスト、図など)は画素値1の黒であると仮定される。黒対白、およびテキスト対背景についての画素値の定義は、選択可能な事項であり、ここで説明される実装は、異なる画素値の定義に適応させるために容易に修正されうることに留意されたい。
各二値画像に適用されるステップS13の線の検出処理は、図2Aおよび図2Bを参照し、以下で説明される。
まず、二値画像の各画素に関連する線幅を取得するために、線幅解析が実行される(ステップS21)。ここで、対象の画素に関連する線幅は、当該対象の画素を含み、横および縦方向において連続する黒画素のランレングスのうち、より小さい方のランレングスとして定義される。白画素(背景)の線幅は、ゼロである。黒画素が線または文字線の一部である場合、線幅は、文書における線または文字線の一般的な幅と同じオーダーになる傾向がある。黒画素が図の要素の一部である場合、その線幅は、かなり大きな値となる傾向がある。線幅は、以降の線の検出処理の様々なステップにおいて使用される。
縦線を構成要素として用いて、二値の入力画像に対してオープニング処理が実行される(ステップS22)。オープニングは、収縮の後に膨張を伴い、同じ構成要素を使用するモルフォロジー演算である。オープニング処理は、構成要素を内部にはめ込むことが可能な二値画像の、画像要素を抽出するものと考えられる。好ましくは、ステップS22において、構成要素は比較的短い縦線である。一実施形態では、構成要素は画素長25かつ画素幅1である。10から100画素のような、他の長さが使用されてもよい。結果的に生じた二値画像を、便宜上、フィルター画像と呼ぶ。
次に、フィルター画像の連結成分が抽出され、ある連結成分またはその一部を削除するために、平均の線幅および列の高さに基づいて、一度に一列ずつ、解析が実行される(ステップS23)。本ステップにおいて、各連結成分に対して、その内部に含まれる画素幅1を有する画素の縦列全てが、列挙される。各画素列に沿って、列に沿う画素の線幅がステップS21の結果から読み出され、各列の線幅の平均値が計算される。この線幅の平均値に対する列の高さの比率が、所定の閾値よりも大きい場合、画素列は実線の一部として保持される。そうでない場合には、画素列は実線の一部でないと見なされ、削除される。一例では、所定の閾値は20であるが、10と30の間のような他の適切な値が使用されてもよい。本ステップにおいて、各画素列は個別に処理されるが、実際に連結成分全体が縦線ではなかった場合には、結果として連結成分全体が削除される。結果的に生じた画像を、便宜上、縦線画像と呼ぶ。
さらに、縦線の横方向位置が決定される(ステップS24)。これを達成するため、ステップS23からの縦線画像は縦方向に射影され、射影ヒストグラム(縦方向射影ヒストグラムと呼ぶ)が取得される。縦方向射影ヒストグラムの各非ゼロ部分(ゼロでない各部分)は、縦線(または統合された複数の縦線)に一致する。このヒストグラムを解析することによって、横方向位置および縦線の幅が取得される(ステップS24)。
以下の一連のステップは、各縦線の上下の境界を決定する(ステップS251からS253、まとめてステップS25)。縦方向射影ヒストグラムの各非ゼロ部分について、縦方向射影ヒストグラムの非ゼロ部分に対応する横方向位置における画像の縦方向スライスである、対応する縦線画像の縦方向スライスが、この画像スライスについてのヒストグラム(第1の横方向射影ヒストグラムと呼ぶ)を生成するために、横方向に射影される(ステップS251)。一方、元の二値画像(すなわち、オープニング処理前の二値画像)の同じ部分のスライスも、もう一つのヒストグラム(第2の横方向射影ヒストグラムと呼ぶ)を生成するために、横方向に射影される(ステップS252)。第2の横方向射影ヒストグラムは、縦方向位置において、第1の横方向射影ヒストグラムの非ゼロ部分に対応する非ゼロ部分を有し、同様に、縦線ではない元の二値画像の他の成分に対応する他の非ゼロ部分も有する(と考えられる)。このように、第1の横方向射影ヒストグラムの各非ゼロ部分に対して、第2の横方向射影ヒストグラムの対応する非ゼロ部分が特定され、その上下の境界は、該当する位置において検出された縦線の上下の境界として取得される(ステップS253)。
ステップS251からS253は、縦方向射影ヒストグラムの全ての非ゼロ部分に対して実行される。結果として、二値画像の全ての縦線が特定され、それらの4つの境界線が取得される。
これが、対象の二値画像に対する縦線の検出の結論である。結果として、各縦線のバウンディングボックスが取得される。
二値画像における横線は、適切な修正、すなわち、各ステップにおいて、縦および横(上/下および左/右、縦列および横行も含む)を入れ替えることによる修正を行った、ステップS22からS253と同様のステップを用いて検出されうる。ステップS21で計算された線幅は横線の検出においても使用されうるため、ステップS21を繰り返す必要はない。
縦線および横線の検出ステップが、複数の二値画像の全てに対して実行された後、全ての二値画像から検出された線(バウンディングボックス)が比較され、縦線および横線の検出処理の出力を構成するバウンディングボックスセットに統合される(図1のステップS14)。統合する際、一つの二値画像からのバウンディングボックスが、完全に他の二値画像からのバウンディングボックスの内部に位置する場合、前者のバウンディングボックスは削除され、二つの異なる二値画像からの二つのバウンディングボックスが十分に重なる場合、すなわち、一つのバウンディングボックスの少なくとも50%がもう一つに重なる場合、二つのバウンディングボックスは、両方を結合する新しいバウンディングボックスによって置き換えられる。
再び図1を参照して、入力グレースケール画像がステップS11においてダウンサンプリングされていた場合には、検出された線のバウンディングボックスは、入力グレースケール画像の元のサイズに戻される(ステップS15)。線の検出結果を用いて、長い縦線および横線が削除された綺麗な二値画像が生成される(ステップS16)。削除の処理においては、線幅に対する高さの比率が大きい全ての縦線は削除される。横線の削除については、下線と交差するテキストの線を保持しながら、下線を含む横線を削除するために、本方法が設計されるべきである。たとえば、「Horizontal and Vertical Line Detection and Removal for Document Images」という名称の共有の特許出願(米国特許出願14/502,820に基づく日本特許出願)において記載される線の削除方法が使用されてもよい。
ここで説明される横線および縦線の検出および削除方法は、たとえば図4に示すコンピューター120のような、情報処理システムに実装されうる。コンピューター120は、プロセッサー121、記憶装置(ハードディスクドライブなど)122および内部メモリー(RAMなど)123を含む。記憶装置122は、本方法を実行するためにRAM123に読み出され、プロセッサー121によって実行されるソフトウェアプログラムを格納する。
一態様において、本発明は、情報処理システムによって実行される方法である。他の態様において、本発明は、本方法を実行する目的で情報処理装置を制御するための、コンピュータープログラムおよびコンピュータープログラムを内部に格納したコンピューターが使用可能な非一時的媒体である。さらに他の態様において、本発明は、情報処理システムにおいて具体化されている。
本発明の思想または範囲から逸脱することなく、本発明に係る横線および縦線の検出および削除方法と、本発明に関連する装置とにおける様々な修正および変更が可能であることは、当業者にとって明らかである。このように、本発明は、添付された特許請求の範囲およびそれらの同等物に記載の範囲で行われる修正および変更も含む。

Claims (14)

  1. グレースケール文書画像における縦線および横線の検出および削除のための方法であって、
    複数の異なる二値化条件を用いて、前記グレースケール文書画像から複数の第1の二値画像を生成するステップと、
    前記複数の第1の二値画像に対応する複数のバウンディングボックスセットを生成するために、前記複数の第1の二値画像の各々において横線および縦線を個別に検出するステップと、ここで、各バウンディングボックスセットは、検出された縦線または横線をそれぞれ示す複数のバウンディングボックスを含み、
    前記複数のバウンディングボックスセットを、前記グレースケール文書画像において検出された縦線および横線を示す一つの統合バウンディングボックスセットとして統合するステップと、
    前記グレースケール文書画像から第2の二値画像を生成するステップと、
    前記検出された線を示す前記統合バウンディングボックスセットを用いて、前記第2の二値画像から横線および縦線を削除するために、前記第2の二値画像を処理するステップと、
    を含む方法。
  2. 前記複数の二値化条件は、複数の異なる二値化閾値である請求項1に記載の方法。
  3. 前記複数の第1の二値画像を生成するステップより前に、前記グレースケール文書画像の歪み補正、ノイズ除去およびダウンサンプリングを行うステップと、
    前記統合するステップの後に、前記統合バウンディングボックスセットのサイズを拡大するステップと、
    をさらに含む請求項1または請求項2に記載の方法。
  4. 第1の二値画像の各々に対する、前記検出するステップは、
    前記第1の二値画像の各画素に関連する線幅を取得するステップ(a)と、ここで、対象の画素に関連する前記線幅は、前記画素を含んで連続する前景画素の横方向および縦方向のランレングスのうち、より小さい方のランレングスとして定義され、
    縦線を構成要素として用いて、前記第1の二値画像に対してオープニング処理を実行するステップ(b)と、
    前記ステップ(b)によって生成された前記第1の二値画像から連結成分を抽出するステップ(c)と、
    各連結成分における画素の各縦方向の列について、前記列における全ての画素に関連する前記線幅の平均値に対する前記列の高さの比率を計算し、前記比率が所定の閾値よりも小さい場合に、前記第1の二値画像から前記画素の列を削除するステップ(d)と、
    を含む請求項1〜3のいずれか一項に記載の方法。
  5. 第1の二値画像の各々に対する、前記検出するステップは、
    前記ステップ(d)の後に、
    縦方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記第1の二値画像を縦方向に射影し、前記縦方向射影ヒストグラムの全ての非ゼロ部分の横方向の境界を、前記検出された縦線の左右の境界として取得するステップ(e)をさらに含む請求項4に記載の方法。
  6. 第1の二値画像の各々に対する、前記検出するステップは、
    前記ステップ(e)の後に、
    前記縦方向射影ヒストグラムの各非ゼロ部分に対して、第1の横方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記第1の二値画像の対応する縦方向スライスを横方向に射影し、かつ第2の横方向射影ヒストグラムを生成するために、前記ステップ(b)より前の前記第1の二値画像の対応する縦方向スライスを横方向に射影するステップ(f)と、
    前記第1の横方向射影ヒストグラムの各非ゼロ部分に対して、前記第2の横方向射影ヒストグラムの対応する非ゼロ部分を特定し、上下の境界を、前記検出された縦線の前記上下の境界として取得するステップ(g)と、
    をさらに含む請求項5に記載の方法。
  7. 文書画像に基づく二値画像における縦線の検出および削除のための方法であって、
    前記二値画像の各画素に関連する線幅を取得するステップ(a)と、ここで、対象の画素に関連する前記線幅は、前記画素を含んで連続する前景画素の横方向および縦方向のランレングスのうち、より小さい方のランレングスとして定義され、
    縦線を構成要素として用いて、前記二値画像に対してオープニング処理を実行するステップ(b)と、
    前記ステップ(b)によって生成された前記二値画像から連結成分を抽出するステップ(c)と、
    各連結成分における画素の各列について、前記列における全ての画素の前記線幅の平均値に対する前記列の高さの比率を計算し、前記比率が所定の閾値よりも小さい場合に、前記二値画像から前記画素の列を削除するステップ(d)と、
    縦方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記二値画像を縦方向に射影し、前記縦方向射影ヒストグラムの全ての非ゼロ部分の横方向の境界を、前記検出された縦線の左右の境界として取得するステップ(e)と、
    前記縦方向射影ヒストグラムの各非ゼロ部分に対して、第1の横方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記二値画像の対応する縦方向スライスを横方向に射影し、かつ第2の横方向射影ヒストグラムを生成するために、前記ステップ(b)より前の前記二値画像の対応する縦方向スライスを横方向に射影するステップ(f)と、
    前記第1の横方向射影ヒストグラムの各非ゼロ部分に対して、前記第2の横方向射影ヒストグラムの対応する非ゼロ部分を特定し、上下の境界を、前記検出された縦線の前記上下の境界として取得するステップ(g)と、
    前記検出された縦線の前記左右の境界および前記上下の境界を用いて、前記二値画像から縦線を削除するために、前記二値画像を処理するステップ(h)と、
    を含む方法。
  8. 情報処理装置を制御するためのコンピュータープログラムであって、当該コンピュータープログラムは、グレースケール文書画像における縦線および横線の検出および削除のための処理を前記情報処理装置に実行させるために構成され、
    複数の異なる二値化条件を用いて、前記グレースケール文書画像から複数の第1の二値画像を生成するステップと、
    前記複数の第1の二値画像に対応する複数のバウンディングボックスセットを生成するために、前記複数の第1の二値画像の各々において横線および縦線を個別に検出するステップと、ここで、各バウンディングボックスセットは、検出された縦線または横線をそれぞれ示す複数のバウンディングボックスを含み、
    前記複数のバウンディングボックスセットを、前記グレースケール文書画像において検出された縦線および横線を示す一つの統合バウンディングボックスセットとして統合するステップと、
    前記グレースケール文書画像から第2の二値画像を生成するステップと、
    前記検出された線を示す前記統合バウンディングボックスセットを用いて、前記第2の二値画像から横線および縦線を削除するために、前記第2の二値画像を処理するステップと、
    を含むコンピュータープログラム。
  9. 前記複数の二値化条件は、複数の異なる二値化閾値である請求項8に記載のコンピュータープログラム。
  10. 前記複数の第1の二値画像を生成するステップより前に、前記グレースケール文書画像の歪み補正、ノイズ除去およびダウンサンプリングを行うステップと、
    前記統合するステップの後に、前記統合バウンディングボックスセットのサイズを拡大するステップと、
    をさらに含む請求項8または請求項9に記載のコンピュータープログラム。
  11. 第1の二値画像の各々に対する、前記検出するステップは、
    前記第1の二値画像の各画素に関連する線幅を取得するステップ(a)と、ここで、対象の画素に関連する前記線幅は、前記画素を含んで連続する前景画素の横方向および縦方向のランレングスのうち、より小さい方のランレングスとして定義され、
    縦線を構成要素として用いて、前記第1の二値画像に対してオープニング処理を実行するステップ(b)と、
    前記ステップ(b)によって生成された前記第1の二値画像から連結成分を抽出するステップ(c)と、
    各連結成分における画素の各縦方向の列について、前記列における全ての画素に関連する前記線幅の平均値に対する前記列の高さの比率を計算し、前記比率が所定の閾値よりも小さい場合に、前記第1の二値画像から前記画素の列を削除するステップ(d)と、
    を含む請求項8〜10のいずれか一項に記載のコンピュータープログラム。
  12. 第1の二値画像の各々に対する、前記検出するステップは、
    前記ステップ(d)の後に、
    縦方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記第1の二値画像を縦方向に射影し、前記縦方向射影ヒストグラムの全ての非ゼロ部分の横方向の境界を、前記検出された縦線の左右の境界として取得するステップ(e)をさらに含む請求項11に記載のコンピュータープログラム。
  13. 第1の二値画像の各々に対する、前記検出するステップは、
    前記ステップ(e)の後に、
    前記縦方向射影ヒストグラムの各非ゼロ部分に対して、第1の横方向射影ヒストグラムを生成するために、前記ステップ(d)によって生成された前記第1の二値画像の対応する縦方向スライスを横方向に射影し、かつ第2の横方向射影ヒストグラムを生成するために、前記ステップ(b)より前の前記第1の二値画像の対応する縦方向スライスを横方向に射影するステップ(f)と、
    前記第1の横方向射影ヒストグラムの各非ゼロ部分に対して、前記第2の横方向射影ヒストグラムの対応する非ゼロ部分を特定し、上下の境界を、前記検出された縦線の前記上下の境界として取得するステップ(g)と、
    をさらに含む請求項12に記載のコンピュータープログラム。
  14. 請求項8〜13のいずれか一項に記載のコンピュータープログラムを格納したコンピューター読み取り可能な記録媒体。
JP2015148126A 2014-09-30 2015-07-27 文書画像における縦線および横線の検出および削除 Active JP6262176B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/502796 2014-09-30
US14/502,796 US9495343B2 (en) 2014-09-30 2014-09-30 Horizontal and vertical line detection and removal for document images

Publications (2)

Publication Number Publication Date
JP2016071855A JP2016071855A (ja) 2016-05-09
JP6262176B2 true JP6262176B2 (ja) 2018-01-17

Family

ID=53785520

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015148126A Active JP6262176B2 (ja) 2014-09-30 2015-07-27 文書画像における縦線および横線の検出および削除

Country Status (4)

Country Link
US (1) US9495343B2 (ja)
EP (1) EP3002712A3 (ja)
JP (1) JP6262176B2 (ja)
CN (1) CN105469027B (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3167408T3 (da) * 2014-07-10 2024-03-04 Sanofi Aventis Deutschland Anordning og fremgangsmåde til udførelse af optisk tegngenkendelse
US9990561B2 (en) * 2015-11-23 2018-06-05 Lexmark International, Inc. Identifying consumer products in images
US10136103B2 (en) 2015-11-23 2018-11-20 Lexmark International, Inc. Identifying consumer products in images
JP6780271B2 (ja) * 2016-03-23 2020-11-04 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
RU2626661C1 (ru) * 2016-06-24 2017-07-31 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и подсистема определения содержащих документ фрагментов цифрового изображения
US10275888B2 (en) * 2016-09-16 2019-04-30 Oracle International Corporation Algorithmic method for detection of documents in images
US10083353B2 (en) * 2016-10-28 2018-09-25 Intuit Inc. Identifying document forms using digital fingerprints
US10586321B2 (en) * 2016-12-27 2020-03-10 Fordaq SA Automatic detection, counting, and measurement of lumber boards using a handheld device
CN106951902B (zh) * 2017-03-27 2020-10-20 深圳怡化电脑股份有限公司 一种图像二值化处理方法及装置
JP7030425B2 (ja) * 2017-05-22 2022-03-07 キヤノン株式会社 画像処理装置、画像処理方法、プログラム
JP7057915B2 (ja) * 2017-08-30 2022-04-21 国立大学法人岩手大学 オブジェクト検出システム、オブジェクト検出方法
CN108345893B (zh) * 2018-03-15 2021-01-26 京东方科技集团股份有限公司 一种直线检测方法、装置、计算机存储介质及终端
CN109409247B (zh) * 2018-09-30 2022-05-13 阿波罗智联(北京)科技有限公司 交通标志识别方法和装置
CN111797838A (zh) * 2019-04-08 2020-10-20 上海怀若智能科技有限公司 一种图片类文档盲去噪系统、方法及装置
CN111814780B (zh) * 2020-07-08 2023-05-26 重庆农村商业银行股份有限公司 一种票据图像处理方法、装置、设备及存储介质
US11727700B2 (en) 2021-06-11 2023-08-15 Capital One Services, Llc Line removal from an image
CN113705524A (zh) * 2021-09-06 2021-11-26 上海景吾智能科技有限公司 图像中垂直线检测方法及系统
CN116363129B (zh) * 2023-05-31 2023-08-22 山东辰欣佛都药业股份有限公司 一种滴眼剂生产用智能灯检系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04302375A (ja) * 1991-03-29 1992-10-26 Eastman Kodak Japan Kk 画像二値化装置
JPH11232382A (ja) * 1998-02-10 1999-08-27 Hitachi Ltd 罫線抽出方法及び罫線除去方法
JP4077094B2 (ja) * 1998-12-11 2008-04-16 富士通株式会社 カラー文書画像認識装置
US6282326B1 (en) * 1998-12-14 2001-08-28 Eastman Kodak Company Artifact removal technique for skew corrected images
US6674900B1 (en) * 2000-03-29 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for extracting titles from digital images
US7031553B2 (en) * 2000-09-22 2006-04-18 Sri International Method and apparatus for recognizing text in an image sequence of scene imagery
JP4100885B2 (ja) * 2001-07-11 2008-06-11 キヤノン株式会社 帳票認識装置、方法、プログラムおよび記憶媒体
US6873728B2 (en) * 2002-01-16 2005-03-29 Eastman Kodak Company Vertical black line removal implementation
JP2004334743A (ja) * 2003-05-12 2004-11-25 Daemon:Kk 罫線の抽出方法、罫線の符号化方法及び罫線抽出プログラム
CN100433045C (zh) * 2005-10-11 2008-11-12 株式会社理光 表格提取方法和设备
JP4791295B2 (ja) * 2006-08-31 2011-10-12 富士通株式会社 罫線抽出プログラム、罫線抽出装置、罫線抽出方法
WO2008137051A1 (en) * 2007-05-01 2008-11-13 Compulink Management Center, Inc. Photo-document segmentation method and system
CN101727582B (zh) * 2008-10-22 2014-02-19 富士通株式会社 文档图像二值化方法及其装置,以及文档图像处理器
CN103761520B (zh) * 2013-12-05 2016-09-21 南京理工大学 基于笔划宽度的文档图像无参二值化方法

Also Published As

Publication number Publication date
US9495343B2 (en) 2016-11-15
EP3002712A2 (en) 2016-04-06
US20160092417A1 (en) 2016-03-31
CN105469027A (zh) 2016-04-06
EP3002712A3 (en) 2016-05-11
CN105469027B (zh) 2019-04-09
JP2016071855A (ja) 2016-05-09

Similar Documents

Publication Publication Date Title
JP6262176B2 (ja) 文書画像における縦線および横線の検出および削除
JP6377025B2 (ja) 文書画像における縦線および横線の検出および削除
US9251614B1 (en) Background removal for document images
JP6100744B2 (ja) 自動修復を用いたカラー文書画像セグメンテーション及び二値化
US7965894B2 (en) Method for detecting alterations in printed document using image comparison analyses
US9384419B2 (en) Image matching method, extracting features from model images applied different variation, image matching device, model template generation method, and model template generation device
CN110136069B (zh) 文本图像矫正方法、装置与电子设备
US11151402B2 (en) Method of character recognition in written document
CN104966092B (zh) 一种图像处理方法和装置
JP2006067585A (ja) デジタル画像におけるキャプションを位置特定及び抽出する方法及び装置
US10389936B2 (en) Focus stacking of captured images
KR101058726B1 (ko) 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법
JP2008225764A (ja) 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
CN111192241A (zh) 一种人脸图像的质量评估方法、装置及计算机存储介质
KR101377910B1 (ko) 화상 처리 방법 및 화상 처리 장치
US8989493B1 (en) Method and apparatus for identifying regions of an image to be filtered during processing of the image
KR101615479B1 (ko) 적응적 전/후처리 필터링을 이용하는 초해상도 영상 처리 방법
JP5984880B2 (ja) 画像処理装置
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
US11570331B2 (en) Image processing apparatus, image processing method, and storage medium
KR101582800B1 (ko) 적응적으로 컬러 영상 내의 에지를 검출하는 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
CN111091526B (zh) 一种视频模糊的检测方法和系统
JP2005234845A (ja) 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体
WO2017088463A1 (zh) 图像处理方法和装置
JP6701773B2 (ja) 罫線削除装置、罫線削除方法、および罫線削除プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160701

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170627

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171213

R150 Certificate of patent or registration of utility model

Ref document number: 6262176

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150