JP4040231B2 - 文字抽出方法及び装置並びに記憶媒体 - Google Patents

文字抽出方法及び装置並びに記憶媒体 Download PDF

Info

Publication number
JP4040231B2
JP4040231B2 JP2000040444A JP2000040444A JP4040231B2 JP 4040231 B2 JP4040231 B2 JP 4040231B2 JP 2000040444 A JP2000040444 A JP 2000040444A JP 2000040444 A JP2000040444 A JP 2000040444A JP 4040231 B2 JP4040231 B2 JP 4040231B2
Authority
JP
Japan
Prior art keywords
connected component
ruled line
pixel connected
rectangle
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000040444A
Other languages
English (en)
Other versions
JP2001229342A (ja
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000040444A priority Critical patent/JP4040231B2/ja
Publication of JP2001229342A publication Critical patent/JP2001229342A/ja
Application granted granted Critical
Publication of JP4040231B2 publication Critical patent/JP4040231B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理の分野に係り、特に、文字認識装置などにおいて、表や帳票などの罫線によって囲まれた枠の内部に記入された文字を抽出する技術に関する。
【0002】
【従来の技術】
帳票な文書などの表領域に記載された文字を抽出する方法とし、特開平3−172984号公報に開示されているように、罫線矩形を抽出し、罫線によって囲まれる枠を罫線矩形の外側の座標を用いて認識し、枠内の黒画素連結成分の外接矩形を求めてから、枠に接している外接矩形を除去し、残った外接矩形を用いて枠内の文字を切り出す方法が知られている。
【0003】
【発明が解決しようとする課題】
上記従来方法では、枠内に罫線に接触した文字がある場合に、罫線に接触している文字に対応する外接矩形が、罫線に対応する黒画素の外接矩形と同一のものになってしまい、枠に接している外接矩形として除去される結果、枠内の文字抽出に失敗することがある。
【0004】
よって、本発明の目的は、枠内に罫線と接触した文字がある場合にも、枠内の文字を確実に抽出可能な文字抽出方法及び装置を提供することにある。
【0005】
【課題を解決するための手段】
上記目的を達成するため、本発明においては、2値画像上の罫線の矩形を抽出し、抽出した罫線矩形の外側の座標を用いて罫線で囲まれた枠の領域を認識し、認識した枠領域内の白画素連結成分の矩形を抽出し、その中で面積が最大の矩形の領域を白画素連結成分領域として抽出し、抽出した白画素連結成分領域内の黒画素連結成分の矩形を抽出し、それを統合することにより文字領域を抽出する。また、罫線の切れに対処するため、枠領域内の所定値以上の長さの白ランを抽出して統合することによって白画素連結成分の矩形を抽出する。また、スキューに対処するため、黒画素連結成分矩形の抽出に先立って、白画素連結成分領域内の周辺部の罫線の黒画素を消去する。また、画像のゆらぎなどにより発生する罫線ノイズに対処するため、黒画素連結成分矩形の統合により文字領域を抽出する前に、罫線ノイズに相当する黒画素連結成分矩形を除去する。
【0006】
このような本発明の特徴及びその他の特徴について、実施の形態に関連して以下詳述する。
【0007】
【発明の実施の形態】
以下、添付図面を参照し、本発明の実施の一形態である文字抽出装置について説明する。この文字抽出装置のブロック構成の一例と処理の流れを図1と図2にそれぞれ示す。また、図4から図10は処理の説明のための図である。
【0008】
この文字抽出装置は、例えば光学文字認識装置の前処理部として用いられるもので、図1に見られるように、表や帳票などの罫線のある原稿の2値イメージデータを入力するためのスキャナなどの画像入力部100と、入力された2値イメージデータを蓄積するための2値イメージメモリ102と、罫線で囲まれた枠領域の認識に関わる黒ラン抽出部104、黒ランメモリ106、罫線抽出部108、罫線メモリ110、枠抽出部112及び枠領域メモリ114と、実際の枠の内部(文字が記入される領域)に対応した領域(後述の白画素連結成分領域)の認識に関わる白ラン抽出部116、白ランメモリ118、白画素連結成分抽出部120及び白画素連結成分メモリ122と、白画素連結成分領域内の罫線の黒画素を消去するための罫線消去部124と、個々の文字の外接矩形又は文字線の外接矩形の抽出のための黒画素連結成分抽出部126と、黒画素連結成分メモリ128と、罫線ノイズを除去するための罫線ノイズ除去部130と、文字領域画像データを切り出すための文字抽出部132と、文字領域画像メモリ134とから構成される。
【0009】
このような構成の文字抽出装置は、必ずしも専用のハードウェアによって実現される必要はなく、例えば図3に示すようなCPU201、メモリ202、ハードディスク203、入力装置(イメージスキャナ、キーボード、マウスなど)204、ディスプレイ206、各種記憶媒体(磁気ディスク、光ディスク、光磁気ディスク、メモリカードなど)207の読み書きのための媒体ドライブ205、外部の機器やネットワークとの通信のための通信装置(モデム、ネットワークアダプタなど)208などをバス210で接続した一般的な構成のコンピュータを利用し、ソフトウェアにより実現することもできる。
【0010】
この場合、図1に示した各部の機能をコンピュータ上で実現するためのプログラム、換言すれば、図2に示した処理ステップをコンピュータ上で実行するためのプログラムが、例えば、それが記録された記憶媒体207から媒体ドライブ205によってメモリ202に読み込まれたり、外部装置より通信装置208によってメモリ202に読み込まれたり、あるいはハードディスク203からメモリ202に読み込まれ、CPU201により実行される。このプログラムを、それを固定記憶させた半導体ROMとして実装してもよい。このようなプログラムが記録された各種記憶媒体207や半導体ROMなどの記憶媒体も本発明に包含されるものである。
【0011】
また、表や帳票などの罫線のある原稿の2値イメージは、例えば入力装置204に含まれるスキャナによって読み込まれたり、記憶媒体207から読み込まれたり、あるいは通信装置208によって外部機器から入力される。
【0012】
次に、図1に示したブロック構成に基づいて、この文字抽出装置の動作を説明する。
【0013】
まず、2値画像入力部100によって、表や帳票などの罫線のある原稿の2値イメージデータを入力し、2値イメージメモリ102に格納する(図2のステップS1)。
黒ラン抽出部104で、2値イメージメモリ102内の2値イメージデータをスキャンし、主走査方向及び副走査方向の、所定値以上の長さを持つ黒ランを抽出し、抽出した各黒ランに関するデータ(始点、終点の座標等)を黒ランメモリ106に格納する(ステップS2)。
【0014】
この黒ランの抽出処理が終わると、罫線抽出部108で、黒ランメモリ106の黒ランデータを参照し、主走査方向の黒ラン及び副走査方向の黒ランのそれぞれに対し、所定の距離範囲内にある黒ランを矩形に統合する処理を行い、統合した矩形の中で、罫線として妥当な長さ及び幅を持つ矩形を主走査方向又は副走査方向の罫線の矩形として抽出し、そのデータ(矩形の始点、終点の座標など)を罫線メモリ110に格納する(ステップS3)。
【0015】
次に枠抽出部112で、罫線メモリ114内の罫線矩形データを参照し、主走査方向の罫線と副走査方向の罫線とによって四方を囲まれた枠の領域を認識し、その枠領域に関するデータ(始点、終点の座標など)を枠領域メモリ114に格納する(ステップS4)。この枠領域の認識には、それを囲む罫線矩形の外側の座標を用いる。例えば、主走査方向の罫線は、図4に示すような主走査方向の黒ラン(黒線)を統合した矩形(破線)として抽出される。枠の上側の罫線のy座標としては図4に示す罫線矩形のYsが用いられ、枠領域の下側の罫線のy座標としては図4に示す罫線矩形のYeが用いられる。同様に、枠領域の左側の罫線のx座標としては罫線矩形の左側のx座標が、枠領域の右側の罫線のx座標としては罫線矩形の右側のx座標が用いられる。
このように、枠を構成する罫線の矩形の外側の座標を用いて枠領域を認識するため、図5に例示するように、罫線(太線)で囲まれた実際の枠領域よりも広い矩形領域(破線)が枠領域として認識される。ただし、図5は誇張されており、認識される枠領域と実際の枠領域とのずれは実際には図5に示すほど大きくない。スキューや、画像の揺らぎなどによる罫線矩形の膨らみがなければ、罫線と罫線矩形とが良く一致するため、認識される枠領域と、実際の枠領域(罫線を含む)とがほぼ一致する。
【0016】
次に、以上のようにして認識された枠領域から、実際の枠の内側領域(文字が記入される領域)に対応した領域を抽出するための処理を行う。まず、白ラン抽出部116で、枠領域メモリ114内の枠領域データによって示される個々の枠領域の内部に関し、2値イメージメモリ102内の2値イメージデータをスキャンして所定値以上の長さの白ランを抽出し、抽出した白ランに関するデータ(始点、終点の座標など)を各枠領域に対応付けて白ランメモリ118に格納する
(ステップS5)。一般に、枠領域は文字行方向に長いため、文字行方向の白ランが抽出される。ここでは、主走査方向が文字行方向に対応するものとして、主走査方向の白ランが抽出される。
【0017】
次に、白画素連結成分抽出部120において、白ランメモリ118内の白ランデータを参照し、各枠領域毎に、その内部の白ランを統合することによって白画素連結成分の外接矩形を白画素連結成分領域として抽出し、そのデータ(始点、終点の座標など)を白画素連結成分メモリ122に格納する(ステップS6)。この際、各枠領域の内部に2つ以上の白画素連結成分領域が抽出された場合には、その中で面積が最も大きな1つの白画素連結成分領域を選び、そのデータのみを白画素連結成分メモリ122に格納する。例えば、図5に示す枠領域の場合、白ランの統合によって、実際の枠の内部に対応する白画素連結成分領域のほかに、枠の外側に複数の白画素連結成分領域が得られるが、その中で面積が最大の、実際の枠の内部に対応した白画素連結成分領域が選択される。
【0018】
なお、図6に例示するように、枠を構成する罫線が印刷のかすれなどで部分的に切れている場合がある。このような罫線の切れた部分の白ランまで検出し、それを統合すると、図6中の網掛け領域と枠の内部とが1つの白画素連結成分領域に統合されてしまう。白ラン抽出部116は、罫線の切れた部分のような、所定値より短い白ランを抽出対象から除外することにより、そのような不都合を回避している。
【0019】
スキューがあると、以上のようにして抽出された白画素連結成分領域に罫線が含まれてしまう。そこで、罫線消去部124で、白画素連結成分メモリ122内の白画素連結成分領域データによって示される各白画素連結成分領域毎に、領域の各辺の内側の限定された範囲(領域の内側で、罫線の黒画素が存在する可能性のある限定された周辺部)について、2値イメージメモリ102内の2値イメージデータをスキャンして罫線の黒画素を検出し、それを白画素に置き換えることにより、白画素連結成分領域に含まれている罫線の消去を行う(ステップS7)。例えば、白画素連結成分領域の各辺に沿った方向(主走査方向又は副走査方向)の一定値以上の長さの黒ランを探索し、罫線とみなし得る黒ランの連結成分を抽出して、その黒画素を白画素に置き換える。図6に示した枠領域について罫線消去を行った結果を図7に示す。図7中の白抜きの線が消去された罫線を表している。なお、図7は誇張されており、実際には白画像連結成分領域には罫線の一部しか入り込まないことが多い。この場合、白画素連結成分領域の内部に入り込んだ罫線の部分だけが消去されることになる。
【0020】
次に、黒画素連結成分抽出部126で、罫線消去後の各白画素連結成分領域の内部について、2値イメージメモリ102上の2値イメージデータをスキャンし、黒画素連結成分の外接矩形を抽出し、そのデータ(始点、終点の座標など)を黒画素連結成分メモリ128に格納する(ステップS8)。図7に示した枠領域から抽出された白画素連結成分領域の場合、図8に示すように、文字又は文字線に外接する矩形が黒画素連結成分矩形として抽出される。
【0021】
画像の揺らぎなどにより、罫線の境界に図9に例示するようなノイズが発生することがある。このような罫線ノイズは、その黒ランが罫線としての黒ランより短いと、前述の罫線消去によっては消去されないため、黒画素連結成分矩形として抽出されることになる。罫線ノイズ除去部130は、そのような罫線ノイズに相当する黒画素連結成分矩形のデータを黒画素連結成分メモリ128から削除する(ステップS9)。例えば、罫線矩形に接する黒画素連結成分矩形で、罫線に対し垂直な方向の長さが所定値以下の黒画素連結成分矩形を罫線ノイズとみなし削除する。
【0022】
このような罫線ノイズの除去後、文字抽出部132において、黒画素連結成分メモリ128内のデータを参照し、各白画素連結成分領域毎に、黒画素連結成分矩形を統合することにより文字領域(図10参照)を求め、その文字領域の2値イメージデータ(文字領域画像)を2値イメージメモリ102より切り出し、文字領域画像メモリ134に格納する(ステップS10)。このようにして、文字と罫線の接触がある枠の内部の文字も確実に抽出することが可能である。しかも、以上に述べたように、スキュー、罫線の切れ、画像の揺れなどによる罫線ノイズがあっても、確実な文字抽出が可能である。
【0024】
本発明の他の実施の形態によれば、罫線ノイズ除去部130が省かれる。このような構成によっても、罫線ノイズを心配する必要がない場合には、問題なく枠内の文字抽出が可能であることは以上の説明から明らかである。
【0025】
【発明の効果】
以上の説明から明らかなように、本発明によれば、枠内に罫線と接触した文字がある場合でも、枠内文字の確実な抽出が可能である。また、枠の罫線に切れがあっても支障無く白画素連結成分領域を抽出し、枠内の文字を確実に抽出可能である。また、スキューや画像の揺らぎによる罫線矩形の膨らみがあっても、枠内の文字を精度よく抽出可能である。さらに、画像のゆらぎなどによって罫線ノイズが発生した場合でも、その影響を受けることなく精度の良い文字抽出が可能である。
【図面の簡単な説明】
【図1】本発明による文字抽出装置のブロック構成の一例を示すブロック図である。
【図2】文字抽出処理を示すフローチャートである。
【図3】本発明をソフトウェアで実施するために利用し得るコンピュータの一例を示すブロック図である。
【図4】黒ランの統合により抽出される罫線矩形の説明図である。
【図5】認識された枠領域の例を示す図である。
【図6】罫線の切れに関する説明のための図である。
【図7】認識された枠領域内の罫線消去を説明するための図である。
【図8】枠領域より抽出される黒画素連結成分矩形の例を示す図である。
【図9】罫線ノイズの説明図である。
【図10】黒画素連結成分矩形の統合により抽出される文字領域の例を示す図である。
【符号の説明】
100 2値画像入力部
102 2値イメージメモリ
104 黒ラン抽出部
106 黒ランメモリ
108 罫線抽出部
110 罫線メモリ
112 枠抽出部
114 枠領域メモリ
116 白ラン抽出部
118 白ランメモリ
120 白画素連結成分抽出部
122 白画素連結成分メモリ
124 罫線消去部
126 黒画素連結成分抽出部
128 黒画素連結成分メモリ
130 罫線ノイズ除去部
132 文字抽出部
134 文字領域画像メモリ

Claims (5)

  1. 2値画像上の罫線で囲まれた枠内の文字を抽出する文字抽出方法であって、
    2値画像上の罫線の矩形を抽出する第1ステップと、
    前記第1ステップで抽出された罫線の矩形の外側の座標を用いて、罫線で囲まれた枠の領域を認識する第2ステップと、
    前記第2ステップで認識された枠領域内の所定値以上の長さの白ランを抽出し統合して白画素連結成分の矩形を抽出し、その中で面積が最大の矩形の白画素連結成分領域を実際の枠の内側領域(文字記入領域)に対応した領域として抽出する第3ステップと、
    前記第3ステップで抽出された白画素連結成分領域内の周辺部の所定値以上の長さの黒ランを探索し、該黒ランの連結成分を抽出して、その黒画素を白画素に置き換えることで、白画素連結成分領域内に含まれる罫線を消去する第4ステップと、
    前記第4ステップでの罫線消去後の白画素連結成分領域内の黒画素連結成分の矩形を抽出する第5ステップと、
    前記第5ステップで抽出された黒画素連結成分矩形を統合して文字領域を抽出し、該文字領域の2値画像データを切り出す第6ステップと、
    を含むことを特徴とする文字抽出方法。
  2. 前記第6ステップの処理に先立って、罫線ノイズに相当する黒画素連結成分矩形を除去するためのステップを更に含むことを特徴とする請求項1記載の文字抽出方法。
  3. 2値画像上の罫線で囲まれた枠内の文字を抽出する文字抽出装置であって、
    2値画像上の罫線の矩形を抽出する手段と、
    抽出された罫線の矩形の外側の座標を用いて、罫線で囲まれた枠の領域を認識する手段と、
    前記認識された枠領域内の所定値以上の長さの白ランを抽出し統合して白画素連結成分の矩形を抽出し、その中で面積が最大の矩形の白画素連結成分領域を実際の枠の内側領域(文字記入領域)に対応した領域として抽出する手段と、
    前記抽出された白画素連結成分領域内の周辺部の所定値以上の長さの黒ランを探索し、該黒ランの連結成分を抽出して、その黒画素を白画素に置き換えることで、白画素連結成分領域内に含まれる罫線を消去する手段と、
    前記罫線消去後の白画素連結成分領域内の黒画素連結成分の矩形を抽出する手段と、
    前記抽出された黒画素連結成分矩形を統合して文字領域を抽出し、該文字領域の2値画像データを切り出す手段と、
    を有することを特徴とする文字抽出装置。
  4. 前記文字領域の2値画像データを切り出す手段での処理に先立って、前記黒画素連結成分の矩形を抽出する手段により抽出された黒画素連結成分矩形から罫線ノイズに相当する黒画素連結成分矩形を除去する手段を更に有することを特徴とする請求項3記載の文字抽出装置。
  5. 請求項1又は2に記載の文字抽出方法の各ステップの処理をコンピュータに実行させるためのプログラムが記録されたことを特徴とするコンピュータ読み取り可能な記憶媒体。
JP2000040444A 2000-02-18 2000-02-18 文字抽出方法及び装置並びに記憶媒体 Expired - Lifetime JP4040231B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000040444A JP4040231B2 (ja) 2000-02-18 2000-02-18 文字抽出方法及び装置並びに記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000040444A JP4040231B2 (ja) 2000-02-18 2000-02-18 文字抽出方法及び装置並びに記憶媒体

Publications (2)

Publication Number Publication Date
JP2001229342A JP2001229342A (ja) 2001-08-24
JP4040231B2 true JP4040231B2 (ja) 2008-01-30

Family

ID=18563817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000040444A Expired - Lifetime JP4040231B2 (ja) 2000-02-18 2000-02-18 文字抽出方法及び装置並びに記憶媒体

Country Status (1)

Country Link
JP (1) JP4040231B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3995185B2 (ja) 2000-07-28 2007-10-24 株式会社リコー 枠認識装置及び記録媒体
CN113449729A (zh) * 2020-03-26 2021-09-28 富士通株式会社 用于消除线的图像处理装置、图像处理方法及存储介质

Also Published As

Publication number Publication date
JP2001229342A (ja) 2001-08-24

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
JP2000194850A (ja) ユ―ザ囲み領域の抽出装置及び抽出方法
JP3615333B2 (ja) 罫線消去装置
JP3837193B2 (ja) 文字行抽出方法および装置
JP4049560B2 (ja) 網点除去方法及びシステム
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP4420440B2 (ja) 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体
JP2796561B2 (ja) 表形式文書認識方式
JP3348224B2 (ja) 表枠線の交点補正装置および表認識装置および光学文字読取装置
JP2000082110A (ja) 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
Kise et al. Document image segmentation as selection of Voronoi edges
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP3391987B2 (ja) 帳票認識装置
JP2001236464A (ja) 文字抽出方法、文字抽出装置及び記憶媒体
JP4079411B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体
JP3402755B2 (ja) 領域分割方法
JP2002074264A (ja) 画像処理装置、画像処理方法および記録媒体
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2931041B2 (ja) 表内文字認識方法
JPH05159062A (ja) 文書認識装置
JPH1049676A (ja) 罫線認識方法
JP2008234223A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2000067158A (ja) 文書画像処理方法および文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070816

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071010

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071107

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4040231

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131116

Year of fee payment: 6

EXPY Cancellation because of completion of term