JP2001229342A - 文字抽出方法及び装置並びに記憶媒体 - Google Patents
文字抽出方法及び装置並びに記憶媒体Info
- Publication number
- JP2001229342A JP2001229342A JP2000040444A JP2000040444A JP2001229342A JP 2001229342 A JP2001229342 A JP 2001229342A JP 2000040444 A JP2000040444 A JP 2000040444A JP 2000040444 A JP2000040444 A JP 2000040444A JP 2001229342 A JP2001229342 A JP 2001229342A
- Authority
- JP
- Japan
- Prior art keywords
- connected component
- area
- pixel connected
- rectangle
- ruled line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
枠内の文字を確実に抽出する。 【解決手段】 主,副走査方向の長い黒ランを抽出し統
合することにより罫線矩形を抽出し(S2,S3)、罫
線矩形の外側の座標を用いて枠領域を認識し(S4)、
枠領域内の長い白ランを抽出し統合することにより枠の
内部に対応した白画素連結成分領域を抽出し、その内部
の罫線を消去する(S5,S6,S7)。白画素連結成
分領域内の黒画素連結成分矩形を抽出し(S8)、罫線
ノイズの矩形を除去し(S9)、残った矩形を統合した
文字領域の2値イメージデータを切り出す(S10)。
Description
係り、特に、文字認識装置などにおいて、表や帳票など
の罫線によって囲まれた枠の内部に記入された文字を抽
出する技術に関する。
字を抽出する方法とし、特開平3−172984号公報
に開示されているように、罫線矩形を抽出し、罫線によ
って囲まれる枠を罫線矩形の外側の座標を用いて認識
し、枠内の黒画素連結成分の外接矩形を求めてから、枠
に接している外接矩形を除去し、残った外接矩形を用い
て枠内の文字を切り出す方法が知られている。
内に罫線に接触した文字がある場合に、罫線に接触して
いる文字に対応する外接矩形が、罫線に対応する黒画素
の外接矩形と同一のものになってしまい、枠に接してい
る外接矩形として除去される結果、枠内の文字抽出に失
敗することがある。
触した文字がある場合にも、枠内の文字を確実に抽出可
能な文字抽出方法及び装置を提供することにある。
め、本発明においては、2値画像上の罫線の矩形を抽出
し、抽出した罫線矩形の外側の座標を用いて罫線で囲ま
れた枠の領域を認識し、認識した枠領域内の白画素連結
成分の矩形を抽出し、その中で面積が最大の矩形の領域
を白画素連結成分領域として抽出し、抽出した白画素連
結成分領域内の黒画素連結成分の矩形を抽出し、それを
統合することにより文字領域を抽出する。また、罫線の
切れに対処するため、枠領域内の所定値以上の長さの白
ランを抽出して統合することによって白画素連結成分の
矩形を抽出する。また、スキューに対処するため、黒画
素連結成分矩形の抽出に先立って、白画素連結成分領域
内の周辺部の罫線の黒画素を消去する。また、画像のゆ
らぎなどにより発生する罫線ノイズに対処するため、黒
画素連結成分矩形の統合により文字領域を抽出する前
に、罫線ノイズに相当する黒画素連結成分矩形を除去す
る。
について、実施の形態に関連して以下詳述する。
の実施の一形態である文字抽出装置について説明する。
この文字抽出装置のブロック構成の一例と処理の流れを
図1と図2にそれぞれ示す。また、図4から図10は処
理の説明のための図である。
装置の前処理部として用いられるもので、図1に見られ
るように、表や帳票などの罫線のある原稿の2値イメー
ジデータを入力するためのスキャナなどの画像入力部1
00と、入力された2値イメージデータを蓄積するため
の2値イメージメモリ102と、罫線で囲まれた枠領域
の認識に関わる黒ラン抽出部104、黒ランメモリ10
6、罫線抽出部108、罫線メモリ110、枠抽出部1
12及び枠領域メモリ114と、実際の枠の内部(文字
が記入される領域)に対応した領域(後述の白画素連結
成分領域)の認識に関わる白ラン抽出部116、白ラン
メモリ118、白画素連結成分抽出部120及び白画素
連結成分メモリ122と、白画素連結成分領域内の罫線
の黒画素を消去するための罫線消去部124と、個々の
文字の外接矩形又は文字線の外接矩形の抽出のための黒
画素連結成分抽出部126と、黒画素連結成分メモリ1
28と、罫線ノイズを除去するための罫線ノイズ除去部
130と、文字領域画像データを切り出すための文字抽
出部132と、文字領域画像メモリ134とから構成さ
れる。
も専用のハードウェアによって実現される必要はなく、
例えば図3に示すようなCPU201、メモリ202、
ハードディスク203、入力装置(イメージスキャナ、
キーボード、マウスなど)204、ディスプレイ20
6、各種記憶媒体(磁気ディスク、光ディスク、光磁気
ディスク、メモリカードなど)207の読み書きのため
の媒体ドライブ205、外部の機器やネットワークとの
通信のための通信装置(モデム、ネットワークアダプタ
など)208などをバス210で接続した一般的な構成
のコンピュータを利用し、ソフトウェアにより実現する
こともできる。
ピュータ上で実現するためのプログラム、換言すれば、
図2に示した処理ステップをコンピュータ上で実行する
ためのプログラムが、例えば、それが記録された記憶媒
体207から媒体ドライブ205によってメモリ202
に読み込まれたり、外部装置より通信装置208によっ
てメモリ202に読み込まれたり、あるいはハードディ
スク203からメモリ202に読み込まれ、CPU20
1により実行される。このプログラムを、それを固定記
憶させた半導体ROMとして実装してもよい。このよう
なプログラムが記録された各種記憶媒体207や半導体
ROMなどの記憶媒体も本発明に包含されるものであ
る。
値イメージは、例えば入力装置204に含まれるスキャ
ナによって読み込まれたり、記憶媒体207から読み込
まれたり、あるいは通信装置208によって外部機器か
ら入力される。
て、この文字抽出装置の動作を説明する。
や帳票などの罫線のある原稿の2値イメージデータを入
力し、2値イメージメモリ102に格納する(図2のス
テップS1)。黒ラン抽出部104で、2値イメージメ
モリ102内の2値イメージデータをスキャンし、主走
査方向及び副走査方向の、所定値以上の長さを持つ黒ラ
ンを抽出し、抽出した各黒ランに関するデータ(始点、
終点の座標等)を黒ランメモリ106に格納する(ステ
ップS2)。
出部108で、黒ランメモリ106の黒ランデータを参
照し、主走査方向の黒ラン及び副走査方向の黒ランのそ
れぞれに対し、所定の距離範囲内にある黒ランを矩形に
統合する処理を行い、統合した矩形の中で、罫線として
妥当な長さ及び幅を持つ矩形を主走査方向又は副走査方
向の罫線の矩形として抽出し、そのデータ(矩形の始
点、終点の座標など)を罫線メモリ110に格納する
(ステップS3)。
内の罫線矩形データを参照し、主走査方向の罫線と副走
査方向の罫線とによって四方を囲まれた枠の領域を認識
し、その枠領域に関するデータ(始点、終点の座標な
ど)を枠領域メモリ114に格納する(ステップS
4)。この枠領域の認識には、それを囲む罫線矩形の外
側の座標を用いる。例えば、主走査方向の罫線は、図4
に示すような主走査方向の黒ラン(黒線)を統合した矩
形(破線)として抽出される。枠の上側の罫線のy座標
としては図4に示す罫線矩形のYsが用いられ、枠領域
の下側の罫線のy座標としては図4に示す罫線矩形のY
eが用いられる。同様に、枠領域の左側の罫線のx座標
としては罫線矩形の左側のx座標が、枠領域の右側の罫
線のx座標としては罫線矩形の右側のx座標が用いられ
る。このように、枠を構成する罫線の矩形の外側の座標
を用いて枠領域を認識するため、図5に例示するよう
に、罫線(太線)で囲まれた実際の枠領域よりも広い矩
形領域(破線)が枠領域として認識される。ただし、図
5は誇張されており、認識される枠領域と実際の枠領域
とのずれは実際には図5に示すほど大きくない。スキュ
ーや、画像の揺らぎなどによる罫線矩形の膨らみがなけ
れば、罫線と罫線矩形とが良く一致するため、認識され
る枠領域と、実際の枠領域(罫線を含む)とがほぼ一致
する。
から、実際の枠の内側領域(文字が記入される領域)に
対応した領域を抽出するための処理を行う。まず、白ラ
ン抽出部116で、枠領域メモリ114内の枠領域デー
タによって示される個々の枠領域の内部に関し、2値イ
メージメモリ102内の2値イメージデータをスキャン
して所定値以上の長さの白ランを抽出し、抽出した白ラ
ンに関するデータ(始点、終点の座標など)を各枠領域
に対応付けて白ランメモリ118に格納する(ステップ
S5)。一般に、枠領域は文字行方向に長いため、文字
行方向の白ランが抽出される。ここでは、主走査方向が
文字行方向に対応するものとして、主走査方向の白ラン
が抽出される。
て、白ランメモリ118内の白ランデータを参照し、各
枠領域毎に、その内部の白ランを統合することによって
白画素連結成分の外接矩形を白画素連結成分領域として
抽出し、そのデータ(始点、終点の座標など)を白画素
連結成分メモリ122に格納する(ステップS6)。こ
の際、各枠領域の内部に2つ以上の白画素連結成分領域
が抽出された場合には、その中で面積が最も大きな1つ
の白画素連結成分領域を選び、そのデータのみを白画素
連結成分メモリ122に格納する。例えば、図5に示す
枠領域の場合、白ランの統合によって、実際の枠の内部
に対応する白画素連結成分領域のほかに、枠の外側に複
数の白画素連結成分領域が得られるが、その中で面積が
最大の、実際の枠の内部に対応した白画素連結成分領域
が選択される。
る罫線が印刷のかすれなどで部分的に切れている場合が
ある。このような罫線の切れた部分の白ランまで検出
し、それを統合すると、図6中の網掛け領域と枠の内部
とが1つの白画素連結成分領域に統合されてしまう。白
ラン抽出部116は、罫線の切れた部分のような、所定
値より短い白ランを抽出対象から除外することにより、
そのような不都合を回避している。
された白画素連結成分領域に罫線が含まれてしまう。そ
こで、罫線消去部124で、白画素連結成分メモリ12
2内の白画素連結成分領域データによって示される各白
画素連結成分領域毎に、領域の各辺の内側の限定された
範囲(領域の内側で、罫線の黒画素が存在する可能性の
ある限定された周辺部)について、2値イメージメモリ
102内の2値イメージデータをスキャンして罫線の黒
画素を検出し、それを白画素に置き換えることにより、
白画素連結成分領域に含まれている罫線の消去を行う
(ステップS7)。例えば、白画素連結成分領域の各辺
に沿った方向(主走査方向又は副走査方向)の一定値以
上の長さの黒ランを探索し、罫線とみなし得る黒ランの
連結成分を抽出して、その黒画素を白画素に置き換え
る。図6に示した枠領域について罫線消去を行った結果
を図7に示す。図7中の白抜きの線が消去された罫線を
表している。なお、図7は誇張されており、実際には白
画像連結成分領域には罫線の一部しか入り込まないこと
が多い。この場合、白画素連結成分領域の内部に入り込
んだ罫線の部分だけが消去されることになる。
線消去後の各白画素連結成分領域の内部について、2値
イメージメモリ102上の2値イメージデータをスキャ
ンし、黒画素連結成分の外接矩形を抽出し、そのデータ
(始点、終点の座標など)を黒画素連結成分メモリ12
8に格納する(ステップS8)。図7に示した枠領域か
ら抽出された白画素連結成分領域の場合、図8に示すよ
うに、文字又は文字線に外接する矩形が黒画素連結成分
矩形として抽出される。
9に例示するようなノイズが発生することがある。この
ような罫線ノイズは、その黒ランが罫線としての黒ラン
より短いと、前述の罫線消去によっては消去されないた
め、黒画素連結成分矩形として抽出されることになる。
罫線ノイズ除去部130は、そのような罫線ノイズに相
当する黒画素連結成分矩形のデータを黒画素連結成分メ
モリ128から削除する(ステップS9)。例えば、罫
線矩形に接する黒画素連結成分矩形で、罫線に対し垂直
な方向の長さが所定値以下の黒画素連結成分矩形を罫線
ノイズとみなし削除する。
部132において、黒画素連結成分メモリ128内のデ
ータを参照し、各白画素連結成分領域毎に、黒画素連結
成分矩形を統合することにより文字領域(図10参照)
を求め、その文字領域の2値イメージデータ(文字領域
画像)を2値イメージメモリ102より切り出し、文字
領域画像メモリ134に格納する(ステップS10)。
このようにして、文字と罫線の接触がある枠の内部の文
字も確実に抽出することが可能である。しかも、以上に
述べたように、スキュー、罫線の切れ、画像の揺れなど
による罫線ノイズがあっても、確実な文字抽出が可能で
ある。
去部124が省かれ、罫線消去を行うことなく黒画素連
結成分矩形の抽出が行われる。このような構成によって
も、スキューや画像のゆらぎなどによる罫線矩形の膨ら
みを心配する必要なない場合には、罫線と文字との接触
がある枠においても正常な文字抽出が可能であることは
以上の説明から明らかである。
イズ除去部130が省かれる。このような構成によって
も、罫線ノイズを心配する必要がない場合には、問題な
く枠内の文字抽出が可能であることは以上の説明から明
らかである。
1乃至8の各項記載の発明によれば、枠内に罫線と接触
した文字がある場合でも、枠内文字の確実な抽出が可能
である。請求項2又は6記載の発明によれば、枠の罫線
に切れがあっても支障無く白画素連結成分領域を抽出
し、枠内の文字を確実に抽出可能である。請求項3又は
7記載の発明によれば、スキューや画像の揺らぎによる
罫線矩形の膨らみがあっても、枠内の文字を精度よく抽
出可能である。請求項4又は8記載の発明によれば、画
像のゆらぎなどによって罫線ノイズが発生した場合で
も、その影響を受けることなく精度の良い文字抽出が可
能である。また、請求項9記載の発明によれば、以上の
ような文字抽出処理を一般的なコンピュータを利用し容
易に実施できる、等々の効果を得られる。
例を示すブロック図である。
得るコンピュータの一例を示すブロック図である。
図である。
の図である。
を示す図である。
文字領域の例を示す図である。
Claims (9)
- 【請求項1】 2値画像上の罫線の矩形を抽出する第1
ステップと、罫線で囲まれた枠の領域を前記第1ステッ
プで抽出された罫線の矩形の外側の座標を用いて認識す
るための第2ステップと、この第2ステップで認識され
た枠領域内の白画素連結成分の矩形を抽出し、その中で
面積が最大の矩形の領域を白画素連結成分領域として抽
出するための第3ステップと、この第3ステップで抽出
された白画素連結成分領域内の黒画素連結成分の矩形を
抽出するための第4ステップと、この第4ステップで抽
出された黒画素連結成分矩形を統合することにより文字
領域を抽出するための第5ステップとを含むことを特徴
とする文字抽出方法。 - 【請求項2】 前記第3ステップにおいて、枠領域内の
所定値以上の長さの白ランを抽出して統合することによ
って白画素連結成分の矩形を抽出することを特徴とする
請求項1記載の文字抽出方法。 - 【請求項3】 前記第4ステップに先だって、白画素連
結成分領域内の周辺部の罫線の黒画素を消去するための
ステップを含むことを特徴とする請求項1又は2記載の
文字抽出方法。 - 【請求項4】 前記第5ステップに先立って、罫線ノイ
ズに相当する黒画素連結成分矩形を除去するためのステ
ップを含むことを特徴とする請求項1、2又は3記載の
文字抽出方法。 - 【請求項5】 2値イメージデータを入力する第1手段
と、この第1手段により入力された2値イメージデータ
から罫線の矩形を抽出するための第2手段と、罫線で囲
まれた枠の領域を前記第2手段により抽出された罫線の
矩形の外側の座標を用いて認識するための第3手段と、
この第3手段により認識された枠領域内について前記入
力された2値イメージデータをスキャンすることにより
白画素連結成分の矩形を抽出し、その中で面積が最大の
矩形の領域を白画素連結成分領域として抽出するための
第4手段と、この第4手段により抽出された白画素連結
成分領域内について前記入力された2値イメージデータ
をスキャンすることにより黒画素連結成分の矩形を抽出
するための第5手段と、この第5手段により抽出された
黒画素連結成分矩形を統合した文字領域の2値イメージ
データを前記入力された2値イメージデータより抽出す
るための第6手段とを具備することを特徴とする文字抽
出装置。 - 【請求項6】 前記第4手段は、枠領域内の所定値以上
の長さの白ランを抽出して統合することによって白画素
連結成分の矩形を抽出することを特徴とする請求項5記
載の文字抽出装置。 - 【請求項7】 前記第5手段による黒画素連結成分矩形
の抽出に先立って、前記第4手段により抽出された白画
素連結成分領域内の周辺部の罫線の黒画素を白画素に置
き換える処理を前記入力された2値イメージデータに施
すための手段を具備することを特徴とする請求項5又は
6記載の文字抽出装置。 - 【請求項8】 前記第6手段による文字領域の2値イメ
ージデータの抽出に先立って、前記第5手段により抽出
された黒画素連結成分矩形から罫線ノイズに相当する黒
画素連結成分矩形を除去するための手段を具備すること
を特徴とする請求項5、6又は7記載の文字抽出装置。 - 【請求項9】 請求項1、2、3又は4記載の文字抽出
方法の各ステップの処理をコンピュータに実行させるた
めのプログラムが記録されたことを特徴とするコンピュ
ータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000040444A JP4040231B2 (ja) | 2000-02-18 | 2000-02-18 | 文字抽出方法及び装置並びに記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000040444A JP4040231B2 (ja) | 2000-02-18 | 2000-02-18 | 文字抽出方法及び装置並びに記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001229342A true JP2001229342A (ja) | 2001-08-24 |
JP4040231B2 JP4040231B2 (ja) | 2008-01-30 |
Family
ID=18563817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000040444A Expired - Lifetime JP4040231B2 (ja) | 2000-02-18 | 2000-02-18 | 文字抽出方法及び装置並びに記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4040231B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7003159B2 (en) | 2000-07-28 | 2006-02-21 | Ricoh Co., Ltd. | Document frame recognition system and method |
CN113449729A (zh) * | 2020-03-26 | 2021-09-28 | 富士通株式会社 | 用于消除线的图像处理装置、图像处理方法及存储介质 |
-
2000
- 2000-02-18 JP JP2000040444A patent/JP4040231B2/ja not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7003159B2 (en) | 2000-07-28 | 2006-02-21 | Ricoh Co., Ltd. | Document frame recognition system and method |
CN113449729A (zh) * | 2020-03-26 | 2021-09-28 | 富士通株式会社 | 用于消除线的图像处理装置、图像处理方法及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP4040231B2 (ja) | 2008-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kise et al. | Segmentation of page images using the area Voronoi diagram | |
JP2001358925A (ja) | 画像処理のための装置、方法及び記録媒体 | |
JP3615333B2 (ja) | 罫線消去装置 | |
JP3837193B2 (ja) | 文字行抽出方法および装置 | |
JP4049560B2 (ja) | 網点除去方法及びシステム | |
JP4040231B2 (ja) | 文字抽出方法及び装置並びに記憶媒体 | |
JP2000082110A (ja) | 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体 | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JP2796561B2 (ja) | 表形式文書認識方式 | |
JP3348224B2 (ja) | 表枠線の交点補正装置および表認識装置および光学文字読取装置 | |
Kise et al. | Document image segmentation as selection of Voronoi edges | |
JP2001236464A (ja) | 文字抽出方法、文字抽出装置及び記憶媒体 | |
JP4079411B2 (ja) | 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体 | |
JP3391987B2 (ja) | 帳票認識装置 | |
JP4129902B2 (ja) | 罫線消去方法、罫線消去装置、及び、記録媒体 | |
JP3402755B2 (ja) | 領域分割方法 | |
JP2002074264A (ja) | 画像処理装置、画像処理方法および記録媒体 | |
JP2003016385A (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
JPH03172984A (ja) | 表処理方法 | |
JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 | |
JPH05159062A (ja) | 文書認識装置 | |
JP2000067158A (ja) | 文書画像処理方法および文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体 | |
JP2931041B2 (ja) | 表内文字認識方法 | |
JP4571447B2 (ja) | 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置 | |
JP3566738B2 (ja) | 網掛け領域処理方法および網掛け領域処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040517 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070816 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071107 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4040231 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121116 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131116 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |