JP2002042143A - 枠認識装置及び記録媒体 - Google Patents

枠認識装置及び記録媒体

Info

Publication number
JP2002042143A
JP2002042143A JP2000228083A JP2000228083A JP2002042143A JP 2002042143 A JP2002042143 A JP 2002042143A JP 2000228083 A JP2000228083 A JP 2000228083A JP 2000228083 A JP2000228083 A JP 2000228083A JP 2002042143 A JP2002042143 A JP 2002042143A
Authority
JP
Japan
Prior art keywords
frame
rectangle
black pixel
pixel rectangle
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000228083A
Other languages
English (en)
Other versions
JP3995185B2 (ja
Inventor
Toshifumi Yamaai
敏文 山合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000228083A priority Critical patent/JP3995185B2/ja
Priority to US09/904,473 priority patent/US7003159B2/en
Publication of JP2002042143A publication Critical patent/JP2002042143A/ja
Application granted granted Critical
Publication of JP3995185B2 publication Critical patent/JP3995185B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 1文字記入枠やチェツクボックスのような、
文字サイズ程度以下の小さい枠を高精度に認識する。 【解決手段】 黒画素矩形抽出部103で抽出した黒画
素矩形に対し、一次判定部104で大きさや黒画素密度
に関する条件判定を行って黒画素矩形を枠候補と非枠候
補に弁別する。白画素矩形抽出部105で、枠候補とさ
れた黒画素矩形の内部の白画素矩形を抽出する。二次判
定部106で、枠候補の黒画素矩形と、それより抽出さ
れた白画素矩形との位置関係に関する条件判定を行い、
枠候補の黒画素矩形を枠と非枠に弁別する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票類のような文
書画像中の罫線で囲まれた枠を認識するための技術に関
する。
【0002】
【従来の技術】罫線で囲まれた枠を含む帳票など文書を
扱う文字認識装置(OCR)においては、文字認識の前
処理段階で文書画像データより枠を認識する必要があ
る。同様に、マーク認識装置(PMR)においても、文
書画像データよりマーク記入枠の位置を予め定義する必
要がある。
【0003】このような枠認識に関しては様々な従来技
術が知られているが、その多くの基本原理は、水平、垂
直方向の黒ランの閾値処理により水平、垂直方向の罫線
を抽出し、四方を罫線で囲まれた領域を枠として認識す
るというものである(特開平11−66225号、特開
平9−138837号など)。
【0004】
【発明が解決しようとする課題】文字認識装置で処理さ
れる帳票類に使用されている枠の大半は、複数の枠が二
次元的に連続して配置された図13に示すような表形式
の枠、複数の枠が一次元的に連続して配置された図14
に示すような梯子形式の枠、あるいは、1つ1つが分離
した図15に示すような枠のいずれかに分類することが
できる。ここでは便宜上、図13及び図14に示すよう
な枠を複雑枠と呼び、図15に示すような枠を単純枠と
呼ぶこととする。
【0005】複雑枠については、個々の枠のサイズが小
さい場合でも、枠を構成する罫線の長さは文字サイズよ
り十分に大きいため、前記従来技術により認識可能であ
る。他方、チェックボックスや1文字記入枠のように、
文字サイズと同等か、それより小さいサイズの単純枠に
ついては、前記従来技術によって認識することは難し
い。前記従来技術では、罫線を抽出するための黒ラン長
の閾値を文字サイズと同等以下にすると、文字の部分で
も多くの罫線候補が抽出されてしまい、本来の罫線を精
度よく抽出することが困難であるためである。
【0006】また、帳票類に用いられる枠は、枠線の細
いものが多いため、スキャナで読み取ると、枠線にかす
れが生じやすい。殊に、ドロップアウトを目的にした薄
い色で枠が印刷された帳票などは、それを白黒スキャナ
で読み取ると、枠線のかすれが特に生じやすい。そのか
すれを生じない程度の濃度で読み取ろうとすると、記入
された文字などが潰れやすくなるため、読み取り濃度を
あまり高くすることも困難である。
【0007】よって、本発明の目的は、前記従来技術で
は認識が困難な、1文字記入枠やチェックボックスのよ
うな、文字サイズ程度もしくはそれより小さな単純枠な
ども高精度に認識できる枠認識装置を提供すること、及
び、枠線のかすれが多い場合にも高精度の枠認識が可能
な枠認識装置を提供することにある。
【0008】
【課題を解決するための手段】本発明の枠認識装置の主
要な特徴は、文書画像データより黒画素の連結成分の外
接矩形(黒画素矩形)を抽出し、抽出した黒画素矩形に
関し条件判定(一次判定)を行うことにより黒画素矩形
を枠候補と非枠候補に弁別し、枠候補とされた黒画素矩
形の内部において文書画像データより白画素の連結成分
の外接矩形(白画素矩形)を抽出し、抽出された白画素
矩形に関し条件判定(二次判定)を行うことにより、白
画素矩形が抽出された黒画素矩形を枠又は非枠に弁別す
ることである。本発明の枠認識装置のもう1つの主要な
特徴は、二次判定により枠とされた黒画素矩形が連続し
た仮想連続枠領域を生成し、仮想連続枠領域に含まれ
る、一次判定で枠候補とされた黒画素矩形であって二次
判定で枠とされなかった黒画素矩形を統合し、統合され
た黒画素矩形に対し枠認識処理を行うことである。本発
明のもう1つの主要な特徴は、統合された黒画素矩形に
対する枠認識処理を、前記の一次判定、白画素矩形抽出
及び二次判定のための手段を利用して行うことである。
【0009】以上に述べた本発明の主要な特徴及びその
他の特徴について、以下に述べる実施の形態に関連して
具体的に説明する。
【0010】
【発明の実施の形態】以下、添付図面を参照し、本発明
の実施の形態について説明する。図1は本発明の1つの
実施の形態を説明するためのブロック図である。ここに
示す枠認識装置は、画像入力部100、画像圧縮部10
1、画像記憶部102、黒画素矩形抽出部103、一次
判定部104、白画素矩形抽出部105、二次判定部1
06、作業用記憶部107、出力部108、以上各部の
動作及び装置全体の動作を制御するための制御部109
から構成される。画像圧縮部101は、必要に応じて設
けられるもので、省くことも可能である。
【0011】一次判定部104、白画素矩形抽出部10
5及び二次判定部106は、1文字記入枠やチェツクボ
ックスなどの、文字サイズと同程度もしくはそれより小
さなサイズの枠の認識処理を行う枠認識モジュール11
0を構成する。ただし、これ以外の条件の枠を例えば前
記従来技術などにより認識するための処理部分を追加
し、この処理部分により認識された枠と、枠認識モジュ
ール110で認識された枠を処理結果として出力するよ
うに変更してもよい。すなわち、本発明は前記従来技術
などと組み合わせて実施することも容易である。そのよ
うな組み合わせを採用する場合、以下に詳述するような
矩形抽出などは従来技術による枠認識処理と共通するた
め、そのため手段を共通化し得る。
【0012】なお、本実施の形態の枠認識装置は、単独
の装置として実現し得るが、これに限定されるものでは
なく、例えば、文字認識装置(OCR)において前処理
部として組み込まれ、あるいは、マーク認識装置(OM
R)において予めマーク記入枠を定義しておくための帳
票定義部として組み込まれる場合もある。
【0013】図2は、本実施の形態の枠認識装置の全体
的な動作を示すフローチャートである。以下、図1のブ
ロック図及び図2のフローチャートを参照し、本実施の
形態の枠認識装置の構成と動作について説明する。
【0014】画像入力部100によって文書画像データ
(通常、2値データ)が入力され、画像記憶部102に
格納される(ステップ200)。より具体的には、文書
画像データは、文書読み取り用のイメージスキャナや、
文書画像データが予め格納されているパソコンなどの記
憶装置より直接的に、又はネットワーク経由にて入力さ
れ、あるいは、磁気ディスクなどの各種記録媒体より入
力される。なお、必要に応じて、入力された文書画像デ
ータに対し画像圧縮部101でOR圧縮(縮小)処理が
施される。このようなOR圧縮処理を施すと、画像記憶
部101の記憶容量の削減や黒画素矩形抽出などの処理
時間の短縮、枠線のかすれの影響の軽減に効果的であ
る。
【0015】次に、黒画素矩形抽出部103において、
画像記憶部101内の文書画像データ(入力された文書
画像データ又はそのOR圧縮後の画像データ)より、黒
画素の連結成分の外接矩形(黒画素矩形)が抽出される
(ステップ201)。この黒画素矩形抽出は、文書画像
の全体又は予め指定された処理領域に対して行われる。
抽出された各黒画素矩形の領域情報として、例えば、左
上コーナーと右下コーナーの座標が作業用記憶部107
に記憶される。
【0016】黒画素矩形抽出の処理が終わると、枠認識
モジュール110による枠認識処理が開始する。
【0017】まず、作業用記憶部107より1つの黒画
素矩形の領域情報が取り出され(ステップ202)、そ
の領域情報を用いて一次判定部104で枠候補と非枠候
補の弁別のための条件判定が行われる(ステップ20
3)。この弁別には、黒画素矩形の高さ、幅、面積、黒
画素数、黒ランの数などの情報を利用できるが、ここで
は、1文字記入枠やチェックボックスのような文字サイ
ズ程度かそれより小さな枠である可能性の高い黒画素矩
形を弁別することを目的としているため、複雑な条件判
定を行う必要はない。したがって、この条件判定では、
例えば次のような比較的単純な条件(1-1)乃至条件(1-
4)に関する判定が行われる。 ・条件(1-1):大きさ(高さ及び幅)がある閾値を越
える。 ・条件(1-2):大きさ(高さ及び幅)がある閾値より
小さい。 ・条件(1-3):縦横比(高さ/幅比又は幅/高さ比)
がある閾値を越える。 ・条件(1-4):黒画素密度(内部の黒画素数を面積で
割った値)がある閾値を越える。
【0018】条件(1-1)は1文字記入枠の大きさを越
える黒画素矩形、例えば文書画像上で2cmを越える高
さ又は幅の黒画素矩形を枠候補から排除するための条件
である。条件(1-2)は、ノイズのような小さな黒画素
矩形、例えば文書画像上で3mm以下の黒画素矩形を枠
候補から排除するための条件である。条件(1-3)は、
縦横比が枠としては明らかに大きすぎる罫線のような黒
画素矩形を排除するための条件である。条件(1-4)
は、内部が黒でほぼ埋め尽くされているような黒画素矩
形を排除するための条件であり、1文字記入枠やチェツ
クボックスは塗りつぶされていない限り、この条件は成
立しない。なお、黒画素密度の計算のための黒画素数
は、一次判定部105において画像記憶部102内の文
書画像データを参照して計数してもよいし、黒画素矩形
抽出部103において黒画素矩形を抽出する際に計数し
て領域情報と関連付けて作業用記憶部107に書き込む
ようにしてもよい。後者の構成のほうが処理効率の面で
一般に有利であろう。
【0019】一次判定部104による条件判定で、上記
4条件のいずれか1つでも成立した場合には(判定結果
=NG)、その黒画素矩形は枠候補とされず、ステップ
202に戻り、別の黒画素矩形の領域情報が作業用記憶
部107より読み出され、その黒画素矩形について一次
判定部104で条件判定が行われる。
【0020】一次判定部104の条件判定で、前記4条
件のいずれも成立しない場合には(判定結果=OK)、
その黒画素矩形は枠候補とされる(ステップ204)。
【0021】1つの黒画素矩形が枠候補とされると、白
画素矩形抽出部105において、その黒画素矩形(親矩
形と呼ぶ)の領域情報に基づき、画像記憶部102内の
文書画像データの、親矩形の領域内部を参照し、白画素
の連結成分の外接矩形(白画素矩形)を抽出し、その領
域情報として例えば左上コーナーと右下コーナーの座標
を作業用記憶部107に格納する(ステップ205)。
【0022】次に、作業用記憶部107より1つの白画
素矩形の領域情報が取り出され(ステップ206)、二
次判定部106で、この白画素矩形に関し、その領域情
報を用いて、親領域(枠候補とされた黒画素矩形)を枠
又は非枠に弁別するための条件判定(二次判定)が行わ
れる(ステップ207)。この条件判定で条件が成立し
た場合(判定結果=OK)には、その親矩形は枠である
と認識される(ステップ208)。枠と認識された親矩
形については、例えば、その領域情報に枠であることを
示すフラグ情報が付加され、あるいは、作業用記憶部1
07内に用意された枠情報記憶域に、その領域情報が格
納される。条件が不成立の場合には(判定結果=N
G)、判定すべき白画素矩形が残っているならば(ステ
ップ209,No)、ステップ206に戻り、別の1つ
の白画素矩形の領域情報が取り出され、その白画素矩形
に関する条件判定が二次判定部106で行われる。親矩
形より抽出された白画素矩形の全てについて条件判定を
行っても親矩形が枠と認識されないか(ステップ20
9,Yes)、親矩形が枠と認識されると、ステップ2
02に戻り、次の黒画素矩形について同様の枠認識処理
が繰り返される。抽出された全ての黒画素矩形が処理済
みとなると(ステップ210,Yes)、作業用記憶部
107より枠として認識された黒画素矩形の領域情報が
出力部108により外部(例えば文字認識装置の認識部
など)へ出力され(ステップ211)、1つの文書画像
データに対する動作を完了する。
【0023】さて、ステップ207の条件判定(二次判
定)は、基本的には、親矩形とその内部より抽出された
白画素矩形との位置関係に関する判定である。以下、そ
の具体例を説明する。
【0024】図3は、二次判定の第1の例を示すフロー
チャートである。まず、親矩形と白画素矩形の重心が計
算され(ステップ300)、算出された重心のX,Y方
向のずれ(絶対値)が算出される(ステップ301)。
X,Y方向の重心のずれが閾値th1(例えば4)と比
較され、X,Y両方向の重心のずれが閾値th1以下な
らば、条件が成立したとされ(ステップ303)、そう
でなければ条件は不成立とされる(ステップ304)。
【0025】例えば、親矩形の左上コーナーの座標(X
so,Yso)と右下コーナーの座標(Xeo,Yeo)が Xso=365,Yso=840 Xeo=400,Yeo=905 であり、抽出された白画素矩形の左上コーナーの座標
(Xsw,Ysw)、右下コーナーの座標(Xew,Yew)が Xsw=372,Ysw=850, Xew=392,Yew=898 であるとする。この場合、親矩形の重心の座標は(38
3、873)、この白画素矩形の重心の座標は(38
2、874)であるから、重心のずれはX,Y方向とも
1であり、これは閾値ht1(ここでは4)以下である
ので条件は成立し、したがって親矩形は枠と認識され
る。
【0026】図4は、二次判定の第2の例を示すフロー
チャートである。まず、親矩形と白画素矩形の座標Xs
(XsoとXsw)のずれ,Ys(YsoとYsw)のずれ、X
e(XeoとXew)のずれ、Ye(YeoとYew)のずれが
計算され(ステップ400)、その最大のずれと最小の
ずれの差が求められる(ステップ401)。この差が閾
値th2(例えば5)と比較され(ステップ402)、
差が閾値th2以下ならば条件成立とされ(ステップ4
03)、そうでなければ条件不成立とされる(ステップ
404)。
【0027】二次判定の第1例の説明中で挙げた親矩形
と白画素矩形の場合、 Xsのずれ=7、Ysのずれ=10、Xeのずれ=8、
Yeのずれ=7 であり、その最大値10と最小値7の差は7で、これは
閾値th2(ここでは5)以下であるので、条件は成立
し、したがって親矩形は枠として認識される。
【0028】図5は、二次判定の第3の例を示すフロー
チャートである。まず、親矩形と白画素矩形の座標Xs
(XsoとXsw)のずれ,Ys(YsoとYsw)のずれ、X
e(XeoとXew)のずれ、Ye(YeoとYew)のずれが
計算され(ステップ500)、求められた各々のずれ
と、予め定められた枠を囲む罫線の太さ(例えば9)と
の差が計算される(ステップ501)。算出された各々
の差と閾値th3(例えば4)が比較され(ステップ5
02)、いずれの差も閾値th3以下ならば条件成立と
され(ステップ503)、いずれか1つの差でも閾値t
h3を越えるならば条件不成立とされる(ステップ50
4)。
【0029】二次判定の第1例の説明中で挙げた親矩形
と白画素矩形の場合、Xsのずれ=7、Ysのずれ=1
0、Xeのずれ=8、Yeのずれ=7と罫線太さ(ここ
では9)との差は最大で2となるため、条件は成立し、
したがって親矩形は枠として認識されることになる。
【0030】図6は、二次判定の第4の例を示すフロー
チャートである。まず、親矩形の内部において水平又は
垂直方向の黒ラン抽出が行われ、抽出された黒ランの長
さのヒストグラムが作成される(ステップ600)。親
矩形は、内部が塗り潰されていない枠であるから(内部
が塗り潰された枠は一次判定で枠候補から排除されてい
る)、このヒストグラムの最頻値を、枠を構成する罫線
の太さとみなすことができる。この仮定に立って、ヒス
トグラムの最頻値の黒ラン長が罫線の太さと推定される
(ステップ601)。次に、親矩形と白画素矩形の座標
Xs(XsoとXsw)のずれ,Ys(YsoとYsw)のず
れ、Xe(XeoとXew)のずれ、Ye(YeoとYew)の
ずれが計算され(ステップ602)、求められた各々の
ずれと、ステップ601で推定された罫線の太さとの差
が計算される(ステップ603)。算出された各々の差
と閾値th3(例えば4)が比較され(ステップ60
4)、いずれの差も閾値th3以下ならば条件成立とさ
れ(ステップ605)、いずれか1つの差でも閾値th
3を越えると条件不成立とされる(ステップ606)。
以上の第1例乃至第4例の二次判定によれば、1文字記
入枠やチェツクボックスのような、従来技術では認識が
困難な文字サイズ程度以下の枠を精度よく弁別できる
が、本第4例の二次判定によれば、枠線(罫線)の太さ
の違いに適応し、様々な太さの枠線からなる枠を精度よ
く認識できる。
【0031】さて、親矩形が枠である場合でも、枠線
(罫線)のある辺が、かすれにより切れた場合、その辺
については、親矩形と白画素矩形とが重なってしまう。
例えば、前述の二次判定の第1例で挙げた親矩形の左辺
の罫線がかすれで切れたとすると、抽出される白画素矩
形の座標はXsw=365,Ysw=850,Xew=
392,Yew=898となり、Ysw=Ysoであるた
め、判定結果は不成立となってしまう。
【0032】このような、かすれによる枠線の切れに対
処するための二次判定の第5の例を図7のフローチャー
トにより説明する。まず、図5又は図6に示した判定処
理が行われ(ステップ700)、その判定結果が調べら
れる(ステップ701)。それが「成立」ならば、最小
的な判定結果は「成立」とされる(ステップ705)。
しかし、ステップ700の判定結果が「不成立」なら
ば、親矩形と白画素矩形の座標Xs,Ys,Xe,Ye
の中で一致するものがあるか調べられ(ステップ70
2)、一致する座標がなければ最終的な判定結果は「不
成立」とされる(ステップ704)。
【0033】一致する座標があるならば、その座標位置
の枠線を構成する罫線の有無の判定が行われる(ステッ
プ703)。例えば、Xsの座標が一致しているなら
ば、かすれにより左辺の枠線がかすれで切れている場合
が考えられるので、左辺の位置について罫線有無判定が
行われる。この判定の方法としては、例えば、対象とす
る辺の位置にある黒画素をカウントし、カウント値が閾
値を越えたときに「罫線有り」、閾値を下回るときに
「罫線無し」、とするような単純な方法で構わない。罫
線があると判定した場合には、二次判定の最終結果は
「成立」とされ(ステップ705)、罫線がない場合に
は二次判定の最終結果は「不成立」とされる(ステップ
704)。
【0034】本例によれば、例えば、もともと1辺又は
2辺に罫線がない「コ」や「し」といった文字の黒画素
矩形を枠と誤認識することなく、かすれにより枠線が切
れた枠の認識率を向上させることができる。
【0035】図8は、二次判定の第6の例を示すフロー
チャートである。本例も、前記第5例と同様に枠線のか
すれによる切れを救済することができる。
【0036】まず、親矩形の罫線の太さが推定される
(ステップ800)。その推定方法は、図6のステップ
600,601に関連して説明したように、親矩形の内
部について水平又は垂直方向の黒ランの長さを調べてヒ
ストグラムを作成し、その最頻値の黒ランの長さを罫線
の太さとする方法でよい。
【0037】親矩形と白画素矩形の座標Xsのずれが計
算され、同ずれが基準値Thに設定される(ステップ8
01)。そして、この基準値Thが、推定した罫線の太
さの2倍以上であるか判定され(ステップ802)、そ
うであるならば判定結果は「不成立」とされる(ステッ
プ807)。
【0038】基準値Thが罫線太さの2倍より小さいと
きには、親矩形と白画素矩形のXe,Ys,Yeのずれ
が計算され、いずれの座標のずれも(Th+5)以上で
あるか否かの判定が行われ(ステップ803)、そうで
あるならば「不成立」とされる(ステップ807)。い
ずれかの座標のずれが(Th+5)未満であるならば、
親矩形と白画素矩形の座標の一致があるか判定される
(ステップ804)。座標の一致がなければ判定結果は
「成立」とされる(ステップ806)。座標の一致があ
る場合には、その一致した座標位置について罫線の有無
が判定される(ステップ805)。この罫線の有無判定
は、図7のステップ703と同様の方法で行えばよい。
そして、罫線があると判定されたときには、かすれによ
り枠線が切れている場合と考えられるため、最終的な判
定結果は「成立」とされる(ステップ806)。しか
し、罫線がないと判定されたときには、最終的な判定結
果は「不成立」とされる(ステップ807)。
【0039】以上説明した本実施の形態の枠認識装置、
あるいは、その処理内容を一般的なコンピュータの資源
を利用して、ソフトウェアにより実現することも可能で
あり、そのような枠認識装置も本発明に包含される。コ
ンピュータ上で、枠認識装置もしくはその処理内容を実
現するためのプログラムは、それが記録された磁気ディ
スク、光ディスク、光磁気ディスク、半導体記憶素子な
どの各種記録媒体よりコンピュータに読み込まれ、ある
いは、ネットワークを介してコンピュータに取り込まれ
て実行されることになる。そのようなプログラムが記録
された各種記録媒体も本発明に包含される。また、本実
施の形態の枠認識装置による枠認識処理の方法も本発明
に包含される。
【0040】図9は、本発明の他の実施の形態を示すブ
ロック図である。図9において、図1と同一部分又は対
応部分には同一の符号が付されている。
【0041】本実施の形態の枠認識装置は、前記実施の
形態の枠認識装置と同様な画像入力部100、画像圧縮
部101、画像記憶部102、黒画素矩形抽出部10
3、一次判定部104、白画素矩形抽出部105、二次
判定部106、作業用記憶部107、出力部108、制
御部109のほかに、仮想連続枠領域生成部120と黒
画素矩形統合部121を含む構成である。本実施の形態
の枠認識装置は、概念的には、黒画素矩形統合部121
により統合された黒画素矩形に関する枠認識処理部12
3を含む。しかし、枠認識モジュール110が枠認識処
理部123として兼用されるため、実際的には枠認識ジ
ュール110と別個に枠認識処理部123が設けられる
わけではない。このように枠認識モジュール110を枠
認識処理部123として利用する構成によれば、枠認識
装置のコスト削減が可能であり、また、枠認識装置をコ
ンピュータを利用してソフトウェアで実現する場合に
は、そのためのプログラムがコンパクトになり、必要メ
モリ容量も削減されるという利点がある。
【0042】ただし、枠認識モジュール110とは別に
枠認識処理部123を設ける構成も可能であり、このよ
うな構成によれば、枠認識処理部123で枠認識モジュ
ール110とは異なる処理アルゴリズムを利用すること
ができるため、処理の自由度は増大する。
【0043】また、本実施の形態の枠認識装置において
も、前記従来技術などにより枠を認識するための処理部
分を追加し、この処理部分により認識された枠も処理結
果として出力させることが可能である。すなわち、本実
施の形態も前記従来技術などとの組み合わせが可能であ
る。
【0044】図10、本実施の形態の枠認識装置の全体
的な動作を示すフローチャートである。以下、図9のブ
ロック図及び図10のフローチャートを参照し、本実施
の形態の枠認識装置の構成と動作について説明する。
【0045】画像入力部100によって文書画像データ
(2値データ)が入力され、画像記憶部102に格納さ
れる(ステップ900)。必要に応じて、入力された文
書画像データに対し画像圧縮部101でOR圧縮(縮
小)処理が施される。
【0046】次に、黒画素矩形抽出部103において、
画像記憶部101内の文書画像データ(入力された文書
画像データ又はそのOR圧縮データ)より、黒画素の連
結成分の外接矩形(黒画素矩形)が抽出される(ステッ
プ901)。この黒画素矩形抽出は、文書画像の全体又
は予め指定された処理領域について行われる。抽出され
た各黒画素矩形の領域情報として、例えば、左上コーナ
ーと右下コーナーの座標が作業用記憶部107に記憶さ
れる。
【0047】黒画素矩形抽出の処理が終わると、枠認識
モジュール110による枠認識処理が実行される(ステ
ップ902)。このステップの処理内容は、図2のフロ
ーチャートにおけるステップ202〜210の処理ルー
プと同様であるので、その説明は繰り返さない。
【0048】本実施の形態の枠認識装置は、ステップ9
03以降で、ステップ902の枠認識処理により認識さ
れた枠に関する情報を利用することにより、罫線のかす
れなどが原因で認識に失敗した枠の認識を再度試みるこ
とに特徴がある。一般に、枠の配置には連続性があるた
め、すでに枠として認識されている黒画素矩形の位置な
どから、枠である可能性の高い黒画素矩形を容易に推定
可能である。
【0049】そこで、枠の連続性に着目し、仮想連続枠
領域生成部120において、既に枠として認識された黒
画素矩形の連続した領域(仮想連続枠領域)を生成する
(ステップ903)。枠は1つだけ単独に存在すること
もあり得るが、口座番号、電話番号、氏名、住所などを
記入するための枠のように、複数個の枠が一列に並んで
配置されていることが多い。また、連続した枠の大きさ
は均等であることが多い。特に、マークシート帳票など
では、行単位に整合をとるため、枠が正確にマトリクス
配置されていることが多い。そして、多くの帳票は横書
きであるため、枠は行方向すなわち水平方向(X方向)
に配列されている場合が圧倒的に多い。そこで、例え
ば、枠として認識された黒画素矩形の中で、垂直方向
(Y方向)に重なりのあるものを水平方向に統合し、統
合領域を文書画像の横幅一杯に(あるいは、指定された
処理対象領域の横幅一杯に)拡張することにより仮想連
続枠領域を生成する。
【0050】図11において、951,952,953
は仮想連続枠領域の例である。これら仮想連続枠領域9
51〜953の内部に示された図形Sは枠として認識さ
れた黒画素矩形(又は枠画像)であり、図形Fは枠線が
かすれにより切れたために認識に失敗した枠画像であ
る。仮想連続枠領域を文書画像(又は指定された処理対
象領域)の横幅一杯に拡張した理由は、仮想連続枠領域
953に見られるように、認識に成功した枠より外側
に、認識に失敗した枠が存在し得るからである。
【0051】なお、縦書き帳票のように、枠が垂直方向
に配列されている場合には、垂直方向に枠を統合するこ
とによって仮想連続枠領域を生成するとよい。また、仮
想連続枠領域生成部120において、認識された枠の連
続方向を自動判定し、判定した方向の仮想連続枠領域を
生成するようにしてもよい。さらに、枠として認識され
た黒画素矩形を大きさによって分類し、同一カテゴリの
黒画素矩形のみを仮想連続枠領域の生成に利用するよう
にしてもよい。
【0052】このような仮想連続枠領域の生成処理が終
了すると、1つの仮想連続枠領域が選択される(ステッ
プ904)。黒画素矩形統合部121において、この仮
想連続枠矩形領域に含まれている、枠候補とされたが枠
としては認識されなかった黒画素矩形で、1つの枠を構
成している可能性の高い黒画素矩形を統合する処理を行
う(ステップ905)。具体的には、図11に図形Fと
して示されている枠画像の黒画素矩形のような、水平方
向(X方向)に重なっている黒画素矩形を1つの黒画素
矩形に統合する。また、図12に示すような水平方向に
重なりのない黒画素矩形であっても、水平方向の距離が
近く、かつ、高さの差が小さい黒画素矩形も統合する。
次に、このようにして統合された各黒画素矩形を対象と
して、枠認識モジュール110で枠認識処理を行う(ス
テップ906)。このような処理によって、前記第1の
実施の形態の枠認識装置では認識できない、かすれによ
り枠線の2辺が分断されたような枠も認識可能となる。
【0053】1つの仮想連続枠領域の処理が終了する
と、ステップ904に戻り、別の仮想連続枠領域が選択
され、同様の処理が繰り返される。全ての仮想連続枠領
域に対する処理が終わると(ステップ907,No)、
認識された枠の領域情報が出力部108により出力され
(ステップ908)、一連の動作を終了する。
【0054】なお、枠認識モジュール110とは別に枠
認識処理部123が設けられる場合には、ステップ90
6は枠認識処理部123によって実行されることにな
る。この場合、例えば特開平11−66225号公報に
述べられているように、統合された黒画素矩形につい
て、罫線の分断を判定し、分断された罫線を接続したう
えで、罫線で四方を囲まれている場合には枠として認識
するような処理方法も利用できる。
【0055】また、本実施の形態の枠認識装置あるいは
その処理内容をコンピュータ上でソフトウェアにより実
現することも可能であり、そのような枠認識装置も本発
明に包含される。また、そのためのプログラムが記録さ
れた各種記録媒体も本発明に包含される。本実施の形態
の枠認識装置による枠認識処理の方法も本発明に包含さ
れる。
【0056】なお、図11及び図12に関連して単純枠
を例に挙げて説明したが、複雑枠であっても1文字が記
入されるような小さな枠を同様に精度よく認識できる。
【0057】
【発明の効果】以上、詳細に説明したように、本発明に
よれば、(1)黒ランの閾値処理により罫線を抽出し、
罫線で囲まれた領域を枠として認識するような手法では
認識が困難な、1文字記入枠やチェックボックスのよう
な文字サイズ程度もしくはそれより小さな単純枠なども
高精度に認識できる。(2)かすれによる枠線の分断に
強い枠認識が可能である。(3)「コ」、「し」といっ
た文字の黒画素矩形の誤認識を回避しつつ、かすれによ
り枠線の一部が途切れた枠も高精度な認識が可能であ
る。(4)統合した黒画素矩形に対する枠認識処理のた
めの、統合前の黒画素矩形に対する枠認識処理のための
手段を利用することにより、装置のコスト削減、装置を
実現するためのプログラムのコンパクト化及び省メモリ
化を実現できる、等々の効果を得られる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態を示すブロック図で
ある。
【図2】第1の実施の形態による枠認識装置の全体的動
作を説明するためのフローチャートである。
【図3】二次判定の第1の例を説明するためのフローチ
ャートである。
【図4】二次判定の第2の例を説明するためのフローチ
ャートである。
【図5】二次判定の第3の例を説明するためのフローチ
ャートである。
【図6】二次判定の第4の例を説明するためのフローチ
ャートである。
【図7】二次判定の第5の例を説明するためのフローチ
ャートである。
【図8】二次判定の第6の例を説明するためのフローチ
ャートである。
【図9】本発明の第2の実施の形態を説明するためのブ
ロック図である。
【図10】第2の実施の形態による枠認識装置の全体的
動作を説明するためのフローチャートである。
【図11】仮想連続枠領域の説明図である。
【図12】水平方向に重なりのない黒画素矩形の統合の
説明のための図である。
【図13】表形式の枠の例を示す図である。
【図14】梯子形式の枠の例を示す図である。
【図15】独立形式の枠の例を示す図である。
【符号の説明】
100 画像入力部 101 画像圧縮部 102 画像記憶部 103 黒画素矩形抽出部 104 一次判定部 105 白画素矩形抽出部 106 二次判定部 107 作業記憶部 108 出力部 109 制御部 110 枠認識モジュール 120 仮想連続枠領域生成部 121 黒画素矩形統合部 123 枠認識処理部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 文書画像データより黒画素の連結成分の
    外接矩形(以下、黒画素矩形と呼ぶ)を抽出する黒画素
    矩形抽出手段と、 前記黒画素矩形抽出手段によって抽出された黒画素矩形
    に関し条件判定を行うことにより黒画素矩形を枠候補と
    非枠候補に弁別する一次判定手段と、 前記一次判定手段によって枠候補とされた黒画素矩形の
    内部において前記文書画像データより白画素の連結成分
    の外接矩形(以下、白画素矩形と呼ぶ)を抽出する白画
    素矩形抽出手段と、 前記白画素矩形抽出手段によって黒画素矩形の内部より
    抽出された白画素矩形に関し条件判定を行うことによ
    り、その黒画素矩形を枠又は非枠に弁別する二次判定手
    段とを有すること特徴とする枠認識装置。
  2. 【請求項2】 前記二次判定手段により枠とされた黒画
    素矩形が連続した仮想連続枠領域を生成する仮想連続枠
    領域生成手段と、 前記仮想連続枠領域に含まれる、前記一次判定手段によ
    り枠候補とされた黒画素矩形であって前記二次判定手段
    により枠とされなかった黒画素矩形を統合する黒画素矩
    形統合手段と、 前記黒画素矩形統合手段により統合された黒画素矩形に
    対する枠認識処理のための手段とをさらに有することを
    特徴とする請求項1記載の枠認識装置。
  3. 【請求項3】 前記二次判定手段により枠とされた黒画
    素矩形が連続した仮想連続枠領域を生成する仮想連続枠
    領域生成手段と、 前記仮想連続枠領域に含まれる、前記一次判定手段によ
    り枠候補とされた黒画素矩形であって前記二次判定手段
    により枠とされなかった黒画素矩形を統合する黒画素矩
    形統合手段とをさらに有し、 前記黒画素矩形統合手段により統合された黒画素領域の
    内部より前記白画素矩形抽出手段によって白画素矩形を
    抽出し、抽出された白画素矩形に関し前記二次判定手段
    により条件判定を行うことにより。その白画素矩形が抽
    出された黒画素矩形を枠又は非枠に弁別することを特徴
    とする請求項1記載の枠認識装置。
  4. 【請求項4】 前記二次判定手段において、黒画素矩形
    と、それより抽出された白画素矩形の重心の位置ずれに
    関する判定を行うことを特徴とする請求項1、2又は3
    記載の枠認識装置。
  5. 【請求項5】 前記二次判定手段において、黒画素矩形
    と、それより抽出された白画素矩形の、四辺の位置ずれ
    の最大値と最小値の差に関する判定を行うことを特徴と
    する請求項1、2又は3記載の枠認識装置。
  6. 【請求項6】 前記二次判定手段において、判定のため
    の閾値として罫線の太さを用いることを特徴とする請求
    項5記載の枠認識装置。
  7. 【請求項7】 前記罫線の太さが、黒画素矩形の内部の
    黒ランの長さのヒストグラムより推定されることを特徴
    とする請求項6記載の枠認識装置。
  8. 【請求項8】 前記二次判定手段において、黒画素矩形
    と、それより抽出された白画素矩形の少なくとも1つの
    辺の位置が一致する場合には、その辺の位置における罫
    線の有無を判定することを特徴とする請求項5、6又は
    7記載の枠認識装置。
  9. 【請求項9】 コンピュータが読み取り可能な記録媒体
    であって、請求項1乃至8のいずれか1項記載の枠認識
    装置をコンピュータで実現するためのプログラムが記録
    されたことを特徴とする記録媒体。
JP2000228083A 2000-07-28 2000-07-28 枠認識装置及び記録媒体 Expired - Fee Related JP3995185B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000228083A JP3995185B2 (ja) 2000-07-28 2000-07-28 枠認識装置及び記録媒体
US09/904,473 US7003159B2 (en) 2000-07-28 2001-07-13 Document frame recognition system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000228083A JP3995185B2 (ja) 2000-07-28 2000-07-28 枠認識装置及び記録媒体

Publications (2)

Publication Number Publication Date
JP2002042143A true JP2002042143A (ja) 2002-02-08
JP3995185B2 JP3995185B2 (ja) 2007-10-24

Family

ID=18721443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000228083A Expired - Fee Related JP3995185B2 (ja) 2000-07-28 2000-07-28 枠認識装置及び記録媒体

Country Status (2)

Country Link
US (1) US7003159B2 (ja)
JP (1) JP3995185B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012190434A (ja) * 2011-02-24 2012-10-04 Ricoh Co Ltd 帳票定義装置、帳票定義方法、プログラム及び記録媒体

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7321687B2 (en) * 2002-03-07 2008-01-22 Canon Kabushiki Kaisha Apparatus and method for image processing to label an object in a binary image
JP4079087B2 (ja) * 2003-03-12 2008-04-23 セイコーエプソン株式会社 レイアウトシステム
US7336396B2 (en) * 2003-03-20 2008-02-26 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
US7428700B2 (en) * 2003-07-28 2008-09-23 Microsoft Corporation Vision-based document segmentation
JP2006074512A (ja) * 2004-09-02 2006-03-16 Casio Comput Co Ltd 撮影装置、撮影装置の画像処理方法及びプログラム
US20070168382A1 (en) * 2006-01-03 2007-07-19 Michael Tillberg Document analysis system for integration of paper records into a searchable electronic database
JP4869841B2 (ja) * 2006-03-14 2012-02-08 株式会社リコー 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP4774390B2 (ja) * 2006-09-13 2011-09-14 株式会社キーエンス 文字切り出し装置、方法およびプログラム
JP4860574B2 (ja) * 2006-09-13 2012-01-25 株式会社キーエンス 文字切り出し装置、方法およびプログラム
US20090208055A1 (en) * 2008-02-20 2009-08-20 Lockheed Martin Corporation Efficient detection of broken line segments in a scanned image
JP4491488B2 (ja) * 2008-03-03 2010-06-30 シャープ株式会社 画像処理装置、画像読取装置、画像データ出力処理装置、および画像処理方法
JP4909311B2 (ja) * 2008-03-31 2012-04-04 富士通フロンテック株式会社 文字認識装置
CN101551859B (zh) * 2008-03-31 2012-01-04 夏普株式会社 图像辨别装置及图像检索装置
JP5171421B2 (ja) * 2008-06-18 2013-03-27 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP5208043B2 (ja) * 2009-04-16 2013-06-12 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
US20160209989A1 (en) * 2013-09-30 2016-07-21 Jin-Feng Luan Record and replay of operations on graphical objects
CN110543624B (zh) * 2018-05-28 2023-06-23 珠海金山办公软件有限公司 一种pdf文档中复选框的识别方法、装置及电子设备
US11151373B2 (en) 2018-07-20 2021-10-19 Ricoh Company, Ltd. Information processing apparatus and information processing method
US11416674B2 (en) 2018-07-20 2022-08-16 Ricoh Company, Ltd. Information processing apparatus, method of processing information and storage medium
US11113559B2 (en) 2018-07-20 2021-09-07 Ricoh Company, Ltd. Information processing apparatus for improving text data recognition, information processing method, and non-transitory recording medium

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2713622B2 (ja) * 1989-11-20 1998-02-16 富士通株式会社 表形式文書読取装置
JP2579397B2 (ja) * 1991-12-18 1997-02-05 インターナショナル・ビジネス・マシーンズ・コーポレイション 文書画像のレイアウトモデルを作成する方法及び装置
JP3253356B2 (ja) * 1992-07-06 2002-02-04 株式会社リコー 文書画像の領域識別方法
JP3302147B2 (ja) * 1993-05-12 2002-07-15 株式会社リコー 文書画像処理方法
JPH0721310A (ja) * 1993-06-30 1995-01-24 Matsushita Electric Ind Co Ltd 文書認識装置
US5706096A (en) * 1994-04-25 1998-01-06 Ricoh Company, Ltd. Optimum line density determining method and system
US5898795A (en) * 1995-12-08 1999-04-27 Ricoh Company, Ltd. Character recognition method using a method for deleting ruled lines
JP3830998B2 (ja) * 1995-12-28 2006-10-11 株式会社東芝 罫線除去方法及びこれを用いた文字認識装置
JP3615333B2 (ja) * 1996-12-05 2005-02-02 株式会社リコー 罫線消去装置
US6226402B1 (en) * 1996-12-20 2001-05-01 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6327387B1 (en) * 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
JP3606500B2 (ja) * 1997-01-31 2005-01-05 株式会社リコー 矩形分類方法
JP3846752B2 (ja) 1997-03-06 2006-11-15 株式会社リコー 罫線消去方法
JPH1166225A (ja) 1997-08-25 1999-03-09 Ricoh Co Ltd 表情報抽出装置及び方法並びに記録媒体
US6636631B2 (en) * 1998-06-04 2003-10-21 Matsushita Electric Industrial Co., Ltd. Optical character reading method and system for a document with ruled lines and its application
JP2001060247A (ja) * 1999-06-14 2001-03-06 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
JP4040231B2 (ja) 2000-02-18 2008-01-30 株式会社リコー 文字抽出方法及び装置並びに記憶媒体
JP2001236464A (ja) 2000-02-25 2001-08-31 Ricoh Co Ltd 文字抽出方法、文字抽出装置及び記憶媒体
JP4159720B2 (ja) * 2000-03-15 2008-10-01 株式会社リコー 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012190434A (ja) * 2011-02-24 2012-10-04 Ricoh Co Ltd 帳票定義装置、帳票定義方法、プログラム及び記録媒体

Also Published As

Publication number Publication date
US20020025072A1 (en) 2002-02-28
JP3995185B2 (ja) 2007-10-24
US7003159B2 (en) 2006-02-21

Similar Documents

Publication Publication Date Title
JP3995185B2 (ja) 枠認識装置及び記録媒体
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
EP1265188B1 (en) Pattern extraction apparatus and method
US8041113B2 (en) Image processing device, image processing method, and computer program product
US7254270B2 (en) System and method for bounding and classifying regions within a graphical image
JPH05233873A (ja) 領域分割方法
WO2000062243A1 (fr) Procede et dispositif d'extraction de chaines de caracteres utilisant un composant de base d'une image de document
US6289120B1 (en) Method and system for processing images of forms which have irregular construction and/or determining whether characters are interior to a form
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3285686B2 (ja) 領域分割方法
CN112836632B (zh) 自定义模板文字识别的实现方法及系统
JP3607753B2 (ja) 文書画像の領域分割方法および装置、並びに段組種類判別方法および装置
JPH11191135A (ja) 文書画像の日本語英語判定方法、文書認識方法および記録媒体
JP2000090194A (ja) 画像処理方法および画像処理装置
JP3406942B2 (ja) 画像処理装置及び方法
US11948342B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium for determining extraction target pixel
WO2023042270A1 (ja) 文字認識プログラム、文字認識システム、及び文字認識方法
JPH0728934A (ja) 文書画像処理装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH11242716A (ja) 画像処理方法および記録媒体
JP3220226B2 (ja) 文字列方向判別方法
JPH1166225A (ja) 表情報抽出装置及び方法並びに記録媒体
JPH06259597A (ja) ドキュメントイメージ処理方法並びに文字認識システムおよびドキュメントイメージ処理装置
JPH0573718A (ja) 領域属性識別方式
JP2002015323A (ja) 文書画像レイアウト識別方法および装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070727

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100810

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110810

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110810

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120810

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120810

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130810

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees