JPH01295383A - 領域抽出方法 - Google Patents

領域抽出方法

Info

Publication number
JPH01295383A
JPH01295383A JP63167056A JP16705688A JPH01295383A JP H01295383 A JPH01295383 A JP H01295383A JP 63167056 A JP63167056 A JP 63167056A JP 16705688 A JP16705688 A JP 16705688A JP H01295383 A JPH01295383 A JP H01295383A
Authority
JP
Japan
Prior art keywords
character
area
height
integration
pieces
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63167056A
Other languages
English (en)
Inventor
Masahiro Nakamura
昌弘 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63167056A priority Critical patent/JPH01295383A/ja
Publication of JPH01295383A publication Critical patent/JPH01295383A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、領域抽出方法に係り、詳しくは光学的文字認
識装置(OCR)において、名刺や雑誌のような大きい
文字と小さい文字が混在した原稿の文字切出しに最適な
文字または文字列の領域抽出方法に関する。
〔従来の技術〕
従来、OCRにおいては、読取った原稿画像について、
その文字行と平行な方向に射影をとり、この射影の黒範
囲を行として切出し、この切出した各行毎に、その文字
行に垂直な方向に射影をとって黒画素領域を抽出し、連
続する黒画素領域を1文字として抽出していた。
〔発明が解決しようとする課題〕
上記従来技術のように、原稿画像の文字行方向に射影を
とり、この射影の連続した範囲を文字行として切出す方
法においては、例えば第10図(a)に示す名刺におけ
る小さな文字の列「所長」および「工学博士」は、その
射影が大きな文字の列「理光太部」の射影と重なってし
まうため行切出しが成功せず、したがって正しく文字を
切出し認識することができなかった。
また、大きい文字と小さい文字では文字の切出しピッチ
が異なるが、従来は大きい文字と小さい文字が並んだ行
においては、いずれか一方のピッチで切出しを行うため
文字切出しに失敗することがあった。
これを防ぐには、射影をとる領域を操作者が直接的に指
定したり、あるいは入力原稿の様式を予め装置に設定し
ておくことによって射影をとる領域を特定しておき、そ
れぞれの領域を別々の領域として処理させる必要があり
、これは文字認識装置の使用上の大きな制約となってい
た。
本発明の目的は、入力原稿の様式を設定したり、操作者
が領域設定を行うことなく、大きさの異なる文字が混在
する原稿について、その大きさに応じた領域を抽出する
方法を提供することにある。
〔課題を解決するための手段〕
上記目的を達成するため、本発明の領域抽出方法におい
ては、原稿画像について文字行と平行な第1方向に射影
をとり、この射影の黒範囲を行として切出した後、切出
した各行毎に、文字行に垂直な第2方向に射影をとって
黒画素領域を抽出し、この抽出した黒画素領域について
第1および第2方向の射影を再度とって黒画素領域を文
字片として抽出し、その高さ1幅、他の文字片との重な
りに関係した特定の統合条件を満たす複数の文字片を一
つの領域に統合することにより1文字の大きさに応じた
文字または文字列の領域を抽出することを特徴とするも
のである。
また、本発明の第2の特徴は、上記統合条件の閾値を、
切出した文字行の高さにより可変とするものである。
本発明の第3の特徴は、注目する文字片の高さをその前
後の文字片と比較し、注目する文字片の高さよりもその
前後の文字片の高さが高いときは、該前後の文字片を使
って統合条件を判定することである。
本発明の第4の特徴は、統合時に統合される文字片に統
合フラグを付加し、該統合終了後に統合フラグの付加さ
れていない文字片に注目しその文字片とその前後の文字
片に対し統合条件を判定するものである。
〔作 用〕
まず原稿画像について文字行と平行な第1方向に射影を
とり、この射影の黒範囲を行として切出す0次に、この
ようにして切出した各行毎に、文字行に垂直な第2方向
に射影をとって黒画素領域を抽出し、この抽出した黒画
素領域について第1および第2方向の射影をとって再度
黒画素領域を抽出する。こNで抽出した黒画素領域を文
字片とし、その高さ1幅、他の文字片との重なりに関係
した特定の統合条件を満たす複数の文字片を一つの領域
に統合することにより1文字の大きさに応じた文字また
は文字列の領域を抽出する。統合条件としては具体的に
は、文字片の高さ、最大幅。
高さと最大幅の比、幅と最大幅の比、最大高さと重なり
合う文字片の高さの比1重なり合う文字片の高さと幅の
比などが用いられる。
このような領域抽出を行えば、各領域から従来と同様な
方法によって容易に個々の文字を切り出し、認識するこ
とが可能となる。
また、日本語のように類似文字の多い言語を対象とした
文字認識においては、1文字単位の認識処理では候補文
字を正確に絞り込むことが容易でないため、候補文字列
と、意味のある文字列の知識辞書との比較照合によって
、最終的に文字を同定する方式の研究が進められている
。この場合、原稿上の文字の意味上の属性を識別するた
めの情報を得られると、知識辞書との比較照合を効率的
に行うことができる。
例えば、第10図(a)の名刺画像の場合、「〒 22
3横浜市港北区新羽町4686Jの文字列の属性は住所
であり、またrTa 045 (593)3411Jの
文字列の属性は電話番号である。本発明は、このような
同一属性の文字列を一つの領域として抽出することがで
き、また、領域の高さから文字の大きさ(領域の高さ)
を知ることもでき、さらに、原稿上の相対位置から属性
も推定可能である。したがって、意味別知識辞書との比
較照合の効率化を期待できる。
〔実施例〕
以下5図面を用いて本発明の実施例について説明する。
第1図は本発明により領域抽出処理を実行する装置構成
の一例を示すブロック図である。1はデータ処理および
制御を実行するCPU、2はCPU1を動作させるため
のプログラムやデータを格納する主メモリ、3は行切り
出し/圧縮回路、4はイメージメモリ、5はバスである
第2図は本発明による領域抽出処理の一実施例の全体的
流れを示すフローチャートである。本実施例においては
文字片抽出処理(処理I)、統合処理1(処理■)、ソ
ート処理(処理■)、統合処理2(処理■)によって領
域抽出が行われる。
各処理の内容について以下説明する。
処理■ この処理の内容は第3図に示す通りである。ステップ1
01は行切り出し/圧縮回路3の処理ステップである。
この処理ステップにおいては、外部のスキャナにより読
取られた原稿の画像データ(白黒2値の画像データ)は
適当な圧縮率で圧縮され、イメージメモリ4に蓄積され
る。
第10図の名刺では住所、電話番号など、文字列毎に属
性が決まっているが、上記圧縮の圧縮率は、同じ属性の
文字はつながるが、異なる属性の文字列はつながらない
程度に、スキャナの解像度にあわせて選ばれる。
このような圧縮を行いながら、主走査方向(X方向、文
字行方向)に射影がとられ、この射影により従来と同様
に行が切出される。こ\で切出された行の領域をBLI
とし、その位置データは主メモリ2に記憶される。
ステップ102からステップ109まではCPU1によ
る処理である。まずステップ102では、各領域BLI
毎にイメージメモリ4上の画像データの副走査方向(Y
方向)に射影がとられ、この射影データは主メモリ2上
の射影バッファに記憶される。
このような射影抽出が終了すると、ステップ103で主
メモリ2上のカウンタKがリセットされたのちステップ
104の処理が実行される。ステップ104では、射影
バッファ内の射影データがチエツクされ、射影の黒領域
のX方向の開始点、終了点の位置がそれぞれPWsep
Weとして主メモリ2に記憶される。
射影データをY方向に並ぶ画素情報の論理和データとし
た場合、110” (白)から1′111(黒)への変
化点を開始点、その逆の変化点を終了点とする。射影デ
ータをY方向に並んだ黒画素数とした場合は、射影値が
特定の閾値を越えて立上がる点を開始点として、特定の
閾値以下に立下がる点を終了点とする。
一つの黒領域の開始点、終了点の記憶がなされるたびに
カウンタには+1され2次の黒領域の開始点、終了点の
検出が行われる。この様にして、領域BLIは垂直方向
の射影によりX方向に複数の領域に分割される。このよ
うな処理はステップ105で終了が判定されるまで繰返
し実行される。
終了したと判定されると、ステップ10Gで主メモリ2
上のカウンタiがリセットされたのち、ステップ107
の処理が実行される。
このステップ107では、ステップ104の処理により
領域BLIから抽出された各領域毎に、イメージメモリ
4内の画像データのX方向の射影がとられ、この射影の
黒領域のY方向の開始点、終了点位置がそれぞれhs、
heとして記憶される。
さらに、hsからheの間において、pwsからpwe
の範囲内のY方向の射影がとられ、その射影のX方向の
開始点、終了点の位置がそれぞれws、weとして記憶
される。
このようにして、X方向の開始点、終了点がWs、we
でY方向の開始点、終了点がhs、heの矩形の領域が
BL2として抽出され、抽出順にBL2 (j、hs、
he、ws、we)のデータ形式で主メモリ2上の領域
テーブルに記憶される(jは抽出番号)。
一つあるいは複数の領域BL2が抽出されると。
ステップ109でカウンタiが+1され、次の領域の抽
出が行われる。ステップ108でi=にと判定されると
、処理は終了する。
以上の処理Iによって、連続した黒画素の領域BL2が
文字片として抽出される。第10図(、)の名刺原稿の
場合、同図(b)に矩形として示すように領域BL2が
抽出される。
処理■ この処理は、領域BLI毎に、その中の領域BL2の統
合条件を満たすものを一つの領域に統合するものである
。例えば第10図(a)の「太」が「二」であったとす
ると、処理Iの段階では「二」は上下に二つに分解され
て抽出されるが、処理■によって、このような領域が一
つの領域に統合される。第4図に処理Hのフローチャー
トを示す。
まずステップ201で、処理対象のBLIに属するBL
2 (i)について高さと幅の最大値を求める(iは抽
出番号)。
ステップ202では、処理対象の領域BLI内の文字片
すなわち領域BL2について、先頭からY方向の重なり
を調べ、重なりがある場合は次の文字構成条件を調べる
1)BL2 (Q ; n−1)の高さが最大文字高さ
より小さい。
2)BL2 CQ ; n−1)の高さと幅の比がある
閾値以下である。
3)BL2 (n ; n−1)の幅がある閾値以下で
ある。
こ\で、nは重なった先頭の文字片すなわちBL2 (
Q)からみて、重なりがなくなる文字片の抽出番号であ
る。BL2 (1; j)はi番目の文字片からj番目
の文字片までゾ構成される文字片群を一つの領域と見做
すことを意味する。
なお、前記2)において、高さと幅の比の閾値(THr
)はステップ201で調べた高さの最大値により変化さ
せてもよい。即ち、窩さの最大値Hwaxがある閾値(
THH)より大きいときはTHr=THrAと、 Hm
ax≦THHのときはTHr=THr8とする。この処
理により1文字構成条件の判定がより正確になる。
ステップ203で、文字片の重なりがないか、または上
記文字構成条件を満たすときはステップ204に分岐し
、そうでないときはステップ205に分岐する。
ステップ204では、主メモリ上の統合フラグを0にし
、注目する文字片(群)の位置情報(hs = w e
 )を主メモリに記憶する。ステップ205では、統合
フラグを1にし、Q (重なった先頭の文字片の抽出番
号)とn (Qからみて重なりがなくなる文字片の抽出
番号)を主メモリに記憶する。
ステップ206で文字片のポインタを重なった文字片の
数だけ進め、対象領域BLI内に処理すべき文字片が残
っているかをステップ207で調べ、残っていないなら
ばステップ225へ分岐する。
文字片が残っている場合、続く文字片についての処理を
行う。
まずステップ208で、文字片のY方向の重なりについ
て調べ、重なりがあれば上記文字構成条件を調べ、また
統合フラグを調べる。
ステップ209で、統合フラグが2でなければステップ
214に分岐する。
統合フラグが2のときは、ステップ210において、統
合フラグを2にセットした時の文字片の重なりの先頭か
ら重なりがなくなるまでの文字片群を一つの領域として
、その位置情報を主メモリ上に記憶する。
次に、ステップ208で調べた文字片の1重なりがない
とき、あるいは重なった文字片が上記文字構成条件を満
たしときはステップ211からステップ212に分岐し
、そうでないときはステップ213に分岐する。
ステップ212では、統合フラグをOにし、注口する文
字片(群)の位置情報(hs−we)を記憶する。ステ
ップ213では、統合フラグを2にし5重なりの先頭番
号と重なりがなくなる文字片の番号を記憶する。その後
、ステップ206に戻り処理を続行する。
統合フラグが2でなくステップ209よりステップ21
4に分岐した場合の処理は次の通りである。まず、ステ
ップ208で調べた文字片の重なりがないとき、あるい
は重なった文字片が上記文字構成条件を満たした場合は
ステップ215に進むが、そうでないときはステップ2
24に分岐する。
ステップ215では当該注目文字片(群)とそれ以前の
確定していない領域の高さを比べ、高さのスタート位置
(最小のhs)、高さ(hsとheの差)、高さのエン
ド位置(最大のhe)の差とある閾値との比較を行い、
そのすべての差が閾値以下ならばステップ216からス
テップ217に分岐し、注目文字片(群)をそれ以前の
領域に統合する。
なお、差の閾値(THD)はステップ201で調べた高
さの最大値により変化させてもよい。すなわち、Hma
x>THHの時ばT Ho = T HD Aをとり、
 Hmax≦TH,の時はT Hn = T HD B
をとるようにする。THDは固定値でも文字高さに比例
した可変値でもよい。この閾値(THI))を変化させ
ることにより、領域統合がより正確になる。
他方、高さのスタート位置、高さ、高さのエンド位置の
差のいずれかがある閾値を越えているときは、ステップ
218において、注目する文字片(群)とそれ以前の確
定していない領域とのX方向の重なりを調べ、重なりが
あるときはステップ219からステップ221に進むが
、重なりがないときはステップ220に進み、統合フラ
グをOにし、それ以前の領域までN−つの領域として確
定させ、注目する文字片(群)の位置情報(hs〜we
)を記憶する。
ステップ221では1次の条件を調べる。
1)注目する文字片(群)と、それ以前の確定していな
い領域内の文字片(群)の幅の最大値の差がある閾値以
下で、かつ文字片(群)の高さがそれ以前の確定してい
ない領域の高さより高いときに注目文字片(群)の高さ
とそれ以前の確定していない領域内の文字片(群)の幅
の最大値の比がある閾値以下である。
2)注目する文字片(群)とそれ以前の確定していない
領域内の文字片(群)の幅の最大値の差がある閾値以下
で、かつ文字片(群)の高さがそれ以前の確定していな
い領域の高さの最大値より高くないときに、それ以前の
確定していない領域の高さの最大値と注目文字片(群)
の幅の比がある閾値以下である。
二へでも高さと幅の比の閾値(T Hrs )はステッ
プ201で調べた高さの最大値(Hmax)により変化
させてもよい、すなわちHwax > T HHの時、
T Hr2= T Hr2A、 Hmax≦THHの時
、THr2=THr2mとする。
上記条件を満たすときはステップ223において、統合
フラグを1にし、注目する文字片(群)をそれ以前の領
域に統合する。
上記条件を満足しないときは、ステップ220において
、統合フラグをOにし、それ以前の領域までN−つの領
域として確定させ(その統合は終了)、注目する文字片
(群)の位置情報(hs〜we)を記憶する。
ステップ224においては、それ以前の領域まで\一つ
の領域として確定させ、統合フラグを2にし、重なりの
先頭番号と重なりがなくなる文字片の番号を記憶する。
ステップ207からステップ225に分岐した場合の処
理は次の通りである。統合フラグが2の場合、ステップ
226において、統合フラグを2にセットした時の文字
片群をそれぞれ一つの領域として確定し、それぞれの位
置情報を記憶する。
統合フラグが2でない場合、ステップ227において、
そこまでの領域を一つの領域として確定し、その位置情
報を記憶する。これで一つの領域BL1についての統合
処理を終了する。
以上の処理を各BLIについて実行することにより、文
字片の統合を行う。
こ\までの処理により、第10図(b)に矩形で示した
領域BL2は、第10図(C)に矩形TBLで示すよう
に統合される。すなわち、文字の高さに応じて領域が統
合されたわけである。
第10図(c)に示す矩形領域TBLは、いずれも同一
の大きさの文字の並びがそれぞれ一つの領域として抽出
されたものであり、領域の高さから文字の大きさも明ら
かである。したがって、各抽出領域毎に、従来と同様な
方法により個々の文字を確実に切出して認識することが
可能である。
五曳且 第10図に示したような名刺などの場合、処理■までN
目的は達成できる。しかし、第11図(、)に示すよう
な原稿画像の場合、領域抽出結果は第11図(b)のよ
うになる、すなわち、ロゴのような大きな図形または文
字の領域A、「〒140」の領域B、「電話番号」の領
域C1r東京都・・・−6」の領域D、「リコー・・・
階」の領域E、「03−・・・67」の領域Fがこの順
番(0で囲んで示す順番)で抽出される。
このように同一文字行に属する領域BとD、領域CとF
がそれぞれ分離して抽出されてしまう。
しかし、領域BとDの文字列の文字の大きさが同一で属
性(住所)も同一であるから、同一行として統合すべき
である。領域CとFの文字列も同様に統合すべきである
。この統合のためには、統合すべき領域の抽出番号を連
続させるように領域の並べかえが必要である。
処理■は、このような領域の並べかえを行う処理である
。処理■によって、領域AからFを第11図(c)に示
す順番に並換え1次の処理■によってさらに統合を行う
ことにより、第11図の領域Bとり、CとFをそれぞれ
一つの領域として抽出することができる。
処理■では、下記の条件を満たすときに領域TBL(処
理■の処理結果としての統合領域)の並換えを行う。
TBL (i)hs>TBL (i+1)haかつ TBL (i)ws<TBL (i+1)wsこNでT
BL(i)hsはi番目の領域の高さのスタート位置、
TBL (i+1)haは(i+1)番目の領域の高さ
のエンド位置、TBL (i)WSはi番目の領域の幅
のスタート位置、TBL(i+1)wsは(i+1)番
目の領域の幅のスタート位置である。
笈星y 処理■における高さの条件による統合処理(第4図のス
テップ215から223まで)と同様である。
以上の一連の処理により、文字の大きさ(高さ)が同一
の文字列の領域が抽出され、その高さから文字の大きさ
が明らかとなるため、従来と同様な文字切出しを各領域
に対して行うことにより文字を確実に切出すことができ
る。また、各領域の原稿内の位置も明らかであるため1
例えば名刺のように特定の位置に特定の属性の文字列が
印刷された原稿の場合、領域の位置から文字列の属性を
推定可能となるため、属性を考慮した文字認識も容易で
ある。
なお、複雑な書式の原稿の場合、処理■と処理■を複数
回繰返すことにより、領域抽出の精度をさらに向上でき
る。
第5図は本発明の他の実施例の領域抽出処理の全体的流
れを示すフローチャートである。こへで。
処理■〜■は第2図と同様であり、処理■(統合処理3
)が新しく追加された部分である。
処理I〜■の一連の処理によって、第10図(a)に示
す名刺は、第10図(c)に示すように、同一の大きさ
の文字の並びがそれぞれ一つの領域として抽出され、ま
た、第11図(a)に示すようにロゴのような大きな図
形領域が含まれている場合でも、領域の並べかえにより
、第11図(c)に示すように同一文字行に属する領域
はそれぞれ一つの領域として抽出される。しかしながら
、例えば第12図(a)のような文字列においては、′
3”と“3”の間の“−”のように高さの非常に低い文
字が存在すると、第12図(b)のように、こ−で切れ
てしまい、一つの領域として抽出されない場合がある。
第12図(b)は、第12図(a)の同一文字列が3つ
の領域に分かれて抽出されることを示している。この場
合、第5図の処理■を行うと、第12図(b)は第12
図(Q)のように統合される。
第6図は処理■の詳細フローチャーI−を示したもので
ある。第6図では1文字片はi=Oからとしている。ま
た、Hは文字片の高さを表わす。
まず、注目する文字片とその次の文字片の高さを比べる
(ステップ305)、次の文字片の高さ(H(i ))
が注目する文字片H(ireg)より高ければ、その高
い文字片を統合対象文字片とする(ステップ306)、
もし注目する文字片の方が高ければ、その次の文字片と
高さを比較し、同様に処理する(ステップ303〜30
5)、注目文字片がそれより後方のすべての文字片より
高ければ、この注目文字片での統合は不成立とし注目文
字片を一つの後方の文字に移しくステップ307)。
これをその列の文字片全てについて処理を繰返す(ステ
ップ308〜310)。注目文字片より前方については
注目文字片より高い文字片を発見しにいき、見つかれば
、その文字片を統合対象文字片としくステップ311)
、見つからなければこの注目文字片での前後の統合は不
成立として、次の文字片に処理を移す(ステップ313
,302)。
このようにして得た統合対象文字片を使い統合処理を行
う(ステップ313)。これにより、第12図(a)は
同図(Q)のように正しく統合される。
−第7図は本発明の他の実施例の領域抽出処理の全体的
流れを示すフローチャートである。こへで、処理!〜■
は第2図及び第6図と同様であり、処理V’  (統合
処理3)が新しく追加された部分である。
処理I〜■の一連の処理によって、第10図(、)に示
す名刺は、第10図(c)に示すように、同一の大きさ
の文字の並びがそれぞれ一つの領域として抽出される。
しかしながら、例えば第13図(a)のような文字列に
おいては、「=」のように幅が広く高さの低い文字が存
在すると、第13図(b)のように、こへで切れてしま
い、領域抽出に失敗することがある。第13図(b)は
、第13図(a)の同一文字列が2つの領域に分かれて
抽出されることを示している。この場合、第7図の処理
V″を行うと、第13図(b)は第13図(c)のよう
に統合される。
第8図は処理v′の詳細フローチャートを示したもので
ある。第8図では1文字片はi=oからとしている。
ステップ401〜403と進み、データエンドでない場
合(ステップ404)、まず注目する文字片に統合フラ
グが付加されているか調べる(ステップ405)、付加
されていれば、次の文字片へ移り(ステップ409)、
付加されていなければ、注目する文字片とその次の文字
片にX方向に重なりがあり(ステップ406)、かつ、
注目する文字片の幅とその次の文字片の高さの比がある
スレッシュ以下であるとき(ステップ407)、統合処
理を行い、統合フラグを付加する(ステップ408)、
これを同−BLIに対して行う。次に同−BLIの最後
の文字片から前方に向って同様の処理を行う(ステップ
410〜417)。これにより、第13図(a)の文字
列は第13図(Q)のように正しく統合される。
次に、第2図、第5図及び第7図における処理■(統合
処理1)の別の詳細フローチャートを第9図に示す、こ
れは基本的には第4図と同様であるが、アルゴリズムを
かえて処理フローを書替えたものである。なお、第9図
には同−BLI内のBL2 (i)について高さと幅の
最大値を求めてからの処理が示されている。
ステップ901では、処理対象の領域BLI内において
連続して抽出された領域BL2 [(i)。
(i+1)]について゛、Y方向に重なっているか調べ
る。重なっている場合はステップ918の処理に分岐す
る。
まずY方向に重なっていない場合について説明する。ス
テップ902で、次に連続するBL2[(i+1)、(
i+2〜n)コについてY方向に重なっているか調べら
れる。重なっている場合。
さらにステップ903で、重なったBL2 (i+1〜
k)の高さが最大高さより高いか、または当該型なった
領域の高さと幅の比が1に近くないかの条件判定が行わ
れる。この条件が成立した場合、ステップ904で、B
L2 (i)とBL2 (i+1)は別領域として領域
テーブルにマークされる(統合されない)。
ステップ903の判定条件が不成立の場合、すなわち重
なった領域の高さが最大高さより高くなく、かつ重なっ
た領域の高さと幅の比が1に近い場合、ステップ906
でBL2 (i)と重なった領域のスター1−位置、エ
ンド位置および高さが比較され、それぞれの差がそれぞ
れの閾値以下であるか否か調べられる。全ての条件につ
いて閾値以下の場合、ステップ907でBL2 (i)
とBL2 (i+1〜k)は同じ領域として領域テーブ
ルにマークされる(統合される)。
ステップ906でいずれかの条件が満たされなかった場
合、ステップ908で、BL2 (i)の高さが重なっ
た領域の高さより高いときには、BL2 (i)の高さ
と重なった領域の幅の比がとられ、BL2 (i)が重
なった領域の高さより高くないときには、BL2 (i
)の幅あるいはBL2(1〜1−1)の中の最大の幅と
、重なった領域の高さの比がとられる。そして、ステッ
プ909で当該比が1に近いか否かが調べられ、1に近
い場合にはステップ910でBL2 (i)とBL2(
i+1)は同じ領域としてマークされ、1に近くない場
合にはステップ911でBL2 (i)とBL2 (i
+l〜k)は別の領域としてマークされる。この比によ
る判定は、普通の文字の高さと幅の比がはゾ1であると
いう性質に基づいている。
ステップ902で重なっていないと判定された場合、ス
テップ912で、BL2 (i)とBL2(i+1)の
スタート位置、エンド位置および高さが比較され、それ
ぞれの差がそれぞれの閾値以下であるかが調べられる。
すべての条件が閾値以下のときは、ステップ913でB
L2 (i)とBL2(i+1)は同じ領域としてマー
クされる。
いずれかの条件が満たされない場合、ステップ914で
、BL2 (i)の高さがBL2 (i+1)の高さよ
り高いならば、BL2 (i)の高さとBL2 (i+
1)の幅の比がとられ、BL2 (i)がBL2 (i
+1)の高さより高くないならば、BL2 (i)の幅
またはBL2 (1〜1−1)の最大幅と、BL2 (
i+1)の高さの比がとられる。そして、ステップ91
5で当該比が1に近いか調べられ、1に近い場合はステ
ップ916でBL2 (i)とBL2 (i+1)は同
一領域としてマークされ、比が1に近くない場合はステ
ップ917でBL2 (i)とBL2 (i+1)は別
領域としてマークされる。
次に、ステップ901でY方向に重なっていると判定さ
れた場合の処理について説明する。
ステップ918で、重なった領域の高さが最大高さより
高いか調べられ、高い場合にはステップ919でBL2
 (i)とBL2 (i+1)は別領域としてマークさ
れ、高くない場合にはステップ920に進む。
ステップ920では、次に連続するBL2[(i)、(
1〜1−1)]についてY方向の重なりが調べられ、重
なった領域の高さが最大高さより高い、または重なった
領域の高さと幅の比が1に近くないかの条件判定が行わ
れる。この条件が成立した場合、ステップ921で、重
なった領域BL2(i”i+k)の高さが最大高さより
高くないBL2 (i+k)までと、BL2 (i+に
+1)とが別の領域としてマークされる。□ステップ9
20の条件が成立しない場合、すなわち、重なった領域
が最大高さより高くなく、かつ重なった領域の高さと幅
の比が1に近い場合、ステップ922に進む。このステ
ップでは、これに連続するBL2 [(i+に+1)、
(i+に+1〜n)]についてY方向に重なっているか
が調べられる。重なっている場合、ステップ923で。
重なった領域の高さが最大高さより高いか、または重な
った領域の高さと幅の比が1に近くないかの条件判定が
行われる。この条件が成立した場合、ステップ924で
BL2 (i+k)までとBL2(i + k 1 )
とは別の領域としてマークされる。
ステップ923で条件が成立しなかった場合、すなわち
重なった領域の高さが最大高さより高くなく、かつ重な
った領域の高さと幅の比が1に近い場合、ステップ92
5に進む。このステップでは、一つ目の重なった領域と
二つ目の重なった領域のスタート位置、エンド位置およ
び高さがそれぞれ比較され、それぞれの差がそれぞれの
閾値以下であるか判定される。すべての条件が満たされ
た場合、すなわち、すべての差が閾値以下の場合、ステ
ップ926でBL2 (i+k)とBL2 (i+に+
1)は同じ領域としてマークされる(統合される)。
ステップ925でいずれかの条件が満たされなかった場
合、ステップ927の処理が行われる。
このステップでは、一つ目の重なった領域の高さが二つ
目の重なった領域の高さより高いときは、一つ目の重な
った領域と二つ目の重なった領域の幅の比がとられ、一
つ目の重なった領域が二つ目の重なった領域の高さより
高くないときは、一つ目の重なった領域のBL2 (i
)の幅またはBL2(1〜1−1)の最大幅と、二つ目
の重なった領域の高さの比がとられる。そしてステップ
928で当該比が1に近いか調べられ、1に近いときは
ステップ929でBL2 (i+k)とBL2(i+に
+1)は同じ領域としてマークされ(統合され)、当該
比が1に近くないときはステップ930で、BL2 (
i十k)とBL2 (i+に+1)は別の領域としてマ
ークされる。
ステップ922で重なっていないと判定された場合、ス
テップ931に進む。このステップでは、一つ目の重な
った領域とBL2 (i+に+1)のスタート位置、エ
ンド位置、高さがそれぞれ比較され、それぞれの差がそ
れぞれの閾値以下であるかの条件判定が行われる。すべ
ての条件が成立する場合、すなわち、すべての差が閾値
以下の場合、ステップ932でBL2 (i+k)とB
L2 (i+に+1)は同じ領域としてマークされる(
統合される)。
ステップ931のいずれかの条件が満たされなかった場
合、すなわち、スタート位置、エンド位置、高さのいず
れかの差が閾値を越えた場合、ステップ933に進む、
このステップでは、−・つ目の重なった領域がBL2 
(i+に+1)の高さより高いときは、一つ目の重なっ
た領域の高さとBL2(i+に+1)の幅の比がとられ
、一つ目の重なった領域がBL2 (i+に+1)の高
さより高くないときは、一つ目の重なった領域のBL2
(i)の幅またはB (1〜1−1)の最大幅と。
BL2 (i十に+1)の高さの比がとられる。そして
、ステップ934で当該比が1に近いか否かが調べられ
、1に近いときにはステップ935でBL2 (i+k
)とBL2 (i+に+1)は同じ領域としてマークさ
れ、1に近くないときにはステップ93GでBL2 (
i+k)とBL2 (i+に+1)は別の領域としてマ
ークされる。
なお、ステップ904,907,910,911.91
3,916,917,919,921゜924.926
,929,930,932,935.936の後にステ
ップ901より処理が再開される。
以上の処理が領域BLI内の全領域BL2について処理
するまで繰り返される。この処理により。
第4図の場合と同様に、第10図(b)に矩形で示した
領域は、第10図(c)に矩形で示すように統合される
以上の各実施例では、処理量およびメモリ量の削減のた
めに、原稿画像の圧縮画像データについて処理を行うと
したが、スキャナ解像度によっては圧縮しない原稿画像
データについて直接に処理を行うようにしてもよいもの
である。
〔発明の効果〕
以上の説明から明らかなように、本発明によれば次のよ
うな効果が得られる。
(1)大きさの異なる文字が混在した名刺などの原稿画
像から文字の大きさに応じた文字列または文字の領域を
抽出することができるため、切出しのための領域指定な
どを行うことなく、文字の切出し、認識を容易かつ確実
に行うことができるようになり、文字認識装置の認識対
象原稿の範囲を拡大できる。
(2)統合条件の閾値を切出した文字行の高さにより可
変とすることにより1文字構成条件の判定や領域統合が
より正確になる。
(3)注目する文字片の高さをその前後の文字片と比較
し、注目する文字片の高さよりもその前後の文字片の高
さが高いときは、該前後の文字片を使って統合条件を判
定することにより、同一文字列中に高さの非常に低い文
字が存在しても領域抽出に失敗することはない。
(4)統合時に統合される文字片に統合フラグを付加し
、該統合終了後に統合フラグの付加されていない文字片
に注目しその文字片とその前後の文字片に対し統合条件
を判定することにより、同一文字列中に幅が広く高さの
低い文字が存在しても領域抽出に失敗することがない。
【図面の簡単な説明】
第1図は本発明により領域抽出処理を実行するための装
置構成の一例を示すブロック図、第2図は本発明の一実
施例の領域抽出処理の全体的流れを示すフローチャート
、第3図は第2図の文字片抽出処理の詳細フローチャー
ト、第4図は第2図の統合処理処理1の詳細フローチャ
ート、第5図は本発明の他の実施例の領域抽出処理の全
体的流れを示すフローチャート、第6図は第5図の統合
処理3の詳細フローチャート、第7図は本発明の更に他
の実施例の領域抽出処理の全体的流れを示すフローチャ
ート、第8図は第7図の統合処理3の詳細フローチャー
ト、第9図は統合処理1の他の詳細フローチャート、第
10図は原稿画像の一例とその抽出領域を示す図、第1
1図は原稿画像の別の例とその抽出領域および並べ換え
を示す図、第12図は第5図の統合処理3の処理例を示
す図。 第13図は第7図の統合処理3の処理例を示す図である
。 1・・・CPU、   2・・・主メモリ、3・・・行
切り出し/圧縮回路、 4・・・イメージメモリ。 第2図 第3図 第5図 高 彎7ズ 品 (υ) (b) し くC)

Claims (5)

    【特許請求の範囲】
  1. (1)原稿画像について文字行と平行な第1方向に射影
    をとり、この射影の黒範囲を行として切出し、切出した
    各行毎に、文字行に垂直な第2方向に射影をとって黒画
    素領域を抽出し、この抽出した黒画素領域について第1
    および第2方向の射影を再度とって黒画素領域を文字片
    として抽出し、その高さ、幅、他の文字片との重なりに
    関係した特定の統合条件を満たす複数の文字片を一つの
    領域に統合することにより、文字の大きさに応じた文字
    または文字列の領域を抽出することを特徴とする領域抽
    出方法。
  2. (2)統合条件の閾値を、切出した文字行の高さにより
    可変とすることを特徴とする請求項(1)記載の領域抽
    出方法。
  3. (3)注目する文字片の高さをその前後の文字片と比較
    し、注目する文字片の高さよりもその前後の文字片の高
    さが高いときは、該前後の文字片を使って統合条件を判
    定することを特徴とする請求項(1)記載の領域抽出方
    法。
  4. (4)統合時に統合される文字片に統合フラグを付加し
    、該統合終了後に統合フラグの付加されていない文字片
    に注目しその文字片とその前後の文字片に対し統合条件
    を判定することを特徴とする請求項(1)記載の領域抽
    出方法。
  5. (5)原稿画像について文字行と平行な方向に射影をと
    り、この射影の黒範囲を行として切出し、各行内で連続
    する黒画素領域を文字片として抽出し、抽出した文字片
    について、その高さ、幅、他の文字片との重なりの関係
    を調べ、特定の統合条件を満たす複数の文字片を一つの
    領域に統合することにより、文字の大きさに応じた文字
    列または文字の領域を抽出することを特徴とする領域抽
    出方法。
JP63167056A 1987-11-05 1988-07-05 領域抽出方法 Pending JPH01295383A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63167056A JPH01295383A (ja) 1987-11-05 1988-07-05 領域抽出方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP28013687 1987-11-05
JP62-280136 1987-11-05
JP63-29839 1988-02-10
JP63167056A JPH01295383A (ja) 1987-11-05 1988-07-05 領域抽出方法

Publications (1)

Publication Number Publication Date
JPH01295383A true JPH01295383A (ja) 1989-11-29

Family

ID=26491216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63167056A Pending JPH01295383A (ja) 1987-11-05 1988-07-05 領域抽出方法

Country Status (1)

Country Link
JP (1) JPH01295383A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03210688A (ja) * 1990-01-12 1991-09-13 Oki Electric Ind Co Ltd 行検出装置
JP2012212231A (ja) * 2011-03-30 2012-11-01 Toshiba Corp 電子機器、プログラムおよび文字列認識方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03210688A (ja) * 1990-01-12 1991-09-13 Oki Electric Ind Co Ltd 行検出装置
JP2012212231A (ja) * 2011-03-30 2012-11-01 Toshiba Corp 電子機器、プログラムおよび文字列認識方法
US8582894B2 (en) 2011-03-30 2013-11-12 Kabushiki Kaisha Toshiba Electronic apparatus and character string recognizing method

Similar Documents

Publication Publication Date Title
RU2651144C2 (ru) Ввод данных с изображений документов с фиксированной структурой
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US7319799B2 (en) Method of recognizing and indexing documents
US6466694B2 (en) Document image processing device and method thereof
US6640010B2 (en) Word-to-word selection on images
US8295600B2 (en) Image document processing device, image document processing method, program, and storage medium
US8208765B2 (en) Search and retrieval of documents indexed by optical character recognition
JPS61267177A (ja) 文書画像追加情報の蓄積方法
US20130014007A1 (en) Method for creating an enrichment file associated with a page of an electronic document
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
US20090030882A1 (en) Document image processing apparatus and document image processing method
CN112381057A (zh) 手写文字识别方法及装置、存储介质、终端
CN109726369B (zh) 一种基于标准文献的智能模板化题录技术实现方法
JP2008108114A (ja) 文書処理装置および文書処理方法
JPH01295383A (ja) 領域抽出方法
Spitz Text characterization by connected component transformations
Baloun et al. ChronSeg: Novel Dataset for Segmentation of Handwritten Historical Chronicles.
JP2781150B2 (ja) 文字分割方法
Yamashita et al. A document recognition system and its applications
JP4418726B2 (ja) 文字列探索装置、探索方法およびこの方法のプログラム
GB2473228A (en) Segmenting Document Images
JP4501731B2 (ja) 画像処理装置
JPH03142691A (ja) 表形式文書認識方式
JPS6154569A (ja) 文書画像処理方式
JP2918666B2 (ja) 文字画像切出し方法