JPH01295383A

JPH01295383A - 領域抽出方法

Info

Publication number: JPH01295383A
Application number: JP63167056A
Authority: JP
Inventors: Masahiro Nakamura; 昌弘中村
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1987-11-05
Filing date: 1988-07-05
Publication date: 1989-11-29

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、領域抽出方法に係り、詳しくは光学的文字認
識装置（ＯＣＲ）において、名刺や雑誌のような大きい
文字と小さい文字が混在した原稿の文字切出しに最適な
文字または文字列の領域抽出方法に関する。

〔従来の技術〕

従来、ＯＣＲにおいては、読取った原稿画像について、
その文字行と平行な方向に射影をとり、この射影の黒範
囲を行として切出し、この切出した各行毎に、その文字
行に垂直な方向に射影をとって黒画素領域を抽出し、連
続する黒画素領域を１文字として抽出していた。

〔発明が解決しようとする課題〕

上記従来技術のように、原稿画像の文字行方向に射影を
とり、この射影の連続した範囲を文字行として切出す方
法においては、例えば第１０図（ａ）に示す名刺におけ
る小さな文字の列「所長」および「工学博士」は、その
射影が大きな文字の列「理光太部」の射影と重なってし
まうため行切出しが成功せず、したがって正しく文字を
切出し認識することができなかった。

また、大きい文字と小さい文字では文字の切出しピッチ
が異なるが、従来は大きい文字と小さい文字が並んだ行
においては、いずれか一方のピッチで切出しを行うため
文字切出しに失敗することがあった。

これを防ぐには、射影をとる領域を操作者が直接的に指
定したり、あるいは入力原稿の様式を予め装置に設定し
ておくことによって射影をとる領域を特定しておき、そ
れぞれの領域を別々の領域として処理させる必要があり
、これは文字認識装置の使用上の大きな制約となってい
た。

本発明の目的は、入力原稿の様式を設定したり、操作者
が領域設定を行うことなく、大きさの異なる文字が混在
する原稿について、その大きさに応じた領域を抽出する
方法を提供することにある。

〔課題を解決するための手段〕

上記目的を達成するため、本発明の領域抽出方法におい
ては、原稿画像について文字行と平行な第１方向に射影
をとり、この射影の黒範囲を行として切出した後、切出
した各行毎に、文字行に垂直な第２方向に射影をとって
黒画素領域を抽出し、この抽出した黒画素領域について
第１および第２方向の射影を再度とって黒画素領域を文
字片として抽出し、その高さ１幅、他の文字片との重な
りに関係した特定の統合条件を満たす複数の文字片を一
つの領域に統合することにより１文字の大きさに応じた
文字または文字列の領域を抽出することを特徴とするも
のである。

また、本発明の第２の特徴は、上記統合条件の閾値を、
切出した文字行の高さにより可変とするものである。

本発明の第３の特徴は、注目する文字片の高さをその前
後の文字片と比較し、注目する文字片の高さよりもその
前後の文字片の高さが高いときは、該前後の文字片を使
って統合条件を判定することである。

本発明の第４の特徴は、統合時に統合される文字片に統
合フラグを付加し、該統合終了後に統合フラグの付加さ
れていない文字片に注目しその文字片とその前後の文字
片に対し統合条件を判定するものである。

〔作　用〕

まず原稿画像について文字行と平行な第１方向に射影を
とり、この射影の黒範囲を行として切出す０次に、この
ようにして切出した各行毎に、文字行に垂直な第２方向
に射影をとって黒画素領域を抽出し、この抽出した黒画
素領域について第１および第２方向の射影をとって再度
黒画素領域を抽出する。こＮで抽出した黒画素領域を文
字片とし、その高さ１幅、他の文字片との重なりに関係
した特定の統合条件を満たす複数の文字片を一つの領域
に統合することにより１文字の大きさに応じた文字また
は文字列の領域を抽出する。統合条件としては具体的に
は、文字片の高さ、最大幅。

高さと最大幅の比、幅と最大幅の比、最大高さと重なり
合う文字片の高さの比１重なり合う文字片の高さと幅の
比などが用いられる。

このような領域抽出を行えば、各領域から従来と同様な
方法によって容易に個々の文字を切り出し、認識するこ
とが可能となる。

また、日本語のように類似文字の多い言語を対象とした
文字認識においては、１文字単位の認識処理では候補文
字を正確に絞り込むことが容易でないため、候補文字列
と、意味のある文字列の知識辞書との比較照合によって
、最終的に文字を同定する方式の研究が進められている
。この場合、原稿上の文字の意味上の属性を識別するた
めの情報を得られると、知識辞書との比較照合を効率的
に行うことができる。

例えば、第１０図（ａ）の名刺画像の場合、「〒　２２
３横浜市港北区新羽町４６８６Ｊの文字列の属性は住所
であり、またｒＴａ　０４５　（５９３）３４１１Ｊの
文字列の属性は電話番号である。本発明は、このような
同一属性の文字列を一つの領域として抽出することがで
き、また、領域の高さから文字の大きさ（領域の高さ）
を知ることもでき、さらに、原稿上の相対位置から属性
も推定可能である。したがって、意味別知識辞書との比
較照合の効率化を期待できる。

〔実施例〕

以下５図面を用いて本発明の実施例について説明する。

第１図は本発明により領域抽出処理を実行する装置構成
の一例を示すブロック図である。１はデータ処理および
制御を実行するＣＰＵ、２はＣＰＵ１を動作させるため
のプログラムやデータを格納する主メモリ、３は行切り
出し／圧縮回路、４はイメージメモリ、５はバスである
。

第２図は本発明による領域抽出処理の一実施例の全体的
流れを示すフローチャートである。本実施例においては
文字片抽出処理（処理Ｉ）、統合処理１（処理■）、ソ
ート処理（処理■）、統合処理２（処理■）によって領
域抽出が行われる。

各処理の内容について以下説明する。

処理■ この処理の内容は第３図に示す通りである。ステップ１
０１は行切り出し／圧縮回路３の処理ステップである。

この処理ステップにおいては、外部のスキャナにより読
取られた原稿の画像データ（白黒２値の画像データ）は
適当な圧縮率で圧縮され、イメージメモリ４に蓄積され
る。

第１０図の名刺では住所、電話番号など、文字列毎に属
性が決まっているが、上記圧縮の圧縮率は、同じ属性の
文字はつながるが、異なる属性の文字列はつながらない
程度に、スキャナの解像度にあわせて選ばれる。

このような圧縮を行いながら、主走査方向（Ｘ方向、文
字行方向）に射影がとられ、この射影により従来と同様
に行が切出される。こ＼で切出された行の領域をＢＬＩ
とし、その位置データは主メモリ２に記憶される。

ステップ１０２からステップ１０９まではＣＰＵ１によ
る処理である。まずステップ１０２では、各領域ＢＬＩ
毎にイメージメモリ４上の画像データの副走査方向（Ｙ
方向）に射影がとられ、この射影データは主メモリ２上
の射影バッファに記憶される。

このような射影抽出が終了すると、ステップ１０３で主
メモリ２上のカウンタＫがリセットされたのちステップ
１０４の処理が実行される。ステップ１０４では、射影
バッファ内の射影データがチエツクされ、射影の黒領域
のＸ方向の開始点、終了点の位置がそれぞれＰＷｓｅｐ
Ｗｅとして主メモリ２に記憶される。

射影データをＹ方向に並ぶ画素情報の論理和データとし
た場合、１１０”　（白）から１′１１１（黒）への変
化点を開始点、その逆の変化点を終了点とする。射影デ
ータをＹ方向に並んだ黒画素数とした場合は、射影値が
特定の閾値を越えて立上がる点を開始点として、特定の
閾値以下に立下がる点を終了点とする。

一つの黒領域の開始点、終了点の記憶がなされるたびに
カウンタには＋１され２次の黒領域の開始点、終了点の
検出が行われる。この様にして、領域ＢＬＩは垂直方向
の射影によりＸ方向に複数の領域に分割される。このよ
うな処理はステップ１０５で終了が判定されるまで繰返
し実行される。

終了したと判定されると、ステップ１０Ｇで主メモリ２
上のカウンタｉがリセットされたのち、ステップ１０７
の処理が実行される。

このステップ１０７では、ステップ１０４の処理により
領域ＢＬＩから抽出された各領域毎に、イメージメモリ
４内の画像データのＸ方向の射影がとられ、この射影の
黒領域のＹ方向の開始点、終了点位置がそれぞれｈｓ、
ｈｅとして記憶される。

さらに、ｈｓからｈｅの間において、ｐｗｓからｐｗｅ
の範囲内のＹ方向の射影がとられ、その射影のＸ方向の
開始点、終了点の位置がそれぞれｗｓ、ｗｅとして記憶
される。

このようにして、Ｘ方向の開始点、終了点がＷｓ、ｗｅ
でＹ方向の開始点、終了点がｈｓ、ｈｅの矩形の領域が
ＢＬ２として抽出され、抽出順にＢＬ２　（ｊ、ｈｓ、
ｈｅ、ｗｓ、ｗｅ）のデータ形式で主メモリ２上の領域
テーブルに記憶される（ｊは抽出番号）。

一つあるいは複数の領域ＢＬ２が抽出されると。

ステップ１０９でカウンタｉが＋１され、次の領域の抽
出が行われる。ステップ１０８でｉ＝にと判定されると
、処理は終了する。

以上の処理Ｉによって、連続した黒画素の領域ＢＬ２が
文字片として抽出される。第１０図（、）の名刺原稿の
場合、同図（ｂ）に矩形として示すように領域ＢＬ２が
抽出される。

処理■ この処理は、領域ＢＬＩ毎に、その中の領域ＢＬ２の統
合条件を満たすものを一つの領域に統合するものである
。例えば第１０図（ａ）の「太」が「二」であったとす
ると、処理Ｉの段階では「二」は上下に二つに分解され
て抽出されるが、処理■によって、このような領域が一
つの領域に統合される。第４図に処理Ｈのフローチャー
トを示す。

まずステップ２０１で、処理対象のＢＬＩに属するＢＬ
２　（ｉ）について高さと幅の最大値を求める（ｉは抽
出番号）。

ステップ２０２では、処理対象の領域ＢＬＩ内の文字片
すなわち領域ＢＬ２について、先頭からＹ方向の重なり
を調べ、重なりがある場合は次の文字構成条件を調べる
。

１）ＢＬ２　（Ｑ　；　ｎ−１）の高さが最大文字高さ
より小さい。

２）ＢＬ２　ＣＱ　；　ｎ−１）の高さと幅の比がある
閾値以下である。

３）ＢＬ２　（ｎ　；　ｎ−１）の幅がある閾値以下で
ある。

こ＼で、ｎは重なった先頭の文字片すなわちＢＬ２　（
Ｑ）からみて、重なりがなくなる文字片の抽出番号であ
る。ＢＬ２　（１；　ｊ）はｉ番目の文字片からｊ番目
の文字片までゾ構成される文字片群を一つの領域と見做
すことを意味する。

なお、前記２）において、高さと幅の比の閾値（ＴＨｒ
）はステップ２０１で調べた高さの最大値により変化さ
せてもよい。即ち、窩さの最大値Ｈｗａｘがある閾値（
ＴＨＨ）より大きいときはＴＨｒ＝ＴＨｒＡと、　Ｈｍ
ａｘ≦ＴＨＨのときはＴＨｒ＝ＴＨｒ８とする。この処
理により１文字構成条件の判定がより正確になる。

ステップ２０３で、文字片の重なりがないか、または上
記文字構成条件を満たすときはステップ２０４に分岐し
、そうでないときはステップ２０５に分岐する。

ステップ２０４では、主メモリ上の統合フラグを０にし
、注目する文字片（群）の位置情報（ｈｓ　＝　ｗ　ｅ
　）を主メモリに記憶する。ステップ２０５では、統合
フラグを１にし、Ｑ　（重なった先頭の文字片の抽出番
号）とｎ　（Ｑからみて重なりがなくなる文字片の抽出
番号）を主メモリに記憶する。

ステップ２０６で文字片のポインタを重なった文字片の
数だけ進め、対象領域ＢＬＩ内に処理すべき文字片が残
っているかをステップ２０７で調べ、残っていないなら
ばステップ２２５へ分岐する。

文字片が残っている場合、続く文字片についての処理を
行う。

まずステップ２０８で、文字片のＹ方向の重なりについ
て調べ、重なりがあれば上記文字構成条件を調べ、また
統合フラグを調べる。

ステップ２０９で、統合フラグが２でなければステップ
２１４に分岐する。

統合フラグが２のときは、ステップ２１０において、統
合フラグを２にセットした時の文字片の重なりの先頭か
ら重なりがなくなるまでの文字片群を一つの領域として
、その位置情報を主メモリ上に記憶する。

次に、ステップ２０８で調べた文字片の１重なりがない
とき、あるいは重なった文字片が上記文字構成条件を満
たしときはステップ２１１からステップ２１２に分岐し
、そうでないときはステップ２１３に分岐する。

ステップ２１２では、統合フラグをＯにし、注口する文
字片（群）の位置情報（ｈｓ−ｗｅ）を記憶する。ステ
ップ２１３では、統合フラグを２にし５重なりの先頭番
号と重なりがなくなる文字片の番号を記憶する。その後
、ステップ２０６に戻り処理を続行する。

統合フラグが２でなくステップ２０９よりステップ２１
４に分岐した場合の処理は次の通りである。まず、ステ
ップ２０８で調べた文字片の重なりがないとき、あるい
は重なった文字片が上記文字構成条件を満たした場合は
ステップ２１５に進むが、そうでないときはステップ２
２４に分岐する。

ステップ２１５では当該注目文字片（群）とそれ以前の
確定していない領域の高さを比べ、高さのスタート位置
（最小のｈｓ）、高さ（ｈｓとｈｅの差）、高さのエン
ド位置（最大のｈｅ）の差とある閾値との比較を行い、
そのすべての差が閾値以下ならばステップ２１６からス
テップ２１７に分岐し、注目文字片（群）をそれ以前の
領域に統合する。

なお、差の閾値（ＴＨＤ）はステップ２０１で調べた高
さの最大値により変化させてもよい。すなわち、Ｈｍａ
ｘ＞ＴＨＨの時ばＴ　Ｈｏ　＝　Ｔ　ＨＤ　Ａをとり、
　Ｈｍａｘ≦ＴＨ，の時はＴ　Ｈｎ　＝　Ｔ　ＨＤ　Ｂ
をとるようにする。ＴＨＤは固定値でも文字高さに比例
した可変値でもよい。この閾値（ＴＨＩ））を変化させ
ることにより、領域統合がより正確になる。

他方、高さのスタート位置、高さ、高さのエンド位置の
差のいずれかがある閾値を越えているときは、ステップ
２１８において、注目する文字片（群）とそれ以前の確
定していない領域とのＸ方向の重なりを調べ、重なりが
あるときはステップ２１９からステップ２２１に進むが
、重なりがないときはステップ２２０に進み、統合フラ
グをＯにし、それ以前の領域までＮ−つの領域として確
定させ、注目する文字片（群）の位置情報（ｈｓ〜ｗｅ
）を記憶する。

ステップ２２１では１次の条件を調べる。

１）注目する文字片（群）と、それ以前の確定していな
い領域内の文字片（群）の幅の最大値の差がある閾値以
下で、かつ文字片（群）の高さがそれ以前の確定してい
ない領域の高さより高いときに注目文字片（群）の高さ
とそれ以前の確定していない領域内の文字片（群）の幅
の最大値の比がある閾値以下である。

２）注目する文字片（群）とそれ以前の確定していない
領域内の文字片（群）の幅の最大値の差がある閾値以下
で、かつ文字片（群）の高さがそれ以前の確定していな
い領域の高さの最大値より高くないときに、それ以前の
確定していない領域の高さの最大値と注目文字片（群）
の幅の比がある閾値以下である。

二へでも高さと幅の比の閾値（Ｔ　Ｈｒｓ　）はステッ
プ２０１で調べた高さの最大値（Ｈｍａｘ）により変化
させてもよい、すなわちＨｗａｘ　＞　Ｔ　ＨＨの時、
Ｔ　Ｈｒ２＝　Ｔ　Ｈｒ２Ａ、　Ｈｍａｘ≦ＴＨＨの時
、ＴＨｒ２＝ＴＨｒ２ｍとする。

上記条件を満たすときはステップ２２３において、統合
フラグを１にし、注目する文字片（群）をそれ以前の領
域に統合する。

上記条件を満足しないときは、ステップ２２０において
、統合フラグをＯにし、それ以前の領域までＮ−つの領
域として確定させ（その統合は終了）、注目する文字片
（群）の位置情報（ｈｓ〜ｗｅ）を記憶する。

ステップ２２４においては、それ以前の領域まで＼一つ
の領域として確定させ、統合フラグを２にし、重なりの
先頭番号と重なりがなくなる文字片の番号を記憶する。

ステップ２０７からステップ２２５に分岐した場合の処
理は次の通りである。統合フラグが２の場合、ステップ
２２６において、統合フラグを２にセットした時の文字
片群をそれぞれ一つの領域として確定し、それぞれの位
置情報を記憶する。

統合フラグが２でない場合、ステップ２２７において、
そこまでの領域を一つの領域として確定し、その位置情
報を記憶する。これで一つの領域ＢＬ１についての統合
処理を終了する。

以上の処理を各ＢＬＩについて実行することにより、文
字片の統合を行う。

こ＼までの処理により、第１０図（ｂ）に矩形で示した
領域ＢＬ２は、第１０図（Ｃ）に矩形ＴＢＬで示すよう
に統合される。すなわち、文字の高さに応じて領域が統
合されたわけである。

第１０図（ｃ）に示す矩形領域ＴＢＬは、いずれも同一
の大きさの文字の並びがそれぞれ一つの領域として抽出
されたものであり、領域の高さから文字の大きさも明ら
かである。したがって、各抽出領域毎に、従来と同様な
方法により個々の文字を確実に切出して認識することが
可能である。

五曳且第１０図に示したような名刺などの場合、処理■までＮ
目的は達成できる。しかし、第１１図（、）に示すよう
な原稿画像の場合、領域抽出結果は第１１図（ｂ）のよ
うになる、すなわち、ロゴのような大きな図形または文
字の領域Ａ、「〒１４０」の領域Ｂ、「電話番号」の領
域Ｃ１ｒ東京都・・・−６」の領域Ｄ、「リコー・・・
階」の領域Ｅ、「０３−・・・６７」の領域Ｆがこの順
番（０で囲んで示す順番）で抽出される。

このように同一文字行に属する領域ＢとＤ、領域ＣとＦ
がそれぞれ分離して抽出されてしまう。

しかし、領域ＢとＤの文字列の文字の大きさが同一で属
性（住所）も同一であるから、同一行として統合すべき
である。領域ＣとＦの文字列も同様に統合すべきである
。この統合のためには、統合すべき領域の抽出番号を連
続させるように領域の並べかえが必要である。

処理■は、このような領域の並べかえを行う処理である
。処理■によって、領域ＡからＦを第１１図（ｃ）に示
す順番に並換え１次の処理■によってさらに統合を行う
ことにより、第１１図の領域Ｂとり、ＣとＦをそれぞれ
一つの領域として抽出することができる。

処理■では、下記の条件を満たすときに領域ＴＢＬ（処
理■の処理結果としての統合領域）の並換えを行う。

ＴＢＬ　（ｉ）ｈｓ＞ＴＢＬ　（ｉ＋１）ｈａかつＴＢＬ　（ｉ）ｗｓ＜ＴＢＬ　（ｉ＋１）ｗｓこＮでＴ
ＢＬ（ｉ）ｈｓはｉ番目の領域の高さのスタート位置、
ＴＢＬ　（ｉ＋１）ｈａは（ｉ＋１）番目の領域の高さ
のエンド位置、ＴＢＬ　（ｉ）ＷＳはｉ番目の領域の幅
のスタート位置、ＴＢＬ（ｉ＋１）ｗｓは（ｉ＋１）番
目の領域の幅のスタート位置である。

笈星ｙ処理■における高さの条件による統合処理（第４図のス
テップ２１５から２２３まで）と同様である。

以上の一連の処理により、文字の大きさ（高さ）が同一
の文字列の領域が抽出され、その高さから文字の大きさ
が明らかとなるため、従来と同様な文字切出しを各領域
に対して行うことにより文字を確実に切出すことができ
る。また、各領域の原稿内の位置も明らかであるため１
例えば名刺のように特定の位置に特定の属性の文字列が
印刷された原稿の場合、領域の位置から文字列の属性を
推定可能となるため、属性を考慮した文字認識も容易で
ある。

なお、複雑な書式の原稿の場合、処理■と処理■を複数
回繰返すことにより、領域抽出の精度をさらに向上でき
る。

第５図は本発明の他の実施例の領域抽出処理の全体的流
れを示すフローチャートである。こへで。

処理■〜■は第２図と同様であり、処理■（統合処理３
）が新しく追加された部分である。

処理Ｉ〜■の一連の処理によって、第１０図（ａ）に示
す名刺は、第１０図（ｃ）に示すように、同一の大きさ
の文字の並びがそれぞれ一つの領域として抽出され、ま
た、第１１図（ａ）に示すようにロゴのような大きな図
形領域が含まれている場合でも、領域の並べかえにより
、第１１図（ｃ）に示すように同一文字行に属する領域
はそれぞれ一つの領域として抽出される。しかしながら
、例えば第１２図（ａ）のような文字列においては、′
３”と“３”の間の“−”のように高さの非常に低い文
字が存在すると、第１２図（ｂ）のように、こ−で切れ
てしまい、一つの領域として抽出されない場合がある。

第１２図（ｂ）は、第１２図（ａ）の同一文字列が３つ
の領域に分かれて抽出されることを示している。この場
合、第５図の処理■を行うと、第１２図（ｂ）は第１２
図（Ｑ）のように統合される。

第６図は処理■の詳細フローチャーＩ−を示したもので
ある。第６図では１文字片はｉ＝Ｏからとしている。ま
た、Ｈは文字片の高さを表わす。

まず、注目する文字片とその次の文字片の高さを比べる
（ステップ３０５）、次の文字片の高さ（Ｈ（ｉ　））
が注目する文字片Ｈ（ｉｒｅｇ）より高ければ、その高
い文字片を統合対象文字片とする（ステップ３０６）、
もし注目する文字片の方が高ければ、その次の文字片と
高さを比較し、同様に処理する（ステップ３０３〜３０
５）、注目文字片がそれより後方のすべての文字片より
高ければ、この注目文字片での統合は不成立とし注目文
字片を一つの後方の文字に移しくステップ３０７）。

これをその列の文字片全てについて処理を繰返す（ステ
ップ３０８〜３１０）。注目文字片より前方については
注目文字片より高い文字片を発見しにいき、見つかれば
、その文字片を統合対象文字片としくステップ３１１）
、見つからなければこの注目文字片での前後の統合は不
成立として、次の文字片に処理を移す（ステップ３１３
，３０２）。

このようにして得た統合対象文字片を使い統合処理を行
う（ステップ３１３）。これにより、第１２図（ａ）は
同図（Ｑ）のように正しく統合される。

−第７図は本発明の他の実施例の領域抽出処理の全体的
流れを示すフローチャートである。こへで、処理！〜■
は第２図及び第６図と同様であり、処理Ｖ’　　（統合
処理３）が新しく追加された部分である。

処理Ｉ〜■の一連の処理によって、第１０図（、）に示
す名刺は、第１０図（ｃ）に示すように、同一の大きさ
の文字の並びがそれぞれ一つの領域として抽出される。

しかしながら、例えば第１３図（ａ）のような文字列に
おいては、「＝」のように幅が広く高さの低い文字が存
在すると、第１３図（ｂ）のように、こへで切れてしま
い、領域抽出に失敗することがある。第１３図（ｂ）は
、第１３図（ａ）の同一文字列が２つの領域に分かれて
抽出されることを示している。この場合、第７図の処理
Ｖ″を行うと、第１３図（ｂ）は第１３図（ｃ）のよう
に統合される。

第８図は処理ｖ′の詳細フローチャートを示したもので
ある。第８図では１文字片はｉ＝ｏからとしている。

ステップ４０１〜４０３と進み、データエンドでない場
合（ステップ４０４）、まず注目する文字片に統合フラ
グが付加されているか調べる（ステップ４０５）、付加
されていれば、次の文字片へ移り（ステップ４０９）、
付加されていなければ、注目する文字片とその次の文字
片にＸ方向に重なりがあり（ステップ４０６）、かつ、
注目する文字片の幅とその次の文字片の高さの比がある
スレッシュ以下であるとき（ステップ４０７）、統合処
理を行い、統合フラグを付加する（ステップ４０８）、
これを同−ＢＬＩに対して行う。次に同−ＢＬＩの最後
の文字片から前方に向って同様の処理を行う（ステップ
４１０〜４１７）。これにより、第１３図（ａ）の文字
列は第１３図（Ｑ）のように正しく統合される。

次に、第２図、第５図及び第７図における処理■（統合
処理１）の別の詳細フローチャートを第９図に示す、こ
れは基本的には第４図と同様であるが、アルゴリズムを
かえて処理フローを書替えたものである。なお、第９図
には同−ＢＬＩ内のＢＬ２　（ｉ）について高さと幅の
最大値を求めてからの処理が示されている。

ステップ９０１では、処理対象の領域ＢＬＩ内において
連続して抽出された領域ＢＬ２　［（ｉ）。

（ｉ＋１）］について゛、Ｙ方向に重なっているか調べ
る。重なっている場合はステップ９１８の処理に分岐す
る。

まずＹ方向に重なっていない場合について説明する。ス
テップ９０２で、次に連続するＢＬ２［（ｉ＋１）、（
ｉ＋２〜ｎ）コについてＹ方向に重なっているか調べら
れる。重なっている場合。

さらにステップ９０３で、重なったＢＬ２　（ｉ＋１〜
ｋ）の高さが最大高さより高いか、または当該型なった
領域の高さと幅の比が１に近くないかの条件判定が行わ
れる。この条件が成立した場合、ステップ９０４で、Ｂ
Ｌ２　（ｉ）とＢＬ２　（ｉ＋１）は別領域として領域
テーブルにマークされる（統合されない）。

ステップ９０３の判定条件が不成立の場合、すなわち重
なった領域の高さが最大高さより高くなく、かつ重なっ
た領域の高さと幅の比が１に近い場合、ステップ９０６
でＢＬ２　（ｉ）と重なった領域のスター１−位置、エ
ンド位置および高さが比較され、それぞれの差がそれぞ
れの閾値以下であるか否か調べられる。全ての条件につ
いて閾値以下の場合、ステップ９０７でＢＬ２　（ｉ）
とＢＬ２　（ｉ＋１〜ｋ）は同じ領域として領域テーブ
ルにマークされる（統合される）。

ステップ９０６でいずれかの条件が満たされなかった場
合、ステップ９０８で、ＢＬ２　（ｉ）の高さが重なっ
た領域の高さより高いときには、ＢＬ２　（ｉ）の高さ
と重なった領域の幅の比がとられ、ＢＬ２　（ｉ）が重
なった領域の高さより高くないときには、ＢＬ２　（ｉ
）の幅あるいはＢＬ２（１〜１−１）の中の最大の幅と
、重なった領域の高さの比がとられる。そして、ステッ
プ９０９で当該比が１に近いか否かが調べられ、１に近
い場合にはステップ９１０でＢＬ２　（ｉ）とＢＬ２（
ｉ＋１）は同じ領域としてマークされ、１に近くない場
合にはステップ９１１でＢＬ２　（ｉ）とＢＬ２　（ｉ
＋ｌ〜ｋ）は別の領域としてマークされる。この比によ
る判定は、普通の文字の高さと幅の比がはゾ１であると
いう性質に基づいている。

ステップ９０２で重なっていないと判定された場合、ス
テップ９１２で、ＢＬ２　（ｉ）とＢＬ２（ｉ＋１）の
スタート位置、エンド位置および高さが比較され、それ
ぞれの差がそれぞれの閾値以下であるかが調べられる。

すべての条件が閾値以下のときは、ステップ９１３でＢ
Ｌ２　（ｉ）とＢＬ２（ｉ＋１）は同じ領域としてマー
クされる。

いずれかの条件が満たされない場合、ステップ９１４で
、ＢＬ２　（ｉ）の高さがＢＬ２　（ｉ＋１）の高さよ
り高いならば、ＢＬ２　（ｉ）の高さとＢＬ２　（ｉ＋
１）の幅の比がとられ、ＢＬ２　（ｉ）がＢＬ２　（ｉ
＋１）の高さより高くないならば、ＢＬ２　（ｉ）の幅
またはＢＬ２　（１〜１−１）の最大幅と、ＢＬ２　（
ｉ＋１）の高さの比がとられる。そして、ステップ９１
５で当該比が１に近いか調べられ、１に近い場合はステ
ップ９１６でＢＬ２　（ｉ）とＢＬ２　（ｉ＋１）は同
一領域としてマークされ、比が１に近くない場合はステ
ップ９１７でＢＬ２　（ｉ）とＢＬ２　（ｉ＋１）は別
領域としてマークされる。

次に、ステップ９０１でＹ方向に重なっていると判定さ
れた場合の処理について説明する。

ステップ９１８で、重なった領域の高さが最大高さより
高いか調べられ、高い場合にはステップ９１９でＢＬ２
　（ｉ）とＢＬ２　（ｉ＋１）は別領域としてマークさ
れ、高くない場合にはステップ９２０に進む。

ステップ９２０では、次に連続するＢＬ２［（ｉ）、（
１〜１−１）］についてＹ方向の重なりが調べられ、重
なった領域の高さが最大高さより高い、または重なった
領域の高さと幅の比が１に近くないかの条件判定が行わ
れる。この条件が成立した場合、ステップ９２１で、重
なった領域ＢＬ２（ｉ”ｉ＋ｋ）の高さが最大高さより
高くないＢＬ２　（ｉ＋ｋ）までと、ＢＬ２　（ｉ＋に
＋１）とが別の領域としてマークされる。□ステップ９
２０の条件が成立しない場合、すなわち、重なった領域
が最大高さより高くなく、かつ重なった領域の高さと幅
の比が１に近い場合、ステップ９２２に進む。このステ
ップでは、これに連続するＢＬ２　［（ｉ＋に＋１）、
（ｉ＋に＋１〜ｎ）］についてＹ方向に重なっているか
が調べられる。重なっている場合、ステップ９２３で。

重なった領域の高さが最大高さより高いか、または重な
った領域の高さと幅の比が１に近くないかの条件判定が
行われる。この条件が成立した場合、ステップ９２４で
ＢＬ２　（ｉ＋ｋ）までとＢＬ２（ｉ　＋　ｋ　１　）
とは別の領域としてマークされる。

ステップ９２３で条件が成立しなかった場合、すなわち
重なった領域の高さが最大高さより高くなく、かつ重な
った領域の高さと幅の比が１に近い場合、ステップ９２
５に進む。このステップでは、一つ目の重なった領域と
二つ目の重なった領域のスタート位置、エンド位置およ
び高さがそれぞれ比較され、それぞれの差がそれぞれの
閾値以下であるか判定される。すべての条件が満たされ
た場合、すなわち、すべての差が閾値以下の場合、ステ
ップ９２６でＢＬ２　（ｉ＋ｋ）とＢＬ２　（ｉ＋に＋
１）は同じ領域としてマークされる（統合される）。

ステップ９２５でいずれかの条件が満たされなかった場
合、ステップ９２７の処理が行われる。

このステップでは、一つ目の重なった領域の高さが二つ
目の重なった領域の高さより高いときは、一つ目の重な
った領域と二つ目の重なった領域の幅の比がとられ、一
つ目の重なった領域が二つ目の重なった領域の高さより
高くないときは、一つ目の重なった領域のＢＬ２　（ｉ
）の幅またはＢＬ２（１〜１−１）の最大幅と、二つ目
の重なった領域の高さの比がとられる。そしてステップ
９２８で当該比が１に近いか調べられ、１に近いときは
ステップ９２９でＢＬ２　（ｉ＋ｋ）とＢＬ２（ｉ＋に
＋１）は同じ領域としてマークされ（統合され）、当該
比が１に近くないときはステップ９３０で、ＢＬ２　（
ｉ十ｋ）とＢＬ２　（ｉ＋に＋１）は別の領域としてマ
ークされる。

ステップ９２２で重なっていないと判定された場合、ス
テップ９３１に進む。このステップでは、一つ目の重な
った領域とＢＬ２　（ｉ＋に＋１）のスタート位置、エ
ンド位置、高さがそれぞれ比較され、それぞれの差がそ
れぞれの閾値以下であるかの条件判定が行われる。すべ
ての条件が成立する場合、すなわち、すべての差が閾値
以下の場合、ステップ９３２でＢＬ２　（ｉ＋ｋ）とＢ
Ｌ２　（ｉ＋に＋１）は同じ領域としてマークされる（
統合される）。

ステップ９３１のいずれかの条件が満たされなかった場
合、すなわち、スタート位置、エンド位置、高さのいず
れかの差が閾値を越えた場合、ステップ９３３に進む、
このステップでは、−・つ目の重なった領域がＢＬ２　
（ｉ＋に＋１）の高さより高いときは、一つ目の重なっ
た領域の高さとＢＬ２（ｉ＋に＋１）の幅の比がとられ
、一つ目の重なった領域がＢＬ２　（ｉ＋に＋１）の高
さより高くないときは、一つ目の重なった領域のＢＬ２
（ｉ）の幅またはＢ　（１〜１−１）の最大幅と。

ＢＬ２　（ｉ十に＋１）の高さの比がとられる。そして
、ステップ９３４で当該比が１に近いか否かが調べられ
、１に近いときにはステップ９３５でＢＬ２　（ｉ＋ｋ
）とＢＬ２　（ｉ＋に＋１）は同じ領域としてマークさ
れ、１に近くないときにはステップ９３ＧでＢＬ２　（
ｉ＋ｋ）とＢＬ２　（ｉ＋に＋１）は別の領域としてマ
ークされる。

なお、ステップ９０４，９０７，９１０，９１１．９１
３，９１６，９１７，９１９，９２１゜９２４．９２６
，９２９，９３０，９３２，９３５．９３６の後にステ
ップ９０１より処理が再開される。

以上の処理が領域ＢＬＩ内の全領域ＢＬ２について処理
するまで繰り返される。この処理により。

第４図の場合と同様に、第１０図（ｂ）に矩形で示した
領域は、第１０図（ｃ）に矩形で示すように統合される
。

以上の各実施例では、処理量およびメモリ量の削減のた
めに、原稿画像の圧縮画像データについて処理を行うと
したが、スキャナ解像度によっては圧縮しない原稿画像
データについて直接に処理を行うようにしてもよいもの
である。

〔発明の効果〕

以上の説明から明らかなように、本発明によれば次のよ
うな効果が得られる。

（１）大きさの異なる文字が混在した名刺などの原稿画
像から文字の大きさに応じた文字列または文字の領域を
抽出することができるため、切出しのための領域指定な
どを行うことなく、文字の切出し、認識を容易かつ確実
に行うことができるようになり、文字認識装置の認識対
象原稿の範囲を拡大できる。

（２）統合条件の閾値を切出した文字行の高さにより可
変とすることにより１文字構成条件の判定や領域統合が
より正確になる。

（３）注目する文字片の高さをその前後の文字片と比較
し、注目する文字片の高さよりもその前後の文字片の高
さが高いときは、該前後の文字片を使って統合条件を判
定することにより、同一文字列中に高さの非常に低い文
字が存在しても領域抽出に失敗することはない。

（４）統合時に統合される文字片に統合フラグを付加し
、該統合終了後に統合フラグの付加されていない文字片
に注目しその文字片とその前後の文字片に対し統合条件
を判定することにより、同一文字列中に幅が広く高さの
低い文字が存在しても領域抽出に失敗することがない。

【図面の簡単な説明】

第１図は本発明により領域抽出処理を実行するための装
置構成の一例を示すブロック図、第２図は本発明の一実
施例の領域抽出処理の全体的流れを示すフローチャート
、第３図は第２図の文字片抽出処理の詳細フローチャー
ト、第４図は第２図の統合処理処理１の詳細フローチャ
ート、第５図は本発明の他の実施例の領域抽出処理の全
体的流れを示すフローチャート、第６図は第５図の統合
処理３の詳細フローチャート、第７図は本発明の更に他
の実施例の領域抽出処理の全体的流れを示すフローチャ
ート、第８図は第７図の統合処理３の詳細フローチャー
ト、第９図は統合処理１の他の詳細フローチャート、第
１０図は原稿画像の一例とその抽出領域を示す図、第１
１図は原稿画像の別の例とその抽出領域および並べ換え
を示す図、第１２図は第５図の統合処理３の処理例を示
す図。第１３図は第７図の統合処理３の処理例を示す図である
。１・・・ＣＰＵ、　　　２・・・主メモリ、３・・・行
切り出し／圧縮回路、４・・・イメージメモリ。第２図第３図第５図高彎７ズ品（υ）（ｂ）しくＣ）

Claims

【特許請求の範囲】

（１）原稿画像について文字行と平行な第１方向に射影
をとり、この射影の黒範囲を行として切出し、切出した
各行毎に、文字行に垂直な第２方向に射影をとって黒画
素領域を抽出し、この抽出した黒画素領域について第１
および第２方向の射影を再度とって黒画素領域を文字片
として抽出し、その高さ、幅、他の文字片との重なりに
関係した特定の統合条件を満たす複数の文字片を一つの
領域に統合することにより、文字の大きさに応じた文字
または文字列の領域を抽出することを特徴とする領域抽
出方法。
（２）統合条件の閾値を、切出した文字行の高さにより
可変とすることを特徴とする請求項（１）記載の領域抽
出方法。
（３）注目する文字片の高さをその前後の文字片と比較
し、注目する文字片の高さよりもその前後の文字片の高
さが高いときは、該前後の文字片を使って統合条件を判
定することを特徴とする請求項（１）記載の領域抽出方
法。
（４）統合時に統合される文字片に統合フラグを付加し
、該統合終了後に統合フラグの付加されていない文字片
に注目しその文字片とその前後の文字片に対し統合条件
を判定することを特徴とする請求項（１）記載の領域抽
出方法。
（５）原稿画像について文字行と平行な方向に射影をと
り、この射影の黒範囲を行として切出し、各行内で連続
する黒画素領域を文字片として抽出し、抽出した文字片
について、その高さ、幅、他の文字片との重なりの関係
を調べ、特定の統合条件を満たす複数の文字片を一つの
領域に統合することにより、文字の大きさに応じた文字
列または文字の領域を抽出することを特徴とする領域抽
出方法。