JPH04330586A - 単語領域抽出方式 - Google Patents

単語領域抽出方式

Info

Publication number
JPH04330586A
JPH04330586A JP2418960A JP41896090A JPH04330586A JP H04330586 A JPH04330586 A JP H04330586A JP 2418960 A JP2418960 A JP 2418960A JP 41896090 A JP41896090 A JP 41896090A JP H04330586 A JPH04330586 A JP H04330586A
Authority
JP
Japan
Prior art keywords
line
area
black area
word
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2418960A
Other languages
English (en)
Inventor
Hiroshi Nakayama
寛 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2418960A priority Critical patent/JPH04330586A/ja
Publication of JPH04330586A publication Critical patent/JPH04330586A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ハンディスキャナー装
置によって読み込んだ文書画像やディスプレイ画面に表
示された文書画像の部分画像より、英単語のようなスペ
ースで区切られた文字列(単語と総称する)の領域を抽
出する単語領域抽出方式に関する。
【0002】
【従来の技術】文字認識システムにおいて、ハンディス
キャナー装置を用いて原稿画像を入力する場合、読み取
り領域が不適切であったり、スキューが大きかったりし
て、単語の切り出し(単語入力)を正しく行なうことが
できないことがあった。それは従来のハンディスキャナ
ー装置が、そのような単語入力を前提としていなかった
ため、読み取り範囲を覗き窓から確認できるようにはな
っていたが、原稿上の目的としている単語に対して読み
取り位置や向きが適切であるか否かを簡単に確認するた
めの手段を備えていなかったからである。
【0003】このような不都合を解決するため、原稿読
み取り窓と原稿上の単語の先頭及び行中心との相対的位
置をそれぞれ合わせるための二つのガイドライン(スタ
ートラインとセンターライン)を有し、読み取り領域と
単語の先頭及び行中心との相対的位置がほぼ一定した読
み取り画像を得られるハンディスキャナー装置と、この
ガイドライン付きハンディスキャナー装置によって読み
込んだ画像より、ガイドライン位置を利用して簡単な処
理により単語領域を抽出する単語領域抽出装置とを考案
し、同一出願人により『ハンディスキャナー装置及び単
語領域抽出装置』なる発明の名称にて平成2年7月19
日付で特許出願がなされている。
【0004】また、ディスプレイ画面上において、マウ
ス(ポインティングデバイス)などを用いて必要な単語
領域を囲む矩形の二つの対角頂点を指定し、この矩形内
を単語領域として抽出するという方式がある。しかし、
文書の行間が狭い場合や単語間スペースが狭い場合、あ
るいは単語に接近して罫線がある場合に、単語領域のみ
を囲む矩形の指定が容易でないという問題がある。
【0005】この問題を解決するため、前記ハンディス
キャナー装置と同様のガイドラインを持つ、単語領域よ
り十分大きな一定の大きさの枠を定義し、この枠(全体
、ガイドラインのみ、あるいはガイドラインの交点部分
のみ)を文書画像とともにディスプレイ画面に表示し、
ガイドラインを目的の単語領域の先頭及び行とほぼ一致
させるように枠を移動させ、枠内の部分画像を入力画像
として、ガイドラインの位置情報(基準位置情報)を利
用し簡単な処理によって目的の単語領域を抽出する単語
領域抽出方式を考案し、やはり同一出願人により『単語
領域抽出方式』なる発明の名称にて平成2年7月19日
付で特許出願がなされている。
【0006】また、ガイドライン付きハンディスキャナ
ー装置によつて読み込まれた文書画像あるいはディスプ
レイ画面上でガイドライン付き枠により指定された領域
の文書画像を入力画像として、入力画像のスキューが大
きい場合にも、より確実に単語領域を抽出可能な単語領
域抽出方式を、同一出願人により『単語領域抽出方式』
なる発明の名称にて平成2年7月27日付で特許出願し
ている。
【0007】
【発明が解決しようとする課題】本発明の目的は、前記
特許出願に係る単語領域抽出装置あるいは方式を改良し
、用紙の端や写真の近くに印刷された単語などの領域を
より確実に抽出できるようにした、より実用性に優れた
単語領域抽出方式を提供するにある。
【0008】
【課題を解決するための手段】特許請求の範囲の請求項
1記載の発明は、抽出すべき目的単語領域の先頭基準位
置及び行基準位置の情報を有する入力画像を、行方向に
一定の重なりを持つ複数の領域に分割し、先頭の分割領
域から末尾の分割領域へ向かって分割領域毎に、行基準
位置より上下に水平射影を調べることにより目的単語領
域の行を切り出し、切り出した行の範囲について、先頭
基準位置の近傍の垂直射影を調べることによって目的単
語領域の先頭位置を検出し、検出した先頭位置の後の垂
直射影を調べることによって目的単語領域の末尾位置を
検出する単語領域抽出方式において、垂直射影を調べる
ことにより分割領域の末尾より連続する一定幅以上の黒
領域を探し、該黒領域を検出した分割領域における行切
り出しは該黒領域を除いた範囲の水平射影を調べること
により行なうとともに、その後の分割領域を行切り出し
及び末尾位置検出の処理対象から除外することを特徴と
する。
【0009】請求項2記載の発明は、前記請求項1記載
の発明において、ある分割領域に末尾より連続した一定
幅以上の黒領域を検出しないが、その末尾部分に一定幅
未満の黒領域を検出したときは、次の分割領域の先頭部
分について一定幅以上の黒領域を探し、それを検出した
ときは、当該ある分割領域の末尾部分の黒領域を末尾よ
り連続した一定幅以上の黒領域とみなして処理すること
を特徴とする。
【0010】請求項3記載の発明は、前記請求項1また
は2記載の発明において、分割領域毎の行切り出しの際
に、行の上端と下端よりそれぞれ行の中心寄りと推定さ
れるに二つの検出位置を設定し、該二つの検出位置の間
に行の上端または下端の少なくとも一方を検出できない
ときに限り、該二つの検出位置の間について求めた垂直
射影を用いて末尾より連続した一定幅以上の黒領域の検
出を行なうことを特徴とする。
【0011】
【作用】文書の用紙右端に近い単語をスキャナーで読み
取った場合、用紙の右端より外側が黒領域として読み取
られることがある。また、写真のような黒として読み取
られるような領域の左側にある単語を読み取った場合に
も、同様に写真等の部分が黒領域として読み取られるこ
とがある。ディスプレイ画面上での領域指定による入力
画像の場合でも、同様なことが起こることがある。
【0012】請求項1ないし3記載の発明によれば、そ
のような目的単語の後ろの黒領域の範囲を排除して行切
り出しを行なうため、用紙右端に接近した単語や写真の
左側に接近した単語の領域を正しく抽出できる。
【0013】なお、前記ガイドライン付きハンディスキ
ャナー装置または前記ガイドライン付き枠を用いて画像
の読み取りまたは領域指定を行なう場合、単語の先頭側
の位置合わせを行なうため、目的の単語が用紙の左端に
接近していたり、あるいは、その左に接近して写真等が
あっても、目的単語の前側の黒領域の入力は容易に避け
ることができる。したがって、請求項1ないし3記載の
発明は、目的単語の前側の黒領域については考慮してい
ないが、実用上問題はない。ただし、必要であれば、単
語先頭側の黒領域除去も含めるように変更することも当
然許される。
【0014】入力画像の分割領域の境界部分に用紙端が
位置したような場合、前側の分割領域の末尾部分で検出
される黒領域の幅が一定幅未満となることがある。この
ような場合においても、請求項2記載の発明によれば、
用紙外部に対応した黒領域の範囲を排除した行切り出し
を効率的かつ確実に行なうことができる。
【0015】請求項3記載の発明によれば、目的単語領
域の行切り出しが期待通りにできなかった場合にのみ、
用紙外や写真等に対応した黒領域の検出処理を行なうた
め、処理に無駄がなく効率的である。
【0016】
【実施例】図1は本発明を実施するためのシステムの一
例を示すブロック図である。1は処理や各種制御を実行
するCPU、2はオペレーティングシステムや本発明に
係る単語領域抽出処理、その他アプリケーションのプロ
グラムなどを記憶するためのプログラムメモリ、3は処
理の中間データや処理結果データなどを記憶するための
データメモリ、4と5はCRTディスプレイとそのイン
タフェース、6は画像データを記憶するための画像メモ
リ、7と8はマウスとキーボード、9はそのインタフェ
ース、10は画像データファイルなどのデータファイル
やオペレーティングシステムや各種プログラムファイル
を保存するための補助記憶装置、11はそのインタフェ
ース、12と13はガイドライン付きハンディスキャナ
ー装置とそのインタフェースである。
【0017】単語領域抽出処理の対象となる入力画像は
、ハンディスキャナー装置12より直接入力され画像メ
モリ6に取り込まれた画像であるか、あるいは、補助記
憶装置10より画像メモリ6に取り込まれた画像のCR
Tディスプレイ3の画面上で領域指定された部分画像で
ある。
【0018】いずれにしても、図2に示すように、単語
領域抽出処理の対象となる入力画像20は、目的単語領
域の先頭基準位置であるスタートライン21と目的単語
領域の行基準位置であるセンターライン22の情報を持
っている。
【0019】ここで、ハンディスキャナー装置12は、
図3に示すような読み取り窓30を通して原稿の画像を
読み取るもので、この読み取り窓30と原稿上の目的単
語領域との位置合わせのためのガイドラインとしてスタ
ートライン31とセンターライン32とを持っている。 図2のスタートライン21とセンターライン22はスタ
ートライン31とセンターライン32の中心線にそれぞ
れ対応する。このようなハンディスキャナー装置12に
よって文書画像を読み込む場合、原稿上の目的単語領域
の先頭(左端)にスタートライン31を、また目的単語
領域の行の中心にセンターライン32の中心を、ほぼ一
致させるように読み取り窓30の位置合わせをし、読み
取り窓30の領域の画像を読み込む。
【0020】また、大型イメージスキャナー装置などに
よってページ単位で読み取られて補助記憶装置10に格
納されている文書画像中の単語領域抽出を行なう場合、
必要ページの文書画像を画像メモリ6に読み込み、これ
をCRTディスプレイ6の画面に表示させ、入力画像の
領域を指定する。図4はこの入力画像領域指定の説明図
であり、画面40に図3に示した読み取り窓30と同様
の、単語領域より大きな枠41を文書画像と重ねて表示
し、スタートライン42を目的の単語(ここでは“Re
cognition”)の領域の先頭と、かつセンター
ライン43を目的単語領域の行と、ほぼ一致させるよう
に枠41を移動させる。この枠41内の部分画像が単語
領域抽出処理の入力画像となる。図2のスタートライン
21とセンターライン22はスタートライン42とセン
ターライン43の中心線にそれぞれ対応する。
【0021】次に、入力画像(その画像データは画像メ
モリ6上にある)より目的の単語領域を抽出する処理を
説明する。この処理の全体の流れは図5に示す通りであ
る。以下、各処理段階について説明する。
【0022】分割領域の設定1   まず、図2に示した基準位置情報付きの入力画像2
0を行方向に複数の領域に分割する。隣合う分割領域は
一部重なりを持たせる。入力画像20を3分割した例を
図6に示す。なお、この例のように左端の分割領域にス
タートライン21が含まれるように分割領域の大きさを
選ぶ。
【0023】分割領域単位の行切り出し2  一つの分
割領域についての処理の概要を図7に示す。 なお、この行切り出し処理は左端(先端)の分割領域か
ら右端(末尾)の分割領域へ向かって順に実行する。
【0024】処理ステップ101(行端探索開始位置の
設定)   対象としている分割領域内の各ライン(走査ライン
)の水平(x方向=行方向)射影を調べ、その値が閾値
以上のときに水平射影をオン、閾値未満のときにオフと
する。行端すなわち行の範囲の上端または下端の探索と
は、あるラインの位置から上または下へ向かって水平射
影がオンからオフへ変化するライン位置を順に調べてい
く操作である。この「あるライン位置」が、ここでいう
行端探索開始位置である。
【0025】まず、左端の分割領域の場合について説明
する。センターライン22の位置するラインの水平射影
がオンであるか調べ、オンの場合は、その上下にノイズ
高さ(ノイズとみなし得る微小黒領域のy方向最大幅)
以上の範囲にわたって、水平射影がオンのラインが連続
しているときは、センターライン22のライン位置を当
該分割領域の行端探索開始位置とする。センターライン
22のライン位置の水平射影がオフの場合、ノイズ高さ
以上連続して水平射影がオンしている範囲すなわち行を
探索し、見つけた行のうちでセンターライン22の位置
に最も近い行(注目する行で現在行と呼ぶ)の中心のラ
イン位置を当該分割領域の行端探索開始位置とする。
【0026】ただし、行端探索開始位置のy座標Yは次
の条件 画像高さ×1/4<Y<画像高さ×3/4を満足しなけ
ればならない。この条件を満足する行端探索開始位置を
設定できない場合、イメージスキャナー装置12の読み
取り位置設定のエラー、またはCRTディスプレイ4の
画面上での枠位置設定のエラーと判断し、この段階で単
語領域抽出処理は異常終了となる。
【0027】次に左端以外の分割領域の場合について説
明する。センターライン22のライン位置に代えて、左
隣の分割領域において抽出された現在行(目的の単語領
域の行とみなされた行)の中心のライン位置を起点とし
て、左端の分割領域の場合と同様の手順により行端探索
開始位置を求める。
【0028】ただし、行端探索開始位置のy座標Yの満
足すべき条件は、 左隣分割領域の現在行上端+ノイズ高さ<Yかつ Y<左隣分割領域の現在行下端−ノイズ高さである。こ
のような条件を満足する行端探索開始位置が設定できな
い場合、行切り出し処理は正常終了となる。 目的の単語領域の後(右)に十分な空白が存在し、その
空白部分の分割領域の場合に、このような正常終了とな
る。
【0029】処理ステップ102(黒領域検出位置の設
定)   単語領域の右側の黒領域(用紙右端外部や写真部分
)は垂直射影を基に検出するが、この垂直射影を調べる
範囲の上下の限界として上下の黒領域検出位置をここで
設定する。行の切り出し(行の上下の端の検出)は、行
端探索開始位置より上下に水平射影を調べることにより
行なうが、処理の効率を上げるために、次の処理ステッ
プ103で上下の黒領域検出位置までの範囲で行切り出
しを完了しない場合に限って黒領域検出を行なうため、
黒領域検出位置は行の上下端より中心寄りの位置に設定
する必要がある。そこで次のような方法で設定する。
【0030】まず先頭(左端)の分割領域を処理してい
る場合である。この場合、切り出そうとしている行の上
下端の位置を推測できないので、行の高さを読み取り対
象として想定した最小の行高さ、行中心を行探索開始位
置として仮定しデフォルトとして与えられた行上端より
少し下の位置と行下端より少し上の位置を上と下の黒領
域検出位置に設定する。
【0031】次は処理している分割領域が先頭の分割領
域以外の場合である。この場合、左隣の分割領域で切り
出されている現在行(目的単語領域とみなされる行)か
ら、処理中分割利領域で切り出そうとしている行の高さ
を推定することができるので、図8に示すように、左隣
分割領域の現在行の高さhcの3分の1だけ行中心から
離れた上下の位置を上下の黒領域検出位置として設定す
る。
【0032】処理ステップ103(黒領域検出位置まで
の行端探索)   処理ステップ101で設定した行端探索開始位置よ
り上向きと下向きに水平射影がオンからオフへ変化する
行端の探索を、処理ステップ102で設定した上下の黒
領域検出位置まで行なう。上下の行端が両方とも検出さ
れた場合は、現在行の切り出しを完了したとして行切り
出しを終了するが、上下いずれかの一方または両方の行
端が検出されない場合は、行端探索を打ち切り処理ステ
ップ104の処理に分岐する。
【0033】処理ステップ104(黒領域の検出)  
ここで検出しようとしている黒領域は単語領域の右側に
ある用紙外部や写真などに対応した黒領域である。上の
黒領域検出位置から下の黒領域検出位置までの垂直射影
を求め、行端探索を打ち切られた時点での現在行の高さ
の4分の5の値を射影閾値として、図9に示すように、
分割領域の末尾から左向きに、垂直射影値が射影閾値を
越える黒領域を探し、その幅を探す。ただし、対象とな
るのは、分割領域の末尾から連続する最初に見つけた黒
領域である。そして、この黒領域の幅が、予め設定され
た幅閾値を越える場合は、目的の黒領域であると判断し
、その少し前の位置から先頭までの範囲を、次の処理ス
テップ105で水平射影を調べる範囲とする。
【0034】他方、黒領域の幅が幅閾値未満の場合は、
次の補助的な処理を実行する。すなわち、この場合は、
処理中の分割領域の末尾部分に黒領域の一部が存在した
ために幅が不十分である可能性があるので、右隣の分割
領域の先頭部分について、現在の分割領域の現在行の範
囲の垂直射影を計算し、上に説明したと同様の方法で分
割領域先頭より連続する一定幅を越える黒領域の検出を
行ない、それが見つかった場合は、現在の分割領域の末
尾部分の黒領域を目的の黒領域とみなす。
【0035】また、現在の分割領域で目的の黒領域を検
出した場合は、次の分割領域以降は単語領域抽出の対象
から除外する。
【0036】処理ステップ105(行端探索)  この
処理ステップの内容は図10に示すフローチャートの通
りである。
【0037】処理ステップ104で検出された黒領域を
除外した範囲について、水平射影を調べることにより、
行端探索開始位置から上向きまたは下向きに行端を探索
するが、行端探索開始位置から十分離れた位置まで探索
を進めても行端を発見できないときは、隣合った行が接
続していると考えられるので、ある位置までで行端探索
を打ち切るべきである。そこでステップ105aにおい
て、そのような探索限界である行端探索打ち切り位置を
設定する。
【0038】左端の分割領域においては、行の高さ(y
方向幅)を推定する情報がないため、処理対象とする文
字の高さの最大値より多少大きな高さだけ行端探索開始
位置から離れた位置を行端探索打ち切り位置とする。左
端の分割領域以外の分割領域については次の通りである
【0039】まず、左隣の分割領域で現在行だけが検出
され、その前(上)の行も次(下)の行も検出されてい
ない場合、図11に示すように、左隣の分割領域におけ
る現在行の高さをhcとして、同現在行の上端からhc
だけ上の位置を上側の行端探索打ち切り位置とし、現在
行の下端からhcだけ下の位置を下側の行端探索打ち切
り位置とする。ただし、このようにして求めた打ち切り
位置が画像の上端または下端を越えている場合は、画像
の上端または下端を打ち切り位置とする。
【0040】他方、左隣の分割領域で現在行のみならず
前の行または次の行も検出されている場合、左隣の分割
領域の現在行の上端または下端からhcだけ上または下
の位置が、前の行の下端より下または次の行の上端より
上ならば、それぞれの位置を上側または下側の行端探索
打ち切り位置とする。しかし、図12に示すように、現
在行の上端からhcだけ上の位置が前の行の下端より上
のときは、両位置の中点位置を上側の打ち切り位置とし
、同様に現在行の下端からhcだけ下の位置が次行の上
端より下のときは、両位置の中点位置を下側の打ち切り
位置とする。
【0041】次に、行端探索開始位置から下向きに水平
射影がオンからオフへ変化する行端の探索を打ち切り位
置まで行なう(ステップ105b)。行端が検出された
場合は、この行端を現在行の下端とし、さらに下向きに
水平射影が再びオンする位置すなわち現在行の次(下)
の行の上端を探索する(ステップ105c)。
【0042】ステップ105bの処理で行端が検出され
なかった場合、現在行と次行とが接続していると判断さ
れるので、接続行の強制分離の処理(ステップ105d
)を行なう。すなわち、左端の分割領域においては、図
13に示すように、行端探索開始位置と下側の行端探索
打ち切り位置とを1:3に内分する位置から、下側の行
端探索打ち切り位置までの範囲内で水平射影の値が最小
の位置を、現在行の下端とする。左端の分割領域以外の
分割領域においては、図14に示すように、左隣の分割
領域での現在行の下端からhc/4(hcは現在行の高
さ)だけ上の位置より下側の打ち切り位置までの範囲内
で水平射影の値が最小の位置を、当該分割領域における
現在行の下端とする。
【0043】ステップ105cまたは105dの次に、
行端探索開始位置より上向きに水平射影がオンからオフ
へ変化する行端の探索を行端探索打ち切り位置まで行な
う(ステップ105e)。
【0044】行端が検出された場合は、この行端を現在
行の上端とし、さらに上向きに水平射影が再びオンする
位置すなわち現在行の前(上)の行の下端を探索する(
ステップ105f)。
【0045】ステップ105eの処理で行端が検出され
なかった場合、現在行と次行とが接続していると判断し
、接続行の強制分離の処理(ステップ105g)を行な
う。すなわち、左端の分割領域においては、図15に示
すように、行端探索開始位置と上側の行端探索打ち切り
位置とを1:3に内分する位置から打ち切り位置までの
範囲内で水平射影の値が最小の位置を、現在行の上端と
する。左端の分割領域以外の分割領域においては、図1
6に示すように、左隣の分割領域での現在行の上端から
hc/4(hcは現在行の高さ)だけ下の位置より上側
の打ち切り位置までの範囲内で水平射影値が最小の位置
を、当該分割領域における現在行の上端とする。
【0046】最後のステップ105hでは、ステップ1
05d及び105gにおける行の強制分離の妥当性を行
の高さや左隣の分割領域での現在行の行端などからチェ
ックし、分離位置が不適当で統合すべきときは統合を行
なって現在行の範囲を修正する。行間が狭い文書や目的
の単語に接近して罫線がある文書などは、その画像のス
キューが大きい場合などに行接続が起こりやすい。この
ような行接続が起こった場合でも、以上のような分割領
域単位の行切り出し処理により、適切な行切り出しが可
能であるため、次の単語先頭及び末尾の検出処理を正常
に行ない目的の単語領域を抽出可能となる。
【0047】単語先頭の検出3   処理の内容は図17に示す通りである。この単語先
頭検出は、スタートライン21の位置を基準として、先
に切り出された現在行の範囲内の垂直射影を調べること
により単語の先頭文字の左端を検出するもので、先頭文
字とスタートラインとの位置関係としては図18の(a
),(b)または(c)に示すような場合がある。 ただし、行切り出し処理で黒領域が検出された分割領域
から後の分割領域は処理対象から排除されることは前述
の通りである。
【0048】まずスタートライン位置の垂直射影値を閾
値と比較し(ステップ201)、閾値未満であれば図1
8の(a)のような場合である可能性が大きいので、ス
タートライン位置より右側に垂直射影値が閾値以上とな
る位置を探し、その位置を先頭文字の左端すなわち単語
領域の先頭位置として仮決定し(ステップ202)、そ
の位置より右に垂直射影値が閾値以上の範囲がある値以
上続いているか調べる(ステップ203)。垂直射影値
が閾値以上の範囲が一定値以上続いているときは、図1
8の(a)のような場合であるので、仮決定した先頭位
置を本決定してデータメモリ3に書き込む(ステップ2
04)。
【0049】ただし、図18の(a)の場合でも、スタ
ートラインと先頭文字との間のスペース内のノイズがス
テップ202で先頭位置として検出されることがある。 この場合、次のステップ203で条件を満足しないので
、ステップ202に戻り、さらに右へ先頭文字を探すこ
とにより、最終的に先頭文字の左端すなわち単語領域の
先頭位置を検出する。
【0050】図18の(b)または(c)の場合のよう
に、スタートラインがある文字に重なっている場合、ス
テップ201で垂直射影値が閾値以上と判定されるので
、スタートラインから左と右に垂直射影値が閾値未満と
なる位置を探し、その位置をスタートラインと重なった
文字の左端と右端とする(ステップ205)。そして、
注目している文字の幅が一定値以上であるか調べる(ス
テップ206)。文字幅が一定値以上であれば、間違い
なくスタートラインの位置は文字内であるので、ステッ
プ205で検出した左端と右端のいずれがスタートライ
ンに近いか調べる(ステップ207)。左端のほうがス
タートラインに近いならば、図18の(c)の場合であ
るので、ステップ205で検出した左端の位置を単語領
域の先頭位置に決定し、データメモリ3に書き込む。
【0051】ステップ207で右端のほうがスタートラ
インに近いと判定したときは、図18の(b)のように
先頭文字より前の文字がスタートラインと重なっている
場合であるので、ステップ202に分岐し、さらに右に
単語領域の先頭を探す。
【0052】また、ステップ206で文字幅が一定値未
満と判定されたときは、図18の(a)のような場合で
あるが、これはスタートラインの直下にノイズがあると
判断されるので、ステップ202に分岐して先頭位置を
検出する。
【0053】単語末尾検出処理4   処理内容は図19に示す通りである。この処理は、
単語の先頭文字を起点として、隣合う文字の間のスペー
スを調べ、スペース幅が狭い文字は単語内と判断し、広
いスペースが見つかったときは、その前の方の文字を末
尾単語とし、その右端を単語領域の末尾位置として検出
するものである。図20はその説明図である。
【0054】まず、スペースが広いか狭いかの判定のた
めのスペース幅閾値を求める(ステップ301)。すな
わち、先に検出された行の高さ(または垂直射影値の最
大値)と予め設定された文字の縦横比とから基準文字幅
を計算する。この基準文字幅の1.5倍の値と、先に検
出された先頭文字の前のスペースの幅とを比較し、その
スペース幅のほうが大きいときは、先頭文字の前のスペ
ースを無効とする。同様に、基準文字幅の0.5倍の値
と、先頭文字の前のスペースとを比較し、そのスペース
幅のほうが小さいときも先頭文字の前のスペースを無効
とする。
【0055】そして、先頭文字の前のスペースが無効と
された場合は、計算により求めた基準文字幅の4分の1
の値をスペース幅閾値に決定する。先頭文字の前のスペ
ースが有効の場合は、そのスペース幅の2分の1の値と
基準文字幅の4分の1の値の平均をスペース幅閾値とす
る。
【0056】このようにしてスペース幅閾値を決定する
と、先頭文字を注目文字に設定し(ステップ302)、
注目文字の右の垂直射影を調べることにより、注目文字
の右に隣接する文字を探す(ステップ303)。右に隣
接する文字が見つからないときは、その時の注目文字を
単語の末尾文字とし、その右端位置を単語末尾位置とし
て検出し、これをデータメモリ3に書き込む(ステップ
304)。
【0057】注目文字の右隣接文字が見つかったときは
、両文字間のスペースの幅を求めてスペース幅閾値と比
較し(ステップ305)、スペース幅がスペース幅閾値
以上であれば注目文字を末尾文字とし、その右端を単語
領域末尾位置として検出する(ステップ304)。スペ
ース幅がスペース幅閾値より小さいときは、右側の文字
を改めて注目文字に設定し(ステップ306)、ステッ
プ303からの処理を行なう。
【0058】以上の処理により、単語の右側の用紙外部
や写真等が一緒に読み取られた画像中の単語であっても
、その領域を抽出することができる。また、領域分割を
行なって処理するため、画像のスキューの影響を本質的
に受けにくい。
【0059】
【発明の効果】以上説明したように、請求項1ないし3
記載の発明によれば、入力画像に用紙端外部や写真等の
黒領域が含まれていても、その範囲を排除して処理する
ことにより、用紙端や写真等に接近した単語の領域でも
確実に抽出することができるようになる。これは、単語
入力を目的としたシステムの使い勝手を大幅に改善でき
、その効果は非常に大きい。また、黒領域除去の処理の
工夫により、単語領域抽出処理全体を効率的に行なうこ
とができる。
【図面の簡単な説明】
【図1】本発明を実施するためのシステムの一例を示す
ブロック図である。
【図2】入力画像の説明図である。
【図3】ガイドライン付きハンディスキャナー装置の読
み取り窓及びガイドラインの説明図である。
【図4】ディスプレイ画面上での入力画像領域の指定方
法及びガイドライン付き枠の説明図である。
【図5】単語領域抽出処理の全体的流れを示すフローチ
ャートである。
【図6】入力画像の領域分割の一例の説明図である。
【図7】分割領域毎の行切り出し処理のフローチャート
である。
【図8】黒領域検出位置の設定の説明図である。
【図9】黒領域検出の説明図である。
【図10】図7の処理ステップ105のフローチャート
である。
【図11】行端探索打ち切り位置の設定方法の説明図で
ある。
【図12】行端探索打ち切り位置の設定方法の説明図で
ある。
【図13】行下端側の接続強制分離の説明図である。
【図14】行下端側の接続強制分離の説明図である。
【図15】行上端側の接続強制分離の説明図である。
【図16】行上端側の接続強制分離の説明図である。
【図17】単語先頭検出処理のフローチャートである。
【図18】スタートラインと単語との位置関係の説明図
である。
【図19】単語末尾検出処理のフローチャートである。
【図20】単語末尾検出の説明図である。
【符号の説明】
1  CPU 2  プログラムメモリ 3  データメモリ 4  CRTディスプレイ 6  画像メモリ 7  マウス 8  キーボード 10  補助記憶装置 12  ガイドライン付きハンディスキャナー装置20
  入力装置 21  スタートライン 22  センターライン 30  読み取り窓 31  スタートライン 32  センターライン 40  画面 41  枠 42  スタートライン 43  センターライン

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】  抽出すべき目的単語領域の先頭基準位
    置及び行基準位置の情報を有する入力画像を、行方向に
    一定の重なりを持つ複数の領域に分割し、先頭の分割領
    域から末尾の分割領域へ向かって分割領域毎に、行基準
    位置より上下に水平射影を調べることにより目的単語領
    域の行を切り出し、切り出した行の範囲について、先頭
    基準位置の近傍の垂直射影を調べることによって目的単
    語領域の先頭位置を検出し、検出した先頭位置の後の垂
    直射影を調べることによって目的単語領域の末尾位置を
    検出する単語領域抽出方式において、垂直射影を調べる
    ことにより分割領域の末尾より連続する一定幅以上の黒
    領域を探し、該黒領域を検出した分割領域における行切
    り出しは該黒領域を除いた範囲の水平射影を調べること
    により行なうとともに、その後の分割領域を行切り出し
    及び末尾位置検出の処理対象から除外することを特徴と
    する単語領域抽出方式。
  2. 【請求項2】  ある分割領域に末尾より連続した一定
    幅以上の黒領域を検出しないが、その末尾部分に一定幅
    未満の黒領域を検出したときは、次の分割領域の先頭部
    分について一定幅以上の黒領域を探し、それを検出した
    ときは、当該ある分割領域の末尾部分の黒領域を末尾よ
    り連続した一定幅以上の黒領域とみなして処理すること
    を特徴とする請求項1記載の単語領域抽出方式。
  3. 【請求項3】  分割領域毎の行切り出しにおいて、行
    の上端と下端よりそれぞれ行の中心寄りと推定されるに
    二つの検出位置を設定し、該二つの検出位置の間に行の
    上端または下端の少なくとも一方を検出できないときに
    限り、該二つの検出位置の間について求めた垂直射影を
    用いて末尾より連続した一定幅以上の黒領域の検出を行
    なうことを特徴とする請求項1または2記載の単語領域
    抽出方式。
JP2418960A 1990-12-20 1990-12-20 単語領域抽出方式 Pending JPH04330586A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2418960A JPH04330586A (ja) 1990-12-20 1990-12-20 単語領域抽出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2418960A JPH04330586A (ja) 1990-12-20 1990-12-20 単語領域抽出方式

Publications (1)

Publication Number Publication Date
JPH04330586A true JPH04330586A (ja) 1992-11-18

Family

ID=18526701

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2418960A Pending JPH04330586A (ja) 1990-12-20 1990-12-20 単語領域抽出方式

Country Status (1)

Country Link
JP (1) JPH04330586A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000215214A (ja) * 1998-12-22 2000-08-04 Xerox Corp 複数文書ジャンル用ダイナミックコンテントデ―タベ―ス処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000215214A (ja) * 1998-12-22 2000-08-04 Xerox Corp 複数文書ジャンル用ダイナミックコンテントデ―タベ―ス処理方法

Similar Documents

Publication Publication Date Title
US4748678A (en) Method of storing and retrieving image data
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
US5123062A (en) OCR for sequentially displaying document layout according to recognition process
US7068855B2 (en) System and method for manipulating a skewed digital image
JP2008071076A (ja) 画像抽出装置
US20210286991A1 (en) Image processing apparatus, image processing method, and storage medium
EP0461760B1 (en) Image processing apparatus and method
JPH04330586A (ja) 単語領域抽出方式
JPH08180068A (ja) 電子ファイリング装置
JP3787377B2 (ja) 文書方向判定方法及び装置及び文字認識方法及び装置
JPH11259597A (ja) フォーマット認識装置及び文字読み取り装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP3548234B2 (ja) 文字認識方法及び装置
JPH08329187A (ja) 文書読取装置
JPS61253587A (ja) 光学文字読取装置
JP3122476B2 (ja) 自動文書清書装置
JP3348224B2 (ja) 表枠線の交点補正装置および表認識装置および光学文字読取装置
JP3604909B2 (ja) 画像間位置合わせ方法
JPH117493A (ja) 文字認識処理装置
JPH04112282A (ja) 単語領域抽出方式
JPH09269970A (ja) 文字認識方法とその装置
JP2001236464A (ja) 文字抽出方法、文字抽出装置及び記憶媒体
JP2022186250A (ja) 画像処理装置、画像処理方法、及びプログラム
JP4001846B2 (ja) 画像表示装置、画像表示方法、画像表示プログラムおよび画像表示プログラムを格納した記録媒体
JPH03250387A (ja) 文字切出し方式