JPH0728933A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0728933A
JPH0728933A JP5192747A JP19274793A JPH0728933A JP H0728933 A JPH0728933 A JP H0728933A JP 5192747 A JP5192747 A JP 5192747A JP 19274793 A JP19274793 A JP 19274793A JP H0728933 A JPH0728933 A JP H0728933A
Authority
JP
Japan
Prior art keywords
block
character
row
line
circumscribing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5192747A
Other languages
English (en)
Inventor
Naohiro Amamoto
直弘 天本
Sadamasa Hirogaki
節正 広垣
Yoshitaka Hamaguchi
佳孝 濱口
Makoto Torigoe
真 鳥越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5192747A priority Critical patent/JPH0728933A/ja
Publication of JPH0728933A publication Critical patent/JPH0728933A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【構成】 読取部1は文書Aのイメージデータを読取
り、領域抽出部2はこのイメージデータから文字領域を
抽出する。外接矩形抽出部3は文字領域で連結している
画素集合の外接矩形ブロックを抽出する。ヒストグラム
作成部4は、外接矩形ブロックの個数からヒストグラム
を作成する。極大点検出部5は、ヒストグラムの極大点
を検出し、行候補ブロック抽出部6は、極大点を与える
ライン上に存在する外接矩形ブロックを行候補ブロック
とする。行ブロック抽出部7は、行候補ブロックを含む
最小の矩形を行ブロックとして抽出する。文字切出し部
8は、この行ブロックに基づき文字切出しを行い、文字
認識部9は文字切出しされた文字に対して文字認識処理
を行う。 【効果】 行間が狭い文書等でも正確な文字行の切出し
を行うことができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、OCR(光学
式文字読取装置)等に用いられ、文書画像から文字認識
を行う文字認識装置に関する。
【0002】
【従来の技術】一般に、光学式文字読取装置では、帳票
等に記入された活字や手書き文字といった文書の画像を
読取り、この文書画像から文字認識を行っている。この
ような文字認識の手順としては、先ず、帳票等の媒体か
ら文書画像を読取り、これから各々の行(文字列)を形
成する画像を抽出する(切出す)ことが必要である。
【0003】従来では、この切出し方法として、例え
ば、特開平3−216782号公報に示すように、文書
画像を文字列方向に所定の長さに分割し、分割された各
領域毎に文字列の射影をとって文字列を切出し、各領域
間での文字列を切出し、各領域間での文字列の連続性を
検出し、文字列を切出すよう構成されていた。
【0004】
【発明が解決しようとする課題】しかしながら、例え
ば、欧文の文書のように、行間が狭い文書あるいは行間
の文字が重なり合っている文書の場合、行間を判別する
ことができないため、正確な文字列を切出すことができ
なかった。また、切出し結果を文字認識の入力とする場
合、文書画像を文字列方向に分割し、文字列を切出して
いるため、各分割領域間での文字列の接続部分に存在す
る文字等に対して、複雑な処理を必要とするという問題
点もあった。
【0005】本発明は、上記従来の問題点を解決するた
めになされたもので、行間が狭い文書あるいは文字が重
なりあっている文書から正確な文字行を切出して文字認
識を行うことができる文字認識装置を提供することを目
的とする。
【0006】
【課題を解決するための手段】第1発明の文字認識装置
は、文字を含むイメージデータから、連結している画素
集合の外接矩形ブロックを抽出する外接矩形抽出部と、
前記外接矩形抽出部で抽出された外接矩形ブロックに基
づき、文字の進行方向と平行なライン上に存在する外接
矩形ブロックの個数からヒストグラムを作成するヒスト
グラム作成部と、前記ヒストグラムから極大点を検出す
る極大点検出部と、前記極大点を与えるライン上に存在
する前記外接矩形ブロックを行候補ブロックとする行候
補ブロック抽出部と、前記行候補ブロックを含む最小の
矩形を行ブロックとして抽出する行ブロック抽出部と、
前記行ブロック抽出部で抽出された行ブロック内の文字
に対して文字認識を行う文字認識部とを備えたことを特
徴とするものである。
【0007】第2発明の文字認識装置は、第1発明にお
いて、行ブロック抽出部は、抽出された外接矩形ブロッ
クのうち、どの行ブロックにも属さない外接矩形ブロッ
クがあった場合、当該外接矩形ブロックの面積に対す
る、当該外接矩形ブロックと任意の行ブロックの重複部
分の面積を比較し、これが所定値以上であった場合に、
当該外接矩形ブロックを含んだ最小の矩形を行ブロック
として抽出するよう構成されていることを特徴とするも
のである。
【0008】第3発明の文字認識装置は、第1または第
2発明において、行ブロック抽出部は、抽出された外接
矩形ブロックのうち、どの行ブロックにも属さない外接
矩形ブロックがあった場合、当該外接矩形ブロックに最
も近い外接矩形ブロックとの距離と基準値とを比較し、
基準値以上の距離であった場合は当該外接矩形ブロック
が単独文字であると判定し、基準値以内の距離であった
場合は、当該外接矩形ブロックを含んだ最小の矩形を行
ブロックとして抽出するよう構成されていることを特徴
とするものである。
【0009】
【作用】第1発明の文字認識装置においては、読取部は
文書のイメージデータを読取り、領域抽出部はこのイメ
ージデータから文字領域を抽出する。外接矩形抽出部は
文字領域で連結している画素集合の外接矩形ブロックを
抽出する。そして、ヒストグラム作成部は、文字の進行
方向と平行なラインに存在する外接矩形ブロックの個数
からヒストグラムを作成する。次に、極大点検出部は、
ヒストグラムの極大点を検出し、更に、行候補ブロック
抽出部は、極大点を与えるライン上に存在する外接矩形
ブロックを行候補ブロックとする。また、行ブロック抽
出部は、行候補ブロックを含む最小の矩形を行ブロック
として抽出する。そして、文字切出し部は、行ブロック
抽出部で抽出された行ブロックに基づき文字切出しを行
い、更に、文字認識部はこの文字切出し部で切出された
文字に対して文字認識処理を行う。
【0010】第2発明の文字認識装置においては、抽出
された外接矩形ブロックのうち、どの行ブロックにも属
さない外接矩形ブロックがあった場合、即ち、行候補ブ
ロック抽出部で行候補ブロックとして抽出されなかった
外接矩形ブロックがあった場合、その外接矩形ブロック
の面積に対する、当該外接矩形ブロックと任意の行ブロ
ックの重複部分の面積を比較する。そして、比較の結
果、例えば重複部分が外接矩形ブロックの1/2以上を
占めている等、所定値以上であった場合は、その外接矩
形ブロックを含んだ最小の矩形を行ブロックとして抽出
する。
【0011】第3発明の文字認識装置においては、上記
第2発明の文字認識装置の重複部分の面積による統合条
件を満たさない外接矩形ブロックがあった場合、例え
ば、いずれかの行ブロックと重複はしているが、その重
複面積が外接矩形ブロックの1/2以下であるといった
場合、行ブロック抽出部は、先ず、その外接矩形ブロッ
クに最も近い外接矩形ブロックとの距離を求める。次
に、求めた距離と予め決定された基準値とを比較し、そ
の距離が基準値以上であった場合は当該外接矩形ブロッ
クが単独文字であると判定し、独立した行ブロックとす
る。一方、基準値以内の距離であった場合は、当該外接
矩形ブロックを含んだ最小の矩形を行ブロックとして抽
出する。
【0012】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図1は本発明の文字認識装置の実施例を示す
ブロック図である。図の装置は、読取部1、領域抽出部
2、外接矩形抽出部3、ヒストグラム作成部4、極大点
検出部5、行候補ブロック抽出部6、行ブロック抽出部
7、文字切出し部8、文字認識部9からなる。
【0013】読取部1は、文書Aを光学的に読取り、文
字を含むイメージデータを出力する機能を有している。
領域抽出部2は、読取部1から出力されたイメージデー
タから、文字領域の抽出を行うものである。外接矩形抽
出部3は、領域抽出部2で領域抽出された文字領域から
ラベル付け処理等によって、ひとかたまりに連結してい
る画素の外接矩形ブロックを抽出する機能を有してい
る。尚、ラベル付け処理については後述する。ヒストグ
ラム作成部4は、外接矩形抽出部3で抽出された外接矩
形ブロックに基づき、文字の進行方向と平行なラインに
存在する外接矩形ブロックの個数からヒストグラムを作
成するものである。
【0014】極大点検出部5は、ヒストグラム作成部4
で作成されたヒストグラムから極大点を検出するもので
あり、行候補ブロック抽出部6は、この極大点を与える
ライン上に存在する外接矩形ブロックを行候補ブロック
とするものである。また、行ブロック抽出部7は、行候
補ブロックを含む最小の矩形を行ブロックとして抽出す
る機能を有している。尚、上記外接矩形抽出部3〜行ブ
ロック抽出部7で行切出し部としての機能を構成してい
る。更に、文字切出し部8は、上記外接矩形抽出部3〜
行ブロック抽出部7で行切出しされた文字列から各文字
の切出しを行う機能を有し、文字認識部9は、この文字
切出し部8で切出された文字に基づき文字認識を行う機
能を有している。
【0015】次に、上記構成の文字認識装置の動作につ
いて説明する。図2は、文字認識処理のフローチャート
である。先ず、外接矩形抽出部3は、領域抽出部2で領
域抽出の結果得られる文字領域からブロックの外接矩形
を抽出する(ステップS1)。この外接矩形抽出は、ラ
ベル付け処理や輪郭追跡等の手法で行う。以下にラベル
付け処理による外接矩形の抽出を説明する。
【0016】図3は、ラベル付け処理を示す説明図であ
る。本処理では、処理対象となる画像を2回走査する。
また、図3(a)は、この処理対象となる画像である。
この走査において、先ず1回目の走査では各黒画素毎に
仮ラベル値を与える。図3(b)は、左方向から右方向
へ走査した場合の仮ラベル値を示している。このラベル
値は、処理対象となっている画素の直上および左隣の画
素の値によって以下のように決められている。
【0017】(1)直上の画素のみが黒:直上の画素の
仮ラベル値と同じ値 (2)左隣の画素のみが黒:左隣の画素の仮ラベル値と
同じ値 (3)直上および左隣の画素が共に黒:直上の仮ラベル
値と同じ値 (4)直上および左隣の画素が共に白:新しい値 但し、(3)の場合、直上の画素と左隣の画素とで与え
られている仮ラベル値が異なる場合には、同一黒連結領
域に異なったラベル値が与えられることになるため、ラ
ベル値変換テーブルを用意する。
【0018】図3(c)はこのラベル値変換テーブルで
あり、仮ラベル値に対する同一ラベル値の関係は、以下
のようになっている。即ち、ある仮ラベル値に隣接する
ラベル値が異なる場合、そのうちで最も小さい値を同一
ラベル値とする。例えば、仮ラベル値が“1”の場合、
隣接する仮ラベル値はすべてこれより大きいため、同一
ラベル値も“1”である(尚、図中、仮ラベル値と同一
ラベル値が同じ場合は空白としている)。また、“2”
の場合も“1”と同様である。そして、“3”の場合、
隣接する仮ラベル値で最も小さい値は“1”であるた
め、同一ラベル値は“1”となる。以下、“4”〜
“8”の場合も同様に、同一ラベル値が、隣接する仮ラ
ベル値で最も小さい値となる。
【0019】更に、各黒連結領域に対して一意に番号が
与えられるように、ラベル値変換テーブルに所定の操作
を行う。即ち、同一ラベル値が、仮ラベル値と同じ値の
ものは、その仮ラベル値に対する同一ラベル値にする。
例えば“7”の場合ではその同一ラベル値が“4”であ
るため、この値“4”が仮ラベル値である場合の同一ラ
ベル値は“3”である。更に、仮ラベル値が“3”であ
る場合の同一ラベル値は“1”であり、この値“1”が
仮ラベル値である場合の同一ラベル値は“1”である。
従って、仮ラベル値“7”の同一ラベル値は“1”とな
る。この結果を示したのが図3(d)である。これによ
り、同一ラベル値は、1、2、5の3種類となり、これ
を連続番号となるよう演算処理を行うと、ラベル値変換
テーブルは図3(e)に示すようになる。
【0020】次に、処理対象の画像を1回目とは逆方
向、即ち、右下から左上に走査しながら、各黒画素毎に
与えられた仮ラベル値を、図3(e)に示されたラベル
値変換テーブルの値を用いて、各画素毎にラベル値の付
け直しを行う。この処理によって得られたのが図3
(f)の値である。図から明かなように、同一ブロック
は同一ラベル値となっている。そして、このような同一
ラベル値の集合の外接矩形を求めることによって、ひと
かたまりに連結している画素のブロック外接矩形を求め
ることができる。
【0021】次に、ヒストグラム作成部4は、文字領域
内で文字の進行方向と平行な各ライン上に存在するブロ
ックの個数からヒストグラムを作成する(ステップS
2)。図4は、ヒストグラム作成処理の説明図である。
図4(a)は、座標(xs,ys)から(xe,ye)
までの文字領域におけるnライン目付近のブロックの存
在を示している。ここで、例えば座標(ys)からn番
目のライン上には、七つのブロックが存在するため、ヒ
ストグラムの(ys+n)番目に“7”を登録する。こ
れを示しているのが図4(b)である。そして、このよ
うな処理を文字領域の全ライン(ys〜ye)について
行う。
【0022】次に、極大点検出部5は、ヒストグラム作
成部4で作成されたヒストグラムからその極大点を求め
る(ステップS3)。図5に、極大点の説明を示す。更
に、行候補ブロック抽出部6は、上記ステップS3の極
大点抽出処理で得られた各極大点について、行候補ブロ
ック抽出処理を行う(ステップS4)。この行候補ブロ
ック抽出処理は、極大点を与えるライン上に存在するブ
ロックを行候補ブロックとして抽出する。次いで、行ブ
ロック抽出部7は、これら行候補ブロックを含む最小の
矩形を行ブロックとして抽出する(ステップS5)。図
6は、行候補ブロックと行ブロックとの抽出処理の説明
図である。
【0023】次に、行ブロック抽出部7は、どの行ブロ
ックにも属さないブロックについて、これらのブロック
がどの行ブロックに属するかを判定し、ある行ブロック
の一部であると判定された場合は、その行ブロックとの
統合処理を行う(ステップS6)。
【0024】図7は、統合処理の内容を示す説明図であ
る。即ち、図7(a)の場合は、ブロックB1とブロッ
クB2のうち、ブロックB2は行ブロックの一部である
と判定され、行ブロックは図7(b)に示すように、ブ
ロックB2を含む最小の矩形に変更される。また、ここ
で用いた統合条件を以下に示す。 統合条件1:いずれかの行ブロックと重複している。 統合条件2:重複部分の面積がブロックの面積の1/2
以上を占めている。
【0025】このような、上記二つの統合条件を共に満
たす場合のみステップS6の統合処理を実施するもので
ある。尚、図7のブロックB1の場合は、統合条件1は
満たしているが、重複部分の面積がブロックB1の面積
の1/2以下であるため、統合処理を行わないものであ
る。
【0026】その後、行ブロック抽出部7は、全極大点
が終了したか否かを判定し(ステップS7)、まだ極大
点の処理が残っている場合は、ステップS4の行候補ブ
ロック抽出処理に戻る。そして、全極大点が終了した場
合は、上記ステップS6において統合条件を満たさなか
ったブロックについて、そのブロックが単独文字である
か否かを判定し、単独文字である場合はこのブロックを
独立した行ブロックとするといった処理を行う(ステッ
プS8)。
【0027】この単独ブロック処理で、単独文字である
か否かの判定は、いずれかの行ブロックに属しているブ
ロックのうち、判定対象になっているブロックと最も近
い距離にあるブロックとの距離を用いて行う。尚、ここ
でブロック間の距離とは、判定対象のブロックの対角線
の交点と、最も近い距離にあるブロックの対角線の交点
との距離としている。そして、行ブロック抽出部7は、
求めたブロック間の距離と、予め実験的に求めた一定値
THLとを比較し、ブロック間の距離が一定値よりも大
きければ単独文字と判定し、ブロックを単独の行ブロッ
クとする。一方、一定値よりも小さければ単独文字では
ないと判定し、最も近い距離にあるブロックの属する行
ブロックと統合、即ち、判定対象のブロックを含む最小
の矩形を行ブロックとするものである。
【0028】その後は、文字切出し部8で、上記行切出
し処理で切出された行の文字列に対して文字切出しを行
う(ステップS9)。この文字切出し方法としては、上
述したラベル付け処理による方法を用いることができ
る。即ち、文字列を構成する画素のうち、連結している
画素には同一のラベル値を付与し、このラベル値に基づ
き1文字を構成する領域(外接矩形)を判定するもので
ある。
【0029】図8は、ラベル付け処理による文字切出し
の一例を示す図である。図に示すように、文字列「fi
gure」の例えば「f」にはラベル値“1”といった
ように、各文字にラベル値が付与され、そして、同一の
ラベル値を持つ黒画素を囲む外接矩形を各々のラベル値
について求める。また、「i」のように、上下に分離し
た文字に関しては、二つの異なったラベル値が付与され
るため、以下の条件で統合処理を行う。
【0030】図9に統合条件の説明図を示す。統合条件
として、x方向にのみ重なっている、即ち、(ye1<
ys2)かつ(xs1≦xe2かつxe1≧xs2)の
条件を満たしている矩形は、分離文字として一つの矩形
に統合する。
【0031】文字切出し部8によって、各文字の外接矩
形が得られると、文字認識部9は、その外接矩形に基づ
き文字認識を行う(ステップS10)。そして、文字認
識が最終文字まで終了したか否かを判定し(ステップS
11)、最終文字ではない場合は、ステップS9からの
処理を繰り返し、最終文字であった場合は、文字認識処
理を終了する。
【0032】尚、上記実施例では、ステップS1におけ
るブロック外接矩形抽出処理やステップS9における文
字切出し処理をラベル付け処理を用いて行ったが、これ
に限定されるものではなく、他の方法であっても同様の
効果を奏する。
【0033】
【発明の効果】以上説明したように、第1発明の文字認
識装置によれば、画素集合の外接矩形ブロックを抽出し
てその個数からヒストグラムを作成し、その極大点を与
えるライン上に存在する外接矩形ブロックを行候補ブロ
ックとして、この行候補ブロックを含む最小の矩形を行
ブロックとして切出すようにしたので、行間が狭い文書
や文字が重なりあっているような文書から正確な文字行
を切出すことが可能となり、その結果文字認識を正確に
行うことができる。
【0034】第2発明の文字認識装置によれば、行ブロ
ック抽出部は、どの行ブロックにも属さない外接矩形ブ
ロックがあった場合、その外接矩形ブロックと任意の行
ブロックとの重複部分の面積によって統合するか否かを
判定するようにしたので、第1発明の効果に加えて、更
に行切出しが正確に行うことができる効果がある。
【0035】第3発明の文字認識装置によれば、行ブロ
ック抽出部は、どの行ブロックにも属さない外接矩形ブ
ロックがあった場合、その外接矩形ブロックに最も近い
外接矩形ブロックとの距離によって、最も近い外接矩形
ブロックの属する行ブロックと統合するか否かを判定す
るようにしたので、第1、第2発明の効果に加えて、更
に行切出しが正確に行うことができる効果がある。
【図面の簡単な説明】
【図1】本発明の文字認識装置のブロック図である。
【図2】本発明の文字認識装置における文字認識処理の
フローチャートである。
【図3】本発明の文字認識装置におけるラベル付け処理
の説明図である。
【図4】本発明の文字認識装置におけるヒストグラム作
成処理の説明図である。
【図5】本発明の文字認識装置における極大点の説明図
である。
【図6】本発明の文字認識装置における行候補ブロック
と行ブロックとの抽出処理の説明図である。
【図7】本発明の文字認識装置における統合処理の説明
図である。
【図8】本発明の文字認識装置における文字切出しの一
例を示す図である。
【図9】本発明の文字認識装置の文字切出しにおける統
合条件の説明図である。
【符号の説明】
3 外接矩形抽出部 4 ヒストグラム作成部 5 極大点検出部 6 行候補ブロック抽出部 7 行ブロック抽出部 9 文字認識部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鳥越 真 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文字を含むイメージデータから、連結し
    ている画素集合の外接矩形ブロックを抽出する外接矩形
    抽出部と、 前記外接矩形抽出部で抽出された外接矩形ブロックに基
    づき、文字の進行方向と平行なライン上に存在する外接
    矩形ブロックの個数からヒストグラムを作成するヒスト
    グラム作成部と、 前記ヒストグラムから極大点を検出する極大点検出部
    と、 前記極大点を与えるライン上に存在する前記外接矩形ブ
    ロックを行候補ブロックとする行候補ブロック抽出部
    と、 前記行候補ブロックを含む最小の矩形を行ブロックとし
    て抽出する行ブロック抽出部と、 前記行ブロック抽出部で抽出された行ブロック内の文字
    に対して文字認識を行う文字認識部とを備えたことを特
    徴とする文字認識装置。
  2. 【請求項2】 行ブロック抽出部は、抽出された外接矩
    形ブロックのうち、どの行ブロックにも属さない外接矩
    形ブロックがあった場合、当該外接矩形ブロックの面積
    に対する、当該外接矩形ブロックと任意の行ブロックの
    重複部分の面積を比較し、これが所定値以上であった場
    合に、当該外接矩形ブロックを含んだ最小の矩形を行ブ
    ロックとして抽出するよう構成されていることを特徴と
    する請求項1記載の文字認識装置。
  3. 【請求項3】 行ブロック抽出部は、抽出された外接矩
    形ブロックのうち、どの行ブロックにも属さない外接矩
    形ブロックがあった場合、当該外接矩形ブロックに最も
    近い外接矩形ブロックとの距離と基準値とを比較し、基
    準値以上の距離であった場合は当該外接矩形ブロックが
    単独文字であると判定し、基準値以内の距離であった場
    合は、当該外接矩形ブロックを含んだ最小の矩形を行ブ
    ロックとして抽出するよう構成されていることを特徴と
    する請求項1または2に記載の文字認識装置。
JP5192747A 1993-07-07 1993-07-07 文字認識装置 Pending JPH0728933A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5192747A JPH0728933A (ja) 1993-07-07 1993-07-07 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5192747A JPH0728933A (ja) 1993-07-07 1993-07-07 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0728933A true JPH0728933A (ja) 1995-01-31

Family

ID=16296385

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5192747A Pending JPH0728933A (ja) 1993-07-07 1993-07-07 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0728933A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2341747A (en) * 1998-07-10 2000-03-22 Fujitsu Ltd Image extraction

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2341747A (en) * 1998-07-10 2000-03-22 Fujitsu Ltd Image extraction
GB2341747B (en) * 1998-07-10 2002-11-20 Fujitsu Ltd Image processing apparatus, image processing method and recording medium
US6879704B2 (en) 1998-07-10 2005-04-12 Fujitsu Limited Image processing apparatus, image processing method and recording medium

Similar Documents

Publication Publication Date Title
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JPH0652354A (ja) スキュー補正方法並びにスキュー角検出方法並びにドキュメントセグメンテーションシステムおよびスキュー角検出装置
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JPH05233873A (ja) 領域分割方法
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JPH0950527A (ja) 枠抽出装置及び矩形抽出装置
JPH0728933A (ja) 文字認識装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP2558668B2 (ja) 文字パタ−ン抽出方法
JPH0581475A (ja) 文字領域抽出方法
JPS61190679A (ja) 文字デ−タ処理装置
JPH0728938A (ja) 文字認識装置
JPH0728934A (ja) 文書画像処理装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH09134404A (ja) 棒グラフ認識装置
JPH0573718A (ja) 領域属性識別方式
JPH0343879A (ja) 文字認識装置およびその文字領域分離方法
JPH0773273A (ja) パターン切出しおよび認識方法とそのシステム
JPH05274472A (ja) 画像認識装置
JPS6327990A (ja) 文字認識方法
JPH0324681A (ja) 画像処理方法及び装置
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JPH0271379A (ja) 画像処理装置
JPH08171609A (ja) 文字列高速抽出装置