JPH06180771A - 英文字認識装置 - Google Patents
英文字認識装置Info
- Publication number
- JPH06180771A JPH06180771A JP4331516A JP33151692A JPH06180771A JP H06180771 A JPH06180771 A JP H06180771A JP 4331516 A JP4331516 A JP 4331516A JP 33151692 A JP33151692 A JP 33151692A JP H06180771 A JPH06180771 A JP H06180771A
- Authority
- JP
- Japan
- Prior art keywords
- character
- rectangle
- word
- recognition result
- letter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 文書画像中の文字を認識する英文字認識装置
において、ノイズを含んだ文書の認識を高精度に行うこ
とを目的とする。 【構成】 文書画像中の文字を重ね合わせにより同じ字
種ごとに分類し、分類された文字群の認識結果を文書内
の複数の単語により確定する。その後、認識結果が確定
した文字画像を除いた画像を対象として、その位置関係
及び大きさをもとにノイズ判定処理を行い、ノイズとし
て判定された矩形を無視して認識処理を行うことにより
ノイズの影響を抑えた認識結果を得る。
において、ノイズを含んだ文書の認識を高精度に行うこ
とを目的とする。 【構成】 文書画像中の文字を重ね合わせにより同じ字
種ごとに分類し、分類された文字群の認識結果を文書内
の複数の単語により確定する。その後、認識結果が確定
した文字画像を除いた画像を対象として、その位置関係
及び大きさをもとにノイズ判定処理を行い、ノイズとし
て判定された矩形を無視して認識処理を行うことにより
ノイズの影響を抑えた認識結果を得る。
Description
【0001】
【産業上の利用分野】本発明は、文書画像中の文字を認
識する英文字認識装置に関するものである。
識する英文字認識装置に関するものである。
【0002】
【従来の技術】近年、文字認識装置をコンピュータ等の
入力装置として利用する要求が高まっており、簡単な操
作により認識結果を得ることの出来る文字認識装置がコ
ンピュータ等のシステム性能の向上に不可欠となってい
る。
入力装置として利用する要求が高まっており、簡単な操
作により認識結果を得ることの出来る文字認識装置がコ
ンピュータ等のシステム性能の向上に不可欠となってい
る。
【0003】以下に従来の英文字認識装置について説明
する。図7は従来の英文字認識装置の機能ブロック図で
ある。図7において、1は認識対象文書を2値化した文
書画像として入力する画像入力手段、2は入力した文書
画像を記憶する画像格納手段、3は文書画像内の黒画素
の連なりをもとにして文字に仮想的に外接する矩形を求
める外接矩形検出手段、4は求められた外接矩形の文書
画像上の座標データと、各文字矩形に与える通し番号と
を記憶する外接矩形座標格納手段、5は外接矩形座標格
納手段4に格納された座標データをもとに各矩形間の水
平方向の間隔を求め、間隔が広い部分を単語区切りとし
て検出し、単語を構成する文字矩形番号を求める単語切
り出し手段、6は求められた単語を構成する文字矩形の
番号をひとまとめにして格納する単語切り出し結果格納
手段である。7は文字矩形番号に対応する文字矩形の座
標データを外接矩形座標格納手段4から取り出すととも
に、それをもとに画像格納手段2から文字画像を取り出
し、その黒画素の分布を抽出して図形特徴を求める図形
特徴抽出手段、8は文書画像を構成する文字の図形特徴
を記憶しておく認識辞書手段、9は文字矩形内の図形特
徴と認識辞書手段8にある図形特徴とを比較して差を求
め、その差が小さい特徴を持つ文字を認識結果とする文
字認識手段、10は各文字矩形の認識結果を格納する認
識結果格納手段、11は認識結果を単語情報をもとに単
語単位に分けて表示する表示処理手段である。
する。図7は従来の英文字認識装置の機能ブロック図で
ある。図7において、1は認識対象文書を2値化した文
書画像として入力する画像入力手段、2は入力した文書
画像を記憶する画像格納手段、3は文書画像内の黒画素
の連なりをもとにして文字に仮想的に外接する矩形を求
める外接矩形検出手段、4は求められた外接矩形の文書
画像上の座標データと、各文字矩形に与える通し番号と
を記憶する外接矩形座標格納手段、5は外接矩形座標格
納手段4に格納された座標データをもとに各矩形間の水
平方向の間隔を求め、間隔が広い部分を単語区切りとし
て検出し、単語を構成する文字矩形番号を求める単語切
り出し手段、6は求められた単語を構成する文字矩形の
番号をひとまとめにして格納する単語切り出し結果格納
手段である。7は文字矩形番号に対応する文字矩形の座
標データを外接矩形座標格納手段4から取り出すととも
に、それをもとに画像格納手段2から文字画像を取り出
し、その黒画素の分布を抽出して図形特徴を求める図形
特徴抽出手段、8は文書画像を構成する文字の図形特徴
を記憶しておく認識辞書手段、9は文字矩形内の図形特
徴と認識辞書手段8にある図形特徴とを比較して差を求
め、その差が小さい特徴を持つ文字を認識結果とする文
字認識手段、10は各文字矩形の認識結果を格納する認
識結果格納手段、11は認識結果を単語情報をもとに単
語単位に分けて表示する表示処理手段である。
【0004】以上のように構成された英文字認識装置に
ついて、図4に基づいてその動作を説明する。まず、画
像入力手段1にて認識対象文書を2値画像として入力
し、画像格納手段2に記憶する。文書画像の一例を図4
に示す。その格納形態は文書56の中のX座標とY座標
上の交点が白か黒かを表す2値画像データで構成されて
いる。
ついて、図4に基づいてその動作を説明する。まず、画
像入力手段1にて認識対象文書を2値画像として入力
し、画像格納手段2に記憶する。文書画像の一例を図4
に示す。その格納形態は文書56の中のX座標とY座標
上の交点が白か黒かを表す2値画像データで構成されて
いる。
【0005】次に、外接矩形検出手段3にて文書画像中
の黒画素の連なりをもとにして文字に仮想的に外接する
矩形を求め、上下に僅かな間隙で隣接する矩形を「i」
「j」等の分離文字として統合した後、外接矩形座標格
納手段4に矩形の座標を格納する。
の黒画素の連なりをもとにして文字に仮想的に外接する
矩形を求め、上下に僅かな間隙で隣接する矩形を「i」
「j」等の分離文字として統合した後、外接矩形座標格
納手段4に矩形の座標を格納する。
【0006】格納された文字矩形の座標をもとに単語切
り出し手段5にて各矩形間の水平方向の間隔が大きな部
分を単語区切りとして検出し、単語を構成する文字矩形
番号を求め、求められた単語を構成する文字矩形の番号
をひとまとめにして単語切り出し結果格納手段6に格納
する。
り出し手段5にて各矩形間の水平方向の間隔が大きな部
分を単語区切りとして検出し、単語を構成する文字矩形
番号を求め、求められた単語を構成する文字矩形の番号
をひとまとめにして単語切り出し結果格納手段6に格納
する。
【0007】その後、外接矩形座標格納手段4に格納さ
れている座標データをもとに画像格納手段2から全ての
文字画像を取り出して図形特徴抽出手段7に送り、図形
特徴を抽出し、文字認識手段9にて全ての文字に対する
認識結果を求め、認識結果格納手段10に格納する。
れている座標データをもとに画像格納手段2から全ての
文字画像を取り出して図形特徴抽出手段7に送り、図形
特徴を抽出し、文字認識手段9にて全ての文字に対する
認識結果を求め、認識結果格納手段10に格納する。
【0008】認識結果格納手段10に格納された各文字
画像の認識結果を単語切り出し結果格納手段6に格納さ
れている単語情報をもとに単語単位に分けて表示する。
画像の認識結果を単語切り出し結果格納手段6に格納さ
れている単語情報をもとに単語単位に分けて表示する。
【0009】以上の処理にて、文書画像中の文字が認識
されることとなる。
されることとなる。
【0010】
【発明が解決しようとする課題】しかしながら上記の従
来の英文字認識装置では、分離文字の統合の際に矩形の
位置関係のみに注目していたため、図4中の文字矩形5
1と文字矩形52は「i」として統合されるが、文字矩
形54と文字矩形55は文字矩形54が「e」であるに
もかかわらず統合され、誤認識してしまうという問題点
を有していた。
来の英文字認識装置では、分離文字の統合の際に矩形の
位置関係のみに注目していたため、図4中の文字矩形5
1と文字矩形52は「i」として統合されるが、文字矩
形54と文字矩形55は文字矩形54が「e」であるに
もかかわらず統合され、誤認識してしまうという問題点
を有していた。
【0011】本発明は上記問題点を解決するもので、ノ
イズの影響を抑え、高精度に認識することの出来る英文
字認識装置を提供することを目的としている。
イズの影響を抑え、高精度に認識することの出来る英文
字認識装置を提供することを目的としている。
【0012】
【課題を解決するための手段】この目的を達成するため
に本発明の英文字認識装置は、文字パターン分類手段、
認識結果確定手段、単語辞書手段を有し、単語情報をも
とに認識結果の確定処理を行い、その結果、確定されな
かった文字に注目して、その矩形の位置関係及び大きさ
によりノイズの判定をおこない、ノイズと判定された文
字を無視して認識結果を得る構成でなる。
に本発明の英文字認識装置は、文字パターン分類手段、
認識結果確定手段、単語辞書手段を有し、単語情報をも
とに認識結果の確定処理を行い、その結果、確定されな
かった文字に注目して、その矩形の位置関係及び大きさ
によりノイズの判定をおこない、ノイズと判定された文
字を無視して認識結果を得る構成でなる。
【0013】
【作用】この手段によって、ノイズを含んだ文書におい
てもその影響が抑えられ、高精度に認識することが出来
る。
てもその影響が抑えられ、高精度に認識することが出来
る。
【0014】
【実施例】以下、本発明の一実施例について、図面を参
照しながら説明する。
照しながら説明する。
【0015】図1及び図2はそれぞれ、本発明の一実施
例における英文字認識装置の機能ブロック図、装置ブロ
ック図である。図1において、12は認識対象文書を2
値化した文書画像として入力する画像入力手段、13は
入力した文書画像を記憶する画像格納手段、14は文書
画像内の黒画素の連なりをもとにして文字に仮想的に外
接する矩形を求める文字矩形検出手段、15は求められ
た文字矩形の文書画像上の座標データと、各文字矩形に
与える通し番号とを記憶する文字矩形座標格納手段、1
6は文字矩形座標格納手段15に格納された座標データ
をもとに各矩形間の水平方向の間隔を求め、間隔が文字
の平均的な間隔よりも広い部分を単語区切りとして検出
し、単語を構成する文字矩形を求める単語切り出し手
段、17は求められた単語を構成する文字矩形の番号を
単語ごとにひとまとめにして格納する単語文字矩形格納
手段である。
例における英文字認識装置の機能ブロック図、装置ブロ
ック図である。図1において、12は認識対象文書を2
値化した文書画像として入力する画像入力手段、13は
入力した文書画像を記憶する画像格納手段、14は文書
画像内の黒画素の連なりをもとにして文字に仮想的に外
接する矩形を求める文字矩形検出手段、15は求められ
た文字矩形の文書画像上の座標データと、各文字矩形に
与える通し番号とを記憶する文字矩形座標格納手段、1
6は文字矩形座標格納手段15に格納された座標データ
をもとに各矩形間の水平方向の間隔を求め、間隔が文字
の平均的な間隔よりも広い部分を単語区切りとして検出
し、単語を構成する文字矩形を求める単語切り出し手
段、17は求められた単語を構成する文字矩形の番号を
単語ごとにひとまとめにして格納する単語文字矩形格納
手段である。
【0016】18は文字矩形の座標データを文字矩形座
標格納手段15から取り出すとともに、それをもとに画
像格納手段13から文字画像を取り外し、文書中の全て
の文字画像間で文字を構成する画素を重ね合わせ、同じ
字種であるか否かを一致する画素と文字矩形内の全画素
数の比により判定し、その比が大きいときに同一字種と
して分類する文字パターン分類手段である。
標格納手段15から取り出すとともに、それをもとに画
像格納手段13から文字画像を取り外し、文書中の全て
の文字画像間で文字を構成する画素を重ね合わせ、同じ
字種であるか否かを一致する画素と文字矩形内の全画素
数の比により判定し、その比が大きいときに同一字種と
して分類する文字パターン分類手段である。
【0017】19は文字矩形番号に対応する文字矩形の
座標データを文字矩形座標格納手段15から取り出すと
ともに、それをもとに画像格納手段13から文字画像を
取り出し、その黒画素の分布を抽出して図形特徴を求め
る図形特徴抽出手段、20は文書画像を構成する文字の
図形特徴を記憶しておく認識辞書手段、21は文字矩形
内の図形特徴と認識辞書手段20にある図形特徴とを比
較して差を求め、その差が小さい特徴を持つ文字を認識
結果とする文字認識手段である。
座標データを文字矩形座標格納手段15から取り出すと
ともに、それをもとに画像格納手段13から文字画像を
取り出し、その黒画素の分布を抽出して図形特徴を求め
る図形特徴抽出手段、20は文書画像を構成する文字の
図形特徴を記憶しておく認識辞書手段、21は文字矩形
内の図形特徴と認識辞書手段20にある図形特徴とを比
較して差を求め、その差が小さい特徴を持つ文字を認識
結果とする文字認識手段である。
【0018】22は文字パターン分類手段18で同一文
字種として分類された文字矩形群の文字矩形番号と、各
文字矩形群に与える通し番号と、文字矩形群の中から1
つを代表矩形として取り出して、その矩形内の画像が該
当する文字種を文字認識手段21にて求めた各文字矩形
群の認識結果と、各文字矩形群の認識結果が確定してい
るか否かを表す認識結果確定情報とを格納する認識結果
格納手段、23は英単語の綴りを格納している単語辞書
手段である。
字種として分類された文字矩形群の文字矩形番号と、各
文字矩形群に与える通し番号と、文字矩形群の中から1
つを代表矩形として取り出して、その矩形内の画像が該
当する文字種を文字認識手段21にて求めた各文字矩形
群の認識結果と、各文字矩形群の認識結果が確定してい
るか否かを表す認識結果確定情報とを格納する認識結果
格納手段、23は英単語の綴りを格納している単語辞書
手段である。
【0019】24は単語を構成する文字矩形番号を単語
文字矩形格納手段17から取り出すとともに、その文字
矩形が属する文字矩形群の認識結果を認識結果格納手段
22から取り出し、その結果得られる単語文字列と、単
語辞書手段23に記憶している単語文字列とを照合して
単語の綴りが正しいか否かを判定し、同一文字矩形群に
属する文字矩形の認識結果が複数の綴りの正しい単語に
て一致していれば、その文字矩形群の認識結果を確定
し、その旨を認識結果格納手段22の認識結果確定情報
に記憶する認識結果確定手段である。
文字矩形格納手段17から取り出すとともに、その文字
矩形が属する文字矩形群の認識結果を認識結果格納手段
22から取り出し、その結果得られる単語文字列と、単
語辞書手段23に記憶している単語文字列とを照合して
単語の綴りが正しいか否かを判定し、同一文字矩形群に
属する文字矩形の認識結果が複数の綴りの正しい単語に
て一致していれば、その文字矩形群の認識結果を確定
し、その旨を認識結果格納手段22の認識結果確定情報
に記憶する認識結果確定手段である。
【0020】25は認識結果確定手段24にて確定され
なかった文字矩形の位置関係及びその大きさに注目し、
矩形の縦長・横長が共に確定されている文字より十分に
小さければ、これを「i」や「j」の点、または、ノイ
ズと疑い、矩形の下方に縦長の矩形がある場合にこれを
「i」や「j」の点として下方の矩形と統合し、孤立し
ている矩形及びその上下の矩形が確定している場合はこ
れをノイズと判定し、単語文字矩形格納手段17に格納
されている単語を構成する文字矩形番号列からノイズと
判定された矩形番号を削除するノイズ判定手段である。
なかった文字矩形の位置関係及びその大きさに注目し、
矩形の縦長・横長が共に確定されている文字より十分に
小さければ、これを「i」や「j」の点、または、ノイ
ズと疑い、矩形の下方に縦長の矩形がある場合にこれを
「i」や「j」の点として下方の矩形と統合し、孤立し
ている矩形及びその上下の矩形が確定している場合はこ
れをノイズと判定し、単語文字矩形格納手段17に格納
されている単語を構成する文字矩形番号列からノイズと
判定された矩形番号を削除するノイズ判定手段である。
【0021】26は認識結果を単語情報をもとに単語単
位に分けて表示する表示処理手段である。
位に分けて表示する表示処理手段である。
【0022】また、図2において、27は認識対象文書
を2値化した文書画像として読み込むスキャナ、28は
全体の制御を行う中央処理装置(以下CPUと略称す
る)、32はデータを固定的に記憶しておくためのリー
ドオンリメモリ(ROM)であって、CPU28が装置
全体を制御するための制御プログラム29と認識辞書デ
ータ30、単語辞書データ31を含む。
を2値化した文書画像として読み込むスキャナ、28は
全体の制御を行う中央処理装置(以下CPUと略称す
る)、32はデータを固定的に記憶しておくためのリー
ドオンリメモリ(ROM)であって、CPU28が装置
全体を制御するための制御プログラム29と認識辞書デ
ータ30、単語辞書データ31を含む。
【0023】37は処理途上のデータを一時的に記憶し
ておくためのランダムアクセスメモリ(RAM)であっ
て、文書画像33、外接矩形格納データ34、単語文字
矩形格納データ35、認識結果格納データ36を含む。
ておくためのランダムアクセスメモリ(RAM)であっ
て、文書画像33、外接矩形格納データ34、単語文字
矩形格納データ35、認識結果格納データ36を含む。
【0024】38はCPU28に対して外部より開始・
終了等の指令を与えるためのキーボード、39は認識結
果を表示する為の表示装置、39−1は上述の各手段を
つなぐ内部の信号電送バスラインである。
終了等の指令を与えるためのキーボード、39は認識結
果を表示する為の表示装置、39−1は上述の各手段を
つなぐ内部の信号電送バスラインである。
【0025】以上のように構成された英文字認識装置に
ついて、図3及び図4、図5、図6を用いてその動作を
説明する。図3は本実施例における英文字認識装置の制
御手順を示すフローチャートである。認識対象文書を画
像入力手段12にて入力し、画像格納手段13に2値化
した文書画像として記憶する(S1)。
ついて、図3及び図4、図5、図6を用いてその動作を
説明する。図3は本実施例における英文字認識装置の制
御手順を示すフローチャートである。認識対象文書を画
像入力手段12にて入力し、画像格納手段13に2値化
した文書画像として記憶する(S1)。
【0026】図4(a)は入力された文書画像である。
その後、文書画像中において、黒画素の連なりを求め、
連なったひと固まりの黒画素を文字とし、文字に仮想的
に外接する矩形を文字矩形検出手段14にて求め、その
結果、得られる矩形の座標データと各文字矩形に与える
通し番号とを文字矩形情報として文字矩形座標格納手段
15に記憶する(S2)。
その後、文書画像中において、黒画素の連なりを求め、
連なったひと固まりの黒画素を文字とし、文字に仮想的
に外接する矩形を文字矩形検出手段14にて求め、その
結果、得られる矩形の座標データと各文字矩形に与える
通し番号とを文字矩形情報として文字矩形座標格納手段
15に記憶する(S2)。
【0027】図4(a)の文字矩形40〜55、及び、
図4(b)はそれぞれ、求められた文字矩形及びその文
字矩形情報の格納形態である。
図4(b)はそれぞれ、求められた文字矩形及びその文
字矩形情報の格納形態である。
【0028】格納された文字矩形の座標をもとに単語切
り出し手段にて各矩形間の水平方向の間隔を求め、間隔
が平均的な文字間隔より広い部分を単語区切りとして検
出し、一つの単語を構成する文字矩形を求める。単語を
構成する文字矩形の番号を単語毎にひとまとめにして単
語文字矩形格納手段17に格納する(S3)。格納時の
形態を図6に示す。
り出し手段にて各矩形間の水平方向の間隔を求め、間隔
が平均的な文字間隔より広い部分を単語区切りとして検
出し、一つの単語を構成する文字矩形を求める。単語を
構成する文字矩形の番号を単語毎にひとまとめにして単
語文字矩形格納手段17に格納する(S3)。格納時の
形態を図6に示す。
【0029】次に、文字パターン分類手段18にて文字
矩形の座標データを文字矩形座標格納手段15から取り
出すとともに、それをもとに画像格納手段13から文字
画像を取り出し、文書中の全ての文字画像間で画像を構
成する画素を重ね合わせ、同じ字種であるか否かを一致
する画素と文字矩形内の画素数の比により判定し、その
比が大きいときに同一字種として分類する(S4)。そ
の過程を図5(a)を用いて説明する。図中の58は文
字画像59と文字画像60を重ね合わせた状態を表して
おり、文字画像59と文字画像60が重なっている画素
61の数を文字の高さを3分割したエリア内で計数し、
エリア62、63、64内で一致している画素の数を求
める。その後、各エリア中の一致画素数を各エリア中の
黒画素の総数で除算し、全てのエリアでその値が1に十
分近ければ文字画像が一致したものと見なす。
矩形の座標データを文字矩形座標格納手段15から取り
出すとともに、それをもとに画像格納手段13から文字
画像を取り出し、文書中の全ての文字画像間で画像を構
成する画素を重ね合わせ、同じ字種であるか否かを一致
する画素と文字矩形内の画素数の比により判定し、その
比が大きいときに同一字種として分類する(S4)。そ
の過程を図5(a)を用いて説明する。図中の58は文
字画像59と文字画像60を重ね合わせた状態を表して
おり、文字画像59と文字画像60が重なっている画素
61の数を文字の高さを3分割したエリア内で計数し、
エリア62、63、64内で一致している画素の数を求
める。その後、各エリア中の一致画素数を各エリア中の
黒画素の総数で除算し、全てのエリアでその値が1に十
分近ければ文字画像が一致したものと見なす。
【0030】文書画像56中の文字矩形40〜55は、
その相互間で比較され(表1)のように分類される。
その相互間で比較され(表1)のように分類される。
【0031】
【表1】
【0032】分類された文字群のうちの一つを代表パタ
ーンとしてその文字画像に対して、図形特徴抽出手段1
9にて図形特徴を抽出し、文字認識手段21に送り、認
識辞書手段20に格納されている図形特徴と比較するこ
とで認識結果を得る(S5)。そして図5(b)に示す
ような形態で認識結果を格納する。
ーンとしてその文字画像に対して、図形特徴抽出手段1
9にて図形特徴を抽出し、文字認識手段21に送り、認
識辞書手段20に格納されている図形特徴と比較するこ
とで認識結果を得る(S5)。そして図5(b)に示す
ような形態で認識結果を格納する。
【0033】次に認識結果の確定処理を行う。認識結果
確定手段24にて単語を構成する文字矩形番号を単語文
字矩形格納手段17から取り出すとともに、該当する文
字矩形の認識結果を認識結果格納手段22から取り出
し、認識結果による文字列として得られる単語文字列と
単語辞書手段23に記憶されている単語文字列とを照合
する。
確定手段24にて単語を構成する文字矩形番号を単語文
字矩形格納手段17から取り出すとともに、該当する文
字矩形の認識結果を認識結果格納手段22から取り出
し、認識結果による文字列として得られる単語文字列と
単語辞書手段23に記憶されている単語文字列とを照合
する。
【0034】そして単語の綴りが正しいか否かを判定
し、同一文字矩形群に属する文字矩形の認識結果が複数
の「綴りが正しい単語」にて一致していれば、その文字
矩形群の認識結果を確定し、その旨を認識結果確定情報
として認識結果格納手段22に記憶する(S6)。
し、同一文字矩形群に属する文字矩形の認識結果が複数
の「綴りが正しい単語」にて一致していれば、その文字
矩形群の認識結果を確定し、その旨を認識結果確定情報
として認識結果格納手段22に記憶する(S6)。
【0035】この結果、文字矩形群(1)、(2)、
(4)の認識結果がそれぞれ「a」「p」「e」と確定
される。
(4)の認識結果がそれぞれ「a」「p」「e」と確定
される。
【0036】その後、S6にて確定されなかった文字矩
形の位置関係及びその大きさに注目してノイズ判定処理
を行う。矩形の縦長・横長が共に確定されている文字よ
り十分に小さければ、これを「i」や「j」の点、また
は、ノイズと疑い、矩形の下方に縦長の矩形がある場合
にこれを「i」や「j」の点として下方の矩形と統合す
る。
形の位置関係及びその大きさに注目してノイズ判定処理
を行う。矩形の縦長・横長が共に確定されている文字よ
り十分に小さければ、これを「i」や「j」の点、また
は、ノイズと疑い、矩形の下方に縦長の矩形がある場合
にこれを「i」や「j」の点として下方の矩形と統合す
る。
【0037】また、孤立している矩形及びその上下の矩
形が確定している場合はこれをノイズと判定し、単語文
字矩形格納手段17に格納されている単語を構成する文
字矩形番号列からノイズと判定された矩形番号を削除す
る(S7)。
形が確定している場合はこれをノイズと判定し、単語文
字矩形格納手段17に格納されている単語を構成する文
字矩形番号列からノイズと判定された矩形番号を削除す
る(S7)。
【0038】図4(a)の文字矩形51はその下方に縦
に長い矩形52があるため、これと統合して「i」とな
り、文字矩形55はその近辺の矩形が確定された文字矩
形54のみであるためノイズとして判定される。
に長い矩形52があるため、これと統合して「i」とな
り、文字矩形55はその近辺の矩形が確定された文字矩
形54のみであるためノイズとして判定される。
【0039】以上の処理にて求められた認識結果を、単
語文字矩形格納手段17、及び、認識結果格納手段22
をもとにして、単語単位に分けて表示する(S8)。
語文字矩形格納手段17、及び、認識結果格納手段22
をもとにして、単語単位に分けて表示する(S8)。
【0040】
【発明の効果】以上のように本発明は、単語情報をもと
に認識結果の確定処理を行い、確定されなかった文字に
注目して、その矩形の位置関係及び大きさによりノイズ
の判定をおこない、ノイズと判定された文字を無視して
認識結果を得ることでノイズの影響が抑えられ、高精度
に認識することが出来、優れた英文字認識装置を実現す
るものである。
に認識結果の確定処理を行い、確定されなかった文字に
注目して、その矩形の位置関係及び大きさによりノイズ
の判定をおこない、ノイズと判定された文字を無視して
認識結果を得ることでノイズの影響が抑えられ、高精度
に認識することが出来、優れた英文字認識装置を実現す
るものである。
【図面の簡単な説明】
【図1】本発明の一実施例における英文字認識装置の機
能ブロック図
能ブロック図
【図2】本発明の一実施例における英文字認識装置の装
置ブロック図
置ブロック図
【図3】本発明の一実施例における英文字認識装置の制
御手順を示すフローチャート
御手順を示すフローチャート
【図4】(a)本実施例における文書画像の例を示す図 (b)本実施例における文字矩形格納手段の格納形態を
表す図
表す図
【図5】(a)本実施例における重ね合わせの動作説明
のための図 (b)本実施例における認識結果の格納形態を表す図
のための図 (b)本実施例における認識結果の格納形態を表す図
【図6】本実施例における文字矩形の格納時の形態を示
す図
す図
【図7】従来の英文字認識装置の機能ブロック図
12 画像入力手段 13 画像格納手段 14 文字矩形検出手段 15 文字矩形座標格納手段 16 単語切り出し手段 17 単語文字矩形格納手段 18 文字パターン分類手段 19 図形特徴抽出手段 20 認識辞書手段 21 文字認識手段 22 認識結果格納手段 23 単語辞書手段 24 認識結果確定手段 25 ノイズ判定手段 26 表示処理手段
Claims (1)
- 【請求項1】文書画像として入力された画像を記憶する
画像格納手段と、 文書画像中の黒画素の連なりをもとにして文字に外接す
る矩形を文字矩形として求める文字矩形検出手段と、 求められた文字矩形の文書画像上の座標データと、各文
字矩形に与える通し番号とを記憶する文字矩形格納手段
と、 文字矩形格納手段に格納された座標データをもとに各矩
形間の水平方向の間隔を求め、間隔が広い部分を単語区
切りとして検出し、単語を構成する文字矩形番号を求め
る単語切り出し手段と、 求められた単語を構成する文字矩形番号を単語ごとにひ
とまとめにして格納する単語文字矩形格納手段と、 文字矩形の座標データを文字矩形格納手段から取り出す
とともに、それをもとに前記画像格納手段から文字画像
を取り出し、文書中の全ての文字画像間で画像を構成す
る画素単位で重ね合わせ、同じ字種であるか否かを、一
致する画素と文字矩形内の全画素数との比により判定
し、その比が大きいときに同一字種として分類する文字
パターン分類手段と、 文字矩形番号に対応する文字矩形の座標データを文字矩
形格納手段から取り出すとともに、それをもとに前記画
像格納手段から文字画像を取り出し、その黒画素の分布
を抽出して図形特徴を求める図形特徴抽出手段と、 認識対象となる文字の図形特徴を記憶しておく認識辞書
手段と、 文字矩形内の図形特徴と前記認識辞書手段にある図形特
徴を比較して差を求め、その差の値が小さい特徴を持つ
文字を認識結果とする文字認識手段と、 前記文字パターン分類手段で同一文字種として分類され
た文字矩形群の番号と、各矩形群に与える通し番号と、
矩形群の中から一つを代表矩形として取り出し、その認
識結果を前記文字認識手段にて求めた結果と、矩形群の
認識結果が確定しているか否かを表す認識結果確定情報
とを格納する認識結果格納手段と、 英単語の綴りを記憶している単語辞書手段と、 単語を構成する文字矩形番号、及びその文字矩形が属す
る矩形群の認識結果をそれぞれ前記単語文字矩形格納手
段、前記認識結果格納手段から取り出し、その結果得ら
れる単語文字列と、前記単語辞書手段に記憶している単
語文字列とを照合して単語の綴りが正しいか否かを判定
し、同一矩形群に属する文字矩形の認識結果が複数の綴
りの正しい単語にて一致していれば、その文字矩形群の
認識結果を確定し、その旨を前記認識結果格納手段の認
識結果確定情報に記憶する認識結果確定手段と、 認識結果確定手段にて確定されなかった文字矩形の位置
関係及びその大きさに注目し、矩形の縦長・横長が共に
確定されている文字より十分に小さければ、これを
「i」や「j」の点、または、ノイズと疑い、矩形の下
方に縦長の矩形がある場合にこれを「i」や「j」の点
として下方の矩形と統合し、孤立している矩形及びその
上下の矩形が確定している場合はこれをノイズと判定
し、前記単語文字矩形格納手段に格納されている単語を
構成する文字矩形番号列からノイズと判定された矩形番
号を削除するノイズ判定手段と、 文書を認識した結果を単語文字矩形及び認識結果をもと
に単語単位に表示する表示処理手段とを備えたことを特
徴とする英文字認識装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4331516A JPH06180771A (ja) | 1992-12-11 | 1992-12-11 | 英文字認識装置 |
US08/816,182 US6212299B1 (en) | 1992-12-11 | 1997-03-12 | Method and apparatus for recognizing a character |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4331516A JPH06180771A (ja) | 1992-12-11 | 1992-12-11 | 英文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06180771A true JPH06180771A (ja) | 1994-06-28 |
Family
ID=18244523
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4331516A Pending JPH06180771A (ja) | 1992-12-11 | 1992-12-11 | 英文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06180771A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1155381A (ja) * | 1997-07-29 | 1999-02-26 | Yasue Mamezaki | 画像認識送受信装置 |
WO2005008513A1 (en) * | 2003-07-16 | 2005-01-27 | 3Gd Korea, Inc. | A method of recognizing automatically information units for constructing experimental data and array patterns of rules, and a storage medium for recording a program of the same |
US7480410B2 (en) | 2001-11-30 | 2009-01-20 | Matsushita Electric Works, Ltd. | Image recognition method and apparatus for the same method |
JP2009531788A (ja) * | 2006-03-29 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | レンダリングのためにトークンベースファイルへの文字列を含むディジタル画像の変換 |
JP2009213145A (ja) * | 2007-02-21 | 2009-09-17 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2010102709A (ja) * | 2008-10-22 | 2010-05-06 | Nhn Corp | 文字列認識方法、文字列認識システム及び文字列認識プログラム用記録媒体 |
-
1992
- 1992-12-11 JP JP4331516A patent/JPH06180771A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1155381A (ja) * | 1997-07-29 | 1999-02-26 | Yasue Mamezaki | 画像認識送受信装置 |
US7480410B2 (en) | 2001-11-30 | 2009-01-20 | Matsushita Electric Works, Ltd. | Image recognition method and apparatus for the same method |
WO2005008513A1 (en) * | 2003-07-16 | 2005-01-27 | 3Gd Korea, Inc. | A method of recognizing automatically information units for constructing experimental data and array patterns of rules, and a storage medium for recording a program of the same |
JP2009531788A (ja) * | 2006-03-29 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | レンダリングのためにトークンベースファイルへの文字列を含むディジタル画像の変換 |
JP2009213145A (ja) * | 2007-02-21 | 2009-09-17 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
US8411955B2 (en) | 2007-02-21 | 2013-04-02 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer-readable medium |
JP2010102709A (ja) * | 2008-10-22 | 2010-05-06 | Nhn Corp | 文字列認識方法、文字列認識システム及び文字列認識プログラム用記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1016033B1 (en) | Automatic language identification system for multilingual optical character recognition | |
US8059868B2 (en) | License plate recognition apparatus, license plate recognition method, and computer-readable storage medium | |
US6212299B1 (en) | Method and apparatus for recognizing a character | |
EP1147485A1 (en) | Video stream classifiable symbol isolation method and system | |
US5502777A (en) | Method and apparatus for recognizing table and figure having many lateral and longitudinal lines | |
JPH07265807A (ja) | 宛名領域検出装置 | |
JPH06180771A (ja) | 英文字認識装置 | |
JP4228592B2 (ja) | 文字認識装置 | |
JP3476595B2 (ja) | 画像領域分割方法、および画像2値化方法 | |
JP2917427B2 (ja) | 図面読取装置 | |
JP2005250786A (ja) | 画像認識方法 | |
JPH06187489A (ja) | 文字認識装置 | |
JP3372005B2 (ja) | 文字認識装置 | |
JPH02116987A (ja) | 文字認識装置 | |
JP2827960B2 (ja) | 宛名行抽出装置 | |
JP3457094B2 (ja) | 文字認識装置及び文字認識方法 | |
JP2917394B2 (ja) | 文字認識装置及び文字切り出し方法 | |
JPH06309503A (ja) | 英文字認識装置 | |
JP3428504B2 (ja) | 文字認識装置 | |
JPH07160810A (ja) | 文字認識装置 | |
JPH0528301A (ja) | 文書認識装置 | |
JPH04260980A (ja) | 図形認識装置 | |
JPH0573718A (ja) | 領域属性識別方式 | |
JP2972443B2 (ja) | 文字認識装置 | |
JPH08305792A (ja) | 画像処理装置及び方法 |