JP3116452B2

JP3116452B2 - 英文字認識装置

Info

Publication number: JP3116452B2
Application number: JP03248998A
Authority: JP
Inventors: 道明信岡
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1991-09-27
Filing date: 1991-09-27
Publication date: 2000-12-11
Anticipated expiration: 2015-12-11
Also published as: JPH0589293A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は英文一般文書の文字認識
を行う英文字認識装置に関するものである。

【０００２】

【従来の技術】近年、文字認識装置を電子計算機等の入
力装置として利用する要求が高まっており、安定な認識
結果を効率的に得ることが出来る文字入力装置が電子計
算機等のシステムの性能向上に不可欠となっている。

【０００３】従来の認識装置は、入力された文字画像よ
り文字領域を切り出し、切り出された文字領域の画像の
図形特徴と予め用意された認識辞書とを比較し、認識を
行っている。この文字領域を切り出す際、英文は文字間
隔が一定でなく、また英文字は字種により文字幅が異な
り、同じ字種においてもフォントにより文字幅が異なる
ため、前後を空白に囲まれた領域を文字領域として切り
出していた。

【０００４】

【発明が解決しようとする課題】しかしながら、接触あ
るいは文字切れ等が存在する品質の高くない文字の文字
領域に対しては、正しく文字領域を切り出せないことが
多く、認識精度の低下を招いていた。

【０００５】本発明が解決しようとする課題は、従来の
これらの問題点を解消し、接触文字・文字切れのある品
質の高くない文字を精度よく認識し、且つ処理速度を高
めることにある。

【０００６】

【課題を解決するための手段】本発明は上記課題を解決
するため、認識対象文書を入力する画像入力部と、入力
された文書画像から文章領域を出力する文章領域切り出
し部と、文章領域から単語領域を出力する単語領域切り
出し部と、単語領域から文字領域を出力する文字領域切
り出し部と、切り出された文字領域の画像から文字の図
形特徴を記憶している認識辞書をもとに文字認識を行う
文字認識部と、この文字認識部及び文字領域切り出し部
より得られる文字領域切り出し情報及び文字の図形特徴
を蓄える文字情報格納部と、英単語の綴りを記憶してい
る単語辞書をもとに次の認識対象文字を決定する認識対
象文字決定部と、認識結果を出力する出力部と、を有す
る英文字認識装置であって、文字領域切り出し部及び文
字認識部は、次の認識対象文字と同一の文字が文字情報
格納部に既に認識された出力として格納されている場合
には、文字情報格納部に格納された前記同一の文字の文
字領域切り出し情報を用いて単語領域から次に認識すべ
き図形特徴を抽出し、この抽出された図形特徴と文字情
報格納部に格納された前記同一の文字の図形特徴とを照
合することにより文字認識を行う構成とした。

【０００７】

【作用】本発明では、次の認識対象文字と同一の文字が
文字情報格納部に既に認識された出力として格納されて
いる場合には、文字情報格納部に格納された前記同一の
文字の文字領域切り出し情報を用いて単語領域から次に
認識すべき図形特徴を抽出し、この抽出された図形特徴
と文字情報格納部に格納された前記同一の文字の図形特
徴とを照合するので、文字切り出し精度、認識精度の向
上を図ることができる。

【０００８】

【実施例】本発明を一実施例とともに示す添付図面とと
もに説明する。

【０００９】図１において、１は認識対象文書を文書画
像として入力する画像入力部、２は入力された文書画像
から文字列の集まりを見つけ、文章領域を出力する文章
領域切り出し部、３は文章領域から単語単位の区切りを
見つけ１つの単語の範囲を単語領域として出力する単語
切り出し部、４は文字情報格納部７に蓄えられている情
報をもとに単語領域から文字単位の区切りを見つけ１つ
の文字の範囲を文字領域として出力する文字領域切り出
し部、５は全ての認識対象文字の図形特徴を予め記憶し
ている認識辞書６、あるいは文字領域に蓄えられている
文字の図形特徴を比較し、それらの間との類似性を求
め、認識を行う文字認識部である。

【００１０】６は全ての認識対象文字の図形特徴を予め
記憶している認識辞書、７は文字領域切り出し部４より
得られた文字領域の大きさ及び、文字認識部５より得ら
れた文字の図形特徴の情報を蓄えておく文字情報格納
部、８は英単語の綴りを記憶している単語辞書９をもと
に認識対象文字を決定する認識対象文字決定部、９は英
単語の綴りをツリー構造にて表現した単語辞書、１０は
認識結果を出力する出力部、１１は画像入力部１から文
字認識部５の各部をつなぐ内部バス、１２は文字領域切
り出し部４，文字認識部５，認識対象文字決定部８及び
出力部１０の各部をつなぐ内部バス、１３，１４，１
５，１６はそれぞれ文字領域切り出し部４と文字情報格
納部７，文字認識部５と文字情報格納部７，文字認識部
５と認識辞書６，認識対象文字決定部８と単語辞書９を
つなぐ内部バスである。

【００１１】以上のように構成された英文字認識装置に
ついて、図２に全体フロチャート、図３に文字領域切り
出し処理フロチャート、図４に文字認識処理フロチャー
ト、図５に単語辞書の一部、図６に処理過程の具体的な
説明図を示し、以下その動作を説明する。

【００１２】認識したい文書を画像入力部１に文書画像
として入力する（ステップｓ１）。入力された文書画像
を文章領域切り出し部４に送り、文章領域切り出し部４
にて、文書画像の縦方向及び横方向の黒画素のヒストグ
ラムを求め、これをもとに文章領域を抽出する。そして
文章領域の位置情報を内部データとして蓄える（ステッ
プｓ２）。

【００１３】単語領域切り出し部３に文章領域の位置情
報を送り、文章領域内に対する単語領域の切り出し処理
を行う。単語領域切り出し部３では、単語の前後の空白
が文字間の空白より大きいことに着目し、ある幅以上の
空白に挟まれた文字列を単語領域として切り出す。文章
領域切り出し部２にて見つけられた文章領域内の全ての
単語領域の位置情報を求め、内部データとして蓄える
（ステップｓ３）。

【００１４】例として、図６の（ａ）に入力画像を、同
図中（ｂ）に文章領域切り出し結果を、同図中（ｃ）に
単語領域切り出し結果を示す。

【００１５】認識対象文字決定部８では、単語の文字の
連なりをツリー構造で表現した単語辞書９を走査してい
くことによって、次に切り出し認識処理を行おうとする
認識対象文字を決定する。もし、単語辞書を走査して認
識対象文字が存在しない場合は、認識対象文字を全ての
文字とする。また、単語の第一文字目の処理を行う場合
も同様に認識対象文字を全ての文字とする。図６の文書
において、英単語‘ｗｉｔｈ’内の‘ｗ’，‘ｉ’，
‘ｔ’が認識されているとして、図５の単語辞書を用い
ると認識対象文字は‘ｈ’，‘ｎ’となる。

【００１６】文字領域切り出し部４に単語領域の位置情
報及び認識対象文字を送り、単語領域内に対する文字領
域の切り出し処理を行う。

【００１７】以下、文字領域の切り出し処理過程を図３
の文字領域切り出し処理フロチャートに沿って示す。

【００１８】文字領域切り出し部４では、英文字は左右
に分離していないことに着目し、前後を空白に挟まれた
領域を文字領域としてもとめ、文字の位置情報を、内部
データとして蓄える。認識対象文字が限定され、かつ情
報格納部にこの認識対象文字の情報が蓄えられている場
合、格納されている大きさの情報をもとに、文字領域を
求め、位置情報を内部データとして蓄える（図３のステ
ップｓ１２，ｓ１３，ｓ１４，ｓ１５）。

【００１９】図６の例では、英単語‘ｗｉｔｈ’内の
‘ｔ’，‘ｈ’に接触、文字切れが存在するが、既に認
識された英単語‘ｎｏｔｈｉｎｇ’内の文字‘ｔ’，
‘ｈ’の文字領域の大きさ情報を用いて、文字領域を切
り出している。

【００２０】文字認識部に文字領域の位置情報を及び認
識対象文字を送り、文字領域内の文字認識処理を行う。

【００２１】以下、文字認識処理過程を図４の文字認識
処理フロチャートに沿って示す。

【００２２】文字認識部５では、文字領域の位置情報を
もとに注目する文字領域の画像の図形特徴を抽出する
（ステップｓ１６）。認識対象文字が限定され、かつ認
識対象文字の文字情報が格納されている場合、抽出した
図形特徴と文字情報格納部７に格納されている認識対象
文字の図形特徴との間の類似性を求め、類似性が高く認
識結果に値する文字が存在する場合、その文字を認識結
果とする（ステップｓ１７，ｓ１８，ｓ１９，ｓ２
０）。

【００２３】認識結果に値する文字が存在しなかった場
合、及び認識対象文字が限定されているが文字情報格納
部に認識対象文字の文字情報が格納されていない場合、
抽出した図形特徴と認識辞書内の認識対象文字の図形特
徴との間の類似性を求め、類似性が高く認識結果に値す
る文字が存在する場合、その文字を認識結果とする（ス
テップｓ２１，ｓ２２）。認識結果に値しない場合、認
識対象文字を全ての文字とする（ステップｓ２３）。認
識対象文字が全ての文字の場合、文字情報格納部７の格
納されている全ての文字の図形特徴との間の類似性を求
め、認識結果に値する最も類似性の高い文字を認識結果
とする（ステップｓ２４，ｓ２５）。

【００２４】認識結果に値する文字が存在しない場合、
認識辞書６内の全ての文字の図形特徴との間の類似性を
求め、認識結果に値する最も類似性の高い文字を認識結
果とする（ステップｓ２６，ｓ２７）。認識結果に値す
る文字が存在しない場合、認識不能としリジェクトコー
ドを出力部へ送る（ステップｓ２８）。認識結果に値す
る文字が存在する場合、文字情報格納部７へその文字の
認識文字コード、文字領域の大きさ情報、領域内の図形
特徴を送るとともに、出力部１０に認識文字コードを送
る（ステップｓ２９）。

【００２５】文字情報格納部７は、全ての認識対象文字
毎に認識文字コードをインデックスとする、文字領域の
大きさ、文字領域内の図形特徴を記憶するテーブルを持
ち、文字認識部より送られてきた文字領域の大きさ及び
文字領域内の図形特徴を蓄える。

【００２６】出力部１０では、送られてきた認識文字コ
ードまたはリジェクトコードを出力する（ステップｓ
９）。

【００２７】以上ステップｓ４，ｓ５の処理を、全ての
単語領域内に対して行う。文書中の全ての単語が認識さ
れるまでこの処理を繰り返す（ステップｓ１１）ことに
より与えられた文書画像の文字認識処理を行う。

【００２８】

【発明の効果】以上説明したように、この発明によっ
て、文字間の接触、文字のかすれ等の低品質文字が存在
する英文一般文書の文字領域切り出し、文字認識処理
を、単語辞書及び同一文章内に存在する文字の情報を用
いて行うことにより、認識精度の向上を図ることができ
る。また、切り出しの際、単語辞書の情報を用いること
により、予め認識の対象とする文字を限定することがで
き、認識処理時間の軽減を図ることができる。

【図面の簡単な説明】

【図１】実施例の構成ブロック図

【図２】実施例の全体のフロチャート

【図３】文字領域切り出し処理のフロチャート

【図４】文字認識処理のフロチャート

【図５】単語辞書の一部を示す説明図

【図６】処理過程の説明図

【符号の説明】

１画像入力部２文章領域切り出し部３単語切り出し部４文字領域切り出し部５文字認識部６認識辞書７文字情報格納部８認識対象文字決定部９単語辞書１０出力部１１内部バス１２内部バス１３内部バス１４内部バス１５内部バス１６内部バス

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06K 9/20 340 G06K 9/34 G06K 9/62 G06K 9/70 G06K 9/72 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】認識対象文書を入力する画像入力部と、入力された文書画像から文章領域を出力する文章領域切
り出し部と、文章領域から単語領域を出力する単語領域切り出し部
と、単語領域から文字領域を出力する文字領域切り出し部
と、切り出された文字領域の画像から文字の図形特徴を記憶
している認識辞書をもとに文字認識を行う文字認識部
と、この文字認識部及び前記文字領域切り出し部より得られ
る文字領域切り出し情報及び文字の図形特徴を蓄える文
字情報格納部と、英単語の綴りを記憶している単語辞書をもとに次の認識
対象文字を決定する認識対象文字決定部と、認識結果を出力する出力部と、を有する英文字認識装置
であって、前記文字領域切り出し部及び文字認識部は、次の認識対
象文字と同一の文字が前記文字情報格納部に既に認識さ
れた出力として格納されている場合には、前記文字情報
格納部に格納された前記同一の文字の文字領域切り出し
情報を用いて単語領域から次に認識すべき図形特徴を抽
出し、この抽出された図形特徴と前記文字情報格納部に
格納された前記同一の文字の図形特徴とを照合すること
により文字認識を行うことを特徴とする英文字認識装
置。