JPH04289989A

JPH04289989A - 英文字認識装置

Info

Publication number: JPH04289989A
Application number: JP3054469A
Authority: JP
Inventors: Ryoichi Yushimo; 良一湯下
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1991-03-19
Filing date: 1991-03-19
Publication date: 1992-10-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、英文字の認識を行なう
英文字認識装置に関するものである。

【０００２】

【従来の技術】近年、文字認識装置をコンピュータ等の
入力装置として利用する要求が高まっており、安定な認
識結果を効率的に得ることのできる文字認識装置がコン
ピュータ等のシステムの性能向上に不可欠となっている
。

【０００３】このとき、従来の認識装置は、文書中の全
ての文字の認識処理を、認識対象としている全ての文字
の中から選び出すことにより行っていた。

【０００４】

【発明が解決しようとする課題】上記で説明したように
従来の文字認識装置は、文書中の全ての認識処理を、認
識対象としている全ての文字の中から選び出すことによ
り行っていたため、選出するための比較処理の回数が多
く、処理時間の増大を招いていた。また、認識対象文字
の中には形状が類似している文字、たとえば‘英文字の
Ｏ’と‘数字の０’や、‘英文字のｌ’と‘数字の１’
などが含まれており、それら相互間での誤認識による認
識率の低下が問題となっていた。

【０００５】本発明は上記問題を解決するもので、比較
処理の回数を軽減し処理時間の短縮を図ることができる
とともに、誤認識を抑えるのに役立つ英文字認識装置を
提供することを目的とするものである。

【０００６】

【課題を解決するための手段】上記課題を解決するため
に、本発明の英文字認識装置は、文字領域切り出し部か
ら切り出された文字領域の先頭の文字画像より、英単語
の綴りを木構造にて表現した英単語辞書をもとに後続の
認識対象文字を求める認識対象文字決定部を設け、文字
領域の画像とこの認識対象文字決定部にて限定された認
識対象文字を比較し、それらの間の類似度を求め認識結
果を決定する文字認識部とを備えたものである。

【０００７】

【作用】上記構成により、文字の認識処理を行う度毎に
英単語の綴り情報をもとに認識対象とする文字は限定さ
れ、この限定された認識対象文字と文字領域の画像が比
較されることにより、認識結果となる文字の選出のため
の比較処理の回数は軽減し、処理時間は短縮されるとと
もに、類似文字の誤認識は抑えられ認識率は向上される
。

【０００８】

【実施例】以下、本発明の一実施例を図面とともに説明
する。図１において、１は認識対象文書を文書画像とし
て入力する画像入力部、２は入力された文書画像から文
字列の集まりを見つけ、文章領域を出力する文章領域切
り出し部、３は文章領域から単語単位の区切りを見つけ
１つの単語の範囲を単語領域として出力する単語切り出
し部、４は単語領域から文字単位の区切りを見つけ１つ
の文字の範囲を文字領域として出力する文字領域切り出
し部である。５は文字領域内の画像の図形特徴と認識対
象となっている文字の認識辞書６を比較し、それらの間
の類似度を求め、認識結果を決定する文字認識部であり
、認識辞書６は認識対象となる全ての文字の図形特徴を
もとにあらかじめ用意されている。７は英単語の綴りを
木構造にて表現した英単語辞書８をもとに認識対象文字
を求める認識対象文字決定部であり、文字領域内の先頭
の文字画像を認識したら、その文字に引き続いて単語を
構成する文字として配置される可能性のある認識対象文
字を英単語辞書８から求め、認識辞書６の認識対象とな
る文字を選択する。９は１〜５の各部をつなぐ内部バス
、１０，１１，１２はそれぞれ５と６、５と７、７と８
をつなぐ内部バスである。

【０００９】このように構成された本実施例の英文字認
識装置について、図２に示した全体の処理の流れ図、図
３に示した英単語辞書８の一部を用いて、以下その動作
を説明する。

【００１０】まず認識したい文書を画像入力部１により
文書画像として入力する（ステップ１３）。入力された
文書画像を文章領域切り出し部２に送り、文章領域切り
出し部２にて文書画像の縦方向および横方向の黒画素の
ヒストグラムを求め、これをもとに文章領域を見つけ、
そして文章領域の位置情報を内部データとして蓄える（
ステップ１４）。

【００１１】単語領域切り出し部３に文章領域の位置情
報を送り、文章領域内に対する単語領域切り出し処理を
行う。単語領域切り出し部３では単語の前後のスペース
が単語内の文字間よりも大きいことに注目し、ある幅以
上のスペースに挟まれた文字列を単語領域として切り出
し、文章領域切り出し部２にて見つけられた文章領域内
の全ての単語領域の位置情報を求め、内部データとして
蓄える（ステップ１５）。

【００１２】文字切り出し部４に単語領域の位置情報を
送り、単語領域に対する文字領域切り出し処理を行う。文字領域切り出し部４では単語領域内の黒画素のヒスト
グラムの変化に注目し、ヒストグラムがある値以下の部
分を文字と文字の区切りとして単語領域内の文字の連な
りを文字単位に分離し文字領域として切り出し、単語領
域切り出し部３にて見つけられた単語領域内の全ての文
字領域の位置情報を求め、内部データとして蓄える（ス
テップ１６）。

【００１３】以上のステップ１４からステップ１６にて
求められた、文章領域・単語領域・文字領域の位置デー
タをもとに文字の認識処理を行う。認識処理は単語毎に
行われ、ステップ１７からステップ２９にて１つの単語
が認識される。

【００１４】１つの単語の認識の過程を「ｑｕｅｅｎ」
を例として示す。認識処理において２種類のフラグを使
用しており、以下のような意味を持つ。１．ワードフラグ　　．．．　　処理しようとする単語
の認識対象文字を英単語辞書８をもとに限定できるか否
かを示すもので、値「０」は限定できる状態、値「１」
は限定できない状態を表わす。したがって処理しようと
する単語が英単語辞書８に記載されていることを前提と
する場合には、このフラグに「０」をセットし、記載さ
れていないことを前提とする場合には、「１」をセット
することとなる。

【００１５】２．対象フラグ　　　　．．．　　認識の
際の認識対象文字を全ての文字としたか限定したかを示
すもので、値「０」は全ての文字とした状態、値「１」
は限定した状態を示す。

【００１６】また、「ｑｕｅｅｎ」の左端の文字から順
に第１、２、３、４、５文字とし、その順序にて認識処
理が行われるものとして以下動作を説明する。まずワー
ドフラグに「０」をセットし、これより認識しようとす
る単語が英単語辞書８に記載されていることを前提とし
て、単語の認識処理を行う。なお、この処理は一つの単
語を認識する度に行う（ステップ１７）。

【００１７】次にワードフラグが「０」か「１」を判定
し、認識の際の認識対象文字を限定するか否かを決定す
る。ワードフラグが「０」の場合は認識対象文字決定部
７が認識しようとする単語におけるこれまでの認識結果
の履歴により、英単語辞書８をもとに認識対象文字を限
定し（ステップ２１）、対象フラグに「１」をセットす
る（ステップ２２）。ワードフラグが「１」の場合は認
識対象文字を限定せず（ステップ１９）、対象フラグに
「０」をセットする（ステップ２０）。ここで、認識し
ようとする文字が第１文字目の場合は無条件に全ての文
字を認識対象とする。これは第１文字目がどのような文
字で始まるかは予測できないためで、第１文字目は常に
全ての文字を認識対象文字として文字認識部５で認識処
理を行う。

【００１８】次に認識対象文字の決定の過程を説明する
。この処理は認識対象文字決定部７にて行われ、図３に
示す単語辞書８をもとに認識対象文字が決定される。英単語辞書８は単語の文字のつながりを木構造で表現し
たもので第１文字、第２文字、第３文字．．．と辿って
いくことにより注目する位置にどのような文字が当ては
められるかが得られる。たとえば第１文字が「ｑ」の場
合、第２文字に当てはめ可能な文字は「ｕ」のみとなり
、第１・２文字がそれぞれ「ｑ」「ｕ」の場合は第３文
字に当てはめ可能な文字は「ａ」「ｅ」「ｉ」「ｏ」「
ｒ」となる。

【００１９】したがって、第１文字の認識結果を「ｑ」
とした場合、第２文字目の認識対象文字は「ｕ」のみと
なり、第１・２文字の認識結果がそれぞれ「ｑ」「ｕ」
の場合は第３文字目の認識対象文字は「ａ」「ｅ」「ｉ
」「ｏ」「ｒ」となり、認識辞書６の中から選択される
。

【００２０】以上の処理で決定された認識対象文字は認
識辞書６から文字認識部５に送られ、注目する文字領域
の画像と各認識対象文字との間の形状の類似性を類似度
として求める（ステップ２３）。そして各認識対象文字
の中に認識結果として決定するに値する類似度を持つ文
字があるかを判定する（ステップ２４）。

【００２１】たとえば、第１文字は全ての認識対象文字
との間で類似度を求め、その中から最も形状が類似した
文字、すなわち「ｑ」を認識結果とする。第２文字は第
１文字の認識結果が「ｑ」であるので認識対象文字は「
ｕ」のみとなり、認識辞書６の「ｕ」との間の類似度を
求め、それが認識結果とするに値するものであれば「ｕ
」を認識結果とする。

【００２２】判定の結果、認識結果が得られた場合はそ
れを出力するとともに認識対象文字決定部に送る（ステ
ップ２５）。認識対象文字決定部７ではそれを認識結果
の履歴として蓄える（ステップ２６）。

【００２３】認識結果が得られなかった場合は処理しよ
うとする単語が単語辞書に記載されていないものと判断
し、以後、この単語の認識処理においては認識対象文字
の限定を行わないためにワードフラグに「１」をセット
する（ステップ２７）。その後、対象フラグが「０」か
「１」かを判定し（ステップ２８）、「０」の場合はリ
ジェクトコードを認識結果として出力し（ステップ２９
）、「１」の場合はステップ１８に処理を移し、全ての
文字を認識対象として認識処理をやり直す。

【００２４】以上、ステップ１８からステップ２９を単
語中の全ての文字が認識されるまで繰り返し（ステップ
３０）、ステップ１６からステップ３０を文書中の全て
の単語が認識されるまで繰り返す（ステップ３１）こと
により与えられた文書画像の文字認識処理を行う。

【００２５】

【発明の効果】以上説明したように本発明によれば、文
字の認識処理を行う度毎に英単語の綴り情報をもとに認
識対象とする文字を限定することにより、文字の認識処
理の際の比較処理の回数を軽減し、処理時間の短縮を図
るとともに、類似文字の相互間での誤認識を抑え認識率
の向上を図ることができる。

【図面の簡単な説明】

【図１】本発明の一実施例の英文字認識装置の構成図で
ある。

【図２】図１の英文字認識処理装置の全体の流れ図であ
る。

【図３】単語辞書の内容の一部を示す図である。

【符号の説明】

１　　画像入力部２　　文章領域切り出し部３　　単語領域切り出し部４　　文字領域切り出し部５　　文字認識部６　　認識辞書７　　認識対象文字決定部８　　単語辞書

Claims

【特許請求の範囲】

【請求項１】　　認識対象文章を入力する画像入力部と
、入力された文書画像から文章領域を出力する文章領域
切り出し部と、文章領域から単語領域を出力する単語領
域切り出し部と、単語領域から無事領域を出力する文字
領域切り出し部と、英単語の綴りを木構造にて表現した
英単語辞書をもとに認識対象文字を求める認識対象文字
決定部と、文字領域の画像と前記認識対象文字決定部に
て限定された認識対象文字を比較し、それらの間の類似
度を求め認識結果を決定する文字認識部とを備えた英文
字認識装置。