JPH04306786A

JPH04306786A - 文字認識装置

Info

Publication number: JPH04306786A
Application number: JP3070985A
Authority: JP
Inventors: Ryoichi Yushimo; 良一湯下
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1991-04-03
Filing date: 1991-04-03
Publication date: 1992-10-29

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は英文字などを認識する文
字認識装置に関する。

【０００２】

【従来の技術】近年、文字認識装置をコンピュータなど
の入力装置として利用する要望が高まっており、安定し
た認識結果を効率的に得る文字認識装置がコンピュータ
などのシステムの性能向上に不可欠となっている。

【０００３】以下、従来の文字認識装置について説明す
ると、従来の文字認識装置は、文書中の文字がすべての
認識対象文字、たとえば、アルファベットのａ・・・ｚ
，Ａ・・・Ｚ，や記号の”＆！？・・・などの文字や記
号であり得ると考えて、一つ一つの文字についてこれら
のすべての文字や記号であるかどうかを調べて認識処理
している。

【０００４】

【発明が解決しようとする課題】このような従来の文字
認識装置では、文書中のすべて文字の認識処理を、認識
対象としているすべての文字の中から選び出すことによ
り行なっていたため、選出するための比較処理の回数が
多く、処理時間の増大を招いていた。また、認識対象文
字の中には形状が類似している文字、たとえば、英文字
の”Ｏ”と数字の”０”、英文字の”Ｉ”と数字の”１
”などが含まれており、それらの誤認識による認識率の
低下が問題となっていた。

【０００５】本発明は上記の課題を解決するもので、処
理時間の短く、類似文字があっても認識率の高い文字認
識装置を提供することを目的とする。

【０００６】

【課題を解決するための手段】本発明は上記の目的を達
成するために、認識対象文書を文書画像として入力する
画像入力部と、入力された文書画像から文章領域を切り
出して出力する文章領域切り出し部と、文章領域から単
語領域を切り出して出力する単語領域切り出し部と、単
語領域から文字領域を切り出して出力する文字領域切り
出し部と、単語における文字の連なり関係を木構造にて
記憶した単語辞書と、文字の寸法特徴を記載した文字位
置辞書と、文字の画像特徴を記載した認識辞書と、認識
した文字のつぎの認識対象文字を前記単語辞書および前
記文字位置辞書とから限定して決定する認識対象文字決
定部と、切り出した文字画像を前記決定した認識対象文
字に対応する認識辞書の画像特徴と比較し、その間の類
似度から認識結果を決定する文字認識部とを備えた文字
認識装置とする。

【０００７】

【作用】本発明は上記の構成において、文章領域切り出
し部が画像入力部で入力した認識対象文書の文書画像か
ら文章領域を切り出し、単語領域切り出し部が前記文章
領域から単語領域を切り出し、文字領域切り出し部が前
記単語領域から文字領域を切り出し、認識対象文字決定
部が単語辞書の文字連なり情報および文字位置辞書の寸
法情報をもとに認識対象とする文字を限定して認識対象
文字とし、文字認識部が文字領域の画像を前記認識対象
文字に対応する認識辞書の画像特徴と比較して類似度か
ら文字を認識決定する。

【０００８】

【実施例】（実施例１）以下、本発明の一実施例の文字
認識装置について図面を参照しながら説明する。

【０００９】図１は本発明の一実施例の文字認識装置の
構成をブロック図で示す。図において、１は認識対象文
書を文書画像として入力する画像入力部、２は入力され
た文書画像から文字列の集まりを見つけて、文章領域を
出力する文章領域切り出し部、３はその文章領域から単
語単位の区切りを見つけて１つの単語の範囲を単語領域
として出力する単語領域切り出し部、４はその単語領域
から文字単位の区切りを見つけて１つの文字の範囲を文
字領域として出力する文字切り出し部、５は文字領域内
の画像の図形特徴を認識辞書６の図形特徴情報と比較し
、それらの間の類似度から文字を認識して決定する文字
認識部、６はあらかじめ種々の文字や記号の図形特徴情
報を記載して用意した認識辞書で、たとえば、文字を複
数の画素に分割し、それらの画素の濃淡分布を黒と白の
分布データとして記載したものである。７は単語辞書５
および文字位置辞書９をもとに認識対象文字を決定する
認識対象文字決定部、８は単語における文字の連なり関
係を木構造で表現した単語辞書、９は文字の寸法情報を
蓄えた文字位置辞書、１０は画像入力部１から文字認識
部５の各部を相互に接続する内部バス、１１、１２、お
よび１３はそれぞれ文字認識部５と認識辞書６、文字認
識部５と認識対象決定部７、認識対象文字決定部７と単
語辞書８と文字位置辞書９を接続する内部バスである。なお、上記の認識対象文字とは、言い替えると候補文字
である。

【００１０】図２は本発明の一実施例の文字認識装置の
動作を示すフローチャートである。上記構成要素の相互
関係と動作について図２を参照しながら説明する。

【００１１】ステップ１において、文字認識したい文書
を画像入力部１により文書画像として入力する。

【００１２】ステップ２において、入力された文書画像
を文章領域切り出し部２に送り、文章領域切り出し部２
で文書画像の縦方向および横方向の黒画素のヒストグラ
ムを求め、それをもとに文章領域を見つけ、文章領域の
位置情報を内部データとして蓄える。

【００１３】ステップ３において、単語領域切り出し部
３に前記文章領域の位置情報を送り、文章領域内に対し
て単語領域切り出し処理を行なう。単語領域切り出し部
３では単語の前後のスペースが単語内の文字間隔よりも
大きいことに注目し、所定の幅以上のスペースに挟まれ
た文字列を単語領域として切り出す。文章領域切り出し
部２で切り出した文章領域内のすべての単語領域の位置
情報を求め、内部データとして蓄える。

【００１４】ステップ４において、文字切領域り出し部
４に前記単語領域の位置情報を送り、単語領域に対して
文字領域切り出し処理を行なう。文字領域切り出し部４
では単語領域内の黒画素のヒルトグラムの変化に注目し
、ヒストグラムが所定の値以下の部分を文字と文字の区
切りと判断し、単語領域内の文字の連なりを文字単位に
分離して文字領域を切り出す。単語領域切り出し部３で
切り出した単語領域内のすべての文字領域の位置情報を
求め、内部データとして蓄える。

【００１５】以上の処理で求めた文章領域、単語領域お
よび文字領域の位置データをもとにステップ５からステ
ップ７により文字の認識処理を行なう。この認識処理は
単語ごとに行ない、ステップ５からステップ１８で１つ
の単語が認識される。

【００１６】以下、単語の認識過程を英単語「ｆｌｏｗ
ｅｒ」について説明する。この処理において、２種類の
フラグを使用する。以下、そのフラグについて説明する
。

【００１７】１．ワードフラグ処理しようとする単語の認識対象文字を英単語辞書にお
ける文字の連なり情報をもとに限定するか否かを示すも
ので、・値「０」は限定する状態・値「１」は限定しない状態を表わす。したがって、処理しようとする単語が英単語
辞書に記載されていることを前提とする場合はフラグに
「０」をセットし、記載されていないことを前提とする
場合には、フラグに「１」をセットすることとなる。

【００１８】ここで、英単語辞書に記載されているとい
うことは、たとえば、文字「ｆ」のつぎに連なる文字が
英単語の特徴として数個の文字に限られ、その文字情報
が記載してあるということである。

【００１９】２．対象フラグ認識処理の認識対象文字をすべての文字としたか、限定
したかを示すもので、・値「０」はすべての文字とした状態・値「１」は限定した状態を表わす。

【００２０】ここで、限定することは、英単語辞書の前
記文字連なり情報に記載された文字候補に限定して処理
するか、または可能性のあるすべての文字候補と考えて
処理するかということである。

【００２１】以下、「ｆｌｏｗｅｒ」の左端の文字から
順に第１、第２、第３、第４、第５、第６文字とし、そ
の順序で認識処理を行なうものとして動作を説明する。

【００２２】まず、ステップ５においてワードフラグに
「０」をセットし、英単語辞書の文字連なり情報を利用
して処理を高速にし、また、類似文字による誤認識を避
けるために、認識しようとする単語が英単語辞書に記載
されているとして認識処理を行なう。なお、この処理は
１つの単語を認識するたびに行なう。

【００２３】ステップ６で、ワードフラグが「１」また
は第１文字か、その他の場合かを判定し、第１文字であ
るために認識対象文字を限定できない場合または英単語
辞書の連なり情報を参照しない場合は、ステップ７に移
行し、その他の場合はステップ９に移行する。まず、「
ｆｌｏｗｅｒ」の第１文字から認識するとき、ステップ
７に移行し、候補文字すなわち、認識対象文字を限定せ
ずにすべての文字を認識対象文字とする。また、認識対
象文字を限定していないのでステップ８で対象フラグを
「０」に設定し、ステップ１０に移行する。また、第２
文字以降またはワードフラグが「０」の場合はステップ
９に移行する。ここでは英単語辞書の文字連なり情報を
利用して認識対象文字を決定し、英単語辞書を利用した
文字限定であるのでステップ１０で対象フラグを「１」
に設定してステップ１０に移行する。

【００２４】ステップ１０では１文字を認識して何文字
であるかを決定する処理を実行する。第１文字はこのス
テップで決定され、また、第２文字以降の文字もいくつ
かの候補文字、すはわち認識対象文字の中から１つの文
字を選択して決定する。この決定する処理は文字認識部
（図１の５）が行なうもので、画像入力された文字の図
形を、たとえば、画素分析して図形の特徴をデータ化し
、あらかじめ種々の文字および記号の図形的特徴を記載
した認識辞書（図１の６）と比較して類似性を求め、最
も類似したものを選んで認識文字とする。このようにし
て「ｆｌｏｗｅｒ」の第１文字が「ｆ」と決定され、認
識される。

【００２５】つぎに、前記ステップ９における認識対象
文字決定の動作について説明する。この処理は文字候補
、すなわち認識対象文字をある範囲に限定して絞る処理
である。認識対象文字決定部（図１の７）は認識しつつ
ある単語の認識過程の履歴、たとえば、第１文字が「ｆ
」であったという履歴をもとに、英単語辞書を参照して
つぎに続く文字候補をいくつかに限定し、その限定され
た文字候補をさらに文字位置辞書に記載された文字の形
状情報と比較してより少ない文字に限定する。この処理
には英単語辞書に記載された英単語特有の綴り構造に依
存した文字の連なり情報と、文字位置辞書の寸法情報を
利用する。

【００２６】英単語辞書８は英単語特有の文字の連なり
を木構造で表現したもので、第１文字に連なり可能な第
２文字、それに連なり可能な第３文字、・・・を木構造
で記載しており、この英単語辞書を第１文字、第２文字
・・・と辿っていくことにより、すでに認識した文字の
つぎにの文字を記載された文字に限定することができる
。

【００２７】図３はそのつながりの木構造を模式図で示
す。たとえば、第１文字が「ｆ」の場合、第２文字に連
なる文字は「ａ」、「ｅ」、「ｉ」、「ｊ」、「ｌ」、
「ｎ」、「ｏ」、「ｒ」、「ｕ」、「ｙ」に限定され、
第１文字が「ｆ」、第２文字が「ｌ」の場合は第３文字
に連なり可能な文字は「ａ」、「ｅ」、「ｉ」、「ｏ」
、「ｕ」および「ｙ」である。図には記載していないが
、実際には「ｆ」に連なる「ａ」についても、「ｅ」に
ついても、その他の文字についても、第２文字、第３文
字・・・の連なり情報が木の枝のように連なって、末広
がりの木構造が記載されている。

【００２８】図５は文字位置辞書の文字の位置情報、言
い替えれば寸法情報を各文字ごとに記憶した構成を模式
図で示す。この文字位置辞書は図４のパターン図で示す
ようにベースラインを基準としたときの文字の高さ、お
よびベースラインよりも下に突き出している部分、すな
わちディセンダの有無を記憶している。高さ情報はベー
スラインからの文字の高さについて、大文字の高さｈ１
、小文字の高さｈ２、どちらとも決定できないものの３
つに区分し、それぞれ１、２、３としており、また、デ
ィセンダ情報はディセンダがない場合を１、ある場合を
２、書体による場合を３としている。前記の英単語辞書
により限定された認識対象は文字位置辞書により入力文
字と文字位置情報が一致するかを確かめられ、一致した
ものが最終的に認識対象文字となる。したがって、第１
文字の認識結果を「ｆ」とした場合、第２文字の認識対
象文字は入力文字の高さ・ディセンダがともに１なので
、候補文字「ａ」、「ｅ」、「ｉ」、「ｏ」、「ｕ」、
「ｙ」のうちの「ｉ」と「ｌ」と決定する。また、第１
文字が「ｆ」、第２文字が「ｌ」と認識されたとき、第
３文字を同様の処理により［ａ」、［ｅ」、［ｉ」、「
ｏ」、「ｕ」に限定する。

【００２９】以上のように、ステップ１１で１文字が認
識され、第１文字が「ｆ」、第２文字が「ｌ」、第３文
字が「ｏ」・・・と順次認識されていくとともに、その
認識結果がステップ１３で出力され、また、ステップ１
４で認識結果が認識履歴として認識対象文字決定部に記
憶される。

【００３０】ステップ１１で認識結果が得られなかった
場合は、処理しようとする単語が英単語辞書に記載され
ていないものと判断し、ステップ１５に移行して、以後
、この単語の認識処理で認識対象文字を限定しないため
にワードフラグに「１」をセットし、ステップ１６に移
行する。ステップ１６は対象フラグが「０」か「１」か
を判定し、「０」の場合はリジェクトコードを認識結果
として出力してステップ１８に移行し、「１」の場合は
ステップ６に移行し、すべての文字を認識対象として認
識処理をやり直す。

【００３１】ステップ１８において、単語中のすべての
文字が認識されるまで繰り返し、ステップ１９において
、文章中のすべての単語が認識されるまで繰り返すこと
により、与えられた文書画像の文字認識処理を完了する
。

【００３２】認識対象文字決定部が認識対象文字を決定
するとき、英単語辞書の綴り情報をを参照するので、類
似した文字が排除される。たとえば、「ｆｌｏｗｅｒ」
における「ｆ」のつぎの「ｌ」が「１」とされる誤認識
は起こり得ない。

【００３３】以上のように本発明の実施例の文字認識装
置によれば、認識対象文書を文書画像として入力する画
像入力部と、入力された文書画像から文章領域を切り出
して出力する文章領域切り出し部と、文章領域から単語
領域を切り出して出力する単語領域切り出し部と、単語
領域から文字領域を切り出して出力する文字領域切り出
し部と、単語における文字の連なり関係を木構造にて記
憶した単語辞書と、文字の寸法特徴を記載した文字位置
辞書と、文字の画像特徴を記載した認識辞書と、認識し
た文字のつぎの認識対象文字を前記単語辞書および前記
文字位置辞書とから限定して決定する認識対象文字決定
部と、切り出した文字画像を前記決定した認識対象文字
に対応する認識辞書の画像特徴と比較し、その間の類似
度から認識結果を決定する文字認識部とを備えた文字認
識装置とすることにより、認識対象文字数を限定して候
補文字数を減少することで認識速度を早め、また、単語
の連なり情報で類似文字による誤認識を防止できる。

【００３４】なお、実施例では英単語を例に説明したが
、英単語に限定するものでないことは言うまでもない。

【００３５】

【発明の効果】以上の実施例から明らかなように、本発
明は、認識対象文書を文書画像として入力する画像入力
部と、入力された文書画像から文章領域を切り出して出
力する文章領域切り出し部と、文章領域から単語領域を
切り出して出力する単語領域切り出し部と、単語領域か
ら文字領域を切り出して出力する文字領域切り出し部と
、英単語における文字の連なり関係を木構造にて記憶し
た単語辞書と、文字の寸法特徴を記載した文字位置辞書
と、文字の画像特徴を記載した認識辞書と、認識した文
字のつぎの認識対象文字を前記単語辞書および前記文字
位置辞書とから限定して決定する認識対象文字決定部と
、切り出した文字画像を前記決定した認識対象文字に対
応する認識辞書の画像特徴と比較し、その間の類似度か
ら認識結果を決定する文字認識部とを備えた文字認識装
置とすることにより、認識速度を早め、また、類似文字
による誤認識を防止できる効果がある。が短い効果があ
る。

【図面の簡単な説明】

【図１】本発明の一実施例の文字認識装置の構成を示す
ブロック図

【図２】本発明の一実施例の文字認識装置の動作を示す
フローチャート

【図３】本発明の一実施例の文字認識装置における英単
語辞書の構成を示す模式図

【図４】本発明の一実施例の文字認識装置における文字
位置情報の作成基準を示すパターン図

【図５】本発明の一実施例の文字認識装置における文字
位置辞書の構成を示す模式図

【符号の説明】

１　　画像入力部２　　文章領域切り出し部３　　単語領域切り出し部４　　文字領域切り出し部５　　文字認識部６　　認識辞書７　　認識対象文字決定部８　　英単語辞書（単語辞書）９　　文字位置辞書

Claims

【特許請求の範囲】

【請求項１】　　認識対象文書を文書画像として入力す
る画像入力部と、入力された文書画像から文章領域を切
り出して出力する文章領域切り出し部と、文章領域から
単語領域を切り出して出力する単語領域切り出し部と、
単語領域から文字領域を切り出して出力する文字領域切
り出し部と、単語における文字の連なり関係を木構造に
て記憶した単語辞書と、文字の寸法特徴を記載した文字
位置辞書と、文字の画像特徴を記載した認識辞書と、認
識した文字のつぎの認識対象文字を前記単語辞書および
前記文字位置辞書とから限定して決定する認識対象文字
決定部と、切り出した文字画像を前記決定した認識対象
文字に対応する認識辞書の画像特徴と比較し、その間の
類似度から認識結果を決定する文字認識部とを備えた文
字認識装置。