JPH04306786A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH04306786A
JPH04306786A JP3070985A JP7098591A JPH04306786A JP H04306786 A JPH04306786 A JP H04306786A JP 3070985 A JP3070985 A JP 3070985A JP 7098591 A JP7098591 A JP 7098591A JP H04306786 A JPH04306786 A JP H04306786A
Authority
JP
Japan
Prior art keywords
character
recognition
word
dictionary
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3070985A
Other languages
English (en)
Inventor
Ryoichi Yushimo
良一 湯下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3070985A priority Critical patent/JPH04306786A/ja
Publication of JPH04306786A publication Critical patent/JPH04306786A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は英文字などを認識する文
字認識装置に関する。
【0002】
【従来の技術】近年、文字認識装置をコンピュータなど
の入力装置として利用する要望が高まっており、安定し
た認識結果を効率的に得る文字認識装置がコンピュータ
などのシステムの性能向上に不可欠となっている。
【0003】以下、従来の文字認識装置について説明す
ると、従来の文字認識装置は、文書中の文字がすべての
認識対象文字、たとえば、アルファベットのa・・・z
,A・・・Z,や記号の”&!?・・・などの文字や記
号であり得ると考えて、一つ一つの文字についてこれら
のすべての文字や記号であるかどうかを調べて認識処理
している。
【0004】
【発明が解決しようとする課題】このような従来の文字
認識装置では、文書中のすべて文字の認識処理を、認識
対象としているすべての文字の中から選び出すことによ
り行なっていたため、選出するための比較処理の回数が
多く、処理時間の増大を招いていた。また、認識対象文
字の中には形状が類似している文字、たとえば、英文字
の”O”と数字の”0”、英文字の”I”と数字の”1
”などが含まれており、それらの誤認識による認識率の
低下が問題となっていた。
【0005】本発明は上記の課題を解決するもので、処
理時間の短く、類似文字があっても認識率の高い文字認
識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明は上記の目的を達
成するために、認識対象文書を文書画像として入力する
画像入力部と、入力された文書画像から文章領域を切り
出して出力する文章領域切り出し部と、文章領域から単
語領域を切り出して出力する単語領域切り出し部と、単
語領域から文字領域を切り出して出力する文字領域切り
出し部と、単語における文字の連なり関係を木構造にて
記憶した単語辞書と、文字の寸法特徴を記載した文字位
置辞書と、文字の画像特徴を記載した認識辞書と、認識
した文字のつぎの認識対象文字を前記単語辞書および前
記文字位置辞書とから限定して決定する認識対象文字決
定部と、切り出した文字画像を前記決定した認識対象文
字に対応する認識辞書の画像特徴と比較し、その間の類
似度から認識結果を決定する文字認識部とを備えた文字
認識装置とする。
【0007】
【作用】本発明は上記の構成において、文章領域切り出
し部が画像入力部で入力した認識対象文書の文書画像か
ら文章領域を切り出し、単語領域切り出し部が前記文章
領域から単語領域を切り出し、文字領域切り出し部が前
記単語領域から文字領域を切り出し、認識対象文字決定
部が単語辞書の文字連なり情報および文字位置辞書の寸
法情報をもとに認識対象とする文字を限定して認識対象
文字とし、文字認識部が文字領域の画像を前記認識対象
文字に対応する認識辞書の画像特徴と比較して類似度か
ら文字を認識決定する。
【0008】
【実施例】(実施例1)以下、本発明の一実施例の文字
認識装置について図面を参照しながら説明する。
【0009】図1は本発明の一実施例の文字認識装置の
構成をブロック図で示す。図において、1は認識対象文
書を文書画像として入力する画像入力部、2は入力され
た文書画像から文字列の集まりを見つけて、文章領域を
出力する文章領域切り出し部、3はその文章領域から単
語単位の区切りを見つけて1つの単語の範囲を単語領域
として出力する単語領域切り出し部、4はその単語領域
から文字単位の区切りを見つけて1つの文字の範囲を文
字領域として出力する文字切り出し部、5は文字領域内
の画像の図形特徴を認識辞書6の図形特徴情報と比較し
、それらの間の類似度から文字を認識して決定する文字
認識部、6はあらかじめ種々の文字や記号の図形特徴情
報を記載して用意した認識辞書で、たとえば、文字を複
数の画素に分割し、それらの画素の濃淡分布を黒と白の
分布データとして記載したものである。7は単語辞書5
および文字位置辞書9をもとに認識対象文字を決定する
認識対象文字決定部、8は単語における文字の連なり関
係を木構造で表現した単語辞書、9は文字の寸法情報を
蓄えた文字位置辞書、10は画像入力部1から文字認識
部5の各部を相互に接続する内部バス、11、12、お
よび13はそれぞれ文字認識部5と認識辞書6、文字認
識部5と認識対象決定部7、認識対象文字決定部7と単
語辞書8と文字位置辞書9を接続する内部バスである。 なお、上記の認識対象文字とは、言い替えると候補文字
である。
【0010】図2は本発明の一実施例の文字認識装置の
動作を示すフローチャートである。上記構成要素の相互
関係と動作について図2を参照しながら説明する。
【0011】ステップ1において、文字認識したい文書
を画像入力部1により文書画像として入力する。
【0012】ステップ2において、入力された文書画像
を文章領域切り出し部2に送り、文章領域切り出し部2
で文書画像の縦方向および横方向の黒画素のヒストグラ
ムを求め、それをもとに文章領域を見つけ、文章領域の
位置情報を内部データとして蓄える。
【0013】ステップ3において、単語領域切り出し部
3に前記文章領域の位置情報を送り、文章領域内に対し
て単語領域切り出し処理を行なう。単語領域切り出し部
3では単語の前後のスペースが単語内の文字間隔よりも
大きいことに注目し、所定の幅以上のスペースに挟まれ
た文字列を単語領域として切り出す。文章領域切り出し
部2で切り出した文章領域内のすべての単語領域の位置
情報を求め、内部データとして蓄える。
【0014】ステップ4において、文字切領域り出し部
4に前記単語領域の位置情報を送り、単語領域に対して
文字領域切り出し処理を行なう。文字領域切り出し部4
では単語領域内の黒画素のヒルトグラムの変化に注目し
、ヒストグラムが所定の値以下の部分を文字と文字の区
切りと判断し、単語領域内の文字の連なりを文字単位に
分離して文字領域を切り出す。単語領域切り出し部3で
切り出した単語領域内のすべての文字領域の位置情報を
求め、内部データとして蓄える。
【0015】以上の処理で求めた文章領域、単語領域お
よび文字領域の位置データをもとにステップ5からステ
ップ7により文字の認識処理を行なう。この認識処理は
単語ごとに行ない、ステップ5からステップ18で1つ
の単語が認識される。
【0016】以下、単語の認識過程を英単語「flow
er」について説明する。この処理において、2種類の
フラグを使用する。以下、そのフラグについて説明する
【0017】1.ワードフラグ 処理しようとする単語の認識対象文字を英単語辞書にお
ける文字の連なり情報をもとに限定するか否かを示すも
ので、 ・値「0」は限定する状態 ・値「1」は限定しない状態 を表わす。したがって、処理しようとする単語が英単語
辞書に記載されていることを前提とする場合はフラグに
「0」をセットし、記載されていないことを前提とする
場合には、フラグに「1」をセットすることとなる。
【0018】ここで、英単語辞書に記載されているとい
うことは、たとえば、文字「f」のつぎに連なる文字が
英単語の特徴として数個の文字に限られ、その文字情報
が記載してあるということである。
【0019】2.対象フラグ 認識処理の認識対象文字をすべての文字としたか、限定
したかを示すもので、 ・値「0」はすべての文字とした状態 ・値「1」は限定した状態 を表わす。
【0020】ここで、限定することは、英単語辞書の前
記文字連なり情報に記載された文字候補に限定して処理
するか、または可能性のあるすべての文字候補と考えて
処理するかということである。
【0021】以下、「flower」の左端の文字から
順に第1、第2、第3、第4、第5、第6文字とし、そ
の順序で認識処理を行なうものとして動作を説明する。
【0022】まず、ステップ5においてワードフラグに
「0」をセットし、英単語辞書の文字連なり情報を利用
して処理を高速にし、また、類似文字による誤認識を避
けるために、認識しようとする単語が英単語辞書に記載
されているとして認識処理を行なう。なお、この処理は
1つの単語を認識するたびに行なう。
【0023】ステップ6で、ワードフラグが「1」また
は第1文字か、その他の場合かを判定し、第1文字であ
るために認識対象文字を限定できない場合または英単語
辞書の連なり情報を参照しない場合は、ステップ7に移
行し、その他の場合はステップ9に移行する。まず、「
flower」の第1文字から認識するとき、ステップ
7に移行し、候補文字すなわち、認識対象文字を限定せ
ずにすべての文字を認識対象文字とする。また、認識対
象文字を限定していないのでステップ8で対象フラグを
「0」に設定し、ステップ10に移行する。また、第2
文字以降またはワードフラグが「0」の場合はステップ
9に移行する。ここでは英単語辞書の文字連なり情報を
利用して認識対象文字を決定し、英単語辞書を利用した
文字限定であるのでステップ10で対象フラグを「1」
に設定してステップ10に移行する。
【0024】ステップ10では1文字を認識して何文字
であるかを決定する処理を実行する。第1文字はこのス
テップで決定され、また、第2文字以降の文字もいくつ
かの候補文字、すはわち認識対象文字の中から1つの文
字を選択して決定する。この決定する処理は文字認識部
(図1の5)が行なうもので、画像入力された文字の図
形を、たとえば、画素分析して図形の特徴をデータ化し
、あらかじめ種々の文字および記号の図形的特徴を記載
した認識辞書(図1の6)と比較して類似性を求め、最
も類似したものを選んで認識文字とする。このようにし
て「flower」の第1文字が「f」と決定され、認
識される。
【0025】つぎに、前記ステップ9における認識対象
文字決定の動作について説明する。この処理は文字候補
、すなわち認識対象文字をある範囲に限定して絞る処理
である。認識対象文字決定部(図1の7)は認識しつつ
ある単語の認識過程の履歴、たとえば、第1文字が「f
」であったという履歴をもとに、英単語辞書を参照して
つぎに続く文字候補をいくつかに限定し、その限定され
た文字候補をさらに文字位置辞書に記載された文字の形
状情報と比較してより少ない文字に限定する。この処理
には英単語辞書に記載された英単語特有の綴り構造に依
存した文字の連なり情報と、文字位置辞書の寸法情報を
利用する。
【0026】英単語辞書8は英単語特有の文字の連なり
を木構造で表現したもので、第1文字に連なり可能な第
2文字、それに連なり可能な第3文字、・・・を木構造
で記載しており、この英単語辞書を第1文字、第2文字
・・・と辿っていくことにより、すでに認識した文字の
つぎにの文字を記載された文字に限定することができる
【0027】図3はそのつながりの木構造を模式図で示
す。たとえば、第1文字が「f」の場合、第2文字に連
なる文字は「a」、「e」、「i」、「j」、「l」、
「n」、「o」、「r」、「u」、「y」に限定され、
第1文字が「f」、第2文字が「l」の場合は第3文字
に連なり可能な文字は「a」、「e」、「i」、「o」
、「u」および「y」である。図には記載していないが
、実際には「f」に連なる「a」についても、「e」に
ついても、その他の文字についても、第2文字、第3文
字・・・の連なり情報が木の枝のように連なって、末広
がりの木構造が記載されている。
【0028】図5は文字位置辞書の文字の位置情報、言
い替えれば寸法情報を各文字ごとに記憶した構成を模式
図で示す。この文字位置辞書は図4のパターン図で示す
ようにベースラインを基準としたときの文字の高さ、お
よびベースラインよりも下に突き出している部分、すな
わちディセンダの有無を記憶している。高さ情報はベー
スラインからの文字の高さについて、大文字の高さh1
、小文字の高さh2、どちらとも決定できないものの3
つに区分し、それぞれ1、2、3としており、また、デ
ィセンダ情報はディセンダがない場合を1、ある場合を
2、書体による場合を3としている。前記の英単語辞書
により限定された認識対象は文字位置辞書により入力文
字と文字位置情報が一致するかを確かめられ、一致した
ものが最終的に認識対象文字となる。したがって、第1
文字の認識結果を「f」とした場合、第2文字の認識対
象文字は入力文字の高さ・ディセンダがともに1なので
、候補文字「a」、「e」、「i」、「o」、「u」、
「y」のうちの「i」と「l」と決定する。また、第1
文字が「f」、第2文字が「l」と認識されたとき、第
3文字を同様の処理により[a」、[e」、[i」、「
o」、「u」に限定する。
【0029】以上のように、ステップ11で1文字が認
識され、第1文字が「f」、第2文字が「l」、第3文
字が「o」・・・と順次認識されていくとともに、その
認識結果がステップ13で出力され、また、ステップ1
4で認識結果が認識履歴として認識対象文字決定部に記
憶される。
【0030】ステップ11で認識結果が得られなかった
場合は、処理しようとする単語が英単語辞書に記載され
ていないものと判断し、ステップ15に移行して、以後
、この単語の認識処理で認識対象文字を限定しないため
にワードフラグに「1」をセットし、ステップ16に移
行する。ステップ16は対象フラグが「0」か「1」か
を判定し、「0」の場合はリジェクトコードを認識結果
として出力してステップ18に移行し、「1」の場合は
ステップ6に移行し、すべての文字を認識対象として認
識処理をやり直す。
【0031】ステップ18において、単語中のすべての
文字が認識されるまで繰り返し、ステップ19において
、文章中のすべての単語が認識されるまで繰り返すこと
により、与えられた文書画像の文字認識処理を完了する
【0032】認識対象文字決定部が認識対象文字を決定
するとき、英単語辞書の綴り情報をを参照するので、類
似した文字が排除される。たとえば、「flower」
における「f」のつぎの「l」が「1」とされる誤認識
は起こり得ない。
【0033】以上のように本発明の実施例の文字認識装
置によれば、認識対象文書を文書画像として入力する画
像入力部と、入力された文書画像から文章領域を切り出
して出力する文章領域切り出し部と、文章領域から単語
領域を切り出して出力する単語領域切り出し部と、単語
領域から文字領域を切り出して出力する文字領域切り出
し部と、単語における文字の連なり関係を木構造にて記
憶した単語辞書と、文字の寸法特徴を記載した文字位置
辞書と、文字の画像特徴を記載した認識辞書と、認識し
た文字のつぎの認識対象文字を前記単語辞書および前記
文字位置辞書とから限定して決定する認識対象文字決定
部と、切り出した文字画像を前記決定した認識対象文字
に対応する認識辞書の画像特徴と比較し、その間の類似
度から認識結果を決定する文字認識部とを備えた文字認
識装置とすることにより、認識対象文字数を限定して候
補文字数を減少することで認識速度を早め、また、単語
の連なり情報で類似文字による誤認識を防止できる。
【0034】なお、実施例では英単語を例に説明したが
、英単語に限定するものでないことは言うまでもない。
【0035】
【発明の効果】以上の実施例から明らかなように、本発
明は、認識対象文書を文書画像として入力する画像入力
部と、入力された文書画像から文章領域を切り出して出
力する文章領域切り出し部と、文章領域から単語領域を
切り出して出力する単語領域切り出し部と、単語領域か
ら文字領域を切り出して出力する文字領域切り出し部と
、英単語における文字の連なり関係を木構造にて記憶し
た単語辞書と、文字の寸法特徴を記載した文字位置辞書
と、文字の画像特徴を記載した認識辞書と、認識した文
字のつぎの認識対象文字を前記単語辞書および前記文字
位置辞書とから限定して決定する認識対象文字決定部と
、切り出した文字画像を前記決定した認識対象文字に対
応する認識辞書の画像特徴と比較し、その間の類似度か
ら認識結果を決定する文字認識部とを備えた文字認識装
置とすることにより、認識速度を早め、また、類似文字
による誤認識を防止できる効果がある。が短い効果があ
る。
【図面の簡単な説明】
【図1】本発明の一実施例の文字認識装置の構成を示す
ブロック図
【図2】本発明の一実施例の文字認識装置の動作を示す
フローチャート
【図3】本発明の一実施例の文字認識装置における英単
語辞書の構成を示す模式図
【図4】本発明の一実施例の文字認識装置における文字
位置情報の作成基準を示すパターン図
【図5】本発明の一実施例の文字認識装置における文字
位置辞書の構成を示す模式図
【符号の説明】
1  画像入力部 2  文章領域切り出し部 3  単語領域切り出し部 4  文字領域切り出し部 5  文字認識部 6  認識辞書 7  認識対象文字決定部 8  英単語辞書(単語辞書) 9  文字位置辞書

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】  認識対象文書を文書画像として入力す
    る画像入力部と、入力された文書画像から文章領域を切
    り出して出力する文章領域切り出し部と、文章領域から
    単語領域を切り出して出力する単語領域切り出し部と、
    単語領域から文字領域を切り出して出力する文字領域切
    り出し部と、単語における文字の連なり関係を木構造に
    て記憶した単語辞書と、文字の寸法特徴を記載した文字
    位置辞書と、文字の画像特徴を記載した認識辞書と、認
    識した文字のつぎの認識対象文字を前記単語辞書および
    前記文字位置辞書とから限定して決定する認識対象文字
    決定部と、切り出した文字画像を前記決定した認識対象
    文字に対応する認識辞書の画像特徴と比較し、その間の
    類似度から認識結果を決定する文字認識部とを備えた文
    字認識装置。
JP3070985A 1991-04-03 1991-04-03 文字認識装置 Pending JPH04306786A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3070985A JPH04306786A (ja) 1991-04-03 1991-04-03 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3070985A JPH04306786A (ja) 1991-04-03 1991-04-03 文字認識装置

Publications (1)

Publication Number Publication Date
JPH04306786A true JPH04306786A (ja) 1992-10-29

Family

ID=13447335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3070985A Pending JPH04306786A (ja) 1991-04-03 1991-04-03 文字認識装置

Country Status (1)

Country Link
JP (1) JPH04306786A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185909A (ja) * 1997-09-03 1999-03-30 Hitachi Ltd 住所認識方法
US5983378A (en) * 1995-10-13 1999-11-09 Jtag Technologies Method tester and circuit for applying a pulse trigger to a unit to be triggered

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983378A (en) * 1995-10-13 1999-11-09 Jtag Technologies Method tester and circuit for applying a pulse trigger to a unit to be triggered
JPH1185909A (ja) * 1997-09-03 1999-03-30 Hitachi Ltd 住所認識方法

Similar Documents

Publication Publication Date Title
Elliman et al. A review of segmentation and contextual analysis techniques for text recognition
Arai et al. Method for real time text extraction of digital manga comic
US10140556B2 (en) Arabic optical character recognition method using hidden markov models and decision trees
Ma et al. Joint layout analysis, character detection and recognition for historical document digitization
JP3452774B2 (ja) 文字認識方法
US7162086B2 (en) Character recognition apparatus and method
Karayil et al. A segmentation-free approach for printed Devanagari script recognition
Nguyen et al. A segmentation method of single-and multiple-touching characters in offline handwritten japanese text recognition
Naz et al. Arabic script based language character recognition: Nasta'liq vs Naskh analysis
JPH04306786A (ja) 文字認識装置
Reul et al. Automatic Semantic Text Tagging on Historical Lexica by Combining OCR and Typography Classification: A Case Study on Daniel Sander's Wörterbuch der Deutschen Sprache
Nguyen et al. Enhanced character segmentation for format-free Japanese text recognition
Thongkanchorn et al. Thai character segmentation in handwriting images using four directional depth first search
Methasate et al. The feature combination technique for off-line Thai character recognition system
KR19990049667A (ko) 한글 문자체 인식 방법
JPH09274645A (ja) 文字認識方法および装置
JPH04289989A (ja) 英文字認識装置
JPH0452783A (ja) 図面読取装置
JP3197441B2 (ja) 文字認識装置
JPH08161432A (ja) 文字切り出し方法および文字切り出し装置
Leishman Shape-free statistical information in optical character recognition
Hwang et al. Segmentation of a text printed in Korean and English using structure information and character recognizers
JP3151866B2 (ja) 英文字認識方法
JP2746345B2 (ja) 文字認識の後処理方法
Sharma et al. A Fuzzy Approach to Hand written Devnagari Script up to five Characters Recognition