JPH0424779A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0424779A
JPH0424779A JP2125938A JP12593890A JPH0424779A JP H0424779 A JPH0424779 A JP H0424779A JP 2125938 A JP2125938 A JP 2125938A JP 12593890 A JP12593890 A JP 12593890A JP H0424779 A JPH0424779 A JP H0424779A
Authority
JP
Japan
Prior art keywords
character
characters
check
operator
reject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2125938A
Other languages
English (en)
Inventor
Hiroaki Ikeda
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2125938A priority Critical patent/JPH0424779A/ja
Publication of JPH0424779A publication Critical patent/JPH0424779A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、認識結果か疑わしい文字を、通常とは異なっ
た方法で表示する機能1文字認識装置に関するものであ
る。
〔従来の技術〕
従来の文字認識装置は、入力文字と標準文字バタンとの
類似度を求め、最も類似度の高い文字が認識結果として
出力される。その時、例えば標準文字パタンの類似度で
最高の値があらかじめ定められた閾値よりも小さい場合
には、認識不能とし、認識結果を表示する際に、リジェ
クト文字をリジエクト記号を用いて表示するものはあっ
た。
また、認識結果がある文字に特定できない場合、その文
字の前にチエツクフラグを表示して認識結果の確認を行
なうようオペレータに知らせ、チエツクを促するように
するものはあった。
〔発明が解決しようとしている課題〕
しかしながら、上記従来の技術では、類似度が非常に低
く、認識結果が十分に疑わしいものであれば、その文字
をリジェクト文字として知らせることは可能であるか、
全ての文字を1つの閾値て判定する為に、誤認識した文
字を表示してしまう可能性もあり、オペレータが認識結
果全てについて確認作業をする必要があるという欠点が
あった。
〔課題を解決する為の手段〕
本発明によれば、従来技術の欠点を解決する為に、文字
画像の入力手段と、入力画像から文字の切り出しを行な
う手段と、切り出された文字画像を1文字ずつ識別計算
を行なう手段と、類似度が最も大きい文字を認識結果と
して出力する出力手段1文字認識装置において、認識不
能文字と、オペレータに認識結果の確認を促す文字の判
定を行なう判定手段、一度認識不能文字あるいはオペレ
ータに認識結果の確認を促す文字と判定された文字につ
いて再判定を行なうよう制御する制御手段、再判定の後
に認識不能文字やオペレータに認識結果の確認を促す文
字と判定された文字を他の認識結果とは異なる表示方法
で表示を行なうよう制御する表示制御手段と1。
また、本発明によれば、従来技術の欠点を解決する為に
、文字画像の入力手段と入力画像から文字の切り出しを
行なう手段と、切り出された文字画像を1文字ずつ識別
計算を行なう手段と、類似度が最も大きい文字を認識結
果として表示する出力手段1文字認識装置において、複
数のカテゴリークループごとに定めた認識不能文字、あ
るいはオペレータに認識結果の確認を促す文字の判定基
準を記憶する記憶手段、入力文字がとのグループに属す
るかを判定する判定手段1。
〔実施例1〕 第11図は本発明における基本構成を示す図であり、1
00は第12図、第13図、第14図におけるフローチ
ャート等の演算を行なう中央演算装置(CPV)、10
1は文字・記号等の入力や、誤認識した時に修正する際
の指示等を行うためのキーボード(K、B、’)、10
2はポインティンタデバイス(P、D、)、103は文
字を認識する際に用いる辞書等を記憶しているリートオ
ンリーメモリ(ROM)、104はスキャナ108によ
り読みとられたデータを記憶するメモリ、105はスキ
ャナ108により読みとられたデータから候補となる単
語等をみフけ、各々の相違度を計算する識別計算部、1
06はCRT、 107はスキャナ108のインターフ
ェイス(SCAN  I/F)、108は画像情報を読
みとるスキャナである。
第1図は、本発明の一実施例を表わすブロック図である
。■でスキャナ108から画像を入力し、2てCPU1
00により入力画像から文字を切り出し、3て識別計算
部105により、切り出した文字画像から特徴を取り出
して識別計算を行い、8てメモリ104に識別部3の処
理結果を格納しておく。4てCPU100によりリジェ
クト・チエツク文字を判定し、9てメモリ104にリジ
ェクト・チエツク文字を記憶する。
5てCPLtlooにより単語の照合による再判定を行
う。7はROM103に記憶しである照合のための単語
辞書である。6てCPU100により認識結果を表示す
る。
ここで本実施例のcpuiooにおける処理の流れを第
12図(a)、第12図(b)、第12図(c)、第1
2図(d)にフローチャートを示し、詳細に説明する。
まず、第2図のき命カ画像を画像入力部Iから入力する
(Sl)。既知の方法を用いて文字切り出し部2て文字
を切り出しくS2)、りンエクト文字を表わすだめのヒ
ツトをメモリ104内に文字数分確保し、オフに初期化
しておく  (S3)。チエツク文字を表わすためのビ
ットをメモリ104内に文字数分確保し、オフに初期化
しておく (S4)。S2にて切り出された文字の識別
計算を識別部3において行い(S5)、結果格納部8に
類似度が太きいものから上位n文字を類似度とともに格
納しておく (S6)。第3図は第2図の4番目の文字
「交」の識別結果を表わしたもので、最大の類似度をV
l、以下V2.V3・・・としておく。閾値t、u、d
をあらかじめ定めでおき、S7てVlとtの値を比較す
る。
S7てVl<tと判定されたならば、その文字はりシエ
ツド文字とし、S3て確保したりシエツド文字を表わす
ビットをオンする(S8)。S7でVl<tてはないと
判断されたならば、更にt≦1<uか否か判定しくS9
)、t≦Vl<uてはないと判断されたならばIVl−
V21<dか否か判断する(SIO)。
S9てt≦Vl<uであると判断された時と、310て
Vl−V21<dであると判断された時は、その文字は
チエツク文字であるとして、S4で確保したチエツク文
字を表わすビットをオンする(311)。
SIOてIVI−V21<dてはない時は、ビットはオ
フのままとし、次の文字の判定へと移る。次に文字があ
るか否か判断しく512)、ある時はS5に戻って最後
の文字まで85から312を繰り返す。
S12で次に文字がない時は、識別結果から単語を抽出
する(S13)。
S14て識別結果にリジェクト文字を表わすビットかオ
ンである文字を含むか否かを判定し、含むと判定された
時は第12図(b)の処理へと進む。
S15て識別結果にチエツク文字を表わすヒツトがオン
である文字を含むか否かを判定し、含むと判定された時
は第12図(c )の処理へと進む。
第4図は照合辞書の内容を示したものであるか、これか
らりシエツド・チエツク文字判定部で2番目のr日」と
12番目の「日」かチエツク文字、6番目のr安」がリ
ジェクト文字となり、「今日は交通?全週間の初口です
。」(9はリジェクト文字)となった場合を例にする。
単語は漢字のみて構成されているものとした場合「今日
」と「交通9全週間」と「初口」の照合が行われる。
リシエツク文字を単語辞書とマツチングを取る(S16
)。この時、リジェクト文字部分には結果格納部8にあ
るn文字のうちであればとの文字が入ってもよい。マツ
チングした単語が1つだけの時(S18)リジェクトを
取り消すことかでき、マツチした単語のりシエツド文字
に対応する文字を結果格納部8に入れ(S19)、リジ
ェクト・チエツク文字記憶部のりシエツド文字を云すビ
ットをオフに・する(S20)。
上記例ではりシエツド文字部分に「安」が入れば「交通
安全週間」にマツチするのでn文字の候補の中にr安」
が入っていればリジェクト文字を「安」にし、ビットを
オフにてきる。照合しようとする単語にリジェクト文字
が複数存在する場合には(S23)、最後のりシエツド
文字に単語の区切りがあるとして再びマツチングを取る
。マツチングか取れなければさらにその前のリジェクト
文字に区切りがあるとしてマツチングが取れるまで区切
りを前にずらしていく。区切りの場所が最初のりシエツ
ド文字まで達した場合、リジェクト・チエツク文字記憶
部のヒツト操作が行わない。
第12図(C)の325においてチエツク文字の単語辞
書とのマツチングを行い、マツチングが成功した場合(
S26)、上記例では「今日」が照合辞書中に存在した
場合、リジェクト・チエツク文字記憶部9のチエツク文
字を示すビットをオフにする(S27)。もしマツチす
る単語が照合辞書になければ(S26)ヒツト操作は行
われない。上記例ではr初口」がそれに当る。
その単語の判定が終了したら、次の単語へと移る。次に
単語があるならば(S28)、S14へ戻り、最後の単
語まで314から328を繰り返す。S28て次に単語
がないと判定されたならば、結果格納部8とリジェクト
・チエツク文字記憶部9の情報よr)認識結果を表示す
る(S29)。りシエツド文字「■」チエツク文字を反
転表示とすると」−記例では第5図のようになる。第6
図は再判定を行わない場合の認識結果を表示したもので
ある。
これにより、照合辞書内に存在する単語であれば、一度
すシエクト文字やチエツク文字になっても取り消すこと
が可能であり、誤認識文字だけをオペレータに知らせる
ことが出来るようになる。ここで、リジェクト・チエツ
ク文字判定部の判定方法や再判定部の判定方法は上記例
に限定されるものではない。また判定に必要な情報につ
いても上記例に限定されるものではない。
〔実施例2〕 第9図は本発明の第2の実施例を表わすブロック図であ
る。1は画像入力部、2は文字切り出し部、3は識別部
、8は結果格納部であり、実施例1と同様である。10
でCPU100によりグループを判定し、カテゴリーを
いくつかに分割したグループをあらかじめ決定しておき
、入力文字がとのグループに属するかを判定する。4は
リジェクト・チエツク文字判定部で、上記グループごと
に判定方法があらかじめ定められている。それぞれのり
シエツド・チエツク文字判定部の結果は、メモリ104
内のりシエツド・チエツク文字記憶部9に格納される。
6でCPU100に結果格納部8とリジェクト・チエツ
ク文字記憶部9の情報より認識結果を表示する。
ここで、本実施例の処理の流れを第13図(a)、第1
3図(b)、第13図(c)、第13図(d)に示すが
、実施例1と同様のステップの説明はここでは省略する
クループ判定部10て最大類似度の文字が平板名である
と判定されたら(S40)、平板名グループとして第1
3図(b)の処理を行う。
グループ判定部10て最大類似度の文字が片仮名である
と判定されたら(S41)、片仮名グループとして第1
3図(c)の処理を行う。
クループ判定部10で最大類似度の文字が平板名・片仮
名以外であると判定されたらデフォルトグループとして
第13図(d)の処理を行う。
平板名グループでは閾値t1、dlがあらかじめ定めら
れており、平板名相リジェクト・チエツク文字判定部で
、vl < tlならば(S42)リジェクト文字(S
8)、l vl−v2 l <diならば(S43)チ
エツク文字としく5ll)その情報をリジェクト・チエ
ツク文字記憶部9に記憶してお(。片仮名グループでは
閾値t2、d2が定められており、片仮名用リジェクト
・チエツク文字判定部でvl < t2ならば(S44
)、リシエツク文字(S8)、1v1−v2<d2なら
ば(S45)チエツク文字としく5ll)、その情報を
リジェクト・チエツク文字記憶部に記憶してお(。
デフォルトグループではt3、u3、d3が定められて
おり、vl < t3ならば(S46) リジェクト文
字(S8)、t3≦vl < u3 (S47)または
1vlV21〈d3ならば(S48)チエツク文字と判
定する(Sll)。S5からS28の処理を最終文字ま
で繰り返しく528)、リジェクト・チエツク文字の判
定か終了したならば、リジェクト文字をrllJ、チエ
ツク文字を反転表示するなとして、オペレータに対象と
なった文字を知らせる(S29)。これにより、リジェ
クト文字やチエツク文字の判定方法や基準をクループ内
で他のクループとは独立に決定できるので、それらの文
字を精度よく求めることか可能となる。ここでクループ
判定部の判定方法は上記例に限定されるものではない。
また、判定に必要な情報についても上記例に記憶される
ものではない。
〈実施例3〉 第10図は本発明の第3の実施例を表わすブロック図で
ある。本実施例では識別部3において、特徴を抽出する
前に文字画像の外接矩形の正規化なとにより位置情報が
失われる場合、特に字形が同じて位置が上部または下部
である「o」と「。」、「′」と「、」なとの再判定に
ついて説明する。位置情報が失われるとこれらの文字の
類似度が接近してしまい、必ずチエツク文字になってし
まう。そこで文字切り出し部2で位置情報を取り出し、
位置情報格納部11に記憶しておく。位置情報は文字の
切り出し枠の中央より上にのみ文字画像が存在する場合
上部文字とし、その逆は下部文字とする。情報の格納は
1文字につき2ビツトで入力文字数分のメモリーを確保
しておき(S50.551)、一方のビットを上部文字
、もう一方を下部文字の情報を表わすこととし、上部文
字あるいは下部文字と判定された場合(S52.554
)、対応するビットをオンにする(S53.555)。
S56て次に文字がないと判定されるまて、S52から
S56の処理を繰り返す。
S3と84でリジェクト・チエツク文字用のビットをメ
モリ104内に確保したら、文字画像の外接矩形を正規
化しく556)、識別計算しくS5)、類似度の大きい
ものからn個のカテゴリーと類似度をメモリ104に格
納する(S6)。
S57では文字がりシエツド文字の条件を満たしている
か判定し、満たしている場合はS3で確保したりシエツ
ド文字用のヒツトをオンしく558)、S57で満たし
ていないと判定された場合は次にチエツク文字の条件を
満たしているか判定しく559)、条件を満たしている
場合はS4で確保したチエツク文字用のビットをオンす
る(S60)。
S61て次に文字がないと判定されるまてS56からS
61の処理を繰り返す。
S62でチエツク文字のヒツトがオンしていると第2位
が同じ字形の下部文字であり(S64)、上部文字ビッ
トがオンである(S65)と判定された時は、チエツク
文字用のビットをオフする(S69)。
予め定めである下部文字であり(S66)、第2位が同
じ字形の上部文字であり(S67)、下部文字ビットが
オンである(S68)と判定された時は、チエツク文字
用のビットをオフする(S69)。
と S62、S64からS68で否か判定された時と、S6
9てチエツク文字用のビットをオフしたら、次の文字の
処理へと移り、S70て次に文字かないと判定されるま
でS62からS70まての処理を繰り返す。
最終文字まで処理が終了したら、結果をCRT106上
に表示する(329)。
これにより、類似度か常に接近する文字について、その
区別が可能な特徴を再判定に用いることにより、一度判
定されたチエツク文字をチエツクの必要かない文字であ
れば取り消すことか可能である。
〔発明の効果] 以上説明したように、本発明によれば認識対象文字をい
くつかのグループに分け、各々のグループことにリジェ
クト・チエツク文字の判定基準を定めることにより、よ
り確かなりシエツド・チエツクを促す表示をすることが
可能となり、オペレータの負担を軽くする効果がある。
【図面の簡単な説明】
第1図は本発明を実施した文字認識装置のブロック図、 第2図は実施例を説明するために用いた入力画像を表わ
す図、 第3図は結果格納部の説明図、 第4図は単語辞書の説明図、 第5図は実施例の認識結果を表示した図、第6図は本発
明を行わない場合の認識結果を表示した図、 第7図はりシエツド文字の説明図、 第8図はチエツク文字の説明図、 第9図は本発明の第2の実施例の文字認識装置のブロッ
ク図、 第1O図は本発明の第3実施例の文字認識装置のブロッ
ク図、 第11図は本発明の基本的な構成を示す図、第12図(
a)は実施例1の処理の流れを示すフローチャート、 第12図(b)は実施例1の処理の流れを示すフローチ
ャート、 第12図(c)は実施例1の処理の流れを示すフローチ
ャート、 第12図(d)は実施例1の処理の流れを示すフローチ
ャート、 第13図(a)は実施例2の処理の流れを示すフローチ
ャート、 第13図(b)は実施例2の処理の流れを示すフローチ
ャート、 第13図蜘)は実施例2の処理の流れを示すフローチャ
ート、 第13図(d)は実施例2の処理の流れを示すフローチ
ャート、 第14図(a)は実施例3の処理の流れを示すフローチ
ャートである。 1・・画像入力部 2・文字切り出し部 3・・識別部 4・・・リジェクト・チエツク文字判定部5・・・再判
定部 6・・・認識結果表示部 7・再判定部で用いる照合用の単語辞書8・・・識別部
の結果格納部 9・・・リジェクト・チエツク文字判定部の結果を記憶
するりシエツド・チエツク文字記憶部10・・・グルー
プ判定部 11・・再判定部を用いる位置情報格納部71・・リジ
ェクト文字を表わす記号 81・・チエツク文字を表わす記号 も1図 第2関 第72図 (b) 第72図 CC> (d)

Claims (2)

    【特許請求の範囲】
  1. (1)文字画像の入力手段と、入力画像から文字の切り
    出しを行なう手段と、切り出された文字画像を1文字ず
    つ識別計算を行なう手段と、類似度が最も大きい文字を
    認識結果として出力する出力手段を有する文字認識装置
    において、認識不能文字と、オペレータに認識結果の認
    定を促す文字の判定を行なう判定手段、一度認識不能文
    字あるいはオペレータに認識結果の確認を促す文字と判
    定された文字について再判定を行なうよう制御する制御
    手段、再判定の後に認識不能文字やオペレータに認識結
    果の確認を促す文字と判定された文字を他の認識結果と
    は異なる表示方法で表示を行なうよう制御する表示制御
    手段とを有することを特徴とする文字認識装置。
  2. (2)文字画像の入力手段と入力画像から文字の切り出
    しを行なう手段と、切り出された文字画像を1文字ずつ
    識別計算を行なう手段と、類似度が最も大きい文字を認
    識結果として出力する出力手段を有する文字認識装置に
    おいて、複数のカテゴリーグループごとに定めた認識不
    能文字、あるいはオペレータに認識結果の確認を促す文
    字の判定基準を記憶する記憶手段、入力文字がどのグル
    ープに属するかを判定する判定手段を有することを特徴
    とする文字認識装置。
JP2125938A 1990-05-15 1990-05-15 文字認識装置 Pending JPH0424779A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2125938A JPH0424779A (ja) 1990-05-15 1990-05-15 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2125938A JPH0424779A (ja) 1990-05-15 1990-05-15 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0424779A true JPH0424779A (ja) 1992-01-28

Family

ID=14922683

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2125938A Pending JPH0424779A (ja) 1990-05-15 1990-05-15 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0424779A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013011932A (ja) * 2011-06-28 2013-01-17 Nec Corp 文字チェック装置、方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013011932A (ja) * 2011-06-28 2013-01-17 Nec Corp 文字チェック装置、方法及びプログラム

Similar Documents

Publication Publication Date Title
KR100339446B1 (ko) 주소 인식 장치 및 주소 인식 방법
JPH0664631B2 (ja) 文字認識装置
JPS58103075A (ja) 文字読取装置
JP3215176B2 (ja) 文書画像処理装置及び文書画像処理方法
JPH0424779A (ja) 文字認識装置
JPH0423185A (ja) 自動セル属性判定機能を有する表読取装置
JPH06215184A (ja) 抽出領域のラベリング装置
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2918666B2 (ja) 文字画像切出し方法
JP2993514B2 (ja) 手書きされた金額数字の認識方法
JP3071745B2 (ja) 文字認識結果の後処理方法
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JP2677271B2 (ja) 文字認識装置
JP2890241B2 (ja) 光学的文字認識装置
JP2991457B2 (ja) 特殊連続数字の認識方法
JPH0514952B2 (ja)
JP2000207491A (ja) 文字列読取方法及び装置
JP3725944B2 (ja) 文字認識装置
JPH09269970A (ja) 文字認識方法とその装置
JPH0458381A (ja) 光学的文字読取装置
JP2017146841A (ja) 文字認識装置、文字認識方法、およびプログラム
JPH04274580A (ja) 光学文字読取り装置
JPH04138583A (ja) 文字認識装置
JPH0436885A (ja) 光学式文字読取装置
JPS63147287A (ja) 光学的文字認識装置