JP3446769B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP3446769B2 JP3446769B2 JP26818993A JP26818993A JP3446769B2 JP 3446769 B2 JP3446769 B2 JP 3446769B2 JP 26818993 A JP26818993 A JP 26818993A JP 26818993 A JP26818993 A JP 26818993A JP 3446769 B2 JP3446769 B2 JP 3446769B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- candidate
- code
- distance
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
に、文字パターンの認識結果の正誤を評価し、その結果
を出力する文字認識装置に関する。
いて読取った文字パターン(未知の文字)と候補文字の
特徴を比較し、比較結果としてのパターン間の距離を得
て候補文字のコードを未知の文字のコードとして出力す
るか否かのリジェクト判定を行うものがある。この場
合、第1候補文字の距離を閾値と比較し、第1候補文字
の距離が閾値以下の場合に第1候補文字のコードを未知
の文字コードとして出力し、第1候補文字の距離が閾値
より大きい場合にはリジェクト信号を出していた。
の文字認識装置では第1の辞書を最も使用頻度の高い文
字種についての標準パターンで構成し、第2の辞書以降
は順に使用頻度が低くなる文字種についての標準パター
ンで構成した多段構成の辞書を用いて認識処理を行って
いる。この場合、認識処理は、まず第1の辞書で行な
い、第1候補文字がリジェクトされた場合に第2の辞書
で認識処理を行なう。更に、第2の辞書でもリジェクト
された場合に第3の辞書で認識処理を行う。以下、リジ
ェクトの場合、順に認識処理を行う。
ような従来技術の問題点として、第1候補文字が正解で
あっても、距離が閾値以上の場合にはリジェクト信号が
出力されてしまうという点があった。この問題点は閾値
を大きめにとることにより軽減される(すなわち、正解
文字に対してリジェクト信号が出力される場合が減少す
る)が、この場合、リジェクト信号を出力すべき文字に
ついてもリジェクト信号が出力されにくくなり、誤認識
率が増加するという不都合が生じ得策ではない。
の文字認識装置については、類似文字の場合リジェクト
の可否判定のための閾値が近い(閾値間の差が小さい)
ため、第1の辞書でリジェクトされた文字が正解文字の
場合でも第2の辞書以降でリジェクトされる可能性が高
いという欠点がある。
なされたものであり、1カテゴリ(1文字種)に対して
複数の辞書を用意するマルチ・テンプレート構成の文字
認識装置において、第1候補文字の距離と第1及び第2
候補文字の文字コードを用いることによってリジェクト
判定性能の向上を実現する文字認識装置の提供を目的と
する。
めに第1の発明は、1文字に対して複数の辞書を有する
文字認識装置であって、1文字分の文字パターンを入力
してその特徴量を抽出し、抽出した特徴量を格納する文
字特徴格納部と、抽出された特徴量と辞書部の複数の辞
書の標準特徴量との距離計算をそれぞれ行ない、該計算
で得たそれぞれの距離を所定の順序で分類し該順序に基
づいて複数の候補文字を取り出し、当該候補文字の文字
コードおよび距離を格納する認識部と、文字を示す文字
コードと、一つの閾値と、標準特徴量とを含む辞書であ
って、標準特徴量が異なる複数の辞書を、文字毎に有す
る辞書部と、認識部で第1候補となった候補文字の距離
と当該第1候補文字に対応する辞書の閾値とを比較し、
第1候補文字の距離が該辞書の閾値以下の場合には第1
候補文字の文字コードを認識結果として出力し、第1候
補文字の距離が該辞書の閾値より大きい場合には第1候
補文字の文字コードと他の候補文字の文字コードが同一
か否かにより第1候補文字の文字コードを認識結果とし
て出力するか否かの判定を行う判定部と、を有すること
を特徴とする。
置において、判定部は、認識部で第1候補となった候補
文字の距離と当該第1候補文字に対応する辞書の閾値と
を比較し、第1候補文字の距離が該辞書の閾値以下の場
合には第1候補文字のコードを認識結果として出力し、
第1候補文字の距離が該辞書の閾値より大きい場合には
第1候補文字の文字コードと他の候補文字の文字コード
が同一の文字コードの場合に第1候補文字の文字コード
を認識結果として出力し、同一文字コードでない場合に
リジェクト信号を出力することを特徴とする。
により1文字分の文字パターンを入力し、特徴量を抽出
して格納し、認識部により文字特徴格納部で抽出された
特徴量と辞書部の複数の標準特徴量との距離計算をそれ
ぞれ行い、該計算で得たそれぞれの距離を所定の順序で
分類し該順序に基づいて複数の候補文字を取り出し、当
該候補文字の文字コードおよび距離を格納する。そし
て、判定部により認識部で第1候補となった候補文字の
距離と当該第1候補文字に対応する辞書の閾値とを比較
し、上記距離が閾値以下の場合に第1候補文字の文字コ
ードを認識結果として出力し、距離が閾値より大きい場
合に、第1候補文字と他の候補文字の文字コードを比較
し文字コードの一致・不一致により第1候補文字の文字
コードを認識結果として出力するか否かの判定を行う。
置において、判定部が、認識部で第1候補となった候補
文字の距離と当該第1候補文字に対応する辞書の閾値と
を比較し、該距離が閾値以下の場合に第1候補文字の文
字コードを認識結果として出力し、該距離が閾値より大
きい場合には第1候補文字と他の候補文字の文字コード
を比較し文字コードが一致した場合に第1候補文字の文
字コードを認識結果として出力し、一致しなかった場合
にリジェクト信号を出力する。
例の文字認識処理ブロック10の構成図であり、11は
文字特徴格納部、12は認識部、13は辞書部、14は
リジェクト判定部である。
ーンCpを入力し、文字パターンCpの特徴量Fiを抽
出し、格納する。認識部12は文字パターンCpの特徴
量Fiと辞書部13からの標準特徴量Fdとの距離計算
を行う。また、認識部12は計算で得られた距離の小さ
い順(昇順)に当該距離の文字コードおよびその距離を
格納する。辞書部13は、例えば数字、カタカナなどの
標準的な特徴量Fd及び文字コードなどから構成される
テンプレート構成をなし、各文字種に対して予め複数個
のテンプレートを格納している。
の一例であり、辞書テーブルはテーブル番号NT、文字
コードC、閾値Th、及び標準特徴量Fdで構成されて
いる。なお、テーブル番号は同じ文字種の辞書テーブル
に対して順次割り当てる。図2に示す構成では文字種C
1の辞書はテーブル番号1から3まで3種類あり、ま
た、文字種C2の辞書はテーブル番号1と2の2種類で
ある。なお、nは1文字の特徴数であり特徴抽出の方法
により異なる。
候補となった文字の距離d1と第1候補文字に対応する
辞書の閾値Thを比較し距離d1がその辞書の閾値Th
以下の場合に第1候補文字の文字コードを認識結果とし
て出力する。また、距離d1が上記閾値Thより大きい
場合には第1候補文字の文字コードと他の候補文字の文
字コードを比較し、文字コードが一致した場合に第1候
補文字の文字コードを認識結果として出力し、一致しな
かった場合にはリジェクト信号を認識結果として出力す
る。
て説明する。先ず、文字特徴格納部11で1文字分の文
字パターンCpを入力し、文字パターンCpの特徴量F
iを抽出し、格納する。次に、認識部12で文字特徴格
納部11で格納した文字パターンCpの特徴量Fiを取
り込み、辞書部13の標準特徴量Fdとの距離DSを全
テーブルについて計算する。そして距離を基準に昇順に
ソート(分類)処理を行ない、距離の小さいものから順
に複数の候補文字を取り出しその文字コード及び距離を
格納する。
作例を示すフローチャートであり、リジェクト判定部1
4では、ステップS1で認識部12に格納されている第
1候補文字の距離を辞書部13の辞書テーブルの閾値と
比較する。第1候補文字の距離が閾値より小さい場合は
ステップS2で第1候補文字の文字コードを認識結果と
して出力する。第1候補文字の距離が閾値より大きい場
合はステップS3で第1候補文字の文字コードと第2候
補文字の文字コードとの比較を行なう。第1候補文字の
文字コードが第2候補文字の文字コードと一致した場合
にはステップS2で第1候補文字の文字コードを認識結
果として出力し、一致しなかった場合にはステップS4
でリジェクト信号を認識結果として出力する。
字コードC1の文字を’A’、文字コードC2の文字
を’B’とし、閾値Th1,Th2,Th3,Th4,
Th5を100としたとき、入力した文字パターンCp
が’A’であり、認識部12では次のような結果を得た
ものとする。
10 第2候補文字について、 テーブル番号・・2,文字コード・・C1,距離・・1
80
処理フローにしたがいステップS1で第1候補文字の距
離’110’が閾値Th1(=100)よりも大きいの
でステップS3に移る。ステップS3では第1候補文字
の文字コード’C1’と第2候補文字の文字コード’C
1’を比較すると両者が等しいのでステップS2に移り
第1候補文字の文字コード’C1’が認識結果として出
力される。
認識部12では次のような結果を得たものとする。
20 第2候補文字について、 テーブル番号・・2,文字コード・・C1,距離・・1
80
第1候補文字の距離’120’が閾値Th4(=10
0)よりも大きいのでステップS3に移る。ステップS
3では第1候補文字の文字コード’C2’と第2候補文
字の文字コード’C1’を比較すると両者が異なるので
ステップS4に移り、リジェクト信号が認識結果として
出力される。
と第2候補文字の文字コードとの比較のみを行なってい
るが、これに限られず図4に示すように第1候補文字の
文字コードと第2候補文字の文字コードが異なる場合に
更にステップS4で第1候補文字の文字コードと第3候
補文字の文字コードの比較を行い、第1候補文字の文字
コードと第3候補文字の文字コードが等しい場合にステ
ップS2で第1候補文字の文字コードを認識結果として
出力し、第1候補文字の文字コードと第3候補文字の文
字コードが異なる場合にステップS5に移りリジェクト
信号を認識結果として出力するように構成してもよく、
同様に第4候補文字の文字コード、第5候補文字の文字
コード、・・・と拡張することもできる。
ば、1文字に対して複数の辞書を用意するマルチ・テン
プレート構成の文字認識装置において、第1候補文字の
距離と閾値との比較によるリジェクト判定に加えて、第
1候補文字の距離が閾値を越える場合に第1候補文字の
文字コードと他の候補文字の文字コードを比較し、第1
候補文字の文字コードと他の候補文字の文字コードの一
致・不一致によりリジェクト判定を行なうように構成し
ているのでリジェクト判定性能の向上が実現される。な
お、第2の発明において第1候補文字の距離が閾値を越
える場合に第1候補文字の文字コードと第2候補文字の
文字コードを比較し、第1候補文字の文字コードと第2
候補文字の文字コードの一致・不一致リジェクト判定を
行なうように構成しているが同様にリジェクト判定性能
の向上が実現される。
認識処理ブロックの構成図である。
トである。
ャートである。
Claims (2)
- 【請求項1】 1文字に対して複数の辞書を有する文字
認識装置であって、1文字分の文字パターンを入力して
その特徴量を抽出し、抽出した特徴量を格納する文字特
徴格納部と、 前記抽出された特徴量と辞書部の複数の辞書の標準特徴
量との距離計算をそれぞれ行ない、該計算で得たそれぞ
れの距離を所定の順序で分類し該順序に基づいて複数の
候補文字を取り出し、当該候補文字の文字コードおよび
距離を格納する認識部と、 文字を示す文字コードと、一つの閾値と、標準特徴量と
を含む辞書であって、標準特徴量が異なる複数の辞書
を、文字毎に有する辞書部と、 前記認識部で第1候補となった候補文字の距離と当該第
1候補文字に対応する辞書の閾値とを比較し、第1候補
文字の距離が該辞書の閾値以下の場合には第1候補文字
の文字コードを認識結果として出力し、第1候補文字の
距離が該辞書の閾値より大きい場合には第1候補文字の
文字コードと他の候補文字の文字コードが同一か否かに
より第1候補文字の文字コードを認識結果として出力す
るか否かの判定を行う判定部と、を有することを特徴と
する文字認識装置。 - 【請求項2】 前記判定部は、前記認識部で第1候補と
なった候補文字の距離と当該第1候補文字に対応する辞
書の閾値とを比較し、第1候補文字の距離が該辞書の閾
値以下の場合には第1候補文字のコードを認識結果とし
て出力し、第1候補文字の距離が該辞書の閾値より大き
い場合には第1候補文字の文字コードと他の候補文字の
文字コードが同一の文字コードの場合に第1候補文字の
文字コードを認識結果として出力し、同一文字コードで
ない場合にリジェクト信号を出力することを特徴とする
請求項1記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26818993A JP3446769B2 (ja) | 1993-09-30 | 1993-09-30 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26818993A JP3446769B2 (ja) | 1993-09-30 | 1993-09-30 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07105319A JPH07105319A (ja) | 1995-04-21 |
JP3446769B2 true JP3446769B2 (ja) | 2003-09-16 |
Family
ID=17455161
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26818993A Expired - Lifetime JP3446769B2 (ja) | 1993-09-30 | 1993-09-30 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3446769B2 (ja) |
-
1993
- 1993-09-30 JP JP26818993A patent/JP3446769B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH07105319A (ja) | 1995-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5005205A (en) | Handwriting recognition employing pairwise discriminant measures | |
JP3950535B2 (ja) | データ処理方法及び装置 | |
EP0355748B1 (en) | A pattern recognition apparatus and method for doing the same | |
CN107180084A (zh) | 词库更新方法及装置 | |
Lehal et al. | A shape based post processor for Gurmukhi OCR | |
Chi et al. | Separation of single-and double-touching handwritten numeral strings | |
JP3446769B2 (ja) | 文字認識装置 | |
KR100218394B1 (ko) | 차량 번호판 인식 방법 | |
JP2556477B2 (ja) | パタン照合装置 | |
JP3659688B2 (ja) | 文字認識装置 | |
JP4143148B2 (ja) | 文字認識装置 | |
Bastrup et al. | Language detection based on unigram analysis and decision trees | |
KR19990011492A (ko) | 단어의 음소 구조에 따른 단어 그룹 형성 방법 | |
JP2923295B2 (ja) | パターン同定処理方式 | |
JPH06119497A (ja) | 文字認識方法 | |
JP4338058B2 (ja) | 文字認識装置 | |
JPH04260987A (ja) | 文字認識装置 | |
JPH03154985A (ja) | 最尤度単語認識方式 | |
JP2712186B2 (ja) | 文字認識装置 | |
JPH06348903A (ja) | 文字認識装置 | |
JPH01191992A (ja) | 文字認識装置 | |
JPH0259504B2 (ja) | ||
JPH1011541A (ja) | 文字認識装置 | |
JPH02156388A (ja) | オンライン手書文字認識方式 | |
JPH03224079A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090704 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090704 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120704 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120704 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140704 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term |