JP3446769B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3446769B2
JP3446769B2 JP26818993A JP26818993A JP3446769B2 JP 3446769 B2 JP3446769 B2 JP 3446769B2 JP 26818993 A JP26818993 A JP 26818993A JP 26818993 A JP26818993 A JP 26818993A JP 3446769 B2 JP3446769 B2 JP 3446769B2
Authority
JP
Japan
Prior art keywords
character
candidate
code
distance
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP26818993A
Other languages
English (en)
Other versions
JPH07105319A (ja
Inventor
孝志 勝毛
Original Assignee
株式会社日本デジタル研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日本デジタル研究所 filed Critical 株式会社日本デジタル研究所
Priority to JP26818993A priority Critical patent/JP3446769B2/ja
Publication of JPH07105319A publication Critical patent/JPH07105319A/ja
Application granted granted Critical
Publication of JP3446769B2 publication Critical patent/JP3446769B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置に関し、特
に、文字パターンの認識結果の正誤を評価し、その結果
を出力する文字認識装置に関する。
【0002】
【従来の技術】従来の文字認識装置として認識処理にお
いて読取った文字パターン(未知の文字)と候補文字の
特徴を比較し、比較結果としてのパターン間の距離を得
て候補文字のコードを未知の文字のコードとして出力す
るか否かのリジェクト判定を行うものがある。この場
合、第1候補文字の距離を閾値と比較し、第1候補文字
の距離が閾値以下の場合に第1候補文字のコードを未知
の文字コードとして出力し、第1候補文字の距離が閾値
より大きい場合にはリジェクト信号を出していた。
【0003】また、特開平3−40186号公報に開示
の文字認識装置では第1の辞書を最も使用頻度の高い文
字種についての標準パターンで構成し、第2の辞書以降
は順に使用頻度が低くなる文字種についての標準パター
ンで構成した多段構成の辞書を用いて認識処理を行って
いる。この場合、認識処理は、まず第1の辞書で行な
い、第1候補文字がリジェクトされた場合に第2の辞書
で認識処理を行なう。更に、第2の辞書でもリジェクト
された場合に第3の辞書で認識処理を行う。以下、リジ
ェクトの場合、順に認識処理を行う。
【0004】
【発明が解決しようとする課題】しかしながら、前記の
ような従来技術の問題点として、第1候補文字が正解で
あっても、距離が閾値以上の場合にはリジェクト信号が
出力されてしまうという点があった。この問題点は閾値
を大きめにとることにより軽減される(すなわち、正解
文字に対してリジェクト信号が出力される場合が減少す
る)が、この場合、リジェクト信号を出力すべき文字に
ついてもリジェクト信号が出力されにくくなり、誤認識
率が増加するという不都合が生じ得策ではない。
【0005】また、特開平3−40186号公報に開示
の文字認識装置については、類似文字の場合リジェクト
の可否判定のための閾値が近い(閾値間の差が小さい)
ため、第1の辞書でリジェクトされた文字正解文字の
場合でも第2の辞書以降リジェクトされる可能性が高
いという欠点がある。
【0006】本発明は上記の欠点および問題点に鑑みて
なされたものであり、1カテゴリ(1文字種)に対して
複数の辞書を用意するマルチ・テンプレート構成の文字
認識装置において、第1候補文字の距離と第1及び第2
候補文字の文字コードを用いることによってリジェクト
判定性能の向上を実現する文字認識装置の提供を目的と
する。
【0007】
【課題を解決するための手段】上記の目的を達成するた
めに第1の発明は、1文字に対して複数の辞書を有する
文字認識装置であって、1文字分の文字パターンを入力
してその特徴量を抽出し、抽出した特徴量を格納する文
字特徴格納部と、抽出された特徴量と辞書部の複数の辞
書の標準特徴量との距離計算をそれぞれ行ない、該計算
で得たそれぞれの距離を所定の順序で分類し該順序に基
づいて複数の候補文字を取り出し、当該候補文字の文字
コードおよび距離を格納する認識部と、文字を示す文字
コードと、一つの閾値と、標準特徴量とを含む辞書であ
って、標準特徴量が異なる複数の辞書を、文字毎に有す
る辞書部と、認識部で第1候補となった候補文字の距離
と当該第1候補文字に対応する辞書の閾値とを比較し、
第1候補文字の距離が該辞書の閾値以下の場合には第1
候補文字の文字コードを認識結果として出力し、第1候
補文字の距離が該辞書の閾値より大きい場合には第1候
補文字の文字コードと他の候補文字の文字コードが同一
か否かにより第1候補文字の文字コードを認識結果とし
て出力するか否かの判定を行う判定部と、を有すること
を特徴とする。
【0008】第2の発明は上記第1の発明の文字認識装
置において、判定部は、認識部で第1候補となった候補
文字の距離と当該第1候補文字に対応する辞書の閾値と
を比較し、第1候補文字の距離が該辞書の閾値以下の場
合には第1候補文字のコードを認識結果として出力し、
第1候補文字の距離が該辞書の閾値より大きい場合には
第1候補文字の文字コードと他の候補文字の文字コード
が同一の文字コードの場合に第1候補文字の文字コード
を認識結果として出力し、同一文字コードでない場合に
リジェクト信号を出力することを特徴とする。
【0009】
【0010】
【作用】上記構成により第1の発明は、文字特徴格納部
により1文字分の文字パターンを入力し、特徴量を抽出
して格納し、認識部により文字特徴格納部で抽出された
特徴量と辞書部の複数の標準特徴量との距離計算をそれ
ぞれ行い、該計算で得たそれぞれの距離を所定の順序で
分類し該順序に基づいて複数の候補文字を取り出し、当
該候補文字の文字コードおよび距離を格納する。そし
て、判定部により認識部で第1候補となった候補文字の
距離と当該第1候補文字に対応する辞書の閾値とを比較
し、上記距離が閾値以下の場合に第1候補文字の文字
ードを認識結果として出力し、距離が閾値より大きい場
合に、第1候補文字と他の候補文字の文字コードを比較
し文字コードの一致・不一致により第1候補文字の文字
コードを認識結果として出力するか否かの判定を行う。
【0011】第2の発明は上記第1の発明の文字認識装
置において、判定部が、認識部で第1候補となった候補
文字の距離と当該第1候補文字に対応する辞書の閾値と
を比較し、該距離が閾値以下の場合に第1候補文字の
コードを認識結果として出力し、該距離が閾値より大
きい場合には第1候補文字と他の候補文字の文字コード
を比較し文字コードが一致した場合に第1候補文字の
コードを認識結果として出力し、一致しなかった場合
にリジェクト信号を出力する。
【0012】
【0013】
【実施例】図1は本発明に基づく文字認識装置の一実施
例の文字認識処理ブロック10の構成図であり、11は
文字特徴格納部、12は認識部、13は辞書部、14は
リジェクト判定部である。
【0014】文字特徴格納部11は1文字分の文字パタ
ーンCpを入力し、文字パターンCpの特徴量Fiを抽
出し、格納する。認識部12は文字パターンCpの特徴
Fiと辞書部13からの標準特徴量Fdとの距離計算
を行う。また、認識部12は計算で得られた距離の小さ
い順(昇順)に当該距離の文字コードおよびその距離を
格納する。辞書部13は、例えば数字、カタカナなどの
標準的な特徴量Fd及び文字コードなどから構成される
テンプレート構成をなし、各文字種に対して予め複数個
のテンプレートを格納している。
【0015】ここで、図2は辞書部13のテーブル構成
の一例であり、辞書テーブルはテーブル番号NT、文字
コードC、閾値Th、及び標準特徴量Fdで構成されて
いる。なお、テーブル番号は同じ文字種の辞書テーブル
に対して順次割り当てる。図2に示す構成では文字種C
1の辞書はテーブル番号1から3まで3種類あり、ま
た、文字種C2の辞書はテーブル番号1と2の2種類で
ある。なお、nは1文字の特徴数であり特徴抽出の方法
により異なる。
【0016】リジェクト判定部14は認識部12で第1
候補となた文字の距離d1と第1候補文字に対応する
辞書の閾値Thを比較し距離d1がその辞書の閾値Th
以下の場合に第1候補文字の文字コードを認識結果とし
て出力する。また、距離d1が上記閾値Thより大きい
場合には第1候補文字の文字コードと他の候補文字の
コードを比較し、文字コードが一致した場合に第1候
補文字の文字コードを認識結果として出力し、一致しな
かった場合にはリジェクト信号を認識結果として出力す
る。
【0017】以下、文字認識ブロック10の動作につい
て説明する。先ず、文字特徴格納部11で1文字分の文
字パターンCpを入力し、文字パターンCpの特徴量F
iを抽出し、格納する。次に、認識部12で文字特徴格
納部11で格納した文字パターンCpの特徴量Fiを取
り込み、辞書部13の標準特徴量Fdとの距離DSを全
テーブルについて計算する。そして距離を基準に昇順に
ソート(分類)処理を行ない、距離の小さいものから順
に複数の候補文字を取り出しその文字コード及び距離を
格納する。
【0018】ここで、図3はリジェクト判定部14の動
作例を示すフローチャートであり、リジェクト判定部1
4では、ステップS1で認識部12に格納されている第
1候補文字の距離を辞書部13の辞書テーブルの閾値と
比較する。第1候補文字の距離が閾値より小さい場合は
ステップS2で第1候補文字の文字コードを認識結果と
して出力する。第1候補文字の距離が閾値より大きい場
合はステップS3で第1候補文字の文字コードと第2候
補文字の文字コードとの比較を行なう。第1候補文字の
文字コードが第2候補文字の文字コードと一致した場合
にはステップS2で第1候補文字の文字コードを認識結
果として出力し、一致しなかった場合にはステップS4
でリジェクト信号を認識結果として出力する。
【0019】例えば、図2の辞書テーブルにおいて、文
字コードC1の文字を’A’、文字コードC2の文字
を’B’とし、閾値Th1,Th2,Th3,Th4,
Th5を100としたとき、入力した文字パターンCp
が’A’であり、認識部12では次のような結果を得た
ものとする。
【0020】第1候補文字について、 テーブル番号・・1,文字コード・・C1,距離・・1
10 第2候補文字について、 テーブル番号・・2,文字コード・・C1,距離・・1
80
【0021】この場合、リジェクト判定部14は図3の
処理フローにしたがいステップS1で第1候補文字の距
離’110’が閾値Th1(=100)よりも大きいの
でステップS3に移る。ステップS3では第1候補文字
文字コード’C1’と第2候補文字の文字コード’C
1’を比較すると両者が等しいのでステップS2に移り
第1候補文字の文字コード’C1’が認識結果として出
力される。
【0022】次に、文字パターンCpが’B’であり、
認識部12では次のような結果を得たものとする。
【0023】第1候補文字について、 テーブル番号・・4,文字コード・・C2,距離・・1
20 第2候補文字について、 テーブル番号・・2,文字コード・・C1,距離・・1
80
【0024】リジェクト判定部14ではステップS1で
第1候補文字の距離’120’が閾値Th4(=10
0)よりも大きいのでステップS3に移る。ステップS
3では第1候補文字の文字コード’C2’と第2候補文
字の文字コード’C1’を比較すると両者が異なるので
ステップS4に移りリジェクト信号が認識結果として
出力される。
【0025】なお、図3では第1候補文字の文字コード
と第2候補文字の文字コードとの比較のみを行なってい
るが、これに限られず図4に示すように第1候補文字の
文字コードと第2候補文字の文字コードが異なる場合に
更にステップS4で第1候補文字の文字コードと第3候
補文字の文字コードの比較を行い、第1候補文字の文字
コードと第3候補文字の文字コードが等しい場合にステ
ップS2で第1候補文字の文字コードを認識結果として
出力し、第1候補文字の文字コードと第3候補文字の
コードが異なる場合にステップS5に移りリジェクト
信号を認識結果として出力するように構成してもよく、
同様に第4候補文字の文字コード、第5候補文字の文字
コード、・・・と拡張することもできる。
【0026】
【発明の効果】以上説明したように第1の発明によれ
ば、1文字に対して複数の辞書を用意するマルチ・テン
プレート構成の文字認識装置において、第1候補文字の
距離と閾値との比較によるリジェクト判定に加えて、第
1候補文字の距離が閾値を越える場合に第1候補文字の
文字コードと他の候補文字の文字コードを比較し、第1
候補文字の文字コードと他の候補文字の文字コードの一
致・不一致によりリジェクト判定を行なうように構成し
ているのでリジェクト判定性能の向上が実現される。な
お、第の発明において第1候補文字の距離が閾値を越
える場合に第1候補文字の文字コードと第2候補文字の
文字コードを比較し、第1候補文字の文字コードと第2
候補文字の文字コードの一致・不一致リジェクト判定を
行なうように構成しているが同様にリジェクト判定性能
の向上が実現される。
【図面の簡単な説明】
【図1】本発明に基づく文字認識装置の一実施例の文字
認識処理ブロックの構成図である。
【図2】辞書部13のテーブル構成の一例である。
【図3】リジェクト判定部の動作例を示すフローチャー
トである。
【図4】リジェクト判定部の他の動作例を示すフローチ
ャートである。
【符号の説明】
10 文字認識処理ブロック 11 文字特徴格納部 12 認識部 13 辞書部 14 リジェクト判定部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/76

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 1文字に対して複数の辞書を有する文字
    認識装置であって、1文字分の文字パターンを入力して
    その特徴量を抽出し、抽出した特徴量を格納する文字特
    徴格納部と、 前記抽出された特徴量と辞書部の複数の辞書の標準特徴
    量との距離計算をそれぞれ行ない、該計算で得たそれぞ
    れの距離を所定の順序で分類し該順序に基づいて複数の
    候補文字を取り出し、当該候補文字の文字コードおよび
    距離を格納する認識部と、 文字を示す文字コードと、一つの閾値と、標準特徴量と
    を含む辞書であって、標準特徴量が異なる複数の辞書
    を、文字毎に有する辞書部と、 前記認識部で第1候補となった候補文字の距離と当該第
    1候補文字に対応する辞書の閾値とを比較し、第1候補
    文字の距離が該辞書の閾値以下の場合には第1候補文字
    の文字コードを認識結果として出力し、第1候補文字の
    距離が該辞書の閾値より大きい場合には第1候補文字の
    文字コードと他の候補文字の文字コードが同一か否かに
    より第1候補文字の文字コードを認識結果として出力す
    るか否かの判定を行う判定部と、を有することを特徴と
    する文字認識装置。
  2. 【請求項2】 前記判定部は、前記認識部で第1候補と
    なった候補文字の距離と当該第1候補文字に対応する辞
    書の閾値とを比較し、第1候補文字の距離が該辞書の閾
    値以下の場合には第1候補文字のコードを認識結果とし
    て出力し、第1候補文字の距離が該辞書の閾値より大き
    い場合には第1候補文字の文字コードと他の候補文字の
    文字コードが同一の文字コードの場合に第1候補文字の
    文字コードを認識結果として出力し、同一文字コードで
    ない場合にリジェクト信号を出力することを特徴とする
    請求項1記載の文字認識装置。
JP26818993A 1993-09-30 1993-09-30 文字認識装置 Expired - Lifetime JP3446769B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26818993A JP3446769B2 (ja) 1993-09-30 1993-09-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26818993A JP3446769B2 (ja) 1993-09-30 1993-09-30 文字認識装置

Publications (2)

Publication Number Publication Date
JPH07105319A JPH07105319A (ja) 1995-04-21
JP3446769B2 true JP3446769B2 (ja) 2003-09-16

Family

ID=17455161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26818993A Expired - Lifetime JP3446769B2 (ja) 1993-09-30 1993-09-30 文字認識装置

Country Status (1)

Country Link
JP (1) JP3446769B2 (ja)

Also Published As

Publication number Publication date
JPH07105319A (ja) 1995-04-21

Similar Documents

Publication Publication Date Title
JP3950535B2 (ja) データ処理方法及び装置
EP0355748B1 (en) A pattern recognition apparatus and method for doing the same
EP0436819A2 (en) Handwriting recognition employing pairwise discriminant measures
CN107180084A (zh) 词库更新方法及装置
CN112651296A (zh) 一种无先验知识数据质量问题自动探查方法及系统
Lehal et al. A shape based post processor for Gurmukhi OCR
Chi et al. Separation of single-and double-touching handwritten numeral strings
JP3446769B2 (ja) 文字認識装置
KR100218394B1 (ko) 차량 번호판 인식 방법
JP2556477B2 (ja) パタン照合装置
JP3659688B2 (ja) 文字認識装置
Pirlo et al. Adaptive score normalization for output integration in multiclassifier systems
JP4143148B2 (ja) 文字認識装置
Bastrup et al. Language detection based on unigram analysis and decision trees
KR19990011492A (ko) 단어의 음소 구조에 따른 단어 그룹 형성 방법
JP2923295B2 (ja) パターン同定処理方式
JP2875678B2 (ja) 文字認識結果の後処理方法
JPH06119497A (ja) 文字認識方法
JP4338058B2 (ja) 文字認識装置
JPH04260987A (ja) 文字認識装置
JPH03154985A (ja) 最尤度単語認識方式
JP2712186B2 (ja) 文字認識装置
JPH06348903A (ja) 文字認識装置
JPH01191992A (ja) 文字認識装置
JPH0259504B2 (ja)

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090704

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090704

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120704

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120704

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140704

Year of fee payment: 11

EXPY Cancellation because of completion of term