JPH0714011A - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JPH0714011A
JPH0714011A JP5154761A JP15476193A JPH0714011A JP H0714011 A JPH0714011 A JP H0714011A JP 5154761 A JP5154761 A JP 5154761A JP 15476193 A JP15476193 A JP 15476193A JP H0714011 A JPH0714011 A JP H0714011A
Authority
JP
Japan
Prior art keywords
group
feature
code
distance
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5154761A
Other languages
English (en)
Inventor
Tamotsu Maeda
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5154761A priority Critical patent/JPH0714011A/ja
Publication of JPH0714011A publication Critical patent/JPH0714011A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 高速、高精度な文字認識装置を実現する。 【構成】 グループ毎の代表特徴と各グループに属する
コードを記憶する第1辞書13、入力パターンから特徴
を抽出する特徴抽出部11、この特徴と第1辞書13に
記憶された各グループの代表特徴との距離が小さい順に
グループの順位を決定する第1認識部12’、この順位
を記憶するグループ順位記憶部14、コード毎に対応す
る特徴を記憶する第2辞書16、所定の上位グループに
属するコードの特徴を第2辞書16から読みだし、これ
と入力パターンの特徴との距離を計算し、最小距離およ
び2番目に小さい距離のコードを認識文字として出力す
る第2認識部15、第2認識部15より得られた候補文
字が正解文字の可能性が低く、かつ反復回数が所定回数
以内であれば、前回の順位より下位のグループに属する
コードに対して第2認識部15で距離を再び計算する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字パターンを読み取
って、その文字パターンに対応する文字コードを出力す
る文字認識装置および文字認識方法に関するものであ
る。
【0002】
【従来の技術】近年、文字認識装置は普及期を迎えつつ
あり、高精度かつ低価格の文字認識装置が求められてい
る。
【0003】以下に従来の文字認識装置について説明す
る。図5は従来の文字認識装置の機能ブロック図を示す
ものである。図5において、11は入力文字パターンか
ら特徴を抽出する特徴抽出部、13は特徴の似た文字を
グループ分けしたグループ毎にそれぞれのグループを代
表する特徴(以下、代表特徴)と各グループに属する文
字コードを記憶する第1辞書、12は特徴抽出部11に
よって抽出された特徴と第1辞書13に記憶された各グ
ループの代表特徴との距離を計算する第1認識部、19
は第1認識部によって得られた距離に対して、これが小
さい順番に上位の所定順位までに該当するグループを選
択する選択部、16は文字コード毎に対応する特徴を記
憶する第2辞書、15は選択部19によって選択された
文字コードに対応する特徴を第2辞書16から読みだ
し、この特徴と特徴抽出部11で抽出された入力文字パ
ターンの特徴との距離を計算し、最小距離の文字コード
を認識文字として出力する第2認識部である。
【0004】以上のように構成された文字認識装置につ
いて、以下その動作について説明する。
【0005】まず、特徴抽出部11で入力文字パターン
から特徴を抽出する。次に特徴抽出部11によって抽出
された特徴と第1辞書13に記憶された各グループの代
表特徴との距離を計算する。
【0006】次に、この距離の小さい順番に上位の所定
位までのグループを選択部19で選択する。
【0007】最後に、選択部19によって選択されたグ
ループに属する文字コードの特徴を第2辞書16から読
みだし、この特徴と特徴抽出部11で抽出された入力文
字パターンの特徴との距離を計算し、最小距離の文字コ
ードを認識文字として出力する。
【0008】
【発明が解決しようとする課題】しかしながら、上記の
従来の構成では、選択部19で選択されたグループ内に
正解文字が存在しないことが少なくなく、この場合、認
識精度が低下するという問題点を有していた。
【0009】本発明は上記従来の問題点を解決するもの
で、高速処理で、かつ高い認識精度の文字認識装置を提
供することを目的とする。
【0010】
【課題を解決するための手段】この課題を解決するため
に本発明は、グループ毎の代表特徴と各グループに属す
る文字コードを記憶する第1辞書と、入力文字パターン
から特徴を抽出する特徴抽出部と、この特徴と第1辞書
に記憶された各グループの代表特徴との距離を計算し、
この距離が小さい順番にグループの順位を決定する第1
認識部12’と、この順位を記憶するグループ順位記憶
部と、文字コード毎に対応するの特徴を記憶する第2辞
書と、所定の上位グループに属する文字コードの特徴を
第2辞書から読みだし、この特徴と入力文字パターンの
特徴との距離を計算し、最小距離および2番目に小さい
距離の文字コードを認識文字として出力する第2認識部
と、第2認識部より得られた候補文字が正解文字の可能
性が高いか否か、または反復回数が所定回数を超えるか
否かを判定し、正解文字の可能性が高い場合または反復
回数が所定回数を超える場合は処理を終了し、それ以外
の場合は、前回に距離計算を行った順位より下位のグル
ープに属する文字コードに対して第2認識部で距離を再
び計算し、今回計算した最小距離の値が前回に計算した
最小距離の値より小さい場合はこれに対応する文字コー
ドを認識文字として出力することにより精度を向上でき
るように処理を反復させる制御部を有している。
【0011】
【作用】この構成において、第1認識部12’により距
離の小さい順に順序づけられたグループのうち、所定の
上位グループに属する文字コードに対して、第2認識部
15で距離計算を行って候補文字を出力する。この候補
文字が正解である可能性が高いとき、または反復回数が
所定回数を超えるときは処理を終了し、それ以外のとき
はグループ内に正解が含まれなかった可能性が高いの
で、前回に距離計算を行った順位より下位のグループに
属する文字コードに対しても第2認識部15で距離を再
び計算し、今回計算した最小距離の値が前回に計算した
最小距離の値より小さい場合はこれに対応する文字コー
ドを認識文字として出力することにより精度を向上でき
るように制御部17が処理を反復させる。
【0012】
【実施例】以下本発明の一実施例について、図面を参照
しながら説明する。
【0013】図1は本発明の一実施例における文字認識
装置の機能ブロック図であり、図5と共通する符号は同
一の対象物を指す。12’は特徴抽出部11で入力文字
パターンから抽出した特徴と第1辞書13に記憶された
特徴の似た文字を分類した各グループの代表特徴との距
離を計算し、この距離が小さい順番にグループの順位を
決定する第1認識部、14は第1認識部12’によって
決められたグループの順番を記憶するグループ順位記憶
部、17は第2認識部15より得られた候補文字が正解
である可能性が高いか否かまたは反復回数が所定の回数
を越えるか否かを判定し、可能性が高い場合または反復
回数が所定回数を超える場合は処理を終了し、それ以外
の場合は前回より下位のグループに属する文字コードに
対しても第2認識部15で再度距離を計算するように処
理を反復させる制御部である。
【0014】以上のように構成された文字認識装置につ
いて、図2の装置ブロック図を用いてその動作を説明す
る。
【0015】まず、イメージスキャナ100より文字パ
ターンを読みだし、これを画像記憶領域106に保存す
る。
【0016】次に、この文字パターンから特徴を抽出
し、特徴記憶部107に記憶する。次に、この特徴と第
1辞書13に記憶された各グループの代表特徴との距離
を計算し、第1距離記憶部108に格納する。
【0017】次に、この距離の小さい順番にグループの
順位を決定し、この順位をグループ順位記憶部14に記
憶する。
【0018】次に、グループ順位記憶部14に記憶され
たグループのうち、設定値記憶部112から読みだした
所定の順位までのグループに属する文字コードに対応す
る特徴を第2辞書16から読みだす。
【0019】次に、この特徴と特徴記憶部107に記憶
した入力文字パターンの特徴との距離を計算し、最小お
よび2番目に小さい距離の値と対応する文字コードを第
2距離記憶部109に格納する。
【0020】最小距離に対応する文字コードが不正解の
可能性が高い場合または反復回数が設定値記憶部112
に記憶した所定の反復回数よりも少ない場合は、グルー
プ順位記憶部14に格納された所定の順位グループに属
する文字コードに対応する特徴を第2辞書16から読み
だし、同様の処理を繰り返す。
【0021】最後に、最小距離に対応する文字コードが
正解であれば結果を表示部111に出力する。
【0022】中央演算処理装置101はプログラム記憶
領域104に記憶された内容に従ってイメージスキャナ
100やリードオンリメモリ103からのデータ読み込
み、ランダムアクセスメモリ105からのデータの読み
書き等の処理を行う。
【0023】102は文字やコマンドの入力を行うキー
ボードである。プログラム記憶領域104には図3のフ
ローチャートに示す手続きをはじめとする制御部17の
内容、特徴抽出部11、第1認識部12’および第2認
識部15の手続き等が記憶してある。
【0024】作業領域110には反復回数を計数するカ
ウンタなど処理に必要な変数がとられる。
【0025】次に図3のフローチャートと図4の説明図
を用いて動作を説明する。ステップS1で、入力文字パ
ターンからの特徴を抽出する。
【0026】ステップS2で、この特徴と各グループの
代表特徴との距離を第1認識部12’で計算する。代表
特徴の例としては、グループに属するコードの特徴の平
均値、グループを代表するコードの特徴などがある。第
1辞書13は2つの領域に分割され、図4(a)に示す
ように、一方はグループ毎に含まれるコードを記憶した
領域と、他方はグループの代表特徴とそれに含まれるコ
ード数、記憶されるコードの先頭番地を示すポインタか
ら構成される。
【0027】ステップS3で、距離値の小さい順番に、
グループに番号を付与する。ステップS4で、反復回数
を計数するカウンタiに初期値1を代入する。
【0028】ステップS5で、距離値の小さい順に上位
A[i]位からB[i]位までのグループに属する文字
コードの特徴と入力文字パターンの特徴との距離を計算
する。ここで、A[i],B[i]は設定値記憶部11
2に予め設定された値である。このとき第2認識部15
で参照される第2辞書には図4(b)のようにコードと
それに対応する特徴が記憶されている。
【0029】ステップS6で、ステップS5で求めた距
離のうち、最小の距離(d1)、2番目に小さい距離
(d2)、およびこれらに対応する文字コードを求め
る。
【0030】ステップS7で、iが1であるかどうかの
判定を行い、真のときはステップS8に、誤のときはス
テップS9に進む。
【0031】ステップS8では、ステップS6で求めた
最小距離(d1)、2番目に小さい距離(d2)とそれ
ぞれに対応する文字コードを第2距離記憶部109に記
憶し、ステップS11に進む。第2距離記憶部109は
図4(c)のように最小距離の距離値とコードを1位の
欄に、2番目に小さい距離値とコードを2位の欄に記憶
しておく。ステップS8が終了した時点ではd1,d2
が各々、第2距離記憶部109の1位の距離の欄(D
1)、2位の距離の欄(D2)に記憶される。
【0032】ステップS9にきた時点では、すでに第2
距離記憶部109にi−1回目までに計算した距離の最
小値(D1)、2番目に小さい値(D2)とこれらに対
応する文字コードが記憶されている。このうち前者の値
(D1)がi番目のステップS6で計算した2番目に小
さい距離(d2)より小さければステップS10に進
み、それ以外のときはステップS11に進む。
【0033】ステップS10では、第2距離記憶部10
9に記憶された最小距離(D1)、2番目に小さい距離
(D2)、およびこれらに対応する文字コードを更新す
る。
【0034】すなわち、d1,d2,D1,D2の中か
ら最小の距離、2番目に小さい距離を求め、かつこれら
の2つの距離に対応するコードを第2距離記憶部109
に記憶する。
【0035】ステップS11では、第2距離記憶部10
9に記憶された最小距離(D1)に対応する文字コード
が正解である可能性が高いかどうかを判断する。この判
断の規則として、最小距離の絶対値がある値より小さい
ときは正解である、最小距離(D1)と2番目に小さい
距離(D2)との比または差がある値より小さい場合は
正解である、あるいは最小距離(D1)の絶対値がある
値より小さく、かつ最小距離(D1)と2番目に小さい
距離(D2)との比または差がある値より小さい場合は
正解である等があげられる。
【0036】ステップS12で、反復回数が所定の回数
(MAX_LOOP)以内であるかを判断し、回数を越えた場合
には、たとえステップS11の条件を満足しなくても処
理を終了する。所定の回数に満たない場合はステップS
13に、それ以外はステップS14に進む。ここで、 M
AX_LOOPの値は設定値記憶部112に予め設定されてい
る。
【0037】ステップS13では、カウンタの値を1だ
け増加してステップS5に戻る。本実施例による文字認
識装置の特性と従来の文字認識装置の特性を表1に比較
して示している。例として、6個の入力文字パターンに
対して、コードが4000種類、グループの数を100
個、各グループ内に含まれるコードの数は40コード
(一定とする)である場合を考える。ここで、設定値記
憶部112の内容を、A[0]=1、B[0]=2、A
[1]=3、B[1]=5、 MAX_LOOP=2と設定し
た。
【0038】
【表1】
【0039】(表1)に示すように、正解文字は1位や
2位のグループに含まれる場合が多いが、5位とかそれ
以下の順位に含まれることも少なくない。従来の方法で
は認識精度を確保するためには上位5位までのグループ
に属する文字コードを各文字パターン毎に距離計算しな
ければならない。このときの1文字パターンあたりの計
算回数は、各グループの代表特徴との計算で100回、
5グループ内の文字コードとの計算で200回(=5グ
ループ×40字)で、合計300回である。一方、本発
明では2位までに正解文字が存在する場合は、各グルー
プの代表特徴との計算で100回、2グループ内の文字
コードとの計算で80回(=2グループ×40字)の合
計180回であり、2位までに正解文字がない場合は3
位から5位までのグループ内の文字コードとの計算に1
20回(=3グループ×40字)分だけ多い300回で
ある。結局、6つの入力文字を認識したときの合計回数
は従来方法が1800回、本発明による方法が1200
回であり、本発明では従来方法の3分の2に減少でき
る。従来方法での処理速度を本発明と同等にするために
は計算対象とするグループ数を5位より少なくするしか
ないが、この場合には5位以下のグループに正解文字が
存在する場合は誤認識となり、精度が低下する。
【0040】この(表1)から明らかなように、本実施
例による文字認識装置は距離計算回数を削減できるとい
う点で優れた効果が得られる。
【0041】なお、グループの決定方法としては、任意
のコードをグループの中心としてこの中心との距離がし
きい値以内であれば同一グループとし、それ以上の場合
は新たにグループの中心を作る「単純クラスタリング」
とよばれる方法、これ以外にも「最大距離アルゴリズ
ム」、「K平均アルゴリズム」など公知の方法があり、
これらの方法によってグループを決定できる。
【0042】また、第2距離記憶部109に記憶された
最小距離に対応する文字コードが正解である可能性が高
いかどうかを判断するために、制御部17では最小距離
と2番目に小さい距離を参照しているが、これは判断の
信頼性を高めるために2つの距離を使っており、特に信
頼性が問われなければ最小距離だけを使っても良い。
【0043】以上のように本実施例によれば、グループ
毎にそれぞれのグループの代表特徴と各グループに属す
る文字コードを記憶する第1辞書13と、入力文字パタ
ーンから特徴を抽出する特徴抽出部11と、この特徴と
第1辞書13に記憶された各グループの代表特徴との距
離を計算し、この距離が小さい順番にグループの順位を
決定する第1認識部12’と、この順位を記憶するグル
ープ順位記憶部14と、この順位の上位グループに属す
る文字コードの特徴を記憶する第2辞書16と、この特
徴と入力文字パターンの特徴との距離を計算する第2認
識部15と、第2認識部15より得られた候補文字が正
解文字の可能性が高いか否かを判定し、可能性が高い場
合または反復回数が所定回数を超える場合は処理を終了
し、それ以外の場合は前回より下位のグループに属する
文字コードに対しても第2認識部15で再度距離を計算
するように処理を反復させる制御部17を設けることに
より、高速処理で、かつ高い認識精度を有す文字認識装
置および文字認識方法を実現することができる。
【0044】
【発明の効果】以上のように本発明は、グループ毎にそ
れぞれのグループの代表特徴と各グループに属する文字
コードを記憶する第1辞書13と、入力文字パターンか
ら特徴を抽出する特徴抽出部11と、この特徴と第1辞
書13に記憶された各グループの代表特徴との距離を計
算し、この距離が小さい順番にグループの順位を決定す
る第1認識部12’と、この順位を記憶するグループ順
位記憶部14と、この順位の上位グループに属する文字
コードの特徴を記憶する第2辞書16と、この特徴と入
力文字パターンの特徴との距離を計算する第2認識部1
5と、第2認識部15より得られた候補文字が正解文字
の可能性が高いか否かを判定し、可能性が高い場合また
は反復回数が所定回数を超える場合は処理を終了し、そ
れ以外の場合は前回より下位のグループに属する文字コ
ードに対しても第2認識部15で再度距離を計算するよ
うに処理を反復させる制御部17を設けることにより、
第1認識部12’により距離の小さい順に順序づけられ
たグループのうち、所定の上位グループに属する文字コ
ードに対して、第2認識部15で距離計算を行って候補
文字を出力する。この候補文字が正解である可能性が高
いとき、または反復回数が所定回数を超えるときは処理
を終了し、それ以外のときはグループ内に正解が含まれ
なかった可能性が高いので、前回に距離計算を行った順
位より下位のグループに属する文字コードに対しても第
2認識部15で距離を再び計算し、今回計算した最小距
離の値が前回に計算した最小距離の値より小さい場合は
これに対応する文字コードを認識文字として出力するこ
とにより、高速処理で、かつ高い認識精度に文字を認識
することができる優れた文字認識装置を実現できるもの
である。
【図面の簡単な説明】
【図1】本発明の一実施例における文字認識装置の説明
のための機能ブロック図
【図2】本発明の一実施例における文字認識装置の説明
のための装置ブロック図
【図3】本発明の一実施例における文字認識装置の説明
のためのフローチャート
【図4】(a)本発明の一実施例における文字認識装置
の第1辞書13の内容を示す図 (b)本発明の一実施例における文字認識装置の第2辞
書16の内容を示す図 (c)本発明の一実施例における文字認識装置の第2距
離記憶部108の内容を示す図
【図5】従来の文字認識装置の機能ブロック図
【符号の説明】 11 特徴抽出部 12’ 第1認識部 13 第1辞書 14 グループ順位記憶部 15 第2認識部 16 第2辞書 17 制御部 100 イメージスキャナ 101 中央演算処理装置 102 キーボード 103 リードオンリメモリ 104 プログラム記憶領域 105 ランダムアクセスメモリ 106 画像記憶領域 107 特徴記憶部 108 第1距離記憶部 109 第2距離記憶部 110 作業領域 111 表示部 112 設定値記憶部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】入力パターンから特徴を抽出した後、 上記抽出された特徴と、類似するカテゴリ同士をグルー
    プにまとめこのグループを代表する特徴とこのグループ
    に属する文字コードの情報を記憶する第二の辞書に記憶
    された特徴との距離によって、グループに正解のコード
    が含まれる可能性が高い順番を決定し、 当該順番に対して、複数のコードと当該各コードに対応
    する特徴を記憶する第一の辞書の中で、所定の順位に該
    当するグループに含まれるコードに対応する特徴と上記
    抽出された特徴との距離によって、上記入力パターンに
    対応するコードを決定し、 当該コードが正解でない可能性が高い場合には、上記入
    力パターンに対応するコードと、上記所定の順位より下
    位の順位に該当するグループに含まれるコードに対応す
    る特徴と上記抽出された特徴により求めたコードとから
    コードを決定することを特徴とする文字認識方法。
  2. 【請求項2】入力パターンから特徴を抽出する手段と、 複数のコードと当該各コードに対応する特徴を記憶する
    第一の辞書と、 類似するコード同士をグループにまとめ、このグループ
    を代表する特徴とこのグループに属する文字コードの情
    報を記憶する第二の辞書と、 上記抽出された特徴と第二の辞書に記憶された特徴との
    距離によって、グループに正解のコードが含まれる可能
    性が高い順番を決定する手段と、 当該順番に対して、第一の辞書の中で、所定の順位に該
    当するグループに含まれるコードに対応する特徴と上記
    抽出された特徴との距離によって、上記入力パターンに
    対応するコードを決定する手段と、 当該コードが正解でない可能性が高い場合には、上記入
    力パターンに対応するコードと、上記所定の順位より下
    位の順位に該当するグループに含まれるコードに対応す
    る特徴と上記抽出された特徴により求めたコードとから
    コードを決定する手段とを有することを特徴とする文字
    認識装置。
JP5154761A 1993-06-25 1993-06-25 文字認識装置および文字認識方法 Pending JPH0714011A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5154761A JPH0714011A (ja) 1993-06-25 1993-06-25 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5154761A JPH0714011A (ja) 1993-06-25 1993-06-25 文字認識装置および文字認識方法

Publications (1)

Publication Number Publication Date
JPH0714011A true JPH0714011A (ja) 1995-01-17

Family

ID=15591322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5154761A Pending JPH0714011A (ja) 1993-06-25 1993-06-25 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JPH0714011A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031387A (ja) * 2004-07-15 2006-02-02 Yamaha Motor Co Ltd 画像認識装置、画像認識方法、画像認識プログラムおよび画像認識プログラムを記録した記録媒体
JP2021179926A (ja) * 2020-05-15 2021-11-18 ソフトバンク株式会社 学習プログラム、学習装置および学習方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031387A (ja) * 2004-07-15 2006-02-02 Yamaha Motor Co Ltd 画像認識装置、画像認識方法、画像認識プログラムおよび画像認識プログラムを記録した記録媒体
JP2021179926A (ja) * 2020-05-15 2021-11-18 ソフトバンク株式会社 学習プログラム、学習装置および学習方法

Similar Documents

Publication Publication Date Title
US5020117A (en) Handwritten character string recognition system
US4771385A (en) Word recognition processing time reduction system using word length and hash technique involving head letters
US6035062A (en) Character recognition method and apparatus
KR100308856B1 (ko) 문자인식방법및장치
JPH0714011A (ja) 文字認識装置および文字認識方法
EP0419259B1 (en) Accurate recognition of input patterns
JPH05314320A (ja) 認識距離の差と候補順を利用した認識結果の評価方式
JPH09198466A (ja) オンライン文字認識方法およびオンライン文字認識装置
JPS62271086A (ja) パタ−ン認識装置
KR100299725B1 (ko) 문자인식장치및문자인식방법
JP2697790B2 (ja) 文字タイプ決定方法
JPS6186883A (ja) オンライン手書き文字認識方式
JP2851865B2 (ja) 文字認識装置
JP2748936B2 (ja) 文字認識方式
JP2677271B2 (ja) 文字認識装置
JP2639314B2 (ja) 文字認識方式
JP3481850B2 (ja) 文字認識装置
JPS6344287A (ja) 文字読取装置
JPH0436885A (ja) 光学式文字読取装置
JP3653555B2 (ja) パターン認識方法
JP2990734B2 (ja) 文字認識装置の認識候補文字出力制御方法
JP2962911B2 (ja) 文字認識装置
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPH0785068A (ja) 検索装置
JPH04138583A (ja) 文字認識装置