JP3333671B2 - パタン認識装置と方法及びパタン認識用距離比較方法 - Google Patents

パタン認識装置と方法及びパタン認識用距離比較方法

Info

Publication number
JP3333671B2
JP3333671B2 JP27086395A JP27086395A JP3333671B2 JP 3333671 B2 JP3333671 B2 JP 3333671B2 JP 27086395 A JP27086395 A JP 27086395A JP 27086395 A JP27086395 A JP 27086395A JP 3333671 B2 JP3333671 B2 JP 3333671B2
Authority
JP
Japan
Prior art keywords
value
pattern
unit
feature vector
distance value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP27086395A
Other languages
English (en)
Other versions
JPH09114932A (ja
Inventor
志行 横塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP27086395A priority Critical patent/JP3333671B2/ja
Publication of JPH09114932A publication Critical patent/JPH09114932A/ja
Application granted granted Critical
Publication of JP3333671B2 publication Critical patent/JP3333671B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文字等のパタン
の認識処理を高速に行うパタン認識装置及びパタン認識
方法に関する。
【0002】
【従来の技術】帳票等に記入された文字パタンを認識す
るため、OCR装置等の文字認識装置が広く用いられて
いる。従来の文字認識装置は、図1に示すように、特徴
抽出部11と、分類部辞書13を備える分類部12と、
識別部辞書15を備える識別部14とから構成されてい
る。
【0003】特徴抽出部11は入力文字パタンの特徴を
抽出するものであり、入力文字パタンを数値列(特徴ベ
クトル)に変換し、分類部12に供給する。分類部12
は、図5に示すように、分類部辞書13と距離値計算部
51とソーティング部52から構成される。分類部辞書
13は入力文字パタンを幾つかの候補文字に分類するた
めに、各認識対象文字の典型的な特徴ベクトルを記憶し
ている。距離値計算部51は入力された特徴ベクトルと
分類部辞書13に登録された各特徴ベクトルとの距離値
を計算し、ソーティング部52に供給する。ソーティン
グ部52は、供給された距離値を昇順にソーティング
し、一定個数の小さい距離値を選択し、選択した距離値
に対応する文字の文字コードを候補文字列として、識別
部14に出力する。
【0004】再び図1を参照して、識別部辞書15は、
各認識対象文字について、1又は複数の特徴ベクトルを
記憶している。識別部14は分類部12より送られてき
た文字コードに対応する識別部辞書15に記憶された特
徴ベクトルと特徴抽出部11から供給された入力特徴ベ
クトルとの距離値を計算する。識別部14は、計算した
距離値を昇順にソーティングし、距離値が小さい一定個
数の文字の文字コードを候補文字列として出力する。通
常、識別部14では分類部12よりも高度な識別関数を
使用して認識精度を高めている。
【0005】
【発明が解決しようとする課題】従来の文字認識装置で
は、識別部14にて最終的に距離値のソーティングを行
う。従って、分類部12において距離値のソーティング
を行う必要はなく、特徴抽出部11で抽出された特徴ベ
クトルとの距離値が小さい特徴ベクトルを持つ候補文字
を一定個数絞り込めればよい。しかし、実際はその絞り
込みの為にソーティング処理が行われていて、多くの処
理時間を要している。
【0006】これらの問題は、文字認識装置に限らず、
他のパタン認識装置に共通に存在しており、高認識率を
維持したまま、入力パタンをより高速に認識できるパタ
ン認識装置及びパタン認識方法が望まれている。
【0007】この発明は上記実状に鑑みて成されたもの
であり、パタンの認識を高速に行うことができるパタン
認識装置と方法及びパタンの認識を高速化することがで
きるパタン認識用の距離比較方法を提供することを目的
とする。
【0008】
【課題を解決するための手段】上記目的を達成するた
め、この発明の第1の観点にかかるパタン認識装置は、
入力パタンから特徴ベクトルを抽出する特徴抽出部と、
予め定められた認識対象パタンの分類用の特徴ベクトル
を記憶する分類部辞書と、前記分類部辞書に記憶された
各特徴ベクトルと前記特徴抽出部により抽出された特徴
ベクトルとの距離値を表すパラメータを計算する距離値
計算部と、前記距離値計算部にて計算された各パラメー
タのうち、予め定められた前記比較値の初期値よりも小
さいものを選択する選択手段と、前記選択手段により選
択されたパラメータの数が所定範囲内に存在しない場
合、前記比較値を更新する更新手段と、前記更新手段に
て更新された比較値を用いて前記選択手段による選択処
理を繰り返し、前記比較値より小さいパラメータを前記
所定範囲内の数だけ選択する制御手段と、前記選択手段
により選択されたパラメータに対応するパタンを出力す
る出力手段と、出力されたパタンを認識する認識手段
と、を備え、前記制御手段は、前記選択手段による選択
処理の繰り返し回数が所定回数を超えた場合に、前記選
択手段による選択を中止し、前記パラメータをソーティ
ングしてパラメータを選択し、所定数のパラメータを選
択するとソーティングを中止するソーティング手段を備
え、前記出力手段は、前記ソーティング手段によりソー
ティングされた所定数のパラメータに対応するパタンを
出力する手段を備える、ことを特徴とする。
【0009】上記目的を達成するため、この発明の第2
の観点にかかるパタン認識方法は、入力パタン列から特
徴ベクトルを抽出する抽出ステップと、前記抽出ステッ
プにおいて抽出された特徴ベクトルと分類用辞書に登録
された特徴ベクトルとの距離値を表すパラメータを計算
する第1の計算ステップと、前記第1の計算ステップに
より計算された各パラメータを前記比較値と比較し、前
記比較値よりも小さいパラメータを選択し、選択したパ
ラメータの数が所定範囲内に存在しない場合、前記比較
値を更新し、更新した比較値を用いて選択処理を繰り返
し、所定範囲内の数だけパラメータを選択するように制
御することにより、前記第1の計算ステップにより計算
されたパラメータと予め定められた比較値とを比較し、
比較結果に基づいて、距離値が小さい所定数のパタンを
選択する選択ステップと、選択処理の繰り返し回数が所
定回数を超えた場合に、前記選択ステップによる選択を
中止し、前記パラメータをソーティングして、距離値が
小さい所定数のパラメータを選択し、所定数のパラメー
タを選択するとソーティングを中止し、選択したパラメ
ータに対応するパタンを出力する出力ステップと、前記
選択ステップ又は出力ステップにより選択されたパタン
に対応する識別用辞書に登録された特徴ベクトルと前記
抽出ステップにより抽出された特徴ベクトルとの距離値
を表すパラメータを計算する第2の計算ステップと、前
記第2の計算ステップにおいて計算されたパラメータに
基づいて、所定範囲内の数の距離値の小さいパタンを出
力するステップと、を備えることを特徴とする。
【0010】このような構成のパタン認識装置及び方法
によれば、パタンの分類用の選択が、距離値のソーティ
ングではなく、距離値と所定の比較値(しきい値)との
比較により行われる。従って、ソーティングにより選択
する場合に比して、処理時間を大幅に短縮することがで
きる。
【0011】比較値を用いて求めている場合には、距離
値のソート処理を行わないことが望ましい。
【0012】入力パタンは、例えば、文字パタンであ
り、前記パラメータは例えば距離値自体又は距離値の2
乗の値から構成される。
【0013】また、この発明の第3の観点にかかるパタ
ン認識用距離比較方法は、入力特徴ベクトルと予め辞書
に登録された認識対象パタンの特徴ベクトルとの距離を
示すパラメータと予め定められた比較値とを比較し、距
離が小さい所定数のパタンを選択し、選択されたパタン
の数が所定範囲内に存在しない場合、前記比較値を更新
し、更新された比較値と前記パラメータの比較処理を繰
り返し、小さい距離値を有するパタンを前記所定数だけ
選択する、ことを特徴とする。
【0014】このような構成のパタン認識用距離比較方
法によれば、パタンの選択が、距離値のソーティングで
はなく、距離値と所定の比較値(しきい値)との比較に
より行われる。従って、ソーティングにより選択する場
合に比して、処理時間を大幅に短縮することができる。
また、パラメータを所定数選択できない場合に、比較値
を更新して、比較処理を繰り返すので、所定数のパラメ
ータを選択できる可能性が高くなる。
【0015】
【発明の実施の形態】以下、この発明の実施の形態にか
かるパタン認識装置及びパタン認識方法を文字認識装置
を例に説明する。この文字認識装置は、図1に示すよう
に、特徴抽出部11、分類部辞書13を備える分類部1
2、識別部辞書15を備える識別部14とから構成され
ている。
【0016】特徴抽出部11は、従来と同様に、帳票等
に手書きされた入力文字パタン等を読み取り、入力文字
パタンから特徴ベクトルを抽出し、分類部12に供給す
る。分類部12は、図2に示すように、分類部辞書13
と、距離値計算部22と、距離値比較部23と、ソーテ
ィング部24から構成される。
【0017】分類部辞書13は、カタカナ、ひらがな、
漢字、記号、数字、英字等の認識対象文字の各文字コー
ドと分類用の特徴ベクトルを予め記憶するデータベース
である。
【0018】距離値計算部22は、特徴抽出部11が抽
出した特徴ベクトル(入力特徴ベクトル)と分類部辞書
13に記憶された特徴ベクトルとの距離を辞書内の全て
の認識対象文字について計算し、文字コードと距離の対
を出力する演算装置である。
【0019】距離値比較部23は、距離値計算部22に
おいて計算された距離値を所定の比較値(しきい値)と
比較し、比較値よりも小さい距離値に対応する文字の文
字コードを候補文字列として一定個数出力する演算装置
である。一回の比較処理で、候補文字を一定個数に絞り
込めなかった場合、距離値比較部23は、比較値を更新
して距離値と比較する比較処理を繰り返す。比較処理を
限度回数まで繰り返しても、候補文字を一定個数に絞り
込めなかった場合、距離値比較部23は比較処理を中止
し、ソーティング部24を起動する。
【0020】ソーティング部24は、前述のように、距
離値比較部23が候補文字を一定数選択できなかった場
合のみ動作し、距離値計算部22にて計算された各距離
値を昇順にソーティングし、一定個数の距離値を選択
し、対応する文字の文字コードを候補文字列として出力
する演算装置である。
【0021】次に、分類部12が入力特徴ベクトルに対
応する候補文字列を出力する処理を具体的に説明する。
【0022】特徴抽出部11が入力文字パタンから抽出
した入力特徴ベクトルは距離値計算部22に供給され
る。距離値計算部22は、入力特徴ベクトルと分類部辞
書13に記憶された各特徴ベクトルとの距離値を計算す
る。入力特徴ベクトルをX(n次元)、分類部辞書13
内のi番目の文字の特徴ベクトルをYi(n次元)とす
るとそれらは数1のように表される。ここでIは分類部
辞書13内の特徴ベクトルの数である。
【0023】
【数1】 XT =[x1, x2, x3, ・・・,xn ] Yi T=[y1i,y2i,y3i,・・・,yni] i=1〜I Tは転置記号を示す。
【0024】距離値計算部22は入力特徴ベクトルXと
i番目の特徴ベクトルYiとのユーリクッドの距離値D
(i)を数2により求める。
【0025】
【数2】
【0026】距離値計算部22は数2を用いて計算した
I個の距離値D(1)〜D(I)をその距離値が得られ
た文字コードと共に距離値比較部23に送る。距離値比
較部23は、距離値計算部22から供給された各距離値
と所定の比較値(しきい値)T(j)を比較し、識別部
14へ送る候補文字を選択(抽出)する。この比較処理
を図3に示すフローチャートを参照して具体的に説明す
る。
【0027】まず、繰り返し回数のカウンタjを0にク
リアし、比較値(しきい値)T(j)の初期値T(0)
を設定する(S301)。次に、繰り返し回数jが定め
られた繰り返し限度回数Jに達したか否か判別する(S
302)。ここでは、j=0であるので、フローはステ
ップS303に進む。ステップS303において、1番
目の距離値D(1)から順番に比較値T(j)と比較し
ていくため、i=1とし、識別候補数のカウンタkをク
リアする(S303)。
【0028】次に、全ての距離値D(i)(i=1、
2、・・・、I)についての処理が終了したか否かを判
別する(ステップS304)。ここでは、処理が終了し
ていないものとし、フローはステップS305に進む。
ステップS305において、距離値D(i)と比較値T
(j)を比較し、距離値D(i)が比較値T(j)より
も小さければ、距離値の番号iを識別候補番号S(k)
として保存し、識別候補数kを1カウントアップする
(S306)。そして次の距離値D(i+1)を読み込
むため、距離値D(i)の番号iを1カウントアップし
(S307)、ステップS304にリターンし、ステッ
プS305〜S307の比較処理を繰り返す。
【0029】全ての距離値D(i)と比較値T(j)と
の比較が終了すると、iがI+1に一致したことがステ
ップS304において判別され、フローはステップS3
08に進む。ステップS308において、識別候補数k
が予め定められた範囲(α1≦k≦α2)に存在するかを
判別する。
【0030】識別候補数kが上記範囲内に存在する場
合、即ち、識別部14に送られる候補文字の数が適当な
数の場合には、保存していたk個の識別候補番号S
(1)〜S(k)に対応する文字コードをソーティング
部24を介さずに識別部14へ候補文字列として出力す
る。識別候補数kが上記範囲内に存在しない場合、即
ち、候補文字が多すぎる場合又は少なすぎる場合、識別
候補数kを適切な数に設定するために、以下の処理を行
う。
【0031】まず、識別候補数kがα1より小さいか否
か判別する(S309)。識別候補数kがα1より小さ
い場合、即ち、候補文字が少なすぎる場合には、識別候
補数kを増加するように、比較値T(j)に所定の正の
補正値βを加算して、新たな比較値T(j)とする(S
310)。識別候補数kがα2より大きい場合、即ち、
候補文字が多すぎる場合には、識別候補数kを減少する
ように、比較値T(j)から補正値βを減算して、新た
な比較値T(j)とする(S311)。
【0032】ステップS310又はS311において、
比較値T(j)を更新した後、繰り返し回数のカウンタ
jを1カウントアップすると共に、記憶していた全ての
識別候補番号S(1)〜S(k)をクリアする(S31
2)。続いて、フローはステップS302に戻り、ステ
ップS302〜S312の比較及び選択処理を繰り返
す。
【0033】上記処理をJ回繰り返しても、所望数の候
補文字が得られない場合、繰り返し回数jが限度回数J
に一致したことがステップS302で判別される。この
判別により、距離値比較部23は、距離値と比較値の比
較による候補文字の選択処理を中止し、ソーティング部
24を起動する。
【0034】ソーティング部24は、距離値比較部23
から供給された距離値D(1)〜D(I)を昇順にソー
ティングし、例えば、小さい方から(α1+α2)/2個
の距離値を選択する。ソーティング部24は、一定個数
の距離値が得られると、その時点でソーティング処理を
終了し、選択した距離値に対応する候補文字列の文字コ
ードを候補文字列として識別部14へ出力する。
【0035】識別部14は、識別部辞書15に登録され
ている特徴ベクトルのうち、距離値比較部23又はソー
ティング部24から供給された候補文字列に対応するも
のと入力特徴ベクトルとの距離を求める。識別部14
は、求めた距離値を昇順にソーティングし、所定数の距
離値が得られた時点でソーティング処理を終了し、距離
が小さい文字の文字コードを候補文字列として出力す
る。
【0036】図3のステップS308の判定に用いられ
る識別候補数kの下限値α1と上限値α2は、それらの値
及びそれらの差を大きくすると、候補文字内に正解文字
が入る可能性が高くなる為、認識精度は高くなる。しか
し、識別部14に送られる候補文字数が多い為、識別部
14の処理速度は低下する。また、下限値α1と上限値
α2及びこれらの値の差を小さくすると、候補文字内に
正解文字が入る可能性が低くなり、認識精度が低くな
る。しかし、識別部14に送られる候補文字数が少ない
為、識別部14の処理速度は向上する。
【0037】このため、下限値α1と上限値α2として
は、認識精度が適当で且つ識別部14での識別処理が高
速に行われるように、実験的に定めた値を設定する。ま
た、補正値βは、少ない繰り返し回数jでα1≦k≦α2
が成立するように実験的に得られた固定値を設定する。
【0038】認識対象文字としてJIS第一水準(認識
対象文字:約3500文字)を想定した場合、例えば、
α1=64、α2=192、β=0.25程度が望まし
い。
【0039】次に、比較値T(j)の初期値T(0)を
求める手法について説明する。比較値T(j)の初期値
T(0)は、予め用意されたN個の学習用文字パタンの
特徴ベクトルと分類部辞書13内の全特徴ベクトルとの
距離値のうち1位のもの(最も小さいもの)を求めて、
それらの距離値の総和dtlを、距離値の総数Nで割った
平均値davよりパラメータγを引いて求める。
【0040】この手法を図4のフローチャートを参照し
て具体的に説明する。まず、距離値の合計値dtlを0に
クリアし、学習用文字パタンの特徴ベクトルの番号nを
1に初期化する(S41)。
【0041】続いて、全ての学習用文字パタンn(1、
2、・・・、N)について、後述するステップS43〜
S47の処理が終了したか否かを判別する(S42)。
ここでは、n=1であるので、フローはステップS43
に進む。
【0042】ステップS43では、n番目の学習用文字
パタンの特徴ベクトルと分類部辞書13内の全ての特徴
ベクトルとの距離値を計算し、そのうち1位のものをd
(n)とし(S43)、求めた距離値d(n)を合計値
tlに加算する(S44)。続いて、n+1番目の学習
用文字パタンの距離値d(n+1)を求めるため、nを
1カウントアップし(S45)、フローはステップS4
2にリターンする。
【0043】全ての学習用文字パタンについて距離値の
計算が終了すると、ステップS42でn>Nと判別さ
れ、フローはステップS46に進む。ステップS46に
おいて、距離値d(n)の数Nで距離値d(n)の総和
tl を割り、距離値d(n)の平均値davを求める(S
46)。最後に、平均値davからパラメータγを引くこ
とにより、初期値T(0)を求める(S47)。このよ
うにして求められた比較値の初期値T(0)が分類部1
2に設定される。
【0044】なお、学習文字パタンの数N及びパラメー
タγは任意に設定可能である。分類部辞書13の認識対
象文字数が4000であり、その中から候補の文字を約
100文字前後に絞りたいとする。距離値d(n)の分
布が正規分布であると仮定した場合、平均値のまわりに
片側2σを取るとその中に確率変数は95%存在すると
いう正規分布の性質より、γ=2σと設定できる(σ:
標準偏差)。
【0045】以上説明したように、この実施の形態で
は、分類部12から識別部14に送る候補文字の選択を
ソーティングを極力行わず、比較値との比較により行
う。これにより分類部12の分類精度を低下させること
なく、分類処理に要する処理時間を従来の2/3程度に
短縮できる。
【0046】なお、図3のフローチャートでは、候補文
字数kが所望の範囲α1≦k≦α2に入らなかった場合、
識別候補数kをクリアして、初めから計算し直してい
る。しかし、繰り返し前の計算を利用し、計算量を減ら
してもよい。例えば、j回目の処理において、識別候補
数kがα1より小さい(k<α1)場合、あとα1−k個
だけ距離値を選択できればよい。よって、j+1回目の
処理では、k個の識別候補に対応する距離値を除いた距
離値の中から足りない分だけ(α1−k個以上α2−k個
以下)小さいものを選択すればよい。また、識別候補数
kがα2より大きい(k>α2)場合、選択されたk個の
距離値からk−α2個だけふるい落とせばよい。よっ
て、j+1回目の処理では、k個の識別候補に対応する
距離値についてのみ比較処理を行えばよい。
【0047】また、上記実施の形態においては、補正値
βを固定値としているが、補正値βをα1−k、k−α2
の値に対応する可変値としてもよい。例えば、α1−k
の値と対応するβの値、α2−kの値と対応するβの値
を予めテーブルに格納しておき、識別候補数kがα1
り小さいと判別された場合は、α1−kをキーとしてそ
れに対応するβの値を求め、比較値T(j)に加算す
る。又、識別候補数kがα2より大きいと判別された場
合は、k−α2をキーとしてそれに対応するβの値を求
め、比較値T(j)から減算する。この場合、α1
k、k−α2の値が大きい程βを大きくする方が望まし
い。
【0048】上記実施の形態においては、距離計算部2
2は入力特徴ベクトルと分類部辞書13に登録された特
徴ベクトルの正確な距離値D(i)を計算している。し
かし、距離値比較部23において、比較処理により距離
値の小さいものを所定数選択できるならば、必ずしも正
確な距離を求める必要はない。例えば、距離値のD
(i)の2乗求めるようにしてもよい。この場合、距離
値比較部23で使用する比較値T(j)も2乗した値を
用いる。このような構成とすることにより、距離計算時
間を短縮し、ひいては、総処理時間を短縮できる。ま
た、距離値の2乗に限らず、距離を表す任意のパラメー
タと対応する比較値を使用できる。
【0049】以上の説明においては、分類部辞書13と
識別部辞書15が個別に配置されている構成を示した
が、識別部辞書15に登録されている各文字パタンの特
徴ベクトルの典型的なものを分類用の辞書として使用し
てもよい。
【0050】以上の説明においては、この発明を文字パ
タンを認識する文字認識装置に適用した例を示したが、
この発明は文字以外の任意のパタンの認識に適用可能で
ある。
【0051】
【発明の効果】以上説明したように、この発明によれ
ば、分類部又は分類ステップでの処理において、比較値
と距離を表すパラメータの比較処理により、距離値の小
さいパタンを選択する。このため、分類部又は分類ステ
ップの処理量を削減できる。よって、パタン当たりの認
識処理が高速になり、データエントリー処理時間等を短
縮できる。
【図面の簡単な説明】
【図1】文字認識装置の構成を示すブロック図である。
【図2】分類部の構成を示すブロック図である。
【図3】距離値比較部における比較処理を説明するため
のフローチャートである。
【図4】比較処理に用いる比較値の初期値の設定を説明
するためのフローチャートである。
【図5】従来の分類部の構成を示すブロック図である。
【符号の説明】
11 特徴抽出部 12 分類部 13 分類部辞書 14 識別部 15 識別部辞書 22 距離値計算部 23 距離値比較部 24 ソーティング部 51 距離値計算部 52 ソーティング部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/03 G06K 9/46

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】入力パタンから特徴ベクトルを抽出する特
    徴抽出部と、 予め定められた認識対象パタンの分類用の特徴ベクトル
    を記憶する分類部辞書と、 前記分類部辞書に記憶された各特徴ベクトルと前記特徴
    抽出部により抽出された特徴ベクトルとの距離値を表す
    パラメータを計算する距離値計算部と、 前記距離値計算部にて計算された各パラメータのうち、
    予め定められた前記比較値の初期値よりも小さいものを
    選択する選択手段と、 前記選択手段により選択されたパラメータの数が所定範
    囲内に存在しない場合、前記比較値を更新する更新手段
    と、 前記更新手段にて更新された比較値を用いて前記選択手
    段による選択処理を繰り返し、前記比較値より小さいパ
    ラメータを前記所定範囲内の数だけ選択する制御手段
    と、前記選択手段により選択されたパラメータに対応するパ
    タンを出力する出力手段と、 出力されたパタンを認識する認識手段と、 を備え、 前記制御手段は、前記選択手段による選択処理の繰り返
    し回数が所定回数を超えた場合に、前記選択手段による
    選択を中止し、前記パラメータをソーティングしてパラ
    メータを選択し、所定数のパラメータを選択するとソー
    ティングを中止するソーティング手段を備え、 前記出力手段は、前記ソーティング手段によりソーティ
    ングされた所定数のパラメータに対応するパタンを出力
    する手段を備える、 ことを特徴とするパタン認識装置。
  2. 【請求項2】前記制御手段は、距離値のソート処理を行
    うことなく、距離値が小さい一定個数のパタンを選択し
    て出力する、ことを特徴とする請求項に記載のパタン
    認識装置。
  3. 【請求項3】入力パタン列から特徴ベクトルを抽出する
    抽出ステップと、 前記抽出ステップにおいて抽出された特徴ベクトルと分
    類用辞書に登録された特徴ベクトルとの距離値を表すパ
    ラメータを計算する第1の計算ステップと、 前記第1の計算ステップにより計算された各パラメータ
    を前記比較値と比較し、前記比較値よりも小さいパラメ
    ータを選択し、選択したパラメータの数が所定範囲内に
    存在しない場合、前記比較値を更新し、更新した比較値
    を用いて選択処理を繰り返し、所定範囲内の数だけパラ
    メータを選択するように制御することにより、前記第1
    の計算ステップにより計算されたパラメータと予め定め
    られた比較値とを比較し、比較結果に基づいて、距離値
    が小さい所定数のパタンを選択する選択ステップと、選択処理の繰り返し回数が所定回数を超えた場合に、前
    記選択ステップによる選択を中止し、前記パラメータを
    ソーティングして、距離値が小さい所定数のパラメータ
    を選択し、所定数のパラメータを選択するとソーティン
    グを中止し、選択したパラメータに対応するパタンを出
    力する出力ステップと、 前記選択ステップ又は出力ステップにより選択されたパ
    タンに対応する識別用辞書に登録された特徴ベクトルと
    前記抽出ステップにより抽出された特徴ベクトルとの距
    離値を表すパラメータを計算する第2の計算ステップ
    と、 前記第2の計算ステップにおいて計算されたパラメータ
    に基づいて、所定範囲内の数の距離値の小さいパタンを
    出力するステップと、 を備えることを特徴とするパタン認識方法。
  4. 【請求項4】前記選択ステップは、距離値のソート処理
    を行うことなく、距離値が小さい一定個数のパタンを選
    択して出力する、ことを特徴とする請求項に記載のパ
    タン認識方法。
JP27086395A 1995-10-19 1995-10-19 パタン認識装置と方法及びパタン認識用距離比較方法 Expired - Lifetime JP3333671B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27086395A JP3333671B2 (ja) 1995-10-19 1995-10-19 パタン認識装置と方法及びパタン認識用距離比較方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27086395A JP3333671B2 (ja) 1995-10-19 1995-10-19 パタン認識装置と方法及びパタン認識用距離比較方法

Publications (2)

Publication Number Publication Date
JPH09114932A JPH09114932A (ja) 1997-05-02
JP3333671B2 true JP3333671B2 (ja) 2002-10-15

Family

ID=17492030

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27086395A Expired - Lifetime JP3333671B2 (ja) 1995-10-19 1995-10-19 パタン認識装置と方法及びパタン認識用距離比較方法

Country Status (1)

Country Link
JP (1) JP3333671B2 (ja)

Also Published As

Publication number Publication date
JPH09114932A (ja) 1997-05-02

Similar Documents

Publication Publication Date Title
Kanai et al. Automated evaluation of OCR zoning
JP3480404B2 (ja) 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
JP2991779B2 (ja) 文字認識方法及び装置
KR100242458B1 (ko) 패턴인식 방법 및 장치와 패턴인식 사전을 작성하는 방법
WO2002019248A9 (en) Character recognition system
Shirali-Shahreza et al. Recognition of handwritten Persian/Arabic numerals by shadow coding and an edited probabilistic neural network
US5528700A (en) Character recognition system based on a neural network
JP3083562B2 (ja) 文字認識機構
JPH0683792A (ja) ニューラルネットワークの学習装置およびニューラルネットワークの学習パターン呈示方法
JP3333671B2 (ja) パタン認識装置と方法及びパタン認識用距離比較方法
JPH07160822A (ja) パターン認識方法
US7167587B2 (en) Sequential classifier for use in pattern recognition system
JP3706646B2 (ja) Ocrの制御方法並びに分類方法及び装置
US20020126903A1 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
Niharmine et al. Tifinagh handwritten character recognition using genetic algorithms
CN107331030A (zh) 一种冠字号识别方法、装置、设备及存储介质
JP2797721B2 (ja) 文字認識装置
KR900007727B1 (ko) 문자 인식 장치
JP2639314B2 (ja) 文字認識方式
JPH11224309A (ja) 文字認識方法および装置
JP3659688B2 (ja) 文字認識装置
JPH0765128A (ja) 活字文字認識用辞書の作成方法
Voráček Tree neural classifier for character recognition
JPH0827819B2 (ja) 手書き文字認識の侯補文字表示方法及びそれを用いた手書き文字認識装置
Chhabra Neural network based text recognition for engineering drawing conversion

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080726

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080726

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090726

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090726

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100726

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110726

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110726

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120726

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120726

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130726

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term