JP3977007B2 - パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP3977007B2
JP3977007B2 JP2000347272A JP2000347272A JP3977007B2 JP 3977007 B2 JP3977007 B2 JP 3977007B2 JP 2000347272 A JP2000347272 A JP 2000347272A JP 2000347272 A JP2000347272 A JP 2000347272A JP 3977007 B2 JP3977007 B2 JP 3977007B2
Authority
JP
Japan
Prior art keywords
pattern
category
recognition
bandwidth
recognition dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000347272A
Other languages
English (en)
Other versions
JP2002150286A (ja
Inventor
博史 亀山
直樹 ▲高▼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP2000347272A priority Critical patent/JP3977007B2/ja
Publication of JP2002150286A publication Critical patent/JP2002150286A/ja
Application granted granted Critical
Publication of JP3977007B2 publication Critical patent/JP3977007B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、入力パターンがどのカテゴリーに属するかを認識辞書に基づいて判定して入力パターンのパターン認識をおこなうパターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体に関し、特に、参照パターンを記憶するためのメモリ容量を抑制しつつ、きめ細かく識別関数を設定し、もってノンパラメトリックなパターン識別をおこなう場合の認識精度を上げることができるパターン認識装置、パターン認識方法および記録媒体に関する。
【0002】
【従来の技術】
従来、サンプルパターンの集合から入力パターンに近いものをk個選び、それらの持つラベルに基づいて入力パターンの分類を決定するk最近傍識別と呼ばれるパターン認識技術が知られており、特に最近では、処理の高速化並びに認識精度の向上を図る試みがなされている。
【0003】
たとえば、特開平8−287250号公報(従来技術1)には、各ノードに辞書パターンが格納された2分木を用い、部分木検索のルールを高次元パターン空間の幾何学的構造に基づいて近似的に最近傍点探索をおこなえるよう修正するパターン認識方法が開示されている。
【0004】
また、「E.parzen,”On estimation of a probability density function and mode”,Ann.Math.Statis.,vol.33,pp.1065-1076,1962」(従来技術2)には、パターンの確率密度を推定し、推定された確率密度に基づいてカテゴリーを認識する技術が開示されている。具体的には、ここでの推定の原理は、パターン空間の1点の周辺を所定のバンド幅をもったガウスカーネルを用いてサンプルの個数を重み付き計数するものであり、1カテゴリー内では共通の(可変でない)バンド幅を用いる。バンド幅あるいはkの値によって密度推定の精度が決まるが、このkは整数値しかとらないため、一般にk最近傍識別よりも認識精度が高い。
【0005】
さらに、「Gregory A. Babich,etc.,”Weight Parzen Windows for Pattern Classification”,IEEE Trans. Pattern Recognition & Machine Intelligence,Vol.18,No.5,May 1996」(従来技術3)には、クラスタリング手法を用いて参照パターンを統合して参照パターンを減少させ、確率密度分布の推定に基づく識別器であるParzen-Window classifierを良く近似するようにした技術が開示されている。
【0006】
【発明が解決しようとする課題】
しかしながら、上記従来技術1によれば、参照パターンの個数を増やすことによりある程度認識精度を上げることができるものの、その見返りとしてメモリ容量が累増するという問題がある。
【0007】
また、従来技術2によれば、高次元では多くの参照パターンを記憶しておかねばならないというメモリ容量の問題がある。加えて、ここではバンド幅を固定としているため、精度良く確率密度を推定することができないという問題もある。精度良く確率密度を推定するためには、データの密なところではバンド幅を小さくし、粗なところではバンド幅を大きくする必要があるからである。
【0008】
さらに、従来技術3によれば、あくまでもパーゼンクラシファイア(Parzen-Window classifier)と同程度の認識精度しか得られず、認識精度に限界があるという問題がある。なお、この従来技術3でも、バンド幅をカテゴリーごとに固定しているので、やはり従来技術2と同様に精度良く確率密度を推定することができない。
【0009】
このように、これらの従来技術1〜3を用いたとしても、(1)参照パターンの記憶容量の問題と、(2)バンド幅を固定することによる密度推定精度の問題というパーゼンクラシファイアの2つの問題を解決することができない。
【0010】
この発明は、上述した従来技術による問題点を解消するためになされたものであり、参照パターンを記憶するためのメモリ容量を抑制しつつ、きめ細かく識別関数を設定し、もってノンパラメトリックなパターン識別をおこなう場合の認識精度を上げることができるパターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを目的とする。
【0011】
【課題を解決するための手段】
上述した課題を解決し、目的を達成するため、請求項1の発明に係るパターン認識装置は、入力パターンがどのカテゴリーに属するかを認識辞書に基づいて判定して前記入力パターンのパターン認識をおこなうパターン認識装置において、複数の参照パターンをカテゴリーごとに区分して記憶する認識辞書と、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、カテゴリーにかかわらず共通の標本共分散行列を用いるとともに、所定の近傍に位置する参照パターンの全てが同一カテゴリーに属するものを削除対象として、前記認識辞書内の参照パターンのうちカテゴリー間の識別境界から離れた参照パターンを削除するエディティング手段とを備えたことを特徴とする。
【0014】
また、請求項2の発明に係るパターン認識装置は、請求項1の発明において、前記エディッティング手段は、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、密度正規化項1/hi dを無視することを特徴とする。
【0015】
また、請求項の発明に係るパターン認識装置は、請求項1または2の発明において、前記認識辞書に記憶した各参照パターンごとに保持するスカラー値であるバンド幅を可変にするバンド幅設定手段をさらに備えたことを特徴とする。
【0016】
また、請求項の発明に係るパターン認識装置は、請求項の発明において、前記バンド幅設定手段は、前記バンド幅を異カテゴリーパターン全体との最小距離の定数倍に設定することを特徴とする。
【0017】
また、請求項5の発明に係るパターン認識方法は、入力パターンがどのカテゴリーに属するかを認識辞書に基づいて判定して前記入力パターンのパターン認識をおこなうパターン認識方法において、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、カテゴリーにかかわらず共通の標本共分散行列を用いるとともに、所定の近傍に位置する参照パターンの全てが同一カテゴリーに属するものを削除対象として、複数の参照パターンをカテゴリーごとに区分して記憶する認識辞書内の参照パターンのうちカテゴリー間の識別境界から離れた参照パターンを削除するエディティング工程を含んだことを特徴とする。
【0019】
また、請求項6の発明に係るパターン認識方法は、請求項5の発明において、 前記エディッティング工程は、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、密度正規化項1/hi dを無視することを特徴とする。
【0020】
また、請求項の発明に係るパターン認識方法は、請求項5または6の発明において、前記認識辞書に記憶した各参照パターンごとに保持するスカラー値であるバンド幅を可変にするバンド幅設定工程をさらに含んだことを特徴とする。
【0021】
また、請求項の発明に係るパターン認識方法は、請求項の発明において、前記バンド幅設定工程は、前記バンド幅を異カテゴリーパターン全体との最小距離の定数倍に設定することを特徴とする。
【0022】
また、請求項の発明に係る記録媒体は、請求項5〜8のいずれか一つに記載された方法をコンピュータに実行させるプログラムを記録したことで、そのプログラムを機械読み取り可能となり、これによって、請求項5〜8のいずれか一つの動作をコンピュータによって実現することができる。
【0023】
【発明の実施の形態】
以下に添付図面を参照して、この発明に係るパターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体の好適な実施の形態を詳細に説明する。なお、本実施の形態では、本発明を文字認識装置に適用した場合を示すこととする。
【0024】
(文字認識装置の構成)
まず、本実施の形態に係る文字認識装置の構成について説明する。図1は、本実施の形態に係る文字認識装置の構成を示す機能ブロック図である。同図に示すように、この文字認識装置10は、画像入力部11と、前処理部12と、特徴抽出部13と、認識処理部14と、認識辞書15と、認識辞書管理部16とからなる。
【0025】
ここで、請求項1の認識辞書は認識辞書15に対応し、請求項1のエディティング手段は認識辞書管理部16に対応し、請求項4のバンド幅設定手段は認識辞書管理部16に対応する。
【0026】
画像入力部11は、文字の画像を光学的に読み取るスキャナなどの入力デバイスであり、この画像入力部11によって読み取られた画像データは前処理部12に出力される。
【0027】
前処理部12は、画像入力部11から受け取った画像データの前処理をおこなう処理部であり、具体的には、この画像データを平滑化処理してノイズを除去した後に、これを所定のしきい値で二値化して二値画像を取得し、この二値画像から文字を切り出した後に、これを正規化する処理部である。
【0028】
特徴抽出部13は、前処理部12が前処理をおこなった正規化された文字データから特徴量を抽出する処理部であり、具体的には、文字の画像データを5×5などにメッシュ割りし、各メッシュについての輪郭の方向を求めることになる。たとえば、輪郭の方向を8方向とすると、5×5×8=200次元の特徴空間が形成されることになる。
【0029】
認識処理部14は、手書き文字などの入力文字から抽出された特徴量をあらかじめ用意された認識辞書15内の特徴量と照合することにより、入力文字がどのカテゴリーに属するかを判定し、その判定結果に基づいてパターン認識をおこなう処理部である。
【0030】
認識辞書15は、認識処理部14による入力文字の認識に利用する辞書であり、具体的には、各文字ごとにカテゴリーを対応付け、該カテゴリーごとに文字の特徴量(参照データ)を記憶する。
【0031】
認識辞書管理部16は、認識辞書15の作成並びに管理をおこなう処理部であり、具体的には、この認識辞書管理部16は、識別境界から離れたパターンを削除するエディティング(editing)処理をおこなうことにより、認識辞書15の容量を低減するとともに、バンド幅を可変にして識別関数をきめ細かく設定できるようにして認識精度を高めている。
【0032】
(エディティング処理の概念)
次に、図1に示した認識辞書管理部16によるエディティング処理について具体的に説明する。図2は、2種のカテゴリーに属する2次元の参照パターンの分布の一例を示す説明図であり、図3は、図2に示す参照パターンの分布に識別境界を設けた説明図である。
【0033】
一般的に、識別手法は、(1)パラメトリックな識別手法と(2)ノンパラメトリックな識別手法に区分することができ、(1)パラメトリックな識別手法には、識別境界が超平面となる線形識別と識別境界が2次超曲面となる2次識別などがあり、(2)ノンパラメトリックな識別境界には、ボロノイ境界によりカテゴリーが分離される最近傍識別と、平滑された識別境界をもつパーゼンクラシファイアなどがある。
【0034】
図2に示すように、図中の小さな矩形で示すカテゴリーAに属する参照パターン群と、図中に大きな矩形で示すカテゴリーBに属する参照パターン群とが存在し、カテゴリーAの参照パターン群がカテゴリーBに属する参照パターン群に挟まれている場合を考えると、図3に示すような2次識別の識別境界または平滑されたノンパラメトリックな識別境界が形成される。
【0035】
このように、従来のノンパラメトリックな識別境界を用いることにより、カテゴリーの識別をおこなうことができるわけであるが、従来の識別境界をそのまま用いることとすると、認識辞書15に記憶せねばならない参照パターン数が多くなってしまう。このため、認識辞書管理部16では、エディティング処理をおこなって参照パターン数を低減している。
【0036】
次に、この認識辞書管理部16によりおこなわれるエディティング処理の概念についてパーゼンクラシファイアと比較してさらに詳細に説明する。パーゼンウインドウの確率密度関数は、d次元データをsi、データ数をN、カーネル関数をKd[・]、バンド幅をhとすると、
【数1】
Figure 0003977007
のようになる。このため、このKd[・]とhを適切に選べば、pn(x)はxの確率密度分布に収束する。
【0037】
この場合の必要条件は、
d[・]≧0
∫Kd[・]dx=1
limN→∞h=0
limN→∞Nhd=∞
となる。
【0038】
ここで、d×dの正則行列をHとして、上式をより一般形にすると、
【数2】
Figure 0003977007
となる。なお、|H|はHの行列式の絶対値を意味するものとする。
【0039】
そして、ガウスカーネルを使うと、(1)式については、
【数3】
Figure 0003977007
となる。
【0040】
また、(2)式については、
【数4】
Figure 0003977007
となる。ただし、Σは標本共分散行列とする。
【0041】
そして、直接パーゼンクラシファイアを使う場合を考えると、カテゴリーごとの確率密度の推定値である
【数5】
Figure 0003977007
が最大となるwiをもって識別結果とすることになる。
【0042】
図4は、1次元データを対象としてパーゼンクラシファイアを用いた場合の識別概念を説明するための説明図である。なお、図中に○で示すデータは、平均190、標準偏差30の正規分布N(190,302)と、平均380、標準偏差30の正規分布N(380,302)とを8対2で混合した分布をもつ人工的に発生させたデータとし、図中に□で示すデータは、平均230、標準偏差60の正規分布N(230,602)と、平均330、標準偏差10の正規分布N(330,102)とを6対4で混合した分布をもつ人工データとする。また、カテゴリーごとのデータの個数は各々10個とする。
【0043】
そして、混合分布についてバンド幅の設定値として標準偏差を混合比率で平均した値に固定する、すなわちカテゴリーAのバンド幅を、(30×8+30×2)/10=30に設定し、カテゴリーBのバンド幅を、(60×6+10×4)/10=40に設定したとき、各々10個のデータを用いて推定される密度関数は、同図(a)に示す曲線になる。
【0044】
また、分布ごとにバンド幅を固定すると、すなわちカテゴリーAのバンド幅を、(1)のデータに対して30および(2)のデータに対して30、カテゴリーBのバンド幅を、(3)のデータに対して60および(4)のデータに対して10に設定すると、同図(b)に示す曲線のようになる。ここで、あるxが与えられた場合に、該xの確率密度関数の大きなカテゴリーにxが属するものと判断されることになる。
【0045】
このように、パーゼンクラシファイアを使って識別をおこなうことができるわけであるが、かかるパーゼンクラシファイアによれば、次元の呪いと呼ばれるdの増加によって累進的に大きなNのデータが必要になるという問題や、バンド幅が固定であるという問題が生ずる。
【0046】
そこで、本実施の形態にかかる認識辞書管理部16では、(5)式の分母の項であるhi d|Σi1/2を消すとともに、バンド幅を可変にする対策を講じている。具体的には、ガウスカーネルによる密度推定に基づいて事後確率を算出するが、そのときどのカテゴリーにも共通のΣを用い、かつ、密度正規化項1/hi dを無視することにする。
【0047】
Cをカテゴリー数とすると、カテゴリーwiの事後確率は、
【数6】
Figure 0003977007
となる。
【0048】
また、ここではカテゴリー境界付近のみを残すようにエディティングした参照パターンに対して、識別関数gi(x)を
【数7】
Figure 0003977007
とする。
【0049】
また、カテゴリーiのk番目の参照パターンのバンド幅hik
【数8】
Figure 0003977007
として、異カテゴリーパターン全体との最小距離の定数倍に設定する。この際、hik d/hjk d≠1であっても、1/hjk dを無視した方が高い識別精度が得られる。
【0050】
次に、図1に示した認識辞書管理部16によるエディティング処理手順について説明する。図5は、図1に示した認識辞書管理部16によるエディティング処理手順を示すフローチャートである。
【0051】
同図に示すように、この認識辞書管理部16では、選択されるサンプルの集合B={全サンプル}とし、Bの要素xに付与されたチェック済みCFLG[x]をすべてオフ(OFF)にし、近傍探索数r=10kとセットする初期化をおこなう(ステップS501)。
【0052】
その後、近傍探索数rをk’と比較して(ステップS502)、この近傍探索数rがk以上でなければ(ステップS502否定)そのまま処理を終了し、近傍探索数rがk以上である場合には(ステップS502肯定)、集合BのCFLG[x]=OFFであるものの中から、ランダムにサンプルxを1個抽出する(ステップS503)。
【0053】
そして、xの近傍r個の全部がxのカテゴリーと同じであるか否かを確認する(ステップS504)。なお、このk’が大きいほど1つのカテゴリーに属するパターン分布の外皮を近似する回帰が識別境界から分布の内部の方向に離れ、また識別境界を平滑化する作用を強めることになる。
【0054】
その結果、xの近傍r個の全部がxのカテゴリーと同じである場合には(ステップS504肯定)、BをB−{x}に更新し、CFLGをすべてOFFに戻してカウント値countを0とした後に(ステップS505)、ステップS503に移行する。
【0055】
これに対して、xの近傍r個の一つでもxのカテゴリーと同じでない場合には(ステップS504否定)、CFLG[x]をオン(ON)にして、カウント値countをインクリメントした後に(ステップS506)、このカウント値countが集合の個数|B|以上であるか否かを調べ(ステップS507)、カウント値countが集合の個数|B|以上でない場合には(ステップS507否定)、ステップS503に移行する。
【0056】
一方、カウント値countが集合の個数|B|以上である場合には(ステップS507肯定)、r=r−Δrとし、CFLGをすべてOFFに戻し、カウント値countを0とした後に(ステップS508)、ステップS502に移行する。
【0057】
上記一連のエディティング処理をおこなうことにより、認識辞書管理部16が識別境界から離れた参照パターンを削除し、もって認識辞書の容量を低減することができる。
【0058】
図6は、認識辞書管理部16による参照パターンの削減過程を説明するための説明図である。同図(a)に示す各カテゴリーあたり200個のサンプルが存在する場合に、k’=5すなわち、どの近傍5個についても必ず互いにカテゴリーの違うパターンが含まれているという終了条件を用いてエディティング処理を適用すると、同図(b)のようになる。
【0059】
そして、k’=4すなわち、どの近傍4個についても必ず互いにカテゴリーの違うパターンが含まれているという終了条件を用いてエディティング処理を適用すると同図(c)のようになり、同様にk’=3という終了条件を用いてエディティング処理を適用すると同図(d)のようになる。
【0060】
これらの図から分かるように、このエディティング処理をおこなうと、境界付近の参照パターンが残るが、境界から離れた部分の参照パターンは削減されることになる。
【0061】
次に、認識辞書管理部16によるバンド幅変更の効果について具体的に説明する。図7は、認識辞書管理部16によるバンド幅変更の効果の一例を説明するための説明図である。
【0062】
なお、図4と同様に、図中に○で示すデータは、平均190、標準偏差30の正規分布N(190,302)と、平均380、標準偏差30の正規分布N(380,302)とを8対2で混合した分布をもつ人工的に発生させたデータとし、図中に□で示すデータは、平均230、標準偏差60の正規分布N(230,602)と、平均330、標準偏差10の正規分布N(330,102)とを6対4で混合した分布をもつ人工データとする。また、カテゴリーごとのデータの個数は各々10個とする。
【0063】
同図(a)に示すように、混合分布についてバンド幅を固定(カテゴリーA;30、カテゴリーB;40)した場合にはエラーが6個生じ、同図(b)に示すように、分布ごとにバンド幅を固定(カテゴリーA;30と30、カテゴリーB60と10)すると、エラーが5個となった。
【0064】
これに対して、同図(c)に示すように、バンド幅を異カテゴリーとの最近傍距離とした場合には、エラーが3個となり、エラー個数が低減した。さらに、同図(d)に示すようにエディティング処理をおこなうと、エラー個数が2個となった。かかる場合にエラー個数が低減する理由は、2個の相対するカテゴリーとの識別境界をきめ細かく形成できるからである。
【0065】
次に、2カテゴリーであり、かつ、k最近傍が2個と単純化した場合について説明する。なお、バンド幅は、異カテゴリーパターンとの最小距離min||si−sj||(ただし、siとsjのカテゴリは異なる)の定数倍であるものとする。
【0066】
この場合には、(6)式で示したカテゴリーw1の事後確率は、
【数9】
Figure 0003977007
となる。また、近傍パターンのペアであるs1とs2は、h1=h2=κ||si−sj||となっていると考えられる。
【0067】
このため、
【数10】
Figure 0003977007
となり、xがs1とs2の中点(s1+s2)/2のとき、図8に示すように、P(w1|m)=P(w2|m)=1/2となり、識別境界がs1とs2の中点を通ることになる。
【0068】
上述してきたように、本実施の形態によれば、認識辞書管理部16は、識別境界から離れたパターンを削除する認識辞書15のエディティング処理をおこなうとともに、バンド幅を可変にして確率密度関数を推定するよう構成したので、認識辞書15の容量を低減するとともに、カテゴリー間の識別境界をきめ細かく形成可能にして認識精度を高めることができる。
【0069】
なお、本実施の形態では、本発明を文字認識装置に適用した場合を示したが、本発明はこれに限定されるものではなく、パターンの認識をおこなう各種パターン認識装置に適用することができる。ただし、英文字、数字、カタカナなどカテゴリー数が少ないものについて特に有効である。
【0070】
【発明の効果】
以上説明したように、請求項1の発明によれば、複数の参照パターンをカテゴリーごとに区分して認識辞書に記憶しておき、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、カテゴリーにかかわらず共通の標本共分散行列を用いるとともに、所定の近傍に位置する参照パターンの全てが同一カテゴリーに属するものを削除対象として、認識辞書内の参照パターンのうちカテゴリー間の識別境界から離れた参照パターンを削除するよう構成したので、認識辞書のメモリ容量を抑制しつつ、カテゴリー間の識別境界をきめ細かく形成可能にして認識精度の向上を図ることが可能なパターン認識装置が得られるという効果を奏する。
【0072】
また、請求項2の発明によれば、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、密度正規化項1/hi dを無視するよう構成したので、認識辞書のメモリ容量を抑制しつつ、認識精度の向上を図ることが可能なパターン認識装置が得られるという効果を奏する。
【0073】
また、請求項の発明によれば、認識辞書に記憶した各参照パターンごとに保持するスカラー値であるバンド幅を可変にするよう構成したので、より高度な認識精度を得ることが可能なパターン認識装置が得られるという効果を奏する。
【0074】
また、請求項の発明によれば、バンド幅を異カテゴリーパターン全体との最小距離の定数倍に設定するよう構成したので、より高度な認識精度を得ることが可能なパターン認識装置が得られるという効果を奏する。
【0075】
また、請求項5の発明によれば、複数の参照パターンをカテゴリーごとに区分して認識辞書に記憶しておき、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、カテゴリーにかかわらず共通の標本共分散行列を用いるとともに、所定の近傍に位置する参照パターンの全てが同一カテゴリーに属するものを削除対象として、認識辞書内の参照パターンのうちカテゴリー間の識別境界から離れた参照パターンを削除するよう構成したので、認識辞書のメモリ容量を抑制しつつ、認識精度の向上を図ることが可能なパターン認識方法が得られるという効果を奏する。
【0077】
また、請求項6の発明によれば、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、密度正規化項1/hi dを無視するよう構成したので、認識辞書のメモリ容量を抑制しつつ、認識精度の向上を図ることが可能なパターン認識方法が得られるという効果を奏する。
【0078】
また、請求項の発明によれば、認識辞書に記憶した各参照パターンごとに保持するスカラー値であるバンド幅を可変にするよう構成したので、より高度な認識精度を得ることが可能なパターン認識方法が得られるという効果を奏する。
【0079】
また、請求項の発明によれば、バンド幅を異カテゴリーパターン全体との最小距離の定数倍に設定するよう構成したので、より高度な認識精度を得ることが可能なパターン認識方法が得られるという効果を奏する。
【0080】
また、請求項の発明によれば、請求項5〜8のいずれか一つに記載された方法をコンピュータに実行させるプログラムを記録したことで、そのプログラムを機械読み取り可能となり、これによって、請求項5〜8のいずれか一つの動作をコンピュータによって実現することが可能な記録媒体が得られるという効果を奏する。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る文字認識装置の構成を示す機能ブロック図である。
【図2】2種のカテゴリーに属する参照パターンの分布の一例を示す説明図である。
【図3】図2に示す参照パターンの分布に識別境界の一例を設けた説明図である。
【図4】パーゼンクラシファイアを用いた場合の識別概念を説明するための説明図である。
【図5】図1に示した認識辞書管理部によるエディティング処理手順を示すフローチャートである。
【図6】図1に示した認識辞書管理部による参照パターンの削減過程を説明するための説明図である。
【図7】図1に示した認識辞書管理部によるバンド幅変更の効果の一例を説明するための説明図である。
【図8】2カテゴリ、かつ、k最近傍が2個と単純化した場合を説明するための説明図である。
【符号の説明】
10 文字認識装置
11 画像入力部
12 前処理部
13 特徴抽出部
14 認識処理部
15 認識辞書
16 認識辞書管理部
A,B カテゴリー

Claims (9)

  1. 入力パターンがどのカテゴリーに属するかを認識辞書に基づいて判定して前記入力パターンのパターン認識をおこなうパターン認識装置において、
    複数の参照パターンをカテゴリーごとに区分して記憶する認識辞書と、
    ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、カテゴリーにかかわらず共通の標本共分散行列を用いるとともに、所定の近傍に位置する参照パターンの全てが同一カテゴリーに属するものを削除対象として、前記認識辞書内の参照パターンのうちカテゴリー間の識別境界から離れた参照パターンを削除するエディティング手段と
    を備えたことを特徴とするパターン認識装置。
  2. 前記エディッティング手段は、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、密度正規化項1/hi dを無視することを特徴とする請求項1に記載のパターン認識装置。
  3. 前記認識辞書に記憶した各参照パターンごとに保持するスカラー値であるバンド幅を可変にするバンド幅設定手段をさらに備えたことを特徴とする請求項1または2に記載のパターン認識装置。
  4. 前記バンド幅設定手段は、前記バンド幅を異カテゴリーパターン全体との最小距離の定数倍に設定することを特徴とする請求項3に記載のパターン認識装置。
  5. 入力パターンがどのカテゴリーに属するかを認識辞書に基づいて判定して前記入力パターンのパターン認識をおこなうパターン認識方法において、
    ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、カテゴリーにかかわらず共通の標本共分散行列を用いるとともに、所定の近傍に位置する参照パターンの全てが同一カテゴリーに属するものを削除対象として、複数の参照パターンをカテゴリーごとに区分して記憶する認識辞書内の参照パターンのうちカテゴリー間の識別境界から離れた参照パターンを削除するエディティング工程
    を含んだことを特徴とするパターン認識方法。
  6. 前記エディッティング工程は、ガウスカーネルによる密度推定に基づいて各カテゴリーの事後確率を算出する際に、密度正規化項1/hi dを無視することを特徴とする請求項5に記載のパターン認識方法。
  7. 前記認識辞書に記憶した各参照パターンごとに保持するスカラー値であるバンド幅を可変にするバンド幅設定工程をさらに含んだことを特徴とする請求項5または6に記載のパターン認識方法。
  8. 前記バンド幅設定工程は、前記バンド幅を異カテゴリーパターン全体との最小距離の定数倍に設定することを特徴とする請求項7に記載のパターン認識方法。
  9. 前記請求項5〜8に記載された方法をコンピュータに実行させるプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2000347272A 2000-11-14 2000-11-14 パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 Expired - Fee Related JP3977007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000347272A JP3977007B2 (ja) 2000-11-14 2000-11-14 パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000347272A JP3977007B2 (ja) 2000-11-14 2000-11-14 パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2002150286A JP2002150286A (ja) 2002-05-24
JP3977007B2 true JP3977007B2 (ja) 2007-09-19

Family

ID=18821034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000347272A Expired - Fee Related JP3977007B2 (ja) 2000-11-14 2000-11-14 パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP3977007B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102034243A (zh) * 2010-12-29 2011-04-27 北京智安邦科技有限公司 一种获取视频图像中人群密度图的方法及装置

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4657511B2 (ja) * 2001-07-12 2011-03-23 グローリー株式会社 パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラム
US7202791B2 (en) * 2001-09-27 2007-04-10 Koninklijke Philips N.V. Method and apparatus for modeling behavior using a probability distrubution function
JP4514687B2 (ja) * 2004-11-08 2010-07-28 株式会社東芝 パターン認識装置
WO2007098957A1 (en) * 2006-03-03 2007-09-07 Mentis Cura Ehf. Method and apparatus of constructing and using a reference tool to generate a discriminatory signal for indicating a medical condition of a subject
JP5234809B2 (ja) * 2009-06-24 2013-07-10 任天堂株式会社 情報処理プログラムおよび情報処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102034243A (zh) * 2010-12-29 2011-04-27 北京智安邦科技有限公司 一种获取视频图像中人群密度图的方法及装置
CN102034243B (zh) * 2010-12-29 2012-09-26 北京智安邦科技有限公司 一种获取视频图像中人群密度图的方法及装置

Also Published As

Publication number Publication date
JP2002150286A (ja) 2002-05-24

Similar Documents

Publication Publication Date Title
Bhowmick et al. Fast polygonal approximation of digital curves using relaxed straightness properties
Kanai et al. Automated evaluation of OCR zoning
US8594431B2 (en) Adaptive partial character recognition
EP1598770B1 (en) Low resolution optical character recognition for camera acquired documents
US9384409B1 (en) Word segmentation for document image using recursive segmentation
CN111079639A (zh) 垃圾图像分类模型构建的方法、装置、设备及存储介质
Liu et al. Precise candidate selection for large character set recognition by confidence evaluation
CN111429359B (zh) 小面积指纹图像拼接方法、装置、设备及存储介质
CN101140623A (zh) 一种基于支持向量机的视频对象识别方法及系统
Wolf Document ink bleed-through removal with two hidden markov random fields and a single observation field
Bhowmik et al. BINYAS: a complex document layout analysis system
Kumar et al. MAPS: Midline analysis and propagation of segmentation
Kumar et al. Text/image region separation for document layout detection of old document images using non-linear diffusion and level set
Cao et al. Preprocessing of low-quality handwritten documents using markov random fields
JP3977007B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Liu et al. Unstructured document recognition on business invoice
Abdullah et al. Novel Adaptive Binarization Method for Degraded Document Images.
Zheng et al. Text identification in noisy document images using Markov random model
Senanayaka et al. Adaptive Centroid Placement Based SNIC for Superpixel Segmentation
Shirdhonkar et al. Discrimination between printed and handwritten text in documents
JP4657511B2 (ja) パターン認識装置、パターン認識方法およびその方法をコンピュータに実行させるプログラム
Abreu et al. An improved fast edit approach for two-string approximated mean computation applied to OCR
Yang et al. Fuzzy clustering with spatial constraints for image thresholding.
Patil et al. Different techniques used in the process of feature extraction from fingerprint
Giuliodori et al. Handwritten digit classification

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070619

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070620

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130629

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees