JP2001118073A - パターン認識装置及び認識方法 - Google Patents
パターン認識装置及び認識方法Info
- Publication number
- JP2001118073A JP2001118073A JP29862599A JP29862599A JP2001118073A JP 2001118073 A JP2001118073 A JP 2001118073A JP 29862599 A JP29862599 A JP 29862599A JP 29862599 A JP29862599 A JP 29862599A JP 2001118073 A JP2001118073 A JP 2001118073A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- narrowing
- pattern
- candidate
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
識辞書12hを作成する。候補認識辞書12hは、各カ
テゴリ毎に当該絞込段階hに応じたNh個の参照パター
ンを持つ。各参照パターンは、カテゴリの学習サンプル
群をNh個にクラスタリングして得た各クラスタの平均
値である。認識対象パターンに近い参照パターンを候補
検出部13で検出し、これらを候補絞込部14で繰り返
し絞り込む。候補絞込部14は、与えられた各参照パタ
ーンのカテゴリを求め、それら各カテゴリの参照パター
ンを現段階hの候補認識辞書12hから取り出し、認識
対象パターンに近いものを所定数選択する。選択された
パターンが同一カテゴリであれば認識制御部15はその
カテゴリを認識結果とし、そうでなければ選択されたパ
ターン群を候補絞込部14に渡し次段階(h+1)の辞
書を使って再度絞込を行わせる。
Description
用したパターン認識装置及び方法に関する。
既存のパターンのカテゴリのいずれに該当するかを求め
る技術であり、文字認識や図形認識、音声認識、構造認
識などの各種分野への応用が期待されている。
法として認識辞書を利用するものがある。この手法で
は、まず予め想定した各カテゴリ毎にそのカテゴリの学
習サンプルのパターンを多数用意し、それら学習サンプ
ル群から当該カテゴリを代表する参照パターンを求め、
求めた各カテゴリの参照パターンを記憶装置に記憶して
認識辞書を作成する。そして、認識対象のパターンが与
えられると、そのパターンを、認識辞書に格納されてい
るすべての参照パターンと比較し、そのパターンに最も
近い参照パターンに対応するカテゴリを、そのパターン
の認識の結果として出力する。
学習サンプルの分布がばらつき、数が多い場合は、参照
パターンが対応カテゴリの学習サンプルの全体を反映す
ることは困難となり、認識率の低下を招く。このことを
説明するために、例えばパターンを各種の特徴量の組で
表現し、同一カテゴリ内の学習サンプル群について特徴
量の平均値(中心値)を求め、この平均値を当該カテゴ
リの参照パターンとする場合を考える。図6に示すよう
に、カテゴリxに該当すべきパターンsを上述の従来手
法で認識しようとした場合、パターンsとカテゴリxの
参照パターンrxとの間の距離が、パターンsとカテゴ
リyの参照パターンryとの間の距離より大きいので、
パターンsはカテゴリyに該当すると誤認される。
術として、例えば、特開昭63−129488号公報に
は、マルチフォント文字パターンを認識するために、各
文字毎に多数の参照パターンを認識辞書に記憶してお
き、その認識辞書を用いて認識を行う方法が開示されて
いる。しかしながら、この方法では、認識辞書に含まれ
る参照パターンの数が非常に多くなり、それら多数の参
照パターンと総当たりで比較することになるため、認識
時間が無視できないものになるという問題がある。カテ
ゴリ数が多い場合には、パターン認識に要する処理時間
は膨大なものとなってしまう。
えば特開平10−162103号公報に、手書き文字学
習サンプルを用いて手書き文字認識辞書を、活字文字学
習サンプルを用いて活字文字認識辞書をそれぞれ作成し
ておき、入力された文字パターンが手書き文字か活字文
字かをまず判断し、手書き文字の場合は手書き文字認識
辞書を、活字文字の場合は活字文字認識辞書をそれぞれ
用いて認識を行う方法が開示されている。しかしなが
ら、文字フォントの種類が多いので、文字フォントの種
類をすべて区別するのは容易ではないし、同じ文字フォ
ントでも手書き文字の場合は学習サンプルの分布が一定
の法則に従わないので、1つの参照パターンで学習サン
プルを表現すると前述の誤認問題が発生し、認識率に影
響を与える。
もので、入力パターンを高精度かつ高速に認識すること
のできるパターン認識装置及びパターン認識方法を提供
することを目的とするものである。
毎に、そのカテゴリ代表となる参照パターンを1つ保持
した認識辞書を作成すると共に、そのカテゴリを段階的
に細分化し、順に参照パターンの数が多くなるよう段階
的に1以上の候補認識辞書を作成する。パターン認識処
理では、まず与えられた認識対象パターンに近い参照パ
ターン群を認識辞書から求めて候補とし、これら候補
を、段階的に詳細化される候補認識辞書を用いて、段階
的に絞り込んでいく。これら各段階を絞込段階と呼ぶ。
各絞込段階毎に、得られた候補が同一カテゴリに属する
か否かを判定し、同一カテゴリであれば、そのカテゴリ
を認識対象パターンの属するカテゴリの認識結果とす
る。同一カテゴリでなければ、得られた候補を、次の絞
込段階の候補認識辞書を用いて再度絞り込む。すなわ
ち、再度の絞込段階での絞込処理では、前段階で得られ
た候補のカテゴリを求め、現段階の候補認識辞書からそ
れら各カテゴリの参照パターン群を求め、これら参照パ
ターン群の中から認識対象パターンに近いものを候補と
して選び出す。以上の絞込処理を、絞込結果の候補群が
同一カテゴリとなるまで繰り返す。
識辞書を用いて候補を絞り込んでいくので、順次認識対
象パターンにより近い候補が選ばれるようになる。した
がって、最終的に得られる認識結果は、認識対象パター
ンに非常に近い候補から定められることになり、認識精
度が向上する。また、最初から各カテゴリ毎に多数の参
照パターンを含んだ詳細な辞書を用いて総当たりで調べ
るのではないので、処理の高速化が見込める。
下、実施形態という)を図面を参照して説明する。
原理を説明するための図である。本実施形態の認識装置
1は、認識辞書作成部11及び認識辞書11a、候補認
識辞書作成部12及びK(K≧1)個の候補認識辞書1
21、122、…12K、候補検出部13、候補絞込部
14及び認識制御部15を含む。この装置1は、入力さ
れた認識対象のパターンが、予め定められた各カテゴリ
のいずれに該当するかを認識するための装置である。例
えば文字認識の場合、「あ」、「い」などの各文字種
が、それぞれここでいうカテゴリである。そして、紙に
印刷された特定の「あ」という文字や、ある人が書いた
「あ」の手書き文字などが、文字種「あ」のカテゴリに
属する個別のパターンということになる。なお、以下の
説明から分かるように、この装置1は、文字、図形、音
声、構造など、どのような形式のパターンにも適用可能
である。
記憶された各カテゴリの学習サンプル群から、各カテゴ
リ毎にその代表となる参照パターンを求め、各カテゴリ
毎に1つの参照パターンを登録した認識辞書11aを作
成する。候補認識辞書作成部12は、記憶部18の学習
サンプル群から、K個の候補認識辞書121〜12Kを
作成する。Kは予め定められた数であり、後述する候補
絞込処理の上限段階数に相当する。各候補認識辞書12
h(h=1,2,…,K)は、それぞれ第h番目の候補
絞込段階で用いる辞書である。候補認識辞書12hやそ
の作成方法等の詳細については後述する。
されている参照パターンの中から、入力された認識対象
パターンに対して最も近いP0個(P0は予め定められ
た数)の参照パターンを候補として検出する。候補絞込
部14は、候補認識辞書12hを用いて候補の絞込を行
う。絞込の処理は、h=1,2,…,Kの順番で各絞込
段階h毎に繰り返し行う。各絞込段階hでは、1つ前の
絞込段階(hー1)で求められた各候補について、その
候補の属するカテゴリの参照パターン群を、現段階hに
対応する候補認識辞書12hから取り出し、それらの中
から認識対象パターンにもっとも近いPh(Phはhに
対応して予め定めた数。ただしPh<P h−1)個の参
照パターンを検出し、これらを絞り込まれた候補として
出力する。
込まれたPh個の候補の参照パターンが同一カテゴリに
属するかどうかを判定する。この判定で、Ph個のパタ
ーンが同一カテゴリの参照パターンであると分かれば、
認識制御部15は、そのカテゴリを認識結果として出力
し、一連の認識処理を終了する。そうでなければ、認識
制御部15は、それらPh個の各参照パターンを、絞込
段階hでの候補として候補絞込部14に渡し、候補絞込
部14に次の段階(h+1)の絞込処理を行わせる。こ
のようにして段階的に絞込処理を繰り返し、最後の絞込
段階Kで求めたPK個の候補参照パターンが同一カテゴ
リでなければ、それらPK個の参照パターンの中で最も
認識対象パターンに近い参照パターンを選び、この参照
パターンの属するカテゴリを認識結果として出力する。
の詳細構成について図2〜図4を用いて説明する。
認識パターン格納部17は、認識対象パターンの構造デ
ータを格納している。パターンの構造データは、パター
ンの表現方式により異なる。例えば、特徴量でパターン
を表現する方式の場合は、特徴量(又は1組の特徴量)
がパターンの構造データとして格納される。また、グラ
フ理論上のグラフでパターンを表現する場合は、パター
ンに対応している重み付きグラフなどが、パターンの構
造データとして格納される。また、パターンが文字や図
形その他の画像である場合、そのパターンを表すビット
マップ等の画像データそのものを、そのパターンの構造
データとして用いることもできる。
(図1参照)で作成された認識辞書であり、具体的には
前述の辞書データ(すなわち各カテゴリ毎の参照パター
ンの情報)を格納した記憶装置である。
データ構造の一例を示す図である。例えばカテゴリの数
がm個であるとすると、辞書データ30は、m個のフィ
ールドから構成される。各フィールドには、それぞれ対
応するカテゴリi(i=1,2,…,m)の参照パター
ン3iが格納される。すなわち、辞書データ30は、カ
テゴリ1〜mのそれぞれの参照パターン31〜3mから
構成される。
辞書作成部12で作成された候補認識辞書のデータを格
納する。図4は、h番目の候補認識辞書12h内の辞書
データを示す図である。この辞書は、第h番目の絞込段
階で用いられるものである。図に示すようにh番目の候
補認識辞書データ4h0は階層構造になっている。辞書
データ4h0には、カテゴリ1、カテゴリ2、…、カテ
ゴリmに対応して、参照パターン群4h1、参照パター
ン群4h2、…、参照パターン群4hmが含まれてい
る。すべてのカテゴリiの参照パターン群4hiは、全
てNh個の参照パターンから構成される。すなわち、辞
書データ4h0には、各カテゴリ毎に、参照パターン4
h11,4h12,…,4h1Nhの合計Nh個の参照
パターンが含まれることになる。ここで、Nhは、絞込
段階の番号hに対応して予め定めた数であり、hが大き
くなるにつれて大きくなるように定めている。すなわ
ち、N i<Ni+1である。
7から読み出された1つの認識対象パターンの構造デー
タを格納する。
理の対象となる候補群を格納する。すなわち、メモリM
2には、候補検出部13で検出されたP0個の候補(参
照パターン)の名前と構造データ、または候補絞込部1
4で絞り込まれたPh−1個(添え字h−1は前絞込段
階の結果であることを示す)の候補の名前と構造データ
を格納する。メモリM2に格納している候補は、h(h
=1,2,…,K)回目の候補絞込段階の入力データと
なる。第1番目の絞込段階(すなわちh=1)のときの
入力データは候補検出部13で検出された候補であり、
第2段階以後の絞込段階hでは、候補絞込部14で前段
階に候補認識辞書Dh−1(h=2,3,…,K)を用
いて求められた候補が入力データとなる。
辞書Dh(h=1,2,…,K)から求められたPh個
の候補の名前と構造データを格納する。候補検出部13
は、認識辞書11aから、メモリM1に格納された認識
パターンともっとも近いP0個の候補(参照パターン)
を求め、その結果をメモリM2に記憶させる。
順番で各絞込段階h毎に、以下のような処理を行う。ま
ず、メモリM2に格納された各候補(これらは前段階の
絞込処理の結果である)の属するカテゴリを求め、絞込
段階hに対応する候補認識辞書Dh(12h)から、そ
れらカテゴリに属する参照パターン群を取り出す。そし
て、それら取り出した参照パターン群の中から、メモリ
M1に格納された認識対象パターンにもっとも近いPh
個の候補を求め、その結果をメモリM3に記憶させる。
たPh個の候補が同一カテゴリの参照パターンであれ
ば、その候補に対応するカテゴリを認識結果として出力
し、そうでなければ、メモリM3の内容をメモリM2に
コピーし、候補絞込部14に次の絞込段階(h+1)の
処理を行わせる。そして、認識制御部15は、最後の絞
込段階(すなわちh=K)において候補認識辞書DKか
ら求められたPK個の絞込結果の候補が同一カテゴリで
ない場合には、それら最終候補の中でメモリM1内の認
識対象パターンともっとも近い候補を選び、その候補の
属するカテゴリを認識結果とする。
れたカテゴリの情報が保存される。以上に説明した本実
施形態に係る認識装置1は、コンピュータシステムを用
いて構築することができる。図5は、認識装置1のプラ
ットフォームとして用いることのできるコンピュータシ
ステムの一例を示している。
は、キーボート21、外部記憶装置22、ディスプレイ
23、プロセッサ部24から構成される。キーボート2
1は、ユーザが操作を指示するための入力装置であり、
この他にマウス等その他の入力装置が付加されていても
よい。外部記憶装置22は、前述の認識対象パターンの
構造データや、認識辞書データ及び候補認識辞書データ
や、認識結果や、前述の処理手順を実現するためのソフ
トウェアを格納する。また、認識対象パターン格納部1
7、認識辞書11aと候補認識辞書121〜12Kを、
この外部記憶装置22の一部として構成することができ
る。さらに、記憶部16によって認識されたカテゴリの
名前と構造データを格納してもよい。外部記憶装置22
は、例えばハードディスクなどで構成することができ
る。ディスプレイ23は、ユーザに対するメッセージや
認識対象パターンのデータ、認識の結果などを表示する
ための出力装置である。もちろん音声出力その他の出力
装置が付加されていてもよい。プロセッサ部24は、外
部記憶装置22に格納されているソフトウェアなどに従
って、実際の処理を行う。プロセッサ部24は、具体的
にマイクロプロセッサやメモリなどから構成される。そ
して、候補検出部13、候補絞込部14、認識制御部1
5は、このプロセッサ部24の上で動作するソフトウェ
アによって構成することができる。
細に説明する。まず、認識対象パターン格納部17に格
納されている認識対象パターンについて説明する。認識
対象パターン格納部17に格納されている認識対象パタ
ーンの構造データは、パターンの表現方法に応じて様々
に異なる。本実施形態の装置は、基本的にどのような形
式の構造データにも適用することができる。例えば、文
字パターン、音声パターン、指紋パターン、顔パターン
の場合は、各パターンの特徴量(又はその組)が認識対
象パターンの構造データとして格納される。化合物分子
構造、RNAの二次構造などの場合は、パターン(構
造)は重み付きグラフで表現でき、それぞれの重み付き
グラフが認識対象パターンの構造データとして格納され
る。線図形の場合は、パターン(線図形)の輪郭線デー
タや、パターン(線図形)のビットマップ等の画像デー
タなどが、認識対象パターンの構造データとして格納さ
れる。
ータの作成法について説明する。例えばパターンを特徴
量で表現する方式の場合、各カテゴリの参照パターンを
求めるには、各カテゴリ毎に、そのカテゴリのすべての
学習サンプルのパターンの特徴量の各次元の平均値(こ
の例では特徴量が、複数の成分からなるベクトルの場合
を考える)を求め、求められた特徴量の平均値を、その
カテゴリの参照パターンとする。また、特徴量以外の方
法でパターンを表現する場合は、各カテゴリごとに、そ
のカテゴリのすべての学習サンプルについて、各学習サ
ンプル間の距離を計算し、該カテゴリのすべての学習サ
ンプルとの距離の和が最小になる学習サンプルを求め、
これをそのカテゴリを代表する参照パターンとする。認
識辞書11aには、各カテゴリごとに、そのカテゴリに
対応づけて参照パターンが記憶される。
公知のパターン間距離の計算方法の中から、処理するパ
ターンに適用可能なものを適宜選択して用いればよい。
例えば、特徴量でパターンを表現するとき、パターン間
のユークリッド距離を用いることができる。パターンp
iの特徴量をベクトル(pi1,pi2,…,pix)
で表現すると、パターンpiとパターンpjの間のユー
クリッド距離は式で計算される。
識辞書データの作成法について説明する。絞込段階hで
用いる候補認識辞書Dh(12h)を作成する際には、
まず各カテゴリ毎に、そのカテゴリのすべての学習サン
プルをNh個のクラスタまで分類する。クラスタ個数N
hは、絞込段階の順番hに対応して予め定められたもの
であり、hが大きくなるにつれて多くなる。すなわち、
1<N1<N2<…<NKである。絞込段階の順番hが
進むほど、各カテゴリが細かくクラスタリングされるこ
とになる。つまり、候補認識辞書Dhは、候補認識辞書
Dh−1より、もっと詳細な学習サンプルの情報を記憶
していることになる。なお、絞込段階hに対応するクラ
スタ個数Nhは、すべてのカテゴリに共通の数である。
辞書の作成の際と同様の方法で、各クラスタごとにその
クラスタを代表する参照パターンを求める。したがっ
て、各カテゴリ毎に、それぞれNh個の参照パターンが
求められることになる。これらNh個の参照パターン
を、絞込段階hの当該カテゴリの参照パターン群として
候補認識辞書12hに登録する。以上のような手順を各
絞込段階h(h=1,2,…,K)毎に行うことによ
り、各絞込段階に対応する候補認識辞書121,12
2,…,12Kが構成される。
のクラスタリング(分類)は、公知のクラスタリング手
法の中から、処理するパターンの形式に適したものを選
択して用いればよい。例えば、文字パターンの場合に
は、よいクラスタリング手法として最長距離分類法が知
られている。最長距離分類法は、2つのクラスタ同士の
距離を各クラスタ内の任意の2つのパターン間の距離の
中で最長な距離によって定義し、この距離が最小となる
2つのクラスタを統合する。2つのクラスタCiとCj
間の距離dは次式で定義される。
初のクラスタとし、これらを上記の方法で順次階層的に
統合していくことにより、所与のサンプル群を所望の数
のクラスタに分割することができる。
る。候補検出部13は、メモリM1に格納されている認
識対象パターンを、認識辞書11aに格納されているす
べての参照パターンと比較し、認識対象パターンともっ
とも近いP0(所定値)個の参照パターンを候補として
検出し、メモリM2に記憶させる。認識辞書11aに
は、各カテゴリ毎に1つずつの参照パターンが記憶され
ているので、候補検出部13では、P0(所定値)個の
カテゴリが、認識対象パターンの所属可能性の高いカテ
ゴリとして抽出されることになる。
−1)で検出された候補と、現絞込段階hの候補認識辞
書Dh(12h)を用いて、それら候補を絞り込む。こ
のとき、メモリM1に格納されている認識対象パターン
を、候補認識辞書Dhに格納されているすべての参照パ
ターンと比較するのではなく、候補認識辞書Dhの参照
パターン群のうち、メモリM2に格納されている前絞込
段階で求められた候補の属するカテゴリに該当するもの
のみを取り出し、これら限られたカテゴリの参照パター
ン群を認識対象パターンと比較する。そして、この比較
により、認識対象パターンにもっとも近いPh個の候補
を求め、メモリM3に記憶させる。
ている前段階の絞込結果の候補に該当するカテゴリのみ
を比較の対象とするので、全参照パターンと比較を行う
特開昭63−129488号などの従来手法に比べて比
較の数が大幅に少なくなり、処理の時間を大幅に短縮で
きる。
って、候補認識辞書Dhに格納されている各カテゴリの
参照パターン数Nhが大きくなり、各カテゴリがより詳
細に分割されているので、絞込段階が進むほど、認識対
象パターンに近い参照パターンをより詳細に求めること
ができる。
びyの学習サンプルを、それぞれ3つのクラスタに分割
し、各クラスタ毎に参照パターンを設定した様子を示し
ている。図7に示すように、1カテゴリに対して3つの
参照パターンを設定することにより、図6のように1カ
テゴリを1つの参照パターンで代表させる場合より、学
習サンプルの分布をよりよく反映することができる。カ
テゴリxに含まれるべきパターンsを認識するとき、パ
ターンsはカテゴリxの参照パターンrx3にもっとも
近いので、この参照パターンrx3は必ず候補として抽
出されることになる。
1)よりも詳細なクラスタリングが行われているので、
候補絞込部14の絞込処理では、より認識対象パターン
に近いものが抽出される。したがって、絞込段階hで抽
出する候補の数Phが、前段階で求めた候補の数P
h−1よりも小さくなるように設定していることを考え
合わせると、絞込段階が進むにつれて、認識対象パター
ンに対してより近く、より数の少ない参照パターンが選
ばれていくことがわかる。したがって、絞込段階を繰り
返すにつれて、認識対象パターンが該当する可能性のよ
り高いカテゴリが選ばれるようになり、しかも選ばれる
カテゴリの数も少なくなっていく。
識制御部15は、まず最初は候補検出部13で検出され
た候補(メモリM2内にある)が、すべて同じカテゴリ
に属するかを検査する。すべての候補が同じカテゴリの
参照パターンであれば、そのカテゴリを認識の結果とし
て出力する。そうでなければ、候補絞込部14に、絞込
処理を行わせる。そして、この絞込により求められた候
補(メモリM3内にある)が、同じカテゴリの参照パタ
ーンかどうかを検査する。同じカテゴリの参照パターン
であればそのカテゴリを認識結果として出力し、そうで
なければメモリM3の内容をメモリM2にコピーし、候
補絞込部14に次の絞込段階の処理を行わせる。これを
繰り返すことにより、徐々に候補が絞り込まれていき、
同一カテゴリの候補のみが選ばれるようになった段階
で、そのカテゴリが認識結果として出力されることにな
る。なお、想定した最後の絞込段階(h=K)の絞込結
果のPK個の候補が同一カテゴリにならなかった場合
は、それら最終候補の中で認識対象パターンにもっとも
近い候補を選び、この候補の属するカテゴリを認識結果
として出力する。
ローチャートを参照して説明していく。まず、候補検出
部13の動作をフローチャートを用いて説明する。図8
は候補検出部13の動作手順を示すフローチャートであ
る。各ステップの処理順に説明する。
認識辞書11aに格納している参照パターンの比較順序
を示す番号であり、これをi=1に初期化する。d
Max()は、認識対象パターンに近い順にP0個まで
の各候補の、認識対象パターンとの距離であり、これら
はdMax(1)=dMax(2)=…d
Max(P0)=最大値に設定する。mは、認識辞書に
格納している参照パターンの個数であり、これには想定
するカテゴリの数をmを設定する。また、C0()は、
候補を記憶するメモリ変数であり、認識対象パターンに
近い順にP0個の分が設けられている。これらC
0(1),C0(2),…,C0(P0)はすべて空
(ヌル値)に初期化される。なおここで、dMax()
の最大値は、ソフトウエア上でDMa x変数の型が表現
できる値の範囲の上限である。
ーンSiとの間の距離d(q,Si)を計算する。
する。
する参照パターンSiとの距離d(q,Si)がd
Max(j)より小さいかどうかを判断する。小さい場
合は、S5へ行く。小さくない場合はS7へ行く。
1),…,C0(P0−1)をそれぞれC0(j+
1),C0(j+2),…,C0(P0)にコピーし、
距離dMax(i),dMax(j+1),…,d
Max(P0−1)をそれぞれdMax(i+1),d
Max(j+2),…,dMax(P0)にコピーす
る。そして、S6へ進む。このステップでは、S4で距
離d(q,Si)が現時点で認識対象パターンにj番目
に近い候補の距離dMax(j)より小さいことが分か
ったので、現在注目する参照パターンSiをj番目に挿
入すべく、それまでj番目以降に配列されていた候補群
を1つずつ後にずらす。
目している参照パターンSiの情報をセットする。すな
わちC0(j)=Si,dMax(j)=d(q,
Si)と設定し、S9に進む。
o)の場合、jを1だけインクリメントして、次に比較
する候補を設定してS8に進む。
して、dMax(1),…,dMax(P0)のうち比
較すべきものが残っているか否かを検査する。残ってい
ない場合(判定結果No)はS9へ進む。比較する候補
はまだ残っている場合(判定結果Yes)は、S4へ行
く。
ントの参照パターンSiが、認識対象パターンqに近い
順のP0個の候補配列の中に位置を見出した場合(S6
から)か、あるいはSiがその候補配列の中に入らない
(すなわち認識対象から遠い)ことが判明した場合(S
8から)のいずれかであり、いずれにしてもカレントの
参照パターンSiについての処理が終了した場合であ
る。このステップでは、参照パターンの順番を示すイン
デックスiを1だけインクリメントし、次に比較する参
照パターンを設定してS10に進む。
を行うべき参照パターンが残っているかどうかを判定す
る。残っていなければ(判定結果No)、候補検出部1
3の処理を終了する。比較する参照パターンはまだ残っ
ている場合は、S2に戻って以上の処理を繰り返す。
0(1),C0(2),…,C0(P0)には、認識対
象パターンqに近い順にP0個の参照パターンが記憶さ
れることになる。
トを用いて説明する。図9は候補絞込部14の絞込段階
h(ただしh=1,2,…,K)における動作手順を示
すフローチャートである。
は、1つ前の絞込段階(h−1)で検出された候補を取
り出す順番を示す番号であり、これをi=1に初期化す
る。また、認識対象パターンに近い順にPh個までの各
候補の、認識対象パターンとの距離を初期化する。すな
わちdMax(1)=dMax(2)=…dMax(P
h)=最大値と設定する。また、認識対象パターンに近
い順にPh個の候補を記憶するためのメモリ変数列Ch
(1),Ch(2),…,Ch(Ph)を空にする。
ける、前段階の第i番目の候補Ch− 1(i)が属する
カテゴリの参照パターン群の中から順番に参照パターン
を取り出す際の順番を示す番号であり、これをj=1に
初期化する。
Ch−1(i)の属するカテゴリの絞込段階hにおける
第j番目の参照パターンSi(j)と、間の距離d
(q,Si(j))を計算する。
定する。
dMax(u)より小さいかどうかを判断する。小さい
場合は、S16へ行く。小さくない場合はS18へ行
く。
1),…,Ch(Ph−1)をそれぞれCh(u+
1),Ch(u+2),…,Ch(Ph)にコピーし、
距離dMa x(u),dMax(u+1),…,d
Max(Ph−1)をそれぞれdMax(u+1),d
Max(u+2),…,dMax(Ph)にコピーす
る。
目の変数に、カレントの参照パターンSi(j)の情報
を記憶させる。すなわち、Ch(u)=Si(j);d
Max(u)=d(q,Si(j))と設定する。これ
が終わると、S20に進む。
場合、uを1インクリメントし、次に比較する候補を設
定してS19に進む。
較して、dMax(1),…,dMa x(Ph)のうち
比較すべきものが残っているか否かを検査する。残って
いない場合は、S20へ行く。比較する候補はまだ残っ
ている場合は、S15に戻って以上の処理を繰り返す。
参照パターンSi(j)が候補配列に挿入されたか、あ
るいは候補配列に入らないことが判明したかのいずれか
の場合であり、いずれの場合もカレント参照パターンに
ついての処理は終わったということなので、インデクス
jを1だけインクリメントし、次の参照パターンを取り
上げて、S21に進む。
おける1カテゴリ当たりの参照パターン数)と比較し、
候補Ch−1(i)に対応する参照パターンのうち残っ
ているものがないかを判定する。残っているものがない
場合(判定結果No)、S22へ行く。比較する参照パ
ターンがまだ残っている場合は、S13に戻って以上の
処理を繰り返す。
補Ch−1(i)に対応するNh個の全参照パターンの
処理が完了したときなので、iを1だけインクリメント
して、iが前絞込段階の絞込結果の中の次の候補を示す
ようにし、S23に進む。
における絞込結果の候補の数Ph−1と比較し、前段階
の絞込結果のうち、まだ取り出されていない候補が残っ
ているかどうかを判定する。残っていなければ(判定結
果No)、候補絞込部14の処理を終了する。比較する
候補がまだ残っている場合は、S12に戻って以上の処
理を繰り返す。
り、絞込結果の候補の配列Ch(1),Ch(2),
…,Ch(P0)には、認識対象パターンqに近い順に
Ph個の参照パターンが記憶されることになる。
(h−1)の絞込結果のPh−1の候補の1つ1つにつ
いて上記処理を繰り返したが、絞込結果のPh−1の候
補の中に同一カテゴリに属するものが複数ある場合も考
えられる。このような場合を想定して、S22で前絞込
段階の絞込結果から次の候補を取り出した際に、その候
補が以前に取り出した候補のいずれかと同じカテゴリに
属するかどうかをチェックし、同じカテゴリに属する場
合には、その候補についてのS13〜S22の処理をス
キップするなどの例外処理を設けてもよい。
トを用いて説明する。図10は認識制御部15の動作手
順を示すフローチャートである。
=1と初期化する(絞込段階hの初期化)。
候補絞込部14でPh個の候補Ch(1),C
h(2),…,Ch(Ph)を検出する。この候補絞込
部14の処理については、既に説明した。
じパターンであるかどうかを判定する。同じパターンの
場合は、S30へ行く。同じパターンではない場合は、
S27へ行く。
ンでない場合、hを1だけインクリメントし、次の候補
認識辞書を取り出す(絞込段階hのインクリメント)。
と比較し、更なる候補の絞込が可能か否かを判定する。
更なる絞込が可能な場合(判定結果Yes)、S25に
戻って次の絞込段階の処理を実行する。更なる絞込処理
ができない場合(hがKを越えた場合)、S29に進
む。
は、最後の絞込段階Kで得られた候補が同一のカテゴリ
でない場合であり、このような場合は、それら候補のう
ち認識対象パターンに最も近い候補CK(1)を取り出
し、この候補の属するカテゴリを、認識対象パターンの
カテゴリとして出力し、一連の処理を終了する。
は、絞込段階hで得られたすべての候補が同一カテゴリ
に属すると判定された場合であり、このような場合に
は、そのカテゴリを認識結果として出力する。どの候補
を選んでもカテゴリは同じなので、例えば最初の候補C
h(1)を選び、この候補のカテゴリを認識結果とし
て、一連の処理を終了する。
15は、候補検出部13で求められた最初の候補につい
ても、S26と同様の判定処理を行い、その結果全ての
候補が同一カテゴリであれば、そのカテゴリを認識結果
とし、その段階で処理を終了する。それら候補が同一カ
テゴリでない場合に、図10に示す絞込段階の処理に移
行する。
て具体的に文字パターンを認識する実験を行った。その
実験における認識率及び認識速度について説明する。な
お、ここでは、距離の計算回数を、認識速度の評価のた
めの評価値として用いる。
をスキャナでコンピュータに入力したものである。文字
パターンは2次ペリフェラル特徴量(128次元)で表
現し、文字パターン間のユークリッド距離で文字パター
ン同士の近さを判定する。実験に用いた文字パターンの
カテゴリ数は3455個であり、カテゴリ(すなわち文
字種)毎に、100から150個程度の学習サンプルを
用意した。まず、文字毎に、該文字のすべての学習サン
プルの中心値を求め、認識辞書を作成した。続いて、文
字毎に、該文字のすべての学習サンプルを15クラスタ
まで最長距離法で分類し、15個の参照パターンを求
め、候補認識辞書を1個作成した(すなわち、K=1の
場合に相当する)。候補認識辞書D1には、3455x
15=51825個の参照パターンが記憶されているこ
とになる。また、抽出する候補数をP0=30,P1=
1と設定した。
の装置を用いた場合と、認識辞書のみを用いる従来の認
識方法を用いた場合の両方について、学習したサンプル
を認識する実験を行った。その結果、従来認識方法の認
識率は88.51%であり、本実施形態の認識方法の認
識率は97.06%であった。1文字を認識するときの
距離計算回数は、従来認識方法の場合は、3455回で
あり、本実施形態の認識方法の場合は、3455+30
×15=3905回であった。
態によれば、認識速度の低下をそれほど招かずに、認識
率を飛躍的に向上させることができる。このように、本
実施形態によれば、パターン認識分野における未知パタ
ーンを認識する問題に対して、より高い認識精度かつ比
較的に高速にパターンを認識することが可能になる。
に係る認識装置及び方法によれば、入力された認識パタ
ーンを従来よりも高精度かつ高速に認識することができ
る。
る。
る。
る。
従来手法での問題を説明するための図である。
表現する本実施形態の手法の利点を説明するための図で
ある。
である。
である。
トである。
書、12 候補認識辞書作成部、121〜12K 候補
認識辞書、13 候補検出部、14 候補絞込部、15
認識制御部。
Claims (12)
- 【請求項1】 入力された認識対象パターンが、予め定
められた複数のカテゴリのいずれに該当するかを判別す
るパターン認識装置において、 各カテゴリ毎に、そのカテゴリの学習サンプル群からそ
のカテゴリを代表する参照パターンを求め、各カテゴリ
毎にその参照パターンを記憶した認識辞書を作成する認
識辞書作成手段と、 K(K≧1)段階の各絞込段階毎に、前記各カテゴリに
ついて、そのカテゴリの学習サンプル群からそれぞれそ
の絞込段階に応じた数の参照パターンを求めることによ
り、当該絞込段階の候補認識辞書を作成する候補認識辞
書作成手段と、 前記認識対象パターンに近い参照パターンの候補を前記
認識辞書から検出する候補検出手段と、 前記候補検出手段で検出された候補のうち、前記認識対
象パターンによりよく適合するものを前記候補認識辞書
を用いて選択することにより、候補の絞込を行う候補絞
込手段と、 前記候補絞込手段に、前記各絞込段階の順に、当該絞込
段階の前記候補認識辞書を用いて段階的に絞込を行わせ
て認識結果を求める認識制御手段と、を備えるパターン
認識装置。 - 【請求項2】 前記認識辞書作成手段は、各カテゴリ毎
に、そのカテゴリのすべての学習サンプルの代表値を求
め、その代表値を該カテゴリの参照パターンとして記憶
させることにより認識辞書を作成することを特徴とする
請求項1記載のパターン認識装置。 - 【請求項3】 前記候補認識辞書作成手段は、絞込段階
h(h=1,2,…,K)の候補認識辞書Dhを作成す
るに当たり、各カテゴリ毎に、そのカテゴリのすべての
学習サンプルをその絞込段階hに応じて定められたNh
(Nh>0,Ni<Ni+1,i=1,2,…,K−
1)個のクラスタにクラスタリングし、前記Nh個のク
ラスタの代表値をそれぞれ求め、求めたNh個の代表値
を当該カテゴリのNh個の参照パターンとして記憶させ
ることにより候補認識辞書Dhを作成することを特徴と
する請求項1記載のパターン認識装置。 - 【請求項4】 前記候補検出手段は、入力された前記認
識対象パターンを前記認識辞書に格納されている各参照
パターンと比較し、前記認識対象パターンに近い順に所
定数P0(P0>1)個の参照パターンを求め、求めた
参照パターンを候補とすることを特徴とする請求項1記
載のパターン認識装置。 - 【請求項5】 前記候補絞込手段は、絞込段階hの絞込
処理を行うに当たり、前段階(h−1)で求められた各
候補の属する各カテゴリについて、現絞込段階hの候補
認識辞書Dhからそれら各カテゴリの参照パターン群を
取得し、これら取得した参照パターン群から前記認識対
象パターンに近い順に、当該絞込段階hに対応して定め
られた所定数Ph(Ph>1,Ph<Ph−1)個の参
照パターンを抽出し、抽出した各参照パターンを現絞込
段階hの候補として選ぶことを特徴とする請求項1記載
のパターン認識装置。 - 【請求項6】 前記認識制御手段は、各絞込段階h毎
に、前記候補絞込手段で得られたPh個の参照パターン
を調べ、これら参照パターン群がすべて同一のカテゴリ
に属する場合に、そのカテゴリを認識結果として出力
し、認識処理を終了することを特徴とする請求項5記載
のパターン認識装置。 - 【請求項7】 前記認識制御手段は、最後の絞込段階K
について前記候補絞込手段で得られたPK個の参照パタ
ーン群が同一のカテゴリでない場合に、それら参照パタ
ーン群のうち前記認識対象パターンに最も近い参照パタ
ーンの属するカテゴリを認識結果として出力することを
特徴とする請求項6記載のパターン認識装置。 - 【請求項8】 入力された認識対象パターンが予め定め
られた複数のカテゴリのいずれに属するかを認識するパ
ターン認識装置であって、 各絞込段階毎に作成された認識辞書であって、それぞれ
が、前記カテゴリ毎に、そのカテゴリの学習サンプル群
を、対応する絞込段階に応じたクラスタ数に分類して得
られた各クラスタの参照パターンを保持する複数の認識
辞書と、 前記各絞込段階毎に、その絞込段階の認識辞書から、そ
の前の絞込段階で得られた各候補の属する各カテゴリに
属する参照パターン群を取得し、これら取得した各参照
パターンの中から前記認識対象パターンに近いものを所
定数個選んで候補とする候補絞込手段と、 前記候補絞込手段で選ばれた候補が全て同じカテゴリに
属する場合そのカテゴリを前記認識対象パターンのカテ
ゴリと判定し、そうでない場合は前記候補絞込手段に次
の絞込段階の処理を行わせる認識制御手段と、 を備えるパターン認識装置。 - 【請求項9】 入力された認識対象パターンが予め定め
られた複数のカテゴリのいずれに該当するかを認識する
パターン認識方法であって、 各絞込段階毎の認識辞書を作成するステップであって、
前記各カテゴリ毎に、そのカテゴリの学習サンプル群
を、対応する絞込段階に応じたクラスタ数に分類し、こ
れら各クラスタごとにそれぞれ参照パターンを求め、こ
れら求めた参照パターンをそれぞれ前記各カテゴリに対
応づけて記憶することにより認識辞書を作成する辞書作
成ステップと、 前記各絞込段階の順に、当該絞込段階の認識辞書から、
その前の絞込段階で得られた候補の属する各カテゴリの
参照パターン群を取得し、これら取得した各参照パター
ンの中から前記認識対象パターンに近いものを所定数個
候補に選択する候補絞込ステップと、 前記候補絞込ステップで選ばれた候補が全て同じカテゴ
リに属する場合そのカテゴリを前記認識対象パターンの
カテゴリと判定し、そうでない場合は次の絞込段階につ
いて前記候補絞込ステップを実行する認識制御ステップ
と、 を含むパターン認識方法。 - 【請求項10】 前記認識辞書作成ステップでは、各絞
込段階の認識辞書を作成するに当たり、前記各クラスタ
ごとにそのクラスタに属する学習サンプル群の代表値を
求め、この代表値を前記参照パターンとすることを特徴
とする請求項9記載のパターン認識方法。 - 【請求項11】 最後の絞込段階について前記候補絞込
ステップで得られた参照パターン群が同一のカテゴリで
ない場合に、それら参照パターン群のうち前記認識対象
パターンに最も近い参照パターンの属するカテゴリを認
識結果として出力することを特徴とする請求項9記載の
パターン認識方法。 - 【請求項12】 前記候補絞込ステップで選択する候補
の数は、後の絞込段階ほど小さい数に定められることを
特徴とする請求項9記載のパターン認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29862599A JP3925011B2 (ja) | 1999-10-20 | 1999-10-20 | パターン認識装置及び認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29862599A JP3925011B2 (ja) | 1999-10-20 | 1999-10-20 | パターン認識装置及び認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001118073A true JP2001118073A (ja) | 2001-04-27 |
JP3925011B2 JP3925011B2 (ja) | 2007-06-06 |
Family
ID=17862165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP29862599A Expired - Fee Related JP3925011B2 (ja) | 1999-10-20 | 1999-10-20 | パターン認識装置及び認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3925011B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011081192A1 (ja) * | 2009-12-28 | 2011-07-07 | サイバーアイ・エンタテインメント株式会社 | 画像認識システム |
WO2012105085A1 (ja) * | 2011-01-31 | 2012-08-09 | Necソフト株式会社 | 画像認証装置、画像認証方法、プログラムおよび記録媒体 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5906071B2 (ja) | 2011-12-01 | 2016-04-20 | キヤノン株式会社 | 情報処理方法、情報処理装置、および記憶媒体 |
-
1999
- 1999-10-20 JP JP29862599A patent/JP3925011B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011081192A1 (ja) * | 2009-12-28 | 2011-07-07 | サイバーアイ・エンタテインメント株式会社 | 画像認識システム |
JP5721233B2 (ja) * | 2009-12-28 | 2015-05-20 | サイバーアイ・エンタテインメント株式会社 | 画像認識システム |
WO2012105085A1 (ja) * | 2011-01-31 | 2012-08-09 | Necソフト株式会社 | 画像認証装置、画像認証方法、プログラムおよび記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP3925011B2 (ja) | 2007-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Weinman et al. | Scene text recognition using similarity and a lexicon with sparse belief propagation | |
CN112614538A (zh) | 一种基于蛋白质预训练表征学习的抗菌肽预测方法和装置 | |
KR100249055B1 (ko) | 문자인식장치및방법 | |
CN103473327A (zh) | 图像检索方法与系统 | |
US20120070073A1 (en) | Searching document images | |
CN112347223A (zh) | 文档检索方法、设备及计算机可读存储介质 | |
CN116432655B (zh) | 基于语用知识学习的少样本命名实体识别方法和装置 | |
JP2011248596A (ja) | 画像入り文書の検索システム及び検索方法 | |
JPH11203415A (ja) | 類似パターンカテゴリ識別辞書作成装置および方法 | |
CN117235137B (zh) | 一种基于向量数据库的职业信息查询方法及装置 | |
JP3903613B2 (ja) | 検索装置及び検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
CN112489689A (zh) | 基于多尺度差异对抗的跨数据库语音情感识别方法及装置 | |
JP3925011B2 (ja) | パターン認識装置及び認識方法 | |
Lomte et al. | Handwritten Vedic Sanskrit Text Recognition Using Deep Learning | |
JP2012098905A (ja) | 文字認識装置、文字認識方法及びプログラム | |
CN112651590B (zh) | 一种指令处理流程推荐的方法 | |
Kou et al. | A stacked graphical model for associating sub-images with sub-captions | |
EP2565799A1 (en) | Method and device for generating a fuzzy rule base for classifying logical structure features of printed documents | |
JPH0638276B2 (ja) | パターン識別装置 | |
Wei et al. | Word image representation based on sequence to sequence model with attention mechanism for out-of-vocabulary keyword spotting | |
JP2002183667A (ja) | 文字認識装置及び記録媒体 | |
Xia et al. | An efficient off-line handwritten Japanese address recognition system | |
KR102564051B1 (ko) | 강인한 학습 및 인식을 위한 다단계 딥러닝 방법 및 이를 수행하는 장치 | |
Kishore et al. | similarity assessment of 30 world sign languages and exploring scope for a sign–to–sign translator | |
Tavoli et al. | A Novel Word-Spotting Method for Handwritten Documents Using an Optimization-Based Classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040217 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070219 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110309 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120309 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130309 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130309 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140309 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |