JP2013131258A - パターン認識装置、パターン認識方法 - Google Patents

パターン認識装置、パターン認識方法 Download PDF

Info

Publication number
JP2013131258A
JP2013131258A JP2013078588A JP2013078588A JP2013131258A JP 2013131258 A JP2013131258 A JP 2013131258A JP 2013078588 A JP2013078588 A JP 2013078588A JP 2013078588 A JP2013078588 A JP 2013078588A JP 2013131258 A JP2013131258 A JP 2013131258A
Authority
JP
Japan
Prior art keywords
dictionary
subspace
input
category
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013078588A
Other languages
English (en)
Other versions
JP5503047B2 (ja
Inventor
Soichiro Ono
聡一郎 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2013078588A priority Critical patent/JP5503047B2/ja
Publication of JP2013131258A publication Critical patent/JP2013131258A/ja
Application granted granted Critical
Publication of JP5503047B2 publication Critical patent/JP5503047B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】相互部分空間法を用いた競合学習により、パターン認識性能を向上できるパターン認識装置、パターン認識方法を提供する。
【解決手段】パターン認識装置は、辞書記憶部、認識部、辞書更新部を備える。前記辞書記憶部には認識対象の本来のパターンのカテゴリと各カテゴリ毎に特徴ベクトル空間の部分空間とを対応付けて記憶したパターン認識用の辞書が記憶されている。前記認識部は前記入力パターンの部分空間と前記辞書内の部分空間とのなす正準角から前記入力パターンのカテゴリを特定する。前記辞書更新部はパターン認識時に互いのカテゴリが一致したか否かに応じて類似度を増減させ、前記入力部分空間のベクトルのうち、前記辞書内の部分空間と正準角をなすベクトルに、前記辞書内の部分空間を近づけまたは遠ざけるように新たな部分空間を計算し、求めた部分空間で前記辞書内の部分空間を更新する。
【選択図】図1

Description

本発明の実施形態は、パターン認識装置、パターン認識方法に関する。
パターン認識の技術の一つに相互部分空間法がある。この相互部分空間法は、近年、動画からの認識を念頭において顔認識の分野を中心に用いられている。
この相互部分空間法は、部分空間法の拡張として解釈できるが、例えば辞書などの作成においては、CLAFIC法など、認識対象カテゴリごとの教師なし学習としては通常の部分空間法と同一の方法を用いることができる。
一方、部分空間法においては学習部分空間法および平均化学習部分空間法などの競合学習の方法を用いることで、辞書の認識精度を向上することが考案されている。
エルッキ・オヤ(小川英光、佐藤誠訳)「パターン認識と部分空間法」(1986)、産業図書
相互部分空間法は、部分空間法の理論的な拡張であるにもかかわらず、競合学習により辞書の認識性能を向上する方法が考えられていない。
このため、部分空間法よりも認識時に多くの計算量を要するにもかかわらず、認識精度の改善は限定的なものにとどまる。
本発明が解決しようとする課題は、競合学習により、相互部分空間法によるパターン認識性能を向上することのできるパターン認識装置、パターン認識方法を提供することにある。
実施形態のパターン認識装置は、入力パターンのカテゴリを認識するパターン認識装置であって、特徴抽出部、辞書記憶部、入力部分空間算出部、認識部、辞書更新部を備える。前記特徴抽出部は前記複数の入力パターンから複数の特徴ベクトルを生成する。前記辞書記憶部には認識対象のカテゴリと各カテゴリ毎に特徴ベクトル空間の部分空間とを対応付けて記憶したパターン認識用の辞書が記憶されている。前記入力部分空間算出部は前記特徴抽出部により生成された前記複数の特徴ベクトルから、特徴ベクトル空間の部分空間を入力部分空間として算出する。前記認識部は前記部分空間部により算出された前記入力部分空間と前記辞書内の部分空間とのなす正準角から算出した類似度により前記入力パターンのカテゴリを特定する。前記辞書更新部は入力パターンの属するべきカテゴリが既知のとき、認識結果のカテゴリと前記辞書内のカテゴリとが一致したか否かを判定し、この判定結果に応じて類似度を増減させるように前記辞書記憶部の前記辞書の部分空間を更新する。
実施形態のパターン認識装置の構成を示す図である。 認識辞書の一例を示す図である。 実施形態のパターン認識装置の動作を示すフローチャートである。 辞書更新動作を説明するための図である。
以下、図面を参照して、実施形態を詳細に説明する。
図1は実施形態のパターン認識装置の構成を示す図である。
図1に示すように、この実施形態のパターン認識装置は、キーボード等の入力装置2と、モニタ等の表示装置3と、これらの機器と通信ケーブルまたはネットワークを介して接続されたパターン認識装置1とを有している。
パターン認識装置1は、例えばCPU、メモリ、ハードディスク装置、通信インターフェースなどのハードウェアと、ハードディスク装置にインストールされたプログラム(オペレーティングシステム(以下「OS」と称す)、パターン認識ソフトウェアなど)を有するコンピュータにより実現される。メモリは、認識辞書記憶部14として機能する。
ソフトウェア(プログラム)は、信号入力部11、特徴抽出部12、入力部分空間算出部13、認識辞書記憶部14、辞書修正部15、認識部16、修正入力部17などを有している。
信号入力部11は、認識対象となる信号を受け付ける。この信号は顔や文字の画像や音声などのディジタル情報、または必要に応じてこれらに二値化などの前処理を施されたデータであり、信号入力部11から特徴抽出部12へ渡される。
特徴抽出部12は、信号入力部11から渡された信号を一定の次元の数ベクトルに変換する。特徴抽出部12は、まず信号に、長さや量子化レベルを正規化するなどの前処理を施し、その前処理後の値や、前処理後の信号にさらにガウシアンフィルタなどのフィルタ処理やフーリエ変換などの変換処理を施した後の値を成分とする複数の特徴ベクトルを出力する。すなわち特徴抽出部12は、入力パターンを用いて所定次元の複数の特徴ベクトルを生成する。
このとき、複数の特徴ベクトルを得る方法として、入力信号複数に対してそれぞれ1つの特徴ベクトルを出力する方法、および、一つの入力信号に相異なる変動を加えることで複数の信号を人工的に生成し、生成された信号に対してそれぞれ1つの特徴ベクトルを出力する方法などがある。
入力信号に加える変動としては、例えばランダムに生成したノイズなどが考えられる。また特徴ベクトルはすべてノルムが1となるように正規化してもよい。これらの特徴ベクトルは、入力部分空間算出部13へ出力される。
入力部分空間算出部13は、特徴抽出部12から入力された複数の特徴ベクトルに対して、入力積分核行列の互いに正規直交する固有ベクトルを、付随する固有値の大きい順に算出し、入力部分空間の正規直交基底を認識部16に渡す。すなわち入力部分空間算出部13は、特徴抽出部12により生成された複数の特徴ベクトルから、特徴ベクトル空間の部分空間を入力部分空間として算出する。
認識辞書記憶部14には、パターン認識用の辞書(以下「認識辞書20」と称す)が記憶されている。認識辞書20には、辞書部分空間が格納されている。入力パターンから得られる部分空間と混同しないよう認識辞書20に格納されている部分空間を辞書部分空間と称す。
図2に示すように、認識辞書20には、認識対象のカテゴリ毎に分けて、正規直交基底v1 (l) ,…,vr (l) 形で辞書部分空間が格納されている。例えばカテゴリ1には正規直交基底v1 (1) ,…,vr (1)が記憶されている。カテゴリ2には正規直交基底v1 (2) ,…,vr (2)が記憶されている。
カテゴリcには正規直交基底v1 (c) ,…,vr (c)が記憶されている。
すなわち、認識辞書記憶部14は、認識対象として予め設定されたパターンのカテゴリと各カテゴリ毎に特徴ベクトル空間の部分空間とを対応付けて記憶したパターン認識用の辞書を記憶している。
認識部16は、入力部分空間の正規直交基底を、各認識対象カテゴリに対応する認識辞書20の辞書部分空間と照合する。認識部16は、入力部分空間と辞書部分空間との類似度を計算する。すべての認識対象カテゴリに対して、類似度が最大のカテゴリを求め、これを認識結果とし、修正入力部17に渡す。すなわち認識部は入力部分空間算出部13により算出された入力部分空間と認識辞書20内の辞書部分空間とのなす正準角から入力パターンのカテゴリを特定する。
より具体的には、認識部16は、入力部分空間算出部13により算出された入力部分空間と認識辞書20内の辞書部分空間とのなす正準角から、認識辞書20にある本来のカテゴリと認識対象の入力パターンを認識した結果のカテゴリとの類似度を求め、求めた類似度に基づいて、入力パターンのカテゴリを特定する。例えば類似度の最も高いカテゴリを入力パターンのカテゴリとする。
修正入力部17は、入力装置2などからの外部からのキー入力を受け付ける。この他、外部からの入力を受け付ける方法としては、グラフィックユーザインターフェース(以下「GUI」と称す)画面などを表示装置3に表示し、認識結果および入力信号を表示装置3に表示するなどし、ユーザーが認識結果の正誤を入力する。このとき、正誤に加え正しい認識結果を入力するようにしてもよい。
なお修正入力部17を特に設けずに、学習データまたはそれと同一のデータを認識対象とする場合など、外部からの入力を待たずに認識結果または正誤が判断できる場合のみを辞書修正部15の処理対象としてもよい。この場合、実施形態から入力装置2および表示装置3を省いてもよい。
辞書修正部15は、認識結果の正誤判定をした結果により、その正誤判定結果と入力部分空間を用いて認識辞書記憶部14の認識辞書20を更新する。すなわち、辞書修正部15は、入力パターンの属するべきカテゴリが既知のとき、認識結果のカテゴリと辞書内のカテゴリとが一致したか否かを判定し、この判定結果に応じて類似度を増減させるように認識辞書記憶部14の認識辞書20の部分空間を更新する辞書更新部として機能する。
辞書修正部15は、入力パターンが属するカテゴリと認識対象の入力パターンを認識部16が認識した結果のカテゴリとが一致したか否かに応じて入力部分空間のベクトルのうち、辞書部分空間と正準角をなすベクトルに、辞書部分空間を近づけまたは遠ざけるように辞書部分空間を算出し、算出した部分空間で認識辞書記憶部14の認識辞書20を更新することで、入力パターンと辞書部分空間との間の類似度を増減させる。
認識結果の正誤判定は予め設定しておいた判定ルールまたは閾値に従って行ってもよく、認識結果を表示装置3に表示して、ユーザーから正誤の指示をキー入力させるようにしてもよい。認識辞書20の更新には、例えば一般化確率勾配法などを用いる。
この実施形態では、認識辞書記憶部14としてメモリを一例にあげたが、具体的には、例えば画像や変数等のデータを記憶可能なランダムアクセスメモリ(RAM)やハードディスクドライブ装置、フラッシュメモリ、ソリッドステートドライブ(SSD)等である。この他、特に断りがない限りこの実施形態では認識辞書記憶部14として表記するが、上記したものに限らず認識辞書記憶部14としては他のいかなる記憶媒体を用いてもよい。
続いて、図3のフローチャートを参照してこのパターン認識装置のパターン認識処理動作を説明する。なおここで説明する処理の流れは一例であり、処理の一部を省略してもよい。
最初に、信号入力部11に認識対象となる信号が入力されると(図2のステップS101)、その信号は特徴抽出部12に渡され、一定の次元の数ベクトルに変換される。
この場合、特徴抽出部12は、信号に、長さや量子化レベルを正規化するなどの前処理を施し、その前処理後の値や、前処理後の信号にさらにガウシアンフィルタなどのフィルタ処理やフーリエ変換などの変換処理を施した後の値を成分とする複数の特徴ベクトルを生成し(ステップS102)、入力部分空間算出部13へ出力する。
入力部分空間算出部13は、特徴抽出部12から入力された複数の特徴ベクトルを、x1…,xn としたとき、入力積分核行列
Figure 2013131258
の互いに正規直交する固有ベクトルを、付随する固有値の大きい順に算出して正規直交基底u1,…,uqとする。すなわち入力部分空間算出部13は、複数の特徴ベクトルから、特徴ベクトル空間の部分空間を入力部分空間として算出する(ステップS103)。
但し、qは入力部分空間の次元を表すパラメータであり、特徴ベクトルの次元dおよび特徴ベクトルの入力数nに対して
1≦ q < min{d,n} 式(2)
を満たすように定める。
このように算出された入力部分空間の正規直交基底u1,…,uq は、認識部16に渡される。
認識部16は、入力部分空間算出部13により算出された入力部分空間と辞書部分空間とのなす正準角から入力パターンのカテゴリを特定、つまりパターン認識する(ステップS104)。
この場合、認識部16は、まず、入力された入力部分空間と認識辞書20の認識対象の各カテゴリに対応する辞書部分空間とを照合する。
辞書部分空間の初期値は、すべての認識対象カテゴリl = 1,…,c に対して、予め用意した学習データから抽出した特徴ベクトルのうち認識対象カテゴリlに属することがわかっているものt1 (l) ,…,tn1 (l)を用いて辞書積分核行列
Figure 2013131258
を計算し、辞書積分核行列K(l)の互いに正規直交する固有ベクトルを、付随する固有値の大きい順に算出して正規直交基底v1 (l) ,…,vr (l) とし、このv1 (l) ,…,vr (l)を基底とする部分空間として定められている。
但し、rは辞書部分空間の次元を表すパラメータであり、特徴ベクトルの次元dに対して
1≦r < d 式(4)
を満たすようにパラメータrを定めるものとする。但し、このとき正規直交基底v1 (l) ,…,vr (l) (l = 1,…,c) を直ちに認識辞書20の初期値とせず、これを後述の辞書修正部15で1回または複数回処理したものを認識辞書20の初期値としてもよい。
認識部16は、入力部分空間と辞書部分空間の類似度s(l)(Uq)を以下の手順で計算する。
いま、l番目の認識対象カテゴリの正規直交基底をv1 (l) ,…,vr (l)とし、
Figure 2013131258
とする。
ここで、入力部分空間と辞書部分空間の正準角を定める行列Sを
Figure 2013131258
と定義し、行列Sの固有値を大きい順に固有値λ1,…,λr、それに付随する固有ベクトルをそれぞれa1,…, ar(i = 1,…,r)とすると、これと入力部分空間と辞書部分空間のなす第i正準角
Figure 2013131258
の間には、
Figure 2013131258
の関係がある。
また入力部分空間のベクトルのうち上記辞書部分空間と第i正準角をなすベクトルyi (l)は、
yi (l) = Uqi 式(7)
で与えられる。このとき、
1 ≦ p < r 式(8)
を満たす整数pを用いて、行列Uqと認識対象カテゴリlとの間の類似度を、
Figure 2013131258
で定める。
そして、すべての認識対象カテゴリl = 1,…,cに対して、類似度s(l)(Uq)を最大とするlを求め、これを認識結果とし、この認識結果を修正入力部17に渡す。
修正入力部17は、GUI画面などを表示装置3に表示し、認識結果および入力信号を表示装置3に表示する。ユーザーは、表示されたGUI画面を見ながら認識結果の正誤を入力装置2から入力する(ステップS105)。このとき、正誤に加え正しい認識結果を入力するようにしてもよい。
辞書修正部15は、認識結果の正誤判定をした結果により、認識辞書20の学習の要否を判定し(ステップS106)、学習が必要であれば(ステップS106のYes)、その正誤判定結果の情報と入力部分空間を用いて認識辞書記憶部14の認識辞書20を更新する(ステップS107)。
表示装置3に認識結果が表示されると、ユーザーは表示内容が確認して、認識結果が正しいか否かを判断し、正誤の指示をキー入力する。このとき、学習を実施するかの判定は予め設定しておいた判定ルールまたは閾値などに従って自動的に行ってもよい。
認識辞書20の更新には、例えば一般化確率勾配法などを用いる。一般化確率勾配法にもとづく辞書更新幅の具体的な計算には、式(6)で定義される正準角の正弦の平方について、辞書部分空間との間には、式(7)で定義されたベクトルyi (l)を|| yi (l) || = 1となるように定めるとき、
Figure 2013131258
となる事実を用いる。但し、
Figure 2013131258
はVr (l)と同じ行数・列数の行列であり、その(α,β)成分は固有値λiを行列Vr (l)の(α,β)成分で偏微分した値として定める。
以下、辞書修正部15における辞書更新動作を、いくつか(第1実施形態〜第5実施形態)例示して説明する。
(第1実施形態)
いま、入力部分空間が本来のカテゴリmに属するとき、すべての認識対象カテゴリl = 1,…,cに対して、式(7)で定義されたベクトルyi (l)を用いて、式(10)の勾配法により、辞書部分空間を
Figure 2013131258
として更新する。
そして、更新されたVr (l)の各列をGram-Schmidtの方法などを用いて正規直交化する。
この操作はl = mの場合は式(9)で定義された類似度を増加させ、l = mの場合は式(9)で定義された類似度を増加させ、l , mの場合は類似度を減少させるため、ベクトルyi (l),…, yp (l)に辞書部分空間を近づけまたは遠ざける操作となっている。
但し、εは辞書の更新幅を示す十分小さい正の定数、l(d)は学習の重みを表す関数である。またベクトルyi (l),…, yp (l)は上記式(7)で与えられる入力部分空間の元であり、記号←は右辺の値で左辺の値を更新することを示す。
重みを表す関数の具体例としては、
定数関数l(d) ≡ 1、
Figure 2013131258
Figure 2013131258
Figure 2013131258
などがある(ρは正の定数)。また、d は類似度の式(9)により、
Figure 2013131258
などとして定める。
このようにこの第1実施形態によれば、入力部分空間のベクトルのうち辞書部分空間と第i正準角をなすベクトルを式(7)で定義し、式(10)の勾配法を用いて認識辞書20の辞書部分空間を更新することで、入力パターンの入力部分空間と認識対象カテゴリの辞書部分空間との類似度が近いものはより近く、遠いものはより遠くなるように認識辞書20の当該カテゴリの辞書部分空間が更新される。
例えば図4に示すように、X軸,Y軸,Z軸からなる3次元の特徴ベクトル空間を想定した場合、入力部分空間(1次元)41と、辞書部分空間と正準角を作る入力部分空間のベクトル40と、2次元平面で構成される正解カテゴリの辞書部分空間42とを特徴ベクトル空間上に示したときに、本実施形態の辞書更新動作により、更新された辞書部分空間43は、入力部分空間(1次元)41に、より近づけられたものなる。
すなわち、競合学習を行うことにより、相互部分空間法によるパターン認識に多くの計算量を要するものの、計算量を多く要しただけの価値がある認識精度を得ることができる。この結果、パターン認識性能を向上することができる。
(第2実施形態)
入力部分空間がカテゴリm に属するとき、すべての認識対象カテゴリl = 1…,c に対して、
Figure 2013131258
とすることにより、第1実施形態の例の更新幅を辞書部分空間の直交補空間に制約したものを、辞書部分空間の基底をなすベクトルv1 (l) ,…, vr (l) にそれぞれ加える。
このようにこの第2実施形態によれば、辞書修正部15が、辞書部分空間の基底をなすベクトルにそれぞれ辞書部分空間の直交補空間に制約された更新幅を加えて、認識辞書記憶部14の認識辞書20の辞書部分空間を更新することで、Vr (l) の各列の正規直交性を1次のオーダーで保つことができるので、認識辞書20の正規直交化は行わなくてもよい。
(第3実施形態)
いま、入力部分空間がカテゴリm に属するとき、すべての認識対象カテゴリl = 1,…, c に対して
Figure 2013131258
とすることにより、辞書部分空間の基底をなすベクトルv1 (l) ,…,vr (l) を、回転行列exp (±εl (d) ξ) を乗じることで更新する。
但しξは辞書部分空間を式(7)のyi (l),…, yp (l) に近づける方向、または遠ざける方向への無限小回転であり、
Figure 2013131258
で与えられる行列である。
また、exp は指数写像と呼ばれ、
Figure 2013131258
で与えられる行列の関数である。
計算機上では、式(16)の無限級数を途中まで計算して近似する他、既知の種々の方法を用いて計算することもできる。
このようにこの第3実施形態によれば、辞書修正部15が、更新前の辞書部分空間の基底をなすベクトルの組に回転行列を乗じて、更新後の辞書部分空間の基底をなすベクトルの組を決定し、辞書部分空間を、入力部分空間のベクトルのうち辞書部分空間と正準角をなすベクトルまたはその近似に近づける方向または遠ざける方向への無限小回転の指数写像またはその近似により回転行列を決定することで、Vr (l) ,Uq (m) の各列の正規直交性を、数値計算による誤差を除いて厳密に保つことができるので、認識辞書20の正規直交化が不要になる。なおこの第3実施形態の認識辞書20の更新方法は第2実施形態の更新方法を1次近似として含む。
(第4実施形態)
いま、入力部分空間がカテゴリm に属するとき、すべての認識対象カテゴリl = 1,…, cに対して射影行列
Figure 2013131258
を計算し、これを
Figure 2013131258
と更新する。そして、更新後の射影行列Pr (l) それぞれについて固有ベクトルを、固有値の大きい順にv1 (l) ,…,vr (l) とし、改めてVr (l) = (v1 … vq)とする。
このようにこの第4実施形態によれば、辞書修正部15が、更新後の射影行列の固有ベクトルにより、更新後の辞書部分空間の基底をなすベクトルの組を与え、辞書部分空間の基底をなすベクトルの組から計算される射影行列に更新差分を加算または減算して更新後の射影行列を更新し、入力部分空間のベクトルのうち辞書部分空間と正準角をなすベクトルに自身の転置を掛けた行列を定数倍して更新差分を得る。つまり、すべての認識対象カテゴリに対して射影行列を計算し、計算した射影行列を式(17)により更新することで、上記同様にパターン認識性能を向上することができる。
(第5実施形態)
この第5実施形態では、辞書積分核を保持する辞書積分核保持部を備える。この場合、辞書修正部15は、更新後の辞書積分核の固有ベクトルにより、更新後の辞書部分空間の基底をなすベクトルの組を与え、更新前の辞書積分核に更新差分を加えまたは減ずることによって辞書積分核保持部の更新後の辞書積分核を更新し、辞書積分核と入力積分核との間の一般化固有値問題の解として得られる固有ベクトルのうちの1つまたは複数の、それぞれに自身の転置を掛けてさらに定数倍したものを加えて更新差分を得る。
この第5実施形態の場合、入力部分空間が、カテゴリm に属するとき、すべての認識対象カテゴリl = 1,…, c に対して、まず式(3)の辞書積分核行列K(l) および式(1)の入力積分核行列Cの一般化固有値問題
z (l) = μCz 式(18)
を解き、固有ベクトルを固有値の大きい順にz1 (l),…, zp (l)(p は式(8)を満たす整数)とする。
次に、辞書積分核行列Kr (l)
Figure 2013131258
と更新する。そして、更新後の辞書積分核行列Kr (l)それぞれについて長さ1 に正規化した固有ベクトルを、固有値の大きい順にv1 (l) ,…,vr (l)とし、改めてVr (l) = (v1 … vq)とする。
但し、このとき近似としてz1 (l),…, zp (l) をz1 (l) = y1 (l), ,…, zp (l) = yp (l),としてもよい。
このようにこの第5実施形態によれば、すべての認識対象カテゴリに対して、式(3)の辞書積分核行列K(l) および式(1)の入力積分核行列Cの一般化固有値問題を解き、固有ベクトルを固有値の大きい順にz1 (l),…, zp (l)とすることで、上記同様にパターン認識性能を向上することができる。
なお、上記第1乃至第5の実施形態の辞書更新方法において、p = 1 のとき、辞書部分空間と正準角をなすベクトル入力部分空間の元y1 (l)を定める方法(近似方法)として以下に示す2つの方法がある。
(第1近似方法)
第1近似方法は、特徴抽出部12により入力パターンから生成された複数の特徴ベクトルを平均することにより、入力部分空間のベクトルのうち辞書部分空間と正準角をなすベクトル、または辞書積分核と入力積分核との間の一般化固有値問題の解として得られる固有ベクトルを近似する方法である。
具体的には、式(7)によって厳密に求める他、近似値として入力特徴ベクトルx1,…, xn の平均
Figure 2013131258
を用いる。
(第2近似方法)
第2近似方法は、特徴抽出部12により入力パターンから生成された複数の特徴ベクトルにより、入力部分空間のベクトルのうち辞書部分空間と正準角をなすベクトル、または辞書積分核と入力積分核との間の一般化固有値問題の解として得られる固有ベクトルを近似する方法である。具体的には、入力特徴ベクトルx1,…, xn の値をそのままyi (l),…, yp (l) として用いる。
また、式(11)をベクトルの標準的な内積<・,・>を用いて、
Figure 2013131258
と表すと既知の学習部分空間法と類似した形になることを利用し、辞書の更新を行う条件および更新幅ε、重み関数l(d) の定め方については、既知の学習部分空間法および学習ベクトル量子化をはじめ、確率的降下法の系統に属する分野で提唱されている方式を組み合わせてもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
また上記実施形態に示した各構成要素を、コンピュータのハードディスク装置などのストレージにインストールしたプログラムで実現してもよく、また上記プログラムを、コンピュータ読取可能な電子媒体:electronic mediaに記憶しておき、プログラムを電子媒体からコンピュータに読み取らせることで本発明の機能をコンピュータが実現するようにしてもよい。電子媒体としては、例えばCD−ROM等の記録媒体やフラッシュメモリ、リムーバブルメディア:Removable media等が含まれる。さらに、ネットワークを介して接続した異なるコンピュータに構成要素を分散して記憶し、各構成要素を機能させたコンピュータ間で通信することで実現してもよい。
1…パターン認識装置、2…入力装置、3…表示装置、11…信号入力部、12…特徴抽出部、13…入力部分空間算出部、13…入力部分空間算出部、14…認識辞書記憶部、15…辞書修正部、16…認識部、17…修正入力部。

Claims (5)

  1. 入力パターンのカテゴリを認識するパターン認識装置であって、
    前記入力パターンを用いて複数の特徴ベクトルを生成する特徴抽出部と、
    認識対象として予め設定されたパターンのカテゴリと各カテゴリ毎に特徴ベクトル空間の部分空間とを対応付けて記憶したパターン認識用の辞書を記憶する辞書記憶部と、
    前記特徴抽出部により生成された前記複数の特徴ベクトルから、特徴ベクトル空間の部分空間を入力部分空間として算出する入力部分空間算出部と、
    前記入力部分空間算出部により算出された前記入力部分空間と前記辞書内の部分空間とのなす正準角から算出した類似度により前記入力パターンのカテゴリを特定する認識部と、
    入力パターンの属するべきカテゴリが既知のとき、認識結果のカテゴリと前記辞書内のカテゴリとが一致したか否かを判定し、この判定結果に応じて類似度を増減させるように前記辞書記憶部の前記辞書の部分空間を更新する辞書更新部と
    を具備することを特徴とするパターン認識装置。
  2. 前記辞書更新部は、
    前記辞書にある本来のカテゴリと認識対象の入力パターンを認識した結果のカテゴリとが一致したか否かに応じて類似度を増減させることで、前記入力部分空間のベクトルのうち、前記辞書の部分空間と正準角をなすベクトルに、前記辞書の部分空間を近づけまたは遠ざけるように前記辞書の部分空間を算出し、算出した部分空間で前記辞書記憶部の前記辞書を更新することを特徴とする請求項1記載のパターン認識装置。
  3. 前記辞書更新部は、
    前記特徴抽出部により前記入力パターンから生成された複数の特徴ベクトルを平均することにより、入力部分空間のベクトルのうち辞書部分空間と正準角をなすベクトル、または辞書積分核と入力積分核との間の一般化固有値問題の解として得られる固有ベクトルを近似することを特徴とする請求項1または2いずれかに記載のパターン認識装置。
  4. 前記辞書更新部は、
    前記特徴抽出部により前記入力パターンから生成された複数の特徴ベクトルにより、入力部分空間のベクトルのうち辞書部分空間と正準角をなすベクトル、または辞書積分核と入力積分核との間の一般化固有値問題の解として得られる固有ベクトルを近似することを特徴とする請求項1乃至3いずれか1項に記載のパターン認識装置。
  5. 前記入力パターンを用いて複数の特徴ベクトルを生成し、
    認識対象として予め設定されたパターンのカテゴリと各カテゴリ毎に特徴ベクトル空間の部分空間とを対応付けて記憶したパターン認識用の辞書を記憶し、
    生成した前記複数の特徴ベクトルから、特徴ベクトル空間の部分空間を入力部分空間として算出し、
    算出された前記入力部分空間と前記辞書内の部分空間とのなす正準角から算出した類似度により前記入力パターンのカテゴリを特定し、
    入力パターンの属するべきカテゴリが既知のとき、認識結果のカテゴリと前記辞書内のカテゴリとが一致したか否かを判定し、この判定結果に応じて類似度を増減させるように前記辞書記憶部の前記辞書の部分空間を更新する
    ことを特徴とする辞書更新方法。
JP2013078588A 2013-04-04 2013-04-04 パターン認識装置、パターン認識方法 Expired - Fee Related JP5503047B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013078588A JP5503047B2 (ja) 2013-04-04 2013-04-04 パターン認識装置、パターン認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013078588A JP5503047B2 (ja) 2013-04-04 2013-04-04 パターン認識装置、パターン認識方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011042064A Division JP5318131B2 (ja) 2011-02-28 2011-02-28 パターン認識装置、パターン認識方法

Publications (2)

Publication Number Publication Date
JP2013131258A true JP2013131258A (ja) 2013-07-04
JP5503047B2 JP5503047B2 (ja) 2014-05-28

Family

ID=48908688

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013078588A Expired - Fee Related JP5503047B2 (ja) 2013-04-04 2013-04-04 パターン認識装置、パターン認識方法

Country Status (1)

Country Link
JP (1) JP5503047B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123173A (ja) * 1998-10-14 2000-04-28 Ntt Data Corp 画像特徴抽出方法及び類似画像検索システム、記録媒体
JP2002251592A (ja) * 2001-02-22 2002-09-06 Toshiba Corp パターン認識辞書学習方法
JP2010182013A (ja) * 2009-02-04 2010-08-19 Toshiba Corp 線形変換行列算出装置、その方法、及び、そのプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000123173A (ja) * 1998-10-14 2000-04-28 Ntt Data Corp 画像特徴抽出方法及び類似画像検索システム、記録媒体
JP2002251592A (ja) * 2001-02-22 2002-09-06 Toshiba Corp パターン認識辞書学習方法
JP2010182013A (ja) * 2009-02-04 2010-08-19 Toshiba Corp 線形変換行列算出装置、その方法、及び、そのプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200100255006; 山口 修 福井 和広: '経時変化を抑制する顔辞書更新法' 電子情報通信学会技術研究報告 Vol.99 No.118 Vol.99  No.118, 19990617, P.43-50, 社団法人電子情報通信学会 *
JPN6013058905; 山口 修 福井 和広: '経時変化を抑制する顔辞書更新法' 電子情報通信学会技術研究報告 Vol.99 No.118 Vol.99  No.118, 19990617, P.43-50, 社団法人電子情報通信学会 *

Also Published As

Publication number Publication date
JP5503047B2 (ja) 2014-05-28

Similar Documents

Publication Publication Date Title
CN110287312B (zh) 文本相似度的计算方法、装置、计算机设备及计算机存储介质
EP3806089A1 (en) Mixed speech recognition method and apparatus, and computer readable storage medium
WO2020003533A1 (en) Pattern recognition apparatus, pattern recognition method, and computer-readable recording medium
CN111626340B (zh) 一种分类方法、装置、终端及计算机存储介质
CN110941961B (zh) 一种信息聚类方法、装置、电子设备及存储介质
JP6172317B2 (ja) 混合モデル選択の方法及び装置
WO2020168843A1 (zh) 一种基于扰动样本的模型训练方法和装置
WO2014073206A1 (ja) 情報処理装置、及び、情報処理方法
CN111207926A (zh) 一种基于滚动轴承故障诊断方法、电子装置及存储介质
JP7163618B2 (ja) 学習装置、学習方法、プログラム及び推定装置
CN110910325B (zh) 一种基于人工蝴蝶优化算法的医疗影像处理方法及装置
US11520837B2 (en) Clustering device, method and program
US20140257810A1 (en) Pattern classifier device, pattern classifying method, computer program product, learning device, and learning method
JP5318131B2 (ja) パターン認識装置、パターン認識方法
CN113516185A (zh) 模型训练的方法、装置、电子设备及存储介质
US11544563B2 (en) Data processing method and data processing device
WO2018024259A1 (zh) 训练声纹识别系统的方法和装置
JP4928193B2 (ja) 顔画像認識装置及び顔画像認識プログラム
JP6586026B2 (ja) 単語ベクトル学習装置、自然言語処理装置、方法、及びプログラム
JP5503047B2 (ja) パターン認識装置、パターン認識方法
KR20150042674A (ko) 환경 변화에 강인한 멀티모달 사용자 인식
CN114970732A (zh) 分类模型的后验校准方法、装置、计算机设备及介质
CN115455142A (zh) 文本检索方法、计算机设备和存储介质
JP2018160165A (ja) 画像処理装置、画像処理方法及びプログラム
CN113420699A (zh) 一种人脸匹配方法、装置及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130404

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131203

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140313

R150 Certificate of patent or registration of utility model

Ref document number: 5503047

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees