JP5175754B2 - 線形変換行列算出装置、その方法、及び、そのプログラム - Google Patents

線形変換行列算出装置、その方法、及び、そのプログラム Download PDF

Info

Publication number
JP5175754B2
JP5175754B2 JP2009023805A JP2009023805A JP5175754B2 JP 5175754 B2 JP5175754 B2 JP 5175754B2 JP 2009023805 A JP2009023805 A JP 2009023805A JP 2009023805 A JP2009023805 A JP 2009023805A JP 5175754 B2 JP5175754 B2 JP 5175754B2
Authority
JP
Japan
Prior art keywords
linear transformation
subspace
transformation matrix
dictionary
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009023805A
Other languages
English (en)
Other versions
JP2010182013A (ja
Inventor
進 窪田
智一 河原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2009023805A priority Critical patent/JP5175754B2/ja
Priority to US12/558,817 priority patent/US8121411B2/en
Publication of JP2010182013A publication Critical patent/JP2010182013A/ja
Application granted granted Critical
Publication of JP5175754B2 publication Critical patent/JP5175754B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像や音声などのパターン認識の技術に関する。
コンピュータの処理能力の向上や安価なカメラの普及により、顔認識等のパターン認識に関して、動画から取り出した複数枚の画像を入力し、この入力画像のパターン分布と辞書画像のパターン分布を求め、その分布同士の近さを比べて認識を行う方法が実用段階に入ってきた。
上記の分布間の類似度を測る方法の1つとして、特許文献1では相互部分空間法が提案されている。この相互部分空間法は、入力パターンと辞書パターンをそれぞれ部分空間で近似し、部分空間同士の類似度を、正準角によって測ることにより、入力パターンの属するカテゴリの認識を行う。
従来の部分空間法は、一つの入力パターンベクトルと着目カテゴリを表す部分空間との間で類似度を測るものである。これに対して、上記の相互部分空間法は、動画像のように認識対象から複数の画像が入力する場合に、入力画像列も部分空間に変換して、部分空間同士の類似度を測る。この際に、比較する2つの部分空間のなす正準角と呼ばれる角度の余弦の2乗が「類似度」として用いられる。
2つの部分空間Sm,Snの基底をそれぞれΦ(m)=(φ (m),・・・,φ (m)),Φ(n)=(φ (n),・・・,φ (n))とおき、仮にK≦Lとする。正準角は2つの部分空間の小さい方の次元数だけ定義され(この場合はK個である)、小さいものから順に{θ (nm),・・・,θ (nm)}とおくと、cosθ (nm)は以下の式(1)で示す固有値問題のi番目の固有値が与えられる。
Figure 0005175754
そして、この固有値問題はラグランジュの未定乗数法を用いて以下のように導出することができる。
部分空間Sn上の任意の単位ベクトルはL次元単位ベクトルa(aa=1)を用いてφ(n) の線形結合によりΦ(n)aで表される。これを部分空間Smへ射影した時の射影長の2乗はaΦ(n)TΦ(m)Φ(m)TΦ(n)aとなる。これをaa=1という制約の下で最大化するため、未定乗数λを用いた以下の式(2)をaとλについて微分して0とおけば、aについて微分から式(1)の固有値問題が得られる。
Figure 0005175754
式(2)において第1正準角は、一方の部分空間上の単位ベクトルのうち、他方の部分空間への射影長が最大となるものを選び、そのベクトルとそれを他方の部分空間へ射影したベクトルとのなす角のことであり、2つの部分空間が最も近くなる角といえる。
相互部分空間法で用いられる正準角とは2つの部分空間のなす角であり、その意味するところは幾何学的には明確である。しかし、それをパターン間の類似度として用いる場合、正準角が小さいことが必ずしもパターンとして似ているということにはつながらない。その理由は、何を似ているとするかは問題依存であり、問題毎にそれに適した類似度尺度が学習されるべきだからである。
このような問題意識の下、特許文献2では直交相互部分空間法が提案されている。この直交相互部分空間法は、異なるカテゴリに属する部分空間の間の正準角を大きくするような線形変換行列を、固有値問題を解くことにより求めるものである。
すなわち、直交相互部分空間法は、全ての辞書部分空間の基底ベクトルφ の自己相関行列SをS=ΣΣiφ φ mt/(ΣΣ )として求め、Sの固有ベクトルを並べた行列をV、Sの固有値を対角成分にもつ対角行列をΛとしたとき、以下の式(3)で与えられる行列Oで部分空間を線形変換し類似度を求める。
Figure 0005175754
特開2003−248826号公報 特願2005−035300号公報
しかし、直交相互部分空間法は異なるカテゴリに属する部分空間の間の正準角を大きくする一方で、必ずしも同じカテゴリに属する部分空間の間の正準角を小さくするとは限らない。
発明者が行った実験では、直交相互部分空間法は、線形変換を行わない相互部分空間法と比較したとき、異なるカテゴリに属する部分空間の間の正準角だけでなく、同じカテゴリに属する部分空間の間の正準角も大きくしてしまうことが確認された。但し、正準角が大きくなる度合いが異なるカテゴリに属する部分空間の間の正準角の方が顕著なため、相互部分空間法よりも高い性能が得られる。そのため、直交相互部分空間法は、相互部分空間法に対して一定の優位性を実用上持っている。
上記のような実験結果が出る理由は、次の通りである。直交相互部分空間法は式(3)で与えられる線形変換行列を用いると、異なるカテゴリ間の正準角が大きくなるという発見に基づく方法であり、正準角自体を直接最適化の対象として操作できる方法ではなかったからである。
一方、パターン認識の精度を向上させるためには、異なるカテゴリに属する部分空間の間の正準角を平均的に大きくするよりは、カテゴリは異なるのに正準角が小さくなる部分空間の組み合わせに対して選択的にその正準角を大きくする方が、間違えやすいパターンが間違えにくくなるため、効果的である。
また、同様に、同一カテゴリに属する部分空間の間の正準角についても、それを平均的に小さくするよりは、正準角が大きい部分空間の組み合わせに対して選択的にその正準角を小さくすることが望ましい。
ところで、入力となる部分空間の組み合わせに対して望ましい出力の値を教師信号として与え、教師信号と出力のずれを最小化するようにパラメータを最適化するという枠組みは機械学習の問題において一般的に用いられているものである。
しかし、相互部分空間法を用いる方法においては、この最適化の枠組みを適用して学習を行うことが困難であった。これは、部分空間を線形変換し正準角を求める際に、線形変換された部分空間の基底をGram−Schmidtの直交化により正規直交系に直す必要があり、この操作が入るために正準角の線形変換に関する微分を一般的な形で求めることができないためである。
そこで本発明は、上記問題点に鑑みて、異なるカテゴリに属する部分空間の間の類似度を大きくする一方で、同じカテゴリに属する部分空間の間の類似度は小さくするような線形変換行列が得られる線形変換行列算出装置、その方法、及び、そのプログラムを提供する。
本発明は、入力パターンを入力部分空間に変換し、予め規定された各カテゴリに属する複数の辞書部分空間との類似度を計算し、前記入力パターンを相互部分空間法により前記各カテゴリに分類するパターン認識装置において、前記相互部分空間法により前記類似度を計算する際の前処理として前記入力部分空間と前記辞書部分空間を線形変換するために用いる線形変換行列を求める線形変換行列算出装置であって、前記各カテゴリに属する複数の前記辞書部分空間を、前記線形変換行列でそれぞれ線形変換する線形変換部と、前記線形変換した複数の前記辞書部分空間から2つの前記辞書部分空間の組合せを複数組選択し、選択された各組の前記辞書部分空間の間のそれぞれの類似度を用いて、損失関数を計算する損失関数計算部と、前記損失関数を前記線形変換行列で微分したときの微分パラメータを計算する微分計算部と、前記微分パラメータと前記線形変換行列とによって、新たな線形変換行列を最急降下法で計算し、新たな前記線形変換行列を、前記線形変換部で用いられる前記線形変換行列として更新する更新部と、を有し、前記微分計算部は、前記線形変換行列Tによる前記線形変換後の空間における計量行列をM =TT とおき、前記損失関数を前記線形変換行列T=単位行列Iの周りで微分し、前記微分パラメータを求める、ことを特徴とする線形変換行列算出装置である。
本発明によれば、異なるカテゴリに属する辞書部分空間の間の類似度を大きくする一方で、同じカテゴリに属する辞書部分空間の間の類似度は小さくするような線形変換行列が得られる。
類似度の分布を示すグラフであり、実線が異なるカテゴリに属する部分空間の間の類似度を表し、点線が同一カテゴリに属する部分空間の間の類似度を表す。 実施の形態1の線形変換行列算出装置のブロック図である。 線形変換行列算出装置のフローチャートである。 実施の形態2のパターン認識装置のブロック図である パターン認識装置のフローチャートである。
まず、本発明の具体的な実施の形態を説明する前に、本実施の形態の理論について説明する。
相互部分空間法は正準角の余弦の2乗を類似度として用いる。しかし、上記したように、角度が小さければ似ているかというと必ずしもそうではない。その理由は、何を似ているとするかは問題依存であり、類似度等の距離尺度は問題毎に学習されるべきものである。
そこで,計量行列Mを用いてベクトルx,yの内積をyMxと定義し、この計量空間における正準角が、同一カテゴリに属する部分空間の間では小さく、異なるカテゴリに属する部分空間の間では大きくなるよう、計量行列Mを学習により求める問題を考える。
M=TTと分解すれば、計量行列Mで表される計量空間における内積は、ベクトルを以下の式(4)のように線形変換した上で通常の内積を求めることと等しい。
Figure 0005175754
以下ではこの線形変換行列Tを学習により求める方法について説明する。
まず、学習用にN個の部分空間P、(但し、i=1,・・・,Nである)が与えられるものとし、それぞれの部分空間の基底をΦ(i)とおく。また、各部分空間には、属するカテゴリのIDciが教師データが付与されているものとする。
部分空間P,Pを線形変換行列Tで線形変換し、線形変換後の2つの部分空間の間のk番目の正準角の余弦の2乗をγ (ij)(T)とおく。但し、以下では簡略化のため、第1正準角のみを類似度として用いることにし、必要ない場合は添え字のkを省略することとする。
=cのときは類似度γ(ij)(T)が大きくなり、それ以外のときは小さくなるような線形変換行列Tを求めればよいので、これは以下の式(5)のyijをクラスラベルとして用いれば部分空間の組み合わせに関する2クラスの認識問題として以下の式(5)のように定式化できる。
Figure 0005175754
線形変換行列Tが与えられたとき、yij=1となるi,jの全ての組み合わせと、yij=−1となるi,jの全ての組み合わせについて、それぞれ線形変換後の空間における類似度γ(ij)(T)を求めると、図1のような分布が得られる。図1は、類似度の分布を示すグラフであり、実線が異なるカテゴリに属する部分空間の間の類似度を表し、点線が同一カテゴリに属する部分空間の間の類似度を表し、縦軸が出現頻度、横軸が類似度である。
ここで、本実施の形態の目的は、同一カテゴリに属する部分空間の間の類似度を大きくし、異なるカテゴリに属する部分空間の間の類似度を小さくするような線形変換行列Tを求めることであるため、図1の2つの分布が、線形変換を施すことによりきれいに分離されることが望ましい。
そこで、yij,γ(ij)(T)に対する損失値をl(yij,γ(ij)(T))、全て又は一定の基準で選択されたi,jの組についての損失値lの和を線形変換行列Tに関する損失関数L(T)とおく。すなわち、損失値lを合計して損失関数L(T)を計算する。そして、損失関数Lを最小化するような線形変換行列Tを求めることにする。ここで損失関数Lとは、同一のカテゴリに属する部分空間の間の類似度の分布と、異なるカテゴリに属する部分空間の間の類似度の分布の分離度を表し、分離が悪ければ損失が増大する。
ここで損失値lとしては、例えば教師信号をyij=1のときは1、yij=−1のときは0として、以下の式(6)のような教師信号と類似度の差の2乗を損失lとして用いることができる。
Figure 0005175754
また他の例としては、類似度γ(ij)(T)に対するクラスレベルyijの事後確率をp(y=yij|γ(ij)(T))として以下のような式(7)を損失値lとして用いることもできる。
Figure 0005175754
但し、事後確率p(y=yij|γ(ij)(T))はγ(ij)(T)の経験分布をもとにロジスティック回帰により以下の式(8)で近似する。
Figure 0005175754
但し、α、βは、ロジスティック回帰により求められるパラメータである。
損失関数L(T)を線形変換行列Tで微分できれば、線形変換行列Tの最急降下方向−∂L(T)/∂Tを求め、一定の微少な刻み幅で線形変換行列Tを更新すれば逐次的に線形変換行列Tを最適化することができる。
損失関数Lは類似度γ(ij)(T)の関数であり、γ(ij)(T)は線形変換行列Tの関数であるので、まずは類似度γ(ij)(T)の線形変換行列Tに関する微分パラメータを求める必要がある。
しかし、類似度γ(ij)(T)を求めるには、部分空間の基底Φ(i),Φ(j)を線形変換行列Tで線形変換し、線形変換後の基底を正規直交基底に直した上で式(1)と同様の固有値問題を解く必要がある。ところが、解く途中に正規直交基底への変換が入るため、一般的な形で線形変換行列Tに関する微分パラメータを計算することは困難である。しかしながら、線形変換行列Tが単位行列Iの場合に限り、微分パラメータを計算することが可能であり、このことに基づいて繰り返し演算で逐次的に線形変換行列Tの最適化を行うことが出来る。
最急降下法によって繰り返し演算して逐次的に線形変換行列Tを更新する際に、更新回数がt+1回目の線形変換行列Tt+1を、更新回数t回目の線形変換行列Tとt回目の更新行列Aを用いてTt+1=Tのように表すことにする。すると、更新行列Aを求めるには、t回目の線形変換行列Tで線形変換された後の空間で微分パラメータを求めればよい。但し、t>1である。
線形変換行列Tで線形変換を行う場合、線形変換前の空間における計量行列MはTTであるが、変換後の空間における計量行列MはIIなので、更新行列Aを求めるにはIの周りで微分ができればよく、これは任意の線形変換行列Tの周りでの微分を行うよりは簡単に求めることができる。
以下順を追って詳しく説明する。
K次元の部分空間SとL次元の部分空間Sの間の正準角θを求め、i番目の正準角をθ、正準角をなす2つの単位ベクトルをa,bとおく。仮にK<Lとすると、θ,a,bの組はK組得られる。
ここで、a,bについて以下の式(9)が成り立つ。
Figure 0005175754
計量行列M=TTで定義される計量空間において、ベクトルaとベクトルbのなす角の余弦の2乗をεij(T)とおくと、εij(T)は以下の式(10)で与えられる。
Figure 0005175754
式(10)をT=Iの周りで微分し、式(9)を適用すると、以下のような式(11)が得られる。
Figure 0005175754
式(11)から、計量空間を規定する線形変換行列Tを単位行列Iから微少に変化させたとき、異なる正準角を構成するベクトルのなす角の余弦の2乗は0のまま変化しない。そのため、i番目の正準角の余弦の2乗の線形変換行列Tに関する(Iにおける)微分は、i番目の正準角をなす2つのベクトルのなす角の余弦の2乗の微分と等しいことがわかる。したがって、正準角の余弦の2乗(=類似度)は正準角をなすベクトルの組を用いて以下の式(12)で与えられる。
Figure 0005175754
式(12)により類似度γ(ij)の線形変換行列Tに関する微分パラメータが得られるので、損失関数L(T)の最急降下方向は以下の式(13)で与えられる。
Figure 0005175754
以上をまとめると、線形変換行列Tの最適化方法は以下のようになる。
第1に、線形変換行列Tの初期値をT=Iとする。
第2に、部分空間の基底を線形変換行列Tで線形変換し、この線形変換後の基底を正規直交系に直す。
第3に、損失関数L(T)を求める。
第4に、線形変換後の空間における計量行列をM=TTとおき、損失関数L(T)をT=Iの周りで微分し、微分パラメータの行列をGとおく。すなわち、式(13)の結果をGとおく。
第5に、一定の微少な刻み幅δを用いて、線形変換行列TをTt+1=T(I+δ)と更新する。
第6に、収束条件を満たすまで第2〜第5の手順を繰り返して更新を続ける。但し、tは更新回数であり、t>1である。
この手順により、異なるカテゴリに属する部分空間の間の正準角を大きくする一方で同じカテゴリに属する部分空間の間の正準角は小さくするような線形変換行列Tを求めることができる。
以下に本発明の一実施の形態を図面に従い説明する。
本発明の実施の形態1の線形変換行列算出装置(以下、単に「行列算出装置」という)200について図2〜図3に基づいて説明する。
本実施の形態の行列算出装置200の構成について図2に基づいて説明する。図2は、本実施の形態の行列算出装置200のブロック図である。
行列算出装置200は、辞書格納部201、初期化部202、線形変換部203、選択部204、損失関数計算部205、微分計算部206、更新部207を有する。
なお、この行列算出装置200は、例えば、汎用のコンピュータを基本ハードウェアとして用いることでも実現することが可能である。すなわち、初期化部202、線形変換部203、選択部204、損失関数計算部205、微分計算部206、更新部207は、上記のコンピュータに搭載されたプロセッサにプログラムを実行させることにより実現することができる。このとき、行列算出装置200は、上記のプログラムをコンピュータ装置に予めインストールすることで実現してもよいし、CD−ROMなどの記憶媒体に記憶して、又はネットワークを介して上記のプログラムを配布して、このプログラムをコンピュータに適宜インストールすることで実現してもよい。
辞書格納部201は、各カテゴリ当たり複数個の辞書部分空間と、それら辞書部分空間に線形変換を施した部分空間の正規直交基底を格納する。なお、この辞書部分空間が、上記で説明した実施の形態の理論における部分空間に対応する。なお、この辞書格納部201を設けず、各カテゴリ当たり複数個の辞書部分空間と、それら辞書部分空間に線形変換を施した部分空間の正規直交基底を外部から取得してもよい。
ここで、「カテゴリ」とは、パターン認識を行うときに、同じパターンが属する範囲をいい、例えば、人物、人物の顔、全身、性別又は年代、物、色、模様などが一つのカテゴリとなる。
初期化部202は、線形変換行列Tの初期値を与える。初期値としては単位行列Iを用いてもよいし、直交相互部分空間法により求められる線形変換行列Tを用いてもよい。なお、この初期化部202を設けず、下記で説明する線形変換部203で初期値を与えても良い。
線形変換部203は、線形変換行列Tを保持し、全ての辞書部分空間について、線形変換を施し、線形変換後の部分空間の正規直交基底を求め、辞書格納部201に格納する。
選択部204は、入力された1つの辞書部分空間に対して、残りの辞書部分空間から複数個の辞書部分空間を選択する。
第1の選択方法としては、選択部204が、全ての辞書部分空間について2つの辞書部分空間の組を選択する。しかし、例えば辞書部分空間が全部で1万個あるとすると、1つの辞書部分空間毎に残りの9999個の辞書部分空間の損失とその微分を計算することになり、計算量が非常に大きくなる。また、異なるカテゴリに属する辞書部分空間の間の正準角はもともと大きい場合が多いので、実用上は全ての組合せについて最適化の計算を行う必要はない。
そこで、第2の選択方法としては、次のように選択部204が2つの辞書部分空間の組を選択する。すなわち、入力辞書部分空間との類似度γを計算し、類似度γの小さい順番に1つ又は予め定められた数の辞書部分空間を選択する。また、入力辞書部分空間と異なるカテゴリに属する辞書部分空間については、入力辞書部分空間との類似度を計算し、類似度γの大きい順に1つ又は予め定められた数の辞書部分空間を選択する。ここで、類似度γの計算は式(2)の固有値問題を解いて得られる第1固有値、又は、第1固有値から第h固有値までの和を用いる。
損失関数計算部205は、線形変換行列Tが入力され、辞書部分空間のそれぞれについて、選択部204により選択された辞書部分空間との損失値lを式(6)又は式(7)に基づいて計算し、その全ての和である損失関数Lを求める。その際、損失値lの計算には線形変換部203により線形変換を施した辞書部分空間の類似度γを用いる。
微分計算部206は、全ての辞書部分空間のそれぞれについて、選択部204により選択された辞書部分空間との間の損失関数Lの微分パラメータを式(13)に基づいて計算する。その際、微分パラメータの計算には線形変換部203により線形変換を施した辞書部分空間の類似度γを用いる。求められた式(13)の結果を、微分パラメータの行列Gとおく。なお、この微分計算部206で用いる2つの辞書部分空間は、損失関数計算部205で用いる2つの辞書部分空間と同一であってもよく、また、異なった辞書部分空間を用いてもよい。
更新部207は、更新回数tが規定の回数に達するか、又は、所定の更新回数の間の損失関数Lの減少幅が閾値以下のときなどの一定の収束条件を満たすまで、微分計算部206により求められた微分パラメータの行列Gと微少な一定の更新幅δを用いて線形変換行列Tから、新たな線形変換行列であるT(I+δG)を計算する。そして、この新たな線形変換行列T(I+δG)を用いて線形変換部203が、辞書部分空間を線形変換するように更新する。
行列算出装置200の動作について図3に基づいて説明する。図3は、行列算出装置200のフローチャートを示す。
ステップ301では、初期化部202が、線形変換行列Tの初期値を生成する。
ステップ302では、線形変換部203が、線形変換行列Tを用いて辞書格納部201に格納されている全ての辞書部分空間に対して線形変換を施す。線形変換部203は、線形変換後の部分空間の基底を正規直交系に変換して、辞書格納部201に格納する。
ステップ303では、選択部204が、辞書格納部201に格納されている全ての線形変換後の辞書部分空間について、2つの辞書部分空間の組み合わせを選択する。損失関数計算部205は、選択された全ての辞書部分空間の組み合わせの類似度γについて損失関数Lを求める。
ステップ304では、選択部204が、辞書格納部201に格納されている全ての線形変換後の辞書部分空間について、2つの辞書部分空間の組み合わせを選択する。微分計算部206は、選択された全ての辞書部分空間の組み合わせの類似度γについて、微分パラメータの行列Gを求める。
ステップ305では、更新部207が、ステップ303で算出された損失関数Lと更新回数tから収束の判定を行い(noの場合)、収束していなければ線形変換ステップ302以降を繰り返し、収束したと判定されれば終了する(yesの場合)。
本実施の形態によれば、異なるカテゴリに属する辞書部分空間の間の正準角を大きくする。一方、同じカテゴリに属する辞書部分空間の間の正準角は小さくするような線形変換行列Tを求めることができる。
本発明の実施の形態2のパターン認識装置400について図4〜図5に基づいて説明する。
本実施の形態のパターン認識装置400は、実施の形態1で示された行列算出装置200で算出された線形変換行列Tを用いてパターン認識を行うものである。
パターン認識装置400の構成について図4に基づいて説明する。図4は、パターン認識装置400のブロック図である。
パターン認識装置400は、パターン取得部401、入力部分空間生成部402、辞書格納部403、行列算出部404、行列格納部405、線形変換部406、類似度計算部407、判定部408を有する。
パターン取得部401は、カメラなどにより認識対象のパターンを予め規定された回数取得する。
入力部分空間生成部402は、パターン取得部401で取得された複数の入力パターンに対して主成分分析を行うことにより入力部分空間を求める。
辞書格納部403は、予め登録されたカテゴリ毎に1つ又は複数の辞書部分空間を格納する。なお、実施の形態1の辞書格納部201に対応する。
行列算出部404は、実施の形態1で示された行列算出装置200を有し、この行列算出装置200により辞書格納部403に格納された辞書部分空間について線形変換行列Tを算出する。線形変換行列Tの算出は毎回行う必要はなく、登録カテゴリ数や辞書部分空間数に変化があった場合にのみ算出を行えばよい。
行列格納部405は、行列算出部404で算出された線形変換行列Tを格納する。
線形変換部406は、行列格納部405に格納されている線形変換行列Tを用いて入力部分空間と辞書部分空間をそれぞれを線形変換する。具体的には、部分空間に基底ベクトルを線形変換行列により変換し、変換後の基底ベクトルをGram−Schmidtの直交化により正規直交基底に変換する。
類似度計算部407は、線形変換された辞書部分空間と、同じく線形変換された入力部分空間との間の類似度を、相互部分空間法により算出する。具体的には、線形変換後の辞書部分空間の正規直交基底をΦ(n) 、線形変換後の入力部分空間の正規直交基底をΦ(m)とおくと、式(2)の固有値問題の第1固有値、又は第1固有値から第h固有値までの和を2つの部分空間の間の類似度とする。但し、h>1である。
判定部408は、類似度計算部407で算出された類似度の値が最も大きく、かつ、その値が予め設定された閾値よりも大きい場合、その類似度が算出された辞書部分空間に対応するカテゴリを認識結果として出力する。それ以外の場合は登録されたカテゴリのどれとも一致しないという判定結果を出力する。
パターン認識装置400の動作について図5に基づいて説明する。図5は、パターン認識装置400のフローチャートである。
ステップ501では、パターン取得部401が、画像や音声などの認識対象のパターンを予め規定された回数取得する。
ステップ502では、入力部分空間生成部402が、複数の入力パターンに対して主成分分析を行うことにより入力部分空間を求める。
ステップ503、504では、行列算出部404が、実施の形態1で示された行列算出装置200により線形変換行列Tを算出する。行列格納部405は、算出された線形変換行列Tを格納する。
ステップ505では、線形変換部406が、行列格納部405に格納されている線形変換行列Tにより入力部分空間と辞書部分空間をそれぞれ線形変換する。
ステップ506では、類似度計算部407が、線形変換された辞書部分空間と、同じく線形変換された入力部分空間との間の類似度を、相互部分空間法により算出する。
ステップ507では、判定部408は類似度計算部407で算出された類似度の値が最も大きく、かつ、その値が予め設定された閾値よりも大きい場合、その類似度が算出された辞書部分空間に対応するカテゴリを認識結果として出力する。それ以外の場合は登録されたカテゴリのどれとも一致しないという判定結果を出力する。
本実施の形態によれば、実施の形態1で示された行列算出装置200により得られた線形変換行列Tを用いて入力部分空間と辞書部分空間をそれぞれ線形変換して、パターン認識を行うことにより、高精度なパターン認識を行うことができる。
なお、本発明は上記各実施形態に限らず、その主旨を逸脱しない限り種々に変更することができる。
200 線形変換行列算出装置
201 辞書格納部
202 初期化部
203 線形変換部
204 選択部
205 損失関数計算部
206 微分計算部
207 更新部

Claims (10)

  1. 入力パターンから入力部分空間を求め、前記入力部分空間と予め規定された各カテゴリに属する複数の辞書部分空間との類似度を相互部分空間法により計算し、前記類似度により前記入力パターンを前記各カテゴリに分類するパターン認識装置において、前記相互部分空間法により前記類似度を計算する際の前処理として前記入力部分空間と前記辞書部分空間を線形変換するために用いる線形変換行列を求める線形変換行列算出装置であって、
    前記各カテゴリに属する複数の前記辞書部分空間を、前記線形変換行列でそれぞれ線形変換する線形変換部と、
    前記線形変換した複数の前記辞書部分空間の各々の間の類似度を用いて、損失関数を計算する損失関数計算部と、
    前記損失関数を前記線形変換行列で微分したときの微分パラメータを計算する微分計算部と、
    前記微分パラメータと前記線形変換行列とによって、新たな線形変換行列を最急降下法で計算し、新たな前記線形変換行列を、前記線形変換部で用いられる前記線形変換行列として更新する更新部と、
    を有し、
    前記微分計算部は、
    前記線形変換行列Tによる前記線形変換後の空間における計量行列をM =TT とおき、前記損失関数を前記線形変換行列T=単位行列Iの周りで微分し、前記微分パラメータを求める、
    ことを特徴とする線形変換行列算出装置。
  2. 前記損失関数計算部は、
    前記各組の2つの前記辞書部分空間の間の前記類似度を用いて損失値をそれぞれ計算し、
    前記複数組の前記辞書部分空間の前記損失値を全て合計して前記損失関数を計算する、
    ことを特徴とする請求項1記載の線形変換行列算出装置。
  3. 前記更新部は、前記更新回数が規定の回数に達するか、又は、所定の前記更新回数の間の前記損失関数の減少幅が閾値以下のときに前記更新を終了する、
    ことを特徴とする請求項1記載の線形変換行列算出装置。
  4. 前記損失関数計算部で用いる2つの前記辞書部分空間と、前記微分計算部で用いる2つの前記辞書部分空間とが同一である、
    ことを特徴とする請求項1記載の線形変換行列算出装置。
  5. 前記線形変換部は、前記線形変換行列の初期値として、単位行列、又は、直交相互部分空間法により求められる線形変換行列を用いる、
    ことを特徴とする請求項1記載の線形変換行列算出装置。
  6. 相互部分空間法により入力パターンを予め規定された各カテゴリに分類するパターン認識装置であって、
    前記入力パターンから入力部分空間を算出する入力部分空間算出部と、
    前記各カテゴリに属する辞書部分空間を算出する辞書部分空間算出部と、
    前記入力部分空間と前記辞書部分空間のそれぞれを、請求項1記載の線形変換行列算出装置により算出される線形変換行列を用いて線形変換する線形変換部と、
    前記線形変換された前記入力部分空間と、前記線形変換された前記辞書部分空間との類似度を算出する類似度算出部と、
    前記類似度を用いて、前記入力部分空間に対応する前記入力パターンがどのカテゴリに属するかを判定する判定部と、
    を有することを特徴とするパターン認識装置。
  7. 入力パターンを入力部分空間に変換し、予め規定された各カテゴリに属する複数の辞書部分空間との類似度を計算し、前記入力パターンを相互部分空間法により前記各カテゴリに分類するパターン認識方法において、前記相互部分空間法により前記類似度を計算する際の前処理として前記入力部分空間と前記辞書部分空間を線形変換するために用いる線形変換行列を求める線形変換行列算出方法であって、
    線形変換部が、前記各カテゴリに属する複数の前記辞書部分空間を、前記線形変換行列でそれぞれ線形変換する線形変換ステップと、
    損失関数計算部が、前記線形変換した複数の前記辞書部分空間から2つの前記辞書部分空間の組合せを複数組選択し、選択された各組の前記辞書部分空間の間のそれぞれの類似度を用いて、損失関数を計算する損失関数計算ステップと、
    微分計算部が、前記損失関数を前記線形変換行列で微分したときの微分パラメータを計算する微分計算ステップと、
    更新部が、前記微分パラメータと前記線形変換行列とによって、新たな線形変換行列を最急降下法で計算し、新たな前記線形変換行列を、前記線形変換ステップで用いられる前記線形変換行列として更新する更新ステップと、
    を有し、
    前記微分計算ステップは、
    前記線形変換行列Tによる前記線形変換後の空間における計量行列をM =TT とおき、前記損失関数を前記線形変換行列T=単位行列Iの周りで微分し、前記微分パラメータを求める、
    ことを特徴とする線形変換行列算出方法。
  8. 相互部分空間法により入力パターンを予め規定された各カテゴリに分類するパターン認識方法であって、
    前記入力パターンから入力部分空間を算出する入力部分空間算出ステップと、
    前記各カテゴリに属する辞書部分空間を算出する辞書部分空間算出ステップと、
    前記入力部分空間と前記辞書部分空間のそれぞれを、請求項記載の線形変換行列算出方法により算出される線形変換行列を用いて線形変換する線形変換ステップと、
    前記線形変換された前記入力部分空間と、前記線形変換された前記辞書部分空間との類似度を算出する類似度算出ステップと、
    前記類似度を用いて、前記入力部分空間に対応する前記入力パターンがどのカテゴリに属するかを判定する判定ステップと、
    を有することを特徴とするパターン認識方法。
  9. 入力パターンを入力部分空間に変換し、予め規定された各カテゴリに属する複数の辞書部分空間との類似度を計算し、前記入力パターンを相互部分空間法により前記各カテゴリに分類するパターン認識プログラムにおいて、前記相互部分空間法により前記類似度を計算する際の前処理として前記入力部分空間と前記辞書部分空間を線形変換するために用いる線形変換行列を求める線形変換行列算出プログラムであって、
    コンピュータに、
    前記各カテゴリに属する複数の前記辞書部分空間を、前記線形変換行列でそれぞれ線形変換する線形変換機能と、
    前記線形変換した複数の前記辞書部分空間から2つの前記辞書部分空間の組合せを複数組選択し、選択された各組の前記辞書部分空間の間のそれぞれの類似度を用いて、損失関数を計算する損失関数計算機能と、
    前記損失関数を前記線形変換行列で微分したときの微分パラメータを計算する微分計算機能と、
    前記微分パラメータと前記線形変換行列とによって、新たな線形変換行列を最急降下法で計算し、新たな前記線形変換行列を、前記線形変換機能で用いられる前記線形変換行列として更新する更新機能と、
    を実現させ
    前記微分計算機能は、
    前記線形変換行列Tによる前記線形変換後の空間における計量行列をM =TT とおき、前記損失関数を前記線形変換行列T=単位行列Iの周りで微分し、前記微分パラメータを求める、
    線形変換行列算出プログラム。
  10. 相互部分空間法により入力パターンを予め規定された各カテゴリに分類するパターン認識プログラムであって、
    コンピュータに、
    前記入力パターンから入力部分空間を算出する入力部分空間算出機能と、
    前記各カテゴリに属する辞書部分空間を算出する辞書部分空間算出機能と、
    前記入力部分空間と前記辞書部分空間のそれぞれを、請求項記載の線形変換行列算出プログラムにより算出される線形変換行列を用いて線形変換する線形変換機能と、
    前記線形変換された前記入力部分空間と、前記線形変換された前記辞書部分空間との類似度を算出する類似度算出機能と、
    前記類似度を用いて、前記入力部分空間に対応する前記入力パターンがどのカテゴリに属するかを判定する判定機能と、
    を実現させるためのパターン認識プログラム。
JP2009023805A 2009-02-04 2009-02-04 線形変換行列算出装置、その方法、及び、そのプログラム Expired - Fee Related JP5175754B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009023805A JP5175754B2 (ja) 2009-02-04 2009-02-04 線形変換行列算出装置、その方法、及び、そのプログラム
US12/558,817 US8121411B2 (en) 2009-02-04 2009-09-14 Linear transformation matrix calculating apparatus, method thereof and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009023805A JP5175754B2 (ja) 2009-02-04 2009-02-04 線形変換行列算出装置、その方法、及び、そのプログラム

Publications (2)

Publication Number Publication Date
JP2010182013A JP2010182013A (ja) 2010-08-19
JP5175754B2 true JP5175754B2 (ja) 2013-04-03

Family

ID=42397771

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009023805A Expired - Fee Related JP5175754B2 (ja) 2009-02-04 2009-02-04 線形変換行列算出装置、その方法、及び、そのプログラム

Country Status (2)

Country Link
US (1) US8121411B2 (ja)
JP (1) JP5175754B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014123184A (ja) * 2012-12-20 2014-07-03 Toshiba Corp 認識装置、方法及びプログラム
JP5503047B2 (ja) * 2013-04-04 2014-05-28 株式会社東芝 パターン認識装置、パターン認識方法
JP6248647B2 (ja) 2014-01-22 2017-12-20 富士通株式会社 画像照合方法、画像処理システム、及びプログラム
US10963063B2 (en) * 2015-12-18 2021-03-30 Sony Corporation Information processing apparatus, information processing method, and program
RU2699573C2 (ru) 2017-12-15 2019-09-06 Общество С Ограниченной Ответственностью "Яндекс" Способы и системы для создания значений общего критерия оценки

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3537949B2 (ja) * 1996-03-06 2004-06-14 株式会社東芝 パターン認識装置及び同装置における辞書修正方法
US6754628B1 (en) * 2000-06-13 2004-06-22 International Business Machines Corporation Speaker recognition using cohort-specific feature transforms
JP4701518B2 (ja) * 2001-03-02 2011-06-15 日本電気株式会社 パターン認識装置、パターン認識方法及びプログラム
JP3888676B2 (ja) 2002-02-25 2007-03-07 株式会社東芝 3次元物体認識装置及びその方法
US7010167B1 (en) * 2002-04-30 2006-03-07 The United States Of America As Represented By The National Security Agency Method of geometric linear discriminant analysis pattern recognition
JP4343125B2 (ja) * 2005-02-10 2009-10-14 株式会社東芝 パターン認識装置及びその方法

Also Published As

Publication number Publication date
US8121411B2 (en) 2012-02-21
JP2010182013A (ja) 2010-08-19
US20100195917A1 (en) 2010-08-05

Similar Documents

Publication Publication Date Title
JP7315748B2 (ja) データ識別器訓練方法、データ識別器訓練装置、プログラム及び訓練方法
CN109522956B (zh) 一种低秩判别特征子空间学习方法
Deutsch et al. Zero shot learning via multi-scale manifold regularization
JP6270182B2 (ja) 属性要因分析方法、装置、およびプログラム
Yuan et al. Ear recognition using improved non-negative matrix factorization
JP5175754B2 (ja) 線形変換行列算出装置、その方法、及び、そのプログラム
Zhang et al. Hypergraph spectral clustering for point cloud segmentation
JP6673226B2 (ja) 特徴変換装置、認識装置、特徴変換方法及びコンピュータ読み取り可能記録媒体
JPH04299469A (ja) 画像内の物体の認識法および一連の画像内の物体のトラッキングへの応用
EP3965007A1 (en) Action recognition apparatus, learning apparatus, and action recognition method
CN107704887B (zh) 一种基于f范数的局部保持投影的图像识别方法
WO2011018823A1 (ja) パターン認識装置、その方法、及びそのプログラム
WO2019215904A1 (ja) 予測モデル作成装置、予測モデル作成方法、および予測モデル作成プログラム記録媒体
Wu et al. Dual-space analysis of the sparse linear model
Adrover et al. A robust predictive approach for canonical correlation analysis
CN107729945A (zh) 基于类间稀疏表示的鉴别回归、分类方法及系统
Liu et al. Nonparametric functional approximation with Delaunay triangulation learner
WO2010110181A1 (ja) パターン照合装置、パターン照合方法及びパターン照合プログラム
CN110210443B (zh) 一种优化投影对称性近似稀疏分类的手势识别方法
Raducanu et al. Online nonparametric discriminant analysis for incremental subspace learning and recognition
Wu et al. Change detection of remote sensing images based on weighted nonnegative matrix factorization
WO2020040007A1 (ja) 学習装置、学習方法及び学習プログラム
Welling et al. Probabilistic sequential independent components analysis
Zenkov Evaluation of the posterior probability of a class with a series of Anderson discriminant functions
JP7221892B2 (ja) 学習装置、学習方法、および学習プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120807

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120926

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130107

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160111

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees