JP2010039723A - 非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体 - Google Patents

非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP2010039723A
JP2010039723A JP2008201274A JP2008201274A JP2010039723A JP 2010039723 A JP2010039723 A JP 2010039723A JP 2008201274 A JP2008201274 A JP 2008201274A JP 2008201274 A JP2008201274 A JP 2008201274A JP 2010039723 A JP2010039723 A JP 2010039723A
Authority
JP
Japan
Prior art keywords
matrix
gaussian distribution
distribution
variance
mixture ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008201274A
Other languages
English (en)
Other versions
JP5068228B2 (ja
Inventor
Hirokazu Kameoka
弘和 亀岡
Kunio Kayano
邦夫 柏野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008201274A priority Critical patent/JP5068228B2/ja
Publication of JP2010039723A publication Critical patent/JP2010039723A/ja
Application granted granted Critical
Publication of JP5068228B2 publication Critical patent/JP5068228B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)

Abstract

【課題】画像や音響信号のスペクトログラムのような非負値(0以上の値)からなるデータから、ポアソン分布とガウス分布の混合分布により定義される関数を尤度関数とし、適応的に観測データの統計分布の分布形を推定し、NMF(非負値行列分解)を行う。
【解決手段】ポアソン分布とガウス分布の基底行列、混合比および重み行列の初期値を生成し、観測データに基づいたガウス分布の分散より生成されたガウス分布率行列で混合比率を更新し、基底行列および重み行列の更新を収束するまで繰り返す。
【選択図】図1

Description

本発明は、主に、画像の特徴抽出や音源分離で用いられる技術に関するものであって、特に、画像や音響信号のスペクトログラムのような非負値からなるデータに基づき、NMF(非負値行列分解)モデルのパラメータを計算する非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体に関する。
非負値行列分解(Non−negative Matrix Factorization;NMF)は、画像や音響信号のスペクトログラムなどの非負値データから特徴的なパターンを抽出する方法として有効であり、画像特徴抽出や音源分離など多岐にわたって応用されている。この非負値行列とは、全成分が非負(0以上)の値で構成される行列であって、非負値行列分解とは、観測データ(非負値ベクトル)のすべてを非負値基底ベクトルの非負結合でよく近似できるような適当な基底系を構成する理論である。
言い換えると、非負値行列分解は、すべての観測データ(J個のK次元非負値ベクトル)
Figure 2010039723
を、I個のK次元非負値基底ベクトル
Figure 2010039723
の非負結合
Figure 2010039723
で良く近似できるような適当な基底系を構成する理論である。
すなわち、J個のK次元非負値ベクトルを並べた非負値行列X=(xK×J=(x,x,・・・x)、I個のK次元非負値基底ベクトルを並べた基底行列W=(wK×I=(w,w,・・・w)、非負結合の係数を要素とした重み行列H=(hI×Jとした場合、
Figure 2010039723
となるような非負値行列である基底行列W,重み行列Hを求めるものが非負値行列分解(NMF)である。
ここで、これらの近さの尺度を、フロベニウス(Frobenius)ノルム
Figure 2010039723
と、Iダイバージェンス(またはKLダイバージェンス)
Figure 2010039723
で定義した場合の最適な基底行列Wおよび重み行列Hを数値計算するための効率的な反復アルゴリズムが、開示されている(非特許文献1)。これらは乗法更新(Multiplicative Update)アルゴリズムと呼ばれている。なお、式6において、[・]は、「・」の行列の(k,j)成分を表す。
をWの転置行列とすると、フロベニウスノルムで定義された式5に示すF(X,WH)を小さくする更新式は、それぞれ
Figure 2010039723
Figure 2010039723
で与えられ、Iダイバージェンスで定義された式6に示すI(X,WH)を小さくする更新式はそれぞれ
Figure 2010039723
Figure 2010039723
で与えられる。
いずれの更新式も、基底行列Wと重み行列Hの初期値が非負値行列であれば必ず非負値行列に更新されることが保証されている点に特徴があり、目的関数の定義によって異なる更新式が導入されるため、当然のことながら目的関数の定義によって異なる値に収束する。
したがって、基底行列Wおよび重み行列Hの行列同士の近さをフロベニウスノルムで測った場合で最適解を得ることは、目的関数を式5に示したフロベニウスノルムとして定義し、尤度関数を次式に示すガウス(Gauss)分布と仮定して最尤推定していることに相当する。
Figure 2010039723
また、基底行列Wおよび重み行列Hの行列同士の近さをIダイバージェンスで測った場合で最適解を得ることは、目的関数を式6に示したIダイバージェンスとして定義し、尤度関数を次式に示すポアソン(Poisson)分布と仮定して最尤推定していることに相当する。
Figure 2010039723
ただし、観測データxは量子化された整数値データ
Figure 2010039723
とする。
すなわち、観測データが実際にどのような統計分布に従って生成されたかに従って、式5に示したフロベニウスノルムあるいは式6に示したIダイバージェンスとしての目的関数のうち、最小にするべき目的関数がいずれであるかが決まるわけである。
しかしながら、一般に、観測データがどのような統計分布に従って生成されたかを事前に知ることはできず、かつ、必ずしもガウス分布やポアソン分布に理想的に従っているとは限らない。このため、従来、状況に応じてどちらかの目的関数を採用することが好ましいかを経験的に選択していた。
D.D.Lee and H.S.Seung,"Learning the Parts of Objects by Non−negative Matrix Factorization,"Natura Vol.401,pp.788−791,1999.
しかしながら、後で詳細に説明するが、図3に示す分布図からわかるように、ポアソン分布の尤度関数の場合、尤度関数の分布の裾は、観測値xが大きいほど広くなる。このため、観測値x(観測行列の要素の値)が小さいほど、NMFモデル(基底行列Wと重み行列Hの積をとった行列)の要素値と観測値xとのずれに対して感度が鋭くなるようなコスト(尤度関数)を設けていることに相当する。一方、図4に示す分布図からわかるように、ガウス分布の尤度関数の場合、尤度関数の分布の裾は、観測値xの大小にかかわらず一定であるため、観測値xが大きいほど、NMFモデルの要素値と観測値xとのずれに対して感度が鋭くなるようなコストを設けていることに相当する。
つまり、尤度関数をポアソン分布と仮定すると、小さな観測値xの微妙な誤差に影響を受けてNMFモデルのパラメータの推定精度が低下しやすくなる。逆に、尤度関数をガウス分布と仮定すると、観測値xに含まれる外れ値や飛び値の影響を受けて、NMFモデルのパラメータの推定精度が低下しやすくなる。
また、音響信号のスペクトログラムのようなスパースなデータ(鋭いピーク成分がまばらにあり、それ以外は極端に小さい成分からなるデータ)に関しては、上記のいずれの影響も陽に受けることになる。したがって、尤度関数としてポアソン分布と仮定した場合は、小さい成分の影響を大きく受け、尤度関数としてガウス分布と仮定した場合は、鋭いピーク成分(外れ値や飛び値)の影響を大きく受けることになる。このため、どちらの尤度関数と仮定したとしても、NMFモデルのパラメータの推定精度が低下してしまうという問題がある。
本発明は、このような事情を考慮し、上記の問題を解決すべくなされたものであって、その目的は、ポアソン分布とガウス分布の混合分布により定義される関数を尤度関数とし、観測データに応じてNMFパラメータだけでなく、観測データの統計分布の分布形も適応的に推定するための非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体を提供することにある。
上記問題を解決するために、本発明は、非負値データを格納した非負値ベクトルが並べられた観測データに基づき、この観測データに応じた非負値行列分解モデルのパラメータを計算する非負値行列分解の数値計算方法において、初期パラメータ生成部が、前記非負値行列分解モデルのパラメータである、基底行列、重み行列、ガウス分布とポアソン分布の混合比率をあらわす分布混合比、およびガウス分布の分散のそれぞれの初期値を生成し、前記ガウス分布率行列生成部が、前記初期パラメータ生成部から入力された前記パラメータの初期値、あるいは、パラメータ更新部により更新された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散の値に基づき、前記観測データの各要素がガウス分布およびポアソン分布のうちガウス分布から生成された確率を表したガウス分布率行列を生成し、前記パラメータ更新部の分布混合比更新部が、前記ガウス分布率行列に基づき、前記分布混合比を更新し、前記パラメータ更新部のガウス分布分散更新部が、
前記ガウス分布率行列、前記基底行列、前記重み行列、および前記観測データに基づき、前記ガウス分布の分散を更新し、前記パラメータ更新部の基底行列更新部が、前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記基底行列を更新し、前記パラメータ更新部の重み行列更新部が、前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記重み行列を更新し、収束判定部は、前記パラメータ更新部により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしているか否かを判定し、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていない場合、前記ガウス分布率行列生成部に前記ガウス分布率行列の生成を指示する信号を出力し、この生成された前記ガウス分布率行列に基づき前記パラメータ更新部により更新されたパラメータの更新を再度判定し、分解行列出力部は、前記収束判定部により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていると判定された場合、更新された前記基底行列および前記重み行列を出力することを特徴とする非負値行列分解の数値計算方法である。
また、本発明にかかる収束判定部は、前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、前記ポアソン分布とガウス分布の混合分布により定義された目的関数を最大化する所定の基準を満たしているか否かを判断することを特徴とする非負値行列分解の数値計算方法である。
また、本発明は、非負値データを格納した非負値ベクトルが並べられた観測データに基づき、この観測データに応じた非負値行列分解モデルのパラメータを計算する非負値行列分解の数値計算装置において、前記非負値行列分解モデルのパラメータである、基底行列、重み行列、ガウス分布とポアソン分布の混合比率をあらわす分布混合比、およびガウス分布の分散のそれぞれの初期値を生成する初期パラメータ生成部と、前記初期パラメータ生成部から入力された前記パラメータの初期値、あるいは、パラメータ更新部により更新された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散に基づき、前記観測データの各要素がガウス分布およびポアソン分布のうちガウス分布から生成された確率を表したガウス分布率行列を生成するガウス分布率行列生成部と、前記ガウス分布率行列生成部から入力された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散を、それぞれ更新する基底行列更新部、重み行列更新部、分布混合比更新部、およびガウス分布分散更新部を有するパラメータ更新部と、前記パラメータ更新部により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしているか否かを判定し、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていない場合、前記ガウス分布率行列生成部に前記ガウス分布率行列の生成を指示する信号を出力し、この生成された前記ガウス分布率行列に基づき前記パラメータ更新部により更新されたパラメータの更新を再度判定する収束判定部と、前記収束判定部により、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていると判定された場合、前記基底行列および前記重み行列を出力する分解行列出力部とを備え、前記パラメータ更新部は、前記ガウス分布率行列に基づき、前記分布混合比を更新する分布混合比更新部と、前記ガウス分布率行列、前記基底行列、前記重み行列、および前記観測データに基づき、前記ガウス分布の分散を更新するガウス分布分散更新部と、前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記基底行列を更新する基底行列更新部と、前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記重み行列を更新する重み行列更新部を有することを特徴とする非負値行列分解の数値計算装置である。
また、本発明にかかる収束判定部は、前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、前記ポアソン分布とガウス分布の混合分布により定義された目的関数を最大化する所定の基準を満たしているか否かを判断することを特徴とする非負値行列分解の数値計算装置である。
また、本発明は、非負値データを格納した非負値ベクトルが並べられた観測データに基づき、この観測データに応じた非負値行列分解モデルのパラメータを計算するコンピュータに、前記非負値行列分解モデルのパラメータである、基底行列、重み行列、ガウス分布とポアソン分布の混合比率をあらわす分布混合比、およびガウス分布の分散のそれぞれの初期値を生成する初期パラメータ生成手段と、前記初期パラメータ生成手段から入力された前記パラメータの初期値、あるいは、更新手段により更新された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散に基づき、前記観測データの各要素がガウス分布およびポアソン分布のうちガウス分布から生成された確率を表したガウス分布率行列を生成するガウス分布率行列生成手段と、前記ガウス分布率行列に基づき、前記分布混合比を更新する更新手段と、前記ガウス分布率行列、前記基底行列、前記重み行列、および前記観測データに基づき、前記ガウス分布の分散を更新する更新手段と、前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記基底行列を更新するガウス分布分散更新手段と、前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記重み行列を更新する基底行列更新手段と、前記更新手段により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしているか否かの前記パラメータの更新を判定し、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていない場合、前記ガウス分布率行列生成手段に前記ガウス分布率行列の生成を指示する信号を出力し、この生成された前記ガウス分布率行列に基づき前記更新手段により更新された前記パラメータの更新を再度判定する収束判定手段と、前記収束判定手段により、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていると判定された場合、前記基底行列および前記重み行列を出力する分解行列出力手段と、を実行させるためのプログラムである。
また、本発明は、非負値データを格納した非負値ベクトルが並べられた観測データに基づき、この観測データに応じた非負値行列分解モデルのパラメータを計算するコンピュータに、前記非負値行列分解モデルのパラメータである、基底行列、重み行列、ガウス分布とポアソン分布の混合比率をあらわす分布混合比、およびガウス分布の分散のそれぞれの初期値を生成する初期パラメータ生成手段と、前記初期パラメータ生成手段から入力された前記パラメータの初期値、あるいは、更新手段により更新された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散に基づき、前記観測データの各要素がガウス分布およびポアソン分布のうちガウス分布から生成された確率を表したガウス分布率行列を生成するガウス分布率行列生成手段と、前記ガウス分布率行列に基づき、前記分布混合比を更新する更新手段と、前記ガウス分布率行列、前記基底行列、前記重み行列、および前記観測データに基づき、前記ガウス分布の分散を更新する更新手段と、前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記基底行列を更新する更新手段と、前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記重み行列を更新する更新手段と、前記更新手段により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしているか否かの前記パラメータの更新を判定し、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていない場合、前記ガウス分布率行列生成手段に前記ガウス分布率行列の生成を指示する信号を出力し、この生成された前記ガウス分布率行列に基づき前記更新手段により更新された前記パラメータの更新を再度判定する収束判定手段と、前記収束判定手段により、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていると判定された場合、前記基底行列および前記重み行列を出力する分解行列出力手段とを実行させるためのプログラムを記憶した記憶媒体である。
本発明によれば、観測データが、ポアソン分布ないしガウス分布のいずれかに従っている場合、どちらの分布に従っているかが推定されるため、そのもとで適切なNMFパラメータを推定することができる。
また、本発明によれば、観測データがポアソン分布ないしガウス分布のいずれかに従っていない場合であっても、観測データの実際の統計分布にポアソン分布とガウス分布の混合分布で表現可能な範囲内で柔軟に尤度関数が適応されるため、そのもとで最尤のNMFパラメータを得ることができる。
さらに、本発明によれば、効率的にNMFパラメータを算出可能な乗法更新アルゴリズムを実現することができる。
また、本発明によれば、音響信号のスペクトログラムのようなスパースなデータに対しても、高精度なNMFパラメータを推定することができる。
以下、図面を参照して、本発明の一実施形態について説明する。図1は、本発明の実施の形態の構成を示すブロック図であり、図2は、その動作を説明するフローチャートである。
図1に示すとおり、本実施の形態の非負値行列分解の計算装置は、初期パラメータ生成部1、ガウス分布率行列生成部2、パラメータ更新部3、収束判定部4および分解行列出力部5を有する。
初期パラメータ生成部1は、非負値行列分解(NMF)モデルのパラメータである基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σの初期値を生成し、ガウス分布率行列生成部2に出力する。例えば、初期パラメータ生成部1は、観測データxに基づき、所定の値が設定されたパラメータの初期値を記憶し、また、設定変更・修正が可能な構成を有する。
ただし、基底行列Wと重み行列Hは、それぞれK×I行列、I×J行列である。なお、ここで言うK,Jは、観測データ行列Xの行数および列数であり、Iは、基底ベクトルが備える非負値基底ベクトルの個数であって予め定められている任意の定数である。
それぞれの初期値の選択可能な範囲は、基底行列W=(wK×Iに関しては、すべてのkとiに対しての範囲として、
Figure 2010039723
また、重み行列H=(hI×Jに関しては、すべてのiとjに対しての範囲として、
Figure 2010039723
分布混合比λに関しては、
Figure 2010039723
ガウス分布の分散σに関しては、σ>0とする。
なお、基底行列W=(wK×Iは、K×I行列で(k,i)成分がwである行列(w,w,・・・w)を表す。また、分布混合比λは、ガウス分布とポアソン分布の混合比率を表す。
ガウス分布率行列生成部2は、入力信号として入力された観測データ行列Xに基づき、初期パラメータ生成部1から入力された、あるいはパラメータ更新部3から読み出した基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σを用いて、次式に基づきk,jすべてについてガウス分布率γを算出する。
Figure 2010039723
なお、観測データ行列Xは、所定の観測データの出力部(図示せず)により、非負値データを格納した非負値ベクトルが並べられた観測データ行列である。なお、観測データxは、観測データ行列Xのk行j行列目の成分、[・]は行列「・」のk行j列目の成分を表す。
ガウス分布率行列生成部2は、上述の式17を利用して計算されたガウス分布率γを要素とした、次式に示すガウス分布率行列Γを生成し、パラメータ更新部3に出力する。
Figure 2010039723
なお、ガウス分布率行列Γとは、観測データ行列Xの各要素xがガウス分布とポアソン分布のうち、ガウス分布から生成された確率を表したものである。
また、ガウス分布率行列生成部2は、入力された観測データ行列X、および初期パラメータ生成部1あるいは分解行列出力部5から入力された基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σを、パラメータ更新部3に出力する。
パラメータ更新部3は、分布混合比更新部31、ガウス分布分散更新部32、基底行列更新部33、重み行列更新部34を含み、これらにより更新された基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σを収束判定部4に出力する。
分布混合比更新部31は、ガウス分布率行列生成部2から入力されたガウス分布率行列Γの要素であるガウス分布率γをガウス分布率γ´とし、これを用いて次式に基づき分布混合比λを更新する。
Figure 2010039723
分布混合比更新部31は、更新した分布混合比λを収束判定部4に出力する。
ガウス分布分散更新部32は、ガウス分布率行列生成部2から入力されたガウス分布の分散σを次式に基づき更新する。つまり、ガウス分布分散更新部32は、ガウス分布率行列生成部2から入力された基底行列W、重み行列H、ガウス分布率γを、それぞれ基底行列W´、重み行列H´、ガウス分布率γ´とし、これらと観測データ行列X=(xK×Jを用いて、次式に基づきガウス分布の分散σを更新する。
Figure 2010039723
ガウス分布分散更新部32は、更新したガウス分布の分散σを収束判定部4に出力する。
基底行列更新部33は、ガウス分布率行列生成部2から入力された基底行列W、重み行列H、ガウス分布行列Γ、およびガウス分布の分散σを、それぞれ基底行列W´、重み行列H´、ガウス分布行列Γ´、ガウス分布の分散σ´とし、これらと観測データ行列X=(xK×Jを用いて、次式に基づき基底行列Wを更新する。
Figure 2010039723
ただし、行列A,B,C(太字)は、それぞれ次式と定義される。
Figure 2010039723
行列の除法は、行列要素同士で商をとる演算とし、○中に中黒「・」で示す記号
Figure 2010039723
は、Hadamard積(行列の要素同士の積をとる演算)を、√内に「・」で示す表記は、「・」が行列のとき、行列の要素ごとの平方根をとる演算を表す。また、「1(太字)」は、要素がすべて1のK×Jの行列を表す。
基底行列更新部33は、更新した基底行列Wを収束判定部4に出力する。
重み行列更新部34は、ガウス分布率行列生成部2から入力された基底行列W、重み行列H、ガウス分布行列Γ、およびガウス分布の分散σを、それぞれ基底行列W´、重み行列H´、ガウス分布行列Γ´、ガウス分布の分散σ´とし、これらと観測データ行列X=(xK×Jを用いて、次式に基づき重み行列Hを更新する。
Figure 2010039723
ただし、行列D,E,F(太字)は、それぞれ次式で定義される。
Figure 2010039723
重み行列更新部34は、更新した重み行列Hを収束判定部4に出力する。
収束判定部4は、パラメータ更新部3により入力された基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σが、それぞれ所定の基準を満たしているか否かのパラメータの更新を判定する。収束判定部4は、基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σが、それぞれ所定の基準を満たしていない場合、ガウス分布率行列生成部2にガウス分布率行列の生成を指示する信号を出力し、それぞれのパラメータが所定の基準を満たすまで、この生成されたガウス分布率行列Γに基づきパラメータ更新部3により更新されたパラメータの更新の判定を繰り返す。
本実施の形態において、収束判定部4は、パラメータ更新部3により、基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σが、下に示す式26のポアソン分布とガウス分布の混合分布により定義された目的関数を最大化するよう更新され、この目的関数の値の変化率が所定値以下となったか否かを判定する。
Figure 2010039723
収束判定部4は、式26に示す目的関数の変化率が所定値以下となった場合、基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σが、所定の基準を満たしていると判定し、更新された最新の基底行列Wおよび重み行列Hを出力する指示の信号を、分解行列出力部5に出力する。
なお、収束判定部4は、上述の判定方法に限られず、例えば、パラメータの更新計算を反復して行った回数が、所定の回数に達したか否かを検出し、所定に回数に達した場合、分解行列出力部5に指示の信号を出力する構成であってもよい。また、収束判定部4は、パラメータの反復更新計算において、それぞれのパラメータの更新の変化率が所定の値以下であるか否かを検出し、変化率が所定値以下になった場合、分解行列出力部5に指示の信号を出力する構成であってもよい。
分解行列出力部5は、収束判定部4から出力の指示信号を受けて、更新された最新の基底行列Wおよび重み行列Hを出力する。
この構成により、本発明は、ポアソン分布とガウス分布の混合分布により定義される尤度関数を、観測データxに応じて、NMFパラメータだけでなく、観測データxの統計分布の分布形も適応的に推定することができる。
つまり、観測データxがポアソン分布ないしガウス分布のいずれかに従っている場合、どちらの分布に従っているか収束判定部4により判定されるまで、パラメータ更新部3による更新が繰り返される。このため、観測データxがどちらの分布に従っているかが推定され、同時にそのもとで適切なNMFパラメータが推定される。
一方、観測データxがポアソン分布ないしガウス分布のいずれかに従っていない場合であっても、観測データxの実際の統計分布にポアソン分布とガウス分布の混合分布で表現可能な範囲内で柔軟に尤度関数が適応されるため、そのもとで最尤のNMFパラメータを得ることができる。
したがって、本発明は、観測データxが、いずれの統計分布の分布形に従っているか不明な場合であっても、観測データxに応じた最尤のNMFパラメータを得ることができる。
さらに、本発明によれば、従来経験的に観測データxの統計分布の分布形を判断していたところ、自動的に最適な統計分布に応じた最尤のNMFパラメータを計算することができるため、効率的にNMFパラメータを計算可能な乗法更新アルゴリズムを実現することができる。
また、本発明によれば、音響信号のスペクトログラムのようなスパースなデータに対しても、高精度なNMFパラメータを推定することができる。
次に、図2を用いて、本発明にかかる非負値行列分解の数値計算方法について説明する。図2は、本実施の形態における非負値行列分解の数値計算方法の一例を示すフローチャートである。
図2に示すとおり、まず、初期パラメータ生成部1により、基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σの初期値が生成される(S1)。生成された基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σの初期値は、ガウス分布率行列生成部2に出力される。
ガウス分布率行列生成部2は、入力された観測データ行列Xに基づき、これら基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σの初期値を用いて、式17によりガウス分布率γを計算し、このガウス分布率γよりガウス分布率行列Γを生成する(S2)。ガウス分布率行列生成部2は、生成したガウス分布率行列Γと、観測データ行列X、基底行列W、重み行列H、分布混合比λおよびガウス分布の分散σの初期値を、パラメータ更新部3に出力する。
パラメータ更新部3は、入力された情報に基づき、NMFパラメータの更新を行う。
すなわち、分布混合比更新部31は、ガウス分布率行列生成部2から入力されたガウス分布率行列Γの要素であるガウス分布率γをガウス分布率γ´とし、これを用いて式19に基づき分布混合比λを更新する(S3)。
ガウス分布分散更新部32は、ガウス分布率行列生成部2から入力された基底行列W、重み行列H、ガウス分布率γを、それぞれ基底行列W´、重み行列H´、ガウス分布率γ´とし、これらと観測データ行列X=(xK×Jを用いて、式20に基づきガウス分布の分散σを更新する(S4)。
基底行列更新部33は、ガウス分布率行列生成部2から入力された基底行列W、重み行列H、ガウス分布行列Γ、およびガウス分布の分散σを、それぞれ基底行列W´、重み行列H´、ガウス分布行列Γ´、ガウス分布の分散σ´とし、これらと観測データ行列X=(xK×Jを用いて、式21に基づき基底行列Wを更新する(S5)。
重み行列更新部34は、ガウス分布率行列生成部2から入力された基底行列W、重み行列H、ガウス分布行列Γ、およびガウス分布の分散σを、それぞれ基底行列W´、重み行列H´、ガウス分布行列Γ´、ガウス分布の分散σ´とし、これらと観測データ行列X=(xK×Jを用いて、式24に基づき重み行列Hを更新する(S6)。
収束判定部4は、入力された基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σが、それぞれ所定の基準を満たしているか否かを判定する(S7)。
基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σが、それぞれ所定の基準を満たしている場合(S7−YES)、収束判定部4は、更新された最新の基底行列Wおよび重み行列Hを出力する指示の信号を、分解行列出力5に出力する。
分解行列出力部5は、収束判定部4から出力の指示信号を受けて、更新された最新の基底行列Wおよび重み行列Hを出力する(S8)。
一方、基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σが、それぞれ所定の基準を満たしていない場合(S7−NO)、収束判定部4は、ガウス分布率行列生成部2にガウス分布率行列の生成を指示する信号を出力する。
ステップS2に戻って、指示信号を受けたガウス分布率行列生成部2は、パラメータ更新部3から更新された最新の基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σを読み出し、観測データxに基づきガウス分布率行列Γを生成し、パラメータ更新部3に出力する。パラメータ更新部3は、ガウス分布率行列生成部2から入力されたガウス分布率行列をおよび観測データxに基づき基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σを更新し、収束判定部4に出力する。これら観測データxおよびパラメータ等が入力された収束判定部4は、パラメータの更新の判定を行う。
すなわち、収束判定部4は、それぞれのパラメータが所定の基準を満たすまで、この生成されたガウス分布率行列Γに基づきパラメータ更新部3により更新されたパラメータの更新の判定を繰り返す。
なお、パラメータ更新部3によるこれら更新の順番は任意であり、例えば、基底行列Wおよび重み行列Hの更新を先に実行し、その後に分布混合比λ、ガウス分布の分散σの更新を実行する構成であってもよく、全ての更新を同時に実行する構成であってもよい。
パラメータ更新部3は、更新された基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σを収束判定部4に出力する。
[観測データに基づく統計分布設定の問題]
ここで、ガウス分布とポアソン分布の尤度関数について説明する。
図3は、ポアソン分布の尤度関数の概形を示す図であり、図4は、ガウス分布の尤度関数の概形を示す図であり、図5は、ポアソン分布とガウス分布の混合分布の概形を示す図である。図3〜5において、凸型の複数の波形a〜oは、それぞれ異なる観測値xの尤度関数を示している。
図3に示すとおり、ポアソン分布の尤度関数である複数の波形a〜eは、波形aの観測データxが最も小さく、アルファベット順に観測データxが大きなり、それぞれ観測データx=1,10,30,60,90であるときのポアソン分布の尤度関数を示す。図3に示すポアソン分布の概形は、横軸に観測データx、縦軸にポアソン分布の尤度関数(式88参照)を規定する。
図3からわかるように、尤度関数がポアソン分布の場合、観測データxが大きいほど尤度関数の分布の裾が広くなる。このため、本実施の形態では、観測データxの値が大きいほど、NMFモデル(基底行列Wと重み行列Hの積をとった行列)[WH]の要素値と観測データxとのずれに対して感度が鈍くなるようなコスト(尤度関数)を設けていることに相当する。
一方、図4に示すとおり、ガウス分布の尤度関数である複数の波形f〜jは、波形fの観測データxが最も小さく、アルファベット順に観測データxが大きくなり、それぞれ観測データx=1,10,30,60,90であるときのガウス分布の尤度関数を示す。図4に示すガウス分布の概形は、横軸に観測値、縦軸にガウス分布の尤度関数(式89参照)を規定する。
図4からわかるように、尤度関数がガウス分布の場合、ポアソン分布の場合とは逆に、尤度関数の分布の裾は観測データxの大きさによらず一定である。このため、本実施の形態では、ポアソン分布のときに比べて観測値xの値が大きいほどNMFモデル[WH]の要素値と観測値xとのずれに対して感度が鋭くなるようなコストを設けていることに相当する。
したがって、尤度関数がポアソン分布の場合のほうが、小さい観測データxにおける微量な誤差によって、推定結果全体が影響をうけやすく、一方、尤度関数がガウス分布の場合のほうが、観測データxの外れ値や飛び値がある場合の影響を受けやすい。
特に音響信号のスペクトログラムのようにスパースなデータ(鋭いピーク成分がまばらにあり、それ以外は極端に小さい成分からなるデータ)に関しては、上記のいずれの影響も陽に受けることになるため、いずれか一方の尤度関数を仮定した場合、必然的に仮定した尤度関数の影響を受けることとなってしまう。
つまり、NMFの性能を向上させるためには、観測データが従う統計分布により即した目的関数をもとに、NMFを行うことが望ましい。そのためには、観測データに応じた統計分布を推定しながら、NMFパラメータである基底行列W,重み行列Hを推定する必要がある。
本発明は、ポアソン分布とガウス分布の混合分布により尤度関数を定義し、観測データに応じてNMFパラメータだけでなく、観測データの統計分布の分布形も適応的に推定することができる。よって本発明は、これら統計分布と尤度関数とのバランスを観測データから適応的に調節し、適切な感度のコストを設けることが可能であり、いかなる応用場面でも最適化基準の選択に迫られることなく、統一的に利用可能なNMFの枠組みを確率する可能性を発揮することができる。
[ハイブリッド尤度関数の定義]
次に、図5を参照して、ポアソン分布とガウス分布の混合分布について説明する。
図5に示すポアソン分布とガウス分布の混合分布は、
Figure 2010039723
と定義される。ただし、ガウス分布は、
Figure 2010039723
ポアソン分布は、
Figure 2010039723
とする。
この式27の混合分布の尤度関数は、式5に示すフロベニウスノルムおよび式6に示すIダイバージェンスで定義される目的関数の両特性を含むハイブリッド尤度関数である。
ただし、ガウス分布とポアソン分布の分布混合比λは、0≦λ≦1である。すなわち、分布混合比λが大きいほど、混合分布はガウス分布に近似し、分布混合比λが小さいほど、混合分布はポアソン分布に近似する。
したがって、対数尤度関数Lは、
Figure 2010039723
となり、この対数尤度関数Lが最大となるような基底行列W、重み行列H、分布混合比λ、ガウス分布の分散σを算出することが好ましい。なお、この分布混合比λとガウス分布の分散σを自由パラメータとして扱うことで、観測データxが従う確率分布をできるだけよくあらわすことができるようになる。つまり、統計分布と尤度関数とのバランスを観測データから適応的に調節し、適切な感度のコストを設けることが可能となる。
なお、本実施の形態において、パラメータ更新部3は、上述の対数尤度関数Lを目的関数として、この目的関数を最大化するように各パラメータを更新し、収束判定部4は、この目的関数の値の変化率が所定値以下となったか否かを判定している。
[NMFパラメータと分布パラメータの最尤推定]
次に、本実施の形態における乗法更新アルゴリズムを導くための、最適な補助関数の計算について説明する。
まず、対数関数の凸性に基づき、
Figure 2010039723
という条件もとで、次のような不等式が成り立つ。
Figure 2010039723
ただし、ガウス分布率行列Γは次式のとおりである。
Figure 2010039723
また、
Figure 2010039723
かつ
Figure 2010039723
という条件のもとでは、次のような不等式が成り立つ。
Figure 2010039723
さらに、
Figure 2010039723
かつ
Figure 2010039723
という条件のもとでは、次のような不等式が成り立つ。
Figure 2010039723
そこで、上述の不等式(式32,36,39)において、いずれも
Figure 2010039723
である場合に等号が成立するため、
Figure 2010039723
が成り立つ。
だたし、3階のテンソルMは
Figure 2010039723
とする。
以上より、次のような不等式が成り立つ。
Figure 2010039723
Figure 2010039723
従って、ガウス分布率γが次のような場合、上述の不等式(式43)が成り立つ。
Figure 2010039723
また、mi,k,jが次のような場合、上述の不等式(式44)が成り立つ。
Figure 2010039723
このように、式41,44に基づき算出された関数G(W,H,λ,σ,Γ,M)は、対数尤度関数L(W,H,λ,σ)を効率的に局所最大化するための補助関数であり、式45,46による更新と、基底行列W、重み行列H、分布混合比λ、およびガウス分布の分散σの更新を繰り返すことで、対数尤度関数L(W,H,λ,σ)を単調増加させることができる。
本実施の形態においては、上述の理論に基づき、ガウス分布率行列生成部2によるガウス分布率行列Γの更新、およびパラメータ更新部3による基底行列W、重み行列H、分布混合比λ、およびガウス分布の分散σの更新を繰り返すことで、本発明にかかる非負値行列分解の数値計算装置は、対数尤度関数Lを単調増加させている。
[乗法更新式の導入]
式41により算出された補助関数Gに基づき算出される各パラメータの更新式について説明する。
まず、ガウス分布率行列Γ=Γ´という条件のもとで、補助関数G(W,H,λ,σ,Γ,M)が最大となる分布混合比λを求める。
Figure 2010039723
を解くと、
Figure 2010039723
となる。
なお、ガウス分布率γの式45より
Figure 2010039723
であるから
Figure 2010039723
となる。
次に、次式に基づき、基底行列W=W´、重み行列H=H´、ガウス分布率行列Γ=Γ´、3階のテンソルM=M´という条件のもとで、補助関数G(W,H,λ,σ,Γ,M)が最大となるガウス分布の分散σを求める。
Figure 2010039723
この式51を、補助関数G(W,H,λ,σ,Γ,M)に代入して、
Figure 2010039723
を解くと、
Figure 2010039723
となる。
次に、次式に基づき、重み行列H=H´、ガウス分布率行列Γ=Γ´、3階のテンソルM=M´、ガウス分布の分散σ=σ´2という条件のもとで、補助関数G(W,H,λ,σ,Γ,M)が最大となる基底行列Wを求める。
Figure 2010039723
この式54に
Figure 2010039723
を代入すると、
Figure 2010039723
となる。ただし、行列の除法は、要素同士で商をとる演算とし、○中に中黒「・」で示す記号(数23参照)は、Hadamard積(行列の要素同士の積をとる演算)を、√内に「・」で示す表記は、「・」が行列のとき、行列の要素ごとの平方根をとる演算とする。なお、式56において、「1(太字)」は要素がすべて1のK×Jの行列である。
この式56の両辺に、
Figure 2010039723
を乗じると、次に示す2次方程式となる。
Figure 2010039723
ここで、
Figure 2010039723
Figure 2010039723
Figure 2010039723
とすると、式58の方程式の解は、
Figure 2010039723
となる。
ただし、
Figure 2010039723
のとき、すなわち、式43の√の中が行列のとき、行列の要素ごとの平方根をとる演算子を表す。
以上により、基底行列Wの更新式は、
Figure 2010039723
となる。式62の解は、非負値行列であるため、式64の基底行列W´が非負値行列であれば基底行列Wは必ず非負値行列に更新される。
次に、次式に基づき、基底行列W=W´、ガウス分布率行列Γ=Γ´、3階のテンソルM=M´、ガウス分布の分散σ=σ´2という条件のもとで、補助関数G(W,H,λ,σ,Γ,M)が最大となる重み行列Hを求める。
Figure 2010039723
この式65に、式55を代入すると、
Figure 2010039723
となる。
この式66の両辺に、
Figure 2010039723
を乗じると、次に示す2次方程式となる。
Figure 2010039723
ここで、
Figure 2010039723
Figure 2010039723
Figure 2010039723
とすると、式68の方程式の解は、
Figure 2010039723
となる。
以上により、重み行列Hの更新式は、
Figure 2010039723
となる。基底行列Wと同様に、式72の解は非負値行列であるため、式73の重み行列H´が非負値行列であれば重み行列Hは必ず非負値行列に更新される。
本実施の形態において、パラメータ更新部3は、上述のとおり算出された式48,53,64,73に基づき、基底行列W、重み行列H、分布混合比λおよびガウス分布の分散σを更新し、ガウス分布率行列生成部2により生成されたガウス分布率行列Γのもとで補助関数Gを最大化させている。つまり、この補助関数Gを最大化させるように更新を繰り返すことによって、収束判定部4は、目的関数Lを効率的に局所最大化させるための基底行列W、重み行列H、分布混合比λおよびガウス分布の分散σを得て、パラメータの更新判定を実行することができる。
[更新式の性質]
ここで、下に示す式74および式75のときの、
Figure 2010039723
Figure 2010039723
前記基底行列Wおよび重み行列Hの更新式(式64,73参照)の性質について説明する。
式74のとき、ガウス分布率γの式45より
Figure 2010039723
すなわち、ガウス分布率行列Γは、
Figure 2010039723
である。
同様に、式75のとき、ガウス分布率行列Γは、
Figure 2010039723
である。
まず、ガウス分布率行列Γ´=「1(太字)」すなわち、ガウス分布率行列Γ´がすべて1のK×Jの行列であるとき、
Figure 2010039723
となり、これらを基底行列Wおよび重み行列Hの更新式(式64,73参照)に代入すると、基底行列Wおよび重み行列Hは、それぞれ
Figure 2010039723
Figure 2010039723
となり、この結果は、フロベニウスノルムで定義されたF(X,WH)を小さくする基底行列Wおよび重み行列Hの更新式(式7,8参照)とそれぞれ一致する。
一方、
Figure 2010039723
という条件のもとで、次式が成り立つ。
Figure 2010039723
ただし、|・|は、「・」が行列のとき、行列の要素ごとの絶対値をとる演算子を表す。
同様にして
Figure 2010039723
では、
Figure 2010039723
となり、これらを基底行列Wおよび重み行列Hの更新式(式64,73参照)に代入すると、基底行列Wおよび重み行列Hは、それぞれ
Figure 2010039723
Figure 2010039723
となり、この結果は、Iダイバージェンスで定義されたI(X,WH)を小さくする基底行列Wおよび重み行列Hの更新式(式9,10参照)とそれぞれ一致する。
したがって、基底行列Wの更新式(式64)および重み行列Hの更新式(式73)は、2種類の乗法更新式を内包するハイブリッドな乗法更新式である。
本発明は、パラメータ更新部3により、このハイブリッドな乗法更新式を用いて基底行列Wおよび重み行列Hを更新している。
このため、本発明は、ポアソン分布とガウス分布の混合分布により尤度関数を定義し、観測データに応じてNMFパラメータだけでなく、観測データの統計分布の分布形も適用的に推定することができる。
なお、上述の図3に示したポアソン分布の尤度関数の概形は、次式に示すポアソン分布の尤度関数の概形である。
Figure 2010039723
また、上述の図4に示したガウス分布の尤度関数の概形は、次式に示すガウス分布の尤度関数の概形である。
Figure 2010039723
ここで、以下上述の数式についての記号の定義について説明する。
非負値行列とは、全成分が非負(0以上)の値で構成される行列である。
次式に示す記号は、「全てのk,iに対して」という意味を表している。
Figure 2010039723
次式に示す記号は、「行列H´の転置行列」という意味を表している。
Figure 2010039723
次式に示す記号は、「左辺の式を右辺の式で定義する」という意味を表している。
Figure 2010039723
次式に示す記号は、「K次元非負値ベクトルの空間」という意味を表している。
Figure 2010039723
次式に示す記号は、「ベクトルwの全ての成分が非負(0以上)である」という意味を表している。
Figure 2010039723
次式に示す記号は、「左辺の式を右変の式で近似する」という意味を表している。
Figure 2010039723
式96に示す記号は、式97に示す「フロベニウスノルム」を表している。
Figure 2010039723
Figure 2010039723
次式に示す記号は、「右辺を左辺に代入する(左辺の式を右辺の式で置き換える)」という意味を表している。
Figure 2010039723
次式に示す記号は、「整数全体からなる集合」という意味を表している。
Figure 2010039723
次式に示す記号は、「0から1の間(区間)に含まれる(0<ガウス分布率γ<1)」という意味を表している。
Figure 2010039723
なお、上述の初期パラメータ生成部1、ガウス分布率行列生成部2、パラメータ更新部3、収束判定部4、分解行列出力部5における、図2を用いて説明したそれぞれの動作の過程は、コンピュータに実行させるためのプログラムや、このプログラムとしてコンピュータ読み取り可能な記録媒体として利用可能であり、コンピュータシステムが読み出して実行することによって、上記処理が行われる。なお、ここでいう「コンピュータシステム」とは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組合せで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
本実施形態による非負値行列分解の数値計算装置の一例を示す概略ブロック図である。 本実施形態による非負値行列分解の数値計算方法の一例を示すフローチャートである。 ポアソン分布の尤度関数の概形である。 ガウス分布の尤度関数の概形である。 ポアソン分布とガウス分布の混合分布の概形である。
符号の説明
1 初期パラメータ生成部
2 ガウス分布率行列生成部
3 パラメータ更新部
4 収束判定部
5 分解行列出力部
31 分布混合比更新部
32 ガウス分布分散更新部
33 基底行列更新部
34 重み行列更新部

Claims (6)

  1. 非負値データを格納した非負値ベクトルが並べられた観測データに基づき、この観測データに応じた非負値行列分解モデルのパラメータを計算する非負値行列分解の数値計算方法において、
    初期パラメータ生成部が、
    前記非負値行列分解モデルのパラメータである、基底行列、重み行列、ガウス分布とポアソン分布の混合比率をあらわす分布混合比、およびガウス分布の分散のそれぞれの初期値を生成し、
    前記ガウス分布率行列生成部が、
    前記初期パラメータ生成部から入力された前記パラメータの初期値、あるいは、パラメータ更新部により更新された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散の値に基づき、前記観測データの各要素がガウス分布およびポアソン分布のうちガウス分布から生成された確率を表したガウス分布率行列を生成し、
    前記パラメータ更新部の分布混合比更新部が、
    前記ガウス分布率行列に基づき、前記分布混合比を更新し、
    前記パラメータ更新部のガウス分布分散更新部が、
    前記ガウス分布率行列、前記基底行列、前記重み行列、および前記観測データに基づき、前記ガウス分布の分散を更新し、
    前記パラメータ更新部の基底行列更新部が、
    前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記基底行列を更新し、
    前記パラメータ更新部の重み行列更新部が、
    前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記重み行列を更新し、
    収束判定部は、
    前記パラメータ更新部により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしているか否かを判定し、
    前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていない場合、前記ガウス分布率行列生成部に前記ガウス分布率行列の生成を指示する信号を出力し、この生成された前記ガウス分布率行列に基づき前記パラメータ更新部により更新されたパラメータの更新を再度判定し、
    分解行列出力部は、
    前記収束判定部により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていると判定された場合、更新された前記基底行列および前記重み行列を出力する
    ことを特徴とする非負値行列分解の数値計算方法。
  2. 前記収束判定部は、前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、前記ポアソン分布とガウス分布の混合分布により定義された目的関数を最大化する所定の基準を満たしているか否かを判断することを特徴とする請求項1に記載の非負値行列分解の数値計算方法。
  3. 非負値データを格納した非負値ベクトルが並べられた観測データに基づき、この観測データに応じた非負値行列分解モデルのパラメータを計算する非負値行列分解の数値計算装置において、
    前記非負値行列分解モデルのパラメータである、基底行列、重み行列、ガウス分布とポアソン分布の混合比率をあらわす分布混合比、およびガウス分布の分散のそれぞれの初期値を生成する初期パラメータ生成部と、
    前記初期パラメータ生成部から入力された前記パラメータの初期値、あるいは、パラメータ更新部により更新された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散に基づき、前記観測データの各要素がガウス分布およびポアソン分布のうちガウス分布から生成された確率を表したガウス分布率行列を生成するガウス分布率行列生成部と、
    前記ガウス分布率行列生成部から入力された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散を、それぞれ更新する基底行列更新部、重み行列更新部、分布混合比更新部、およびガウス分布分散更新部を有するパラメータ更新部と、
    前記パラメータ更新部により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしているか否かを判定し、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていない場合、前記ガウス分布率行列生成部に前記ガウス分布率行列の生成を指示する信号を出力し、この生成された前記ガウス分布率行列に基づき前記パラメータ更新部により更新されたパラメータの更新を再度判定する収束判定部と、
    前記収束判定部により、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていると判定された場合、前記基底行列および前記重み行列を出力する分解行列出力部とを備え、
    前記パラメータ更新部は、
    前記ガウス分布率行列に基づき、前記分布混合比を更新する分布混合比更新部と、
    前記ガウス分布率行列、前記基底行列、前記重み行列、および前記観測データに基づき、前記ガウス分布の分散を更新するガウス分布分散更新部と、
    前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記基底行列を更新する基底行列更新部と、
    前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記重み行列を更新する重み行列更新部を有することを特徴とする非負値行列分解の数値計算装置。
  4. 前記収束判定部は、前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、前記ポアソン分布とガウス分布の混合分布により定義された目的関数を最大化する所定の基準を満たしているか否かを判断することを特徴とする請求項3に記載の非負値行列分解の数値計算装置。
  5. 非負値データを格納した非負値ベクトルが並べられた観測データに基づき、この観測データに応じた非負値行列分解モデルのパラメータを計算するコンピュータに、
    前記非負値行列分解モデルのパラメータである、基底行列、重み行列、ガウス分布とポアソン分布の混合比率をあらわす分布混合比、およびガウス分布の分散のそれぞれの初期値を生成する初期パラメータ生成手段と、
    前記初期パラメータ生成手段から入力された前記パラメータの初期値、あるいは、更新手段により更新された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散に基づき、前記観測データの各要素がガウス分布およびポアソン分布のうちガウス分布から生成された確率を表したガウス分布率行列を生成するガウス分布率行列生成手段と、
    前記ガウス分布率行列に基づき、前記分布混合比を更新する更新手段と、
    前記ガウス分布率行列、前記基底行列、前記重み行列、および前記観測データに基づき、前記ガウス分布の分散を更新する更新手段と、
    前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記基底行列を更新するガウス分布分散更新手段と、
    前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記重み行列を更新する基底行列更新手段と、
    前記更新手段により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしているか否かの前記パラメータの更新を判定し、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていない場合、前記ガウス分布率行列生成手段に前記ガウス分布率行列の生成を指示する信号を出力し、この生成された前記ガウス分布率行列に基づき前記更新手段により更新された前記パラメータの更新を再度判定する収束判定手段と、
    前記収束判定手段により、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていると判定された場合、前記基底行列および前記重み行列を出力する分解行列出力手段と、
    を実行させるためのプログラム。
  6. 非負値データを格納した非負値ベクトルが並べられた観測データに基づき、この観測データに応じた非負値行列分解モデルのパラメータを計算するコンピュータに、
    前記非負値行列分解モデルのパラメータである、基底行列、重み行列、ガウス分布とポアソン分布の混合比率をあらわす分布混合比、およびガウス分布の分散のそれぞれの初期値を生成する初期パラメータ生成手段と、
    前記初期パラメータ生成手段から入力された前記パラメータの初期値、あるいは、更新手段により更新された前記基底行列、前記重み行列、前記分布混合比、および前記ガウス分布の分散に基づき、前記観測データの各要素がガウス分布およびポアソン分布のうちガウス分布から生成された確率を表したガウス分布率行列を生成するガウス分布率行列生成手段と、
    前記ガウス分布率行列に基づき、前記分布混合比を更新する更新手段と、
    前記ガウス分布率行列、前記基底行列、前記重み行列、および前記観測データに基づき、前記ガウス分布の分散を更新する更新手段と、
    前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記基底行列を更新する更新手段と、
    前記ガウス分布率行列、前記基底行列、前記重み行列、前記観測データ、および前記ガウス分布の分散に基づき、前記重み行列を更新する更新手段と、
    前記更新手段により更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしているか否かの前記パラメータの更新を判定し、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていない場合、前記ガウス分布率行列生成手段に前記ガウス分布率行列の生成を指示する信号を出力し、この生成された前記ガウス分布率行列に基づき前記更新手段により更新された前記パラメータの更新を再度判定する収束判定手段と、
    前記収束判定手段により、前記更新された前記基底行列、前記重み行列、前記分布混合比および前記ガウス分布の分散が、それぞれ所定の基準を満たしていると判定された場合、前記基底行列および前記重み行列を出力する分解行列出力手段とを実行させるためのプログラムを記憶した記憶媒体。
JP2008201274A 2008-08-04 2008-08-04 非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体 Expired - Fee Related JP5068228B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008201274A JP5068228B2 (ja) 2008-08-04 2008-08-04 非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008201274A JP5068228B2 (ja) 2008-08-04 2008-08-04 非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体

Publications (2)

Publication Number Publication Date
JP2010039723A true JP2010039723A (ja) 2010-02-18
JP5068228B2 JP5068228B2 (ja) 2012-11-07

Family

ID=42012215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008201274A Expired - Fee Related JP5068228B2 (ja) 2008-08-04 2008-08-04 非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体

Country Status (1)

Country Link
JP (1) JP5068228B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8731881B2 (en) 2011-03-18 2014-05-20 Nec Corporation Multivariate data mixture model estimation device, mixture model estimation method, and mixture model estimation program
KR20150064602A (ko) * 2013-12-03 2015-06-11 삼성전자주식회사 신규 물질 탐색 시스템 및 그 탐색 방법
JP2016038680A (ja) * 2014-08-06 2016-03-22 学校法人電子開発学園 計算処理装置、計算処理方法、計算処理システム、及びプログラム
WO2020013236A1 (ja) * 2018-07-11 2020-01-16 日本電信電話株式会社 データ解析装置、方法、及びプログラム
CN114878735A (zh) * 2021-01-22 2022-08-09 株式会社岛津制作所 通过两个变量确定的数据的解析方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258440A (ja) * 2004-03-12 2005-09-22 Mitsubishi Electric Research Laboratories Inc 別個の信号の成分を分離する方法およびシステム
JP2008215881A (ja) * 2007-02-28 2008-09-18 National Institute Of Advanced Industrial & Technology 信号強度の時系列情報の解析方法、解析プログラム、並びに解析装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005258440A (ja) * 2004-03-12 2005-09-22 Mitsubishi Electric Research Laboratories Inc 別個の信号の成分を分離する方法およびシステム
JP2008215881A (ja) * 2007-02-28 2008-09-18 National Institute Of Advanced Industrial & Technology 信号強度の時系列情報の解析方法、解析プログラム、並びに解析装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8731881B2 (en) 2011-03-18 2014-05-20 Nec Corporation Multivariate data mixture model estimation device, mixture model estimation method, and mixture model estimation program
KR20150064602A (ko) * 2013-12-03 2015-06-11 삼성전자주식회사 신규 물질 탐색 시스템 및 그 탐색 방법
KR102224714B1 (ko) 2013-12-03 2021-03-08 삼성전자주식회사 신규 물질 탐색 시스템 및 그 탐색 방법
JP2016038680A (ja) * 2014-08-06 2016-03-22 学校法人電子開発学園 計算処理装置、計算処理方法、計算処理システム、及びプログラム
WO2020013236A1 (ja) * 2018-07-11 2020-01-16 日本電信電話株式会社 データ解析装置、方法、及びプログラム
JP2020009314A (ja) * 2018-07-11 2020-01-16 日本電信電話株式会社 データ解析装置、方法、及びプログラム
JP7014069B2 (ja) 2018-07-11 2022-02-01 日本電信電話株式会社 データ解析装置、方法、及びプログラム
CN114878735A (zh) * 2021-01-22 2022-08-09 株式会社岛津制作所 通过两个变量确定的数据的解析方法
CN114878735B (zh) * 2021-01-22 2024-01-23 株式会社岛津制作所 通过两个变量确定的数据的解析方法

Also Published As

Publication number Publication date
JP5068228B2 (ja) 2012-11-07

Similar Documents

Publication Publication Date Title
Huang et al. Functional coefficient regression models for non‐linear time series: a polynomial spline approach
JP5068228B2 (ja) 非負値行列分解の数値計算方法、非負値行列分解の数値計算装置、プログラムおよび記憶媒体
Bistrian et al. Processing epidemiological data using dynamic mode decomposition method
US20100198897A1 (en) Deriving a function that represents data points
EP2546759A1 (en) Generation of recommendation values
WO2021213649A1 (en) Method and system for generating a predictive model
WO2020177863A1 (en) Training of algorithms
WO2019106758A1 (ja) 言語処理装置、言語処理システムおよび言語処理方法
CN115062777A (zh) 卷积神经网络的量化方法、神经网络、设备及存储介质
JP2019075003A (ja) 近似計算装置、近似計算方法及びプログラム
JP7349811B2 (ja) 訓練装置、生成装置及びグラフ生成方法
JP5956359B2 (ja) パラメータ推定方法、装置、及びプログラム
JP7158175B2 (ja) 情報処理装置、システム、情報処理方法及びプログラム
CN116472538A (zh) 用于量化神经网络的方法和系统
JP2021002322A (ja) イジングマシンデータ入力機器、及びイジングマシンにデータを入力する方法
WO2020040007A1 (ja) 学習装置、学習方法及び学習プログラム
CN111160487A (zh) 人脸图像数据集的扩充方法和装置
JP4313803B2 (ja) 行列における数値分解方法
JP4531738B2 (ja) 行列における数値分解方法
Gong et al. Adaptive methods for center choosing of radial basis function interpolation: a review
JP2021089388A (ja) 音響解析装置、音響解析方法及び音響解析プログラム
JP2005242580A (ja) パラメータ推定方法、データ予測方法、パラメータ推定装置、データ予測装置、及びコンピュータプログラム
JP5942998B2 (ja) 線形制約条件生成装置及び方法、半正定値最適化問題求解装置、計量学習装置、並びにコンピュータ・プログラム
WO2019008625A1 (ja) 信号処理装置、信号処理方法およびプログラムを記憶する記憶媒体
CN116433662B (zh) 一种基于稀疏分解与景深估计的神经元提取方法及装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100526

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100902

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120802

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120807

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120814

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150824

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5068228

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150824

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees