JP2008191467A - 混合モデル初期値算出装置及び混合モデル初期値算出プログラム - Google Patents

混合モデル初期値算出装置及び混合モデル初期値算出プログラム Download PDF

Info

Publication number
JP2008191467A
JP2008191467A JP2007026674A JP2007026674A JP2008191467A JP 2008191467 A JP2008191467 A JP 2008191467A JP 2007026674 A JP2007026674 A JP 2007026674A JP 2007026674 A JP2007026674 A JP 2007026674A JP 2008191467 A JP2008191467 A JP 2008191467A
Authority
JP
Japan
Prior art keywords
multidimensional
initial value
mixed model
data
histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007026674A
Other languages
English (en)
Other versions
JP4902378B2 (ja
Inventor
Masahide Naemura
昌秀 苗村
Toshihiko Misu
俊彦 三須
Masaki Takahashi
正樹 高橋
Masato Fujii
真人 藤井
Nobuyuki Yagi
伸行 八木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2007026674A priority Critical patent/JP4902378B2/ja
Publication of JP2008191467A publication Critical patent/JP2008191467A/ja
Application granted granted Critical
Publication of JP4902378B2 publication Critical patent/JP4902378B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】解析対象となるデータに基づいて、混合モデルのパラメータの初期値を算出する混合モデル初期値算出装置を提供する。
【解決手段】混合モデル初期値算出装置1は、混合モデルの解析対象となる多次元観測信号(多次元データ)について、多次元ヒストグラムを生成する多次元ヒストグラム生成手段12と、多次元ヒストグラムの各値を、しきい値に基づいて二値化する多次元二値化手段13と、二値化されたデータについて、多次元空間において連続して所定値となる領域を抽出してラベリングする多次元ラベリング手段14と、ラベリングされた領域ごとに、当該領域に対応する多次元観測信号について統計量を算出して、領域の数と統計量とを、混合モデルにおける分布の数とパラメータとの初期値とするパラメータ初期値算出手段15とを備えることを特徴とする。
【選択図】図1

Description

本発明は、多次元のデータにおける混合モデルの解析に用いられるパラメータの初期値を算出する混合モデル初期値算出装置及び混合モデル初期値算出プログラムに関する。
従来、音声認識や画像認識等の様々な信号処理において、多次元信号の分布を、複数の分布を組み合わせた確率モデルである混合モデルに当てはめて解析することが行われる。この混合モデルは、例えば、EM(Expectation-Maximization)学習処理によって解析することができる。このEM学習処理は、パラメータ(例えば、ガウス分布の場合、平均、分散及び重み付け係数)及び分布の数(以下、単にパラメータと言う)の初期値を設定し、最尤的に最適なモデルにパラメータの値が収束するまで、パラメータの値を修正する処理を繰り返すものである。このEM学習処理は、初期値によって解析結果の良否が左右される(初期値依存性)という欠点を有する。これは、収束結果が大域的な最適解でなく、局所的な最適解に収束するためである。
そして、複数の初期値を設定して、それぞれについてEM学習した複数の処理結果を統計的な尤度が最大になるまで繰り返し、併合分割することにより初期値依存性を回避する方法が開示されている(特許文献1参照)。
特開2000−163395号公報(段落番号0017〜0049)
しかしながら、初期値は、経験的な知見に基づいて推定して設定されていたため、不適当な初期値が設定されてしまうと尤度の低い解析結果が得られてしまうという問題があった。また、特許文献1に記載の方法でも、初期値はランダムに選択されるため、初期値の設定による収束性や解析結果の良否への影響がなおも残るという問題があった。
本発明は、前記従来技術の問題を解決するために成されたもので、EM学習処理による混合モデルの解析対象となるデータに基づいて、混合モデルのパラメータの初期値を算出する混合モデル初期値算出装置及び混合モデル初期値算出プログラムを提供することを目的とする。
前記課題を解決するため、請求項1に記載の混合モデル初期値算出装置は、EM学習処理による混合モデルの解析に用いられる当該混合モデルの分布の数とパラメータとの初期値を算出する混合モデル初期値算出装置において、多次元ヒストグラム生成手段と、多次元二値化手段と、多次元ラベリング手段と、パラメータ初期値算出手段とを備える構成とした。
かかる構成によれば、混合モデル初期値算出装置は、多次元ヒストグラム生成手段によって、混合モデルの解析対象となる多次元のデータである多次元データについて、それぞれの次元のデータを累計することで多次元ヒストグラムを生成し、多次元二値化手段によって、多次元ヒストグラムの各値を、しきい値に基づいて二値化する。また、混合モデル初期値算出装置は、多次元ラベリング手段によって、多次元二値化手段で二値化されたデータである二値化データについて、多次元空間において連続して所定値となる領域を抽出してラベリングする。このようにして得られた情報は、多次元データの分布状態を反映したものであり、それぞれラベリングされた領域ごとに多次元データが偏在することを示している。更に、混合モデル初期値算出装置は、パラメータ初期値算出手段によって、ラベリングされた領域ごとに、当該領域に対応する多次元データについて統計量を算出して、領域の数及び統計量を、分布の数及びパラメータの初期値とする。
これによって、混合モデル初期値算出装置は、多次元データの分布状態に基づいて、混合モデルにおける分布の数とパラメータとの初期値を算出することができる。
また、請求項2に記載の混合モデル初期値算出装置は、請求項1に記載の混合モデル初期値算出装置において、前記多次元データに対して次元圧縮処理を行う次元圧縮手段を更に備え、前記多次元ヒストグラム生成手段が、前記次元圧縮手段によって次元圧縮されたデータについて多次元ヒストグラムを生成する構成とした。
これによって、混合モデル初期値算出装置は、多次元データを次元圧縮した後、混合モデルにおける分布の数とパラメータとの初期値を算出することができる。
また、請求項3に記載の混合モデル初期値算出装置は、請求項2に記載の混合モデル初期値算出装置において、前記次元圧縮手段が、主成分分析によって次元圧縮処理を行い、前記多次元ヒストグラム生成手段が、前記次元圧縮手段による主成分分析で得られた固有値に基づいて、前記ヒストグラムの区間数を算出する構成とした。
ここで、次元圧縮処理を行ったデータの各次元の軸は、主成分分析における基底ベクトルとなる。そして、この基底ベクトルは固定ベクトルに、各々の基底ベクトルに対応する固有の値は固有値に相当する。そして、混合モデル初期値算出装置は、多次元ヒストグラムの軸長と量子化幅とを、この固有値に基づいて設定することができる。
また、請求項4に記載の混合モデル初期値算出プログラムは、EM学習処理による混合モデルの解析に用いられる当該混合モデルの分布の数とパラメータとの初期値を算出するためにコンピュータを、多次元ヒストグラム生成手段、多次元二値化手段、多次元ラベリング手段、パラメータ初期値算出手段として機能させることとした。
かかる構成によれば、混合モデル初期値算出プログラムは、多次元ヒストグラム生成手段によって、混合モデルの解析対象となる多次元のデータである多次元データについて、それぞれの次元のデータを累計することで多次元ヒストグラムを生成し、多次元二値化手段によって、多次元ヒストグラムの各値を、しきい値に基づいて二値化する。また、混合モデル初期値算出プログラムは、多次元ラベリング手段によって、多次元二値化手段で二値化されたデータである二値化データについて、多次元空間において連続して所定値となる領域を抽出してラベリングし、パラメータ初期値算出手段によって、ラベリングされた領域ごとに、当該領域に対応する多次元データについて統計量を算出して、領域の数及び統計量を、分布の数及びパラメータの初期値とする。
これによって、混合モデル初期値算出プログラムは、多次元データの分布状態に基づいて、混合モデルにおける分布の数とパラメータとの初期値を算出することができる。
本発明に係る混合モデル初期値算出装置及び混合モデル初期値算出プログラムでは、以下のような優れた効果を奏する。請求項1及び請求項4に記載の発明によれば、EM学習処理による混合モデルの解析に用いられるパラメータの初期値を、多次元データの分布状態に即して求めることが可能になる。これによって、EM学習処理による統計的なパラメータ推定処理の大域解への収束性が向上する。
請求項2に記載の発明によれば、次元圧縮することで、多次元データの特徴を残したまま、その後の処理における計算量を低減することができる。
請求項3に記載の発明によれば、多次元ヒストグラムの軸長と量子化幅とを主成分分析における固有値に基づいて設定することで、多次元データの分布状態をより適切に示す多次元ヒストグラムを生成することができ、多次元データの分布状態により即したパラメータの初期値を求めることができる。
以下、本発明の実施の形態について図面を参照して説明する。
[混合モデル初期値算出装置の構成]
まず、図1を参照して、本発明における混合モデル初期値算出装置1の構成について説明する。図1は、本発明における混合モデル初期値算出装置の構成を模式的に示した模式図である。なお、ここでは、混合モデル初期値算出装置1が、ガウス混合モデルのパラメータの初期値を算出する場合について説明するが、本発明の混合モデル初期値算出装置は、例えば、ラプラシアンモデルやポワソンモデル等の様々な混合モデルにおけるパラメータの初期値の算出にも適用することができる。
混合モデル初期値算出装置1は、外部から入力された多次元観測信号(多次元データ)に基づいて、当該多次元観測信号の分布をEM学習処理によってガウス混合モデルのパラメータ推定する際におけるパラメータの初期値を算出するものである。ここで、混合モデル初期値算出装置1は、次元圧縮手段11と、多次元ヒストグラム生成手段12と、多次元二値化手段13と、多次元ラベリング手段14と、初期混合モデルパラメータ推定手段15とを備える。ここで、多次元観測信号とは、統計的パラメータの推定対象となる多次元の信号であり、例えば、音声や画像の観測信号である。
次元圧縮手段11は、入力された多次元観測信号に次元圧縮処理を行い、低次の次元圧縮信号に変換するものである。ここで変換された次元圧縮信号は、多次元ヒストグラム生成手段12に出力される。ここでは、次元圧縮手段11が、PCA(主成分分析)によって次元圧縮することとした。以下、次元圧縮手段11が、PCAによって多次元観測信号を次元圧縮する方法について説明する。
まず、次元圧縮手段11は、M個のN次元信号である多次元観測信号を入力し、以下の式(1)に示すような行列Dを生成する。なお、dij(i=1,…,N、j=1,…,M)は、多次元観測信号の成分である。
Figure 2008191467
そして、次元圧縮手段11は、N個の基底ベクトルe〜eから、N’個(N’<N)の基底ベクトルe〜eN’を選択して、以下の式(2)のような変換行列Eを生成する。このとき、次元圧縮手段11は、次元ごとの成分dij間の共分散行列又は相関行列の固有値を算出し、固有値λ〜λの値が大きい順に並べたとき(λ>…>λN’>…>λ)の固有値λ〜λN’に対応する基底ベクトルe〜eN’を選択する。
E=[e…eN’] …(2)
なお、N’は、次元圧縮により生成される次元圧縮信号の次元の数である。このN’は、所定値としてもよく、例えば、30次元(N=30)の音声信号を多次元観測信号として入力する場合に、次元圧縮手段11が次元圧縮処理によって4次元(N’=4)の次元圧縮信号を生成することとしてもよい。また、N’は、寄与率に基づいて決定されることとしてもよく、以下の式(3)に示すように、寄与率Pがしきい値Th1(例えば、80%)以下になる最大のN’を設定することとしてもよい。
Figure 2008191467
更に、次元圧縮手段11は、以下の式(4)によって、次元圧縮信号の行列D’を算出する。以上のようにして、次元圧縮手段11が、多次元観測信号を次元圧縮して、次元圧縮信号を生成することができる。そして、ここでは、次元圧縮手段11が、次元圧縮信号とともに、対応する固有値λ〜λN’を多次元ヒストグラム生成手段12に出力することとした。
D’=ED …(4)
多次元ヒストグラム生成手段12は、次元圧縮手段11から入力された次元圧縮信号から多次元ヒストグラムを生成するものである。ここで生成された多次元ヒストグラムは、多次元二値化手段13に出力される。ここでは、多次元ヒストグラム生成手段12は、次元圧縮手段11の主成分分析によって変換された次元圧縮信号の各次元を軸とする多次元空間で次元圧縮信号の頻度を求め、多次元ヒストグラムを生成することとした。更に、多次元ヒストグラム生成手段12は、次元圧縮手段11から入力された主成分分析の固有値に基づいて、多次元ヒストグラムの区間数(ビン数)を決定することとした。以下、多次元ヒストグラム生成手段12が、多次元ヒストグラムを生成する方法について説明する。
ここで、多次元ヒストグラム生成手段12は、次元圧縮手段11からN’次元空間の次元圧縮信号と、固有値λ〜λN’とを入力すると、N’次元空間の各軸のスケール量子化を行う。つまり、多次元ヒストグラム生成手段12は、以下の式(5)に示すように、次元圧縮信号の次元ごとの最小値の行列d’minと最大値の行列d’maxとを算出し、この2つの行列の差分の行列d’rangeを算出する。ここで、min()は括弧内の数値のうちの最小値、max()は括弧内の数値のうちの最大値を示し、d’ij(i=1,…,N’、j=1,…,M)は次元圧縮信号の成分である。
d’min=[min(d’11,…,d’1M) … min(d’N’1,…,d’N’M)]
d’max=[max(d’11,…,d’1M) … max(d’N’1,…,d’N’M)]
d’range=d’max−d’min …(5)
更に、多次元ヒストグラム生成手段12は、以下の式(6)に基づいて、スケールファクタベクトルsを算出する。なお、Hは、予め選択された整数(例えば、256)である。また、d’range(i=1,…,N’)は、行列d’rangeの各成分である。
Figure 2008191467
更に、多次元ヒストグラム生成手段12は、以下の式(7)に示すように、次元圧縮信号の行列D’の各成分にスケールファクタベクトルsを乗算して、整数化した整数化データh(i=1,…,M)を生成する。なお、round()は、括弧内の数値の整数化(例えば、四捨五入)を示す。また、s(i=1,…,N’)は、スケールファクタベクトルsの各成分である。これによって、多次元ヒストグラム生成手段12は、N’次元空間の各軸のスケール量子化ができる。
Figure 2008191467
そして、多次元ヒストグラム生成手段12は、変換されたデータについて頻度を求め、N’次元ヒストグラムを生成する。ここでは、以下の式(8)に示すようにして、頻度F(i=1,…,M)を計測する。なお、cardinal()とは、要素数を返す関数である。更に、多次元ヒストグラム生成手段12は、算出された頻度Fに基づいてN’次元のヒストグラムを生成する。
=cardinal(d’∈h) …(8)
なお、多次元ヒストグラム手段12は、生成されたヒストグラムについて、線形フィルタ操作を施すこととしてもよい。ここで、線形フィルタとして、例えば、近傍N要素のガウスフィルタを設計する場合には、対象要素を中心にガウス正規分布を仮定し、それぞれの次元軸にN要素までの値を取り出して、それらの値の総和が1になるように正規化した値をフィルタ係数とする。例えば、2次元上で近傍5要素のガウスフィルタの場合は、5×5タップ長の2次元ローパスフィルタが生成される。
多次元二値化手段13は、多次元ヒストグラム生成手段12から入力された多次元ヒストグラムを、しきい値に基づいて二値化した多次元二値化信号(二値化データ)を生成するものである。ここで生成された多次元二値化信号は、多次元ラベリング手段14に出力される。以下、多次元二値化手段13が、多次元ヒストグラムを多次元二値化信号に変換する方法について説明する。
多次元二値化手段13は、ヒストグラム空間(N’次元空間)における整数化データh(i=1,…,N’)に対応する各点において、以下の式(9)に基づいて多次元二値化信号B[h]を生成する。なお、hist(h)は、整数化データhに対応する点における多次元ヒストグラムの値を示す。また、Th2はしきい値である。このしきい値Th2は、基本的には予め設定されたものとするが、後記する多次元ラベリング手段14においてラベル数がある決められた数に近づくように調整することとしてもよい。
Figure 2008191467
ここで、図2を参照(適宜図1参照)して、多次元二値化手段13が、一例として1次元のヒストグラムから1次元の二値化信号を生成する場合について説明する。図2は、1次元のヒストグラムから1次元の二値化信号を生成する例を説明するための説明図、(a)は、1次元のヒストグラムの例を模式的に示したグラフ、(b)は、(a)の1次元のヒストグラムを二値化した1次元の二値化信号の例を模式的に示したグラフである。
多次元二値化手段13は、図2(a)のヒストグラムの値hist(h)がしきい値Th2より小さい部分p、p、pの信号を、図2(b)に示すように、値が「0」の二値化信号B[h]に変換する。一方、多次元二値化手段13は、図2(a)のヒストグラムの値hist(h)がしきい値Th2より大きい部分p、pの信号を、図2(b)に示すように、値が「1」の二値化信号B[h]に変換する。なお、次元が増しても、多次元二値化手段13が各次元について同様の処理を行うことで、多次元二値化信号を生成することができる。
多次元ラベリング手段14は、多次元二値化手段13から入力された多次元二値化信号が、多次元空間において連続して同一の値をとる領域に、同一のラベルを付与し、多次元ラベル信号を生成するものである。ここで生成された多次元ラベル信号は、初期混合モデルパラメータ推定手段15に出力される。
ここで、多次元ラベリング手段14は、以下の式(10)に従って、多次元二値化信号B[h](i=1,…,N’)にラベルを付与し、多次元ラベル信号L[h]を生成する。なお、Lmaxは、ラベリング処理で得られた総ラベル数である。
B[h]…B[hN’]∈{0,1} → L[h]…L[hN’]∈{1,…,Lmax} …(10)
ここで、図3を参照(適宜図1参照)して、多次元ラベリング手段14が、2次元の二値化信号から多次元ラベル信号を生成する例について説明する。図3は、2次元の二値化信号から多次元ラベル信号を生成する例を説明するための説明図、(a)は、2次元の二値化信号の例を模式的に示した模式図、(b)は、(a)の2次元の二値化信号をラベリングした多次元ラベル信号の例を模式的に示した模式図である。なお、図3(a)において、2次元の二値化信号から構成される画像の各点の信号の値が「0」の領域R0を斜線で、「1」の領域R1〜R4を白(斜線無し)で示した。また、図3(b)において、多次元ラベル信号から構成される画像の領域R1〜R4内の点に付与されるラベル「1」〜「4」を、領域R1〜R4内の数字「1」〜「4」で示した。多次元ラベリング手段14は、図3に示すように、多次元二値化信号B[h]が連続して「1」となる領域R1〜R4に、それぞれラベル「1」〜「4」を付与する。
なお、多次元ラベリング手段14は、ラベリング処理によって得られた信号について、サイズの小さいものを除去したり、連結の幅が小さいもの切り分けたり、凹凸性からくぼみ部分を切り取るなどの非線形処理を施すこととしてもよい。多次元ラベリング手段14は、多次元空間において、ラベリングされた各領域について形状を解析し、代表的な凸形状を類推して、その結果を新たに多次元ラベル信号に置き変えることとしてもよい。
初期混合モデルパラメータ推定手段15は、多次元ラベリング手段14から入力された多次元ラベル信号と、外部から入力された多次元観測信号とに基づいて、ガウス混合モデルのパラメータ推定におけるパラメータの初期値を算出するものである。ここで算出された初期値は、外部に出力される。なお、多次元ラベリング手段14によってラベリングされた領域の数が、ガウス混合モデルにおけるガウス分布の数を示し、各領域の要素数(ラベリングサイズ)に比例する値を、各ガウス分布の重み付け係数の初期値とした。更に、各領域についての多次元観測データの統計量の解析結果を、各ガウス分布の平均及び分散の初期値とした。
以下、ガウス混合モデルの場合におけるパラメータの初期値の算出方法について説明する。ここでは初期混合モデルパラメータ推定手段15は、以下の式(11)〜(14)によって混合数(分布数)Kと、各ラベルL(i=1〜Lmax)に対応するガウス分布の混合係数(重み付け係数)Mix[i]、平均μ及び分散νを算出する。ここで、size(L)(i=1〜Lmax)は、各ラベルのラベリングサイズである。また、Lbl(d’)は、特徴ベクトルd’が属するラベルを示す。
Figure 2008191467
なお、混合モデル初期値算出装置1は、コンピュータにおいて各手段を各機能プログラムとして実現することも可能であり、各機能プログラムを結合して、混合モデル初期値算出プログラムとして動作させることも可能である。
[混合モデル初期値算出装置の動作]
次に、図4を参照して、混合モデル初期値算出装置1の動作について説明する。図4は、本発明における混合モデル初期値算出装置が、混合モデルのパラメータの初期値を算出する動作を示したフローチャートである。
混合モデル初期値算出装置1は、次元圧縮手段11によって、多次元観測信号を入力して、次元圧縮処理を行う(ステップS11)。続いて、混合モデル初期値算出装置1は、多次元ヒストグラム生成手段12によって、ステップS11において次元圧縮された次元圧縮信号から多次元ヒストグラムを生成する(ステップS12)。
更に、混合モデル初期値算出装置1は、多次元二値化手段13によって、ステップS12において生成された多次元ヒストグラムを二値化する(ステップS13)。そして、混合モデル初期値算出装置1は、多次元ラベリング手段14によって、ステップS13において二値化された多次元二値化信号が、多次元空間において連続して同一の値をとる領域にラベリングし、多次元ラベル信号を生成する(ステップS14)。
更に、混合モデル初期値算出装置1は、初期混合モデルパラメータ推定手段15によって、ステップS14において生成された多次元ラベル信号と、ステップS11において外部から入力された多次元観測信号とに基づいて、混合モデルのパラメータ推定におけるパラメータの初期値を算出し(ステップS15)、動作を終了する。
以上のようにして、混合モデル初期値算出装置1は、EM学習処理による混合モデルの解析に用いられるパラメータの初期値を、多次元観測データに即して求めることが可能になる。これによって、EM学習処理による統計的なパラメータ推定処理の大域解への収束性が向上する。そして、本発明は、音声認識処理や画像認識処理等で用いられている混合モデルのパラメータ解析の対象となる様々な多次元データに適用することができる。
例えば、本発明を、混合モデルを用いたHMM(Hidden Markov Model;隠れマルコフモデル)のパラメータの初期値の推定に適用することができる。以下、図5を参照して、本発明をHMMのパラメータの初期値の推定に適用する場合について説明する。図5は、HMMのパラメータの初期値の推定の処理の流れを模式的に示すフローチャートである。
HMMにおいて、まず、入力された観測データについて混合数を1としたときのガウス分布を仮定して、パラメータ(roughパラメータ)を推定(ステップS21〜S24)した後に、本発明の混合モデル初期値算出装置1によるパラメータの初期値の推定を行うことが好ましい。このHMMにおけるroughパラメータの推定は、以下のように行うことができる。
すなわち、観測データ全体から平均、分散を計算し、状態ごとに適当な摂動を与えて、その結果を初期パラメータ(混合数=1)とする(ステップS21)。次に、求めた初期パラメータでHMM認識処理を行い、データをHMMの状態に振り分ける(ステップS22)。そして、それぞれの状態に属するデータで混合数1のガウスモデルのパラメータ(平均、分散)をroughパラメータとして求める。以上の処理を収束条件が満たされるまで繰り返す(ステップS23)ことにより、roughパラメータ推定の精度を向上させることが可能である。この時、認識結果の状態遷移を推定し(ステップS24)、推定確率の変化分を収束条件とした。なお、収束条件は予め定められた繰り返し回数としてもよい。
このようにして推定されたroughパラメータから、時間ごとにデータの存在する状態を推定する(ステップS25)。その後、これらの状態ごとに入力データを収集解析して、本発明の混合モデル初期値算出装置1を適用して混合モデルのパラメータの初期値を推定する(ステップS26)。
ここで、従来は、K−mean法などを用いて観測データを分離して混合モデルのパラメータの初期値を推定していたが、K−mean法では混合数を予め決めておく必要があるため、単純にデータから混合数を決めることができなかった。しかし、本発明では、観測データから自動的に混合数まで推定可能であり、より観測データの分布を反映した結果が得られる。なお、本発明の混合モデル初期値算出装置1を用いた混合モデルのパラメータの初期値の推定の際にも、roughパラメータの推定と同様に、収束条件が満たされるまで繰り返して推定精度を向上させることも可能である。
本発明における混合モデル初期値算出装置の構成を模式的に示した模式図である。 本発明における混合モデル初期値算出装置の多次元二値化手段が、1次元のヒストグラムから1次元の二値化信号を生成する例を説明するための説明図、(a)は、1次元のヒストグラムの例を模式的に示したグラフ、(b)は、(a)の1次元のヒストグラムを二値化した1次元の二値化信号の例を模式的に示したグラフである。 本発明における混合モデル初期値算出装置の多次元ラベリング手段が、2次元の二値化信号から多次元ラベル信号を生成する例を説明するための説明図、(a)は、2次元の二値化信号の例を模式的に示した模式図、(b)は、(a)の2次元の二値化信号をラベリングした多次元ラベル信号の例を模式的に示した模式図である。 本発明における混合モデル初期値算出装置が、混合モデルのパラメータの初期値を算出する動作を示したフローチャートである。 本発明における混合モデル初期値算出装置をHMMのパラメータの初期値の推定に適用した場合の処理の流れを模式的に示すフローチャートである。
符号の説明
1 混合モデル初期値算出装置
11 次元圧縮手段
12 多次元ヒストグラム生成手段
13 多次元二値化手段
14 多次元ラベリング手段
15 初期混合モデルパラメータ推定手段

Claims (4)

  1. EM学習処理による混合モデルの解析に用いられる当該混合モデルの分布の数とパラメータとの初期値を算出する混合モデル初期値算出装置において、
    前記混合モデルの解析対象となる多次元のデータである多次元データについて、それぞれの次元のデータを累計することで多次元ヒストグラムを生成する多次元ヒストグラム生成手段と、
    この多次元ヒストグラム生成手段によって生成された多次元ヒストグラムの各値を、しきい値に基づいて二値化する多次元二値化手段と、
    この多次元二値化手段によって二値化されたデータである二値化データについて、多次元空間において連続して所定値となる領域を抽出してラベリングする多次元ラベリング手段と、
    この多次元ラベリング手段によってラベリングされた前記領域ごとに、当該領域に対応する前記多次元データについて統計量を算出して、前記領域の数及び前記統計量を、前記分布の数及び前記パラメータの初期値とするパラメータ初期値算出手段と、
    を備えることを特徴とする混合モデル初期値算出装置。
  2. 前記多次元データに対して次元圧縮処理を行う次元圧縮手段を更に備え、
    前記多次元ヒストグラム生成手段が、前記次元圧縮手段によって次元圧縮されたデータについて多次元ヒストグラムを生成することを特徴とする請求項1に記載の混合モデル初期値算出装置。
  3. 前記次元圧縮手段が、主成分分析によって次元圧縮処理を行い、
    前記多次元ヒストグラム生成手段が、前記次元圧縮手段による主成分分析で得られた固有値に基づいて、前記ヒストグラムの区間数を算出することを特徴とする請求項2に記載の混合モデル初期値算出装置。
  4. EM学習処理による混合モデルの解析に用いられる当該混合モデルの分布の数とパラメータとの初期値を算出するためにコンピュータを、
    前記混合モデルの解析対象となる多次元のデータである多次元データについて、それぞれの次元のデータを累計することで多次元ヒストグラムを生成する多次元ヒストグラム生成手段、
    この多次元ヒストグラム生成手段によって生成された多次元ヒストグラムの各値を、しきい値に基づいて二値化する多次元二値化手段、
    この多次元二値化手段によって二値化されたデータである二値化データについて、多次元空間において連続して所定値となる領域を抽出してラベリングする多次元ラベリング手段、
    この多次元ラベリング手段によってラベリングされた前記領域ごとに、当該領域に対応する前記多次元データについて統計量を算出して、前記領域の数及び前記統計量を、前記分布の数及び前記パラメータの初期値とするパラメータ初期値算出手段として機能させることを特徴とする混合モデル初期値算出プログラム。
JP2007026674A 2007-02-06 2007-02-06 混合モデル初期値算出装置及び混合モデル初期値算出プログラム Expired - Fee Related JP4902378B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007026674A JP4902378B2 (ja) 2007-02-06 2007-02-06 混合モデル初期値算出装置及び混合モデル初期値算出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007026674A JP4902378B2 (ja) 2007-02-06 2007-02-06 混合モデル初期値算出装置及び混合モデル初期値算出プログラム

Publications (2)

Publication Number Publication Date
JP2008191467A true JP2008191467A (ja) 2008-08-21
JP4902378B2 JP4902378B2 (ja) 2012-03-21

Family

ID=39751619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007026674A Expired - Fee Related JP4902378B2 (ja) 2007-02-06 2007-02-06 混合モデル初期値算出装置及び混合モデル初期値算出プログラム

Country Status (1)

Country Link
JP (1) JP4902378B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8731881B2 (en) 2011-03-18 2014-05-20 Nec Corporation Multivariate data mixture model estimation device, mixture model estimation method, and mixture model estimation program
JP2016123873A (ja) * 2015-01-07 2016-07-11 株式会社東芝 X線ct装置、補正方法及び補正プログラム
JP2016194914A (ja) * 2015-03-31 2016-11-17 日本電気株式会社 混合モデル選択の方法及び装置
JP2016194912A (ja) * 2015-03-31 2016-11-17 日本電気株式会社 混合モデルの選択方法及び装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07287736A (ja) * 1994-04-19 1995-10-31 N T T Data Tsushin Kk 物品識別システム
JPH10149189A (ja) * 1996-11-20 1998-06-02 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 音声認識のための単語モデル生成装置及び音声認識装置
JP2000099078A (ja) * 1998-09-24 2000-04-07 Nec Corp 標準パターン学習装置
JP2000163395A (ja) * 1998-11-30 2000-06-16 Nippon Telegr & Teleph Corp <Ntt> 混合モデルの最尤推定方法および混合モデルの最尤推定プログラムを記録した記録媒体
JP2002169586A (ja) * 2000-09-19 2002-06-14 Atr Onsei Gengo Tsushin Kenkyusho:Kk 音声及び画像の合成モデル生成装置、音声及び画像の合成モデルのための環境適応化装置、並びに音声認識装置
JP2004094427A (ja) * 2002-08-30 2004-03-25 Hitachi Ltd 帳票画像処理装置及び該装置を実現するためのプログラム
WO2005050479A1 (ja) * 2003-11-21 2005-06-02 National University Corporation Kochi University 類似パターン検索装置、類似パターン検索方法、類似パターン検索プログラム、および分画分離装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07287736A (ja) * 1994-04-19 1995-10-31 N T T Data Tsushin Kk 物品識別システム
JPH10149189A (ja) * 1996-11-20 1998-06-02 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 音声認識のための単語モデル生成装置及び音声認識装置
JP2000099078A (ja) * 1998-09-24 2000-04-07 Nec Corp 標準パターン学習装置
JP2000163395A (ja) * 1998-11-30 2000-06-16 Nippon Telegr & Teleph Corp <Ntt> 混合モデルの最尤推定方法および混合モデルの最尤推定プログラムを記録した記録媒体
JP2002169586A (ja) * 2000-09-19 2002-06-14 Atr Onsei Gengo Tsushin Kenkyusho:Kk 音声及び画像の合成モデル生成装置、音声及び画像の合成モデルのための環境適応化装置、並びに音声認識装置
JP2004094427A (ja) * 2002-08-30 2004-03-25 Hitachi Ltd 帳票画像処理装置及び該装置を実現するためのプログラム
WO2005050479A1 (ja) * 2003-11-21 2005-06-02 National University Corporation Kochi University 類似パターン検索装置、類似パターン検索方法、類似パターン検索プログラム、および分画分離装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8731881B2 (en) 2011-03-18 2014-05-20 Nec Corporation Multivariate data mixture model estimation device, mixture model estimation method, and mixture model estimation program
JP2016123873A (ja) * 2015-01-07 2016-07-11 株式会社東芝 X線ct装置、補正方法及び補正プログラム
JP7002827B2 (ja) 2015-01-07 2022-01-20 キヤノンメディカルシステムズ株式会社 X線ct装置、補正方法及び補正プログラム
JP2016194914A (ja) * 2015-03-31 2016-11-17 日本電気株式会社 混合モデル選択の方法及び装置
JP2016194912A (ja) * 2015-03-31 2016-11-17 日本電気株式会社 混合モデルの選択方法及び装置

Also Published As

Publication number Publication date
JP4902378B2 (ja) 2012-03-21

Similar Documents

Publication Publication Date Title
US10692185B2 (en) Generative methods of super resolution
CN107564513B (zh) 语音识别方法及装置
Li et al. Background data resampling for outlier-aware classification
US8401283B2 (en) Information processing apparatus, information processing method, and program
US8331655B2 (en) Learning apparatus for pattern detector, learning method and computer-readable storage medium
US8472745B2 (en) Image processing method, apparatus, program, and recording medium for the same
CN102473280B (zh) 图像处理装置和方法以及数据处理装置和方法
US12002259B2 (en) Image processing apparatus, training apparatus, image processing method, training method, and storage medium
US11521099B2 (en) Dictionary generation apparatus, evaluation apparatus, dictionary generation method, evaluation method, and storage medium for selecting data and generating a dictionary using the data
Freitas et al. No-reference image quality assessment based on statistics of local ternary pattern
CN109961093B (zh) 一种基于众智集成学习的图像分类方法
CN102576453A (zh) 图像处理装置和方法、数据处理装置和方法、程序和记录介质
CN102473279A (zh) 图像处理装置和方法、数据处理装置和方法、程序和记录介质
KR101900180B1 (ko) 영상의 특성 추출을 위한 영상 분석 방법 및 장치
JP5051746B2 (ja) 特徴抽出装置及び方法並びにプログラム
CN110866439B (zh) 基于多特征学习及超像素核稀疏表示的高光谱图像联合分类方法
CN110135369A (zh) 一种行为识别方法、系统、设备及计算机可读存储介质
US10685264B2 (en) Visual data processing using energy networks
KR101556603B1 (ko) 랭크 정보를 이용한 영상 분리 장치 및 그 방법
JP4902378B2 (ja) 混合モデル初期値算出装置及び混合モデル初期値算出プログラム
JP2017033372A (ja) 人物認識装置及びそのプログラム
US20210192319A1 (en) Information processing apparatus, method, and medium
US10580127B2 (en) Model generation apparatus, evaluation apparatus, model generation method, evaluation method, and storage medium
Dieleman et al. Accelerating sparse restricted boltzmann machine training using non-gaussianity measures
KR101514551B1 (ko) 환경 변화에 강인한 멀티모달 사용자 인식

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090319

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111228

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees