JP6616472B2 - クラスタリング装置、クラスタリング方法及びクラスタリングプログラム - Google Patents

クラスタリング装置、クラスタリング方法及びクラスタリングプログラム Download PDF

Info

Publication number
JP6616472B2
JP6616472B2 JP2018166434A JP2018166434A JP6616472B2 JP 6616472 B2 JP6616472 B2 JP 6616472B2 JP 2018166434 A JP2018166434 A JP 2018166434A JP 2018166434 A JP2018166434 A JP 2018166434A JP 6616472 B2 JP6616472 B2 JP 6616472B2
Authority
JP
Japan
Prior art keywords
cluster
vector
target signal
clustering
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018166434A
Other languages
English (en)
Other versions
JP2018189994A (ja
Inventor
信貴 伊藤
智広 中谷
章子 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018166434A priority Critical patent/JP6616472B2/ja
Publication of JP2018189994A publication Critical patent/JP2018189994A/ja
Application granted granted Critical
Publication of JP6616472B2 publication Critical patent/JP6616472B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

本発明は、クラスタリング装置、クラスタリング方法及びクラスタリングプログラムに関する。
複数のマイクロホンにより取得した目的信号及び雑音を含む複数の観測信号から雑音を抑圧して目的信号を取得する技術として雑音除去技術がある。従来の雑音除去技術では、時間周波数領域(例えば短時間フーリエ変換領域)における目的信号のスパース性の仮定の下、「目的信号及び雑音からなる観測信号は、時間周波数領域の疎な点においてのみ目的信号を含み、他の点においては目的信号を含まず雑音のみを含む」というモデルを用いる。従来の雑音除去技術では、このモデルに基づき、観測信号の各時間周波数成分を、目的信号を含むものと含まないものとに分類する。
すなわち、従来の雑音除去技術では、上記モデルに基づき、「観測信号の各時間周波数成分から抽出した信号到来方向を特徴づける到来方向特徴量の分布は、目的信号を含む時間周波数成分においては目的信号の到来方向に対応する分布を持ち、目的信号を含まない時間周波数成分においては雑音の到来方向に対応する分布を持つ」と仮定する。そして、従来の雑音除去技術では、この仮定に基づき、到来方向特徴量に対してクラスタ数2のクラスタリングを適用することで、観測信号の時間周波数成分を、目的信号を含む時間周波数成分からなるクラスタ(以下「目的信号と対応するクラスタ」)と目的信号を含まない時間周波数成分からなるクラスタ(以下「目的信号と対応しないクラスタ」)とにクラスタリングする。
特開2013−054258号公報
しかしながら、上記技術では、目的信号と対応するクラスタと目的信号と対応しないクラスタへのクラスタリングはできても、得られた2つのクラスタのうちのどちらが目的信号と対応するクラスタであるかが不明である。そのため、各クラスタが、目的信号と対応するクラスタであるか、目的信号と対応しないクラスタであるかの判定を人為的に行う必要があるという問題がある。
本願が開示する実施形態の一例は、複数のマイクロホンにより取得した観測信号の時間周波数成分をクラスタリングすることで得られたクラスタの各々が、目的信号と対応するクラスタであるか、目的信号と対応しないクラスタであるかを判定することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の本願のクラスタリング装置は、複数のマイクロホンで目的信号を含む音を観測した複数の観測信号の時間周波数成分を前記目的信号と対応するクラスタと前記目的信号と対応しないクラスタとにクラスタリングするクラスタリング装置であって、各観測信号の時間周波数成分からなる観測信号ベクトルに対応する特徴量ベクトルを抽出する特徴抽出部と、前記特徴量ベクトルに所定の混合モデルを当てはめることで前記クラスタ毎かつ時間周波数成分毎の事後確率を算出するクラスタリング部と、を含み、前記混合モデルは、各クラスタに関する特徴量ベクトルのモデル分布の重み付き和で表され、前記各クラスタに関する特徴量ベクトルのモデル分布には、前記目的信号と対応しないクラスタに関する前記特徴量ベクトルのモデル分布は、前記目的信号と対応するクラスタに関する前記特徴量ベクトルのモデル分布よりも小さい到来方向局在度を持つという制約が課されていることを特徴とする。
本願が開示する実施形態の一例によれば、例えば、複数のマイクロホンにより取得した観測信号の時間周波数成分をクラスタリングすることで得られたクラスタの各々が、目的信号と対応するクラスタであるか、目的信号と対応しないクラスタであるかを判定することができる。
図1は、実施形態1(実施形態2)に係るクラスタ判定装置の一例を示す図である。 図2は、実施形態1(実施形態2)に係る第1例の到来方向局在度算出部を示す図である。 図3は、実施形態1(実施形態2)に係る第2例の到来方向局在度算出部を示す図である。 図4は、実施形態1(実施形態2)に係る第3例の到来方向局在度算出部を示す図である。 図5は、実施形態1に係る判定部の一例を示す図である。 図6は、実施形態1に係るクラスタ判定処理の一例を示すフローチャートである。 図7は、実施形態2に係るクラスタ判定処理の一例を示すフローチャートである。 図8は、実施形態3に係るクラスタリング装置の一例を示す図である。 図9は、実施形態3に係るクラスタリング処理の一例を示すフローチャートである。 図10は、プログラムが実行されることにより、実施形態に係るクラスタ判定装置及びクラスタリング装置が実現されるコンピュータの一例を示す図である。
以下、本願の開示技術に係る実施形態の一例の説明に先立ち、開示技術の前提及び背景となる従来技術について説明する。従来技術の説明後、本願の開示技術に係る実施形態の一例について説明する。以下、重複する構成及び処理については、後出部分について同一符号を付与して説明を省略する。また、以下、下記(1−1)式〜(1−3)式に示すように、「“^A”を“Aの直上に^を付した記号”」、「“〜A”を“Aの直上に〜を付した記号”」、「“AC B”を“Aに上付きBを付し、下付きCを付した記号”」と同等であるとする。また、以下、記号Aがスカラーを示す場合には単に“A”と表記し、記号Aがベクトルを示す場合には“ベクトルA”と表記し、記号Aが行列を示す場合には“行列A”と表記し、記号Aが集合を示す場合には“集合A”と表記する。
Figure 0006616472
[従来の雑音除去技術]
複数のマイクロホンにより取得した目的信号及び雑音を含む観測信号を用いて雑音を抑圧した強調信号を取得する従来の雑音除去技術について説明する。
従来の雑音除去技術では、「目的信号は時間周波数平面上の疎な点においてのみパワーを持つ」(スパース性)と仮定する。この仮定は音声信号に対して特に精度よく成立することが知られている。スパース性を仮定すれば、観測信号の各時間周波数成分は、下記(2)式に示す2つの状態のいずれかを取る。
Figure 0006616472
状態S(0)では観測信号は雑音のみを含むことに着目すれば、雑音共分散行列^Φf vは、下記(3)式により推定できる。
Figure 0006616472
ここで、ベクトルytf:=[ytf (1)・・・ytf (M)]T∈CM(CMはM次元複素ベクトル空間)は、M個のマイクロホンにおける観測信号の短時間フーリエ変換(以下、観測信号ベクトルと呼ぶ)、γtf (n)は状態S(n)(n=0,1)の検出により得られる各時間周波数点での状態S(n)の事後確率、t∈{1,・・・,T}は時間フレームの番号、f∈{1,・・・,F}は周波数ビンの番号、Tは時間フレームの数、Fは周波数ビンの数、上付きのTは転置、上付きのHはエルミート転置、変数の直上に付した^は推定値であることを示す記号である。雑音共分散行列^Φf vを用いれば、下記(4)式により、雑音を抑圧した強調信号である観測信号ベクトルytfへの目的信号の寄与ベクトルstf∈CMを推定できる。
Figure 0006616472
なお、上記(4)式において、ベクトル^vtfは観測信号ベクトルytfに含まれる雑音の寄与ベクトルvtfの推定値であるマルチチャネルウィーナフィルタ出力、γtf (1)は時間周波数マスク、行列^Φf yは観測共分散行列である。本アプローチによる雑音除去の性能は事後確率γtf (n)の精度に大きく依存する。
従来の雑音除去技術では、各時間周波数点にて観測信号ベクトルytfから抽出した信号到来方向を特徴づける到来方向特徴量ベクトルztfを、「状態S(0)と対応するクラスタ(目的信号と対応しないクラスタ)」と「状態S(1)と対応するクラスタ(目的信号と対応するクラスタ)」の2つのクラスタにクラスタリングすることで、事後確率γtf (n)を算出する。時間周波数成分(t,f)が状態S(n)(n=0,1)を取る場合の到来方向特徴量ベクトルztfの分布をp(ztf|S(n),Θ)、状態の事前分布をP(S(n)|Θ)とすれば、到来方向特徴量ベクトルztfの分布は、下記(5)式のように混合分布でモデル化される。
Figure 0006616472
ただし、上記(5)式における集合Θは、全てのモデルパラメータの集合である。EMアルゴリズムなどにより、下記(6)式の尤度を最大化するパラメータ集合Θを求めることにより、上記(5)式の混合分布を、観測された到来方向特徴量ベクトルztfの分布に当てはめる。得られたパラメータ集合Θの推定値^Θを用いれば、事後確率γtf (n)を、下記(7)式により算出することができる。
Figure 0006616472
Figure 0006616472
到来方向特徴量ベクトルztfとしては、下記(8)式により定義される観測信号ベクトルytfの単位方向ベクトルを用いることができる。なお、下記(8)式において、||*||2は、2ノルムを表す。
Figure 0006616472
上記(8)式による到来方向特徴量ベクトルztfは、異なる周波数ビンでは異なる分布形状を持つことから、従来の雑音除去技術では、周波数ビン毎に独立にクラスタリングを行う。この場合、1つの状態が、異なる周波数ビンでは異なるクラスタ番号を持つというパーミュテーション問題が生じる。そこで、1つの状態に対応するクラスタを周波数ビン間で束ねる後処理を行う。
このように、従来の雑音除去技術では、状態S(n)(n=0,1)に対する到来方向特徴量ベクトルztfの分布形状に関する事前知識をモデル化していないため、得られた2つのクラスタの各々が状態S(n)(n=0,1)のどちらに対応するか不明であるというクラスタのラベルの曖昧性が生じる。このため、従来の雑音除去技術では、雑音除去を行うために、クラスタリング後に人手で各クラスタを各状態に対応付ける必要がある。
本発明は、このような背景に鑑みてなされたものであり、クラスタのラベルの曖昧性を解消し、状態S(n)(n=0,1)と紐づいたクラスタを得るための技術を提供する。これにより、クラスタリング後に人手で各クラスタを各状態に対応付ける必要がなくなり、雑音除去を自動で行うことができるようになる。
これを実現するために、本発明では、「目的信号は特定方向から到来するのに対し、雑音は多方向から一様に到来する」という性質に着目する。この性質により、状態S(0)では目的信号が存在せず雑音のみが存在するため、信号到来方向は一様である(信号到来方向の局在性が小さい)のに対し、状態S(1)では目的信号が存在するため信号到来方向に偏りがある(信号到来方向の局在性が大きい)。本発明では、この点に着目し、クラスタ内の信号到来方向の局在性の大きさを表す到来方向局在度を用いて、「状態S(0)と対応するクラスタ(目的信号と対応しないクラスタ)」よりも「状態S(1)と対応するクラスタ(目的信号と対応するクラスタ)」の方がより大きい到来方向局在度を持つと仮定することで、クラスタのラベルの曖昧性を解消する。
<実施形態>
以下、本願の開示技術に係る実施形態の一例について、図面を参照して説明する。なお、以下の実施形態により、本願が開示する技術が限定されるものではない。また、以下の各実施形態は、適宜組合せてもよい。
[実施形態1]
開示技術の実施形態1では、複数のマイクロホンで取得した観測信号と、クラスタのラベルの曖昧性が存在する2つのクラスタの事後確率とを用いて、各クラスタの到来方向局在度を周波数ビン毎に算出し、この到来方向局在度の周波数方向への集約値が最大となるクラスタを目的信号と対応するクラスタと判定することで、クラスタのラベルの曖昧性を解消する。
(実施形態1に係るクラスタ判定装置)
図1は、実施形態1に係るクラスタ判定装置の一例を示す図である。実施形態1に係るクラスタ判定装置100は、M(≧2)個のマイクロホンで取得した観測信号の時間周波数変換ytf (1),・・・,ytf (M)と、「各クラスタが状態S(n)(n=0,1)のどちらに対応するかが不明である」というクラスタのラベルの曖昧性が存在する2つのクラスタの事後確率βtf (n)とを受け取って、クラスタのラベルの曖昧性が解消された事後確率γtf (n)を出力する。
なお、観測信号の時間周波数変換値ytf (1),・・・,ytf (M)をベクトルとしてまとめたものを観測信号ベクトルytfとして、下記(9)式のように定義する。以下、クラスタのラベルの曖昧性が存在する事後確率をβtf (n)、クラスタのラベルの曖昧性が存在しない事後確率をγtf (n)と区別する。
Figure 0006616472
クラスタ判定装置100は、クラスタ内の信号到来方向の局在性の大きさを表す到来方向局在度κf (n)を算出し、到来方向局在度κf (n)を周波数方向に集約した集約値が最大となるクラスタを目的信号と対応するクラスタと判定する。
クラスタ判定装置100は、到来方向局在度算出部10A(10B,10C)、判定部20を有する。到来方向局在度算出部10A(10B,10C)は、観測信号ベクトルytfと事後確率βtf (n)を受け取って、到来方向局在度κf (n)を算出し、判定部20に受け渡す。判定部20は、事後確率βtf (n)と到来方向局在度算出部10A(10B,10C)からの到来方向局在度κf (n)を受け取って、クラスタのラベルの曖昧性が解消された事後確率γtf (n)を算出して出力する。
到来方向局在度算出部10A(10B,10C)において算出する到来方向局在度としては、特徴量局在度、固有値スパース度、異方度等を用いることができる。以下では、特徴量局在度を用いる到来方向局在度算出部10Aを第1例とし、固有値スパース度を用いる到来方向局在度算出部10Bを第2例とし、異方度を用いる到来方向局在度算出部10Cを第3例として説明する。
(第1例の到来方向局在度算出部)
図2は、実施形態1に係る第1例の到来方向局在度算出部を示す図である。第1例の到来方向局在度算出部10Aが到来方向局在度として用いる特徴量局在度は、各時間周波数点で抽出された信号到来方向を特徴づける到来方向特徴量の局在性の大きさである。
到来方向局在度算出部10Aは、到来方向特徴量算出部10A−1、特徴量局在度算出部10A−2を有する。到来方向特徴量算出部10A−1は、観測信号ベクトルytfを受け取って、到来方向特徴量ベクトルztfを算出し、特徴量局在度算出部10A−2に受け渡す。到来方向特徴量としては、マイクロホン間の位相差や振幅比、マイクロホン間到来時間差、DOA(Direction Of Arrival)、観測信号ベクトルytfの単位方向ベクトル等がある。例えば、観測信号ベクトルytfの単位方向ベクトルは、下記(10)式により算出できる。
Figure 0006616472
特徴量局在度算出部10A−2は、事後確率βtf (n)と、到来方向特徴量算出部10A−1からの到来方向特徴量ベクトルztfを受け取って、特徴量局在度κf (n)を算出し、特徴量局在度κf (n)を到来方向局在度として出力する。
特徴量局在度κf (n)としては、到来方向特徴量ベクトルztfのクラスタ内分散の逆数、到来方向特徴量ベクトルztfのクラスタ内エントロピーの符号を反転させたものなどを用いることができる。また、到来方向特徴量ベクトルztfとして観測信号ベクトルytfの単位方向ベクトルを用いた場合には、観測された到来方向特徴量ベクトルztfの分布に複素ワトソン分布を当てはめたときの集中パラメータを特徴量局在度κf (n)として用いることもできる。
集中パラメータκf (n)は、以下の手順で算出できる。まず、単位方向ベクトルztfのクラスタ内共分散行列Rf (n)を、下記(11)式により算出する。
Figure 0006616472
次に、クラスタ内共分散行列Rf (n)の固有値分解により最大固有値μf (n)を取得する。最後に、集中パラメータκf (n)を、下記(12)式により算出する。
Figure 0006616472
(第2例の到来方向局在度算出部)
図3は、実施形態1に係る第2例の到来方向局在度算出部を示す図である。第2例の到来方向局在度算出部10Bが到来方向局在度として用いる固有値スパース度は、観測信号ベクトルのクラスタ内共分散行列の固有値分布のスパース性の大きさである。一般に、ある信号の共分散行列の各固有値は対応する固有ベクトル方向におけるその信号の分散を表す。したがって、観測信号ベクトルのクラスタ内共分散行列の固有値分布がスパースであるということは、そのクラスタ内において観測信号ベクトルの方向が特定の方向に局在していることを意味する。
観測信号ベクトルの方向は信号到来方向と対応するから、観測信号ベクトルの方向が局在しているということは、信号到来方向が局在していることを意味する。したがって、固有値スパース度を到来方向局在度として用いることができる。
到来方向局在度算出部10Bは、共分散行列算出部10B−1、固有値分布算出部10B−2、固有値スパース度算出部10B−3を有する。
共分散行列算出部10B−1は、事後確率βtf (n)と、観測信号ベクトルytfを受け取って、クラスタ内共分散行列Φf (n)を算出し、固有値分布算出部10B−2に受け渡す。クラスタ内共分散行列Φf (n)は、下記(13)式により算出できる。
Figure 0006616472
固有値分布算出部10B−2は、共分散行列算出部10B−1からクラスタ内共分散行列Φf (n)を受け取って、クラスタ内共分散行列Φf (n)の固有値λf1 (n),・・・,λfM (n)を算出し、下記(14)式のように定義される固有値分布ベクトルλf (n)を固有値スパース度算出部10B−3に受け渡す。ここで、λf1 (n),λf2 (n),・・・,λfM-1 (n),λfM (n)は、λf1 (n)≧λf2 (n)≧・・・≧λfM-1 (n)≧λfM (n)の大小関係が成り立つように降順に並べるものとする。
Figure 0006616472
固有値スパース度算出部10B−3は、固有値分布算出部10B−2から固有値分布ベクトルλf (n)を受け取って、固有値スパース度κf (n)を算出して到来方向局在度として出力する。固有値スパース度κf (n)としては、最大固有値λf1 (n)と最小固有値λfM (n)の比(すなわちクラスタ内共分散行列Φf (n)の条件数)、零固有値の個数(すなわちクラスタ内共分散行列Φf (n)の零空間の次元)、固有値分布ベクトルλf (n)の1ノルムと2ノルムの比(すなわちクラスタ内共分散行列Φf (n)のトレースノルムとフロベニウスノルムの比)、固有値分布ベクトルλf (n)のエントロピーの符号を反転させたもの等を用いることができる。
(第3例の到来方向局在度算出部)
図4は、実施形態1に係る第3例の到来方向局在度算出部を示す図である。第3例の到来方向局在度算出部10Cが到来方向局在度として用いる異方度は、参考文献1及び参考文献2に開示されている行列部分空間の概念に基づき、以下のように定義される。参考文献1は、「N. Ito, E. Vincent, N. Ono, and S. Sagayama, “General Algorithms for Estimating Spectrogram and Transfer Functions of Target Signal for Blind Suppression of Diffuse Noise,” Proc. IEEE International Workshop on Machine Learning for Signal Processing (MLSP), Sep. 2013.」である。参考文献2は、「N. Ito, E. Vincent, T. Nakatani, N. Ono, S. Araki, and S. Sagayama, “Blind Suppression of Nonstationary Diffuse Acoustic Noise Based on Spatial Covariance Matrix Decomposition,” Journal of Signal Processing Systems, vol. 79, no. 2, pp. 145-157, May 2015.」である。
すなわち、M次エルミート行列全体の集合を実ベクトル空間(行列のなすベクトル空間なので行列空間と呼ぶ)とみなし、あらゆる方向から到来する等方性信号の共分散行列を前述の行列空間の部分空間(以下、等方性行列部分空間と呼ぶ)としてモデル化することで、観測信号のクラスタ内共分散行列Φf (n)は、等方性行列部分空間に属する成分行列Φf ||(n)と、異方性行列部分空間(等方性行列部分空間の直交補空間)に属する成分行列Φf ⊥(n)とに直交分解できる。成分行列Φf ⊥(n)及び成分行列Φf ||(n)のノルム比(以下、異方度と呼ぶ)は、下記(15)式で与えられる。異方度は、各クラスタ内における信号到来方向の異方性の大きさ(等方性の小ささ)を表すので、これを到来方向局在度として用いることができる。
Figure 0006616472
到来方向局在度算出部10Cは、共分散行列算出部10C−1、直交分解部10C−2、異方度算出部10C−3を有する。共分散行列算出部10C−1は、事後確率βtf (n)と、観測信号ベクトルytfを受け取って、観測信号のクラスタ内共分散行列Φf (n)を算出し、直交分解部10C−2に受け渡す。クラスタ内共分散行列Φf (n)は、下記(16)式により算出できる。
Figure 0006616472
直交分解部10C−2は、共分散行列算出部10C−1からクラスタ内共分散行列Φf (n)を受け取って、等方性行列部分空間に属する成分行列Φf ||(n)と、異方性行列部分空間に属する成分行列Φf ⊥(n)とを算出し、異方度算出部10C−3に受け渡す。等方性行列部分空間に属する成分行列Φf ||(n)と、異方性行列部分空間に属する成分行列Φf ⊥(n)は、それぞれ下記(17−1)式及び(17−2)式により算出できる。
Figure 0006616472
ここで、{Qf (d)d=1 Dは等方性行列部分空間の直交基底を表し、{Qf (d)d=D+1 M2(M2はM2を表す)は異方性行列部分空間の直交基底を表し、<Φf (n),Qf (d)>は下記(18)式により定義されるクラスタ内共分散行列Φf (n)と行列Qf (d)の内積を表し、Dは等方性行列部分空間の次元を表し、||*||Fはフロベニウスノルムを表し、trはトレースを表す。
Figure 0006616472
直交基底{Qf (d)d=1 Dとしては、例えば、下記(19)式により定義されるbf (m,n)を(m,n)成分とする行列Bfのみからなる、下記(20)式で表現される基底を用いることができる。ここで、sinc(*)はsinc(x):=sin(x)/xで定義されるsinc関数を表し、ωfはf番目の周波数ビンに対応する角周波数を表し、dmnはマイクロホンmとマイクロホンnとの間の距離を表し、cは音速を表す。直交基底{Qf (d)d=1 Dの他の例は、上記の参考文献1及び参考文献2に開示されている。
Figure 0006616472
Figure 0006616472
異方度算出部10C−3は、直交分解部10C−2から等方性行列部分空間に属する成分行列Φf ||(n)と、異方性行列部分空間に属する成分行列Φf ⊥(n)とを受け取って、到来方向局在度である異方度κf (n)を下記(21)式により算出して出力する。
Figure 0006616472
(判定部)
図5は、実施形態1に係る判定部の一例を示す図である。判定部20は、周波数方向集約部20−1、クラスタ置換部20−2を有する。
周波数方向集約部20−1は、到来方向局在度κf (n)を受け取って、その周波数方向への集約値〜κ(n)を算出してクラスタ置換部20−2に受け渡す。集約値〜κ(n)としては、集合{κf (n)f=1 Fに属する到来方向局在度κf (n)の大きさを表す代表値(相加平均などの平均、中央値、最頻値、最大値、最小値、四分位点など)や、周波数ビン毎にκf (n)が最大となる番号nに1票を与える投票における得票数等を用いることができる。全周波数ビンにわたる集合{κf (n)f=1 Fに対する集約値の代わりに集合{κf (n)|f∈S}に対する集約値を用いてもよい。ここで、集合Sは、集合{1,・・・,F}の任意の部分集合である。例えば、集約値〜κ(n)が得票数である場合には、集約値〜κ(n)は、下記(22)式により計算される。ここで、|*|は集合の元の個数である。
Figure 0006616472
また、例えば、集約値〜κ(n)が全周波数ビンにわたる相加平均である場合には、集約値〜κ(n)は、下記(23)式により計算される。
Figure 0006616472
クラスタ置換部20−2は、事後確率βtf (n)と、周波数方向集約部20−1からの集約値〜κ(n)を受け取って、クラスタのラベルの曖昧性が解消された事後確率γtf (n)を作成し出力する。事後確率γtf (n)の作成は、下記(24)式による。
Figure 0006616472
(実施形態1に係るクラスタ判定処理)
図6は、実施形態1に係るクラスタ判定処理の一例を示すフローチャートである。先ず、到来方向局在度算出部10A(10B,10C)が、観測信号ベクトルytfと事後確率βtf (n)を受け取って、クラスタ毎かつ周波数ビン毎の到来方向局在度κf (n)を算出する(ステップS11)。次に、判定部20の周波数方向集約部20−1が、到来方向局在度算出部10A(10B,10C)から到来方向局在度κf (n)を受け取り、クラスタ毎の集約値〜κ(n)を算出する(ステップS12)。次に、判定部20のクラスタ置換部20−2が、事後確率βtf (n)と、周波数方向集約部20−1からの集約値〜κ(n)を受け取って、クラスタのラベルの曖昧性が解消されたクラスタ毎かつ時間周波数成分毎の事後確率γtf (n)を作成し出力する(クラスタ置換、ステップS13)。
(実施形態1の変形例1)
到来方向局在度κf (n)が既知の場合には、実施形態1に係るクラスタ判定装置は、前記到来方向局在度κf (n)を入力として用い、到来方向局在度算出部10A(10B,10C)を含まない構成としても良い。すなわち、実施形態1の変形例1に係るクラスタ判定装置は、判定部20のみからなる。前記判定部20は、観測信号の時間周波数成分を複数のクラスタへクラスタリングすることで得られたクラスタのラベルの曖昧性が存在する2つのクラスタの事後確率βtf (n)と到来方向局在度κf (n)を受け取って、クラスタのラベルの曖昧性が解消された事後確率γtf (n)を作成し出力する。判定部20における処理は、既に述べた通りであるため詳細な説明を省略する。
なお、到来方向局在度κf (n)が既知の場合とは、例えば、各クラスタに関する特徴量ベクトルのモデル分布の重み付き和である混合モデルを前記特徴量ベクトルに当てはめることによって前記クラスタリングを行なう場合に、前記混合モデルを前記特徴量ベクトルに当てはめたときの前記混合モデルのパラメータを用いて到来方向局在度κf (n)が得られる場合などである。
(実施形態1の変形例2)
実施形態1に係るクラスタ判定装置は、クラスタのラベルの曖昧性が解消された事後確率γtf (n)を出力する代わりに、γtf (n)= βtf (Π(n))となる集合{0,1}上の置換Πを出力する構成としても良い。前記置換Πは、クラスタのラベルの曖昧性が存在する2つのクラスタのそれぞれが、目的信号と対応するクラスタであるか、目的信号と対応しないクラスタであるかを指定する対応関係である。すなわち、実施形態1の変形例2に係るクラスタ判定装置は、到来方向局在度算出部と判定部からなり、前記判定部は、周波数方向集約部とクラスタ置換部からなり、前記クラスタ置換部は、周波数方向集約部からの集約値〜κ(n)を受け取って前記置換Πを決定し出力する。前記置換Πは、「〜κ(0)<〜κ(1)」ならば「Π(0)=0、Π(1)=1」、「〜κ(0)≧〜κ(1)」ならば「Π(0)=1、Π(1)=0」となるように決定すればよい。なお、前記到来方向局在度算出部と前記周波数方向集約部における処理は、既に述べた通りであるため詳細な説明を省略する。
[実施形態2]
実施形態2では、複数のマイクロホンで取得した観測信号とクラスタのラベルの曖昧性が存在する2つのクラスタの事後確率とを用いて各クラスタの到来方向局在度を周波数ビン毎に算出し、周波数ビン毎に到来方向局在度が最大となるクラスタを目的信号と対応するクラスタと判定することで、クラスタのラベルの曖昧性を解消する。
実施形態2では、クラスタのラベルの曖昧性を解消するという効果に加えて、パーミュテーションの曖昧性を解消するという効果もある。事後確率を周波数ビン毎のクラスタリングにより算出する場合、1つの状態が、異なる周波数ビンでは異なるクラスタ番号を持つというパーミュテーションの曖昧性がある。実施形態2では、周波数ビン毎にクラスタのラベルの曖昧性を解消するため、上記パーミュテーションの曖昧性も解消することができる(パーミュテーション解決)。
実施形態2では、実施形態1の場合と同様に、観測信号ベクトルytfと、クラスタのラベルの曖昧性が存在する2つのクラスタの事後確率βtf (n)とを受け取って、クラスタのラベルの曖昧性が解消された事後確率γtf (n)を出力する。
実施形態2のポイントは、周波数ビン毎に到来方向局在度κf (n)が最大となるクラスタを目的信号と対応するクラスタと判定することである。実施形態2は、周波数ビン毎に判定を行う点で、実施形態1とは異なる。これにより、クラスタのラベルの曖昧性を解消する効果に加え、パーミュテーションの曖昧性を解消する効果も得ることができる。
(実施形態2に係るクラスタ判定装置)
図1を参照して、実施形態2に係るクラスタ判定装置の一例を説明する。実施形態2に係るクラスタ判定装置100Dは、到来方向局在度算出部10D、判定部20Dを有する。
到来方向局在度算出部10Dは、観測信号ベクトルytfと、事後確率βtf (n)を受け取って到来方向局在度κf (n)を算出し、判定部20Dに受け渡す。到来方向局在度算出部10Dにおける処理は、実施形態1の場合と同様であるから、詳細な説明は省略する。
判定部20Dは、事後確率βtf (n)と、到来方向局在度算出部10Dからの到来方向局在度κf (n)を受け取って、クラスタのラベルの曖昧性が解消された事後確率γtf (n)を作成し出力する。事後確率γtf (n)は、下記(25)式のように、周波数ビン毎に到来方向局在度κf (n)を比較して作成する。
Figure 0006616472
(実施形態2に係るクラスタ判定処理)
図7は、実施形態2に係るクラスタ判定処理の一例を示すフローチャートである。先ず、到来方向局在度算出部10Dが、観測信号ベクトルytfと、事後確率βtf (n)を受け取ってクラスタ毎かつ周波数ビン毎の到来方向局在度κf (n)を算出する(ステップS21)。次に判定部20Dが、事後確率βtf (n)と、到来方向局在度算出部10Dからの到来方向局在度κf (n)を受け取って、クラスタのラベルの曖昧性が解消されたクラスタ毎かつ時間周波数成分毎の事後確率γtf (n)を作成し出力する(判定処理、ステップS22)。
(実施形態2の変形例1)
到来方向局在度κf (n)が既知の場合には、実施形態2に係るクラスタ判定装置は、前記到来方向局在度κf (n)を入力として用い、到来方向局在度算出部10Dを含まない構成としても良い。すなわち、実施形態2の変形例1に係るクラスタ判定装置は、判定部20Dのみからなる。前記判定部20Dは、観測信号の時間周波数成分を複数のクラスタへクラスタリングすることで得られたクラスタのラベルの曖昧性が存在する2つのクラスタの事後確率βtf (n)と到来方向局在度κf (n)を受け取って、クラスタのラベルの曖昧性が解消された事後確率γtf (n)を作成し出力する。判定部20Dにおける処理は、既に述べた通りであるため詳細な説明を省略する。
(実施形態2の変形例2)
実施形態2に係るクラスタ判定装置は、クラスタのラベルの曖昧性が解消された事後確率γtf (n)を出力する代わりに、γtf (n)= βtf (Πf(n))となる周波数ビン毎の集合{0,1}上の置換Πを出力する構成としても良い。ただし、前記ΠfはΠを表す。前記置換Πは、各周波数ビンにおいて、クラスタのラベルの曖昧性が存在する2つのクラスタのそれぞれが、目的信号と対応するクラスタであるか、目的信号と対応しないクラスタであるかを指定する対応関係である。すなわち、実施形態2の変形例2に係るクラスタ判定装置は、到来方向局在度算出部と判定部からなり、前記判定部は到来方向局在度算出部からの到来方向局在度κf (n)を受け取って前記置換Πを作成し出力する。前記置換Πの作成は、「κf (0)<κf (1)」ならば「Π(0)=0、Π(1)=1」とし、「κf (0)≧κf (1)」ならば「Π(0)=1、Π(1)=0」とすればよい。なお、前記到来方向局在度算出部における処理は、既に述べた通りであるため詳細な説明を省略する。
[実施形態3]
実施形態3では、複数のマイクロホンで取得した観測信号を用いて、「目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布よりも、目的信号と対応するクラスタに関する特徴量ベクトルのモデル分布の方が、より大きい到来方向局在度を持つ」という制約を課された、各クラスタに関する特徴量ベクトルのモデル分布の重み付き和である混合モデルを特徴量ベクトルに当てはめることにより、クラスタのラベルの曖昧性を生じさせずにクラスタリングを行なう。
実施形態3では、各周波数ビンにおいてクラスタのラベルの曖昧性を生じさせずにクラスタリングを行なうことができるという効果があり、したがってまた、パーミュテーションの曖昧性を生じさせずにクラスタリングを行なうことができるという効果もある。また、「目的信号は特定方向から到来するのに対し、雑音は多方向から一様に到来する」という目的信号と雑音の性質をモデル化しているため、この性質を事前知識として用いることで、クラスタリングの精度自体を改善する効果もある。
実施形態3では、観測信号ベクトルytf:=[ytf (1)・・・ytf (M)]Tを受け取ってクラスタのラベルの曖昧性がない事後確率γtf (n)を出力する。実施形態3のポイントは、目的信号と雑音の前記性質をモデル化することにより、クラスタのラベルの曖昧性を生じさせずにクラスタリングを行なう点にある。より具体的には、目的信号と雑音の前記性質に基づき、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布よりも、目的信号と対応するクラスタに関する特徴量ベクトルのモデル分布の方が、より大きい到来方向局在度を持つという制約を課された、各クラスタに関する特徴量ベクトルのモデル分布の重み付き和である混合モデルを特徴量ベクトルに当てはめることによりクラスタリングを行なう。
実施形態3では、例えば、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布よりも、目的信号と対応するクラスタに関する特徴量ベクトルのモデル分布の方が、より大きい到来方向局在度を持つように、前記混合モデルのパラメータに制約を課す。例えば、目的信号と対応しないクラスタの到来方向局在度が、その取りうる値の中の最小値を取るように、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布のパラメータに制約を課す。
すなわち、例えば、前記特徴量ベクトルとして観測信号ベクトルの単位方向ベクトルを用い、前記混合モデルとして下記参考文献3において開示されている複素ワトソン分布の重み付き和である混合ワトソン分布を用いる場合、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布である複素ワトソン分布のパラメータである集中パラメータを0に固定することにより、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布の到来方向局在度(特徴量局在度)である集中パラメータが最小値0を取るようにする。また、例えば、前記特徴量ベクトルとして観測信号ベクトルを用い、前記混合モデルとして下記参考文献4において開示されている複素ガウス分布の重み付き和である混合ガウス分布を用いる場合、(イ)目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布である複素ガウス分布のパラメータである共分散行列が単位行列の定数倍であるという制約を課すことにより、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布の到来方向局在度(固有値スパース度)であるクラスタ内共分散行列の最大固有値と最小固有値の比が最小値1を取るようにする、もしくは、(ロ)目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布である複素ガウス分布のパラメータである共分散行列が前記等方性行列部分空間に属するという制約を課すことにより、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布の到来方向局在度(異方度)が最小値0を取るようにする。参考文献3は、「伊藤信貴,荒木章子,木下慶介,中谷智広,“音源位置情報に基づく劣決定ブラインド音源分離のためのパーミュテーションフリークラスタリング法”,電子情報通信学会論文誌A,vol,J97-A,no.4,pp.234-246,Apr,2014.」である。参考文献4は、「N. Ito, S. Araki, T. Yoshioka, and T. Nakatani, “Relaxed Disjointness Based Clustering for Joint Blind Source Separation and Dereverberation,” Proc. International Workshop on Acoustic Signal Enhancement (IWAENC), Sep. 2014.」である。
また、実施形態3では、例えば、混合モデルを用いた反復アルゴリズムに基づくクラスタリングにおいて、各反復において、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布よりも、目的信号と対応するクラスタに関する特徴量ベクトルのモデル分布の方が、より小さい到来方向局在度を持つ場合に、「(イ)目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布のパラメータを調整して、当該モデル分布の到来方向局在度を減少させる」、もしくは、「(ロ)目的信号と対応するクラスタに関する特徴量ベクトルのモデル分布のパラメータを調整して当該モデル分布の到来方向局在度を増加させる」ことにより、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布よりも、目的信号と対応するクラスタに関する特徴量ベクトルのモデル分布の方が、より大きい到来方向局在度を持つようにする。
すなわち、例えば、前記特徴量ベクトルとして観測信号ベクトルの単位方向ベクトルを用い、前記混合モデルとして混合ワトソン分布を用いる場合、各反復において、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布である複素ワトソン分布よりも、目的信号と対応するクラスタに関する特徴量ベクトルのモデル分布である複素ワトソン分布の方が、より小さい到来方向局在度(特徴量局在度)である集中パラメータを持つ場合に、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布である複素ワトソン分布のパラメータである集中パラメータを減少させることにより、目的信号と対応しないクラスタに関する特徴量ベクトルのモデル分布よりも、目的信号と対応するクラスタに関する特徴量ベクトルのモデル分布の方が、より大きい到来方向局在度である集中パラメータを持つようにする。
以下では、観測信号ベクトルの単位方向ベクトルを特徴量ベクトルとして用い、目的信号と対応しないクラスタに関する前記特徴量ベクトルのモデル分布である複素ワトソン分布の集中パラメータを0に固定した混合ワトソン分布を混合モデルとして用いる場合について、より詳しく説明する。
(実施形態3に係るクラスタリング装置)
図8は、実施形態3に係るクラスタリング装置の一例を示す図である。実施形態3に係るクラスタリング装置200は、特徴抽出部210、クラスタリング部220を有する。
特徴抽出部210は、観測信号ベクトルytfを受け取って各時間周波数点における信号到来方向を特徴づける到来方向特徴量ベクトルである下記(26)式の観測信号ベクトルytfの単位方向ベクトルztfを算出し、クラスタリング部220に受け渡す。
Figure 0006616472
クラスタリング部220は、特徴抽出部210から到来方向特徴量ベクトルztfを受け取り、クラスタのラベルの曖昧性がない事後確率(以下、単に「事後確率」と呼ぶ)γtf (n)を出力する。
クラスタリング部220は、事後確率更新部221、パラメータ更新部222、パラメータ記憶部223を有する。事後確率更新部221は、特徴抽出部210からの到来方向特徴量ベクトルztfと、パラメータ記憶部223からのパラメータΘを受け取り、事後確率γtf (n)を更新してパラメータ更新部222に受け渡すとともに、クラスタリング部220での処理が終了した際に事後確率γtf (n)を出力する。パラメータΘは、下記(27)式により定義される。また、事後確率γtf (n)は、下記(28)式により更新される。
Figure 0006616472
Figure 0006616472
ここで、p(ztf|S(n),Θ)(n=0,1)は、状態S(n)に対する到来方向特徴量ベクトルztfのモデル分布であり、下記(29−1)式及び(29−2)式により計算される。ただし、下記(29−1)式における状態S(0)に対する分布p(ztf|S(0),Θ)は、複素ワトソン分布の集中パラメータを0と置くことで得られる分布(単位超球面上の一様分布)である。また、下記(29−2)式におけるK(*,*,*)は、クンマー関数を表す。
Figure 0006616472
パラメータ更新部222は、事後確率更新部221からの事後確率γtf (n)と、特徴抽出部210からの到来方向特徴量ベクトルztfを受け取ってパラメータΘを更新し、パラメータ記憶部223に受け渡す。パラメータ更新部222の詳細は後述する。パラメータ記憶部223は、パラメータ更新部222からパラメータΘを受け取って記憶し、事後確率更新部221での次の処理の際にパラメータΘを受け渡す。
パラメータ更新部222は、混合重み更新部222−1、特徴量共分散行列算出部222−2、平均方向ベクトル更新部222−3、集中パラメータ更新部222−4を有する。
混合重み更新部222−1は、事後確率更新部221から事後確率γtf (n)を受け取って混合重みαf (n)を更新し、パラメータ記憶部223に受け渡す。混合重みαf (n)は、下記(30)式により更新できる。
Figure 0006616472
特徴量共分散行列更新部222−2は、特徴抽出部210からの到来方向特徴量ベクトルztfと、事後確率更新部221からの事後確率γtf (n)とを受け取って、目的信号に対応するクラスタの特徴量共分散行列Rf (1)を更新し、平均方向ベクトル更新部222−3と、集中パラメータ更新部222−4に受け渡す。特徴量共分散行列Rf (1)は、下記(31)式により更新できる。
Figure 0006616472
平均方向ベクトル更新部222−3は、特徴量共分散行列更新部222−2から特徴量共分散行列Rf (1)を受け取って目的信号に対応するクラスタの平均方向ベクトルaf (1)を更新し、パラメータ記憶部223に受け渡す。平均方向ベクトルaf (1)は、特徴量共分散行列Rf (1)の固有値分解により得られた最大固有値に対応するノルム1の固有ベクトルにより更新すればよい。一方、上記のように、目的信号に対応しないクラスタは単位超球面上の一様分布によりモデル化しているため、目的信号に対応しないクラスタの平均方向ベクトルは更新する必要がない。
集中パラメータ更新部222−4は、特徴量共分散行列更新部222−2から特徴量共分散行列Rf (1)を受け取って目的信号に対応するクラスタの集中パラメータκf (1)を更新し、パラメータ記憶部223に受け渡す。集中パラメータκf (1)は、特徴量共分散行列Rf (1)の固有値分解により得られた最大固有値μf (1)を用いて、下記(32)式により更新すればよい。一方、上記のように、目的信号に対応しないクラスタは単位超球面上の一様分布によりモデル化しているため目的信号に対応しないクラスタの集中パラメータは更新する必要がない。
Figure 0006616472
(実施形態3に係るクラスタリング処理)
図9は、実施形態3に係るクラスタリング処理の一例を示すフローチャートである。先ず、特徴抽出部210が、観測信号ベクトルytfを受け取って時間周波数成分毎の到来方向特徴量ベクトルztfを抽出する(ステップS31)。次に、事後確率更新部221が、特徴抽出部210からの到来方向特徴量ベクトルztfと、パラメータ記憶部223からのパラメータΘとを受け取って、クラスタ毎かつ時間周波数成分毎の事後確率γtf (n)を更新する(ステップS32)。
次に、混合重み更新部222−1が、事後確率更新部221から事後確率γtf (n)を受け取って、クラスタ毎かつ周波数ビン毎の混合重みを更新する(ステップS33)。次に、特徴量共分散行列更新部222−2が、事後確率更新部221からの事後確率γtf (n)と、特徴抽出部210からの到来方向特徴量ベクトルztfとを受け取って、目的信号に対応するクラスタの周波数ビン毎の特徴量共分散行列Rf (1)を算出する(ステップS34)。
次に、平均方向ベクトル更新部222−3が、特徴量共分散行列更新部222−2から特徴量共分散行列Rf (1)を受け取って、目的信号に対応するクラスタの周波数ビン毎の平均方向ベクトルaf (1)を更新する(ステップS35)。次に、集中パラメータ更新部222−4が、特徴量共分散行列更新部222−2から特徴量共分散行列Rf (1)を受け取って、目的信号に対応するクラスタの周波数ビン毎の集中パラメータκf (1)を更新する(ステップS36)。次に、図示しない終了条件判定部が、終了条件が満たされているかを判定し(ステップS37)、満たされている場合(ステップS37:Yes)は事後確率更新部221が事後確率γtf (n)を出力し、満たされていない場合(ステップS37:No)は、ステップS32に戻って処理を続ける。なお、終了条件は、例えば、ステップS32〜S37のループ処理を規定回数繰り返した、事後確率γtf (n)が所定条件を満たした等である。
以上の各実施形態は、任意のクラスタリング技術と組み合わせて利用することができる。
また、クラスタ判定装置100,100D、クラスタリング装置200において行われる各処理は、全部又は任意の一部が、CPU等の処理装置及び処理装置により解析実行されるプログラムにて実現されてもよい。また、クラスタ判定装置100,100D、クラスタリング装置200において行われる各処理は、ワイヤードロジックによるハードウェアとして実現されてもよい。
また、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともできる。もしくは、実施形態において説明した各処理のうち、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上述及び図示の処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて適宜変更することができる。
(プログラムについて)
図10は、プログラムが実行されることにより、実施形態に係るクラスタ判定装置及びクラスタリング装置が実現されるコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU(Central Processing Unit)1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。コンピュータ1000において、これらの各部はバス1080によって接続される。
メモリ1010は、ROM(Read Only Memory)1011及びRAM(Random Access Memory)1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1031に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1041に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1041に挿入される。シリアルポートインタフェース1050は、例えばマウス1051、キーボード1052に接続される。ビデオアダプタ1060は、例えばディスプレイ1061に接続される。
ハードディスクドライブ1031は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、クラスタ判定装置100,100D、クラスタリング装置200の各処理を規定するプログラムは、コンピュータ1000によって実行される指令が記述されたプログラムモジュール1093として、例えばハードディスクドライブ1031に記憶される。例えば、クラスタ判定装置100,100D、クラスタリング装置200における機能構成と同様の情報処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1031に記憶される。
また、実施形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1031に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1031に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して実行する。
なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1031に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1041等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093やプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093やプログラムデータ1094は、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
上記の各実施形態は、本願が開示する技術に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
10A、10B、10C、10D 到来方向局在度算出部
10A−1 到来方向特徴量算出部
10A−2 特徴量局在度算出部
10B−1、10C−1 共分散行列算出部
10B−2 固有値分布算出部
10B−3 固有値スパース度算出部
10C−2 直交分解部
10C−3 異方度算出部
20、20D 判定部
20−1 周波数方向集約部
20−2 クラスタ置換部
100、100D クラスタ判定装置
200 クラスタリング装置
210 特徴抽出部
220 クラスタリング部
221 事後確率更新部
222 パラメータ更新部
222−1 混合重み更新部
222−2 特徴量共分散行列更新部
222−3 平均方向ベクトル更新部
222−4 集中パラメータ更新部
223 パラメータ記憶部
1000 コンピュータ
1010 メモリ
1020 CPU

Claims (3)

  1. 複数のマイクロホンで目的信号を含む音を観測した複数の観測信号の時間周波数成分を前記目的信号と対応するクラスタと前記目的信号と対応しないクラスタとにクラスタリングするクラスタリング装置であって、
    各観測信号の時間周波数成分からなる観測信号ベクトルに対応する特徴量ベクトルを抽出する特徴抽出部と、
    前記特徴量ベクトルに所定の混合モデルを当てはめることで前記クラスタ毎かつ時間周波数成分毎の事後確率を算出するクラスタリング部と、
    を含み、
    前記混合モデルは、各クラスタに関する特徴量ベクトルのモデル分布の重み付き和で表され、
    前記各クラスタに関する特徴量ベクトルのモデル分布は、前記目的信号と対応しないクラスタに関する前記特徴量ベクトルのモデル分布、前記目的信号と対応するクラスタに関する前記特徴量ベクトルのモデル分布よりも小さい到来方向局在度を持つという制約が課されて作成されたものである
    ことを特徴とするクラスタリング装置。
  2. 複数のマイクロホンで目的信号を含む音を観測した複数の観測信号の時間周波数成分を前記目的信号と対応するクラスタと前記目的信号と対応しないクラスタとにクラスタリングするクラスタリング装置が実行するクラスタリング方法であって、
    各観測信号の時間周波数成分からなる観測信号ベクトルに対応する特徴量ベクトルを抽出する特徴抽出ステップと、
    前記特徴量ベクトルに所定の混合モデルを当てはめることで前記クラスタ毎かつ時間周波数成分毎の事後確率を算出するクラスタリングステップと、
    を含み、
    前記混合モデルは、各クラスタに関する特徴量ベクトルのモデル分布の重み付き和で表され、
    前記各クラスタに関する特徴量ベクトルのモデル分布は、前記目的信号と対応しないクラスタに関する前記特徴量ベクトルのモデル分布、前記目的信号と対応するクラスタに関する前記特徴量ベクトルのモデル分布よりも小さい到来方向局在度を持つという制約が課されて作成されたものである
    ことを特徴とするクラスタリング方法。
  3. 請求項1に記載のクラスタリング装置としてコンピュータを機能させるためのクラスタリングプログラム。
JP2018166434A 2018-09-05 2018-09-05 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム Active JP6616472B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018166434A JP6616472B2 (ja) 2018-09-05 2018-09-05 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018166434A JP6616472B2 (ja) 2018-09-05 2018-09-05 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2015159933A Division JP6441769B2 (ja) 2015-08-13 2015-08-13 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Publications (2)

Publication Number Publication Date
JP2018189994A JP2018189994A (ja) 2018-11-29
JP6616472B2 true JP6616472B2 (ja) 2019-12-04

Family

ID=64478622

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018166434A Active JP6616472B2 (ja) 2018-09-05 2018-09-05 クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Country Status (1)

Country Link
JP (1) JP6616472B2 (ja)

Also Published As

Publication number Publication date
JP2018189994A (ja) 2018-11-29

Similar Documents

Publication Publication Date Title
JP6441769B2 (ja) クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
JP6434657B2 (ja) 空間相関行列推定装置、空間相関行列推定方法および空間相関行列推定プログラム
WO2017141542A1 (ja) マスク推定装置、マスク推定方法及びマスク推定プログラム
WO2020045313A1 (ja) マスク推定装置、マスク推定方法及びマスク推定プログラム
JP6538624B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
Kelkar et al. Prior image-constrained reconstruction using style-based generative models
JP6059072B2 (ja) モデル推定装置、音源分離装置、モデル推定方法、音源分離方法及びプログラム
JP5406866B2 (ja) 音源分離装置、その方法及びプログラム
WO2012105386A1 (ja) 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム
JP5881454B2 (ja) 音源ごとに信号のスペクトル形状特徴量を推定する装置、方法、目的信号のスペクトル特徴量を推定する装置、方法、プログラム
JP6616472B2 (ja) クラスタリング装置、クラスタリング方法及びクラスタリングプログラム
WO2012105385A1 (ja) 有音区間分類装置、有音区間分類方法、及び有音区間分類プログラム
JP5807914B2 (ja) 音響信号解析装置、方法、及びプログラム
JP6193823B2 (ja) 音源数推定装置、音源数推定方法および音源数推定プログラム
JP5726790B2 (ja) 音源分離装置、音源分離方法、およびプログラム
WO2019194300A1 (ja) 信号分析装置、信号分析方法および信号分析プログラム
JP6290803B2 (ja) モデル推定装置、目的音強調装置、モデル推定方法及びモデル推定プログラム
US11297418B2 (en) Acoustic signal separation apparatus, learning apparatus, method, and program thereof
JP2019074621A (ja) 信号分離装置、信号分離方法及びプログラム
JP6915579B2 (ja) 信号分析装置、信号分析方法および信号分析プログラム
Wang et al. Fisher discriminative dictionary learning for vehicle classification in acoustic sensor networks
JP6685943B2 (ja) 分離行列設計装置、フィルタ係数算出装置、その方法、及びプログラム
Wang et al. Spline estimator for ultra-high dimensional partially linear varying coefficient models
Bizzarri et al. Model Order Reduction and Smart Virtual Sensing for Unbounded Vibro-Acoustics Using High Order FEM and Infinite Elements
JP2019035851A (ja) 目的音源推定装置、目的音源推定方法及び目的音源推定プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190716

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190828

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191107

R150 Certificate of patent or registration of utility model

Ref document number: 6616472

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150