JP2011053565A - 信号分析装置、信号分析方法、プログラム、及び記録媒体 - Google Patents

信号分析装置、信号分析方法、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2011053565A
JP2011053565A JP2009204065A JP2009204065A JP2011053565A JP 2011053565 A JP2011053565 A JP 2011053565A JP 2009204065 A JP2009204065 A JP 2009204065A JP 2009204065 A JP2009204065 A JP 2009204065A JP 2011053565 A JP2011053565 A JP 2011053565A
Authority
JP
Japan
Prior art keywords
parameter
time
analysis
information storage
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009204065A
Other languages
English (en)
Inventor
Le Roux Jonathan
ルルージョナトン
Hirokazu Kameoka
弘和 亀岡
Kunio Kayano
邦夫 柏野
Junki Ono
順貴 小野
Shigeki Sagayama
茂樹 嵯峨山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2009204065A priority Critical patent/JP2011053565A/ja
Publication of JP2011053565A publication Critical patent/JP2011053565A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)

Abstract

【課題】より高精度またはより高速な信号分析処理を行う。
【解決手段】時間周波数解析部110は、時系列信号を時間周波数成分に分解する。分析パラメータ初期値生成部120は、時系列信号パラメータ、及び誤差配分量比重係数の各初期値を生成する。分析パラメータ無矛盾化項計算部140は、位相無矛盾化項を算出する。分析パラメータ更新部130は、誤差配分量比重係数、時間周波数成分配分量、位相スペクトルパラメータ、振幅スペクトル基底パラメータ、アクティビティ係数パラメータを算出し、算出した分析パラメータの値を情報記憶部100に反映させる。分析パラメータ収束判定部150は、上記分析パラメータが所定の規準を満たしているか否かを判定し、分析パラメータ出力部160は、所定の規準を満たしていると判定された場合、上記分析パラメータを出力する。
【選択図】図1

Description

本発明は、入力信号を分析する方法に関するものであり、例えば、複数の音が混合している音響信号からの特定音の検出、複数の音が混合している音響信号からの特定音の分離抽出、及び複数の音が混合している音響信号からの特定音の加工に用いられる信号分析装置、信号分析方法、プログラム、及び記録媒体に関する。
従来、信号の分析に関しては、信号の時間周波数表現に基づく各種の分析方法が広く知られている。分析の結果、得られる分析パラメータは、時間周波数領域におけるものであるが、時間周波数領域での計算の結果、分析パラメータの組合せが、時間領域では信号として現実に存在しえない組合せになる可能性があり、必ずしも的確な分析結果にならないという問題があった。
例えば、非負値行列分解(NMF)が知られている(例えば、非特許文献1参照)。NMFでは、音響信号の時間周波数表現に適用した際、一般的にパワー成分のみを対象としている。また、NMFの利点を保ちつつ、信号の位相情報をモデル化することで、加法性を維持できる方法として、複素NMFが知られている(例えば、非特許文献2参照)。複素NMFは、特に、本発明と特に関係の深い手法であり、位相スペクトルパラメータが導入されて時間周波数領域で信号を更に的確にモデル化できる。
D. D. Lee and H. S. Seung, "Learning of the parts of objects by non-negative matrix factorization," Nature, vol. 401, pp. 788-791,1999 H. Kameoka, N. Ono, K. Kashino, and S. Sagayama,"Complex NMF: A new sparse representation for acoustic signals," in Proc. ICASSP, Apr.2009
しかしながら、上述した非負値行列分解(NMF)には、音響信号の時間周波数表現に適用した際、一般的にパワー成分のみを対象とし、位相情報が失われ、信号の加法性が維持されないという問題があった。
また、上述した複素NMFには、時間周波数領域で信号を更に的確にモデル化できるようになった反面、パラメータ数が増加し、局所解に落ちやすくなる「次元の呪」、及び信号の時間周波数領域での表現の無矛盾性が考慮されていないという問題があった。
本発明は、このような事情を考慮してなされたものであり、その目的は、より高精度またはより高速な信号分析処理を行うことができる信号分析装置、信号分析方法、プログラム、及び記録媒体を提供することにある。
上述した課題を解決するために、本発明は、時系列信号を分析する信号分析装置であって、振幅スペクトル基底パラメータ、アクティビティ係数パラメータ、及び位相スペクトルパラメータからなる時系列信号パラメータ、並びに誤差配分量比重係数からなる分析パラメータと、時間周波数成分とを記憶するための情報記憶部と、前記時系列信号を時間周波数成分に分解し、前記情報記憶部に記憶する時間周波数分解部と、前記時系列信号パラメータ、及び前記誤差配分量比重係数の各初期値を生成し、前記情報記憶部に記憶する初期値生成部と、前記時系列信号パラメータに基づいて、前記時間周波数成分を無矛盾とするための位相無矛盾化項を計算する分析パラメータ無矛盾化項計算部と、前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び、前記位相無矛盾化項に基づいて、前記分析パラメータを更新する分析パラメータ更新部と、前記分析パラメータが所定の規準を満たしているか否かを判定する分析パラメータ収束判定部と、前記分析パラメータ収束判定部によって前記分析パラメータが所定の規準を満たしていると判定されると、前記分析パラメータを出力する分析パラメータ出力部と、を備え、前記分析パラメータ更新部は、前記分析パラメータ収束判定部によって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記分析パラメータを再度更新する、ことを特徴とする信号分析装置である。
本発明は、上記の発明において、前記分析パラメータ更新部は、前記情報記憶部に記憶されている前記時系列信号パラメータから、前記誤差配分量比重係数を計算する誤差配分係数計算部と、前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び前記誤差配分量比重係数から、時間周波数成分配分量を計算する時間周波数成分配分量計算部と、前記情報記憶部に記憶されている前記誤差配分量比重係数、前記時間周波数成分配分量、及び前記位相無矛盾化項から、前記位相スペクトルパラメータを計算する位相スペクトルパラメータ計算部と、前記情報記憶部に記憶されている前記アクティビティ係数パラメータ、前記誤差配分量比重係数、前記時間周波数成分配分量、前記位相スペクトルパラメータ、及び前記位相無矛盾化項から、前記振幅スペクトル基底パラメータを計算する振幅スペクトル基底パラメータ計算部と、前記情報記憶部に記憶されている前記振幅スペクトル基底パラメータ、前記アクティビティ係数パラメータ、前記誤差配分量比重係数、前記時間周波数成分配分量、前記位相スペクトルパラメータ、前記位相無矛盾化項から、前記アクティビティ係数パラメータを計算するアクティビティ係数パラメータ計算部と、前記誤差配分係数計算部、前記時間周波数成分配分量計算部、前記位相スペクトルパラメータ計算部、前記振幅スペクトル基底パラメータ計算部、及び前記アクティビティ係数パラメータ計算部によって算出された新たな値を前記情報記憶部に反映させる計算値反映部と、を備え、前記分析パラメータ収束判定部によって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記誤差配分係数計算部は、新たな誤差配分量比重係数を再度計算し、前記時間周波数成分配分量計算部は、新たな時間周波数成分配分量を再度計算し、前記位相スペクトルパラメータ計算部は、新たな位相スペクトルパラメータを再度計算し、前記振幅スペクトル基底パラメータ計算部は、新たな振幅スペクトル基底パラメータを再度計算し、前記アクティビティ係数パラメータ計算部は、新たなアクティビティ係数パラメータを再度計算し、前記計算値反映部は、再度計算された新たな誤差配分量比重係数、新たな時間周波数成分配分量、新たな位相スペクトルパラメータ、新たな振幅スペクトル基底パラメータ、新たなアクティビティ係数パラメータの値を前記情報記憶部に反映させる、ことを特徴とする。
また、上述した課題を解決するために、本発明は、時系列信号を分析する信号分析方法であって、前記時系列信号を時間周波数成分に分解し、情報記憶部に記憶する時間周波数分解ステップと、振幅スペクトル基底パラメータ、アクティビティ係数パラメータ、及び位相スペクトルパラメータからなる時系列信号パラメータと、誤差配分量比重係数とからなる分析パラメータの各初期値を生成し、前記情報記憶部に記憶する初期値生成ステップと、前記情報記憶部に記憶されている時系列信号パラメータに基づいて、前記時間周波数成分を無矛盾とするための位相無矛盾化項を計算する分析パラメータ無矛盾化項計算ステップと、前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び、前記位相無矛盾化項に基づいて、前記情報記憶部に記憶されている分析パラメータを更新する分析パラメータ更新ステップと、前記分析パラメータが所定の規準を満たしているか否かを判定する分析パラメータ収束判定ステップと、前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていると判定されると、前記分析パラメータを出力する分析パラメータ出力ステップと、を含み、前記分析パラメータ更新ステップは、前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記分析パラメータを再度更新する、ことを特徴とする信号分析方法である。
本発明は、上記の発明において、前記分析パラメータ更新ステップは、前記情報記憶部に記憶されている前記時系列信号パラメータから、前記誤差配分量比重係数を計算する誤差配分係数計算ステップと、前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び前記誤差配分量比重係数から、時間周波数成分配分量を計算する時間周波数成分配分量計算ステップと、前記情報記憶部に記憶されている前記誤差配分量比重係数、前記時間周波数成分配分量、及び前記位相無矛盾化項から、前記位相スペクトルパラメータを計算する位相スペクトルパラメータ計算ステップと、前記情報記憶部に記憶されている前記アクティビティ係数パラメータ、前記誤差配分量比重係数、前記時間周波数成分配分量、前記位相スペクトルパラメータ、及び前記位相無矛盾化項から、前記振幅スペクトル基底パラメータを計算する振幅スペクトル基底パラメータ計算ステップと、前記情報記憶部に記憶されている前記振幅スペクトル基底パラメータ、前記アクティビティ係数パラメータ、前記誤差配分量比重係数、前記時間周波数成分配分量、前記位相スペクトルパラメータ、前記位相無矛盾化項から、前記アクティビティ係数パラメータを計算するアクティビティ係数パラメータ計算ステップと、前記誤差配分係数計算ステップ、前記時間周波数成分配分量計算ステップ、前記位相スペクトルパラメータ計算ステップ、前記振幅スペクトル基底パラメータ計算ステップ、及び前記アクティビティ係数パラメータ計算ステップによって算出された新たな値を前記情報記憶部に反映させる計算値反映ステップと、を有し、前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記誤差配分係数計算ステップは、新たな誤差配分量比重係数を再度計算し、前記時間周波数成分配分量計算ステップは、新たな時間周波数成分配分量を再度計算し、前記位相スペクトルパラメータ計算ステップは、新たな位相スペクトルパラメータを再度計算し、前記振幅スペクトル基底パラメータ計算ステップは、新たな振幅スペクトル基底パラメータを再度計算し、前記アクティビティ係数パラメータ計算ステップは、新たなアクティビティ係数パラメータを再度計算し、前記計算値反映ステップは、再度計算された新たな誤差配分量比重係数、新たな時間周波数成分配分量、新たな位相スペクトルパラメータ、新たな振幅スペクトル基底パラメータ、新たなアクティビティ係数パラメータの値を前記情報記憶部に反映させる、ことを特徴とする。
また、上述した課題を解決するために、本発明は、情報記憶部を有する装置であって時系列信号を分析する信号分析装置を構成するコンピュータに、前記時系列信号を時間周波数成分に分解し、前記情報記憶部に記憶する時間周波数分解ステップと、振幅スペクトル基底パラメータ、アクティビティ係数パラメータ、及び位相スペクトルパラメータからなる時系列信号パラメータと、誤差配分量比重係数とからなる分析パラメータの各初期値を生成し、前記情報記憶部に記憶する初期値生成ステップと、前記情報記憶部に記憶されている時系列信号パラメータに基づいて、前記時間周波数成分を無矛盾とするための位相無矛盾化項を計算する分析パラメータ無矛盾化項計算ステップと、前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び、前記位相無矛盾化項に基づいて、前記情報記憶部に記憶されている分析パラメータを更新する分析パラメータ更新ステップと、前記分析パラメータが所定の規準を満たしているか否かを判定する分析パラメータ収束判定ステップと、前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていると判定されると、前記分析パラメータを出力する分析パラメータ出力ステップと、を実行させ、前記分析パラメータ更新ステップは、前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記分析パラメータを再度更新する、ことを特徴とするプログラムである。
また、上述した課題を解決するために、本発明は、情報記憶部を有する装置であって時系列信号を分析する信号分析装置を構成するコンピュータに、前記時系列信号を時間周波数成分に分解し、前記情報記憶部に記憶する時間周波数分解ステップと、振幅スペクトル基底パラメータ、アクティビティ係数パラメータ、及び位相スペクトルパラメータからなる時系列信号パラメータと、誤差配分量比重係数とからなる分析パラメータの各初期値を生成し、前記情報記憶部に記憶する初期値生成ステップと、前記情報記憶部に記憶されている時系列信号パラメータに基づいて、前記時間周波数成分を無矛盾とするための位相無矛盾化項を計算する分析パラメータ無矛盾化項計算ステップと、前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び、前記位相無矛盾化項に基づいて、前記情報記憶部に記憶されている分析パラメータを更新する分析パラメータ更新ステップと、前記分析パラメータが所定の規準を満たしているか否かを判定する分析パラメータ収束判定ステップと、前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていると判定されると、前記分析パラメータを出力する分析パラメータ出力ステップと、を実行させ、前記分析パラメータ更新ステップは、前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記分析パラメータを再度更新する、ためのプログラムを記録したコンピュータ読み取り可能な記録媒体である。
この発明によれば、分析パラメータの更新において、信号の時間周波数表現が無矛盾になるという制約を利用し、より的確な更新を行うことによって、より高精度またはより高速な信号分析処理を行うことができる。
本実施形態による信号分析装置の構成を示す機能ブロック図である。 本発明の実施形態に係る信号分析装置10の動作の一例を示すフローチャートである。 第3の設定での目的関数の各項の推移を示す図である。 分離された信号(チャイムと音声)のスペクトログラムを示す図である。
以下、本発明の一実施形態を、図面を参照して説明する。
A.本発明の原理
まず、本発明の原理を説明する。なお、以下の説明において、記号≡は、左辺の式を右辺の式で定義することを意味する。記号←は数値の代入を表す。式中の、文字上部に ̄が付いた文字は、文中において、文字の前に ̄を記載して示す。また、式中の、文字上部にが付いた文字は、文中において、文字の前にを記載して示す。また、「時間周波数領域内の演算」として、式中には、斜体のFを用いているが、文中では、通常のFを記載して示す。同様に斜体のfに関しても、文中では、通常のfを記載して示す。
公知の方法として「複素NMF」と呼ばれる信号分析方法が知られている。複素NMFは、観測スペクトログラムYを、次式(1)に示されるように、K個のソースWの和により近似しようとする手法である。
Figure 2011053565
Hを振幅スペクトル基底パラメータ、Uをアクティビティ係数パラメータ、φを位相スペクトルパラメータと呼ぶ。最適モデルパラメータの推定は、次式(2)により定義される目的関数の最小化により行われる。
Figure 2011053565
本発明は、以下に説明するように、上記の目的関数に各Wの無矛盾性を評価する新たな項を導入することを特徴とする。
フレーム長をN、フレームシフト量をR、分析窓関数をw(t)、合成窓関数をs(t)とした短時間フーリエ変換と短時間逆フーリエ変換とを考える。但し、分析窓関数と合成窓関数とが完全再構成条件を満たしていることを仮定する。
ここで、短時間フーリエ変換においては、時間周波数領域の次元がそれに相当する時間領域の次元よりも大きく、時間周波数領域で定義できる複素数の集合の全てが時間領域の信号の短時間フーリエ変換として得られるわけでない。すなわち、短時間フーリエ変換は、時間領域の信号の冗長な表現となっている。
時間領域の信号の短時間フーリエ変換として得られる複素数の集合を「無矛盾なスペクトログラム」と呼ぶ。ある集合Wω,tに対して、無矛盾であるための必要十分条件は、その短時間逆フーリエ変換の短時間フーリエ変換がW自体であることである。分析窓関数wによる短時間フーリエ変換をSTFTと書き、合成窓関数sによる短時間逆フーリエ変換をiSTFTと書く。また、時間周波数領域内の演算Fw,sを次式(3)のように定義する。
Figure 2011053565
この時、ある複素数の集合Wが無矛盾であるためには、数式(4)のような必要十分条件を満たさなければいけない。
Figure 2011053565
ある複素数の集合Wの無矛盾性をFw,s(W)のLノルムを用いて数値的に評価し、それにより得られた無矛盾性項を次式(5)のように新たに目的関数に導入する。
Figure 2011053565
但し、γは、目的関数の無矛盾性項の重み係数を表す。
上記γを0に終始固定した場合には、上記公知の複素NMFと同等の方法・装置となる。また、γを最初から0でない固定の係数にしてもよいが、始めは0にしておき、反復の途中で0でない固定の係数にしてもよい。なお、反復計算の過程毎に、γの値を任意に変えてもよい。
ここで、分析パラメータの具体的計算方法を示すため、新たに導入された無矛盾性項に対する補助関数を導入する。すなわち、上述した非特許文献2で導入されている補助関数に対し、新たに、上記無矛盾性項に合わせた補助関数を導入する。
時間周波数領域内の演算Fw,sの行列表現を次式(6)で表す。
Figure 2011053565
次式(7)の不等式を用いて補助関数を導く。
Figure 2011053565
但し、数式(7)は、次式(8)に示す条件のもとで成り立つ。
Figure 2011053565
また、次式(9)に示す値は、次式(10)を満たす任意の定数である。
Figure 2011053565
Figure 2011053565
合わせて、数式(11)に示す、f(H,U,φ)の補助関数を、次式(12)のように導入できる。
Figure 2011053565
Figure 2011053565
数式(12)から、次式(13)が成り立つ。
Figure 2011053565
但し、数式(12)は、次式(14)、(15)の条件のもとで成り立つ。また、次式(16)は、下記式(17)を満たす任意の定数である。
Figure 2011053565
Figure 2011053565
Figure 2011053565
Figure 2011053565
なお、数式(14)におけるCは、複素数全体の集合、数式(15)におけるRは、実数全体の集合を表す。
さらに、次式(18)、(19)、(20)のとき、下記数式(21)が成立するため、f(θ, ̄θ)が補助関数の定義を満たす。
Figure 2011053565
Figure 2011053565
Figure 2011053565
Figure 2011053565
以上の結果を用いて、H、U、φの更新式が求められる。Hに関しては、本来、次式(22)に示す条件でf(θ, ̄θ)を最小化する必要があるが、ここでは簡単のため、まず無制限でf(θ, ̄θ)を最小化するHを解析的に求め、それを数式(22)を満たすように正規化することにする。
Figure 2011053565
数式(12)の中にφによる項をまとめると、次式(23)となり、次式(24)のときに最小となる。
Figure 2011053565
Figure 2011053565
但し、(・)は、(・)の複素共役を表し、arg(・)は、(・)の偏角を表す。数式(20)により、 ̄Zの値を代入し、整理すると、φの更新式が次式(25)で求められる。
Figure 2011053565
但し、(・)は、(・)の随伴作用素を表す。ここでは証明を省略するが、次式(26)という等式が成り立つ。また、a ω,tは、次式(27)により定義される。
Figure 2011053565
Figure 2011053565
δの設定により、a ω,tを事前に計算し、係数として扱うことも考えられ、反復毎にδをなんらかの方法で更新し、a ω,tの値を更新することも考えられる。例えば、δを、次式(28)のように事前に定義し、次式(29)を代入すると、a ω,tは、次式(30)とqとにしか依存しない係数となり、その計算が簡単かつ軽量になる。
Figure 2011053565
Figure 2011053565
Figure 2011053565
但し、qは、任意の正な定数であり、次式(31)で表されるα(ρ,τ)は、分析窓関数wと合成窓関数sとフレームシフト量Rとにより定義される係数である。
Figure 2011053565
次式(32)で表される無矛盾化項 ̄Wを、次式(33)で定義する。
Figure 2011053565
Figure 2011053565
そこで、数式(25)でのaの役割を考えると、無矛盾化項 ̄Wの中に現状のWがどれくらい重視されるかに相当することがわかる。aを小さくするほど、収束性が保証されながら現在の値から遠くへいくということが考えられるため、例えば、aが一番小さくなるようにq=1を設定してもよい。
HとUの更新式は、それぞれf(θ, ̄θ)のHとUとによる微分を0と置くことで求められ、次式(34)、(35)となる。
Figure 2011053565
Figure 2011053565
また、数式(12)に示す、f(H,U,φ)の補助関数の代わりに、下記式(36)を利用してもよい。
Figure 2011053565
まず、数式(3)に示す時間周波数領域内Gω,sを下記式(37)のように定義する。
Figure 2011053565
ある複素数の集合Wに対して、Gω,s(W)はその集合の短時間逆フーリエ変換の短時間フーリエ変換である。Gω,sを用いて、数式(5)の目的関数の無矛盾性項は次式(38)のように書ける。
Figure 2011053565
但し、Gω,s(W)は、ある複素数の集合Wに対して最小二乗誤差の意味でWに最も近い無矛盾なスペクトログラムである(例えば、非特許文献:D. W. Griffin and J. S. Lim,“ Signal estimation from modified short-time Fourier transform, ”IEEE Trans. Acoustics, Speech, and Signal Process., vol. 32, no. 2, pp. 236.243, Apr. 1984 を参照)。従って、あらゆる無矛盾なスペクトログラムZ∈Ker(Fω,s)に対して、下記式(39)が成り立ち、Gω,s(W)について下記式(40)のような等式が得られる。
Figure 2011053565
Figure 2011053565
数式(40)の結果より、次式(41)で定義される関数(θ,θ)がf(θ)の補助関数であることがわかる。すなわち、数式(12)の代わりに、数式(41)がf(θ)の補助関数となる。
Figure 2011053565
但し、θ=(Y,U,Z)は、下記式(42)、(43)およびZ∈Ker(Fω,s)を満たすY,U,Zからなり、数式(16)は数式(17)を満たす任意の定数である。
Figure 2011053565
Figure 2011053565
数式(40)より、関数f(θ,θ)は、Y,U,Zに関して、次式(44)、(45)、(46)のとき最小化される。
Figure 2011053565
Figure 2011053565
Figure 2011053565
今、Y,U,Zが数式(44)、(45)、(46)により更新されたと仮定すると、その更新値のもとで、φ ω,t,H ω,U のそれぞれの更新式は、以下のようになる。
まず、φ ω,tについては、数式(41)において次式(47)に関係する項をまとめると下記式(48)を得る。これを最小化するφ ω,tは、解析的に下記式(49)で与えられ、これがφ ω,tの更新式となる。
Figure 2011053565
Figure 2011053565
Figure 2011053565
HとUの更新式についてはf(θ,θ)の各々に関する偏微分を0とおくことで得られる(本来は、Lagrange未定乗数法などにより下記式(50)の拘束のもとでf(θ,θ)を最小化すべきであるがここでは簡単のため、まず無制約でf(θ,θ)を最小化し、その後正規化するアプローチをとることとする)。Y,U,Zおよびφが上記の順序で更新されたとして、これらの結果を代入した形でH,Uの更新式を表すと下記式(51)、(52)のようになる。
Figure 2011053565
Figure 2011053565
Figure 2011053565
以上のように、数式(12)の補助関数の代わりに数式(41)を補助関数とし、数式(25)、(34)、(35)の更新式の代わりに数式(49)、(51)、(52)を更新式として利用してもよい。
次に、本発明の実施形態について説明する。
B.実施形態
図1は、本実施形態による信号分析装置の構成を示すブロック図である。図1において、信号分析装置10は、時間周波数解析部110、分析パラメータ初期値生成部120、情報記憶部100、分析パラメータ更新部130、分析パラメータ無矛盾化項計算部140、分析パラメータ収束判定部150、及び分析パラメータ出力部160を備えている。
分析パラメータ更新部130は、誤差配分係数計算部131、時間周波数成分配分量計算部132、位相スペクトルパラメータ計算部133、振幅スペクトル基底パラメータ計算部134、アクティビティ係数パラメータ計算部135、及び計算値反映部136から構成されている。
情報記憶部100は、振幅スペクトル基底パラメータ、アクティビティ係数パラメータ、及び位相スペクトルパラメータからなる時系列信号パラメータ、時間周波数成分、並びに、誤差配分量比重係数を記憶するための記憶領域である。また、情報記憶部100は、時間周波数成分配分量も記憶する。なお、各パラメータ等の詳細については後述する。
時間周波数解析部110は、時系列信号を時間周波数成分に分解し、情報記憶部100に出力する。より詳細には、時間周波数解析部110は、時系列信号を入力として、時間周波数成分Yω,tを出力する。ω=0,…,Ω−1、t=0,…,T−1は、それぞれ周波数、時刻に対応するインデックスとする。時間周波数成分Yω,tは、短時間フーリエ変換により計算する。また、時間周波数成分Yω,tは、次式(53)となるように規格化しておく。
Figure 2011053565
分析パラメータ初期値生成部120は、上記時系列信号パラメータ、及び誤差配分量比重係数の各初期値を生成し、情報記憶部100に出力する。より詳細には、分析パラメータ初期値生成部120は、次式(54)で示される、振幅スペクトル基底パラメータH、アクティビティ係数パラメータU、位相スペクトルパラメータφ、誤差配分量比重係数βの初期値を設定し、それぞれの設定値をH′、U′、φ′、β′とする。
Figure 2011053565
また、それぞれの初期値の選択可能範囲は、振幅スペクトル基底パラメータHとアクティビティ係数パラメータUに関しては、次式(55)とする。また、位相スペクトルパラメータφに関しては次式(56)とし、誤差配分量比重係数βに関しては次式(57)とする。
Figure 2011053565
Figure 2011053565
Figure 2011053565
分析パラメータ無矛盾化項計算部140は、情報記憶部100に記憶されている時系列信号パラメータから、新たな位相無矛盾化項を算出する。より詳細には、分析パラメータ無矛盾化項計算部140は、前段で得られたH′とU′とφ′とを用いて、数式(58)により、数式(32)で示す位相無矛盾化項 ̄Wを計算する。
Figure 2011053565
但し、W′は、次式(59)で表されるとする。
Figure 2011053565
誤差配分係数計算部131は、情報記憶部100に記憶されている時間周波数成分、及び時系列信号パラメータから、新たな誤差配分量比重係数を算出する。誤差配分量比重係数を定数とせず、反復計算毎に更新する場合、その更新則は、次式(60)のように、数式(61)を満たす範囲内で任意に決めてもよい。
Figure 2011053565
Figure 2011053565
また、誤差配分係数計算部131は、分析パラメータ収束判定部150によって分析パラメータが所定の規準を満たしていないと判断された場合に、新たな誤差配分量比重係数を再度算出する。
時間周波数成分配分量計算部132は、情報記憶部100に記憶されている時間周波数成分、及び時系列信号パラメータと、誤差配分係数計算部131によって算出された誤差配分量比重係数とから、時間周波数成分配分量を算出する。
より詳細には、時間周波数成分配分量計算部132は、前段で得られたH′、U′、φ′、βと時間周波数成分Yω,tとを用いて、数式(62)で示される時間周波数成分配分量 ̄Yを、数式(63)により計算する。
Figure 2011053565
Figure 2011053565
また、時間周波数成分配分量計算部132は、分析パラメータ収束判定部150によって分析パラメータが所定の規準を満たしていないと判断された場合に、新たな時間周波数成分配分量を再度算出する。
位相スペクトルパラメータ計算部133は、誤差配分係数計算部131によって算出された誤差配分量比重係数と、時間周波数成分配分量計算部132によって算出された時間周波数成分配分量と、分析パラメータ無矛盾化項計算部140によって算出された位相無矛盾化項とから、新たな位相スペクトルパラメータを算出する。
より詳細には、位相スペクトルパラメータ計算部133は、前段で得られたβと ̄Yと ̄Wとを用いて、次式(64)により、位相スペクトルパラメータφを計算する。
Figure 2011053565
また、位相スペクトルパラメータ計算部133は、分析パラメータ収束判定部150によって分析パラメータが所定の規準を満たしていないと判断された場合に、新たな位相スペクトルパラメータを再度算出する。
振幅スペクトル基底パラメータ計算部134は、情報記憶部100に記憶されているアクティビティ係数パラメータと、誤差配分係数計算部131によって算出された誤差配分量比重係数と、時間周波数成分配分量計算部132によって算出された時間周波数成分配分量と、位相スペクトルパラメータ計算部133によって算出された位相スペクトルパラメータと、分析パラメータ無矛盾化項計算部140によって算出された位相無矛盾化項とから、新たな振幅スペクトル基底パラメータを算出する。
より詳細には、振幅スペクトル基底パラメータ計算部134は、前段で得られたU′とβと ̄Yと ̄Wとφとを用いて、次式(65)に示す振幅スペクトル基底パラメータ ̄Hを、次式(66)により算出する。
Figure 2011053565
Figure 2011053565
但し、(・)は、(・)の複素共役を表し、Re[(・)]は、(・)の実部を表す。次に、次式(67)により ̄Hを規格化し、Hに代入する。
Figure 2011053565
また、振幅スペクトル基底パラメータ計算部134は、分析パラメータ収束判定部150によって分析パラメータが所定の規準を満たしていないと判断された場合に、新たな振幅スペクトル基底パラメータを再度算出する。
アクティビティ係数パラメータ計算部135は、情報記憶部100に記憶されている振幅スペクトル基底パラメータ、及びアクティビティ係数パラメータと、誤差配分係数計算部131によって算出された誤差配分量比重係数と、時間周波数成分配分量計算部132によって算出された時間周波数成分配分量と、位相スペクトルパラメータ計算部133によって算出された位相スペクトルパラメータと、分析パラメータ無矛盾化項計算部140によって算出された位相無矛盾化項とから、新たなアクティビティ係数パラメータを算出する。
より詳細には、アクティビティ係数パラメータ計算部135は、前段で得られたH′とU′とβと ̄Yと ̄Wとφとを用いて、次式(68)によりアクティビティ係数パラメータUを計算する。
Figure 2011053565
また、アクティビティ係数パラメータ計算部135は、分析パラメータ収束判定部150によって分析パラメータが所定の規準を満たしていないと判断された場合に、新たなアクティビティ係数パラメータを再度算出する。
計算値反映部136は、誤差配分係数計算部131、位相スペクトルパラメータ計算部133、振幅スペクトル基底パラメータ計算部134、及びアクティビティ係数パラメータ計算部135によって算出された新たな値を情報記憶部100に反映させる。
つまり、計算値反映部136は、前段で得られたH、U、φ、βを、H′、U′、φ′、β′に代入する。
また、計算値反映部136は、分析パラメータ収束判定部150によって分析パラメータが所定の規準を満たしていないと判断された場合に、再度算出された新たな値を情報記憶部100に反映させる。
分析パラメータ収束判定部150は、情報記憶部100に記憶されている分析パラメータが所定の規準を満たしているか否かを判定する。より詳細には、分析パラメータ収束判定部150は、反復計算が所定の回数を満たしたか否か、あるいは、反復計算においてパラメータの更新の変化率が所定値以下になったか否か、あるいは、目的関数地の変化率が所定値以下になったか否かを判定する。目的関数は、次式(69)により計算される。
Figure 2011053565
分析パラメータ出力部160は、分析パラメータ収束判定部150によって分析パラメータが所定の規準を満たしていると判定された場合に、該分析パラメータを出力する。
続いて、信号分析装置10の動作を説明する。図2は、本発明の実施形態に係る信号分析装置10の動作の一例を示すフローチャートである。
時間周波数解析部110は、時系列信号を時間周波数成分に分解し、情報記憶部100に記憶(出力)する(ステップS100)。分析パラメータ初期値生成部120は、上記時系列信号パラメータ、及び誤差配分量比重係数の各初期値を生成し、情報記憶部100に記憶(出力)する(ステップS110)。
分析パラメータ無矛盾化項計算部140は、情報記憶部100に記憶されている時系列信号パラメータから、新たな位相無矛盾化項を算出する(ステップS120)。誤差配分係数計算部131は、情報記憶部100に記憶されている時間周波数成分、及び時系列信号パラメータから、新たな誤差配分量比重係数を算出する(ステップS130)。
時間周波数成分配分量計算部132は、情報記憶部100に記憶されている時間周波数成分、及び時系列信号パラメータと、誤差配分係数計算部131によって算出された誤差配分量比重係数とから、時間周波数成分配分量を算出する(ステップS140)。位相スペクトルパラメータ計算部133は、誤差配分係数計算部131によって算出された誤差配分量比重係数と、時間周波数成分配分量計算部132によって算出された時間周波数成分配分量と、分析パラメータ無矛盾化項計算部140によって算出された位相無矛盾化項とから、新たな位相スペクトルパラメータを算出する(ステップS150)。
振幅スペクトル基底パラメータ計算部134は、情報記憶部100に記憶されているアクティビティ係数パラメータと、誤差配分係数計算部131によって算出された誤差配分量比重係数と、時間周波数成分配分量計算部132によって算出された時間周波数成分配分量と、位相スペクトルパラメータ計算部133によって算出された位相スペクトルパラメータと、分析パラメータ無矛盾化項計算部140によって算出された位相無矛盾化項とから、新たな振幅スペクトル基底パラメータを算出する(ステップS160)。
アクティビティ係数パラメータ計算部135は、情報記憶部100に記憶されている振幅スペクトル基底パラメータ、及びアクティビティ係数パラメータと、誤差配分係数計算部131によって算出された誤差配分量比重係数と、時間周波数成分配分量計算部132によって算出された時間周波数成分配分量と、位相スペクトルパラメータ計算部133によって算出された位相スペクトルパラメータと、分析パラメータ無矛盾化項計算部140によって算出された位相無矛盾化項とから、新たなアクティビティ係数パラメータを算出する(ステップS170)。
計算値反映部136は、誤差配分係数計算部131、位相スペクトルパラメータ計算部133、振幅スペクトル基底パラメータ計算部134、及びアクティビティ係数パラメータ計算部135によって算出された新たな値を情報記憶部100に反映させる(ステップS180)。
分析パラメータ収束判定部150は、情報記憶部100に記憶されている分析パラメータが所定の規準を満たしているか否かを判定し(ステップS190)、情報記憶部100に記憶されている分析パラメータが所定の規準を満たしていると判定された場合には(ステップS190:YES)、分析パラメータ出力部160は、分析パラメータを出力する(ステップS200)。
一方、情報記憶部100に記憶されている分析パラメータが所定の規準を満たしていないと、分析パラメータ収束判定部150にて判定された場合には(ステップS190:NO)、ステップS120に戻る。つまり、情報記憶部100に記憶されている分析パラメータが所定の規準を満たすようになるまで(所定の規準に収束するまで)、ステップS120からステップS190を繰り返し実行する。
C.実験例
次に、本発明の効果及び作用を示すため、本発明の実施形態を用いた実験例について説明する。
本実験では、発明の効果、及び作用の一例として、1チャンネルの教師あり音声音楽分離を行った。音声と音楽とを、それぞれ別々に事前に振幅スペクトル基底パラメータを学習させ、学習された基底を合わせ、固定する。新たな音声・音楽を混合した信号に対し、学習させた基底を用いて、提案手法によりアクティビティ係数パラメータ、及び位相スペクトルパラメータを推定する。
元々の音声と音楽とを、それぞれ別々に学習させた基底と、それに対するアクティビティ係数、及び位相スペクトルパラメータとを用いて、音声と音楽のそれぞれに対応する複素スペクトログラムを再合成し、その分離の精度を評価する。
音声には、男性話者の発話を用いて、音楽にはチャイムのメロディを用いた。サンプリング周波数は、16kHzとし、スペクトログラムは、フレーム長32msecのsine窓関数を16ms毎にシフトさせて作成した。基底の事前学習は、NMFを用いてそれぞれK=20個の基底を10secの信号で行った。5secの音声とチャイムとの混合音を基底学習のステップで用いた部分以外で作成した。基底を合わせて、K=40個の基底を固定し、アクティビティ係数パラメータと位相スペクトルパラメータのみを更新する。上述した実施形態に示した定数パラメータの実際の数値としては、次式(70)で示す値を用いた。
Figure 2011053565
本実験例では、次の3つの設定で、SNRの改善効果を測定した。
第1の設定は、最初から本発明を利用するようにγ=1とし、100回の反復を行った。第2の設定は、通常NMF(γ=0にした上でφを観測スペクトルの位相スペクトルに固定)を500回の反復(収束するまで)を行ってから、φを更新しはじめ、γ=1に変えて50回の反復を行った。また、第3の設定は、最初、γ=0のもとで(つまり、無矛盾性を考慮しない複素NMFを)100回の反復を行ってから、γ=1に変えて100回の反復を行った。
その結果、第1の設定では、チャイムが+11.4dB、音声が+9.71dBと改善した。第2の設定では、NMFが終わった時点において、それぞれ、+12.7dB、+6.6dBの改善があったが、本発明を適用した50回の反復で、+13.1dB、及び+9.8dBと、さらなる改善が得られた。第3の設定では、複素NMFが終わった時点の+13.1dBと+7dBの改善から、提案手法の100回の反復で、+12dBと+10dBまで改善した。
図3(a)、(b)は、第3の設定での目的関数の各項の推移を示す図である。図3(a)には、繰り返し回数に対するエラーを示し、図3(b)には、繰り返し回数に対する矛盾性を示している。100回目の反復から無矛盾化項が導入されたことの効果が明らかである。
また、図4(a)、(b)は、分離された信号(チャイムと音声)のスペクトログラムを示す図である。図4(a)には、チャイムと音声とが混合しているときのスペクトログラムを示し、図4(b)には、分離されたチャイム(上側)と分離された音声(下側)とのスペクトログラムを示している。無矛盾化項の導入により、更に高いSNRの改善が得られた。また、収束性の見通しを改善した結果、従来手法よりも目的関数が更に低く、すなわち、より良く目的に適うような解が得られた。
上述した実施形態によれば、分析パラメータの更新において、信号の時間周波数表現が無矛盾になるという制約を利用し、より的確な更新を行うことによって、より高精度またはより高速な信号分析処理を行うことができる。
なお、図2のフローチャートの各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、信号分析装置10に係る上述した種々の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
10 信号分析装置
100 情報記憶部
110 時間周波数解析部
120 分析パラメータ初期値生成部
130 分析パラメータ更新部
140 分析パラメータ無矛盾化項計算部
150 分析パラメータ収束判定部
160 分析パラメータ出力部
131 誤差配分係数計算部
132 時間周波数成分配分量計算部
133 位相スペクトルパラメータ計算部
134 振幅スペクトル基底パラメータ計算部
135 アクティビティ係数パラメータ計算部
136 計算値反映部

Claims (6)

  1. 時系列信号を分析する信号分析装置であって、
    振幅スペクトル基底パラメータ、アクティビティ係数パラメータ、及び位相スペクトルパラメータからなる時系列信号パラメータ、並びに誤差配分量比重係数からなる分析パラメータと、時間周波数成分とを記憶するための情報記憶部と、
    前記時系列信号を時間周波数成分に分解し、前記情報記憶部に記憶する時間周波数分解部と、
    前記時系列信号パラメータ、及び前記誤差配分量比重係数の各初期値を生成し、前記情報記憶部に記憶する初期値生成部と、
    前記時系列信号パラメータに基づいて、前記時間周波数成分を無矛盾とするための位相無矛盾化項を計算する分析パラメータ無矛盾化項計算部と、
    前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び、前記位相無矛盾化項に基づいて、前記分析パラメータを更新する分析パラメータ更新部と、
    前記分析パラメータが所定の規準を満たしているか否かを判定する分析パラメータ収束判定部と、
    前記分析パラメータ収束判定部によって前記分析パラメータが所定の規準を満たしていると判定されると、前記分析パラメータを出力する分析パラメータ出力部と、
    を備え、
    前記分析パラメータ更新部は、
    前記分析パラメータ収束判定部によって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記分析パラメータを再度更新する、
    ことを特徴とする信号分析装置。
  2. 前記分析パラメータ更新部は、
    前記情報記憶部に記憶されている前記時系列信号パラメータから、前記誤差配分量比重係数を計算する誤差配分係数計算部と、
    前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び前記誤差配分量比重係数から、時間周波数成分配分量を計算する時間周波数成分配分量計算部と、
    前記情報記憶部に記憶されている前記誤差配分量比重係数、前記時間周波数成分配分量、及び前記位相無矛盾化項から、前記位相スペクトルパラメータを計算する位相スペクトルパラメータ計算部と、
    前記情報記憶部に記憶されている前記アクティビティ係数パラメータ、前記誤差配分量比重係数、前記時間周波数成分配分量、前記位相スペクトルパラメータ、及び前記位相無矛盾化項から、前記振幅スペクトル基底パラメータを計算する振幅スペクトル基底パラメータ計算部と、
    前記情報記憶部に記憶されている前記振幅スペクトル基底パラメータ、前記アクティビティ係数パラメータ、前記誤差配分量比重係数、前記時間周波数成分配分量、前記位相スペクトルパラメータ、前記位相無矛盾化項から、前記アクティビティ係数パラメータを計算するアクティビティ係数パラメータ計算部と、
    前記誤差配分係数計算部、前記時間周波数成分配分量計算部、前記位相スペクトルパラメータ計算部、前記振幅スペクトル基底パラメータ計算部、及び前記アクティビティ係数パラメータ計算部によって算出された新たな値を前記情報記憶部に反映させる計算値反映部と、
    を備え、
    前記分析パラメータ収束判定部によって前記分析パラメータが所定の規準を満たしていないと判定された場合に、
    前記誤差配分係数計算部は、新たな誤差配分量比重係数を再度計算し、
    前記時間周波数成分配分量計算部は、新たな時間周波数成分配分量を再度計算し、
    前記位相スペクトルパラメータ計算部は、新たな位相スペクトルパラメータを再度計算し、
    前記振幅スペクトル基底パラメータ計算部は、新たな振幅スペクトル基底パラメータを再度計算し、
    前記アクティビティ係数パラメータ計算部は、新たなアクティビティ係数パラメータを再度計算し、
    前記計算値反映部は、再度計算された新たな誤差配分量比重係数、新たな時間周波数成分配分量、新たな位相スペクトルパラメータ、新たな振幅スペクトル基底パラメータ、新たなアクティビティ係数パラメータの値を前記情報記憶部に反映させる、
    ことを特徴とする請求項1に記載の信号分析装置。
  3. 時系列信号を分析する信号分析方法であって、
    前記時系列信号を時間周波数成分に分解し、情報記憶部に記憶する時間周波数分解ステップと、
    振幅スペクトル基底パラメータ、アクティビティ係数パラメータ、及び位相スペクトルパラメータからなる時系列信号パラメータと、誤差配分量比重係数とからなる分析パラメータの各初期値を生成し、前記情報記憶部に記憶する初期値生成ステップと、
    前記情報記憶部に記憶されている時系列信号パラメータに基づいて、前記時間周波数成分を無矛盾とするための位相無矛盾化項を計算する分析パラメータ無矛盾化項計算ステップと、
    前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び、前記位相無矛盾化項に基づいて、前記情報記憶部に記憶されている分析パラメータを更新する分析パラメータ更新ステップと、
    前記分析パラメータが所定の規準を満たしているか否かを判定する分析パラメータ収束判定ステップと、
    前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていると判定されると、前記分析パラメータを出力する分析パラメータ出力ステップと、
    を含み、
    前記分析パラメータ更新ステップは、
    前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記分析パラメータを再度更新する、
    ことを特徴とする信号分析方法。
  4. 前記分析パラメータ更新ステップは、
    前記情報記憶部に記憶されている前記時系列信号パラメータから、前記誤差配分量比重係数を計算する誤差配分係数計算ステップと、
    前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び前記誤差配分量比重係数から、時間周波数成分配分量を計算する時間周波数成分配分量計算ステップと、
    前記情報記憶部に記憶されている前記誤差配分量比重係数、前記時間周波数成分配分量、及び前記位相無矛盾化項から、前記位相スペクトルパラメータを計算する位相スペクトルパラメータ計算ステップと、
    前記情報記憶部に記憶されている前記アクティビティ係数パラメータ、前記誤差配分量比重係数、前記時間周波数成分配分量、前記位相スペクトルパラメータ、及び前記位相無矛盾化項から、前記振幅スペクトル基底パラメータを計算する振幅スペクトル基底パラメータ計算ステップと、
    前記情報記憶部に記憶されている前記振幅スペクトル基底パラメータ、前記アクティビティ係数パラメータ、前記誤差配分量比重係数、前記時間周波数成分配分量、前記位相スペクトルパラメータ、前記位相無矛盾化項から、前記アクティビティ係数パラメータを計算するアクティビティ係数パラメータ計算ステップと、
    前記誤差配分係数計算ステップ、前記時間周波数成分配分量計算ステップ、前記位相スペクトルパラメータ計算ステップ、前記振幅スペクトル基底パラメータ計算ステップ、及び前記アクティビティ係数パラメータ計算ステップによって算出された新たな値を前記情報記憶部に反映させる計算値反映ステップと、
    を有し、
    前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていないと判定された場合に、
    前記誤差配分係数計算ステップは、新たな誤差配分量比重係数を再度計算し、
    前記時間周波数成分配分量計算ステップは、新たな時間周波数成分配分量を再度計算し、
    前記位相スペクトルパラメータ計算ステップは、新たな位相スペクトルパラメータを再度計算し、
    前記振幅スペクトル基底パラメータ計算ステップは、新たな振幅スペクトル基底パラメータを再度計算し、
    前記アクティビティ係数パラメータ計算ステップは、新たなアクティビティ係数パラメータを再度計算し、
    前記計算値反映ステップは、再度計算された新たな誤差配分量比重係数、新たな時間周波数成分配分量、新たな位相スペクトルパラメータ、新たな振幅スペクトル基底パラメータ、新たなアクティビティ係数パラメータの値を前記情報記憶部に反映させる、
    ことを特徴とする請求項3に記載の信号分析方法。
  5. 情報記憶部を有する装置であって時系列信号を分析する信号分析装置を構成するコンピュータに、
    前記時系列信号を時間周波数成分に分解し、前記情報記憶部に記憶する時間周波数分解ステップと、
    振幅スペクトル基底パラメータ、アクティビティ係数パラメータ、及び位相スペクトルパラメータからなる時系列信号パラメータと、誤差配分量比重係数とからなる分析パラメータの各初期値を生成し、前記情報記憶部に記憶する初期値生成ステップと、
    前記情報記憶部に記憶されている時系列信号パラメータに基づいて、前記時間周波数成分を無矛盾とするための位相無矛盾化項を計算する分析パラメータ無矛盾化項計算ステップと、
    前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び、前記位相無矛盾化項に基づいて、前記情報記憶部に記憶されている分析パラメータを更新する分析パラメータ更新ステップと、
    前記分析パラメータが所定の規準を満たしているか否かを判定する分析パラメータ収束判定ステップと、
    前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていると判定されると、前記分析パラメータを出力する分析パラメータ出力ステップと、
    を実行させ、
    前記分析パラメータ更新ステップは、
    前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記分析パラメータを再度更新する、
    ことを特徴とするプログラム。
  6. 情報記憶部を有する装置であって時系列信号を分析する信号分析装置を構成するコンピュータに、
    前記時系列信号を時間周波数成分に分解し、前記情報記憶部に記憶する時間周波数分解ステップと、
    振幅スペクトル基底パラメータ、アクティビティ係数パラメータ、及び位相スペクトルパラメータからなる時系列信号パラメータと、誤差配分量比重係数とからなる分析パラメータの各初期値を生成し、前記情報記憶部に記憶する初期値生成ステップと、
    前記情報記憶部に記憶されている時系列信号パラメータに基づいて、前記時間周波数成分を無矛盾とするための位相無矛盾化項を計算する分析パラメータ無矛盾化項計算ステップと、
    前記情報記憶部に記憶されている前記時間周波数成分、前記時系列信号パラメータ、及び、前記位相無矛盾化項に基づいて、前記情報記憶部に記憶されている分析パラメータを更新する分析パラメータ更新ステップと、
    前記分析パラメータが所定の規準を満たしているか否かを判定する分析パラメータ収束判定ステップと、
    前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていると判定されると、前記分析パラメータを出力する分析パラメータ出力ステップと、
    を実行させ、
    前記分析パラメータ更新ステップは、
    前記分析パラメータ収束判定ステップによって前記分析パラメータが所定の規準を満たしていないと判定された場合に、前記分析パラメータを再度更新する、
    ためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2009204065A 2009-09-03 2009-09-03 信号分析装置、信号分析方法、プログラム、及び記録媒体 Pending JP2011053565A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009204065A JP2011053565A (ja) 2009-09-03 2009-09-03 信号分析装置、信号分析方法、プログラム、及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009204065A JP2011053565A (ja) 2009-09-03 2009-09-03 信号分析装置、信号分析方法、プログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2011053565A true JP2011053565A (ja) 2011-03-17

Family

ID=43942602

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009204065A Pending JP2011053565A (ja) 2009-09-03 2009-09-03 信号分析装置、信号分析方法、プログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2011053565A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070884A (zh) * 2019-02-28 2019-07-30 北京字节跳动网络技术有限公司 音频起始点检测方法和装置
CN116050230A (zh) * 2022-10-25 2023-05-02 上海交通大学 基于蒙特卡洛的fd-oct的全波长信号模拟方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070884A (zh) * 2019-02-28 2019-07-30 北京字节跳动网络技术有限公司 音频起始点检测方法和装置
CN116050230A (zh) * 2022-10-25 2023-05-02 上海交通大学 基于蒙特卡洛的fd-oct的全波长信号模拟方法
CN116050230B (zh) * 2022-10-25 2023-08-22 上海交通大学 基于蒙特卡洛的fd-oct的全波长信号模拟方法

Similar Documents

Publication Publication Date Title
JP4660739B2 (ja) 音分析装置およびプログラム
US9721202B2 (en) Non-negative matrix factorization regularized by recurrent neural networks for audio processing
JP6623376B2 (ja) 音源強調装置、その方法、及びプログラム
JPWO2017146073A1 (ja) 声質変換装置、声質変換方法およびプログラム
JP5580585B2 (ja) 信号分析装置、信号分析方法及び信号分析プログラム
Hayes et al. A review of differentiable digital signal processing for music and speech synthesis
JP6044119B2 (ja) 音響解析装置およびプログラム
CN105474307A (zh) 定量的f0轮廓生成装置及方法、以及用于生成f0轮廓的模型学习装置及方法
JP6711765B2 (ja) 形成装置、形成方法および形成プログラム
JP2009204808A (ja) 音響特徴抽出方法及び、その装置、そのプログラム、そのプログラムを記録した記録媒体
JP2011053565A (ja) 信号分析装置、信号分析方法、プログラム、及び記録媒体
Hoffman et al. Finding latent sources in recorded music with a shift-invariant HDP
Gabrielli et al. A multi-stage algorithm for acoustic physical model parameters estimation
JP2012027196A (ja) 信号分析装置、方法、及びプログラム
US20200273480A1 (en) Sound source separating device, sound source separating method, and program
JP5771575B2 (ja) 音響信号分析方法、装置、及びプログラム
JP2013195575A (ja) 音響信号分析装置、方法、及びプログラム
JP5771582B2 (ja) 音響信号分析装置、方法、及びプログラム
Lee et al. Discriminative training of complex-valued deep recurrent neural network for singing voice separation
Li et al. Robust Non‐negative matrix factorization with β‐divergence for speech separation
WO2020017226A1 (ja) 耐雑音音声認識装置及び方法、並びにコンピュータプログラム
JP6564744B2 (ja) 信号解析装置、方法、及びプログラム
JP2010049102A (ja) 残響除去装置、残響除去方法、コンピュータプログラムおよび記録媒体
CN113066472A (zh) 合成语音处理方法及相关装置
JP5318042B2 (ja) 信号解析装置、信号解析方法及び信号解析プログラム