JP5318042B2 - Signal analysis apparatus, signal analysis method, and signal analysis program - Google Patents
Signal analysis apparatus, signal analysis method, and signal analysis program Download PDFInfo
- Publication number
- JP5318042B2 JP5318042B2 JP2010159604A JP2010159604A JP5318042B2 JP 5318042 B2 JP5318042 B2 JP 5318042B2 JP 2010159604 A JP2010159604 A JP 2010159604A JP 2010159604 A JP2010159604 A JP 2010159604A JP 5318042 B2 JP5318042 B2 JP 5318042B2
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- signal
- model
- filter characteristic
- model parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
Description
本発明は、時系列信号の動特性特徴を抽出する信号解析装置、信号解析方法及び信号解析プログラムに関する。 The present invention relates to a signal analysis apparatus, a signal analysis method, and a signal analysis program that extract dynamic characteristic features of time series signals.
歌声音響信号から抽出される基本周波数系列を例に挙げて、従来技術を説明する。この歌声の基本周波数系列には、歌唱者が歌おうとする音高目標値系列と歌唱力・歌唱スタイル・個人性・感情に基づく様々な動的変動成分(オーバーシュートやビブラートなど)が複雑に重ね合わされている。歌声は、多くのジャンルの音楽を特徴づける重要な要素の一つであり、この歌声の基本周波数系列に着目した様々な研究が現在盛んに行われている。 The prior art will be described using a basic frequency sequence extracted from a singing voice acoustic signal as an example. In the basic frequency series of this singing voice, the pitch target value series that the singer wants to sing and various dynamic fluctuation components (overshoot, vibrato, etc.) based on singing power, singing style, personality, and emotion are overlaid in a complex manner. Has been. Singing voice is one of the important elements that characterize many genres of music, and various studies focusing on the fundamental frequency series of singing voice are currently being actively conducted.
基本周波数系列に含まれる音高目標値系列を特徴抽出できれば、ハミング検索や自動採譜への応用が期待される。特に、歌声から楽曲を検索するハミング検索では、歌唱された歌声の基本周波数系列から、歌唱者の意図する音高目標値系列を正しく推定して、楽曲データベースの旋律と照合する必要がある。 If feature extraction of the pitch target value sequence included in the fundamental frequency sequence can be performed, application to hamming search and automatic music transcription is expected. In particular, in the Hamming search for searching for music from a singing voice, it is necessary to correctly estimate a pitch target value series intended by the singer from the basic frequency series of sung singing voices, and to collate with the melody of the music database.
一方で、オーバーシュートやビブラートのような基本周波数系列の動的変動成分は、歌声知覚、個人性知覚に影響を与える成分であることが知られている。したがって、歌唱スタイルの記述やそれを利用した類似歌声検索、歌唱力自動評価のための有用な尺度となりうる。また、より表情豊かかつ多様な歌声合成のためにも必要不可欠な成分である。そこで従来研究では、線形2次系を利用して歌声の基本周波数の動的変動成分を制御するモデルが提案されている(例えば、非特許文献1、2、3参照)。
On the other hand, it is known that dynamic fluctuation components of the fundamental frequency series such as overshoot and vibrato are components that affect singing voice perception and personality perception. Therefore, it can be a useful measure for description of singing style, similar singing voice search using the singing style, and automatic evaluation of singing ability. It is also an indispensable component for more expressive and diverse singing voice synthesis. Therefore, in the conventional research, a model for controlling a dynamic fluctuation component of the fundamental frequency of a singing voice using a linear quadratic system has been proposed (for example, see Non-Patent
これらの研究では、日本語の話声の基本周波数パターンを表現する藤崎モデルが参考にされた。藤崎モデルは、臨界制動2次系のインパルス応答とステップ応答を利用して、日本語の句頭から句末に向けて緩やかに下降するフレーズ成分と、語句に対応して急激に上昇下降するアクセント成分を表現し、これらを重畳することで、基本周波数系列を記述する。ただし、歌声の旋律に伴った急激な基本周波数の上昇・下降の制御及び、ビブラートのような周期的な振動は、臨界制動系では表現できない。そのため、歌声の基本周波数制御モデルでは2次系の伝達関数
非特許文献3では、音階を表す階段状信号に式(1)のインパルス応答を畳み込んで得られる基本周波数系列を利用して、表情豊かな歌声合成音を実現した。しかしながら、これらの従来技術では、制御パラメータ(減衰率ζと固有周波数Ω)が手作業あるいは規則に基づいて決定されるものであった。これに対し、非特許文献4では、入力となる階段状信号および線形2次系の制御パラメータがいずれも未知の下で、観測される基本周波数系列だけから、それらを同時に推定する確率的なフレームワークが提案された。これは、音高目標値系列を表現する隠れマルコフモデル(HMM)と、差分近似に基づく式(1)のパラメトリックな表現によって、最尤なモデルパラメータを反復推定する学習アルゴリズムである。
In
しかしながら、上述した非特許文献4の従来技術では、モデルパラメータの推定性能が悪かった。すなわち、観測される基本周波数系列と、パラメータによって再合成される基本周波数系列との誤差が大きくなるという問題がある。これは、基本周波数系列には音高の立ち上がりやビブラートのような様々な動特性が混在しているため、2次系のパラメータを最尤法によって直接推定すると、ある特定の動特性に引っ張られるオーバーフィッティングの問題が発生するためである。これに対し、基本周波数系列をフレーム分割して、フレームごとにモデルパラメータを推定する手法も提案されたが、各動特性を生み出す2次系の影響範囲が系列上で不明確であるため、結局モデルパラメータを適切に推定できないという問題がある。
However, in the prior art of Non-Patent
本発明は、このような事情に鑑みてなされたもので、時系列信号の動特性特徴を抽出する際に、入力となる階段状信号および線形2次系の制御パラメータがいずれも未知の下で、観測される基本周波数系列だけから、モデルパラメータを精度よく推定することができる信号解析装置、信号解析方法及び信号解析プログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, and when extracting the dynamic characteristic features of the time series signal, the input stepwise signal and the control parameter of the linear secondary system are both unknown. An object of the present invention is to provide a signal analysis apparatus, a signal analysis method, and a signal analysis program capable of accurately estimating model parameters from only the observed fundamental frequency series.
本発明は、観測信号[o]を、入力信号[f]とフィルタ特性を表すインパルス応答信号[h]との畳みこみによって得られる信号生成系の出力信号[y]と残差信号[ε]との和で表し、前記観測信号から、前記入力信号を表すモデルを構成する入力信号パラメータ[u]と、前記フィルタ特性を表すモデルを構成するフィルタ特性パラメータ[{a,b}または{a0,a1,a2}または{w1,w2,…,wI}]と、前記残差信号を表すモデルを構成する残差信号パラメータ[β]とを推定することにより時系列信号の動特性特徴を抽出する信号解析装置であって、前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成部と、前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータ[Θ]とし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離部と、前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの、対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られるQ関数[式27]を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新部と、前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離部と前記モデルパラメータ更新部による処理とを再度行わせるパラメータ収束判定部と、前記パラメータ収束判定部により前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力部とを備えることを特徴とする。 In the present invention, an output signal [y] and a residual signal [ε] of a signal generation system obtained by convolving an observation signal [o] with an input signal [f] and an impulse response signal [h] representing filter characteristics. And the input signal parameter [u] constituting the model representing the input signal and the filter characteristic parameter [{a, b} or {a 0 constituting the model representing the filter characteristic from the observed signal. , A 1 , a 2 } or {w 1 , w 2 ,..., W I }] and a residual signal parameter [β] constituting the model representing the residual signal, thereby estimating the time series signal. A signal analysis apparatus for extracting a dynamic characteristic feature, comprising: a parameter initial value generation unit that generates initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal; A set of a filter characteristic parameter, the input signal parameter, and the residual signal parameter is a model parameter [Θ], and the observation signal is configured by the input signal parameter and the filter characteristic parameter using the model parameter. A set of a signal separation unit for separating the output signal of the signal generation system and the residual signal configured by the residual signal parameter, the observation signal, the model parameter, the output signal, and the residual signal When the Q function [Equation 27] obtained by adding the prior probability of the model parameter to the conditional expected value of the log likelihood function is given as an objective function, the objective function is maximized with respect to the model parameter. A model parameter updating unit for updating the model parameter so as to be It is determined whether or not a predetermined standard is satisfied, and when it is determined that the predetermined standard is not satisfied, the processing by the signal separation unit and the model parameter update unit is performed again until the predetermined standard is satisfied. A parameter convergence determination unit; and a parameter output unit configured to output the model parameter when the parameter convergence determination unit determines that the model parameter satisfies a predetermined criterion.
本発明は、 前記入力信号はステップ信号[式17]であり、前記出力信号は多次元ガウス分布に従うものとして確率的にモデル化[式21]され、前記残差信号は、ガウス性白色雑音として確率的にモデル化[式22]されることを特徴とする。 In the present invention, the input signal is a step signal [Equation 17], the output signal is stochastically modeled as following a multidimensional Gaussian distribution [Equation 21], and the residual signal is expressed as Gaussian white noise. It is characterized by being probabilistically modeled [Equation 22].
本発明は、前記信号生成系のフィルタ特性は、差分法によって導出されるフィルタ[式5]で表され、前記フィルタ特性パラメータは、前記固有周波数の二乗に反比例するパラメータ[a=1/Ω2, 式5]と、前記減衰率に比例し前記固有周波数に反比例するパラメータ[b=2ζ/Ω, 式5]とであることを特徴とする。 According to the present invention, the filter characteristic of the signal generation system is expressed by a filter [Expression 5] derived by a difference method, and the filter characteristic parameter is a parameter [a = 1 / Ω 2 inversely proportional to the square of the natural frequency. , Equation 5] and a parameter [b = 2ζ / Ω, Equation 5] proportional to the attenuation factor and inversely proportional to the natural frequency.
本発明は、前記信号生成系のフィルタ特性は、自己回帰過程に基づいて構成されるフィルタ[式10]で表され、前記フィルタ特性パラメータは、自己回帰パラメータ[式9]であることを特徴とする。 In the present invention, the filter characteristic of the signal generation system is represented by a filter [Equation 10] configured based on an autoregressive process, and the filter characteristic parameter is an autoregressive parameter [Equation 9]. To do.
本発明は 前記信号生成系のフィルタ特性は、複数の2次系フィルタの重み付き線形和によって構成されるフィルタ[式15]で表され、前記フィルタ特性パラメータは、前記各2次系フィルタの重み[{w1,w2,…,wI}]であることを特徴とする。 In the present invention, the filter characteristic of the signal generation system is represented by a filter [Equation 15] configured by a weighted linear sum of a plurality of second-order filters, and the filter characteristic parameter is a weight of each second-order filter. [{W 1 , w 2 ,..., W I }].
本発明は、前記モデルパラメータ更新部は、補助変数から構成される前記目的関数の補助関数を、前記固有周波数の二乗に反比例するパラメータ[a]と前記補助関数を前記減衰率に比例し前記固有周波数に反比例するパラメータ[b]とでそれぞれ微分して得られる方程式からなる連立方程式[式36と式37]をフィルタ特性パラメータについて解くことにより、フィルタ特性パラメータ[{a,b}]の値を更新するフィルタ特性パラメータ更新部と、前記補助関数を、前記入力信号パラメータで微分して得られる方程式[式38]を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、前記補助関数を、前記残差信号パラメータで微分して得られる方程式[式38]を解くことにより、残差信号パラメータを更新する残差信号パラメータ更新部とから構成されることを特徴とする。 According to the present invention, the model parameter update unit sets the auxiliary function of the objective function composed of auxiliary variables to a parameter [a] that is inversely proportional to the square of the natural frequency and the auxiliary function that is proportional to the attenuation rate and the eigenfunction. By solving simultaneous equations [Equations 36 and 37] consisting of equations obtained by differentiating each of the parameters [b] inversely proportional to the frequency with respect to the filter properties parameters, the values of the filter properties parameters [{a, b}] are obtained. A filter characteristic parameter updating unit for updating, an input signal parameter updating unit for updating an input signal parameter by solving an equation [Equation 38] obtained by differentiating the auxiliary function with the input signal parameter, and the auxiliary function By solving the equation [Equation 38] obtained by differentiating the signal with the residual signal parameter. Characterized in that it is composed of a residual signal parameter update section for updating.
本発明は、前記モデルパラメータ更新部は、前記目的関数を、前記フィルタ特性パラメータに含まれる各自己回帰パラメータ[{a0,a1,a2}]でそれぞれ微分して得られる方程式[式40, 式41, 式42]からなる連立方程式をフィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、前記目的関数を、前記入力信号パラメータで微分して得られる方程式[式43]を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、前記目的関数を、前記残差信号パラメータで微分して得られる方程式[式43]を解くことにより、残差信号パラメータを更新する残差信号パラメータ更新部とから構成されることを特徴とする。
In the present invention, the model parameter update unit is configured to obtain an equation obtained by differentiating the objective function by each autoregressive parameter [{a 0 , a 1 , a 2 }] included in the filter characteristic parameter [
本発明は、前記モデルパラメータ更新部は、補助変数から構成される前記目的関数の補助関数を、前記フィルタ特性パラメータである各2次系フィルタの重み[{w1,w2,…,wI}]でそれぞれ微分して得られる方程式からなる非線形連立方程式[式49または式57]を、フィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、前記補助関数を、前記入力信号パラメータで微分して得られる方程式[式50または式58]を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、前記補助関数を、前記残差信号パラメータで微分して得られる方程式[式50または式58]を解くことにより、残差信号パラメータを更新する残差信号パラメータ更新部とから構成されることを特徴とする。 In the present invention, the model parameter updating unit converts the auxiliary function of the objective function composed of auxiliary variables into weights [{w 1 , w 2 ,..., W I of the second-order filters that are the filter characteristic parameters]. }], A nonlinear simultaneous equation [Equation 49 or 57] consisting of equations obtained by differentiating each of them by solving for the filter characteristic parameter, the filter characteristic parameter updating unit for updating the value of the filter characteristic parameter, and the auxiliary function Is obtained by differentiating the input signal parameter by solving the equation [Equation 50 or 58] obtained by differentiating the input signal parameter, and the auxiliary function is differentiated by the residual signal parameter. A residual signal that updates the residual signal parameters by solving the equation [Eq. 50 or Eq. 58] Characterized in that it is composed of a parameter update unit.
本発明は、前記信号分離部は、前記観測信号と前記モデルパラメータが与えられた時の、前記出力信号および前記残差信号から構成される完全データの期待値[式(28)]と、前記完全データの自己相関[式(29)]とを用いて、前記観測信号を出力信号と残差信号とに分離することを特徴とする。 According to the present invention, the signal separation unit includes an expected value [Equation (28)] of complete data composed of the output signal and the residual signal when the observation signal and the model parameter are given, The observation signal is separated into an output signal and a residual signal using autocorrelation [Equation (29)] of complete data.
本発明は、観測信号を、入力信号とフィルタ特性を表すインパルス応答信号との畳みこみによって得られる信号生成系の出力信号と残差信号との和で表し、前記観測信号から、前記入力信号を表すモデルを構成する入力信号パラメータと、前記フィルタ特性を表すモデルを構成するフィルタ特性パラメータと、前記残差信号を表すモデルを構成する残差信号パラメータとを推定することにより時系列信号の動特性特徴を抽出する信号解析装置における信号解析方法であって、前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成ステップと、前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離ステップと、前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新ステップと、前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離ステップと前記モデルパラメータ更新ステップによる処理を再度行わせるパラメータ収束判定ステップと、前記パラメータ収束判定ステップにより前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力ステップとを有することを特徴とする。 The present invention represents an observation signal as a sum of an output signal of a signal generation system obtained by convolution of an input signal and an impulse response signal representing a filter characteristic and a residual signal, and the input signal is expressed from the observation signal. The dynamic characteristics of the time-series signal by estimating the input signal parameters constituting the model to be represented, the filter characteristic parameters constituting the model representing the filter characteristics, and the residual signal parameters constituting the model representing the residual signal A signal analysis method in a signal analysis apparatus for extracting features, the parameter initial value generating step for generating initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal, and the filter characteristic A set of a parameter, the input signal parameter, and the residual signal parameter is a model parameter. The observation signal is separated into the output signal of the signal generation system configured by the input signal parameter and the filter characteristic parameter and the residual signal configured by the residual signal parameter using the model parameter. A priori probability of the model parameter to a conditional expectation value of a log-likelihood function when given a signal separation step, the observed signal, the model parameter, and a set of the output signal and the residual signal. A model parameter update step of updating the model parameter so as to maximize the objective function with respect to the model parameter, using the function obtained by addition as an objective function, and whether or not the model parameter satisfies a predetermined criterion If it is determined that the predetermined standard is not satisfied, the predetermined standard is satisfied. Until it is determined that the model parameter satisfies a predetermined criterion by the parameter convergence determination step that causes the signal separation step and the model parameter update step to be performed again, and the parameter convergence determination step, the model parameter And a parameter output step for outputting.
本発明は、観測信号を、入力信号とフィルタ特性を表すインパルス応答信号との畳みこみによって得られる信号生成系の出力信号と残差信号との和で表し、前記観測信号から、前記入力信号を表すモデルを構成する入力信号パラメータと、前記フィルタ特性を表すモデルを構成するフィルタ特性パラメータと、前記残差信号を表すモデルを構成する残差信号パラメータとを推定することにより時系列信号の動特性特徴を抽出する信号解析装置上のコンピュータに信号解析を行わせる信号解析プログラムであって、前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成ステップと、前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離ステップと、前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新ステップと、前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離ステップと前記モデルパラメータ更新ステップによる処理を再度行わせるパラメータ収束判定ステップと、前記パラメータ収束判定ステップにより前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力ステップとを前記コンピュータに行わせることを特徴とする。 The present invention represents an observation signal as a sum of an output signal of a signal generation system obtained by convolution of an input signal and an impulse response signal representing a filter characteristic and a residual signal, and the input signal is expressed from the observation signal. The dynamic characteristics of the time-series signal by estimating the input signal parameters constituting the model to be represented, the filter characteristic parameters constituting the model representing the filter characteristics, and the residual signal parameters constituting the model representing the residual signal A signal analysis program for causing a computer on a signal analysis device for extracting features to perform signal analysis, wherein parameter initials for generating initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal A value generation step, the filter characteristic parameter, the input signal parameter, and the residual signal parameter. A set with a meter is used as a model parameter, and the observation signal is configured by the output signal of the signal generation system configured by the input signal parameter and the filter characteristic parameter and the residual signal parameter by using the model parameter. A conditional expectation value of a log-likelihood function when given a signal separation step for separating the residual signal, the observed signal, the model parameter, and the set of the output signal and the residual signal. A function obtained by adding the prior probabilities of the model parameters to the objective function, a model parameter updating step for updating the model parameter so as to maximize the objective function with respect to the model parameter; and Judgment is made whether or not the standard is satisfied, and the predetermined standard is not satisfied When it is determined that the model parameter satisfies the predetermined criterion, the parameter separation determining step for performing again the processing by the signal separation step and the model parameter updating step until the predetermined criterion is satisfied, and the model parameter satisfies the predetermined criterion by the parameter convergence determining step. If it is determined, the computer is caused to perform a parameter output step of outputting the model parameter.
本発明によれば、入力となる階段状信号および線形2次系の制御パラメータがいずれも未知の下で、観測される基本周波数系列のみからモデルパラメータを精度よく推定することができるという効果が得られる。 According to the present invention, it is possible to accurately estimate a model parameter from only an observed fundamental frequency sequence when both the input stepped signal and the control parameter of the linear secondary system are unknown. It is done.
以下、図面を参照して、本発明の一実施形態による信号解析装置を説明する。まず、本発明の信号解析装置において、入力となる階段状信号および線形2次系の制御パラメータがいずれも未知の下で、観測される基本周波数系列のみからモデルパラメータを精度よく推定する原理について説明する。 Hereinafter, a signal analyzing apparatus according to an embodiment of the present invention will be described with reference to the drawings. First, in the signal analysis apparatus of the present invention, the principle of accurately estimating model parameters from only the observed fundamental frequency sequence will be described under the assumption that both the input stepwise signal and the control parameter of the linear quadratic system are unknown. To do.
図1は、線形2次系モデルの概念を示す説明図である。図1に示すように、観測信号o(t)を複数の区分に分割し、それぞれの区分における観測信号を、ステップ信号(入力信号)f(t)、フィルタ特性(線形2次系のインパルス応答)h(t)、残差信号(剰余信号)ε(t)の3つの要素に分解するものとする。 FIG. 1 is an explanatory diagram showing the concept of a linear quadratic system model. As shown in FIG. 1, the observation signal o (t) is divided into a plurality of sections, and the observation signal in each section is converted into a step signal (input signal) f (t) and a filter characteristic (an impulse response of a linear secondary system). ) H (t) and residual signal (residue signal) ε (t).
ここで、図2を参照して、入力信号f(t)と観測信号o(t)との関係を説明する。図2は、信号生成系の概念を示す説明図である。入力信号f(t)は、目標値からなる信号を意味する。線形の2次系フィルタh(t)は、2次系に従う、観測信号の時間的な立ち上がりやオーバーシュートなどの動特性を表現する。線形2次系フィルタの出力信号y(t)は、f(t)とh(t)の畳み込み
ここで、線形2次系の伝達関数を離散時間表現する4つの手法について説明する。まず、差分法による離散時間表現法(手法1という)について説明する。式(1)をラプラス逆変換すると、
この近似を利用すると式(3)は、
もちろん、差分法は、式(4)以外にも複数の近似方法(中央差分、前進差分、後退差分、Sinc関数利用など)を用いることができ、結果的にA、B、Cそれぞれの行列の構成を変更することに相当する。手法1では、式(5)のa、bがフィルタ特性パラメータとなる。
Of course, the difference method can use a plurality of approximation methods (center difference, forward difference, backward difference, use of Sinc function, etc.) in addition to equation (4). This corresponds to changing the configuration. In
次に、自己回帰モデルに基づく離散時間表現法(手法2という)について説明する。式(1)のs領域からz領域への写像を考える。
これは2次の自己回帰モデルと同形であり、
次に、複数の振動基底の線形和に基づく離散時間表現法(手法3、手法4という)について説明する。式(1)の伝達関数のラプラス逆変換によって得られるインパルス応答は、ζの値によって、以下のように場合分けされる。
これらのインパルス応答をサンプリング周期Δに基づいて離散化すると、系の入出力関係は、y=Φfのような形式で記述できる。例えば、ζ=1の場合、Φは下三角行列
ここでは、予め手動でζ、Ωを決定し、I個の振動現象を表すインパルス応答{Φ(1),Φ(2),・・・,Φ(I)}を計算する。そして、これらの逆行列Υ(i):=(Φ(t))−1(逆フィルタのインパルス応答を表す。これらを以後、振動基底と呼ぶ)の線形重み付き和で、Φ−1を近似する。手法3では、式(14)のw:={w1,w2,・・・,wI}をフィルタ特性パラメータとし、これらのパラメータを回帰問題の枠組みで推定するものとする。
Here, ζ and Ω are manually determined in advance, and impulse responses {Φ (1) , Φ (2) ,..., Φ (I) } representing I vibration phenomena are calculated. Then, Φ −1 is approximated by a linear weighted sum of these inverse matrices i (i) : = (Φ (t) ) −1 (representing the impulse response of the inverse filter. These are hereinafter referred to as vibration bases). To do. In
一方、手法4では、フィルタ特性パラメータw:={w1,w2,・・・,wI}がスパースなものとする。これは、Φ−1が、ほんの数個の振動基底のみによって表現されることを意味する。後に説明するが、これはwの事前確率を想定することで容易に実現されうる。
On the other hand, in the
系のインパルス応答ΦをΦ(i)の線形重み付き和で表現してもよいが、Υ(i)の線形重み付き和で逆フィルタのインパルス応答Φ−1を表現した理由は、後に説明するパラメータ学習アルゴリズムの導出の複雑さを解消するためである。それゆえに、系の入出力関係は、
以上に説明した4つの手法(式(5)、式(10)、式(15))より、式(1)の伝達関数が、すべてΨy=fの形式に変換された。Ψはそれぞれ、
次に、ガウス過程に基づく線形2次系の統計的モデリングについて説明する。式(5)、式(10)、式(15)によって表現される系の入出力関係を、ガウス過程(文献:C. E. Rasmussen and C. K. I. Williams, Gaussian Processes for Machine Learning. MIT Press, Cambridge, Mass, USA, 2006.)に基づいて統計的にモデル化する。 Next, statistical modeling of a linear quadratic system based on a Gaussian process will be described. The input / output relationship of the system expressed by Equation (5), Equation (10), and Equation (15) can be expressed as a Gaussian process (literature: CE Rasmussen and CKI Williams, Gaussian Processes for Machine Learning. MIT Press, Cambridge, Mass, USA). , 2006.) for statistical modeling.
ここで、入力ステップ信号のモデル化について説明する。入力信号fはステップ信号を想定する。そのために、常に同じ値をもつベクトル
ここで、αは分散を表す超パラメータであり、あらかじめ手動で値を設定する。したがって、請求項で述べた入力信号パラメータはuのみである。出力yは、ガウス分布に従う変数集合fの線形結合(y=Ψ−1f)であるから、y自身もガウス分布に従う。その平均と共分散は、
このモデルはガウス過程の1つの例となっていることは特筆すべき点である。ガウス過程の重要な点は、yのN個の要素の同時分布が、平均と共分散といった2次までの統計量で完全に記述される点である。通常のガウス過程では、平均はたいていの場合、零とすることが多く、共分散はカーネル行列の線形和(Multiple Kernel Learning;文献:F. R. Bach, G. R. G. Lanckriet, and M. I. Jordan, “Multiple kernel learning, conic duality, and the smo algorithm," in Proc. ICML 2004, pp. 6-13, July 2004)によって構成されるのが一般的である。この技術により、複数の観測値(ここでは、yの要素)がそれぞれ独立同分布に従うと仮定するのではなく、観測値間の相関を考慮できる。このMultiple Kernel Learningを利用したガウス過程による信号モデリングは機械学習の分野で近年注目を集めている。 It should be noted that this model is an example of a Gaussian process. The important point of the Gaussian process is that the simultaneous distribution of N elements of y is completely described by statistics up to second order such as mean and covariance. In normal Gaussian processes, the mean is often zero, and the covariance is the linear sum of kernel matrices (Multiple Kernel Learning; literature: FR Bach, GRG Lanckriet, and MI Jordan, “Multiple kernel learning, conic In general, it is composed of duality, and the smo algorithm, "in Proc. ICML 2004, pp. 6-13, July 2004). With this technique, rather than assuming that a plurality of observed values (in this case, elements of y) follow independent and identical distributions, the correlation between the observed values can be considered. In recent years, signal modeling using Gaussian processes using Multiple Kernel Learning has attracted attention in the field of machine learning.
これに対し、前述したモデルでは、式(21)の平均と共分散の項に行列Ψ−1を含む。そして、式(16)のように、Ψがいくつかの基底の線形和で表現されている。したがって、Multiple Kernel Learningとは異なる、特別なガウス過程に基づく信号モデルとここで言及する。 On the other hand, in the above-described model, the matrix Ψ −1 is included in the mean and covariance terms of Equation (21). Then, as in Expression (16), Ψ is expressed by a linear sum of several bases. Therefore, here we refer to a signal model based on a special Gaussian process, which is different from Multiple Kernel Learning.
次に、尤度関数と事前確率について説明する。ガウス性白色雑音に従う残差信号
ここで、βは残差信号の分散を表す超パラメータとし、これが請求項でいう残差信号パラメータに相当する。yとεは互いに独立であると仮定すると、ガウス過程の定義より、観測信号oが与えられたときのモデルパラメータθ={Ψ,u,β}の対数尤度関数は、
Θの事前確率P(Θ)は、各要素の独立性P(Θ)=P(Ψ)P(u)P(β)を仮定し、uとβはそれぞれ一様分布に従うものとする。P(Ψ)は、前述した手法1〜4のフィルタ特性パラメータの独立性を仮定して、
次に、EM法に基づくパラメータ学習アルゴリズムについて説明する。基本周波数系列oが与えられたときに、事後確率P(Θ|o)∝P(o|Θ)P(Θ)を最大化するパラメータΘの推定値を決定したい。しかしながら、Θの事後(MAP)推定値に関する最適解を解析的に求めることは難しい。その理由は、観測信号oが出力信号yと残差信号εの和で構成される、尤度関数が、Ψを構成するフィルタ特性パラメータに関して非線形となるなどが挙げられる。ここでは、それぞれの問題に対処するために、次の2つの方策を適用する。 Next, a parameter learning algorithm based on the EM method will be described. Given a fundamental frequency sequence o, we want to determine an estimate of the parameter Θ that maximizes the posterior probability P (Θ | o) ∝P (o | Θ) P (Θ). However, it is difficult to analytically determine the optimal solution for the posterior (MAP) estimate of Θ. The reason is that the observation signal o is composed of the sum of the output signal y and the residual signal ε, and the likelihood function is non-linear with respect to the filter characteristic parameter constituting Ψ. Here, in order to deal with each problem, the following two measures are applied.
1つ目は、EM法のE−stepで、oをyとεに分配することである。2つ目は、M−stepに補助関数法(文献:H. Kameoka, N. Ono, K. Kashino, and S. Sagayama, “Complex NMF: A New Sparse Representation for Acoustic Signals," in Proc. ICASSP 2009, pp. 3437-3440, April 2009)を適用して、Q関数の補助関数を設計することである。 The first is to distribute o to y and ε in E-step of EM method. The second is an auxiliary function method (reference: H. Kameoka, N. Ono, K. Kashino, and S. Sagayama, “Complex NMF: A New Sparse Representation for Acoustic Signals,” in Proc. ICASSP 2009 , pp. 3437-3440, April 2009) to design the auxiliary function of the Q function.
次に、完全データの定義について説明する。このMAP推定問題にEM法を適用する際の最初のステップは完全データを定義することである。ここでは、yとεを完全データxと見なして、EM法を適用する。不完全データと完全データの関係を、
なお、=の上にcのついた記号は、定数項を除いて左辺と右辺が等しいことを表し、
EM法のE−stepでは、直前に更新されたモデルパラメータをΘ´に代入し、E[x|o;Θ´]とE[xxT|o;Θ´]を計算する。後の計算のため、y、εに対応するようにE[x|o;Θ´]とE[xxT|o;Θ´]を
次に、Q関数を前述の手法1〜手法4の各モデルパラメータに関して、最大化するM−step更新式について説明する。まず、手法1のM−step更新式について説明する。Ψ=aA+bB+Cなので、式(27)から関連する項を取り出すと、最大化する目的関数は
そこで、f1 +(a,b,u,β,γ1)をa、bそれぞれに関して微分して0とおくと、
一方、f1 +(a,b,u,β,γ1)をu、βそれぞれに関して微分して0とおくと、
以上の手法1に関する、EM法に基づくパラメータ学習アルゴリズムをまとめると、以下のようになる。
初期化: パラメータΘ={a,b,u,β}に初期値を与える。E−step: E[x|o;Θ´]、E[xxT|o;Θ´]、γ1={γa,1,γb,1,γa,2,γb,2,・・・,γa,N,γb,N}の更新。M−step:式(36)、(37)、(38)より、モデルパラメータΘ={a,b,u,β}の更新。収束判定:式(34)の補助関数の値が収束していなければ、Θ´=ΘとしてE−stepに戻る。
The parameter learning algorithm based on the EM method related to the
Initialization: An initial value is given to the parameter Θ = {a, b, u, β}. E-step: E [x | o; Θ ′], E [xx T | o; Θ ′], γ 1 = {γ a, 1 , γ b, 1 , γ a, 2 , γ b, 2 ,. .., γ a, N , γ b, N } update. M-step: Update of model parameter Θ = {a, b, u, β} from equations (36), (37), and (38). Convergence determination: If the value of the auxiliary function of Expression (34) has not converged, return to E-step as Θ ′ = Θ.
次に、手法2のM−step更新式について説明する。Ψ=a0U0+a1U1+a2U2なので、式(27)から関連する項を取り出すと、最大化する目的関数は、
一方、f2(a0,a1,a2,u,β)をu、βそれぞれに関して微分して0とおくと、
以上の手法2に関する、EM法に基づくパラメータ学習アルゴリズムをまとめると、以下のようになる。初期化:パラメータΘ={a0,a1,a2,u,β}に初期値を与える。E−step:E[x|o;Θ´]、E[xxT|o;Θ´]の更新。
M−step:式(40)、(41)、(42)、(43)より、モデルパラメータΘ={a0,a1,a2,u,β}の更新。収束判定:式(39)の目的関数の値が収束していなければ、Θ´=ΘとしてE−stepに戻る。
The parameter learning algorithm based on the EM method related to the
M-step: Update of the model parameter Θ = {a 0 , a 1 , a 2 , u, β} from the equations (40), (41), (42), (43). Convergence determination: If the value of the objective function in Expression (39) has not converged, return to E-step as Θ ′ = Θ.
次に、手法3のM−step更新式について説明する。Ψ=w1Υ(1)+w2Υ(2)+・・・+wIΥ(I)なので、式(27)から関連する項を取り出すと、最大化する目的関数は、
ここで、補助変数γ3={γ1,1,・・・,γI,N}を定義し、補助関数を
式(46)をwi´に関して微分して0とおくと,
以上の手法3に関する、EM法に基づくパラメータ学習アルゴリズムをまとめると、以下のようになる。
初期化:パラメータΘ={w,u,β}に初期値を与える。E−step:E[x|o;Θ´]、E[xxT|o;Θ´]、γ3の更新。M−step:式(49)、(50)より、モデルパラメータΘ={w,u,β}の更新。収束判定:式(46)の補助関数の値が収束していなければ、Θ´=ΘとしてE−stepに戻る。
The parameter learning algorithm based on the EM method related to the
Initialization: An initial value is given to the parameter Θ = {w, u, β}. E-step: Update of E [x | o; Θ ′], E [xx T | o; Θ ′], γ 3 . M-step: Update of model parameter Θ = {w, u, β} from equations (49) and (50). Convergence determination: If the value of the auxiliary function in the equation (46) has not converged, return to E-step as Θ ′ = Θ.
次に、手法4のM−step更新式について説明する。Ψ=w1Υ(1)+w2Υ(2)+・・・+wIΥ(I)なので、式(27)から関連する項を取り出すと、最大化する目的関数は、
ここで、補助変数 ̄w:={ ̄w1, ̄w2,・・・, ̄wI}、γ4={γ1,1,・・・,γI,N}を定義し、補助関数を
式(54)をwi´に関して微分して0とおくと、
Differentiating equation (54) with respect to w i ′ and setting it to 0,
一方、f4 +(w,u,β,γ4)をu、βそれぞれに関して微分して0とおくと、
以上の手法4に関する、EM法に基づくパラメータ学習アルゴリズムをまとめると、以下のようになる。
初期化:パラメータΘ={w,u,β}に初期値を与える。E−step:E[x|o;Θ´]、E[xxT|o;Θ´]、 ̄w、γ4の更新。M−step:式(57)、(58)から、モデルパラメータΘ={w,u,β}の更新。収束判定:式(54)の補助関数の値が収束していなければ、Θ´=ΘとしてE−stepに戻る。
The parameter learning algorithm based on the EM method related to the
Initialization: An initial value is given to the parameter Θ = {w, u, β}. E-step: E [x | o; Θ'], E [xx T | o; Θ'], ¯w, γ 4 of the update. M-step: Update of the model parameter Θ = {w, u, β} from the equations (57) and (58). Convergence determination: If the value of the auxiliary function of Expression (54) has not converged, return to E-step as Θ ′ = Θ.
<第1の実施形態>
次に、図3を参照して、本発明の第1の実施形態による信号解析装置の構成を説明する。図3は同実施形態の構成を示すブロック図である。図3に示すように、信号解析装置は、コンピュータ装置によって構成し、基本周波数抽出部1、セグメント分割部2、パラメータ初期値生成部3、信号分離部4、フィルタ特性パラメータ更新部5、入力信号パラメータ更新部6、残差信号パラメータ更新部7、パラメータ収束判定部8およびパラメータ出力部9を備える。フィルタ特性パラメータ更新部5と、入力信号パラメータ更新部6と、残差信号パラメータ更新部7は、モデルパラメータ更新部10を構成する。第1の実施形態は、前述した手法1を用いて信号解析を行う構成である。
<First Embodiment>
Next, the configuration of the signal analyzing apparatus according to the first embodiment of the present invention will be described with reference to FIG. FIG. 3 is a block diagram showing the configuration of the embodiment. As shown in FIG. 3, the signal analysis device is configured by a computer device, and includes a fundamental
基本周波数抽出部1は、入力される歌声音響信号から観測基本周波数時系列を抽出する。この処理は、周知技術により実現でき、例えば、文献:A de Cheveign´e and H. Kawahara, “YIN, a fundamental frequency estimator for speech and music," Journal of the Acoustical Society of America, vol.111, no.4, pp. 1917-1930, 2002で提案される基本周波数推定法YIN を利用して、歌声音響信号から5msごとに基本周波数を推定する。
The fundamental
セグメント分割部2は、推定された基本周波数系列をいくつかのセグメントに分割する。図4に示すように、各セグメントは、ある音高から別の音高へ立ち上がる瞬間を始点および終点とする。セグメントへの分割方法は手作業、もしくk−mean法、またはビタビアルゴリズムなどを利用する。分割されたセグメントo=[o1,o2,・・・,oN]T(Nはセグメントにおける基本周波数系列の長さを表し、セグメントごとに変化する)
ごとにモデルパラメータを推定する。前処理として、セグメントの先頭の基本周波数値o1を、セグメントのすべての基本周波数値から減算し正規化を行う。
The
Model parameters are estimated every time. As preprocessing, normalization is performed by subtracting the fundamental frequency value o 1 at the beginning of the segment from all the fundamental frequency values of the segment.
パラメータ初期値生成部3は、モデルパラメータΘ1={a,b,u,β}の初期値を決定する。a,bは、ζ=1.0,Ω=0.1のときに、式(5)より計算される、a=100,b=20を初期値とする。uは、観測信号oの要素の中央値を初期値とする。βは、β=100を初期値とする。これらはすべて実験的に決定する。また、αは、α=2に固定する。
The parameter initial
信号分離部4では、ガウス過程の定義およびEMアルゴリズムに基づいて導出される出力信号と残差信号の期待値を信号分離基準として、観測信号を出力信号と残差信号に分離する。ここでは、現在のモデルパラメータΘ1´={a,b,u,β}を利用して、式(28)、(29)を計算し、式(30)に基づいて、E[x|o;Θ1´]とE[xxT|o;Θ1´]を ̄xy, ̄xε,Ry,Rεに分割する。また、式(33)に基づいて、補助変数γ1も計算する。
The
フィルタ特性パラメータ更新部5は、フィルタ特性パラメータであるa、bの値を更新する。式(5)から分かるように、aとbは共に正の値となる制約の下で、Coordinate descent法を適用して、式(36)と式(37)からなる連立方程式を解き、aとbを求める。まず、初期値としてa=0、b=0と設定する。そして、式(36)をaに関する方程式と見なして、
次に、式(37)をbに関する方程式と見なして、
入力信号パラメータ更新部6は、フィルタ特性パラメータ更新部5で更新されたa、bを利用して、式(16)のΨを計算し、式(38)に基づいて、入力信号パラメータuの値を更新する。
The input signal
残差信号パラメータ更新部7は、式(38)に基づいて、残差信号パラメータβの値を更新する。
The residual signal
パラメータ収束判定部8は、信号分離部4で計算された ̄xy,Ry,Rεおよび、モデルパラメータ更新部10によってそれぞれ更新されたモデルパラメータΘ1={a,b,u,β}を利用して、式(31)の目的関数の値を計算する。更新前のモデルパラメータを用いて計算した式(31)の目的関数の値と更新後のモデルパラメータを用いて計算した式(31)の目的関数の値との誤差が、所定の閾値以下であれば、収束したと判定する。収束していればパラメータ出力部9は、モデルパラメータΘ1={a,b,u,β}を出力した後に、次のセグメントにおけるモデルパラメータ推定に移行するため、セグメント分割部2の処理へ移行する。一方、収束しない場合は、Θ1´=Θ1として信号分離部4の処理に戻る。
The parameter
なお、収束したか否かを判定する方法としては、目的関数を用いる方法以外に、モデルパラメータ各々の値を更新前と更新後とで比較しても良いし、予め定めた繰り返し回数に到達したか否かで判定を行っても良い。 In addition to the method using the objective function, as a method for determining whether or not the convergence has occurred, the values of the model parameters may be compared before and after the update, or a predetermined number of iterations has been reached. The determination may be made based on whether or not.
<第2の実施形態>
次に、本発明の第2の実施形態による信号解析装置の構成を説明する。第2の実施形態は、前述した手法2を用いて信号解析を行う構成である。第2の実施形態における信号解析装置の構成は、図3に示す構成と同様であり、基本周波数抽出部1及びセグメント分割部2の処理動作は、第1の実施形態と同じである。第2の実施形態は、その他の構成の処理動作が異なる。
<Second Embodiment>
Next, the configuration of the signal analyzing apparatus according to the second embodiment of the present invention will be described. The second embodiment is configured to perform signal analysis using the
パラメータ初期値生成部3は、モデルパラメータΘ2={a0,a1,a2,u,β}の初期値を決定する。a0,a1,a2は、ζ=1.0,Ω=0.1のときに、式(9)より計算される、a0=121,a1=−220,a2=100を初期値とする。uは、観測信号oの要素の中央値を初期値とする。βは、β=100を初期値とする。これらはすべて実験的に決定する。また、αは、α=2に固定する。
The parameter initial
信号分離部4は、ガウス過程の定義およびEMアルゴリズムに基づいて導出される出力信号と残差信号の期待値を信号分離基準として、観測信号を出力信号と残差信号に分離する。現在のモデルパラメータΘ2´={a0,a1,a2,u,β}を利用して、式(28)、(29)を計算し、式(30)に基づいて、E[x|o;Θ2´]とE[xxT|o;Θ2´]を ̄xy, ̄xε,Ry,Rεに分割する。
The
フィルタ特性パラメータ更新部5は、フィルタ特性パラメータであるa0,a1,a2の値を更新する。式(9)から分かるように、a0とa2は正の値、a1は負の値となる制約の下で、Coordinate descent法を適用して、式(40)、(41)、(42)からなる連立方程式を解き、a0,a1,a2を求める。まず、初期値としてa0=0,a1=0,a2=0と設定する。そして、式(40)をa0に関する方程式と見なして、
次に、式(41)をa1に関する方程式と見なして、
次に、式(42)をa2に関する方程式と見なして、
入力信号パラメータ更新部6は、フィルタ特性パラメータ更新部5で更新されたa0,a1,a2を利用して、式(16)のΨを計算し、式(43)に基づいて、入力信号パラメータuの値を更新する。
The input signal
残差信号パラメータ更新部7は、式(43)に基づいて、残差信号パラメータβの値を更新する。
The residual signal
パラメータ収束判定部8は、信号分離部4で計算された ̄xy,Ry,Rεおよび、モデルパラメータ更新部10によって更新されたモデルパラメータΘ2={a0,a1,a2,u,β}を利用して、式(39)の目的関数の値を計算する。その値が収束していれば、パラメータ出力部9は、モデルパラメータΘ2={a0,a1,a2,u,β}を出力し、次のセグメントにおけるモデルパラメータ推定に移行するため、セグメント分割部2の処理動作へ移行する。一方、収束しない場合は、Θ2´=Θ2として信号分離部4の処理動作に移行する。
The parameter
<第3の実施形態>
次に、本発明の第3の実施形態による信号解析装置の構成を説明する。第3の実施形態は、前述した手法3を用いて信号解析を行う構成である。第3の実施形態における信号解析装置の構成は、図3に示す構成と同様であり、基本周波数抽出部1及びセグメント分割部2の処理動作は、第1の実施形態と同じである。第3の実施形態は、その他の構成の処理動作が異なる。
<Third Embodiment>
Next, the configuration of the signal analyzing apparatus according to the third embodiment of the present invention will be described. The third embodiment is configured to perform signal analysis using the
パラメータ初期値生成部3は、モデルパラメータΘ3={w,u,β}の初期値を決定する。まず、{Υ(1),Υ(2),・・・,Υ(I)}を作成するために、ζは0から2までの間を0.02刻みで、Ωは0.05から0.3までの間を0.005刻みで変化させる。その結果、I=3100となる。w={w1,w2,・・・wI}の初期値はすべて1/Iに設定する。uは、観測信号oの要素の中央値を初期値とする。βは、β=100を初期値とする。これらはすべて実験的に決定する。また、αは、α=2に固定する。
The parameter initial
信号分離部4は、ガウス過程の定義およびEMアルゴリズムに基づいて導出される出力信号と残差信号の期待値を信号分離基準として、観測信号を出力信号と残差信号に分離する。現在のモデルパラメータΘ3´={w,u,β}を利用して、式(28)、(29)を計算し、式(30)に基づいて、E[x|o;Θ3´]とE[xxT|o;Θ3´]を ̄xy, ̄xε,Ry,Rεに分割する。また、式(48)に基づいて、補助変数γ3も計算する。
The
フィルタ特性パラメータ更新部5は、フィルタ特性パラメータであるwの値を更新する。Coordinate descent法を利用して、式(49)のi´=1,2,・・・,Iに関する非線形連立方程式を解くと、wを求めることができる。まず、初期値として{w1,w2,・・・wI}をすべて0に設定する。そして、式(49)をw1´に関する方程式と見なして、
入力信号パラメータ更新部6は、フィルタ特性パラメータ更新部5で更新されたwを利用して、式(16)のΨを計算し、式(50)に基づいて、入力信号パラメータuの値を更新する。
The input signal
残差信号パラメータ更新部7は、式(50)に基づいて、残差信号パラメータβの値を更新する。
The residual signal
パラメータ収束判定部8は、信号分離部4で計算された ̄xy,Ry,Rεおよび、モデルパラメータ更新部10によって更新されたモデルパラメータΘ3={w,u,β}を利用して、式(44)の目的関数の値を計算する。その値が収束していれば、パラメータ出力部9は、モデルパラメータΘ3={w,u,β}を出力し、次のセグメントにおけるモデルパラメータ推定に移行するため、セグメント分割部2の処理動作へ移行する。一方、収束しない場合は、Θ3´=Θ3として信号分離部4の処理動作に移行する。
The parameter
<第4の実施形態>
次に、本発明の第4の実施形態による信号解析装置の構成を説明する。第4の実施形態は、前述した手法4を用いて信号解析を行う構成である。第4の実施形態における信号解析装置の構成は、図3に示す構成と同様であり、基本周波数抽出部1及びセグメント分割部2の処理動作は、第1の実施形態と同じである。第4の実施形態は、その他の構成の処理動作が異なる。
<Fourth Embodiment>
Next, the configuration of the signal analyzing apparatus according to the fourth embodiment of the present invention will be described. The fourth embodiment is configured to perform signal analysis using the
パラメータ初期値生成部3は、モデルパラメータをΘ4={w,u,β}とする以外は第3の実施形態と同じである。
The parameter initial
信号分離部4は、ガウス過程の定義およびEMアルゴリズムに基づいて導出される出力信号と残差信号の期待値を信号分離基準として、観測信号を出力信号と残差信号に分離する。現在のモデルパラメータΘ4´={w,u,β}を利用して、式(28)、(29)を計算し、式(30)に基づいて、E[x|o;Θ4´]とE[xxT|o;Θ4´]を ̄xy, ̄xε,Ry,Rεに分割する。また、式(56)に基づいて、補助変数γ4も計算する。
The
フィルタ特性パラメータ更新部5は、フィルタ特性パラメータであるwの値を更新する。Coordinate descent法を利用して、式(57)のi´=1,2,・・・,Iに関する非線形連立方程式を解くと、wを求めることができる。まず、初期値として{w1,w2,・・・wI}をすべて0に設定する。そして、式(57)をw1´に関する方程式と見なして、
入力信号パラメータ更新部6は、フィルタ特性パラメータ更新部5で更新されたwを利用して、式(16)のΨを計算し、式(58)に基づいて、入力信号パラメータuの値を更新する。
The input signal
残差信号パラメータ更新部7は、式(58)に基づいて、残差信号パラメータβの値を更新する。
The residual signal
パラメータ収束判定部8は、前記信号分離部で計算され ̄xy,Ry,Rεおよび、モデルパラメータ更新部10によって更新されたモデルパラメータΘ4={w,u,β}を利用して、式(51)の目的関数の値を計算する。その値が収束していれば、パラメータ出力部9は、モデルパラメータΘ4={w,u,β}を出力し、次のセグメントにおけるモデルパラメータ推定に移行するため、セグメント分割部2の処理動作へ移行する。一方、収束しない場合は、Θ4´=Θ4として信号分離部4の処理動作に移行する。
The parameter
<第5の実施形態>
次に、図5を参照して、本発明の第5の実施形態による信号解析装置の構成を説明する。第4の実施形態は、前述した手法1〜4を使用して、通常の音声信号(話声、歌声を含む)の信号解析を行う構成である。第5の実施形態における信号解析装置の構成は、図3に示す基本周波数抽出部1に代えてメルケプストラム係数抽出部11を備えた点が、第1〜4の実施形態と異なる。第5の実施形態における信号解析装置は、音声信号から抽出されるメル周波数ケプストラム係数(MFCC)の時系列を、歌声の基本周波数系列と同様に、階段状の入力信号にフィルタが畳み込まれたものと見なし、観測MFCC信号から、音素列を表す入力信号とフィルタ特性の分離特徴抽出を行う。
<Fifth Embodiment>
Next, the configuration of a signal analyzing apparatus according to the fifth embodiment of the present invention will be described with reference to FIG. The fourth embodiment is configured to perform signal analysis of normal voice signals (including speech and singing voices) using the
メルケプストラム係数抽出部11は、音声信号を周波数分析し、メルケプストラム係数(通常は12次元程度のベクトル)の時系列を抽出する。第5の実施形態における信号解析装置は、MFCCベクトルの各要素の時系列信号ごとに解析処理を行うものである。 The mel cepstrum coefficient extraction unit 11 performs frequency analysis on the audio signal and extracts a time series of mel cepstrum coefficients (usually a vector of about 12 dimensions). The signal analysis apparatus according to the fifth embodiment performs an analysis process for each time-series signal of each element of the MFCC vector.
セグメント分割部2、パラメータ初期値生成部3、信号分離部4、フィルタ特性パラメータ更新部5、入力信号パラメータ更新部6、残差信号パラメータ更新部7、パラメータ収束判定部8およびパラメータ出力部9の処理動作は、前述した第1〜第4の実施形態のいずれかに基づくものとする。
<実験結果>
次に、本発明の効果および作用を示すため、本発明の実施形態による信号解析装置を用いた実験結果を以下に説明する。ここでは、上記第1の実施形態、第2の実施形態、第4の実施形態および非特許文献4の従来法を実装して、基本周波数系列の入力ステップ信号(音高目標値系列)とフィルタ特性を表すインパルス応答信号(歌唱動的変動成分)への分解性能を評価する。
<Experimental result>
Next, in order to show the effects and operations of the present invention, the results of experiments using the signal analysis apparatus according to the embodiment of the present invention will be described below. Here, the conventional method of the first embodiment, the second embodiment, the fourth embodiment and the
1つ目の評価実験では、本発明が局所最小化問題を解決できているかを確認する。まず、パラメータuをランダムに100個決定し、式(18)に基づいて、100個の入力ステップ信号を人工的に作成する。ここでは、N=300、α=2とした。同様に、ζとΩをそれぞれ100個ランダムに決定し、式(12)に基づいて、100個のインパルス応答信号を人工的に作成する。これらの人工的な信号と式(22)に基づいて、100個の観測信号を人工的に作成する。ここでは、β=100とした。本実験では、これらの観測信号ごとにモデルパラメータを推定する。 In the first evaluation experiment, it is confirmed whether the present invention can solve the local minimization problem. First, 100 parameters u are randomly determined, and 100 input step signals are artificially created based on Expression (18). Here, N = 300 and α = 2. Similarly, 100 ζ and Ω are respectively determined at random, and 100 impulse response signals are artificially created based on Expression (12). Based on these artificial signals and equation (22), 100 observation signals are artificially created. Here, β = 100. In this experiment, model parameters are estimated for each of these observation signals.
評価尺度として、観測信号ごとに、
(1)推定されたモデルパラメータuと、観測信号の作成のためにランダムに決定されたuとの二乗誤差
(2)推定されたモデルパラメータによって構成される系のインパルス応答信号と、観測信号の作成のためにランダムに決定されたζとΩに基づくインパルス応答信号の二乗平均平方根誤差(RootMean Square Error,RMSE)
を計算する。どちらも誤差が小さくなれば、観測信号の入力ステップ信号とインパルス応答信号への分解性能が高い(局所最小化問題を回避できている)と言える。表1はそれぞれの誤差の平均値を示し、最も誤差が小さくなったのは、第4の実施形態よる信号解析装置であった。
As an evaluation scale, for each observed signal,
(1) A square error between the estimated model parameter u and u determined at random for creating the observation signal. (2) An impulse response signal of the system constituted by the estimated model parameter, Root Mean Square Error (RMSE) of impulse response signal based on ζ and Ω determined randomly for creation
Calculate In both cases, if the error is small, it can be said that the resolution performance of the observation signal into the input step signal and the impulse response signal is high (a local minimization problem can be avoided). Table 1 shows the average values of the respective errors, and the signal analysis apparatus according to the fourth embodiment has the smallest error.
2つ目の評価実験では、歌声音響信号から抽出される実際の基本周波数系列を利用してパラメータ学習アルゴリズムの収束性能を評価する。歌声データベースとして、クラシックの声楽家、ポップス歌手、音楽的な訓練を受けていない素人(それぞれ男女1名ずつの計6名)の歌声からなるデータベースを利用した。歌唱者は、伴奏なしで歌唱曲を歌唱した。歌唱曲は、「きらきら星」、「喜びの歌(Beethovenの交響曲第9番第4楽章の歌の部分を岩佐東一郎氏によって作詞されたもの)」である。日本語歌詞による歌唱(2パターンの歌詞)、ハミングによる歌唱を収録した。基本周波数は、前述したYINを利用して、5msごとに推定される。なお、Hzで表される周波数oHzを、次のようにcentで表される対数スケールの周波数ocentに変換する。
この変換により、半音は100centに相当する。次に、図4に示すように、推定された基本周波数系列を手動でセグメントに分割する。その結果、セグメントの総数は1323となった。セグメントごとにモデルパラメータを推定する。評価尺度として、セグメントごとに、観測信号oと、推定されたモデルパラメータによって再合成される信号μ(式(23)を参照)との二乗平均平方根誤差(RMSE)を計算した。そのRMSEの平均値を表1の右部分に示す。この評価実験においても第4の実施形態よる信号解析装置が最も小さい誤差となった。 By this conversion, a semitone corresponds to 100 cent. Next, as shown in FIG. 4, the estimated fundamental frequency sequence is manually divided into segments. As a result, the total number of segments was 1323. Estimate model parameters for each segment. As an evaluation measure, for each segment, the root mean square error (RMSE) between the observed signal o and the signal μ (see equation (23)) recombined with the estimated model parameters was calculated. The average value of the RMSE is shown in the right part of Table 1. Also in this evaluation experiment, the signal analysis apparatus according to the fourth embodiment has the smallest error.
図6は、観測信号と、第4の実施形態のモデルパラメータによって再合成される信号μを示す。観測信号を見ると、各セグメントには、音高の立ち上がりに関する動特性、音高が安定するときに振動するビブラートのような動特性が複雑に重ね合わさっていることがわかる。本発明は、EM法を利用して、それぞれを分離する手段を持つため、従来法に比べてパラメータの推定性能が向上した。特に、第4の実施形態の信号解析装置は、様々な振動基底の線形和で2次系のフィルタ特性を表現し、さらにその重みパラメータにスパースな制約を持たせているため、他の実施形態に比べて、観測信号へのオーバーフィッティングの問題を解消し、誤差が最も小さくなっている。 FIG. 6 shows the observed signal and the signal μ recombined with the model parameters of the fourth embodiment. Looking at the observed signal, it can be seen that each segment has a complex overlap of dynamic characteristics related to the rise of the pitch and dynamic characteristics such as vibrato that vibrate when the pitch stabilizes. Since the present invention has means for separating each using the EM method, the parameter estimation performance is improved as compared with the conventional method. In particular, the signal analysis apparatus according to the fourth embodiment expresses the filter characteristics of the second-order system with linear sums of various vibration bases, and further has sparse restrictions on the weight parameters. Compared with, the problem of overfitting to the observed signal is solved and the error is minimized.
図7は、第4の実施形態よる信号解析装置によって推定されたζとΩの歌唱者ごとの平均値を示したものである。各セグメントで推定されるwの要素の最も大きい値wiに着目し、それに対応するζとΩのすべてのセグメントにわたる平均値を歌唱者ごとに計算した。ζが小さな値であることは、その振動現象がオーバーシュートのような減衰振動であることを意味する。一方で、Ωが小さな値であることは、音高の立ち上がり時間が長いことを意味する。したがって、素人歌唱者は歌唱技術が乏しいため、ζとΩの値が他の歌唱者に比べて、ともに小さい値になった。図8は、第4の実施形態よる信号解析装置によって推定されたuの歌唱者ごとの頻度分布を示す。声楽家やポップス歌手に関しては、半音(100cent)の整数倍の位置に分布のピークが観測される。一方で、素人歌唱者に関しては、そのピークが不鮮明となっている。これも素人歌唱者は歌唱技術が乏しいため、正しい音階(正確な半音単位)で歌唱することが難しいことを意味する。 FIG. 7 shows the average values for each singer of ζ and Ω estimated by the signal analyzing apparatus according to the fourth embodiment. Paying attention to the largest value w i of the element of w estimated in each segment, the average value over all segments of ζ and Ω corresponding thereto was calculated for each singer. A small value of ζ means that the vibration phenomenon is a damped vibration such as an overshoot. On the other hand, a small value of Ω means that the pitch rise time is long. Therefore, since amateur singers have poor singing skills, the values of ζ and Ω are both smaller than those of other singers. FIG. 8 shows the frequency distribution of each u singer estimated by the signal analyzing apparatus according to the fourth embodiment. For vocalists and pop singers, a distribution peak is observed at a position that is an integral multiple of a semitone (100 cent). On the other hand, for amateur singers, the peak is unclear. This also means that it is difficult for amateur singers to sing with the correct scale (accurate semitones) because of their poor singing skills.
このように、観測信号は、入力ステップ信号とフィルタ特性を表すインパルス応答信号との畳みこみによって得られる系の出力信号と、残差信号との和で構成されるものとし、基本周波数系列の場合は、音が立ち上がる(音高が変化する)時点を始点終点として、それによって分割されるセグメントごとに信号の生成過程とする。また、観測信号には、様々な動特性が混在するため、ガウス過程(ベイジアンアプローチ)の観点から信号の生成過程をモデル化し、観測信号の、出力信号と残差信号への分離過程を適用する。そして、分離された出力信号に基づいて、入力信号パラメータやフィルタ特性パラメータを推定する。一方で、分離された残差信号に基づいて、残差信号パラメータを推定する。この推定の流れを何度も繰り返すことにより、最終的にモデルパラメータを精度よく推定することができる。 Thus, the observed signal is composed of the sum of the output signal of the system obtained by convolution of the input step signal and the impulse response signal representing the filter characteristics, and the residual signal. Is a process of generating a signal for each segment divided by the time when the sound rises (the pitch changes) as the start point and the end point. In addition, since various dynamic characteristics exist in the observed signal, the signal generation process is modeled from the viewpoint of a Gaussian process (Bayesian approach), and the process of separating the observed signal into an output signal and a residual signal is applied. . Then, the input signal parameter and the filter characteristic parameter are estimated based on the separated output signal. On the other hand, a residual signal parameter is estimated based on the separated residual signal. By repeating this estimation flow many times, the model parameter can be estimated with accuracy.
以上説明したように、入力信号をステップ信号と仮定し、また、系のフィルタ特性が線形2次系に従うことを仮定して、観測される時系列信号から、信号生成系の入力信号およびフィルタ特性(インパルス応答信号)、残差信号を推定するようにしたため、歌声の基本周波数(F0)系列から、歌唱者が歌おうとする音高目標値系列とビブラートやオーバーシュートのような歌唱動的変動成分の特徴抽出を行うことができる。 As described above, assuming that the input signal is a step signal and assuming that the filter characteristic of the system follows a linear quadratic system, the input signal and filter characteristic of the signal generation system can be obtained from the observed time series signal. (Impulse response signal), because the residual signal is estimated, from the fundamental frequency (F0) sequence of the singing voice, the pitch target value sequence that the singer wants to sing, and singing dynamic fluctuation components such as vibrato and overshoot Feature extraction can be performed.
なお、図3、図5における各処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより信号解析処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。 3 and 5 are recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed. Signal analysis processing may be performed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer system” includes a WWW system having a homepage providing environment (or display environment). The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。 The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, what is called a difference file (difference program) may be sufficient.
時系列信号の動特性特徴を抽出することによって、信号解析を行うことが不可欠な用途に適用できる。 By extracting the dynamic characteristic features of time series signals, it can be applied to applications where signal analysis is indispensable.
1・・・基本周波数抽出部、2・・・セグメント分割部、3・・・パラメータ初期値生成部、4・・・信号分離部、5・・・フィルタ特性パラメータ更新部、6・・・入力信号パラメータ更新部、7・・・残差信号パラメータ更新部、8・・・パラメータ収束判定部、9・・・パラメータ出力部、10・・・モデルパラメータ更新部、11・・・メルケプストラム係数抽出部
DESCRIPTION OF
Claims (11)
前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成部と、
前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離部と、
前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新部と、
前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離部と前記モデルパラメータ更新部による処理を再度行わせるパラメータ収束判定部と、
前記パラメータ収束判定部により前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力部と、
を備えることを特徴とする信号解析装置。 The observed signal is represented by the sum of the output signal and residual signal of the signal generation system obtained by convolution of the input signal and the impulse response signal representing the filter characteristics, and a model representing the input signal is constructed from the observed signal A dynamic characteristic feature of a time-series signal is extracted by estimating an input signal parameter to be processed, a filter characteristic parameter constituting a model representing the filter characteristic, and a residual signal parameter constituting a model representing the residual signal A signal analyzer,
A parameter initial value generating unit that generates initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal;
A set of the filter characteristic parameter, the input signal parameter, and the residual signal parameter is used as a model parameter, and the observation signal is defined by the input signal parameter and the filter characteristic parameter using the model parameter. A signal separation unit for separating the output signal of the generation system and the residual signal configured by the residual signal parameters;
A function obtained by adding the prior probability of the model parameter to the conditional expected value of the log likelihood function when the observed signal, the model parameter, and the set of the output signal and the residual signal are given A model parameter updating unit that updates the model parameter so as to maximize the objective function with respect to the model parameter,
It is determined whether or not the model parameter satisfies a predetermined criterion, and when it is determined that the predetermined parameter is not satisfied, processing by the signal separation unit and the model parameter update unit is performed until the predetermined criterion is satisfied. A parameter convergence determination unit to be performed again;
A parameter output unit that outputs the model parameter when the parameter convergence determination unit determines that the model parameter satisfies a predetermined criterion;
A signal analyzing apparatus comprising:
前記出力信号は多次元ガウス分布に従うものとして確率的にモデル化され、
前記残差信号は、ガウス性白色雑音として確率的にモデル化される
ことを特徴とする請求項1記載の信号解析装置。 The input signal is a step signal;
The output signal is stochastically modeled as following a multidimensional Gaussian distribution;
The signal analysis apparatus according to claim 1, wherein the residual signal is probabilistically modeled as Gaussian white noise.
前記フィルタ特性パラメータは、前記固有周波数の二乗に反比例するパラメータと、前記減衰率に比例し前記固有周波数に反比例するパラメータとである
ことを特徴とする請求項2記載の信号解析装置。 The filter characteristic of the signal generation system is represented by a filter derived by a difference method,
The signal analysis apparatus according to claim 2, wherein the filter characteristic parameters are a parameter that is inversely proportional to the square of the natural frequency and a parameter that is proportional to the attenuation factor and inversely proportional to the natural frequency.
補助変数から構成される前記目的関数の補助関数を、前記固有周波数の二乗に反比例するパラメータと前記補助関数を前記減衰率に比例し前記固有周波数に反比例するパラメータとでそれぞれ微分して得られる方程式からなる連立方程式をフィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、
前記補助関数を、前記入力信号パラメータで微分して得られる方程式を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、
前記補助関数を、前記残差信号パラメータで微分して得られる方程式を解くことにより、残差信号パラメータを更新する残差信号パラメータとから構成されることを特徴とする請求項3記載の信号解析装置。 The model parameter update unit
Equations obtained by differentiating the auxiliary function of the objective function composed of auxiliary variables with a parameter inversely proportional to the square of the natural frequency and a parameter proportional to the attenuation rate and inversely proportional to the natural frequency. A filter characteristic parameter updating unit that updates the value of the filter characteristic parameter by solving the simultaneous equation consisting of
An input signal parameter updating unit for updating the input signal parameter by solving an equation obtained by differentiating the auxiliary function with the input signal parameter;
4. The signal analysis according to claim 3, further comprising a residual signal parameter for updating the residual signal parameter by solving an equation obtained by differentiating the auxiliary function with the residual signal parameter. apparatus.
前記目的関数を、前記フィルタ特性パラメータに含まれる各自己回帰パラメータでそれぞれ微分して得られる方程式からなる連立方程式をフィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、
前記目的関数を、前記入力信号パラメータで微分して得られる方程式を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、
前記目的関数を、前記残差信号パラメータで微分して得られる方程式を解くことにより、残差信号パラメータを更新する残差信号パラメータとから構成されることを特徴とする請求項4記載の信号解析装置。 The model parameter update unit
A filter characteristic parameter updating unit that updates the value of the filter characteristic parameter by solving for the filter characteristic parameter a simultaneous equation consisting of equations obtained by differentiating the objective function with each autoregressive parameter included in the filter characteristic parameter. When,
An input signal parameter update unit for updating the input signal parameter by solving an equation obtained by differentiating the objective function with the input signal parameter;
5. The signal analysis according to claim 4, further comprising a residual signal parameter for updating the residual signal parameter by solving an equation obtained by differentiating the objective function with the residual signal parameter. apparatus.
補助変数から構成される前記目的関数の補助関数を、前記フィルタ特性パラメータである各2次系フィルタの重みでそれぞれ微分して得られる方程式からなる非線形連立方程式を、フィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、
前記補助関数を、前記入力信号パラメータで微分して得られる方程式を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、
前記補助関数を、前記残差信号パラメータで微分して得られる方程式を解くことにより、残差信号パラメータを更新する残差信号パラメータとから構成されることを特徴とする請求項5記載の信号解析装置。 The model parameter update unit
By solving a nonlinear simultaneous equation consisting of equations obtained by differentiating the auxiliary function of the objective function composed of auxiliary variables by the weights of the respective second-order filters, which are the filter characteristic parameters, with respect to the filter characteristic parameters, A filter characteristic parameter update unit for updating the value of the filter characteristic parameter;
An input signal parameter updating unit for updating the input signal parameter by solving an equation obtained by differentiating the auxiliary function with the input signal parameter;
6. The signal analysis according to claim 5, further comprising: a residual signal parameter for updating the residual signal parameter by solving an equation obtained by differentiating the auxiliary function with the residual signal parameter. apparatus.
前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成ステップと、
前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離ステップと、
前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新ステップと、
前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離ステップと前記モデルパラメータ更新ステップによる処理を再度行わせるパラメータ収束判定ステップと、
前記パラメータ収束判定ステップにより前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力ステップと、
を有することを特徴とする信号解析方法。 The observed signal is represented by the sum of the output signal and residual signal of the signal generation system obtained by convolution of the input signal and the impulse response signal representing the filter characteristics, and a model representing the input signal is constructed from the observed signal A dynamic characteristic feature of a time-series signal is extracted by estimating an input signal parameter to be processed, a filter characteristic parameter constituting a model representing the filter characteristic, and a residual signal parameter constituting a model representing the residual signal A signal analysis method in a signal analyzer,
A parameter initial value generating step of generating initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal;
A set of the filter characteristic parameter, the input signal parameter, and the residual signal parameter is used as a model parameter, and the observation signal is defined by the input signal parameter and the filter characteristic parameter using the model parameter. A signal separation step of separating the output signal of the generation system and the residual signal constituted by the residual signal parameters;
A function obtained by adding the prior probability of the model parameter to the conditional expected value of the log likelihood function when the observed signal, the model parameter, and the set of the output signal and the residual signal are given A model parameter update step for updating the model parameter so as to maximize the objective function with respect to the model parameter,
It is determined whether or not the model parameter satisfies a predetermined criterion, and when it is determined that the model parameter does not satisfy the predetermined criterion, processing by the signal separation step and the model parameter update step is performed until the predetermined criterion is satisfied. A parameter convergence determination step to be performed again;
A parameter output step for outputting the model parameter when the model parameter is determined to satisfy a predetermined criterion by the parameter convergence determination step;
A signal analysis method characterized by comprising:
前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成ステップと、
前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離ステップと、
前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新ステップと、
前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離ステップと前記モデルパラメータ更新ステップによる処理を再度行わせるパラメータ収束判定ステップと、
前記パラメータ収束判定ステップにより前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力ステップと、
を前記コンピュータに行わせることを特徴とする信号解析プログラム。 The observed signal is represented by the sum of the output signal and residual signal of the signal generation system obtained by convolution of the input signal and the impulse response signal representing the filter characteristics, and a model representing the input signal is constructed from the observed signal A dynamic characteristic feature of a time-series signal is extracted by estimating an input signal parameter to be processed, a filter characteristic parameter constituting a model representing the filter characteristic, and a residual signal parameter constituting a model representing the residual signal A signal analysis program for causing a computer on a signal analyzer to perform signal analysis,
A parameter initial value generating step of generating initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal;
A set of the filter characteristic parameter, the input signal parameter, and the residual signal parameter is used as a model parameter, and the observation signal is defined by the input signal parameter and the filter characteristic parameter using the model parameter. A signal separation step of separating the output signal of the generation system and the residual signal constituted by the residual signal parameters;
A function obtained by adding the prior probability of the model parameter to the conditional expected value of the log likelihood function when the observed signal, the model parameter, and the set of the output signal and the residual signal are given A model parameter update step for updating the model parameter so as to maximize the objective function with respect to the model parameter,
It is determined whether or not the model parameter satisfies a predetermined criterion, and when it is determined that the model parameter does not satisfy the predetermined criterion, processing by the signal separation step and the model parameter update step is performed until the predetermined criterion is satisfied. A parameter convergence determination step to be performed again;
A parameter output step for outputting the model parameter when the model parameter is determined to satisfy a predetermined criterion by the parameter convergence determination step;
A signal analysis program for causing the computer to execute
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010159604A JP5318042B2 (en) | 2010-07-14 | 2010-07-14 | Signal analysis apparatus, signal analysis method, and signal analysis program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010159604A JP5318042B2 (en) | 2010-07-14 | 2010-07-14 | Signal analysis apparatus, signal analysis method, and signal analysis program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012022128A JP2012022128A (en) | 2012-02-02 |
JP5318042B2 true JP5318042B2 (en) | 2013-10-16 |
Family
ID=45776462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010159604A Active JP5318042B2 (en) | 2010-07-14 | 2010-07-14 | Signal analysis apparatus, signal analysis method, and signal analysis program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5318042B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012027196A (en) * | 2010-07-22 | 2012-02-09 | Nippon Telegr & Teleph Corp <Ntt> | Signal analyzing device, method, and program |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3511360B2 (en) * | 1998-03-09 | 2004-03-29 | 日本電信電話株式会社 | Music sound signal separation method, its apparatus and program recording medium |
JP5188300B2 (en) * | 2008-07-14 | 2013-04-24 | 日本電信電話株式会社 | Basic frequency trajectory model parameter extracting apparatus, basic frequency trajectory model parameter extracting method, program, and recording medium |
-
2010
- 2010-07-14 JP JP2010159604A patent/JP5318042B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012022128A (en) | 2012-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Joint optimization of masks and deep recurrent neural networks for monaural source separation | |
US8930183B2 (en) | Voice conversion method and system | |
US8380331B1 (en) | Method and apparatus for relative pitch tracking of multiple arbitrary sounds | |
Yoshii et al. | A nonparametric Bayesian multipitch analyzer based on infinite latent harmonic allocation | |
JP2016045221A (en) | Signal analysis device, method, and program | |
JP2009251029A (en) | Speech processing apparatus and method, and program | |
Shekofteh et al. | Autoregressive modeling of speech trajectory transformed to the reconstructed phase space for ASR purposes | |
JP5807921B2 (en) | Quantitative F0 pattern generation device and method, model learning device for F0 pattern generation, and computer program | |
JP5771575B2 (en) | Acoustic signal analysis method, apparatus, and program | |
JP5318042B2 (en) | Signal analysis apparatus, signal analysis method, and signal analysis program | |
JP2009204808A (en) | Sound characteristic extracting method, device and program thereof, and recording medium with the program stored | |
JP2012027196A (en) | Signal analyzing device, method, and program | |
Gabrielli et al. | A multi-stage algorithm for acoustic physical model parameters estimation | |
US10839823B2 (en) | Sound source separating device, sound source separating method, and program | |
JP6499095B2 (en) | Signal processing method, signal processing apparatus, and signal processing program | |
JP2013195575A (en) | Sound signal analysis device, method, and program | |
JP6564744B2 (en) | Signal analysis apparatus, method, and program | |
JP6498141B2 (en) | Acoustic signal analyzing apparatus, method, and program | |
JP6101599B2 (en) | Acoustic signal analysis apparatus, volume trajectory prediction apparatus, method, and program | |
JP6137708B2 (en) | Quantitative F0 pattern generation device, model learning device for F0 pattern generation, and computer program | |
JP2011053565A (en) | Signal analyzer, signal analytical method, program, and recording medium | |
WO2024038560A1 (en) | Learning device, estimating device, learning method, and program | |
JP5626793B2 (en) | Basic frequency model parameter estimation apparatus, method, and program | |
JP6553561B2 (en) | Signal analysis apparatus, method, and program | |
JP2010197596A (en) | Signal analysis device, signal analysis method, program, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121004 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20130605 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130709 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5318042 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |