JP5318042B2 - Signal analysis apparatus, signal analysis method, and signal analysis program - Google Patents

Signal analysis apparatus, signal analysis method, and signal analysis program Download PDF

Info

Publication number
JP5318042B2
JP5318042B2 JP2010159604A JP2010159604A JP5318042B2 JP 5318042 B2 JP5318042 B2 JP 5318042B2 JP 2010159604 A JP2010159604 A JP 2010159604A JP 2010159604 A JP2010159604 A JP 2010159604A JP 5318042 B2 JP5318042 B2 JP 5318042B2
Authority
JP
Japan
Prior art keywords
parameter
signal
model
filter characteristic
model parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010159604A
Other languages
Japanese (ja)
Other versions
JP2012022128A (en
Inventor
康智 大石
弘和 亀岡
大地 持橋
秀尚 永野
邦夫 柏野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010159604A priority Critical patent/JP5318042B2/en
Publication of JP2012022128A publication Critical patent/JP2012022128A/en
Application granted granted Critical
Publication of JP5318042B2 publication Critical patent/JP5318042B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a signal analysis apparatus for extracting dynamic characteristics of a time-series signal. <P>SOLUTION: When a signal analysis apparatus extracts dynamic characteristics of a time-series signal by estimating an input signal parameter, a filter property parameter, and a residual signal parameter from an observation signal while the observation signal is indicated by a sum of an output signal in a signal generation system and a residual signal obtained by convolution between an input signal and an impulse response signal indicating a filter property, the signal analysis apparatus comprises: a parameter initial value generation unit for generating initial values of the parameters; a signal separation unit for separating the observation signal; a model parameter updating unit for updating a model parameter to maximize a target function with regard to the model parameter; a parameter convergence determination unit for making the signal separation unit and the model parameter updating unit perform processes again until the model parameter satisfies a predetermined criterion; and a parameter output unit for outputting the model parameter if it is judged that the model parameter satisfies a predetermined criterion. <P>COPYRIGHT: (C)2012,JPO&amp;INPIT

Description

本発明は、時系列信号の動特性特徴を抽出する信号解析装置、信号解析方法及び信号解析プログラムに関する。   The present invention relates to a signal analysis apparatus, a signal analysis method, and a signal analysis program that extract dynamic characteristic features of time series signals.

歌声音響信号から抽出される基本周波数系列を例に挙げて、従来技術を説明する。この歌声の基本周波数系列には、歌唱者が歌おうとする音高目標値系列と歌唱力・歌唱スタイル・個人性・感情に基づく様々な動的変動成分(オーバーシュートやビブラートなど)が複雑に重ね合わされている。歌声は、多くのジャンルの音楽を特徴づける重要な要素の一つであり、この歌声の基本周波数系列に着目した様々な研究が現在盛んに行われている。   The prior art will be described using a basic frequency sequence extracted from a singing voice acoustic signal as an example. In the basic frequency series of this singing voice, the pitch target value series that the singer wants to sing and various dynamic fluctuation components (overshoot, vibrato, etc.) based on singing power, singing style, personality, and emotion are overlaid in a complex manner. Has been. Singing voice is one of the important elements that characterize many genres of music, and various studies focusing on the fundamental frequency series of singing voice are currently being actively conducted.

基本周波数系列に含まれる音高目標値系列を特徴抽出できれば、ハミング検索や自動採譜への応用が期待される。特に、歌声から楽曲を検索するハミング検索では、歌唱された歌声の基本周波数系列から、歌唱者の意図する音高目標値系列を正しく推定して、楽曲データベースの旋律と照合する必要がある。   If feature extraction of the pitch target value sequence included in the fundamental frequency sequence can be performed, application to hamming search and automatic music transcription is expected. In particular, in the Hamming search for searching for music from a singing voice, it is necessary to correctly estimate a pitch target value series intended by the singer from the basic frequency series of sung singing voices, and to collate with the melody of the music database.

一方で、オーバーシュートやビブラートのような基本周波数系列の動的変動成分は、歌声知覚、個人性知覚に影響を与える成分であることが知られている。したがって、歌唱スタイルの記述やそれを利用した類似歌声検索、歌唱力自動評価のための有用な尺度となりうる。また、より表情豊かかつ多様な歌声合成のためにも必要不可欠な成分である。そこで従来研究では、線形2次系を利用して歌声の基本周波数の動的変動成分を制御するモデルが提案されている(例えば、非特許文献1、2、3参照)。   On the other hand, it is known that dynamic fluctuation components of the fundamental frequency series such as overshoot and vibrato are components that affect singing voice perception and personality perception. Therefore, it can be a useful measure for description of singing style, similar singing voice search using the singing style, and automatic evaluation of singing ability. It is also an indispensable component for more expressive and diverse singing voice synthesis. Therefore, in the conventional research, a model for controlling a dynamic fluctuation component of the fundamental frequency of a singing voice using a linear quadratic system has been proposed (for example, see Non-Patent Documents 1, 2, and 3).

これらの研究では、日本語の話声の基本周波数パターンを表現する藤崎モデルが参考にされた。藤崎モデルは、臨界制動2次系のインパルス応答とステップ応答を利用して、日本語の句頭から句末に向けて緩やかに下降するフレーズ成分と、語句に対応して急激に上昇下降するアクセント成分を表現し、これらを重畳することで、基本周波数系列を記述する。ただし、歌声の旋律に伴った急激な基本周波数の上昇・下降の制御及び、ビブラートのような周期的な振動は、臨界制動系では表現できない。そのため、歌声の基本周波数制御モデルでは2次系の伝達関数

Figure 0005318042
における減衰率ζを調整することによって、指数減衰(ζ>1)、減衰振動(0<ζ<1、オーバーシュートに対応する)、臨界制動(ζ=1)、定常振動(ζ=0、ビブラートに対応する)からなる様々な振動現象を表現する。 In these studies, the Fujisaki model, which expresses the fundamental frequency pattern of Japanese speech, was referenced. The Fujisaki model uses the impulse response and step response of the critical braking secondary system, and the phrase component that slowly falls from the beginning of the Japanese phrase toward the end of the phrase, and the accent that rises and falls sharply corresponding to the phrase The fundamental frequency sequence is described by expressing the components and superimposing them. However, the control of the sudden rise and fall of the fundamental frequency accompanying the melody of the singing voice and the periodic vibration such as vibrato cannot be expressed by the critical braking system. Therefore, in the fundamental frequency control model of singing voice, the transfer function of the secondary system
Figure 0005318042
By adjusting the damping rate ζ at, exponential damping (ζ> 1), damping vibration (0 <ζ <1, corresponding to overshoot), critical braking (ζ = 1), steady vibration (ζ = 0, vibrato) To represent various vibration phenomena.

非特許文献3では、音階を表す階段状信号に式(1)のインパルス応答を畳み込んで得られる基本周波数系列を利用して、表情豊かな歌声合成音を実現した。しかしながら、これらの従来技術では、制御パラメータ(減衰率ζと固有周波数Ω)が手作業あるいは規則に基づいて決定されるものであった。これに対し、非特許文献4では、入力となる階段状信号および線形2次系の制御パラメータがいずれも未知の下で、観測される基本周波数系列だけから、それらを同時に推定する確率的なフレームワークが提案された。これは、音高目標値系列を表現する隠れマルコフモデル(HMM)と、差分近似に基づく式(1)のパラメトリックな表現によって、最尤なモデルパラメータを反復推定する学習アルゴリズムである。   In Non-Patent Document 3, an expressive singing voice synthesized sound is realized by using a fundamental frequency sequence obtained by convolving the impulse response of Expression (1) with a stepped signal representing a musical scale. However, in these conventional techniques, control parameters (attenuation rate ζ and natural frequency Ω) are determined manually or based on rules. On the other hand, in Non-Patent Document 4, a stochastic frame in which the input stepwise signal and the control parameter of the linear secondary system are both unknown and are estimated simultaneously from only the observed fundamental frequency sequence. Work was proposed. This is a learning algorithm that iteratively estimates the maximum likelihood model parameter using a hidden Markov model (HMM) that expresses a pitch target value series and a parametric expression of Equation (1) based on difference approximation.

N. Minematsu, B. Matsuoka, and K. Hirose, “Prosodic Modeling of Nagauta Singing and Its Evaluation," in Proc. SpeechProsody 2004, pp. 487-490, Mar. 2004N. Minematsu, B. Matsuoka, and K. Hirose, “Prosodic Modeling of Nagauta Singing and Its Evaluation,” in Proc. SpeechProsody 2004, pp. 487-490, Mar. 2004 T. Saitou, M. Unoki, and M. Akagi, “Development of an F0 control Model Based on F0 Dynamic Characteristics for Singing-Voice Synthesis," Speech Communication, vol.46, pp. 405-417, 2005T. Saitou, M. Unoki, and M. Akagi, “Development of an F0 control Model Based on F0 Dynamic Characteristics for Singing-Voice Synthesis,” Speech Communication, vol.46, pp. 405-417, 2005 T. Saitou, M. Goto, M. Unoki, and M. Akagi, “Speech-To-Singing Synthesis: Converting Speaking Voices to Singing Voices by Controlling Acoustic Features Unique to Singing Voices," in Proc. WASPAA 2007, pp. 215-218, Oct. 2007T. Saitou, M. Goto, M. Unoki, and M. Akagi, “Speech-To-Singing Synthesis: Converting Speaking Voices to Singing Voices by Controlling Acoustic Features Unique to Singing Voices,” in Proc. WASPAA 2007, pp. 215 -218, Oct. 2007 Y. Ohishi, H. Kameoka, K. Kashino, and K. Takeda, “Parameter Estimation Method of F0 Control Model for Singing Voices," in Proc INTERSPEECH 2008, pp. 139-142, Sep. 2008Y. Ohishi, H. Kameoka, K. Kashino, and K. Takeda, “Parameter Estimation Method of F0 Control Model for Singing Voices,” in Proc INTERSPEECH 2008, pp. 139-142, Sep. 2008

しかしながら、上述した非特許文献4の従来技術では、モデルパラメータの推定性能が悪かった。すなわち、観測される基本周波数系列と、パラメータによって再合成される基本周波数系列との誤差が大きくなるという問題がある。これは、基本周波数系列には音高の立ち上がりやビブラートのような様々な動特性が混在しているため、2次系のパラメータを最尤法によって直接推定すると、ある特定の動特性に引っ張られるオーバーフィッティングの問題が発生するためである。これに対し、基本周波数系列をフレーム分割して、フレームごとにモデルパラメータを推定する手法も提案されたが、各動特性を生み出す2次系の影響範囲が系列上で不明確であるため、結局モデルパラメータを適切に推定できないという問題がある。   However, in the prior art of Non-Patent Document 4 described above, the model parameter estimation performance was poor. That is, there is a problem that an error between the observed fundamental frequency sequence and the fundamental frequency sequence re-synthesized according to the parameter increases. This is because various dynamic characteristics such as pitch rise and vibrato are mixed in the fundamental frequency sequence, and if a second-order parameter is directly estimated by the maximum likelihood method, it is pulled to a specific dynamic characteristic. This is because an overfitting problem occurs. On the other hand, a method of dividing the fundamental frequency sequence into frames and estimating model parameters for each frame has also been proposed, but the range of influence of the secondary system that generates each dynamic characteristic is unclear on the sequence, so There is a problem that model parameters cannot be estimated appropriately.

本発明は、このような事情に鑑みてなされたもので、時系列信号の動特性特徴を抽出する際に、入力となる階段状信号および線形2次系の制御パラメータがいずれも未知の下で、観測される基本周波数系列だけから、モデルパラメータを精度よく推定することができる信号解析装置、信号解析方法及び信号解析プログラムを提供することを目的とする。   The present invention has been made in view of such circumstances, and when extracting the dynamic characteristic features of the time series signal, the input stepwise signal and the control parameter of the linear secondary system are both unknown. An object of the present invention is to provide a signal analysis apparatus, a signal analysis method, and a signal analysis program capable of accurately estimating model parameters from only the observed fundamental frequency series.

本発明は、観測信号[o]を、入力信号[f]とフィルタ特性を表すインパルス応答信号[h]との畳みこみによって得られる信号生成系の出力信号[y]と残差信号[ε]との和で表し、前記観測信号から、前記入力信号を表すモデルを構成する入力信号パラメータ[u]と、前記フィルタ特性を表すモデルを構成するフィルタ特性パラメータ[{a,b}または{a,a,a}または{w,w,…,w}]と、前記残差信号を表すモデルを構成する残差信号パラメータ[β]とを推定することにより時系列信号の動特性特徴を抽出する信号解析装置であって、前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成部と、前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータ[Θ]とし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離部と、前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの、対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られるQ関数[式27]を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新部と、前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離部と前記モデルパラメータ更新部による処理とを再度行わせるパラメータ収束判定部と、前記パラメータ収束判定部により前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力部とを備えることを特徴とする。 In the present invention, an output signal [y] and a residual signal [ε] of a signal generation system obtained by convolving an observation signal [o] with an input signal [f] and an impulse response signal [h] representing filter characteristics. And the input signal parameter [u] constituting the model representing the input signal and the filter characteristic parameter [{a, b} or {a 0 constituting the model representing the filter characteristic from the observed signal. , A 1 , a 2 } or {w 1 , w 2 ,..., W I }] and a residual signal parameter [β] constituting the model representing the residual signal, thereby estimating the time series signal. A signal analysis apparatus for extracting a dynamic characteristic feature, comprising: a parameter initial value generation unit that generates initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal; A set of a filter characteristic parameter, the input signal parameter, and the residual signal parameter is a model parameter [Θ], and the observation signal is configured by the input signal parameter and the filter characteristic parameter using the model parameter. A set of a signal separation unit for separating the output signal of the signal generation system and the residual signal configured by the residual signal parameter, the observation signal, the model parameter, the output signal, and the residual signal When the Q function [Equation 27] obtained by adding the prior probability of the model parameter to the conditional expected value of the log likelihood function is given as an objective function, the objective function is maximized with respect to the model parameter. A model parameter updating unit for updating the model parameter so as to be It is determined whether or not a predetermined standard is satisfied, and when it is determined that the predetermined standard is not satisfied, the processing by the signal separation unit and the model parameter update unit is performed again until the predetermined standard is satisfied. A parameter convergence determination unit; and a parameter output unit configured to output the model parameter when the parameter convergence determination unit determines that the model parameter satisfies a predetermined criterion.

本発明は、 前記入力信号はステップ信号[式17]であり、前記出力信号は多次元ガウス分布に従うものとして確率的にモデル化[式21]され、前記残差信号は、ガウス性白色雑音として確率的にモデル化[式22]されることを特徴とする。   In the present invention, the input signal is a step signal [Equation 17], the output signal is stochastically modeled as following a multidimensional Gaussian distribution [Equation 21], and the residual signal is expressed as Gaussian white noise. It is characterized by being probabilistically modeled [Equation 22].

本発明は、前記信号生成系のフィルタ特性は、差分法によって導出されるフィルタ[式5]で表され、前記フィルタ特性パラメータは、前記固有周波数の二乗に反比例するパラメータ[a=1/Ω, 式5]と、前記減衰率に比例し前記固有周波数に反比例するパラメータ[b=2ζ/Ω, 式5]とであることを特徴とする。 According to the present invention, the filter characteristic of the signal generation system is expressed by a filter [Expression 5] derived by a difference method, and the filter characteristic parameter is a parameter [a = 1 / Ω 2 inversely proportional to the square of the natural frequency. , Equation 5] and a parameter [b = 2ζ / Ω, Equation 5] proportional to the attenuation factor and inversely proportional to the natural frequency.

本発明は、前記信号生成系のフィルタ特性は、自己回帰過程に基づいて構成されるフィルタ[式10]で表され、前記フィルタ特性パラメータは、自己回帰パラメータ[式9]であることを特徴とする。   In the present invention, the filter characteristic of the signal generation system is represented by a filter [Equation 10] configured based on an autoregressive process, and the filter characteristic parameter is an autoregressive parameter [Equation 9]. To do.

本発明は 前記信号生成系のフィルタ特性は、複数の2次系フィルタの重み付き線形和によって構成されるフィルタ[式15]で表され、前記フィルタ特性パラメータは、前記各2次系フィルタの重み[{w,w,…,w}]であることを特徴とする。 In the present invention, the filter characteristic of the signal generation system is represented by a filter [Equation 15] configured by a weighted linear sum of a plurality of second-order filters, and the filter characteristic parameter is a weight of each second-order filter. [{W 1 , w 2 ,..., W I }].

本発明は、前記モデルパラメータ更新部は、補助変数から構成される前記目的関数の補助関数を、前記固有周波数の二乗に反比例するパラメータ[a]と前記補助関数を前記減衰率に比例し前記固有周波数に反比例するパラメータ[b]とでそれぞれ微分して得られる方程式からなる連立方程式[式36と式37]をフィルタ特性パラメータについて解くことにより、フィルタ特性パラメータ[{a,b}]の値を更新するフィルタ特性パラメータ更新部と、前記補助関数を、前記入力信号パラメータで微分して得られる方程式[式38]を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、前記補助関数を、前記残差信号パラメータで微分して得られる方程式[式38]を解くことにより、残差信号パラメータを更新する残差信号パラメータ更新部とから構成されることを特徴とする。   According to the present invention, the model parameter update unit sets the auxiliary function of the objective function composed of auxiliary variables to a parameter [a] that is inversely proportional to the square of the natural frequency and the auxiliary function that is proportional to the attenuation rate and the eigenfunction. By solving simultaneous equations [Equations 36 and 37] consisting of equations obtained by differentiating each of the parameters [b] inversely proportional to the frequency with respect to the filter properties parameters, the values of the filter properties parameters [{a, b}] are obtained. A filter characteristic parameter updating unit for updating, an input signal parameter updating unit for updating an input signal parameter by solving an equation [Equation 38] obtained by differentiating the auxiliary function with the input signal parameter, and the auxiliary function By solving the equation [Equation 38] obtained by differentiating the signal with the residual signal parameter. Characterized in that it is composed of a residual signal parameter update section for updating.

本発明は、前記モデルパラメータ更新部は、前記目的関数を、前記フィルタ特性パラメータに含まれる各自己回帰パラメータ[{a,a,a}]でそれぞれ微分して得られる方程式[式40, 式41, 式42]からなる連立方程式をフィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、前記目的関数を、前記入力信号パラメータで微分して得られる方程式[式43]を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、前記目的関数を、前記残差信号パラメータで微分して得られる方程式[式43]を解くことにより、残差信号パラメータを更新する残差信号パラメータ更新部とから構成されることを特徴とする。 In the present invention, the model parameter update unit is configured to obtain an equation obtained by differentiating the objective function by each autoregressive parameter [{a 0 , a 1 , a 2 }] included in the filter characteristic parameter [formula 40 , Equation 41, Equation 42] are solved for the filter characteristic parameter, and the filter characteristic parameter updating unit for updating the value of the filter characteristic parameter and the objective function are obtained by differentiating with the input signal parameter. By solving the equation [Equation 43], the input signal parameter updating unit for updating the input signal parameter and the equation [Equation 43] obtained by differentiating the objective function with the residual signal parameter are obtained. And a residual signal parameter updating unit for updating the difference signal parameter.

本発明は、前記モデルパラメータ更新部は、補助変数から構成される前記目的関数の補助関数を、前記フィルタ特性パラメータである各2次系フィルタの重み[{w,w,…,w}]でそれぞれ微分して得られる方程式からなる非線形連立方程式[式49または式57]を、フィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、前記補助関数を、前記入力信号パラメータで微分して得られる方程式[式50または式58]を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、前記補助関数を、前記残差信号パラメータで微分して得られる方程式[式50または式58]を解くことにより、残差信号パラメータを更新する残差信号パラメータ更新部とから構成されることを特徴とする。 In the present invention, the model parameter updating unit converts the auxiliary function of the objective function composed of auxiliary variables into weights [{w 1 , w 2 ,..., W I of the second-order filters that are the filter characteristic parameters]. }], A nonlinear simultaneous equation [Equation 49 or 57] consisting of equations obtained by differentiating each of them by solving for the filter characteristic parameter, the filter characteristic parameter updating unit for updating the value of the filter characteristic parameter, and the auxiliary function Is obtained by differentiating the input signal parameter by solving the equation [Equation 50 or 58] obtained by differentiating the input signal parameter, and the auxiliary function is differentiated by the residual signal parameter. A residual signal that updates the residual signal parameters by solving the equation [Eq. 50 or Eq. 58] Characterized in that it is composed of a parameter update unit.

本発明は、前記信号分離部は、前記観測信号と前記モデルパラメータが与えられた時の、前記出力信号および前記残差信号から構成される完全データの期待値[式(28)]と、前記完全データの自己相関[式(29)]とを用いて、前記観測信号を出力信号と残差信号とに分離することを特徴とする。   According to the present invention, the signal separation unit includes an expected value [Equation (28)] of complete data composed of the output signal and the residual signal when the observation signal and the model parameter are given, The observation signal is separated into an output signal and a residual signal using autocorrelation [Equation (29)] of complete data.

本発明は、観測信号を、入力信号とフィルタ特性を表すインパルス応答信号との畳みこみによって得られる信号生成系の出力信号と残差信号との和で表し、前記観測信号から、前記入力信号を表すモデルを構成する入力信号パラメータと、前記フィルタ特性を表すモデルを構成するフィルタ特性パラメータと、前記残差信号を表すモデルを構成する残差信号パラメータとを推定することにより時系列信号の動特性特徴を抽出する信号解析装置における信号解析方法であって、前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成ステップと、前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離ステップと、前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新ステップと、前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離ステップと前記モデルパラメータ更新ステップによる処理を再度行わせるパラメータ収束判定ステップと、前記パラメータ収束判定ステップにより前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力ステップとを有することを特徴とする。   The present invention represents an observation signal as a sum of an output signal of a signal generation system obtained by convolution of an input signal and an impulse response signal representing a filter characteristic and a residual signal, and the input signal is expressed from the observation signal. The dynamic characteristics of the time-series signal by estimating the input signal parameters constituting the model to be represented, the filter characteristic parameters constituting the model representing the filter characteristics, and the residual signal parameters constituting the model representing the residual signal A signal analysis method in a signal analysis apparatus for extracting features, the parameter initial value generating step for generating initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal, and the filter characteristic A set of a parameter, the input signal parameter, and the residual signal parameter is a model parameter. The observation signal is separated into the output signal of the signal generation system configured by the input signal parameter and the filter characteristic parameter and the residual signal configured by the residual signal parameter using the model parameter. A priori probability of the model parameter to a conditional expectation value of a log-likelihood function when given a signal separation step, the observed signal, the model parameter, and a set of the output signal and the residual signal. A model parameter update step of updating the model parameter so as to maximize the objective function with respect to the model parameter, using the function obtained by addition as an objective function, and whether or not the model parameter satisfies a predetermined criterion If it is determined that the predetermined standard is not satisfied, the predetermined standard is satisfied. Until it is determined that the model parameter satisfies a predetermined criterion by the parameter convergence determination step that causes the signal separation step and the model parameter update step to be performed again, and the parameter convergence determination step, the model parameter And a parameter output step for outputting.

本発明は、観測信号を、入力信号とフィルタ特性を表すインパルス応答信号との畳みこみによって得られる信号生成系の出力信号と残差信号との和で表し、前記観測信号から、前記入力信号を表すモデルを構成する入力信号パラメータと、前記フィルタ特性を表すモデルを構成するフィルタ特性パラメータと、前記残差信号を表すモデルを構成する残差信号パラメータとを推定することにより時系列信号の動特性特徴を抽出する信号解析装置上のコンピュータに信号解析を行わせる信号解析プログラムであって、前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成ステップと、前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離ステップと、前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新ステップと、前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離ステップと前記モデルパラメータ更新ステップによる処理を再度行わせるパラメータ収束判定ステップと、前記パラメータ収束判定ステップにより前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力ステップとを前記コンピュータに行わせることを特徴とする。   The present invention represents an observation signal as a sum of an output signal of a signal generation system obtained by convolution of an input signal and an impulse response signal representing a filter characteristic and a residual signal, and the input signal is expressed from the observation signal. The dynamic characteristics of the time-series signal by estimating the input signal parameters constituting the model to be represented, the filter characteristic parameters constituting the model representing the filter characteristics, and the residual signal parameters constituting the model representing the residual signal A signal analysis program for causing a computer on a signal analysis device for extracting features to perform signal analysis, wherein parameter initials for generating initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal A value generation step, the filter characteristic parameter, the input signal parameter, and the residual signal parameter. A set with a meter is used as a model parameter, and the observation signal is configured by the output signal of the signal generation system configured by the input signal parameter and the filter characteristic parameter and the residual signal parameter by using the model parameter. A conditional expectation value of a log-likelihood function when given a signal separation step for separating the residual signal, the observed signal, the model parameter, and the set of the output signal and the residual signal. A function obtained by adding the prior probabilities of the model parameters to the objective function, a model parameter updating step for updating the model parameter so as to maximize the objective function with respect to the model parameter; and Judgment is made whether or not the standard is satisfied, and the predetermined standard is not satisfied When it is determined that the model parameter satisfies the predetermined criterion, the parameter separation determining step for performing again the processing by the signal separation step and the model parameter updating step until the predetermined criterion is satisfied, and the model parameter satisfies the predetermined criterion by the parameter convergence determining step. If it is determined, the computer is caused to perform a parameter output step of outputting the model parameter.

本発明によれば、入力となる階段状信号および線形2次系の制御パラメータがいずれも未知の下で、観測される基本周波数系列のみからモデルパラメータを精度よく推定することができるという効果が得られる。   According to the present invention, it is possible to accurately estimate a model parameter from only an observed fundamental frequency sequence when both the input stepped signal and the control parameter of the linear secondary system are unknown. It is done.

線形2次系モデルの概念を示す説明図である。It is explanatory drawing which shows the concept of a linear secondary system model. 信号生成系の概念を示す説明図である。It is explanatory drawing which shows the concept of a signal generation system. 本発明の第1の実施形態における歌声の基本周波数系列に対する信号解析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the signal analysis apparatus with respect to the fundamental frequency series of the singing voice in the 1st Embodiment of this invention. 歌声の基本周波数系列に対する信号分解モデルを示す説明図である。It is explanatory drawing which shows the signal decomposition model with respect to the fundamental frequency series of a singing voice. 本発明の第5の実施形態における音声信号のメル周波数ケプストラム係数(MFCC)系列に対する信号解析装置の構成を示すブロック図である。It is a block diagram which shows the structure of the signal analysis apparatus with respect to the mel frequency cepstrum coefficient (MFCC) series of the audio | voice signal in the 5th Embodiment of this invention. 第4の実施形態におけるモデルパラメータによって生成される信号μと観測基本周波数系列oとの比較結果を示す図である。It is a figure which shows the comparison result of signal (micro | micron | mu) produced | generated by the model parameter in 4th Embodiment, and the observation fundamental frequency series o. 第4の実施形態によって推定されたζとΩの歌唱者ごとの平均値を示す図である。It is a figure which shows the average value for every singer of (zeta) and (omega) estimated by 4th Embodiment. 第4の実施形態によって推定されたuの歌唱者ごとの頻度分布を示す図である。It is a figure which shows frequency distribution for every song person of u estimated by 4th Embodiment.

以下、図面を参照して、本発明の一実施形態による信号解析装置を説明する。まず、本発明の信号解析装置において、入力となる階段状信号および線形2次系の制御パラメータがいずれも未知の下で、観測される基本周波数系列のみからモデルパラメータを精度よく推定する原理について説明する。   Hereinafter, a signal analyzing apparatus according to an embodiment of the present invention will be described with reference to the drawings. First, in the signal analysis apparatus of the present invention, the principle of accurately estimating model parameters from only the observed fundamental frequency sequence will be described under the assumption that both the input stepwise signal and the control parameter of the linear quadratic system are unknown. To do.

図1は、線形2次系モデルの概念を示す説明図である。図1に示すように、観測信号o(t)を複数の区分に分割し、それぞれの区分における観測信号を、ステップ信号(入力信号)f(t)、フィルタ特性(線形2次系のインパルス応答)h(t)、残差信号(剰余信号)ε(t)の3つの要素に分解するものとする。   FIG. 1 is an explanatory diagram showing the concept of a linear quadratic system model. As shown in FIG. 1, the observation signal o (t) is divided into a plurality of sections, and the observation signal in each section is converted into a step signal (input signal) f (t) and a filter characteristic (an impulse response of a linear secondary system). ) H (t) and residual signal (residue signal) ε (t).

ここで、図2を参照して、入力信号f(t)と観測信号o(t)との関係を説明する。図2は、信号生成系の概念を示す説明図である。入力信号f(t)は、目標値からなる信号を意味する。線形の2次系フィルタh(t)は、2次系に従う、観測信号の時間的な立ち上がりやオーバーシュートなどの動特性を表現する。線形2次系フィルタの出力信号y(t)は、f(t)とh(t)の畳み込み

Figure 0005318042
によって計算される系の出力信号を表す。残差信号ε(t)は観測信号と出力信号の残差信号を表す。ただし、観測信号は離散的な信号系列であるため、これらの要素に分解するために、式(1)の2次系の伝達関数を離散時間表現する4つの手法のいずれかを用いる。 Here, the relationship between the input signal f (t) and the observation signal o (t) will be described with reference to FIG. FIG. 2 is an explanatory diagram showing the concept of the signal generation system. The input signal f (t) means a signal composed of a target value. The linear secondary system filter h (t) expresses dynamic characteristics such as temporal rise of an observation signal and overshoot according to the secondary system. The output signal y (t) of the linear second-order filter is a convolution of f (t) and h (t)
Figure 0005318042
Represents the output signal of the system calculated by The residual signal ε (t) represents the residual signal between the observation signal and the output signal. However, since the observation signal is a discrete signal sequence, any one of four methods for expressing the transfer function of the second-order system of Expression (1) in discrete time is used to decompose it into these elements.

ここで、線形2次系の伝達関数を離散時間表現する4つの手法について説明する。まず、差分法による離散時間表現法(手法1という)について説明する。式(1)をラプラス逆変換すると、

Figure 0005318042
となり、f(t)とy(t)の関係を表す2階微分方程式が導かれる。ここでf(t)とy(t)をサンプリング周期Δで離散化して、
Figure 0005318042
と表し(Nは信号の長さを表す)、差分法を利用すると、
Figure 0005318042
のように各時刻の微分値を近似できる。 Here, four methods for expressing the transfer function of the linear quadratic system in discrete time will be described. First, the discrete time expression method (referred to as Method 1) by the difference method will be described. When formula (1) is inversely transformed by Laplace,
Figure 0005318042
Thus, a second-order differential equation representing the relationship between f (t) and y (t) is derived. Here, f (t) and y (t) are discretized with a sampling period Δ,
Figure 0005318042
(N represents the length of the signal), and using the difference method,
Figure 0005318042
The differential value at each time can be approximated as follows.

この近似を利用すると式(3)は、

Figure 0005318042
と書ける。ここで、(aA+bB+C)が2次系の逆フィルタのインパルス応答に相当し、A、B、CはそれぞれN×Nの行列であり、
Figure 0005318042
と書ける。 Using this approximation, equation (3) becomes
Figure 0005318042
Can be written. Here, (aA + bB + C) corresponds to the impulse response of the inverse filter of the second-order system, and A, B, and C are each an N × N matrix,
Figure 0005318042
Can be written.

もちろん、差分法は、式(4)以外にも複数の近似方法(中央差分、前進差分、後退差分、Sinc関数利用など)を用いることができ、結果的にA、B、Cそれぞれの行列の構成を変更することに相当する。手法1では、式(5)のa、bがフィルタ特性パラメータとなる。   Of course, the difference method can use a plurality of approximation methods (center difference, forward difference, backward difference, use of Sinc function, etc.) in addition to equation (4). This corresponds to changing the configuration. In Method 1, a and b in Expression (5) are filter characteristic parameters.

次に、自己回帰モデルに基づく離散時間表現法(手法2という)について説明する。式(1)のs領域からz領域への写像を考える。

Figure 0005318042
と近似すると、s領域とz領域の関係は、
Figure 0005318042
となる。式(1)の逆フィルタの伝達関数はz領域で、
Figure 0005318042
と書ける。 Next, a discrete time expression method (referred to as method 2) based on the autoregressive model will be described. Consider the mapping from the s region to the z region in equation (1).
Figure 0005318042
And the relationship between the s region and the z region is
Figure 0005318042
It becomes. The transfer function of the inverse filter of equation (1) is in the z region,
Figure 0005318042
Can be written.

これは2次の自己回帰モデルと同形であり、

Figure 0005318042
とすると、式(8)は、
Figure 0005318042
と書ける。U=I(IはN×Nの単位行列)であり、U、Uはそれぞれ
Figure 0005318042
からなるN×Nの行列とする。手法2では、式(10)のa,a,aがフィルタ特性パラメータとなる。 This is isomorphic to the second-order autoregressive model,
Figure 0005318042
Then, equation (8) becomes
Figure 0005318042
Can be written. U 0 = I N (I N is an N × N unit matrix), and U 1 and U 2 are respectively
Figure 0005318042
An N × N matrix consisting of In Method 2, a 0 , a 1 , and a 2 in Expression (10) are filter characteristic parameters.

次に、複数の振動基底の線形和に基づく離散時間表現法(手法3、手法4という)について説明する。式(1)の伝達関数のラプラス逆変換によって得られるインパルス応答は、ζの値によって、以下のように場合分けされる。

Figure 0005318042
Next, a discrete time expression method (method 3 and method 4) based on a linear sum of a plurality of vibration bases will be described. The impulse response obtained by the Laplace inverse transform of the transfer function of Equation (1) is classified as follows according to the value of ζ.
Figure 0005318042

これらのインパルス応答をサンプリング周期Δに基づいて離散化すると、系の入出力関係は、y=Φfのような形式で記述できる。例えば、ζ=1の場合、Φは下三角行列

Figure 0005318042
で書ける。ただし、h(t)は式(12)のように複数の場合からなるので、行列Φを以下のように構成する。
Figure 0005318042
When these impulse responses are discretized based on the sampling period Δ, the input / output relationship of the system can be described in a format such as y = Φf. For example, when ζ = 1, Φ is a lower triangular matrix
Figure 0005318042
You can write in However, since h (t) consists of a plurality of cases as shown in Equation (12), the matrix Φ is configured as follows.
Figure 0005318042

ここでは、予め手動でζ、Ωを決定し、I個の振動現象を表すインパルス応答{Φ(1),Φ(2),・・・,Φ(I)}を計算する。そして、これらの逆行列Υ(i):=(Φ(t)−1(逆フィルタのインパルス応答を表す。これらを以後、振動基底と呼ぶ)の線形重み付き和で、Φ−1を近似する。手法3では、式(14)のw:={w,w,・・・,w}をフィルタ特性パラメータとし、これらのパラメータを回帰問題の枠組みで推定するものとする。 Here, ζ and Ω are manually determined in advance, and impulse responses {Φ (1) , Φ (2) ,..., Φ (I) } representing I vibration phenomena are calculated. Then, Φ −1 is approximated by a linear weighted sum of these inverse matrices i (i) : = (Φ (t) ) −1 (representing the impulse response of the inverse filter. These are hereinafter referred to as vibration bases). To do. In Method 3, w: = {w 1 , w 2 ,..., W I } in Expression (14) is a filter characteristic parameter, and these parameters are estimated in the framework of a regression problem.

一方、手法4では、フィルタ特性パラメータw:={w,w,・・・,w}がスパースなものとする。これは、Φ−1が、ほんの数個の振動基底のみによって表現されることを意味する。後に説明するが、これはwの事前確率を想定することで容易に実現されうる。 On the other hand, in the method 4, it is assumed that the filter characteristic parameter w: = {w 1 , w 2 ,..., W I } is sparse. This means that Φ −1 is represented by only a few vibration bases. As will be described later, this can be easily realized by assuming a prior probability of w.

系のインパルス応答ΦをΦ(i)の線形重み付き和で表現してもよいが、Υ(i)の線形重み付き和で逆フィルタのインパルス応答Φ−1を表現した理由は、後に説明するパラメータ学習アルゴリズムの導出の複雑さを解消するためである。それゆえに、系の入出力関係は、

Figure 0005318042
と表現される。 The impulse response Φ of the system may be expressed by a linear weighted sum of Φ (i) , but the reason why the impulse response Φ −1 of the inverse filter is expressed by the linear weighted sum of Υ (i) will be described later. This is to eliminate the complexity of deriving the parameter learning algorithm. Therefore, the input / output relationship of the system is
Figure 0005318042
It is expressed.

以上に説明した4つの手法(式(5)、式(10)、式(15))より、式(1)の伝達関数が、すべてΨy=fの形式に変換された。Ψはそれぞれ、

Figure 0005318042
と表現される。 From the four methods described above (formula (5), formula (10), and formula (15)), the transfer function of formula (1) is all converted into the form of Ψy = f. Ψ is respectively
Figure 0005318042
It is expressed.

次に、ガウス過程に基づく線形2次系の統計的モデリングについて説明する。式(5)、式(10)、式(15)によって表現される系の入出力関係を、ガウス過程(文献:C. E. Rasmussen and C. K. I. Williams, Gaussian Processes for Machine Learning. MIT Press, Cambridge, Mass, USA, 2006.)に基づいて統計的にモデル化する。   Next, statistical modeling of a linear quadratic system based on a Gaussian process will be described. The input / output relationship of the system expressed by Equation (5), Equation (10), and Equation (15) can be expressed as a Gaussian process (literature: CE Rasmussen and CKI Williams, Gaussian Processes for Machine Learning. MIT Press, Cambridge, Mass, USA). , 2006.) for statistical modeling.

ここで、入力ステップ信号のモデル化について説明する。入力信号fはステップ信号を想定する。そのために、常に同じ値をもつベクトル

Figure 0005318042
を用意する。ここで、スカラー値uは相対音高を表すパラメータ、1はN個の1の値が並ぶベクトルとする。このベクトルuを平均とする多次元ガウス分布から生成される確率変数として、入力信号fを確率的にモデル化する。
Figure 0005318042
Here, modeling of the input step signal will be described. The input signal f is assumed to be a step signal. Therefore, a vector that always has the same value
Figure 0005318042
Prepare. Here, the scalar value u is a parameter representing relative pitch, and N is a vector in which N 1 values are arranged. The input signal f is stochastically modeled as a random variable generated from a multidimensional Gaussian distribution with the vector u as an average.
Figure 0005318042

ここで、αは分散を表す超パラメータであり、あらかじめ手動で値を設定する。したがって、請求項で述べた入力信号パラメータはuのみである。出力yは、ガウス分布に従う変数集合fの線形結合(y=Ψ−1f)であるから、y自身もガウス分布に従う。その平均と共分散は、

Figure 0005318042
である。よって、yが従う確率分布は、
Figure 0005318042
と書ける。 Here, α is a super parameter representing dispersion, and is manually set in advance. Therefore, the only input signal parameter mentioned in the claims is u. Since the output y is a linear combination (y = Ψ −1 f) of the variable set f according to the Gaussian distribution, y itself also follows the Gaussian distribution. Its mean and covariance are
Figure 0005318042
It is. Therefore, the probability distribution that y follows is
Figure 0005318042
Can be written.

このモデルはガウス過程の1つの例となっていることは特筆すべき点である。ガウス過程の重要な点は、yのN個の要素の同時分布が、平均と共分散といった2次までの統計量で完全に記述される点である。通常のガウス過程では、平均はたいていの場合、零とすることが多く、共分散はカーネル行列の線形和(Multiple Kernel Learning;文献:F. R. Bach, G. R. G. Lanckriet, and M. I. Jordan, “Multiple kernel learning, conic duality, and the smo algorithm," in Proc. ICML 2004, pp. 6-13, July 2004)によって構成されるのが一般的である。この技術により、複数の観測値(ここでは、yの要素)がそれぞれ独立同分布に従うと仮定するのではなく、観測値間の相関を考慮できる。このMultiple Kernel Learningを利用したガウス過程による信号モデリングは機械学習の分野で近年注目を集めている。   It should be noted that this model is an example of a Gaussian process. The important point of the Gaussian process is that the simultaneous distribution of N elements of y is completely described by statistics up to second order such as mean and covariance. In normal Gaussian processes, the mean is often zero, and the covariance is the linear sum of kernel matrices (Multiple Kernel Learning; literature: FR Bach, GRG Lanckriet, and MI Jordan, “Multiple kernel learning, conic In general, it is composed of duality, and the smo algorithm, "in Proc. ICML 2004, pp. 6-13, July 2004). With this technique, rather than assuming that a plurality of observed values (in this case, elements of y) follow independent and identical distributions, the correlation between the observed values can be considered. In recent years, signal modeling using Gaussian processes using Multiple Kernel Learning has attracted attention in the field of machine learning.

これに対し、前述したモデルでは、式(21)の平均と共分散の項に行列Ψ−1を含む。そして、式(16)のように、Ψがいくつかの基底の線形和で表現されている。したがって、Multiple Kernel Learningとは異なる、特別なガウス過程に基づく信号モデルとここで言及する。 On the other hand, in the above-described model, the matrix Ψ −1 is included in the mean and covariance terms of Equation (21). Then, as in Expression (16), Ψ is expressed by a linear sum of several bases. Therefore, here we refer to a signal model based on a special Gaussian process, which is different from Multiple Kernel Learning.

次に、尤度関数と事前確率について説明する。ガウス性白色雑音に従う残差信号

Figure 0005318042
を導入し、観測信号
Figure 0005318042
は、系の出力信号yに残差信号εが加わった信号
Figure 0005318042
と仮定する。 Next, the likelihood function and the prior probability will be described. Residual signal subject to Gaussian white noise
Figure 0005318042
Introduced the observation signal
Figure 0005318042
Is a signal obtained by adding a residual signal ε to the output signal y of the system
Figure 0005318042
Assume that

ここで、βは残差信号の分散を表す超パラメータとし、これが請求項でいう残差信号パラメータに相当する。yとεは互いに独立であると仮定すると、ガウス過程の定義より、観測信号oが与えられたときのモデルパラメータθ={Ψ,u,β}の対数尤度関数は、

Figure 0005318042
となる。ここで、μ:=Ψ−1u,Σ:=αΨ−1(Ψ−1+βIとする。 Here, β is a super parameter representing the variance of the residual signal, which corresponds to the residual signal parameter in the claims. Assuming that y and ε are independent from each other, from the definition of the Gaussian process, the log likelihood function of the model parameter θ = {Ψ, u, β} when the observation signal o is given is
Figure 0005318042
It becomes. Here, μ: = Ψ -1 u, Σ: = αΨ -1 (Ψ -1) and T + beta I N.

Θの事前確率P(Θ)は、各要素の独立性P(Θ)=P(Ψ)P(u)P(β)を仮定し、uとβはそれぞれ一様分布に従うものとする。P(Ψ)は、前述した手法1〜4のフィルタ特性パラメータの独立性を仮定して、

Figure 0005318042
とし、P(a)、P(b)、P(a)、P(a)、P(a)はそれぞれ一様分布を仮定する。手法3では、同様にP(w),P(w),・・・,P(w)はそれぞれ一様分布を仮定する。一方、手法4では、パラメータwにスパースな制約をもたせるために、一般化正規分布
Figure 0005318042
に従うものとする。ただし、p、λは一般化正規分布の形状を規定する定数であり、0<p<2のときp(w)は優ガウス的となり、スパースネスを測るための尺度となる。 The prior probability P (Θ) of Θ assumes the independence P (Θ) = P (ψ) P (u) P (β) of each element, and u and β are assumed to follow a uniform distribution. P (Ψ) assumes the independence of the filter characteristic parameters of the methods 1 to 4 described above,
Figure 0005318042
And P (a), P (b), P (a 0 ), P (a 1 ), and P (a 2 ) are assumed to have a uniform distribution. In method 3, similarly, P (w 1 ), P (w 2 ),..., P (w I ) are assumed to have a uniform distribution. On the other hand, in Method 4, a generalized normal distribution is used in order to place a sparse constraint on the parameter w.
Figure 0005318042
Shall be followed. However, p and λ are constants that define the shape of the generalized normal distribution. When 0 <p <2, p (w) becomes dominant Gaussian and is a scale for measuring sparseness.

次に、EM法に基づくパラメータ学習アルゴリズムについて説明する。基本周波数系列oが与えられたときに、事後確率P(Θ|o)∝P(o|Θ)P(Θ)を最大化するパラメータΘの推定値を決定したい。しかしながら、Θの事後(MAP)推定値に関する最適解を解析的に求めることは難しい。その理由は、観測信号oが出力信号yと残差信号εの和で構成される、尤度関数が、Ψを構成するフィルタ特性パラメータに関して非線形となるなどが挙げられる。ここでは、それぞれの問題に対処するために、次の2つの方策を適用する。   Next, a parameter learning algorithm based on the EM method will be described. Given a fundamental frequency sequence o, we want to determine an estimate of the parameter Θ that maximizes the posterior probability P (Θ | o) ∝P (o | Θ) P (Θ). However, it is difficult to analytically determine the optimal solution for the posterior (MAP) estimate of Θ. The reason is that the observation signal o is composed of the sum of the output signal y and the residual signal ε, and the likelihood function is non-linear with respect to the filter characteristic parameter constituting Ψ. Here, in order to deal with each problem, the following two measures are applied.

1つ目は、EM法のE−stepで、oをyとεに分配することである。2つ目は、M−stepに補助関数法(文献:H. Kameoka, N. Ono, K. Kashino, and S. Sagayama, “Complex NMF: A New Sparse Representation for Acoustic Signals," in Proc. ICASSP 2009, pp. 3437-3440, April 2009)を適用して、Q関数の補助関数を設計することである。   The first is to distribute o to y and ε in E-step of EM method. The second is an auxiliary function method (reference: H. Kameoka, N. Ono, K. Kashino, and S. Sagayama, “Complex NMF: A New Sparse Representation for Acoustic Signals,” in Proc. ICASSP 2009 , pp. 3437-3440, April 2009) to design the auxiliary function of the Q function.

次に、完全データの定義について説明する。このMAP推定問題にEM法を適用する際の最初のステップは完全データを定義することである。ここでは、yとεを完全データxと見なして、EM法を適用する。不完全データと完全データの関係を、

Figure 0005318042
と表現する。xと現在のパラメータΘ´が与えられたときの、対数尤度関数の条件付き期待値を計算し、さらにlogP(Θ)を加算すると、以下のようなQ関数を得る。
Figure 0005318042
Next, the definition of complete data will be described. The first step in applying the EM method to this MAP estimation problem is to define complete data. Here, y and ε are regarded as complete data x, and the EM method is applied. The relationship between incomplete data and complete data
Figure 0005318042
It expresses. When the conditional expected value of the log likelihood function when x and the current parameter Θ ′ are given is calculated and logP (Θ) is added, the following Q function is obtained.
Figure 0005318042

なお、=の上にcのついた記号は、定数項を除いて左辺と右辺が等しいことを表し、

Figure 0005318042
である。ここで、tr(・)は行列のトレースを表し、条件付ガウス分布の性質から、
Figure 0005318042
と書ける。ここで、式(28)は、不完全データo(観測信号)と現在のパラメータが与えられた時の、完全データx(出力信号と残差信号で構成される)の期待値であり、式(29)は、不完全データo(観測信号)と現在のパラメータが与えられた時の、完全データx(出力信号と残差信号で構成される)の自己相関である。 Note that the symbol with c above = indicates that the left side and the right side are equal except for the constant term.
Figure 0005318042
It is. Where tr (•) represents the trace of the matrix, and from the nature of the conditional Gaussian distribution,
Figure 0005318042
Can be written. Here, Expression (28) is an expected value of complete data x (consisting of an output signal and a residual signal) when incomplete data o (observation signal) and the current parameter are given. (29) is an autocorrelation of complete data x (consisting of an output signal and a residual signal) when incomplete data o (observation signal) and the current parameter are given.

EM法のE−stepでは、直前に更新されたモデルパラメータをΘ´に代入し、E[x|o;Θ´]とE[xx|o;Θ´]を計算する。後の計算のため、y、εに対応するようにE[x|o;Θ´]とE[xx|o;Θ´]を

Figure 0005318042
のように区分表現する。 ̄xと ̄xεは( ̄はそれぞれxの頭に付く、以下の説明においても同様)はどちらも長さNのベクトルであり、RとRεはどちらもN×Nの正方行列を表す。 In the E-step of the EM method, the model parameter updated immediately before is substituted into Θ ′, and E [x | o; Θ ′] and E [xx T | o; Θ ′] are calculated. For later calculations, let E [x | o; Θ ′] and E [xx T | o; Θ ′] correspond to y and ε.
Figure 0005318042
It is divided and expressed as  ̄ xy and  ̄ x ε ( ̄ is prefixed with x, respectively in the following description) are both vectors of length N, and R y and R ε are both N × N square matrices. Represents.

次に、Q関数を前述の手法1〜手法4の各モデルパラメータに関して、最大化するM−step更新式について説明する。まず、手法1のM−step更新式について説明する。Ψ=aA+bB+Cなので、式(27)から関連する項を取り出すと、最大化する目的関数は

Figure 0005318042
と改めて定義される。ここで、An,nとは行列Aのn行n列目の要素を表す。パラメータ集合Θに関する最大化問題を解く更新式を前述の補助関数法により導く。式(31)で与えられる目的関数の補助関数を以下の不等式を用いて導く。
Figure 0005318042
ここで、等号成立は、
Figure 0005318042
の場合である。補助変数γ={γa,1,γb,1,γa,2,γb,2,・・・,γa,N,γb,N}を導入すると、補助関数は、
Figure 0005318042
とすれば、f(a,b,u,β)≧f (a,b,u,β,γ)が成り立ち、式(33)が成立するとき、
Figure 0005318042
となるため、f (a,b,u,β,γ)は補助関数の定義を満たす。 Next, an M-step update formula for maximizing the Q function for each model parameter of the above-described methods 1 to 4 will be described. First, the M-step update formula of Method 1 will be described. Since Ψ = aA + bB + C, taking the relevant term from Equation (27), the objective function to be maximized is
Figure 0005318042
Is redefined. Here, A n, n represents an element in the nth row and the nth column of the matrix A. An update formula for solving the maximization problem with respect to the parameter set Θ is derived by the auxiliary function method described above. The auxiliary function of the objective function given by Equation (31) is derived using the following inequality.
Figure 0005318042
Here, the establishment of the equal sign is
Figure 0005318042
This is the case. When the auxiliary variable γ 1 = {γ a, 1 , γ b, 1 , γ a, 2 , γ b, 2 ,..., Γ a, N , γ b, N } is introduced, the auxiliary function is
Figure 0005318042
Then, f 1 (a, b, u, β) ≧ f 1 + (a, b, u, β, γ 1 ) holds, and when equation (33) holds,
Figure 0005318042
Therefore, f 1 + (a, b, u, β, γ 1 ) satisfies the definition of the auxiliary function.

そこで、f (a,b,u,β,γ)をa、bそれぞれに関して微分して0とおくと、

Figure 0005318042
を得る。式(5)から分かるように、aとbは共に正の値となる制約の下で、Coordinate descent法を適用して、式(36)と式(37)からなる連立方程式を解き、aとbを求める。 Therefore, if f 1 + (a, b, u, β, γ 1 ) is differentiated with respect to each of a and b and set to 0,
Figure 0005318042
Get. As can be seen from Equation (5), under the constraint that both a and b are positive values, the Coordinate descent method is applied to solve the simultaneous equations of Equation (36) and Equation (37), and a and b is obtained.

一方、f (a,b,u,β,γ)をu、βそれぞれに関して微分して0とおくと、

Figure 0005318042
を得る。これらの式を用いて、uとβを更新する。 On the other hand, if f 1 + (a, b, u, β, γ 1 ) is differentiated with respect to u and β, and is set to 0,
Figure 0005318042
Get. Using these equations, u and β are updated.

以上の手法1に関する、EM法に基づくパラメータ学習アルゴリズムをまとめると、以下のようになる。
初期化: パラメータΘ={a,b,u,β}に初期値を与える。E−step: E[x|o;Θ´]、E[xx|o;Θ´]、γ={γa,1,γb,1,γa,2,γb,2,・・・,γa,N,γb,N}の更新。M−step:式(36)、(37)、(38)より、モデルパラメータΘ={a,b,u,β}の更新。収束判定:式(34)の補助関数の値が収束していなければ、Θ´=ΘとしてE−stepに戻る。
The parameter learning algorithm based on the EM method related to the above method 1 is summarized as follows.
Initialization: An initial value is given to the parameter Θ = {a, b, u, β}. E-step: E [x | o; Θ ′], E [xx T | o; Θ ′], γ 1 = {γ a, 1 , γ b, 1 , γ a, 2 , γ b, 2 ,. .., γ a, N , γ b, N } update. M-step: Update of model parameter Θ = {a, b, u, β} from equations (36), (37), and (38). Convergence determination: If the value of the auxiliary function of Expression (34) has not converged, return to E-step as Θ ′ = Θ.

次に、手法2のM−step更新式について説明する。Ψ=a+a+aなので、式(27)から関連する項を取り出すと、最大化する目的関数は、

Figure 0005318042
と改めて定義される。f(a,a,a,u,β)をa,a,aに関してそれぞれ微分して0とおくと,
Figure 0005318042
を得る。式(9)に示すように、aとaは正の値、aは負の値となる制約の下で、Coordinate descent法を適用して、式(40)、(41)、(42)からなる連立方程式を解き、a,a,aを求める。 Next, the M-step update formula of Method 2 will be described. Since Ψ = a 0 U 0 + a 1 U 1 + a 2 U 2 , when the relevant terms are taken from equation (27), the objective function to be maximized is
Figure 0005318042
Is redefined. If f 2 (a 0 , a 1 , a 2 , u, β) is differentiated with respect to a 0 , a 1 , a 2 and set to 0,
Figure 0005318042
Get. As shown in Expression (9), the Coordinate descent method is applied under the constraint that a 0 and a 2 are positive values and a 1 is a negative value, and Expressions (40), (41), ( 42) are solved to obtain a 0 , a 1 , and a 2 .

一方、f(a,a,a,u,β)をu、βそれぞれに関して微分して0とおくと、

Figure 0005318042
を得る。これらの式を用いて、uとβを更新する。 On the other hand, if f 2 (a 0 , a 1 , a 2 , u, β) is differentiated with respect to u and β, and set to 0,
Figure 0005318042
Get. Using these equations, u and β are updated.

以上の手法2に関する、EM法に基づくパラメータ学習アルゴリズムをまとめると、以下のようになる。初期化:パラメータΘ={a,a,a,u,β}に初期値を与える。E−step:E[x|o;Θ´]、E[xx|o;Θ´]の更新。
M−step:式(40)、(41)、(42)、(43)より、モデルパラメータΘ={a,a,a,u,β}の更新。収束判定:式(39)の目的関数の値が収束していなければ、Θ´=ΘとしてE−stepに戻る。
The parameter learning algorithm based on the EM method related to the above method 2 is summarized as follows. Initialization: An initial value is given to the parameter Θ = {a 0 , a 1 , a 2 , u, β}. E-step: Update of E [x | o; Θ ′], E [xx T | o; Θ ′].
M-step: Update of the model parameter Θ = {a 0 , a 1 , a 2 , u, β} from the equations (40), (41), (42), (43). Convergence determination: If the value of the objective function in Expression (39) has not converged, return to E-step as Θ ′ = Θ.

次に、手法3のM−step更新式について説明する。Ψ=wΥ(1)+wΥ(2)+・・・+wΥ(I)なので、式(27)から関連する項を取り出すと、最大化する目的関数は、

Figure 0005318042
と改めて定義される。ここで、Υn,n (i)はΥ(i)のn行n列目の対角要素を表す。この最大化問題を解く更新式を補助関数法により導く。式(44)で与えられる目的関数の補助関数を以下の不等式を用いて導く。
Figure 0005318042
Next, the M-step update formula of Method 3 will be described. Since Ψ = w 1 Υ (1) + w 2 Υ (2) +... + W I Υ (I) , when the relevant term is taken from equation (27), the objective function to be maximized is
Figure 0005318042
Is redefined. Here, Υ n, n (i) represents the diagonal element of the n-th row and the n-th column of Υ (i) . An update formula that solves this maximization problem is derived by the auxiliary function method. The auxiliary function of the objective function given by Expression (44) is derived using the following inequality.
Figure 0005318042

ここで、補助変数γ={γ1,1,・・・,γI,N}を定義し、補助関数を

Figure 0005318042
と定義する。このとき、
Figure 0005318042
が成り立ち、等号成立は、
Figure 0005318042
のときであるため、式(46)は補助関数の定義を満たす。 Here, the auxiliary variable γ 3 = {γ 1,1 ,..., Γ I, N } is defined, and the auxiliary function is defined as
Figure 0005318042
It is defined as At this time,
Figure 0005318042
The establishment of the equality sign
Figure 0005318042
(46) satisfies the definition of the auxiliary function.

式(46)をwi´に関して微分して0とおくと,

Figure 0005318042
を得る。Coordinate descent法を利用して、i´=1,2,・・・,Iに関する非線形連立方程式を解くと、wを求めることができる。一方、f (w,u,β,γ)をu、βそれぞれに関して微分して0とおくと、
Figure 0005318042
を得る。これらの式を用いて、uとβを更新する。 Differentiating equation (46) with respect to w i ′ and setting it to 0,
Figure 0005318042
Get. By solving the nonlinear simultaneous equations related to i ′ = 1, 2,..., Using the coordinate descent method, w can be obtained. On the other hand, if f 3 + (w, u, β, γ 3 ) is differentiated with respect to u and β, and set to 0,
Figure 0005318042
Get. Using these equations, u and β are updated.

以上の手法3に関する、EM法に基づくパラメータ学習アルゴリズムをまとめると、以下のようになる。
初期化:パラメータΘ={w,u,β}に初期値を与える。E−step:E[x|o;Θ´]、E[xx|o;Θ´]、γの更新。M−step:式(49)、(50)より、モデルパラメータΘ={w,u,β}の更新。収束判定:式(46)の補助関数の値が収束していなければ、Θ´=ΘとしてE−stepに戻る。
The parameter learning algorithm based on the EM method related to the above method 3 is summarized as follows.
Initialization: An initial value is given to the parameter Θ = {w, u, β}. E-step: Update of E [x | o; Θ ′], E [xx T | o; Θ ′], γ 3 . M-step: Update of model parameter Θ = {w, u, β} from equations (49) and (50). Convergence determination: If the value of the auxiliary function in the equation (46) has not converged, return to E-step as Θ ′ = Θ.

次に、手法4のM−step更新式について説明する。Ψ=wΥ(1)+wΥ(2)+・・・+wΥ(I)なので、式(27)から関連する項を取り出すと、最大化する目的関数は、

Figure 0005318042
と改めて定義される。ここで、Υn,n (i)はΥ(i)のn行n列目の対角要素を表す。この最大化問題を解く更新式を補助関数法により導く。式(51)で与えられる目的関数の補助関数を以下の2つの不等式を用いて導く。
Figure 0005318042
Next, the M-step update formula of Method 4 will be described. Since Ψ = w 1 Υ (1) + w 2 Υ (2) +... + W I Υ (I) , when the relevant term is taken from equation (27), the objective function to be maximized is
Figure 0005318042
Is redefined. Here, Υ n, n (i) represents the diagonal element of the n-th row and the n-th column of Υ (i) . An update formula that solves this maximization problem is derived by the auxiliary function method. The auxiliary function of the objective function given by equation (51) is derived using the following two inequalities.
Figure 0005318042

ここで、補助変数 ̄w:={ ̄w, ̄w,・・・, ̄w}、γ={γ1,1,・・・,γI,N}を定義し、補助関数を

Figure 0005318042
と定義する。このとき、
Figure 0005318042
が成り立ち、等号成立は、
Figure 0005318042
のときであるため、式(54)は補助関数の定義を満たす。
式(54)をwi´に関して微分して0とおくと、
Figure 0005318042
を得る。Coordinate descent法を利用して、i´=1,2,・・・,Iに関する非線形連立方程式を解くと、wを求めることができる。 Here, the auxiliary variable ¯w: = {¯w 1, ¯w 2, ···, ¯w}, γ 4 = {γ 1,1, ···, γ I, N} define the auxiliary Function
Figure 0005318042
It is defined as At this time,
Figure 0005318042
The establishment of the equality sign
Figure 0005318042
(54) satisfies the definition of the auxiliary function.
Differentiating equation (54) with respect to w i ′ and setting it to 0,
Figure 0005318042
Get. By solving the nonlinear simultaneous equations related to i ′ = 1, 2,..., Using the coordinate descent method, w can be obtained.

一方、f (w,u,β,γ)をu、βそれぞれに関して微分して0とおくと、

Figure 0005318042
を得る。これらの式を用いて、uとβを更新する。 On the other hand, when f 4 + (w, u, β, γ 4 ) is differentiated with respect to u and β, and set to 0,
Figure 0005318042
Get. Using these equations, u and β are updated.

以上の手法4に関する、EM法に基づくパラメータ学習アルゴリズムをまとめると、以下のようになる。
初期化:パラメータΘ={w,u,β}に初期値を与える。E−step:E[x|o;Θ´]、E[xx|o;Θ´]、 ̄w、γの更新。M−step:式(57)、(58)から、モデルパラメータΘ={w,u,β}の更新。収束判定:式(54)の補助関数の値が収束していなければ、Θ´=ΘとしてE−stepに戻る。
The parameter learning algorithm based on the EM method related to the above method 4 is summarized as follows.
Initialization: An initial value is given to the parameter Θ = {w, u, β}. E-step: E [x | o; Θ'], E [xx T | o; Θ'], ¯w, γ 4 of the update. M-step: Update of the model parameter Θ = {w, u, β} from the equations (57) and (58). Convergence determination: If the value of the auxiliary function of Expression (54) has not converged, return to E-step as Θ ′ = Θ.

<第1の実施形態>
次に、図3を参照して、本発明の第1の実施形態による信号解析装置の構成を説明する。図3は同実施形態の構成を示すブロック図である。図3に示すように、信号解析装置は、コンピュータ装置によって構成し、基本周波数抽出部1、セグメント分割部2、パラメータ初期値生成部3、信号分離部4、フィルタ特性パラメータ更新部5、入力信号パラメータ更新部6、残差信号パラメータ更新部7、パラメータ収束判定部8およびパラメータ出力部9を備える。フィルタ特性パラメータ更新部5と、入力信号パラメータ更新部6と、残差信号パラメータ更新部7は、モデルパラメータ更新部10を構成する。第1の実施形態は、前述した手法1を用いて信号解析を行う構成である。
<First Embodiment>
Next, the configuration of the signal analyzing apparatus according to the first embodiment of the present invention will be described with reference to FIG. FIG. 3 is a block diagram showing the configuration of the embodiment. As shown in FIG. 3, the signal analysis device is configured by a computer device, and includes a fundamental frequency extraction unit 1, a segment division unit 2, a parameter initial value generation unit 3, a signal separation unit 4, a filter characteristic parameter update unit 5, an input signal. A parameter update unit 6, a residual signal parameter update unit 7, a parameter convergence determination unit 8, and a parameter output unit 9 are provided. The filter characteristic parameter update unit 5, the input signal parameter update unit 6, and the residual signal parameter update unit 7 constitute a model parameter update unit 10. The first embodiment is configured to perform signal analysis using the method 1 described above.

基本周波数抽出部1は、入力される歌声音響信号から観測基本周波数時系列を抽出する。この処理は、周知技術により実現でき、例えば、文献:A de Cheveign´e and H. Kawahara, “YIN, a fundamental frequency estimator for speech and music," Journal of the Acoustical Society of America, vol.111, no.4, pp. 1917-1930, 2002で提案される基本周波数推定法YIN を利用して、歌声音響信号から5msごとに基本周波数を推定する。   The fundamental frequency extraction unit 1 extracts an observed fundamental frequency time series from the input singing voice acoustic signal. This processing can be realized by a well-known technique. For example, literature: A de Cheveign´e and H. Kawahara, “YIN, a fundamental frequency estimator for speech and music,” Journal of the Acoustical Society of America, vol.111, no .4, pp. 1917-1930, 2002, the fundamental frequency estimation method YIN is used to estimate the fundamental frequency from the singing voice signal every 5 ms.

セグメント分割部2は、推定された基本周波数系列をいくつかのセグメントに分割する。図4に示すように、各セグメントは、ある音高から別の音高へ立ち上がる瞬間を始点および終点とする。セグメントへの分割方法は手作業、もしくk−mean法、またはビタビアルゴリズムなどを利用する。分割されたセグメントo=[o,o,・・・,o(Nはセグメントにおける基本周波数系列の長さを表し、セグメントごとに変化する)
ごとにモデルパラメータを推定する。前処理として、セグメントの先頭の基本周波数値oを、セグメントのすべての基本周波数値から減算し正規化を行う。
The segment dividing unit 2 divides the estimated fundamental frequency sequence into several segments. As shown in FIG. 4, each segment has a start point and an end point at the moment when it rises from one pitch to another. As a method of dividing into segments, manual work, k-mean method, Viterbi algorithm or the like is used. Divided segment o = [o 1 , o 2 ,..., O N ] T (N represents the length of the fundamental frequency sequence in the segment and varies from segment to segment)
Model parameters are estimated every time. As preprocessing, normalization is performed by subtracting the fundamental frequency value o 1 at the beginning of the segment from all the fundamental frequency values of the segment.

パラメータ初期値生成部3は、モデルパラメータΘ={a,b,u,β}の初期値を決定する。a,bは、ζ=1.0,Ω=0.1のときに、式(5)より計算される、a=100,b=20を初期値とする。uは、観測信号oの要素の中央値を初期値とする。βは、β=100を初期値とする。これらはすべて実験的に決定する。また、αは、α=2に固定する。 The parameter initial value generation unit 3 determines an initial value of the model parameter Θ 1 = {a, b, u, β}. As for a and b, when ζ = 1.0 and Ω = 0.1, a = 100 and b = 20 calculated from the equation (5) are set as initial values. The initial value of u is the median value of the elements of the observation signal o. The initial value of β is β = 100. These are all determined experimentally. Α is fixed to α = 2.

信号分離部4では、ガウス過程の定義およびEMアルゴリズムに基づいて導出される出力信号と残差信号の期待値を信号分離基準として、観測信号を出力信号と残差信号に分離する。ここでは、現在のモデルパラメータΘ´={a,b,u,β}を利用して、式(28)、(29)を計算し、式(30)に基づいて、E[x|o;Θ´]とE[xx|o;Θ´]を ̄x, ̄xε,R,Rεに分割する。また、式(33)に基づいて、補助変数γも計算する。 The signal separation unit 4 separates the observation signal into the output signal and the residual signal using the output signal derived based on the definition of the Gaussian process and the expected value of the residual signal based on the EM algorithm as a signal separation reference. Here, equations (28) and (29) are calculated using the current model parameter Θ 1 ′ = {a, b, u, β}, and E [x | o based on equation (30). ; Θ 1 ′] and E [xx T | o; Θ 1 ′] are divided into  ̄x y ,  ̄x ε , R y , and R ε . Also, the auxiliary variable γ 1 is calculated based on the equation (33).

フィルタ特性パラメータ更新部5は、フィルタ特性パラメータであるa、bの値を更新する。式(5)から分かるように、aとbは共に正の値となる制約の下で、Coordinate descent法を適用して、式(36)と式(37)からなる連立方程式を解き、aとbを求める。まず、初期値としてa=0、b=0と設定する。そして、式(36)をaに関する方程式と見なして、

Figure 0005318042
を計算する。 The filter characteristic parameter updating unit 5 updates the values of a and b that are filter characteristic parameters. As can be seen from Equation (5), under the constraint that both a and b are positive values, the Coordinate descent method is applied to solve the simultaneous equations of Equation (36) and Equation (37), and a and b is obtained. First, as initial values, a = 0 and b = 0 are set. And, considering equation (36) as an equation for a,
Figure 0005318042
Calculate

次に、式(37)をbに関する方程式と見なして、

Figure 0005318042
を計算する。式(59)、(60)による更新を交互に繰り返し、aとbの値がそれぞれ変化しなくなるまで更新を続ける。 Next, considering equation (37) as an equation for b,
Figure 0005318042
Calculate Updates according to equations (59) and (60) are alternately repeated until the values of a and b no longer change.

入力信号パラメータ更新部6は、フィルタ特性パラメータ更新部5で更新されたa、bを利用して、式(16)のΨを計算し、式(38)に基づいて、入力信号パラメータuの値を更新する。   The input signal parameter update unit 6 calculates Ψ of Expression (16) using a and b updated by the filter characteristic parameter update unit 5, and based on Expression (38), the value of the input signal parameter u Update.

残差信号パラメータ更新部7は、式(38)に基づいて、残差信号パラメータβの値を更新する。   The residual signal parameter updating unit 7 updates the value of the residual signal parameter β based on Expression (38).

パラメータ収束判定部8は、信号分離部4で計算された ̄x,R,Rεおよび、モデルパラメータ更新部10によってそれぞれ更新されたモデルパラメータΘ={a,b,u,β}を利用して、式(31)の目的関数の値を計算する。更新前のモデルパラメータを用いて計算した式(31)の目的関数の値と更新後のモデルパラメータを用いて計算した式(31)の目的関数の値との誤差が、所定の閾値以下であれば、収束したと判定する。収束していればパラメータ出力部9は、モデルパラメータΘ={a,b,u,β}を出力した後に、次のセグメントにおけるモデルパラメータ推定に移行するため、セグメント分割部2の処理へ移行する。一方、収束しない場合は、Θ´=Θとして信号分離部4の処理に戻る。 The parameter convergence determination unit 8 includes  ̄x y , R y , R ε calculated by the signal separation unit 4 and the model parameter Θ 1 = {a, b, u, β} updated by the model parameter update unit 10, respectively. Is used to calculate the value of the objective function of equation (31). If an error between the value of the objective function of the equation (31) calculated using the model parameter before the update and the value of the objective function of the equation (31) calculated using the model parameter after the update is less than a predetermined threshold value If it is, it is determined that it has converged. If it has converged, the parameter output unit 9 outputs the model parameter Θ 1 = {a, b, u, β} and then proceeds to the process of the segment dividing unit 2 in order to proceed to model parameter estimation in the next segment. To do. On the other hand, when it does not converge, it returns to the processing of the signal separation unit 4 as Θ 1 ′ = Θ 1 .

なお、収束したか否かを判定する方法としては、目的関数を用いる方法以外に、モデルパラメータ各々の値を更新前と更新後とで比較しても良いし、予め定めた繰り返し回数に到達したか否かで判定を行っても良い。   In addition to the method using the objective function, as a method for determining whether or not the convergence has occurred, the values of the model parameters may be compared before and after the update, or a predetermined number of iterations has been reached. The determination may be made based on whether or not.

<第2の実施形態>
次に、本発明の第2の実施形態による信号解析装置の構成を説明する。第2の実施形態は、前述した手法2を用いて信号解析を行う構成である。第2の実施形態における信号解析装置の構成は、図3に示す構成と同様であり、基本周波数抽出部1及びセグメント分割部2の処理動作は、第1の実施形態と同じである。第2の実施形態は、その他の構成の処理動作が異なる。
<Second Embodiment>
Next, the configuration of the signal analyzing apparatus according to the second embodiment of the present invention will be described. The second embodiment is configured to perform signal analysis using the method 2 described above. The configuration of the signal analyzing apparatus in the second embodiment is the same as that shown in FIG. 3, and the processing operations of the fundamental frequency extracting unit 1 and the segment dividing unit 2 are the same as those in the first embodiment. The second embodiment differs in processing operations of other configurations.

パラメータ初期値生成部3は、モデルパラメータΘ={a,a,a,u,β}の初期値を決定する。a,a,aは、ζ=1.0,Ω=0.1のときに、式(9)より計算される、a=121,a=−220,a=100を初期値とする。uは、観測信号oの要素の中央値を初期値とする。βは、β=100を初期値とする。これらはすべて実験的に決定する。また、αは、α=2に固定する。 The parameter initial value generation unit 3 determines an initial value of the model parameter Θ 2 = {a 0 , a 1 , a 2 , u, β}. a 0 , a 1 , and a 2 are calculated from Equation (9) when ζ = 1.0 and Ω = 0.1, and a 0 = 121, a 1 = −220, and a 2 = 100. Use the initial value. The initial value of u is the median value of the elements of the observation signal o. The initial value of β is β = 100. These are all determined experimentally. Α is fixed to α = 2.

信号分離部4は、ガウス過程の定義およびEMアルゴリズムに基づいて導出される出力信号と残差信号の期待値を信号分離基準として、観測信号を出力信号と残差信号に分離する。現在のモデルパラメータΘ´={a,a,a,u,β}を利用して、式(28)、(29)を計算し、式(30)に基づいて、E[x|o;Θ´]とE[xx|o;Θ´]を ̄x, ̄xε,R,Rεに分割する。 The signal separation unit 4 separates the observation signal into the output signal and the residual signal using the output signal derived based on the definition of the Gaussian process and the expected value of the residual signal based on the EM algorithm as a signal separation reference. Equations (28) and (29) are calculated using the current model parameter Θ 2 ′ = {a 0 , a 1 , a 2 , u, β}, and E [x | O; Θ 2 ′] and E [xx T | o; Θ 2 ′] are divided into  ̄ xy ,  ̄ x ε , R y , and R ε .

フィルタ特性パラメータ更新部5は、フィルタ特性パラメータであるa,a,aの値を更新する。式(9)から分かるように、aとaは正の値、aは負の値となる制約の下で、Coordinate descent法を適用して、式(40)、(41)、(42)からなる連立方程式を解き、a,a,aを求める。まず、初期値としてa=0,a1=0,a=0と設定する。そして、式(40)をaに関する方程式と見なして、

Figure 0005318042
を計算する。 The filter characteristic parameter update unit 5 updates the values of a 0 , a 1 , and a 2 that are filter characteristic parameters. As can be seen from equation (9), the coordinate descent method is applied under the constraint that a 0 and a 2 are positive values and a 1 is a negative value, and equations (40), (41), ( 42) are solved to obtain a 0 , a 1 , and a 2 . First, as initial values, a 0 = 0, a1 = 0, and a 2 = 0 are set. And considering equation (40) as an equation for a 0 ,
Figure 0005318042
Calculate

次に、式(41)をaに関する方程式と見なして、

Figure 0005318042
を計算する。 Next, considering equation (41) as an equation for a 1 ,
Figure 0005318042
Calculate

次に、式(42)をaに関する方程式と見なして、

Figure 0005318042
を計算する。そして、式(61)、(62)、(63)による更新を順番に繰り返し、a,a,aの値がそれぞれ変化しなくなるまで更新を続ける。 Next, considering equation (42) as an equation for a 2 ,
Figure 0005318042
Calculate Then, the updating by the formulas (61), (62), and (63) is repeated in order, and the updating is continued until the values of a 0 , a 1 , and a 2 no longer change.

入力信号パラメータ更新部6は、フィルタ特性パラメータ更新部5で更新されたa,a,aを利用して、式(16)のΨを計算し、式(43)に基づいて、入力信号パラメータuの値を更新する。 The input signal parameter updating unit 6 calculates Ψ of Expression (16) using a 0 , a 1 , and a 2 updated by the filter characteristic parameter updating unit 5, and inputs based on Expression (43). Update the value of the signal parameter u.

残差信号パラメータ更新部7は、式(43)に基づいて、残差信号パラメータβの値を更新する。   The residual signal parameter update unit 7 updates the value of the residual signal parameter β based on the equation (43).

パラメータ収束判定部8は、信号分離部4で計算された ̄x,R,Rεおよび、モデルパラメータ更新部10によって更新されたモデルパラメータΘ={a,a,a,u,β}を利用して、式(39)の目的関数の値を計算する。その値が収束していれば、パラメータ出力部9は、モデルパラメータΘ={a,a,a,u,β}を出力し、次のセグメントにおけるモデルパラメータ推定に移行するため、セグメント分割部2の処理動作へ移行する。一方、収束しない場合は、Θ´=Θとして信号分離部4の処理動作に移行する。 The parameter convergence determination unit 8 includes  ̄ x y , R y , R ε calculated by the signal separation unit 4 and the model parameter Θ 2 = {a 0 , a 1 , a 2 , updated by the model parameter update unit 10. u, β} is used to calculate the value of the objective function of Equation (39). If the value has converged, the parameter output unit 9 outputs the model parameter Θ 2 = {a 0 , a 1 , a 2 , u, β}, and shifts to model parameter estimation in the next segment. The process proceeds to the processing operation of the segment division unit 2. On the other hand, when it does not converge, it shifts to the processing operation of the signal separation unit 4 as Θ 2 ′ = Θ 2 .

<第3の実施形態>
次に、本発明の第3の実施形態による信号解析装置の構成を説明する。第3の実施形態は、前述した手法3を用いて信号解析を行う構成である。第3の実施形態における信号解析装置の構成は、図3に示す構成と同様であり、基本周波数抽出部1及びセグメント分割部2の処理動作は、第1の実施形態と同じである。第3の実施形態は、その他の構成の処理動作が異なる。
<Third Embodiment>
Next, the configuration of the signal analyzing apparatus according to the third embodiment of the present invention will be described. The third embodiment is configured to perform signal analysis using the method 3 described above. The configuration of the signal analysis apparatus in the third embodiment is the same as that shown in FIG. 3, and the processing operations of the fundamental frequency extraction unit 1 and the segment division unit 2 are the same as those in the first embodiment. The third embodiment differs in processing operations of other configurations.

パラメータ初期値生成部3は、モデルパラメータΘ={w,u,β}の初期値を決定する。まず、{Υ(1),Υ(2),・・・,Υ(I)}を作成するために、ζは0から2までの間を0.02刻みで、Ωは0.05から0.3までの間を0.005刻みで変化させる。その結果、I=3100となる。w={w,w,・・・w}の初期値はすべて1/Iに設定する。uは、観測信号oの要素の中央値を初期値とする。βは、β=100を初期値とする。これらはすべて実験的に決定する。また、αは、α=2に固定する。 The parameter initial value generation unit 3 determines an initial value of the model parameter Θ 3 = {w, u, β}. First, in order to create {Υ (1) , Υ (2) ,..., Υ (I) }, ζ is from 0 to 2 in increments of 0.02, and Ω is 0.05 to 0. .3 is changed in increments of 0.005. As a result, I = 3100. The initial values of w = {w 1 , w 2 ,... w I } are all set to 1 / I. The initial value of u is the median value of the elements of the observation signal o. The initial value of β is β = 100. These are all determined experimentally. Α is fixed to α = 2.

信号分離部4は、ガウス過程の定義およびEMアルゴリズムに基づいて導出される出力信号と残差信号の期待値を信号分離基準として、観測信号を出力信号と残差信号に分離する。現在のモデルパラメータΘ´={w,u,β}を利用して、式(28)、(29)を計算し、式(30)に基づいて、E[x|o;Θ´]とE[xx|o;Θ´]を ̄x, ̄xε,R,Rεに分割する。また、式(48)に基づいて、補助変数γも計算する。 The signal separation unit 4 separates the observation signal into the output signal and the residual signal using the output signal derived based on the definition of the Gaussian process and the expected value of the residual signal based on the EM algorithm as a signal separation reference. Equations (28) and (29) are calculated using the current model parameter Θ 3 ′ = {w, u, β}, and E [x | o; Θ 3 ′] is calculated based on equation (30). And E [xx T | o; Θ 3 ′] are divided into  ̄ xy ,  ̄ x ε , R y , and R ε . Further, the auxiliary variable γ 3 is also calculated based on the equation (48).

フィルタ特性パラメータ更新部5は、フィルタ特性パラメータであるwの値を更新する。Coordinate descent法を利用して、式(49)のi´=1,2,・・・,Iに関する非線形連立方程式を解くと、wを求めることができる。まず、初期値として{w,w,・・・w}をすべて0に設定する。そして、式(49)をw1´に関する方程式と見なして、

Figure 0005318042
と変形する。i´=1,2,・・・,Iに関して、式(64)による更新を順番に繰り返し、w={w,w,・・・w}の値がそれぞれ変化しなくなるまで更新を続ける。 The filter characteristic parameter updating unit 5 updates the value of w that is a filter characteristic parameter. Using the coordinate descent method, w can be obtained by solving the nonlinear simultaneous equations related to i ′ = 1, 2,... First, {w 1 , w 2 ,... W I } are all set to 0 as initial values. And considering equation (49) as an equation for w 1 ′ ,
Figure 0005318042
And deformed. i'= 1, 2, · · ·, with respect to I, repeatedly updated according to formula (64) in turn, the update to w = {w 1, w 2 , ··· w I} is the value of does not change, respectively to continue.

入力信号パラメータ更新部6は、フィルタ特性パラメータ更新部5で更新されたwを利用して、式(16)のΨを計算し、式(50)に基づいて、入力信号パラメータuの値を更新する。   The input signal parameter updating unit 6 calculates Ψ of Expression (16) using w updated by the filter characteristic parameter updating unit 5, and updates the value of the input signal parameter u based on Expression (50). To do.

残差信号パラメータ更新部7は、式(50)に基づいて、残差信号パラメータβの値を更新する。   The residual signal parameter updating unit 7 updates the value of the residual signal parameter β based on Expression (50).

パラメータ収束判定部8は、信号分離部4で計算された ̄x,R,Rεおよび、モデルパラメータ更新部10によって更新されたモデルパラメータΘ={w,u,β}を利用して、式(44)の目的関数の値を計算する。その値が収束していれば、パラメータ出力部9は、モデルパラメータΘ={w,u,β}を出力し、次のセグメントにおけるモデルパラメータ推定に移行するため、セグメント分割部2の処理動作へ移行する。一方、収束しない場合は、Θ´=Θとして信号分離部4の処理動作に移行する。 The parameter convergence determination unit 8 uses  ̄x y , R y , R ε calculated by the signal separation unit 4 and the model parameter Θ 3 = {w, u, β} updated by the model parameter update unit 10. Thus, the value of the objective function of Expression (44) is calculated. If the value has converged, the parameter output unit 9 outputs the model parameter Θ 3 = {w, u, β} and proceeds to model parameter estimation in the next segment. Migrate to On the other hand, when it does not converge, it shifts to the processing operation of the signal separation unit 4 as Θ 3 ′ = Θ 3 .

<第4の実施形態>
次に、本発明の第4の実施形態による信号解析装置の構成を説明する。第4の実施形態は、前述した手法4を用いて信号解析を行う構成である。第4の実施形態における信号解析装置の構成は、図3に示す構成と同様であり、基本周波数抽出部1及びセグメント分割部2の処理動作は、第1の実施形態と同じである。第4の実施形態は、その他の構成の処理動作が異なる。
<Fourth Embodiment>
Next, the configuration of the signal analyzing apparatus according to the fourth embodiment of the present invention will be described. The fourth embodiment is configured to perform signal analysis using the method 4 described above. The configuration of the signal analyzing apparatus in the fourth embodiment is the same as that shown in FIG. 3, and the processing operations of the fundamental frequency extracting unit 1 and the segment dividing unit 2 are the same as those in the first embodiment. The fourth embodiment differs in processing operations of other configurations.

パラメータ初期値生成部3は、モデルパラメータをΘ={w,u,β}とする以外は第3の実施形態と同じである。 The parameter initial value generation unit 3 is the same as that of the third embodiment except that the model parameter is Θ 4 = {w, u, β}.

信号分離部4は、ガウス過程の定義およびEMアルゴリズムに基づいて導出される出力信号と残差信号の期待値を信号分離基準として、観測信号を出力信号と残差信号に分離する。現在のモデルパラメータΘ´={w,u,β}を利用して、式(28)、(29)を計算し、式(30)に基づいて、E[x|o;Θ´]とE[xx|o;Θ´]を ̄x, ̄xε,R,Rεに分割する。また、式(56)に基づいて、補助変数γも計算する。 The signal separation unit 4 separates the observation signal into the output signal and the residual signal using the output signal derived based on the definition of the Gaussian process and the expected value of the residual signal based on the EM algorithm as a signal separation reference. Using the current model parameter Θ 4 ′ = {w, u, β}, equations (28) and (29) are calculated, and E [x | o; Θ 4 ′] is calculated based on equation (30). And E [xx T | o; Θ 4 ′] are divided into  ̄ xy ,  ̄ x ε , R y , and R ε . Also, the auxiliary variable γ 4 is calculated based on the equation (56).

フィルタ特性パラメータ更新部5は、フィルタ特性パラメータであるwの値を更新する。Coordinate descent法を利用して、式(57)のi´=1,2,・・・,Iに関する非線形連立方程式を解くと、wを求めることができる。まず、初期値として{w,w,・・・w}をすべて0に設定する。そして、式(57)をw1´に関する方程式と見なして、

Figure 0005318042
と変形する。i´=1,2,・・・,Iに関して、式(65)による更新を順番に繰り返し、w={w,w,・・・w}の値がそれぞれ変化しなくなるまで更新を続ける。 The filter characteristic parameter updating unit 5 updates the value of w that is a filter characteristic parameter. Using the coordinate descent method, w can be obtained by solving the nonlinear simultaneous equations related to i ′ = 1, 2,... First, {w 1 , w 2 ,... W I } are all set to 0 as initial values. Then, considering equation (57) as an equation for w 1 ′ ,
Figure 0005318042
And deformed. i'= 1, 2, · · ·, with respect to I, repeatedly updated according to formula (65) in turn, the update to w = {w 1, w 2 , ··· w I} is the value of does not change, respectively to continue.

入力信号パラメータ更新部6は、フィルタ特性パラメータ更新部5で更新されたwを利用して、式(16)のΨを計算し、式(58)に基づいて、入力信号パラメータuの値を更新する。   The input signal parameter updating unit 6 calculates Ψ of Expression (16) using w updated by the filter characteristic parameter updating unit 5, and updates the value of the input signal parameter u based on Expression (58). To do.

残差信号パラメータ更新部7は、式(58)に基づいて、残差信号パラメータβの値を更新する。   The residual signal parameter updating unit 7 updates the value of the residual signal parameter β based on Expression (58).

パラメータ収束判定部8は、前記信号分離部で計算され ̄x,R,Rεおよび、モデルパラメータ更新部10によって更新されたモデルパラメータΘ={w,u,β}を利用して、式(51)の目的関数の値を計算する。その値が収束していれば、パラメータ出力部9は、モデルパラメータΘ={w,u,β}を出力し、次のセグメントにおけるモデルパラメータ推定に移行するため、セグメント分割部2の処理動作へ移行する。一方、収束しない場合は、Θ´=Θとして信号分離部4の処理動作に移行する。 The parameter convergence determination unit 8 uses  ̄ xy , R y , R ε calculated by the signal separation unit and the model parameter Θ 4 = {w, u, β} updated by the model parameter update unit 10. The value of the objective function of equation (51) is calculated. If the value has converged, the parameter output unit 9 outputs the model parameter Θ 4 = {w, u, β} and proceeds to model parameter estimation in the next segment. Migrate to On the other hand, when it does not converge, it shifts to the processing operation of the signal separation unit 4 as Θ 4 ′ = Θ 4 .

<第5の実施形態>
次に、図5を参照して、本発明の第5の実施形態による信号解析装置の構成を説明する。第4の実施形態は、前述した手法1〜4を使用して、通常の音声信号(話声、歌声を含む)の信号解析を行う構成である。第5の実施形態における信号解析装置の構成は、図3に示す基本周波数抽出部1に代えてメルケプストラム係数抽出部11を備えた点が、第1〜4の実施形態と異なる。第5の実施形態における信号解析装置は、音声信号から抽出されるメル周波数ケプストラム係数(MFCC)の時系列を、歌声の基本周波数系列と同様に、階段状の入力信号にフィルタが畳み込まれたものと見なし、観測MFCC信号から、音素列を表す入力信号とフィルタ特性の分離特徴抽出を行う。
<Fifth Embodiment>
Next, the configuration of a signal analyzing apparatus according to the fifth embodiment of the present invention will be described with reference to FIG. The fourth embodiment is configured to perform signal analysis of normal voice signals (including speech and singing voices) using the methods 1 to 4 described above. The configuration of the signal analyzing apparatus in the fifth embodiment differs from the first to fourth embodiments in that a mel cepstrum coefficient extracting unit 11 is provided instead of the fundamental frequency extracting unit 1 shown in FIG. In the signal analysis device according to the fifth embodiment, a time series of mel frequency cepstrum coefficients (MFCC) extracted from an audio signal is convoluted with a step-like input signal in the same manner as a basic frequency sequence of singing voices. It is assumed that the input signal representing the phoneme string and the filter characteristic are separated from the observed MFCC signal.

メルケプストラム係数抽出部11は、音声信号を周波数分析し、メルケプストラム係数(通常は12次元程度のベクトル)の時系列を抽出する。第5の実施形態における信号解析装置は、MFCCベクトルの各要素の時系列信号ごとに解析処理を行うものである。   The mel cepstrum coefficient extraction unit 11 performs frequency analysis on the audio signal and extracts a time series of mel cepstrum coefficients (usually a vector of about 12 dimensions). The signal analysis apparatus according to the fifth embodiment performs an analysis process for each time-series signal of each element of the MFCC vector.

セグメント分割部2、パラメータ初期値生成部3、信号分離部4、フィルタ特性パラメータ更新部5、入力信号パラメータ更新部6、残差信号パラメータ更新部7、パラメータ収束判定部8およびパラメータ出力部9の処理動作は、前述した第1〜第4の実施形態のいずれかに基づくものとする。   Segment dividing unit 2, parameter initial value generating unit 3, signal separating unit 4, filter characteristic parameter updating unit 5, input signal parameter updating unit 6, residual signal parameter updating unit 7, parameter convergence determination unit 8 and parameter output unit 9 The processing operation is based on any one of the first to fourth embodiments described above.

<実験結果>
次に、本発明の効果および作用を示すため、本発明の実施形態による信号解析装置を用いた実験結果を以下に説明する。ここでは、上記第1の実施形態、第2の実施形態、第4の実施形態および非特許文献4の従来法を実装して、基本周波数系列の入力ステップ信号(音高目標値系列)とフィルタ特性を表すインパルス応答信号(歌唱動的変動成分)への分解性能を評価する。
<Experimental result>
Next, in order to show the effects and operations of the present invention, the results of experiments using the signal analysis apparatus according to the embodiment of the present invention will be described below. Here, the conventional method of the first embodiment, the second embodiment, the fourth embodiment and the non-patent document 4 is implemented, and the input step signal (pitch target value sequence) and filter of the fundamental frequency sequence are implemented. The decomposition performance into an impulse response signal (singing dynamic variation component) representing the characteristic is evaluated.

1つ目の評価実験では、本発明が局所最小化問題を解決できているかを確認する。まず、パラメータuをランダムに100個決定し、式(18)に基づいて、100個の入力ステップ信号を人工的に作成する。ここでは、N=300、α=2とした。同様に、ζとΩをそれぞれ100個ランダムに決定し、式(12)に基づいて、100個のインパルス応答信号を人工的に作成する。これらの人工的な信号と式(22)に基づいて、100個の観測信号を人工的に作成する。ここでは、β=100とした。本実験では、これらの観測信号ごとにモデルパラメータを推定する。   In the first evaluation experiment, it is confirmed whether the present invention can solve the local minimization problem. First, 100 parameters u are randomly determined, and 100 input step signals are artificially created based on Expression (18). Here, N = 300 and α = 2. Similarly, 100 ζ and Ω are respectively determined at random, and 100 impulse response signals are artificially created based on Expression (12). Based on these artificial signals and equation (22), 100 observation signals are artificially created. Here, β = 100. In this experiment, model parameters are estimated for each of these observation signals.

評価尺度として、観測信号ごとに、
(1)推定されたモデルパラメータuと、観測信号の作成のためにランダムに決定されたuとの二乗誤差
(2)推定されたモデルパラメータによって構成される系のインパルス応答信号と、観測信号の作成のためにランダムに決定されたζとΩに基づくインパルス応答信号の二乗平均平方根誤差(RootMean Square Error,RMSE)
を計算する。どちらも誤差が小さくなれば、観測信号の入力ステップ信号とインパルス応答信号への分解性能が高い(局所最小化問題を回避できている)と言える。表1はそれぞれの誤差の平均値を示し、最も誤差が小さくなったのは、第4の実施形態よる信号解析装置であった。
As an evaluation scale, for each observed signal,
(1) A square error between the estimated model parameter u and u determined at random for creating the observation signal. (2) An impulse response signal of the system constituted by the estimated model parameter, Root Mean Square Error (RMSE) of impulse response signal based on ζ and Ω determined randomly for creation
Calculate In both cases, if the error is small, it can be said that the resolution performance of the observation signal into the input step signal and the impulse response signal is high (a local minimization problem can be avoided). Table 1 shows the average values of the respective errors, and the signal analysis apparatus according to the fourth embodiment has the smallest error.

Figure 0005318042
Figure 0005318042

2つ目の評価実験では、歌声音響信号から抽出される実際の基本周波数系列を利用してパラメータ学習アルゴリズムの収束性能を評価する。歌声データベースとして、クラシックの声楽家、ポップス歌手、音楽的な訓練を受けていない素人(それぞれ男女1名ずつの計6名)の歌声からなるデータベースを利用した。歌唱者は、伴奏なしで歌唱曲を歌唱した。歌唱曲は、「きらきら星」、「喜びの歌(Beethovenの交響曲第9番第4楽章の歌の部分を岩佐東一郎氏によって作詞されたもの)」である。日本語歌詞による歌唱(2パターンの歌詞)、ハミングによる歌唱を収録した。基本周波数は、前述したYINを利用して、5msごとに推定される。なお、Hzで表される周波数oHzを、次のようにcentで表される対数スケールの周波数ocentに変換する。

Figure 0005318042
In the second evaluation experiment, the convergence performance of the parameter learning algorithm is evaluated using an actual fundamental frequency sequence extracted from the singing voice acoustic signal. As a singing voice database, a database consisting of singing voices of classical vocalists, pop singers, and amateurs who have not been trained in music (one male and one female each) was used. The singer sang the song without accompaniment. The songs are “Kirakira Hoshi” and “Song of Joy” (the song part of Beethoven's 9th 4th movement was written by Toichiro Iwasa). Singing with Japanese lyrics (two patterns of lyrics) and singing with Hamming. The fundamental frequency is estimated every 5 ms using the YIN described above. The frequency o Hz expressed in Hz is converted into a logarithmic scale frequency o cent expressed as cent as follows.
Figure 0005318042

この変換により、半音は100centに相当する。次に、図4に示すように、推定された基本周波数系列を手動でセグメントに分割する。その結果、セグメントの総数は1323となった。セグメントごとにモデルパラメータを推定する。評価尺度として、セグメントごとに、観測信号oと、推定されたモデルパラメータによって再合成される信号μ(式(23)を参照)との二乗平均平方根誤差(RMSE)を計算した。そのRMSEの平均値を表1の右部分に示す。この評価実験においても第4の実施形態よる信号解析装置が最も小さい誤差となった。   By this conversion, a semitone corresponds to 100 cent. Next, as shown in FIG. 4, the estimated fundamental frequency sequence is manually divided into segments. As a result, the total number of segments was 1323. Estimate model parameters for each segment. As an evaluation measure, for each segment, the root mean square error (RMSE) between the observed signal o and the signal μ (see equation (23)) recombined with the estimated model parameters was calculated. The average value of the RMSE is shown in the right part of Table 1. Also in this evaluation experiment, the signal analysis apparatus according to the fourth embodiment has the smallest error.

図6は、観測信号と、第4の実施形態のモデルパラメータによって再合成される信号μを示す。観測信号を見ると、各セグメントには、音高の立ち上がりに関する動特性、音高が安定するときに振動するビブラートのような動特性が複雑に重ね合わさっていることがわかる。本発明は、EM法を利用して、それぞれを分離する手段を持つため、従来法に比べてパラメータの推定性能が向上した。特に、第4の実施形態の信号解析装置は、様々な振動基底の線形和で2次系のフィルタ特性を表現し、さらにその重みパラメータにスパースな制約を持たせているため、他の実施形態に比べて、観測信号へのオーバーフィッティングの問題を解消し、誤差が最も小さくなっている。   FIG. 6 shows the observed signal and the signal μ recombined with the model parameters of the fourth embodiment. Looking at the observed signal, it can be seen that each segment has a complex overlap of dynamic characteristics related to the rise of the pitch and dynamic characteristics such as vibrato that vibrate when the pitch stabilizes. Since the present invention has means for separating each using the EM method, the parameter estimation performance is improved as compared with the conventional method. In particular, the signal analysis apparatus according to the fourth embodiment expresses the filter characteristics of the second-order system with linear sums of various vibration bases, and further has sparse restrictions on the weight parameters. Compared with, the problem of overfitting to the observed signal is solved and the error is minimized.

図7は、第4の実施形態よる信号解析装置によって推定されたζとΩの歌唱者ごとの平均値を示したものである。各セグメントで推定されるwの要素の最も大きい値wに着目し、それに対応するζとΩのすべてのセグメントにわたる平均値を歌唱者ごとに計算した。ζが小さな値であることは、その振動現象がオーバーシュートのような減衰振動であることを意味する。一方で、Ωが小さな値であることは、音高の立ち上がり時間が長いことを意味する。したがって、素人歌唱者は歌唱技術が乏しいため、ζとΩの値が他の歌唱者に比べて、ともに小さい値になった。図8は、第4の実施形態よる信号解析装置によって推定されたuの歌唱者ごとの頻度分布を示す。声楽家やポップス歌手に関しては、半音(100cent)の整数倍の位置に分布のピークが観測される。一方で、素人歌唱者に関しては、そのピークが不鮮明となっている。これも素人歌唱者は歌唱技術が乏しいため、正しい音階(正確な半音単位)で歌唱することが難しいことを意味する。 FIG. 7 shows the average values for each singer of ζ and Ω estimated by the signal analyzing apparatus according to the fourth embodiment. Paying attention to the largest value w i of the element of w estimated in each segment, the average value over all segments of ζ and Ω corresponding thereto was calculated for each singer. A small value of ζ means that the vibration phenomenon is a damped vibration such as an overshoot. On the other hand, a small value of Ω means that the pitch rise time is long. Therefore, since amateur singers have poor singing skills, the values of ζ and Ω are both smaller than those of other singers. FIG. 8 shows the frequency distribution of each u singer estimated by the signal analyzing apparatus according to the fourth embodiment. For vocalists and pop singers, a distribution peak is observed at a position that is an integral multiple of a semitone (100 cent). On the other hand, for amateur singers, the peak is unclear. This also means that it is difficult for amateur singers to sing with the correct scale (accurate semitones) because of their poor singing skills.

このように、観測信号は、入力ステップ信号とフィルタ特性を表すインパルス応答信号との畳みこみによって得られる系の出力信号と、残差信号との和で構成されるものとし、基本周波数系列の場合は、音が立ち上がる(音高が変化する)時点を始点終点として、それによって分割されるセグメントごとに信号の生成過程とする。また、観測信号には、様々な動特性が混在するため、ガウス過程(ベイジアンアプローチ)の観点から信号の生成過程をモデル化し、観測信号の、出力信号と残差信号への分離過程を適用する。そして、分離された出力信号に基づいて、入力信号パラメータやフィルタ特性パラメータを推定する。一方で、分離された残差信号に基づいて、残差信号パラメータを推定する。この推定の流れを何度も繰り返すことにより、最終的にモデルパラメータを精度よく推定することができる。   Thus, the observed signal is composed of the sum of the output signal of the system obtained by convolution of the input step signal and the impulse response signal representing the filter characteristics, and the residual signal. Is a process of generating a signal for each segment divided by the time when the sound rises (the pitch changes) as the start point and the end point. In addition, since various dynamic characteristics exist in the observed signal, the signal generation process is modeled from the viewpoint of a Gaussian process (Bayesian approach), and the process of separating the observed signal into an output signal and a residual signal is applied. . Then, the input signal parameter and the filter characteristic parameter are estimated based on the separated output signal. On the other hand, a residual signal parameter is estimated based on the separated residual signal. By repeating this estimation flow many times, the model parameter can be estimated with accuracy.

以上説明したように、入力信号をステップ信号と仮定し、また、系のフィルタ特性が線形2次系に従うことを仮定して、観測される時系列信号から、信号生成系の入力信号およびフィルタ特性(インパルス応答信号)、残差信号を推定するようにしたため、歌声の基本周波数(F0)系列から、歌唱者が歌おうとする音高目標値系列とビブラートやオーバーシュートのような歌唱動的変動成分の特徴抽出を行うことができる。   As described above, assuming that the input signal is a step signal and assuming that the filter characteristic of the system follows a linear quadratic system, the input signal and filter characteristic of the signal generation system can be obtained from the observed time series signal. (Impulse response signal), because the residual signal is estimated, from the fundamental frequency (F0) sequence of the singing voice, the pitch target value sequence that the singer wants to sing, and singing dynamic fluctuation components such as vibrato and overshoot Feature extraction can be performed.

なお、図3、図5における各処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより信号解析処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。   3 and 5 are recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed. Signal analysis processing may be performed. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer system” includes a WWW system having a homepage providing environment (or display environment). The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。   The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, what is called a difference file (difference program) may be sufficient.

時系列信号の動特性特徴を抽出することによって、信号解析を行うことが不可欠な用途に適用できる。   By extracting the dynamic characteristic features of time series signals, it can be applied to applications where signal analysis is indispensable.

1・・・基本周波数抽出部、2・・・セグメント分割部、3・・・パラメータ初期値生成部、4・・・信号分離部、5・・・フィルタ特性パラメータ更新部、6・・・入力信号パラメータ更新部、7・・・残差信号パラメータ更新部、8・・・パラメータ収束判定部、9・・・パラメータ出力部、10・・・モデルパラメータ更新部、11・・・メルケプストラム係数抽出部   DESCRIPTION OF SYMBOLS 1 ... Fundamental frequency extraction part, 2 ... Segment division part, 3 ... Parameter initial value generation part, 4 ... Signal separation part, 5 ... Filter characteristic parameter update part, 6 ... Input Signal parameter update unit, 7 ... residual signal parameter update unit, 8 ... parameter convergence determination unit, 9 ... parameter output unit, 10 ... model parameter update unit, 11 ... mel cepstrum coefficient extraction Part

Claims (11)

観測信号を、入力信号とフィルタ特性を表すインパルス応答信号との畳みこみによって得られる信号生成系の出力信号と残差信号との和で表し、前記観測信号から、前記入力信号を表すモデルを構成する入力信号パラメータと、前記フィルタ特性を表すモデルを構成するフィルタ特性パラメータと、前記残差信号を表すモデルを構成する残差信号パラメータとを推定することにより時系列信号の動特性特徴を抽出する信号解析装置であって、
前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成部と、
前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離部と、
前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新部と、
前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離部と前記モデルパラメータ更新部による処理を再度行わせるパラメータ収束判定部と、
前記パラメータ収束判定部により前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力部と、
を備えることを特徴とする信号解析装置。
The observed signal is represented by the sum of the output signal and residual signal of the signal generation system obtained by convolution of the input signal and the impulse response signal representing the filter characteristics, and a model representing the input signal is constructed from the observed signal A dynamic characteristic feature of a time-series signal is extracted by estimating an input signal parameter to be processed, a filter characteristic parameter constituting a model representing the filter characteristic, and a residual signal parameter constituting a model representing the residual signal A signal analyzer,
A parameter initial value generating unit that generates initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal;
A set of the filter characteristic parameter, the input signal parameter, and the residual signal parameter is used as a model parameter, and the observation signal is defined by the input signal parameter and the filter characteristic parameter using the model parameter. A signal separation unit for separating the output signal of the generation system and the residual signal configured by the residual signal parameters;
A function obtained by adding the prior probability of the model parameter to the conditional expected value of the log likelihood function when the observed signal, the model parameter, and the set of the output signal and the residual signal are given A model parameter updating unit that updates the model parameter so as to maximize the objective function with respect to the model parameter,
It is determined whether or not the model parameter satisfies a predetermined criterion, and when it is determined that the predetermined parameter is not satisfied, processing by the signal separation unit and the model parameter update unit is performed until the predetermined criterion is satisfied. A parameter convergence determination unit to be performed again;
A parameter output unit that outputs the model parameter when the parameter convergence determination unit determines that the model parameter satisfies a predetermined criterion;
A signal analyzing apparatus comprising:
前記入力信号はステップ信号であり、
前記出力信号は多次元ガウス分布に従うものとして確率的にモデル化され、
前記残差信号は、ガウス性白色雑音として確率的にモデル化される
ことを特徴とする請求項1記載の信号解析装置。
The input signal is a step signal;
The output signal is stochastically modeled as following a multidimensional Gaussian distribution;
The signal analysis apparatus according to claim 1, wherein the residual signal is probabilistically modeled as Gaussian white noise.
前記信号生成系のフィルタ特性は、差分法によって導出されるフィルタで表され、
前記フィルタ特性パラメータは、前記固有周波数の二乗に反比例するパラメータと、前記減衰率に比例し前記固有周波数に反比例するパラメータとである
ことを特徴とする請求項2記載の信号解析装置。
The filter characteristic of the signal generation system is represented by a filter derived by a difference method,
The signal analysis apparatus according to claim 2, wherein the filter characteristic parameters are a parameter that is inversely proportional to the square of the natural frequency and a parameter that is proportional to the attenuation factor and inversely proportional to the natural frequency.
前記信号生成系のフィルタ特性は、自己回帰過程に基づいて構成されるフィルタで表され、前記フィルタ特性パラメータは、自己回帰パラメータであることを特徴とする請求項2記載の信号解析装置。   The signal analysis apparatus according to claim 2, wherein the filter characteristic of the signal generation system is represented by a filter configured based on an autoregressive process, and the filter characteristic parameter is an autoregressive parameter. 前記信号生成系のフィルタ特性は、複数の2次系フィルタの重み付き線形和によって構成されるフィルタで表され、前記フィルタ特性パラメータは、前記各2次系フィルタの重みであることを特徴とする請求項2記載の信号解析装置。   The filter characteristic of the signal generation system is represented by a filter constituted by a weighted linear sum of a plurality of secondary system filters, and the filter characteristic parameter is a weight of each secondary system filter. The signal analysis apparatus according to claim 2. 前記モデルパラメータ更新部は、
補助変数から構成される前記目的関数の補助関数を、前記固有周波数の二乗に反比例するパラメータと前記補助関数を前記減衰率に比例し前記固有周波数に反比例するパラメータとでそれぞれ微分して得られる方程式からなる連立方程式をフィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、
前記補助関数を、前記入力信号パラメータで微分して得られる方程式を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、
前記補助関数を、前記残差信号パラメータで微分して得られる方程式を解くことにより、残差信号パラメータを更新する残差信号パラメータとから構成されることを特徴とする請求項3記載の信号解析装置。
The model parameter update unit
Equations obtained by differentiating the auxiliary function of the objective function composed of auxiliary variables with a parameter inversely proportional to the square of the natural frequency and a parameter proportional to the attenuation rate and inversely proportional to the natural frequency. A filter characteristic parameter updating unit that updates the value of the filter characteristic parameter by solving the simultaneous equation consisting of
An input signal parameter updating unit for updating the input signal parameter by solving an equation obtained by differentiating the auxiliary function with the input signal parameter;
4. The signal analysis according to claim 3, further comprising a residual signal parameter for updating the residual signal parameter by solving an equation obtained by differentiating the auxiliary function with the residual signal parameter. apparatus.
前記モデルパラメータ更新部は、
前記目的関数を、前記フィルタ特性パラメータに含まれる各自己回帰パラメータでそれぞれ微分して得られる方程式からなる連立方程式をフィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、
前記目的関数を、前記入力信号パラメータで微分して得られる方程式を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、
前記目的関数を、前記残差信号パラメータで微分して得られる方程式を解くことにより、残差信号パラメータを更新する残差信号パラメータとから構成されることを特徴とする請求項4記載の信号解析装置。
The model parameter update unit
A filter characteristic parameter updating unit that updates the value of the filter characteristic parameter by solving for the filter characteristic parameter a simultaneous equation consisting of equations obtained by differentiating the objective function with each autoregressive parameter included in the filter characteristic parameter. When,
An input signal parameter update unit for updating the input signal parameter by solving an equation obtained by differentiating the objective function with the input signal parameter;
5. The signal analysis according to claim 4, further comprising a residual signal parameter for updating the residual signal parameter by solving an equation obtained by differentiating the objective function with the residual signal parameter. apparatus.
前記モデルパラメータ更新部は、
補助変数から構成される前記目的関数の補助関数を、前記フィルタ特性パラメータである各2次系フィルタの重みでそれぞれ微分して得られる方程式からなる非線形連立方程式を、フィルタ特性パラメータについて解くことにより、フィルタ特性パラメータの値を更新するフィルタ特性パラメータ更新部と、
前記補助関数を、前記入力信号パラメータで微分して得られる方程式を解くことにより、入力信号パラメータを更新する入力信号パラメータ更新部と、
前記補助関数を、前記残差信号パラメータで微分して得られる方程式を解くことにより、残差信号パラメータを更新する残差信号パラメータとから構成されることを特徴とする請求項5記載の信号解析装置。
The model parameter update unit
By solving a nonlinear simultaneous equation consisting of equations obtained by differentiating the auxiliary function of the objective function composed of auxiliary variables by the weights of the respective second-order filters, which are the filter characteristic parameters, with respect to the filter characteristic parameters, A filter characteristic parameter update unit for updating the value of the filter characteristic parameter;
An input signal parameter updating unit for updating the input signal parameter by solving an equation obtained by differentiating the auxiliary function with the input signal parameter;
6. The signal analysis according to claim 5, further comprising: a residual signal parameter for updating the residual signal parameter by solving an equation obtained by differentiating the auxiliary function with the residual signal parameter. apparatus.
前記信号分離部は、前記観測信号と前記モデルパラメータが与えられた時の前記出力信号および前記残差信号から構成される完全データの期待値と、前記完全データの自己相関とを用いて、前記観測信号を出力信号と残差信号とに分離することを特徴とする請求項2から8のいずれかに記載の信号解析装置。   The signal separation unit uses the expected value of complete data composed of the output signal and the residual signal when the observation signal and the model parameter are given, and the autocorrelation of the complete data, 9. The signal analyzing apparatus according to claim 2, wherein the observation signal is separated into an output signal and a residual signal. 観測信号を、入力信号とフィルタ特性を表すインパルス応答信号との畳みこみによって得られる信号生成系の出力信号と残差信号との和で表し、前記観測信号から、前記入力信号を表すモデルを構成する入力信号パラメータと、前記フィルタ特性を表すモデルを構成するフィルタ特性パラメータと、前記残差信号を表すモデルを構成する残差信号パラメータとを推定することにより時系列信号の動特性特徴を抽出する信号解析装置における信号解析方法であって、
前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成ステップと、
前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離ステップと、
前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新ステップと、
前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離ステップと前記モデルパラメータ更新ステップによる処理を再度行わせるパラメータ収束判定ステップと、
前記パラメータ収束判定ステップにより前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力ステップと、
を有することを特徴とする信号解析方法。
The observed signal is represented by the sum of the output signal and residual signal of the signal generation system obtained by convolution of the input signal and the impulse response signal representing the filter characteristics, and a model representing the input signal is constructed from the observed signal A dynamic characteristic feature of a time-series signal is extracted by estimating an input signal parameter to be processed, a filter characteristic parameter constituting a model representing the filter characteristic, and a residual signal parameter constituting a model representing the residual signal A signal analysis method in a signal analyzer,
A parameter initial value generating step of generating initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal;
A set of the filter characteristic parameter, the input signal parameter, and the residual signal parameter is used as a model parameter, and the observation signal is defined by the input signal parameter and the filter characteristic parameter using the model parameter. A signal separation step of separating the output signal of the generation system and the residual signal constituted by the residual signal parameters;
A function obtained by adding the prior probability of the model parameter to the conditional expected value of the log likelihood function when the observed signal, the model parameter, and the set of the output signal and the residual signal are given A model parameter update step for updating the model parameter so as to maximize the objective function with respect to the model parameter,
It is determined whether or not the model parameter satisfies a predetermined criterion, and when it is determined that the model parameter does not satisfy the predetermined criterion, processing by the signal separation step and the model parameter update step is performed until the predetermined criterion is satisfied. A parameter convergence determination step to be performed again;
A parameter output step for outputting the model parameter when the model parameter is determined to satisfy a predetermined criterion by the parameter convergence determination step;
A signal analysis method characterized by comprising:
観測信号を、入力信号とフィルタ特性を表すインパルス応答信号との畳みこみによって得られる信号生成系の出力信号と残差信号との和で表し、前記観測信号から、前記入力信号を表すモデルを構成する入力信号パラメータと、前記フィルタ特性を表すモデルを構成するフィルタ特性パラメータと、前記残差信号を表すモデルを構成する残差信号パラメータとを推定することにより時系列信号の動特性特徴を抽出する信号解析装置上のコンピュータに信号解析を行わせる信号解析プログラムであって、
前記観測信号から前記入力信号パラメータと前記フィルタ特性パラメータと前記残差信号パラメータの初期値を生成するパラメータ初期値生成ステップと、
前記フィルタ特性パラメータと前記入力信号パラメータと前記残差信号パラメータとの組をモデルパラメータとし、前記モデルパラメータを用いて、前記観測信号を、前記入力信号パラメータと前記フィルタ特性パラメータによって構成される前記信号生成系の出力信号と前記残差信号パラメータによって構成される前記残差信号とに分離する信号分離ステップと、
前記観測信号と、前記モデルパラメータと、前記出力信号および前記残差信号の組とが与えられたときの対数尤度関数の条件付き期待値に前記モデルパラメータの事前確率を足し合わせて得られる関数を目的関数として、当該目的関数を前記モデルパラメータに関して最大化するように前記モデルパラメータを更新するモデルパラメータ更新ステップと、
前記モデルパラメータが所定の基準を満たしているか否かを判定し、所定の基準を満たしていないと判定された場合に所定の基準を満たすまで、前記信号分離ステップと前記モデルパラメータ更新ステップによる処理を再度行わせるパラメータ収束判定ステップと、
前記パラメータ収束判定ステップにより前記モデルパラメータが所定の規準を満たすと判定された場合に、当該モデルパラメータを出力するパラメータ出力ステップと、
を前記コンピュータに行わせることを特徴とする信号解析プログラム。
The observed signal is represented by the sum of the output signal and residual signal of the signal generation system obtained by convolution of the input signal and the impulse response signal representing the filter characteristics, and a model representing the input signal is constructed from the observed signal A dynamic characteristic feature of a time-series signal is extracted by estimating an input signal parameter to be processed, a filter characteristic parameter constituting a model representing the filter characteristic, and a residual signal parameter constituting a model representing the residual signal A signal analysis program for causing a computer on a signal analyzer to perform signal analysis,
A parameter initial value generating step of generating initial values of the input signal parameter, the filter characteristic parameter, and the residual signal parameter from the observed signal;
A set of the filter characteristic parameter, the input signal parameter, and the residual signal parameter is used as a model parameter, and the observation signal is defined by the input signal parameter and the filter characteristic parameter using the model parameter. A signal separation step of separating the output signal of the generation system and the residual signal constituted by the residual signal parameters;
A function obtained by adding the prior probability of the model parameter to the conditional expected value of the log likelihood function when the observed signal, the model parameter, and the set of the output signal and the residual signal are given A model parameter update step for updating the model parameter so as to maximize the objective function with respect to the model parameter,
It is determined whether or not the model parameter satisfies a predetermined criterion, and when it is determined that the model parameter does not satisfy the predetermined criterion, processing by the signal separation step and the model parameter update step is performed until the predetermined criterion is satisfied. A parameter convergence determination step to be performed again;
A parameter output step for outputting the model parameter when the model parameter is determined to satisfy a predetermined criterion by the parameter convergence determination step;
A signal analysis program for causing the computer to execute
JP2010159604A 2010-07-14 2010-07-14 Signal analysis apparatus, signal analysis method, and signal analysis program Active JP5318042B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010159604A JP5318042B2 (en) 2010-07-14 2010-07-14 Signal analysis apparatus, signal analysis method, and signal analysis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010159604A JP5318042B2 (en) 2010-07-14 2010-07-14 Signal analysis apparatus, signal analysis method, and signal analysis program

Publications (2)

Publication Number Publication Date
JP2012022128A JP2012022128A (en) 2012-02-02
JP5318042B2 true JP5318042B2 (en) 2013-10-16

Family

ID=45776462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010159604A Active JP5318042B2 (en) 2010-07-14 2010-07-14 Signal analysis apparatus, signal analysis method, and signal analysis program

Country Status (1)

Country Link
JP (1) JP5318042B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012027196A (en) * 2010-07-22 2012-02-09 Nippon Telegr & Teleph Corp <Ntt> Signal analyzing device, method, and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3511360B2 (en) * 1998-03-09 2004-03-29 日本電信電話株式会社 Music sound signal separation method, its apparatus and program recording medium
JP5188300B2 (en) * 2008-07-14 2013-04-24 日本電信電話株式会社 Basic frequency trajectory model parameter extracting apparatus, basic frequency trajectory model parameter extracting method, program, and recording medium

Also Published As

Publication number Publication date
JP2012022128A (en) 2012-02-02

Similar Documents

Publication Publication Date Title
Huang et al. Joint optimization of masks and deep recurrent neural networks for monaural source separation
US8930183B2 (en) Voice conversion method and system
US8380331B1 (en) Method and apparatus for relative pitch tracking of multiple arbitrary sounds
Yoshii et al. A nonparametric Bayesian multipitch analyzer based on infinite latent harmonic allocation
JP2016045221A (en) Signal analysis device, method, and program
JP2009251029A (en) Speech processing apparatus and method, and program
Shekofteh et al. Autoregressive modeling of speech trajectory transformed to the reconstructed phase space for ASR purposes
JP5807921B2 (en) Quantitative F0 pattern generation device and method, model learning device for F0 pattern generation, and computer program
JP5771575B2 (en) Acoustic signal analysis method, apparatus, and program
JP5318042B2 (en) Signal analysis apparatus, signal analysis method, and signal analysis program
JP2009204808A (en) Sound characteristic extracting method, device and program thereof, and recording medium with the program stored
JP2012027196A (en) Signal analyzing device, method, and program
Gabrielli et al. A multi-stage algorithm for acoustic physical model parameters estimation
US10839823B2 (en) Sound source separating device, sound source separating method, and program
JP6499095B2 (en) Signal processing method, signal processing apparatus, and signal processing program
JP2013195575A (en) Sound signal analysis device, method, and program
JP6564744B2 (en) Signal analysis apparatus, method, and program
JP6498141B2 (en) Acoustic signal analyzing apparatus, method, and program
JP6101599B2 (en) Acoustic signal analysis apparatus, volume trajectory prediction apparatus, method, and program
JP6137708B2 (en) Quantitative F0 pattern generation device, model learning device for F0 pattern generation, and computer program
JP2011053565A (en) Signal analyzer, signal analytical method, program, and recording medium
WO2024038560A1 (en) Learning device, estimating device, learning method, and program
JP5626793B2 (en) Basic frequency model parameter estimation apparatus, method, and program
JP6553561B2 (en) Signal analysis apparatus, method, and program
JP2010197596A (en) Signal analysis device, signal analysis method, program, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121004

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130605

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130709

R150 Certificate of patent or registration of utility model

Ref document number: 5318042

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350