JP2007034262A - Device, method, and program for deciding signal, and recording medium - Google Patents

Device, method, and program for deciding signal, and recording medium Download PDF

Info

Publication number
JP2007034262A
JP2007034262A JP2006057746A JP2006057746A JP2007034262A JP 2007034262 A JP2007034262 A JP 2007034262A JP 2006057746 A JP2006057746 A JP 2006057746A JP 2006057746 A JP2006057746 A JP 2006057746A JP 2007034262 A JP2007034262 A JP 2007034262A
Authority
JP
Japan
Prior art keywords
signal
autoregressive coefficient
autoregressive
coefficient
discrete
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006057746A
Other languages
Japanese (ja)
Other versions
JP4653673B2 (en
Inventor
Hiroko Kato
比呂子 加藤
Kentaro Ishizuka
健太郎 石塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006057746A priority Critical patent/JP4653673B2/en
Publication of JP2007034262A publication Critical patent/JP2007034262A/en
Application granted granted Critical
Publication of JP4653673B2 publication Critical patent/JP4653673B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To decide a target signal which varies nonlinearly in the amplitude, fundamental frequency, etc., more accurately, in a signal with non-target signals such as noise being mixed therein. <P>SOLUTION: On the basis of a discrete signal x(t), autoregression coefficients of a nonlinear function autoregression model representing the discrete signal are found; and on the basis of the autoregression coefficient, it is determined whether the discrete signal x(t) is the target signal. The signal decision is made by deciding which of the found autoregression coefficient and a threshold is larger or performing pattern recognition, based on the learning contents previously obtained by learning with a known signal. Further, the found autoregression coefficient is normalized and smoothed, as necessary, and the signal determination is made, on the basis of the properly normalized and smoothed autoregression coefficients. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、振幅や基本周波数などが非線形に変動する性質を有する信号を判定するための信号判定装置、信号判定方法、信号判定プログラムおよび記録媒体に関する。   The present invention relates to a signal determination device, a signal determination method, a signal determination program, and a recording medium for determining a signal having a property in which amplitude, fundamental frequency, and the like fluctuate nonlinearly.

信号(人の音声、音楽、騒音・雑音、生体信号、無線信号などの信号を広く指す。)の分析やその加工処理などの信号処理では、信号処理対象とする信号が存在する区間を推定する、換言すれば、ある区間の信号が信号処理対象とする信号であるかを判定する必要があり、この判定精度がその後の信号処理の効果にも大きく影響する。   In signal processing such as analysis of signals (signals such as human voice, music, noise / noise, biological signals, wireless signals, etc.) and processing of the signals, a section where a signal to be processed exists is estimated. In other words, it is necessary to determine whether a signal in a certain section is a signal to be processed, and this determination accuracy greatly affects the effect of subsequent signal processing.

例えば、信号が音響信号の場合、音声信号や音楽信号の符号化、雑音信号の抑圧、残響除去、自動音声認識などの音響信号処理技術の多くにおいては、入力となる複数の種類の信号が含まれる音響信号から、ある区間の音響信号が信号処理対象とする音響信号であるかを判定する必要があり、この判定精度がその後の音響信号処理の効果にも大きく影響する。この音響信号判定のための音響特徴(信号特徴)として、例えば携帯電話などで用いられている音声信号判定方法では従来、音声信号の周波数スペクトル、音声信号の全帯域のエネルギーおよび帯域分割後の各帯域のエネルギー、音声信号波形の零交差数、およびそれらの時間微分などが利用されてきた(非特許文献1第66頁参照)。これらの音響特徴を用いた音声信号判定方法では、入力される音響信号を例えば25ms程度のある一定時間長に分割し、分割された各区間で上述の音響特徴を算出し、その値が予め別途定めた閾値を超える場合にはその区間の信号は音声信号、そうでない場合にはその区間の信号は非音声信号として判定していた。
Benyassine,A.,Shlomot,E.,and Su, H-Y. "ITU-T recommendation G.729 Annex B:A silence compression scheme for use with G.729 optimized for V.70 digital simultaneous voice and data applications", IEEE Communications Magazine, pp.64-73, September, 1997.
For example, when the signal is an acoustic signal, many of the acoustic signal processing techniques such as encoding of audio signals and music signals, suppression of noise signals, dereverberation, and automatic speech recognition include multiple types of input signals. Therefore, it is necessary to determine whether the acoustic signal in a certain section is an acoustic signal to be processed, and this determination accuracy greatly affects the effect of subsequent acoustic signal processing. As an acoustic feature (signal feature) for determining this acoustic signal, for example, in an audio signal determination method used in, for example, a mobile phone, each of the frequency spectrum of the audio signal, the energy of the entire band of the audio signal, and each after band division Band energy, the number of zero crossings of a speech signal waveform, and their time derivatives have been used (see Non-Patent Document 1, page 66). In the sound signal determination method using these acoustic features, the input acoustic signal is divided into a certain fixed length of, for example, about 25 ms, the above-described acoustic features are calculated in each divided section, and the values are separately obtained in advance. When the predetermined threshold value is exceeded, the signal in the section is determined as an audio signal, and otherwise, the signal in the section is determined as a non-speech signal.
Benyassine, A., Shlomot, E., and Su, HY. "ITU-T recommendation G.729 Annex B: A silence compression scheme for use with G.729 optimized for V.70 digital simultaneous voice and data applications", IEEE Communications Magazine, pp.64-73, September, 1997.

しかし、上述の信号特徴はいずれも、排除すべき雑信号(例えば雑音)と目的信号(例えば音声信号や音楽信号のようにある属性〔後述する。〕を有する信号)とで類似した値を示すことがあり、雑信号のある環境などでは十分な信号判定精度を得られない問題点があった。   However, each of the above signal features shows a similar value between a miscellaneous signal (for example, noise) to be excluded and a target signal (for example, a signal having a certain attribute (described later) such as an audio signal or a music signal). In some cases, there is a problem that sufficient signal determination accuracy cannot be obtained in an environment with a miscellaneous signal.

そこで、本発明は、雑信号などの目的外信号が混入した信号において、振幅や基本周波数などが非線形に変動する性質を有する目的信号をより正確に判定するための信号判定装置、信号判定方法、信号判定プログラムおよび記録媒体を提供することを目的とする。   Accordingly, the present invention provides a signal determination device, a signal determination method, and a signal determination method for more accurately determining a target signal having a property that the amplitude, fundamental frequency, and the like fluctuate nonlinearly in a signal mixed with a non-target signal such as a miscellaneous signal, An object is to provide a signal determination program and a recording medium.

上記課題を解決するために、本発明は、記憶手段に記憶される離散信号に基づいて、当該離散信号を表現する非線形関数自己回帰モデルの自己回帰係数を求め、この自己回帰係数に基づいて、離散信号が目的信号であるか否かを判定するものとする。   In order to solve the above problem, the present invention obtains an autoregressive coefficient of a nonlinear function autoregressive model expressing the discrete signal based on the discrete signal stored in the storage means, and based on the autoregressive coefficient, It is determined whether or not the discrete signal is the target signal.

信号判定は、求められた自己回帰係数と閾値との大小判定によって行ってもよいし、あるいは、予め既知の信号で学習して得た学習内容に基づくパターン認識によって行うとしてもよい。   The signal determination may be performed by determining the magnitude of the obtained autoregressive coefficient and the threshold value, or may be performed by pattern recognition based on learning content obtained by learning with a known signal in advance.

また、求められた自己回帰係数を正規化・平滑化を必要に応じて行い、適宜正規化・平滑化された自己回帰係数に基づいて信号判定を行うようにしてもよい。   Further, the obtained autoregressive coefficient may be normalized / smoothed as necessary, and signal determination may be performed based on the autoregressive coefficient that has been appropriately normalized / smoothed.

また、本発明の信号判定装置をコンピュータ上で機能させる信号判定プログラムによって、コンピュータを信号判定装置として作動処理させることができる。そして、この信号判定プログラムを記録した、コンピュータ読み取り可能なプログラム記録媒体によって、他のコンピュータを信号判定装置として機能させることや、信号判定プログラムを流通させることなどが可能になる。   Further, the computer can be operated as a signal determination device by a signal determination program that causes the signal determination device of the present invention to function on the computer. Then, it becomes possible to cause another computer to function as a signal determination device, distribute the signal determination program, and the like by using a computer-readable program recording medium that records the signal determination program.

本発明によれば、信号モデルである非線形関数自己回帰モデルの自己回帰係数に基づいて信号判定を行うことで、雑信号などの目的外信号が混入した信号において、振幅や基本周波数などが非線形に変動する性質を有する信号をより正確に判定することができる。   According to the present invention, by performing signal determination based on the autoregressive coefficient of the non-linear function autoregressive model that is a signal model, the amplitude, the fundamental frequency, and the like are nonlinear in a signal mixed with a non-target signal such as a miscellaneous signal. It is possible to more accurately determine a signal having a varying property.

<各実施形態に共通する事項の説明>
本発明の信号判定装置・方法は、入力となる信号に対して適用する非線形関数自己回帰モデルの自己回帰係数を算出し、算出された自己回帰係数に基づいて信号判定を行う。以下、各実施形態における[信号]と[非線形関数自己回帰モデル]について説明する。
<Description of matters common to each embodiment>
The signal determination apparatus / method of the present invention calculates an autoregressive coefficient of a nonlinear function autoregressive model to be applied to an input signal, and performs signal determination based on the calculated autoregressive coefficient. Hereinafter, [signal] and [nonlinear function autoregressive model] in each embodiment will be described.

[信号]
各実施形態で扱う信号は、人の音声、音楽、騒音・雑音などの音響信号とする。勿論、音響信号に限定されず、例えば無線信号や生体信号などでもよい。目的信号は、振幅や基本周波数などが非線形に変動する性質を有する信号であるとする。上述した「ある属性」とは、「振幅や基本周波数などが非線形に変動する性質」である。
[signal]
Signals handled in each embodiment are acoustic signals such as human voice, music, and noise / noise. Of course, the signal is not limited to an acoustic signal, and may be, for example, a radio signal or a biological signal. It is assumed that the target signal is a signal having the property that the amplitude, the fundamental frequency, and the like fluctuate nonlinearly. The above-mentioned “certain attribute” is “a property that the amplitude, the fundamental frequency and the like fluctuate nonlinearly”.

図示しない収音手段(例えばマイクロホン)によって得られた収音信号(この収音信号には、目的信号である音声信号や音楽信号の他に、目的外信号である雑音信号が含まれる場合がある。)は、例えば8,000Hzのサンプリングレートでサンプリングされ、適宜量子化された離散信号に変換される。以下、この離散信号を単に音響信号ということにする。収音信号から音響信号へのA/D変換などを実行するために必要となる構成要素(手段)は、いずれも公知技術の常套手段によって達成されるから、説明および図示を略する。   A sound collection signal obtained by sound collection means (for example, a microphone) (not shown) (this sound collection signal may include a noise signal which is a non-target signal in addition to a voice signal and a music signal which are target signals. .) Is sampled at a sampling rate of 8,000 Hz, for example, and converted into a quantized discrete signal as appropriate. Hereinafter, this discrete signal is simply referred to as an acoustic signal. Since the components (means) necessary for executing A / D conversion from the collected sound signal to the acoustic signal and the like are all achieved by conventional means in the known art, explanation and illustration are omitted.

そして、図示しない音響信号切出手段が、音響信号から、時間軸方向に一定時間幅で始点を移動させながら、所定時間長の音響信号をフレームとして切り出す。例えば200サンプル点(8,000Hz×25ms)長の音響信号を、80サンプル点(8,000Hz×10ms)ずつ始点を移動させながら切り出す。各フレームの切り出しは、音響信号に公知の窓関数(例えば、ハミング窓、ガウス窓)を適用すればよい。窓関数の適用によるフレームの切り出しは公知の常套手段によって達成されるから、説明および図示を省略する。   Then, an acoustic signal cutout unit (not shown) cuts out an acoustic signal having a predetermined time length from the acoustic signal as a frame while moving the start point with a certain time width in the time axis direction. For example, an acoustic signal having a length of 200 sample points (8,000 Hz × 25 ms) is cut out while moving the start point by 80 sample points (8,000 Hz × 10 ms). Each frame may be cut out by applying a known window function (for example, a Hamming window or a Gaussian window) to the acoustic signal. Since the cutout of the frame by applying the window function is achieved by known conventional means, the description and illustration are omitted.

また、切り出すフレーム幅は、全てのフレームで同じとするのでもよいし、例えば、予め従来技術の方法で適宜に定めた各区間の音響信号に対して信号判定を実行しておき、十分な精度で確実に目的信号である、あるいは目的信号ではないと判定される区間については、長くフレーム幅を採り、逆に従来技術の方法での信号判定において確実性が無い区間については、フレーム幅を短く採るとしてもよい。ここで、従来技術の方法での信号判定における確実性判定は、例えば、音響信号のエネルギー(パワー)に関する閾値を十分に大きく、あるいは十分に小さく設定しておくことで、十分大きい閾値を越えるエネルギーを有する区間の音響信号は目的信号である、十分小さい閾値を越えないエネルギーを有する区間の音響信号は目的信号ではない、と判定すればよい。以下の各実施形態では、従来技術の方法による予めの信号判定は行わないものとして説明する。   In addition, the frame width to be cut out may be the same for all the frames. For example, signal determination is performed on the acoustic signal of each section appropriately determined by a conventional method in advance, and sufficient accuracy is obtained. Therefore, a longer frame width is used for a section that is definitely the target signal or is determined not to be the target signal, and conversely, a frame width is shortened for a section that has no certainty in signal determination using the conventional method. It may be taken. Here, the certainty determination in the signal determination by the method of the prior art is, for example, energy that exceeds a sufficiently large threshold value by setting a threshold value relating to energy (power) of the acoustic signal sufficiently large or sufficiently small. It may be determined that the acoustic signal in the section having the signal is the target signal, and the acoustic signal in the section having energy not exceeding the sufficiently small threshold is not the target signal. In each of the following embodiments, description will be made assuming that the signal determination by the method according to the prior art is not performed.

なお、この明細書において「目的信号であるか否かの判定(信号判定)」とは、判定対象となる離散信号(ここでは音響信号である。)が、既述の「振幅や基本周波数などが非線形に変動する性質」を有する信号であるか否かを判定することをいうものとする。   In this specification, “determination of whether or not the signal is a target signal (signal determination)” means that a discrete signal (in this case, an acoustic signal) to be determined is an “amplitude, fundamental frequency, etc.” It is assumed that it is determined whether or not the signal has a characteristic that fluctuates nonlinearly.

以上のようにして切り出された各フレームの音響信号x(t[i])〔iはフレーム番号とする。t[i]は番号iのフレームの離散信号における各サンプル点を表す。〕が、音響信号切出手段によって出力される。音響信号切出手段によって出力された各フレームは、本発明の信号判定装置における自己回帰係数算出部(後述)の入力となる。なお、目的信号であるか否かは、後述の説明で明らかになるとおり、このフレーム毎に判定されることになる。 The acoustic signal x i (t [i] ) [i ] of each frame cut out as described above is a frame number. t [i] represents each sample point in the discrete signal of the frame of number i. Is output by the acoustic signal cutting means. Each frame output by the acoustic signal cutout means is input to an autoregressive coefficient calculation unit (described later) in the signal determination device of the present invention. Whether or not the signal is a target signal is determined for each frame, as will be apparent from the following description.

マイクロホンによって得られた収音信号から音響信号切出手段によってフレームが出力されるまでの処理は、マイクロホンによる収音をしながら、時々刻々と、離散信号化、切出しの各処理を行うもの(いわゆるストリーム処理と同様の処理である。)としてもよいし、マイクロホンによって得られた収音信号を離散信号化して後述の外部記憶装置に保存記憶しておき、この保存記憶された離散信号(音響信号)に対して切出しの処理を行うもの(いわゆるバッファ処理と同様の処理である。)としてもよいし、適宜に設定変更可能である。   The process from the sound collection signal obtained by the microphone to the output of the frame by the sound signal extraction means is to perform discrete signal conversion and extraction processes every moment while collecting sound by the microphone (so-called It is also possible to perform the same processing as the stream processing.) The collected sound signal obtained by the microphone is converted into a discrete signal and stored in an external storage device to be described later, and the stored and stored discrete signal (acoustic signal) ) May be performed (a process similar to a so-called buffer process), and the setting can be changed as appropriate.

ところで、本発明の信号判定装置・方法は、あるフレームの音響信号が目的信号であるか否かを判定するものであるが、この判定後に、目的信号であると判定された音響信号に対して何らかの信号処理が行われるのが通常である(勿論、信号判定自体を目的として、その他の信号処理を行わず終了しても良い。)。ここで何らかの信号処理とは、例えば音響信号の場合、雑音抑圧、ハウリング防止、エコー抑圧のための処理などである。このため、上記のストリーム処理ないしバッファ処理は、マイクロホンによって得られた収音信号から音響信号切出手段によってフレームが出力されるまでの処理ではなく、マイクロホンによって得られた収音信号から所定の信号処理が終了するまでの処理としてもよく、信号処理の内容などによって適宜に設定変更可能である。   By the way, the signal determination apparatus / method of the present invention determines whether or not an acoustic signal of a certain frame is the target signal. After this determination, the signal determination apparatus / method determines the acoustic signal determined to be the target signal. It is normal that some signal processing is performed (of course, for the purpose of signal determination itself, the processing may be terminated without performing other signal processing). Here, for example, in the case of an acoustic signal, the signal processing is processing for noise suppression, howling prevention, echo suppression, and the like. For this reason, the above stream processing or buffer processing is not processing from the sound collection signal obtained by the microphone until the frame is output by the acoustic signal extraction means, but a predetermined signal from the sound collection signal obtained by the microphone. The processing may be performed until the processing is completed, and the setting can be appropriately changed depending on the content of the signal processing.

各実施形態では、予めマイクロホンによって得られた収音信号を離散信号化して、この離散信号(音響信号)に対して音響信号切出手段によって切出しの処理を行って得られた複数のフレームの音響信号x(t[i])を後述の外部記憶装置に保存記憶しておくとする。 In each embodiment, sound signals of a plurality of frames obtained by converting a collected sound signal obtained by a microphone in advance into a discrete signal and performing a cutting process on the discrete signal (acoustic signal) by an acoustic signal cutting unit. It is assumed that the signal x i (t [i] ) is stored in an external storage device described later.

[非線形関数自己回帰モデル]
各実施形態で扱う非線形関数自己回帰モデルは、その一例として、Exponential自己回帰モデル(以下、「指数関数自己回帰モデル」という。)とする。非線形で不規則な変動をする性質を持つ時系列データを予測するモデルとして、指数関数自己回帰モデルが提案されている(参考文献1参照)。
(参考文献1) Haggan,V. and Ozaki,T., "Modelling nonlinear random vibrations using an amplitude-dependent autoregressive time series model", Biometrika, Vol.68, pp.189-196, 1981
[Nonlinear function autoregressive model]
The nonlinear function autoregressive model handled in each embodiment is, for example, an Exponential autoregressive model (hereinafter referred to as “exponential function autoregressive model”). An exponential autoregressive model has been proposed as a model for predicting time-series data having the property of nonlinear and irregular fluctuation (see Reference 1).
(Reference 1) Haggan, V. and Ozaki, T., "Modeling nonlinear random vibrations using an amplitude-dependent autoregressive time series model", Biometrika, Vol.68, pp.189-196, 1981

この指数関数自己回帰モデルは、ある時点{t}における音響信号の値x(t)を、この時点{t}よりも前の各時点{t−k}〔但しk=1、2、・・・、pとし、1≦pとする。ここでpは、指数関数自己回帰モデルの項数を決定するので、これをモデル次数という。〕における音響信号の値x(t−k)のそれぞれに対して自己回帰係数φを乗じたものの総和と、時点{t}よりも前の各時点{t−k}における音響信号の値x(t−k)のそれぞれに対して、自己回帰係数πおよび、自己回帰係数であるスケールパラメータγ〔但し0≦γとする。〕と時点{t−1}における音響信号の値x(t−1)の二乗との積を指数とする自然対数の底eのべき乗を乗じたものの総和と、正規白色雑音に従う観測誤差ε(t)との和によって予測するモデルであり、式(1)のように表すことができる(なお、例えば時点{t−2}における音響信号の値x(t−2)の項の自己回帰係数φおよび自己回帰係数πが0である場合、厳密には指数関数自己回帰モデルは過去p個の音響信号の値に基づくものとは言えないが、このような場合も含めて、過去p個の音響信号の値に基づくものであるとする。)。

Figure 2007034262
In this exponential function autoregressive model, the value x (t) of the acoustic signal at a certain time point {t} is changed to each time point {t−k} [k = 1, 2,.・ P and 1 ≦ p. Here, since p determines the number of terms of the exponential function autoregressive model, this is called the model order. ] Of the sound signal values x (t−k) in FIG. 4] multiplied by the autoregressive coefficient φ k and the value x of the sound signal at each time point {t−k} before the time point {t}. For each of (t−k), an autoregressive coefficient π k and a scale parameter γ (where 0 ≦ γ are autoregressive coefficients). ] Multiplied by the power of the base e of the natural logarithm with the product of the value x (t-1) of the acoustic signal at the time point {t-1} as the exponent, and the observation error ε ( t) and is a model predicted by the sum of (t), and can be expressed as in equation (1) (for example, the autoregressive coefficient of the term of the value x (t-2) of the acoustic signal at time {t-2}) When φ 2 and the autoregressive coefficient π 2 are 0, strictly speaking, the exponential function autoregressive model cannot be said to be based on the values of the past p acoustic signals. Suppose that it is based on the values of individual acoustic signals.)
Figure 2007034262

一般的な自己回帰モデル(Autoregressive model;ARモデル)との違いは、音響信号の値x(t−k)の係数(この係数は自己回帰係数ではない。)に音響信号の値の変動に依存して値が変化する指数項(πexp(−γx(t−1)))が導入されていることである。指数関数自己回帰モデルは、この指数項の効果によって、不規則な変動を伴う非定常的な音響信号を効果的にモデル化することができる。 The difference from the general autoregressive model (AR model) is that the coefficient of the acoustic signal value x (tk) depends on the variation of the acoustic signal value (this coefficient is not an autoregressive coefficient). Thus, an exponential term (π k exp (−γx (t−1) 2 )) whose value changes is introduced. The exponential autoregressive model can effectively model non-stationary acoustic signals with irregular fluctuations by the effect of this exponential term.

自然界に存在する信号は、多くの場合、非対称な振動特性を持ち、このような信号をモデル化するには、ARモデルを用いるよりも上述した非線形モデルを用いる方が適している。また、音声信号や音楽信号の多くの部分では、ほぼ周期的な信号がその周期や振幅が微細に振動しながら続く性質を持っており、このような音響信号のモデル化には非線形モデルの中でも指数関数自己回帰モデルが適していると考えられるので、各実施形態における非線形関数自己回帰モデルの一例を指数関数自己回帰モデルとするのである。   Signals that exist in nature often have asymmetric vibration characteristics, and in order to model such signals, it is better to use the above-described nonlinear model than to use the AR model. Also, in many parts of audio signals and music signals, almost periodic signals have the property that their period and amplitude continue to vibrate finely. Since an exponential function autoregressive model is considered suitable, an example of a nonlinear function autoregressive model in each embodiment is an exponential function autoregressive model.

なお、式(1)で表される指数関数自己回帰モデルの指数項は自然対数の底eのべき乗を用いているが、自然対数の底eに限らず、正の実数であればよい。この正の実数をaとすると、e−γ=a−μ、μ=γ/logaなる関係があるので、適宜に指数関数自己回帰モデルの表現を変更することが可能である。 Note that the exponent term of the exponential function autoregressive model expressed by Equation (1) uses the power of the base e of the natural logarithm, but is not limited to the base e of the natural logarithm and may be a positive real number. When this positive real numbers a, e -γ = a -μ, μ = γ / log e since a the relationship is, it is possible to change the representation of the exponential autoregressive model appropriately.

また、式(1)で表される指数関数自己回帰モデルの指数項のうち、exp(−γx)〔但し、式(1)では変数xにx(t−1)を代入している。〕で表される関数gは、その取りうる値が0以上1以下に収まることが好ましい。換言すれば、指数関数自己回帰モデルの指数項における関数は、その取りうる値が0以上1以下に収まるものであればよい。例えば、ボルツマン(Boltzmann)関数〔その一例として、g=exp(x)/(1+exp(x))〕、ゴンペルツ(Gompertz)関数〔その一例として、g=exp(−exp(−x))〕、シグモイド関数〔その一例として、g=1/(1+exp(−x))〕、ローレンツピーク(Lorentz Peak)関数〔その一例として、g=α/(x+α);αは正定数〕、フォークト(Voigt)関数、擬似フォークト(Voigt)関数、ピアソン分布族第7型の関数を正規化したピーク関数など種々の関数が適用可能である。また、関数の取りうる値が0以上1以下に収まるのが良いとしたが、式(1)で表される指数関数自己回帰モデルの指数項からも明らかなとおり当該関数には自己回帰係数πを乗じるので、この自己回帰係数πを乗じた値までも含めるとすれば、関数の取りうる値が0以上1以下に収まるとする限定をつける必要はない。 In addition, among the exponential terms of the exponential function autoregressive model expressed by the equation (1), exp (−γx 2 ) [However, in the equation (1), x (t−1) is substituted for the variable x. It is preferable that the value of the function g represented by In other words, the function in the exponent term of the exponential function autoregressive model only needs to have a value that can be taken between 0 and 1. For example, the Boltzmann function [for example, g = exp (x) / (1 + exp (x))], the Gompertz function [for example, g = exp (−exp (−x))], Sigmoid function [for example, g = 1 / (1 + exp (−x))], Lorentz peak function (for example, g = α / (x 2 + α); α is a positive constant), forked ( Various functions such as a peak function obtained by normalizing a Voigt function, a pseudo Vogt function, and a Pearson distribution family type 7 function are applicable. In addition, the value that the function can take should be within the range of 0 to 1, but as is apparent from the exponent term of the exponential function autoregressive model expressed by Equation (1), the function has an autoregressive coefficient π. Since k is multiplied, it is not necessary to limit the value that can be taken by the function to be within the range of 0 to 1 if the value multiplied by the autoregressive coefficient π k is included.

式(1)の指数関数自己回帰モデルの自己回帰係数のうち、信号の非線形性に係わりを有する自己回帰係数は、指数項の指数であるスケールパラメータγである。そこで、各実施形態では、スケールパラメータγを算出する(データである離散信号から具体的なスケールパラメータγの値を求める。)として説明する。勿論、スケールパラメータγに限定する趣旨ではなく、その他の自己回帰係数φ、πも算出することで、これらを信号判定に用いることができる。なお、離散信号からスケールパラメータγ(その他の自己回帰係数も含む。)を算出することは、離散信号に基づいて、この離散信号を最も良く表現する(つまり、最も尤もらしい、あるいは相応しい)指数関数自己回帰モデルの自己回帰係数を求めることに他ならないことに留意する。   Among the autoregressive coefficients of the exponential function autoregressive model of Equation (1), the autoregressive coefficient having a relationship with the nonlinearity of the signal is a scale parameter γ that is an exponent of the exponent term. Therefore, in each embodiment, description will be made on the assumption that the scale parameter γ is calculated (a specific value of the scale parameter γ is obtained from a discrete signal that is data). Of course, the purpose is not limited to the scale parameter γ, and other autoregressive coefficients φ and π can also be calculated and used for signal determination. Note that calculating the scale parameter γ (including other autoregressive coefficients) from the discrete signal is the exponential function that best represents this discrete signal (ie, most likely or appropriate) based on the discrete signal. Note that it is none other than finding the autoregressive coefficient of the autoregressive model.

ここで参考として、離散信号(音響信号)に基づいて算出されたスケールパラメータγは、無音の区間や環境雑音が混入する区間と、ほぼ周期的な信号である音声信号や音楽信号に代表される、周期や振幅が非線形に変動しながら続く性質を有する信号が含まれる区間とで取りうる値の範囲が異なることを図1に示す。図1は、音響信号とスケールパラメータγとの関係を示す図である。   For reference, the scale parameter γ calculated based on a discrete signal (acoustic signal) is typified by a silent section, a section in which environmental noise is mixed, and an audio signal or music signal that is a substantially periodic signal. FIG. 1 shows that the range of values that can be taken is different in a section including a signal having a characteristic that continues while the period and amplitude vary nonlinearly. FIG. 1 is a diagram illustrating a relationship between an acoustic signal and a scale parameter γ.

図1(a)に示されるような無音区間と音声区間のみが存在するような音響信号に対して、本発明の信号判定装置・方法によって算出したスケールパラメータγの値を図1(b)に示す。図示のとおり、無音区間ではスケールパラメータγは高い値となり、音声区間では低い値となることが分かる。また、図1(c)で示す音響信号は、図1(a)で示す音声信号に対し駅騒音を信号対雑音比10dBで加算したものであり、この音響信号に対して、本発明の信号判定装置・方法によって算出したスケールパラメータγの値を図1(d)に示す。ここでも駅騒音のみが存在する区間ではスケールパラメータγの値は比較的高い値となり、音声区間では比較的低い値となることが分かる。これは、指数関数自己回帰モデルにおいて、スケールパラメータγが小さい値を示す場合は、音響信号のスケールパラメータγによって表される非線形性が高いことを意味し、スケールパラメータγが大きい値を示す場合は、音響信号のパラメータγによって表される非線形性が低いことを意味するためと考えられる。音響信号においては多くの場合、音声信号や音楽信号など目的信号ではこのスケールパラメータγによって表される非線形性が高く、環境雑音などの目的外信号ではこのスケールパラメータγによって表される非線形性が低い。図1は、この傾向を示している。   FIG. 1B shows the value of the scale parameter γ calculated by the signal determination device / method of the present invention for an acoustic signal having only a silent section and a voice section as shown in FIG. Show. As shown in the figure, it can be seen that the scale parameter γ has a high value in the silent section and a low value in the voice section. The acoustic signal shown in FIG. 1 (c) is obtained by adding station noise to the audio signal shown in FIG. 1 (a) with a signal-to-noise ratio of 10 dB. The value of the scale parameter γ calculated by the determination device / method is shown in FIG. Again, it can be seen that the value of the scale parameter γ is relatively high in the section where only station noise exists, and is relatively low in the speech section. This means that when the scale parameter γ shows a small value in the exponential function autoregressive model, the nonlinearity represented by the scale parameter γ of the acoustic signal is high, and when the scale parameter γ shows a large value. This is considered to mean that the nonlinearity represented by the parameter γ of the acoustic signal is low. In many cases, an acoustic signal has a high non-linearity represented by the scale parameter γ in a target signal such as a voice signal or a music signal, and a non-linearity represented by the scale parameter γ in a non-target signal such as an environmental noise. . FIG. 1 illustrates this trend.

本発明者らは、このような実験的事実などを背景として、スケールパラメータγその他非線形関数自己回帰モデルにおける自己回帰係数が信号判定に有用であるとの知見を得るに至った。本発明は、このような知見に基づいて創出されたものである。従来において、非線形関数自己回帰モデルの自己回帰係数に基づく信号判定は存在していなかった。   The present inventors have obtained knowledge that the autoregressive coefficient in the scale parameter γ and other nonlinear function autoregressive models is useful for signal determination against the background of such experimental facts. The present invention has been created based on such knowledge. Conventionally, there is no signal determination based on the autoregressive coefficient of the nonlinear function autoregressive model.

<第1実施形態>
本発明の信号判定装置・方法の第1実施形態を説明する。
図2は、第1実施形態に係わる信号判定装置(1)のハードウェア構成を例示した構成ブロック図である。
図3は、第1実施形態に係わる信号判定装置(1)の機能構成図である。
図4は、従来的な自己回帰係数算出方法の処理の流れを示すフローチャートである。
図5は、本発明者らが創出した自己回帰係数算出方法における処理機能を示す機能ブロック図である。
図6は、本発明者らが創出した自己回帰係数算出方法の処理の流れを示すフローチャートである。
図7は、本発明者らが創出した自己回帰係数算出方法(変形例1)における処理機能を示す機能ブロック図である。
図8は、本発明者らが創出した自己回帰係数算出方法(変形例1)の処理の流れを示すフローチャートである。
図9は、本発明者らが創出した自己回帰係数算出方法(変形例2)における処理機能を示す機能ブロック図である。
図10は、本発明者らが創出した自己回帰係数算出方法(変形例2)の処理の流れを示すフローチャートである。
図11は、本発明者らが創出した自己回帰係数算出方法(変形例3)における処理機能を示す機能ブロック図である。
図12は、本発明者らが創出した自己回帰係数算出方法(変形例3)の処理の流れを示すフローチャートである。
<First Embodiment>
1st Embodiment of the signal determination apparatus and method of this invention is described.
FIG. 2 is a configuration block diagram illustrating the hardware configuration of the signal determination apparatus (1) according to the first embodiment.
FIG. 3 is a functional configuration diagram of the signal determination device (1) according to the first embodiment.
FIG. 4 is a flowchart showing a process flow of a conventional autoregressive coefficient calculation method.
FIG. 5 is a functional block diagram showing processing functions in the autoregressive coefficient calculation method created by the present inventors.
FIG. 6 is a flowchart showing a process flow of the autoregressive coefficient calculation method created by the present inventors.
FIG. 7 is a functional block diagram showing processing functions in the autoregressive coefficient calculation method (Modification 1) created by the present inventors.
FIG. 8 is a flowchart showing the flow of processing of the autoregressive coefficient calculation method (Modification 1) created by the present inventors.
FIG. 9 is a functional block diagram showing processing functions in the autoregressive coefficient calculation method (Modification 2) created by the present inventors.
FIG. 10 is a flowchart showing the flow of processing of the autoregressive coefficient calculation method (Modification 2) created by the present inventors.
FIG. 11 is a functional block diagram showing processing functions in the autoregressive coefficient calculation method (Modification 3) created by the present inventors.
FIG. 12 is a flowchart showing the flow of processing of the autoregressive coefficient calculation method (Modification 3) created by the present inventors.

図2に例示するように、信号判定装置(1)は、キーボードなどが接続可能な入力部(11)、液晶ディスプレイなどが接続可能な出力部(12)、信号判定装置(1)外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部(13)、DSP(Digital Signal Processor)(14)〔CPU(Central Processing Unit)でも良い。またキャッシュメモリなどを備えていてもよい。〕、メモリであるRAM(15)、ROM(16)やハードディスクである外部記憶装置(17)並びにこれらの入力部(11)、出力部(12)、通信部(13)、DSP(14)、RAM(15)、ROM(16)、外部記憶装置(17)間のデータのやり取りが可能なように接続するバス(18)を有している。また必要に応じて、信号判定装置(1)に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。   As illustrated in FIG. 2, the signal determination device (1) includes an input unit (11) to which a keyboard or the like can be connected, an output unit (12) to which a liquid crystal display or the like can be connected, and the signal determination device (1) to communicate with the outside. A communication unit (13) to which connectable communication devices (for example, communication cables) can be connected, DSP (Digital Signal Processor) (14) [CPU (Central Processing Unit) may be used. A cache memory or the like may be provided. ], A RAM (15) as a memory, a ROM (16), an external storage device (17) as a hard disk, and an input unit (11), an output unit (12), a communication unit (13), a DSP (14), The bus (18) is connected so that data can be exchanged between the RAM (15), the ROM (16), and the external storage device (17). If necessary, the signal determination device (1) may be provided with a device (drive) that can read and write a storage medium such as a CD-ROM.

さらに信号判定装置(1)には、音声、音楽、雑音などの音を収音するためのマイクロホンを接続可能であって、マイクロホンによって得られた収音信号の入力を受ける信号入力部を設ける。信号入力部にはマイクロホンが接続される。この収音信号が、離散信号である音響信号へ変換されること、この音響信号が、音響信号切出手段によって所定時間幅のフレームとして出力されること、得られた複数のフレームの音響信号x(t[i])が外部記憶装置(17)に保存記憶されることなどは既に説明したとおりである。 Furthermore, the signal determination device (1) can be connected to a microphone for collecting sounds such as voice, music, and noise, and is provided with a signal input unit that receives an input of a collected sound signal obtained by the microphone. A microphone is connected to the signal input unit. The collected sound signal is converted into an acoustic signal which is a discrete signal, the acoustic signal is output as a frame having a predetermined time width by the acoustic signal cutting means, and the obtained acoustic signals x of a plurality of frames are obtained. As described above, i (t [i] ) is stored in the external storage device (17).

信号判定装置(1)の外部記憶装置(17)には、信号判定のためのプログラムおよびこのプログラムの処理において必要となるデータなどが保存記憶されている〔外部記憶装置が無い場合には、例えばプログラムを読み出し専用記憶装置であるROMに保存記憶させておけばよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に保存記憶される。   The external storage device (17) of the signal determination device (1) stores and stores a program for signal determination, data necessary for processing of this program, and the like [if there is no external storage device, for example, The program may be stored in a ROM that is a read-only storage device. ]. Further, data obtained by the processing of these programs is appropriately stored and stored in a RAM or an external storage device.

より具体的には、信号判定装置(1)の外部記憶装置(17)〔あるいはROMなど〕には、音響信号を表現する指数関数自己回帰モデルのスケールパラメータγを得るためのプログラム、スケールパラメータγから音響信号が目的信号であるか否かを判定するためのプログラム、およびこれらのプログラムの処理において必要となるデータ(音響信号など)などが保存記憶されている(なお、上述したストリーム処理を行う場合には、音響信号に窓関数を適用してフレームを切出す音響信号切出手段を実現するためのプログラムも保存記憶しておく。)。その他、これらのプログラムに基づく処理を制御するための制御プログラムも適宜に保存しておく。   More specifically, a program for obtaining a scale parameter γ of an exponential function autoregressive model representing an acoustic signal, a scale parameter γ, is stored in the external storage device (17) [or ROM, etc.] of the signal determination device (1). And a program for determining whether or not the acoustic signal is the target signal, and data (such as an acoustic signal) necessary for the processing of these programs are stored and stored (the above-described stream processing is performed) In this case, a program for realizing acoustic signal extraction means for extracting a frame by applying a window function to the acoustic signal is also stored and stored. In addition, a control program for controlling processing based on these programs is also stored as appropriate.

第1実施形態に係る信号判定装置(1)では、外部記憶装置(17)〔あるいはROMなど〕に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAM(15)に読み込まれて、DSP(14)で解釈実行・処理される。その結果、DSP(14)が所定の機能(自己回帰係数算出部、信号判定部、さらには必要に応じて音響信号切出部)を実現することで、信号判定が実現される。   In the signal determination device (1) according to the first embodiment, each program stored in the external storage device (17) [or ROM, etc.] and data necessary for processing each program are stored in the RAM (15) as necessary. Are interpreted and executed and processed by the DSP (14). As a result, DSP (14) implement | achieves a predetermined function (an autoregressive coefficient calculation part, a signal determination part, and also an acoustic signal extraction part as needed), and signal determination is implement | achieved.

そこで次に、図4〜図12を参照して、信号判定装置(1)における信号判定処理の流れを順次説明する。
第1実施形態の信号判定装置(1)は、自己回帰係数算出部(20)および信号判定部(21)から構成される(図3参照)。
Then, next, with reference to FIGS. 4-12, the flow of the signal determination process in a signal determination apparatus (1) is demonstrated sequentially.
The signal determination device (1) of the first embodiment includes an autoregressive coefficient calculation unit (20) and a signal determination unit (21) (see FIG. 3).

第1実施形態では、各フレームの音響信号x(t[i])ごとに信号判定を行う。つまり、例えば、フレーム総数をFとし、i=1,2,・・・,Fとすると、1番目のフレームの音響信号x(t[1])について信号判定を行い、次いで、2番目のフレームの音響信号x(t[2])について信号判定を行い、この処理をF番目のフレームの音響信号x(t[F])まで繰り返すことで、全てのフレームの音響信号について信号判定を行うのである。 In the first embodiment, signal determination is performed for each frame acoustic signal x i (t [i] ). That is, for example, if the total number of frames is F and i = 1, 2,..., F, signal determination is performed on the acoustic signal x 1 (t [1] ) of the first frame, and then the second The signal determination is performed for the acoustic signal x 2 (t [2] ) of the frame, and this process is repeated until the acoustic signal x F (t [F] ) of the F th frame, thereby determining the signal for the acoustic signals of all frames. Is done.

ここで留意すべきは、各フレームの音響信号x(t[i])それぞれは、以下に説明する処理においては相関が無いということである。従って、以下では、あるフレームの音響信号x(t[R])〔i=R〕に着目して説明する。説明の便宜から、x(t[R])を単にx(t)と略記する。また、サンプル点tをt=1,2,・・・,nとする。 It should be noted here that each of the acoustic signals x i (t [i] ) of each frame has no correlation in the processing described below. Accordingly, the following description will be given focusing on the acoustic signal x R (t [R] ) [i = R] of a certain frame. For convenience of explanation, x R (t [R] ) is simply abbreviated as x (t). Further, the sample point t is set to t = 1, 2,.

<スケールパラメータの算出>
自己回帰係数算出部(20)では、入力された上記音響信号x(t)に対して指数関数自己回帰モデルを適用し、そのスケールパラメータγを算出する。一般的には、スケールパラメータγを単独で算出するのではなく、その他の自己回帰係数も算出することになる。指数関数自己回帰モデルの自己回帰係数算出方法に限定はなく、種々の方法が適用可能であるが、ここでは、従来的な自己回帰係数算出方法(A)および、本発明者らが、従前に特許出願を行った自己回帰係数算出方法(B)を示す。自己回帰係数算出方法(B)の詳細については、参考文献2および参考文献3を参照のこと。
(参考文献2) K.Ishizuka, H.Kato, and T.Nakatani, "Speech signal analysis with exponential autoregressive model", Proc. IEEE Intl, Conf. Acoustics, Speech and Signal Processing(ICASSP), Vol.1, I-225, March 18-23, 2005.
(参考文献3) 特願2005−63162号
<Calculation of scale parameters>
The autoregressive coefficient calculation unit (20) applies an exponential function autoregressive model to the input acoustic signal x (t) and calculates its scale parameter γ. In general, the scale parameter γ is not calculated alone, but other autoregressive coefficients are also calculated. There are no limitations on the autoregressive coefficient calculation method of the exponential function autoregressive model, and various methods can be applied. Here, the conventional autoregressive coefficient calculation method (A) and the present inventors previously An autoregressive coefficient calculation method (B) for which a patent application has been filed is shown. See Reference 2 and Reference 3 for details of the autoregressive coefficient calculation method (B).
(Reference 2) K.Ishizuka, H.Kato, and T.Nakatani, "Speech signal analysis with exponential autoregressive model", Proc. IEEE Intl, Conf. Acoustics, Speech and Signal Processing (ICASSP), Vol.1, I -225, March 18-23, 2005.
(Reference 3) Japanese Patent Application No. 2005-63162

[従来的な自己回帰係数算出方法(A)]
n個のサンプル点で与えられる音響信号x(t)に基づいて、指数関数自己回帰モデルの自己回帰係数であるモデル次数p、スケールパラメータγ、自己回帰係数φ(以下、「係数φ」と略記する。)、自己回帰係数π(以下、「係数π」と略記する。)の従来的な算出方法を図4を参照して以下に説明する。
[Conventional autoregressive coefficient calculation method (A)]
Based on the acoustic signal x (t) given by n sample points, the model order p which is an autoregressive coefficient of the exponential function autoregressive model, the scale parameter γ, the autoregressive coefficient φ k (hereinafter referred to as “coefficient φ k ”). ), A conventional method for calculating the autoregressive coefficient π k (hereinafter abbreviated as “coefficient π k ”) will be described with reference to FIG.

まず、モデル次数pおよびスケールパラメータγの値の算出は、非線形モデルに関する赤池情報量基準AIC(p)を用いて、式(2)の条件を満たすような値p、γを選択することによる。ここでmはモデル次数pの取りうる値の最大値(任意値)を表す。また、argmin(・)は、括弧内の関数が最小の値をとるパラメータ(式(2)ではp、γである。)の値を出力する関数である。

Figure 2007034262
First, the calculation of the value of the model order p and scale parameter gamma, using Akaike information criterion AIC on Nonlinear Model (p), the value p a to satisfy the condition of equation (2), selecting a gamma a by. Here, m represents the maximum value (arbitrary value) that the model order p can take. Also, argmin (•) is a function that outputs the value of a parameter (p and γ in equation (2)) for which the function in parentheses takes the minimum value.
Figure 2007034262

式(2)でp、γを選択するには、事前に係数φ、係数πを決定しておく必要があるため、一意にAIC(p)の値を最小とする自己回帰係数の組(モデル次数p、スケールパラメータγ、係数φ、係数π)を求めるのは困難であり、数値的最適化を行った場合も局所解を避けることが難しい。 In order to select p a and γ a in equation (2), it is necessary to determine the coefficient φ k and the coefficient π k in advance. Therefore, the autoregressive coefficient that uniquely minimizes the value of AIC (p) It is difficult to obtain a set (model order p, scale parameter γ, coefficient φ k , coefficient π k ), and it is difficult to avoid local solutions even when numerical optimization is performed.

そこで具体的には、自己回帰係数算出部(20)は、次のような各処理手順を実行し、自己回帰係数の組(モデル次数p、スケールパラメータγ、係数φ、係数π)を求めることになる。 Specifically, the autoregressive coefficient calculation unit (20) executes the following processing procedures, and sets a set of autoregressive coefficients (model order p, scale parameter γ, coefficient φ k , coefficient π k ). Will be asked.

モデル次数pとスケールパラメータγの取りうる値の範囲は予め(プログラムなどに記述するなどして)設定されているとする。ここで、“取りうる値”とは、自己回帰係数の算出をコンピュータによって実行することを前提としていることから離散値となることに留意する。モデル次数pについては、上述したとおり指数関数自己回帰モデルの項数を表すから整数値をとり、p=1,2,・・・,mとする。スケールパラメータγについては正の実数値をとり(γ=0だとARモデルになる。)、γ=γ,・・・,γfinとして[fin]個の値をとるとする。また、“範囲”については、モデル次数pの範囲は、ここでは1≦p≦mとしたが、ある2以上の整数c(≦m)に対してc≦p≦mとしてもよい。スケールパラメータγの範囲は、任意に設定することでよく、ここではγ≦γ≦γfinとした。 It is assumed that the range of values that the model order p and the scale parameter γ can take are set in advance (for example, in a program). Here, it should be noted that the “possible value” is a discrete value because it is assumed that the autoregressive coefficient is calculated by a computer. The model order p represents the number of terms in the exponential function autoregressive model as described above, and thus an integer value is taken, and p = 1, 2,..., M. The scale parameter γ is a positive real value (AR model when γ = 0), and suppose that [fin] values are taken as γ = γ 1 , γ 2 ,. As for “range”, the range of the model order p is 1 ≦ p ≦ m here, but may be c ≦ p ≦ m for an integer c (≦ m) of 2 or more. The range of the scale parameter γ may be set arbitrarily. Here, γ 1 ≦ γ ≦ γ fin is set.

まず、自己回帰係数算出部(20)は、モデル次数pおよびスケールパラメータγを任意のpおよびγに固定する。ここで“任意”としたのは、後述の処理では、固定されたモデル次数pとスケールパラメータγとの組み合わせに対する係数φ、係数πを求めるので、固定するモデル次数pおよびスケールパラメータγを昇順、降順にとる必然性がないからである。ここでは説明の便宜から、モデル次数pは昇順(p=1,p=2,・・・,p=mの順序)で順次固定するとし、スケールパラメータγは降順(γ=γfin,γ=γfin−1,・・・,γ=γの順序)で順次固定するとする。即ち、まず、自己回帰係数算出部(20)は、モデル次数をp=1に固定し(ステップS1)、スケールパラメータをγ=γfinに固定する(ステップS2)。 First, the autoregressive coefficient calculation unit (20) fixes the model order p and the scale parameter γ to arbitrary p 0 and γ 0 . Here, “arbitrary” is set because the coefficient φ k and the coefficient π k for the combination of the fixed model order p and the scale parameter γ are obtained in the later-described processing, and therefore the fixed model order p and the scale parameter γ are determined. This is because there is no necessity of ascending order and descending order. Here, for convenience of explanation, it is assumed that the model order p is sequentially fixed in ascending order (p = 1, p = 2,..., P = m order), and the scale parameter γ is in descending order (γ = γ fin , γ = γ fin−1 ,..., γ = γ 1 (in order). That is, first, the autoregressive coefficient calculation unit (20) fixes the model order to p = 1 (step S1), and fixes the scale parameter to γ = γ fin (step S2).

その後、自己回帰係数算出部(20)は、後述する最小二乗誤差推定方法によって最小二乗誤差推定値である係数φ^k(fin)、係数π^k(fin)(記号^は最尤推定量を表す。)を算出する(ステップS3)。 After that, the autoregressive coefficient calculation unit (20) uses the least square error estimation method described later to obtain a coefficient φ ^ k (fin) and a coefficient π ^ k (fin) (symbol ^ is the maximum likelihood estimator). (Step S3).

次に、自己回帰係数算出部(20)は、モデル次数をp=1に固定したまま、スケールパラメータγがγであるかを判定し(ステップS6)、γ=γであればステップS6の処理を、γ=γでなければステップS5の処理を行う。ここでは、γ=γfinであるから、自己回帰係数算出部(20)は、ステップS5の処理を実行して、スケールパラメータをγ=γfin−1にし、このときの最小二乗誤差推定値である係数φ^k(fin−1)、係数π^k(fin−1)を最小二乗誤差推定方法によって算出する(ステップS3)。この処理をスケールパラメータがγ=γになるまで繰り返すことで、モデル次数がp=1の場合における、複数の(スケールパラメータγ、係数φ、係数π)の組(γfin、φ^k(fin)、π^k(fin)p=1、(γfin−1、φ^k(fin−1)、π^k(fin−1)p=1、・・・、(γ、φ^k(1)、π^k(1)p=1が得られる。 Next, the autoregressive coefficient calculation unit (20) determines whether the scale parameter γ is γ 1 while the model order is fixed at p = 1 (step S6). If γ = γ 1 , step S6 is performed. processing of, the process of gamma = gamma 1 unless step S5. Here, since γ = γ fin , the autoregressive coefficient calculation unit (20) executes the process of step S5 to set the scale parameter to γ = γ fin−1 , and the minimum square error estimated value at this time is A certain coefficient φ ^ k (fin−1) and coefficient π ^ k (fin−1) are calculated by the least square error estimation method (step S3). By repeating this process until the scale parameter becomes γ = γ 1 , a plurality of sets (γ fin , φ ^) of (scale parameter γ, coefficient φ k , coefficient π k ) when the model order is p = 1. k (fin) , π ^ k (fin) ) p = 1 , ( γfin-1 , φ ^ k (fin-1) , π ^ k (fin-1) ) p = 1 , ..., (γ 1 , φ ^ k (1) , π ^ k (1) ) p = 1 .

次に、この段階ではγ=γが成立するので(ステップS4)、自己回帰係数算出部(20)は、モデル次数pがp=mであるかを判定し(ステップS6)、p=mであればステップS8の処理を、p=mでなければステップS7の処理を行う。この段階ではp=1であるから、自己回帰係数算出部(20)は、ステップS7の処理を実行して、モデル次数をp=2にし、ステップS2〜ステップS5の処理を繰り返して、複数の(スケールパラメータγ、係数φ、係数π)の組(γfin、φ^k(fin)、π^k(fin)p=2、(γfin−1、φ^k(fin−1)、π^k(fin−1)p=2、・・・、(γ、φ^k(1)、π^k(1)p=2を得る。 Next, since γ = γ 1 is established at this stage (step S4), the autoregressive coefficient calculation unit (20) determines whether the model order p is p = m (step S6), and p = m If so, the process of step S8 is performed. If p = m is not satisfied, the process of step S7 is performed. Since p = 1 at this stage, the autoregressive coefficient calculation unit (20) executes the process of step S7, sets the model order to p = 2, repeats the processes of step S2 to step S5, and performs a plurality of steps. (Scale parameter γ, coefficient φ k , coefficient π k ) (γ fin , φ k (fin) , π ^ k (fin) ) p = 2 , (γ fin −1 , φ ^ k (fin −1) ) , Π ^ k (fin-1) ) p = 2 ,..., (Γ 1 , φ ^ k (1) , π ^ k (1) ) p = 2 .

自己回帰係数算出部(20)は、これらの処理をモデル次数pがその最大値mとなるまで繰り返す。この結果、ステップS6でp=mが成立すると判定されたときには、γfin、φ^k(fin)、π^k(fin)p=1、(γfin−1、φ^k(fin−1)、π^k(fin−1)p=1、・・・、(γ、φ^k(1)、π^k(1)p=1、(γfin、φ^k(fin)、π^k(fin)p=2、(γfin−1、φ^k(fin−1)、π^k(fin−1)p=2、・・・、(γ、φ^k(1)、π^k(1)p=2、・・・、(γfin、φ^k(fin)、π^k(fin)p=m、(γfin−1、φ^k(fin−1)、π^k(fin−1)p=m、・・・、(γ、φ^k(1)、π^k(1)p=mが得られている。自己回帰係数算出部(20)は、これらの得られた(モデル次数p、スケールパラメータγ、係数φ、係数π)の各組ごとに赤池情報量規準AIC(p)の値を求め、AIC(p)が最小となるときのモデル次数p、スケールパラメータγ、係数φ、係数πの組み合わせを指数関数自己回帰モデルの自己回帰係数として出力する(ステップS8)。 The autoregressive coefficient calculation unit (20) repeats these processes until the model order p reaches its maximum value m. As a result, when it is determined in step S6 that p = m is satisfied, γ fin , φ ^ k (fin) , π ^ k (fin) ) p = 1 , (γ fin−1 , φ ^ k (fin− 1) , π ^ k (fin-1) ) p = 1 ,..., (Γ 1 , φ ^ k (1) , π ^ k (1) ) p = 1 , (γ fin , φ ^ k ( fin), π ^ k (fin )) p = 2, (γ fin-1, φ ^ k (fin-1), π ^ k (fin-1)) p = 2, ···, (γ 1, φ ^ k (1) , π ^ k (1) ) p = 2 ,..., (γ fin , φ ^ k (fin) , π ^ k (fin) ) p = m , (γ fin−1 , φ ^ k (fin-1) , π ^ k (fin-1) ) p = m , ..., (γ 1 , φ ^ k (1) , π ^ k (1) ) p = m is obtained. ing. The autoregressive coefficient calculation unit (20) obtains the value of the Akaike information criterion AIC (p) for each of these obtained (model order p, scale parameter γ, coefficient φ k , coefficient π k ), A combination of the model order p, the scale parameter γ, the coefficient φ k , and the coefficient π k when AIC (p) is minimized is output as an autoregressive coefficient of the exponential function autoregressive model (step S8).

<最小二乗誤差推定方法>
上述した係数φ、係数πの最小二乗誤差推定値は、音響信号x(t)〔t=1,2,・・・,n〕、モデル次数pの値、スケールパラメータγの値が既知ならば、行列α、X、Yを式(3)のように構成し、それを用いた正規方程式の解として得られる。なお、行列の右肩の文字Tは、転置行列であることを表す。

Figure 2007034262
<Least square error estimation method>
As for the estimated least square error value of the coefficient φ k and the coefficient π k described above, the acoustic signal x (t) [t = 1, 2,..., N], the value of the model order p, and the value of the scale parameter γ are known. Then, the matrices α, X, and Y are configured as shown in Equation (3) and obtained as a solution of a normal equation using the same. Note that the letter T on the right side of the matrix indicates a transposed matrix.
Figure 2007034262

式(3)のように行列α、X、Yを構成すると、係数φ、係数πの最小二乗誤差推定値であるφ^、π^を成分とする行列α^を式(4)の行列計算によって求めることができる。

Figure 2007034262
When the matrices α, X, and Y are configured as in Expression (3), the matrix α ^ including φ ^ k and π ^ k , which are the least square error estimated values of the coefficient φ k and the coefficient π k , is expressed by Expression (4). ) Matrix calculation.
Figure 2007034262

[自己回帰係数算出方法(B)]
次に、自己回帰係数算出方法(B)の処理手順を図5、図6を参照して説明する。
モデル次数pについては、上記の従来的な自己回帰係数算出方法(A)で説明したのと同様であるとする。
自己回帰係数算出方法(B)では、自己回帰係数算出部(20)は、モデル次数設定部(141)、スケールパラメータ初期値設定部(142)、係数最小二乗誤差推定演算部(143)、スケールパラメータ探索部(144)、極限周期係数探索部(145)、スケールパラメータ判定部(146)、最尤推定量出力部(147)、全最尤推定量出力部(149)、モデル次数判定部、制御部から構成され、次のような各処理手順を実行し、自己回帰係数の組(モデル次数p、スケールパラメータγ、係数φ、係数π)を求めることになる。
[Autoregressive coefficient calculation method (B)]
Next, the processing procedure of the autoregressive coefficient calculation method (B) will be described with reference to FIGS.
The model order p is assumed to be the same as that described in the conventional autoregressive coefficient calculation method (A).
In the autoregressive coefficient calculation method (B), the autoregressive coefficient calculation unit (20) includes a model order setting unit (141), a scale parameter initial value setting unit (142), a coefficient least square error estimation calculation unit (143), a scale. A parameter search unit (144), an extreme periodic coefficient search unit (145), a scale parameter determination unit (146), a maximum likelihood estimation amount output unit (147), a total maximum likelihood estimation amount output unit (149), a model order determination unit, The control unit is configured to execute each processing procedure as described below to obtain a set of autoregressive coefficients (model order p, scale parameter γ, coefficient φ k , coefficient π k ).

まず、モデル次数設定部(142)は、制御部の制御の下、モデル次数pをp=1に設定する(ステップS201)。   First, the model order setting unit (142) sets the model order p to p = 1 under the control of the control unit (step S201).

次に、スケールパラメータ初期値設定部(142)は、式(5)に基づき、スケールパラメータγの初期値γを設定する(ステップS202)。式(5)において、Max(・)は括弧内の値のうち最大値を求める関数であり、εは初期値設定因子である。初期値設定因子εは予め(スケールパラメータ初期値設定部(142)を実現するプログラムなどに記述するなどして)設定されているとする。音響信号のように、信号の振幅が大きな箇所において非線形性が小さくなるような信号の場合に、信号の振幅が最大の箇所において指数関数自己回帰モデルの指数項の自然対数の底eのべき乗の値が最小となるように、初期値設定因子εは小さな値とするのが良いが、その値として好ましくは、1.0×10−3以下の値とするのが良い。特に、1.0×10−7以下の値とすることで、より好適な自己回帰係数を得ることができる。 Next, the scale parameter initial value setting unit (142), based on the equation (5), sets an initial value gamma 0 of the scale parameter gamma (step S202). In Expression (5), Max (·) is a function for obtaining the maximum value among the values in parentheses, and ε is an initial value setting factor. It is assumed that the initial value setting factor ε is set in advance (for example, in a program for realizing the scale parameter initial value setting unit (142)). In the case of a signal whose nonlinearity is small at a location where the amplitude of the signal is large, such as an acoustic signal, the power of the base e of the natural logarithm of the exponential term of the exponential autoregressive model at the location where the signal amplitude is maximum The initial value setting factor ε is preferably a small value so that the value is minimized, but the value is preferably 1.0 × 10 −3 or less. In particular, by setting the value to 1.0 × 10 −7 or less, a more suitable autoregressive coefficient can be obtained.

スケールパラメータ初期値設定部(142)は、制御部の制御の下、外部記憶装置(17)から読み出されてRAM(15)の音響信号x(t)格納領域(1503)に格納されている音響信号x(t)を読み込み、その二乗値が最大となるときのその最大値Max(x(t))(但し1≦t≦nである。)を求め、式(5)に基づいて、スケールパラメータγの初期値γの値を求めて、これをRAM(15)のスケールパラメータ初期値γ格納領域(1505)に格納する。

Figure 2007034262
The scale parameter initial value setting unit (142) is read from the external storage device (17) and stored in the acoustic signal x (t) storage area (1503) of the RAM (15) under the control of the control unit. The acoustic signal x (t) is read, and the maximum value Max (x (t) 2 ) (where 1 ≦ t ≦ n) when the square value is maximum is obtained, and based on the equation (5). Then, the initial value γ 0 of the scale parameter γ is obtained and stored in the scale parameter initial value γ 0 storage area (1505) of the RAM (15).
Figure 2007034262

なお、スケールパラメータγの初期値γは、式(5)によってのみ定められるものではない。音響信号x(t)のうち、その絶対値が最大となる音響信号の値に基づいて、スケールパラメータγの初期値γを設定すればよく、より具体的には、音響信号x(t)のうち、その絶対値が最大となる音響信号の値に対して、スケールパラメータγの値が最小となるようにし、その最小値を初期値γとするのである。式(5)で求められる初期値γは、その一例である。 Note that the initial value γ 0 of the scale parameter γ is not determined only by the equation (5). The initial value γ 0 of the scale parameter γ may be set based on the value of the acoustic signal having the maximum absolute value among the acoustic signals x (t). More specifically, the acoustic signal x (t) Among them, the value of the scale parameter γ is minimized with respect to the value of the acoustic signal having the maximum absolute value, and the minimum value is set as the initial value γ 0 . The initial value γ 0 obtained by Expression (5) is an example.

次に、係数最小二乗誤差推定値演算部(143)は、式(6)に従って行列α、X、Yを構成し、式(7)に従って、行列αの各成分(係数φ、係数π)の最小二乗誤差推定値(係数φ^、係数π^)を成分として持つ行列α^を求める(ステップS203)。係数最小二乗誤差推定値演算部(143)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=1である。)、音響信号x(t)格納領域(1503)に格納されている音響信号x(t)、スケールパラメータ初期値γ格納領域(1505)に格納されているスケールパラメータγの初期値γを読み込み、これらの値に基づいて式(6)のように構成される行列α、X、Yから、式(7)に表される公知の最小二乗誤差推定方法(行列α、X、Yを用いた正規方程式の解)によって行列α^を求め、行列α^の成分である係数φ^、係数π^の値をRAM(15)のφ^、π^格納領域(1506)に格納する。

Figure 2007034262
Figure 2007034262
Next, the coefficient least square error estimated value calculation unit (143) constructs the matrices α, X, and Y according to Equation (6), and each component of the matrix α (coefficient φ k , coefficient π k according to Equation (7)). ) To obtain a matrix α ^ having the least square error estimated value (coefficient φ ^ k , coefficient π ^ k ) as components (step S203). The coefficient least square error estimated value calculation unit (143) controls the value of the model order p stored in the model order p storage area (1502) under the control of the control unit (p = 1 at this stage), acoustic signal x stored in the acoustic signal x (t) storage area (1503) (t), reads the initial value gamma 0 of the scale parameter gamma stored in the scale parameter initial value gamma 0 storage area (1505), Based on these values, a known least square error estimation method (matrix α, X, Y using the matrix α, X, Y) represented by equation (7) is obtained from the matrix α, X, Y configured as shown in equation (6). The matrix α ^ is obtained by (solution of the equation), and the values of the coefficients φ ^ k and coefficients π ^ k which are components of the matrix α ^ are stored in the φ ^ k , π ^ k storage area (1506) of the RAM (15). .
Figure 2007034262
Figure 2007034262

次に、スケールパラメータ探索部(144)は、式(8)に基づき、スケールパラメータγの値γ^を求める(ステップS204)。式(8)において、argmin(・)は括弧内の関数の値が最小の値を取るパラメータ(ここではスケールパラメータγ)を出力する関数である。また、式(8)のAIC(p)は、この段階におけるモデル次数pと、ステップS203で求めた(係数φ、係数π)の最小二乗誤差推定値(係数φ^、係数π^)を固定して式(2)で与えられる赤池情報量基準である。スケールパラメータ探索部(144)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=1である。)、音響信号x(t)格納領域(1503)に格納されている音響信号x(t)、スケールパラメータ初期値γ格納領域(1505)に格納されているスケールパラメータγの初期値γ、φ^、π^格納領域(1506)に格納されている係数φ^、係数π^の値を読み込み、0≦γ≦γの範囲内で、例えば勾配法(最急降下法やニュートン法など)などの数値的最適化によって、赤池情報量規準AIC(p)の値を最小とするスケールパラメータγの値γ^を求める。これをRAM(15)のγ^格納領域(1507)に格納する。

Figure 2007034262
Next, the scale parameter search unit (144) obtains the value γ ^ A of the scale parameter γ based on the equation (8) (step S204). In equation (8), argmin (·) is a function that outputs a parameter (here, a scale parameter γ) that takes the minimum value of the function in parentheses. Further, AIC (p) in Expression (8) is the model order p at this stage and the least square error estimate (coefficient φ ^ k , coefficient π ^) of (coefficient φ k , coefficient π k ) obtained in step S203. This is the Akaike information criterion given by equation (2) with k ) fixed. The scale parameter search unit (144) controls the value of the model order p stored in the model order p storage area (1502) under the control of the control unit (p = 1 at this stage), the acoustic signal x ( t) The acoustic signal x (t) stored in the storage area (1503) and the initial value γ 0 , φ ^ k , π ^ of the scale parameter γ stored in the scale parameter initial value γ 0 storage area (1505) The value of coefficient φ ^ k and coefficient π ^ k stored in the k storage area (1506) is read, and within the range of 0 ≦ γ ≦ γ 0 , for example, gradient method (steepest descent method, Newton method, etc.) A value γ ^ A of the scale parameter γ that minimizes the value of the Akaike information criterion AIC (p) is obtained by numerical optimization. This is stored in the γ ^ A storage area (1507) of the RAM (15).
Figure 2007034262

なお、情報量規準としては、赤池情報量規準AIC(p)に限定されるものではなく、その他の情報量規準(例えば、BIC(Schwarz’s Bayesian Information Criterion)など)を用いるとしてもよい。   The information criterion is not limited to the Akaike information criterion AIC (p), and other information criterion (for example, BIC (Schwarz's Bayesian Information Criterion)) may be used.

次に、係数最小二乗誤差推定値演算部(143)は、ステップS204で求められたスケールパラメータγの値γ^を式(9)のγ^として(モデル次数も固定したままであり、この段階ではp=1である。)、式(9)に従って行列α、X、Yを構成し、式(10)に従って、行列αの各成分(係数φ、係数π)の最小二乗誤差推定値(係数φ^、係数π^)を成分として持つ行列α^を求める(ステップS205)。係数最小二乗誤差推定値演算部(143)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=1である。)、音響信号x(t)格納領域(1503)に格納されている音響信号x(t)、γ^格納領域(1507)に格納されているスケールパラメータγの値γ^を読み込み、これらの値に基づいて式(9)のように構成される行列α、X、Yから、式(10)に表される公知の最小二乗誤差推定方法(行列α、X、Yを用いた正規方程式の解)によって行列α^を求め、行列α^の要素である係数φ^、係数π^の値をRAM(15)のφ^、π^格納領域(1506)に格納する。

Figure 2007034262
Figure 2007034262
Next, the coefficient least square error estimated value calculation unit (143) sets the value γ ^ A of the scale parameter γ obtained in step S204 as γ ^ in the equation (9) (the model order is also fixed, In the stage, p = 1.), The matrix α, X, Y is constructed according to the equation (9), and the least square error estimation of each component (coefficient φ k , coefficient π k ) of the matrix α according to the equation (10). A matrix α ^ having values (coefficients φ ^ k , coefficients π ^ k ) as components is obtained (step S205). The coefficient least square error estimated value calculation unit (143) controls the value of the model order p stored in the model order p storage area (1502) under the control of the control unit (p = 1 at this stage), The acoustic signal x (t) stored in the acoustic signal x (t) storage area (1503), the value γ ^ A of the scale parameter γ stored in the γ ^ A storage area (1507) are read, and these values are read. From the matrices α, X, and Y configured as shown in Equation (9) based on the above, the known least square error estimation method expressed in Equation (10) (the solution of the normal equation using the matrices α, X, and Y) ) To obtain the matrix α ^ and store the values of the coefficients φ ^ k and the coefficients π ^ k , which are elements of the matrix α ^, in the φ ^ k , π ^ k storage area (1506) of the RAM (15).
Figure 2007034262
Figure 2007034262

次に、極限周期係数探索部(145)は、式(13)に基づき、係数φ、係数πの値φ^^およびπ^^を求める(ステップS206)。極限周期係数探索部(145)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=1である。)、音響信号x(t)格納領域(1503)に格納されている音響信号x(t)、γ^格納領域(1507)に格納されているスケールパラメータγの値γ^、φ^、π^格納領域(1506)に格納されているステップS205で得られた係数φ^、係数π^の値を読み込み、この係数φ^、係数π^を係数とする式(11)の2つの固有方程式

Figure 2007034262
の固有解λ、λ (但しλ はλの共役解を表し、λおよびλ をもって式(11)の上段の固有方程式の全ての固有解を表す。つまり、例えばr個の固有解をλ01、λ02、・・・、λ0rとすると、このr個の固有解をλによって表すのである。その他も同様である。)、λ、λ (但しλ はλの共役解を表し、λおよびλ をもって式(11)の下段の固有方程式の全ての固有解を表す。)のそれぞれが、式(12)を満たす範囲で(例えば|λ>1は、上記の例でいえば、r個の固有解λ01、λ02、・・・、λ0rのそれぞれが、|λ01>1、|λ02>1、・・・、|λ0r>1であることを意味する。その他も同様である。)、
Figure 2007034262
赤池情報量規準AIC(p)を最小にする係数φ、係数πの値φ^^およびπ^^(例えばφ^^は、φの上に^が2つ付くものとする。)の組を、例えば勾配法(最急降下法やニュートン法など)などの数値的最適化により求める。極限周期係数探索部(145)は、この係数φ^^、係数π^^の値をRAM(15)のφ^^、π^^格納領域(1508)に格納する。
Figure 2007034262
Then, the limit cycle coefficient searching unit (145), based on equation (13), the coefficient phi k, determine the value phi ^^ k and [pi ^^ k coefficient [pi k (step S206). The limit period coefficient search unit (145) controls the value of the model order p stored in the model order p storage area (1502) under the control of the control unit (p = 1 at this stage), the acoustic signal x. (T) The acoustic signal x (t) stored in the storage area (1503), the value of the scale parameter γ stored in the γ ^ A storage area (1507), γ ^ A , φ ^ k , π ^ k stored The values of the coefficients φ ^ k and the coefficient π ^ k obtained in step S205 stored in the area (1506) are read, and the two values of the equation (11) using the coefficient φ ^ k and the coefficient π ^ k as the coefficients are read. Eigen equation
Figure 2007034262
Eigensolutions lambda 0 of, lambda - 0 (where lambda - 0 represents a conjugate solution of lambda 0, lambda 0 and lambda -. Represents all the specific solutions of 0 with upper characteristic equation of Equation (11) that is, for example, When r eigensolutions are λ 01 , λ 02 ,..., λ 0r , the r eigen solutions are represented by λ 0. The same applies to the others.), λ , λ ( However lambda - represents a conjugate solution of lambda ∞, lambda and lambda -. each is) representing all unique solutions of lower specific equations have equation (11), in a range satisfying equation (12) (For example, | λ 0 | 2 > 1 means that, in the above example, each of r eigensolutions λ 01 , λ 02 ,..., Λ 0r is | λ 01 | 2 > 1, | λ 02. | 2 > 1,..., | Λ 0r | 2 > 1 (the same applies to others).
Figure 2007034262
Coefficient phi k which minimizes the Akaike Information Criterion AIC (p), the coefficient [pi k values phi ^^ k and [pi ^^ k (e.g. phi ^^ is on the phi ^ is a two stick things. ) Is obtained by numerical optimization such as a gradient method (steepest descent method, Newton method, etc.). The limit periodic coefficient search unit (145) stores the values of the coefficient φ ^ k and coefficient π ^ k in the φ ^ k and π ^ k storage area (1508) of the RAM (15).
Figure 2007034262

ステップS206は、ステップS205で得られた係数φ^、π^による指数関数自己回帰モデルが音声信号のように揺らぎを持った周期信号をより良くモデル化するためには、式(11)の固有方程式を解いて得られる解λ、λ 、λ、λ について、λ、λ が単位円よりも外側、λ、λ が単位円の内側にある条件(式(12)に相当する。)を満たすことが望ましいことに基づいた処理である(上記参考文献1参照)。 In step S206, in order to better model a periodic signal in which the exponential function autoregressive model based on the coefficients φ ^ k and π ^ k obtained in step S205 has fluctuations like a speech signal, the expression (11) solutions lambda 0 obtained by solving the characteristic equation of, λ - 0, λ ∞, λ - for ∞, lambda 0, lambda - inside the the unit circle - outer, lambda ∞, lambda than 0 is the unit circle This process is based on the fact that it is desirable to satisfy the condition (corresponding to the expression (12)) (see the above-mentioned Reference 1).

次に、スケールパラメータ探索部(144)は、式(14)に基づき、スケールパラメータγの値γ^を求める(ステップS207)。式(14)のAIC(p)は、この段階におけるモデル次数pと、ステップS206で求めた(係数φ、係数π)の最小二乗誤差推定値(係数φ^^、係数π^^)を固定して式(2)で与えられる赤池情報量基準である。スケールパラメータ探索部(144)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=1である。)、音響信号x(t)格納領域(1503)に格納されている音響信号x(t)、スケールパラメータ初期値γ格納領域(1505)に格納されているスケールパラメータγの初期値γ、φ^^、π^^格納領域(1508)に格納されている係数φ^^、係数π^^の値を読み込み、0≦γ≦γの範囲内で、例えば勾配法(最急降下法やニュートン法など)などの数値的最適化によって、赤池情報量規準AIC(p)の値を最小とするスケールパラメータγの値γ^を求める。スケールパラメータ探索部(144)は、これをRAM(15)のγ^格納領域(1509)に格納する。

Figure 2007034262
Next, the scale parameter search unit (144) obtains the value γ ^ B of the scale parameter γ based on the equation (14) (step S207). The AIC (p) in equation (14) is the model order p at this stage and the least square error estimate (coefficient φ ^^ k , coefficient π ^^) of (coefficient φ k , coefficient π k ) obtained in step S206. This is the Akaike information criterion given by equation (2) with k ) fixed. The scale parameter search unit (144) controls the value of the model order p stored in the model order p storage area (1502) under the control of the control unit (p = 1 at this stage), the acoustic signal x ( acoustic signal x stored in t) storage area (1503) (t), the initial value gamma 0 of the scale parameter gamma stored in the scale parameter initial value gamma 0 storage area (1505), φ ^^ k, π ^^ coefficient k stored is stored in the area (1508) phi ^^ k, reads the value of the coefficient [pi ^^ k, in the range of 0 ≦ γ ≦ γ 0, for example, gradient method (steepest descent method or Newton's method The value γ ^ B of the scale parameter γ that minimizes the value of the Akaike information criterion AIC (p) is obtained by numerical optimization such as. The scale parameter search unit (144) stores this in the γ ^ B storage area (1509) of the RAM (15).
Figure 2007034262

以上のように、スケールパラメータ探索部(144)はスケールパラメータγの値として、γ^とγ^を求める。 As described above, the scale parameter search unit (144) obtains γ ^ A and γ ^ B as the values of the scale parameter γ.

次に、スケールパラメータ判定部(146)は、ステップS204で算出したスケールパラメータγの値γ^と、ステップS207で算出したスケールパラメータγの値γ^との差が、判定閾値ε(例えば1.0×10−10とする。)以下であるかを判定し、この判定結果を判定結果格納領域(1511)に格納する(ステップS208)。判定閾値εは予め(スケールパラメータ判定部(146)を実現するプログラムなどに記述するなどして)設定されているとする。制御部は、判定結果格納領域(1511)に格納されている判定結果を読み込み、判定閾値ε以下ではないとの判定結果の場合には、ステップS207で得られたスケールパラメータγの値γ^をスケールパラメータγの値γ^としてγ^格納領域(1507)に格納し(ステップS209)、このスケールパラメータγの値γ^に基づいて、再度ステップS205〜S207の処理を行う。このような処理は、スケールパラメータγの値γ^と、スケールパラメータγの値γ^との差が判定閾値ε以下であると判定されるまで繰り返される。 Next, the scale parameter determination unit (146) determines that the difference between the value γ ^ A of the scale parameter γ calculated in step S204 and the value γ ^ B of the scale parameter γ calculated in step S207 is a determination threshold ε 2 ( For example, it is set to 1.0 × 10 −10 ). It is assumed that the determination threshold value ε 2 is set in advance (for example, in a program that implements the scale parameter determination unit (146)). Control unit reads the determination result stored in the determination result storage area (1511), in the case of the determination result of the determination threshold ε is not 2 or less, the value of the scale parameter gamma obtained in step S207 gamma ^ B is stored as a value γ ^ A of the scale parameter γ in the γ ^ A storage area (1507) (step S209), and the processing of steps S205 to S207 is performed again based on the value γ ^ A of the scale parameter γ. Such processing is repeated until it is determined that the difference between the value γ ^ A of the scale parameter γ and the value γ ^ B of the scale parameter γ is equal to or less than the determination threshold ε 2 .

制御部は、判定結果格納領域(1511)に格納されている判定結果を読み込み、ステップS208において判定閾値ε以下であるとの判定結果である場合には、ステップS210以降の処理を実行するようにする。 Control unit, the determination result is read storage areas (1511) determination result is stored, in the case of the determination result that is determined threshold epsilon 2 or less step S208, to execute the steps S210 and subsequent steps To.

最尤推定量出力部(147)は、ステップS208において、スケールパラメータγの値γ^と、スケールパラメータγの値γ^との差が判定閾値ε以下であると判定されたときの、スケールパラメータγの値γ^をγ^格納領域(1509)から読み込んで出力し、さらに、ステップS207において、このスケールパラメータγの値γ^を与えたときの係数φ、係数πの値φ^^、π^^をφ^^、π^^格納領域(1508)から読み込んで出力することで、これらの値を最尤推定量として得る(ステップS210)。最尤推定量出力部(147)は、これらの最尤推定量をRAM(15)の最尤推定量格納領域(1512)に格納する。この最尤推定量は、モデル次数pがp=1のときのものなので、便宜的に(γ^、φ^^、π^^p=1と表すことにする。 Maximum likelihood estimator output unit (147), in step S208, when the difference between the value gamma ^ A scale parameter gamma, and the value gamma ^ B of the scale parameter gamma is determined to be the determination threshold epsilon 2 or less , The value γ ^ B of the scale parameter γ is read from the γ ^ B storage area (1509) and output, and in step S207, the coefficient φ k and the coefficient π when the value γ ^ B of the scale parameter γ is given k values φ ^ k , π ^^ k are read from the φ ^^ k , π ^^ k storage area (1508) and output, thereby obtaining these values as maximum likelihood estimators (step S 210). The maximum likelihood estimation amount output unit (147) stores these maximum likelihood estimation amounts in the maximum likelihood estimation amount storage area (1512) of the RAM (15). Since this maximum likelihood estimator is one when the model order p is p = 1, it is expressed as (γ ^ B , φ ^^ k , π ^^ k ) p = 1 for convenience.

なお、上記ステップS210は、最尤推定量出力部(147)が、ステップS208において、スケールパラメータγの値γ^と、スケールパラメータγの値γ^との差が判定閾値ε以下であると判定されたときの、スケールパラメータγの値γ^をγ^格納領域(1509)から読み込んで出力し、さらに、ステップS204(なお、ステップS209を経過した後ではステップS207である。)において、このスケールパラメータγの値γ^を与えたときの係数φ、係数πの値をφ^^、π^^格納領域(1508)から読み込んで出力し、これらの値を最尤推定量として得るようにしてもよい。 In step S210, the maximum likelihood estimator output unit (147) determines that the difference between the value γ ^ A of the scale parameter γ and the value γ ^ B of the scale parameter γ is less than or equal to the determination threshold ε 2 in step S208. The value γ ^ A of the scale parameter γ when it is determined to be present is read from the γ ^ B storage area (1509) and output, and further, step S204 (after step S209 has elapsed, step S207 is performed). ), The values of the coefficient φ k and the coefficient π k when the value γ ^ A of the scale parameter γ is given are read from the φ ^^ k and π ^^ k storage areas (1508), and output. May be obtained as the maximum likelihood estimation amount.

また、ステップS208では、判定閾値ε以下であるか否かを判定するものとしたが、判定閾値ε未満であるか否かを判定するものとしてもよい。 In step S208, it is assumed to determine whether a determination threshold epsilon 2 or less, may be intended to determine whether it is less than the determination threshold epsilon 2.

続いて、モデル次数判定部において、モデル次数p格納領域(1502)に格納されているモデル次数(この段階ではp=1である。)を読み出し、さらにモデル次数範囲格納領域(1501)に格納されている最大値mを読み出し、これらの値が等しいか否かを判定する(S211)。p=mが成立しないと判定された場合には、モデル次数設定(141)は、モデル次数pの値に1を加えてモデル次数p格納領域(1502)に格納する(ステップS212)。この段階ではp=1なのでp=2にする。   Subsequently, the model order determination unit reads the model order (p = 1 at this stage) stored in the model order p storage area (1502), and further stores it in the model order range storage area (1501). The maximum value m is read, and it is determined whether these values are equal (S211). If it is determined that p = m does not hold, the model order setting (141) adds 1 to the value of the model order p and stores it in the model order p storage area (1502) (step S212). Since p = 1 at this stage, p = 2 is set.

そして、ステップS211においてモデル次数pがp=mが成立すると判定されるまで、ステップS203〜S212の処理が繰り返される(なお、上記の式(6)、式(7)、式(8)、式(9)、式(10)、式(11)、式(13)、式(14)における記号pの値は、ステップS212で更新された値になる。)。この結果、ステップS211でp=mが成立すると判定されたときには、モデル次数pの各値(p=1、2、・・・、m)に対する最尤推定量(γ^、φ^^、π^^p=1、(γ^、φ^^、π^^p=2、・・・、(γ^、φ^^、π^^p=mが最尤推定量格納領域(1512)に格納されたことになる。全最尤推定量出力部(20)は、最尤推定量格納領域(1512)から、これらの得られた(モデル次数p、スケールパラメータγ、係数φ、係数π)の組を読み込んで、各組ごとに赤池情報量規準AIC(p)の値を求め、AIC(p)が最小となるときのモデル次数p、スケールパラメータγ、係数φ、係数πの組み合わせを指数関数自己回帰モデルの自己回帰係数として出力し、全最尤推定量格納領域(1514)に格納する(ステップS213)。 Then, the processing of steps S203 to S212 is repeated until it is determined in step S211 that the model order p is p = m (note that the above equations (6), (7), (8), (9), the expression (10), the expression (11), the expression (13), and the value of the symbol p in the expression (14) are the values updated in step S212. As a result, when it is determined in step S211 that p = m is established, the maximum likelihood estimator (γ ^ B , φ ^^ k ) for each value (p = 1, 2,..., M) of the model order p. , Π ^^ k ) p = 1 , (γ ^ B , φ ^^ k , π ^^ k ) p = 2 ,..., (Γ ^ B , φ ^^ k , π ^^ k ) p = m is stored in the maximum likelihood estimation amount storage area (1512). The total maximum likelihood estimator output unit (20) reads a set of these obtained (model order p, scale parameter γ, coefficient φ k , coefficient π k ) from the maximum likelihood estimator storage area (1512). The value of the Akaike information criterion AIC (p) is obtained for each group, and the combination of the model order p, the scale parameter γ, the coefficient φ k , and the coefficient π k when the AIC (p) is minimized is an exponential autoregressive function. The model is output as an autoregressive coefficient and stored in the total maximum likelihood estimator storage area (1514) (step S213).

<自己回帰係数算出方法(B)の変形例1>
以下に、上記の自己回帰係数算出方法(B)の変形例1を図7、図8を参照して説明する。
上記の自己回帰係数算出方法(B)では、ステップS206の処理を実行して係数φ、係数πの値φ^^およびπ^^を求めたが、この処理を省略することで演算量を減少させ、演算時間を短縮することができる。
即ち、自己回帰係数算出方法(B)の変形例1は、ステップS206の処理を省略するものである。
この場合、自己回帰係数算出方法(B)の変形例1のステップS207における係数φ、πの値φ^^、π^^は、自己回帰係数算出方法(B)の変形例1のステップS205で得られた係数φ^、π^の値によることになる。その他のステップにおける処理は、自己回帰係数算出方法(B)における処理と同様である。
<Variation 1 of autoregressive coefficient calculation method (B)>
Below, the modification 1 of said autoregressive coefficient calculation method (B) is demonstrated with reference to FIG. 7, FIG.
In the autoregressive coefficient calculation method (B) described above, the process of step S206 is executed to obtain the coefficient φ k and the values φ ^^ k and π ^^ k of the coefficient π k . However, by omitting this process, The amount of calculation can be reduced and the calculation time can be shortened.
That is, in the first modification of the autoregressive coefficient calculation method (B), the process of step S206 is omitted.
In this case, the coefficients φ k and π k values φ ^ k and π ^^ k in step S207 of the first modification of the autoregressive coefficient calculation method (B) are the first modification of the autoregressive coefficient calculation method (B). This depends on the values of the coefficients φ ^ k and π ^ k obtained in step S205. Processing in other steps is the same as the processing in the autoregressive coefficient calculation method (B).

<自己回帰係数算出方法(B)の変形例2>
以下に、上記の自己回帰係数算出方法(B)の変形例2を図9、図10を参照して説明する。
上記の自己回帰係数算出方法(B)では、モデル次数pをp=1,2,・・・,mとして、モデル次数ごとに自己回帰係数を求めたが、自己回帰係数算出方法(B)の変形例2では、モデル次数pを適宜1つの値qに固定する。つまり、自己回帰係数算出方法(B)において、上記のステップS211、S212、S213が不要になる。このようにすることで、さらに演算量を減少させ、演算時間を短縮することができる。その他のステップにおける処理は、自己回帰係数算出方法(B)における処理と同様である。
<Modification 2 of autoregressive coefficient calculation method (B)>
Below, the modification 2 of said autoregressive coefficient calculation method (B) is demonstrated with reference to FIG. 9, FIG.
In the autoregressive coefficient calculation method (B), the model order p is set to p = 1, 2,..., M, and the autoregressive coefficient is obtained for each model order. In the second modification, the model order p is appropriately fixed to one value q. That is, in the autoregressive coefficient calculation method (B), the above steps S211, S212, and S213 are not required. By doing so, the amount of calculation can be further reduced and the calculation time can be shortened. Processing in other steps is the same as the processing in the autoregressive coefficient calculation method (B).

<自己回帰係数算出方法(B)の変形例3>
以下に、上記の自己回帰係数算出方法(B)の変形例3を図11、図12を参照して説明する。
上記の自己回帰係数算出方法(B)の変形例1では、モデル次数pをp=1,2,・・・,mとして、モデル次数ごとに自己回帰係数を求めたが、自己回帰係数算出方法(B)の変形例2では、モデル次数pを適宜1つの値qに固定する。つまり、自己回帰係数算出方法(B)の変形例1において、上記のステップS211、S212、S213が不要になる。このようにすることで、さらに演算量を減少させ、演算時間を短縮することができる。その他のステップにおける処理は、自己回帰係数算出方法(B)の変形例1における処理と同様である。
<Modification 3 of autoregressive coefficient calculation method (B)>
Below, the modification 3 of said autoregressive coefficient calculation method (B) is demonstrated with reference to FIG. 11, FIG.
In the modified example 1 of the autoregressive coefficient calculation method (B), the model order p is set to p = 1, 2,..., M, and the autoregressive coefficient is obtained for each model order. In the second modification of (B), the model order p is appropriately fixed to one value q. That is, in the modified example 1 of the autoregressive coefficient calculation method (B), the above steps S211, S212, and S213 are not necessary. By doing so, the amount of calculation can be further reduced and the calculation time can be shortened. The processing in other steps is the same as the processing in Modification 1 of the autoregressive coefficient calculation method (B).

<自己回帰係数算出方法(B)の変形例4>
以下に、上記の自己回帰係数算出方法(B)の変形例4を説明する。
自己回帰係数算出方法(B)の変形例4は、以上に説明した自己回帰係数算出方法(B)、自己回帰係数算出方法(B)の変形例1、自己回帰係数算出方法(B)の変形例2、自己回帰係数算出方法(B)の変形例3のいずれかの方法において、ステップS205以降の処理を実行せず、ステップS204で求められたスケールパラメータγ(γ^)を自己回帰係数算出部(20)の出力とする。
<Modification 4 of autoregressive coefficient calculation method (B)>
Below, the modification 4 of said autoregressive coefficient calculation method (B) is demonstrated.
Modification 4 of the autoregressive coefficient calculation method (B) includes the autoregressive coefficient calculation method (B), the first modification of the autoregressive coefficient calculation method (B), and the modification of the autoregressive coefficient calculation method (B). In any one of the methods of Example 2 and Modification 3 of the autoregressive coefficient calculation method (B), the processing after step S205 is not executed, and the scale parameter γ (γ ^ A ) obtained in step S204 is used as the autoregressive coefficient. The output of the calculation unit (20).

<信号判定>
以上のようにして、自己回帰係数算出部(20)は、音響信号x(t)に基づいて、この音響信号x(t)を表現する指数関数自己回帰モデルのスケールパラメータγ(その他の自己回帰係数)を算出する。算出されたスケールパラメータγ(その他の自己回帰係数)は、適宜RAM(15)などに記憶保存される。
このようにして得られたスケールパラメータγは、信号判定部(21)の入力となる。
<Signal judgment>
As described above, the autoregressive coefficient calculation unit (20), based on the acoustic signal x (t), the scale parameter γ (another autoregressive) of the exponential function autoregressive model expressing the acoustic signal x (t). Coefficient). The calculated scale parameter γ (other autoregressive coefficient) is appropriately stored in the RAM (15) or the like.
The scale parameter γ thus obtained becomes an input to the signal determination unit (21).

信号判定部(21)は、RAM(15)に保存記憶されたスケールパラメータγを読み込み、音響信号x(t)が目的信号であるか否かを判定する。信号判定部(21)における信号判定方法を以下に説明する。
図13は、閾値に基づく信号判定方法の処理を示すフローチャートである。
図14は、サポートベクターマシンに基づく信号判定方法の処理を示すフローチャートである。
The signal determination unit (21) reads the scale parameter γ stored and stored in the RAM (15) and determines whether or not the acoustic signal x (t) is a target signal. A signal determination method in the signal determination unit (21) will be described below.
FIG. 13 is a flowchart illustrating processing of a signal determination method based on a threshold.
FIG. 14 is a flowchart showing processing of a signal determination method based on a support vector machine.

<閾値に基づく判定>
まず、信号判定閾値τとの大小比較によって信号判定する方法を説明する。
信号判定閾値τは、予め(信号判定部(21)を実現するプログラムなどに記述するなどして)設定されているとする。
スケールパラメータγと音響信号との関係では、上述したとおり、音響信号が音声信号のような目的信号の場合はスケールパラメータγの値が小さくなり、音響信号が雑音信号のような目的外信号の場合はスケールパラメータγの値は大きくなる。このことは、予め設定された信号判定閾値τとスケールパラメータγの大小判定することで信号判定が行えることを示す。
<Determination based on threshold>
First, a method for determining a signal by comparing with the signal determination threshold τ will be described.
It is assumed that the signal determination threshold τ is set in advance (for example, in a program that implements the signal determination unit (21)).
Regarding the relationship between the scale parameter γ and the acoustic signal, as described above, when the acoustic signal is a target signal such as an audio signal, the value of the scale parameter γ decreases, and the acoustic signal is a non-target signal such as a noise signal. The value of the scale parameter γ increases. This indicates that signal determination can be performed by determining the magnitude of the preset signal determination threshold τ and the scale parameter γ.

そこで、信号判定部(21)を実現するプログラムにおいて、τとγの大小判定でτ>γが成立する場合には「目的信号である」ことを出力し、τ>γが成立しない場合には「目的外信号である」あるいは「目的信号ではない」ことを出力するように対応付けて記述しておく。具体的には、「目的信号である」場合には論理値1を出力し、「目的外信号である」あるいは「目的信号ではない」場合には論理値0を出力するようにする。このプログラムがDSP(14)で解釈実行されて実現する信号判定部(21)は、予め設定された信号判定閾値τと自己回帰係数算出部(20)によって算出されたスケールパラメータγとの大小判定をし(ステップS50)、τ>γが成立する場合には目的信号であると判定して論理値1を出力し(ステップS51)、それ以外の場合には目的外信号である(あるいは目的信号ではない)と判定して論理値0を出力する(ステップS52)。この出力が信号判定装置(1)の出力となる。   Therefore, in the program that realizes the signal determination unit (21), when τ> γ is satisfied in the determination of τ and γ, it is output that “is the target signal”, and when τ> γ is not satisfied. It is described in association with each other so as to output “is a non-target signal” or “not a target signal”. Specifically, a logical value 1 is output when “is a target signal”, and a logical value 0 is output when “is a non-target signal” or “not a target signal”. The signal determination unit (21) realized by interpreting and executing this program by the DSP (14) determines the magnitude between the preset signal determination threshold τ and the scale parameter γ calculated by the autoregressive coefficient calculation unit (20). (Step S50), if τ> γ holds, the signal is determined to be a target signal and a logical value 1 is output (step S51). Otherwise, it is a non-target signal (or target signal). Is not) and a logical value 0 is output (step S52). This output becomes the output of the signal determination device (1).

なお、予め設定された信号判定閾値τと自己回帰係数算出部(20)によって算出されたスケールパラメータγとの大小判定に限定するものではない。自己回帰係数算出部(20)によって算出されたスケールパラメータγ以外の自己回帰係数(例えば係数πの平均値)と信号判別閾値τとの大小判定によって信号判定するものでもよいし、あるいは、スケールパラメータγを他の自己回帰係数で適宜重み付けした値と信号判定閾値との大小判定するとしてもよく、信号の種類や性質などに応じて適宜に変更可能である。 Note that the present invention is not limited to the magnitude determination between the preset signal determination threshold τ and the scale parameter γ calculated by the autoregressive coefficient calculation unit (20). Autoregressive coefficient calculation unit (20) may be one signal determined by size determination of the autoregressive coefficients other than has been scaled parameter γ to calculate (for example the average value of the coefficient [pi k) and the signal discrimination threshold tau 1 by or, The magnitude of the scale parameter γ appropriately weighted with another autoregressive coefficient and the signal determination threshold may be determined, and can be changed as appropriate according to the type and nature of the signal.

<パターン認識に基づく信号判定>
次に、パターン認識によって信号判定する方法を説明する。
信号判定部(21)は、パターン認識におけるいわゆる識別器として機能する。スケールパラメータγは、パターン認識における特徴量に相当する。スケールパラメータγ以外の自己回帰係数についても音響信号の特徴量であるから、これらの複数の自己回帰係数を特徴量としてパターン認識を行うことも可能である。ここでは説明の便宜から、スケールパラメータγのみをパターン認識における特徴量とする。
<Signal judgment based on pattern recognition>
Next, a method for determining a signal by pattern recognition will be described.
The signal determination unit (21) functions as a so-called discriminator in pattern recognition. The scale parameter γ corresponds to a feature amount in pattern recognition. Since the autoregressive coefficients other than the scale parameter γ are also feature quantities of the acoustic signal, pattern recognition can be performed using these autoregressive coefficients as feature quantities. Here, for convenience of explanation, only the scale parameter γ is used as a feature amount in pattern recognition.

パターン認識方法には種々の方法があり、その例としては、サポートベクターマシン(Support Vector Machine)、K−NN法(K-Nearest Neighbor Method)、隠れマルコフモデル(Hidden Markov Model)、ニューラルネットワーク(Neural Network)などがある。本発明においては、特に限定されることなくこれらのパターン認識方法が適用可能である。
ここでは、サポートベクターマシンによる場合を説明する。
There are various pattern recognition methods, such as Support Vector Machine, K-Nearest Neighbor Method, Hidden Markov Model, Neural Network (Neural). Network). In the present invention, these pattern recognition methods can be applied without particular limitation.
Here, a case using a support vector machine will be described.

<サポートベクターマシン>
サポートベクターマシンは、(非線形識別器に拡張可能な)線形識別器の一種であり、識別関数f(x)で表現される。例えば、あるデータXの入力に対し、出力f(X)が正ならば、データXはクラスAに識別され、出力f(X)が負ならば、データXはクラスBに識別される。サポートベクターマシンに相当する信号判定部(21)は、スケールパラメータγの入力に対し、(入力されたスケールパラメータγに対応する)音響信号x(t)が目的信号であるか否かを識別する。
<Support vector machine>
The support vector machine is a kind of linear classifier (extendable to a non-linear classifier) and is expressed by a discrimination function f (x). For example, if the output f (X) is positive for an input of certain data X, the data X is identified as class A, and if the output f (X) is negative, the data X is identified as class B. The signal determination unit (21) corresponding to the support vector machine identifies whether or not the acoustic signal x (t) (corresponding to the input scale parameter γ) is the target signal with respect to the input of the scale parameter γ. .

信号判定部(21)は、予めの「学習」によって得られた識別関数で表現される処理を実行する。予めの「学習」は、次のようにして行う。
まず、信号種別(目的信号および目的外信号であり、これらが「クラス」に相当する。)が既知である複数(学習精度を向上させるためにも、十分に多数であることが好ましい。)の信号のスケールパラメータγの値をそれぞれ求め、各スケールパラメータγの値に対して目的種別に応じた値(これをクラス値と呼ぶことにし、クラス値は、例えば、目的信号であれば1、目的外信号であれば−1とする。)を対応付ける。このようにしてスケールパラメータγとクラス値とが対応付けられた集合を学習データと呼ぶことにする。
The signal determination unit (21) executes a process expressed by a discriminant function obtained in advance by “learning”. Pre-learning is performed as follows.
First, a plurality of signals (preferably sufficiently large in order to improve learning accuracy) whose signal types (the target signal and the non-target signal, which correspond to “class”) are known. Each value of the scale parameter γ of the signal is obtained, and a value corresponding to the purpose type for each value of the scale parameter γ (this will be referred to as a class value. If it is an external signal, it is set to -1.). A set in which the scale parameter γ is associated with the class value in this way is referred to as learning data.

このようにして得られた学習データに基づき、クラス値で分別される2種類のデータ(目的信号に対応したスケールパラメータγ、目的外信号に対応したスケールパラメータγ)を分離する超平面(この場合は0次元の超平面である。)と、クラス値で分別される2種類のデータとの距離(これを「マージン」という。)が最大となる分離超平面を求める。分離超平面を学習データから求めることは、学習データを間違うことなく2種類のクラスに識別するという制約条件の下、マージンを表す関数をラグランジュ未定乗数法によって定式化することで、2次計画問題に帰着する。この2次計画問題を数値計算によって解くことによって、識別関数のパラメータ(識別関数の係数)が得られる。   A hyperplane (in this case) that separates two types of data (scale parameter γ corresponding to the target signal and scale parameter γ corresponding to the non-target signal) that are classified by the class value based on the learning data thus obtained Is a 0-dimensional hyperplane) and a separation hyperplane that maximizes the distance between two types of data sorted by class value (this is referred to as “margin”). Finding the separation hyperplane from the training data is a quadratic programming problem by formulating a function representing the margin by the Lagrange undetermined multiplier method under the constraint that the training data is discriminated into two types without mistakes. To return to. By solving this quadratic programming problem by numerical calculation, parameters of the discriminant function (coefficients of the discriminant function) are obtained.

ここでは、スケールパラメータγのみを(音響)信号特徴として用いているので、識別関数f(x)は、f(x)=w・x+bで表現される。この識別関数f(x)の係数wおよびbが2次計画問題の数値計算によって求められるのである。   Here, since only the scale parameter γ is used as the (acoustic) signal feature, the discriminant function f (x) is expressed by f (x) = w · x + b. The coefficients w and b of the discriminant function f (x) are obtained by numerical calculation of the quadratic programming problem.

以上のようにして学習データから得られた係数wおよびbによって表現される識別関数f(x)に基づく処理を、信号判定部(21)は実行する。上記の例でいえば、学習データにおいて、目的信号のクラス値を1(正)、目的外信号のクラス値を−1(負)に対応付けたので、信号判定部(21)は、スケールパラメータγの入力に対して識別関数f(x=γ)を求め、この値が0以上であるか否かを判定し(ステップS53)、この値が0以上であれば、目的信号であることを表す論理値1を出力し(ステップS54)、f(x=γ)の値が負であれば目的外信号である(あるいは目的信号はない)ことを表す論理値0を出力する(ステップS55)。この出力が信号判定装置(1)の出力となる。   The signal determination unit (21) executes processing based on the discriminant function f (x) expressed by the coefficients w and b obtained from the learning data as described above. In the above example, since the class value of the target signal is associated with 1 (positive) and the class value of the non-target signal is associated with −1 (negative) in the learning data, the signal determination unit (21) A discrimination function f (x = γ) is obtained with respect to the input of γ, and it is determined whether or not this value is 0 or more (step S53). A logical value 1 is output (step S54), and if the value of f (x = γ) is negative, a logical value 0 indicating that the signal is a non-target signal (or there is no target signal) is output (step S55). . This output becomes the output of the signal determination device (1).

以上では、(音響)信号特徴としてスケールパラメータγのみを用いたが、自己回帰係数算出部(20)によって算出されたその他の自己回帰係数を用いることも可能であり、上述したのと同様の方法で識別関数が求められる。そして、信号判定部(21)は、識別関数を求めるために用いた自己回帰係数を入力として、この識別関数で表現される処理を実行する。また、用いる自己回帰係数を1種類とするのではなく、複数の種類とすることもできる。   In the above, only the scale parameter γ is used as the (acoustic) signal feature, but other autoregressive coefficients calculated by the autoregressive coefficient calculating unit (20) can also be used, and the same method as described above The discriminant function is obtained. And the signal determination part (21) performs the process represented by this discriminant function by using the autoregressive coefficient used for obtaining the discriminant function as an input. Further, the autoregressive coefficient to be used is not limited to one type but can be a plurality of types.

本発明においては、サポートベクターマシンの識別関数を学習によって求めることは主要な構成要素ではなく、学習によって得られた識別関数に基づく信号判定に意義を有する。サポートベクターマシンの識別関数の学習は公知のものによればよく、例えば参考文献4を参照のこと。
(参考文献4) 津田宏治著、「サポートベクターマシンとは何か」、電子情報通信学会誌、2000、p460〜466
In the present invention, obtaining the discriminant function of the support vector machine by learning is not a main component, but has significance in signal determination based on the discriminant function obtained by learning. Learning of the discriminant function of the support vector machine may be based on a known one, for example, see Reference 4.
(Reference 4) Koji Tsuda, “What is Support Vector Machine”, IEICE Journal, 2000, p.

以上のようにして、音響信号x(t)が目的信号であるか目的外信号であるかが判定されたことになる。
ところで、ここでの音響信号x(t)は、既に説明のとおり、あるフレームの音響信号x(t[R])〔i=R〕である。以上に説明した信号判定を各フレームの音響信号x(t[i])〔i=1,2,・・・,F〕に対して行うことで、全てのフレームの音響信号に対して信号判定を行うことができる。つまり、1番目のフレームの音響信号x(t[1])について信号判定を行い、次いで、2番目のフレームの音響信号x(t[2])について信号判定を行い、この処理をF番目のフレームの音響信号x(t[F])まで繰り返すことで、全てのフレームの音響信号について信号判定を行うことができるのである。
As described above, it is determined whether the acoustic signal x (t) is a target signal or a non-target signal.
By the way, the acoustic signal x (t) here is an acoustic signal x R (t [R] ) [i = R] of a certain frame as already described. The signal determination described above is performed on the acoustic signals x i (t [i] ) [i = 1, 2,... Judgment can be made. That is, signal determination is performed for the acoustic signal x 1 (t [1] ) of the first frame, then signal determination is performed for the acoustic signal x 2 (t [2] ) of the second frame, and this processing is performed as F By repeating up to the acoustic signal x F (t [F] ) of the second frame, signal determination can be performed for the acoustic signals of all frames.

<第2実施形態>
次に、本発明の信号判定装置・方法の第2実施形態を、図15を参照して説明する。
図15は、第2実施形態における信号判定装置(1)の機能構成図である。
第1実施形態では、各フレームの音響信号x(t[i])〔i=1,2,・・・,F〕ごとに信号判定を行ったが、第2実施形態は、全てのフレームの音響信号x(t[i])について、それぞれのスケールパラメータγ〔i=1,2,・・・,F〕を算出し、次いで、スケールパラメータγ〔i=1,2,・・・,F〕から全てのフレームの音響信号x(t[i])の信号判定を行う。第2実施形態における信号判定装置のハードウェア構成や機能構成などは第1実施形態と同じであるから、第1実施形態と異なる点についてのみ説明を加える。
Second Embodiment
Next, a second embodiment of the signal determination apparatus / method of the present invention will be described with reference to FIG.
FIG. 15 is a functional configuration diagram of the signal determination device (1) in the second embodiment.
In the first embodiment, the signal determination is performed for each frame of the acoustic signal x i (t [i] ) [i = 1, 2,..., F]. the acoustic signal x i (t [i]) , each of the scale parameter gamma i [i = 1, 2, · · ·, F] is calculated, then the scale parameter gamma i [i = 1, 2, · .., F] to perform signal determination of the acoustic signals x i (t [i] ) of all frames. Since the hardware configuration and functional configuration of the signal determination apparatus in the second embodiment are the same as those in the first embodiment, only the differences from the first embodiment will be described.

まず、自己回帰係数算出部(20)は、信号判定装置(1)に入力された全てのフレームの音響信号x(t[i])について、1番目のフレームの音響信号x(t[1])のスケールパラメータγを算出し、2番目のフレームの音響信号x(t[2])のスケールパラメータγを算出し、この処理をF番目のフレームの音響信号x(t[F])まで繰り返すことで、全てのフレームの音響信号についてスケールパラメータγ〔i=1,2,・・・,F〕を算出する。算出されたスケールパラメータγ〔i=1,2,・・・,F〕は、適宜RAM(15)などに保存記憶される。次いで、信号判定部(21)は、RAM(15)に保存記憶されたスケールパラメータγ〔i=1,2,・・・,F〕を読み込み、それぞれのスケールパラメータγ〔i=1,2,・・・,F〕に基づいて、各スケールパラメータγに対応する音響信号x(t[i])の信号判定を行う。 First, the autoregressive coefficient calculation unit (20) performs the acoustic signal x 1 (t [ 1 ] of the first frame on the acoustic signals x i (t [i] ) of all frames input to the signal determination device (1) . 1]) is calculated scale parameter gamma 1 of calculating the scale parameter gamma 2 of the audio signal of the second frame x 2 (t [2]), the acoustic signal x F (t of F-th frame of this process [F] ), the scale parameter γ i [i = 1, 2,..., F] is calculated for the acoustic signals of all frames. The calculated scale parameters γ i [i = 1, 2,..., F] are appropriately stored and stored in the RAM (15) or the like. Then, the signal determining unit (21), RAM (15) scale parameter stored stored in the gamma i [i = 1, 2, · · ·, F] reads, each scale parameter gamma i [i = 1, 2,..., F], the signal determination of the acoustic signal x i (t [i] ) corresponding to each scale parameter γ i is performed.

なお、自己回帰係数算出部(20)による自己回帰係数算出方法および信号判定部(21)による信号判定方法は、第1実施形態で説明したのと同様である。   The autoregressive coefficient calculation method by the autoregressive coefficient calculation unit (20) and the signal determination method by the signal determination unit (21) are the same as described in the first embodiment.

<第3実施形態>
次に、本発明の信号判定装置・方法の第3実施形態を、図16、図17を参照して説明する。
図16は、第3実施形態の信号判定装置(2)の機能構成図である。
図17は、第3実施形態の信号判定装置(2)における信号判定処理の流れを示すフローチャートである。
第2実施形態では、全てのフレームの音響信号x(t[i])について、それぞれのスケールパラメータγ〔i=1,2,・・・,F〕を算出し、次いで、スケールパラメータγ〔i=1,2,・・・,F〕から全てのフレームの音響信号x(t[i])の信号判定を行うとした。第3実施形態では、スケールパラメータγの振幅(大きさ)が各フレームの音響信号によって異なることを考慮し、その影響が信号判定に及ばないようにするため、自己回帰係数算出部(20)によって算出されたスケールパラメータγ〔i=1,2,・・・,F〕の正規化を行う。そこで、第2実施形態と異なる点についてのみ説明を加える。
<Third Embodiment>
Next, a third embodiment of the signal determination apparatus / method of the present invention will be described with reference to FIGS.
FIG. 16 is a functional configuration diagram of the signal determination device (2) of the third embodiment.
FIG. 17 is a flowchart illustrating a flow of signal determination processing in the signal determination device (2) of the third embodiment.
In the second embodiment, the scale parameters γ i [i = 1, 2,..., F] are calculated for the acoustic signals x i (t [i] ) of all frames, and then the scale parameter γ The signal determination of the acoustic signals x i (t [i] ) of all frames is performed from i [i = 1, 2,..., F]. In the third embodiment, in consideration of the fact that the amplitude (magnitude) of the scale parameter γ differs depending on the acoustic signal of each frame, the autoregressive coefficient calculation unit (20) uses the influence of the influence on the signal determination. Normalization of the calculated scale parameter γ i [i = 1, 2,..., F] is performed. Therefore, only the differences from the second embodiment will be described.

第3実施形態の信号判定装置(2)の外部記憶装置には、信号判定のためのプログラムおよびこのプログラムの処理において必要となるデータなどが保存記憶されている〔外部記憶装置が無い場合には、例えばプログラムを読み出し専用記憶装置であるROMに保存記憶させておけばよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に保存記憶される。   The external storage device of the signal determination device (2) of the third embodiment stores and stores a signal determination program and data necessary for processing of this program [when there is no external storage device] For example, the program may be stored in a ROM that is a read-only storage device. ]. Further, data obtained by the processing of these programs is appropriately stored and stored in a RAM or an external storage device.

より具体的には、信号判定装置(2)の外部記憶装置〔あるいはROMなど〕には、音響信号を表現する指数関数自己回帰モデルのスケールパラメータγを得るためのプログラム、スケールパラメータγの正規化を行うためのプログラム、スケールパラメータγから音響信号が目的信号であるか否かを判定するためのプログラム、およびこれらのプログラムの処理において必要となるデータ(音響信号など)などが保存記憶されている(なお、上述したストリーム処理を行う場合には、音響信号に窓関数を適用してフレームを切出す音響信号切出手段を実現するためのプログラムも保存記憶しておく。)。その他、これらのプログラムに基づく処理を制御するための制御プログラムも適宜に保存しておく。   More specifically, in the external storage device (or ROM, etc.) of the signal determination device (2), a program for obtaining the scale parameter γ of the exponential function autoregressive model expressing the acoustic signal, normalization of the scale parameter γ A program for determining whether or not the acoustic signal is the target signal from the scale parameter γ, and data (such as an acoustic signal) necessary for processing these programs are stored and stored. (Note that when performing the above-described stream processing, a program for realizing acoustic signal extraction means for extracting a frame by applying a window function to the acoustic signal is also stored.) In addition, a control program for controlling processing based on these programs is also stored as appropriate.

第3実施形態に係る信号判定装置(2)では、外部記憶装置〔あるいはROMなど〕に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAM(15)に読み込まれて、DSP(14)で解釈実行・処理される。その結果、DSP(14)が所定の機能(自己回帰係数算出部、正規化部、信号判定部、さらには必要に応じて音響信号切出部)を実現することで、信号判定が実現される。   In the signal determination device (2) according to the third embodiment, each program stored in an external storage device (or ROM, etc.) and data necessary for processing each program are read into the RAM (15) as necessary. Then, the interpretation is executed and processed by the DSP (14). As a result, the DSP (14) realizes predetermined functions (autoregressive coefficient calculation unit, normalization unit, signal determination unit, and, if necessary, an acoustic signal extraction unit), thereby realizing signal determination. .

第2実施形態で説明したように、まず、自己回帰係数算出部(20)は、信号判定装置(2)に入力された全てのフレームの音響信号x(t[i])について、1番目のフレームの音響信号x(t[1])のスケールパラメータγを算出し、2番目のフレームの音響信号x(t[2])のスケールパラメータγを算出し、この処理をF番目のフレームの音響信号x(t[F])まで繰り返すことで、全てのフレームの音響信号についてスケールパラメータγ〔i=1,2,・・・,F〕を算出する(ステップS56)。算出されたスケールパラメータγ〔i=1,2,・・・,F〕は、適宜RAM(15)などに保存記憶される。次いで、正規化部(22)は、RAM(15)に保存記憶されたスケールパラメータγ〔i=1,2,・・・,F〕を読み込み、式(15)に従って、スケールパラメータγ〔i=1,2,・・・,F〕の正規化を行う(ステップS57)。γ は、正規化で得られた値を表す。max(・)とmin(・)は、それぞれ、最大値、最小値を求める関数を表す。

Figure 2007034262
As described in the second embodiment, first, the autoregressive coefficient calculation unit (20) performs the first operation on the acoustic signals x i (t [i] ) of all frames input to the signal determination device (2). calculates the scale parameter gamma 1 of the audio signal frame x 1 in (t [1]), to calculate the scale parameter gamma 2 of the second frame acoustic signal x 2 (t [2]) , the process F By repeating up to the acoustic signal x F (t [F] ) of the first frame, the scale parameter γ i [i = 1, 2,..., F] is calculated for the acoustic signals of all frames (step S56). . The calculated scale parameters γ i [i = 1, 2,..., F] are appropriately stored and stored in the RAM (15) or the like. Next, the normalization unit (22) reads the scale parameter γ i [i = 1, 2,..., F] stored and stored in the RAM (15), and according to the equation (15), the scale parameter γ i [ i = 1, 2,..., F] is normalized (step S57). γ - i represents a value obtained by normalization. max (·) and min (·) represent functions for obtaining a maximum value and a minimum value, respectively.
Figure 2007034262

式(15)で表される正規化は、信号判定装置(2)の入力となった全てのフレームの音響信号x(t[i])に対し、γ の最小値が0、最大値が1になるような正規化を行うことを示す。無論、このような正規化に限定するものではなく、例えば、γの平均、分散、標準偏差など他の統計量を用いて、γ の値の範囲を0≦γ ≦1に限定せず、一定の範囲にγ の値が収まるような正規化を行ってもよい。 In the normalization expressed by the equation (15), the minimum value of γ - i is 0 and the maximum for the acoustic signals x i (t [i] ) of all frames that are input to the signal determination device (2). Indicates that normalization is performed so that the value becomes 1. Of course, such is not limited to the normalization, for example, gamma mean i, dispersion, using other statistics such as standard deviation, gamma - the range of values of i 0 ≦ γ - the i ≦ 1 Without limitation, normalization may be performed so that the value of γ - i falls within a certain range.

正規化部(22)によって算出された正規化されたスケールパラメータγ 〔i=1,2,・・・,F〕は、適宜RAM(15)などに保存記憶される。次いで、信号判定部(21)は、RAM(15)に保存記憶されたスケールパラメータγ 〔i=1,2,・・・,F〕を読み込み、それぞれのスケールパラメータγ 〔i=1,2,・・・,F〕に基づいて、各スケールパラメータγ に対応する音響信号x(t[i])の信号判定を行う(ステップS58)。 The normalized scale parameter γ - i [i = 1, 2,..., F] calculated by the normalization unit (22) is appropriately stored and stored in the RAM (15) or the like. Next, the signal determination unit (21) reads the scale parameters γ - i [i = 1, 2,..., F] stored and stored in the RAM (15), and each scale parameter γ - i [i = Based on 1, 2,..., F], signal determination of the acoustic signal x i (t [i] ) corresponding to each scale parameter γ - i is performed (step S58).

なお、自己回帰係数算出部(20)による自己回帰係数算出方法および信号判定部(21)による信号判定方法は、第1実施形態で説明したのと同様である。   The autoregressive coefficient calculation method by the autoregressive coefficient calculation unit (20) and the signal determination method by the signal determination unit (21) are the same as described in the first embodiment.

<第4実施形態>
次に、本発明の信号判定装置・方法の第4実施形態を、図18、図19を参照して説明する。
図18は、第4実施形態の信号判定装置(3)の機能構成図である。
図19は、第4実施形態の信号判定装置(3)における信号判定処理の流れを示すフローチャートである。
第2実施形態では、全てのフレームの音響信号x(t[i])について、それぞれのスケールパラメータγ〔i=1,2,・・・,F〕を算出し、次いで、スケールパラメータγ〔i=1,2,・・・,F〕から全てのフレームの音響信号x(t[i])の信号判定を行うとした。第4実施形態では、所定時間長の音響信号から切り出された時間的に隣り合うフレームの音響信号に対するスケールパラメータγ間の急激な変動を補正するために、自己回帰係数算出部(20)によって算出されたスケールパラメータγ〔i=1,2,・・・,F〕の平滑化を行う。そこで、第2実施形態と異なる点についてのみ説明を加える。
<Fourth embodiment>
Next, a fourth embodiment of the signal determination apparatus / method of the present invention will be described with reference to FIGS.
FIG. 18 is a functional configuration diagram of the signal determination device (3) of the fourth embodiment.
FIG. 19 is a flowchart illustrating a flow of signal determination processing in the signal determination device (3) of the fourth embodiment.
In the second embodiment, the scale parameters γ i [i = 1, 2,..., F] are calculated for the acoustic signals x i (t [i] ) of all frames, and then the scale parameter γ The signal determination of the acoustic signals x i (t [i] ) of all frames is performed from i [i = 1, 2,..., F]. In the fourth embodiment, the auto-regression coefficient calculation unit (20) calculates in order to correct a rapid variation between the scale parameters γ with respect to the acoustic signals of temporally adjacent frames cut out from the acoustic signal having a predetermined time length. The scale parameter γ i [i = 1, 2,..., F] is smoothed. Therefore, only the differences from the second embodiment will be described.

第4実施形態の信号判定装置(3)の外部記憶装置には、信号判定のためのプログラムおよびこのプログラムの処理において必要となるデータなどが保存記憶されている〔外部記憶装置が無い場合には、例えばプログラムを読み出し専用記憶装置であるROMに保存記憶させておけばよい。〕。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に保存記憶される。   The external storage device of the signal determination device (3) of the fourth embodiment stores and stores a signal determination program and data necessary for the processing of this program [when there is no external storage device] For example, the program may be stored in a ROM that is a read-only storage device. ]. Further, data obtained by the processing of these programs is appropriately stored and stored in a RAM or an external storage device.

より具体的には、信号判定装置(3)の外部記憶装置〔あるいはROMなど〕には、音響信号を表現する指数関数自己回帰モデルのスケールパラメータγを得るためのプログラム、スケールパラメータγの平滑化を行うためのプログラム、スケールパラメータγから音響信号が目的信号であるか否かを判定するためのプログラム、およびこれらのプログラムの処理において必要となるデータ(音響信号など)などが保存記憶されている(なお、上述したストリーム処理を行う場合には、音響信号に窓関数を適用してフレームを切出す音響信号切出手段を実現するためのプログラムも保存記憶しておく。)。その他、これらのプログラムに基づく処理を制御するための制御プログラムも適宜に保存しておく。   More specifically, in the external storage device (or ROM, etc.) of the signal determination device (3), a program for obtaining the scale parameter γ of the exponential function autoregressive model expressing the acoustic signal, smoothing of the scale parameter γ A program for determining whether or not the acoustic signal is the target signal from the scale parameter γ, and data (such as an acoustic signal) necessary for processing these programs are stored and stored. (Note that when performing the above-described stream processing, a program for realizing acoustic signal extraction means for extracting a frame by applying a window function to the acoustic signal is also stored.) In addition, a control program for controlling processing based on these programs is also stored as appropriate.

第4実施形態に係る信号判定装置(3)では、外部記憶装置〔あるいはROMなど〕に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてRAM(15)に読み込まれて、DSP(14)で解釈実行・処理される。その結果、DSP(14)が所定の機能(自己回帰係数算出部、平滑化部、信号判定部、さらには必要に応じて音響信号切出部)を実現することで、信号判定が実現される。   In the signal determination device (3) according to the fourth embodiment, each program stored in an external storage device (or ROM, etc.) and data necessary for processing each program are read into the RAM (15) as necessary. Then, the interpretation is executed and processed by the DSP (14). As a result, the DSP (14) realizes a predetermined function (autoregressive coefficient calculation unit, smoothing unit, signal determination unit, and, if necessary, an acoustic signal extraction unit), thereby realizing signal determination. .

第2実施形態で説明したように、まず、自己回帰係数算出部(20)は、信号判定装置(3)に入力された全てのフレームの音響信号x(t[i])について、1番目のフレームの音響信号x(t[1])のスケールパラメータγを算出し、2番目のフレームの音響信号x(t[2])のスケールパラメータγを算出し、この処理をF番目のフレームの音響信号x(t[F])まで繰り返すことで、全てのフレームの音響信号についてスケールパラメータγ〔i=1,2,・・・,F〕を算出する(ステップS59)。算出されたスケールパラメータγ〔i=1,2,・・・,F〕は、適宜RAM(15)などに保存記憶される。次いで、平滑化部(23)は、RAM(15)に保存記憶されたスケールパラメータγ〔i=1,2,・・・,F〕を読み込み、式(16)に従って、スケールパラメータγ〔i=1,2,・・・,F〕の平滑化を行う(ステップS60)。γ は、平滑化で得られた値を表す。

Figure 2007034262
As described in the second embodiment, first, the autoregressive coefficient calculation unit (20) performs the first operation on the acoustic signals x i (t [i] ) of all frames input to the signal determination device (3). calculates the scale parameter gamma 1 of the audio signal frame x 1 in (t [1]), to calculate the scale parameter gamma 2 of the second frame acoustic signal x 2 (t [2]) , the process F By repeating up to the acoustic signal x F (t [F] ) of the th frame, the scale parameter γ i [i = 1, 2,..., F] is calculated for the acoustic signals of all frames (step S59). . The calculated scale parameters γ i [i = 1, 2,..., F] are appropriately stored and stored in the RAM (15) or the like. Next, the smoothing unit (23) reads the scale parameter γ i [i = 1, 2,..., F] stored and stored in the RAM (15), and according to the equation (16), the scale parameter γ i [ i = 1, 2,..., F] is smoothed (step S60). γ to h represent values obtained by smoothing.
Figure 2007034262

式(16)で表される平滑化は、信号判定装置(3)の入力となった所定範囲のフレームの音響信号x(t[i])に対するスケールパラメータγの移動平均をとることを示す。νは移動平均をとる所定範囲のフレーム数を表す整数値である。無論、このような平滑化に限定するものではなく、例えば、補間法による平滑化でもよい。 The smoothing represented by the equation (16) indicates that a moving average of the scale parameter γ is taken with respect to the acoustic signal x i (t [i] ) of a predetermined range of frames that is input to the signal determination device (3). . ν is an integer value representing the number of frames in a predetermined range for which a moving average is taken. Of course, the present invention is not limited to such smoothing, and may be smoothed by an interpolation method, for example.

目的信号となる音声信号や音楽信号が例えば25ms程度の短い時間のみに突発的に発生する(存在する)ことは、現実には稀であるから、スケールパラメータγを平滑化することで、スケールパラメータγ間の急激な変動を補正する方が信号判定精度を向上させることができる。   Since it is rare in reality that an audio signal or music signal as a target signal suddenly occurs (exists) only in a short time of, for example, about 25 ms, the scale parameter γ is smoothed to obtain a scale parameter. It is possible to improve the signal determination accuracy by correcting the rapid fluctuation between γ.

平滑化部(23)によって算出された平滑化されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕は、適宜RAM(15)などに保存記憶される。次いで、信号判定部(21)は、RAM(15)に保存記憶されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕を読み込み、それぞれのスケールパラメータγ 〔h=1,2,・・・,F−ν〕に基づいて、各スケールパラメータγ に対応する音響信号x(t[i])の信号判定を行う(ステップS61)。 The smoothed scale parameters γ to h [h = 1, 2,..., F−ν] calculated by the smoothing unit (23) are appropriately stored and stored in the RAM (15) or the like. Next, the signal determination unit (21) reads the scale parameters γ to h [h = 1, 2,..., F−ν] stored and stored in the RAM (15), and each scale parameter γ to h [ Based on h = 1, 2,..., F−ν], the sound signal x i (t [i] ) corresponding to each of the scale parameters γ to h is determined (step S61).

なお、自己回帰係数算出部(20)による自己回帰係数算出方法および信号判定部(21)による信号判定方法は、第1実施形態で説明したのと同様である。   The autoregressive coefficient calculation method by the autoregressive coefficient calculation unit (20) and the signal determination method by the signal determination unit (21) are the same as described in the first embodiment.

<第5実施形態>
次に、本発明の信号判定装置・方法の第5実施形態を、図20、図21を参照して説明する。
図20は、第5実施形態の信号判定装置(4)の機能構成図である。
図21は、第5実施形態の信号判定装置(4)における信号判定処理の流れを示すフローチャートである。
第3実施形態では、正規化部(22)が、自己回帰係数算出部(20)によって算出されたスケールパラメータγ〔i=1,2,・・・,F〕の正規化を行い、次いで、信号判定部(21)が正規化されたスケールパラメータγ 〔i=1,2,・・・,F〕に基づき信号判定を行うとした。第5実施形態は、正規化部(22)によって正規化されたスケールパラメータγ 〔i=1,2,・・・,F〕を、平滑化部(23)で平滑化し、信号判定部(21)は、平滑化部(23)で平滑化されたスケールパラメータγ 〔i=1,2,・・・,F〕に基づき信号判定を行う。信号判定装置のハードウェア構成や機能構成は第3・第4実施形態と同様であり、第5実施形態の実施態様は、第3実施形態で説明した正規化の処理後に、第4実施形態で説明した平滑化の処理を実行するものとなっているから、ここでは、正規化処理後に平滑化を行う処理の流れについて説明する。
<Fifth Embodiment>
Next, a fifth embodiment of the signal determination apparatus / method of the present invention will be described with reference to FIGS.
FIG. 20 is a functional configuration diagram of the signal determination device (4) of the fifth embodiment.
FIG. 21 is a flowchart showing the flow of signal determination processing in the signal determination apparatus (4) of the fifth embodiment.
In the third embodiment, the normalization unit (22) normalizes the scale parameter γ i [i = 1, 2,..., F] calculated by the autoregressive coefficient calculation unit (20), and then The signal determination unit (21) performs signal determination based on the normalized scale parameter γ - i [i = 1, 2,..., F]. In the fifth embodiment, the scale parameter γ - i [i = 1, 2,..., F] normalized by the normalization unit (22) is smoothed by the smoothing unit (23), and the signal determination unit (21) performs signal determination based on the scale parameter γ - i [i = 1, 2,..., F] smoothed by the smoothing unit (23). The hardware configuration and functional configuration of the signal determination device are the same as those of the third and fourth embodiments. The fifth embodiment is the same as that of the fourth embodiment after the normalization processing described in the third embodiment. Since the smoothing process described above is executed, the flow of the process of performing the smoothing after the normalization process will be described here.

まず、第5実施形態の信号判定装置(4)における自己回帰係数算出部(20)は、信号判定装置に入力された全てのフレームの音響信号x(t[i])について、1番目のフレームの音響信号x(t[1])のスケールパラメータγを算出し、2番目のフレームの音響信号x(t[2])のスケールパラメータγを算出し、この処理をF番目のフレームの音響信号x(t[F])まで繰り返すことで、全てのフレームの音響信号についてスケールパラメータγ〔i=1,2,・・・,F〕を算出する(ステップS62)。算出されたスケールパラメータγ〔i=1,2,・・・,F〕は、適宜RAMなどに保存記憶される。次いで、正規化部(22)は、RAMに保存記憶されたスケールパラメータγ〔i=1,2,・・・,F〕を読み込み、式(15)に従って、スケールパラメータγ〔i=1,2,・・・,F〕の正規化を行う(ステップS63)。正規化されたスケールパラメータγ 〔i=1,2,・・・,F〕は、適宜RAMなどに保存記憶される。正規化の方法については、既述のとおり、γの平均、分散、標準偏差など他の統計量を用いて、γ の値の範囲を0≦γ ≦1に限定せず、一定の範囲にγ の値が収まるような正規化を行ってもよい。 First, the autoregressive coefficient calculation unit (20) in the signal determination device (4) of the fifth embodiment performs the first operation on the acoustic signals x i (t [i] ) of all frames input to the signal determination device. calculates the scale parameter gamma 1 of the audio signal frame x 1 (t [1]) , to calculate the scale parameter gamma 2 of the audio signal of the second frame x 2 (t [2]) , F th this process The scale parameter γ i [i = 1, 2,..., F] is calculated for the acoustic signals of all the frames by repeating until the acoustic signal x F (t [F] ) of the current frame (step S62). The calculated scale parameter γ i [i = 1, 2,..., F] is appropriately stored in a RAM or the like. Next, the normalization unit (22) reads the scale parameter γ i [i = 1, 2,..., F] stored and stored in the RAM, and according to the equation (15), the scale parameter γ i [i = 1]. , 2,..., F] are normalized (step S63). The normalized scale parameter γ - i [i = 1, 2,..., F] is appropriately stored and stored in a RAM or the like. For the method of normalization, as described above, the average of the gamma i, dispersion, using other statistics such as standard deviation, gamma - the range of values of i 0 ≦ γ - not limited to i ≦ 1, Normalization may be performed so that the value of γ - i falls within a certain range.

続いて、平滑化部(23)は、RAMに保存記憶された正規化されたスケールパラメータγ 〔i=1,2,・・・,F〕を読み込み、式(17)に従って、スケールパラメータγ 〔i=1,2,・・・,F〕の平滑化を行う(ステップS64)。γ は、平滑化で得られた値を表す。平滑化の方法については、既述のとおり、例えば補間法による平滑化でもよい。

Figure 2007034262
Subsequently, the smoothing unit (23) reads the normalized scale parameter γ - i [i = 1, 2,..., F] stored and stored in the RAM, and according to the equation (17), the scale parameter Smoothing of γ i [i = 1, 2,..., F] is performed (step S64). γ to h represent values obtained by smoothing. As described above, the smoothing method may be smoothed by an interpolation method, for example.
Figure 2007034262

平滑化部(23)によって算出された平滑化されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕は、適宜RAM(15)などに保存記憶される。次いで、信号判定部(21)は、RAM(15)に保存記憶されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕を読み込み、それぞれのスケールパラメータγ 〔h=1,2,・・・,F−ν〕に基づいて、各スケールパラメータγ に対応する音響信号x(t[i])の信号判定を行う(ステップS65)。 The smoothed scale parameters γ to h [h = 1, 2,..., F−ν] calculated by the smoothing unit (23) are appropriately stored and stored in the RAM (15) or the like. Next, the signal determination unit (21) reads the scale parameters γ to h [h = 1, 2,..., F−ν] stored and stored in the RAM (15), and each scale parameter γ to h [ Based on h = 1, 2,..., F−ν], the sound signal x i (t [i] ) corresponding to each of the scale parameters γ to h is determined (step S65).

なお、自己回帰係数算出部(20)による自己回帰係数算出方法および信号判定部(21)による信号判定方法は、第1実施形態で説明したのと同様である。   The autoregressive coefficient calculation method by the autoregressive coefficient calculation unit (20) and the signal determination method by the signal determination unit (21) are the same as described in the first embodiment.

<第6実施形態>
次に、本発明の信号判定装置・方法の第6実施形態を、図22、図23を参照して説明する。
図22は、第6実施形態の信号判定装置(5)の機能構成図である。
図23は、第6実施形態の信号判定装置(5)における信号判定処理の流れを示すフローチャートである。
第4実施形態では、平滑化部(23)が、自己回帰係数算出部(20)によって算出されたスケールパラメータγ〔i=1,2,・・・,F〕の平滑化を行い、次いで、信号判定部(21)が平滑化されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕に基づき信号判定を行うとした。第5実施形態は、平滑化部(23)によって平滑化されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕を、正規化部(22)で正規化し、信号判定部(21)は、正規化部(22)で正規化されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕に基づき信号判定を行う。信号判定装置のハードウェア構成や機能構成は第3・第4実施形態と同様であり、第6実施形態の実施態様は、第4実施形態で説明した平滑化の処理後に、第3実施形態で説明した正規化の処理を実行するものとなっているから、ここでは、平滑化処理後に正規化を行う処理の流れについて説明する。
<Sixth Embodiment>
Next, a sixth embodiment of the signal determination apparatus / method of the present invention will be described with reference to FIGS.
FIG. 22 is a functional configuration diagram of the signal determination device (5) of the sixth embodiment.
FIG. 23 is a flowchart illustrating a flow of signal determination processing in the signal determination device (5) of the sixth embodiment.
In the fourth embodiment, the smoothing unit (23) smoothes the scale parameter γ i [i = 1, 2,..., F] calculated by the autoregressive coefficient calculation unit (20), and then The signal determination unit (21) performs the signal determination based on the smoothed scale parameters γ to h [h = 1, 2,..., F−ν]. In the fifth embodiment, the scale parameters γ to h [h = 1, 2,..., F−ν] smoothed by the smoothing unit (23) are normalized by the normalization unit (22), The determination unit (21) performs signal determination based on the scale parameter γ h [h = 1, 2,..., F−ν] normalized by the normalization unit (22). The hardware configuration and functional configuration of the signal determination device are the same as those of the third and fourth embodiments, and the embodiment of the sixth embodiment is the same as that of the third embodiment after the smoothing process described in the fourth embodiment. Since the described normalization process is executed, the flow of the normalization process after the smoothing process will be described here.

まず、第6実施形態の信号判定装置(5)における自己回帰係数算出部(20)は、信号判定装置に入力された全てのフレームの音響信号x(t[i])について、1番目のフレームの音響信号x(t[1])のスケールパラメータγを算出し、2番目のフレームの音響信号x(t[2])のスケールパラメータγを算出し、この処理をF番目のフレームの音響信号x(t[F])まで繰り返すことで、全てのフレームの音響信号についてスケールパラメータγ〔i=1,2,・・・,F〕を算出する(ステップS66)。算出されたスケールパラメータγ〔i=1,2,・・・,F〕は、適宜RAMなどに保存記憶される。次いで、平滑化部(23)は、RAMに保存記憶されたスケールパラメータγ〔i=1,2,・・・,F〕を読み込み、式(16)に従って、スケールパラメータγ〔i=1,2,・・・,F〕の平滑化を行う(ステップS67)。平滑化されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕は適宜RAMなどに保存記憶される。平滑化の方法については、既述のとおり、例えば補間法による平滑化でもよい。 First, the autoregressive coefficient calculation unit (20) in the signal determination device (5) of the sixth embodiment performs the first operation on the acoustic signals x i (t [i] ) of all frames input to the signal determination device. calculates the scale parameter gamma 1 of the audio signal frame x 1 (t [1]) , to calculate the scale parameter gamma 2 of the audio signal of the second frame x 2 (t [2]) , F th this process The scale parameter γ i [i = 1, 2,..., F] is calculated for the acoustic signals of all the frames by repeating until the acoustic signal x F (t [F] ) of the current frame (step S66). The calculated scale parameter γ i [i = 1, 2,..., F] is appropriately stored in a RAM or the like. Next, the smoothing unit (23) reads the scale parameter γ i [i = 1, 2,..., F] stored and stored in the RAM, and according to the equation (16), the scale parameter γ i [i = 1]. , 2,..., F] is smoothed (step S67). The smoothed scale parameters γ to h [h = 1, 2,..., F−ν] are appropriately stored and stored in a RAM or the like. As described above, the smoothing method may be smoothed by an interpolation method, for example.

続いて、正規化部(22)は、RAMに保存記憶された平滑化されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕を読み込み、式(18)に従って、スケールパラメータγ 〔h=1,2,・・・,F−ν〕の正規化を行う(ステップS68)。γ は、正規化で得られた値を表す。正規化の方法については、既述のとおり、γ の平均、分散、標準偏差など他の統計量を用いて、γ の値の範囲を0≦γ ≦1に限定せず、一定の範囲にγ の値が収まるような正規化を行ってもよい。

Figure 2007034262
Subsequently, the normalization unit (22) reads the smoothed scale parameters γ to h [h = 1, 2,..., F−ν] stored and stored in the RAM, according to the equation (18). The scale parameters γ to h [h = 1, 2,..., F−ν] are normalized (step S68). γ - h represents a value obtained by normalization. For the method of normalization, as described above, the average of the gamma ~ i, dispersion, using other statistics such as standard deviation, gamma - the range of values of i 0 ≦ γ - not limited to i ≦ 1 Normalization may be performed so that the value of γ - i falls within a certain range.
Figure 2007034262

正規化部(22)によって算出された正規化されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕は、適宜RAMなどに保存記憶される。次いで、信号判定部(21)は、RAMに保存記憶されたスケールパラメータγ 〔h=1,2,・・・,F−ν〕を読み込み、それぞれのスケールパラメータγ 〔h=1,2,・・・,F−ν〕に基づいて、各スケールパラメータγ に対応する音響信号x(t[i])の信号判定を行う(ステップS69)。 The normalized scale parameter γ h [h = 1, 2,..., F−ν] calculated by the normalization unit (22) is appropriately stored and stored in a RAM or the like. Next, the signal determination unit (21) reads scale parameters γ h [h = 1, 2,..., F−ν] stored and stored in the RAM, and each scale parameter γ h [h = 1]. , 2,..., F−ν], the signal determination of the acoustic signal x i (t [i] ) corresponding to each scale parameter γ h is performed (step S69).

なお、自己回帰係数算出部(20)による自己回帰係数算出方法および信号判定部(21)による信号判定方法は、第1実施形態で説明したのと同様である。   The autoregressive coefficient calculation method by the autoregressive coefficient calculation unit (20) and the signal determination method by the signal determination unit (21) are the same as described in the first embodiment.

<第7実施形態>
次に、本発明の信号判定装置・方法の第7実施形態を、図24、図25、図26、図27を参照して説明する。
図24は、第7実施形態の信号判定装置の機能構成図である。
図25は、目的信号区間認識用HMMと目的外信号区間認識用HMMの構成と連結関係を示す図である。
図26は、学習における、学習データと目的信号区間認識用HMM・目的外信号区間認識用HMMとの対応関係を示す図である。
図27は、学習で得られたHMM(信号判定モデル)による、スケールパラメータγの時系列パターンの信号区間判定を示す図である。
<Seventh embodiment>
Next, a seventh embodiment of the signal determination apparatus / method of the present invention will be described with reference to FIGS. 24, 25, 26, and 27. FIG.
FIG. 24 is a functional configuration diagram of the signal determination apparatus according to the seventh embodiment.
FIG. 25 is a diagram illustrating a configuration and a connection relationship between the target signal section recognition HMM and the non-target signal section recognition HMM.
FIG. 26 is a diagram illustrating a correspondence relationship between the learning data, the target signal section recognition HMM, and the non-target signal section recognition HMM in learning.
FIG. 27 is a diagram illustrating signal section determination of the time series pattern of the scale parameter γ by the HMM (signal determination model) obtained by learning.

以上の各実施形態では、各フレームの音響信号の信号判定を行うとして説明したが、このことは、各フレームの音響信号が所定時間長の音響信号から切出されたものである場合には、この所定時間長の音響信号における信号区間の検出(判定)を行っていることに他ならない。
そうすると、所定時間長の音響信号から時系列に切出された各フレームの音響信号ごとに算出されたスケールパラメータγ〔i=1,2,・・・,F〕は各フレームに対応した時系列パターンに他ならず、この時系列パターンとしてのスケールパラメータγ〔i=1,2,・・・,F〕から、所定時間長の音響信号における信号区間の検出(判定)を行うことができることになる。このような時系列パターンとしてのスケールパラメータγに基づく信号区間判定は、隠れマルコフモデル(Hidden Markov Model;以下、「HMM」という。)によって達成しえる。
In each of the embodiments described above, the signal determination of the acoustic signal of each frame has been described. This is because the acoustic signal of each frame is cut out from the acoustic signal having a predetermined time length. This is nothing but the detection (determination) of the signal section in the acoustic signal having the predetermined time length.
Then, the scale parameter γ i [i = 1, 2,..., F] calculated for each acoustic signal of each frame cut out in time series from the acoustic signal having a predetermined time length corresponds to each frame. It is possible to detect (determine) a signal section in an acoustic signal having a predetermined time length from the scale parameter γ i [i = 1, 2,... It will be possible. Such signal section determination based on the scale parameter γ i as a time series pattern can be achieved by a Hidden Markov Model (hereinafter referred to as “HMM”).

信号判定部(21)は、時系列パターンとしてのスケールパラメータγ〔i=1,2,・・・,F〕(但し、このスケールパラメータγは、平滑化などが施されていないものでも、あるいは、平滑化や正規化が施されたものでも、さらには、正規化および平滑化が施されたものでもよい。)を入力とし、HMMを用いることで、各フレームが切り出される前の所定時間長の音響信号における信号区間の検出(判定)を行う。上記の各実施形態では、フレームとスケールパラメータと信号判定は1対1的対応関係にあったが、HMMを用いた信号判定では、このような関係は必ずしも成り立たない。つまり、HMMを用いた信号判定では、ある時系列パターンの複数のスケールパラメータに対応する複数のフレームをもって与えられる信号幅が目的信号区間か目的外信号区間であるかが判定されることになることに留意する。 The signal determination unit (21) uses a scale parameter γ i [i = 1, 2,..., F] as a time series pattern (however, the scale parameter γ i may be one that has not been smoothed). Alternatively, it may be smoothed or normalized, or may be normalized and smoothed.) And an HMM is used as a predetermined before each frame is cut out. Detection (determination) of a signal section in a time-length acoustic signal is performed. In each of the above embodiments, the frame, the scale parameter, and the signal determination have a one-to-one correspondence, but such a relationship does not necessarily hold in the signal determination using the HMM. That is, in the signal determination using the HMM, it is determined whether the signal width given by the plurality of frames corresponding to the plurality of scale parameters of a certain time series pattern is the target signal section or the non-target signal section. Keep in mind.

なお、自己回帰係数算出部(20)による自己回帰係数算出方法は第1実施形態で説明したのと同様であり、正規化や平滑化なども上記の各実施形態で説明したのと同様であるから、ここでは信号判定部(21)におけるHMMを用いた信号区間判定について説明を加える。   Note that the autoregressive coefficient calculation method by the autoregressive coefficient calculation unit (20) is the same as that described in the first embodiment, and normalization and smoothing are the same as those described in the above embodiments. Therefore, here, the signal section determination using the HMM in the signal determination unit (21) will be described.

信号判定部(21)は、予めの「学習」によって得られたHMMを用いて信号区間判定を行う。予めの「学習」は、次のようにして行う。
まず、目的信号区間認識用および目的外信号区間認識用に2つのHMM(モデル構造は同じでもよい。)を用意する(図25参照)。これらを目的信号HMMと目的外信号HMMということにする。ここでは時系列パターンを取り扱うので、例えば、いわゆるleft-to-rightモデル(LRモデル)を用意すればよい。各HMMにおける状態数や正規分布混合数などは任意でよい。なお、目的信号HMMおよび目的外信号HMMはそれぞれ、目的信号であることが既知の音響信号のスケールパラメータ、目的外信号であることが既知の音響信号のスケールパラメータによって学習して逐次状態分割法(SSS;Successive State Spliting)で形成されたHMM網としてもよい。この学習は、公知のEMアルゴリズムやBaum-Welchアルゴリズムを用いればよく、この学習によって各HMMにおける状態間の状態遷移確率や(状態ないし状態間遷移において)スケールパラメータの値を出力する確率である出力確率分布が求まる。
The signal determination unit (21) performs signal section determination using the HMM obtained by the previous “learning”. Pre-learning is performed as follows.
First, two HMMs (the model structure may be the same) are prepared for target signal section recognition and non-target signal section recognition (see FIG. 25). These are referred to as a target signal HMM and a non-target signal HMM. Here, since time series patterns are handled, for example, a so-called left-to-right model (LR model) may be prepared. The number of states and the normal distribution mixture number in each HMM may be arbitrary. Note that the target signal HMM and the non-target signal HMM are learned by the scale parameter of the acoustic signal that is known to be the target signal and the scale parameter of the acoustic signal that is known to be the non-target signal, respectively, and the sequential state division method ( It may be an HMM network formed by SSS (Successive State Splitting). For this learning, a known EM algorithm or Baum-Welch algorithm may be used. By this learning, the state transition probability between states in each HMM and the output that is the probability of outputting the value of the scale parameter (in the transition between states or states). Probability distribution is obtained.

目的信号HMMおよび目的外信号HMMは図25で示すような連結関係が成立するとする。この連結関係で表された目的信号HMMおよび目的外信号HMMの状態遷移によって、目的信号区間および目的外信号区間が表現されることになる。また、目的信号HMMおよび目的外信号HMMはともに1つずつとするのではなく、長いスケールパラメータの時系列パターンに対応するために、それぞれ複数の同種のHMMを連結させるようにしてもよい。   It is assumed that the target signal HMM and the non-target signal HMM are connected as shown in FIG. The target signal section and the non-target signal section are expressed by the state transition of the target signal HMM and the non-target signal HMM expressed by this connection relation. Further, the target signal HMM and the non-target signal HMM are not limited to one each, but a plurality of HMMs of the same type may be connected to each other in order to correspond to a long time series parameter pattern.

次に、予め目的信号区間および目的外信号区間が既知の音響信号から得られたスケールパラメータの時系列パターンに目的信号区間および目的外信号区間のラベル付けを行った学習データを用いて、各HMMの遷移確率を学習する(図26参照。なお、図26では、各HMM間の遷移を表す矢印は省略している。また、目的信号HMMを「信」、目的外信号HMMを「外」で略記している。)。この学習では、学習データに対する尤度が最大になるように遷移確率を求める。   Next, each HMM is used by using learning data obtained by labeling the target signal section and the non-target signal section on the time series pattern of the scale parameter obtained from the acoustic signal whose target signal section and the non-target signal section are already known. (See FIG. 26. In FIG. 26, arrows indicating transitions between the HMMs are omitted. In addition, the target signal HMM is “trust” and the non-target signal HMM is “out”.) Abbreviated.) In this learning, the transition probability is obtained so that the likelihood for the learning data is maximized.

以上のようにして、スケールパラメータの時系列パターンから信号判定を行うためのHMM(信号判定モデル)が得られる。このようにして得られた信号判定モデルは、信号判定装置のハードディスクなどの外部記憶装置に保存記憶しておくとする。   As described above, an HMM (signal determination model) for performing signal determination from the time series pattern of the scale parameter is obtained. The signal determination model obtained in this way is assumed to be stored in an external storage device such as a hard disk of the signal determination device.

信号判定部(21)は、RAMに保存記憶されているスケールパラメータの時系列パターンを読み込むと、外部記憶装置に保存記憶された信号判定モデルを用いて、読み込んだスケールパラメータの時系列パターンを出現確率(尤度)が最も大きくなる信号判定モデルにおける経路(目的信号HMMおよび目的外信号HMMを通過した順番)を信号区間判定の出力とする(図27参照。図27における太線が選択された経路を例示している。)。この出力が信号判定装置の出力となる。なお、あらゆる経路を探索することは冗長であるから、可能性の低い経路は枝刈りして、可能性の高い経路を探索するようにしてもよい。   When the signal determination unit (21) reads the time series pattern of the scale parameter stored and stored in the RAM, the signal determination unit (21) uses the signal determination model stored and stored in the external storage device to display the time series pattern of the read scale parameter. The path in the signal determination model with the highest probability (likelihood) (the order of passing through the target signal HMM and the non-target signal HMM) is used as the output of the signal section determination (see FIG. 27. The path with the bold line in FIG. 27 selected. For example). This output becomes the output of the signal determination device. In addition, since searching for every route is redundant, a route with low possibility may be pruned to search for a route with high possibility.

なお、本発明においては、信号判定モデルを学習によって求めることは主要な構成要素ではなく、学習によって得られた信号判定モデルに基づく信号判定に意義を有する。信号判定モデルの学習は公知のものによればよく、例えば参考文献5を参照のこと。
(参考文献5) 北研二、中村哲、永田昌明著、「音声言語処理」、森北出版株式会社、1996
In the present invention, obtaining a signal determination model by learning is not a main component, but has significance in signal determination based on the signal determination model obtained by learning. Learning of the signal determination model may be based on a known one. For example, see Reference 5.
(Reference 5) Kenji Kita, Satoshi Nakamura, Masaaki Nagata, “Spoken Language Processing”, Morikita Publishing Co., Ltd., 1996

本発明である信号判定装置・方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記信号判定装置・方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。   The signal determination apparatus / method according to the present invention is not limited to the above-described embodiment, and can be appropriately changed without departing from the gist of the present invention. Further, the processing described in the signal determination device / method is not only executed in time series in the order described, but also executed in parallel or individually as required by the processing capability of the device that executes the processing. It is good.

また、上記信号判定装置における処理機能をコンピュータによって実現する場合、信号判定装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記信号判定装置における処理機能がコンピュータ上で実現される。   When the processing function in the signal determination device is realized by a computer, the processing content of the function that the signal determination device should have is described by a program. Then, by executing this program on a computer, the processing function of the signal determination device is realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。   The program describing the processing contents can be recorded on a computer-readable recording medium. The computer-readable recording medium may be any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Specifically, for example, as a magnetic recording device, a hard disk device, a flexible disk, a magnetic tape or the like, and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only). Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical recording medium, MO (Magneto-Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.

また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   The program is distributed by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its storage device. When executing the process, the computer reads the program stored in its own recording medium and executes the process according to the read program. As another execution form of the program, the computer may directly read the program from the portable recording medium and execute processing according to the program, and the program is transferred from the server computer to the computer. Each time, the processing according to the received program may be executed sequentially. Also, the program is not transferred from the server computer to the computer, and the above-described processing is executed by a so-called ASP (Application Service Provider) type service that realizes the processing function only by the execution instruction and result acquisition. It is good. Note that the program in this embodiment includes information that is used for processing by an electronic computer and that conforms to the program (data that is not a direct command to the computer but has a property that defines the processing of the computer).

また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、信号判定装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   In this embodiment, the signal determination apparatus is configured by causing a computer to execute a predetermined program. However, at least a part of these processing contents may be realized by hardware.

<指数関数回帰モデルの有効性>
音響信号―特に非線形振動系としてモデル化できる音響信号―に対して、指数関数自己回帰(ExpAR)モデルが有効であることを示す。
例えば、音声の自然性・個人性に寄与する特性は、声帯音源と言われている。そして、従来の音声伝達系(音声生成モデル)は、声帯振動→声道伝達系→音声放射とされており、理論的には声帯振動は声門体積流の生成・声門インピーダンスの時間変化に起因し、声道伝達系への非線形的影響を及ぼす。声帯振動はフォルマント(formant)エネルギーの急激な減衰に関係するものと言われている。従って、声帯の自励振動機構と声道の伝達機構との相互作用を考慮したモデル化が必要である。
<Effectiveness of exponential function regression model>
It shows that the exponential autoregressive (ExpAR) model is effective for acoustic signals—especially acoustic signals that can be modeled as nonlinear vibration systems.
For example, a characteristic that contributes to the naturalness and individuality of speech is said to be a vocal cord sound source. The conventional voice transmission system (speech generation model) is vocal fold vibration → vocal tract transmission system → voice radiation. Theoretically, the vocal fold vibration is caused by the generation of glottal volume flow and the temporal change of glottal impedance. Non-linear effects on the vocal tract transmission system. Vocal cord vibration is said to be related to the rapid decay of formant energy. Therefore, it is necessary to model the interaction between the self-excited vibration mechanism of the vocal cords and the transmission mechanism of the vocal tract.

しかし現状では、声帯振動と声道伝達系は別々にモデル化されていて、主に、声帯振動は振動モデル、声道伝達系はLPC(Linear Predictive Coding)に代表される線形自己回帰モデル(既述のARモデルである。)等が用いられている。このように現状では二段階に亘って音声データをモデル化しているが、ExpARモデルは、声帯振動とこの声帯振動による非線形的影響を受けた声道伝達系の双方の特性を表現することが可能である。以下にExpARモデルの物理的特性について説明を加える。   However, at present, the vocal cord vibration and the vocal tract transmission system are modeled separately. Mainly, the vocal fold vibration is a vibration model, and the vocal tract transmission system is a linear autoregressive model represented by LPC (Linear Predictive Coding). The above-mentioned AR model) is used. Thus, at present, voice data is modeled in two stages, but the ExpAR model can express the characteristics of both vocal fold vibrations and vocal tract transmission systems that are nonlinearly affected by the vocal fold vibrations. It is. The physical characteristics of the ExpAR model will be described below.

自励振動を示す連続微分方程式は式(19)で表すことができる。但し、xは信号を、a,bは係数を表す。

Figure 2007034262
A continuous differential equation indicating self-excited vibration can be expressed by Equation (19). Here, x represents a signal, and a and b represent coefficients.
Figure 2007034262

この微分方程式の特性方程式の根ρは、式(20)で与えられる。ここで、iは虚数である。式(19)は、a>0のとき、−a/2<0であるから減衰振動(aが大のとき速く減衰、aが小のとき遅く減衰)を表し、a<0のとき、−a/2>0であるから発散振動を表す。

Figure 2007034262
The root ρ of the characteristic equation of this differential equation is given by equation (20). Here, i is an imaginary number. Expression (19) represents a damped oscillation (attenuation fast when a is large, and slow attenuation when a is small) because -a / 2 <0 when a> 0, and-when a <0, Since a / 2> 0, it represents divergent vibration.
Figure 2007034262

微分方程式(19)は、式(21)で表される2次のARモデル(以下、「AR(2)」という。)で特徴付けられる〔微分方程式(19)を1階の連立微分方程式として書き改めればよい。〕。ここで、x(t)は時点tでの信号xを表し、φ、φはAR係数、ε(t)は正規白色雑音を表す。

Figure 2007034262
The differential equation (19) is characterized by a second-order AR model represented by the equation (21) (hereinafter referred to as “AR (2)”) [the differential equation (19) as a first-order simultaneous differential equation] Rewrite it. ]. Here, x (t) represents the signal x at time t, φ 1 and φ 2 represent AR coefficients, and ε (t) represents normal white noise.
Figure 2007034262

AR(2)の特性根をλとすると特性根λは式(22)で与えられ、AR(2)を満たす信号は、式(23)のf付近でピークを持つスペクトルを有する。信号が音声信号の場合、そのスペクトルピーク群がフォルマントを表すことになる。

Figure 2007034262
When the characteristic root of AR (2) is λ, the characteristic root λ is given by Expression (22), and a signal satisfying AR (2) has a spectrum having a peak in the vicinity of f 0 of Expression (23). When the signal is an audio signal, the spectrum peak group represents a formant.
Figure 2007034262

式(22)の複素共役根をλ、λとすると、|λ1,2|≦1のとき、|λ1,2|が0に近くなると速く減衰し、1に近づくと遅く減衰する。また、|λ1,2|>1のときは、|λ1,2|が1から離れるほど早く発散する。なお、λ1,2なる表記は、λまたはλを表す(以下同様)。 Assuming that the complex conjugate roots of equation (22) are λ 1 and λ 2 , when | λ 1,2 | ≦ 1, | λ 1,2 | . In addition, when | λ 1,2 |> 1, | λ 1,2 | Incidentally, lambda 1, 2 becomes notation represents lambda 1 or lambda 2 (hereinafter the same).

van der Po1の自励振動は式(24)で表され、1次階差の係数a(x)が信号xの関数になっている。この信号xの振幅の大小で係数の正負が決まり、振動の減衰・発散が決まる。つまり、van der Po1の自励振動は、振幅依存型の非線形モデル構造である。

Figure 2007034262
The self-excited vibration of van der Po1 is expressed by the equation (24), and the first-order difference coefficient a (x) is a function of the signal x. The magnitude of the amplitude of the signal x determines whether the coefficient is positive or negative, and vibration attenuation / divergence is determined. In other words, the self-excited vibration of van der Po1 has an amplitude-dependent nonlinear model structure.
Figure 2007034262

声帯振動のモデルは式(25)の運動方程式で表され、Kの大小で振動の状態が決まる振幅依存型のモデル構造である。式(25)は、K>0の場合、減衰振動を表し、K<0の場合、発散振動を表す。なお、K:ピッチ周期内でのエネルギー損失時間変化、ω:K=0における共振角周波数である。

Figure 2007034262
Model of the vocal cords vibration is represented by the equation of motion of the formula (25), a model structure of the amplitude-dependent which determines the state of the vibration in the magnitude of K t. Equation (25) represents a damped vibration when K t > 0, and a divergent vibration when K t <0. K t : energy loss time change within the pitch period, ω 0 : resonance angular frequency at K t = 0.
Figure 2007034262

ExpARモデルは、式(26)から明らかなように、信号の振幅依存項が一期前の信号x(t−1)によって表されている非線形モデルである。信号x(t−k)の係数部分は、状態空間表現の形式にすれば遷移行列の要素となり、その特性を示すのに一期前の信号x(t−1)の情報で十分であるという意味である。式(26)は、|x(t−1)|の大小によって振動特性が変化し、|x(t−1)|が大の場合、減衰振動を示し、|x(t−1)|が小の場合、発散振動を示す。なお、pはモデル次数、φ、πは自己回帰係数、γはスケールパラメータである。

Figure 2007034262
The ExpAR model is a non-linear model in which the amplitude-dependent term of the signal is represented by the signal x (t−1) one period before, as is clear from Expression (26). The coefficient part of the signal x (t−k) becomes an element of the transition matrix in the form of state space expression, and the information of the previous signal x (t−1) is sufficient to show the characteristics. Meaning. Equation (26) shows that the vibration characteristic changes depending on the magnitude of | x (t−1) |. When | x (t−1) | If it is small, it indicates divergent vibration. Here, p is the model order, φ k and π k are autoregressive coefficients, and γ is a scale parameter.
Figure 2007034262

つまりExpARモデルは、現在の信号x(t)を説明することについて、一期前の信号x(t−1)に過去の情報が集約されているマルコフ定常性の仮定に対して自然な表現を示している非線形モデルである。   In other words, the ExpAR model expresses a natural expression for the assumption of Markov stationarity in which past information is aggregated in the previous signal x (t−1) for explaining the current signal x (t). It is the nonlinear model shown.

AR(2)の固有根λ1,2、ピッチエネルギー減衰を決めるK、ExpARモデルの振幅依存項のx(t−1)の間の関係をまとめると表1のようになり、ExpARモデルが信号の振幅変化に応じて減衰ないし発散と変化する特性を記述していることが云える。

Figure 2007034262
Table 1 summarizes the relationship among the intrinsic root λ 1,2 of AR (2), K t that determines the pitch energy attenuation, and x (t−1) of the amplitude dependence term of the ExpAR model. It can be said that the characteristics that change with attenuation or divergence according to the change in amplitude of the signal are described.
Figure 2007034262

ExpARモデルの定常性の条件は、式(22)の特性根が全て単位円の内側に入ることである。ExpARモデルを音声データに適用した場合、この係数φ、φは通常、LPCを適用することで推定される声道伝達特性、つまりフォルマントに対応する。また、マルコフ性の仮定から、式(27)の特性根が単位円の外にある場合でも、ExpARモデルは定常である。

Figure 2007034262
The condition for the stationarity of the ExpAR model is that all the characteristic roots of Equation (22) fall inside the unit circle. When the ExpAR model is applied to speech data, the coefficients φ 1 and φ 2 usually correspond to vocal tract transfer characteristics estimated by applying LPC, that is, formants. Further, from the assumption of Markov property, the ExpAR model is stationary even when the characteristic root of Equation (27) is outside the unit circle.
Figure 2007034262

式(26)の自己回帰係数πは非線形性の強さを示し、上述した減衰ないし発散を決める。また、式(26)のスケールパラメータγも非線形性を示す部分となるが、場合によってはπとγとは相殺し合う関係にもなりうる(例えばπ=0の場合である。)。そこで、ある音声データ、自己回帰係数π、スケールパラメータγの間の関係をモデル次数p=2の場合について図29に示す。 The autoregressive coefficient π k in equation (26) indicates the strength of nonlinearity and determines the above-described attenuation or divergence. In addition, the scale parameter γ in the equation (26) is also a portion showing non-linearity. However, in some cases, π k and γ may be in a mutually canceling relationship (for example, when π k = 0). Therefore, FIG. 29 shows the relationship among certain audio data, autoregressive coefficient π k , and scale parameter γ in the case of model order p = 2.

図29に示すように、自己回帰係数πが全フレームで0の値を取ることがなく(図29では表示スケールの都合で自己回帰係数πが0になる部分が見受けられるが、厳密には0ではない。)、スケールパラメータγが音声区間では小さくなる、つまり非線形性が増している状態を示していることから、ExpARモデルが音声の非線形性を捕らえていて、音声区間を抽出しうることを示している。 As shown in FIG. 29, the autoregressive coefficient π k does not take a value of 0 in all frames (in FIG. 29, there is a portion where the autoregressive coefficient π k becomes 0 for convenience of display scale, but strictly, Is not 0.) Since the scale parameter γ is small in the speech interval, that is, the nonlinearity is increasing, the ExpAR model captures the speech nonlinearity and can extract the speech interval. It is shown that.

換言すると、音声信号のような非線形な振動特性を有する信号の場合、全ての自己回帰係数πが恒常的に0あるいは非線形性に影響を及ぼすスケールパラメータγの効果を損なう値を取らないように推定されるので、このような信号のモデル化にExpARモデルが有効と言えるのである。 In other words, in the case of a signal having nonlinear vibration characteristics such as an audio signal, all the autoregressive coefficients π k are constantly set to 0 or a value that impairs the effect of the scale parameter γ that affects the nonlinearity. Therefore, it can be said that the ExpAR model is effective for modeling such a signal.

<フォルマントと自己回帰係数πとスケールパラメータγとの関係>
声道伝達系に係わるフォルマントと、式(26)の非線形性を示す指数項(πexp(−γx(t−1)))の自己回帰係数πおよびスケールパラメータγとの関係を示す。
<Relationship between formant, autoregressive coefficient π k and scale parameter γ>
The relationship between the formant relating to the vocal tract transmission system, the autoregressive coefficient π k of the exponential term (π k exp (−γx (t−1) 2 )) indicating the nonlinearity of the equation (26), and the scale parameter γ is shown. .

定常性を示す自己回帰係数φ、φ〔式(22)参照。〕からスペクトルを求めると、このスペクトルのピーク群は、LPCによって推定されるフォルマントに相当する。これらのピークは、あるフレーム間での平均的なフォルマントの高さと位相を示している。これに対してExpARモデルでは、さらに式(27)で示されるような特性根も得ることができる。この根の挙動は信号の振幅に依存し、単位円を出たり入ったり、もしくは、単位円内で位相が変化する状態を示す。このような根の挙動は、あるフレーム間で時々刻々と変動しているフォルマントの高さと周波数位置のゆらぎを示すことになる。そこで、このことを簡単に示すため、式(26)をφ、π、x(t−1)、ε(t)を固定値としたモデルにして、自己回帰係数πおよびスケールパラメータγを種々の値に設定したときのスペクトルを図30に示す。図30から判るように、自己回帰係数πを固定してスケールパラメータγを変更した場合でも、逆にスケールパラメータγを固定して自己回帰係数πを変更した場合でも、スペクトルの様相が変化し、フォルマントの高さと周波数位置が変化している。 Autoregressive coefficients φ 1 , φ 2 indicating stationarity [Refer to formula (22). ], The peak group of this spectrum corresponds to a formant estimated by LPC. These peaks show the average formant height and phase between certain frames. On the other hand, in the ExpAR model, a characteristic root as shown in the equation (27) can also be obtained. The behavior of this root depends on the amplitude of the signal and indicates a state in which the phase moves in and out of the unit circle or the phase changes in the unit circle. Such root behavior indicates the fluctuation of the height of the formant and the frequency position which fluctuate every moment between frames. Therefore, in order to show this simply, Equation (26) is modeled with φ k , π k , x (t−1), and ε (t) as fixed values, and autoregressive coefficient π and scale parameter γ are set as follows. The spectrum when set to various values is shown in FIG. As can be seen from FIG. 30, even when the autoregressive coefficient π is fixed and the scale parameter γ is changed, or when the scale parameter γ is fixed and the autoregressive coefficient π is changed, the spectrum changes. The formant height and frequency position are changing.

音声信号と雑音信号が混在する音響信号に対して、本発明の信号判定方法によって得られた音響特徴を用いて音声信号区間を検出した実施例を示す。この実施例で使用した音響信号データは、社団法人情報処理学会 音声言語情報処理研究会 雑音下音声認識評価ワーキンググループ 雑音下音声認識評価環境(AURORA-2J)に含まれる、男声1名によって発声された数字読み上げ音声に駅騒音を信号対雑音比10dBで加算した信号で、サンプリング周波数8kHz、量子化ビット数16ビットで離散サンプリングされたものを用いた。図28(a)に雑音信号の含まれない音声信号、図28(b)に雑音信号の加算された音声信号を示す。これは図1(a)(c)に示されたものと同様である。この音響信号に対し、本発明による信号判定方法を、1フレームの時間長を25ms(200サンプル点)とし、0.125ms(1サンプル点)ごとにフレームの始点を移動させ、モデル次数8で指数関数自己回帰モデルのパラメータを推定し、移動平均を200サンプル点で取るようにして行った。出力された音響特徴(スケールパラメータγ)を図28(c)に示す。図示のように、本発明による信号判定方法によって出力される音響特徴が、音声信号の存在する区間では小さい値を示し、それ以外の区間では大きい値を示すことがわかる。この音響特徴に対し、その平均値(図28(c)の点線)を閾値として設定した場合の音声信号区間検出を行った。音響特徴の値が閾値を上回れば音声信号区間、下回れば非音声信号区間とした。音声信号区間を1、非音声信号区間を0とした結果を図28(d)に示す。図示の通り、本発明の手法が雑音信号のある環境でも目的信号となる音声信号の存在区間の推定に有効であることが確認された。   An embodiment in which an audio signal section is detected using an acoustic feature obtained by the signal determination method of the present invention for an audio signal in which an audio signal and a noise signal are mixed will be described. The acoustic signal data used in this example is uttered by one male voice included in the noisy speech recognition evaluation working environment (AURORA-2J). A signal obtained by adding station noise to a signal reading speech with a signal-to-noise ratio of 10 dB and discretely sampled with a sampling frequency of 8 kHz and a quantization bit number of 16 bits was used. FIG. 28A shows an audio signal not including a noise signal, and FIG. 28B shows an audio signal added with the noise signal. This is the same as that shown in FIGS. For this acoustic signal, the signal determination method according to the present invention sets the time length of one frame to 25 ms (200 sample points), moves the start point of the frame every 0.125 ms (1 sample point), and takes an exponent of model order 8 The parameters of the function autoregressive model were estimated and the moving average was taken at 200 sample points. The output acoustic features (scale parameter γ) are shown in FIG. As shown in the figure, it can be seen that the acoustic feature output by the signal determination method according to the present invention shows a small value in the section where the audio signal exists, and shows a large value in the other sections. For this acoustic feature, an audio signal section was detected when the average value (dotted line in FIG. 28C) was set as a threshold value. When the acoustic feature value exceeds the threshold value, the voice signal section is set, and when the acoustic feature value falls below the threshold value, the voice signal section is set. FIG. 28 (d) shows the result when the audio signal interval is 1 and the non-audio signal interval is 0. As shown in the figure, it has been confirmed that the method of the present invention is effective in estimating the existence section of a speech signal that is a target signal even in an environment with a noise signal.

本発明の信号判定装置および方法は、信号が音響信号である場合を例にすれば、音声や楽音の符号化、雑音信号抑圧、残響除去、自動音声認識などにおける音響信号処理に用いることができる。   The signal determination apparatus and method of the present invention can be used for acoustic signal processing in speech and musical sound encoding, noise signal suppression, dereverberation, automatic speech recognition, etc., taking the case where the signal is an acoustic signal as an example. .

(a)無音区間と音声区間のみが存在するような音声信号の例。(b)図1(a)に例示する音声信号について、本発明の信号判定装置・方法によって算出したスケールパラメータγの値。(c)図1(a)で例示する音声信号に対し駅騒音を信号対雑音比10dBで加算したもの。(d)図1(c)で例示する音声信号に対して、本発明の信号判定装置・方法によって算出したスケールパラメータγの値。(A) An example of a voice signal in which only a silent section and a voice section exist. (B) The value of the scale parameter γ calculated by the signal determination apparatus / method of the present invention for the audio signal illustrated in FIG. (C) A station noise added to the audio signal illustrated in FIG. 1A with a signal-to-noise ratio of 10 dB. (D) The value of the scale parameter γ calculated by the signal determination apparatus / method of the present invention for the audio signal illustrated in FIG. 第1実施形態に係わる信号判定装置(1)のハードウェア構成を例示した構成ブロック図。The block diagram which illustrated the hardware constitutions of the signal determination apparatus (1) concerning 1st Embodiment. 第1実施形態に係わる信号判定装置(1)の機能構成図。The function block diagram of the signal determination apparatus (1) concerning 1st Embodiment. 従来的な自己回帰係数算出方法の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of the conventional autoregressive coefficient calculation method. 本発明者らが創出した自己回帰係数算出方法における処理機能を示す機能ブロック図。The functional block diagram which shows the processing function in the autoregressive coefficient calculation method which the present inventors created. 本発明者らが創出した自己回帰係数算出方法の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of the autoregressive coefficient calculation method which the present inventors created. 本発明者らが創出した自己回帰係数算出方法(変形例1)における処理機能を示す機能ブロック図。The functional block diagram which shows the processing function in the autoregressive coefficient calculation method (modification 1) which the present inventors created. 本発明者らが創出した自己回帰係数算出方法(変形例1)の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of the autoregressive coefficient calculation method (modification 1) which the present inventors created. 本発明者らが創出した自己回帰係数算出方法(変形例2)における処理機能を示す機能ブロック図。The functional block diagram which shows the processing function in the autoregressive coefficient calculation method (modification 2) which the present inventors created. 本発明者らが創出した自己回帰係数算出方法(変形例2)の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of the autoregressive coefficient calculation method (modification 2) which the present inventors created. 本発明者らが創出した自己回帰係数算出方法(変形例3)における処理機能を示す機能ブロック図。The functional block diagram which shows the processing function in the autoregressive coefficient calculation method (modification 3) which the present inventors created. 本発明者らが創出した自己回帰係数算出方法(変形例3)の処理の流れを示すフローチャート。The flowchart which shows the flow of a process of the autoregressive coefficient calculation method (modification 3) which the present inventors created. 閾値に基づく信号判定方法の処理を示すフローチャート。The flowchart which shows the process of the signal determination method based on a threshold value. サポートベクターマシンに基づく信号判定方法の処理を示すフローチャート。The flowchart which shows the process of the signal determination method based on a support vector machine. 第2実施形態における信号判定装置(1)の機能構成図。The function block diagram of the signal determination apparatus (1) in 2nd Embodiment. 第3実施形態の信号判定装置(2)の機能構成図。The function block diagram of the signal determination apparatus (2) of 3rd Embodiment. 第3実施形態の信号判定装置(2)における信号判定処理の流れを示すフローチャート。The flowchart which shows the flow of the signal determination process in the signal determination apparatus (2) of 3rd Embodiment. 第4実施形態の信号判定装置(3)の機能構成図。The function block diagram of the signal determination apparatus (3) of 4th Embodiment. 第4実施形態の信号判定装置(3)における信号判定処理の流れを示すフローチャート。The flowchart which shows the flow of the signal determination process in the signal determination apparatus (3) of 4th Embodiment. 第5実施形態の信号判定装置(4)の機能構成図。The function block diagram of the signal determination apparatus (4) of 5th Embodiment. 第5実施形態の信号判定装置(4)における信号判定処理の流れを示すフローチャート。The flowchart which shows the flow of the signal determination process in the signal determination apparatus (4) of 5th Embodiment. 第6実施形態の信号判定装置(5)の機能構成図。The function block diagram of the signal determination apparatus (5) of 6th Embodiment. 第6実施形態の信号判定装置(5)における信号判定処理の流れを示すフローチャート。The flowchart which shows the flow of the signal determination process in the signal determination apparatus (5) of 6th Embodiment. 第7実施形態の信号判定装置の機能構成図。The function block diagram of the signal determination apparatus of 7th Embodiment. 目的信号区間認識用HMMと目的外信号区間認識用HMMの構成と連結関係を示す図。The figure which shows the structure and connection relation of HMM for target signal area recognition, and HMM for non-target signal area recognition. 学習における、学習データと目的信号区間認識用HMM・目的外信号区間認識用HMMとの対応関係を示す図。The figure which shows the correspondence of learning data, HMM for target signal area recognition, and HMM for non-target signal area recognition in learning. 学習で得られたHMM(信号判定モデル)による、スケールパラメータγの時系列パターンの信号区間判定を示す図である。It is a figure which shows the signal area determination of the time series pattern of the scale parameter (gamma) by HMM (signal determination model) obtained by learning. (a)図1(a)と同じ音声信号。(b)図1(c)と同じ音響信号。(c)本発明の信号判定方法による検証実験において算出された音響特徴(スケールパラメータγ)。(d)閾値に基づく信号判定結果。(A) The same audio signal as in FIG. (B) The same acoustic signal as in FIG. (C) Acoustic features (scale parameter γ) calculated in the verification experiment by the signal determination method of the present invention. (D) A signal determination result based on the threshold value. 音声データにモデル次数p=2のExpARモデルを適用した場合の、フレームごとの自己回帰係数πおよびスケールパラメータγ値の変化を示した図。The figure which showed the change of the autoregressive coefficient (pi) k and scale parameter (gamma) value for every flame | frame at the time of applying the ExpAR model of model order p = 2 to audio | voice data. φ、π、x(t−1)、ε(t)を固定値としたExpARモデルにおいて、自己回帰係数πおよびスケールパラメータγを種々の値に設定したときのスペクトルを示した図(但し、x(t−1)=0.5)。In the ExpAR model in which φ k , π k , x (t−1), and ε (t) are fixed values, a diagram showing spectra when the autoregressive coefficient π and the scale parameter γ are set to various values (however, , X (t-1) = 0.5).

符号の説明Explanation of symbols

1 信号判定装置
20 自己回帰係数算出部
21 信号判定部
22 正規化部
23 平滑化部
DESCRIPTION OF SYMBOLS 1 Signal determination apparatus 20 Autoregressive coefficient calculation part 21 Signal determination part 22 Normalization part 23 Smoothing part

Claims (15)

離散信号が目的信号であるか否かを判定する信号判定装置であって、
離散信号を記憶する記憶手段と、
記憶手段に記憶される離散信号に基づいて、当該離散信号を表現する非線形関数自己回帰モデルの自己回帰係数を求めて出力する自己回帰係数算出手段と、
自己回帰係数算出手段によって出力された自己回帰係数を入力とし、当該自己回帰係数に基づいて離散信号が目的信号であるか否かを判定して、この信号判定結果を出力する信号判定手段と
を備えたことを特徴とする信号判定装置。
A signal determination device for determining whether a discrete signal is a target signal,
Storage means for storing discrete signals;
An autoregressive coefficient calculating means for obtaining and outputting an autoregressive coefficient of a nonlinear function autoregressive model expressing the discrete signal based on the discrete signal stored in the storage means;
A signal determining means for receiving the autoregressive coefficient output by the autoregressive coefficient calculating means, determining whether the discrete signal is the target signal based on the autoregressive coefficient, and outputting the signal determination result; A signal determination device comprising:
自己回帰係数算出手段は、
記憶手段に記憶された離散信号に基づいて、当該離散信号を表現する指数関数自己回帰モデルにおける指数である自己回帰係数を求めて出力するものである
ことを特徴とする請求項1に記載の信号判定装置。
The autoregressive coefficient calculation means is
2. The signal according to claim 1, wherein an autoregressive coefficient, which is an index in an exponential function autoregressive model expressing the discrete signal, is obtained and output based on the discrete signal stored in the storage means. Judgment device.
信号判定手段は、
自己回帰係数算出手段によって出力された自己回帰係数と所定の閾値との比較判定を行い、この比較判定結果に基づいて、比較判定結果ごとに予め対応付けられた信号判定結果を出力するものである
ことを特徴とする請求項1または請求項2に記載の信号判定装置。
The signal determination means is
A comparison determination between the autoregressive coefficient output by the autoregressive coefficient calculation means and a predetermined threshold is performed, and a signal determination result associated in advance for each comparison determination result is output based on the comparison determination result. The signal determination device according to claim 1, wherein the signal determination device is a signal determination device.
信号判定手段は、
自己回帰係数算出手段によって出力された自己回帰係数に対して、予め既知の信号を用いて求めた自己回帰係数によって学習して得た学習内容に基づくパターン認識を行い、このパターン認識結果に基づいて、パターン認識結果ごとに予め対応付けられた信号判定結果を出力するものである
ことを特徴とする請求項1または請求項2に記載の信号判定装置。
The signal determination means is
For the autoregressive coefficient output by the autoregressive coefficient calculating means, pattern recognition based on the learning content obtained by learning with the autoregressive coefficient obtained using a known signal in advance is performed, and based on the pattern recognition result 3. The signal determination apparatus according to claim 1, wherein a signal determination result associated in advance for each pattern recognition result is output.
記憶手段は、
複数のフレームの離散信号を記憶するものであり、
上記自己回帰係数算出手段は、
記憶手段に記憶される複数のフレームの離散信号に対して、各フレームの離散信号ごとに自己回帰係数を算出するものであり、
この自己回帰係数算出手段によって出力された各フレームの離散信号の自己回帰係数を正規化する自己回帰係数正規化手段を備え、
上記信号判定手段は、
自己回帰係数正規化手段によって正規化された各フレームの離散信号の自己回帰係数を入力とする
ことを特徴とする請求項1ないし請求項4のいずれかに記載の信号判定装置。
The storage means
Storing discrete signals of a plurality of frames,
The autoregressive coefficient calculating means is:
For the discrete signals of a plurality of frames stored in the storage means, an autoregressive coefficient is calculated for each discrete signal of each frame,
Autoregressive coefficient normalizing means for normalizing the autoregressive coefficient of the discrete signal of each frame output by the autoregressive coefficient calculating means,
The signal determination means includes
5. The signal determination apparatus according to claim 1, wherein an autoregressive coefficient of the discrete signal of each frame normalized by the autoregressive coefficient normalizing means is input.
記憶手段は、
複数のフレームの離散信号を記憶するものであり、
上記自己回帰係数算出手段は、
記憶手段に記憶される複数のフレームの離散信号に対して、各フレームの離散信号ごとに自己回帰係数を算出するものであり、
この自己回帰係数算出手段によって出力された各フレームの離散信号の自己回帰係数を正規化する自己回帰係数正規化手段と、
自己回帰係数正規化手段によって正規化された各フレームの離散信号の自己回帰係数を平滑化する被正規化係数平滑化手段とを備え、
上記信号判定手段は、
被正規化係数平滑化手段によって平滑化された各フレームの離散信号の自己回帰係数を入力とする
ことを特徴とする請求項1ないし請求項4のいずれかに記載の信号判定装置。
The storage means
Storing discrete signals of a plurality of frames,
The autoregressive coefficient calculating means is:
For the discrete signals of a plurality of frames stored in the storage means, an autoregressive coefficient is calculated for each discrete signal of each frame,
Autoregressive coefficient normalizing means for normalizing the autoregressive coefficient of the discrete signal of each frame output by the autoregressive coefficient calculating means;
A normalized coefficient smoothing means for smoothing the autoregressive coefficient of the discrete signal of each frame normalized by the autoregressive coefficient normalizing means,
The signal determination means includes
5. The signal determination apparatus according to claim 1, wherein an autoregressive coefficient of the discrete signal of each frame smoothed by the normalized coefficient smoothing means is input.
記憶手段は、
複数のフレームの離散信号を記憶するものであり、
上記自己回帰係数算出手段は、
記憶手段に記憶される複数のフレームの離散信号に対して、各フレームの離散信号ごとに自己回帰係数を算出するものであり、
この自己回帰係数算出手段によって出力された各フレームの離散信号の自己回帰係数を平滑化する自己回帰係数平滑化手段を備え、
上記信号判定手段は、
自己回帰係数平滑化手段によって平滑化された各フレームの離散信号の自己回帰係数を入力とする
ことを特徴とする請求項1ないし請求項4のいずれかに記載の信号判定装置。
The storage means
Storing discrete signals of a plurality of frames,
The autoregressive coefficient calculating means is:
For the discrete signals of a plurality of frames stored in the storage means, an autoregressive coefficient is calculated for each discrete signal of each frame,
Autoregressive coefficient smoothing means for smoothing the autoregressive coefficient of the discrete signal of each frame output by the autoregressive coefficient calculating means,
The signal determination means includes
5. The signal determination apparatus according to claim 1, wherein an autoregressive coefficient of the discrete signal of each frame smoothed by the autoregressive coefficient smoothing means is input.
記憶手段は、
複数のフレームの離散信号を記憶するものであり、
上記自己回帰係数算出手段は、
記憶手段に記憶される複数のフレームの離散信号に対して、各フレームの離散信号ごとに自己回帰係数を算出するものであり、
この自己回帰係数算出手段によって出力された各フレームの離散信号の自己回帰係数を平滑化する自己回帰係数平滑化手段と、
自己回帰係数平滑化手段によって平滑化された各フレームの離散信号の自己回帰係数を正規化する被平滑化係数正規化手段とを備え、
上記信号判定手段は、
被平滑化係数正規化手段によって正規化された各フレームの離散信号の自己回帰係数を入力とする
ことを特徴とする請求項1ないし請求項4のいずれかに記載の信号判定装置。
The storage means
Storing discrete signals of a plurality of frames,
The autoregressive coefficient calculating means is:
For the discrete signals of a plurality of frames stored in the storage means, an autoregressive coefficient is calculated for each discrete signal of each frame,
Autoregressive coefficient smoothing means for smoothing the autoregressive coefficient of the discrete signal of each frame output by the autoregressive coefficient calculating means;
Smoothed coefficient normalizing means for normalizing the autoregressive coefficient of the discrete signal of each frame smoothed by the autoregressive coefficient smoothing means,
The signal determination means includes
5. The signal determination apparatus according to claim 1, wherein the autoregressive coefficient of the discrete signal of each frame normalized by the smoothed coefficient normalizing means is input.
離散信号が目的信号であるか否かを判定する信号判定方法であって、
自己回帰係数算出手段が、記憶手段に記憶される離散信号に基づいて、当該離散信号を表現する非線形関数自己回帰モデルの自己回帰係数を求めて出力する自己回帰係数算出ステップと、
信号判定手段が、自己回帰係数算出ステップにおいて出力された自己回帰係数に基づいて、離散信号が目的信号であるか否かを判定して、この信号判定結果を出力する信号判定ステップと
を有することを特徴とする信号判定方法。
A signal determination method for determining whether a discrete signal is a target signal,
An autoregressive coefficient calculating means for obtaining and outputting an autoregressive coefficient of a nonlinear function autoregressive model expressing the discrete signal based on the discrete signal stored in the storage means;
The signal determination means includes a signal determination step of determining whether or not the discrete signal is a target signal based on the autoregressive coefficient output in the autoregressive coefficient calculation step, and outputting the signal determination result. A signal determination method characterized by the above.
自己回帰係数算出ステップは、
入力された離散信号に基づいて、当該離散信号を表現する指数関数自己回帰モデルにおける指数である自己回帰係数を求めて出力するものである
ことを特徴とする請求項9に記載の信号判定方法。
The autoregressive coefficient calculation step is
The signal determination method according to claim 9, wherein an autoregressive coefficient that is an index in an exponential function autoregressive model that expresses the discrete signal is obtained and output based on the input discrete signal.
信号判定ステップは、
自己回帰係数算出ステップにおいて出力された自己回帰係数と所定の閾値との比較判定を行い、この比較判定結果に基づいて、比較判定結果ごとに予め対応付けられた信号判定結果を出力するものである
ことを特徴とする請求項9または請求項10に記載の信号判定方法。
The signal determination step
A comparison determination between the autoregressive coefficient output in the autoregressive coefficient calculation step and a predetermined threshold is performed, and a signal determination result associated in advance for each comparison determination result is output based on the comparison determination result. The signal determination method according to claim 9 or 10, wherein:
信号判定ステップは、
自己回帰係数算出ステップにおいて出力された自己回帰係数に対して、予め既知の信号を用いて求めた自己回帰係数によって学習して得た学習内容に基づくパターン認識を行い、このパターン認識結果に基づいて、パターン認識結果ごとに予め対応付けられた信号判定結果を出力するものである
ことを特徴とする請求項9または請求項10に記載の信号判定方法。
The signal determination step
For the autoregressive coefficient output in the autoregressive coefficient calculation step, pattern recognition based on the learning content obtained by learning with the autoregressive coefficient obtained using a known signal in advance is performed, and based on this pattern recognition result The signal determination method according to claim 9 or 10, wherein a signal determination result associated in advance for each pattern recognition result is output.
複数のフレームの離散信号がそれぞれ目的信号であるか否かを判定する信号判定方法であって、
自己回帰係数算出手段が、記憶手段に記憶された複数のフレームの離散信号に対して、各フレームの離散信号ごとに、この離散信号に基づいて、当該離散信号を表現する非線形関数自己回帰モデルの自己回帰係数を求めて出力する自己回帰係数算出ステップと、
信号判定手段が、自己回帰係数算出ステップにおいて出力された各フレームの離散信号の自己回帰係数に基づいて、各フレームの離散信号が目的信号であるか否かを判定して、この信号判定結果を出力する信号判定ステップと
を有することを特徴とする信号判定方法。
A signal determination method for determining whether or not discrete signals of a plurality of frames are respective target signals,
An autoregressive coefficient calculating unit is configured to generate a non-linear function autoregressive model for expressing a discrete signal based on the discrete signal for each discrete signal of each frame for the discrete signal of a plurality of frames stored in the storage unit. An autoregressive coefficient calculating step for obtaining and outputting the autoregressive coefficient;
Based on the autoregressive coefficient of the discrete signal of each frame output in the autoregressive coefficient calculating step, the signal determining means determines whether or not the discrete signal of each frame is the target signal, and determines the signal determination result. And a signal determining step for outputting the signal.
請求項1から請求項8のいずれかに記載された信号判定装置としてコンピュータを機能させるための信号判定プログラム。       A signal determination program for causing a computer to function as the signal determination device according to claim 1. 請求項14に記載の信号判定プログラムを記録した、コンピュータによって読み取り可能なプログラム記録媒体。       A computer-readable program recording medium on which the signal determination program according to claim 14 is recorded.
JP2006057746A 2005-06-23 2006-03-03 Signal determination apparatus, signal determination method, signal determination program, and recording medium Expired - Fee Related JP4653673B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006057746A JP4653673B2 (en) 2005-06-23 2006-03-03 Signal determination apparatus, signal determination method, signal determination program, and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005182959 2005-06-23
JP2006057746A JP4653673B2 (en) 2005-06-23 2006-03-03 Signal determination apparatus, signal determination method, signal determination program, and recording medium

Publications (2)

Publication Number Publication Date
JP2007034262A true JP2007034262A (en) 2007-02-08
JP4653673B2 JP4653673B2 (en) 2011-03-16

Family

ID=37793545

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006057746A Expired - Fee Related JP4653673B2 (en) 2005-06-23 2006-03-03 Signal determination apparatus, signal determination method, signal determination program, and recording medium

Country Status (1)

Country Link
JP (1) JP4653673B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03248200A (en) * 1990-02-27 1991-11-06 Nec Corp Pole zero analyzing device
JP2001236085A (en) * 2000-02-25 2001-08-31 Matsushita Electric Ind Co Ltd Sound domain detecting device, stationary noise domain detecting device, nonstationary noise domain detecting device and noise domain detecting device
JP2002268669A (en) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> Method, device and program analyzing audio signal/and computer-readable storage medium stored with audio signal analyzing program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03248200A (en) * 1990-02-27 1991-11-06 Nec Corp Pole zero analyzing device
JP2001236085A (en) * 2000-02-25 2001-08-31 Matsushita Electric Ind Co Ltd Sound domain detecting device, stationary noise domain detecting device, nonstationary noise domain detecting device and noise domain detecting device
JP2002268669A (en) * 2001-03-13 2002-09-20 Nippon Telegr & Teleph Corp <Ntt> Method, device and program analyzing audio signal/and computer-readable storage medium stored with audio signal analyzing program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
西口 善朋 YOSHITOMO NISHIGUCHI: "座標変換を用いたテンソル積展開による高次スペクトルのパラメトリック推定 Parametric Estimation of Hig", 電子情報通信学会技術研究報告 VOL.99 NO.685 IEICE TECHNICAL REPORT, JPN6010041865, 14 March 2000 (2000-03-14), JP, pages 239 - 246, ISSN: 0001792369 *

Also Published As

Publication number Publication date
JP4653673B2 (en) 2011-03-16

Similar Documents

Publication Publication Date Title
JP5411936B2 (en) Speech signal section estimation apparatus, speech signal section estimation method, program thereof, and recording medium
JP5218052B2 (en) Language model generation system, language model generation method, and language model generation program
US8010362B2 (en) Voice conversion using interpolated speech unit start and end-time conversion rule matrices and spectral compensation on its spectral parameter vector
JP5229234B2 (en) Non-speech segment detection method and non-speech segment detection apparatus
EP1995723B1 (en) Neuroevolution training system
EP1465154B1 (en) Method of speech recognition using variational inference with switching state space models
US7035790B2 (en) Speech processing system
JP4515054B2 (en) Method for speech recognition and method for decoding speech signals
WO2012036305A1 (en) Voice recognition device, voice recognition method, and program
US7680663B2 (en) Using a discretized, higher order representation of hidden dynamic variables for speech recognition
JP6216809B2 (en) Parameter adjustment system, parameter adjustment method, program
JP4486527B2 (en) Acoustic signal analyzing apparatus and method, program, and recording medium
JP3987927B2 (en) Waveform recognition method and apparatus, and program
JP5191500B2 (en) Noise suppression filter calculation method, apparatus, and program
JP6580911B2 (en) Speech synthesis system and prediction model learning method and apparatus thereof
JP6142401B2 (en) Speech synthesis model learning apparatus, method, and program
JP4950600B2 (en) Acoustic model creation apparatus, speech recognition apparatus using the apparatus, these methods, these programs, and these recording media
JP4653673B2 (en) Signal determination apparatus, signal determination method, signal determination program, and recording medium
JP4691079B2 (en) Audio signal section estimation apparatus, method, program, and recording medium recording the same
JP6468519B2 (en) Basic frequency pattern prediction apparatus, method, and program
JP2008058876A (en) Method of deducing sound signal segment, and device and program and storage medium thereof
JP4690973B2 (en) Signal section estimation apparatus, method, program, and recording medium thereof
JP4242320B2 (en) Voice recognition method, apparatus and program thereof, and recording medium thereof
JP2011164124A (en) Acoustic model parameter learning method based on linear classification model and device, method and device for creating finite state converter with phoneme weighting, and program therefor
JP6903613B2 (en) Speech recognition device, speech recognition method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101217

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees