JPH0670754B2 - Polar zero analyzer - Google Patents

Polar zero analyzer

Info

Publication number
JPH0670754B2
JPH0670754B2 JP62061738A JP6173887A JPH0670754B2 JP H0670754 B2 JPH0670754 B2 JP H0670754B2 JP 62061738 A JP62061738 A JP 62061738A JP 6173887 A JP6173887 A JP 6173887A JP H0670754 B2 JPH0670754 B2 JP H0670754B2
Authority
JP
Japan
Prior art keywords
pole
zero
output
parameter
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62061738A
Other languages
Japanese (ja)
Other versions
JPS63226700A (en
Inventor
幸夫 三留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62061738A priority Critical patent/JPH0670754B2/en
Priority to US07/167,275 priority patent/US4899386A/en
Publication of JPS63226700A publication Critical patent/JPS63226700A/en
Publication of JPH0670754B2 publication Critical patent/JPH0670754B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Filters That Use Time-Delay Elements (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は極零分析装置に関し、特に音声等の信号のスペ
クトルを近似する極零パラメータの値を抽出する極零分
析装置に関するものである。
Description: TECHNICAL FIELD The present invention relates to a pole-zero analyzer, and more particularly to a pole-zero analyzer that extracts a pole-zero parameter value that approximates the spectrum of a signal such as voice.

〔従来の技術〕[Conventional technology]

音声合成や音声認識の分野では、音声のスペクトルを近
似するパラメータの値を抽出することが重要である。さ
らに、一般の信号についても、そのスペクトルを近似す
るパラメータの値を抽出することが必要になる場合があ
る。
In the fields of speech synthesis and speech recognition, it is important to extract the values of parameters that approximate the speech spectrum. Furthermore, it may be necessary to extract the values of parameters that approximate the spectrum of general signals.

音声等の信号(以下単に音声等と記す)のスペクトルを
近似するパラメータとしては、極あるいは極零がしばし
ば用いられる。これは、極や零はその物理的意味が明確
である等の特徴があり、応用上有利であるためである。
A pole or pole zero is often used as a parameter for approximating the spectrum of a signal such as voice (hereinafter simply referred to as voice). This is because poles and zeros have characteristics such as clear physical meanings and are advantageous in application.

従来、音声等のスペクトルを近似する極パラメータの値
を抽出するものとして、音声等から抽出された線形予測
係数を係数とする高次代数方程式を例えばニュートン・
ラプソン法等の逐次近似法を用いて解く方法が知られて
いる。この第一の従来例は、例えばジェイ.ディー.マ
ーケルとエイ.エイチ.グレイ(J.D.Markel and A.H.G
ray)の著書「音声の線形予測(鈴木訳)」(Linear Pr
ediction Speech)の第7章に示されている。
Conventionally, a high-order algebraic equation whose coefficient is a linear prediction coefficient extracted from speech or the like is used to extract the value of a pole parameter that approximates a spectrum of speech or the like, for example, Newton
A solution method using a successive approximation method such as Rapson method is known. This first conventional example is, for example, Jay. Dee. Markel and A. H. Gray (JDMarkel and AHG
Ray) 's book "Linear Prediction of Speech (Translated by Suzuki)" (Linear Pr
ediction Speech) chapter 7.

極パラメータの値を抽出する第二の従来例として、自己
相関領域において逆フィルタリンクするものが、伏木田
による論文「自己相関領域で逆フィルタリングを用いた
ホルマントの多段推定方式」(日本音響学会音声研究会
資料S81−41)に示されている。この第二の従来例で
は、音声の生成モデルの極パラメータに対応する係数を
用いて、入力信号の自己相関値を逐次逆フィルタリング
してエラーパワーを求める。あらかじめ、極パラメータ
値のテーブルを用意しておき、それから各段の係数を求
めて上記のエラーパワーを算出する。種々の極パラメー
タ値の候補に対してエラーパワーの最小値を与えたもの
を最適な近似を与える極パラメータの値として出力す
る。
As a second conventional example of extracting the value of the pole parameter, an inverse filter link in the autocorrelation region is described in Fushikida's paper "Multi-stage formant estimation method using inverse filtering in the autocorrelation region" It is shown in the study group material S81-41). In the second conventional example, the error power is obtained by sequentially inverse filtering the autocorrelation value of the input signal using the coefficient corresponding to the pole parameter of the voice generation model. A table of pole parameter values is prepared in advance, and the coefficient of each stage is calculated from the table to calculate the error power. The minimum value of the error power is given to various candidates for the pole parameter value, and the value is output as the pole parameter value that gives the optimum approximation.

一方、極零パラメータの値を抽出する第三の従来例とし
て、シー.ティー.マリスとアール.テイ.ロバーツ
(C.T.Mullis and R.A.Roberts)によるアイイーイーイ
ートランザクション(IEEETransaction)エイエスエス
ピー24(ASSP−24),No.3のページ226から238に掲載の
論文、「ザユース オブ セカンドオーダ インフォメ
ーション イン ザ アプロクシメイション オブ デ
ィスクリートタイム リニアー システムズ(The Use
of Second-Order Information in the Approximation o
f Discrete-Time Linear Sys-tems)」に示されたもの
がある。
On the other hand, as a third conventional example for extracting the value of the pole-zero parameter, C.I. tea. Maris and Earl. Tei. "The Youth of Second Order Information in the Aproximation of Discrete" by Roberts (CTMullis and RARoberts), EE-Transaction (IEEE Transaction 24), No. 3, pages 226-238. Time Linear Systems (The Use
of Second-Order Information in the Approximation o
f Discrete-Time Linear Sys-tems) ”.

これは、音声のスペクトル包絡H(ejω)を、伝達関数
が次式で表される極零システムによって近似するもので
ある。
This speech spectral envelope H (ej omega), the transfer function is intended to approximate the pole-zero system represented by the following formula.

但しa0=1 ここにnは分母多項式の次数すなわち極回路の次数で、
mは分子多項式の次数すなわち零回路の次数である。
Where a 0 = 1 where n is the degree of the denominator polynomial, that is, the degree of the polar circuit,
m is the order of the numerator polynomial, that is, the order of the zero circuit.

この方法は次式の値を最小にするaiおよびqkが最適な近
似を与えるという原理に基づいている。
This method is based on the principle that ai and qk that minimize the value of the following equation give the optimal approximation.

これは、時間領域においては、音声等の入力信号の自己
相関値と、それに関連したインパルス応答から決定され
る値を係数とし、ai未知数とする連立方程式を解くこと
に対応する。
In the time domain, this corresponds to solving a system of simultaneous equations in which ai is an unknown number, and a coefficient is a value determined from an autocorrelation value of an input signal such as a voice and its associated impulse response.

自己相関値およびインパルス応答の値は例えばnあるい
はmよりも高い次数の線形予測法、すなわち第一の従来
例の方法によって容易に求めることができる。そのとき
には、高次代数方程式の根を求める必要はなく、単にイ
ンパルス応答さえ求めればよい。
The value of the autocorrelation value and the value of the impulse response can be easily obtained by, for example, a linear prediction method of an order higher than n or m, that is, the method of the first conventional example. In that case, it is not necessary to find the root of the higher-order algebraic equation, and only the impulse response needs to be found.

第三の従来例では、伝達関数の分母多項式と分子多項式
の係数aiとqkが得られる。これから極零パラメータの値
を得るためには第一の従来例と同様に高次(n次もしく
はm次)代数方程式の根を求める必要がある。
In the third conventional example, coefficients ai and qk of the denominator polynomial of the transfer function and the numerator polynomial are obtained. In order to obtain the value of the pole-zero parameter from this, it is necessary to find the root of a high-order (nth-order or mth-order) algebraic equation as in the first conventional example.

〔発明が解決しようとする問題点〕[Problems to be solved by the invention]

上述した従来例のうち、第一の従来例、即ち線形予測係
数を係数とする高次代数方程式を解くものは、高次代数
方程式を解く際に多くの演算を必要とすることや、極の
周波数やバンド幅を安定に求めることが困難であるとい
った問題点があった。
Among the above-mentioned conventional examples, the first conventional example, that is, one that solves a high-order algebraic equation having a linear prediction coefficient as a coefficient requires many operations when solving a high-order algebraic equation, and There is a problem that it is difficult to stably obtain the frequency and the bandwidth.

また第二の従来例では、あらかじめ音声等のスペクトル
を表す極パラメータとして妥当と思われる候補の中から
最適な値を抽出するので安定に求められるが、多くの演
算を必要とするといった問題点があった。
Further, in the second conventional example, an optimum value is extracted in advance from candidates that are considered to be valid as a pole parameter representing a spectrum of voice or the like, so that stable calculation is possible, but there is a problem that many calculations are required. there were.

更に、これら第一,第二の従来例では極パラメータの値
しか得られないので、音声等のスペクトルの形状によっ
ては比較的低い次数では最適な近似を与えるパラメータ
値とはならない。逆にそのような場合には高い次数のパ
ラメータを求めなければならずいっそう多くの演算が必
要になるといった問題点があった。
Furthermore, since only the pole parameter values are obtained in the first and second conventional examples, the parameter value that gives the optimum approximation cannot be obtained at a relatively low order depending on the shape of the spectrum of speech or the like. On the contrary, in such a case, there has been a problem that a higher order parameter has to be obtained and more calculations are required.

第三の従来例、即ちマリスとロバーツによるものは、極
パラメータと零パラメータの値が得られるので、比較的
低い次数で最適な近似を与えるパラメータ値となるが、
第一の例と同様に高次代数方程式を解かねばならず第一
の従来例と同様の問題点があった。この点は、音声の場
合には零の数は少ないので問題とならないが、極の次数
は少なくとも10次程度必要であり問題となる。更に、こ
の従来例ではインパルス応答の推定値を求めなければな
らないために、多くの演算を必要とするという問題があ
った。
The third conventional example, that by Maris and Roberts, obtains the values of the pole parameter and the zero parameter, so the parameter value gives an optimum approximation at a relatively low order,
As in the first example, the high-order algebraic equations had to be solved, and there were the same problems as in the first conventional example. In the case of speech, this is not a problem because the number of zeros is small, but a pole order of at least about 10 is required, which is a problem. Furthermore, in this conventional example, there is a problem that many calculations are required because the estimated value of the impulse response must be obtained.

本発明の目的は、音声等の信号のスペクトルを近似する
極零パラメータの値を比較的少ない演算量で精度良く抽
出できる極零分析装置を提供することにある。
An object of the present invention is to provide a pole-zero analyzer which can accurately extract the value of the pole-zero parameter approximating the spectrum of a signal such as voice with a relatively small amount of calculation.

〔問題点を解決するための手段〕[Means for solving problems]

本発明の極零分析装置は、音声等の信号から抽出された
ケプストラムの値を用いて極零型の音声の生成モデルに
基づいて極零パラメータ値を推定する極零分析装置にお
いて、入力信号から時間窓内のケプストラムを算出し一
時記憶する手段と、二次の極回路と一次の零回路を有
し、その出力を第一の出力とし、その出力に係数を掛け
た値を第二の出力とし、一次の遅延要素の出力に係数を
掛けた値を第三の出力とする回路を基本フィルタとし、
少なくとも一つの基本フィルタの第一の出力を並列に接
続した第一の並列フィルタと、同様の構成の第二の並列
フィルタを有し、前記第一の並列フィルタの出力と前記
第二の並列フィルタの出力の差に係数を掛けた値を出力
とする分析フィルタと、前記入力信号から抽出されたケ
プストラムと前記分析フィルタのインパルス応答との差
を算出し、それから極零パラメータの推定誤差を算出す
る手段と、前記各基本フィルタの第二,第三の出力とケ
プストラムの差から極零パラメータの推定値の修正情報
を算出する手段と、前記音声の生成モデルの極零パラメ
ータの候補値を選択し、そのときの推定誤差を算出し、
各パラメータの修正情報に基づいて前記極零パラメータ
の候補値を修正しつつ極零パラメータの推定誤差が最小
になった時の前記極零パラメータの候補値を抽出された
極零パラメータの値として出力するように制御する手段
とを備えている。
The pole-zero analysis apparatus of the present invention is a pole-zero analysis apparatus that estimates pole-zero parameter values based on a generation model of a pole-zero type speech using a value of a cepstrum extracted from a signal such as a voice, from an input signal. It has a means for calculating and temporarily storing the cepstrum within the time window, a secondary pole circuit and a primary zero circuit, and its output is the first output, and the value obtained by multiplying the output by a coefficient is the second output. And a circuit in which a value obtained by multiplying the output of the first-order delay element by a coefficient is the third output is a basic filter,
A first parallel filter in which the first outputs of at least one basic filter are connected in parallel, and having a second parallel filter of the same configuration, the output of the first parallel filter and the second parallel filter An output of a value obtained by multiplying the output difference by a coefficient, and the difference between the cepstrum extracted from the input signal and the impulse response of the analysis filter is calculated, and then the estimation error of the pole-zero parameter is calculated. Means, means for calculating correction information of the estimated value of the pole-zero parameter from the difference between the second and third outputs of each of the basic filters and the cepstrum, and a candidate value of the pole-zero parameter of the voice generation model is selected. , Calculate the estimation error at that time,
The candidate value of the pole-zero parameter is output as the value of the extracted pole-zero parameter when the estimation error of the pole-zero parameter is minimized while modifying the candidate value of the pole-zero parameter based on the correction information of each parameter. And means for controlling so as to do so.

〔作用〕[Action]

本発明の原理は、次の式(3)で与えられる対数スペク
トルの二乗誤差rを最小にするようにして最適な極零パ
ラメータを求めることである。
The principle of the present invention is to find the optimum pole-zero parameter by minimizing the square error r of the logarithmic spectrum given by the following equation (3).

これは時間領域においては音声から抽出されたケプスト
ラムと、音声生成モデルのケプストラムの二乗誤差を最
小にすることに等価である。音声のスペクトル包絡を表
すケプストラムは、数10次以下の成分であるから、二乗
誤差を評価する場合にもその程度の成分のみでよい。
This is equivalent to minimizing the squared error between the cepstrum extracted from the speech and the cepstrum of the speech production model in the time domain. Since the cepstrum that represents the spectral envelope of speech is a component of several tens or less, only a component of that level is sufficient when evaluating a squared error.

あらかじめ決められた時間窓内の音声のケプストラムの
値は従来よく知られているように、高速フーリエ変換器
などを用いて容易に算出することができる。これに対し
音声の生成モデルのケプストラムを同様に高速フーリエ
変換器を用いて算出しようとするならば、極零パラメー
タの推定値を設定し、合成音声を生成しそれのケプスト
ラムを高速フーリエ変換器によって求めなければならな
いので膨大な演算を必要とする。
The value of the speech cepstrum within a predetermined time window can be easily calculated using a fast Fourier transformer or the like, as is well known in the art. On the other hand, if the cepstrum of the speech production model is to be calculated using a fast Fourier transformer as well, an estimated value of the pole-zero parameter is set, synthetic speech is generated, and its cepstrum is generated by the fast Fourier transformer. Since it has to be obtained, a huge amount of calculation is required.

しかし本発明では、音声の生成モデルが極零モデルであ
る場合には、構成要素の分析フィルタのインパルス応答
に時間の逆数を掛けた値がその音声生成モデルのケプス
トラムと等価であることを利用し演算量を低減してい
る。このとき基本フィルタの係数は次式で与えられる。
However, in the present invention, when the speech production model is a pole-zero model, it is utilized that the value obtained by multiplying the impulse response of the component analysis filter by the reciprocal of time is equivalent to the cepstrum of the speech production model. The amount of calculation is reduced. At this time, the coefficient of the basic filter is given by the following equation.

a=2・p・cos(θ) b=−p2 (4) c=−p・cos(θ) ここに、pは生成モデルの極または零の絶対値、θはそ
の偏角である。係数a,b,cはそれぞれ第2図(a)に示
す基本フィルタの乗算器203,204,205の係数にそれぞれ
対応する。
a = 2 · p · cos (θ) b = −p 2 (4) c = −p · cos (θ) where p is the absolute value of the pole or zero of the generative model, and θ is its argument. The coefficients a, b and c respectively correspond to the coefficients of the multipliers 203, 204 and 205 of the basic filter shown in FIG.

さらに、ケプストラムの二乗誤差の極零パラメータに対
する偏微分係数が基本フィルタの第二,第三の出力と等
価であることを利用し、極零パラメータの候補値の修正
を決定するものである。このときの偏微分係数を算出す
るための係数は次式で与えられる。
Furthermore, the fact that the partial differential coefficient of the square error of the cepstrum with respect to the pole-zero parameter is equivalent to the second and third outputs of the basic filter is used to determine the correction of the candidate value of the pole-zero parameter. The coefficient for calculating the partial differential coefficient at this time is given by the following equation.

d=−1/p e=−2・p・sin(θ) (5) ここに、d,eは第2図(a)に示す基本フィルタの乗算
器206,207の係数に対応する。
d = −1 / p e = −2 · p · sin (θ) (5) Here, d and e correspond to the coefficients of the multipliers 206 and 207 of the basic filter shown in FIG.

このようにして、ケプストラムの二乗誤差を種々の極零
パラメータ値の候補について算出し、各基本フィルタの
第二,第三の出力を基にその候補値を修正しつつ、二乗
誤差の最小値を与えるときの極零パラメータ値の候補を
最適な極零パラメータ値として出力する。
In this way, the squared error of the cepstrum is calculated for various candidates of pole-zero parameter values, and the minimum value of the squared error is corrected while correcting the candidate values based on the second and third outputs of each basic filter. The candidate for the pole-zero parameter value when given is output as the optimum pole-zero parameter value.

〔実施例〕〔Example〕

次に、図面を用いて本発明の実施例について説明する。 Next, embodiments of the present invention will be described with reference to the drawings.

第1図は本発明の一実施例のブロック図である。FIG. 1 is a block diagram of an embodiment of the present invention.

101は制御回路、102はケプストラム算出回路、103はケ
プストラムメモリ、104はインパルス発生器、105は第一
並列フィルタ、106は第二並列フィルタ、107は第一係数
算出回路、108は第二係数算出回路、109は係数乗算器、
110は誤差算出回路、111は極修正情報算出器、112は零
修正情報算出器である。
101 is a control circuit, 102 is a cepstrum calculation circuit, 103 is a cepstrum memory, 104 is an impulse generator, 105 is a first parallel filter, 106 is a second parallel filter, 107 is a first coefficient calculation circuit, and 108 is a second coefficient calculation. Circuit, 109 is a coefficient multiplier,
110 is an error calculation circuit, 111 is a pole correction information calculator, and 112 is a zero correction information calculator.

また、第2図は二つの並列フィルタその構成要素である
基本フィルタのブロック図である。第2図(a)に示す
ように、基本フィルタは二つの遅延要素201と202,極回
路の係数乗算器203と204,零回路の係数乗算器205,その
出力から極の絶対値の修正情報を生成するための係数乗
算器206,一次の遅延要素に掛けて偏角の修正情報を生成
するための係数乗算器207から構成され、1つの入力信
号線211と三本の出力信号線212,213,214を持っている。
Further, FIG. 2 is a block diagram of a basic filter which is a constituent element of two parallel filters. As shown in FIG. 2 (a), the basic filter includes two delay elements 201 and 202, coefficient multipliers 203 and 204 of the pole circuit, coefficient multiplier 205 of the zero circuit, and correction information of the absolute value of the pole from its output. And a coefficient multiplier 207 for multiplying a first-order delay element to generate deflection angle correction information. One input signal line 211 and three output signal lines 212, 213 and 214 are provided. have.

一方、第2図(b)は並列フィルタのブロック図であ
り、信号線221から入力される信号は複数の基本フィル
タの各入力信号線に分配されて入力され、各基本フィル
タの第一の出力信号線、即ち第2図(a)の信号線212
の出力が総て加算されて信号線222から出力され、その
外の信号線、即ち第2図(a)の信号線213,214はその
まま信号線の束223に出力される。
On the other hand, FIG. 2B is a block diagram of the parallel filter, in which the signal input from the signal line 221 is distributed and input to each input signal line of the plurality of basic filters, and the first output of each basic filter is input. The signal line, that is, the signal line 212 in FIG.
Are output from the signal line 222, and the other signal lines, that is, the signal lines 213 and 214 in FIG. 2A, are output to the signal line bundle 223 as they are.

第1図の信号線121から信号が入力されると、ケプスト
ラム算出回路102は、制御回路101から信号線123を介し
て送られる制御信号に従って、時間窓内の入力信号のケ
プストラムを算出し信号線133を介してケプストラムメ
モリ103に送り一時記憶させる。
When a signal is input from the signal line 121 in FIG. 1, the cepstrum calculation circuit 102 calculates the cepstrum of the input signal within the time window in accordance with the control signal sent from the control circuit 101 via the signal line 123. It is sent to the cepstrum memory 103 via 133 and temporarily stored.

一方、第一,第二係数算出回路107,108は、制御回路101
からそれぞれ信号線127,128を介して送られる音声生成
モデルの極パラメータの候補値および零パラメータの候
補値から、各基本フィルタの各係数を算出し、それぞれ
信号線136,137を介して第一,第二並列フィルタに送
る。
On the other hand, the first and second coefficient calculation circuits 107 and 108 are
From the polar parameter candidate value and the zero parameter candidate value of the voice generation model sent from the respective signal lines 127 and 128 respectively, the respective coefficients of the respective basic filters are calculated, and the first and second parallel lines are respectively calculated via the signal lines 136 and 137. Send to filter.

第一,第二並列フィルタ105,106は、制御回路101からそ
れぞれ信号線125,126を介して送られる制御信号に従
い、内部の遅延要素をクリアーした後、第一,第二係数
算出回路107,108から送られる係数値を各基本フィルタ
内の乗算器にセットし、インパルス発生器104から信号
線135を介して送られるインパルスに対する応答を逐次
算出し、それぞれ信号線138,139に送り、そのデータの
差が信号線140を通って乗算器109に送られる。乗算器10
9には制御回路101から信号線131を介してインパルス発
生からの時刻の逆数が送られ、この乗算器109の出力が
音声生成モデルのケプストラムデータとして信号線141
へと送られる。
The first and second parallel filters 105 and 106 have coefficient values sent from the first and second coefficient calculation circuits 107 and 108 after clearing internal delay elements according to control signals sent from the control circuit 101 via signal lines 125 and 126, respectively. Is set to the multiplier in each basic filter, the response to the impulse sent from the impulse generator 104 via the signal line 135 is sequentially calculated, and the results are sent to the signal lines 138 and 139, respectively, and the difference between the data passes through the signal line 140. And is sent to the multiplier 109. Multiplier 10
The reciprocal of the time from the impulse generation is sent to the control circuit 101 from the control circuit 101 via the signal line 131, and the output of the multiplier 109 is sent to the signal line 141 as the cepstrum data of the voice generation model.
Sent to.

ケプストラムメモリ103は、記憶している音声のケプス
トラムデータを制御回路101から信号線124を介して送ら
れるタイミング信号に同期して信号線134へと送り出
し、そのデータと音声生成モデルのケプストラムとの差
が信号線142を介して誤差算出回路110、極修正情報算出
器111、零修正情報算出器112へと送られる。
The cepstrum memory 103 sends the stored voice cepstrum data to the signal line 134 in synchronization with the timing signal sent from the control circuit 101 via the signal line 124, and outputs the difference between the data and the cepstrum of the voice generation model. Is sent to the error calculation circuit 110, the pole correction information calculator 111, and the zero correction information calculator 112 via the signal line 142.

誤差算出回路110では、制御回路101から信号線132を介
して送られるタイミング信号に同期して、信号線142を
介して送られるケプストラムの差のデータの二乗和を算
出し、信号線143を介して制御回路101へと送る。
The error calculation circuit 110 calculates the sum of squares of the cepstrum difference data sent via the signal line 142 in synchronism with the timing signal sent from the control circuit 101 via the signal line 132, and via the signal line 143. And sends it to the control circuit 101.

第一,第二の並列フィルタ105,106からは、信号線の束1
44,145を介して各基本フィルタの第二,第三の出力から
得られる情報がそれぞれ、極修正情報算出器111,零修正
情報算出器112へと送られる。
From the first and second parallel filters 105 and 106, the bundle of signal lines 1
Information obtained from the second and third outputs of the respective basic filters via 44 and 145 are sent to the pole correction information calculator 111 and the zero correction information calculator 112, respectively.

極修正情報算出器111,零修正情報算出器112は、それぞ
れ信号線129,130を介して制御回路101から送られる制御
信号に従って、それぞれ信号線の束144,145を介して送
られるデータと、信号線142を介して送られケプストラ
ムの差のデータから、各極パラメータおよび零パラメー
タの変化に対する二乗誤差の偏微分係数を算出し、それ
ぞれ信号線146,147を介して制御回路101へと送る。
The pole-correction-information calculator 111 and the zero-correction-information calculator 112 divide the data sent via the signal line bundles 144 and 145, respectively, and the signal line 142 in accordance with the control signals sent from the control circuit 101 via the signal lines 129 and 130, respectively. The partial differential coefficient of the squared error with respect to the change of each pole parameter and zero parameter is calculated from the data of the cepstrum difference sent via the signal and sent to the control circuit 101 via the signal lines 146 and 147, respectively.

制御回路101は、音声生成モデルの極零パラメータの候
補値を、第一,第二係数算出回路107,108へと送り、そ
のときの推定誤差を誤差算出回路110から受け取ると共
に、各極パラメータおよび零パラメータの修正情報を極
修正情報算出器111,零修正情報算出器112から受け取
り、極零パラメータの候補値を修正しつつ、推定誤差が
最小なるときの候補値を、最適な極零パラメータの値と
して信号線122から出力する。
The control circuit 101 sends the candidate values of the pole-zero parameter of the voice generation model to the first and second coefficient calculation circuits 107 and 108, receives the estimation error at that time from the error calculation circuit 110, and also determines each pole parameter and zero parameter. Of the correction information of the pole correction information calculator 111, the zero correction information calculator 112, while correcting the candidate value of the pole-zero parameter, the candidate value when the estimation error is the minimum, as the value of the optimum pole-zero parameter. Output from the signal line 122.

以上の処理が分析フレームごとにくり返される。The above processing is repeated for each analysis frame.

〔発明の効果〕〔The invention's effect〕

以上説明したように本発明によれば、第一および第二の
従来例より精度良くスペクトルを近似できる極零パラメ
ータ値を求められる。しかも高次の代数方程式を解く必
要がないため第三の従来例より安定に求められるという
効果がある。このとき、第三の従来例と異なり、音声の
生成モデルのインパルス応答を求める必要がないので、
その分の演算は不要である。
As described above, according to the present invention, the pole-zero parameter value that can approximate the spectrum more accurately than the first and second conventional examples can be obtained. Moreover, since it is not necessary to solve a high-order algebraic equation, there is an effect that it can be obtained more stably than the third conventional example. At this time, unlike the third conventional example, it is not necessary to obtain the impulse response of the voice generation model.
The calculation for that amount is unnecessary.

また、本発明によれば、音声合成のための極零分析など
において、極零パラメータ値の候補に制限を加えること
によって、音声合成モデルに合ったものを抽出できると
いう利点がある。
Further, according to the present invention, there is an advantage that, in pole-zero analysis or the like for speech synthesis, by limiting restrictions on the pole-zero parameter value candidates, ones that match the speech synthesis model can be extracted.

さらに、音声からケプストラムを抽出する際に、周波数
軸をメルスケールなどに変換したり、抽出されたケプス
トラムデータに重みを掛けたりすることにより、分析の
精度の向上をさせられるという効果が期待される。
Furthermore, when extracting the cepstrum from speech, it is expected that the accuracy of analysis can be improved by converting the frequency axis to mel scale or by weighting the extracted cepstrum data. .

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例のブロック図、第2図は二つ
の並列フィルタとその構成要素である基本フィルタのブ
ロック図である。 101……制御回路、102……ケプストラム算出回路、103
……ケプストラムメモリ、104……インパルス発生器、1
05……第一並列フィルタ、106……第二並列フィルタ、1
07……第一係数算出回路、108……第二係数算出回路、1
09……係数乗算器、110…誤差算出回路、111……極修正
情報算出器、112……零修正情報算出器、201,202……遅
延要素、203,204……極回路の係数乗算器、205……零回
路の係数乗算器、206……基本フィルタの出力から極の
絶対値の修正情報を生成するための係数乗算器、207…
…一次の遅延要素に掛けて偏角の修正情報を生成するた
めの係数乗算器。
FIG. 1 is a block diagram of an embodiment of the present invention, and FIG. 2 is a block diagram of two parallel filters and a basic filter which is a component thereof. 101 ... Control circuit, 102 ... Cepstrum calculation circuit, 103
...... Cepstral memory, 104 …… Impulse generator, 1
05 …… First parallel filter, 106 …… Second parallel filter, 1
07 …… First coefficient calculation circuit, 108 …… Second coefficient calculation circuit, 1
09 …… coefficient multiplier, 110… error calculation circuit, 111 …… pole correction information calculator, 112 …… zero correction information calculator, 201,202 …… delay element, 203,204 …… pole circuit coefficient multiplier, 205 …… Coefficient multiplier of zero circuit, 206 ... Coefficient multiplier for generating correction information of absolute value of pole from output of basic filter, 207 ...
... A coefficient multiplier for multiplying the first-order delay element to generate the correction information of the argument.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】音声等の信号から抽出されたケプストラム
の値を用いて極零型の音声の生成モデルに基づいて極零
パラメータ値を推定する極零分析装置において、入力信
号から時間窓内のケプストラムを算出し一時記憶する手
段と、二次の極回路と一次の零回路を有し、その出力を
第一の出力とし、その出力に係数を掛けた値を第二の出
力とし、一次の遅延要素の出力に係数を掛けた値を第三
の出力とする回路を基本フィルタとし、少なくとも一つ
の基本フィルタの第一の出力を並列に接続した第一の並
列フィルタと、同様の構成の第二の並列フィルタを有
し、前記第一の並列フィルタの出力と前記第二の並列フ
ィルタの出力の差に係数を掛けた値を出力とする分析フ
ィルタと、前記入力信号から抽出されたケプストラムと
前記分析フィルタのインパルス応答との差を算出し、そ
れから極零パラメータの推定誤差を算出する手段と、前
記各基本フィルタの第二,第三の出力とケプストラムの
差から極零パラメータの推定値の修正情報を算出する手
段と、前記音声の生成モデルの極零パラメータの候補値
を選択し、そのときの推定誤差を算出し、各パラメータ
の修正情報に基づいて前記極零パラメータの候補値を修
正しつつ極零パラメータの推定誤差が最小になった時の
前記極零パラメータの候補値を抽出された極零パラメー
タの値として出力するように制御する手段とを備えるこ
とを特徴とする極零分析装置。
1. A pole-zero analyzer for estimating pole-zero parameter values based on a pole-zero voice generation model using a cepstrum value extracted from a signal such as a voice signal. It has a means for calculating and temporarily storing the cepstrum, a secondary pole circuit and a primary zero circuit, and its output is the first output, and a value obtained by multiplying the output by a coefficient is the second output. A circuit in which the value obtained by multiplying the output of the delay element by a coefficient is the third output is the basic filter, and the first parallel filter in which the first outputs of at least one basic filter are connected in parallel, An analysis filter having two parallel filters, the output of which is a value obtained by multiplying the difference between the output of the first parallel filter and the output of the second parallel filter, and a cepstrum extracted from the input signal. Of the analysis filter And a correction means for calculating the estimation error of the pole-zero parameter from the difference, and the correction information of the estimation value of the pole-zero parameter from the difference between the second and third outputs of the basic filters and the cepstrum. Means for selecting the pole-zero parameter candidate value of the speech generation model, calculating the estimation error at that time, and correcting the pole-zero parameter candidate value based on the correction information of each parameter while controlling the pole-zero parameter. And a means for controlling so that the candidate value of the pole-zero parameter when the estimation error of the parameter becomes the minimum is output as the value of the extracted pole-zero parameter.
JP62061738A 1987-03-11 1987-03-16 Polar zero analyzer Expired - Lifetime JPH0670754B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP62061738A JPH0670754B2 (en) 1987-03-16 1987-03-16 Polar zero analyzer
US07/167,275 US4899386A (en) 1987-03-11 1988-03-11 Device for deciding pole-zero parameters approximating spectrum of an input signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62061738A JPH0670754B2 (en) 1987-03-16 1987-03-16 Polar zero analyzer

Publications (2)

Publication Number Publication Date
JPS63226700A JPS63226700A (en) 1988-09-21
JPH0670754B2 true JPH0670754B2 (en) 1994-09-07

Family

ID=13179831

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62061738A Expired - Lifetime JPH0670754B2 (en) 1987-03-11 1987-03-16 Polar zero analyzer

Country Status (1)

Country Link
JP (1) JPH0670754B2 (en)

Also Published As

Publication number Publication date
JPS63226700A (en) 1988-09-21

Similar Documents

Publication Publication Date Title
Kawahara et al. Tandem-STRAIGHT: A temporally stable power spectral representation for periodic signals and applications to interference-free spectrum, F0, and aperiodicity estimation
EP3309782B1 (en) Method, device and system for noise suppression
EP2178082A1 (en) Cyclic signal processing method, cyclic signal conversion method, cyclic signal processing device, and cyclic signal analysis method
US8280739B2 (en) Method and apparatus for speech analysis and synthesis
EP0853309B1 (en) Method and apparatus for signal analysis
JPH0632028B2 (en) Speech analysis method
JPS5853358B2 (en) speech analysis device
CA1164569A (en) System for extraction of pole/zero parameter values
Nau et al. Simulating and analyzing artificial nonstationary earthquake ground motions
JPH0670754B2 (en) Polar zero analyzer
Narayanaswamy et al. Audio source separation via multi-scale learning with dilated dense u-nets
JPH07234696A (en) Complex cepstrum analyzer for speech
JPH0670753B2 (en) Polar zero analyzer
US6049814A (en) Spectrum feature parameter extracting system based on frequency weight estimation function
JPH0670752B2 (en) Polar zero analyzer
JPS62203199A (en) Pitch cycle extraction system
Nein et al. Incorporating error shaping technique into LSF vector quantization
CN1801323B (en) Load optimization method for speech/speaker recognition system
US4845754A (en) Pole-zero analyzer
JPS6255800B2 (en)
JPH0235992B2 (en)
JPS6367200B2 (en)
JPH0670750B2 (en) Pole zero analyzer with estimation of phase characteristics
JPH0670751B2 (en) Pole zero analyzer with estimation of phase characteristics
JPH0644197B2 (en) Polar zero analyzer