JP4293005B2 - Speech and music signal encoding apparatus and decoding apparatus - Google Patents

Speech and music signal encoding apparatus and decoding apparatus Download PDF

Info

Publication number
JP4293005B2
JP4293005B2 JP2004027981A JP2004027981A JP4293005B2 JP 4293005 B2 JP4293005 B2 JP 4293005B2 JP 2004027981 A JP2004027981 A JP 2004027981A JP 2004027981 A JP2004027981 A JP 2004027981A JP 4293005 B2 JP4293005 B2 JP 4293005B2
Authority
JP
Japan
Prior art keywords
signal
linear prediction
prediction coefficient
circuit
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004027981A
Other languages
Japanese (ja)
Other versions
JP2004177982A (en
Inventor
淳 村島
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004027981A priority Critical patent/JP4293005B2/en
Publication of JP2004177982A publication Critical patent/JP2004177982A/en
Application granted granted Critical
Publication of JP4293005B2 publication Critical patent/JP4293005B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To excellently encode a sound music signal over the entire band by a voice music signal encoding and decoding device of band-division constitution. <P>SOLUTION: A residue vector is generated from a difference vector outputted from a first differentiator 180 by using a reverse filter 230. A band selecting circuit 250 generates (n) sub-vectors by using components included in an arbitrary band with an orthogonally-converted residue vector. An orthogonal conversion coefficient quantizing circuit 260 quantizes the (n) sub-vectors. <P>COPYRIGHT: (C)2004,JPO

Description

本発明は、音声音楽信号を低ビットレートで伝送するための符号化装置および復号装置に関するものである。 The present invention relates to an encoding device and a decoding device for transmitting a voice music signal at a low bit rate.

音声信号を中低ビットレートで高能率に符号化する方法として、音声信号を線形予測フィルタとその駆動音源信号(音源信号)に分離して符号化する方法が広く用いられている。 As a method of encoding an audio signal at a medium to low bit rate with high efficiency, a method of encoding an audio signal by separating it into a linear prediction filter and its driving excitation signal (excitation signal) is widely used.

その代表的な方法の一つにCELP(Code Excited Linear Prediction)がある。CELPでは、入力音声を線形予測分析して求めた線形予測係数が設定された線形予測フィルタを、音声のピッチ周期を表す信号と雑音的な信号との和で表される音源信号により駆動することで、合成音声信号(再生信号)が得られる。CELPに関してはM. Schroederらによる「Code excited linear prediction:High quality speech at very low bit rates」(Proc. ICASSP, pp.937-940, 1985 )(非特許文献1)を参照できる。また、前記CELPを帯域分割構成とすることで、音楽信号に対する符号化性能を改善できる。この構成では、各帯域に対応する音源信号を加算して得られる励振信号で、線形予測合成フィルタを駆動することによって、再生信号を生成する。 One typical method is CELP (Code Excited Linear Prediction). In CELP, a linear prediction filter in which a linear prediction coefficient obtained by linear prediction analysis of input speech is set is driven by a sound source signal represented by the sum of a speech pitch period signal and a noisy signal. Thus, a synthesized voice signal (reproduced signal) is obtained. Regarding CELP, reference can be made to “Code excited linear prediction: High quality speech at very low bit rates” (Proc. ICASSP, pp. 937-940, 1985) (Non-Patent Document 1). Also, the coding performance for the music signal can be improved by adopting a band division configuration for the CELP. In this configuration, a reproduction signal is generated by driving a linear prediction synthesis filter with an excitation signal obtained by adding sound source signals corresponding to each band.

帯域分割構成のCELPに関しては、A. Ubaleらによる「Multi-band CELP Coding of Speech and Music」(IEEE Workshop on Speech Coding for Telec
ommunications, pp.101-102, 1997)(非特許文献2)を参照できる。
Regarding CELP in band division configuration, “Multi-band CELP Coding of Speech and Music” by A. Ubale et al. (IEEE Workshop on Speech Coding for Telec
ommunications, pp. 101-102, 1997) (Non-Patent Document 2).

図31は従来の音声音楽信号符号化装置の一例を示すブロック図である。ここでは簡単のため、帯域数を2とする。音声または音楽信号をサンプリングし、この複数サンプルを1フレームとして一つのベクトルにまとめて生成した入力信号(入力ベクトル)は、入力端子10から入力される。 FIG. 31 is a block diagram showing an example of a conventional speech and music signal encoding apparatus. Here, for simplicity, the number of bands is 2. An input signal (input vector) generated by sampling a voice or music signal and combining the plurality of samples into one vector as one frame is input from the input terminal 10.

線形予測係数計算回路170は、入力端子10から入力ベクトルを入力し、前記入力ベクトルに対して線形予測分析を行い、線形予測係数を求め、さらに前記線形予測係数を量子化し、量子化線形予測係数を求める。そして前記線形予測係数を重みづけフィルタ140と重みづけフィルタ141へ出力し、量子化線形予測係数に対応するインデックスを線形予測合成フィルタ130と線形予測合成フィルタ131および符号出力回路190へ出力する。 The linear prediction coefficient calculation circuit 170 receives an input vector from the input terminal 10, performs linear prediction analysis on the input vector, obtains a linear prediction coefficient, further quantizes the linear prediction coefficient, and produces a quantized linear prediction coefficient. Ask for. The linear prediction coefficient is output to the weighting filter 140 and the weighting filter 141, and the index corresponding to the quantized linear prediction coefficient is output to the linear prediction synthesis filter 130, the linear prediction synthesis filter 131, and the code output circuit 190.

第1の音源生成回路110は、第1の最小化回路150から出力されるインデックスを入力し、前記インデックスに対応する第1の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第1のゲイン回路160へ出力する。 The first sound source generation circuit 110 receives an index output from the first minimization circuit 150, reads a first sound source vector corresponding to the index from a table storing a plurality of sound source vectors, Output to the first gain circuit 160.

第2の音源生成回路111は、第2の最小化回路151から出力されるインデックスを入力し、前記インデックスに対応する第2の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第2のゲイン回路161へ出力する。 The second sound source generation circuit 111 receives the index output from the second minimization circuit 151, reads the second sound source vector corresponding to the index from a table storing a plurality of sound source vectors, Output to the second gain circuit 161.

第1のゲイン回路160は、第1の最小化回路150から出力されるインデックスと第1の音源生成回路110から出力される第1の音源ベクトルとを入力し、前記インデックスに対応する第1のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第1のゲインと前記第1の音源ベクトルとを乗算し、第3の音源ベクトルを生成し、前記第3の音源ベクトルを第1の帯域通過フィルタ120へ出力する。 The first gain circuit 160 receives the index output from the first minimizing circuit 150 and the first sound source vector output from the first sound source generation circuit 110, and receives the first gain corresponding to the index. The gain is read from a table in which a plurality of gain values are stored, the first gain and the first excitation vector are multiplied, a third excitation vector is generated, and the third excitation vector is 1 to the band pass filter 120.

第2のゲイン回路161は、第2の最小化回路151から出力されるインデックスと第2の音源生成回路111から出力される第2の音源ベクトルとを入力し、前記インデックスに対応する第2のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第2のゲインと前記第2の音源ベクトルとを乗算し、第4の音源ベクトルを生成し、前記第4の音源ベクトルを第2の帯域通過フィルタ121へ出力する。 The second gain circuit 161 receives the index output from the second minimization circuit 151 and the second sound source vector output from the second sound source generation circuit 111, and receives a second corresponding to the index. The gain is read from a table in which a plurality of gain values are stored, the second gain and the second excitation vector are multiplied, a fourth excitation vector is generated, and the fourth excitation vector is 2 to the band-pass filter 121.

第1の帯域通過フィルタ120は、第1のゲイン回路160から出力される第3の音源ベクトルを入力する。前記第3の音源ベクトルは、このフィルタにより第1の帯域に帯域制限され、第1の励振ベクトルを得る。第1の帯域通過フィルタ120は、前記第1の励振ベクトルを線形予測合成フィルタ130へ出力する。 The first band pass filter 120 receives the third sound source vector output from the first gain circuit 160. The third sound source vector is band-limited to the first band by this filter to obtain a first excitation vector. The first band pass filter 120 outputs the first excitation vector to the linear prediction synthesis filter 130.

第2の帯域通過フィルタ121は、第2のゲイン回路161から出力される第4の音源ベクトルを入力する。前記第4の音源ベクトルは、このフィルタにより第2の帯域に帯域制限され、第2の励振ベクトルを得る。第2の帯域通過フィルタ121は、前記第2の励振ベクトルを線形予測合成フィルタ131へ出力する。 The second band pass filter 121 receives the fourth sound source vector output from the second gain circuit 161. The fourth excitation vector is band-limited to the second band by this filter to obtain a second excitation vector. The second band pass filter 121 outputs the second excitation vector to the linear prediction synthesis filter 131.

線形予測合成フィルタ130は、第1の帯域通過フィルタ120から出力される第1の励振ベクトルと線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第1の励振ベクトルにより駆動することで、第1の再生信号(再生ベクトル)を得る。そして前記第1の再生ベクトルを第1の差分器180へ出力する。 The linear prediction synthesis filter 130 receives the first excitation vector output from the first bandpass filter 120 and the index corresponding to the quantized linear prediction coefficient output from the linear prediction coefficient calculation circuit 170, and the index By reading the quantized linear prediction coefficient corresponding to the above from a table in which a plurality of quantized linear prediction coefficients are stored, and driving the filter in which the quantized linear prediction coefficient is set by the first excitation vector, A first reproduction signal (reproduction vector) is obtained. Then, the first reproduction vector is output to the first subtractor 180.

線形予測合成フィルタ131は、第2の帯域通過フィルタ121から出力される第2の励振ベクトルと線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第2の励振ベクトルにより駆動することで、第2の再生ベクトルを得る。そして前記第2の再生ベクトルを第2の差分器181へ出力する。 The linear prediction synthesis filter 131 receives the second excitation vector output from the second bandpass filter 121 and the index corresponding to the quantized linear prediction coefficient output from the linear prediction coefficient calculation circuit 170, and the index By reading the quantized linear prediction coefficient corresponding to the above from a table in which a plurality of quantized linear prediction coefficients are stored, and driving the filter in which the quantized linear prediction coefficient is set by the second excitation vector, A second reproduction vector is obtained. Then, the second reproduction vector is output to the second subtractor 181.

第1の差分器180は、入力端子10を介して入力ベクトルを入力し、線形予測合成フィルタ130から出力される第1の再生ベクトルを入力し、それらの差分を計算し、これを第1の差分ベクトルとして、重みづけフィルタ140と第2の差分器181へ出力する。 The first differentiator 180 inputs an input vector via the input terminal 10, inputs a first reproduction vector output from the linear prediction synthesis filter 130, calculates a difference between them, and calculates the first difference. The difference vector is output to the weighting filter 140 and the second differencer 181.

第2の差分器181は、第1の差分器180から第1の差分ベクトルを入力し、線形予測合成フィルタ131から出力される第2の再生ベクトルを入力し、それらの差分を計算し、これを第2の差分ベクトルとして、重みづけフィルタ141へ出力する。 The second subtractor 181 receives the first difference vector from the first subtractor 180, receives the second reproduction vector output from the linear prediction synthesis filter 131, calculates the difference between them, Is output to the weighting filter 141 as the second difference vector.

重みづけフィルタ140は、第1の差分器180から出力される第1の差分ベクトルと線形予測係数計算回路170から出力される線形予測係数を入力し、前記線形予測係数を用いて、人間の聴覚特性に対応した重みづけフィルタを生成し、前記重みづけフィルタを前記第1の差分ベクトルで駆動することで、第1の重
みづけ差分ベクトルを得る。そして前記第1の重みづけ差分ベクトルを第1の最小化回路150へ出力する。
The weighting filter 140 receives the first difference vector output from the first differentiator 180 and the linear prediction coefficient output from the linear prediction coefficient calculation circuit 170, and uses the linear prediction coefficient to human hearing. A weighting filter corresponding to the characteristic is generated, and the weighting filter is driven by the first difference vector to obtain a first weighting difference vector. The first weighted difference vector is output to the first minimizing circuit 150.

重みづけフィルタ141は、第2の差分器181から出力される第2の差分ベクトルと線形予測係数計算回路170から出力される線形予測係数を入力し、前記線形予測係数を用いて、人間の聴覚特性に対応した重みづけフィルタを生成し、前記重みづけフィルタを前記第2の差分ベクトルで駆動することで、第2の重みづけ差分ベクトルを得る。そして前記第2の重みづけ差分ベクトルを第2の最小化回路151へ出力する。 The weighting filter 141 receives the second difference vector output from the second differentiator 181 and the linear prediction coefficient output from the linear prediction coefficient calculation circuit 170, and uses the linear prediction coefficient to detect human hearing. A weighting filter corresponding to the characteristic is generated, and the weighting filter is driven by the second difference vector to obtain a second weighting difference vector. Then, the second weighted difference vector is output to the second minimizing circuit 151.

第1の最小化回路150は、第1の音源生成回路110に格納されている第1の音源ベクトル全てに対応するインデックスを、前記第1の音源生成回路110へ順次出力し、第1のゲイン回路160に格納されている第1のゲイン全てに対応するインデックスを、前記第1のゲイン回路160へ順次出力する。また、重みづけフィルタ140から出力される第1の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第1の音源ベクトルおよび前記第1のゲインを選択し、これらに対応するインデックスを符号出力回路190へ出力する。 The first minimizing circuit 150 sequentially outputs indexes corresponding to all the first sound source vectors stored in the first sound source generating circuit 110 to the first sound source generating circuit 110 to obtain a first gain. Indexes corresponding to all the first gains stored in the circuit 160 are sequentially output to the first gain circuit 160. Further, the first weighted difference vector output from the weighting filter 140 is sequentially input, its norm is calculated, and the first sound source vector and the first gain that minimize the norm are obtained. The selected indexes are output to the code output circuit 190.

第2の最小化回路151は、第2の音源生成回路111に格納されている第2の音源ベクトル全てに対応するインデックスを、前記第2の音源生成回路111へ順次出力し、第2のゲイン回路161に格納されている第2のゲイン全てに対応するインデックスを、前記第2のゲイン回路161へ順次出力する。また、重みづけフィルタ141から出力される第2の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第2の音源ベクトルおよび前記第2のゲインを選択し、これらに対応するインデックスを符号出力回路190へ出力する。 The second minimizing circuit 151 sequentially outputs indexes corresponding to all the second sound source vectors stored in the second sound source generating circuit 111 to the second sound source generating circuit 111 to obtain a second gain. Indexes corresponding to all the second gains stored in the circuit 161 are sequentially output to the second gain circuit 161. Further, the second weighted difference vector output from the weighting filter 141 is sequentially input, the norm thereof is calculated, and the second sound source vector and the second gain that minimize the norm are obtained. The selected indexes are output to the code output circuit 190.

符号出力回路190は、線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスを入力する。また、第1の最小化回路150から出力される、第1の音源ベクトルおよび第1のゲインの各々に対応するインデックスを入力し、第2の最小化回路151から出力される、第2の音源ベクトルおよび第2のゲインの各々に対応するインデックスを入力する。そして各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。 The code output circuit 190 inputs an index corresponding to the quantized linear prediction coefficient output from the linear prediction coefficient calculation circuit 170. Also, the second sound source output from the second minimizing circuit 151 by inputting an index corresponding to each of the first sound source vector and the first gain output from the first minimizing circuit 150. An index corresponding to each of the vector and the second gain is input. Each index is converted into a bit-sequence code and output via the output terminal 20.

図32は、従来の音声音楽信号復号装置の一例を示すブロック図である。入力端子30からビット系列の符号を入力する。 FIG. 32 is a block diagram showing an example of a conventional speech and music signal decoding apparatus. A bit sequence code is input from the input terminal 30.

符号入力回路310は、入力端子30から入力したビット系列の符号をインデックスに変換する。第1の音源ベクトルに対応するインデックスは、第1の音源生成回路110へ出力される。第2の音源ベクトルに対応するインデックスは、第2の音源生成回路111へ出力される。第1のゲインに対応するインデックスは、第1のゲイン回路160へ出力される。第2のゲインに対応するインデックスは、第2のゲイン回路161へ出力される。量子化線形予測係数に対応するインデックスは、線形予測合成フィルタ130および線形予測合成フィルタ131へ出力される。 The code input circuit 310 converts the code of the bit series input from the input terminal 30 into an index. The index corresponding to the first sound source vector is output to the first sound source generation circuit 110. The index corresponding to the second sound source vector is output to the second sound source generation circuit 111. The index corresponding to the first gain is output to the first gain circuit 160. The index corresponding to the second gain is output to the second gain circuit 161. The index corresponding to the quantized linear prediction coefficient is output to the linear prediction synthesis filter 130 and the linear prediction synthesis filter 131.

第1の音源生成回路110は、符号入力回路310から出力されるインデックスを入力し、前記インデックスに対応する第1の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第1のゲイン回路160へ出力する。 The first excitation generator 110 receives the index output from the code input circuit 310, reads the first excitation vector corresponding to the index from a table storing a plurality of excitation vectors, Output to the gain circuit 160.

第2の音源生成回路111は、符号入力回路310から出力されるインデックスを入力し、前記インデックスに対応する第2の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第2のゲイン回路161へ出力する。 The second sound source generation circuit 111 receives the index output from the code input circuit 310, reads a second sound source vector corresponding to the index from a table storing a plurality of sound source vectors, Output to the gain circuit 161.

第1のゲイン回路160は、符号入力回路310から出力されるインデックスと第1の音源生成回路110から出力される第1の音源ベクトルとを入力し、前記インデックスに対応する第1のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第1のゲインと前記第1の音源ベクトルとを乗算し、第3の音源ベクトルを生成し、前記第3の音源ベクトルを第1の帯域通過フィルタ120へ出力する。 The first gain circuit 160 receives the index output from the code input circuit 310 and the first sound source vector output from the first sound source generation circuit 110, and obtains a first gain corresponding to the index, Reading from a table storing a plurality of gain values, multiplying the first gain and the first sound source vector to generate a third sound source vector, and using the third sound source vector as the first band Output to the pass filter 120.

第2のゲイン回路161は、符号入力回路310から出力されるインデックスと第2の音源生成回路111から出力される第2の音源ベクトルとを入力し、前記インデックスに対応する第2のゲインを、ゲインの値が複数個格納されたテーブルより読み出し、前記第2のゲインと前記第2の音源ベクトルとを乗算し、第4の音源ベクトルを生成し、前記第4の音源ベクトルを第2の帯域通過フィルタ121へ出力する。 The second gain circuit 161 receives the index output from the code input circuit 310 and the second sound source vector output from the second sound source generation circuit 111, and obtains the second gain corresponding to the index, Reading from a table storing a plurality of gain values, multiplying the second gain and the second sound source vector to generate a fourth sound source vector, and using the fourth sound source vector as the second band Output to the pass filter 121.

第1の帯域通過フィルタ120は、第1のゲイン回路160から出力される第3の音源ベクトルを入力する。前記第3の音源ベクトルは、このフィルタにより第1の帯域に帯域制限され、第1の励振ベクトルを得る。第1の帯域通過フィルタ120は、前記第1の励振ベクトルを線形予測合成フィルタ130へ出力する。 The first band pass filter 120 receives the third sound source vector output from the first gain circuit 160. The third sound source vector is band-limited to the first band by this filter to obtain a first excitation vector. The first band pass filter 120 outputs the first excitation vector to the linear prediction synthesis filter 130.

第2の帯域通過フィルタ121は、第2のゲイン回路161から出力される第4の音源ベクトルを入力する。前記第4の音源ベクトルは、このフィルタにより第2の帯域に帯域制限され、第2の励振ベクトルを得る。第2の帯域通過フィルタ121は、前記第2の励振ベクトルを線形予測合成フィルタ131へ出力する。 The second band pass filter 121 receives the fourth sound source vector output from the second gain circuit 161. The fourth excitation vector is band-limited to the second band by this filter to obtain a second excitation vector. The second band pass filter 121 outputs the second excitation vector to the linear prediction synthesis filter 131.

線形予測合成フィルタ130は、第1の帯域通過フィルタ120から出力される第1の励振ベクトルと符号入力回路310から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第1の励振ベクトルにより駆動することで、第1の再生ベクトルを得る。そして前記第1の再生ベクトルを加算器182へ出力する。 The linear prediction synthesis filter 130 receives the first excitation vector output from the first bandpass filter 120 and the index corresponding to the quantized linear prediction coefficient output from the code input circuit 310, and corresponds to the index. The first linear quantization coefficient is read from a table in which a plurality of quantized linear prediction coefficients are stored, and the filter in which the quantized linear prediction coefficient is set is driven by the first excitation vector. Get the playback vector. Then, the first reproduction vector is output to the adder 182.

線形予測合成フィルタ131は、第2の帯域通過フィルタ121から出力される第2の励振ベクトルと符号入力回路310から出力される量子化線形予測係数に対応するインデックスとを入力し、前記インデックスに対応する量子化線形予測係数を、量子化線形予測係数が複数個格納されたテーブルより読み出し、この量子化線形予測係数が設定されたフィルタを、前記第2の励振ベクトルにより駆動することで、第2の再生ベクトルを得る。そして前記第2の再生ベクトルを加算器182へ出力する。 The linear prediction synthesis filter 131 inputs the second excitation vector output from the second bandpass filter 121 and the index corresponding to the quantized linear prediction coefficient output from the code input circuit 310, and corresponds to the index. The quantized linear prediction coefficient to be read is read from a table in which a plurality of quantized linear prediction coefficients are stored, and the filter in which the quantized linear prediction coefficient is set is driven by the second excitation vector, so that the second Get the playback vector. Then, the second reproduction vector is output to the adder 182.

加算器182は、線形予測合成フィルタ130から出力される第1の再生ベクトルと、線形予測合成フィルタ131から出力される第2の再生ベクトルを入力し、これらの和を計算し、これを第3の再生ベクトルとして、出力端子40を介して、出力する。
Code excited linear prediction:High quality speech at very low bit rates(Proc. ICASSP, pp.937-940, 1985 ) Multi-band CELP Coding of Speech and Music(IEEE Workshop on Speech Coding for Telecommunications, pp.101-102, 1997
The adder 182 inputs the first reproduction vector output from the linear prediction synthesis filter 130 and the second reproduction vector output from the linear prediction synthesis filter 131, calculates the sum of these, Are output via the output terminal 40.
Code excited linear prediction: High quality speech at very low bit rates (Proc. ICASSP, pp.937-940, 1985) Multi-band CELP Coding of Speech and Music (IEEE Workshop on Speech Coding for Telecommunications, pp.101-102, 1997

問題点は、上述した従来の音声音楽信号符号化装置では、入力信号の低域に対応する帯域特性を有する励振信号と、前記入力信号の高域に対応する帯域特性を有する励振信号とを加算して得られる励振信号により、前記入力信号から求めた線形予測合成フィルタを駆動することで再生信号を生成する構成であることから、高周波数域に属する帯域においてCELPに基づく符号化を行うため、高周波数域に属する帯域において符号化性能が低下することにより、全帯域における音声音楽信号の符号化品質が劣化することである。 The problem is that, in the above-described conventional speech and music signal encoding apparatus, an excitation signal having a band characteristic corresponding to the low frequency of the input signal and an excitation signal having a band characteristic corresponding to the high frequency of the input signal are added. Since the reproduction signal is generated by driving the linear prediction synthesis filter obtained from the input signal by the excitation signal obtained as described above, in order to perform encoding based on CELP in the band belonging to the high frequency range, A decrease in encoding performance in a band belonging to a high frequency range results in a deterioration in the encoding quality of a speech and music signal in all bands.

その理由は、高周波数域に属する帯域における信号は、音声とは大きく異なる性質を有しているため、音声の生成過程をモデル化しているCELPでは高周波数域に属する帯域における信号を高精度に生成できないからである。本発明の目的は、上述の問題を解決し、音声音楽信号を全帯域にわたって良好に符号化できる音声音楽信号符号化装置を提供することである。 The reason for this is that signals in a band belonging to the high frequency range have properties that are significantly different from those of speech, so CELP modeling the speech generation process can accurately signal signals in the band belonging to the high frequency range. This is because it cannot be generated. An object of the present invention is to solve the above-described problems and provide a speech and music signal encoding apparatus that can satisfactorily encode speech and music signals over the entire band.

本発明の第1の装置は、第1の帯域に対応する励振信号により入力信号から求めた線形予測合成フィルタを駆動することで第1の再生信号を生成し、入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第2の帯域に対応する成分を、直交変換後に符号化する。
具体的には、第1の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1の再生信号を生成する手段(図1の110、160、120、130)と、入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成する手段(図1の180、230)と、前記残差信号における第2の帯域に対応する成分を直交変換後に符号化する手段(図1の240、250、260)とを有する。
The first apparatus of the present invention generates a first reproduction signal by driving a linear prediction synthesis filter obtained from an input signal by an excitation signal corresponding to a first band, and the input signal and the first reproduction signal are generated. A residual signal is generated by driving an inverse filter of the linear prediction synthesis filter with a difference signal from the signal, and a component corresponding to the second band in the residual signal is encoded after orthogonal transformation.
Specifically, a unit (110, 160, 120, 130 in FIG. 1) for generating a first reproduction signal by driving the linear prediction synthesis filter with an excitation signal corresponding to the first band, and an input signal 1 to generate a residual signal by driving an inverse filter of the linear prediction synthesis filter using a difference signal between the first reproduced signal and the second reproduction signal, and a second signal in the residual signal. Means (240, 250, 260 in FIG. 1) for encoding the component corresponding to the band after orthogonal transformation.

本発明の第2の装置は、第1と第2の帯域に対応する励振信号により、入力信号から求めた線形予測合成フィルタを駆動することで第1と第2の再生信号を生成し、前記第1と第2の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第3の帯域に対応する成分を、直交変換後に符号化する。具体的には、第1と第2の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1と第2の再生信号を生成する手段(図8の1001,1002)と、前記第1と第2の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第3の帯域に対応する成分を直交変換後に符号化する手段(図8の1003)とを有する。 The second device of the present invention generates the first and second reproduction signals by driving the linear prediction synthesis filter obtained from the input signal by the excitation signals corresponding to the first and second bands, A residual signal is generated by driving an inverse filter of the linear prediction synthesis filter using a difference signal between a signal obtained by adding the first and second reproduction signals and the input signal, and a third band in the residual signal is generated. The component corresponding to is encoded after orthogonal transformation. Specifically, means (1001, 1002 in FIG. 8) for generating the first and second reproduction signals by driving the linear prediction synthesis filter by the excitation signals corresponding to the first and second bands, A residual signal is generated by driving an inverse filter of the linear prediction synthesis filter using a difference signal between the input signal and a signal obtained by adding the first and second reproduction signals, and a third signal in the residual signal is generated. Means (1003 in FIG. 8) for encoding the component corresponding to the band after orthogonal transformation.

本発明の第3の装置は、第1から第N−1の帯域に対応する励振信号により、入力信号から求めた線形予測合成フィルタを駆動することで第1から第N−1の再生信号を生成し、前記第1から第N−1の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第Nの帯域に対応する成分を、直交変換後に符号化する。具体的には、第1から第N−1の帯域に対応する励振信号により前記線形予測合成フィルタを駆動することで第1から第N−1の再生信号を生成する手段(図9の1001、1004)と、前記第1から第N−1の再生信号を加算した信号と前記入力信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における第Nの帯域に対応する成分を直交変換後に符号化する手段(図9の1005)とを有する。 The third device of the present invention drives the linear prediction synthesis filter obtained from the input signal by the excitation signals corresponding to the first to (N-1) th bands, thereby generating the first to (N-1) th reproduced signals. Generating a residual signal by driving an inverse filter of the linear prediction synthesis filter with a difference signal between the input signal and a signal obtained by adding the first to (N-1) th reproduced signals, and generating the residual signal The component corresponding to the Nth band in the signal is encoded after orthogonal transformation. Specifically, means for generating the first to (N-1) th reproduced signals by driving the linear prediction synthesis filter with the excitation signals corresponding to the first to (N-1) th bands (1001, 1001 in FIG. 9). 1004) and a signal obtained by adding the first to (N-1) th reproduced signals and the input signal to drive an inverse filter of the linear prediction synthesis filter to generate a residual signal, and Means (1005 in FIG. 9) for encoding the component corresponding to the Nth band in the difference signal after orthogonal transformation.

本発明の第4の装置は、第2の符号化において、第1の符号化復号信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する。具体的には、第1の符号化復号信号と入力信号との差分を計算する手段(図11の180)と、入力信号から求めた線形予測合成フィルタの逆フィルタを前記差分信号で駆動することにより残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する手段(図11の1002)とを有する。 The fourth device of the present invention, in the second encoding, drives the inverse filter of the linear prediction synthesis filter obtained from the input signal by the difference signal between the first encoded decoded signal and the input signal. A difference signal is generated, and a component corresponding to an arbitrary band in the residual signal is encoded after orthogonal transformation. Specifically, the means for calculating the difference between the first encoded decoded signal and the input signal (180 in FIG. 11) and the inverse filter of the linear prediction synthesis filter obtained from the input signal are driven by the difference signal. Means for generating a residual signal and encoding a component corresponding to an arbitrary band in the residual signal after orthogonal transformation (1002 in FIG. 11).

本発明の第5の装置は、第3の符号化において、第1と第2の符号化復号信号を加算した信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する。具体的には、第1と第2の符号化復号信号を加算した信号と入力信号との差分信号を計算する手段(図12の1801、1802)と、入力信号から求めた線形予測合成フィルタの逆フィルタを前記差分信号で駆動することにより残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する手段(図12の1003)とを有する。 The fifth device of the present invention is the inverse of the linear prediction synthesis filter obtained from the input signal by the difference signal between the input signal and the signal obtained by adding the first and second encoded decoded signals in the third encoding. A residual signal is generated by driving a filter, and a component corresponding to an arbitrary band in the residual signal is encoded after orthogonal transformation. Specifically, means (1801, 1802 in FIG. 12) for calculating a difference signal between the signal obtained by adding the first and second encoded decoded signals and the input signal, and the linear prediction synthesis filter obtained from the input signal Means (1003 in FIG. 12) which generates a residual signal by driving an inverse filter with the differential signal and encodes a component corresponding to an arbitrary band in the residual signal after orthogonal transformation.

本発明の第6の装置は、第Nの符号化において、第1から第N−1の符号化復号信号を加算した信号と入力信号との差分信号により、入力信号から求めた線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する。具体的には、第1から第N−1の符号化復号信号を加算した信号と入力信号との差分信号を計算する手段(図13の1801、1802)と、入力信号から求めた線形予測合成フィルタの逆フィルタを前記差分信号で駆動することにより残差信号を生成し、前記残差信号における任意の帯域に対応する成分を直交変換後に符号化する手段(図13の1005)とを有する。 In a sixth apparatus of the present invention, a linear prediction synthesis filter obtained from an input signal based on a difference signal between an input signal and a signal obtained by adding the first to (N-1) th encoded decoding signals in the Nth encoding A residual signal is generated by driving the inverse filter, and a component corresponding to an arbitrary band in the residual signal is encoded after orthogonal transformation. Specifically, means (1801 and 1802 in FIG. 13) for calculating a difference signal between a signal obtained by adding the first to (N-1) th encoded decoding signals and the input signal, and linear prediction synthesis obtained from the input signal Means for generating a residual signal by driving an inverse filter of the filter with the differential signal, and encoding a component corresponding to an arbitrary band in the residual signal after orthogonal transformation (1005 in FIG. 13).

本発明の第7の装置は、入力信号の第1の帯域に対応する励振信号を生成する際にピッチ予測フィルタを用いる。具体的には、ピッチ予測手段(図14の112、162、184、510)を有する。 The seventh apparatus of the present invention uses the pitch prediction filter when generating the excitation signal corresponding to the first band of the input signal. Specifically, it has pitch prediction means (112, 162, 184, 510 in FIG. 14).

本発明の第8の装置は、第1のサンプリング周波数でサンプリングされた第1の入力信号を第2のサンプリング周波数にダウンサンプリングして第2の入力信号を生成し、前記第2の入力信号から求めた第1の線形予測係数が設定された合成フィルタを励振信号により駆動することで、第1の再生信号を生成し、前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより第2の再生信号を生成し、さらに、前記第1の入力信号から求めた線形予測係数と前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数との差分から第3の線形予測係数を計算し、前記第2の線形予測係数と前記第3の線形予測係数との和から第4の線形予測係数を計算し、前記第1の入力信号と前記第2の再生信号との差分信号により前記第4の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成し、前記残差信号における任意の帯域に対応する成分を、直交変換後に符号化する。具体的には、第1のサンプリング周波数でサンプリングされた第1の入力信号を第2のサンプリング周波数にダウンサンプリングして第2の入力信号を生成する手段(図15の780)と、前記第2の入力信号から求めた第1の線形予測係数が設定された合成フィルタを励振信号により駆動することで、第1の再生信号を生成する手段(図15の770、132)と、前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより第2の再生信号を生成する手段(図15の781)と、前記第1の入力信号から求めた線形予測係数と前記第1の線形予測係数と第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数との差分から第3の線形予測係数を計算する手段(図15の771、772)と、前記第2の線形予測係数と前記第3の線形予測係数との和から第4の線形予測係数を計算し、前記第1の入力信号と前記第2の再生信号との差分信号により前記第4の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成する手段(図15の180、730)と、前記残差信号における任意の帯域に対応する成分を、直交変換後に符号化する手段(図15の240、250、260)とを有する。 The eighth device of the present invention downsamples the first input signal sampled at the first sampling frequency to the second sampling frequency to generate a second input signal, and generates the second input signal from the second input signal. Driving a synthesis filter in which the obtained first linear prediction coefficient is set with an excitation signal to generate a first reproduction signal and up-sampling the first reproduction signal to the first sampling frequency And a second linear signal obtained by sampling frequency conversion of the linear prediction coefficient obtained from the first input signal and the first linear prediction coefficient into a first sampling frequency. Calculating a third linear prediction coefficient from the difference from the prediction coefficient, calculating a fourth linear prediction coefficient from the sum of the second linear prediction coefficient and the third linear prediction coefficient, A residual signal is generated by driving an inverse filter in which the fourth linear prediction coefficient is set by a difference signal between the input signal of 1 and the second reproduction signal, and is set to an arbitrary band in the residual signal. Corresponding components are encoded after orthogonal transformation. Specifically, the first input signal sampled at the first sampling frequency is down-sampled to the second sampling frequency to generate a second input signal (780 in FIG. 15), and the second Means for generating a first reproduction signal by driving a synthesis filter in which a first linear prediction coefficient obtained from the input signal is set by an excitation signal (770 and 132 in FIG. 15); Means (781 in FIG. 15) for generating a second reproduction signal by up-sampling the reproduction signal to the first sampling frequency, the linear prediction coefficient obtained from the first input signal, and the first linear Means for calculating the third linear prediction coefficient from the difference between the prediction coefficient and the second linear prediction coefficient obtained by converting the sampling frequency to the first sampling frequency (771 in FIG. 15) 772), a fourth linear prediction coefficient is calculated from the sum of the second linear prediction coefficient and the third linear prediction coefficient, and a difference signal between the first input signal and the second reproduced signal is calculated. Means for generating a residual signal by driving an inverse filter in which the fourth linear prediction coefficient is set (180, 730 in FIG. 15), and a component corresponding to an arbitrary band in the residual signal, Means for encoding after orthogonal transformation (240, 250, 260 in FIG. 15).

本発明の第9の装置は、復号した直交変換係数を直交逆変換することにより、第2の帯域に対応する励振信号を生成し、前記励振信号により線形予測合成フィルタを駆動することで第2の再生信号を生成し、さらに、復号した第1の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1の再生信号を生成し、前記第1の再生信号と前記第2の再生信号を加算することで復号音声音楽を生成する。具体的には、復号信号と直交変換係数を直交逆変換することにより、第2の帯域に対応する励振信号を生成する手段(図16の440、460)と、線形予測合成フィルタを前記励振信号で駆動することにより第2の再生信号を生成する手段(図16の131)と、第1の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1の再生信号を生成する手段(図16の110、120、130、160)と、前記第1の再生信号と前記第2の再生信号とを加算することで復号音声音楽を生成する手段(図16の182)とを有する。 The ninth apparatus of the present invention generates an excitation signal corresponding to the second band by performing orthogonal inverse transform on the decoded orthogonal transform coefficient, and drives the linear prediction synthesis filter by the excitation signal to generate the second signal. Further, the first reproduction signal is generated by driving the linear prediction filter with the excitation signal corresponding to the decoded first band, and the first reproduction signal and the second reproduction signal are generated. Decoded speech music is generated by adding the reproduction signals. Specifically, a unit (440, 460 in FIG. 16) that generates an excitation signal corresponding to the second band by performing orthogonal inverse transform on the decoded signal and the orthogonal transform coefficient, and a linear prediction synthesis filter include the excitation signal. Means for generating a second reproduction signal by driving with (131 in FIG. 16) and means for generating the first reproduction signal by driving the linear prediction filter with an excitation signal corresponding to the first band (110, 120, 130, 160 in FIG. 16) and means (182 in FIG. 16) for generating decoded speech music by adding the first reproduction signal and the second reproduction signal.

本発明の第10の装置は、復号した直交変換係数を直交逆変換することにより、第3の帯域に対応する励振信号を生成し、前記励振信号により線形予測合成フィルタを駆動することで第3の再生信号を生成し、さらに、復号した第1と第2の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1と第2の再生信号を生成し、前記第1から第3の再生信号を加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、第3の帯域に対応する励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することより第3の再生信号を生成する手段(図22の1053)と、第1と第2の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1と第2の再生信号を生成する手段(図22の1051、1052)と、前記第1から第3の再生信号を加算することで復号音声音楽を生成する手段(図22の1821、1822)とを有する。 The tenth device of the present invention generates an excitation signal corresponding to the third band by performing orthogonal inverse transform on the decoded orthogonal transform coefficient, and drives the linear prediction synthesis filter by the excitation signal to generate the third signal. And the first and second reproduction signals are generated by driving the linear prediction filter with the excitation signals corresponding to the decoded first and second bands, and the first to second reproduction signals are generated. 3 is added to the reproduced signal to generate decoded speech music. Specifically, an orthogonal inverse transform is performed on the decoded orthogonal transform coefficient to generate an excitation signal corresponding to the third band, and a linear prediction synthesis filter is driven by the excitation signal to thereby generate a third reproduction signal. Means for generating (1053 in FIG. 22) and means for generating the first and second reproduction signals by driving the linear prediction filter with excitation signals corresponding to the first and second bands (1051 in FIG. 22). , 1052) and means for generating decoded speech music by adding the first to third reproduction signals (1821, 1822 in FIG. 22).

本発明の第11の装置は、復号した直交変換係数を直交逆変換することにより、第Nの帯域に対応する励振信号を生成し、前記励振信号により線形予測合成フィルタを駆動することで第Nの再生信号を生成し、さらに、復号した第1から第N−1の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第
1から第Nn−1の再生信号を生成し、前記第1から第Nの再生信号を加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、第Nの帯域に対応する励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することより第Nの再生信号を生成する手段(図23の1055)と、第1から第N−1の帯域に対応する励振信号により前記線形予測フィルタを駆動することで第1から第N−1の再生信号を生成する手段(図23の1051、1054)と、前記第1から第Nの再生信号を加算することで復号音声音楽を生成する手段(図23の1821、1822)とを有する。
The eleventh device of the present invention generates an excitation signal corresponding to the Nth band by performing orthogonal inverse transform on the decoded orthogonal transform coefficient, and drives the linear prediction synthesis filter by the excitation signal to generate the Nth filter. And the first to Nn−1 regenerated signals are generated by driving the linear prediction filter with the excitation signals corresponding to the decoded first to (N−1) th bands, Decoded speech music is generated by adding the first to Nth reproduction signals. Specifically, an orthogonal inverse transform is performed on the decoded orthogonal transform coefficient to generate an excitation signal corresponding to the Nth band, and a linear prediction synthesis filter is driven by the excitation signal to thereby convert the Nth reproduction signal. Means for generating (1055 in FIG. 23) and means for generating the first to (N−1) th reproduced signals by driving the linear prediction filter with the excitation signals corresponding to the first to (N−1) th bands. 23, 1051, 1054) in FIG. 23, and means (1821, 1822 in FIG. 23) for generating decoded speech music by adding the first to Nth reproduction signals.

本発明の第12の装置は、第2の復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と第1の復号信号とを加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成する手段(図24の1052)と、前記再生信号と第1の復号信号とを加算することで復号音声音楽を生成する手段(図24の182)とを有する。 The twelfth device of the present invention generates an excitation signal by performing orthogonal inverse transform on the decoded orthogonal transform coefficient in the second decoding, and driving a linear prediction synthesis filter with the excitation signal to generate a reproduction signal. Generating decoded speech music by adding the reproduction signal and the first decoded signal. Specifically, means (1052 in FIG. 24) generates an excitation signal by performing orthogonal inverse transform on the decoded orthogonal transform coefficient, and generates a reproduction signal by driving a linear prediction synthesis filter with the excitation signal. And means (182 in FIG. 24) for generating decoded speech music by adding the reproduction signal and the first decoded signal.

本発明の第13の装置は、第3の復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と第1および第2の復号信号とを加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成する手段(図25の1053)と、前記再生信号と第1および第2の復号信号とを加算することで復号音声音楽を生成する手段(図25の1821、1822)とを有する。 In the third decoding, the thirteenth device of the present invention generates an excitation signal by performing orthogonal inverse transform on the decoded orthogonal transform coefficient, and drives a linear prediction synthesis filter with the excitation signal to generate a reproduction signal. And generating the decoded speech music by adding the reproduction signal and the first and second decoded signals. Specifically, means for generating an excitation signal by orthogonally transforming the decoded orthogonal transform coefficient and generating a reproduction signal by driving a linear prediction synthesis filter with the excitation signal (1053 in FIG. 25); And means for generating decoded speech music by adding the reproduction signal and the first and second decoded signals (1821 and 1822 in FIG. 25).

本発明の第14の装置は、第Nの復号において、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成し、前記再生信号と第1から第N−1の復号信号とを加算することで復号音声音楽を生成する。具体的には、復号した直交変換係数を直交逆変換することにより、励振信号を生成し、線形予測合成フィルタを前記励振信号で駆動することにより再生信号を生成する手段(図26の1055)と、前記再生信号と第1から第N−1の復号信号とを加算することで復号音声音楽を生成する手段(図26の1821、1822)とを有する。 The fourteenth device of the present invention generates an excitation signal by performing orthogonal inverse transform on the decoded orthogonal transform coefficient in the Nth decoding, and drives a linear prediction synthesis filter with the excitation signal to generate a reproduction signal. Generating decoded speech music by adding the reproduction signal and the first to (N-1) th decoded signals. Specifically, means (1055 in FIG. 26) for generating an excitation signal by performing orthogonal inverse transform on the decoded orthogonal transform coefficient and generating a reproduction signal by driving a linear prediction synthesis filter with the excitation signal. Means for generating decoded speech music by adding the reproduction signal and the first to (N-1) th decoded signals (1821 and 1822 in FIG. 26).

本発明の第15の装置は、第1の帯域に対応する励振信号を生成する際にピッチ予測フに係るルタを用いる。具体的には、ピッチ予測手段(図27の112、162、184、510)を有する。 The fifteenth device of the present invention uses the filter relating to the pitch prediction filter when generating the excitation signal corresponding to the first band. Specifically, it has pitch prediction means (112, 162, 184, 510 in FIG. 27).

本発明の第16の装置は、第1の帯域に対る第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を、第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、復号した直交変換係数を直交逆変換することにより、第2の帯域に対応する第2の励振信号を生成し、前記第2の励振信号により第2の線形予測合成フィルタを駆動することで第2の再生信号を生成し、前記第1の再生信号と前記第2の再生信号とを加算することで復号音声音楽を生成する。具体的には、第1の帯域に対応する第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を、第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成する手段(図28の132、781)と、復号した直交変換係数を直交逆変換することにより、第2の帯域に対応する第2の励振信号を生成し、前記第2の励振信号により第2の線形予測合成フィルタを駆動することで第2の再生信号を生成する手段(図28の440、831)と、前記第1の再生信号と前記第2の再生信号とを加算することで復号音声音楽を生成する手段(図28の182)とを有する。 According to a sixteenth device of the present invention, a signal obtained by driving a first linear prediction synthesis filter with a first excitation signal for the first band is up-sampled to a first sampling frequency to obtain a first And a second excitation signal corresponding to the second band is generated by performing orthogonal inverse transform on the decoded orthogonal transform coefficient, and a second linear prediction synthesis filter is generated by the second excitation signal. The second reproduction signal is generated by driving and the decoded reproduction music is generated by adding the first reproduction signal and the second reproduction signal. Specifically, a signal obtained by driving the first linear prediction synthesis filter with the first excitation signal corresponding to the first band is up-sampled to the first sampling frequency to obtain the first reproduction signal. A second excitation signal corresponding to the second band is generated by performing orthogonal inverse transformation on the generated orthogonal transform coefficients (132 and 781 in FIG. 28) and the second excitation signal. Means for generating a second reproduction signal by driving the second linear prediction synthesis filter (440 and 831 in FIG. 28), and decoding by adding the first reproduction signal and the second reproduction signal Means for generating voice music (182 in FIG. 28).

本発明17の装置は、本発明1の装置から出力される符号を、本発明9の装置で復号する。具体的には、音声音楽信号符号化手段(図1)と、音声音楽信号復号手段(図16)とを有する。 The device of the present invention 17 decodes the code output from the device of the present invention 1 by the device of the present invention 9. Specifically, it has speech and music signal encoding means (FIG. 1) and speech and music signal decoding means (FIG. 16).

本発明18の装置は、本発明2の装置から出力される符号を、本発明10の装置で復号する。具体的には、音声音楽信号符号化手段(図8)と、音声音楽信号復号手段(図22)とを有する。 The apparatus of the present invention 18 decodes the code output from the apparatus of the present invention 2 by the apparatus of the present invention 10. Specifically, it has a voice music signal encoding means (FIG. 8) and a voice music signal decoding means (FIG. 22).

本発明19の装置は、本発明3の装置から出力される符号を、本発明11の装置で復号する。具体的には、音声音楽信号符号化手段(図9)と、音声音楽信号復号手段(図23)とを有する。 The device according to the nineteenth aspect of the present invention decodes the code output from the device according to the third aspect of the present invention by the device according to the present invention 11. Specifically, it has a voice music signal encoding means (FIG. 9) and a voice music signal decoding means (FIG. 23).

本発明20の装置は、本発明4の装置から出力される符号を、本発明12の装置で復号する。具体的には、音声音楽信号符号化手段(図11)と、音声音楽信号復号手段(図24)とを有する。 The device of the present invention 20 decodes the code output from the device of the present invention 4 by the device of the present invention 12. Specifically, it has a voice music signal encoding means (FIG. 11) and a voice music signal decoding means (FIG. 24).

本発明21の装置は、本発明5の装置から出力される符号を、本発明13の装置で復号する。具体的には、音声音楽信号符号化手段(図12)と、音声音楽信号復号手段(図25)とを有する。 The device of the present invention 21 decodes the code output from the device of the present invention 5 by the device of the present invention 13. Specifically, the audio / music signal encoding means (FIG. 12) and the audio / music signal decoding means (FIG. 25) are included.

本発明22の装置は、本発明6の装置から出力される符号を、本発明14の装置で復号する。具体的には、音声音楽信号符号化手段(図13)と、音声音楽信号復号手段(図26)とを有する。 The device of the present invention 22 decodes the code output from the device of the present invention 6 by the device of the present invention 14. Specifically, it has speech and music signal encoding means (FIG. 13) and speech and music signal decoding means (FIG. 26).

本発明23の装置は、本発明7の装置から出力される符号を、本発明15の装置で復号する。具体的には、音声音楽信号符号化手段(図14)と、音声音楽信号復号手段(図27)とを有する。 The device of the present invention 23 decodes the code output from the device of the present invention 7 by the device of the present invention 15. Specifically, it has a voice music signal encoding means (FIG. 14) and a voice music signal decoding means (FIG. 27).

本発明24の装置は、本発明8の装置から出力される符号を、本発明16の装置で復号する。具体的には、音声音楽信号符号化手段(図15)と、音声音楽信号復号手段(図28)とを有する。
(作用)
本発明では、入力信号の低域に対応する帯域特性を有する励振信号により入力信号から求めた線形予測合成フィルタを駆動することで第1の再生信号を生成し、前記入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号の高域成分を、直交変換に基づく符号化方式を用いて符号化する。すなわち、高周波数域に属する帯域における、音声とは異なる性質を有する信号に対しては、CELPに代わり、直交変換に基づく符号化を行う。前記直交変換に基づく符号化は、音声と異なる性質を有する信号に対する符号化性能がCELPに比べて高い。このため、前記入力信号の高域成分に対する符号化性能が改善される。その結果、音声音楽信号を全帯域にわたって良好に符号化することが可能となる。
The device of the present invention 24 decodes the code output from the device of the present invention 8 by the device of the present invention 16. Specifically, the audio / music signal encoding means (FIG. 15) and the audio / music signal decoding means (FIG. 28) are included.
(Function)
In the present invention, a first reproduction signal is generated by driving a linear prediction synthesis filter obtained from an input signal by an excitation signal having a band characteristic corresponding to a low frequency of the input signal, and the input signal and the first signal are generated. A residual signal is generated by driving an inverse filter of the linear prediction synthesis filter with a difference signal from the reproduction signal, and a high frequency component of the residual signal is encoded using an encoding method based on orthogonal transform. . That is, for a signal having a property different from that of speech in a band belonging to a high frequency range, encoding based on orthogonal transformation is performed instead of CELP. The coding based on the orthogonal transform has higher coding performance for signals having properties different from those of speech compared to CELP. For this reason, the encoding performance with respect to the high frequency component of the input signal is improved. As a result, it is possible to encode the audio music signal satisfactorily over the entire band.

本発明による効果は、音声音楽信号を全帯域にわたって良好に符号化できることである。その理由は、入力信号の低域に対応する帯域特性を有する音源信号により前記入力信号から求めた線形予測合成フィルタを駆動することで第1の再生信号を生成し、前記入力信号と前記第1の再生信号との差分信号により前記線形予測合成フィルタの逆フィルタを駆動することで残差信号を生成し、前記残差信号の高域成分を、直交変換に基づく符号化方式を用いて符号化するため、前記入力信号の高域成分に対する符号化性能が改善されるからである。 The effect of the present invention is that the audio music signal can be encoded well over the entire band. The reason is that a first reproduction signal is generated by driving a linear prediction synthesis filter obtained from the input signal by a sound source signal having a band characteristic corresponding to a low frequency of the input signal, and the input signal and the first signal are generated. A residual signal is generated by driving an inverse filter of the linear prediction synthesis filter using a difference signal from the reproduced signal of the above-described reproduction signal, and a high frequency component of the residual signal is encoded using an encoding method based on orthogonal transform This is because the coding performance for the high frequency component of the input signal is improved.

図1は、本発明の第1の実施例による音声音楽信号符号化装置の構成を示すブロック図である。ここでは、帯域数を2として説明する。音声または音楽信号をサンプリングし、この複数サンプルを1フレームとして一つのベクトルにまとめて生成した入力信号(入力ベクトル)は、入力端子10から入力される。
入力ベクトルは、x(n),n=0,…,L−1と表される。ただし、Lは、ベクトル長である。また、入力信号はFs0[Hz]からFe0[Hz]に帯域制限される。例えば、サンプリング周波数を16[kHz]として、Fs0=50[Hz]、Fe0=7000[Hz]とする。
FIG. 1 is a block diagram showing a configuration of a speech and music signal encoding apparatus according to a first embodiment of the present invention. Here, the number of bands is assumed to be two. An input signal (input vector) generated by sampling a voice or music signal and combining the plurality of samples into one vector as one frame is input from the input terminal 10.
The input vector is represented as x (n), n = 0,. However, L is a vector length. The input signal is band-limited from F s0 [Hz] to F e0 [Hz]. For example, assuming that the sampling frequency is 16 [kHz], F s0 = 50 [Hz] and F e0 = 7000 [Hz].

線形予測係数計算回路170は、入力端子10から入力ベクトルを入力し、前記入力ベクトルに対して線形予測分析を行い、線形予測係数αi ,i=1,…,Nを求め、さらに前記線形予測係数を量子化し、量子化線形予測係数αi ′,i=1,…,Nを求める。ここで、Nは、線形予測次数であり、例えば、16である。また、線形予測係数計算回路170は、前記線形予測係数を重みづけフィルタ140へ出力し、前記量子化線形予測係数に対応するインデックスを線形予測合成フィルタ130と線形予測逆フィルタ230および符号出力回路290へ出力する。線形予測係数の量子化に関しては、例えば、線スペクトル対(Line Spectrum Pair, LSP )へ変換し、量子化する方法がある。線形予測係数のLSPへの変換に関しては、菅村らによる「線スペクトル対(LSP)音声分析合成方式による音声情報圧縮」(電子情報通信学会論文誌A,Vol.J64-A, No.8, pp.599-606, 1981 )(文献3)を、LSPの量子化に関しては、大室らによる「移動平均型フレーム間予測を用いるLSPパラメータのベクトル量子化」(電子情
報通信学会論文誌A,Vol.J77-A, No.3, pp.303-312, 1994 )(文献4)を参照できる。
Linear prediction coefficient calculating circuit 170 receives the input vector from input terminal 10, performs a linear prediction analysis on the input vector, the linear prediction coefficients αi, i = 1, ..., determine the N p, further the linear prediction quantized coefficients, quantized linear prediction coefficients αi ', i = 1, ... , determine the N p. Here, N p is the linear prediction order, for example, is 16. Further, the linear prediction coefficient calculation circuit 170 outputs the linear prediction coefficient to the weighting filter 140, and indexes corresponding to the quantized linear prediction coefficients include the linear prediction synthesis filter 130, the linear prediction inverse filter 230, and the code output circuit 290. Output to. As for quantization of the linear prediction coefficient, for example, there is a method of converting to a line spectrum pair (LSP) and quantizing. Regarding the conversion of linear prediction coefficients to LSP, “Voice Information Compression by Line Spectrum Pair (LSP) Speech Analysis and Synthesis Method” by Kashimura et al. (The IEICE Transactions A, Vol. J64-A, No. 8, pp 599-606, 1981) (Reference 3), with regard to LSP quantization, Omuro et al., “Vector quantization of LSP parameters using moving average interframe prediction” (Journal of the Institute of Electronics, Information and Communication Engineers, Vol. A, Vol. J77-A, No.3, pp.303-312, 1994) (Reference 4).

第1の音源生成回路110は、第1の最小化回路150から出力されるインデックスを入力し、前記インデックスに対応する第1の音源ベクトルを、複数個の音源信号(音源ベクトル)が格納されたテーブルより読み出し、第1のゲイン回路160へ出力する。ここで、第1の音源生成回路110の構成について図2を用いて補足する。第1の音源生成回路110が備えているテーブル1101には、Ne 個の音源ベクトルが格納されている。例えば、Ne は256である。スイッチ1102は入力端子1103を介して、第1の最小化回路150から出力されるインデックスiを入力し、前記インデックスに対応する音源ベクトルを前記テーブルより選択し、これを第1の音源ベクトルとして出力端子1104を介して、第1のゲイン回路160へ出力する。また、音源信号の符号化については、複数のパルスから成り、パルスの位置とパルスの振幅により規定される、マルチパルス信号により音源信号を効率的に表現する方法を用いることができる。マルチパルス信号を用いた音源信号の符号化に関しては、小澤らによる「マルチパルスベクトル量子化音源と高速探索に基づくMP−CELP音声符号化」(電子情報通信学会論文誌A,pp.1655-1663, 1996)(文献5)を参照できる。以上で、第1の音源生成回路110の説明を終え、図1の説明に戻る。 The first sound source generation circuit 110 receives the index output from the first minimization circuit 150, and stores a plurality of sound source signals (sound source vectors) as the first sound source vector corresponding to the index. Read from the table and output to the first gain circuit 160. Here, the configuration of the first sound source generation circuit 110 will be supplemented with reference to FIG. The table 1101 provided in the first sound source generation circuit 110 stores N e sound source vectors. For example, N e is 256. The switch 1102 inputs the index i output from the first minimizing circuit 150 via the input terminal 1103, selects the sound source vector corresponding to the index from the table, and outputs this as the first sound source vector. The signal is output to the first gain circuit 160 via the terminal 1104. In addition, for encoding a sound source signal, a method of efficiently expressing a sound source signal by a multi-pulse signal, which includes a plurality of pulses and is defined by the position of the pulse and the amplitude of the pulse, can be used. Regarding coding of excitation signals using multi-pulse signals, Ozawa et al., “MP-CELP Speech Coding Based on Multi-Pulse Vector Quantized Sound Source and Fast Search” (Journal of the Institute of Electronics, Information and Communication Engineers, pp.1655-1663) , 1996) (Reference 5). This is the end of the description of the first sound source generation circuit 110, and the description returns to FIG.

第1のゲイン回路160は、ゲインの値が格納されたテーブルを備えている。第1のゲイン回路160は、第1の最小化回路150から出力されるインデックスと第1の音源生成回路110から出力される第1の音源ベクトルとを入力し、前記インデックスに対応する第1のゲインを前記テーブルより読み出し、前記第1のゲインと前記第1の音源ベクトルとを乗算し、第2の音源ベクトルを生成し、生成した前記第2の音源ベクトルを第1の帯域通過フィルタ120へ出力する。 The first gain circuit 160 includes a table in which gain values are stored. The first gain circuit 160 receives the index output from the first minimizing circuit 150 and the first sound source vector output from the first sound source generation circuit 110, and receives the first gain corresponding to the index. A gain is read from the table, the first gain and the first excitation vector are multiplied, a second excitation vector is generated, and the generated second excitation vector is sent to the first bandpass filter 120. Output.

第1の帯域通過フィルタ120は、第1のゲイン回路160から出力される第2の音源ベクトルを入力する。前記第2の音源ベクトルは、このフィルタにより第1の帯域に帯域制限され、第1の励振ベクトルを得る。第1の帯域通過フィルタ120は、前記第1の励振ベクトルを線形予測合成フィルタ130へ出力する。ここで、第1の帯域は、Fs1[Hz]からFe1[Hz]とする。ただし、Fs0≦Fs1≦Fe1≦Fe0である。例えば、Fs1=50[Hz]、Fe1=4000[Hz]である。また、第1の帯域通過フィルタ120は、第1の帯域に帯域制限する特性をもち、かつ100次程度の線形予測次数をもつことを特徴とする高次線形予測フィルタ1/B(z)で実現することもできる。ここで、Nphを線形予測次数、線形予測係数をβ,i=1,…,Nphとすると高次線形予測フィルタの伝達関数1/B(z)は、 The first band pass filter 120 receives the second sound source vector output from the first gain circuit 160. The second sound source vector is band-limited to the first band by this filter to obtain a first excitation vector. The first band pass filter 120 outputs the first excitation vector to the linear prediction synthesis filter 130. Here, the first band is assumed to be F s1 [Hz] to F e1 [Hz]. However, F s0 ≦ F s1 ≦ F e1 ≦ F e0 . For example, F s1 = 50 [Hz] and F e1 = 4000 [Hz]. The first band-pass filter 120 is a high-order linear prediction filter 1 / B (z) characterized by having a band-limiting characteristic to the first band and having a linear prediction order of about 100th order. It can also be realized. Here, when N ph is the linear prediction order and the linear prediction coefficients are β i , i = 1,..., N ph , the transfer function 1 / B (z) of the high-order linear prediction filter is

Figure 0004293005
Figure 0004293005

と表される。前記高次線形予測フィルタに関しては(文献2)を参照できる。 It is expressed. Regarding the high-order linear prediction filter, reference 2 can be referred to.

線形予測合成フィルタ130は、量子化線形予測係数が格納されたテーブルを備えている。線形予測合成フィルタ130は、第1の帯域通過フィルタ120から出力される第1の励振ベクトルと線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された合成フィルタ1/A(z)を、前記第1の励振ベクトルにより駆動することで、第1の再生信号(再生ベクトル)を得る。そして前記第1の再生ベクトルを第1の差分器180へ出力する。ここで、合成フィルタの伝達関数1/A(z)は、 The linear prediction synthesis filter 130 includes a table in which quantized linear prediction coefficients are stored. The linear prediction synthesis filter 130 receives the first excitation vector output from the first bandpass filter 120 and the index corresponding to the quantized linear prediction coefficient output from the linear prediction coefficient calculation circuit 170. In addition, the quantized linear prediction coefficient corresponding to the index is read from the table, and the synthesis filter 1 / A (z) in which the quantized linear prediction coefficient is set is driven by the first excitation vector. A first reproduction signal (reproduction vector) is obtained. Then, the first reproduction vector is output to the first subtractor 180. Here, the transfer function 1 / A (z) of the synthesis filter is

Figure 0004293005
Figure 0004293005

と表される。 It is expressed.

第1の差分器180は、入力端子10を介して入力ベクトルを入力し、線形予測合成フィルタ130から出力される第1の再生ベクトルを入力し、それらの差分を計算し、これを第1の差分ベクトルとして、重みづけフィルタ140と線形予測逆フィルタ230へ出力する。 The first differentiator 180 inputs an input vector via the input terminal 10, inputs a first reproduction vector output from the linear prediction synthesis filter 130, calculates a difference between them, and calculates the first difference. The difference vector is output to the weighting filter 140 and the linear prediction inverse filter 230.

第1の重みづけフィルタ140は、第1の差分器180から出力される第1の差分ベクトルと線形予測係数計算回路170から出力される線形予測係数を入力し、前記線形予測係数を用いて、人間の聴覚特性に対応した重みづけフィルタW(z)を生成し、前記重みづけフィルタを前記第1の差分ベクトルで駆動することで、第1の重みづけ差分ベクトルを得る。そして前記第1の重みづけ差分ベクトルを第1の最小化回路150へ出力する。ここで、重みづけフィルタの伝達関数W(z)は、W(z)=Q(z/γ1 )/Q(z/γ2 )と表される。ただし、 The first weighting filter 140 receives the first difference vector output from the first differentiator 180 and the linear prediction coefficient output from the linear prediction coefficient calculation circuit 170, and uses the linear prediction coefficient, A weighting filter W (z) corresponding to human auditory characteristics is generated, and the weighting filter is driven by the first difference vector, thereby obtaining a first weighted difference vector. The first weighted difference vector is output to the first minimizing circuit 150. Here, the transfer function W (z) of the weighting filter is expressed as W (z) = Q (z / γ1) / Q (z / γ2). However,

Figure 0004293005
Figure 0004293005

である。γおよびγは定数であり、例えば、γ=0.9、γ=0.6である。また、重みづけフィルタの詳細に関しては、(文献1)を参照できる。 It is. γ 1 and γ 2 are constants, for example, γ 1 = 0.9 and γ 2 = 0.6. For details of the weighting filter, reference 1 can be referred to.

第1の最小化回路150は、第1の音源生成回路110に格納されている第1の音源ベクトル全てに対応するインデックスを、前記第1の音源生成回路110へ順次出力し、第1のゲイン回路160に格納されている第1のゲイン全てに対応するインデックスを、前記第1のゲイン回路160へ順次出力する。また、重みづけフィルタ140から出力される第1の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第1の音源ベクトルおよび前記第1のゲインを選択し、これらに対応するインデックスを符号出力回路290へ出力する。 The first minimizing circuit 150 sequentially outputs indexes corresponding to all the first sound source vectors stored in the first sound source generating circuit 110 to the first sound source generating circuit 110 to obtain a first gain. Indexes corresponding to all the first gains stored in the circuit 160 are sequentially output to the first gain circuit 160. Further, the first weighted difference vector output from the weighting filter 140 is sequentially input, its norm is calculated, and the first sound source vector and the first gain that minimize the norm are obtained. The selected indexes are output to the code output circuit 290.

線形予測逆フィルタ230は、量子化線形予測係数が格納されたテーブルを備えている。線形予測逆フィルタ230は、線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスと第1の差分器180から出力される第1の差分ベクトルとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された逆フィルタA(z)を、前記第1の差分ベクトルにより駆動することで、第1の残差ベクトルを得る。そして前記第1の残差ベクトルを直交変換回路240へ出力する。ここで、逆フィルタの伝達関数A(z)は、 The linear prediction inverse filter 230 includes a table in which quantized linear prediction coefficients are stored. The linear prediction inverse filter 230 receives an index corresponding to the quantized linear prediction coefficient output from the linear prediction coefficient calculation circuit 170 and the first difference vector output from the first differencer 180. Further, the quantized linear prediction coefficient corresponding to the index is read from the table, and the inverse filter A (z) in which the quantized linear prediction coefficient is set is driven by the first difference vector. A residual vector of 1 is obtained. Then, the first residual vector is output to the orthogonal transformation circuit 240. Here, the transfer function A (z) of the inverse filter is

Figure 0004293005
Figure 0004293005

と表される。 It is expressed.

直交変換回路240は、線形予測逆フィルタ230から出力される第1の残差ベクトルを入力し、前記第1の残差ベクトルを直交変換し、第2の残差ベクトルを得る。そして前記第2の残差ベクトルを帯域選択回路250へ出力する。ここで直交変換としては、離散コサイン変換(Discrete Cosine Transform, DCT)を用いることができる。 The orthogonal transform circuit 240 receives the first residual vector output from the linear prediction inverse filter 230 and performs orthogonal transform on the first residual vector to obtain a second residual vector. The second residual vector is output to the band selection circuit 250. Here, as the orthogonal transform, a discrete cosine transform (DCT) can be used.

帯域選択回路250は、直交変換回路240から出力される第2の残差ベクトルを入力し、図3に示すように、前記第2の残差ベクトルにおいて、第2の帯域に含まれる成分を用いてNsbv 個のサブベクトルを生成する。第2の帯域としては、任意の帯域が設定できるが、ここではFs2[Hz]からFe2[Hz]とする。
ただし、Fs0≦Fs2≦Fe2≦Fe0である。ここでは、第1の帯域と第2の帯域が重ならない、すなわち、Fe1≦Fs2とする。例えば、Fs2=4000[Hz]、Fe2=7000[Hz]である。帯域選択回路250は、前記Nsbv 個のサブベクトルを直交変換係数量子化回路260へ出力する。
The band selection circuit 250 receives the second residual vector output from the orthogonal transform circuit 240, and uses a component included in the second band in the second residual vector, as shown in FIG. To generate N sbv subvectors . An arbitrary band can be set as the second band, but here it is assumed that F s2 [Hz] is changed to F e2 [Hz].
However, F s0 ≦ F s2 ≦ F e2 ≦ F e0 . Here, the first band and the second band do not overlap, that is, F e1 ≦ F s2 . For example, F s2 = 4000 [Hz] and F e2 = 7000 [Hz]. The band selection circuit 250 outputs the N sbv subvectors to the orthogonal transform coefficient quantization circuit 260.

直交変換係数量子化回路260は、帯域選択回路250から出力されるNsbv個のサブベクトルを入力する。直交変換係数量子化回路260は、前記サブベクトルの形状に対する量子化値(形状コードベクトル)が格納されたテーブルと、前記サブベクトルのゲインに対する量子化値(量子化ゲイン)が格納されたテーブルとを備えており、入力された前記Nsbv 個のサブベクトル各々に対して、量子化誤差が最小となる、形状の量子化値とゲインの量子化値とを、前記テーブルより選択し、対応するインデックスを符号出力回路290へ出力する。ここで、直交変換係数量子化回路260の構成について図4を用いて補足する。図4において、点線で囲まれたブロックはNsbv 個あり、その各ブロックで前記Nsbv 個のサブベクトルが量子化される。前記Nsbv 個のサブベクトルを The orthogonal transform coefficient quantization circuit 260 receives N sbv subvectors output from the band selection circuit 250. The orthogonal transform coefficient quantization circuit 260 includes a table storing a quantization value (shape code vector) for the shape of the subvector, a table storing a quantization value (quantization gain) for the gain of the subvector, For each of the input N sbv subvectors , a shape quantization value and a gain quantization value that minimize the quantization error are selected from the table and correspond to each other. The index is output to the code output circuit 290. Here, the configuration of the orthogonal transform coefficient quantization circuit 260 will be supplemented with reference to FIG. 4, the block surrounded by the dotted line have number N sbv, the N sbv sub vectors in that each block is quantized. The N sbv subvectors

Figure 0004293005
Figure 0004293005

と表す。各サブベクトルに対する処理は共通であるので、esb,0(n),n=0,…,L−1に対する処理について説明する。 It expresses. Since the processing for each subvector is common, the processing for e sb , 0 (n), n = 0,..., L−1 will be described.

サブベクトルesb,0(n),n=0,…,L−1は、入力端子2650を介して入力される。テーブル2610には、形状コードベクトルc0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1がNc,0 個格納されている。ここで、Lはベクトル長を表し、jはインデックスを表す。テーブル2610は、最小化回路2630から出力されるインデックスを入力し、前記インデックスに対応する前記形状コードベクトルc0 [j](n),n=0,…,L−1をゲイン回路2620へ出力する。ゲイン回路2620が備えているテーブルには、量子化ゲインg0 [k],k=0,…,Ng,0 −1がNg,0 個格納されている。ここで、kはインデックスを表す。ゲイン回路2620は、テーブル2610から出力される前記形状コードベクトルc0 [j](n),n=0,…,L−1を入力し、最小化回路2630から出力されるインデックスを入力し、前記インデックスに対応する量子化ゲインg0 [k]を前記テーブルより読み出し、前記量子化ゲインg0 [k]と前記形状コードベクトルc0 [j](n),n=0,…,L−1とを乗算して得られる量子化サブベクトルe′sb,0(n),n=0,…,L−1を差分器2640へ出力する。差分器2640は、入力端子2650を介して入力される前記サブベクトルesb,0(n),n=0,…,L−1とゲイン回路2620から入力される前記量子化サブベクトルe′sb,0(n),n=0,…,L−1との差分を計算し、これを差分ベクトルとして最小化回路2630へ出力する。最小化回路2630は、テーブル2610に格納されている前記形状コードベクトルc0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1全てに対応するインデックスを、前記テーブル2610へ順次出力し、ゲイン回路2620に格納されている前記量子化ゲインg0 [k],k=0,…,Ng,0 −1全てに対応するインデックスを、ゲイン回路2620へ順次出力する。また、差分器2640から前記差分ベクトルを順次入力し、そのノルムD0 を計算し、前記ノルムD0 が最小となる前記形状コードベクトルc0 [j](n),n=0,…,L−1および前記量子化ゲインg0 [k]を選択し、これらに対応するインデックスをインデックス出力回路2660へ出力する。サブベクトル The subvector e sb , 0 (n), n = 0,..., L−1 is input via the input terminal 2650. The table 2610, shape code vector c 0 [j] (n) , n = 0, ..., L-1, j = 0, ..., N c, 0 -1 is stored N c, 0 or. Here, L represents a vector length, and j represents an index. The table 2610 receives the index output from the minimizing circuit 2630 and outputs the shape code vector c 0 [j] (n), n = 0,..., L−1 corresponding to the index to the gain circuit 2620. To do. The table provided in the gain circuit 2620 stores N g , 0 quantization gains g 0 [k] , k = 0,..., N g , 0 −1. Here, k represents an index. The gain circuit 2620 inputs the shape code vector c 0 [j] (n), n = 0,..., L−1 output from the table 2610, and inputs the index output from the minimization circuit 2630, The quantization gain g 0 [k] corresponding to the index is read from the table, and the quantization gain g 0 [k] and the shape code vector c 0 [j] (n), n = 0,. Quantized subvectors e ′ sb , 0 (n), n = 0,..., L−1 obtained by multiplying 1 are output to the differentiator 2640. The subtractor 2640 receives the sub-vector e sb , 0 (n), n = 0,..., L−1 input via the input terminal 2650 and the quantized sub-vector e ′ sb input from the gain circuit 2620. , 0 (n), n = 0,..., L−1, and outputs this to the minimizing circuit 2630 as a difference vector. The minimizing circuit 2630 applies all of the shape code vectors c 0 [j] (n), n = 0,..., L−1, j = 0, ..., N c , 0 −1 stored in the table 2610. The corresponding indexes are sequentially output to the table 2610, and the indexes corresponding to all the quantization gains g 0 [k] , k = 0,..., N g, 0 −1 stored in the gain circuit 2620 are The signals are sequentially output to the gain circuit 2620. Moreover, the difference vector are sequentially input from the differentiator 2640, the norm D 0 calculated, the said shape code vector c 0 norm D 0 is the minimum [j] (n), n = 0, ..., L −1 and the quantization gain g 0 [k] are selected, and indexes corresponding to these are output to the index output circuit 2660. Subvector

Figure 0004293005
Figure 0004293005

に対しても同様の処理を行う。インデックス出力回路2660は、Nsbv 個の最小化回路から出力されるインデックスを入力し、これらをまとめたインデックスのセットを出力端子2670を介して符号出力回路290へ出力する。また、ノルムD0 が最小となる前記形状コードベクトルc0 [j](n),n=0,…,L−
1および前記量子化ゲインg0 [k]の決定については、以下の方法を用いることもできる。ノルムD0 は、
The same processing is performed for. The index output circuit 2660 receives the indexes output from the N sbv minimization circuits, and outputs a set of indexes obtained by collecting them to the code output circuit 290 via the output terminal 2670. Further, the norm D 0 is the minimum shape code vector c 0 [j] (n) , n = 0, ..., L-
1 and the quantization gain g 0 [k] can be determined by the following method. Norm D 0 is

Figure 0004293005
Figure 0004293005

と表される。ここで、最適なゲインg′0It is expressed. Where the optimal gain g ′ 0

Figure 0004293005
Figure 0004293005

と設定すると、ノルムD0 は、 And norm D 0 is

Figure 0004293005
Figure 0004293005

と変形できる。したがって、D0 が最小となるc0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1を求めることは、(式3)の第2項が最大と
なるc0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1を求めることと等価である。そこで、(式3)の第2項が最大となるc0 [j](n),n=0,…,L−1,j=jopt を求めた後、このc0 [j](n),n=0,…,L−1,j=jopt について(式1)が最小となるg0 [k],k=kopt を求める。ここで、c0 [j] (n),n=0,…,L−1,j=jopt としては、(式3)の第2項の値が大きいものから順に複数個の候補を選んでおき、その各々に対して(式1)が最小となるg0 [k],k=kopt を求め、それらの中からノルムD0 が最小となるc0 [j](n),n=0,…,L−1,j=jopt とg0 [k],k=kopt を最終的に選択することもできる。サブベクトル
And can be transformed. Therefore, c D 0 is minimum 0 [j] (n), n = 0, ..., L-1, j = 0, ..., to obtain the N c, 0 -1, the first of (Equation 3) 2 term is the maximum c 0 [j] (n) , n = 0, ..., L-1, j = 0, ..., is equivalent to finding the n c, 0 -1. Therefore, after obtaining c 0 [j] (n), n = 0,..., L−1, j = j opt that maximizes the second term of (Equation 3), this c 0 [j] (n ), N = 0,..., L−1, j = j opt , g 0 [k] and k = k opt that minimize (Equation 1) are obtained. Here, as c 0 [j] (n), n = 0,..., L−1, j = j opt , a plurality of candidates are selected in descending order of the value of the second term in (Equation 3). And g 0 [k] and k = k opt that minimize (Equation 1) are obtained for each of them, and c 0 [j] (n), n that minimizes the norm D 0 among them. = 0,..., L-1, j = j opt and g 0 [k] , k = k opt can be finally selected. Subvector

Figure 0004293005
Figure 0004293005

に対しても同様の方法を適用できる。以上で図4を用いた直交変換係数量子化回路260の説明を終え、図1の説明に戻る。 The same method can be applied to. This is the end of the description of the orthogonal transform coefficient quantization circuit 260 using FIG. 4, and the description returns to FIG.

符号出力回路290は、線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスを入力する。また、第1の最小化回路150から出力される、第1の音源ベクトルおよび第1のゲインの各々に対応するインデックスを入力し、直交変換係数量子化回路260から出力される、Nsbv 個のサブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットを入力する。そして、図29に模式的に示すように各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。 The code output circuit 290 receives an index corresponding to the quantized linear prediction coefficient output from the linear prediction coefficient calculation circuit 170. Also, an index corresponding to each of the first excitation vector and the first gain output from the first minimizing circuit 150 is input, and N sbv number of outputs output from the orthogonal transform coefficient quantization circuit 260 are input. Enter a set of indices consisting of shape code vectors and quantization gain indices for the subvectors. Then, as schematically shown in FIG. 29, each index is converted into a bit-sequence code and output via the output terminal 20.

図1を用いて説明した第1の実施例は、帯域数が2の場合であるが、帯域数を3以上に拡張した場合について以下で説明する。 The first embodiment described with reference to FIG. 1 is a case where the number of bands is 2, but a case where the number of bands is expanded to 3 or more will be described below.

図1は、図5のように書き直すことができる。ここで、図5の第1の符号化回路1001は、図6と等価であり、図5の第2の符号化回路1002は、図7と等価であり、図6、図7を構成する各ブロックは、図1で説明した各ブロックと同じである。 FIG. 1 can be rewritten as shown in FIG. Here, the first encoding circuit 1001 in FIG. 5 is equivalent to FIG. 6, and the second encoding circuit 1002 in FIG. 5 is equivalent to FIG. The blocks are the same as the blocks described in FIG.

本発明の第2の実施例は、第1の実施例において帯域数を3に拡張することで実現される。本発明の第2の実施例による音声音楽信号符号化装置の構成は、図8に示すブロック図で表すことができる。ここで、第1の符号化回路1001は図6と等価であり、第2の符号化回路1002は図6と等価であり、第3の符
号化回路1003は図7と等価である。符号出力回路2901は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1001から出力されるインデックスを入力し、第2の符号化回路1002から出力されるインデックスを入力し、第3の符号化回路1003から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
The second embodiment of the present invention is realized by expanding the number of bands to 3 in the first embodiment. The configuration of the speech and music signal encoding apparatus according to the second embodiment of the present invention can be represented by the block diagram shown in FIG. Here, the first encoding circuit 1001 is equivalent to FIG. 6, the second encoding circuit 1002 is equivalent to FIG. 6, and the third encoding circuit 1003 is equivalent to FIG. The code output circuit 2901 receives the index output from the linear prediction coefficient calculation circuit 170, receives the index output from the first encoding circuit 1001, and receives the index output from the second encoding circuit 1002. The set of indexes output from the third encoding circuit 1003 is input. Each index is converted into a bit-sequence code and output via the output terminal 20.

本発明の第3の実施例は、第1の実施例において帯域数をNに拡張することで実現される。本発明の第3の実施例による音声音楽信号符号化装置の構成
は、図9に示すブロック図で表すことができる。ここで、第1の符号化回路1001から第N−1の符号化回路1004は図6と等価であり、第Nの符号化回路1005は図7と等価である。符号出力回路2902は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1001から第N−1の符号化回路1004の各々より出力されるインデックスを入力し、第Nの符号化回路1005から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。
The third embodiment of the present invention is realized by extending the number of bands to N in the first embodiment. The configuration of the speech and music signal encoding apparatus according to the third embodiment of the present invention can be represented by the block diagram shown in FIG. Here, the first encoding circuit 1001 to the (N-1) th encoding circuit 1004 are equivalent to FIG. 6, and the Nth encoding circuit 1005 is equivalent to FIG. The code output circuit 2902 receives an index output from the linear prediction coefficient calculation circuit 170, inputs an index output from each of the first to N-1th encoding circuits 1004 to 1001, and An index set output from the N encoding circuits 1005 is input. Each index is converted into a bit-sequence code and output via the output terminal 20.

第1の実施例では、図5における第1の符号化回路1001がA−b−S(Analysis-by-Synthesis )法を用いた符号化方式に基づいているが、第1の符号化回路1001に対して、A−b−S法以外の符号化方式を適用することもできる。以下では、A−b−S法以外の符号化方式として時間周波数変換を用いた符号化方式を第1の符号化回路1001に対して適用した場合について説明する。 In the first embodiment, the first encoding circuit 1001 in FIG. 5 is based on an encoding method using an AbS (Analysis-by-Synthesis) method. On the other hand, an encoding method other than the Abs method can be applied. Hereinafter, a case where an encoding method using time-frequency conversion is applied to the first encoding circuit 1001 as an encoding method other than the Abs method will be described.

本発明の第4の実施例は、第1の実施例において時間周波数変換を用いた符号化方式を適用することで実現される。本発明の第4の実施例による音声音楽信号符号化装置の構成は、図11に示すブロック図で表すことができる。ここで、第1の符号化回路1011は図10と等価であり、第2の符号化回路1002は図7と等価である。図10を構成するブロックのうち、線形予測逆フィルタ230、直交変換回路240、帯域選択回路250および直交変換係数量子化回路260は、図1で説明した各ブロックと同じである。また、直交変換係数逆量子化回路460、直交逆変換回路440および線形予測合成フィルタ131は、後述する第9の実施例による、第1の実施例に対応する音声音楽復号装置を構成するブロックと同じである。直交変換係数逆量子化回路460、直交逆変換回路440および線形予測合成フィルタ131の説明は、図13を用いた第9の実施例の説明において行うのでここでは割愛する。符号出力回路2903は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1011から出力されるインデックスのセットを入力し、第2の符号化回路1002から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。 The fourth embodiment of the present invention is realized by applying an encoding method using time-frequency conversion in the first embodiment. The configuration of the speech and music signal encoding apparatus according to the fourth embodiment of the present invention can be represented by the block diagram shown in FIG. Here, the first encoding circuit 1011 is equivalent to FIG. 10, and the second encoding circuit 1002 is equivalent to FIG. Among the blocks constituting FIG. 10, the linear prediction inverse filter 230, the orthogonal transform circuit 240, the band selection circuit 250, and the orthogonal transform coefficient quantization circuit 260 are the same as the blocks described in FIG. The orthogonal transform coefficient inverse quantization circuit 460, the orthogonal inverse transform circuit 440, and the linear prediction synthesis filter 131 are blocks constituting a speech and music decoding device corresponding to the first embodiment according to a ninth embodiment described later. The same. The description of the orthogonal transform coefficient inverse quantization circuit 460, the orthogonal inverse transform circuit 440, and the linear prediction synthesis filter 131 will be omitted because it will be described in the description of the ninth embodiment using FIG. The code output circuit 2903 receives the index output from the linear prediction coefficient calculation circuit 170, receives the index set output from the first encoding circuit 1011, and outputs from the second encoding circuit 1002. Enter a set of indexes. Each index is converted into a bit-sequence code and output via the output terminal 20.

本発明の第5の実施例は、第4の実施例において帯域数を3に拡張することで実現される。本発明の第5の実施例による音声音楽信号符号化装置の構成は、図12に示すブロック図で表すことができる。ここで、第1の符号化回路1011は図10と等価であり、第2の符号化回路1012は図10と等価であり、第3の符号化回路1003は図7と等価である。符号出力回路2904は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1011から出力されるインデックスのセットを入力し、第2の符号化回路1012から出力されるインデックスのセットを入力し、第3の符号化回路1003から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。 The fifth embodiment of the present invention is realized by expanding the number of bands to 3 in the fourth embodiment. The configuration of the speech and music signal encoding apparatus according to the fifth embodiment of the present invention can be represented by the block diagram shown in FIG. Here, the first encoding circuit 1011 is equivalent to FIG. 10, the second encoding circuit 1012 is equivalent to FIG. 10, and the third encoding circuit 1003 is equivalent to FIG. The code output circuit 2904 receives the index output from the linear prediction coefficient calculation circuit 170, receives the index set output from the first encoding circuit 1011, and outputs the index set from the second encoding circuit 1012. An index set is input, and an index set output from the third encoding circuit 1003 is input. Each index is converted into a bit-sequence code and output via the output terminal 20.

本発明の第6の実施例は、第4の実施例において帯域数をNに拡張することで実現される。本発明の第6の実施例による音声音楽信号符号化装置の構成は、図13に示すブロック図で表すことができる。ここで、第1の符号化回路1011から第N−1の符号化回路1014の各々は図10と等価であり、第Nの符号化回路1005は図7と等価である。符号出力回路2905は、線形予測係数計算回路170から出力されるインデックスを入力し、第1の符号化回路1011から第N−1の符号化回路1014の各々より出力されるインデックスのセットを入力し、第Nの符号化回路1005から出力されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。 The sixth embodiment of the present invention is realized by expanding the number of bands to N in the fourth embodiment. The configuration of the speech and music signal encoding apparatus according to the sixth embodiment of the present invention can be represented by the block diagram shown in FIG. Here, each of the first to N-1th encoding circuits 1011 to 1014 is equivalent to FIG. 10, and the Nth encoding circuit 1005 is equivalent to FIG. The code output circuit 2905 receives the index output from the linear prediction coefficient calculation circuit 170, and receives the set of indexes output from each of the N-1th encoding circuit 1014 from the first encoding circuit 1011. The index set output from the Nth encoding circuit 1005 is input. Each index is converted into a bit-sequence code and output via the output terminal 20.

図14は、本発明の第7の実施例による音声音楽信号符号化装置の構成を示すブロック図である。図中の点線で囲まれたブロックをピッチ予測フィルタといい、図1にピッチ予測フィルタを付加することで図14が得られる。以下では、図1と異なるブロックである、記憶回路510、ピッチ信号生成回路112、第3のゲイン回路162、加算器184、第1の最小化回路550、符号出力回路590について説明する。 FIG. 14 is a block diagram showing the configuration of a speech and music signal encoding apparatus according to the seventh embodiment of the present invention. A block surrounded by a dotted line in the figure is called a pitch prediction filter, and FIG. 14 is obtained by adding the pitch prediction filter to FIG. Hereinafter, the memory circuit 510, the pitch signal generation circuit 112, the third gain circuit 162, the adder 184, the first minimization circuit 550, and the code output circuit 590, which are different blocks from those in FIG. 1, will be described.

記憶回路510は、加算器184から第5の音源信号を入力し、保持する。記憶回路510は、過去に入力されて保持されている前記第5の音源信号をピッチ信号生成回路112へ出力する。 The storage circuit 510 receives the fifth sound source signal from the adder 184 and holds it. The storage circuit 510 outputs the fifth sound source signal input and held in the past to the pitch signal generation circuit 112.

ピッチ信号生成回路112は、記憶回路510に保持されている過去の第5の音源信号と第1の最小化回路550から出力されるインデックスとを入力する。前記インデックスは、遅延dを指定する。そして、図30に示すように、前記過去の第5の音源信号において、現フレームの始点よりdサンプル過去の点から、ベクトル長に相当するLサンプル分の信号を切り出し、第1のピッチベクトルを生成する。ここで、d<Lの場合にはdサンプル分の信号を切り出し、この切り出したdサンプルを繰り返し接続して、ベクトル長がLサンプルである第1のピッチベクトルを生成する。ピッチ信号生成回路112は、前記第1のピッチベクトルを第3のゲイン回路162へ出力する。 The pitch signal generation circuit 112 receives the past fifth sound source signal held in the storage circuit 510 and the index output from the first minimization circuit 550. The index specifies a delay d. Then, as shown in FIG. 30, in the past fifth sound source signal, a signal for L samples corresponding to the vector length is cut out from a point d samples past from the start point of the current frame, and the first pitch vector is obtained. Generate. Here, when d <L, a signal for d samples is cut out, and the cut out d samples are repeatedly connected to generate a first pitch vector having a vector length of L samples. The pitch signal generation circuit 112 outputs the first pitch vector to the third gain circuit 162.

第3のゲイン回路162は、ゲインの値が格納されたテーブルを備えている。第3のゲイン回路162は、第1の最小化回路550から出力されるインデックスとピッチ信号生成回路112から出力される第1のピッチベクトルとを入力し、前記インデックスに対応する第3のゲインを前記テーブルより読み出し、前記第3のゲインと前記第1のピッチベクトルとを乗算し、第2のピッチベクトルを生成し、生成した前記第2のピッチベクトルを加算器184へ出力する。 The third gain circuit 162 includes a table in which gain values are stored. The third gain circuit 162 receives the index output from the first minimization circuit 550 and the first pitch vector output from the pitch signal generation circuit 112, and obtains a third gain corresponding to the index. The second pitch vector is read from the table, multiplied by the third gain and the first pitch vector to generate a second pitch vector, and the generated second pitch vector is output to the adder 184.

加算器184は、第1のゲイン回路160から出力される第2の音源ベクトルと、第3のゲイン回路162から出力される第2のピッチベクトルを入力し、これらの和を計算し、これを第5の音源ベクトルとして、第1の帯域通過フィルタ120へ出力する。 The adder 184 inputs the second sound source vector output from the first gain circuit 160 and the second pitch vector output from the third gain circuit 162, calculates the sum of these, The fifth sound source vector is output to the first band pass filter 120.

第1の最小化回路550は、第1の音源生成回路110に格納されている第1の音源ベクトル全てに対応するインデックスを、前記第1の音源生成回路110へ順次出力し、ピッチ信号生成回路112において規定された範囲内の遅延d全てに対応するインデックスを、前記ピッチ信号生成回路112へ順次出力し、第1のゲイン回路160に格納されている第1のゲイン全てに対応するインデックスを、前記第1のゲイン回路160へ順次出力し、第3のゲイン回路162に格納されている第3のゲイン全てに対応するインデックスを、前記第3のゲイン回路162へ順次出力する。また、重みづけフィルタ140から出力される第1の重みづけ差分ベクトルを順次入力し、そのノルムを計算し、前記ノルムが最小となるような、前記第1の音源ベクトル、前記遅延d、前記第1のゲインおよび前記第3のゲインを選択し、これらに対応するインデックスをまとめて符号出力回路590へ出力する。 The first minimizing circuit 550 sequentially outputs indexes corresponding to all the first sound source vectors stored in the first sound source generating circuit 110 to the first sound source generating circuit 110, and the pitch signal generating circuit. 112, indexes corresponding to all delays d within the range defined in 112 are sequentially output to the pitch signal generation circuit 112, and indexes corresponding to all the first gains stored in the first gain circuit 160 are The first gain circuit 160 is sequentially output, and indexes corresponding to all the third gains stored in the third gain circuit 162 are sequentially output to the third gain circuit 162. In addition, the first weighted difference vector output from the weighting filter 140 is sequentially input, the norm thereof is calculated, and the first sound source vector, the delay d, the first, such that the norm is minimized. A gain of 1 and the third gain are selected, and indexes corresponding to these are collectively output to the code output circuit 590.

符号出力回路590は、線形予測係数計算回路170から出力される量子化線形予測係数に対応するインデックスを入力する。また、第1の最小化回路550から出力される、第1の音源ベクトル、遅延d、第1のゲインおよび第3のゲインの各々に対応するインデックスを入力し、直交変換係数量子化回路260から出力される、Nsbv 個のサブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットを入力する。そして、各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。 The code output circuit 590 inputs an index corresponding to the quantized linear prediction coefficient output from the linear prediction coefficient calculation circuit 170. Also, the index corresponding to each of the first sound source vector, the delay d, the first gain, and the third gain output from the first minimizing circuit 550 is input, and the orthogonal transform coefficient quantizing circuit 260 outputs the index. A set of indexes composed of shape code vectors and quantization gain indexes for the N sbv subvectors to be output are input. Each index is converted into a bit-sequence code and output via the output terminal 20.

図15は、本発明の第8の実施例による音声音楽信号符号化装置の構成を示すブロック図である。以下では、図14と異なるブロックである、ダウンサンプル回路780、第1の線形予測係数計算回路770、第1の線形予測合成フィルタ132、第3の差分器183、アップサンプル回路781、第1の差分器180、
第2の線形予測係数計算回路771、第3の線形予測係数計算回路772、線形予測逆フィルタ730、符号出力回路790について説明する。
FIG. 15 is a block diagram showing the configuration of a speech and music signal encoding apparatus according to the eighth embodiment of the present invention. In the following, the downsampling circuit 780, the first linear prediction coefficient calculation circuit 770, the first linear prediction synthesis filter 132, the third differentiator 183, the upsampling circuit 781, the first block, which are different blocks from FIG. Differentiator 180,
The second linear prediction coefficient calculation circuit 771, the third linear prediction coefficient calculation circuit 772, the linear prediction inverse filter 730, and the code output circuit 790 will be described.

ダウンサンプル回路780は、入力端子10から入力ベクトルを入力し、これをダウンサンプルして得られる、第1の帯域を有する第2の入力ベクトルを第1の線形予測係数計算回路770および第3の差分器183へ出力する。ここで、第1の帯域は、第1の実施例と同様にFs1[Hz]からFe1[Hz]とし、入力ベクトルの帯域はFs0[Hz]からFe0[Hz](第3の帯域)とする。ダウンサンプル回路の構成については、P. P. Vaidyanathanによる「Multirate Systems and Filter Banks」と題した文献(文献6)の4.1.1節を参照できる。 The down-sampling circuit 780 inputs an input vector from the input terminal 10 and obtains a second input vector having a first band obtained by down-sampling the input vector from the first linear prediction coefficient calculation circuit 770 and the third Output to the differentiator 183. Here, the first band is set to F s1 [Hz] to F e1 [Hz] as in the first embodiment, and the input vector band is set to F s0 [Hz] to F e0 [Hz] (third Band). Regarding the configuration of the downsampling circuit, section 4.1.1 of the document entitled “Multirate Systems and Filter Banks” by PP Vaidyanathan (Reference 6) can be referred to.

第1の線形予測係数計算回路770は、ダウンサンプル回路780から第2の入力ベクトルを入力し、前記第2の入力ベクトルに対して線形予測分析を行い、第1の帯域を有する第1の線形予測係数を求め、さらに前記第1の線形予測係数を量子化し、第1の量子化線形予測係数を求める。第1の線形予測係数計算回路770は、前記第1の線形予測係数を第1の重みづけフィルタ140へ出力し、第1の量子化線形予測係数に対応するインデックスを第1の線形予測合成フィルタ132と線形予測逆フィルタ730と第3の線形予測係数計算回路772および符号出力回路790へ出力する。 The first linear prediction coefficient calculation circuit 770 receives the second input vector from the downsampling circuit 780, performs linear prediction analysis on the second input vector, and performs the first linear having the first band. A prediction coefficient is obtained, and further, the first linear prediction coefficient is quantized to obtain a first quantized linear prediction coefficient. The first linear prediction coefficient calculation circuit 770 outputs the first linear prediction coefficient to the first weighting filter 140, and an index corresponding to the first quantized linear prediction coefficient is output to the first linear prediction synthesis filter. 132, the linear prediction inverse filter 730, the third linear prediction coefficient calculation circuit 772, and the code output circuit 790.

第1の線形予測合成フィルタ132は、第1の量子化線形予測係数が格納されたテーブルを備えている。第1の線形予測合成フィルタ132は、加算器184から出力される第5の音源ベクトルと第1の線形予測係数計算回路770から出力される第1の量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する第1の量子化線形予測係数を、前記テーブルより読み出し、前記第1の量子化線形予測係数が設定された合成フィルタを、前記第5の音源ベクトルにより駆動することで、第1の帯域を有する第1の再生ベクトルを得る。そして前記第1の再生ベクトルを第3の差分器183とアップサンプル回路781へ出力する。 The first linear prediction synthesis filter 132 includes a table in which the first quantized linear prediction coefficients are stored. The first linear prediction synthesis filter 132 uses the fifth excitation vector output from the adder 184 and the index corresponding to the first quantized linear prediction coefficient output from the first linear prediction coefficient calculation circuit 770. input. Further, the first quantized linear prediction coefficient corresponding to the index is read from the table, and the synthesis filter in which the first quantized linear prediction coefficient is set is driven by the fifth excitation vector. Then, a first reproduction vector having a first band is obtained. Then, the first reproduction vector is output to the third differentiator 183 and the upsampling circuit 781.

第3の差分器183は、第1の線形予測合成フィルタ132から出力される第1の再生ベクトルとダウンサンプル回路780から出力される第2の入力ベクトルとを入力し、それらの差分を計算し、これを第2の差分ベクトルとして重みづけフィルタ140へ出力する。 The third differentiator 183 inputs the first reproduction vector output from the first linear prediction synthesis filter 132 and the second input vector output from the downsampling circuit 780, and calculates the difference between them. This is output to the weighting filter 140 as the second difference vector.

アップサンプル回路781は、第1の線形予測合成フィルタ132から出力される第1の再生ベクトルを入力し、これをアップサンプルして第3の帯域を有する第3の再生ベクトルを得る。ここで、第3の帯域はFs0[Hz]からFe0[Hz]である。アップサンプル回路781は、前記第3の再生ベクトルを第1の差分器180へ出力する。アップサンプル回路の構成については、P. P. Vaidyanathanによる「Multirate Systems and Filter Banks」と題した文献(文献6)の4.1.1節を参照できる。 The upsampling circuit 781 receives the first reproduction vector output from the first linear prediction synthesis filter 132 and upsamples it to obtain a third reproduction vector having a third band. Here, the third band is from F s0 [Hz] to F e0 [Hz]. The upsample circuit 781 outputs the third reproduction vector to the first subtractor 180. For the configuration of the upsample circuit, refer to section 4.1.1 of the document (Reference 6) entitled “Multirate Systems and Filter Banks” by PP Vaidyanathan.

第1の差分器180は、入力端子10を介して入力ベクトルを入力し、アップサンプル回路781から出力される第3の再生ベクトルを入力し、それらの差分を計算し、これを第1の差分ベクトルとして、線形予測逆フィルタ730へ出力する。 The first differentiator 180 receives an input vector via the input terminal 10, inputs a third reproduction vector output from the upsampling circuit 781, calculates a difference between them, and uses this as a first difference. The vector is output to the linear prediction inverse filter 730 as a vector.

第2の線形予測係数計算回路771は、入力端子10から入力ベクトルを入力し、前記入力ベクトルに対して線形予測分析を行い、第3の帯域を有する第2の線形予測係数を求め、前記第2の線形予測係数を第3の線形予測係数計算回路772へ出力する。 The second linear prediction coefficient calculation circuit 771 receives an input vector from the input terminal 10, performs linear prediction analysis on the input vector, obtains a second linear prediction coefficient having a third band, and The second linear prediction coefficient is output to the third linear prediction coefficient calculation circuit 772.

第3の線形予測係数計算回路772は、第1の量子化線形予測係数が格納されたテーブルを備えている。第3の線形予測係数計算回路772は、第2の線形予測係数計算回路771から出力される第2の線形予測係数と、第1の線形予測係数計算回路770から出力される第1の量子化線形予測係数に対応するインデックスとを入力する。そして前記インデックスに対応する第1の量子化線形予測係数を、前記テーブルより読み出し、前記第1の量子化線形予測係数をLSPに変換し、さらに、これをサンプリング周波数変換することで、入力信号のサンプリング周波数に対応する第1のLSPを得る。また、前記第2の線形予測係数をLSPに変換し、第2のLSPを得る。前記第2のLSPと前記第1のLSPとの差分を計算し、これを第3のLSPとする。ここで、LSPのサンプリング周波数変換については、特願平9−202475号(文献7)を参照できる。前記第3のLSPを量子化し、これを線形予測係数に変換し、第3の帯域を有する第3の量子化線形予測係数を得る。そして前記第3の量子化線形予測係数に対応するインデックスを線形予測逆フィルタ730および符号出力回路790へ出力する。 The third linear prediction coefficient calculation circuit 772 includes a table in which the first quantized linear prediction coefficient is stored. The third linear prediction coefficient calculation circuit 772 includes the second linear prediction coefficient output from the second linear prediction coefficient calculation circuit 771 and the first quantization output from the first linear prediction coefficient calculation circuit 770. Input an index corresponding to the linear prediction coefficient. Then, the first quantized linear prediction coefficient corresponding to the index is read from the table, the first quantized linear prediction coefficient is converted to LSP, and further, the sampling frequency is converted, thereby converting the input signal. A first LSP corresponding to the sampling frequency is obtained. Further, the second linear prediction coefficient is converted into an LSP to obtain a second LSP. A difference between the second LSP and the first LSP is calculated, and this is defined as a third LSP. Here, Japanese Patent Application No. 9-202475 (Document 7) can be referred to for sampling frequency conversion of LSP. The third LSP is quantized and converted into a linear prediction coefficient to obtain a third quantized linear prediction coefficient having a third band. The index corresponding to the third quantized linear prediction coefficient is output to the linear prediction inverse filter 730 and the code output circuit 790.

線形予測逆フィルタ730は、第1の量子化線形予測係数が格納された第1のテーブルと第3の量子化線形予測係数が格納された第2のテーブルとを備えている。線形予測逆フィルタ730は、第1の線形予測係数計算回路770から出力される第1の量子化線形予測係数に対応する第1のインデックスと第3の線形予測係数計算回路772から出力される第3の量子化線形予測係数に対応する第2のインデックスと第1の差分器180から出力される第1の差分ベクトルとを入力する。線形予測逆フィルタ730は、前記第1のインデックスに対応する第1の量子化線形予測係数を前記第1のテーブルより読み出し、LSPに変換し、さらに、これをサンプリング周波数変換することで、入力信号のサンプリング周波数に対応する第1のLSPを得る。そして前記第2のインデックスに対応する第3の量子化線形予測係数を、前記第2のテーブルより読み出し、LSPに変換
し、第3のLSPを得る。次に、前記第1のLSPと前記第3のLSPとを加算し、第2のLSPを得る。線形予測逆フィルタ730は、前記第2のLSPを線形予測係数に変換し、第2の量子化線形予測係数を得、前記第2の量子化線形予測係数が設定された逆フィルタを、前記第1の差分ベクトルにより駆動することで、第1の残差ベクトルを得る。そして前記第1の残差ベクトルを直交変換回路240へ出力する。
The linear prediction inverse filter 730 includes a first table storing a first quantized linear prediction coefficient and a second table storing a third quantized linear prediction coefficient. The linear prediction inverse filter 730 includes a first index corresponding to the first quantized linear prediction coefficient output from the first linear prediction coefficient calculation circuit 770 and a first index output from the third linear prediction coefficient calculation circuit 772. The second index corresponding to the quantized linear prediction coefficient of 3 and the first difference vector output from the first differentiator 180 are input. The linear prediction inverse filter 730 reads the first quantized linear prediction coefficient corresponding to the first index from the first table, converts the coefficient into an LSP, and further converts the input signal to the sampling frequency. The first LSP corresponding to the sampling frequency is obtained. Then, the third quantized linear prediction coefficient corresponding to the second index is read from the second table and converted into an LSP to obtain a third LSP. Next, the first LSP and the third LSP are added to obtain a second LSP. The linear prediction inverse filter 730 converts the second LSP into a linear prediction coefficient, obtains a second quantized linear prediction coefficient, and performs an inverse filter in which the second quantized linear prediction coefficient is set, By driving with a difference vector of 1, a first residual vector is obtained. Then, the first residual vector is output to the orthogonal transformation circuit 240.

符号出力回路790は、第1の線形予測係数計算回路770から出力される第1の量子化線形予測係数に対応するインデックスを入力し、第3の線形予測係数計算回路772から出力される第3の量子化線形予測係数に対応するインデックスを入力し、第1の最小化回路550から出力される、第1の音源ベクトル、遅延d、第1のゲインおよび第3のゲインの各々に対応するインデックスを入力し、直交変換係数量子化回路260から出力される、Nsbv 個のサブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットを入力する。そして各インデックスをビット系列の符号に変換し、出力端子20を介して出力する。 The code output circuit 790 inputs an index corresponding to the first quantized linear prediction coefficient output from the first linear prediction coefficient calculation circuit 770 and outputs a third output from the third linear prediction coefficient calculation circuit 772. An index corresponding to each of the first excitation vector, the delay d, the first gain, and the third gain output from the first minimizing circuit 550 is input. , And a set of indices composed of shape code vectors and quantization gain indices for N sbv subvectors output from the orthogonal transform coefficient quantization circuit 260. Each index is converted into a bit-sequence code and output via the output terminal 20.

図16は、本発明の第9の実施例による、第1の実施例に対応する音声音楽信号復号装置の構成を示すブロック図である。本復号装置は、入力端子30からビット系列の符号を入力する。 FIG. 16 is a block diagram showing a configuration of a speech and music signal decoding apparatus corresponding to the first embodiment according to the ninth embodiment of the present invention. The decoding apparatus inputs a bit sequence code from an input terminal 30.

符号入力回路410は、入力端子30から入力したビット系列の符号をインデックスに変換する。第1の音源ベクトルに対応するインデックスは、第1の音源生成回路110へ出力される。第1のゲインに対応するインデックスは、第1のゲイン回路160へ出力される。量子化線形予測係数に対応するインデックスは、線形予測合成フィルタ130および線形予測合成フィルタ131へ出力される。サブベクトルに対する形状コードベクトルおよび量子化ゲインの各々に対応するインデックスNsbv を個のサブベクトル分まとめたインデックスのセットは、直交変換係数逆量子化回路460へ出力される。 The code input circuit 410 converts the bit sequence code input from the input terminal 30 into an index. The index corresponding to the first sound source vector is output to the first sound source generation circuit 110. The index corresponding to the first gain is output to the first gain circuit 160. The index corresponding to the quantized linear prediction coefficient is output to the linear prediction synthesis filter 130 and the linear prediction synthesis filter 131. A set of indexes obtained by collecting the index N sbv corresponding to each of the shape code vector and the quantization gain for the subvector for the number of subvectors is output to the orthogonal transform coefficient inverse quantization circuit 460.

第1の音源生成回路110は、符号入力回路410から出力されるインデックスを入力し、前記インデックスに対応する第1の音源ベクトルを、複数個の音源ベクトルが格納されたテーブルより読み出し、第1のゲイン回路160へ出力する。 The first sound generator 110 receives an index output from the code input circuit 410, reads a first sound vector corresponding to the index from a table storing a plurality of sound vectors, Output to the gain circuit 160.

第1のゲイン回路160は、量子化ゲイン
格納されたテーブルを備えている。第1のゲイン回路160は、符号入力回路410から出力されるインデックスと第1の音源生成回路110から出力される第1の音源ベクトルとを入力し、前記インデックスに対応する第1のゲインを前記テーブルより読み出し、前記第1のゲインと前記第1の音源ベクトルとを乗算し、第2の音源ベクトルを生成し、生成した前記第2の音源ベクトルを第1の帯域通過フィルタ120へ出力する。
The first gain circuit 160 includes a table storing quantization gains. The first gain circuit 160 receives the index output from the code input circuit 410 and the first sound source vector output from the first sound source generation circuit 110, and sets the first gain corresponding to the index to the first gain circuit 160. It reads from the table, multiplies the first gain and the first sound source vector to generate a second sound source vector, and outputs the generated second sound source vector to the first band pass filter 120.

第1の帯域通過フィルタ120は、第1のゲイン回路160から出力される第2の音源ベクトルを入力する。前記第2の音源ベクトルは、このフィルタにより第1の帯域に帯域制限され、第1の励振ベクトルを得る。第1の帯域通過フィルタ120は、前記第1の励振ベクトルを線形予測合成フィルタ130へ出力する。 The first band pass filter 120 receives the second sound source vector output from the first gain circuit 160. The second sound source vector is band-limited to the first band by this filter to obtain a first excitation vector. The first band pass filter 120 outputs the first excitation vector to the linear prediction synthesis filter 130.

直交変換係数逆量子化回路460の構成について図18を用いて説明する。図18において、点線で囲まれたブロックはNsbv 個ある。その各ブロックで図1の帯域選択回路250において規定されるNsbv 個の量子化サブベクトル The configuration of the orthogonal transform coefficient inverse quantization circuit 460 will be described with reference to FIG. In FIG. 18, there are N sbv blocks surrounded by a dotted line. N sbv quantization subvectors defined in the band selection circuit 250 of FIG. 1 in each block

Figure 0004293005
Figure 0004293005

が復号される。各量子化サブベクトルに対する復号処理は共通であるので、e′sb,0(n),n=0,…,L−1に対する処理について説明する。量子化サブベクトルe′sb,0(n),n=0,…,L−1は、図1における直交変換係数量子化回路260での処理と同様に、形状コードベクトルc0 [j](n),n=0,…,L−1と量子化ゲインg0 [k]との積で表される。ここで、j,kはインデックスを表す。インデックス入力回路4630は、入力端子4650を介して、符号入力回路410から出力されるNsbv 個の量子化サブベクトルに対する形状コードベクトルおよび量子化ゲインのインデックスから構成されるインデックスのセットiを入力する。そして前記インデックスのセットiから、形状コードベクトルc0 [j](n),n=0,…,L−1を指定するインデックスisbs,0 と量子化ゲインg0[k]を指定するインデックスisbg,0 とを取り出し、isbs,0 をテーブル4610へ出力し、isbg,0 をゲイン回路4620へ出力する。テーブル4610には、c0 [j](n),n=0,…,L−1,j=0,…,Nc,0 −1が格納されている。テーブル4610は、インデックス入力回路4630から出されるインデックスisbs,0 を入力し、isbs,0 に対応する形状コードベクトルc0 [j](n),n=0,…,L−1,j=isbs,0 をゲイン回路4620へ出力する。ゲイン回路4620が備えているテーブルには、g0 [k],k=0,…,Ng,0 −1が格納されている。ゲイン回路4620は、テーブル4610から出力されるc0 [j](n),n=0,…,L−1,j=isbs,0 を入力し、インデックス入力回路4630から出力されるインデックスisbg,0 を入力し、isbg,0 に対応する量子化ゲインg0 [k],k=isbg,0 を前記テーブルより読み出し、c0 [j](n),n=0,…,L−1,j=isbg,0 とg0 [k],k=isbg,0 とを乗算して得られる量子化サブベクトルe′sb,0(n),n=0,…,L−1を全帯域ベクトル生成回路4640へ出力する。全帯域ベクトル生成回路4640は、ゲイン回路4620から出力される量子化サブベクトルe′sb,0(n),n=0,…,L−1を入力する。また、全帯域ベクトル生成回路4640は、e′sb,0(n),n=0,…,L−1と同様の処理で得られる、 Is decrypted. Since the decoding process for each quantization subvector is common, the process for e ′ sb , 0 (n), n = 0,..., L−1 will be described. Quantization subvector e 'sb, 0 (n) , n = 0, ..., L-1 , as well as the processing of the orthogonal transform coefficient quantizing circuit 260 in FIG. 1, the shape code vector c 0 [j] ( n), n = 0,..., L−1 and the quantization gain g 0 [k] . Here, j and k represent indexes. The index input circuit 4630 receives, via an input terminal 4650, an index set if composed of shape code vectors and quantization gain indices for the N sbv quantization subvectors output from the code input circuit 410. To do. The index that specifies the from the set i f of the index, the shape code vector c 0 [j] (n) , n = 0, ..., index i sbs, 0 and quantization gain g0 specifying the L-1 [k] i sbg , 0 is taken out, i sb s, 0 is output to the table 4610, and i sbg , 0 is output to the gain circuit 4620. The table 4610, c 0 [j] ( n), n = 0, ..., L-1, j = 0, ..., N c, 0 -1 is stored. The table 4610 receives the index i sbs , 0 output from the index input circuit 4630, and the shape code vector c 0 [j] (n), n = 0,..., L−1, j corresponding to i sbs , 0. = I sbs , 0 is output to the gain circuit 4620. The table provided in the gain circuit 4620 stores g 0 [k] , k = 0,..., N g, 0 −1. The gain circuit 4620 receives c 0 [j] (n), n = 0,..., L−1, j = i sbs , 0 output from the table 4610, and the index i output from the index input circuit 4630. sbg, 0 type a, i sbg, 0 corresponding to the quantized gain g 0 [k], k = i sbg, 0 read from the table, c 0 [j] (n ), n = 0, ..., Quantized subvector e ′ sb , 0 (n), n = 0,..., L obtained by multiplying L−1, j = i sbg , 0 and g 0 [k] , k = i sbg , 0 −1 is output to the full-band vector generation circuit 4640. The full-band vector generation circuit 4640 receives the quantized subvector e ′ sb , 0 (n), n = 0,..., L−1 output from the gain circuit 4620. The all-band vector generation circuit 4640 is obtained by the same processing as e ′ sb , 0 (n), n = 0,..., L−1.

Figure 0004293005
Figure 0004293005

を入力する。そして図17に示すように、
前記Nsbv 個の量子化サブベクトル
Enter. And as shown in FIG.
The N sbv quantization subvectors

Figure 0004293005
Figure 0004293005

を、図1の帯域選択回路250において規定される第2の帯域に配置し、前記第2の帯域以外には零ベクトルを配置することにより、全帯域(例えば、再生信号のサンプリング周波数が16kHzのときは、8kHz帯域)に相当する第2の励振ベクトルを生成し、これを出力端子4660を介して直交逆変換回路440へ出力する。 1 is arranged in the second band defined by the band selection circuit 250 in FIG. 1, and a zero vector is arranged in addition to the second band, so that the whole band (for example, the sampling frequency of the reproduction signal is 16 kHz). 2), a second excitation vector corresponding to the 8 kHz band) is generated and output to the orthogonal inverse transform circuit 440 via the output terminal 4660.

直交逆変換回路440は、直交変換係数逆量子化回路460から出力される第2の励振ベクトルを入力し、前記第2の励振ベクトルを直交逆変換し、第3の励振ベクトルを得る。そして前記第3の励振ベクトルを線形予測合成フィルタ131へ出力する。ここで、直交逆変換としては、離散コサイン逆変換(Inverse Discrete Cosine Transform, IDCT )を用いることができる。 The orthogonal inverse transform circuit 440 receives the second excitation vector output from the orthogonal transform coefficient inverse quantization circuit 460 and orthogonally inverse transforms the second excitation vector to obtain a third excitation vector. Then, the third excitation vector is output to the linear prediction synthesis filter 131. Here, as the inverse orthogonal transform, an inverse discrete cosine transform (IDCT) can be used.

線形予測合成フィルタ130は、量子化線形予測係数が格納されたテーブルを備えている。線形予測合成フィルタ130は、第1の帯域通過フィルタ120から出力される第1の励振ベクトルと符号入力回路410から出力される量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された合成フィルタ1/A(z)を、前記第1の励振ベクトルにより駆動することで、第1の再生ベクトルを得る。そして前記第1の再生ベクトルを加算器182へ出力する。 The linear prediction synthesis filter 130 includes a table in which quantized linear prediction coefficients are stored. The linear prediction synthesis filter 130 receives the first excitation vector output from the first bandpass filter 120 and the index corresponding to the quantized linear prediction coefficient output from the code input circuit 410. In addition, the quantized linear prediction coefficient corresponding to the index is read from the table, and the synthesis filter 1 / A (z) in which the quantized linear prediction coefficient is set is driven by the first excitation vector. To obtain a first reproduction vector. Then, the first reproduction vector is output to the adder 182.

線形予測合成フィルタ131は、量子化線形予測係数が格納されたテーブルを備えている。線形予測合成フィルタ131は、直交逆変換回路440から出力される第3の励振ベクトルと符号入力回路410から出力される量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する量子化線形予測係数を、前記テーブルより読み出し、この量子化線形予測係数が設定された合成フィルタ1/A(z)を、前記第3の励振ベクトルにより駆動することで、第2の再生ベクトルを得る。そして前記第2の再生ベクトルを加算器182へ出力する。 The linear prediction synthesis filter 131 includes a table in which quantized linear prediction coefficients are stored. The linear prediction synthesis filter 131 receives the third excitation vector output from the orthogonal inverse transform circuit 440 and the index corresponding to the quantized linear prediction coefficient output from the code input circuit 410. In addition, the quantized linear prediction coefficient corresponding to the index is read from the table, and the synthesis filter 1 / A (z) in which the quantized linear prediction coefficient is set is driven by the third excitation vector. Then, a second reproduction vector is obtained. Then, the second reproduction vector is output to the adder 182.

加算器182は、線形予測合成フィルタ130から出力される第1の再生ベクトルと、線形予測合成フィルタ131から出力される第2の再生ベクトルとを入力し、これらの和を計算し、これを第3の再生ベクトルとして、出力端子40を介して、出力する。 The adder 182 inputs the first reproduction vector output from the linear prediction synthesis filter 130 and the second reproduction vector output from the linear prediction synthesis filter 131, calculates the sum of these, 3 as the reproduction vector 3 through the output terminal 40.

図16を用いて説明した第9の実施例は、帯域数が2の場合であるが、帯域数を3以上に拡張した場合について以下で説明する。 The ninth embodiment described with reference to FIG. 16 is a case where the number of bands is 2, but a case where the number of bands is expanded to 3 or more will be described below.

図16は、図19のように書き直すことができる。ここで、図19の第1の復号回路1051は、図20と等価であり、図19の第2の復号回路1052は、図21と等価であり、図20、図21を構成する各ブロックは、図16で説明した各ブロックと同じである。 FIG. 16 can be rewritten as shown in FIG. Here, the first decoding circuit 1051 in FIG. 19 is equivalent to FIG. 20, the second decoding circuit 1052 in FIG. 19 is equivalent to FIG. 21, and each block constituting FIG. 20 and FIG. This is the same as each block described in FIG.

本発明の第10の実施例は、第9の実施例において帯域数を3に拡張することで実現される。本発明の第10の実施例による音声音楽信号復号装置の構成は、図22に示すブロック図で表すことができる。ここで、第1の復号回路1051は図20と等価であり、第2の復号回路1052は図20と等価であり、第3の復号回路1053は図21と等価である。符号入力回路4101は、入力端子30から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第1の復号回路1051、第2の復号回路1052および第3の復号回路1053へ出力し、音源ベクトルとゲインに対応するインデックスを第1の復号回路1051および第2の復号回路1052へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第3の復号回路1053へ出力する。 The tenth embodiment of the present invention is realized by extending the number of bands to 3 in the ninth embodiment. The configuration of the speech and music signal decoding apparatus according to the tenth embodiment of the present invention can be represented by the block diagram shown in FIG. Here, the first decoding circuit 1051 is equivalent to FIG. 20, the second decoding circuit 1052 is equivalent to FIG. 20, and the third decoding circuit 1053 is equivalent to FIG. The code input circuit 4101 converts the code of the bit sequence input from the input terminal 30 into an index, and converts the index corresponding to the quantized linear prediction coefficient to the first decoding circuit 1051, the second decoding circuit 1052, and the third decoding. An output corresponding to the sound source vector and the gain is output to the first decoding circuit 1051 and the second decoding circuit 1052, and a set of the index corresponding to the shape code vector and the quantization gain for the subvector is output to the circuit 1053. 3 to the decoding circuit 1053.

本発明の第11の実施例は、第9の実施例において帯域数をNに拡張することで実現される。本発明の第11の実施例による音声音楽信号復号装置の構成は、図23に示すブロック図で表すことができる。ここで、第1の復号回路1051から第N−1の復号回路1054の各々は図20と等価であり、第Nの復号回路1055は図21と等価である。符号入力回路4102は、入力端子30から入力したビット系列の符号をインデックスに変換し量子化線形予測係数に対応するインデックスを第1の復号回路1051から第N−1の復号回路1054および第Nの復号回路1055の各々へ出力し、音源ベクトルとゲインに対応するインデックスを第1の復号回路1051から第N−1の復号回路1054の各々へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第Nの復号回路1055へ出力する。 The eleventh embodiment of the present invention is realized by expanding the number of bands to N in the ninth embodiment. The configuration of the speech and music signal decoding apparatus according to the eleventh embodiment of the present invention can be represented by the block diagram shown in FIG. Here, each of the first decoding circuit 1051 to the (N-1) th decoding circuit 1054 is equivalent to FIG. 20, and the Nth decoding circuit 1055 is equivalent to FIG. The code input circuit 4102 converts the code of the bit sequence input from the input terminal 30 into an index, and converts the index corresponding to the quantized linear prediction coefficient from the first decoding circuit 1051 to the (N−1) -th decoding circuit 1054 and the N-th decoding circuit. Output to each of the decoding circuits 1055, and output the sound source vector and the index corresponding to the gain from each of the first decoding circuit 1051 to each of the (N-1) th decoding circuits 1054, and convert the shape code vector and quantization gain for the subvector. The corresponding set of indexes is output to the Nth decoding circuit 1055.

第9の実施例では、図19における第1の復号回路1051がA−b−S法を用いた符号化方式に対応する復号方式に基づいているが、第1の復号回路1051に対して、A−b−S法以外の符号化方式に対応する復号方式を適用することもできる。以下では、時間周波数変換を用いた符号化方式に対応する復号方式を第1の復号回路1051に対して適用した場合について説明する。 In the ninth embodiment, the first decoding circuit 1051 in FIG. 19 is based on a decoding method corresponding to an encoding method using the Abs method, but for the first decoding circuit 1051, A decoding method corresponding to an encoding method other than the Abs method can also be applied. Below, the case where the decoding system corresponding to the encoding system using time frequency conversion is applied with respect to the 1st decoding circuit 1051 is demonstrated.

本発明の第12の実施例は、第9の実施例において時間周波数変換を用いた符号化方式に対応する復号方式を適用することで実現される。本発明の第12の実施例による音声音楽信号復号装置の構成は、図24に示すブロック図で表すことができる。ここで、第1の復号回路1061は図21と等価であり、第2の復号回路1052は図21と等価である。符号入力回路4103は、入力端子30から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第1の復号回路1061および第2の復号
回路1052へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第1の復号回路1061および第2の復号回路1052へ出力する。
The twelfth embodiment of the present invention is realized by applying a decoding scheme corresponding to the encoding scheme using time-frequency conversion in the ninth embodiment. The configuration of the speech and music signal decoding apparatus according to the twelfth embodiment of the present invention can be represented by the block diagram shown in FIG. Here, the first decoding circuit 1061 is equivalent to FIG. 21, and the second decoding circuit 1052 is equivalent to FIG. The code input circuit 4103 converts the code of the bit sequence input from the input terminal 30 into an index, outputs the index corresponding to the quantized linear prediction coefficient to the first decoding circuit 1061 and the second decoding circuit 1052, and A set of indexes corresponding to the shape code vector and the quantization gain for the vector is output to first decoding circuit 1061 and second decoding circuit 1052.

本発明の第13の実施例は、第12の実施例において帯域数を3に拡張することで実現される。本発明の第13の実施例による音声音楽信号復号装置の構成は、図25に示すブロック図で表すことができる。ここで、第1の復号回路1061は図21と等価であり、第2の復号回路1062は図21と等価であり、第3の復号回路1053は図21と等価である。符号入力回路4104は、入力端子30から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第1の復号回路1061、第2の復号回路1062および第3の復号回路1053へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第1の復号回路1061、第2の復号回路1062および第3の復号回路1053へ出力する。 The thirteenth embodiment of the present invention is realized by expanding the number of bands to three in the twelfth embodiment. The configuration of the speech and music signal decoding apparatus according to the thirteenth embodiment of the present invention can be represented by the block diagram shown in FIG. Here, the first decoding circuit 1061 is equivalent to FIG. 21, the second decoding circuit 1062 is equivalent to FIG. 21, and the third decoding circuit 1053 is equivalent to FIG. The code input circuit 4104 converts the code of the bit sequence input from the input terminal 30 into an index, and converts the index corresponding to the quantized linear prediction coefficient to the first decoding circuit 1061, the second decoding circuit 1062, and the third decoding. The output to the circuit 1053 is output to the first decoding circuit 1061, the second decoding circuit 1062, and the third decoding circuit 1053, the set of indices corresponding to the shape code vector and the quantization gain for the subvector.

本発明の第14の実施例は、第12の実施例において帯域数をNに拡張することで実現される。本発明の第14の実施例による音声音楽信号復号装置の構成は、図26に示すブロック図で表すことができる。ここで、第1の復号回路1061から第N−1の復号回路1064の各々は図21と等価であり、第Nの復号回路1055は図21と等価である。符号入力回路4105は、入力端子30から入力したビット系列の符号をインデックスに変換し、量子化線形予測係数に対応するインデックスを第1の復号回路1061から第N−1の復号回路1064および第Nの復号回路1055の各々へ出力し、サブベクトルに対する形状コードベクトルおよび量子化ゲインに対応するインデックスのセットを第1の復号回路1061から第N−1の復号回路1064および第Nの復号回路1055の各々へ出力する。 The fourteenth embodiment of the present invention is realized by extending the number of bands to N in the twelfth embodiment. The configuration of the speech and music signal decoding apparatus according to the fourteenth embodiment of the present invention can be represented by the block diagram shown in FIG. Here, each of the first decoding circuit 1061 to the (N-1) th decoding circuit 1064 is equivalent to FIG. 21, and the Nth decoding circuit 1055 is equivalent to FIG. The code input circuit 4105 converts the code of the bit sequence input from the input terminal 30 into an index, and converts the index corresponding to the quantized linear prediction coefficient from the first decoding circuit 1061 to the (N−1) -th decoding circuit 1064 and the N-th decoding circuit. Are output to each of the first decoding circuit 1055, and a set of indexes corresponding to the shape code vector and the quantization gain for the sub-vector is obtained from the first decoding circuit 1061 to the (N−1) th decoding circuit 1064 and the Nth decoding circuit 1055. Output to each.

図27は、本発明の第15の実施例による、第7の実施例に対応する音声音楽信号復号装置の構成を示すブロック図である。図27において、図16の第9の実施例と異なるブロックは、記憶回路510、ピッチ信号生成回路112、第3のゲイン回路162、加算器184および符号入力回路610であるが、記憶回路510、ピッチ信号生成回路112、第3のゲイン回路162および加算器184は、図14と同様であるので説明を省略し、符号入力回路610について説明する。 FIG. 27 is a block diagram showing a configuration of a speech and music signal decoding apparatus corresponding to the seventh embodiment according to the fifteenth embodiment of the present invention. 27, the blocks different from the ninth embodiment of FIG. 16 are a storage circuit 510, a pitch signal generation circuit 112, a third gain circuit 162, an adder 184, and a sign input circuit 610. Since the pitch signal generation circuit 112, the third gain circuit 162, and the adder 184 are the same as those in FIG. 14, the description thereof will be omitted, and the code input circuit 610 will be described.

符号入力回路610は、入力端子30から入力したビット系列の符号をインデックスに変換する。第1の音源ベクトルに対応するインデックスは、第1の音源生成回路110へ出力される。遅延dに対応するインデックスは、ピッチ信号生成回路112へ出力される。第1のゲインに対応するインデックスは、第1のゲイン回路160へ出力される。第3のゲインに対応するインデックスは、第3のゲイン回路162へ出力される。量子化線形予測係数に対応するインデックスは、線形予測合成フィルタ130および線形予測合成フィルタ131へ出力される。サブベクトルに対する形状コードベクトルおよび量子化ゲインの各々に対応するインデックスをNsbv 個のサブベクトル分まとめたインデックスのセットは、直交変換係数逆量子化回路460へ出力される。 The code input circuit 610 converts the code of the bit sequence input from the input terminal 30 into an index. The index corresponding to the first sound source vector is output to the first sound source generation circuit 110. The index corresponding to the delay d is output to the pitch signal generation circuit 112. The index corresponding to the first gain is output to the first gain circuit 160. The index corresponding to the third gain is output to the third gain circuit 162. The index corresponding to the quantized linear prediction coefficient is output to the linear prediction synthesis filter 130 and the linear prediction synthesis filter 131. A set of indexes obtained by collecting indexes corresponding to each of the shape code vector and the quantization gain for the subvector for N sbv subvectors is output to orthogonal transform coefficient inverse quantization circuit 460.

図28は、本発明の第16の実施例による、第8の実施例に対応する音声音楽信号復号装置の構成を示すブロック図である。以下では、図27と異なるブロックである、符号入力回路810、第1の線形予測係数合成フィルタ132、アップサンプル回路781および第2の線形予測合成フィルタ831について説明する。 FIG. 28 is a block diagram showing a configuration of a speech and music signal decoding apparatus corresponding to the eighth embodiment according to the sixteenth embodiment of the present invention. Hereinafter, the code input circuit 810, the first linear prediction coefficient synthesis filter 132, the upsampling circuit 781, and the second linear prediction synthesis filter 831 which are different blocks from those in FIG. 27 will be described.

符号入力回路810は、入力端子30から入力したビット系列の符号をインデックスに変換する。第1の音源ベクトルに対応するインデックスは、第1の音源生成回路110へ出力される。遅延dに対応するインデックスは、ピッチ信号生成回路112へ出力される。第1のゲインに対応するインデックスは、第1のゲイン回路160へ出力される。第3のゲインに対応するインデックスは、第3のゲイン回路162へ出力される。第1の量子化線形予測係数に対応するインデックスは、第1の線形予測合成フィルタ132および第2の線形予測合成フィルタ831へ出力される。第3の量子化線形予測係数に対応するインデックスは、第2の線形予測合成フィルタ831へ出力される。サブベクトルに対する形状コードベクトルおよび量子化ゲインの各々に対応するインデックスをNsbv 個のサブベクトル分まとめたインデックスのセットは、直交変換係数逆量子化回路
460へ出力される。
The code input circuit 810 converts the code of the bit sequence input from the input terminal 30 into an index. The index corresponding to the first sound source vector is output to the first sound source generation circuit 110. The index corresponding to the delay d is output to the pitch signal generation circuit 112. The index corresponding to the first gain is output to the first gain circuit 160. The index corresponding to the third gain is output to the third gain circuit 162. The index corresponding to the first quantized linear prediction coefficient is output to the first linear prediction synthesis filter 132 and the second linear prediction synthesis filter 831. The index corresponding to the third quantized linear prediction coefficient is output to the second linear prediction synthesis filter 831. A set of indexes obtained by collecting indexes corresponding to each of the shape code vector and the quantization gain for the subvector for N sbv subvectors is output to orthogonal transform coefficient inverse quantization circuit 460.

第1の線形予測合成フィルタ132は、第1の量子化線形予測係数が格納されたテーブルを備えている。第1の線形予測合成フィルタ132は、加算器184から出力される第5の音源ベクトルと符号入力回路810から出力される第1の量子化線形予測係数に対応するインデックスとを入力する。また、前記インデックスに対応する第1の量子化線形予測係数を、前記テーブルより読み出し、前記第1の量子化線形予測係数が設定された合成フィルタを、前記第5の音源ベクトルにより駆動することで、第1の帯域を有する第1の再生ベクトルを得る。そして前記第1の再生ベクトルをアップサンプル回路781へ出力する。 The first linear prediction synthesis filter 132 includes a table in which the first quantized linear prediction coefficients are stored. The first linear prediction synthesis filter 132 receives the fifth excitation vector output from the adder 184 and the index corresponding to the first quantized linear prediction coefficient output from the code input circuit 810. Further, the first quantized linear prediction coefficient corresponding to the index is read from the table, and the synthesis filter in which the first quantized linear prediction coefficient is set is driven by the fifth excitation vector. Then, a first reproduction vector having a first band is obtained. Then, the first reproduction vector is output to the upsampling circuit 781.

アップサンプル回路781は、第1の線形予測合成フィルタ132から出力される第1の再生ベクトルを入力し、これをアップサンプルして第3の帯域を有する第3の再生ベクトルを得る。そして前記第3の再生ベクトルを第1の加算器182へ出力する。 The upsampling circuit 781 receives the first reproduction vector output from the first linear prediction synthesis filter 132 and upsamples it to obtain a third reproduction vector having a third band. The third reproduction vector is output to the first adder 182.

第2の線形予測合成フィルタ831は、第1の帯域を有する第1の量子化線形予測係数が格納された第1のテーブルと、第3の帯域を有する第3の量子化線形予測係数が格納された第2のテーブルとを備えている。第2の線形予測合成フィルタ831は、直交逆変換回路440から出力される第3の励振ベクトルと、符号入力回路810から出力される第1の量子化線形予測係数に対応する第1のインデックスと、第3の量子化線形予測係数に対応する第2のインデックスとを入力する。第2の線形予測合成フィルタ831は、前記第1のインデックスに対応する第1の量子化線形予測係数を前記第1のテーブルより読み出し、これをLSPに変換し、さらに、これをサンプリング周波数変換することで、第3の再生ベクトルのサンプリング周波数に対応する第1のLSPを得る。次に、前記第2のインデックスに対応する第3の量子化線形予測係数を、前記第2のテーブルより読み出し、これをLSPに変換し、第3のLSPを得る。そして前記第1のLSPと前記第3のLSPとを加算して得られる第2のLSPを、線形予測係数に変換し、第2の線形予測係数を得る。第2の線形予測合成フィルタ831は、前記第2の線形予測係数が設定された合成フィルタを、前記第3の励振ベクトルにより駆動することで、第3の帯域を有する第2の再生ベクトルを得る。そして前記第2の再生ベクトルを加算器182へ出力する。 The second linear prediction synthesis filter 831 stores a first table storing a first quantized linear prediction coefficient having a first band and a third quantized linear prediction coefficient having a third band. The second table is provided. The second linear prediction synthesis filter 831 includes a third excitation vector output from the orthogonal inverse transform circuit 440 and a first index corresponding to the first quantized linear prediction coefficient output from the code input circuit 810. , And the second index corresponding to the third quantized linear prediction coefficient. The second linear prediction synthesis filter 831 reads the first quantized linear prediction coefficient corresponding to the first index from the first table, converts it to LSP, and further converts this to the sampling frequency. Thus, the first LSP corresponding to the sampling frequency of the third reproduction vector is obtained. Next, the third quantized linear prediction coefficient corresponding to the second index is read from the second table and converted into an LSP to obtain a third LSP. Then, the second LSP obtained by adding the first LSP and the third LSP is converted into a linear prediction coefficient to obtain a second linear prediction coefficient. The second linear prediction synthesis filter 831 obtains a second reproduction vector having a third band by driving the synthesis filter in which the second linear prediction coefficient is set with the third excitation vector. . Then, the second reproduction vector is output to the adder 182.

加算器182は、アップサンプル回路781から出力される第3の再生ベクトルと、第2の線形予測合成フィルタ831から出力される第2の再生ベクトルを入力し、これらの和を計算し、これを第4の再生ベクトルとして、出力端子40を介して、出力する。 The adder 182 inputs the third reproduction vector output from the upsampling circuit 781 and the second reproduction vector output from the second linear prediction synthesis filter 831, calculates the sum of these, The fourth reproduction vector is output via the output terminal 40.

本発明の第1の実施例による音声音楽信号符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal encoding apparatus by 1st Example of this invention. 第1の音源生成回路110の構成を示すブロック図である。2 is a block diagram showing a configuration of a first sound source generation circuit 110. FIG. 帯域選択回路250においてサブベクトル生成する方法を説明するための図である。6 is a diagram for explaining a method of generating a subvector in band selection circuit 250. FIG. 直交変換係数量子化回路260の構成を示すブロック図である。3 is a block diagram showing a configuration of an orthogonal transform coefficient quantization circuit 260. FIG. 本発明の第1の実施例による音声音楽信号符号化装置の構成を示す、図1と等価なブロック図である。It is a block diagram equivalent to FIG. 1 which shows the structure of the audio | voice music signal encoding apparatus by 1st Example of this invention. 図5における第1の符号化回路1001の構成を示すブロック図である。FIG. 6 is a block diagram showing a configuration of a first encoding circuit 1001 in FIG. 5. 図5における第2の符号化回路1002の構成を示すブロック図である。FIG. 6 is a block diagram showing a configuration of a second encoding circuit 1002 in FIG. 5. 本発明の第2の実施例による音声音楽信号符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal encoding apparatus by the 2nd Example of this invention. 本発明の第3の実施例による音声音楽信号符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal encoding apparatus by the 3rd Example of this invention. 図11における第1の符号化回路1011の構成を示すブロック図である。FIG. 12 is a block diagram showing a configuration of a first encoding circuit 1011 in FIG. 11. 本発明の第4の実施例による音声音楽信号符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal encoding apparatus by the 4th Example of this invention. 本発明の第5の実施例による音声音楽信号符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal encoding apparatus by the 5th Example of this invention. 本発明の第6の実施例による音声音楽信号符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal encoding apparatus by the 6th Example of this invention. 本発明の第7の実施例による音声音楽信号符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal encoding apparatus by the 7th Example of this invention. 本発明の第8の実施例による音声音楽信号符号化装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal encoding apparatus by the 8th Example of this invention. 本発明の第9の実施例による音声音楽信号復号装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal decoding apparatus by the 9th Example of this invention. 直交変換係数逆量子化回路460において第2の励振ベクトル生成する方法を説明するための図である。It is a figure for demonstrating the method to produce | generate a 2nd excitation vector in the orthogonal transformation coefficient inverse quantization circuit 460. FIG. 直交変換係数逆量子化回路460の構成を示すブロック図である。4 is a block diagram showing a configuration of an orthogonal transform coefficient inverse quantization circuit 460. FIG. 本発明の第9の実施例による音声音楽信号復号装置の構成を示す、図16と等価なブロック図である。It is a block diagram equivalent to FIG. 16 which shows the structure of the audio | voice music signal decoding apparatus by the 9th Example of this invention. 図19における第1の復号回路1051の構成を示すブロック図である。FIG. 20 is a block diagram illustrating a configuration of a first decoding circuit 1051 in FIG. 19. 図19における第2の復号回路1052の構成を示すブロック図である。FIG. 20 is a block diagram illustrating a configuration of a second decoding circuit 1052 in FIG. 19. 本発明の第10の実施例による音声音楽信号復号装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal decoding apparatus by the 10th Example of this invention. 本発明の第11の実施例による音声音楽信号復号装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal decoding apparatus by 11th Example of this invention. 本発明の第12の実施例による音声音楽信号復号装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal decoding apparatus by the 12th Example of this invention. 本発明の第13の実施例による音声音楽信号復号装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal decoding apparatus by the 13th Example of this invention. 本発明の第14の実施例による音声音楽信号復号装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal decoding apparatus by the 14th Example of this invention. 本発明の第15の実施例による音声音楽信号復号装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal decoding apparatus by 15th Example of this invention. 本発明の第16の実施例による音声音楽信号復号装置の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice music signal decoding apparatus by the 16th Example of this invention. 符号出力回路290における、インデックスとビット系列の符号との対応を説明するための図である。FIG. 10 is a diagram for explaining a correspondence between an index and a bit sequence code in a code output circuit 290; ピッチ信号生成回路112において、第1のピッチベクトルを生成する方法を説明するための図である。6 is a diagram for explaining a method of generating a first pitch vector in the pitch signal generation circuit 112. FIG. 従来法による音声音楽信号符号化装置の実施の形態を示すブロック図である。It is a block diagram which shows embodiment of the audio | voice music signal encoding apparatus by a conventional method. 従来法による音声音楽信号復号装置の実施の形態を示すブロック図である。It is a block diagram which shows embodiment of the audio | voice music signal decoding apparatus by a conventional method.

符号の説明Explanation of symbols

10,30 入力端子
20,40 出力端子
110 第1の音源生成回路
111 第2の音源生成回路
160 第1のゲイン回路
161 第2のゲイン回路
120 第1の帯域通過フィルタ
121 第2の帯域通過フィルタ
182,184 加算器
180 第1の差分器
181 第2の差分器
183 第3の差分器
170 線形予測係数計算回路
770 第1の線形予測係数計算回路
771 第2の線形予測係数計算回路
772 第3の線形予測係数計算回路
130 線形予測合成フィルタ
131 線形予測合成フィルタ
132 第1の線形予測合成フィルタ
831 第2の線形予測合成フィルタ
140 重みづけフィルタ
141 重みづけフィルタ
150,550 第1の最小化回路
151 第2の最小化回路
230,730 線形予測逆フィルタ
240 直交変換回路
250 帯域選択回路
260 直交変換係数量子化回路
440 直交逆変換回路
460 直交変換係数逆量子化回路
190,290,590,790 符号出力回路
310,410,610,810 符号入力回路
780 ダウンサンプル回路
781 アップサンプル回路
510 記憶回路
112 ピッチ信号生成回路
162 第3のゲイン回路
1101 テーブル
1102 スイッチ
1103 入力端子
1104 出力端子
2650,2651 入力端子
2610,2611 テーブル
2620,2621 ゲイン回路
2630,2631 最小化回路
2640,2641 差分器
2660 インデックス出力回路
2670 出力端子
1001,1011 第1の符号化回路
1002,1012 第2の符号化回路
1003 第3の符号化回路
1004,1014 第N−1の符号化回路
1005 第Nの符号化回路
2901,2902,2903,2904,2905 符号出力回路
1801,1802 差分器
4610,4611 テーブル
4620,4621 ゲイン回路
4630 インデックス入力回路
4640 全帯域ベクトル生成回路
4650 入力端子
4660 出力端子
1051,1061 第1の復号回路
1052,1062 第2の復号回路
1053 第3の復号回路
1054,1064 第N−1の復号回路
1055 第Nの復号回路
4101,4102,4103,4104,4105 符号入力回路
1821,1822 加算器
10, 30 Input terminal 20, 40 Output terminal 110 First sound generator circuit 111 Second sound generator circuit 160 First gain circuit 161 Second gain circuit 120 First band pass filter 121 Second band pass filter 182, 184 Adder 180 First differencer 181 Second differencer 183 Third differencer 170 Linear prediction coefficient calculation circuit 770 First linear prediction coefficient calculation circuit 771 Second linear prediction coefficient calculation circuit 772 Third Linear prediction coefficient calculation circuit 130 linear prediction synthesis filter 131 linear prediction synthesis filter 132 first linear prediction synthesis filter 831 second linear prediction synthesis filter 140 weighting filter 141 weighting filters 150 and 550 first minimizing circuit 151 Second minimizing circuits 230 and 730 linear prediction inverse filter 240 orthogonal transform circuit 250 Area selection circuit 260 Orthogonal transform coefficient quantization circuit 440 Orthogonal inverse transform circuit 460 Orthogonal transform coefficient inverse quantization circuit 190, 290, 590, 790 Code output circuit 310, 410, 610, 810 Code input circuit 780 Downsample circuit 781 Upsample Circuit 510 Memory circuit 112 Pitch signal generation circuit 162 Third gain circuit 1101 Table 1102 Switch 1103 Input terminal 1104 Output terminal 2650, 2651 Input terminal 2610, 2611 Table 2620, 2621 Gain circuit 2630, 2631 Minimization circuit 2640, 2641 Differentiator 2660 Index output circuit 2670 Output terminals 1001 and 1011 First encoding circuit 1002 and 1012 Second encoding circuit 1003 Third encoding circuit 1004 and 1014 N-1th encoding time 1005 Nth encoding circuit 2901, 2902, 2903, 2904, 2905 Code output circuit 1801, 1802 Differentiator 4610, 4611 Table 4620, 4621 Gain circuit 4630 Index input circuit 4640 Full-band vector generation circuit 4650 Input terminal 4660 Output terminal 1051 , 1061 First decoding circuit 1052, 1062 Second decoding circuit 1053 Third decoding circuit 1054, 1064 N-1 decoding circuit 1055 Nth decoding circuit 4101, 4102, 4103, 4104, 4105 Code input circuit 1821 , 1822 Adder

Claims (6)

第1のサンプリング周波数でサンプリングされた第1の入力信号を受け、
前記第1の入力信号を第2のサンプリング周波数にダウンサンプリングして第2の入力信号を生成し、
前記第2の入力信号から第2のサンプリング周波数の第1の線形予測係数を求め、
前記第1の線形予測係数が設定された合成フィルタを駆動して前記第2の入力信号に対応する第1の再生信号を生成するための前記第2のサンプリング周波数の第1の励振信号を求め、
前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより第2の再生信号を生成し、
前記第1の入力信号から求めた線形予測係数に対応する周波数領域パラメータと前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数に対応する周波数領域パラメータとの差分から第3の線形予測係数を求め、
前記第2の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとの和から第4の線形予測係数を求め、
前記第1の入力信号と前記第2の再生信号との差分信号により前記第4の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成し、
前記残差信号を直交変換し、
前記直交変換された残差信号の少なくとも一部の帯域に対応する成分と前記第1の線形予測係数と前記第3の線形予測係数と前記励振信号とを出力することを特徴とする音声音楽信号符号化装置。
Receiving a first input signal sampled at a first sampling frequency;
Down-sampling the first input signal to a second sampling frequency to generate a second input signal;
Obtaining a first linear prediction coefficient of a second sampling frequency from the second input signal;
A first excitation signal having the second sampling frequency for generating a first reproduction signal corresponding to the second input signal by driving a synthesis filter in which the first linear prediction coefficient is set is obtained. ,
Generating a second reproduction signal by up-sampling the first reproduction signal to the first sampling frequency;
A frequency domain parameter corresponding to a linear prediction coefficient obtained from the first input signal and a frequency corresponding to a second linear prediction coefficient obtained by converting the first linear prediction coefficient into a first sampling frequency by sampling frequency conversion. A third linear prediction coefficient is obtained from the difference from the region parameter,
Obtaining a fourth linear prediction coefficient from a sum of a frequency domain parameter corresponding to the second linear prediction coefficient and a frequency domain parameter corresponding to the third linear prediction coefficient;
A residual signal is generated by driving an inverse filter in which the fourth linear prediction coefficient is set by a difference signal between the first input signal and the second reproduction signal;
Orthogonally transform the residual signal;
A speech music signal characterized by outputting a component corresponding to at least a part of a band of the orthogonally transformed residual signal, the first linear prediction coefficient, the third linear prediction coefficient, and the excitation signal. Encoding device.
第1のサンプリング周波数でサンプリングされた前記第1の入力信号を第2のサンプリング周波数にダウンサンプリングして生成された第2の入力信号から求められる第2のサンプリング周波数の第1の線形予測係数と、前記第1の線形予測係数が設定された合成フィルタを駆動して前記第2の入力信号に対応する第1の再生信号を生成するために求められた前記第2のサンプリング周波数の第1の励振信号と、前記第1の入力信号から求められた線形予測係数に対応する周波数領域パラメータと前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数に対応する周波数領域パラメータとの差分から求められた第3の線形予測係数と、前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより生成された第2の再生信号と前記前記第1の入力信号との差分信号により前記第2の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとの和から求められた第4の線形予測係数が設定された逆フィルタを駆動することで生成された前記残差信号を直交変換して得られる直交変換後残差信号の少なくとも一部の帯域に対応する成分とを含む信号を受け、
前記第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を前記第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、
直交変換後残差信号の少なくとも一部の帯域に対応する成分を直交逆変換することにより第1のサンプリング周波数の第2の励振信号を生成し、
前記第1の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとを加算して得られる信号が設定された第2の線形予測合成フィルタを前記第2の励振信号により駆動することで第2の再生信号を生成し、
前記第1の再生信号と前記第2の再生信号とを加算することで音声音楽信号を生成することを特徴とする音声音楽信号復号装置。
A first linear prediction coefficient of a second sampling frequency obtained from a second input signal generated by down-sampling the first input signal sampled at a first sampling frequency to a second sampling frequency; The first sampling frequency of the second sampling frequency obtained for driving the synthesis filter in which the first linear prediction coefficient is set to generate the first reproduction signal corresponding to the second input signal. A second linear prediction obtained by sampling frequency conversion of the excitation signal, the frequency domain parameter corresponding to the linear prediction coefficient obtained from the first input signal, and the first linear prediction coefficient into a first sampling frequency A third linear prediction coefficient obtained from the difference from the frequency domain parameter corresponding to the coefficient, and the first reproduction signal as the first sampling frequency. A frequency domain parameter corresponding to the second linear prediction coefficient and the third linear prediction coefficient based on a difference signal between the second reproduction signal generated by up-sampling to a number and the first input signal. Of the residual signal after orthogonal transformation obtained by orthogonal transformation of the residual signal generated by driving the inverse filter in which the fourth linear prediction coefficient obtained from the sum with the corresponding frequency domain parameter is set Receiving a signal including a component corresponding to at least a part of the band;
A first reproduction signal is generated by up-sampling a signal obtained by driving a first linear prediction synthesis filter with the first excitation signal to the first sampling frequency;
Generating a second excitation signal having a first sampling frequency by performing orthogonal inverse transformation on a component corresponding to at least a part of the band of the residual signal after orthogonal transformation;
A second linear prediction synthesis filter in which a signal obtained by adding a frequency domain parameter corresponding to the first linear prediction coefficient and a frequency domain parameter corresponding to the third linear prediction coefficient is set; A second reproduction signal is generated by driving with the excitation signal of
A speech and music signal decoding apparatus, wherein a speech and music signal is generated by adding the first reproduction signal and the second reproduction signal.
直交変換された残差信号の少なくとも一部の帯域に対応する成分と第2のサンプリング周波数の第1の線形予測係数と第1のサンプリング周波数の第3の線形予測係数と第2のサンプリング周波数の第1の励振信号とを含む信号を受け、
前記第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を前記第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、
直交変換後残差信号の少なくとも一部の帯域に対応する成分を直交逆変換することにより第1のサンプリング周波数の第2の励振信号を生成し、
前記第1の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとを加算して得られる信号が設定された第2の線形予測合成フィルタを前記第2の励振信号により駆動することで第2の再生信号を生成し、
前記第1の再生信号と前記第2の再生信号とを加算することで音声音楽信号を生成することを特徴とする音声音楽信号復号装置。
The component corresponding to at least a part of the band of the orthogonally transformed residual signal, the first linear prediction coefficient of the second sampling frequency, the third linear prediction coefficient of the first sampling frequency, and the second sampling frequency Receiving a signal including a first excitation signal;
A first reproduction signal is generated by up-sampling a signal obtained by driving a first linear prediction synthesis filter with the first excitation signal to the first sampling frequency;
Generating a second excitation signal having a first sampling frequency by performing orthogonal inverse transformation on a component corresponding to at least a part of the band of the residual signal after orthogonal transformation;
A second linear prediction synthesis filter in which a signal obtained by adding a frequency domain parameter corresponding to the first linear prediction coefficient and a frequency domain parameter corresponding to the third linear prediction coefficient is set; A second reproduction signal is generated by driving with the excitation signal of
A speech and music signal decoding apparatus, wherein a speech and music signal is generated by adding the first reproduction signal and the second reproduction signal.
第1のサンプリング周波数でサンプリングされた第1の入力信号を受け、
前記第1の入力信号を第2のサンプリング周波数にダウンサンプリングして第2の入力信号を生成し、
前記第2の入力信号から第2のサンプリング周波数の第1の線形予測係数を求め、
前記第1の線形予測係数が設定された合成フィルタを駆動して前記第2の入力信号に対応する第1の再生信号を生成するための前記第2のサンプリング周波数の第1の励振信号を求め、
前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより第2の再生信号を生成し、
前記第1の入力信号から求めた線形予測係数に対応する周波数領域パラメータと前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数に対応する周波数領域パラメータとの差分から第3の線形予測係数を求め、
前記第2の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとの和から第4の線形予測係数を求め、
前記第1の入力信号と前記第2の再生信号との差分信号により前記第4の線形予測係数が設定された逆フィルタを駆動することで残差信号を生成し、
前記残差信号を直交変換し、
前記直交変換された残差信号の少なくとも一部の帯域に対応する成分と前記第1の線形予測係数と前記第3の線形予測係数と前記励振信号とを出力することを特徴とする音声音楽信号符号化方法。
Receiving a first input signal sampled at a first sampling frequency;
Down-sampling the first input signal to a second sampling frequency to generate a second input signal;
Obtaining a first linear prediction coefficient of a second sampling frequency from the second input signal;
A first excitation signal having the second sampling frequency for generating a first reproduction signal corresponding to the second input signal by driving a synthesis filter in which the first linear prediction coefficient is set is obtained. ,
Generating a second reproduction signal by up-sampling the first reproduction signal to the first sampling frequency;
A frequency domain parameter corresponding to a linear prediction coefficient obtained from the first input signal and a frequency corresponding to a second linear prediction coefficient obtained by converting the first linear prediction coefficient into a first sampling frequency by sampling frequency conversion. A third linear prediction coefficient is obtained from the difference from the region parameter,
Obtaining a fourth linear prediction coefficient from a sum of a frequency domain parameter corresponding to the second linear prediction coefficient and a frequency domain parameter corresponding to the third linear prediction coefficient;
A residual signal is generated by driving an inverse filter in which the fourth linear prediction coefficient is set by a difference signal between the first input signal and the second reproduction signal;
Orthogonally transform the residual signal;
A speech music signal characterized by outputting a component corresponding to at least a part of a band of the orthogonally transformed residual signal, the first linear prediction coefficient, the third linear prediction coefficient, and the excitation signal. Encoding method.
第1のサンプリング周波数でサンプリングされた前記第1の入力信号を第2のサンプリング周波数にダウンサンプリングして生成された第2の入力信号から求められる第2のサンプリング周波数の第1の線形予測係数と、前記第1の線形予測係数が設定された合成フィルタを駆動して前記第2の入力信号に対応する第1の再生信号を生成するために求められた前記第2のサンプリング周波数の第1の励振信号と、前記第1の入力信号から求められた線形予測係数に対応する周波数領域パラメータと前記第1の線形予測係数を第1のサンプリング周波数にサンプリング周波数変換して得られる第2の線形予測係数に対応する周波数領域パラメータとの差分から求められた第3の線形予測係数と、前記第1の再生信号を前記第1のサンプリング周波数にアップサンプリングすることにより生成された第2の再生信号と前記前記第1の入力信号との差分信号により前記第2の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとの和から求められた第4の線形予測係数が設定された逆フィルタを駆動することで生成された前記残差信号を直交変換して得られる直交変換後残差信号の少なくとも一部の帯域に対応する成分とを含む信号を受け、
前記第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を前記第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、
直交変換後残差信号の少なくとも一部の帯域に対応する成分を直交逆変換することにより第1のサンプリング周波数の第2の励振信号を生成し、
前記第1の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとを加算して得られる信号が設定された第2の線形予測合成フィルタを前記第2の励振信号により駆動することで第2の再生信号を生成し、
前記第1の再生信号と前記第2の再生信号とを加算することで音声音楽信号を生成することを特徴とする音声音楽信号復号方法。
A first linear prediction coefficient of a second sampling frequency obtained from a second input signal generated by down-sampling the first input signal sampled at a first sampling frequency to a second sampling frequency; The first sampling frequency of the second sampling frequency obtained for driving the synthesis filter in which the first linear prediction coefficient is set to generate the first reproduction signal corresponding to the second input signal. A second linear prediction obtained by sampling frequency conversion of the excitation signal, the frequency domain parameter corresponding to the linear prediction coefficient obtained from the first input signal, and the first linear prediction coefficient into a first sampling frequency A third linear prediction coefficient obtained from the difference from the frequency domain parameter corresponding to the coefficient, and the first reproduction signal as the first sampling frequency. A frequency domain parameter corresponding to the second linear prediction coefficient and the third linear prediction coefficient based on a difference signal between the second reproduction signal generated by up-sampling to a number and the first input signal. Of the residual signal after orthogonal transformation obtained by orthogonal transformation of the residual signal generated by driving the inverse filter in which the fourth linear prediction coefficient obtained from the sum with the corresponding frequency domain parameter is set Receiving a signal including a component corresponding to at least a part of the band;
A first reproduction signal is generated by up-sampling a signal obtained by driving a first linear prediction synthesis filter with the first excitation signal to the first sampling frequency;
Generating a second excitation signal having a first sampling frequency by performing orthogonal inverse transformation on a component corresponding to at least a part of the band of the residual signal after orthogonal transformation;
A second linear prediction synthesis filter in which a signal obtained by adding a frequency domain parameter corresponding to the first linear prediction coefficient and a frequency domain parameter corresponding to the third linear prediction coefficient is set; A second reproduction signal is generated by driving with the excitation signal of
A speech and music signal decoding method, wherein a speech and music signal is generated by adding the first reproduction signal and the second reproduction signal.
直交変換された残差信号の少なくとも一部の帯域に対応する成分と第2のサンプリング周波数の第1の線形予測係数と第1のサンプリング周波数の第3の線形予測係数と第2のサンプリング周波数の第1の励振信号とを含む信号を受け、
前記第1の励振信号により第1の線形予測合成フィルタを駆動して得られる信号を前記第1のサンプリング周波数にアップサンプリングして第1の再生信号を生成し、
直交変換後残差信号の少なくとも一部の帯域に対応する成分を直交逆変換することにより第1のサンプリング周波数の第2の励振信号を生成し、
前記第1の線形予測係数に対応する周波数領域パラメータと前記第3の線形予測係数に対応する周波数領域パラメータとを加算して得られる信号が設定された第2の線形予測合成フィルタを前記第2の励振信号により駆動することで第2の再生信号を生成し、
前記第1の再生信号と前記第2の再生信号とを加算することで音声音楽信号を生成することを特徴とする音声音楽信号復号方法。
The component corresponding to at least a part of the band of the orthogonally transformed residual signal, the first linear prediction coefficient of the second sampling frequency, the third linear prediction coefficient of the first sampling frequency, and the second sampling frequency Receiving a signal including a first excitation signal;
A first reproduction signal is generated by up-sampling a signal obtained by driving a first linear prediction synthesis filter with the first excitation signal to the first sampling frequency;
Generating a second excitation signal having a first sampling frequency by performing orthogonal inverse transformation on a component corresponding to at least a part of the band of the residual signal after orthogonal transformation;
A second linear prediction synthesis filter in which a signal obtained by adding a frequency domain parameter corresponding to the first linear prediction coefficient and a frequency domain parameter corresponding to the third linear prediction coefficient is set; A second reproduction signal is generated by driving with the excitation signal of
A speech and music signal decoding method, wherein a speech and music signal is generated by adding the first reproduction signal and the second reproduction signal.
JP2004027981A 2004-02-04 2004-02-04 Speech and music signal encoding apparatus and decoding apparatus Expired - Fee Related JP4293005B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004027981A JP4293005B2 (en) 2004-02-04 2004-02-04 Speech and music signal encoding apparatus and decoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004027981A JP4293005B2 (en) 2004-02-04 2004-02-04 Speech and music signal encoding apparatus and decoding apparatus

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP16657398A Division JP3541680B2 (en) 1998-06-15 1998-06-15 Audio music signal encoding device and decoding device

Publications (2)

Publication Number Publication Date
JP2004177982A JP2004177982A (en) 2004-06-24
JP4293005B2 true JP4293005B2 (en) 2009-07-08

Family

ID=32709481

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004027981A Expired - Fee Related JP4293005B2 (en) 2004-02-04 2004-02-04 Speech and music signal encoding apparatus and decoding apparatus

Country Status (1)

Country Link
JP (1) JP4293005B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1852849A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream

Also Published As

Publication number Publication date
JP2004177982A (en) 2004-06-24

Similar Documents

Publication Publication Date Title
JP3199020B2 (en) Audio music signal encoding device and decoding device
JP3134817B2 (en) Audio encoding / decoding device
US20210375296A1 (en) Methods, Encoder And Decoder For Linear Predictive Encoding And Decoding Of Sound Signals Upon Transition Between Frames Having Different Sampling Rates
JP3541680B2 (en) Audio music signal encoding device and decoding device
US7805314B2 (en) Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data
WO1990013112A1 (en) Voice encoder
JP2010244078A (en) Spectrum envelope information quantization device, spectrum envelope information decoding device, spectrum envelope information quantizatization method, and spectrum envelope information decoding method
JPH08123495A (en) Wide-band speech restoring device
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
JP3582589B2 (en) Speech coding apparatus and speech decoding apparatus
JP2003150200A (en) Method and device for converting code, program and storage medium
JP3147807B2 (en) Signal encoding device
JP4293005B2 (en) Speech and music signal encoding apparatus and decoding apparatus
JP3268750B2 (en) Speech synthesis method and system
JPH09127987A (en) Signal coding method and device therefor
KR100682966B1 (en) Method and apparatus for quantizing/dequantizing frequency amplitude, and method and apparatus for encoding/decoding audio signal using it
JP3063087B2 (en) Audio encoding / decoding device, audio encoding device, and audio decoding device
EP1717796B1 (en) Method for converting code and code conversion apparatus therefor
WO2000003385A1 (en) Voice encoding/decoding device
JP2615862B2 (en) Voice encoding / decoding method and apparatus
JPH04301900A (en) Audio encoding device
JP3773509B2 (en) Broadband speech restoration apparatus and broadband speech restoration method
JPH01293400A (en) Speech encoding and decoding method and speech encoding device and speech decoding device

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050316

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050518

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080331

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080902

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090317

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090330

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120417

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130417

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140417

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees