JPH09258795A - Digital filter and sound coding/decoding device - Google Patents

Digital filter and sound coding/decoding device

Info

Publication number
JPH09258795A
JPH09258795A JP8096040A JP9604096A JPH09258795A JP H09258795 A JPH09258795 A JP H09258795A JP 8096040 A JP8096040 A JP 8096040A JP 9604096 A JP9604096 A JP 9604096A JP H09258795 A JPH09258795 A JP H09258795A
Authority
JP
Japan
Prior art keywords
filter
order
coefficient
signal
linear prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8096040A
Other languages
Japanese (ja)
Other versions
JP3248668B2 (en
Inventor
Shigeaki Sasaki
茂明 佐々木
Akitoshi Kataoka
章俊 片岡
Takehiro Moriya
健弘 守谷
Shinji Hayashi
伸二 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP09604096A priority Critical patent/JP3248668B2/en
Publication of JPH09258795A publication Critical patent/JPH09258795A/en
Application granted granted Critical
Publication of JP3248668B2 publication Critical patent/JP3248668B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To attain acoustic sense weighting and noise suppression based on fine spectral structure of an acoustic signal containing voice by cascade- connecting digital filters respectively obtained from a p-order linear predictive coefficient of an input signal and an n-order linear predictive coefficient of a predictive residual signal. SOLUTION: A linear predictive analyzing means 12 performs linear predictive analysis of an input signal in a present frame so as to obtain a p-order linear prediction coefficient α. A linear predictive analyzing means 41 performs linear predictive analysis of a composite signal over past frames so as to obtain an m-order linear prediction coefficient. With this linear prediction coefficient as a filter coefficient, inverse filtering of LPC is performed in a digital filter 42 to obtain a predictive residual signal. A linear predictive analyzing means 43 performs linear predictive analysis of this predictive residual signal to obtain an n-order linear predictive coefficient β. Digital filters 44-1, 44-2 obtained using obtained α, β are cascade-connected and used as a composite filter 44.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、線形予測係数をフ
ィルタ係数として使用するディジタルフィルタに係り、
特に、音声や楽音等の音響信号の符号化において、聴覚
特性を考慮した重み付けを行う聴覚重み付けフィルタ、
音響信号の符号化符号の復号化合成における合成フィル
タ、復号化合成信号の量子化雑音を聴覚特性に基づいて
抑圧するポストフィルタ等の音響信号処理用の全極形ま
たは移動平均形ディジタルフィルタに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital filter using a linear prediction coefficient as a filter coefficient,
In particular, in the coding of audio signals such as voices and musical sounds, an auditory weighting filter for weighting considering auditory characteristics,
The present invention relates to an all-pole type or moving average type digital filter for acoustic signal processing, such as a synthesizing filter for decoding and synthesizing a coded code of an acoustic signal, a post filter for suppressing quantization noise of the decoded and synthesizing signal based on auditory characteristics.

【0002】[0002]

【従来の技術】線形予測によって求められた線形係数を
符号化することによって、音響信号を低ビットレートに
符号化する方法の典型として、CELP(Code E
xcited Linear Prediction:
符号励振線形予測)方式が、従来、知られている。
2. Description of the Related Art CELP (Code E) is a typical method for encoding an acoustic signal at a low bit rate by encoding a linear coefficient obtained by linear prediction.
xcited Linear Prediction:
A code-excited linear prediction) method is conventionally known.

【0003】図9は、上記CELP方式による従来の音
響符号化装置を示すブロック図であり、図9(1)は、
従来の音響符号化装置AC4を示すブロック図である。
FIG. 9 is a block diagram showing a conventional acoustic encoding apparatus based on the CELP method. FIG. 9 (1) shows
It is a block diagram which shows the conventional audio encoding device AC4.

【0004】この音響符号化装置AC4において、入力
端子11に入力された入力音声信号は、5〜20ms程
度のフレーム毎に、線形予測分析手段12で線形予測分
析され、p次の線形予測係数α0i(i=1、2、……、
p)が求められる。なお、「線形予測分析」は、音声信
号のサンプル値が、それ以前の時刻のいくつかのサンプ
ル値の線形結合で近似されるという考え方に基づくもの
である。
In this acoustic coding device AC4, the input speech signal input to the input terminal 11 is subjected to linear prediction analysis by the linear prediction analysis means 12 for each frame of about 5 to 20 ms, and the p-th order linear prediction coefficient α is obtained. 0i (i = 1, 2, ...,
p) is required. The "linear prediction analysis" is based on the idea that a sample value of a voice signal is approximated by a linear combination of some sample values at times before that.

【0005】そして、線形予測分析手段12が出力した
線形予測係数α0iは、量子化手段13で量子化され、こ
の量子化線形予測係数α0iは、フィルタ係数として、線
形予測合成フィルタ14に設定される。合成フィルタ1
4の伝達関数h(z)は、次の式(1)で表わされる。
The linear prediction coefficient α 0i output by the linear prediction analysis means 12 is quantized by the quantization means 13, and the quantized linear prediction coefficient α 0i is set in the linear prediction synthesis filter 14 as a filter coefficient. To be done. Synthesis filter 1
The transfer function h (z) of 4 is represented by the following equation (1).

【0006】[0006]

【数1】 合成フィルタ14へ入力されるべき励振信号(加算手段
18が出力した信号)が適応符号帳15に記憶され、制
御手段16が出力する符号に応じたピッチ周期で、適応
符号帳15から励振信号(ベクトル)が切り出され、こ
れが繰り返されてフレーム長とされ、利得付与手段17
によって利得が付与され、加算手段18を通じて、励振
信号として、合成フィルタ14へ供給される。
[Equation 1] The excitation signal (the signal output by the adding means 18) to be input to the synthesis filter 14 is stored in the adaptive codebook 15, and the excitation signal (from the adaptive codebook 15 is generated at the pitch cycle corresponding to the code output by the control means 16). Vector) is cut out, and this is repeated to obtain the frame length, and the gain giving means 17
The gain is added by the above and is supplied to the synthesizing filter 14 as an excitation signal through the adding means 18.

【0007】合成フィルタ14が出力する合成信号が、
減算手段19によって、入力信号から引かれ、この引か
れた差分信号は、聴覚重み付けフィルタ21によって、
聴覚特性のマスキング特性(?)と対応した重み付けが
なされ、この重み付けされた差信号のエネルギーが最小
になるように、適応符号帳15の入力符号(つまリピッ
チ周期)が、制御手段16によって探索される。
The combined signal output from the combining filter 14 is
The subtraction means 19 subtracts the subtracted difference signal from the input signal, and the subtracted difference signal is subtracted by the auditory weighting filter 21.
Weighting corresponding to the masking characteristic (?) Of the auditory characteristic is performed, and the control means 16 searches for the input code (summer pitch period) of the adaptive codebook 15 so that the energy of the weighted difference signal is minimized. It

【0008】その後、制御手段16の制御によって、雑
音符号帳22から励振ベクトルが順次取り出され、利得
付与手段23で利得が付与された後、この利得が付与さ
れた励振ベクトルと、先に選択した適応符号帳15から
の励振ベクトルとが、加算手段18によって加算され、
励振信号として合成フィルタ14へ供給され、上記と同
様に、聴覚重み付けフィルタ21が出力する差信号のエ
ネルギーが最小になるような励振ベクトル(利得付与手
段17が出力する励振ベクトルと、利得付与手段23が
出力する励振ベクトルとの組合せ)が選択される。
After that, under the control of the control means 16, the excitation vector is sequentially taken out from the noise codebook 22, and the gain is given by the gain giving means 23. Then, the excitation vector to which the gain is given and the one previously selected. The excitation vector from the adaptive codebook 15 is added by the adding means 18,
The excitation vector is supplied to the synthesis filter 14 as an excitation signal, and similarly to the above, the excitation vector (the excitation vector output by the gain imparting means 17 and the gain imparting means 23 that minimizes the energy of the difference signal output by the auditory weighting filter 21). The combination with the excitation vector output by) is selected.

【0009】最後に、上記のように選択された適応符号
帳15と雑音符号帳22とが出力する各励振ベクトルに
対して、それぞれ利得付与手段17、23が所定の利得
を付与し、このときにおける聴覚重み付けフィルタ21
の出力信号のエネルギーが最小になるような各利得が探
索される。
Finally, the gain imparting means 17 and 23 impart predetermined gains to the respective excitation vectors output by the adaptive codebook 15 and the noise codebook 22 selected as described above. Auditory weighting filter 21 in
Each gain is searched for such that the energy of the output signal of s is minimum.

【0010】量子化していない線形予測係数αi と、2
つの1以下の定数γ1、γ2とを用いて、次の式(2)
によって伝達関数w(z)が求められ、この伝達関数w
(z)が聴覚重み付けフィルタ21に使用される。
The unquantized linear prediction coefficient α i and 2
Using the two constants γ1 and γ2 less than or equal to 1, the following equation (2)
The transfer function w (z) is obtained by
(Z) is used for the perceptual weighting filter 21.

【0011】[0011]

【数2】 量子化線形予測係数を示す符号と、適応符号帳15、雑
音符号帳22でそれぞれ選択された励振ベクトルを示す
各符号と、利得付与手段17、23に与えられた各最適
利得を示す符号とが、音響符号化装置AC4の出力とさ
れる。
[Equation 2] The code indicating the quantized linear prediction coefficient, each code indicating the excitation vector selected by the adaptive codebook 15 and the noise codebook 22, and the code indicating each optimum gain given to the gain giving means 17 and 23, respectively. , And is output from the audio encoding device AC4.

【0012】図9(2)は、従来の音響符号化装置AC
5を示すブロック図である。
FIG. 9 (2) shows a conventional acoustic coding device AC.
5 is a block diagram showing FIG.

【0013】音響符号化装置AC5は、音響符号化装置
AC4において、線形予測フィルタ14と聴覚重み付け
フィルタ21とを合成した聴覚重み付き合成フィルタ2
4を、線形予測フィルタ14の代わりに設けたものであ
る。この場合、入力端子11からの入力信号を、聴覚重
み付けフィルタ21を通して、減算手段19へ供給す
る。
The acoustic coding device AC5 is a perceptual weighting synthesis filter 2 obtained by synthesizing the linear prediction filter 14 and the perceptual weighting filter 21 in the acoustic coding device AC4.
4 is provided instead of the linear prediction filter 14. In this case, the input signal from the input terminal 11 is supplied to the subtraction means 19 through the auditory weighting filter 21.

【0014】図10は、従来のCELP方式による従来
の音響復号化装置AD1を示すブロック図である。
FIG. 10 is a block diagram showing a conventional acoustic decoding apparatus AD1 based on the conventional CELP method.

【0015】音響復号化装置AD1において、入力端子
31から入力された入力符号中の線形予測係数符号が逆
量子化手段32によって逆量子化され、この逆量子化線
形予測係数は、フィルタ係数として、線形予測フィルタ
33に設定される。入力符号中のピッチ符号によって、
適応符号帳34から励振ベクトルが切り出され、また、
雑音符号によって、雑音符号帳35から励振ベクトルが
選択され、これら符号帳34、35からの各励振ベクト
ルは、利得付与手段36、37によって、入力符号中の
利得符号に応じて、それぞれ利得が付与された後、加算
手段38によって加算され、励振信号として合成フィル
タ33に与えられる。聴覚特性を考慮して量子化雑音が
小さくなるように、合成フィルタ33からの合成信号が
ポストフィルタ39で処理され、出力される。
In the acoustic decoding device AD1, the linear predictive coefficient code in the input code input from the input terminal 31 is dequantized by the dequantizing means 32, and the dequantized linear predictive coefficient is used as a filter coefficient. It is set in the linear prediction filter 33. Depending on the pitch code in the input code,
The excitation vector is cut out from the adaptive codebook 34, and
The excitation code is selected from the noise codebook 35 by the noise code, and the excitation vectors from these codebooks 34 and 35 are respectively given gains by the gain giving means 36 and 37 according to the gain code in the input code. After that, the signals are added by the adding means 38 and given to the synthesis filter 33 as an excitation signal. The combined signal from the combining filter 33 is processed by the post filter 39 and output so that the quantization noise is reduced in consideration of the auditory characteristics.

【0016】[0016]

【発明が解決しようとする課題】従来のCELP等の時
間領域における音響信号符号化装置において、従来の聴
覚重み付けフィルタ、合成フィルタ、ポストフィルタ
は、音声のフォルマントをモデル化できる10〜20次
程度の線形予測によって、フィルタ係数を決定するの
で、周波数領域において定常的で多数かつ不等間隔のピ
ークを有する音響信号の微細なスペクトル構造を表現す
ることができない。
In a conventional acoustic signal coding apparatus in the time domain such as CELP, the conventional auditory weighting filter, synthesis filter, and post filter are of the order of 10 to 20 that can model the formant of speech. Since the filter coefficient is determined by the linear prediction, it is not possible to represent the fine spectral structure of the acoustic signal having a large number of stationary peaks at regular intervals in the frequency domain.

【0017】したがって、微細なスペクトル構造を有す
る合成信号を得るには、合成フィルタに入力される励振
信号が、その微細スペクトル構造の情報を有する必要が
あり、この微細スペクトル構造の情報を有する励振信号
を符号化するには、多大な情報ビットが必要であり、ま
た、CELP等の符号帳探索型の符号化方式では、励振
信号を符号化するために符号帳探索に多大な演算量を必
要とし、実時間での処理が不可能であるという問題があ
る。
Therefore, in order to obtain a synthesized signal having a fine spectral structure, the excitation signal input to the synthesis filter needs to have the information of the fine spectral structure, and the excitation signal having the information of the fine spectral structure. Requires a large amount of information bits, and a codebook search type encoding method such as CELP requires a large amount of calculation for codebook search in order to encode the excitation signal. However, there is a problem that processing in real time is impossible.

【0018】また、微細スペクトル構造を表現する手段
として、線形予測の次数を単純に増加する手法が考えら
れるが、この手法によれば、求められた予測係数を量子
化する方法と比較すると、予測係数を求める過程に必要
な計算精度では、予測次数を上げることができないとい
う問題がある。
As a means for expressing the fine spectral structure, a method of simply increasing the order of linear prediction can be considered. According to this method, the prediction coefficient is compared with the method of quantizing the obtained prediction coefficient. There is a problem that the prediction order cannot be increased with the calculation accuracy required in the process of obtaining the coefficient.

【0019】また、上記従来例において、聴覚重み付
け、雑音抑圧は、10〜20次程度の線形予測係数、単
一のピッチ周波数等のパラメータのみで制御されるの
で、微細なスペクトル構造を考慮した細かな制御は不可
能であるという問題がある。
Further, in the above-mentioned conventional example, the perceptual weighting and noise suppression are controlled only by parameters such as linear prediction coefficients of the 10th to 20th order and a single pitch frequency. However, there is a problem that it is impossible to control it.

【0020】本発明は、音声を含む音響信号の微細スペ
クトル構造、この微細スペクトル構造に基づいた聴覚重
み付け、雑音抑圧を、ディジタルフィルタとして提供す
るものである。
The present invention provides, as a digital filter, a fine spectral structure of an acoustic signal containing speech, auditory weighting and noise suppression based on this fine spectral structure.

【0021】[0021]

【課題を解決するための手段】請求項1の発明は、入力
信号に対してp次の線形予測分析を行い、このp次の線
形予測係数からフィルタ係数を決定し、p次の線形予測
によって求められた予測残差信号に対して、n次の線形
予測を行い、n次の線形予測係数からフィルタ係数を決
定し、それぞれ求められた全極型または移動平均型ディ
ジタルフィルタを縦続に接続したディジタルフィルタで
ある。
According to a first aspect of the present invention, a p-th order linear prediction analysis is performed on an input signal, a filter coefficient is determined from the p-th order linear prediction coefficient, and the p-th order linear prediction is performed. An nth-order linear prediction is performed on the obtained prediction residual signal, the filter coefficient is determined from the nth-order linear prediction coefficient, and the obtained all-pole type or moving average type digital filters are connected in cascade. It is a digital filter.

【0022】請求項2の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
符号化装置において、聴覚特性に応じた重み付けを、差
信号に対して施す全極型または移動平均型ディジタルフ
ィルタとして、入力信号に対してp次の線形予測分析を
行い、p次の線形予測係数からフィルタ係数を決定し、
p次の線形予測によって求められた予測残差信号に対
し、n次の線形予測分析を行い、n次の線形予測係数か
らフィルタ係数を決定し、それぞれ求められた全極型ま
たは移動平均型ディジタルフィルタを縦続に接続した音
響符号化装置である。
According to a second aspect of the present invention, in an encoding device that determines an encoding code so that a difference signal between an acoustic input signal and a synthesized signal is minimized, weighting is applied to the difference signal in accordance with auditory characteristics. As an all-pole or moving average digital filter to be applied, p-th order linear prediction analysis is performed on the input signal, and the filter coefficient is determined from the p-th order linear prediction coefficient.
An n-th order linear prediction analysis is performed on the prediction residual signal obtained by the p-th order linear prediction, the filter coefficient is determined from the n-th order linear prediction coefficient, and the obtained all-pole type or moving average type digital signal is obtained. It is an audio encoding device in which filters are connected in cascade.

【0023】請求項3の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
符号化装置において、聴覚特性に応じた重み付けを差信
号に対して施す全極型または移動平均型ディジタルフィ
ルタとして、入力信号に対してp次の線形予測分析を行
い、p次の線形予測係数からフィルタ係数を決定し、過
去のフレームにおける合成信号に対してm次の線形予測
分析を行い、m次の線形予測分析によって求められた予
測残差信号に対してn次の線形予測分析を行い、n次の
線形予測係数からフィルタ係数を決定し、それぞれ求め
られたディジタルフィルタを縦続に接続した音響符号化
装置である。なお、上記mは、pと等しいものでもよ
く、多少異なるものでもよい。
According to a third aspect of the present invention, in the encoding device that determines the encoding code so that the difference signal between the acoustic input signal and the combined signal is minimized, weighting is applied to the difference signal according to the auditory characteristics. As an all-pole or moving average digital filter, p-th order linear prediction analysis is performed on the input signal, the filter coefficient is determined from the p-th order linear prediction coefficient, and the m-th order is added to the combined signal in the past frame. The linear prediction analysis is performed, the n-th order linear prediction analysis is performed on the prediction residual signal obtained by the m-th order linear prediction analysis, and the filter coefficient is determined from the n-th order linear prediction coefficient. It is an audio encoding device in which filters are connected in cascade. The m may be equal to or slightly different from p.

【0024】請求項4の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
符号化装置において、聴覚特性に応じた重み付けを、差
信号に対して施す全極型または移動平均型ディジタルフ
ィルタとして、入力信号に対してp次の線形予測分析を
行い、p次の線形予測係数からフィルタ係数を決定し、
過去のフレームにおいて量子化線形予測係数からフィル
タ係数が決定された合成フィルタヘの入力信号を保存
し、この保存された信号に対してn次の線形予測分析を
行い、n次の線形予測係数からフィルタ係数を決定し、
それぞれ求められたディジタルフィルタを縦続に接続し
た音響符号化装置である。
According to a fourth aspect of the present invention, in an encoding device that determines an encoding code so that a difference signal between an acoustic input signal and a synthetic signal is minimized, weighting is applied to the difference signal according to the auditory characteristics. As an all-pole or moving average digital filter to be applied, p-th order linear prediction analysis is performed on the input signal, and the filter coefficient is determined from the p-th order linear prediction coefficient.
The input signal to the synthesis filter in which the filter coefficient is determined from the quantized linear prediction coefficient in the past frame is saved, the n-th order linear prediction analysis is performed on this saved signal, and the filter is performed from the n-th order linear prediction coefficient. Determine the coefficient,
This is an acoustic coding device in which digital filters obtained respectively are connected in cascade.

【0025】請求項5の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
音響符号化/復号化装置において、合成信号の合成を行
うディジタルフィルタとして、入力信号に対してp次の
線形予測分析を行い、このp次の予測係数を量子化して
量子化予測係数を作り、p次の予測係数と量子化予測係
数とからそれぞれフィルタ係数を決定し、過去のフレー
ムにおける合成信号に対してm次の線形予測分析を行
い、m次の線形予測によって求められた予測残差信号に
対してn次の線形予測分析を行い、n次の線形予測係数
からフィルタ係数を決定し、それぞれ求められたディジ
タルフィルタを縦続に接続した音響符号化/復号化装置
である。なお、mは、pと等しいものでもよく、多少異
なるものでもよい。
According to a fifth aspect of the present invention, in an acoustic encoding / decoding device for determining an encoding code so that a difference signal between an acoustic input signal and a synthetic signal is minimized, a digital filter for synthesizing the synthetic signal is provided. , P-th order linear prediction analysis is performed on the input signal, the p-th order prediction coefficient is quantized to form a quantized prediction coefficient, and the filter coefficient is determined from each of the p-th order prediction coefficient and the quantized prediction coefficient. , The m-th order linear prediction analysis is performed on the synthesized signal in the past frame, the n-th order linear prediction analysis is performed on the prediction residual signal obtained by the m-th order linear prediction, and the n-th order linear prediction coefficient is calculated. It is an acoustic encoding / decoding device in which the filter coefficients are determined from the above and the obtained digital filters are connected in cascade. Note that m may be equal to p or may be slightly different.

【0026】請求項5の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
音響符号化/復号化装置において、合成信号の合成を行
うディジタルフィルタとして、入力信号に対してp次の
線形予測分析を行い、p次の予測係数を量子化して量子
化予測係数を作り、p次の量子化予測係数からフィルタ
係数を決定し、過去のフレームにおける合成信号に対し
てm次の線形予測分析を行い、m次の線形予測によって
求められた予測残差信号に対してn次の線形予測分析を
行い、n次の線形予測係数からフィルタ係数を決定し、
それぞれ求められたディジタルフィルタを縦続に接続す
る音響符号化/復号化装置である。なお、mは、pと等
しいものでもよく、多少異なっているものでもよい。
According to a fifth aspect of the present invention, in an acoustic encoding / decoding device for determining an encoding code so that a difference signal between an acoustic input signal and a synthetic signal is minimized, a digital filter for synthesizing the synthetic signal is provided. , P-th order linear prediction analysis is performed on the input signal, the p-th order prediction coefficient is quantized to create a quantized prediction coefficient, the filter coefficient is determined from the p-th order quantized prediction coefficient, and the synthesis in the past frame is performed. The m-th order linear prediction analysis is performed on the signal, the n-th order linear prediction analysis is performed on the prediction residual signal obtained by the m-th order linear prediction, and the filter coefficient is determined from the n-th order linear prediction coefficient. ,
This is an audio encoding / decoding device that connects the obtained digital filters in cascade. Note that m may be equal to p or may be slightly different.

【0027】請求項6の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
符号化/復号化装置において、合成信号の合成を行うデ
ィジタルフィルタとして、入力信号に対してp次の線形
予測分析を行い、p次の予測係数を量子化して量子化予
測係数を作り、p次の量子化予測係数からフィルタ係数
を決定し、過去のフレームにおいてp次の量子化線形予
測係数からフィルタ係数が決定された合成フィルタに入
力された信号を保存し、保存された信号に対してn次の
線形予測を行い、n次の線形予測係数からフィルタ係数
を決定し、それぞれ求められたディジタルフィルタを縦
続に接続する音響符号化/復号化装置である。
According to a sixth aspect of the present invention, in an encoding / decoding device that determines an encoding code so that a difference signal between an acoustic input signal and a synthetic signal is minimized, a digital filter for synthesizing the synthetic signal is provided. The p-th order linear prediction analysis is performed on the input signal, the p-th order prediction coefficient is quantized to create a quantized prediction coefficient, and the filter coefficient is determined from the p-th order quantized prediction coefficient. The signal input to the synthesis filter in which the filter coefficient is determined from the quantized linear prediction coefficient is stored, the nth-order linear prediction is performed on the stored signal, and the filter coefficient is determined from the nth-order linear prediction coefficient. Then, the audio encoding / decoding device connects the obtained digital filters in cascade.

【0028】請求項7の発明は、音響の符号化符号によ
る復号化合成信号に対して、量子化雑音を聴覚的に抑圧
する処理を行うディジタルフィルタとして、過去のフレ
ームを含む復号化合成信号に対してm次の線形予測分析
を行い、m次の線形予測分析によって求められた予測残
差信号に対してn次の線形予測を行い、n次の線形予測
係数からフィルタ係数を決定し、それぞれ求められたデ
ィジタルフィルタを縦続に接続した音響復号化装置であ
る。なお、mは、pと等しいものでもよく、多少異なる
ものでもよい。
According to a seventh aspect of the present invention, as a digital filter for performing a process of acoustically suppressing the quantization noise, the decoded combined signal including the past frame is decoded into the decoded combined signal including the past frame. On the other hand, the m-th order linear prediction analysis is performed, the n-th order linear prediction is performed on the prediction residual signal obtained by the m-th order linear prediction analysis, and the filter coefficient is determined from the n-th order linear prediction coefficient. This is an audio decoding device in which the obtained digital filters are connected in cascade. Note that m may be equal to p or may be slightly different.

【0029】請求項8の発明は、音響の符号化符号によ
る復号化合成信号に対して、量子化雑音を聴覚的に抑圧
する処理を行うディジタルフィルタとして、過去のフレ
ームにおいてp次の線形予測係数からフィルタ係数が決
定された合成フィルタに入力された信号を保存し、保存
された信号に対してn次の線形予測分析を行い、n次の
線形予測係数からフィルタ係数を決定し、現在のフレー
ムにおける符号化符号から得られたp次の線形予測係数
によってフィルタ係数が決定されたディジタルフィルタ
とそれぞれ求められたディジタルフィルタとを縦続に接
続した音響復号化装置である。
According to an eighth aspect of the present invention, a p-th order linear prediction coefficient in a past frame is used as a digital filter that performs processing for acoustically suppressing quantization noise on a decoded combined signal by an acoustic coding code. The signal input to the synthesis filter in which the filter coefficient is determined from is stored, the n-th order linear prediction analysis is performed on the stored signal, the filter coefficient is determined from the n-th order linear prediction coefficient, and the current frame is calculated. It is an acoustic decoding device in which a digital filter whose filter coefficient is determined by a p-th order linear prediction coefficient obtained from the encoded code in and the digital filter obtained respectively are connected in cascade.

【0030】[0030]

【発明の実施の形態および実施例】図1(1)は、本発
明の一実施例である音響符号化装置AC1を示すブロッ
ク図である。
BEST MODE FOR CARRYING OUT THE INVENTION FIG. 1A is a block diagram showing an acoustic coding apparatus AC1 which is an embodiment of the present invention.

【0031】この音響符号化装置AC1は、請求項5に
対応する実施例であり、図9に示した従来の音響符号化
装置AC4において、合成フィルタ14の代わりに合成
フィルタ44を設け、m次線形予測分析手段41、LP
C逆フィルタ42、n次線形予測分析手段43、第2の
フィルタ係数決定手段43aとを設け、第1のフィルタ
係数決定手段13aを設けたものである。
This acoustic encoding device AC1 is an embodiment corresponding to claim 5, and in the conventional acoustic encoding device AC4 shown in FIG. 9, a synthesis filter 44 is provided in place of the synthesis filter 14, and m-th order Linear predictive analysis means 41, LP
The C inverse filter 42, the nth-order linear prediction analysis means 43, the second filter coefficient determination means 43a are provided, and the first filter coefficient determination means 13a is provided.

【0032】音響符号化装置AC1において、まず、現
フレームにおける入力信号を線形予測分析してp次の線
形予測係数α0i(i=1、2、……、p)を求める。こ
の線形予測係数α0iは、従来の音響符号化装置AC4中
の線形予測分析手段12で得られた係数を用いることが
できる。さらに、この予測係数を量子化し、量子化予測
係数αi (i=1、2、……、p)を求める。通常、p
は10から20程度とする。
In the audio encoding device AC1, first, the input signal in the current frame is subjected to linear prediction analysis to obtain a p-th order linear prediction coefficient α 0i (i = 1, 2, ..., P). As the linear prediction coefficient α 0i , the coefficient obtained by the linear prediction analysis means 12 in the conventional acoustic encoding device AC4 can be used. Further, this prediction coefficient is quantized to obtain a quantized prediction coefficient α i (i = 1, 2, ..., P). Usually p
Is about 10 to 20.

【0033】次に、過去のフレームにわたる合成信号を
線形予測分析手段41で線形予測分析し、m次の線形予
測係数α' k(k=1、2、……、m)を求める。なお、
上記のように、mは、pと等しくてもよく、多少異なっ
ていてもよい。また、線形予測分析を行う場合、分析対
象の信号系列にかける窓としては、非対称窓またはハミ
ング窓等の対称窓のいずれを用いてもよい。
Next, the composite signal over the past frame linear prediction analysis in the linear prediction analysis unit 41, the linear prediction coefficients of m degree α 'k (k = 1,2, ......, m) obtained. In addition,
As noted above, m may be equal to p or slightly different. Further, when performing the linear prediction analysis, either asymmetric window or symmetric window such as Hamming window may be used as the window to be applied to the signal sequence to be analyzed.

【0034】次に、過去の合成音声に対して、この線形
予測係数α' kをフィルタ係数として、伝達特性が次の式
(3)で表わされるディジタルフィルタ42でLPC逆
フィルタリングを行い、予測残差信号を求める。
Next, with respect to past synthesized speech, the linear prediction coefficient alpha 'k as the filter coefficients, performs a LPC inverse filtering by the digital filter 42 which transfer characteristic is represented by the following formula (3), the prediction residual Find the difference signal.

【0035】[0035]

【数3】 次に、求められた過去の合成信号(たとえば1ピッチ前
の合成信号)の予測残差信号を、線形予測分析手段43
で線形予測分析して、n次の線形予測係数βj(j=
1、2、……、n)を求める。n次の線形予測によっ
て、m次の線形予測では予測しきれない高次の相関を表
わすために、nは、mよりも大であることが望ましい。
たとえば、符号化対象が音楽である場合、100次以上
の予測が最適である場合がある。
(Equation 3) Next, the prediction residual signal of the obtained past synthesized signal (for example, the synthesized signal one pitch before) is used as the linear prediction analysis means 43.
The linear prediction analysis is performed by using the linear prediction coefficient β j (j =
1, 2, ..., N) are calculated. It is preferable that n is larger than m so that the n-th order linear prediction represents a higher-order correlation that cannot be predicted by the m-th order linear prediction.
For example, when the encoding target is music, 100th or higher order prediction may be optimal.

【0036】次に、得られた係数αi 、βj を用いて、
伝達特性がそれぞれ次の式(4)、式(5)で表わされ
るディジタルフィルタを縦続接続し、伝達特性が式
(6)で表わされるディジタルフィルタを構成し、合成
フィルタ44として用いる。
Next, using the obtained coefficients α i and β j ,
Digital filters whose transfer characteristics are represented by the following equations (4) and (5) are connected in series to form a digital filter whose transfer characteristic is represented by the equation (6), and are used as the synthesis filter 44.

【0037】図1(2)は、本発明の他の実施例である
音響符号化装置AC2を示すブロック図である。
FIG. 1 (2) is a block diagram showing an audio encoding device AC2 which is another embodiment of the present invention.

【0038】符号化対象の信号の性質によっては、音響
符号化装置AC2のように、複数の励振符号帳の内で一
部の励振符号帳からの励振信号のみを、合成フィルタ4
4でフィルタリングし、それ以外の励振符号帳からの励
振信号は、従来の合成フィルタによってフィルタリング
するようにしてもよい。
Depending on the nature of the signal to be coded, only the excitation signals from some of the excitation codebooks among the plurality of excitation codebooks, like the acoustic encoding device AC2, are synthesized by the synthesis filter 4.
The excitation signal from the excitation codebook other than the above may be filtered by the conventional synthesis filter.

【0039】[0039]

【数4】 (Equation 4)

【0040】[0040]

【数5】 (Equation 5)

【0041】[0041]

【数6】 図2(1)は、符号化対象入力信号の対数パワースペク
トルの一例を示す図であり、図2(2)は、音響符号化
装置AC1による合成フィルタにおいて、包絡を表わす
フィルタの対数パワースペクトル特性の一例を示す図で
あり、図2(3)は、音響符号化装置AC1による合成
フィルタにおいて、微細構造を表わすフィルタの対数バ
ワースペクトル特性の一例を示す図であり、図2(4)
は、音響符号化装置AC1による合成フィルタの対数パ
ワースペクトル特性の一例を示す図である。
(Equation 6) 2 (1) is a diagram showing an example of a logarithmic power spectrum of an input signal to be encoded, and FIG. 2 (2) is a logarithmic power spectrum characteristic of a filter representing an envelope in a synthesis filter by the acoustic encoding device AC1. 2 (3) is a diagram showing an example of a logarithmic Bower spectrum characteristic of a filter representing a fine structure in the synthesis filter by the acoustic encoding device AC1, and FIG.
[Fig. 3] is a diagram showing an example of a logarithmic power spectrum characteristic of a synthesis filter by the acoustic encoding device AC1.

【0042】上記実施例では、符号化対象信号のパワー
スペクトル特性の包絡を表わすフィルタと微細構造を表
わすフィルタとをそれぞれ求め、両フィルタを縦続接続
して構成されている。
In the above embodiment, a filter representing the envelope of the power spectrum characteristic of the signal to be coded and a filter representing the fine structure are respectively obtained, and both filters are connected in cascade.

【0043】図2(1)に表わされる符号化対象信号の
パワースペクトル特性を表現する場合、包絡形状は、従
来のように量子化された低次のフィルタ係数αi で図2
(2)のように表現し、微細構造は、過去の合成音声
を、高次の分析によって得られた高次のフィルタ係数β
j で図2(3)のように表現し、それらのフィルタの縦
続接続によって、図2(4)のようなパワースペクトル
特性を表現できる。上記実施例は、従来例と比較して、
復号化装置側に送信するための余分の情報ビットを必要
とせず、しかも、より複雑な符号化対象信号のパワース
ペクトル特性を表現できる。
When expressing the power spectrum characteristic of the signal to be coded shown in FIG. 2A, the envelope shape is represented by the low-order filter coefficient α i quantized as in the conventional case.
Expressed as in (2), the fine structure has a higher-order filter coefficient β obtained by higher-order analysis of past synthesized speech.
2 (3) is represented by j , and the power spectrum characteristic as shown in FIG. 2 (4) can be represented by the cascade connection of these filters. The above-mentioned embodiment, compared with the conventional example,
An extra information bit for transmitting to the decoding device side is not required, and more complex power spectrum characteristics of the signal to be encoded can be expressed.

【0044】また、一回の線形予測分析では、微細構造
を表現できる程の高次の分析を行う予測係数を安定して
求めることは困難であるが、上記実施例では、高次の分
析を行う対象の信号が、低次の相関が除かれた予測残差
信号であるので、高次の分析であっても、予測係数を安
定して求めることが容易である。なお、安定な予測係数
が求められなかった場合は、前のフレームで得られた
値、または初期化された値を、安定な予測係数として用
いることができる。
Further, it is difficult to stably obtain a prediction coefficient for performing a high-order analysis enough to express a fine structure by one-time linear prediction analysis. However, in the above embodiment, the high-order analysis is performed. Since the signal to be performed is the prediction residual signal from which the low-order correlation is removed, it is easy to stably obtain the prediction coefficient even in the high-order analysis. If a stable prediction coefficient is not obtained, the value obtained in the previous frame or the initialized value can be used as the stable prediction coefficient.

【0045】初期化された値を安定な予測係数として用
いる場合でも、量子化された低次の予測係数が求められ
ていれば、その低次の予測による利得は少なくとも保証
される。
Even when the initialized value is used as a stable prediction coefficient, if the quantized low-order prediction coefficient is obtained, at least the gain by the low-order prediction is guaranteed.

【0046】また、上記実施例において、合成フィルタ
に励振信号を入力し、合成信号を得るためには、従来の
フィルタリングの操作に加えて、フィルタ係数βj によ
るフィルタリングを必要とするが、従来の音響符号化装
置AC5でよく用いられるように、合成フィルタのイン
パルス応答と零入力応答とをそれぞれ一旦、求めておけ
ば、インパルス応答をフィルタ係数とする移動平均型デ
ィジタルフィルタと符号帳とからの励振信号を畳み込ん
で得られた信号と、零入力応答を入力信号から引いた差
信号との誤差が最小になるように、励振信号を選ぶこと
によって、符号帳中の全ての励振信号について、フィル
タ係数βj によるフィルタリングの操作を避けることが
でき、この場合、符号帳探索のみに必要となる演算量は
従来と変わらない。
Further, in the above embodiment, in order to input the excitation signal to the synthesis filter and obtain the synthesis signal, in addition to the conventional filtering operation, filtering by the filter coefficient β j is required. As is often used in the acoustic coding apparatus AC5, once the impulse response and the zero-input response of the synthesis filter are respectively obtained, the moving average type digital filter using the impulse response as the filter coefficient and the excitation from the codebook are used. The excitation signal is selected so that the error between the signal obtained by convolving the signal and the difference signal obtained by subtracting the quiescent response from the input signal is minimized. The filtering operation by the coefficient β j can be avoided, and in this case, the amount of calculation required only for the codebook search is the same as in the conventional case.

【0047】図3は、本発明の他の実施例を示すブロッ
ク図であり、従来の音響符号化装置AC4における聴覚
重み付けフィルタ21を改良した聴覚重み付けフィルタ
211を示すブロック図である。
FIG. 3 is a block diagram showing another embodiment of the present invention, which is a block diagram showing a perceptual weighting filter 211 which is an improvement of the perceptual weighting filter 21 in the conventional acoustic coding apparatus AC4.

【0048】聴覚重み付けフィルタ211は、請求項
1、2に対応する発明であり、入力信号系列に対して、
p次の線形予測分析を行い、p次の予測係数を求めるp
次線形予測分析手段12と、p次の予測係数に基づい
て、全極形または移動平均形ディジタルフィルタのフィ
ルタ係数を決定する第1のフィルタ係数決定手段12a
と、入力信号をLPC逆フィルタ(61)に通して、p
次の線形予測の予測残差として得られた信号系列につい
て、n次の線形予測を行う手段62と、n次の予測係数
に基づいて、全極形または移動平均形ディジタルフィル
タのフィルタ係数を決定する第2のフィルタ係数決定手
段62aと、p次の線形予測によってフィルタ係数が決
定された第1の全極形または移動平均形ディジタルフィ
ルタ63−1と、n次の線形予測によってフィルタ係数
が決定された第2の全極形または移動平均形ディジタル
フィルタ63−2と、第1のフィルタと上記第2のフィ
ルタとを縦続接続する接続手段とを有する聴覚重み付け
フィルタである。このように分析を2回に分けることに
よって、フィルタ設計が自由になる。なお、このフィル
タ211を、音響符号化装置にも、音響復号化装置にも
使用でき、また、映像等の音響以外の符号化/復号化装
置にも使用することができる。
The perceptual weighting filter 211 is an invention corresponding to claims 1 and 2, and is applied to an input signal sequence,
p-order linear prediction analysis is performed to obtain p-order prediction coefficients p
First-order linear prediction analysis means 12 and first filter coefficient determination means 12a for determining the filter coefficient of the all-pole type or moving average type digital filter based on the p-th order prediction coefficient.
And pass the input signal through the LPC inverse filter (61) to obtain p
For the signal sequence obtained as the prediction residual of the next linear prediction, a means 62 for performing n-th order linear prediction, and the filter coefficient of the all-pole or moving average digital filter is determined based on the n-th order prediction coefficient. Second filter coefficient determining means 62a, a first all-pole or moving average digital filter 63-1 whose filter coefficient is determined by p-order linear prediction, and a filter coefficient determined by n-th order linear prediction This is a perceptual weighting filter having a second all-pole type or moving average type digital filter 63-2 that has been formed, and a connecting means that cascade-connects the first filter and the second filter. By thus dividing the analysis into two, the filter design becomes free. The filter 211 can be used in both an audio encoding device and an audio decoding device, and can also be used in an encoding / decoding device other than audio such as video.

【0049】フィルタ211を音響符号化装置に使用し
た場合には、音響の入力信号のスペクトル包絡のモデル
化を線形予測分析で行い、上記音響の入力信号と符号化
符号の合成信号との差信号が最小化するように上記符号
化符号を決定し、上記差信号に対して聴覚特性に応じた
重み付けを施す音響符号化装置において、音響の入力信
号に対して、p次の線形予測分析を行い、p次の予測係
数を求めるp次の線形予測分析手段12と、p次の予測
係数に基づいて、フィルタ係数を決定する第1のフィル
タ係数決定手段12aと、上記入力をLPC逆フィルタ
61に通して得られたp次の線形予測の残差信号に対し
て、n次の線形予測分析を行い、n次の予測係数を求め
るn次の線形予測分析手段43と、上記n次の予測係数
に基づいて、フィルタ係数を決定する第2のフィルタ係
数決定手段62aと、上記複数のディジタルフィルタ6
3−1、63−2を縦続接続する接続手段とからなる。
この場合、精密な聴覚重み付けを行いことができる。
When the filter 211 is used in the acoustic coding device, the spectral envelope of the acoustic input signal is modeled by linear prediction analysis, and the difference signal between the acoustic input signal and the coded code composite signal is obtained. In the acoustic encoding device that determines the encoding code so as to minimize the difference and weights the difference signal according to the auditory characteristics, p-th order linear prediction analysis is performed on the acoustic input signal. , A p-th order linear prediction analysis means 12 for obtaining a p-th order prediction coefficient, a first filter coefficient determination means 12a for determining a filter coefficient based on the p-th order prediction coefficient, and the above-mentioned input to the LPC inverse filter 61. The p-th order linear prediction residual signal obtained through the above is subjected to an n-th order linear prediction analysis to obtain an n-th order prediction coefficient, and an n-th order linear prediction analysis means 43 and the n-th order prediction coefficient. Based on A second filter coefficient determining means 62a for determining the data coefficients, said plurality of digital filters 6
3-1 and 63-2 are connected in cascade.
In this case, precise auditory weighting can be performed.

【0050】図4は、本発明の別の実施例である聴覚重
み付けフィルタ212を示すブロック図である。聴覚重
み付けフィルタ212は、従来の音響符号化装置AC4
における聴覚重み付けフィルタ21を改良したフィルタ
であり、請求項3に対応する実施例である。
FIG. 4 is a block diagram showing an auditory weighting filter 212 which is another embodiment of the present invention. The perceptual weighting filter 212 is a conventional acoustic coding device AC4.
It is a filter which is an improvement of the perceptual weighting filter 21 in the above, and is an embodiment corresponding to claim 3.

【0051】聴覚重み付けフィルタ212は、音響の入
力信号のスペクトル包絡のモデル化を線形予測分析で行
い、上記音響の入力信号と符号化符号の合成信号との差
信号が最小化するように上記符号化符号を決定し、上記
差信号に対して聴覚特性に応じた重み付けを施す音響符
号化装置において、上記音響の入力信号に対して、p次
の線形予測分析を行い、p次の予測係数を求めるp次の
線形予測分析手段12と、上記p次の予測係数に基づい
て、フィルタ係数を決定する第1のフィルタ係数決定手
段12aと、上記音響の入力信号における過去のフレー
ムについての合成信号に対して、m次の線形予測分析を
行い、m次の予測残差信号を求めるm次の線形予測分析
手段51と、上記m次の予測残差信号に基づいて、n次
の線形予測分析を行い、n次の予測係数を求めるn次の
線形予測分析手段53と、上記n次の予測係数に基づい
て、フィルタ係数を決定する第2のフィルタ係数決定手
段53aと、上記複数のディジタルフィルタ54−1と
54−2とを縦続接続する接続手段とを有するものであ
る。
The perceptual weighting filter 212 models the spectral envelope of the acoustic input signal by linear predictive analysis to minimize the difference signal between the acoustic input signal and the encoded code composite signal. In a sound coding apparatus that determines a coding code and weights the difference signal according to the auditory characteristics, a p-th order linear prediction analysis is performed on the sound input signal, and a p-th order prediction coefficient is calculated. The p-th order linear prediction analysis unit 12 to be obtained, the first filter coefficient determination unit 12a that determines the filter coefficient based on the p-th order prediction coefficient, and the synthesized signal of the past frame in the acoustic input signal are obtained. On the other hand, an m-th order linear prediction analysis is performed based on the m-th order prediction residual signal and the m-th order linear prediction analysis means 51 that performs the m-th order linear prediction analysis to obtain the m-th order prediction residual signal. The nth-order linear prediction analysis means 53 for obtaining the nth-order prediction coefficient, the second filter coefficient determination means 53a for determining the filter coefficient based on the nth-order prediction coefficient, and the plurality of digital filters 54. -1 and 54-2 are connected in cascade.

【0052】まず、現フレームにおける入力信号を線形
予測分析し、p次の線形予測係数α0i(i=1、2、…
…、p)を求める。この線形予測係数α0iは、音響符号
化装置AC4中の線形予測分析手段12で得られたもの
を用いることができる。通常、pは、10〜20程度と
する。
First, the input signal in the current frame is subjected to linear prediction analysis, and the p-th order linear prediction coefficient α 0i (i = 1, 2, ...).
..., p) is calculated. As this linear prediction coefficient α 0i , the one obtained by the linear prediction analysis means 12 in the acoustic encoding device AC4 can be used. Usually, p is set to about 10 to 20.

【0053】次に、現フレームと過去のフレームとにわ
たる入力信号を、線形予測手段51で線形予測分析し、
m次の線形予測係数α' k(k=1、2、……、m)を求
める。なお、上記のように、mは、pと等しくてもよ
く、多少異なっていてもよい。また、線形予測分析を行
う場合、分析対象の信号系列にかける窓は、非対称窓ま
たはハミング窓等の対称窓のいずれを用いてもよい。
Next, the linear prediction means 51 performs a linear prediction analysis on the input signal over the current frame and the past frame,
An m-th order linear prediction coefficient α k (k = 1, 2, ..., M) is obtained. As described above, m may be equal to p or may be slightly different. Further, when performing the linear prediction analysis, the window applied to the signal sequence to be analyzed may be either an asymmetric window or a symmetric window such as a Hamming window.

【0054】次に、現フレームと過去のフレームとにわ
たる入力信号に対し、この線形予測係数α' kをフィルタ
係数として、伝達特性が上記の式(1)のα' kをinv
(αk)で置き換えたディジタルフィルタ52によっ
て、LPC逆フィルタリングを行い、予測残差信号を求
める。
Next, the input signal over the current frame and the previous frame, the LPC coefficients alpha 'a k as the filter coefficient, the transfer characteristic is alpha of the above formula (1)' a k inv
The LPC inverse filtering is performed by the digital filter 52 replaced by (αk) to obtain the prediction residual signal.

【0055】次に、求められた過去の合成信号の予測残
差信号を、線形予測手段53によって線形予測分析し、
n次の線形予測係数βj (j=1、2、……、n)を求
める。n次の線形予測によって、m次の線形予測では予
測しきれない高次の相関を表わすので、nは、mよりも
大であることが望ましい。たとえば、符号化対象が音楽
である場合、100次以上の予測が最適な場合がある点
は、上記実施例と同様である。
Next, the obtained prediction residual signal of the past combined signal is subjected to linear prediction analysis by the linear prediction means 53,
An nth-order linear prediction coefficient β j (j = 1, 2, ..., N) is obtained. Since n-th order linear prediction represents a higher-order correlation that cannot be predicted by the m-th order linear prediction, n is preferably larger than m. For example, when the object to be encoded is music, the prediction of 100th order or higher may be optimal, as in the above embodiment.

【0056】次に、得られた係数α0i、inv(βj
と、1以下の定数γ1、γ2、γ3、γ4を用いて、伝
達特性が次の式(7)で表わされるディジタルフィルタ
54を構成し、音響符号化装置AC4における聴覚重み
付けフィルタ21として用いる。
Next, the obtained coefficients α 0i , inv (β j )
Using the constants γ1, γ2, γ3, and γ4 of 1 or less, a digital filter 54 whose transfer characteristic is represented by the following equation (7) is configured to be used as the perceptual weighting filter 21 in the acoustic encoding device AC4.

【0057】[0057]

【数7】 上記実施例においては、従来のフィルタ係数α0iと1以
下の定数、γ1、γ2とで表わされる入力信号のパワー
スペクトル包絡に基づいた聴覚重み付けフィルタに、高
次のフィルタ係数β0iと1以下の定数γ1、γ4とで表
わされる入力信号のパワースペクトルの微細構造に基づ
いた聴覚重み付けフィルタを付け加えることによって、
複数のピッチが混在するような入力信号に対しても、聴
覚特性に応じたより細かな制御を行うことができる。
(Equation 7) In the above embodiment, a conventional filter coefficient α 0i and a constant less than or equal to 1, and a perceptual weighting filter based on the power spectrum envelope of the input signal represented by γ1 and γ2 are used, and a higher order filter coefficient β 0i and less than or equal to 1 are used. By adding an auditory weighting filter based on the fine structure of the power spectrum of the input signal represented by the constants γ1, γ4,
Even for an input signal in which a plurality of pitches are mixed, finer control can be performed according to the auditory characteristics.

【0058】また、上記実施例においては、合成信号ま
たは入力信号に対して、低次の線形予測分析を行い、そ
の予測残差信号に対して高次の線形予測分析を行い、こ
れによって得られた予測係数を用いるディジタルフィル
タによって、従来よりも複雑なパワースペクトル特性を
表わすことができる。したがって、多数の励振ベクトル
をフィルタに通すCELP方式のような符号化におい
て、合成フィルタとして用いることによって、様々な音
響信号のパワースペクトル特性を、合成フィルタ励振符
号帳内に励振ベクトルのバリエーションとして持つ必要
がない点で有効である。また、従来よりも聴覚特性に応
じた重み付け、雑音抑圧を細かく制御できる点において
有効である。
Further, in the above embodiment, the low-order linear prediction analysis is performed on the combined signal or the input signal, and the high-order linear prediction analysis is performed on the prediction residual signal. By using a digital filter using the above prediction coefficient, more complicated power spectrum characteristics than before can be expressed. Therefore, it is necessary to have power spectrum characteristics of various acoustic signals as variations of the excitation vector in the synthesis filter excitation codebook by using as a synthesis filter in encoding such as the CELP method in which a large number of excitation vectors are filtered. It is effective in that there is no. Further, it is more effective than before in that weighting and noise suppression can be finely controlled according to the auditory characteristics.

【0059】この聴覚重み付けフィルタ212によっ
て、精密な聴覚重み付けを行うことができる。
The perceptual weighting filter 212 enables precise perceptual weighting.

【0060】図5は、本発明の他の実施例である聴覚重
み付けフィルタ213を示すブロック図である。聴覚重
み付けフィルタ213は、従来の音響符号化装置AC4
における聴覚重み付けフィルタ21を改良したフィルタ
であり、請求項4に対応する実施例である。
FIG. 5 is a block diagram showing an auditory weighting filter 213 which is another embodiment of the present invention. The perceptual weighting filter 213 is a conventional acoustic encoding device AC4.
It is a filter that is an improvement of the perceptual weighting filter 21 in FIG. 4 and is an embodiment corresponding to claim 4.

【0061】聴覚重み付けフィルタ213は、音響の入
力信号のスペクトル包絡のモデル化を線形予測分析で行
い、上記音響の入力信号と符号化符号の合成信号との差
信号が最小化するように上記符号化符号を決定し、上記
差信号に対して聴覚特性に応じた重み付けを施す音響符
号化装置において、上記音響の入力信号に対して、p次
の線形予測分析を行い、p次の予測係数を求めるp次の
線形予測分析手段12と、上記p次の予測係数に基づい
て、フィルタ係数を決定する第1のフィルタ係数決定手
段2aと、上記音響の入力信号における過去のフレーム
において、量子化予測係数に基づいてフィルタ係数が決
定された合成フィルタに入力された信号を保存する信号
保存手段15と、上記信号保存手段に保存された信号に
対して、n次の線形予測分析行い、n次の予測係数を求
めるn次の線形予測分析手段62と、上記n次の予測係
数に基づいて、フィルタ係数を決定する第2のフィルタ
係数決定手段62aと、上記複数のディジタルフィルタ
63−1と63−2とを縦続接続する接続手段とを有す
る聴覚重み付けフィルタである。
The perceptual weighting filter 213 models the spectral envelope of the acoustic input signal by linear prediction analysis, and minimizes the difference signal between the acoustic input signal and the synthesized signal of the encoded code. In a sound coding apparatus that determines a coding code and weights the difference signal according to the auditory characteristics, a p-th order linear prediction analysis is performed on the sound input signal, and a p-th order prediction coefficient is calculated. A p-th order linear prediction analysis unit 12 to be obtained, a first filter coefficient determination unit 2a that determines a filter coefficient based on the p-th order prediction coefficient, and a quantized prediction in a past frame in the acoustic input signal. A signal storage unit 15 for storing the signal input to the synthesis filter whose filter coefficient is determined based on the coefficient, and an n-th order line for the signal stored in the signal storage unit. Prediction analysis is performed to obtain an nth-order prediction coefficient, an nth-order linear prediction analysis means 62, a second filter coefficient determination means 62a that determines a filter coefficient based on the nth-order prediction coefficient, and the plurality of digital signals. It is a perceptual weighting filter having a connecting means for cascading the filters 63-1 and 63-2.

【0062】聴覚重み付けフィルタ213によって、精
密な聴覚重み付けを行うことができる。
The perceptual weighting filter 213 enables precise perceptual weighting.

【0063】図6は、本発明のさらに別の実施例である
音響符号化装置AC3を示すブロック図である。
FIG. 6 is a block diagram showing an audio encoding device AC3 which is still another embodiment of the present invention.

【0064】音響符号化装置AC3は、請求項6に対応
する実施例であり、音響の入力信号のスペクトル包絡の
モデル化を線形予測分析で行い、上記音響の入力信号と
符号化符号の合成信号との差信号が最小化するように上
記符号化符号を決定し、上記合成信号の合成を行う音響
符号化/復号化装置において、上記音響の入力信号に対
して、p次の線形予測分析を行い、p次の予測係数を求
めるp次の線形予測分析手段12と、上記p次の予測係
数を量子化し、p次の量子化予測係数を作る量子化予測
係数作成手段13と、上記p次の量子化予測係数に基づ
いて、フィルタ係数を決定する第1のフィルタ係数決定
手段13aと、上記音響の入力信号における過去のフレ
ームにおいて、p次の量子化予測係数に基づいてフィル
タ係数が決定された合成フィルタに入力された信号を保
存する信号保存手段15と、上記信号保存手段に保存さ
れた信号に対して、n次の線形予測分析行い、n次の予
測係数を求めるn次の線形予測分析手段43と、上記n
次の予測係数に基づいて、フィルタ係数を決定する第2
のフィルタ係数決定手段43aと、上記複数のディジタ
ルフィルタ44−1と44−2とを縦続接続する接続手
段とを有する音響符号化装置である。また、音響符号化
装置AC3は、音響復号化装置にも適用することができ
る。
The acoustic coding device AC3 is an embodiment corresponding to claim 6, wherein the spectral envelope of the acoustic input signal is modeled by the linear predictive analysis, and the synthesized signal of the acoustic input signal and the coding code is obtained. In the acoustic coding / decoding apparatus that determines the coding code so as to minimize the difference signal between and, and performs p-order linear prediction analysis on the acoustic input signal in the acoustic coding / decoding device. The p-th order linear prediction analysis means 12 for obtaining the p-th order prediction coefficient, the quantized prediction coefficient creating means 13 for quantizing the p-th order prediction coefficient to produce the p-th order quantized prediction coefficient, and the p-th order The first filter coefficient determination unit 13a that determines the filter coefficient based on the quantized prediction coefficient and the filter coefficient is determined based on the p-th quantized prediction coefficient in the past frame in the acoustic input signal. A signal storage unit 15 for storing the signal input to the synthesis filter, and an nth-order linear prediction analysis for performing an nth-order linear prediction analysis on the signal stored in the signal storage unit to obtain an nth-order prediction coefficient. Means 43 and the above n
A second determining filter coefficients based on the following prediction coefficients
Is an acoustic coding apparatus having the filter coefficient determining unit 43a of No. 1 and the connecting unit that cascade-connects the plurality of digital filters 44-1 and 44-2. The acoustic encoding device AC3 can also be applied to an acoustic decoding device.

【0065】音響符号化装置AC3によれば、スペクト
ルを精密に合成することができるという利点がある。
The acoustic encoding device AC3 has an advantage that spectra can be accurately synthesized.

【0066】図7は、本発明のさらに別の実施例である
ポストフィルタ391を示すブロック図である。ポスト
フィルタ391は、従来の音響復号化装置AD1におけ
るポストフィルタ39を改良したものであり、請求項7
に対応する実施例である。
FIG. 7 is a block diagram showing a post filter 391 which is still another embodiment of the present invention. The post filter 391 is an improvement of the post filter 39 in the conventional acoustic decoding device AD1, and
It is an embodiment corresponding to.

【0067】ポストフィルタ391は、音響信号の符号
化符号から得られる(合成される)復号化合成信号に対
して、量子化雑音を聴覚的に抑圧する音響復号化装置に
おいて、過去のフレームを含む上記復号化合成信号に対
して、m次の線形予測分析を行い、m次の予測残差信号
を求めるm次の線形予測分析手段71と、上記LPC逆
フィルタ72を通して得られたm次の予測残差信号に対
して、n次の線形予測分析を行い、n次の予測係数を求
めるn次線形予測手段73と、上記n次の予測係数に基
づいて、フィルタ係数を決定する第1のフィルタ係数決
定手段73aと、上記符号化符号から得られたn次の線
形予測係数によってフィルタ係数を決定する第2のフィ
ルタ係数決定手段32aと、包絡聴覚重み付けフィルタ
74−1と、微細構造聴覚重み付けフィルタ74−2と
を縦続に接続する接続手段とを有する音響復号化装置に
おけるポストフィルタである。
The post filter 391 includes a past frame in the acoustic decoding device which aurally suppresses the quantization noise with respect to the decoded synthetic signal obtained (synthesized) from the encoded code of the acoustic signal. The m-th order linear prediction analysis means 71 for performing the m-th order linear prediction analysis on the decoded combined signal to obtain the m-th order prediction residual signal, and the m-th order prediction obtained through the LPC inverse filter 72. An n-th order linear prediction analysis is performed on the residual signal to obtain an n-th order prediction coefficient, and a first filter for determining a filter coefficient based on the n-th order prediction coefficient. Coefficient determining means 73a, second filter coefficient determining means 32a for determining a filter coefficient based on the nth-order linear prediction coefficient obtained from the above-mentioned code, envelope perceptual weighting filter 74-1, and fine filter A post filter in the acoustic decoding apparatus and a connection means for connecting the concrete perceptual weighting filter 74-2 to cascade.

【0068】ポストフィルタ391によれば、聴覚特性
に適したポストフィルタを作ることができる。
According to the post filter 391, a post filter suitable for hearing characteristics can be made.

【0069】図8は、本発明の別の実施例であるポスト
フィルタ392を示すブロック図である。ポストフィル
タ392は、従来の音響復号化装置AD1におけるポス
トフィルタ39を改良したものであり、請求項8に対応
する実施例である。
FIG. 8 is a block diagram showing a post filter 392 which is another embodiment of the present invention. The post filter 392 is an improvement of the post filter 39 in the conventional acoustic decoding device AD1 and is an embodiment corresponding to claim 8.

【0070】ポストフィルタ392は、音響信号の符号
化符号から合成された復号化合成信号に対して、量子化
雑音を聴覚的に抑圧する音響復号化装置において、過去
のフレームにおいて、上記入力符号から得られたp次の
線形予測係数からフィルタ係数が決定された合成フィル
タに入力された信号を保存する信号保存手段82と、上
記保存された信号に対して、n次の線形予測分析を行
い、n次の予測係数を求めるn次の線形予測手段83
と、上記n次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段83aと、現在のフ
レームにおける上記符号化符号から得られたn次の線形
予測係数によってフィルタ係数を決定する第2のフィル
タ係数決定手段32aと、包絡聴覚重み付けフィルタ8
4−1と、微細構造聴覚重み付けフィルタ84−2と、
フィルタ84−1と84−2とを縦続に接続する接続手
段とを有するポストフィルタである。
The post filter 392 is used in the past in the past frame in the past in the acoustic decoding apparatus which acoustically suppresses the quantization noise in the decoded synthetic signal synthesized from the encoded code of the acoustic signal. A signal storage unit 82 that stores the signal input to the synthesis filter whose filter coefficient is determined from the obtained p-th order linear prediction coefficient, and an n-th order linear prediction analysis on the stored signal. n-th order linear prediction means 83 for obtaining an n-th order prediction coefficient
And a first filter coefficient determination means 83a that determines a filter coefficient based on the nth-order prediction coefficient, and a filter coefficient is determined by the nth-order linear prediction coefficient obtained from the encoding code in the current frame. Second filter coefficient determining means 32a and envelope hearing weighting filter 8
4-1 and the fine structure auditory weighting filter 84-2,
It is a post filter having a connecting means for connecting the filters 84-1 and 84-2 in cascade.

【0071】ポストフィルタ392によれば、聴覚特性
に適したポストフィルタを作ることができる。
According to the post filter 392, a post filter suitable for hearing characteristics can be made.

【0072】[0072]

【発明の効果】本発明によれば、合成信号または入力信
号に対して、低次の線形予測分析を行い、その予測残差
信号に対して高次の線形予測分析を行い、これによって
得られた予測係数を用いるディジタルフィルタによっ
て、従来よりも複雑なパワースペクトル特性を表わすこ
とができるという効果を奏することができる。
According to the present invention, a low-order linear prediction analysis is performed on a composite signal or an input signal, and a high-order linear prediction analysis is performed on the prediction residual signal. With the digital filter using the prediction coefficient, it is possible to exhibit an effect that more complicated power spectrum characteristics can be represented than in the past.

【図面の簡単な説明】[Brief description of drawings]

【図1】図1(1)は、本発明の一実施例である音響符
号化装置AC1を示すブロック図であり、図1(2)
は、本発明の他の実施例である音響符号化装置AC2を
示すブロック図である。
FIG. 1 (1) is a block diagram showing an audio encoding device AC1 which is an embodiment of the present invention, and FIG.
[Fig. 6] is a block diagram showing an audio encoding device AC2 which is another embodiment of the present invention.

【図2】上記実施例における対数パワースペクトル特性
を示す図である。
FIG. 2 is a diagram showing logarithmic power spectrum characteristics in the above embodiment.

【図3】本発明の他の実施例を示すブロック図であり、
従来の音響符号化装置AC4における聴覚重み付けフィ
ルタ21を改良した聴覚重み付けフィルタ211を示す
ブロック図である。
FIG. 3 is a block diagram showing another embodiment of the present invention;
It is a block diagram which shows the perceptual weighting filter 211 which improved the perceptual weighting filter 21 in the conventional acoustic encoding device AC4.

【図4】本発明の別の実施例である聴覚重み付けフィル
タ212を示すブロック図であり、聴覚重み付けフィル
タ212は、従来の音響符号化装置AC4における聴覚
重み付けフィルタ21を改良したフィルタであり、請求
項3に対応する実施例である。
FIG. 4 is a block diagram showing an auditory weighting filter 212 which is another embodiment of the present invention, which is an improved auditory weighting filter 21 in the conventional acoustic encoding device AC4. It is an embodiment corresponding to item 3.

【図5】本発明の他の実施例である聴覚重み付けフィル
タ213を示すブロック図であり、聴覚重み付けフィル
タ213は、従来の音響符号化装置AC4における聴覚
重み付けフィルタ21を改良したフィルタであり、請求
項4に対応する実施例である。
5 is a block diagram showing a perceptual weighting filter 213 which is another embodiment of the present invention, wherein the perceptual weighting filter 213 is a filter obtained by improving the perceptual weighting filter 21 in the conventional acoustic encoding device AC4. It is an example corresponding to item 4.

【図6】本発明のさらに別の実施例である音響符号化装
置AC3を示すブロック図である。
FIG. 6 is a block diagram showing an audio encoding device AC3 which is still another embodiment of the present invention.

【図7】本発明のさらに別の実施例であるポストフィル
タ391を示すブロック図である。ポストフィルタ39
1は、従来の音響復号化装置AD1におけるポストフィ
ルタ39を改良したものであり、請求項7に対応する実
施例である。
FIG. 7 is a block diagram showing a post filter 391 which is still another embodiment of the present invention. Post filter 39
1 is an improvement of the post filter 39 in the conventional audio decoding apparatus AD1, and is an embodiment corresponding to claim 7.

【図8】本発明の別の実施例であるポストフィルタ39
2を示すブロック図である。ポストフィルタ392は、
従来の音響復号化装置AD1におけるポストフィルタ3
9を改良したものであり、請求項8に対応する実施例で
ある。
FIG. 8 is a post filter 39 according to another embodiment of the present invention.
It is a block diagram showing 2. The post filter 392 is
Post filter 3 in conventional audio decoding device AD1
9 is an improved example, and is an embodiment corresponding to claim 8.

【図9】CELP方式による従来の音響符号化装置を示
すブロック図であり、図9(1)は、従来の音響符号化
装置AC4を示すブロック図であり、図9(2)は、従
来の音響符号化装置AC5を示すブロック図である。
FIG. 9 is a block diagram showing a conventional acoustic encoding device based on the CELP method, FIG. 9 (1) is a block diagram showing a conventional acoustic encoding device AC4, and FIG. 9 (2) is a conventional acoustic encoding device. It is a block diagram which shows acoustic encoding device AC5.

【図10】CELP方式による従来の音響復号化装置A
D1を示すブロック図である。
FIG. 10 is a conventional acoustic decoding device A based on the CELP method.
It is a block diagram which shows D1.

【符号の説明】[Explanation of symbols]

AC1、AC2、AC3…音響符号化装置、 12…p次線形予測分析手段、 13…量子化手段、 14…線形予測合成フィルタ、 15…適応符号帳、 16…制御手段、 17、23…利得付与手段、 18…加算手段、 19…減算手段、 21…聴覚重み付けフィルタ、 22…雑音符号帳、 41、51…m次線形予測分析手段、 42、52…LPC逆フィルタ、 43、53…n次線形予測分析手段、 44…線形予測合成フィルタ(n次線形予測合成フィル
タとp次線形予測合成フィルタ)、 AD1…音響復号化装置、 54…ディジタルフィルタ(包絡聴覚重み付けフィルタ
と微細構造聴覚重み付けフィルタ)。
AC1, AC2, AC3 ... Acoustic coding device, 12 ... p-order linear prediction analysis means, 13 ... Quantization means, 14 ... Linear prediction synthesis filter, 15 ... Adaptive codebook, 16 ... Control means, 17, 23 ... Gain addition Means, 18 ... Addition means, 19 ... Subtraction means, 21 ... Auditory weighting filter, 22 ... Noise codebook, 41, 51 ... m-order linear prediction analysis means, 42, 52 ... LPC inverse filter, 43, 53 ... n-order linear Prediction analysis means, 44 ... Linear prediction synthesis filter (nth-order linear prediction synthesis filter and p-th order linear prediction synthesis filter), AD1 ... Acoustic decoding device, 54 ... Digital filter (envelope perceptual weighting filter and fine structure perceptual weighting filter).

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H03H 17/02 681 9274−5J H03H 17/02 681D H03M 7/30 9382−5K H03M 7/30 B (72)発明者 林 伸二 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Internal reference number FI Technical indication location H03H 17/02 681 9274-5J H03H 17/02 681D H03M 7/30 9382-5K H03M 7/30 B (72) Inventor Shinji Hayashi 3-19-2 Nishishinjuku, Shinjuku-ku, Tokyo Inside Nippon Telegraph and Telephone Corporation

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 入力信号系列に対して、p次の線形予測
分析を行い、p次の予測係数を求めるp次線形予測分析
手段と;上記p次の予測係数に基づいて、全極形または
移動平均形ディジタルフィルタのフィルタ係数を決定す
る第1のフィルタ係数決定手段と;入力信号をLPC逆
フィルタに通して、上記p次の線形予測の予測残差とし
て得られた信号系列について、n次の線形予測を行う手
段と;上記n次の予測係数に基づいて、全極形または移
動平均形ディジタルフィルタのフィルタ係数を決定する
第2のフィルタ係数決定手段と;上記p次の線形予測に
よってフィルタ係数が決定された第1の全極形または移
動平均形ディジタルフィルタと;上記n次の線形予測に
よってフィルタ係数が決定された第2の全極形または移
動平均形ディジタルフィルタと;上記第1のフィルタと
上記第2のフィルタとを縦続接続する接続手段と;を有
することを特徴とするディジタルフィルタ。
1. A p-th order linear prediction analysis means for performing a p-th order linear prediction analysis on an input signal sequence to obtain a p-th order prediction coefficient; based on the p-th order prediction coefficient; First filter coefficient determining means for determining a filter coefficient of a moving average type digital filter; an n-th order of a signal sequence obtained as a prediction residual of the p-th order linear prediction by passing an input signal through an LPC inverse filter A second filter coefficient determining means for determining a filter coefficient of the all-pole type or moving average type digital filter based on the n-th order prediction coefficient; and a filter by the p-th order linear prediction. A first all-pole or moving average digital filter whose coefficient is determined; and a second all-pole or moving average digital filter whose filter coefficient is determined by the n-th order linear prediction A digital filter, comprising: a filter; and a connecting unit that cascade-connects the first filter and the second filter.
【請求項2】 音響の入力信号のスペクトル包絡のモデ
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記差信号に対して聴覚特性に応じ
た重み付けを施す音響符号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段と;上記入力をLP
C逆フィルタに通して得られたp次の線形予測の残差信
号に対して、n次の線形予測分析を行い、n次の予測係
数を求めるn次の線形予測分析手段と;上記n次の予測
係数に基づいて、フィルタ係数を決定する第2のフィル
タ係数決定手段と;上記複数のディジタルフィルタを縦
続接続する接続手段と;を有することを特徴とする音響
符号化装置における聴覚重み付けフィルタ。
2. The coding of the acoustic input signal is modeled by a linear predictive analysis, and the coding code is determined so that a difference signal between the acoustic input signal and a composite signal of the coding code is minimized. Then, in the acoustic coding device for weighting the difference signal according to the auditory characteristic, the p-th order linear prediction analysis is performed on the input signal of the sound to obtain the p-th order prediction coefficient. Linear prediction analysis means; first filter coefficient determination means for determining a filter coefficient based on the p-th order prediction coefficient;
An n-th order linear prediction analysis means for performing an n-th order linear prediction analysis on the p-th order linear prediction residual signal obtained through the C inverse filter, and the n-th order linear prediction analysis means; A perceptual weighting filter in an audio encoding device, comprising: a second filter coefficient determining means for determining a filter coefficient based on the prediction coefficient of 1. and a connecting means for cascading the plurality of digital filters.
【請求項3】 音響の入力信号のスペクトル包絡のモデ
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記差信号に対して聴覚特性に応じ
た重み付けを施す音響符号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段と;上記音響の入力
信号における過去のフレームについての合成信号に対し
て、m次の線形予測分析を行い、m次の予測残差信号を
求めるm次の線形予測分析手段と;上記m次の予測残差
信号に基づいて、n次の線形予測分析を行い、n次の予
測係数を求めるn次の線形予測分析手段と;上記n次の
予測係数に基づいて、フィルタ係数を決定する第2のフ
ィルタ係数決定手段と;上記複数のディジタルフィルタ
を縦続接続する接続手段と;を有することを特徴とする
音響符号化装置における聴覚重み付けフィルタ。
3. Modeling of a spectral envelope of an acoustic input signal is performed by linear prediction analysis, and the coding code is determined so that a difference signal between the acoustic input signal and a synthesized signal of the coding code is minimized. Then, in the acoustic coding device for weighting the difference signal according to the auditory characteristic, the p-th order linear prediction analysis is performed on the input signal of the sound to obtain the p-th order prediction coefficient. Linear prediction analysis means; first filter coefficient determination means for determining a filter coefficient based on the p-th order prediction coefficient; m-th order with respect to the synthesized signal of the past frame in the acoustic input signal Linear prediction analysis means for performing linear prediction analysis to obtain an m-th order prediction residual signal; and n-th order linear prediction analysis based on the m-th order prediction residual signal, and an n-th order prediction coefficient N-th order linear prediction An acoustic code comprising: an analyzing means; a second filter coefficient determining means for determining a filter coefficient based on the n-th order prediction coefficient; and a connecting means for cascading the plurality of digital filters. Weighting filter in a digitizer.
【請求項4】 音響の入力信号のスペクトル包絡のモデ
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記差信号に対して聴覚特性に応じ
た重み付けを施す音響符号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段と;上記音響の入力
信号における過去のフレームにおいて、量子化予測係数
に基づいてフィルタ係数が決定された合成フィルタに入
力された信号を保存する信号保存手段と;上記信号保存
手段に保存された信号に対して、n次の線形予測分析行
い、n次の予測係数を求めるn次の線形予測分析手段
と;上記n次の予測係数に基づいて、フィルタ係数を決
定する第2のフィルタ係数決定手段と;上記複数のディ
ジタルフィルタを縦続接続する接続手段と;を有するこ
とを特徴とする音響符号化装置における聴覚重み付けフ
ィルタ。
4. The coding of the acoustic input signal is modeled by a linear predictive analysis, and the coding code is determined so that a difference signal between the acoustic input signal and the synthesized signal of the coding code is minimized. Then, in the acoustic coding device for weighting the difference signal according to the auditory characteristic, the p-th order linear prediction analysis is performed on the input signal of the sound to obtain the p-th order prediction coefficient. Linear prediction analysis means; first filter coefficient determination means that determines a filter coefficient based on the p-th order prediction coefficient; filter coefficient based on a quantized prediction coefficient in a past frame in the acoustic input signal Signal storing means for storing the signal input to the synthesis filter for which n is determined; n-th order linear prediction analysis is performed on the signal stored in the signal storing means to obtain an n-th order prediction coefficient. Linear predictive analysis means; second filter coefficient determination means for determining a filter coefficient based on the nth-order prediction coefficient; and connection means for connecting the plurality of digital filters in cascade. Auditory weighting filter in an audio encoding device that performs audio.
【請求項5】 音響の入力信号のスペクトル包絡のモデ
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記合成信号の合成を行う音響符号
化/復号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数を量子化し、p次の量子化予測
係数を作る量子化予測係数作成手段と;上記p次の量子
化予測係数に基づいて、フィルタ係数を決定する第1の
フィルタ係数決定手段と;過去のフレームにおける合成
信号に対して、m次の線形予測分析を行い、m次の予測
残差信号を求めるm次の線形予測分析手段と;上記m次
の予測残差信号に対して、n次の線形予測分析を行い、
n次の予測係数を求めるn次の線形予測分析手段と;上
記n次の予測係数に基づいて、フィルタ係数を決定する
第2のフィルタ係数決定手段と;上記複数のディジタル
フィルタを縦続接続する接続手段と;を有することを特
徴とする音響符号化/復号化装置。
5. The spectral envelope of an acoustic input signal is modeled by linear prediction analysis, and the coding code is determined so that a difference signal between the acoustic input signal and a synthesized signal of the coding code is minimized. Then, in the acoustic encoding / decoding device for synthesizing the synthesized signal, a p-th order linear prediction analysis means for performing a p-th order linear prediction analysis on the sound input signal to obtain a p-th order prediction coefficient. A quantized prediction coefficient creating unit that quantizes the p-th order prediction coefficient to create a p-th order quantized prediction coefficient; and a first filter that determines a filter coefficient based on the p-th order quantized prediction coefficient. Coefficient determining means; m-th order linear prediction analysis means for performing m-th order linear prediction analysis on the combined signal in the past frame to obtain an m-th order prediction residual signal; and the m-th order prediction residual signal For n-th order linear prediction analysis There,
n-th order linear prediction analysis means for obtaining an n-th order prediction coefficient; second filter coefficient determining means for determining a filter coefficient based on the n-th order prediction coefficient; and a connection for cascading the plurality of digital filters. And an audio encoding / decoding device.
【請求項6】 音響の入力信号のスペクトル包絡のモデ
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記合成信号の合成を行う音響符号
化/復号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数を量子化し、p次の量子化予測
係数を作る量子化予測係数作成手段と;上記p次の量子
化予測係数に基づいて、フィルタ係数を決定する第1の
フィルタ係数決定手段と;上記音響の入力信号における
過去のフレームにおいて、p次の量子化予測係数に基づ
いてフィルタ係数が決定された合成フィルタに入力され
た信号を保存する信号保存手段と;上記信号保存手段に
保存された信号に対して、n次の線形予測分析行い、n
次の予測係数を求めるn次の線形予測分析手段と;上記
n次の予測係数に基づいて、フィルタ係数を決定する第
2のフィルタ係数決定手段と;上記複数のディジタルフ
ィルタを縦続接続する接続手段と;を有することを特徴
とする音響符号化/復号化装置。
6. Modeling of a spectral envelope of an acoustic input signal is performed by linear prediction analysis, and the coded code is determined so that a difference signal between the acoustic input signal and a coded code composite signal is minimized. Then, in the acoustic encoding / decoding device for synthesizing the synthesized signal, a p-th order linear prediction analysis means for performing a p-th order linear prediction analysis on the sound input signal to obtain a p-th order prediction coefficient. A quantized prediction coefficient creating unit that quantizes the p-th order prediction coefficient to create a p-th order quantized prediction coefficient; and a first filter that determines a filter coefficient based on the p-th order quantized prediction coefficient. Coefficient determining means; signal saving means for saving a signal input to a synthesis filter in which a filter coefficient has been determined based on a p-th order quantized prediction coefficient in a past frame in the acoustic input signal; Against the stored signal to the stage, n next performs linear prediction analysis, n
N-th order linear prediction analysis means for obtaining the next prediction coefficient; second filter coefficient determination means for determining a filter coefficient based on the n-th order prediction coefficient; and connection means for cascading the plurality of digital filters And an audio encoding / decoding device.
【請求項7】 音響信号の符号化符号から得られる復号
化合成信号に対して、量子化雑音を聴覚的に抑圧する音
響復号化装置において、 過去のフレームを含む上記復号化合成信号に対して、m
次の線形予測分析を行い、m次の予測残差信号を求める
m次の線形予測分析手段と;LPC逆フィルタを通して
得られたm次の予測残差信号に対して、n次の線形予測
分析を行い、n次の予測係数を求めるn次線形予測手段
と;上記n次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段と;上記符号化符号
から得られたn次の線形予測係数によってフィルタ係数
を決定する第2のフィルタ係数決定手段と;包絡聴覚重
み付けフィルタと;微細構造聴覚重み付けフィルタと;
上記包絡聴覚重み付けフィルタと微細構造聴覚重み付け
フィルタとを縦続に接続する接続手段と;を有すること
を特徴とする音響復号化装置におけるポストフィルタ。
7. An audio decoding device for acoustically suppressing quantization noise for a decoded combined signal obtained from an encoded code of an audio signal, wherein the decoded combined signal including a past frame is ... , M
An m-th order linear prediction analysis means for performing the following linear prediction analysis to obtain an m-th order prediction residual signal; and an n-th order linear prediction analysis for the m-th order prediction residual signal obtained through the LPC inverse filter. And an nth-order linear prediction means for obtaining an nth-order prediction coefficient; a first filter coefficient determination means for determining a filter coefficient based on the nth-order prediction coefficient; and n obtained from the coded code. Second filter coefficient determining means for determining a filter coefficient by the following linear prediction coefficient; an envelope perceptual weighting filter; a fine structure perceptual weighting filter;
A post filter in an audio decoding device, comprising: connecting means for connecting the envelope perceptual weighting filter and the fine structure perceptual weighting filter in cascade.
【請求項8】 音響信号の符号化符号から合成された復
号化合成信号に対して、量子化雑音を聴覚的に抑圧する
音響復号化装置において、 過去のフレームにおいて、上記入力符号から得られたp
次の線形予測係数からフィルタ係数が決定された合成フ
ィルタに入力された信号を保存する信号保存手段と;上
記保存された信号に対して、n次の線形予測分析を行
い、n次の予測係数を求めるn次の線形予測手段と;上
記n次の予測係数に基づいて、フィルタ係数を決定する
第1のフィルタ係数決定手段と;現在のフレームにおけ
る上記符号化符号から得られたn次の線形予測係数によ
ってフィルタ係数を決定する第2のフィルタ係数決定手
段と;包絡聴覚重み付けフィルタと;微細構造聴覚重み
付けフィルタと;上記包絡聴覚重み付けフィルタと上記
微細構造聴覚重み付けフィルタとを縦続に接続する接続
手段と;を有することを特徴とする音響復号化装置にお
けるポストフィルタ。
8. An acoustic decoding device for acoustically suppressing quantization noise for a decoded synthetic signal synthesized from an encoded code of an acoustic signal, obtained from the input code in a past frame. p
Signal saving means for saving the signal input to the synthesis filter whose filter coefficient is determined from the next linear prediction coefficient; and n-th order linear prediction analysis for the saved signal, and the nth order prediction coefficient An n-th order linear predicting means for determining: a first filter coefficient determining means for determining a filter coefficient based on the n-th order predictive coefficient; and an n-th order linear coefficient obtained from the coding code in the current frame. Second filter coefficient determining means for determining a filter coefficient based on a prediction coefficient; envelope perceptual weighting filter; fine structure perceptual weighting filter; connection means for connecting the envelope perceptual weighting filter and the fine structure perceptual weighting filter in cascade. And a post filter in an audio decoding device.
JP09604096A 1996-03-25 1996-03-25 Digital filter and acoustic encoding / decoding device Expired - Fee Related JP3248668B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09604096A JP3248668B2 (en) 1996-03-25 1996-03-25 Digital filter and acoustic encoding / decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09604096A JP3248668B2 (en) 1996-03-25 1996-03-25 Digital filter and acoustic encoding / decoding device

Publications (2)

Publication Number Publication Date
JPH09258795A true JPH09258795A (en) 1997-10-03
JP3248668B2 JP3248668B2 (en) 2002-01-21

Family

ID=14154388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09604096A Expired - Fee Related JP3248668B2 (en) 1996-03-25 1996-03-25 Digital filter and acoustic encoding / decoding device

Country Status (1)

Country Link
JP (1) JP3248668B2 (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0998166A1 (en) * 1998-10-30 2000-05-03 Koninklijke Philips Electronics N.V. Device for audio processing,receiver and method for filtering the wanted signal and reproducing it in presence of ambient noise
EP1052622A2 (en) * 1999-05-11 2000-11-15 Nippon Telegraph and Telephone Corporation Selection of a synthesis filter for CELP type wideband audio coding
WO2002013183A1 (en) * 2000-08-09 2002-02-14 Sony Corporation Voice data processing device and processing method
JP2002062899A (en) * 2000-08-23 2002-02-28 Sony Corp Device and method for data processing, device and method for learning and recording medium
JP2002149175A (en) * 2000-11-14 2002-05-24 Sony Corp Device and method for processing sound, device and method for learning and recording medium
JP2004517348A (en) * 2000-10-17 2004-06-10 クゥアルコム・インコーポレイテッド High performance low bit rate coding method and apparatus for non-voice speech
US6859775B2 (en) 2001-03-06 2005-02-22 Ntt Docomo, Inc. Joint optimization of excitation and model parameters in parametric speech coders
US7283961B2 (en) 2000-08-09 2007-10-16 Sony Corporation High-quality speech synthesis device and method by classification and prediction processing of synthesized sound
JP2009508146A (en) * 2005-05-31 2009-02-26 マイクロソフト コーポレーション Audio codec post filter
JP2009210645A (en) * 2008-02-29 2009-09-17 Nippon Telegr & Teleph Corp <Ntt> Encoding device, decoding device, encoding method, decoding method, program, and recording medium
US8027242B2 (en) 2005-10-21 2011-09-27 Qualcomm Incorporated Signal coding and decoding based on spectral dynamics
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62111299A (en) * 1985-11-08 1987-05-22 松下電器産業株式会社 Voice signal feature extraction circuit
JPH02157800A (en) * 1988-12-09 1990-06-18 Oki Electric Ind Co Ltd Feature extracting system
JPH0477799A (en) * 1990-07-19 1992-03-11 Oki Electric Ind Co Ltd Feature amount extracting method for pitch signal
JPH05257498A (en) * 1992-03-11 1993-10-08 Mitsubishi Electric Corp Voice coding system
JPH06250697A (en) * 1993-02-26 1994-09-09 Fujitsu Ltd Method and device for voice coding and decoding
JPH09297597A (en) * 1996-03-06 1997-11-18 Fujitsu Ltd High-efficiency speech transmission system and high-efficiency speech transmission device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62111299A (en) * 1985-11-08 1987-05-22 松下電器産業株式会社 Voice signal feature extraction circuit
JPH02157800A (en) * 1988-12-09 1990-06-18 Oki Electric Ind Co Ltd Feature extracting system
JPH0477799A (en) * 1990-07-19 1992-03-11 Oki Electric Ind Co Ltd Feature amount extracting method for pitch signal
JPH05257498A (en) * 1992-03-11 1993-10-08 Mitsubishi Electric Corp Voice coding system
JPH06250697A (en) * 1993-02-26 1994-09-09 Fujitsu Ltd Method and device for voice coding and decoding
JPH09297597A (en) * 1996-03-06 1997-11-18 Fujitsu Ltd High-efficiency speech transmission system and high-efficiency speech transmission device

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0998166A1 (en) * 1998-10-30 2000-05-03 Koninklijke Philips Electronics N.V. Device for audio processing,receiver and method for filtering the wanted signal and reproducing it in presence of ambient noise
EP1052622A2 (en) * 1999-05-11 2000-11-15 Nippon Telegraph and Telephone Corporation Selection of a synthesis filter for CELP type wideband audio coding
EP1052622A3 (en) * 1999-05-11 2001-12-05 Nippon Telegraph and Telephone Corporation Selection of a synthesis filter for CELP type wideband audio coding
US6810381B1 (en) 1999-05-11 2004-10-26 Nippon Telegraph And Telephone Corporation Audio coding and decoding methods and apparatuses and recording medium having recorded thereon programs for implementing them
US7283961B2 (en) 2000-08-09 2007-10-16 Sony Corporation High-quality speech synthesis device and method by classification and prediction processing of synthesized sound
WO2002013183A1 (en) * 2000-08-09 2002-02-14 Sony Corporation Voice data processing device and processing method
US7912711B2 (en) 2000-08-09 2011-03-22 Sony Corporation Method and apparatus for speech data
JP2002062899A (en) * 2000-08-23 2002-02-28 Sony Corp Device and method for data processing, device and method for learning and recording medium
JP2004517348A (en) * 2000-10-17 2004-06-10 クゥアルコム・インコーポレイテッド High performance low bit rate coding method and apparatus for non-voice speech
JP4517262B2 (en) * 2000-11-14 2010-08-04 ソニー株式会社 Audio processing device, audio processing method, learning device, learning method, and recording medium
JP2002149175A (en) * 2000-11-14 2002-05-24 Sony Corp Device and method for processing sound, device and method for learning and recording medium
US6859775B2 (en) 2001-03-06 2005-02-22 Ntt Docomo, Inc. Joint optimization of excitation and model parameters in parametric speech coders
JP2009508146A (en) * 2005-05-31 2009-02-26 マイクロソフト コーポレーション Audio codec post filter
US8027242B2 (en) 2005-10-21 2011-09-27 Qualcomm Incorporated Signal coding and decoding based on spectral dynamics
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
JP2009210645A (en) * 2008-02-29 2009-09-17 Nippon Telegr & Teleph Corp <Ntt> Encoding device, decoding device, encoding method, decoding method, program, and recording medium

Also Published As

Publication number Publication date
JP3248668B2 (en) 2002-01-21

Similar Documents

Publication Publication Date Title
JP3481390B2 (en) How to adapt the noise masking level to a synthetic analysis speech coder using a short-term perceptual weighting filter
US5307441A (en) Wear-toll quality 4.8 kbps speech codec
EP0503684B1 (en) Adaptive filtering method for speech and audio
JP3707116B2 (en) Speech decoding method and apparatus
EP0981816B1 (en) Audio coding systems and methods
JP3234609B2 (en) Low-delay code excitation linear predictive coding of 32Kb / s wideband speech
JPH09212199A (en) Linear predictive analyzing method for audio frequency signal and method for coding and decoding audio frequency signal including its application
JPH0869299A (en) Voice coding method, voice decoding method and voice coding/decoding method
JPH1091194A (en) Method of voice decoding and device therefor
JPH10187196A (en) Low bit rate pitch delay coder
JPH10124092A (en) Method and device for encoding speech and method and device for encoding audible signal
JP3248668B2 (en) Digital filter and acoustic encoding / decoding device
JP3180786B2 (en) Audio encoding method and audio encoding device
JP3095133B2 (en) Acoustic signal coding method
JP2000132193A (en) Signal encoding device and method therefor, and signal decoding device and method therefor
JP3916934B2 (en) Acoustic parameter encoding, decoding method, apparatus and program, acoustic signal encoding, decoding method, apparatus and program, acoustic signal transmitting apparatus, acoustic signal receiving apparatus
JPH07168596A (en) Voice recognizing device
JP3192051B2 (en) Audio coding device
JPH06202698A (en) Adaptive post filter
JP3520955B2 (en) Acoustic signal coding
JP2853170B2 (en) Audio encoding / decoding system
JP3024467B2 (en) Audio coding device
JP3071800B2 (en) Adaptive post filter
Tseng An analysis-by-synthesis linear predictive model for narrowband speech coding
JP3274451B2 (en) Adaptive postfilter and adaptive postfiltering method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071109

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081109

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees