JP3248668B2 - Digital filter and acoustic encoding / decoding device - Google Patents
Digital filter and acoustic encoding / decoding deviceInfo
- Publication number
- JP3248668B2 JP3248668B2 JP09604096A JP9604096A JP3248668B2 JP 3248668 B2 JP3248668 B2 JP 3248668B2 JP 09604096 A JP09604096 A JP 09604096A JP 9604096 A JP9604096 A JP 9604096A JP 3248668 B2 JP3248668 B2 JP 3248668B2
- Authority
- JP
- Japan
- Prior art keywords
- filter
- coefficient
- signal
- linear prediction
- order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明は、線形予測係数をフ
ィルタ係数として使用するディジタルフィルタに係り、
特に、音声や楽音等の音響信号の符号化において、聴覚
特性を考慮した重み付けを行う聴覚重み付けフィルタ、
音響信号の符号化符号の復号化合成における合成フィル
タ、復号化合成信号の量子化雑音を聴覚特性に基づいて
抑圧するポストフィルタ等の音響信号処理用の全極形ま
たは移動平均形ディジタルフィルタに関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital filter using a linear prediction coefficient as a filter coefficient,
In particular, in the encoding of audio signals such as voice and musical sound, an auditory weighting filter that performs weighting in consideration of auditory characteristics,
The present invention relates to an all-pole or moving average digital filter for audio signal processing, such as a synthesis filter for decoding and synthesizing an encoded code of an audio signal, and a post filter for suppressing quantization noise of the decoded synthesized signal based on auditory characteristics.
【0002】[0002]
【従来の技術】線形予測によって求められた線形係数を
符号化することによって、音響信号を低ビットレートに
符号化する方法の典型として、CELP(Code E
xcited Linear Prediction:
符号励振線形予測)方式が、従来、知られている。2. Description of the Related Art As a typical method of encoding an audio signal at a low bit rate by encoding linear coefficients obtained by linear prediction, CELP (Code E) is used.
xcited Linear Prediction:
A code excitation linear prediction) method is conventionally known.
【0003】図9は、上記CELP方式による従来の音
響符号化装置を示すブロック図であり、図9(1)は、
従来の音響符号化装置AC4を示すブロック図である。FIG. 9 is a block diagram showing a conventional acoustic encoding apparatus based on the CELP method. FIG.
It is a block diagram which shows the conventional acoustic encoding device AC4.
【0004】この音響符号化装置AC4において、入力
端子11に入力された入力音声信号は、5〜20ms程
度のフレーム毎に、線形予測分析手段12で線形予測分
析され、p次の線形予測係数α0i(i=1、2、……、
p)が求められる。なお、「線形予測分析」は、音声信
号のサンプル値が、それ以前の時刻のいくつかのサンプ
ル値の線形結合で近似されるという考え方に基づくもの
である。In the audio coding apparatus AC4, the input speech signal input to the input terminal 11 is subjected to linear prediction analysis by the linear prediction analysis means 12 for each frame of about 5 to 20 ms, and a p-order linear prediction coefficient α 0i (i = 1, 2,...,
p) is required. The “linear prediction analysis” is based on the idea that a sample value of an audio signal is approximated by a linear combination of some sample values at an earlier time.
【0005】そして、線形予測分析手段12が出力した
線形予測係数α0iは、量子化手段13で量子化され、こ
の量子化線形予測係数α0iは、フィルタ係数として、線
形予測合成フィルタ14に設定される。合成フィルタ1
4の伝達関数h(z)は、次の式(1)で表わされる。The linear prediction coefficient α 0i output from the linear prediction analysis means 12 is quantized by the quantization means 13, and the quantized linear prediction coefficient α 0i is set as a filter coefficient in the linear prediction synthesis filter 14. Is done. Synthesis filter 1
The transfer function h (z) of No. 4 is expressed by the following equation (1).
【0006】[0006]
【数1】 合成フィルタ14へ入力されるべき励振信号(加算手段
18が出力した信号)が適応符号帳15に記憶され、制
御手段16が出力する符号に応じたピッチ周期で、適応
符号帳15から励振信号(ベクトル)が切り出され、こ
れが繰り返されてフレーム長とされ、利得付与手段17
によって利得が付与され、加算手段18を通じて、励振
信号として、合成フィルタ14へ供給される。(Equation 1) The excitation signal to be input to the synthesis filter 14 (the signal output from the adding means 18) is stored in the adaptive codebook 15, and the excitation signal (from the adaptive codebook 15 at a pitch cycle corresponding to the code output from the control means 16). Vector) is cut out, and this is repeated to obtain a frame length.
, And is supplied to the synthesis filter 14 as an excitation signal through the addition means 18.
【0007】合成フィルタ14が出力する合成信号が、
減算手段19によって、入力信号から引かれ、この引か
れた差分信号は、聴覚重み付けフィルタ21によって、
聴覚特性のマスキング特性(?)と対応した重み付けが
なされ、この重み付けされた差信号のエネルギーが最小
になるように、適応符号帳15の入力符号(つまリピッ
チ周期)が、制御手段16によって探索される。The synthesized signal output from the synthesis filter 14 is
It is subtracted from the input signal by the subtraction means 19, and the subtracted difference signal is obtained by the auditory weighting filter 21.
The weighting corresponding to the masking characteristic (?) Of the auditory characteristic is performed, and the control unit 16 searches for the input code (trimming pitch period) of the adaptive codebook 15 so that the energy of the weighted difference signal is minimized. You.
【0008】その後、制御手段16の制御によって、雑
音符号帳22から励振ベクトルが順次取り出され、利得
付与手段23で利得が付与された後、この利得が付与さ
れた励振ベクトルと、先に選択した適応符号帳15から
の励振ベクトルとが、加算手段18によって加算され、
励振信号として合成フィルタ14へ供給され、上記と同
様に、聴覚重み付けフィルタ21が出力する差信号のエ
ネルギーが最小になるような励振ベクトル(利得付与手
段17が出力する励振ベクトルと、利得付与手段23が
出力する励振ベクトルとの組合せ)が選択される。After that, under the control of the control means 16, the excitation vectors are sequentially extracted from the noise codebook 22, and the gain is applied by the gain applying means 23. The excitation vector from the adaptive codebook 15 is added by the adding means 18,
The excitation vector is supplied to the synthesis filter 14 as an excitation signal, and in the same manner as described above, the excitation vector (the excitation vector output by the gain applying unit 17 and the excitation vector Is selected in combination with the excitation vector output by the.
【0009】最後に、上記のように選択された適応符号
帳15と雑音符号帳22とが出力する各励振ベクトルに
対して、それぞれ利得付与手段17、23が所定の利得
を付与し、このときにおける聴覚重み付けフィルタ21
の出力信号のエネルギーが最小になるような各利得が探
索される。Finally, gain applying means 17 and 23 apply predetermined gains to the respective excitation vectors output from the adaptive codebook 15 and the noise codebook 22 selected as described above. Weighting filter 21 in
Is searched for such that the energy of the output signal is minimized.
【0010】量子化していない線形予測係数αi と、2
つの1以下の定数γ1、γ2とを用いて、次の式(2)
によって伝達関数w(z)が求められ、この伝達関数w
(z)が聴覚重み付けフィルタ21に使用される。The unquantized linear prediction coefficients α i and 2
Using two constants γ1 and γ2 of 1 or less, the following equation (2)
The transfer function w (z) is obtained by
(Z) is used for the auditory weighting filter 21.
【0011】[0011]
【数2】 量子化線形予測係数を示す符号と、適応符号帳15、雑
音符号帳22でそれぞれ選択された励振ベクトルを示す
各符号と、利得付与手段17、23に与えられた各最適
利得を示す符号とが、音響符号化装置AC4の出力とさ
れる。(Equation 2) A code indicating the quantized linear prediction coefficient, a code indicating the excitation vector selected in each of the adaptive codebook 15 and the noise codebook 22, and a code indicating each optimal gain given to the gain applying means 17 and 23 , The output of the audio encoding device AC4.
【0012】図9(2)は、従来の音響符号化装置AC
5を示すブロック図である。FIG. 9 (2) shows a conventional audio coding apparatus AC.
FIG.
【0013】音響符号化装置AC5は、音響符号化装置
AC4において、線形予測フィルタ14と聴覚重み付け
フィルタ21とを合成した聴覚重み付き合成フィルタ2
4を、線形予測フィルタ14の代わりに設けたものであ
る。この場合、入力端子11からの入力信号を、聴覚重
み付けフィルタ21を通して、減算手段19へ供給す
る。The acoustic encoding device AC5 is an acoustic encoding device AC4. The acoustic encoding device AC5 is composed of a perceptual weighted synthesis filter 2 obtained by synthesizing the linear prediction filter 14 and the perceptual weighting filter 21.
4 is provided in place of the linear prediction filter 14. In this case, the input signal from the input terminal 11 is supplied to the subtraction means 19 through the auditory weighting filter 21.
【0014】図10は、従来のCELP方式による従来
の音響復号化装置AD1を示すブロック図である。FIG. 10 is a block diagram showing a conventional acoustic decoding device AD1 based on the conventional CELP method.
【0015】音響復号化装置AD1において、入力端子
31から入力された入力符号中の線形予測係数符号が逆
量子化手段32によって逆量子化され、この逆量子化線
形予測係数は、フィルタ係数として、線形予測フィルタ
33に設定される。入力符号中のピッチ符号によって、
適応符号帳34から励振ベクトルが切り出され、また、
雑音符号によって、雑音符号帳35から励振ベクトルが
選択され、これら符号帳34、35からの各励振ベクト
ルは、利得付与手段36、37によって、入力符号中の
利得符号に応じて、それぞれ利得が付与された後、加算
手段38によって加算され、励振信号として合成フィル
タ33に与えられる。聴覚特性を考慮して量子化雑音が
小さくなるように、合成フィルタ33からの合成信号が
ポストフィルタ39で処理され、出力される。In the audio decoding device AD1, the linear predictive coefficient code in the input code input from the input terminal 31 is inversely quantized by the inverse quantizing means 32. The inverse quantized linear predictive coefficient is used as a filter coefficient. The linear prediction filter 33 is set. Depending on the pitch code in the input code,
An excitation vector is cut out from the adaptive codebook 34, and
The excitation vector is selected from the noise codebook 35 by the noise code, and the excitation vectors from the codebooks 34 and 35 are given gains by the gain applying means 36 and 37 according to the gain code in the input code. Thereafter, the signals are added by the adding means 38 and supplied to the synthesis filter 33 as an excitation signal. The synthesized signal from the synthesis filter 33 is processed by the post filter 39 and output so that the quantization noise is reduced in consideration of the auditory characteristics.
【0016】[0016]
【発明が解決しようとする課題】従来のCELP等の時
間領域における音響信号符号化装置において、従来の聴
覚重み付けフィルタ、合成フィルタ、ポストフィルタ
は、音声のフォルマントをモデル化できる10〜20次
程度の線形予測によって、フィルタ係数を決定するの
で、周波数領域において定常的で多数かつ不等間隔のピ
ークを有する音響信号の微細なスペクトル構造を表現す
ることができない。In the conventional audio signal encoding apparatus in the time domain such as CELP, the conventional perceptual weighting filter, synthesis filter, and post-filter are of the order of 10 to 20 which can model the formant of speech. Since the filter coefficients are determined by the linear prediction, it is not possible to represent a fine spectral structure of an acoustic signal having a large number of unequally spaced peaks that are stationary in the frequency domain.
【0017】したがって、微細なスペクトル構造を有す
る合成信号を得るには、合成フィルタに入力される励振
信号が、その微細スペクトル構造の情報を有する必要が
あり、この微細スペクトル構造の情報を有する励振信号
を符号化するには、多大な情報ビットが必要であり、ま
た、CELP等の符号帳探索型の符号化方式では、励振
信号を符号化するために符号帳探索に多大な演算量を必
要とし、実時間での処理が不可能であるという問題があ
る。Therefore, in order to obtain a composite signal having a fine spectral structure, the excitation signal input to the synthesis filter needs to have information on the fine spectral structure. Requires a large amount of information bits, and a codebook search-type coding scheme such as CELP requires a large amount of calculation for codebook search to code the excitation signal. However, there is a problem that processing in real time is impossible.
【0018】また、微細スペクトル構造を表現する手段
として、線形予測の次数を単純に増加する手法が考えら
れるが、この手法によれば、求められた予測係数を量子
化する方法と比較すると、予測係数を求める過程に必要
な計算精度では、予測次数を上げることができないとい
う問題がある。As a means for expressing the fine spectrum structure, a method of simply increasing the order of linear prediction can be considered. According to this method, when compared with a method of quantizing the obtained prediction coefficient, the prediction There is a problem that the prediction order cannot be increased with the calculation accuracy required for the process of obtaining the coefficients.
【0019】また、上記従来例において、聴覚重み付
け、雑音抑圧は、10〜20次程度の線形予測係数、単
一のピッチ周波数等のパラメータのみで制御されるの
で、微細なスペクトル構造を考慮した細かな制御は不可
能であるという問題がある。In the above-mentioned conventional example, the auditory weighting and noise suppression are controlled only by parameters such as linear prediction coefficients of about the order of 10 to 20 and a single pitch frequency. Control is impossible.
【0020】本発明は、音声を含む音響信号の微細スペ
クトル構造、この微細スペクトル構造に基づいた聴覚重
み付け、雑音抑圧を、ディジタルフィルタとして提供す
るものである。The present invention provides, as a digital filter, a fine spectral structure of an audio signal including speech, auditory weighting and noise suppression based on the fine spectral structure.
【0021】[0021]
【課題を解決するための手段】請求項1の発明は、入力
信号に対してp次の線形予測分析を行い、このp次の線
形予測係数からフィルタ係数を決定し、p次の線形予測
によって求められた予測残差信号に対して、n次の線形
予測を行い、n次の線形予測係数からフィルタ係数を決
定し、それぞれ求められた全極型または移動平均型ディ
ジタルフィルタを縦続に接続したディジタルフィルタで
ある。According to a first aspect of the present invention, a p-order linear prediction analysis is performed on an input signal, and a filter coefficient is determined from the p-th linear prediction coefficient. The obtained prediction residual signal is subjected to nth-order linear prediction, a filter coefficient is determined from the nth-order linear prediction coefficient, and the obtained all-pole or moving average digital filters are connected in cascade. It is a digital filter.
【0022】請求項2の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
符号化装置において、聴覚特性に応じた重み付けを、差
信号に対して施す全極型または移動平均型ディジタルフ
ィルタとして、入力信号に対してp次の線形予測分析を
行い、p次の線形予測係数からフィルタ係数を決定し、
p次の線形予測によって求められた予測残差信号に対
し、n次の線形予測分析を行い、n次の線形予測係数か
らフィルタ係数を決定し、それぞれ求められた全極型ま
たは移動平均型ディジタルフィルタを縦続に接続した音
響符号化装置である。According to a second aspect of the present invention, there is provided an encoding apparatus for determining an encoding code so that a difference signal between an acoustic input signal and a synthesized signal is minimized. As an all-pole or moving average digital filter to be applied, a p-order linear prediction analysis is performed on the input signal, and a filter coefficient is determined from the p-order linear prediction coefficient.
An nth-order linear prediction analysis is performed on the prediction residual signal obtained by the pth-order linear prediction, and a filter coefficient is determined from the nth-order linear prediction coefficient. This is an acoustic encoding device in which filters are connected in cascade.
【0023】請求項3の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
符号化装置において、聴覚特性に応じた重み付けを差信
号に対して施す全極型または移動平均型ディジタルフィ
ルタとして、入力信号に対してp次の線形予測分析を行
い、p次の線形予測係数からフィルタ係数を決定し、過
去のフレームにおける合成信号に対してm次の線形予測
分析を行い、m次の線形予測分析によって求められた予
測残差信号に対してn次の線形予測分析を行い、n次の
線形予測係数からフィルタ係数を決定し、それぞれ求め
られたディジタルフィルタを縦続に接続した音響符号化
装置である。なお、上記mは、pと等しいものでもよ
く、多少異なるものでもよい。According to a third aspect of the present invention, in a coding apparatus that determines a coding code so that a difference signal between an acoustic input signal and a synthesized signal is minimized, weighting is performed on the difference signal in accordance with auditory characteristics. As an all-pole or moving average digital filter, a p-order linear prediction analysis is performed on the input signal, a filter coefficient is determined from the p-th linear prediction coefficient, and an m-th order The linear prediction analysis is performed, the n-th linear prediction analysis is performed on the prediction residual signal obtained by the m-th linear prediction analysis, the filter coefficients are determined from the n-th linear prediction coefficients, and the digital coefficients respectively obtained are determined. This is an acoustic encoding device in which filters are connected in cascade. Note that the above m may be equal to p or slightly different.
【0024】請求項4の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
符号化装置において、聴覚特性に応じた重み付けを、差
信号に対して施す全極型または移動平均型ディジタルフ
ィルタとして、入力信号に対してp次の線形予測分析を
行い、p次の線形予測係数からフィルタ係数を決定し、
過去のフレームにおいて量子化線形予測係数からフィル
タ係数が決定された合成フィルタヘの入力信号を保存
し、この保存された信号に対してn次の線形予測分析を
行い、n次の線形予測係数からフィルタ係数を決定し、
それぞれ求められたディジタルフィルタを縦続に接続し
た音響符号化装置である。According to a fourth aspect of the present invention, there is provided an encoding apparatus for determining an encoding code such that a difference signal between an acoustic input signal and a synthesized signal is minimized. As an all-pole or moving average digital filter to be applied, a p-order linear prediction analysis is performed on the input signal, and a filter coefficient is determined from the p-order linear prediction coefficient.
An input signal to a synthesis filter in which a filter coefficient is determined from a quantized linear prediction coefficient in a past frame is stored, an n-order linear prediction analysis is performed on the stored signal, and a filter is performed based on the n-th linear prediction coefficient. Determine the coefficient,
This is an acoustic encoding device in which digital filters obtained in each case are connected in cascade.
【0025】請求項5の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
音響符号化/復号化装置において、合成信号の合成を行
うディジタルフィルタとして、入力信号に対してp次の
線形予測分析を行い、このp次の予測係数を量子化して
量子化予測係数を作り、p次の予測係数と量子化予測係
数とからそれぞれフィルタ係数を決定し、過去のフレー
ムにおける合成信号に対してm次の線形予測分析を行
い、m次の線形予測によって求められた予測残差信号に
対してn次の線形予測分析を行い、n次の線形予測係数
からフィルタ係数を決定し、それぞれ求められたディジ
タルフィルタを縦続に接続した音響符号化/復号化装置
である。なお、mは、pと等しいものでもよく、多少異
なるものでもよい。According to a fifth aspect of the present invention, a digital filter for synthesizing a composite signal is provided in an audio encoding / decoding apparatus which determines an encoding code so as to minimize a difference signal between the audio input signal and the composite signal. Performs a p-order linear prediction analysis on the input signal, quantizes the p-order prediction coefficient to generate a quantized prediction coefficient, and determines filter coefficients from the p-order prediction coefficient and the quantized prediction coefficient, respectively. Performs an m-th linear prediction analysis on the synthesized signal in the past frame, performs an n-th linear prediction analysis on the prediction residual signal obtained by the m-th linear prediction, and obtains an n-th linear prediction coefficient , A filter coefficient is determined from, and the digital filter obtained is connected in cascade. Note that m may be equal to p or slightly different.
【0026】請求項5の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
音響符号化/復号化装置において、合成信号の合成を行
うディジタルフィルタとして、入力信号に対してp次の
線形予測分析を行い、p次の予測係数を量子化して量子
化予測係数を作り、p次の量子化予測係数からフィルタ
係数を決定し、過去のフレームにおける合成信号に対し
てm次の線形予測分析を行い、m次の線形予測によって
求められた予測残差信号に対してn次の線形予測分析を
行い、n次の線形予測係数からフィルタ係数を決定し、
それぞれ求められたディジタルフィルタを縦続に接続す
る音響符号化/復号化装置である。なお、mは、pと等
しいものでもよく、多少異なっているものでもよい。According to a fifth aspect of the present invention, a digital filter for synthesizing a composite signal is provided in an audio encoding / decoding apparatus which determines an encoding code so that a difference signal between the audio input signal and the composite signal is minimized. , Performs a p-order linear prediction analysis on the input signal, quantizes the p-th prediction coefficient to generate a quantized prediction coefficient, determines a filter coefficient from the p-th quantization prediction coefficient, and performs synthesis in a past frame. An m-order linear prediction analysis is performed on the signal, an n-th linear prediction analysis is performed on the prediction residual signal obtained by the m-th linear prediction, and a filter coefficient is determined from the n-th linear prediction coefficient. ,
This is an audio encoding / decoding device that connects the digital filters obtained in cascade. Note that m may be equal to p or slightly different.
【0027】請求項6の発明は、音響入力信号と合成信
号との差信号が最小になるように符号化符号を決定する
符号化/復号化装置において、合成信号の合成を行うデ
ィジタルフィルタとして、入力信号に対してp次の線形
予測分析を行い、p次の予測係数を量子化して量子化予
測係数を作り、p次の量子化予測係数からフィルタ係数
を決定し、過去のフレームにおいてp次の量子化線形予
測係数からフィルタ係数が決定された合成フィルタに入
力された信号を保存し、保存された信号に対してn次の
線形予測を行い、n次の線形予測係数からフィルタ係数
を決定し、それぞれ求められたディジタルフィルタを縦
続に接続する音響符号化/復号化装置である。According to a sixth aspect of the present invention, there is provided an encoding / decoding device for determining an encoding code such that a difference signal between an acoustic input signal and a synthesized signal is minimized, as a digital filter for synthesizing a synthesized signal. Perform a p-order linear prediction analysis on the input signal, quantize the p-th prediction coefficient to generate a quantized prediction coefficient, determine a filter coefficient from the p-th quantized prediction coefficient, Saves the signal input to the synthesis filter in which the filter coefficient is determined from the quantized linear prediction coefficient, performs n-th linear prediction on the stored signal, and determines the filter coefficient from the n-th linear prediction coefficient And an acoustic encoding / decoding device for cascade-connecting the obtained digital filters.
【0028】請求項7の発明は、音響の符号化符号によ
る復号化合成信号に対して、量子化雑音を聴覚的に抑圧
する処理を行うディジタルフィルタとして、過去のフレ
ームを含む復号化合成信号に対してm次の線形予測分析
を行い、m次の線形予測分析によって求められた予測残
差信号に対してn次の線形予測を行い、n次の線形予測
係数からフィルタ係数を決定し、それぞれ求められたデ
ィジタルフィルタを縦続に接続した音響復号化装置であ
る。なお、mは、pと等しいものでもよく、多少異なる
ものでもよい。According to a seventh aspect of the present invention, as a digital filter for performing a process of acoustically suppressing quantization noise on a decoded synthesized signal obtained by encoding a sound, a decoded synthesized signal including a past frame is used. An m-th linear prediction analysis is performed on the prediction residual signal, an n-th linear prediction is performed on the prediction residual signal obtained by the m-th linear prediction analysis, and a filter coefficient is determined from the n-th linear prediction coefficient. This is an audio decoding device in which the obtained digital filters are connected in cascade. Note that m may be equal to p or slightly different.
【0029】請求項8の発明は、音響の符号化符号によ
る復号化合成信号に対して、量子化雑音を聴覚的に抑圧
する処理を行うディジタルフィルタとして、過去のフレ
ームにおいてp次の線形予測係数からフィルタ係数が決
定された合成フィルタに入力された信号を保存し、保存
された信号に対してn次の線形予測分析を行い、n次の
線形予測係数からフィルタ係数を決定し、現在のフレー
ムにおける符号化符号から得られたp次の線形予測係数
によってフィルタ係数が決定されたディジタルフィルタ
とそれぞれ求められたディジタルフィルタとを縦続に接
続した音響復号化装置である。An eighth aspect of the present invention is a digital filter for performing a process of acoustically suppressing quantization noise on a decoded and synthesized signal obtained by encoding a sound by using a p-order linear prediction coefficient in a past frame. Saves the input signal to the synthesis filter for which the filter coefficients have been determined, performs n-order linear prediction analysis on the stored signal, determines filter coefficients from the n-th linear prediction coefficients, and determines the current frame. And a digital filter whose filter coefficient is determined by a p-order linear prediction coefficient obtained from the encoded code in the above, and the digital filter obtained respectively are connected in cascade.
【0030】[0030]
【発明の実施の形態および実施例】図1(1)は、本発
明の一実施例である音響符号化装置AC1を示すブロッ
ク図である。DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1A is a block diagram showing an audio encoding apparatus AC1 according to an embodiment of the present invention.
【0031】この音響符号化装置AC1は、請求項5に
対応する実施例であり、図9に示した従来の音響符号化
装置AC4において、合成フィルタ14の代わりに合成
フィルタ44を設け、m次線形予測分析手段41、LP
C逆フィルタ42、n次線形予測分析手段43、第2の
フィルタ係数決定手段43aとを設け、第1のフィルタ
係数決定手段13aを設けたものである。This acoustic encoding apparatus AC1 is an embodiment corresponding to claim 5, and in the conventional acoustic encoding apparatus AC4 shown in FIG. 9, a synthesis filter 44 is provided instead of the synthesis filter 14, and the m-th order Linear prediction analysis means 41, LP
It is provided with a C inverse filter 42, an nth-order linear prediction analysis unit 43, a second filter coefficient determination unit 43a, and a first filter coefficient determination unit 13a.
【0032】音響符号化装置AC1において、まず、現
フレームにおける入力信号を線形予測分析してp次の線
形予測係数α0i(i=1、2、……、p)を求める。こ
の線形予測係数α0iは、従来の音響符号化装置AC4中
の線形予測分析手段12で得られた係数を用いることが
できる。さらに、この予測係数を量子化し、量子化予測
係数αi (i=1、2、……、p)を求める。通常、p
は10から20程度とする。In the audio coding apparatus AC1, first, an input signal in the current frame is subjected to linear prediction analysis to obtain a p-order linear prediction coefficient α 0i (i = 1, 2,..., P). As the linear prediction coefficient α 0i , a coefficient obtained by the linear prediction analysis unit 12 in the conventional audio encoding device AC4 can be used. Further, the prediction coefficients are quantized to obtain quantized prediction coefficients α i (i = 1, 2,..., P). Usually p
Is about 10 to 20.
【0033】次に、過去のフレームにわたる合成信号を
線形予測分析手段41で線形予測分析し、m次の線形予
測係数α' k(k=1、2、……、m)を求める。なお、
上記のように、mは、pと等しくてもよく、多少異なっ
ていてもよい。また、線形予測分析を行う場合、分析対
象の信号系列にかける窓としては、非対称窓またはハミ
ング窓等の対称窓のいずれを用いてもよい。Next, the synthesized signal over the past frame is subjected to linear prediction analysis by the linear prediction analysis means 41 to obtain an m-th linear prediction coefficient α ′ k (k = 1, 2,..., M). In addition,
As mentioned above, m may be equal to p or slightly different. In the case of performing linear prediction analysis, any of an asymmetric window and a symmetric window such as a Hamming window may be used as a window applied to a signal sequence to be analyzed.
【0034】次に、過去の合成音声に対して、この線形
予測係数α' kをフィルタ係数として、伝達特性が次の式
(3)で表わされるディジタルフィルタ42でLPC逆
フィルタリングを行い、予測残差信号を求める。Next, LPC inverse filtering is performed on the past synthesized speech by the digital filter 42 whose transfer characteristic is expressed by the following equation (3) using the linear prediction coefficient α ′ k as a filter coefficient, Find the difference signal.
【0035】[0035]
【数3】 次に、求められた過去の合成信号(たとえば1ピッチ前
の合成信号)の予測残差信号を、線形予測分析手段43
で線形予測分析して、n次の線形予測係数βj(j=
1、2、……、n)を求める。n次の線形予測によっ
て、m次の線形予測では予測しきれない高次の相関を表
わすために、nは、mよりも大であることが望ましい。
たとえば、符号化対象が音楽である場合、100次以上
の予測が最適である場合がある。(Equation 3) Next, the prediction residual signal of the obtained past synthesized signal (for example, the synthesized signal one pitch before) is converted to a linear prediction analysis unit 43.
And a linear prediction coefficient β j of order n (j =
1, 2,..., N). In order for the n-th linear prediction to represent a higher-order correlation that cannot be completely predicted by the m-th linear prediction, n is preferably larger than m.
For example, when the encoding target is music, prediction of the 100th or higher order may be optimal.
【0036】次に、得られた係数αi 、βj を用いて、
伝達特性がそれぞれ次の式(4)、式(5)で表わされ
るディジタルフィルタを縦続接続し、伝達特性が式
(6)で表わされるディジタルフィルタを構成し、合成
フィルタ44として用いる。Next, using the obtained coefficients α i and β j ,
Digital filters whose transfer characteristics are expressed by the following equations (4) and (5) are connected in cascade to form a digital filter whose transfer characteristics are expressed by an equation (6).
【0037】図1(2)は、本発明の他の実施例である
音響符号化装置AC2を示すブロック図である。FIG. 1B is a block diagram showing an acoustic encoding device AC2 according to another embodiment of the present invention.
【0038】符号化対象の信号の性質によっては、音響
符号化装置AC2のように、複数の励振符号帳の内で一
部の励振符号帳からの励振信号のみを、合成フィルタ4
4でフィルタリングし、それ以外の励振符号帳からの励
振信号は、従来の合成フィルタによってフィルタリング
するようにしてもよい。Depending on the nature of the signal to be encoded, only the excitation signal from some of the excitation codebooks among the plurality of excitation codebooks is converted into the synthesis filter 4 like the acoustic encoding device AC2.
4 and the other excitation signals from the excitation codebook may be filtered by a conventional synthesis filter.
【0039】[0039]
【数4】 (Equation 4)
【0040】[0040]
【数5】 (Equation 5)
【0041】[0041]
【数6】 図2(1)は、符号化対象入力信号の対数パワースペク
トルの一例を示す図であり、図2(2)は、音響符号化
装置AC1による合成フィルタにおいて、包絡を表わす
フィルタの対数パワースペクトル特性の一例を示す図で
あり、図2(3)は、音響符号化装置AC1による合成
フィルタにおいて、微細構造を表わすフィルタの対数バ
ワースペクトル特性の一例を示す図であり、図2(4)
は、音響符号化装置AC1による合成フィルタの対数パ
ワースペクトル特性の一例を示す図である。(Equation 6) FIG. 2A is a diagram illustrating an example of a logarithmic power spectrum of an input signal to be encoded, and FIG. 2B is a diagram illustrating a logarithmic power spectrum characteristic of a filter representing an envelope in a synthesis filter of the acoustic encoding device AC1. FIG. 2C is a diagram illustrating an example of a logarithmic power spectrum characteristic of a filter representing a fine structure in the synthesis filter by the acoustic encoding device AC1, and FIG.
FIG. 7 is a diagram illustrating an example of a logarithmic power spectrum characteristic of a synthesis filter by the audio encoding device AC1.
【0042】上記実施例では、符号化対象信号のパワー
スペクトル特性の包絡を表わすフィルタと微細構造を表
わすフィルタとをそれぞれ求め、両フィルタを縦続接続
して構成されている。In the above embodiment, a filter representing the envelope of the power spectrum characteristic of the signal to be encoded and a filter representing the fine structure are obtained, and both filters are cascaded.
【0043】図2(1)に表わされる符号化対象信号の
パワースペクトル特性を表現する場合、包絡形状は、従
来のように量子化された低次のフィルタ係数αi で図2
(2)のように表現し、微細構造は、過去の合成音声
を、高次の分析によって得られた高次のフィルタ係数β
j で図2(3)のように表現し、それらのフィルタの縦
続接続によって、図2(4)のようなパワースペクトル
特性を表現できる。上記実施例は、従来例と比較して、
復号化装置側に送信するための余分の情報ビットを必要
とせず、しかも、より複雑な符号化対象信号のパワース
ペクトル特性を表現できる。When expressing the power spectrum characteristic of the signal to be encoded shown in FIG. 2A, the envelope shape is represented by a low-order filter coefficient α i quantized as in the prior art.
Expressed as (2), the fine structure is obtained by converting a past synthesized speech to a higher-order filter coefficient β obtained by a higher-order analysis.
The power spectrum characteristic as shown in FIG. 2 (4) can be expressed by j as shown in FIG. 2 (3) and the cascade connection of these filters. The above embodiment, compared to the conventional example,
An extra information bit for transmitting to the decoding device is not required, and more complex power spectrum characteristics of the signal to be encoded can be expressed.
【0044】また、一回の線形予測分析では、微細構造
を表現できる程の高次の分析を行う予測係数を安定して
求めることは困難であるが、上記実施例では、高次の分
析を行う対象の信号が、低次の相関が除かれた予測残差
信号であるので、高次の分析であっても、予測係数を安
定して求めることが容易である。なお、安定な予測係数
が求められなかった場合は、前のフレームで得られた
値、または初期化された値を、安定な予測係数として用
いることができる。In one linear prediction analysis, it is difficult to stably obtain a prediction coefficient for performing a higher-order analysis that can express a fine structure. Since the signal to be performed is the prediction residual signal from which the low-order correlation has been removed, it is easy to stably obtain the prediction coefficient even in the high-order analysis. If a stable prediction coefficient cannot be obtained, a value obtained in a previous frame or an initialized value can be used as a stable prediction coefficient.
【0045】初期化された値を安定な予測係数として用
いる場合でも、量子化された低次の予測係数が求められ
ていれば、その低次の予測による利得は少なくとも保証
される。Even when the initialized value is used as a stable prediction coefficient, if a quantized low-order prediction coefficient is obtained, at least the gain by the low-order prediction is guaranteed.
【0046】また、上記実施例において、合成フィルタ
に励振信号を入力し、合成信号を得るためには、従来の
フィルタリングの操作に加えて、フィルタ係数βj によ
るフィルタリングを必要とするが、従来の音響符号化装
置AC5でよく用いられるように、合成フィルタのイン
パルス応答と零入力応答とをそれぞれ一旦、求めておけ
ば、インパルス応答をフィルタ係数とする移動平均型デ
ィジタルフィルタと符号帳とからの励振信号を畳み込ん
で得られた信号と、零入力応答を入力信号から引いた差
信号との誤差が最小になるように、励振信号を選ぶこと
によって、符号帳中の全ての励振信号について、フィル
タ係数βj によるフィルタリングの操作を避けることが
でき、この場合、符号帳探索のみに必要となる演算量は
従来と変わらない。In the above embodiment, in order to input the excitation signal to the synthesis filter and obtain the synthesized signal, in addition to the conventional filtering operation, filtering by the filter coefficient β j is required. Once the impulse response and the quiescent response of the synthesis filter are obtained once, as is often used in the acoustic encoding device AC5, the excitation from the moving average digital filter using the impulse response as a filter coefficient and the codebook is performed. By selecting the excitation signal so that the error between the signal obtained by convolving the signal and the difference signal obtained by subtracting the quiescent response from the input signal is minimized, a filter is applied to all the excitation signals in the codebook. Filtering operation using the coefficient β j can be avoided, and in this case, the amount of computation required only for codebook search is the same as in the past.
【0047】図3は、本発明の他の実施例を示すブロッ
ク図であり、従来の音響符号化装置AC4における聴覚
重み付けフィルタ21を改良した聴覚重み付けフィルタ
211を示すブロック図である。FIG. 3 is a block diagram showing another embodiment of the present invention, and is a block diagram showing an auditory weighting filter 211 obtained by improving the auditory weighting filter 21 in the conventional audio encoder AC4.
【0048】聴覚重み付けフィルタ211は、請求項
1、2に対応する発明であり、入力信号系列に対して、
p次の線形予測分析を行い、p次の予測係数を求めるp
次線形予測分析手段12と、p次の予測係数に基づい
て、全極形または移動平均形ディジタルフィルタのフィ
ルタ係数を決定する第1のフィルタ係数決定手段12a
と、入力信号をLPC逆フィルタ(61)に通して、p
次の線形予測の予測残差として得られた信号系列につい
て、n次の線形予測を行う手段62と、n次の予測係数
に基づいて、全極形または移動平均形ディジタルフィル
タのフィルタ係数を決定する第2のフィルタ係数決定手
段62aと、p次の線形予測によってフィルタ係数が決
定された第1の全極形または移動平均形ディジタルフィ
ルタ63−1と、n次の線形予測によってフィルタ係数
が決定された第2の全極形または移動平均形ディジタル
フィルタ63−2と、第1のフィルタと上記第2のフィ
ルタとを縦続接続する接続手段とを有する聴覚重み付け
フィルタである。このように分析を2回に分けることに
よって、フィルタ設計が自由になる。なお、このフィル
タ211を、音響符号化装置にも、音響復号化装置にも
使用でき、また、映像等の音響以外の符号化/復号化装
置にも使用することができる。The auditory weighting filter 211 is an invention corresponding to the first and second aspects.
Perform p-order linear prediction analysis to find p-order prediction coefficient
First-order linear prediction analysis means 12 and first filter coefficient determination means 12a for determining filter coefficients of an all-pole or moving average digital filter based on a p-th prediction coefficient
And the input signal is passed through an LPC inverse filter (61) to obtain p
Means 62 for performing an nth-order linear prediction on the signal sequence obtained as a prediction residual of the next linear prediction, and determining filter coefficients of an all-pole or moving average digital filter based on the nth prediction coefficient A second filter coefficient determining means 62a, a first all-pole or moving average digital filter 63-1 whose filter coefficient is determined by a p-order linear prediction, and a filter coefficient determined by an n-th linear prediction This is an auditory weighting filter having a second all-pole or moving average digital filter 63-2 and connection means for cascading the first filter and the second filter. Dividing the analysis into two in this way makes the filter design free. Note that the filter 211 can be used for an audio encoding device and an audio decoding device, and can also be used for an encoding / decoding device for non-audio such as video.
【0049】フィルタ211を音響符号化装置に使用し
た場合には、音響の入力信号のスペクトル包絡のモデル
化を線形予測分析で行い、上記音響の入力信号と符号化
符号の合成信号との差信号が最小化するように上記符号
化符号を決定し、上記差信号に対して聴覚特性に応じた
重み付けを施す音響符号化装置において、音響の入力信
号に対して、p次の線形予測分析を行い、p次の予測係
数を求めるp次の線形予測分析手段12と、p次の予測
係数に基づいて、フィルタ係数を決定する第1のフィル
タ係数決定手段12aと、上記入力をLPC逆フィルタ
61に通して得られたp次の線形予測の残差信号に対し
て、n次の線形予測分析を行い、n次の予測係数を求め
るn次の線形予測分析手段43と、上記n次の予測係数
に基づいて、フィルタ係数を決定する第2のフィルタ係
数決定手段62aと、上記複数のディジタルフィルタ6
3−1、63−2を縦続接続する接続手段とからなる。
この場合、精密な聴覚重み付けを行いことができる。When the filter 211 is used in an audio encoding device, the spectral envelope of the audio input signal is modeled by linear prediction analysis, and the difference signal between the audio input signal and the synthesized signal of the encoded code is obtained. In the acoustic encoding device that determines the encoding code so that is minimized and weights the difference signal according to the auditory characteristics, a p-order linear prediction analysis is performed on the audio input signal. , A p-order linear prediction analysis means 12 for obtaining a p-th prediction coefficient, a first filter coefficient determination means 12 a for determining a filter coefficient based on the p-th prediction coefficient, and the input to the LPC inverse filter 61. N-order linear prediction analysis means 43 for performing an n-th order linear prediction analysis on the p-th order linear prediction residual signal obtained through the Based on A second filter coefficient determining means 62a for determining the data coefficients, said plurality of digital filters 6
3-1 and 63-2.
In this case, precise auditory weighting can be performed.
【0050】図4は、本発明の別の実施例である聴覚重
み付けフィルタ212を示すブロック図である。聴覚重
み付けフィルタ212は、従来の音響符号化装置AC4
における聴覚重み付けフィルタ21を改良したフィルタ
であり、請求項3に対応する実施例である。FIG. 4 is a block diagram showing an auditory weighting filter 212 according to another embodiment of the present invention. The auditory weighting filter 212 is a conventional audio encoding device AC4.
This is an improved version of the auditory weighting filter 21 in the first embodiment, and is an embodiment corresponding to claim 3.
【0051】聴覚重み付けフィルタ212は、音響の入
力信号のスペクトル包絡のモデル化を線形予測分析で行
い、上記音響の入力信号と符号化符号の合成信号との差
信号が最小化するように上記符号化符号を決定し、上記
差信号に対して聴覚特性に応じた重み付けを施す音響符
号化装置において、上記音響の入力信号に対して、p次
の線形予測分析を行い、p次の予測係数を求めるp次の
線形予測分析手段12と、上記p次の予測係数に基づい
て、フィルタ係数を決定する第1のフィルタ係数決定手
段12aと、上記音響の入力信号における過去のフレー
ムについての合成信号に対して、m次の線形予測分析を
行い、m次の予測残差信号を求めるm次の線形予測分析
手段51と、上記m次の予測残差信号に基づいて、n次
の線形予測分析を行い、n次の予測係数を求めるn次の
線形予測分析手段53と、上記n次の予測係数に基づい
て、フィルタ係数を決定する第2のフィルタ係数決定手
段53aと、上記複数のディジタルフィルタ54−1と
54−2とを縦続接続する接続手段とを有するものであ
る。The auditory weighting filter 212 models the spectral envelope of the audio input signal by linear prediction analysis, and minimizes the difference signal between the audio input signal and the synthesized signal of the encoded code. A sound coding apparatus that determines a coding code and weights the difference signal according to auditory characteristics, performs a p-order linear prediction analysis on the sound input signal, and calculates a p-order prediction coefficient. The p-order linear prediction analysis means 12 to be obtained, the first filter coefficient determination means 12a for determining a filter coefficient based on the p-order prediction coefficient, and the synthesized signal for the past frame in the audio input signal. On the other hand, an m-th linear prediction analysis means 51 for performing an m-th linear prediction analysis to obtain an m-th prediction residual signal, and an n-th linear prediction analysis based on the m-th prediction residual signal. An n-th linear prediction analysis means 53 for obtaining an n-th prediction coefficient; a second filter coefficient determination means 53a for determining a filter coefficient based on the n-th prediction coefficient; -1 and 54-2 in cascade.
【0052】まず、現フレームにおける入力信号を線形
予測分析し、p次の線形予測係数α0i(i=1、2、…
…、p)を求める。この線形予測係数α0iは、音響符号
化装置AC4中の線形予測分析手段12で得られたもの
を用いることができる。通常、pは、10〜20程度と
する。First, the input signal in the current frame is subjected to linear prediction analysis, and a p-order linear prediction coefficient α 0i (i = 1, 2,...)
..., p). As the linear prediction coefficient α 0i , the one obtained by the linear prediction analysis unit 12 in the audio encoding device AC4 can be used. Usually, p is about 10 to 20.
【0053】次に、現フレームと過去のフレームとにわ
たる入力信号を、線形予測手段51で線形予測分析し、
m次の線形予測係数α' k(k=1、2、……、m)を求
める。なお、上記のように、mは、pと等しくてもよ
く、多少異なっていてもよい。また、線形予測分析を行
う場合、分析対象の信号系列にかける窓は、非対称窓ま
たはハミング窓等の対称窓のいずれを用いてもよい。Next, the input signal over the current frame and the past frame is subjected to linear prediction analysis by the linear prediction means 51,
The m-th order linear prediction coefficient α ′ k (k = 1, 2,..., m) is obtained. Note that, as described above, m may be equal to p or slightly different. In the case of performing linear prediction analysis, a window applied to a signal sequence to be analyzed may be an asymmetric window or a symmetric window such as a Hamming window.
【0054】次に、現フレームと過去のフレームとにわ
たる入力信号に対し、この線形予測係数α' kをフィルタ
係数として、伝達特性が上記の式(1)のα' kをinv
(αk)で置き換えたディジタルフィルタ52によっ
て、LPC逆フィルタリングを行い、予測残差信号を求
める。Next, the input signal over the current frame and the previous frame, the LPC coefficients alpha 'a k as the filter coefficient, the transfer characteristic is alpha of the above formula (1)' a k inv
LPC inverse filtering is performed by the digital filter 52 replaced with (αk) to obtain a prediction residual signal.
【0055】次に、求められた過去の合成信号の予測残
差信号を、線形予測手段53によって線形予測分析し、
n次の線形予測係数βj (j=1、2、……、n)を求
める。n次の線形予測によって、m次の線形予測では予
測しきれない高次の相関を表わすので、nは、mよりも
大であることが望ましい。たとえば、符号化対象が音楽
である場合、100次以上の予測が最適な場合がある点
は、上記実施例と同様である。Next, the obtained prediction residual signal of the past synthesized signal is subjected to linear prediction analysis by the linear prediction means 53, and
An nth-order linear prediction coefficient β j (j = 1, 2,..., n) is obtained. Since the n-th linear prediction represents a higher-order correlation that cannot be predicted by the m-th linear prediction, n is preferably larger than m. For example, when the encoding target is music, the prediction of the 100th or higher order may be optimal in the same manner as in the above embodiment.
【0056】次に、得られた係数α0i、inv(βj )
と、1以下の定数γ1、γ2、γ3、γ4を用いて、伝
達特性が次の式(7)で表わされるディジタルフィルタ
54を構成し、音響符号化装置AC4における聴覚重み
付けフィルタ21として用いる。Next, the obtained coefficients α 0i , inv (β j )
Using the constants γ1, γ2, γ3, and γ4 of 1 or less, a digital filter 54 whose transfer characteristic is represented by the following equation (7) is used as the perceptual weighting filter 21 in the audio encoding device AC4.
【0057】[0057]
【数7】 上記実施例においては、従来のフィルタ係数α0iと1以
下の定数、γ1、γ2とで表わされる入力信号のパワー
スペクトル包絡に基づいた聴覚重み付けフィルタに、高
次のフィルタ係数β0iと1以下の定数γ1、γ4とで表
わされる入力信号のパワースペクトルの微細構造に基づ
いた聴覚重み付けフィルタを付け加えることによって、
複数のピッチが混在するような入力信号に対しても、聴
覚特性に応じたより細かな制御を行うことができる。(Equation 7) In the above-described embodiment, the conventional filter coefficient α 0i and the auditory weighting filter based on the power spectrum envelope of the input signal represented by the constants γ1 and γ2 of 1 or less are added to the high-order filter coefficient β 0i and the By adding an auditory weighting filter based on the fine structure of the power spectrum of the input signal represented by the constants γ1 and γ4,
Even for an input signal in which a plurality of pitches are mixed, finer control according to the auditory characteristics can be performed.
【0058】また、上記実施例においては、合成信号ま
たは入力信号に対して、低次の線形予測分析を行い、そ
の予測残差信号に対して高次の線形予測分析を行い、こ
れによって得られた予測係数を用いるディジタルフィル
タによって、従来よりも複雑なパワースペクトル特性を
表わすことができる。したがって、多数の励振ベクトル
をフィルタに通すCELP方式のような符号化におい
て、合成フィルタとして用いることによって、様々な音
響信号のパワースペクトル特性を、合成フィルタ励振符
号帳内に励振ベクトルのバリエーションとして持つ必要
がない点で有効である。また、従来よりも聴覚特性に応
じた重み付け、雑音抑圧を細かく制御できる点において
有効である。In the above embodiment, a low-order linear prediction analysis is performed on the synthesized signal or the input signal, and a high-order linear prediction analysis is performed on the prediction residual signal. The digital filter using the predicted coefficients can express more complex power spectrum characteristics than before. Therefore, in encoding such as the CELP method in which a large number of excitation vectors are passed through a filter, it is necessary to have power spectrum characteristics of various acoustic signals as variations of excitation vectors in the synthesis filter excitation codebook by using the synthesis filter. It is effective in that there is no. Further, it is effective in that weighting according to auditory characteristics and noise suppression can be more finely controlled than in the past.
【0059】この聴覚重み付けフィルタ212によっ
て、精密な聴覚重み付けを行うことができる。With this hearing weighting filter 212, accurate hearing weighting can be performed.
【0060】図5は、本発明の他の実施例である聴覚重
み付けフィルタ213を示すブロック図である。聴覚重
み付けフィルタ213は、従来の音響符号化装置AC4
における聴覚重み付けフィルタ21を改良したフィルタ
であり、請求項4に対応する実施例である。FIG. 5 is a block diagram showing an auditory weighting filter 213 according to another embodiment of the present invention. The auditory weighting filter 213 is a conventional audio encoding device AC4.
This is an improved version of the auditory weighting filter 21 in the first embodiment, and is an embodiment corresponding to claim 4.
【0061】聴覚重み付けフィルタ213は、音響の入
力信号のスペクトル包絡のモデル化を線形予測分析で行
い、上記音響の入力信号と符号化符号の合成信号との差
信号が最小化するように上記符号化符号を決定し、上記
差信号に対して聴覚特性に応じた重み付けを施す音響符
号化装置において、上記音響の入力信号に対して、p次
の線形予測分析を行い、p次の予測係数を求めるp次の
線形予測分析手段12と、上記p次の予測係数に基づい
て、フィルタ係数を決定する第1のフィルタ係数決定手
段2aと、上記音響の入力信号における過去のフレーム
において、量子化予測係数に基づいてフィルタ係数が決
定された合成フィルタに入力された信号を保存する信号
保存手段15と、上記信号保存手段に保存された信号に
対して、n次の線形予測分析行い、n次の予測係数を求
めるn次の線形予測分析手段62と、上記n次の予測係
数に基づいて、フィルタ係数を決定する第2のフィルタ
係数決定手段62aと、上記複数のディジタルフィルタ
63−1と63−2とを縦続接続する接続手段とを有す
る聴覚重み付けフィルタである。The auditory weighting filter 213 models the spectral envelope of the audio input signal by linear predictive analysis, and minimizes the difference signal between the audio input signal and the synthesized signal of the coded code. A sound coding apparatus that determines a coding code and weights the difference signal according to auditory characteristics, performs a p-order linear prediction analysis on the sound input signal, and calculates a p-order prediction coefficient. P-order linear prediction analysis means 12 to be obtained, first filter coefficient determination means 2a for determining a filter coefficient based on the p-order prediction coefficient, and quantization prediction in a past frame of the audio input signal. A signal storage unit 15 for storing a signal input to the synthesis filter whose filter coefficient is determined based on the coefficient, and an n-th order line for the signal stored in the signal storage unit N-order linear prediction analysis means 62 for performing prediction analysis to obtain an n-th prediction coefficient; second filter coefficient determination means 62a for determining a filter coefficient based on the n-th prediction coefficient; This is an auditory weighting filter having connection means for cascade-connecting the filters 63-1 and 63-2.
【0062】聴覚重み付けフィルタ213によって、精
密な聴覚重み付けを行うことができる。The auditory weighting filter 213 enables precise auditory weighting.
【0063】図6は、本発明のさらに別の実施例である
音響符号化装置AC3を示すブロック図である。FIG. 6 is a block diagram showing an acoustic encoder AC3 according to still another embodiment of the present invention.
【0064】音響符号化装置AC3は、請求項6に対応
する実施例であり、音響の入力信号のスペクトル包絡の
モデル化を線形予測分析で行い、上記音響の入力信号と
符号化符号の合成信号との差信号が最小化するように上
記符号化符号を決定し、上記合成信号の合成を行う音響
符号化/復号化装置において、上記音響の入力信号に対
して、p次の線形予測分析を行い、p次の予測係数を求
めるp次の線形予測分析手段12と、上記p次の予測係
数を量子化し、p次の量子化予測係数を作る量子化予測
係数作成手段13と、上記p次の量子化予測係数に基づ
いて、フィルタ係数を決定する第1のフィルタ係数決定
手段13aと、上記音響の入力信号における過去のフレ
ームにおいて、p次の量子化予測係数に基づいてフィル
タ係数が決定された合成フィルタに入力された信号を保
存する信号保存手段15と、上記信号保存手段に保存さ
れた信号に対して、n次の線形予測分析行い、n次の予
測係数を求めるn次の線形予測分析手段43と、上記n
次の予測係数に基づいて、フィルタ係数を決定する第2
のフィルタ係数決定手段43aと、上記複数のディジタ
ルフィルタ44−1と44−2とを縦続接続する接続手
段とを有する音響符号化装置である。また、音響符号化
装置AC3は、音響復号化装置にも適用することができ
る。The acoustic coding apparatus AC3 is an embodiment corresponding to claim 6, wherein the modeling of the spectral envelope of the audio input signal is performed by linear prediction analysis, and the synthesized signal of the audio input signal and the coded code is synthesized. In the acoustic encoding / decoding device that determines the encoding code so as to minimize the difference signal from the audio signal and synthesizes the synthesized signal, a p-order linear prediction analysis is performed on the audio input signal. A p-order linear prediction analysis means 12 for obtaining a p-th prediction coefficient, a quantized prediction coefficient creation means 13 for quantizing the p-th prediction coefficient to generate a p-th quantization prediction coefficient, A first filter coefficient determining means 13a for determining a filter coefficient based on the quantized prediction coefficient of the above, and a filter coefficient is determined based on a p-th quantized prediction coefficient in a past frame of the acoustic input signal. A signal storage unit 15 for storing a signal input to the synthesis filter, and an n-th linear prediction analysis for performing an n-th linear prediction analysis on the signal stored in the signal storage unit to obtain an n-th prediction coefficient Means 43;
A second determining a filter coefficient based on a next prediction coefficient;
This is an acoustic coding apparatus having a filter coefficient determining means 43a and connection means for cascading the plurality of digital filters 44-1 and 44-2. Also, the audio encoding device AC3 can be applied to an audio decoding device.
【0065】音響符号化装置AC3によれば、スペクト
ルを精密に合成することができるという利点がある。According to the acoustic coding device AC3, there is an advantage that the spectrum can be synthesized precisely.
【0066】図7は、本発明のさらに別の実施例である
ポストフィルタ391を示すブロック図である。ポスト
フィルタ391は、従来の音響復号化装置AD1におけ
るポストフィルタ39を改良したものであり、請求項7
に対応する実施例である。FIG. 7 is a block diagram showing a post filter 391 according to still another embodiment of the present invention. The post filter 391 is an improvement of the post filter 39 in the conventional audio decoding device AD1.
This is an embodiment corresponding to FIG.
【0067】ポストフィルタ391は、音響信号の符号
化符号から得られる(合成される)復号化合成信号に対
して、量子化雑音を聴覚的に抑圧する音響復号化装置に
おいて、過去のフレームを含む上記復号化合成信号に対
して、m次の線形予測分析を行い、m次の予測残差信号
を求めるm次の線形予測分析手段71と、上記LPC逆
フィルタ72を通して得られたm次の予測残差信号に対
して、n次の線形予測分析を行い、n次の予測係数を求
めるn次線形予測手段73と、上記n次の予測係数に基
づいて、フィルタ係数を決定する第1のフィルタ係数決
定手段73aと、上記符号化符号から得られたn次の線
形予測係数によってフィルタ係数を決定する第2のフィ
ルタ係数決定手段32aと、包絡聴覚重み付けフィルタ
74−1と、微細構造聴覚重み付けフィルタ74−2と
を縦続に接続する接続手段とを有する音響復号化装置に
おけるポストフィルタである。The post-filter 391 is a sound decoding device that aurally suppresses quantization noise of a decoded synthesized signal obtained (synthesized) from an encoded code of an audio signal, and includes a past frame. The m-order linear prediction analysis means 71 for performing an m-order linear prediction analysis on the decoded synthesized signal to obtain an m-th prediction residual signal, and the m-order prediction obtained through the LPC inverse filter 72 An n-order linear prediction means 73 for performing an n-th linear prediction analysis on the residual signal to obtain an n-th prediction coefficient, and a first filter for determining a filter coefficient based on the n-th prediction coefficient A coefficient deciding means 73a, a second filter coefficient deciding means 32a for deciding a filter coefficient based on an nth-order linear prediction coefficient obtained from the encoded code, an envelope auditory weighting filter 74-1, A post filter in the acoustic decoding apparatus and a connection means for connecting the concrete perceptual weighting filter 74-2 to cascade.
【0068】ポストフィルタ391によれば、聴覚特性
に適したポストフィルタを作ることができる。According to the post filter 391, a post filter suitable for the auditory characteristics can be produced.
【0069】図8は、本発明の別の実施例であるポスト
フィルタ392を示すブロック図である。ポストフィル
タ392は、従来の音響復号化装置AD1におけるポス
トフィルタ39を改良したものであり、請求項8に対応
する実施例である。FIG. 8 is a block diagram showing a post filter 392 according to another embodiment of the present invention. The post filter 392 is an improvement of the post filter 39 in the conventional audio decoding device AD1, and is an embodiment corresponding to claim 8.
【0070】ポストフィルタ392は、音響信号の符号
化符号から合成された復号化合成信号に対して、量子化
雑音を聴覚的に抑圧する音響復号化装置において、過去
のフレームにおいて、上記入力符号から得られたp次の
線形予測係数からフィルタ係数が決定された合成フィル
タに入力された信号を保存する信号保存手段82と、上
記保存された信号に対して、n次の線形予測分析を行
い、n次の予測係数を求めるn次の線形予測手段83
と、上記n次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段83aと、現在のフ
レームにおける上記符号化符号から得られたn次の線形
予測係数によってフィルタ係数を決定する第2のフィル
タ係数決定手段32aと、包絡聴覚重み付けフィルタ8
4−1と、微細構造聴覚重み付けフィルタ84−2と、
フィルタ84−1と84−2とを縦続に接続する接続手
段とを有するポストフィルタである。The post-filter 392 is an acoustic decoding device that aurally suppresses the quantization noise of the decoded synthesized signal synthesized from the encoded code of the audio signal. A signal storage unit 82 for storing a signal input to the synthesis filter whose filter coefficient is determined from the obtained p-th linear prediction coefficient, and performing an n-th linear prediction analysis on the stored signal; n-order linear prediction means 83 for obtaining an n-th prediction coefficient
First filter coefficient determining means 83a for determining a filter coefficient based on the n-th prediction coefficient, and determining a filter coefficient based on the n-th linear prediction coefficient obtained from the coded code in the current frame. A second filter coefficient determining means 32a for performing
4-1 and a fine structure auditory weighting filter 84-2;
This is a post filter having connection means for connecting filters 84-1 and 84-2 in cascade.
【0071】ポストフィルタ392によれば、聴覚特性
に適したポストフィルタを作ることができる。According to the post filter 392, a post filter suitable for the auditory characteristics can be produced.
【0072】[0072]
【発明の効果】本発明によれば、合成信号または入力信
号に対して、低次の線形予測分析を行い、その予測残差
信号に対して高次の線形予測分析を行い、これによって
得られた予測係数を用いるディジタルフィルタによっ
て、従来よりも複雑なパワースペクトル特性を表わすこ
とができるという効果を奏することができる。According to the present invention, a low-order linear prediction analysis is performed on a synthesized signal or an input signal, and a high-order linear prediction analysis is performed on the prediction residual signal. With the digital filter using the predicted coefficients, it is possible to obtain an effect that a more complex power spectrum characteristic can be represented as compared with the related art.
【図1】図1(1)は、本発明の一実施例である音響符
号化装置AC1を示すブロック図であり、図1(2)
は、本発明の他の実施例である音響符号化装置AC2を
示すブロック図である。FIG. 1 (1) is a block diagram showing an acoustic encoding device AC1 according to an embodiment of the present invention, and FIG. 1 (2).
FIG. 14 is a block diagram showing an acoustic encoding device AC2 according to another embodiment of the present invention.
【図2】上記実施例における対数パワースペクトル特性
を示す図である。FIG. 2 is a diagram showing logarithmic power spectrum characteristics in the embodiment.
【図3】本発明の他の実施例を示すブロック図であり、
従来の音響符号化装置AC4における聴覚重み付けフィ
ルタ21を改良した聴覚重み付けフィルタ211を示す
ブロック図である。FIG. 3 is a block diagram showing another embodiment of the present invention;
It is a block diagram which shows the auditory weighting filter 211 which improved the auditory weighting filter 21 in the conventional audio encoding device AC4.
【図4】本発明の別の実施例である聴覚重み付けフィル
タ212を示すブロック図であり、聴覚重み付けフィル
タ212は、従来の音響符号化装置AC4における聴覚
重み付けフィルタ21を改良したフィルタであり、請求
項3に対応する実施例である。FIG. 4 is a block diagram showing an auditory weighting filter 212 according to another embodiment of the present invention. The auditory weighting filter 212 is a filter obtained by improving the auditory weighting filter 21 in the conventional audio encoding device AC4. This is an embodiment corresponding to item 3.
【図5】本発明の他の実施例である聴覚重み付けフィル
タ213を示すブロック図であり、聴覚重み付けフィル
タ213は、従来の音響符号化装置AC4における聴覚
重み付けフィルタ21を改良したフィルタであり、請求
項4に対応する実施例である。FIG. 5 is a block diagram showing an auditory weighting filter 213 according to another embodiment of the present invention. The auditory weighting filter 213 is a filter obtained by improving the auditory weighting filter 21 of the conventional audio encoding device AC4. This is an example corresponding to item 4.
【図6】本発明のさらに別の実施例である音響符号化装
置AC3を示すブロック図である。FIG. 6 is a block diagram showing an acoustic encoding device AC3 according to still another embodiment of the present invention.
【図7】本発明のさらに別の実施例であるポストフィル
タ391を示すブロック図である。ポストフィルタ39
1は、従来の音響復号化装置AD1におけるポストフィ
ルタ39を改良したものであり、請求項7に対応する実
施例である。FIG. 7 is a block diagram showing a post filter 391 according to still another embodiment of the present invention. Post filter 39
Reference numeral 1 denotes an improved post filter 39 in the conventional audio decoding device AD1, which is an embodiment corresponding to claim 7.
【図8】本発明の別の実施例であるポストフィルタ39
2を示すブロック図である。ポストフィルタ392は、
従来の音響復号化装置AD1におけるポストフィルタ3
9を改良したものであり、請求項8に対応する実施例で
ある。FIG. 8 shows a post filter 39 according to another embodiment of the present invention.
FIG. 2 is a block diagram showing a second example. The post filter 392 is
Post filter 3 in conventional audio decoding device AD1
9 is an embodiment corresponding to claim 8.
【図9】CELP方式による従来の音響符号化装置を示
すブロック図であり、図9(1)は、従来の音響符号化
装置AC4を示すブロック図であり、図9(2)は、従
来の音響符号化装置AC5を示すブロック図である。FIG. 9 is a block diagram showing a conventional acoustic encoding device using the CELP method, FIG. 9 (1) is a block diagram showing a conventional acoustic encoding device AC4, and FIG. 9 (2) is a conventional acoustic encoding device. It is a block diagram showing acoustic coding device AC5.
【図10】CELP方式による従来の音響復号化装置A
D1を示すブロック図である。FIG. 10 shows a conventional audio decoding apparatus A using the CELP method.
It is a block diagram showing D1.
AC1、AC2、AC3…音響符号化装置、 12…p次線形予測分析手段、 13…量子化手段、 14…線形予測合成フィルタ、 15…適応符号帳、 16…制御手段、 17、23…利得付与手段、 18…加算手段、 19…減算手段、 21…聴覚重み付けフィルタ、 22…雑音符号帳、 41、51…m次線形予測分析手段、 42、52…LPC逆フィルタ、 43、53…n次線形予測分析手段、 44…線形予測合成フィルタ(n次線形予測合成フィル
タとp次線形予測合成フィルタ)、 AD1…音響復号化装置、 54…ディジタルフィルタ(包絡聴覚重み付けフィルタ
と微細構造聴覚重み付けフィルタ)。AC1, AC2, AC3: Acoustic coding device, 12: p-order linear prediction analysis means, 13: quantization means, 14: linear prediction synthesis filter, 15: adaptive codebook, 16: control means, 17, 23: gain application Means 18 Addition means 19 Subtraction means 21 Perceptual weighting filter 22 Noise codebook 41 51 m-order linear prediction analysis means 42 52 LPC inverse filter 43 53 n-th linear Prediction analysis means, 44: Linear prediction synthesis filter (n-order linear prediction synthesis filter and p-order linear prediction synthesis filter), AD1: acoustic decoding device, 54: Digital filter (envelope auditory weighting filter and fine structure auditory weighting filter).
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI H03H 17/02 681 G10L 9/14 J H03M 7/30 9/18 E (72)発明者 林 伸二 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平5−257498(JP,A) 特開 平6−250697(JP,A) 特開 昭62−111299(JP,A) 特開 平9−297597(JP,A) 特開 平4−77799(JP,A) 特開 平2−157800(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/06 G10L 19/04 ────────────────────────────────────────────────── ─── Continued on the front page (51) Int.Cl. 7 Identification symbol FI H03H 17/02 681 G10L 9/14 J H03M 7/30 9/18 E (72) Inventor Shinji Hayashi Shinjuku-ku, Tokyo No. 19-2, Nippon Telegraph and Telephone Corporation (56) References JP-A-5-257498 (JP, A) JP-A-6-250697 (JP, A) JP-A-62-1111299 (JP, A) JP-A-9-297597 (JP, A) JP-A-4-77799 (JP, A) JP-A-2-157800 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G10L 19/06 G10L 19/04
Claims (8)
分析を行い、p次の予測係数を求めるp次線形予測分析
手段と;上記p次の予測係数に基づいて、全極形または
移動平均形ディジタルフィルタのフィルタ係数を決定す
る第1のフィルタ係数決定手段と;入力信号をLPC逆
フィルタに通して、上記p次の線形予測の予測残差とし
て得られた信号系列について、n次の線形予測を行う手
段と;上記n次の予測係数に基づいて、全極形または移
動平均形ディジタルフィルタのフィルタ係数を決定する
第2のフィルタ係数決定手段と;上記p次の線形予測に
よってフィルタ係数が決定された第1の全極形または移
動平均形ディジタルフィルタと;上記n次の線形予測に
よってフィルタ係数が決定された第2の全極形または移
動平均形ディジタルフィルタと;上記第1のフィルタと
上記第2のフィルタとを縦続接続する接続手段と;を有
することを特徴とするディジタルフィルタ。A p-order linear prediction analysis means for performing a p-order linear prediction analysis on an input signal sequence to obtain a p-th prediction coefficient; based on the p-order prediction coefficient, an all-pole or First filter coefficient determining means for determining a filter coefficient of a moving average type digital filter; and an n-th order signal sequence obtained by passing an input signal through an LPC inverse filter and obtaining a prediction residual of the p-th order linear prediction. Means for determining the filter coefficient of an all-pole or moving average digital filter based on the n-order prediction coefficient; and a filter for performing the p-order linear prediction. A first all-pole or moving average digital filter whose coefficients are determined; and a second all-pole or moving average digital filter whose filter coefficients are determined by the n-th linear prediction. A digital filter, comprising: a filter; and connection means for cascading the first filter and the second filter.
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記差信号に対して聴覚特性に応じ
た重み付けを施す音響符号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段と;上記入力をLP
C逆フィルタに通して得られたp次の線形予測の残差信
号に対して、n次の線形予測分析を行い、n次の予測係
数を求めるn次の線形予測分析手段と;上記n次の予測
係数に基づいて、フィルタ係数を決定する第2のフィル
タ係数決定手段と;上記複数のディジタルフィルタを縦
続接続する接続手段と;を有することを特徴とする音響
符号化装置における聴覚重み付けフィルタ。2. A method for modeling a spectral envelope of an audio input signal by linear predictive analysis, and determining the encoding code such that a difference signal between the audio input signal and a composite signal of the encoding code is minimized. In the acoustic encoding device for weighting the difference signal according to the auditory characteristics, a p-order linear prediction analysis is performed on the audio input signal to obtain a p-order prediction coefficient. Linear prediction analysis means; first filter coefficient determination means for determining a filter coefficient based on the p-order prediction coefficient;
N-order linear prediction analysis means for performing an n-th linear prediction analysis on a p-th linear prediction residual signal obtained through the C inverse filter to obtain an n-th prediction coefficient; A perceptual weighting filter for an acoustic coding apparatus, comprising: second filter coefficient determining means for determining a filter coefficient based on the prediction coefficient of (1); and connecting means for cascading the plurality of digital filters.
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記差信号に対して聴覚特性に応じ
た重み付けを施す音響符号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段と;上記音響の入力
信号における過去のフレームについての合成信号に対し
て、m次の線形予測分析を行い、m次の予測残差信号を
求めるm次の線形予測分析手段と;上記m次の予測残差
信号に基づいて、n次の線形予測分析を行い、n次の予
測係数を求めるn次の線形予測分析手段と;上記n次の
予測係数に基づいて、フィルタ係数を決定する第2のフ
ィルタ係数決定手段と;上記複数のディジタルフィルタ
を縦続接続する接続手段と;を有することを特徴とする
音響符号化装置における聴覚重み付けフィルタ。3. A model of a spectral envelope of an audio input signal is performed by linear prediction analysis, and the encoding code is determined so as to minimize a difference signal between the audio input signal and a composite signal of the encoding code. In the acoustic encoding device for weighting the difference signal according to the auditory characteristics, a p-order linear prediction analysis is performed on the audio input signal to obtain a p-order prediction coefficient. Linear prediction analysis means; first filter coefficient determination means for determining a filter coefficient based on the p-order prediction coefficient; m-th order synthesis signal for a past frame in the audio input signal; An m-th linear prediction analysis means for performing a linear prediction analysis to obtain an m-th prediction residual signal; and performing an n-th linear prediction analysis based on the m-th prediction residual signal to obtain an n-th prediction coefficient N-order linear prediction An acoustic code comprising: analysis means; second filter coefficient determination means for determining a filter coefficient based on the n-th prediction coefficient; and connection means for cascading the plurality of digital filters. Auditory weighting filter in the digitizer.
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記差信号に対して聴覚特性に応じ
た重み付けを施す音響符号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段と;上記音響の入力
信号における過去のフレームにおいて、量子化予測係数
に基づいてフィルタ係数が決定された合成フィルタに入
力された信号を保存する信号保存手段と;上記信号保存
手段に保存された信号に対して、n次の線形予測分析行
い、n次の予測係数を求めるn次の線形予測分析手段
と;上記n次の予測係数に基づいて、フィルタ係数を決
定する第2のフィルタ係数決定手段と;上記複数のディ
ジタルフィルタを縦続接続する接続手段と;を有するこ
とを特徴とする音響符号化装置における聴覚重み付けフ
ィルタ。4. A model of a spectral envelope of an audio input signal is performed by linear prediction analysis, and the encoding code is determined such that a difference signal between the audio input signal and a composite signal of the encoding code is minimized. In the acoustic encoding device for weighting the difference signal according to the auditory characteristics, a p-order linear prediction analysis is performed on the audio input signal to obtain a p-order prediction coefficient. Linear prediction analysis means; first filter coefficient determination means for determining a filter coefficient based on the p-order prediction coefficient; filter coefficients based on the quantized prediction coefficient in a past frame of the audio input signal Signal storage means for storing the signal input to the synthesis filter for which n is determined; n-order linear prediction analysis is performed on the signal stored in the signal storage means to obtain an n-th prediction coefficient Linear prediction analysis means; second filter coefficient determination means for determining a filter coefficient based on the n-order prediction coefficient; and connection means for cascading the plurality of digital filters. Perceptual weighting filter in an acoustic encoding device.
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記合成信号の合成を行う音響符号
化/復号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数を量子化し、p次の量子化予測
係数を作る量子化予測係数作成手段と;上記p次の量子
化予測係数に基づいて、フィルタ係数を決定する第1の
フィルタ係数決定手段と;過去のフレームにおける合成
信号に対して、m次の線形予測分析を行い、m次の予測
残差信号を求めるm次の線形予測分析手段と;上記m次
の予測残差信号に対して、n次の線形予測分析を行い、
n次の予測係数を求めるn次の線形予測分析手段と;上
記n次の予測係数に基づいて、フィルタ係数を決定する
第2のフィルタ係数決定手段と;上記複数のディジタル
フィルタを縦続接続する接続手段と;を有することを特
徴とする音響符号化/復号化装置。5. A model of a spectral envelope of an audio input signal is performed by linear prediction analysis, and the encoding code is determined such that a difference signal between the audio input signal and a composite signal of the encoding code is minimized. In the audio encoding / decoding device for synthesizing the synthesized signal, a p-order linear prediction analysis unit for performing a p-order linear prediction analysis on the audio input signal to obtain a p-th prediction coefficient A quantized prediction coefficient creating means for quantizing the p-th order prediction coefficient to generate a p-th order quantization prediction coefficient; and a first filter for determining a filter coefficient based on the p-th order quantization prediction coefficient Coefficient determining means; m-order linear prediction analysis means for performing an m-th linear prediction analysis on a synthesized signal in a past frame to obtain an m-th prediction residual signal; and the m-th prediction residual signal For n-order linear prediction analysis There,
n-th linear prediction analysis means for obtaining an n-th prediction coefficient; second filter coefficient determination means for determining a filter coefficient based on the n-th prediction coefficient; connection for cascading the plurality of digital filters Means; and an audio encoding / decoding apparatus.
ル化を線形予測分析で行い、上記音響の入力信号と符号
化符号の合成信号との差信号が最小化するように上記符
号化符号を決定し、上記合成信号の合成を行う音響符号
化/復号化装置において、 上記音響の入力信号に対して、p次の線形予測分析を行
い、p次の予測係数を求めるp次の線形予測分析手段
と;上記p次の予測係数を量子化し、p次の量子化予測
係数を作る量子化予測係数作成手段と;上記p次の量子
化予測係数に基づいて、フィルタ係数を決定する第1の
フィルタ係数決定手段と;上記音響の入力信号における
過去のフレームにおいて、p次の量子化予測係数に基づ
いてフィルタ係数が決定された合成フィルタに入力され
た信号を保存する信号保存手段と;上記信号保存手段に
保存された信号に対して、n次の線形予測分析行い、n
次の予測係数を求めるn次の線形予測分析手段と;上記
n次の予測係数に基づいて、フィルタ係数を決定する第
2のフィルタ係数決定手段と;上記複数のディジタルフ
ィルタを縦続接続する接続手段と;を有することを特徴
とする音響符号化/復号化装置。6. A model of a spectral envelope of an audio input signal is performed by linear prediction analysis, and the encoding code is determined so that a difference signal between the audio input signal and a composite signal of the encoding code is minimized. In the audio encoding / decoding device for synthesizing the synthesized signal, a p-order linear prediction analysis unit for performing a p-order linear prediction analysis on the audio input signal to obtain a p-th prediction coefficient A quantized prediction coefficient creating means for quantizing the p-th order prediction coefficient to generate a p-th order quantization prediction coefficient; and a first filter for determining a filter coefficient based on the p-th order quantization prediction coefficient Coefficient determination means; signal storage means for storing a signal input to a synthesis filter whose filter coefficient has been determined based on a p-th quantized prediction coefficient in a past frame of the audio input signal; Against the stored signal to the stage, n next performs linear prediction analysis, n
N-order linear prediction analysis means for obtaining the next prediction coefficient; second filter coefficient determination means for determining a filter coefficient based on the n-th prediction coefficient; connection means for cascading the plurality of digital filters And an audio encoding / decoding device.
化合成信号に対して、量子化雑音を聴覚的に抑圧する音
響復号化装置において、 過去のフレームを含む上記復号化合成信号に対して、m
次の線形予測分析を行い、m次の予測残差信号を求める
m次の線形予測分析手段と;LPC逆フィルタを通して
得られたm次の予測残差信号に対して、n次の線形予測
分析を行い、n次の予測係数を求めるn次線形予測手段
と;上記n次の予測係数に基づいて、フィルタ係数を決
定する第1のフィルタ係数決定手段と;上記符号化符号
から得られたn次の線形予測係数によってフィルタ係数
を決定する第2のフィルタ係数決定手段と;包絡聴覚重
み付けフィルタと;微細構造聴覚重み付けフィルタと;
上記包絡聴覚重み付けフィルタと微細構造聴覚重み付け
フィルタとを縦続に接続する接続手段と;を有すること
を特徴とする音響復号化装置におけるポストフィルタ。7. An acoustic decoding device for acoustically suppressing quantization noise of a decoded synthesized signal obtained from an encoded code of an acoustic signal, comprising: , M
M-order linear prediction analysis means for performing the following linear prediction analysis to obtain an m-th prediction residual signal; and n-order linear prediction analysis for the m-th prediction residual signal obtained through the LPC inverse filter. And n-th linear prediction means for obtaining an n-th prediction coefficient; first filter coefficient determination means for determining a filter coefficient based on the n-th prediction coefficient; n obtained from the coding code Second filter coefficient determining means for determining a filter coefficient by the following linear prediction coefficient; an envelope auditory weighting filter; a fine structure auditory weighting filter;
Connection means for cascade-connecting the envelope auditory weighting filter and the fine structure auditory weighting filter.
号化合成信号に対して、量子化雑音を聴覚的に抑圧する
音響復号化装置において、 過去のフレームにおいて、上記入力符号から得られたp
次の線形予測係数からフィルタ係数が決定された合成フ
ィルタに入力された信号を保存する信号保存手段と;上
記保存された信号に対して、n次の線形予測分析を行
い、n次の予測係数を求めるn次の線形予測手段と;上
記n次の予測係数に基づいて、フィルタ係数を決定する
第1のフィルタ係数決定手段と;現在のフレームにおけ
る上記符号化符号から得られたn次の線形予測係数によ
ってフィルタ係数を決定する第2のフィルタ係数決定手
段と;包絡聴覚重み付けフィルタと;微細構造聴覚重み
付けフィルタと;上記包絡聴覚重み付けフィルタと上記
微細構造聴覚重み付けフィルタとを縦続に接続する接続
手段と;を有することを特徴とする音響復号化装置にお
けるポストフィルタ。8. An acoustic decoding apparatus for acoustically suppressing quantization noise of a decoded synthesized signal synthesized from an encoded code of an acoustic signal, wherein the decoded signal is obtained from the input code in a past frame. p
Signal storage means for storing a signal input to a synthesis filter for which a filter coefficient has been determined from the next linear prediction coefficient; performing n-order linear prediction analysis on the stored signal to obtain an n-th prediction coefficient N first-order linear prediction means for determining a filter coefficient based on the n-th prediction coefficient; and n-th linearity obtained from the coding code in the current frame. Second filter coefficient determining means for determining a filter coefficient based on a prediction coefficient; an envelope auditory weighting filter; a fine structure auditory weighting filter; And a post filter in the audio decoding device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09604096A JP3248668B2 (en) | 1996-03-25 | 1996-03-25 | Digital filter and acoustic encoding / decoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09604096A JP3248668B2 (en) | 1996-03-25 | 1996-03-25 | Digital filter and acoustic encoding / decoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09258795A JPH09258795A (en) | 1997-10-03 |
JP3248668B2 true JP3248668B2 (en) | 2002-01-21 |
Family
ID=14154388
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09604096A Expired - Fee Related JP3248668B2 (en) | 1996-03-25 | 1996-03-25 | Digital filter and acoustic encoding / decoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3248668B2 (en) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0998166A1 (en) * | 1998-10-30 | 2000-05-03 | Koninklijke Philips Electronics N.V. | Device for audio processing,receiver and method for filtering the wanted signal and reproducing it in presence of ambient noise |
EP1052622B1 (en) * | 1999-05-11 | 2007-07-11 | Nippon Telegraph and Telephone Corporation | Selection of a synthesis filter for CELP type wideband audio coding |
US7283961B2 (en) | 2000-08-09 | 2007-10-16 | Sony Corporation | High-quality speech synthesis device and method by classification and prediction processing of synthesized sound |
JP4517262B2 (en) * | 2000-11-14 | 2010-08-04 | ソニー株式会社 | Audio processing device, audio processing method, learning device, learning method, and recording medium |
JP2002062899A (en) * | 2000-08-23 | 2002-02-28 | Sony Corp | Device and method for data processing, device and method for learning and recording medium |
EP1944759B1 (en) * | 2000-08-09 | 2010-10-20 | Sony Corporation | Voice data processing device and processing method |
US6947888B1 (en) * | 2000-10-17 | 2005-09-20 | Qualcomm Incorporated | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
US6859775B2 (en) | 2001-03-06 | 2005-02-22 | Ntt Docomo, Inc. | Joint optimization of excitation and model parameters in parametric speech coders |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US8027242B2 (en) | 2005-10-21 | 2011-09-27 | Qualcomm Incorporated | Signal coding and decoding based on spectral dynamics |
US8392176B2 (en) | 2006-04-10 | 2013-03-05 | Qualcomm Incorporated | Processing of excitation in audio coding and decoding |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
JP5013293B2 (en) * | 2008-02-29 | 2012-08-29 | 日本電信電話株式会社 | Encoding device, decoding device, encoding method, decoding method, program, recording medium |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62111299A (en) * | 1985-11-08 | 1987-05-22 | 松下電器産業株式会社 | Voice signal feature extraction circuit |
JP2625998B2 (en) * | 1988-12-09 | 1997-07-02 | 沖電気工業株式会社 | Feature extraction method |
JPH0477799A (en) * | 1990-07-19 | 1992-03-11 | Oki Electric Ind Co Ltd | Feature amount extracting method for pitch signal |
JPH05257498A (en) * | 1992-03-11 | 1993-10-08 | Mitsubishi Electric Corp | Voice coding system |
JPH06250697A (en) * | 1993-02-26 | 1994-09-09 | Fujitsu Ltd | Method and device for voice coding and decoding |
JPH09297597A (en) * | 1996-03-06 | 1997-11-18 | Fujitsu Ltd | High-efficiency speech transmission system and high-efficiency speech transmission device |
-
1996
- 1996-03-25 JP JP09604096A patent/JP3248668B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09258795A (en) | 1997-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3707116B2 (en) | Speech decoding method and apparatus | |
JP3707153B2 (en) | Vector quantization method, speech coding method and apparatus | |
JP3235703B2 (en) | Method for determining filter coefficient of digital filter | |
JP3707154B2 (en) | Speech coding method and apparatus | |
JP3680380B2 (en) | Speech coding method and apparatus | |
JP4005154B2 (en) | Speech decoding method and apparatus | |
EP0503684B1 (en) | Adaptive filtering method for speech and audio | |
JP3234609B2 (en) | Low-delay code excitation linear predictive coding of 32Kb / s wideband speech | |
JP3557662B2 (en) | Speech encoding method and speech decoding method, and speech encoding device and speech decoding device | |
JPH09212199A (en) | Linear predictive analyzing method for audio frequency signal and method for coding and decoding audio frequency signal including its application | |
JPH1091194A (en) | Method of voice decoding and device therefor | |
JPH10124092A (en) | Method and device for encoding speech and method and device for encoding audible signal | |
JP3248668B2 (en) | Digital filter and acoustic encoding / decoding device | |
JP3236592B2 (en) | Speech coding method for use in a digital speech coder | |
JP2645465B2 (en) | Low delay low bit rate speech coder | |
EP0810584A2 (en) | Signal coder | |
JP4359949B2 (en) | Signal encoding apparatus and method, and signal decoding apparatus and method | |
JP4281131B2 (en) | Signal encoding apparatus and method, and signal decoding apparatus and method | |
JP3095133B2 (en) | Acoustic signal coding method | |
JPH09127987A (en) | Signal coding method and device therefor | |
JP4618823B2 (en) | Signal encoding apparatus and method | |
JP3520955B2 (en) | Acoustic signal coding | |
JP3192051B2 (en) | Audio coding device | |
JP2853170B2 (en) | Audio encoding / decoding system | |
JP3675054B2 (en) | Vector quantization method, speech encoding method and apparatus, and speech decoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071109 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081109 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |