JPH08137494A - Sound signal encoding device, decoding device, and processing device - Google Patents

Sound signal encoding device, decoding device, and processing device

Info

Publication number
JPH08137494A
JPH08137494A JP6272006A JP27200694A JPH08137494A JP H08137494 A JPH08137494 A JP H08137494A JP 6272006 A JP6272006 A JP 6272006A JP 27200694 A JP27200694 A JP 27200694A JP H08137494 A JPH08137494 A JP H08137494A
Authority
JP
Japan
Prior art keywords
acoustic signal
band
signal
frequency
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6272006A
Other languages
Japanese (ja)
Inventor
Itaru Kaneko
格 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GRAPHICS COMMUN LAB KK
Original Assignee
GRAPHICS COMMUN LAB KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GRAPHICS COMMUN LAB KK filed Critical GRAPHICS COMMUN LAB KK
Priority to JP6272006A priority Critical patent/JPH08137494A/en
Publication of JPH08137494A publication Critical patent/JPH08137494A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

PURPOSE: To provide a sound signal encoding device, a sound signal decoding device, and a sound signal processing device in which a sound signal is inputted, redundancy of a sound signal is reduced, the signal is encoded, encoded data in which redundancy is reduced is inputted and it is decoded to a sound signals. CONSTITUTION: An input sound signal is divided into plural frequency components by a band divider 11, and code quantity corresponding to each frequency band of input sound signals is allowed by a code quantity allotting device 14. Next, after the next coefficient is predicted from a coefficient column before it corresponds to a frequency component divided by the band divider 11 by an in-band signal predicting device 12, a frequency component is subtracted from a predicted value and a residual component is obtained, after the residual component obtained by the in-band signal predicting device 12 is quantized by a residual component encoding device 13 corresponding to code quantity allotted by the code quantity allotting device 14, the quantized residual component is encoded.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、音響信号符号化装置、
音響信号復号装置および音響信号処理装置に関し、特
に、音響信号を入力して音響信号の冗長性を削減して符
号化し、冗長性を削減された符号化データを入力して音
響信号に復号する音響信号符号化装置、音響信号復号装
置および音響信号処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an acoustic signal coding device,
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an acoustic signal decoding device and an acoustic signal processing device, and more particularly, to an acoustic signal that inputs an acoustic signal to reduce the redundancy of the acoustic signal for encoding, and to input encoded data with reduced redundancy to decode the acoustic signal. The present invention relates to a signal encoding device, an acoustic signal decoding device, and an acoustic signal processing device.

【0002】[0002]

【従来の技術】従来、音響信号の冗長性を利用して効率
的に音響信号を符号化する音響信号符号化装置として
は、全帯域の音響信号を利用して続く波形を予測するこ
とで、伝送または記録する符号量を削減するものがあっ
た。例えば、DPCM方式やADPCM方式は音響信号
の直前までの値との差分値を伝送することにより符号量
を削減するものがあった。また、人間の聴覚が比較的近
い周波数の成分をマスクするというマスキング効果を有
効に利用するために、上記方式を複数の周波数帯域に分
離して行う方式として、例えば、ITU−T勧告G72
2においては、音響信号を4つの帯域に分割した後に、
それぞれの成分毎にADPCM方式を使用するものがあ
った。
2. Description of the Related Art Conventionally, as an acoustic signal encoding apparatus for efficiently encoding an acoustic signal by utilizing the redundancy of the acoustic signal, by predicting the subsequent waveform by utilizing the acoustic signal of the entire band, Some have reduced the amount of code to be transmitted or recorded. For example, in the DPCM system and the ADPCM system, there is a system in which the code amount is reduced by transmitting a difference value from the value up to immediately before the acoustic signal. In order to effectively use the masking effect of masking components of frequencies relatively close to human hearing, as a method of performing the above method by dividing it into a plurality of frequency bands, for example, ITU-T Recommendation G72.
In 2, after dividing the acoustic signal into four bands,
Some have used the ADPCM method for each component.

【0003】一方、近年、人間の聴覚の性質をより積極
的に利用する方式が登場した。これらの方式は、周波数
マスキング効果の精密なモデルを適用することで、マス
キング効果を限界まで利用するものである。例えば、I
SO/IEC11172.3国際標準(MPEG Audio)
は、音響信号の帯域を32から384帯域に分割した後
に、それぞれについて最適な符号量を割り当てること
で、符号量を削減するものである。また、米国通信委員
会ATSC(Advanced Television Systems Committee
)規格の音響伝送(Dolby AC3 )や、MiniDis
c方式等も同様である。
On the other hand, in recent years, a system that more positively utilizes the nature of human hearing has appeared. These methods utilize the masking effect to the limit by applying a precise model of the frequency masking effect. For example, I
SO / IEC 11172.3 International Standard (MPEG Audio)
Is to reduce the code amount by dividing the band of the acoustic signal into 32 to 384 bands and then allocating an optimum code amount to each band. In addition, ATSC (Advanced Television Systems Committee)
) Standard sound transmission (Dolby AC3) and MiniDis
The same applies to the c method and the like.

【0004】また、従来、音響信号符号化装置、音響信
号復号装置および音響信号処理装置については、特開平
4−503136号公報記載の「高品質オーディオ用短
時間遅延変換コーダ、デコーダ、及びエンコーダ・デコ
ーダ」が報告されている。このもののエンコーダ部分
は、信号標本化及び量子化装置101、信号標本化バッ
ファ102、分析ウインドウ逓倍装置103、ディジタ
ル・フィルタバンク104、ブロック・フローティング
ポイント・エンコーダ105、適応的ビット割当装置1
06、均質量子化装置107およびフォーマッタ109
によって構成されている。このものは、信号標本化及び
量子化装置101により広帯域のアナログ・オーディオ
情報を時間領域信号のサンプル・ブロックに標準化して
量子化し、分析ウインドウ逓倍装置103により分析ウ
インドウを用いて各時間領域信号サンプル・ブロックを
重み付けする。次に、適応的ビット割当装置106を有
するサブバンド装置108により分析ウインドウで重み
付けされた時間領域信号サンプル・ブロックに応答し
て、周波数サブバンドを定義し、符号化精度が適応的ビ
ット割当装置106によって決定される適応的部分と非
適応的部分とから成る1つ以上のディジタル・ワードを
各サブバンドに対して含むサブバンド情報を発生し、フ
ォーマット化装置109によりサブバンド情報を含むデ
ィジタル情報を伝送又は記憶に適するフォーマットを有
するディジタル出力に組み立てるように構成すること
で、広帯域のアナログのオーディオ情報を高品位でディ
ジタル符号化するという利点を有するものである。
Further, in the past, regarding the audio signal encoding device, the audio signal decoding device and the audio signal processing device, there is disclosed in Japanese Unexamined Patent Publication No. 4-503136, "Short delay conversion coder for high quality audio, decoder and encoder. Decoder "has been reported. The encoder part of this is a signal sampling and quantizing device 101, a signal sampling buffer 102, an analysis window multiplier 103, a digital filter bank 104, a block floating point encoder 105, an adaptive bit allocation device 1.
06, homogeneous quantizer 107 and formatter 109
It is composed by. This signal is obtained by standardizing and quantizing wide band analog audio information into a sample block of a time domain signal by a signal sampling and quantizing device 101, and analyzing a time domain signal sample by an analysis window multiplication device 103 using an analysis window. • Weight blocks. The frequency subband is then defined in response to the analysis window weighted time domain signal sample blocks by the subband unit 108 having the adaptive bit allocation unit 106, and the coding accuracy is adaptive bit allocation unit 106. Generating subband information containing for each subband one or more digital words consisting of an adaptive portion and a non-adaptive portion determined by the formatting device 109; It has the advantage of high-quality digital encoding of wideband analog audio information by configuring it for assembly into a digital output having a format suitable for transmission or storage.

【0005】一方、このもののデコーダ部分は、デフォ
ーマッタ112、線形化装置113、ディジタル・フィ
ルタバンク114、合成ウインドウ逓倍装置115、信
号ブロック重複・加算装置116およびアナログ信号発
生器117によって構成されている。このものは、符号
化信号からサブバンド・ブロックを誘導するために符号
化信号を受け取り、適応的割当装置を含むデフォーマッ
タ112により符号化精度が適応的ビット割当装置10
6によって決定されるディジタル・ワードを再構築す
る。次に、線形化装置113およびディジタル・フィル
タバンク114により誘導されたサブバンド情報ブロッ
クの対応する1つに応じて時間領域信号サンプル・ブロ
ックの各々が発生される時間領域信号サンプル・ブロッ
クを発生し、合成ウインドウ逓倍装置115により時間
領域信号サンプル・ブロックを合成ウインドウによって
重み付けする。次に、信号ブロック重複・加算装置11
6によりウインドウ重み付け効果を消去してアナログ・
オ−ディオ情報のディジタル化された表現を復元し、ア
ナログ信号発生器117によりディジタル化された表現
をアナログ形式に転換するように構成することで、広帯
域のアナログのオーディオ情報をディジタル情報を含む
符号化された信号から分析ウインドウで重み付けられた
量子化入力信号に応じて再生するという利点を有するも
のである。
On the other hand, the decoder part of this one is composed of a deformatter 112, a linearization device 113, a digital filter bank 114, a synthesis window multiplication device 115, a signal block duplication / addition device 116 and an analog signal generator 117. . It receives a coded signal to derive a subband block from the coded signal, and a deformatter 112 including an adaptive allocator provides an adaptive bit allocator 10 with a coding accuracy.
Reconstruct the digital word determined by 6. Next, a time domain signal sample block is generated in which each of the time domain signal sample blocks is generated in response to a corresponding one of the subband information blocks derived by the linearizer 113 and the digital filter bank 114. , The synthesis window multiplier 115 weights the time domain signal sample blocks by the synthesis window. Next, the signal block duplication / addition device 11
By removing the window weighting effect by 6, analog
A wideband analog audio information is encoded with digital information by recovering the digitized representation of the audio information and converting the digitized representation by the analog signal generator 117 into an analog format. It has the advantage of reproducing from the quantized signal according to the quantized input signal weighted in the analysis window.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、これら
の音響信号復号装置および音響信号処理装置において
は、音響信号を一定周波数間隔と一定時間間隔に区切っ
た後に、符号量の割り当てを行っていたため、聴覚モデ
ルも一定周波数間隔と一定時間間隔毎に人間の聴覚の感
度を与えるものとして規定しなければならないといった
問題があった。
However, in these acoustic signal decoding apparatus and acoustic signal processing apparatus, since the acoustic signal is divided into the constant frequency interval and the constant time interval, the code amount is assigned, and therefore There is also a problem that the model also has to be defined as one that gives the sensitivity of human hearing at constant frequency intervals and constant time intervals.

【0007】また、ISO/IECの標準化グループ内
の公式試聴テストにおいて、聴覚特性を利用する方法が
最も高い性能を示すように、予測だけを用いて音響信号
を符号化する場合は、信号の冗長性は十分に削減される
という利点を生ずるが、聴覚のマスキング特性には対応
していないので、マスキング特性を精密にもれなく利用
することができず、最適な符号化ができないといった問
題があった。
Further, in the official listening test within the standardization group of ISO / IEC, when the acoustic signal is coded using only the prediction so that the method utilizing the auditory characteristics exhibits the highest performance, the signal redundancy is used. However, since it does not correspond to the masking characteristics of the auditory sense, there is a problem that the masking characteristics cannot be used precisely and the optimum coding cannot be performed.

【0008】また、聴覚特性を用いて従来のように固定
された帯域および時間ブロック毎に符号量または符号化
精度を制御する場合は、前述のように聴覚の特性を、帯
域と時間の関数としてモデル化する必要がある。このよ
うに、聴覚特性をモデル化した場合に、周波数空間にお
ける聴覚特性と時間軸方向におけるマスキング特性は通
常まったく別個のモデルで記述された後に組み合わされ
ていた。しかしながら、音響信号の時間的変化と周波数
空間における分布は完全に分離できるものではないの
で、この方式には困難があった。例えば、周波数空間で
のマスキング効果を高めるために周波数解像度を高める
と、不確定性原理に基づいて時間軸上の解像度が低くな
り、時間マスキング効果は有効に利用できなくなり、逆
に時間解像度を上げると周波数解像度が下がるといった
問題があった。
Further, when controlling the code amount or the coding accuracy for each fixed band and time block by using the auditory characteristic as in the conventional case, the auditory characteristic as a function of the bandwidth and the time as described above is used. Need to be modeled. As described above, when the auditory characteristics are modeled, the auditory characteristics in the frequency space and the masking characteristics in the time axis direction are usually described by completely different models and then combined. However, this method is difficult because the temporal change of the acoustic signal and the distribution in the frequency space cannot be completely separated. For example, if the frequency resolution is increased in order to enhance the masking effect in the frequency space, the resolution on the time axis becomes lower based on the uncertainty principle, the time masking effect cannot be used effectively, and conversely the time resolution is increased. And there was a problem that the frequency resolution was lowered.

【0009】例えば、時間解像度と周波数解像度とのど
ちらかを優先させる場合に、前記特開平4−50313
6号公報記載の方式では、時間解像度を優先するときに
は、128サンプルを1フレームとし、周波数解像度を
優先するときには、256サンプルを1フレームとする
等の解決方法が取り得る。しかしながら、このような方
法では、時間解像度と周波数解像度との選択は2通りし
かなく、またフレーム単位にしか選択できないため、信
号に応じた最適な時間/周波数解像度とはならない。ま
た、ある帯域に時間変化の激しい成分を含み、別の帯域
に精細な周波数分布を有する継続的な成分を含むような
信号の場合には、ブロック単位での時間/周波数解像度
の最適な調整はできなくなるといった問題があった。
For example, in the case of prioritizing either time resolution or frequency resolution, the above-mentioned Japanese Patent Laid-Open No. 4-50313.
In the method described in Japanese Patent Laid-Open No. 6-128, when the time resolution is prioritized, 128 samples are set as one frame, and when the frequency resolution is prioritized, 256 samples are set as one frame. However, in such a method, there are only two choices of the time resolution and the frequency resolution, and only the frame unit can be selected. Therefore, the optimum time / frequency resolution according to the signal cannot be obtained. In addition, in the case of a signal that includes a component that changes rapidly with time in one band and a continuous component that has a fine frequency distribution in another band, optimal adjustment of time / frequency resolution in block units is not possible. There was a problem that I could not do it.

【0010】また、音響信号の周波数軸上の聴覚特性の
微細な構造についても、例えば近接マスキングのように
隣接する周波数の周波数マスキング効果までをも周波数
成分間の比較演算により求める必要があり、この比較演
算のために繁雑な計算を必要とするといった問題があっ
た。そこで、本発明の音響信号符号化装置は、音響信号
を帯域分割した後に、帯域内の周波数成分に対して線形
の予測器を用いて予測し、予測値と入力値の残差成分を
量子化したものを圧縮符号として出力することで、広域
的なマスキング特性を帯域分割と帯域間の符号量割当に
よって利用し、近接マスキング効果を予測器のフィルタ
ー特性の制御によって効率よく利用することができ、ま
た、予測器のフィルター特性を音響信号の性質に適応的
に制御することで、時間分解能と周波数分解能力を最適
に調節することができ、さらにまた、予測器が予測でき
る範囲の音響入力については、出力符号が著しく減少で
き、特に、正弦波や多数の高調波成分を含む波形を、そ
れぞれの帯域内で予測した波形を重ねあわせることで予
測し、全体の符号量を削減することができる音響信号符
号化装置を提供することを課題としている。
With respect to the fine structure of the auditory characteristics on the frequency axis of the acoustic signal, it is necessary to obtain the frequency masking effect of adjacent frequencies such as proximity masking by comparing the frequency components. There is a problem that complicated calculation is required for comparison calculation. Therefore, the acoustic signal encoding device of the present invention divides the acoustic signal into bands, predicts the frequency components within the bands using a linear predictor, and quantizes the residual component of the predicted value and the input value. By outputting the compressed code as a compressed code, wide area masking characteristics can be used by band division and code amount allocation between bands, and proximity masking effect can be efficiently used by controlling the filter characteristics of the predictor. By adaptively controlling the filter characteristics of the predictor to the characteristics of the acoustic signal, it is possible to optimally adjust the time resolution and frequency resolution capability. Furthermore, regarding the acoustic input within the range that the predictor can predict, , The output code can be significantly reduced, and in particular, a waveform containing a sine wave and many harmonic components can be predicted by superimposing the waveforms predicted in each band, and the overall code amount can be calculated. It has an object to provide an acoustic signal encoding apparatus capable of reducing.

【0011】そこで、本発明の音響信号復号装置は、出
力符号が著しく減少された符号化データに基づいて音響
信号を合成でき、特に、全体の符号量を削減された多数
の高調波成分を含む波形の音響信号を合成することがで
きる音響信号復号装置を提供することを課題としてい
る。
Therefore, the acoustic signal decoding apparatus of the present invention can synthesize an acoustic signal on the basis of encoded data whose output code is significantly reduced, and in particular includes a large number of harmonic components with a reduced overall code amount. An object of the present invention is to provide an acoustic signal decoding device capable of synthesizing waveform acoustic signals.

【0012】[0012]

【課題を解決するための手段】請求項1記載の発明は、
上記課題を解決するため、音響信号を入力して該音響信
号の冗長性を削減して符号化する音響信号符号化装置に
おいて、入力音響信号を複数の周波数成分に分割する帯
域分割器と、該入力音響信号の各周波数帯域に対応する
符号量を割り当てる符号量割当器と、前記帯域分割器で
分割された周波数成分に対応する以前の係数列から次の
係数を予測した後に、該予測値から該周波数成分を減算
して残差成分を求める帯域内信号予測器と、前記符号量
割当器で割り当てられた符号量に対応させて該帯域内信
号予測器で求められた該残差成分を量子化した後に、符
号化する残差成分符号化器と、を備えたことを特徴とす
る。
According to the first aspect of the present invention,
In order to solve the above-mentioned problems, in an acoustic signal encoding device for inputting an acoustic signal and encoding while reducing the redundancy of the acoustic signal, a band divider that divides the input acoustic signal into a plurality of frequency components, A code amount assigner that assigns a code amount corresponding to each frequency band of the input acoustic signal, and after predicting the next coefficient from the previous coefficient sequence corresponding to the frequency component divided by the band divider, from the predicted value An in-band signal predictor for subtracting the frequency component to obtain a residual component, and a quantum for the residual component obtained by the in-band signal predictor corresponding to the code amount assigned by the code amount assigner And a residual component encoder which encodes the encoded residual component.

【0013】請求項2記載の発明は、上記課題を解決す
るため、前記帯域分割器が、前記入力音響信号を周波数
毎の成分に分離する多相フィルタ・バンク、前記入力音
響信号を周波数毎の成分に分離する離散フーリエ変換
器、前記入力音響信号を周波数毎の成分に分離する離散
ハートレイ変換器、前記入力音響信号を直交変換を施し
て周波数毎の成分に分離する離散コサイン変換器、前記
入力音響信号を直交変換を施して周波数毎の成分に分離
する変形離散コサイン変換器、のうちいずれか1つによ
って構成することを特徴とする。
According to a second aspect of the present invention, in order to solve the above-mentioned problems, the band divider divides the input acoustic signal into components for each frequency, a polyphase filter bank, and the input acoustic signal for each frequency. A discrete Fourier transformer for separating the input acoustic signal into components for each frequency, a discrete Hartley transformer for separating the input acoustic signal into components for each frequency, a discrete cosine transformer for performing orthogonal transformation on the input acoustic signal to separate into components for each frequency, the input It is characterized in that it is configured by any one of modified discrete cosine converters that perform orthogonal transformation on an acoustic signal to separate it into frequency components.

【0014】請求項3記載の発明は、上記課題を解決す
るため、前記符号量割当器が、聴覚モデルの最小可聴レ
ベルに対応させて符号量を割り当てるように構成するこ
とを特徴とする。請求項4記載の発明は、上記課題を解
決するため、冗長性を削減された符号化データを入力し
て音響信号に復号する音響信号復号装置において、入力
された符号化データを残差成分に復号する残差成分復号
器と、それぞれの周波数成分の以前の係数列から次の係
数を予測し、該残差成分復号器で復号された残差成分で
該予測値を補正して周波数成分を生成する帯域内信号予
測器と、該帯域内信号予測器で生成された各周波数成分
から音響信号を合成する帯域合成器と、を備えたことを
特徴とする。
In order to solve the above problems, the code amount assigner is configured to assign the code amount corresponding to the minimum audible level of the auditory model. In order to solve the above-mentioned problems, an invention according to a fourth aspect is an acoustic signal decoding apparatus for inputting encoded data with reduced redundancy and decoding it into an acoustic signal, wherein the input encoded data is used as a residual component. The residual component decoder to be decoded and the next coefficient is predicted from the previous coefficient sequence of each frequency component, and the predicted value is corrected by the residual component decoded by the residual component decoder to obtain the frequency component. An in-band signal predictor to be generated and a band synthesizer to synthesize an acoustic signal from each frequency component generated by the in-band signal predictor are provided.

【0015】請求項5記載の発明は、上記課題を解決す
るため、前記帯域合成器が、前記帯域内信号予測器で生
成された各周波数成分から音響信号を合成する逆多相フ
ィルタ・バンク、前記帯域内信号予測器で生成された各
周波数成分から音響信号を合成する逆離散フーリエ変換
器、前記帯域内信号予測器で生成された各周波数成分か
ら音響信号を合成する逆離散ハートレイ変換器、前記帯
域内信号予測器で生成された各周波数成分から逆直交変
換を施して音響信号を合成する逆離散コサイン変換器、
前記帯域内信号予測器で生成された各周波数成分から逆
直交変換を施して音響信号を合成する逆変形離散コサイ
ン変換器、のうちいずれか1つによって構成することを
特徴とする。
In order to solve the above-mentioned problems, the present invention as set forth in claim 5 is an inverse polyphase filter bank in which the band synthesizer synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor, An inverse discrete Fourier transformer that synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor, an inverse discrete Hartley transformer that synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor, An inverse discrete cosine transformer that synthesizes an acoustic signal by performing an inverse orthogonal transform from each frequency component generated by the in-band signal predictor,
It is characterized in that it is configured by any one of an inverse modified discrete cosine transformer that performs an inverse orthogonal transform on each frequency component generated by the in-band signal predictor to synthesize an acoustic signal.

【0016】請求項6記載の発明は、上記課題を解決す
るため、請求項1記載の音響信号符号化装置において、
前記符号量割当器で割り当てられた符号量に対応させて
前記残差成分符号化器で残差成分を量子化する際に、周
波数成分に擬似的に対応する擬似周波数成分の以前の係
数列から次の係数を予測した後に、該予測値から逆量子
化された該残差成分を減算して擬似周波数成分を求める
ローカルデコーダを備え、前記帯域内信号予測器が、該
ローカルデコーダで求められた該予測値から前記帯域分
割器で分割された周波数成分を減算して残差成分を求
め、前記残差成分符号化器で該残差成分を量子化した後
に、符号化データに符号化する一方、請求項4記載の音
響信号復号装置において、該符号化データを入力して音
響信号に復号するように構成することを特徴とする。
In order to solve the above-mentioned problems, the invention according to claim 6 is the audio signal encoding device according to claim 1, wherein:
When quantizing the residual component in the residual component encoder in association with the code amount assigned by the code amount assigner, from the previous coefficient sequence of the pseudo frequency component pseudo corresponding to the frequency component After predicting the next coefficient, a local decoder for calculating the pseudo frequency component by subtracting the dequantized residual component from the predicted value is provided, and the in-band signal predictor is calculated by the local decoder. The residual component is obtained by subtracting the frequency component divided by the band divider from the predicted value, the residual component is quantized by the residual component encoder, and then encoded into encoded data. According to a fourth aspect of the present invention, there is provided the acoustic signal decoding device, wherein the encoded data is input and decoded into an acoustic signal.

【0017】請求項7記載の発明は、上記課題を解決す
るため、上記請求項1乃至6記載の発明を組み合わせる
ことによって構成することを特徴とする。
In order to solve the above-mentioned problems, the invention according to claim 7 is constituted by combining the inventions according to claims 1 to 6.

【0018】[0018]

【作用】請求項1記載の発明では、帯域分割器により入
力音響信号を複数の周波数成分に分割し、符号量割当器
により入力音響信号の各周波数帯域に対応する符号量を
割り当てる。次に、帯域内信号予測器により帯域分割器
で分割された周波数成分に対応する以前の係数列から次
の係数を予測した後に、予測値から周波数成分を減算し
て残差成分を求め、残差成分符号化器により符号量割当
器で割り当てられた符号量に対応させて帯域内信号予測
器で求められた残差成分を量子化した後に、量子化され
た残差成分を符号化する。
According to the first aspect of the present invention, the band divider divides the input acoustic signal into a plurality of frequency components, and the code amount assigner assigns the code amount corresponding to each frequency band of the input acoustic signal. Next, after predicting the next coefficient from the previous coefficient sequence corresponding to the frequency component divided by the band divider by the in-band signal predictor, the frequency component is subtracted from the predicted value to obtain the residual component, After the residual component obtained by the in-band signal predictor is quantized by the difference component encoder in correspondence with the code amount assigned by the code amount assigner, the quantized residual component is encoded.

【0019】請求項2記載の発明では、請求項1記載の
発明において、帯域分割器が、入力音響信号を周波数毎
の成分に分離する多相フィルタ・バンク、入力音響信号
を周波数毎の成分に分離する離散フーリエ変換器、入力
音響信号を周波数毎の成分に分離する離散ハートレイ変
換器、入力音響信号を直交変換を施して周波数毎の成分
に分離する離散コサイン変換器、入力音響信号を直交変
換を施して周波数毎の成分に分離する変形離散コサイン
変換器、のうちいずれか1つによって構成する。
According to a second aspect of the present invention, in the first aspect of the present invention, the band divider is a polyphase filter bank for separating the input acoustic signal into frequency components, and the input acoustic signal into frequency components. Discrete Fourier transformer for separation, Discrete Hartley transformer for separating input acoustic signal into frequency components, Discrete cosine transformer for performing orthogonal transformation of input acoustic signal into frequency components, and orthogonal transformation of input acoustic signal , And a modified discrete cosine converter that separates each frequency component.

【0020】請求項3記載の発明では、請求項1記載の
発明において、符号量割当器が、聴覚モデルの最小可聴
レベルに対応させて符号量を割り当てるように構成す
る。請求項4記載の発明では、残差成分復号器により入
力された符号化データを残差成分に復号し、帯域内信号
予測器によりそれぞれの周波数成分の以前の係数列から
次の係数を予測し、残差成分復号器で復号された残差成
分で予測値を補正して周波数成分を生成する。次に、帯
域合成器により帯域内信号予測器で生成された各周波数
成分から音響信号を合成する。
According to a third aspect of the present invention, in the first aspect of the invention, the code amount assigner is configured to assign the code amount corresponding to the minimum audible level of the auditory model. In the invention according to claim 4, the encoded data input by the residual component decoder is decoded into residual components, and the in-band signal predictor predicts the next coefficient from the previous coefficient sequence of each frequency component. , The residual component decoded by the residual component decoder corrects the prediction value to generate a frequency component. Next, the band synthesizer synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor.

【0021】請求項5記載の発明では、請求項4記載の
発明において、帯域合成器が、帯域内信号予測器で生成
された各周波数成分から音響信号を合成する逆多相フィ
ルタ・バンク、帯域内信号予測器で生成された各周波数
成分から音響信号を合成する逆離散フーリエ変換器、帯
域内信号予測器で生成された各周波数成分から音響信号
を合成する逆離散ハートレイ変換器、帯域内信号予測器
で生成された各周波数成分から逆直交変換を施して音響
信号を合成する逆離散コサイン変換器、帯域内信号予測
器で生成された各周波数成分から逆直交変換を施して音
響信号を合成する逆変形離散コサイン変換器、のうちい
ずれか1つによって構成する。
According to a fifth aspect of the present invention, in the fourth aspect of the present invention, the band synthesizer synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor. Inverse Discrete Fourier Transform that synthesizes an acoustic signal from each frequency component generated by the in-signal predictor, Inverse Discrete Hartley Transform that synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor, In-band signal Inverse Discrete Cosine Transformer that synthesizes acoustic signal by performing inverse orthogonal transform from each frequency component generated by the predictor, and synthesizes acoustic signal by performing inverse orthogonal transform from each frequency component generated by the in-band signal predictor , Or an inverse modified discrete cosine transformer.

【0022】請求項6記載の発明では、請求項1記載の
音響信号符号化装置において、ローカルデコーダにより
符号量割当器で割り当てられた符号量に対応させて残差
成分符号化器で残差成分を量子化する際に、周波数成分
に擬似的に対応する擬似周波数成分の以前の係数列から
次の係数を予測した後に、この予測値から逆量子化され
た残差成分を減算して擬似周波数成分を求めた後に、帯
域内信号予測器が、ローカルデコーダで求められた該予
測値から帯域分割器で分割された周波数成分を減算して
残差成分を求め、残差成分符号化器で残差成分を量子化
した後に、符号化データに符号化する一方、請求項4記
載の音響信号復号装置において、この符号化データを入
力して音響信号に復号するように構成する。
According to a sixth aspect of the present invention, in the acoustic signal encoding apparatus according to the first aspect, the residual component encoder causes the residual component to correspond to the code amount assigned by the code amount assigner by the local decoder. When quantizing, the next coefficient is predicted from the previous coefficient sequence of the pseudo frequency component that pseudo corresponds to the frequency component, and then the dequantized residual component is subtracted from this predicted value to determine the pseudo frequency. After obtaining the component, the in-band signal predictor subtracts the frequency component divided by the band divider from the predicted value obtained by the local decoder to obtain the residual component, and the residual component encoder While the difference component is quantized and then encoded into encoded data, the acoustic signal decoding device according to claim 4 is configured so that the encoded data is input and decoded into an acoustic signal.

【0023】請求項7記載の発明では、請求項1乃至6
記載の発明を組み合わせることによって構成する。
In the invention described in claim 7, claims 1 to 6 are provided.
It is configured by combining the described inventions.

【0024】[0024]

【実施例】以下、本発明の実施例を図面を参照して説明
する。 (実施例1)図1は本発明の一実施例である音響信号符
号化装置および音響信号復号装置のシステム構成図であ
る。
Embodiments of the present invention will be described below with reference to the drawings. (Embodiment 1) FIG. 1 is a system configuration diagram of an acoustic signal coding apparatus and an acoustic signal decoding apparatus according to an embodiment of the present invention.

【0025】図1に示す音響信号符号化装置は、入力音
響信号を入力して64の周波数成分を出力する帯域分割
器11、64個の周波数ブロックに分割された帯域内信
号予測器12、64個の周波数ブロックに分割された残
差成分符号化器13、入力音響信号を入力して32の周
波数成分毎の符号量割当を出力する符号量割当器14お
よび64個の周波数ブロックに分割された出力符号デー
タを一つながりのビット列に組み立てるフォーマッタ1
5によって構成される。
The acoustic signal coding apparatus shown in FIG. 1 is a band divider 11 for inputting an input acoustic signal and outputting 64 frequency components, and an in-band signal predictor 12, 64 divided into 64 frequency blocks. Residual component encoder 13 divided into frequency blocks, code amount allocator 14 that inputs an input acoustic signal and outputs code amount allocation for each of 32 frequency components, and is divided into 64 frequency blocks. Formatter 1 that assembles output code data into a series of bit strings
It is composed of 5.

【0026】図2は、図1に示す音響信号符号化装置の
各周波数ブロックに対応する構成図である。64個の各
周波数ブロックは各入力信号の1/64の帯域を処理
し、全体で全帯域が処理されるように構成される。ま
ず、音響信号符号化装置のシステム構成について、図2
に示す音響信号符号化装置と、図3に示す線形予測法を
用いた帯域内信号予測器の一例と、図4に示す格子形可
変係数ディジタルフィルタを用いた帯域内信号予測器の
一例を参照して説明する。
FIG. 2 is a block diagram corresponding to each frequency block of the acoustic signal coding apparatus shown in FIG. Each of the 64 frequency blocks processes 1/64 band of each input signal, and is configured to process the entire band in total. First, FIG. 2 shows the system configuration of the audio signal encoding device.
Refer to the acoustic signal encoding device shown in FIG. 4, an example of an in-band signal predictor using the linear prediction method shown in FIG. 3, and an example of an in-band signal predictor using the lattice variable coefficient digital filter shown in FIG. And explain.

【0027】図2に示すように、音響信号符号化装置
は、帯域分割器11、帯域内信号予測器2、残差成分符
号化器3、符号量割当器14およびフォーマッタ15に
よって構成される。ここで、入力音響信号は、16bi
tの線形PCM信号のように音響信号を一定のサンプリ
ングレートで線形PCM符号化したものである。しかし
ながら、この符号の精度は16bitに制限される必要
がなく、より高い精度(例えば20bit)であれば全
体としてもより良好な性能が得られることはいうまでも
ない。また、図2に示す入力音響信号は、モノラル1c
hの入力信号とするが、多chにも適用することができ
ることはいうまでもない。
As shown in FIG. 2, the acoustic signal coding apparatus is composed of a band divider 11, an in-band signal predictor 2, a residual component coder 3, a code amount allocator 14 and a formatter 15. Here, the input acoustic signal is 16 bi
It is a linear PCM code of an acoustic signal at a constant sampling rate like the linear PCM signal of t. However, it goes without saying that the accuracy of this code does not have to be limited to 16 bits, and if the accuracy is higher (for example, 20 bits), better performance can be obtained as a whole. The input audio signal shown in FIG. 2 is monaural 1c.
Although it is an input signal of h, it goes without saying that it can be applied to many channels.

【0028】帯域分割器11は、入力音響信号を周波数
毎の成分に分離する多相フィルタ・バンクPFB(Poly
phase Filter Bank )、入力音響信号を周波数毎の成分
に分離する離散フーリエ変換器DFT(Discrete Fouri
or Transform)、入力音響信号を周波数毎の成分に分離
する離散ハートレイ変換器DHT(Discrete HartleyTr
ansform)、入力音響信号を直交変換を施して周波数毎
の成分に分離する離散コサイン変換器DCT(Discrete
Cosine Transform )、入力音響信号を直交変換を施し
て周波数毎の成分に分離する変形離散コサイン変換器M
DCT(Modified Discrete Cosine Transform)等のう
ちいずれか1つによって構成され、入力音響信号の情報
量を失うことなく複数の周波数成分に分割する機能を有
するものである。
The band divider 11 is a polyphase filter bank PFB (Poly) for separating an input acoustic signal into components for each frequency.
phase filter bank), a discrete Fourier transformer DFT (Discrete Fouri) that separates the input acoustic signal into frequency components
or Transform), a discrete Hartley transformer DHT (Discrete HartleyTr) that separates the input acoustic signal into frequency components
ansform), a discrete cosine transformer DCT (Discrete) for orthogonally transforming an input acoustic signal to separate it into frequency components.
Cosine Transform), a modified discrete cosine transformer M that performs orthogonal transformation on the input acoustic signal to separate it into frequency components
It is composed of any one of DCT (Modified Discrete Cosine Transform) and the like, and has a function of dividing into a plurality of frequency components without losing the information amount of the input acoustic signal.

【0029】ここで、一例としてMDCTを説明する。
MDCTでは、入力信号を1フレーム(Lサンプル)ず
つ処理し、L個の周波数成分に分解する。Lは通常2N
(2の整数乗)の値に設定される。ここでは、Lを64
とする。次に、周波数成分を以下のように求める。 入力:x[m,i] m=0,1,...,∞(フレーム番号) i=0,...,L-1(フレーム内サンプル番号)
MDCT will now be described as an example.
In MDCT, an input signal is processed one frame (L sample) at a time and decomposed into L frequency components. L is usually 2 N
It is set to a value (an integer power of 2). Here, L is 64
And Next, the frequency component is obtained as follows. Input: x [m, i] m = 0,1, ..., ∞ (frame number) i = 0, ..., L-1 (frame sample number)

【0030】[0030]

【数1】 [Equation 1]

【0031】 for i=0,...,L-1 MDCT係数:M[i,k]=cos((2k+1)*(2i+n0)*(π/2)*(1/L)) (数2) n0=(L+1)/2 例えば、入力 x[m,i]がある周波数の正弦波であった場
合には、この変換によって以下の成分に出力が集中す
る。
For i = 0, ..., L-1 MDCT coefficient: M [i, k] = cos ((2k + 1) * (2i + n 0 ) * (π / 2) * (1 / L )) (Equation 2) n 0 = (L + 1) / 2 For example, when the input x [m, i] is a sine wave having a certain frequency, the output concentrates on the following components by this conversion.

【0032】 周波数 係数 (fsc/L)*(1/2)*0.5 c[m,0] (fsc/L)*(1/2)*1.5 c[m,1] (fsc/L)*(1/2)*2.5 c[m,2]・ ・・ ・・
・(fsc/L)*(1/2)*(L-0.5) c[m,L] すなわち、MDCTを用いて変換することによって周波
数帯域をL等分する効果が得られたことになる。なお、
L=64とすれば、周波数帯域を64等分することにな
る。
Frequency coefficient (fsc / L) * (1/2) * 0.5 c [m, 0] (fsc / L) * (1/2) * 1.5 c [m, 1] (fsc / L) * ( 1/2) * 2.5 c [m, 2] ・ ・ ・ ・ ・
(Fsc / L) * (1/2) * (L-0.5) c [m, L] That is, the effect of dividing the frequency band into L equal parts was obtained by converting using MDCT. In addition,
If L = 64, the frequency band will be divided into 64 equal parts.

【0033】図2に示す帯域内信号予測器2は、図1に
示す帯域内信号予測器12の64ブロックのうちの1つ
に対応する。帯域内信号予測器2は、帯域分割器1で分
割された各周波数成分を入力し、同じ周波数成分の以前
の係数列から次の係数を予測し、また、その予測値と実
際の入力値の差を求める。ここで、予測値y[m,k] 、周
波数成分c[m,k] および残差成分e[m,k] の関係を示す。
The in-band signal predictor 2 shown in FIG. 2 corresponds to one of the 64 blocks of the in-band signal predictor 12 shown in FIG. The in-band signal predictor 2 inputs each frequency component divided by the band divider 1, predicts the next coefficient from the previous coefficient sequence of the same frequency component, and predicts the predicted value and the actual input value. Find the difference. Here, the relationship between the predicted value y [m, k], the frequency component c [m, k], and the residual component e [m, k] is shown.

【0034】 y[m,k]=Pred{c[m-1,k],c[m-2,k],....,} (数3) e[m,k]=y[m,k]-c[m,k] (数4) なお、(数3)に示すPred{... }は、周波数成分y[m,k]
の過去の値の列から、次の値を予測する関数である。
従って、Pred{c[m-1,k],c[m-2,k],...}は若干の誤差e
[m,k]が生じるが、c[m,k] の値に近い値を予測すること
ができる。
Y [m, k] = Pred {c [m-1, k], c [m-2, k], ....,} (Equation 3) e [m, k] = y [m , k] -c [m, k] (Formula 4) Note that Pred {...} shown in (Formula 3) is a frequency component y [m, k].
It is a function that predicts the next value from the past value column of.
Therefore, Pred {c [m-1, k], c [m-2, k], ...} has a slight error e
Although [m, k] occurs, a value close to the value of c [m, k] can be predicted.

【0035】ここで、線形予測法を用いたPred関数の一
例を(数5)に示す。 y[m,k]=Pred{c[m-1,k],c[m-2,k],....,} =a1*c[m-1,k]+a2*c[m-2,k]+a3*c[m-3,k]+... (数5) 次に、(数5)のブロック構成を図3に示す。図3に示
すように、線形予測法を用いた帯域内信号予測器2にお
いては、予測値y[m,k]は、周波数成分c[m,k]の過去の値
に係数anを乗算した後に、各項を加算して得られる。ま
た、残差成分e[m,k]は、予測値y[m,k]から周波数成分c
[m,k]を減算して得られる。
Here, an example of the Pred function using the linear prediction method is shown in (Equation 5). y [m, k] = Pred {c [m-1, k], c [m-2, k], ....,} = a1 * c [m-1, k] + a2 * c [m -2, k] + a3 * c [m-3, k] + ... (Equation 5) Next, FIG. 3 shows the block configuration of (Equation 5). As shown in FIG. 3, in the in-band signal predictor 2 using the linear prediction method, the prediction value y [m, k] is obtained by multiplying the past value of the frequency component c [m, k] by the coefficient an. It is obtained by adding each term later. The residual component e [m, k] is the frequency component c from the predicted value y [m, k].
It is obtained by subtracting [m, k].

【0036】ここで、入力音響信号が定常的な信号であ
る場合には、過去の周波数成分c[m-n,k](n=1,2,...) を
より長くさかのぼって計算すれば、より正確に予測値y
[m,k]を予測できる。しかしながら、例えば、周波数成
分c[m-2,k]またはc[m-3,k]までの過去の値で打ち切って
も十分実用的である。次に、帯域内信号予測器2に適用
できる格子形可変係数ディジタルフィルタを示す。
Here, when the input acoustic signal is a stationary signal, if past frequency components c [mn, k] (n = 1,2, ...) are calculated backwards, More accurately predicted value y
Can predict [m, k]. However, it is sufficiently practical to discontinue with past values up to the frequency component c [m-2, k] or c [m-3, k], for example. Next, a lattice variable coefficient digital filter applicable to the in-band signal predictor 2 will be shown.

【0037】 Am(D)=Am-1(D)−kmBm-1(D) (数6) Bm(D)=D(Bm-1(D)−kmAm-1(D)) (数7) なお、Dは遅延演算子、km はPARCOR係数であ
る。ここで、(数6)および(数7)のブロック構成を
図4に示す。図4に示すように、入力xi に対応した予
測値A2(D)が出力される。また、PARCOR係数
km を制御部から設定できるレジスタ値にすることで、
例えば、CPU(Central Processing Unit )から必要
に応じて、PARCOR係数km を調整することができ
る。
Am (D) = Am-1 (D) -km Bm-1 (D) (Equation 6) Bm (D) = D (Bm-1 (D) -kmAm-1 (D)) (Equation 7) Incidentally, D is a delay operator and km is a PARCOR coefficient. Here, the block configurations of (Equation 6) and (Equation 7) are shown in FIG. As shown in FIG. 4, the predicted value A2 (D) corresponding to the input xi is output. Also, by setting the PARCOR coefficient km to a register value that can be set by the control unit,
For example, the PARCOR coefficient km can be adjusted as needed from a CPU (Central Processing Unit).

【0038】以上の処理においては、高い精度で行うほ
ど好ましいが、実数表現で行われているので、残差成分
の振幅自体は圧縮されているにもかかわらず、情報量が
大きい状態である。そこで、短いビット量に変換して実
際の情報圧縮を行う。図2に示す残差成分符号化器3
は、図1に示す残差成分符号化器13の64ブロックの
うちの1つに対応する。残差成分符号化器3は、帯域内
信号予測器2で求められた残差成分を量子化して、短い
ビット数で表せる符号に変換し、出力符号データを生成
する。
In the above processing, it is preferable to perform the processing with high accuracy, but since it is expressed by a real number expression, the amount of information is large even though the amplitude of the residual component itself is compressed. Therefore, it is converted into a short bit amount and the actual information compression is performed. Residual component encoder 3 shown in FIG.
Corresponds to one of the 64 blocks of the residual component encoder 13 shown in FIG. The residual component encoder 3 quantizes the residual component obtained by the in-band signal predictor 2 and converts it into a code that can be represented by a short number of bits to generate output code data.

【0039】残差成分符号化器3においては、例えば、
以下のような単純な丸め整数化関数を用いるものとす
る。 Quant(x)=rint(x/Q[m,i]) (数8) Requant(x)=x*Q[m,i] (数9) ここで、rint(x)はxに最も近い整数を値として取る丸
め関数であり、Qは量子化ステップである。例えば、量
子化ステップQが0.5である場合には、Quant(x)は
0.5刻みに1づつ増加する。
In the residual component encoder 3, for example,
The following simple rounding integerizing function is used. Quant (x) = rint (x / Q [m, i]) (Equation 8) Requant (x) = x * Q [m, i] (Equation 9) where rint (x) is the integer closest to x Is a rounding function that takes as a value, and Q is a quantization step. For example, when the quantization step Q is 0.5, Quant (x) increases by 1 in 0.5 steps.

【0040】従って、量子化ステップを大きくした場合
には、より少ない符号量を用いて入力を表わすことがで
きる反面、精度が荒く表現される。この量子化ステップ
Qは、符号量割当器4から出力される帯域符号量割当に
よって制御される。ここで、簡単のために、符号量割当
は各帯域の量子化ステップQの値そのものとする。しか
しながら、これも簡単のため例としてこのような方法を
取るのであって、他の形式で量子化ステップQを伝送し
てもかまわないことはいうまでもない。また、量子化ス
テップQの値は復号時に必要となるから出力符号にも量
子化ステップQが含まれる。しかし、量子化ステップQ
の値をそのまま符号化する必要はなく、音響信号復号装
置において音響信号符号化装置と同じ量子化ステップQ
の値が得られるように符号の発生・解釈規則が定められ
ていればどのような方法で量子化ステップQの値を伝送
してもかまわない。
Therefore, when the quantization step is increased, the input can be represented by using a smaller code amount, but the accuracy is coarsely represented. The quantization step Q is controlled by the band code amount allocation output from the code amount allocator 4. Here, for simplicity, the code amount allocation is the value itself of the quantization step Q of each band. However, this method is also taken as an example for simplicity, and it goes without saying that the quantization step Q may be transmitted in another format. Further, since the value of the quantization step Q is necessary at the time of decoding, the output code also includes the quantization step Q. However, the quantization step Q
It is not necessary to directly encode the value of the same, and the same quantization step Q in the acoustic signal decoding device as in the acoustic signal encoding device is used.
The value of the quantization step Q may be transmitted by any method as long as the code generation / interpretation rule is determined so that the value of can be obtained.

【0041】この量子化関数を用いて、残差成分符号化
器3の入出力の関係を表すと、以下のようになる。 q[m,k]=Quant(e[m,k]) (数10) 符号量割当器14は、入力音響信号を分析して帯域符号
量割当を発生する。さらに、符号量割当器14は、IS
O/IEC 11172.3国際標準に基づいて入力音
響信号を分析して32個の帯域符号量割当値を発生する
ものであり、帯域毎の符号量を入力音響信号に応じて最
適に制御することで、効率よく符号化できる。
Using this quantization function, the input / output relationship of the residual component encoder 3 is expressed as follows. q [m, k] = Quant (e [m, k]) (Equation 10) The code amount allocator 14 analyzes the input acoustic signal and generates band code amount allocation. Further, the code amount assigner 14 uses the IS
The input audio signal is analyzed based on the O / IEC 11172.3 international standard to generate 32 band code amount allocation values, and the code amount for each band is optimally controlled according to the input audio signal. Thus, it is possible to efficiently encode.

【0042】図2に示すフォーマッタ15は、符号量割
当器14の32個の帯域符号量割当値および残差成分符
号化器3の64ブロック分の出力符号データを伝送又は
記憶に適するフォーマットを有するディジタル出力に組
み立てる。なお、残差成分符号化器3の符号量割当は量
子化ステップQに基づいて行っているが、量子化ステッ
プQは再生周波数成分の量子化ノイズレベルと平均的に
一致するので、例えば聴覚モデルで計算される合成最小
可聴レベルnpartnn=0,...,31}を量子化ステップとす
ることもできる。この場合、合成最小可聴レベルnpartn
はエネルギーで与えられるので、それを量子化ステップ
に対応させるためには、例えば以下の計算方法を用いれ
ばよい。
The formatter 15 shown in FIG. 2 has a format suitable for transmitting or storing the 32 band code amount allocation values of the code amount allocator 14 and the output code data of 64 blocks of the residual component encoder 3. Assemble to digital output. Although the code amount allocation of the residual component encoder 3 is performed based on the quantization step Q, since the quantization step Q is on average equal to the quantization noise level of the reproduction frequency component, for example, the auditory model The synthetic minimum audible level npart n { n = 0, ..., 31} calculated in step 1 can also be used as the quantization step. In this case, the synthetic minimum audible level npart n
Is given by the energy, so to make it correspond to the quantization step, for example, the following calculation method may be used.

【0043】 Q[m,k]=(npartn)1/2 (数11) k=2n,2n+1 このようにして求められた符号化された残差成分と、上
記量子化ステップは、フォーマッタ15によって一つの
つながりのビット列に整形される。このようにして、聴
覚系のフィルター分解能力の性質は帯域分割器1と符号
量割当器4によって限界まで利用することができ、ま
た、聴覚の動的な性質および聴覚の微細な周波数依存性
は、64個の帯域内信号予測器2によってほぼ限界まで
利用することができ、この組み合わせによって聴覚の性
質は各構成要素の自然な性質によって利用されるので、
従来の方式と比較して聴覚モデルとそれによって制御さ
れる符号発生量の制御はより簡単なもので十分である。
Q [m, k] = (npart n ) 1/2 (Equation 11) k = 2n, 2n + 1 The coded residual component thus obtained and the quantization step are: The formatter 15 shapes the connected bit string. In this way, the property of the filter decomposition capability of the auditory system can be utilized to the limit by the band divider 1 and the code amount allocator 4, and the dynamic property of the auditory sense and the minute frequency dependency of the auditory sense are , 64 in-band signal predictors 2 can be used almost to the limit, and by this combination, the auditory property is used by the natural property of each component,
It is sufficient that the auditory model and the control of the code generation amount controlled by the auditory model are simpler than those in the conventional method.

【0044】以下、図1に示す音響信号符号化装置の動
作を説明する。音響信号符号化装置は、帯域分割器11
により入力音響信号を64個の周波数成分に分割し、符
号量割当器14により入力音響信号の各周波数帯域に対
応する32個の符号量を割り当てる。次に、帯域内信号
予測器12により帯域分割器11で分割された64個の
周波数成分に対応する以前の係数列から次の係数を予測
した後に、予測値から周波数成分を減算して残差成分を
求め、残差成分符号化器13により符号量割当器14で
割り当てられた32個の符号量に対応させて帯域内信号
予測器12で求められた残差成分を量子化した後に、量
子化された残差成分を符号化するので、広域的なマスキ
ング特性を64個の帯域分割と帯域間の32個の符号量
割当によって利用し、近接マスキング効果を帯域内信号
予測器のフィルター特性の制御によって効率よく利用す
ることができ、また、帯域内信号予測器のフィルター特
性を音響信号の性質に適応的に制御することで、時間分
解能と周波数分解能力を最適に調節することができ、さ
らにまた、帯域内信号予測器が予測できる範囲の音響入
力については、出力符号が著しく減少でき、特に、正弦
波や多数の高調波成分を含む波形は、各帯域毎に周波数
成分を予測し、それらを合成することによって全帯域に
渡る波形を精度良く予測でき、全体の符号量を削減する
ことができる。
The operation of the audio signal coding apparatus shown in FIG. 1 will be described below. The acoustic signal encoding device includes a band divider 11
The input audio signal is divided into 64 frequency components by, and the code amount allocator 14 allocates 32 code amounts corresponding to each frequency band of the input audio signal. Next, after predicting the next coefficient from the previous coefficient sequence corresponding to the 64 frequency components divided by the band divider 11 by the in-band signal predictor 12, the frequency component is subtracted from the predicted value to obtain the residual error. After calculating the components, the residual component encoder 13 quantizes the residual components obtained by the in-band signal predictor 12 in correspondence with the 32 code amounts assigned by the code amount assigner 14, Since the encoded residual component is encoded, the wide area masking characteristic is used by dividing the band into 64 bands and assigning 32 code amounts between the bands, and the proximity masking effect is used as a filter characteristic of the in-band signal predictor. It can be used efficiently by control, and the time resolution and frequency resolution can be optimally adjusted by adaptively controlling the filter characteristics of the in-band signal predictor to the characteristics of the acoustic signal. Also, for acoustic inputs in the range that the in-band signal predictor can predict, the output code can be significantly reduced, and especially for waveforms containing sine waves and many harmonic components, frequency components are predicted for each band, By synthesizing them, the waveform over the entire band can be accurately predicted, and the total code amount can be reduced.

【0045】次に、図5に本発明の一実施例である音響
信号符号化装置で利用される聴覚のマスキング特性を示
す。図5において、マスクする音はマスカー、マスクさ
れて聞こえなくなる音はマスキーと呼ばれる。この場合
に、純音A(マスカー)が存在する状態で他の純音の可
聴限界(マスキングスレシホルド)が表される。近接マ
スキングのように、マスキング効果はマスカーとマスキ
ーの周波数が近い程強く現われるので、近接マスキング
効果は予測器のフィルター特性の制御によって効率よく
利用することができる。
Next, FIG. 5 shows the auditory masking characteristics used in the audio signal coding apparatus according to one embodiment of the present invention. In FIG. 5, a masked sound is called a masker, and a masked sound that cannot be heard is called a masky. In this case, the audible limit (masking threshold) of another pure tone is expressed in the presence of the pure tone A (masker). Like proximity masking, the masking effect appears stronger as the frequencies of the masker and the masky become closer, so that the proximity masking effect can be efficiently used by controlling the filter characteristics of the predictor.

【0046】一方、マスキング効果はマスカーとマスキ
ーの周波数が離れている程弱く現われるので、広域マス
キング効果は帯域分割と帯域間の符号量割当によって利
用される。このように、本実施例(請求項1)では、帯
域分割器11により入力音響信号を複数の周波数成分に
分割し、符号量割当器14により入力音響信号の各周波
数帯域に対応する符号量を割り当てる。次に、帯域内信
号予測器2により帯域分割器11で分割された周波数成
分に対応する以前の係数列から次の係数を予測した後
に、予測値から周波数成分を減算して残差成分を求め、
残差成分符号化器3により符号量割当器4で割り当てら
れた符号量に対応させて帯域内信号予測器2で求められ
た残差成分を量子化した後に、量子化された残差成分を
符号化するので、広域的なマスキング特性を帯域分割と
帯域間の符号量割当によって利用し、近接マスキング効
果を帯域内信号予測器のフィルター特性の制御によって
効率よく利用することができ、また、帯域内信号予測器
のフィルター特性を音響信号の性質に適応的に制御する
ことで、時間分解能と周波数分解能力を最適に調節する
ことができ、さらにまた、帯域内信号予測器が予測でき
る範囲の音響入力については、出力符号が著しく減少で
き、特に、正弦波や多数の高調波成分を含む波形は、各
帯域毎に周波数成分を予測し、それらを合成することに
よって全帯域に渡る波形を精度良く予測でき、全体の符
号量を削減することができる。
On the other hand, since the masking effect appears weaker as the frequencies of the masker and the masky are farther apart, the wide area masking effect is utilized by band division and code amount allocation between bands. As described above, in the present embodiment (claim 1), the band divider 11 divides the input acoustic signal into a plurality of frequency components, and the code amount allocator 14 determines the code amount corresponding to each frequency band of the input acoustic signal. assign. Next, after predicting the next coefficient from the previous coefficient sequence corresponding to the frequency component divided by the band divider 11 by the in-band signal predictor 2, the frequency component is subtracted from the predicted value to obtain the residual component. ,
After the residual component encoder 3 quantizes the residual component obtained by the in-band signal predictor 2 corresponding to the code amount assigned by the code amount assigner 4, the quantized residual component is Since coding is performed, wide-area masking characteristics can be used by band division and code amount allocation between bands, and proximity masking effect can be efficiently used by controlling the filter characteristics of the in-band signal predictor. By adaptively controlling the filter characteristics of the in-signal predictor to the characteristics of the acoustic signal, it is possible to optimally adjust the time resolution and frequency resolution capability, and furthermore, the acoustic range within which the in-band signal predictor can predict. For the input, the output code can be significantly reduced, and especially for waveforms that contain sine waves and many harmonic components, the frequency components are predicted for each band, and synthesized over the entire band. Waveform can accurately predict, it is possible to reduce the overall amount of code.

【0047】このように、本実施例(請求項2)では、
帯域分割器11が、入力音響信号を周波数毎の成分に分
離する多相フィルタ・バンク、入力音響信号を周波数毎
の成分に分離する離散フーリエ変換器、入力音響信号を
周波数毎の成分に分離する離散ハートレイ変換器、入力
音響信号を直交変換を施して周波数毎の成分に分離する
離散コサイン変換器、入力音響信号を直交変換を施して
周波数毎の成分に分離する変形離散コサイン変換器、の
うちいずれか1つによって構成するので、入力音響信号
の情報量を失うことなく複数の周波数成分に分割する機
能を複数の中から選択して使用することができる。
Thus, in this embodiment (claim 2),
A band divider 11 is a polyphase filter bank that separates an input sound signal into frequency components, a discrete Fourier transformer that separates the input sound signal into frequency components, and separates an input sound signal into frequency components. Of the discrete Hartley transformers, the discrete cosine transformer that performs an orthogonal transformation on the input acoustic signal to separate it into frequency components, and the modified discrete cosine transformer that performs an orthogonal transformation on the input acoustic signal to separate it into frequency components Since it is configured by any one, it is possible to select and use the function of dividing into a plurality of frequency components without losing the information amount of the input acoustic signal.

【0048】このように、本実施例(請求項3)では、
符号量割当器14が、聴覚モデルの最小可聴レベルに対
応させて符号量を割り当てるように構成するので、聴覚
モデルで計算される合成最小可聴レベルを量子化ステッ
プとして利用でき最小の符号量を割り当てることができ
る。(実施例2)図1に示す音響信号復号装置は、入力
ビット列を64ブロック分の符号化データに分解するデ
フォーマッタ16、入力ビット列を32の周波数成分毎
の符号量割当値に分解する符号量抽出器10、64個の
周波数ブロックに分割された残差成分復号器17、64
個の周波数ブロックに分割された帯域内信号予測器18
および64の周波数成分入力から合成された全帯域の1
つの音響信号を出力する帯域合成器19によって構成さ
れる。
Thus, in this embodiment (claim 3),
Since the code amount assigner 14 is configured to assign the code amount corresponding to the minimum audible level of the auditory model, the synthetic minimum audible level calculated by the auditory model can be used as a quantization step and the minimum code amount is assigned. be able to. (Embodiment 2) The acoustic signal decoding apparatus shown in FIG. 1 has a deformatter 16 that decomposes an input bit string into 64 blocks of encoded data, and a code amount that decomposes the input bit string into 32 code amount allocation values for each frequency component. Extractor 10, residual component decoder 17, 64 divided into 64 frequency blocks
In-band signal predictor 18 divided into frequency blocks
1 of full band synthesized from 64 and 64 frequency component inputs
The band synthesizer 19 outputs two acoustic signals.

【0049】図6は、図1に示す音響信号復号装置の各
周波数ブロックに対応する構成図である。図6に示すよ
うに、音響信号復号装置は、デフォーマッタ16、残差
成分復号器7、帯域内信号予測器8、帯域合成器9およ
び符号量抽出器10によって構成される。
FIG. 6 is a configuration diagram corresponding to each frequency block of the acoustic signal decoding apparatus shown in FIG. As shown in FIG. 6, the acoustic signal decoding apparatus includes a deformatter 16, a residual component decoder 7, an in-band signal predictor 8, a band synthesizer 9 and a code amount extractor 10.

【0050】デフォーマッタ16は、伝送又は記憶され
た一つながりのビット列を分解し、32個の帯域符号量
制御データQを一括して符号量抽出器10に出力すると
ともに、64ブロック分の符号データを分解して各残差
成分復号器7に出力する。符号量抽出器10は、デフォ
ーマッタ16から出力されたひとまとまりの帯域符号量
割当値を32個分の帯域符号量割当値に分解した後に、
1個の帯域符号量割当値を対応する周波数を担当する2
個の残差成分復号器7に出力し、以下同様に32個分の
帯域符号量割当値を全体で64個の残差成分復号器7に
出力する。例えば、前述のように単純に帯域符号量制御
データQの値を符号量制御に用いるのであれば、Q[k]を
符号化データより抽出すればよい。
The deformatter 16 decomposes a series of transmitted or stored bit strings, outputs the 32 band code amount control data Q to the code amount extractor 10 all at once, and the code data for 64 blocks. Is decomposed and output to each residual component decoder 7. The code amount extractor 10 decomposes a group of band code amount allocation values output from the deformatter 16 into 32 band code amount allocation values, and
2 in charge of a frequency corresponding to one band code amount allocation value
Output to the residual component decoders 7, and similarly, 32 band code amount allocation values for the same are output to the total of 64 residual component decoders 7. For example, if the value of the band code amount control data Q is simply used for code amount control as described above, Q [k] may be extracted from the encoded data.

【0051】残差成分復号器7は、図1に示す残差成分
復号器17の64ブロックのうちの1つに対応する。残
差成分復号器7は、符号量抽出器10から出力された帯
域符号量割当値に基づいて、入力された符号データを残
差成分に復号する。ここで、残差成分復号器7は、入力
された符号化残差成分q[m,k]を元の実数値e'[m,k] に戻
す。従って、前述の量子化関数(数10)を用いて有限
精度で量子化した後に符号化した場合には、出力は、前
述の量子化逆量子化関数(数8)および(数9)を用い
て以下のように表される値となる。
The residual component decoder 7 corresponds to one of the 64 blocks of the residual component decoder 17 shown in FIG. The residual component decoder 7 decodes the input code data into a residual component based on the band code amount allocation value output from the code amount extractor 10. Here, the residual component decoder 7 restores the input coded residual component q [m, k] to the original real value e '[m, k]. Therefore, when the quantization is performed with finite precision using the above-mentioned quantization function (Equation 10) and then the encoding is performed, the output uses the above-described quantized inverse quantization function (Equation 8) and (Equation 9). The value is represented as follows.

【0052】 e'[m,k]=Requant(Quant(e[m,k])) (数12) なお、(数12)において、e[m,k]は前述の音響信号符
号化器内の符号化前の残差成分の値である。図7は、本
発明の一実施例である音響信号復号器内の帯域内信号予
測器8の構成図である。
E ′ [m, k] = Requant (Quant (e [m, k])) (Equation 12) In (Equation 12), e [m, k] is the above-mentioned acoustic signal encoder. Is the value of the residual component before encoding of. FIG. 7 is a block diagram of the in-band signal predictor 8 in the acoustic signal decoder that is an embodiment of the present invention.

【0053】帯域内信号予測器8は、図1に示す帯域内
信号予測器18の64ブロックのうちの1つに対応す
る。帯域内信号予測器8は、同じ周波数成分の以前の係
数列から次の係数を予測し、復号された残差成分で予測
値を補正して擬似的な周波数成分として出力する。図7
に示すように、帯域内信号予測器8は、音響信号符号化
器内の帯域内信号予測器2とまったく同一の構成とす
る。従って、入力と出力の関係は以下のように表され
る。
In-band signal predictor 8 corresponds to one of the 64 blocks of in-band signal predictor 18 shown in FIG. The in-band signal predictor 8 predicts the next coefficient from the previous coefficient sequence of the same frequency component, corrects the predicted value with the decoded residual component, and outputs it as a pseudo frequency component. Figure 7
As shown in, the in-band signal predictor 8 has exactly the same configuration as the in-band signal predictor 2 in the acoustic signal encoder. Therefore, the relationship between input and output is expressed as follows.

【0054】 y'[m,k]=Pred{c'[m-1,k],c'[m-2,k],・・・} (数13) 次に、周波数成分c'[m,k]は、予測値y'[m,k]と残差成分
e'[m,k]を用いて以下のように再生する。 c'[m,k]=y'[m,k]-e'[m,k] (数14) ここで、予測値y'[m,k]は音響信号復号器8で予測され
た予測値であり、周波数成分c'[m,k] は音響信号復号器
で再生された周波数成分である。従って、(数14)は
前述の(数4)を変形したものであるので、 y'[m,k]=y[m,k]、e'[m,k]=e[m,k] (数15) という関係が成立する場合には、 c'[m,k]=c[m,k] (数16) となり、音響信号復号器で再生された周波数成分は音響
信号符号化器に入力されたものと完全に同じものにな
る。しかしながら、実際には(数12)に示すように、
量子化誤差および予測誤差があるので、(数16)のよ
うにはならない。
Y '[m, k] = Pred {c' [m-1, k], c '[m-2, k], ...} (Equation 13) Next, the frequency component c' [m , k] is the predicted value y '[m, k] and residual component
Reproduce as follows using e '[m, k]. c '[m, k] = y' [m, k] -e '[m, k] (Equation 14) Here, the prediction value y' [m, k] is the prediction predicted by the acoustic signal decoder 8. It is a value, and the frequency component c ′ [m, k] is the frequency component reproduced by the acoustic signal decoder. Therefore, since (Equation 14) is a modification of (Equation 4), y '[m, k] = y [m, k], e' [m, k] = e [m, k] When the relation of (Equation 15) is established, c '[m, k] = c [m, k] (Equation 16), and the frequency component reproduced by the acoustic signal decoder is transmitted to the acoustic signal encoder. It will be exactly the same as what was entered. However, in reality, as shown in (Equation 12),
Since there is a quantization error and a prediction error, it does not look like (Equation 16).

【0055】帯域合成器19は、帯域内信号予測器で生
成された各周波数成分から音響信号を合成する逆多相フ
ィルタ・バンクIPFB(Inverse Polyphase Filter B
ank)、帯域内信号予測器で生成された各周波数成分か
ら音響信号を合成する逆離散フーリエ変換器IDFT
(Inverse Discrete Fourior Transform)、帯域内信号
予測器で生成された各周波数成分から音響信号を合成す
る逆離散ハートレイ変換器IDHT(Inverse Discrete
Hartley Transform)、帯域内信号予測器で生成された
各周波数成分から逆直交変換を施して音響信号を合成す
る逆離散コサイン変換器IDCT(Inverse Discrete C
osine Transform )、帯域内信号予測器で生成された各
周波数成分から逆直交変換を施して音響信号を合成する
逆変形離散コサイン変換器IMDCT(Inverse Modifi
ed Discrete Cosine Transform)のうちいずれか1つに
よって構成し、周波数成分を入力として元の時系列サン
プルの形の音響信号に変換する。
The band synthesizer 19 is an inverse polyphase filter bank IPFB (Inverse Polyphase Filter B) for synthesizing an acoustic signal from each frequency component generated by the in-band signal predictor.
ank), an inverse discrete Fourier transformer IDFT that synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor
(Inverse Discrete Fourior Transform), an inverse discrete Hartley transformer IDHT (Inverse Discrete Transform) that synthesizes an acoustic signal from each frequency component generated by an in-band signal predictor.
Hartley Transform), an inverse discrete cosine transformer IDCT (Inverse Discrete C) that synthesizes an acoustic signal by performing an inverse orthogonal transform from each frequency component generated by the in-band signal predictor.
Inverse transform cosine transformer IMDCT (Inverse Modifi) that synthesizes an acoustic signal by performing an inverse orthogonal transform from each frequency component generated by the in-band signal predictor.
ed Discrete Cosine Transform), and transforms it into an acoustic signal in the form of the original time-series sample by using the frequency component as an input.

【0056】なお、帯域合成器19は、図2に示す音響
信号符号化装置の帯域分割器11で64帯域に分割した
過程と逆の変換を用いるものである。例えば、帯域分割
器11でMDCTを使用した場合には、帯域合成器19
ではIMDCTを使用する。以下、図1に示す音響信号
復号装置の動作を説明する。音響信号復号装置は、残差
成分復号器17により入力された符号化データを64個
の残差成分に復号し、帯域内信号予測器18によりそれ
ぞれの周波数成分の以前の係数列から次の係数を予測
し、残差成分復号器17で復号された残差成分で予測値
を補正して64個の周波数成分を生成する。次に、帯域
合成器19により帯域内信号予測器18で生成された6
4個の周波数成分から音響信号を合成するので、出力符
号が著しく減少された符号化データに基づいて音響信号
を合成するでき、特に、全体の符号量を削減された多数
の高調波成分を含む波形の音響信号を合成することがで
きる。
The band synthesizer 19 uses a conversion reverse to the process of dividing into 64 bands by the band divider 11 of the acoustic signal coding apparatus shown in FIG. For example, when MDCT is used in the band divider 11, the band synthesizer 19
Now use IMDCT. The operation of the acoustic signal decoding device shown in FIG. 1 will be described below. The acoustic signal decoding device decodes the coded data input by the residual component decoder 17 into 64 residual components, and the in-band signal predictor 18 decodes the next coefficient from the previous coefficient sequence of each frequency component. , And the prediction value is corrected by the residual component decoded by the residual component decoder 17 to generate 64 frequency components. Next, 6 generated by the in-band signal predictor 18 by the band synthesizer 19
Since the acoustic signal is synthesized from the four frequency components, the acoustic signal can be synthesized based on the coded data whose output code is significantly reduced, and in particular, the total code amount is reduced and a large number of harmonic components are included. Waveform acoustic signals can be synthesized.

【0057】このように、本実施例(請求項4)では、
残差成分復号器7により入力された符号化データを残差
成分に復号し、帯域内信号予測器8によりそれぞれの周
波数成分の以前の係数列から次の係数を予測し、残差成
分復号器7で復号された残差成分で予測値を補正して周
波数成分を生成する。次に、帯域合成器19により帯域
内信号予測器8で生成された各周波数成分から音響信号
を合成するので、出力符号が著しく減少された符号化デ
ータに基づいて音響信号を合成するでき、特に、全体の
符号量を削減された多数の高調波成分を含む波形の音響
信号を合成することができる。
As described above, in the present embodiment (claim 4),
The coded data input by the residual component decoder 7 is decoded into a residual component, the in-band signal predictor 8 predicts the next coefficient from the previous coefficient sequence of each frequency component, and the residual component decoder The prediction value is corrected with the residual component decoded in 7 to generate the frequency component. Next, since the acoustic signal is synthesized by the band synthesizer 19 from each frequency component generated by the in-band signal predictor 8, the acoustic signal can be synthesized based on the coded data whose output code is remarkably reduced. , It is possible to synthesize an acoustic signal having a waveform including a large number of harmonic components with the overall code amount reduced.

【0058】このように、本実施例(請求項5)では、
帯域合成器19が、帯域内信号予測器8で生成された各
周波数成分から音響信号を合成する逆多相フィルタ・バ
ンク、帯域内信号予測器8で生成された各周波数成分か
ら音響信号を合成する逆離散フーリエ変換器、帯域内信
号予測器8で生成された各周波数成分から音響信号を合
成する逆離散ハートレイ変換器、帯域内信号予測器8で
生成された各周波数成分から逆直交変換を施して音響信
号を合成する逆離散コサイン変換器、帯域内信号予測器
8で生成された各周波数成分から逆直交変換を施して音
響信号を合成する逆変形離散コサイン変換器、のうちい
ずれか1つによって構成する。
Thus, in the present embodiment (claim 5),
The band synthesizer 19 synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor 8 and an inverse polyphase filter bank that synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor 8. An inverse discrete Fourier transformer, an inverse discrete Hartley converter that synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor 8, and an inverse orthogonal transform from each frequency component generated by the in-band signal predictor 8. Any one of an inverse discrete cosine transformer for applying an acoustic signal and an inverse modified discrete cosine transformer for performing an inverse orthogonal transform from each frequency component generated by the in-band signal predictor 8 to synthesize an acoustic signal Composed of two.

【0059】(実施例3)図8は、本発明(請求項6)
の一実施例である音響信号符号化装置に適応できるロー
カルデコーダ3および帯域内信号予測器2の構成図であ
る。図8に示すローカルデコーダは、図2の音響信号符
号化装置内の残差成分符号化器3に置き換えることで、
図1の音響信号符号化装置に適応できるものである。ま
た、図8に示す同装置内の帯域内信号予測器3も同様に
図2の帯域内信号予測器2に置き換えることで、図1の
音響信号符号化装置に適応できるものである。
(Embodiment 3) FIG. 8 shows the present invention (claim 6).
FIG. 3 is a configuration diagram of a local decoder 3 and an in-band signal predictor 2 that can be applied to an acoustic signal encoding device that is one embodiment of the present invention. By replacing the local decoder shown in FIG. 8 with the residual component encoder 3 in the acoustic signal encoder of FIG.
This is applicable to the audio signal encoding device of FIG. Further, by replacing the in-band signal predictor 3 in the apparatus shown in FIG. 8 with the in-band signal predictor 2 in FIG. 2 as well, the in-band signal predictor 3 can be applied to the acoustic signal coding apparatus in FIG.

【0060】このローカルデコーダ付き符号化器は、
(実施例2)に記載した音響信号復号装置と同様の機能
を有するものであるが、区別のためにローカルデコーダ
と呼ぶ。なお、ローカルデコーダにはフォーマッタ/デ
フォーマッタを通さずに直接にフォーマット前のデータ
を入力することもできるものとする。また、ローカルデ
コーダ内の信号は音響信号復号装置内の信号と区別する
ためc"[m,k]、y"[m,k]およびe"[m,k] と記述する。
The encoder with the local decoder is
Although it has the same function as the acoustic signal decoding apparatus described in the second embodiment, it is called a local decoder for the sake of distinction. It should be noted that it is also possible to directly input unformatted data to the local decoder without passing through the formatter / deformatter. The signal in the local decoder is described as c "[m, k], y" [m, k] and e "[m, k] to distinguish it from the signal in the audio signal decoding apparatus.

【0061】図8に示すローカルデコーダ付き符号化器
では、音響信号符号化器の帯域内信号予測器2の入力と
してc[m-1,k],c[m-2,k],・・・に代わってローカルデコー
ダの周波数成分値c"[m-1,k],c"[m-2,k],・・・・を入力す
る。以下、図8に示すローカルデコーダ付き符号化器の
動作を説明する。まず、線形予測器25で予測されたロ
ーカルデコーダ予測値y"[m,k]から入力された周波数成
分c"[m,k]を加算器21で減算して残差成分e[m,k]を求
める。次に、この残差成分e[m,k]を量子化器22で符号
量割当値Qに対応して量子化し出力値を得るとともに、
さらに、この値を逆量子化器23で符号量割当値Qに対
応して逆量子化して残差成分e"[m,k]を求める。次に、
線形予測器25で予測されたローカルデコーダ予測値y"
[m,k]からこの残差成分e"[m,k]を加算器24で減算し周
波数成分c"[m,k]を求める。ここで、加算器24で求め
られた周波数成分c"[m,k]は、順次に遅延素子26〜2
9に渡され線形予測器25の入力データになる。
In the encoder with local decoder shown in FIG. 8, as input to the in-band signal predictor 2 of the acoustic signal encoder, c [m-1, k], c [m-2, k], ... In place of, input the frequency component value c "[m-1, k], c" [m-2, k], ... Of the local decoder. The operation of the encoder with local decoder shown in FIG. 8 will be described below. First, the frequency component c "[m, k] input from the local decoder prediction value y" [m, k] predicted by the linear predictor 25 is subtracted by the adder 21 to obtain the residual component e [m, k]. ]] Next, the residual component e [m, k] is quantized by the quantizer 22 in accordance with the code amount allocation value Q to obtain an output value, and
Further, this value is inversely quantized by the inverse quantizer 23 corresponding to the code amount allocation value Q to obtain the residual component e "[m, k].
Local decoder prediction value y "predicted by the linear predictor 25
This residual component e "[m, k] is subtracted from [m, k] by the adder 24 to obtain the frequency component c" [m, k]. Here, the frequency components c ″ [m, k] obtained by the adder 24 are sequentially delayed elements 26 to 2
9 and becomes the input data of the linear predictor 25.

【0062】前述のように帯域内信号予測器2または8
の入力は、ローカルデコーダ内のc"[m,k]を使用するの
で、 y[m,k]=Pred{c"[m-1,k],c"[m-2,k],・・・} (数17) となる。なお、c[m,k]とc"[m,k]は同一値ではないが、
近い値を持つので、(数17)の方法でも十分良い予測
値y[m,k]が得られる。
As described above, the in-band signal predictor 2 or 8
Input uses c "[m, k] in the local decoder, so y [m, k] = Pred {c" [m-1, k], c "[m-2, k], ..} (Equation 17) Note that c [m, k] and c "[m, k] are not the same value,
Since the values are close to each other, a sufficiently good prediction value y [m, k] can be obtained even by the method of (Equation 17).

【0063】次に、音響信号処理装置に適応できるロー
カルデコーダ付き符号化器/復号器を説明する。ローカ
ルデコーダ付き符号化/復号器は、前記ローカルデコー
ダ付き符号化器にさらに縦列に音響信号復号装置を接続
したものである。この場合、残差成分符号化器3と残差
成分復号器7は遠隔地に設置し、その間は符号化データ
だけが伝送されるものである。
Next, an encoder / decoder with a local decoder which can be applied to the acoustic signal processing apparatus will be described. The encoder / decoder with a local decoder is one in which acoustic signal decoding devices are further connected in series to the encoder with a local decoder. In this case, the residual component encoder 3 and the residual component decoder 7 are installed at remote locations, during which only encoded data is transmitted.

【0064】次に、ローカルデコーダがない場合、すな
わち、図2に示す残差成分符号化器3および図7に示す
残差成分復号器7の場合と比較して、ローカルデコーダ
の効果を説明する。図2に示す残差成分符号化器3およ
び図7に示す残差成分復号器7の場合には、例えば、 y[m,k]=Pred{c[m-1,k],c[m-2,k],・・・} (数18) y'[m,k]=Pred{c'[m-1,k],c'[m-2,k],・・・} (数19) e[m,k]=y[m,k]-c[m,k] (数20) c'[m,k]=y'[m,k]-e'[m,k] (数21) y[m+1,k]=Pred{c[m,k],c[m-1,k],・・・} (数22) y'[m+1,k]=Pred{c'[m,k],c'[m-1,k],・・・} (数23) e[m+1,k]=y[m+1,k]-c[m+1,k] (数24) c'[m+1,k]=y'[m+1,k]-e'[m+1,k] (数25) と計算を繰り返していく場合を考える。なお、(数1
8)(数19)までは予測値がy[m,k]=y'[m,k]だったと
する。
Next, the effect of the local decoder will be described in comparison with the case where there is no local decoder, that is, the case where the residual component encoder 3 shown in FIG. 2 and the residual component decoder 7 shown in FIG. . In the case of the residual component encoder 3 shown in FIG. 2 and the residual component decoder 7 shown in FIG. 7, for example, y [m, k] = Pred {c [m-1, k], c [m -2, k], ...} (Equation 18) y '[m, k] = Pred {c' [m-1, k], c '[m-2, k], ...} (Equation 19) e [m, k] = y [m, k] -c [m, k] (Equation 20) c '[m, k] = y' [m, k] -e '[m, k] ( Formula 21) y [m + 1, k] = Pred {c [m, k], c [m-1, k], ...} (Formula 22) y '[m + 1, k] = Pred { c '[m, k], c' [m-1, k], ...} (Equation 23) e [m + 1, k] = y [m + 1, k] -c [m + 1, Consider the case where the calculation is repeated as k] (Equation 24) c '[m + 1, k] = y' [m + 1, k] -e '[m + 1, k] (Equation 25). Note that (Equation 1
8) Up to (Equation 19), it is assumed that the predicted value is y [m, k] = y '[m, k].

【0065】ここで、(数12)の関係に従って、残差
成分e'[m,k]はe[m,k]と若干の誤差を生じるので、(数
21)によって求まる周波数成分c'[m,k]はc[m,k]に若
干の誤差が加わる。これによって、(数22)および
(数23)によって求まる予測値y'[m+1,k]およびy[m+
1,k]も異なった予測値となるので、やがて周波数成分c'
[m,k]とc[m,k]は非常に異なった値となってしまう。
Here, according to the relation of (Equation 12), the residual component e '[m, k] causes a slight error with e [m, k], so the frequency component c' [determined by (Equation 21) is obtained. For m, k], some error is added to c [m, k]. As a result, the predicted values y '[m + 1, k] and y [m + obtained by (Equation 22) and (Equation 23) are obtained.
1, k] also have different prediction values, so the frequency component c '
[m, k] and c [m, k] have very different values.

【0066】従って、(数24)、(数25)によって
求まるc'[m+1,k]とc[m+1,k]の誤差は、予測値y'[m+1,k]
の誤差に残差成分e'[m+1,k]の誤差が加わって、いっそ
う大きなものとなる。以上のように、ローカルデコーダ
を持たない残差成分符号化器3では残差成分符号化器3
内と音響信号復号装置内の帯域内信号予測器8の出力す
る予測値に誤差がしだいに蓄積するため、残差成分符号
化器3の入力と復号された値の差も誤差が蓄積して無制
限に拡大していくという問題があった。
Therefore, the error between c '[m + 1, k] and c [m + 1, k] obtained by (Equation 24) and (Equation 25) is the predicted value y' [m + 1, k].
The error of the residual component e '[m + 1, k] is added to the error of to make it even larger. As described above, in the residual component encoder 3 having no local decoder, the residual component encoder 3
Since the error gradually accumulates in the prediction value output from the in-band signal predictor 8 in the acoustic signal decoding device, the error also accumulates in the difference between the input of the residual component encoder 3 and the decoded value. There was the problem of unlimited expansion.

【0067】一方、ローカルデコーダ付き符号化器/復
号器では残差成分符号化器3と復号器の動作は以下のよ
うになる。 y"[m,k]=Pred{c"[m-1,k],c"[m-2,k],・・・} (数26) y'[m,k]=Pred{c'[m-1,k],c'[m-2,k],・・・} (数27) e[m,k]=y"[m,k]-c[m,k] (数28) c"[m,k]=y"[m,k]-e"[m,k] (数29) c'[m,k]=y'[m,k]-e'[m,k] (数30) y"[m+1,k]=Pred{c"[m,k],c"[m-1,k],・・・} (数31) y'[m+1,k]=Pred{c'[m,k],c'[m-1,k],・・・} (数32) e[m+1,k]=y[m+1,k]-c[m+1,k] (数33) c"[m+1,k]=y"[m+1,k]-e"[m+1,k] (数34) c'[m+1,k]=y'[m+1,k]-e'[m+1,k] (数35) ここで、初期状態においては、ローカルデコーダと復号
器が同じ状態だったとする。まず、予測値y"[m,k]およ
びy'[m,k]は同じ装置が同じ状態を保っているので、同
じ予測値を生成する。これによって、残差成分e[m,k]を
計算し量子化した後に、逆量子化した残差成分e"[m,k]
とe'[m,k]もそれぞれ同一値となる。予測値y'[m,k],y"
[m,k]が同一値なので、結果的に周波数成分c'[m,k]とc"
[m,k] も同一値になる。以上のようにして1予測値の処
理が終了し、帯域内信号予測器2内に新しい値が入力さ
れることになるが、その時ローカルデコーダ内予測器に
入力される周波数成分c"[m,k]は復号器内のc'[m,k]と同
じ値である。従って、(数31)および(数32)で求
められる次の予測値y'[m+1,k]とy"[m+1]も完全に一致す
る。
On the other hand, in the encoder / decoder with the local decoder, the operation of the residual component encoder 3 and the decoder is as follows. y "[m, k] = Pred {c" [m-1, k], c "[m-2, k], ...} (Equation 26) y '[m, k] = Pred {c' [m-1, k], c '[m-2, k], ...} (Equation 27) e [m, k] = y "[m, k] -c [m, k] (Equation 28 ) C "[m, k] = y" [m, k] -e "[m, k] (Equation 29) c '[m, k] = y' [m, k] -e '[m, k ] (Equation 30) y "[m + 1, k] = Pred {c" [m, k], c "[m-1, k], ...} (Equation 31) y '[m + 1, k] = Pred {c '[m, k], c' [m-1, k], ...} (Equation 32) e [m + 1, k] = y [m + 1, k] -c [m + 1, k] (Equation 33) c "[m + 1, k] = y" [m + 1, k] -e "[m + 1, k] (Equation 34) c '[m + 1 , k] = y '[m + 1, k] -e' [m + 1, k] (Equation 35) Here, it is assumed that the local decoder and the decoder are in the same state in the initial state. The values y "[m, k] and y '[m, k] produce the same predictive value because the same device remains the same. As a result, the residual component e [m, k] is calculated and quantized, and then the dequantized residual component e "[m, k]
And e '[m, k] have the same value. Predicted value y '[m, k], y "
Since [m, k] are the same value, as a result, frequency components c '[m, k] and c "
[m, k] also have the same value. As described above, the processing of one prediction value is completed, and a new value is input to the in-band signal predictor 2. At that time, the frequency component c "[m, k] is the same value as c '[m, k] in the decoder, so the next predicted values y' [m + 1, k] and y "obtained in (Equation 31) and (Equation 32) are [m + 1] is also a perfect match.

【0068】同様に、(数30)〜(数34)の処理に
おいても、ローカルデコーダの予測値y"[m,k] と復号器
内の予測値y'[m,k] は同一値を取り続け、以下同様に処
理が進むので、復号器とローカルデコーダの予測値y'[m
+n,k]とy"[m+n,k]に差が生じることはない。このことに
より、例えば(数28)および(数29)から、周波数
成分c[m,k]とc"[m,k]の間の誤差は残差成分e[m,k]とe"
[m,k]の誤差に等しく、これは量子化と逆量子化を行っ
たことによる誤差に等しい。この誤差は量子化ステップ
より常に小さくなるので、ローカルデコーダ付き符号化
器では、音響信号復号装置で再生される値と入力の誤差
が一定値(量子化ステップ幅)以内に縮小されるという
効果が得られる。
Similarly, in the processing of (Equation 30) to (Equation 34), the prediction value y "[m, k] of the local decoder and the prediction value y '[m, k] in the decoder have the same value. Since the processing continues, the prediction value y '[m
There is no difference between + n, k] and y "[m + n, k]. Therefore, from (Equation 28) and (Equation 29), for example, the frequency components c [m, k] and c" The error between [m, k] is the residual component e [m, k] and e "
It is equal to the error of [m, k], which is equal to the error due to the quantization and dequantization. Since this error is always smaller than the quantization step, the encoder with local decoder has the effect of reducing the error between the value reproduced by the audio signal decoding device and the input within a fixed value (quantization step width). can get.

【0069】このように、本実施例(請求項6)では、
音響信号符号化装置において、ローカルデコーダにより
符号量割当器14で割り当てられた符号量に対応させて
残差成分符号化器3で残差成分を量子化する際に、周波
数成分に擬似的に対応する擬似周波数成分の以前の係数
列から次の係数を予測した後に、この予測値から逆量子
化された残差成分を減算して擬似周波数成分を求めた後
に、帯域内信号予測器2が、ローカルデコーダで求めら
れた予測値から帯域分割器11で分割された周波数成分
を減算して残差成分を求め、残差成分符号化器3で残差
成分を量子化した後に、符号化データに符号化する。一
方、音響信号復号装置において、この符号化データを入
力して音響信号に復号するように構成するので、音響信
号復号装置で再生される周波数成分の値と音響信号符号
化装置で入力される周波数成分とを一定誤差内で一致さ
せることができ、かつ、残差成分の誤差を量子化ステッ
プ幅以内に縮小させることができる。
As described above, in this embodiment (claim 6),
In the acoustic signal encoding device, when the residual component encoder 3 quantizes the residual component in correspondence with the code amount assigned by the code amount assigner 14 by the local decoder, it pseudo corresponds to the frequency component. After predicting the next coefficient from the previous coefficient sequence of the pseudo frequency component to be obtained, and subtracting the dequantized residual component from this predicted value to obtain the pseudo frequency component, the in-band signal predictor 2 The residual component is obtained by subtracting the frequency component divided by the band divider 11 from the prediction value obtained by the local decoder, and the residual component is quantized by the residual component encoder 3, and then converted into encoded data. Encode. On the other hand, in the acoustic signal decoding device, since this encoded data is input and decoded into an acoustic signal, the value of the frequency component reproduced by the acoustic signal decoding device and the frequency input by the acoustic signal encoding device The components can be matched with each other within a constant error, and the error of the residual component can be reduced within the quantization step width.

【0070】[0070]

【発明の効果】本発明の音響信号符号化装置によれば、
広域的なマスキング特性を帯域分割と帯域間の符号量割
当によって利用し、近接マスキング効果を帯域内信号予
測器のフィルター特性の制御によって効率よく利用する
ことができ、また、帯域内信号予測器のフィルター特性
を音響信号の性質に適応的に制御することで、時間分解
能と周波数分解能力を最適に調節することができ、さら
にまた、帯域内信号予測器が予測できる範囲の音響入力
については、出力符号が著しく減少でき、特に、正弦波
や多数の高調波成分を含む波形は、各帯域毎に周波数成
分を予測し、それらを合成することによって全帯域に渡
る波形を精度良く予測でき、全体の符号量を削減するこ
とができる。
According to the audio signal coding apparatus of the present invention,
Wide area masking characteristics can be utilized by band division and code amount allocation between bands, and proximity masking effect can be efficiently utilized by controlling the filter characteristics of the in-band signal predictor. By adaptively controlling the filter characteristics to the characteristics of the acoustic signal, it is possible to optimally adjust the time resolution and frequency resolution, and for the acoustic input within the range that the in-band signal predictor can predict, output Signs can be significantly reduced, and especially for waveforms that contain sine waves and many harmonic components, frequency components can be predicted for each band, and by combining them, the waveform over the entire band can be predicted with high accuracy. The code amount can be reduced.

【0071】また、本発明の音響信号符号化装置によれ
ば、出力符号が著しく減少された符号化データに基づい
て音響信号を合成するでき、特に、全体の符号量を削減
された多数の高調波成分を含む波形の音響信号を合成す
ることができる。
Further, according to the acoustic signal coding apparatus of the present invention, the acoustic signal can be synthesized based on the coded data whose output code is remarkably reduced, and in particular, a large number of harmonics in which the overall code amount is reduced. It is possible to synthesize an acoustic signal having a waveform including wave components.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例である音響信号符号化装置お
よび音響信号復号装置のシステム構成図である。
FIG. 1 is a system configuration diagram of an audio signal encoding device and an audio signal decoding device according to an embodiment of the present invention.

【図2】図1に示す音響信号符号化装置の各周波数ブロ
ックに対応する構成図である。
FIG. 2 is a configuration diagram corresponding to each frequency block of the audio signal encoding device shown in FIG.

【図3】本発明の一実施例である線形予測法を用いた帯
域内信号予測器の構成図である。
FIG. 3 is a configuration diagram of an in-band signal predictor using a linear prediction method that is an embodiment of the present invention.

【図4】本発明の一実施例である格子形可変係数ディジ
タルフィルタを用いた帯域内信号予測器の構成図であ
る。
FIG. 4 is a configuration diagram of an in-band signal predictor using a lattice-type variable coefficient digital filter that is an embodiment of the present invention.

【図5】本発明の一実施例である音響信号符号化装置の
マスキング特性を示す。
FIG. 5 shows masking characteristics of the acoustic signal coding apparatus according to the embodiment of the present invention.

【図6】図1に示す音響信号復号装置の各ブロックに対
応する構成図である。
6 is a configuration diagram corresponding to each block of the acoustic signal decoding device shown in FIG. 1. FIG.

【図7】本発明の一実施例である音響信号復号器内の帯
域内信号予測器8の構成図である。
FIG. 7 is a configuration diagram of an in-band signal predictor 8 in an acoustic signal decoder that is an embodiment of the present invention.

【図8】本発明(請求項6)の一実施例である音響信号
符号化装置に適応できるローカルデコーダ3および帯域
内信号予測器2の構成図である。
FIG. 8 is a configuration diagram of a local decoder 3 and an in-band signal predictor 2 which can be applied to an acoustic signal encoding device which is an embodiment of the present invention (claim 6).

【符号の説明】[Explanation of symbols]

1 帯域分割器 2 帯域内信号予測器 3 残差成分符号化器 4 符号量割当器 7 残差成分復号器 8 帯域内信号予測器 9 帯域合成器 10 符号量抽出器 11 帯域分割器 12 帯域内信号予測器 13 残差成分符号化器 14 符号量割当器 15 フォーマッタ 16 デフォーマッタ 17 残差成分復号器 18 帯域内信号予測器 19 帯域合成器 1 band splitter 2 in-band signal predictor 3 residual component encoder 4 code amount assigner 7 residual component decoder 8 in-band signal predictor 9 band combiner 10 code amount extractor 11 band splitter 12 in-band Signal predictor 13 Residual component encoder 14 Code amount allocator 15 Formatter 16 Deformatter 17 Residual component decoder 18 In-band signal predictor 19 Band synthesizer

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】音響信号を入力して該音響信号の冗長性を
削減して符号化する音響信号符号化装置において、入力
音響信号を複数の周波数成分に分割する帯域分割器と、
該入力音響信号の各周波数帯域に対応する符号量を割り
当てる符号量割当器と、前記帯域分割器で分割された周
波数成分に対応する以前の係数列から次の係数を予測し
た後に、該予測値から該周波数成分を減算して残差成分
を求める帯域内信号予測器と、前記符号量割当器で割り
当てられた符号量に対応させて該帯域内信号予測器で求
められた該残差成分を量子化した後に符号化する残差成
分符号化器と、を備えたことを特徴とする音響信号符号
化装置。
1. An audio signal coding apparatus for inputting an audio signal and encoding while reducing the redundancy of the audio signal, and a band divider for dividing the input audio signal into a plurality of frequency components,
A code amount allocator that allocates a code amount corresponding to each frequency band of the input acoustic signal, and the predicted value after predicting the next coefficient from the previous coefficient sequence corresponding to the frequency component divided by the band divider To the in-band signal predictor for subtracting the frequency component from the in-band signal predictor to obtain the residual component, and the residual component obtained by the in-band signal predictor corresponding to the code amount assigned by the code amount assigner. An acoustic signal coding apparatus, comprising: a residual component coder that performs quantization and then codes.
【請求項2】前記帯域分割器が、前記入力音響信号を周
波数毎の成分に分離する多相フィルタ・バンク、前記入
力音響信号を周波数毎の成分に分離する離散フーリエ変
換器、前記入力音響信号を周波数毎の成分に分離する離
散ハートレイ変換器、前記入力音響信号を直交変換を施
して周波数毎の成分に分離する離散コサイン変換器、前
記入力音響信号を直交変換を施して周波数毎の成分に分
離する変形離散コサイン変換器、のうちいずれか1つに
よって構成することを特徴とする請求項1記載の音響信
号符号化装置。
2. A polyphase filter bank for separating the input acoustic signal into frequency components, a discrete Fourier transformer for separating the input acoustic signal into frequency components, and the input acoustic signal. A discrete Hartley converter for separating each frequency component into a component, a discrete cosine converter for performing an orthogonal transform on the input acoustic signal to separate into a component for each frequency, and an orthogonal transform of the input acoustic signal into a component for each frequency. The acoustic signal encoding device according to claim 1, wherein the acoustic signal encoding device is configured by any one of the modified discrete cosine converters to be separated.
【請求項3】前記符号量割当器が、聴覚モデルの最小可
聴レベルに対応させて符号量を割り当てるように構成す
ることを特徴とする請求項1記載の音響信号符号化装
置。
3. The acoustic signal coding apparatus according to claim 1, wherein the code amount assigner is configured to assign the code amount corresponding to the minimum audible level of the auditory model.
【請求項4】冗長性を削減された符号化データを入力し
て音響信号に復号する音響信号復号装置において、入力
された符号化データを残差成分に復号する残差成分復号
器と、それぞれの周波数成分の以前の係数列から次の係
数を予測し、該残差成分復号器で復号された残差成分で
該予測値を補正して周波数成分を生成する帯域内信号予
測器と、該帯域内信号予測器で生成された各周波数成分
から音響信号を合成する帯域合成器と、を備えたことを
特徴とする音響信号復号装置。
4. An acoustic signal decoding apparatus for inputting coded data with reduced redundancy to decode into an acoustic signal, a residual component decoder for decoding the input coded data into a residual component, respectively. An in-band signal predictor that predicts the next coefficient from the previous coefficient sequence of the frequency component of, and corrects the prediction value with the residual component decoded by the residual component decoder to generate a frequency component; An audio signal decoding device, comprising: a band synthesizer that synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor.
【請求項5】前記帯域合成器が、前記帯域内信号予測器
で生成された各周波数成分から音響信号を合成する逆多
相フィルタ・バンク、前記帯域内信号予測器で生成され
た各周波数成分から音響信号を合成する逆離散フーリエ
変換器、前記帯域内信号予測器で生成された各周波数成
分から音響信号を合成する逆離散ハートレイ変換器、前
記帯域内信号予測器で生成された各周波数成分から逆直
交変換を施して音響信号を合成する逆離散コサイン変換
器、前記帯域内信号予測器で生成された各周波数成分か
ら逆直交変換を施して音響信号を合成する逆変形離散コ
サイン変換器、のうちいずれか1つによって構成するこ
とを特徴とする請求項5記載の音響信号復号装置。
5. An inverse polyphase filter bank in which the band synthesizer synthesizes an acoustic signal from each frequency component generated by the in-band signal predictor, and each frequency component generated by the in-band signal predictor. Inverse discrete Fourier transformer for synthesizing an acoustic signal from, an inverse discrete Hartley transformer for synthesizing an acoustic signal from each frequency component generated by the in-band signal predictor, each frequency component generated by the in-band signal predictor An inverse discrete cosine transformer that synthesizes an acoustic signal by performing an inverse orthogonal transform from the inverse deformed discrete cosine transformer that synthesizes an acoustic signal by performing an inverse orthogonal transform from each frequency component generated by the in-band signal predictor, The audio signal decoding apparatus according to claim 5, wherein the audio signal decoding apparatus is configured by any one of the above.
【請求項6】請求項1記載の音響信号符号化装置におい
て、前記符号量割当器で割り当てられた符号量に対応さ
せて前記残差成分符号化器で残差成分を量子化する際
に、周波数成分に擬似的に対応する擬似周波数成分の以
前の係数列から次の係数を予測した後に、該予測値から
逆量子化された該残差成分を減算して擬似周波数成分を
求めるローカルデコーダを備え、前記帯域内信号予測器
が、該ローカルデコーダで求められた該予測値から前記
帯域分割器で分割された周波数成分を減算して残差成分
を求め、前記残差成分符号化器で該残差成分を量子化し
た後に、符号化データに符号化する一方、請求項4記載
の音響信号復号装置において、該符号化データを入力し
て音響信号に復号するように構成することを特徴とする
音響信号処理装置。
6. The acoustic signal coding apparatus according to claim 1, wherein when the residual component encoder quantizes the residual component in correspondence with the code amount assigned by the code amount assigner, After predicting the next coefficient from the previous coefficient sequence of the pseudo frequency component corresponding to the frequency component in a pseudo manner, the local decoder for obtaining the pseudo frequency component by subtracting the dequantized residual component from the predicted value is used. The in-band signal predictor subtracts the frequency component divided by the band divider from the prediction value obtained by the local decoder to obtain a residual component, and the residual component encoder encodes the residual component. 5. The acoustic signal decoding device according to claim 4, wherein the residual component is quantized and then encoded into encoded data, and the acoustic signal decoding device according to claim 4 is configured so that the encoded data is input and decoded into an acoustic signal. Audio signal processing device.
【請求項7】上記請求項1乃至6記載の発明を組み合わ
せることによって構成することを特徴とする音響信号処
理装置。
7. An audio signal processing device, which is configured by combining the inventions of claims 1 to 6.
JP6272006A 1994-11-07 1994-11-07 Sound signal encoding device, decoding device, and processing device Pending JPH08137494A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6272006A JPH08137494A (en) 1994-11-07 1994-11-07 Sound signal encoding device, decoding device, and processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6272006A JPH08137494A (en) 1994-11-07 1994-11-07 Sound signal encoding device, decoding device, and processing device

Publications (1)

Publication Number Publication Date
JPH08137494A true JPH08137494A (en) 1996-05-31

Family

ID=17507834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6272006A Pending JPH08137494A (en) 1994-11-07 1994-11-07 Sound signal encoding device, decoding device, and processing device

Country Status (1)

Country Link
JP (1) JPH08137494A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008041322A1 (en) * 2006-10-03 2008-04-10 Toa Corporation Filter bank

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008041322A1 (en) * 2006-10-03 2008-04-10 Toa Corporation Filter bank
JPWO2008041322A1 (en) * 2006-10-03 2010-02-04 ティーオーエー株式会社 Filter bank
JP4493720B2 (en) * 2006-10-03 2010-06-30 ティーオーエー株式会社 Filter bank

Similar Documents

Publication Publication Date Title
US7194407B2 (en) Audio coding method and apparatus
JP3881943B2 (en) Acoustic encoding apparatus and acoustic encoding method
RU2402160C2 (en) Scalable compressed audio bit stream and codec using hierarchical set of filters and multichannel composite coding
JP5343098B2 (en) LPC harmonic vocoder with super frame structure
US8010349B2 (en) Scalable encoder, scalable decoder, and scalable encoding method
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
KR20090083069A (en) Method and apparatus for encoding audio signal, and method and apparatus for decoding audio signal
JPH11143499A (en) Improved method for switching type predictive quantization
JP2001222297A (en) Multi-band harmonic transform coder
RU2640722C2 (en) Improved quantizer
JP2002372996A (en) Method and device for encoding acoustic signal, and method and device for decoding acoustic signal, and recording medium
KR100738109B1 (en) Method and apparatus for quantizing and inverse-quantizing an input signal, method and apparatus for encoding and decoding an input signal
KR100789368B1 (en) Apparatus and Method for coding and decoding residual signal
JP4359949B2 (en) Signal encoding apparatus and method, and signal decoding apparatus and method
US20040083094A1 (en) Wavelet-based compression and decompression of audio sample sets
JP2004302259A (en) Hierarchical encoding method and hierarchical decoding method for sound signal
JP2004246038A (en) Speech or musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program
JPH08137494A (en) Sound signal encoding device, decoding device, and processing device
JPH0990989A (en) Conversion encoding method and conversion decoding method
JP4618823B2 (en) Signal encoding apparatus and method
KR20130007521A (en) Method and apparatus for encoding audio signal, and method and apparatus for decoding audio signal
JPH0918348A (en) Acoustic signal encoding device and acoustic signal decoding device
KR20080092823A (en) Apparatus and method for encoding and decoding signal
JPH05276049A (en) Voice coding method and its device
KR20000069159A (en) A method of encoding a speech signal