JP3341440B2 - Information encoding method and apparatus, information decoding method and apparatus, and information recording medium - Google Patents

Information encoding method and apparatus, information decoding method and apparatus, and information recording medium

Info

Publication number
JP3341440B2
JP3341440B2 JP03282894A JP3282894A JP3341440B2 JP 3341440 B2 JP3341440 B2 JP 3341440B2 JP 03282894 A JP03282894 A JP 03282894A JP 3282894 A JP3282894 A JP 3282894A JP 3341440 B2 JP3341440 B2 JP 3341440B2
Authority
JP
Japan
Prior art keywords
gain control
information
signal
processing
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP03282894A
Other languages
Japanese (ja)
Other versions
JPH07221649A (en
Inventor
京弥 筒井
ロバート・ヘドル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to US08/532,721 priority Critical patent/US5731767A/en
Priority to JP03282894A priority patent/JP3341440B2/en
Application filed by Sony Corp filed Critical Sony Corp
Priority to AU15897/95A priority patent/AU1589795A/en
Priority to EP95907835A priority patent/EP0693828B1/en
Priority to PCT/JP1995/000146 priority patent/WO1995021489A1/en
Priority to CN02120438.1A priority patent/CN1281006C/en
Priority to CN95190216.4A priority patent/CN1130833C/en
Publication of JPH07221649A publication Critical patent/JPH07221649A/en
Priority to AU23853/99A priority patent/AU719817B2/en
Application granted granted Critical
Publication of JP3341440B2 publication Critical patent/JP3341440B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、いわゆる高能率符号化
によって入力ディジタルデータの符号化を行い、これを
伝送、記録、再生し、復号化して再生信号を得るよう
な、情報符号化方法及び装置、情報復号化方法及び装
置、並びに情報記録媒体に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information encoding method which encodes input digital data by so-called high-efficiency encoding, and transmits, records, reproduces and decodes the digital data to obtain a reproduced signal. The present invention relates to an apparatus, an information decoding method and apparatus, and an information recording medium.

【0002】[0002]

【従来の技術】従来より、オーディオ或いは音声等の信
号の高能率符号化の手法は種々知られているが、例え
ば、時間軸上のオーディオ信号等をブロック化しない
で、複数の周波数帯域に分割して符号化する非ブロック
化周波数帯域分割方式である帯域分割符号化(サブバン
ド・コーディング:SBC)や、時間軸の信号を周波数
軸上の信号に変換(スペクトル変換)して複数の周波数
帯域に分割し、各帯域毎に符号化するブロック化周波数
帯域分割方式、いわゆる変換符号化等を挙げることがで
きる。また、上述の帯域分割符号化と変換符号化とを組
み合わせた高能率符号化の手法も考えられており、この
場合には、例えば、上記帯域分割符号化で帯域分割を行
った後、該各帯域毎の信号を周波数軸上の信号にスペク
トル変換し、このスペクトル変換された各帯域毎に符号
化が施される。
2. Description of the Related Art Hitherto, various methods for highly efficient encoding of a signal such as audio or voice have been known. For example, an audio signal or the like on a time axis is divided into a plurality of frequency bands without being blocked. Division coding (sub-band coding: SBC), which is a non-blocking frequency band division method for performing coding, and converting a signal on the time axis into a signal on the frequency axis (spectral conversion) to generate a plurality of frequency bands , And a coding frequency band division method for encoding for each band, so-called conversion encoding. Further, a high-efficiency coding method combining the above-described band division coding and transform coding is also considered.In this case, for example, after performing band division by the band division coding, The spectrum of the signal for each band is converted into a signal on the frequency axis, and coding is performed for each band that has been subjected to the spectrum conversion.

【0003】ここで、上述した帯域分割符号化において
用いられる帯域分割用フィルターとしては、例えばQM
Fフィルターがあり、このQMFフィルターは、文献
「ディジタル・コーディング・オブ・スピーチ・イン・
サブバンズ」(Digital codingof speech in subbands,
R.E.Crochiere, Bell Syst.Tech. J., Vol.55, No.819
76)に述べられている。
Here, as a band dividing filter used in the above-mentioned band dividing coding, for example, QM
There is an F filter, and this QMF filter is described in the document "Digital Coding of Speech in
Subbands "(Digital coding of speech in subbands,
RECrochiere, Bell Syst.Tech.J., Vol.55, No.819
76).

【0004】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」(Po
lyphase Quadrature filters -A new subband coding t
echnique, Joseph H. Rothweiler, ICASSP 83 BOSTON)
には、等バンド幅のフィルター分割手法が述べられてい
る。
[0004] Also, a document "Polyphase Quadrature Filters-New Band Division Coding Technology" (PoPo
lyphase Quadrature filters -A new subband coding t
echnique, Joseph H. Rothweiler, ICASSP 83 BOSTON)
Describes an equal bandwidth filter division technique.

【0005】また、上述したスペクトル変換としては、
例えば、入力オーディオ信号を所定単位時間(フレー
ム)でブロック化し、当該ブロック毎に離散フーリエ変
換(DFT)、コサイン変換(DCT)、モディファイ
ドDCT変換(MDCT)等を行うことで時間軸を周波
数軸に変換するようなスペクトル変換がある。なお、上
記MDCTについては、文献「時間領域エリアシング・
キャンセルを基礎とするフィルタ・バンク設計を用いた
サブバンド/変換符号化」(Subband/TransformCoding
Using Filter Bank Designs Based on Time Domain Ali
asing Cancellation, J.P.Princen, A.B.Bradley, Uni
v. of Surrey, Royal Melbourne Inst.ofTech. ICASSP
1987)に述べられている。
[0005] The above-mentioned spectral conversion includes:
For example, an input audio signal is divided into blocks in a predetermined unit time (frame), and a discrete Fourier transform (DFT), a cosine transform (DCT), a modified DCT transform (MDCT), or the like is performed for each block, so that the time axis is changed to the frequency axis. There is a spectrum conversion to be performed. The above MDCT is described in the document “Time domain aliasing.
Subband / Transform Coding Using Cancellation-Based Filter Bank Design "(Subband / TransformCoding
Using Filter Bank Designs Based on Time Domain Ali
asing Cancellation, JPPrincen, ABBradley, Uni
v. of Surrey, Royal Melbourne Inst. of Tech. ICASSP
1987).

【0006】このようにフィルターやスペクトル変換に
よって帯域毎に分割された信号を量子化することによ
り、量子化雑音が発生する帯域を制御することができ、
マスキング効果などの性質を利用して聴覚的により高能
率な符号化を行なうことができる。また、ここで量子化
を行なう前に、各帯域毎に、例えばその帯域における信
号成分の絶対値の最大値で正規化を行なうようにすれ
ば、さらに高能率な符号化を行なうことができる。
As described above, by quantizing the signal divided for each band by the filter or the spectrum conversion, the band in which the quantization noise occurs can be controlled.
Aurally more efficient encoding can be performed by utilizing properties such as a masking effect. Further, if the normalization is performed for each band, for example, with the maximum value of the absolute value of the signal component in that band before the quantization is performed, more efficient encoding can be performed.

【0007】ここで、周波数帯域分割された各周波数成
分を量子化する場合の周波数分割幅としては、例えば人
間の聴覚特性を考慮した帯域幅を用いることが多い。す
なわち、一般に高域ほど帯域幅が広くなるような臨界帯
域(クリティカルバンド)と呼ばれている帯域幅で、オ
ーディオ信号を複数(例えば25バント)の帯域に分割
することがある。また、この時の各帯域毎のデータを符
号化する際には、各帯域毎に所定のビット配分或いは、
各帯域毎に適応的なビット割当て(ビットアロケーシヨ
ン)による符号化が行われる。例えば、上記MDCT処
理されて得られた係数データを上記ビットアロケーシヨ
ンによって符号化する際には、上記各ブロック毎のMD
CT処理により得られる各帯域毎のMDCT係数データ
に対して、適応的な割当てビット数で符号化が行われる
ことになる。ビット割当手法としては、次の2手法が知
られている。
Here, as a frequency division width when quantizing each frequency component divided into frequency bands, for example, a bandwidth in consideration of human auditory characteristics is often used. That is, an audio signal may be divided into a plurality of bands (for example, 25 bands) in a band called a critical band (critical band) in which the band becomes generally wider as the frequency becomes higher. When encoding data for each band at this time, a predetermined bit distribution for each band or
Encoding by adaptive bit allocation (bit allocation) is performed for each band. For example, when the coefficient data obtained by the MDCT processing is encoded by the bit allocation, the MD of each block is encoded.
The MDCT coefficient data for each band obtained by the CT processing is encoded with an adaptive number of allocated bits. The following two methods are known as bit allocation methods.

【0008】例えば、文献「音声信号の適応変換符号
化」(Adaptive Transform Coding ofSpeech Signals.
R.Zelinski, P.Noll, IEEE Transactions of Accoustic
s, Speech, and Signal Processing, vol.ASSP-25, No.
4, August 1977 )では、各帯域毎の信号の大きさをも
とに、ビット割当を行なっている。この方式では、量子
化雑音スペクトルが平坦となり、雑音エネルギー最小と
なるが、聴感覚的にはマスキング効果が利用されていな
いために実際の雑音感は最適ではない。
For example, the document "Adaptive Transform Coding of Speech Signals.
R. Zelinski, P. Noll, IEEE Transactions of Accoustic
s, Speech, and Signal Processing, vol.ASSP-25, No.
4, August 1977), bits are assigned based on the magnitude of the signal for each band. In this method, the quantization noise spectrum is flattened and the noise energy is minimized, but the actual noise sensation is not optimal because the masking effect is not utilized from the auditory point of view.

【0009】また、例えば文献「臨界帯域符号化器 −
ディジタル・エンコーディング・オブ・パーセプチュア
ル・リクワイアメンツ・オブ・ジ・オーディトリィ・シ
ステム」(The critical band coder --digital encodi
ng of the perceptual requirements of the auditory
system, M.A.Kransner MIT, ICASSP 1980)では、聴覚
マスキングを利用することで、各帯域毎に必要な信号対
雑音比を得て固定的なビット割当を行なう手法が述べら
れている。しかしこの手法では、サイン波入力で特性を
測定する場合でも、ビット割当が固定的であるために特
性値がそれほど良い値とならない。
Further, for example, in the document “Critical band encoder—
Digital Encoding of Perceptual Requirements of the Auditory System (The critical band coder --digital encodi
ng of the perceptual requirements of the auditory
system, MAKransner MIT, ICASSP 1980) describes a method of obtaining a required signal-to-noise ratio for each band and performing fixed bit allocation by using auditory masking. However, in this method, even when the characteristic is measured with a sine wave input, the characteristic value is not so good because the bit allocation is fixed.

【0010】これらの問題を解決するために、ビット割
当に使用できる全ビットが、各小ブロック毎にあらかじ
め定められた固定ビット割当パターン分と、各ブロック
の信号の大きさに依存したビット配分を行なう分に分割
使用され、その分割比を入力信号に関係する信号に依存
させ、前記信号のスペクトルが滑らかなほど前記固定ビ
ット割当パターン分への分割比率を大きくする高能率符
号化装置が提案されている。
[0010] In order to solve these problems, all bits that can be used for bit allocation include a fixed bit allocation pattern predetermined for each small block and a bit allocation depending on the signal size of each block. A high-efficiency coding apparatus has been proposed in which a division ratio is used to perform the division, the division ratio is made dependent on a signal related to an input signal, and the division ratio into the fixed bit allocation pattern is increased as the spectrum of the signal is smoother. ing.

【0011】この方法によれば、サイン波入力のよう
に、特定のスペクトルにエネルギーが集中する場合には
そのスペクトルを含むブロックに多くのビットを割り当
てる事により、全体の信号対雑音特性を著しく改善する
ことができる。一般に、急峻なスペクトル成分をもつ信
号に対して人間の聴覚は極めて敏感であるため、このよ
うな方法を用いる事により、信号対雑音特性を改善する
ことは、単に測定上の数値を向上させるばかりでなく、
聴感上、音質を改善するのに有効である。
According to this method, when energy is concentrated on a specific spectrum such as a sine wave input, a large number of bits are allocated to a block including the spectrum, thereby significantly improving the entire signal-to-noise characteristic. can do. In general, human hearing is extremely sensitive to signals having steep spectral components. Therefore, using such a method to improve the signal-to-noise characteristics merely improves the numerical values measured. But not
This is effective for improving sound quality in terms of hearing.

【0012】ビット割り当ての方法にはこの他にも数多
くのやり方が提案されており、さらに聴覚に関するモデ
ルが精緻化され、符号化装置の能力があがれば聴覚的に
みてより高能率な符号化が可能になる。
Numerous other methods have been proposed for the bit allocation method. Further, models relating to hearing are refined, and if the capability of the coding device is increased, more efficient coding can be perceived perceptually. Will be possible.

【0013】ところで、波形信号をスペクトルに変換す
る方法として上述のDFTやDCTを使用した場合に
は、M個のサンプルからなる時間ブロックで変換を行う
とM個の独立な実数データが得られる。時間ブロック間
の接続歪みを軽減するために、通常、両隣のブロックと
それぞれM1 個のサンプルずつオーバーラップさせるの
で、平均して、DFTやDCTでは(M−M1 )個のサ
ンプルに対してM個の実数データを量子化して符号化す
ることになる。
When the above-described DFT or DCT is used as a method of converting a waveform signal into a spectrum, M independent real number data can be obtained by performing conversion using a time block including M samples. In order to reduce the connection distortion between time blocks, normally, since the overlapped by sample blocks and one M each neighboring, on average, in DFT or DCT (M-M 1) with respect to samples M pieces of real number data are quantized and encoded.

【0014】これに対してスペクトルに変換する方法と
して上述のMDCTを使用した場合には、両隣の時間と
N個ずつオーバーラップさせた2M個のサンプルから、
独立なM個の実数データが得られるので平均して、MD
CTではM個のサンプルに対してM個の実数データを量
子化して符号化することになる。復号化装置において
は、このようにしてMDCTを用いて得られた符号から
各ブロックにおいて逆変換を施して得られた波形要素を
互いに干渉させながら加え合わせることにより、波形信
号を再構成することができる。
On the other hand, when the above-mentioned MDCT is used as a method for converting into a spectrum, 2M samples overlapping N times each with the time on both sides are used.
Since M independent real number data are obtained, on average, MD
In CT, M real number data is quantized and encoded for M samples. In the decoding apparatus, it is possible to reconstruct a waveform signal by adding the waveform elements obtained by performing inverse transform in each block from the code obtained by using the MDCT while causing the blocks to interfere with each other. it can.

【0015】一般に変換のための時間ブロックを長くす
ることによって、スペクトルの周波数分解能が高まり特
定のスペクトル成分にエネルギーが集中する。したがっ
て、両隣のブロックと半分ずつオーバーラップさせて長
いブロック長で変換を行い、しかも得られたスペクトル
信号の個数が、元の時間サンプルの個数に対して増加し
ないMDCTを使用することにより、DFTやDCTを
使用した場合よりも効率の良い符号化を行うことが可能
となる。また、隣接するブロック同士に十分長いオーバ
ーラップを持たせることによって、波形信号のブロック
間歪みを軽減することもできる。
In general, by extending the time block for the conversion, the frequency resolution of the spectrum is increased and the energy is concentrated on a specific spectral component. Therefore, by using a MDCT in which the transform is performed with a long block length by overlapping the adjacent blocks by half each and the number of obtained spectral signals does not increase with respect to the number of original time samples, DFT or It is possible to perform more efficient coding than when DCT is used. In addition, by providing a sufficiently long overlap between adjacent blocks, distortion between blocks of a waveform signal can be reduced.

【0016】このように、信号をいったん周波数成分に
分解し、その周波数成分を量子化して符号化する方法を
用いると、その周波数成分を復号化して合成して得られ
た波形信号にも量子化雑音が発生するが、もし、元々の
信号成分が急激に変化する場合には、波形信号上の量子
化雑音は必ずしも元の信号波形が大きくない部分でも大
きくなってしまい、この量子化雑音が同時マスキングに
よって隠蔽されないため聴感上の障害になる。音が急激
に大きくなるアタック部でこのようにして発生する量子
化雑音はプリエコーと呼ばれる。
As described above, when a method of once decomposing a signal into frequency components and quantizing and encoding the frequency components is used, a waveform signal obtained by decoding and synthesizing the frequency components is also quantized. Noise is generated, but if the original signal component changes rapidly, the quantization noise on the waveform signal will be large even in areas where the original signal waveform is not large, and this quantization noise Since it is not concealed by masking, it becomes an obstacle to hearing. The quantization noise generated in this way in the attack part where the sound suddenly increases is called pre-echo.

【0017】特に、スペクトル変換を使用して多数の周
波数成分に分解した場合には、時間分解能が悪くなり、
長い期間にわたってプリエコーが発生してしまう。
In particular, when the signal is decomposed into a large number of frequency components using spectral conversion, the time resolution becomes poor,
Pre-echo occurs over a long period.

【0018】ここで、帯域分割の際にスペクトル変換を
使用した場合のプリエコーの発生の動作原理について、
図7を参照しながら説明する。
Here, the operation principle of the generation of the pre-echo when the spectrum conversion is used in the band division will be described.
This will be described with reference to FIG.

【0019】図7の(A)に示す窓関数あるいはウィン
ドウ関数を用いて、入力波形信号SWに順スペクトル変
換を施したスペクトル信号に量子化雑音が加わった場合
に、この量子化雑音が加わったスペクトル信号に逆スペ
クトル変換を施して再び時間軸上の波形信号に戻すと、
その量子化雑音は変換ブロック全体に拡がってしまう。
ここで、入力信号波形が(B)のように変換ブロックの
途中で急激に大きくなった場合には、元の信号波形が小
さい区間においては、量子化雑音QNが信号波形SWに
対して大きくなってしまうため、同時マスキングが効か
ず、プリエコーとして聴感上の障害になる。
When quantization noise is added to the spectrum signal obtained by performing forward spectrum conversion on the input waveform signal SW using the window function or the window function shown in FIG. 7A, the quantization noise is added. Performing inverse spectrum conversion on the spectrum signal and returning it to the waveform signal on the time axis again,
The quantization noise spreads over the entire transform block.
Here, when the input signal waveform suddenly increases in the middle of the conversion block as in (B), the quantization noise QN becomes larger than the signal waveform SW in a section where the original signal waveform is small. As a result, simultaneous masking does not work, and the pre-echo causes hearing damage.

【0020】ここで、スペクトル変換の変換長を短くす
れば上記の量子化雑音の発生期間も短くなるが、そうす
ると周波数分解能が悪くなり、準定常的な部分における
符号化効率が悪くなってしまう。このような問題を解決
する手段として、信号波形が急激に変化する部分におい
てのみ周波数分解能を犠牲にして変換長を短くする、と
いう方法が提案されている。
Here, if the conversion length of the spectrum conversion is shortened, the period during which the above-mentioned quantization noise is generated is also shortened. However, if so, the frequency resolution is deteriorated, and the coding efficiency in the quasi-stationary part is deteriorated. As a means for solving such a problem, there has been proposed a method of shortening the conversion length at the part where the signal waveform changes abruptly at the expense of frequency resolution.

【0021】図8はこのようなプリエコーによる聴感上
の障害を軽減するために考案された従来技術の一例につ
いて説明するための図である。一般に、準定常的な信号
波形に対しては、変換ブロック長を長くした方が特定の
スペクトル係数に対してエネルギーが集中するので符号
化効率は高くなるが、音の大きさが急激に変化する部分
では変換ブロック長が長いと上述のプリエコーが問題に
なる。
FIG. 8 is a diagram for explaining an example of the prior art devised to reduce the hearing impairment due to such a pre-echo. Generally, for a quasi-stationary signal waveform, the longer the transform block length is, the more the energy concentrates on a specific spectral coefficient, so that the coding efficiency becomes higher, but the sound volume changes abruptly. If the conversion block length is long in the part, the above-mentioned pre-echo becomes a problem.

【0022】そこで、音の大きさが急激に変化する部
分、例えば図8の(B)に示すような入力信号波形SW
の振幅が急激に大きくなるところでは、図8の(A)に
示すように、変換ブロック長を短くするような短変換窓
関数あるいは短変換ウィンドウ関数を掛けるようにし、
これによって上記プリエコーの発生期間を十分短くすれ
ば、元の信号によるいわゆる逆向マスキングが効き、聴
感上の障害が無くなる。図8の方法ではこのことを利用
して信号波形の各部分の性質に応じて変換ブロック長を
選択的に切り替えている。
Therefore, the portion where the loudness of the sound changes rapidly, for example, the input signal waveform SW shown in FIG.
Where the amplitude of increases sharply, a short conversion window function or a short conversion window function that shortens the conversion block length is applied as shown in FIG.
As a result, if the period of occurrence of the pre-echo is sufficiently shortened, so-called reverse masking by the original signal is effective, so that there is no obstacle to hearing. In the method of FIG. 8, utilizing this, the conversion block length is selectively switched according to the properties of each part of the signal waveform.

【0023】この方法を用いると、準定常部では十分な
周波数分解能が確保されると共に、アタック部における
プリエコーも発生期間が十分に短くなりいわゆる逆向マ
スキングにより隠蔽されるため、効率の良い符号化が可
能となる。
Using this method, sufficient frequency resolution is ensured in the quasi-stationary part, and the pre-echo in the attack part has a sufficiently short generation period and is concealed by so-called reverse masking, so that efficient coding is performed. It becomes possible.

【0024】しかし、このように変換長を可変にする方
法では、異なる長さの変換に対応した変換手段を符号化
装置、符号化装置に設ける必要がある。さらにこの方法
では、変換によって得られるスペクトル成分の数は変換
長の長さに比例するため、各スペクトル成分が対応する
周波数帯域も変換長によって異なり、複数のスペクトル
を、例えば臨界帯域幅毎にまとめて符号化しようとした
場合に、各臨界帯域に含まれるスペクトルの数も異なっ
てしまい、符号化、復号化の処理が煩雑になってしま
う。このように、変換長を可変にするやり方では、符号
化装置、復号化装置とも複雑なものになってしまう、と
いう欠点がある。
However, in the method of making the conversion length variable as described above, it is necessary to provide conversion means corresponding to conversions of different lengths in the encoding device and the encoding device. Furthermore, in this method, since the number of spectral components obtained by the conversion is proportional to the length of the conversion length, the frequency band corresponding to each spectral component also differs depending on the conversion length, and a plurality of spectra are grouped, for example, for each critical bandwidth. However, when trying to perform encoding, the number of spectra included in each critical band also differs, and the encoding and decoding processes become complicated. As described above, the method of making the conversion length variable has a disadvantage that both the encoding device and the decoding device are complicated.

【0025】ところで、変換ブロック長を一定にしたま
まで上記プリエコーの問題を解決するための方法とし
て、特開平3−132228号公報には、入力された波
形信号に対して適応ゲイン制御を行った後、DFTやD
CTを用いてスペクトル信号に変換して符号化を行う方
法が述べられている。ここでゲイン制御とは、パワーレ
ベルの小さいところではそのゲインを大きく(振幅を増
幅)することである。
As a method for solving the above-described pre-echo problem while keeping the conversion block length constant, Japanese Patent Application Laid-Open No. 3-132228 discloses an adaptive gain control for an input waveform signal. Later, DFT and D
A method is described in which a signal is converted into a spectrum signal using CT and coding is performed. Here, the gain control means increasing the gain (amplifying the amplitude) where the power level is small.

【0026】この方法においては、符号化装置はスペク
トル信号への変換を行う前に、アタック部ではゲインを
急激に下げたゲイン制御を行い、アタック部以外では減
衰に応じてそのゲインを再び上げて行くようゲイン制御
を行っており、復号化装置は、逆スペクトル変換して得
られた信号波形に対してゲイン制御を補正する逆ゲイン
制御を施した信号を出力する。このようにすると、マス
キング・レベルが低くなる小振幅の信号部分における量
子化雑音が抑圧される。また、変換長を常に一定にする
ことができるため、符号化装置、復号化装置の構成を簡
単にすることができる。
In this method, the coding apparatus performs gain control in which the gain is sharply reduced in the attack section before performing conversion to the spectrum signal, and increases the gain again in accordance with the attenuation in other sections than the attack section. The gain control is performed, and the decoding apparatus outputs a signal obtained by performing inverse gain control on the signal waveform obtained by performing the inverse spectrum conversion to correct the gain control. In this way, the quantization noise in the small-amplitude signal portion where the masking level becomes low is suppressed. Further, since the conversion length can always be kept constant, the configurations of the encoding device and the decoding device can be simplified.

【0027】しかしながら、 この方法では信号の減衰
時にもゲイン制御を行う必要がある。一般にゲイン制御
を行うことは元の信号波形を歪ませることになるので、
スペクトルに変換した場合にエネルギーの分布が分散さ
れ、効率的な符号化を行うことが困難になる。特に信号
の減衰時には、前の音が後に発生した発生した音をマス
クする順向マスキングが有効に作用するため、量子化雑
音の発生を時間的に制御するよりも雑音レベルそのもの
を下げることが重要である。また、常にゲイン制御の処
理を行うことは、演算処理量の面から見ても好ましくな
い。
However, in this method, it is necessary to perform gain control even when the signal is attenuated. Generally, gain control distorts the original signal waveform,
When converted to a spectrum, the energy distribution is dispersed, making it difficult to perform efficient coding. In particular, when the signal is attenuated, the forward masking that masks the sound that occurred before the previous sound works effectively, so it is more important to reduce the noise level itself than to control the generation of quantization noise temporally. It is. Also, it is not preferable to always perform the gain control process from the viewpoint of the amount of calculation processing.

【0028】変換ブロック長を一定にしたままでプリエ
コーを防止する他の方法として、例えば特開昭61−2
01526号公報や特開昭63−7023号公報に示す
ような技術が知られている。これらの公報には、符号化
装置において、入力信号波形を時間ブロック毎に切り出
してウィンドウを掛けた後、アタック部を検出し、アタ
ック部直前の小振幅の波形を増幅してからDFTやDC
Tを用いてスペクトル信号に変換して符号化し、復号化
装置においては、復元されたスペクトル信号に逆DFT
(Inverse DFT:IDFT)や逆DCT(Inverse D
CT:IDCT)等の逆変換を施してから符号化装置で
アタック部直前の信号を増幅したことを補正する処理を
施すことにより、プリエコーを防止する方法が提案され
ている。この場合も、変換長を常に一定にでき、符号化
装置、復号化装置の構成を簡単にすることができる。
As another method for preventing pre-echo while keeping the conversion block length constant, for example, Japanese Patent Laid-Open No.
Techniques such as those disclosed in JP-A-01526 and JP-A-63-7023 are known. In these publications, an encoding device cuts out an input signal waveform for each time block, applies a window, detects an attack portion, amplifies a small-amplitude waveform immediately before the attack portion, and then performs DFT or DC
T is converted into a spectrum signal using T, and the decoded signal is decoded.
(Inverse DFT: IDFT) and inverse DCT (Inverse DFT)
There has been proposed a method for preventing a pre-echo by performing an inverse transformation such as CT: IDCT) and then performing a process of correcting that a signal immediately before an attack unit is amplified by an encoding device. Also in this case, the conversion length can always be constant, and the configurations of the encoding device and the decoding device can be simplified.

【0029】ここで図9は、上記特開昭61−2015
26号公報や特開昭63−7023号公報において示さ
れているウィンドウ化処理技術を用いた符号化復号化に
ついての動作原理を説明したものであり、図10及び図
11は、この技術を用いた符号化装置及び復号化装置の
処理の流れを示したものである。
Here, FIG.
No. 26 and Japanese Patent Application Laid-Open No. 63-7023 describe the principle of operation for encoding and decoding using the windowing processing technique. FIGS. 10 and 11 show this technique. 3 shows the flow of processing performed by the encoding device and the decoding device.

【0030】図10の入力端子400には、例えば図9
の(A)に示すような信号波形が入力されており、ウィ
ンドウ回路401においては、時間的に順次連続しかつ
相互に重畳する時間窓を設定し時間波形信号を切り出す
ように、図9の(B)に示すウィンドウ関数(上記特開
昭61−201526号公報で言う特性カーブ)が掛け
合わされる。アタック部検出回路402は、入力信号の
振幅が急激に大きくなる箇所(アタック部)を検出す
る。ゲイン制御回路403においては、もしアタック部
が検出された場合には微小振幅部分を増幅するように処
理を行い、またアタック部が検出されなかった場合には
増幅処理を行わない。ゲイン制御回路403からの出力
は、順スペクトル変換回路404に送られてDFT、D
CT等によりスペクトル信号に変換される。こうして得
られたスペクトル信号は、正規化・量子化回路405に
て正規化および量子化された後、符号化回路406によ
って符号化され、出力端子407より符号列として取り
出される。
The input terminal 400 shown in FIG.
(A) of FIG. 9 is input, and the window circuit 401 sets a time window that is temporally continuous and superimposed on each other, and cuts out a time waveform signal as shown in FIG. A window function (characteristic curve referred to in the above-mentioned Japanese Patent Application Laid-Open No. 61-201526) is multiplied. The attack part detection circuit 402 detects a part (attack part) where the amplitude of the input signal sharply increases. The gain control circuit 403 performs processing so as to amplify the minute amplitude portion if an attack part is detected, and does not perform amplification processing if the attack part is not detected. An output from the gain control circuit 403 is sent to a forward spectrum conversion circuit 404, and DFT, D
It is converted into a spectrum signal by CT or the like. The spectrum signal thus obtained is normalized and quantized by the normalization / quantization circuit 405, then encoded by the encoding circuit 406, and extracted from the output terminal 407 as a code string.

【0031】また、図11に示す復号化装置において
は、入力端子410に供給された符号列信号に対して、
復号化回路411にて上記符号化回路406での符号化
の逆の復号化が施され、逆正規化・逆量子化回路412
に送られる。逆正規化・逆量子化回路412からの出力
は、逆スペクトル変換回路413でIDFTやIDCT
等により時間領域への逆変換が行われた後に、ゲイン制
御補正回路414に送られて、上記符号化装置で施され
たゲイン制御処理を補正する処理が施される。ゲイン制
御補正回路414からの出力は、隣接ブロック合成回路
415に送られて隣接ブロックとの合成がなされ、出力
端子416を介して取り出される。
In the decoding apparatus shown in FIG. 11, the code string signal supplied to the input terminal 410 is
In the decoding circuit 411, the inverse decoding of the encoding in the encoding circuit 406 is performed, and the inverse normalization / inverse quantization circuit 412 is applied.
Sent to An output from the inverse normalization / inverse quantization circuit 412 is output to an inverse spectrum conversion circuit 413 by IDFT or IDCT.
After the inverse conversion to the time domain is performed by the above-described method, the data is sent to the gain control correction circuit 414, and the gain control processing performed by the encoding device is corrected. The output from the gain control correction circuit 414 is sent to the adjacent block synthesis circuit 415, where the output from the gain control correction circuit 414 is synthesized with the adjacent block, and extracted through the output terminal 416.

【0032】この方法では、上述のようにウィンドウ関
数が施された後、変形された波形信号に対してアタック
部の検出処理が行われるので、ブロックの両端において
は大振幅の部分も緩和されてしまい、例えば図9に示す
ように、ブロックBL1においては、アタック部が検出
されず、次のブロックBL2においてのみアタック部が
検出されることが生じ得るが、スペクトル変換として上
記DFTやDCTを用いた場合には、順スペクトル変換
を施して得られたスペクトルに対して逆スペクトル変換
を施せば元の時系列ブロックが完全に復元されるため、
復号化装置においてブロック毎にゲイン制御の補正処理
を施せば問題は生じない。
In this method, after the window function is applied as described above, the process of detecting the attack portion is performed on the deformed waveform signal, so that the large-amplitude portion is mitigated at both ends of the block. For example, as shown in FIG. 9, an attack portion may not be detected in the block BL1 and an attack portion may be detected only in the next block BL2. However, the above-described DFT or DCT is used for spectrum conversion. In this case, if the spectrum obtained by performing the forward spectrum transformation is subjected to the inverse spectrum transformation, the original time-series block is completely restored.
If the decoding apparatus performs the gain control correction processing for each block, no problem occurs.

【0033】[0033]

【発明が解決しようとする課題】しかしながら、これら
のゲイン制御を利用する方法の実施例で述べられている
方法においては、アタック部におけるゲイン制御量は固
定的で、アタック部の検出の有無によって所定の値のゲ
イン制御を行うか否かを決定するものであった。プリエ
コーは周波数領域で発生した量子化雑音が時間領域に変
換されたものであるので、符号化の圧縮率が上がり周波
数領域での量子化雑音が大きくなればプリエコーによる
音質劣化は大きくなるが、一方、必要以上のゲイン制御
を行うことは周波数領域でのエネルギー分布を拡散させ
ることになるので効率的な圧縮を行う上で望ましくな
い。したがって、従来のようにアタック部の検出の有無
によって所定の値のゲイン制御を行うか否かを二者択一
的に選択する方法では、特に圧縮率が高い場合には音質
の劣化を防止することが困難であった。
However, in the method described in the embodiment of the method using the gain control, the gain control amount in the attack portion is fixed, and the predetermined amount depends on whether the attack portion is detected or not. It is determined whether or not to perform the gain control of the value of. In pre-echo, quantization noise generated in the frequency domain is converted to the time domain.Therefore, if the compression rate of coding increases and the quantization noise in the frequency domain increases, sound quality degradation due to pre-echo increases, but on the other hand, Performing more gain control than necessary spreads the energy distribution in the frequency domain, which is not desirable for efficient compression. Therefore, in the conventional method of alternately selecting whether or not to perform a predetermined value of gain control based on the presence or absence of detection of an attack portion, sound quality is prevented from being deteriorated particularly when the compression ratio is high. It was difficult.

【0034】本発明は、このような実情に鑑みてなされ
たものであり、アタック部の振幅変化の度合いに応じた
ゲイン制御を可能とし、より効率的でより音質の高い符
号化、復号化、あるいは記録が行え、構成も簡単で、効
果的にプリエコー防止が行えるような情報符号化方法及
び装置、情報復号化方法及び装置、並びに情報記録媒体
の提供を目的とするものである。
The present invention has been made in view of such circumstances, and enables gain control in accordance with the degree of amplitude change of an attack portion, and enables more efficient encoding and decoding with higher sound quality. Alternatively, it is an object of the present invention to provide an information encoding method and apparatus, an information decoding method and apparatus, and an information recording medium that can perform recording and have a simple configuration and can effectively prevent pre-echo.

【0035】[0035]

【課題を解決するための手段】本発明は、上述の課題を
解決するために、アタック部のゲイン制御量を波形信号
のレベル変化に応じて変化させることにより、圧縮率の
高い場合にも効果的にプリエコーを防止するものであ
る。
According to the present invention, in order to solve the above-mentioned problems, the gain control amount of the attack section is changed in accordance with a change in the level of a waveform signal, so that the present invention is effective even when the compression ratio is high. This is to prevent pre-echo.

【0036】すなわち、本発明に係る情報符号化方法
は、入力波形信号を複数の帯域に分割する帯域分割処理
と、上記帯域分割された波形信号のゲインを制御するゲ
イン制御処理と、上記ゲイン制御処理された入力波形信
号を所定単位時間毎にブロック化して周波数成分に分解
する周波数成分分解処理と、上記周波数成分分解処理の
出力情報および上記ゲイン制御の制御情報の符号化処理
とを行う情報符号化方法であって、上記ゲイン制御処理
は、上記帯域分割処理された帯域毎に行い、上記ゲイン
制御の制御情報は、ゲイン制御を行うかどうかを表すフ
ラグ情報を含み、実際のゲイン制御を行わないブロック
の上記制御情報は上記フラグのみから構成されることを
特徴とする。
That is, in the information encoding method according to the present invention, there are provided a band division process for dividing an input waveform signal into a plurality of bands, a gain control process for controlling a gain of the band-divided waveform signal, and a gain control process. An information code for performing a frequency component decomposition process of blocking the processed input waveform signal for each predetermined unit time and decomposing it into frequency components, and an encoding process of output information of the frequency component decomposition process and control information of the gain control. The gain control process is performed for each band subjected to the band division process, and the control information of the gain control includes flag information indicating whether to perform the gain control, and performs the actual gain control. It is characterized in that the control information of a non-existing block comprises only the flag.

【0037】また、本発明に係る情報符号化装置は、入
力波形信号を複数の帯域に分割する帯域分割処理手段
と、上記帯域分割された波形信号のゲイン制御処理を行
うゲイン制御処理手段と、上記ゲイン制御処理手段から
の出力信号を所定単位時間毎にブロック化して周波数成
分に分解する周波数成分分解処理手段と、上記周波数成
分分解処理手段からの出力情報および上記ゲイン制御の
制御情報の符号化処理を行う符号化手段とを有する情報
符号化装置であって、上記ゲイン制御処理は、上記帯域
分割処理された帯域毎に行い、上記ゲイン制御の制御情
報は、ゲイン制御を行うかどうかを表すフラグ情報を含
み、実際のゲイン制御を行わないブロックの上記制御情
報は上記フラグのみから構成されることを特徴とする。
Further, the information coding apparatus according to the present invention comprises: a band division processing means for dividing an input waveform signal into a plurality of bands; a gain control processing means for performing a gain control processing of the band-divided waveform signal; Frequency component decomposition processing means for blocking an output signal from the gain control processing means for each predetermined unit time and decomposing the signal into frequency components; and encoding output information from the frequency component decomposition processing means and control information for gain control. And an encoding means for performing the processing, wherein the gain control processing is performed for each of the bands subjected to the band division processing, and the control information of the gain control indicates whether to perform gain control. It is characterized in that the control information of a block that includes flag information and does not perform actual gain control is composed of only the flag.

【0038】次に、本発明に係る情報復号化方法は、周
波数成分信号およびゲイン制御補正情報の復号化処理
と、上記周波数成分信号から所定単位時間毎にブロック
化された複数の帯域の波形信号を生成する波形信号生成
処理と、上記波形信号生成処理の出力波形信号のゲイン
制御補正処理と、上記ゲイン制御補正処理された複数の
帯域の波形信号を合成する帯域合成処理とを行う情報復
号化方法であって、上記ゲイン制御補正処理は、上記波
形信号生成処理における帯域毎に行われ、上記ゲイン制
御補正情報は、ゲイン制御を行うかどうかを表すフラグ
情報を含み、実際のゲイン制御を行わないブロックの上
記ゲイン制御補正情報は上記フラグのみから構成される
ことを特徴とする。
Next, an information decoding method according to the present invention provides a decoding process of a frequency component signal and gain control correction information, and a waveform signal of a plurality of bands which are blocked from the frequency component signal at predetermined unit times. Information decoding that performs a waveform signal generation process of generating a waveform signal, a gain control correction process of an output waveform signal of the waveform signal generation process, and a band synthesis process of synthesizing the waveform signals of a plurality of bands subjected to the gain control correction process. In the method, the gain control correction processing is performed for each band in the waveform signal generation processing, and the gain control correction information includes flag information indicating whether to perform gain control, and performs actual gain control. The gain control correction information of the no block includes only the flag.

【0039】また、本発明に係る情報復号化装置は、周
波数成分信号およびゲイン制御補正情報を復号化処理す
る復号化手段と、上記周波数成分信号から所定単位時間
毎にブロック化された複数の帯域の波形信号を生成する
波形信号生成処理手段と、上記波形信号生成処理手段か
らの出力波形信号のゲイン制御補正処理を行うゲイン制
御補正処理手段と、上記ゲイン制御補正処理された複数
の帯域の波形信号を合成する帯域合成処理と有する情報
復号化装置であって、上記ゲイン制御補正処理は、上記
波形信号生成処理における帯域毎に行われ、上記ゲイン
制御補正情報は、ゲイン制御を行うかどうかを表すフラ
グ情報を含み、実際のゲイン制御を行わないブロックの
上記ゲイン制御補正情報は上記フラグのみから構成され
ることを特徴とする。
An information decoding apparatus according to the present invention comprises: decoding means for decoding a frequency component signal and gain control correction information; and a plurality of bands which are blocked from the frequency component signal at predetermined unit times. Waveform signal generation processing means for generating a waveform signal of the above, gain control correction processing means for performing gain control correction processing of an output waveform signal from the waveform signal generation processing means, and waveforms of a plurality of bands subjected to the gain control correction processing An information decoding apparatus having a band synthesis process for synthesizing a signal, wherein the gain control correction process is performed for each band in the waveform signal generation process, and the gain control correction information indicates whether to perform gain control. Wherein the gain control correction information of a block that does not actually perform gain control includes only the flag. .

【0040】さらに、本発明に係る情報記録媒体は、時
間軸上の信号を所定単位時間毎にブロック化して行う周
波数成分分解処理によって得られた周波数成分信号情報
およびゲイン制御補正情報が記録され、上記ゲイン制御
補正情報はゲイン制御を行うかどうかを表すフラグ情報
を含み、実際のゲイン制御を行わないブロックの上記ゲ
イン制御補正情報は上記フラグのみから構成されるとと
もに、上記周波数成分信号の帯域毎に選択されたもので
あることを特徴とする。
Further, in the information recording medium according to the present invention, frequency component signal information and gain control correction information obtained by frequency component decomposition processing performed by blocking a signal on the time axis for each predetermined unit time are recorded. The gain control correction information includes flag information indicating whether or not to perform gain control. The gain control correction information of a block that does not actually perform gain control includes only the flag, Is selected.

【0041】[0041]

【0042】これらの発明において、上記周波数成分分
解処理は、時間軸上の信号を周波数軸上の信号に変換す
るスペクトル変換処理を含むことが挙げられる。また、
上記入力信号又は出力信号は音響信号であることが挙げ
られる。
In these inventions, the frequency component decomposition processing includes a spectrum conversion processing for converting a signal on the time axis into a signal on the frequency axis. Also,
The input signal or the output signal may be an acoustic signal.

【0043】[0043]

【作用】波形信号が急激に大きくなる部分でのゲイン制
御量として、複数種類の大きさから選択的に決定したも
のを用いることにより、アタック部の振幅変化の度合に
応じたゲイン制御が可能となり、より効率的でより音質
の高い符号化、復号化、記録、伝送が可能となる。
[Function] By using a gain control amount selectively determined from a plurality of magnitudes as a gain control amount in a portion where a waveform signal sharply increases, gain control according to a degree of amplitude change of an attack portion can be performed. Thus, encoding, decoding, recording, and transmission with higher efficiency and higher sound quality can be performed.

【0044】[0044]

【実施例】以下、本発明の好ましい実施例について、図
面を参照にしながら説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Preferred embodiments of the present invention will be described below with reference to the drawings.

【0045】図1は本発明の情報符号化方法が適用され
る符号化装置の実施例のブロック回路図を示したもので
ある。この図1において、入力端子100を介して符号
化装置に入力されたオーディオ信号は、帯域分割回路1
01によって帯域分割される。この帯域分割回路101
における帯域分割手段としては、前述したQMF等のフ
ィルタによる分割手段を用いても、また、MDCT等の
スペクトル変換によって得られたスペクトルを帯域毎に
グループ化するという手段を用いてもよい。また、一
旦、フィルタによって幾つかの帯域に分割されたものに
対してスペクトル変換を行ない、これによって得られた
スペクトルを帯域毎にグループ化するという手段を用い
てもよい。さらに、この帯域分割による各帯域の幅は均
一であっても、例えば臨界帯域幅に合わせるように不均
一にとっても良い。なお、図1の例では四つの帯域に分
割されているが、もちろんこの数はさらに多くしても、
或いは少なくしてもよい。
FIG. 1 is a block circuit diagram showing an embodiment of an encoding apparatus to which the information encoding method of the present invention is applied. In FIG. 1, an audio signal input to an encoding device via an input terminal 100 is supplied to a band division circuit 1.
01 is divided into bands. This band division circuit 101
As the band dividing means in, a dividing means using a filter such as the above-described QMF may be used, or a means for grouping spectra obtained by spectrum conversion such as MDCT for each band may be used. Alternatively, a means may be used in which spectrum conversion is performed once on a band that has been divided into several bands by a filter, and the resulting spectrum is grouped for each band. Further, the width of each band by this band division may be uniform or may be non-uniform so as to match, for example, a critical bandwidth. In the example of FIG. 1, the frequency band is divided into four bands.
Alternatively, it may be reduced.

【0046】上記帯域分割回路101によって帯域分割
された信号は、ある時間ブロック毎に各帯域に対応する
正規化回路111,112,113,114によって正
規化が施され、ここでそれぞれ正規化係数と被正規化信
号に分解される。それぞれの被正規化信号は、それぞれ
量子化精度決定回路141の出力である量子化精度情報
に基づいて量子化回路121,122,123、124
によって量子化され、ここで被正規化・量子化信号へと
変換される。なお、図1においては、上記量子化精度決
定回路141からの各量子化回路121,122,12
3,124への量子化精度情報のうち、上記量子化回路
122へ送られる量子化精度情報は端子152を介し、
上記量子化回路123へ送られる量子化精度情報は端子
153を介し、上記量子化回路124へ送られる量子化
精度情報は端子154を介してそれぞれ対応する回路に
送られる。
The signals divided by the band dividing circuit 101 are normalized by normalizing circuits 111, 112, 113, and 114 corresponding to each band for each certain time block. Decomposed into a normalized signal. The respective normalized signals are respectively quantized circuits 121, 122, 123, and 124 based on the quantization precision information output from the quantization precision determination circuit 141.
, And converted into a normalized / quantized signal. In FIG. 1, each of the quantization circuits 121, 122, 12 from the quantization precision determination circuit 141 is referred to.
Among the quantization accuracy information to 3, 124, the quantization accuracy information sent to the quantization circuit 122 is transmitted via a terminal 152,
The quantization accuracy information sent to the quantization circuit 123 is sent via a terminal 153, and the quantization accuracy information sent to the quantization circuit 124 is sent to a corresponding circuit via a terminal 154.

【0047】上記量子化回路121,122,123,
124からの各被正規化・量子化信号と、上記正規化回
路111,112,113,114からの各正規化係数
と、上記量子化精度決定回路141からの各量子化精度
情報とは、マルチプレクサ131によって、順次符号列
とされ、この符号列が端子103から出力される。この
符号列は、その後、ディスク状やテープ状あるいは半導
体などの記録媒体に記録され、または伝送系から送信さ
れる。
The quantization circuits 121, 122, 123,
The respective normalized / quantized signals from 124, the respective normalization coefficients from the above-mentioned normalization circuits 111, 112, 113 and 114, and the respective pieces of quantization accuracy information from the above-mentioned quantization accuracy determination circuit 141 are multiplexed. The code string is sequentially formed by 131, and this code string is output from the terminal 103. This code string is then recorded on a recording medium such as a disk, a tape, or a semiconductor, or transmitted from a transmission system.

【0048】ここで、図1の例においては、上記量子化
精度決定回路141は上記帯域分割回路101によって
帯域分割された各信号に基づいて上記量子化精度を計算
しているが、帯域分割前の端子100を介した信号から
計算することも可能であり、また、各正規化回路11
1,112,113,114からの正規化係数に基づい
て計算することも可能である。さらに、当該量子化精度
決定回路141での計算は、マスキング効果等の聴覚現
象に基づいて行なうことができるものであり、上記各量
子化精度情報は上述したようにマルチプレクサ131を
介して出力されて後に復号化装置に送られるものであ
る。このため、符号化装置で使われる聴覚モデルは任意
に設定することができることになる
Here, in the example of FIG. 1, the quantization precision determination circuit 141 calculates the quantization precision based on each signal divided by the band division circuit 101. It is also possible to calculate from the signal via the terminal 100 of
It is also possible to calculate based on the normalization coefficients from 1,112,113,114. Further, the calculation in the quantization accuracy determination circuit 141 can be performed based on an auditory phenomenon such as a masking effect, and the quantization accuracy information is output via the multiplexer 131 as described above. It is sent to the decoding device later. Therefore, the auditory model used in the encoding device can be set arbitrarily.

【0049】一方、図2は本発明の情報復号化方法が適
用される図1の符号化装置に対応する復号化装置の実施
例のブロック回路図を示したものである。この図2にお
いて、本実施例の復号化装置の端子201に入力された
符号情報(前記符号列)は、デマルチプレクサ202に
送られ、ここで各帯域毎の量子化精度情報と、正規化係
数と、被正規化・量子化信号とに分離復元される。各帯
域毎の量子化精度情報、正規化係数、被正規化・量子化
信号は、それぞれ各帯域に対応する信号成分構成回路2
11,212,213,214に送られ、ここで各帯域
毎に信号成分が構成される。これら各信号成分構成回路
211,212,213,214からの信号成分は、帯
域合成回路221によって合成されてオーディオ信号と
なされて端子251から出力される。
FIG. 2 is a block circuit diagram showing an embodiment of a decoding apparatus corresponding to the encoding apparatus shown in FIG. 1 to which the information decoding method of the present invention is applied. In FIG. 2, the code information (the code sequence) input to the terminal 201 of the decoding apparatus according to the present embodiment is sent to the demultiplexer 202, where the quantization accuracy information for each band and the normalization coefficient And a normalized / quantized signal. The quantization accuracy information, the normalization coefficient, and the normalized / quantized signal for each band are used as signal component configuration circuits 2 corresponding to the respective bands.
11, 212, 213, 214, where signal components are configured for each band. The signal components from the respective signal component constituting circuits 211, 212, 213, 214 are combined by the band combining circuit 221 to form an audio signal, which is output from the terminal 251.

【0050】次に、図3は、本発明の実施例を適用した
場合のウィンドウ化処理時のゲイン制御動作について説
明するための図である。
Next, FIG. 3 is a diagram for explaining a gain control operation at the time of windowing processing when the embodiment of the present invention is applied.

【0051】ここで、前述した従来例において述べられ
ている方法では、アタック直前部を増幅させるゲイン制
御量は固定的である。例えば、特開昭63−7026号
公報においては、各ブロックをサブブロックに分割し、
二つのサブブロック間の振幅変動が所定の限界値(20
dB程度)を超える場合には、振幅が急変する以前の信
号の振幅を符号化手段で増幅し、それを復号化手段で補
正する方法が開示されている。
Here, in the method described in the conventional example described above, the gain control amount for amplifying the portion immediately before the attack is fixed. For example, in JP-A-63-7026, each block is divided into sub-blocks,
The amplitude fluctuation between the two sub-blocks is a predetermined limit value (20
When the amplitude exceeds (about dB), a method is disclosed in which the amplitude of the signal before the amplitude changes abruptly is amplified by the encoding means and corrected by the decoding means.

【0052】しかしながら、例えば、図3の(A)の信
号波形SW1、SW2は、どちらもアタック部を含むも
のの、その振幅の変化の仕方には大きな違いがある。す
なわち、信号波形SW1においては、アタック部の直前
にもあるレベル以上の波形信号があり、発生したプリエ
コーはこの元々の波形信号によってアタック部以後程で
はないもののある程度マスクされる。これに対して、信
号波形SW2においては、アタック部の直前の波形信号
のレベルは非常に低く、発生したプリエコーはほとんど
マスクされない。
However, for example, although the signal waveforms SW1 and SW2 in FIG. 3A both include an attack portion, there is a great difference in the manner in which the amplitude changes. That is, in the signal waveform SW1, there is a waveform signal of a certain level or more immediately before the attack portion, and the generated pre-echo is masked to some extent by the original waveform signal, though not as much as after the attack portion. On the other hand, in the signal waveform SW2, the level of the waveform signal immediately before the attack portion is very low, and the generated pre-echo is hardly masked.

【0053】ここで、このアタック部の検出を、レベル
変化のただ一つの限界値だけで識別し、同一のゲイン制
御・ゲイン制御補正を行おうとした場合、信号波形SW
1に対して最適なように限界値およびゲイン制御量を設
定すると、信号波形SW2に対してはプリエコーが聞こ
えてしまう。また、信号波形SW2に対して最適なよう
に限界値およびゲイン制御量を設定すると、信号波形S
W1に対しては必要以上のゲイン制御を行うことにな
り、周波数領域でエネルギーの拡散を招くため、符号化
効率が落ちてしまうことになる。
Here, if the detection of the attack portion is identified by only one limit value of the level change and the same gain control and gain control correction are to be performed, the signal waveform SW
If the limit value and the gain control amount are set to be optimal for 1, the pre-echo will be heard for the signal waveform SW2. When the limit value and the gain control amount are set so as to be optimal for the signal waveform SW2, the signal waveform S2
Unnecessary gain control is performed on W1 and energy is spread in the frequency domain, so that the coding efficiency is reduced.

【0054】そこで本発明の方法では、信号波形のアタ
ック部における振幅変化の度合いに応じてゲイン制御量
を変化させることによってこの問題を解決している。
The method of the present invention solves this problem by changing the gain control amount according to the degree of amplitude change in the attack portion of the signal waveform.

【0055】すなわち、本発明の方法では、図3の
(A)に示すように、信号波形SW1に対しては、図3
の(B)に示すゲイン制御量が比較的小さいゲイン制御
関数G1を適用してゲイン制御、ゲイン制御補正の処理
を行うのに対して、信号波形SW2に対しては、ゲイン
制御量が比較的大きいゲイン制御関数G2を適用してゲ
イン制御、ゲイン制御補正の処理を行う。
That is, in the method of the present invention, as shown in FIG.
(B) performs gain control and gain control correction by applying the gain control function G1 having a relatively small gain control amount, whereas the gain control amount is relatively small for the signal waveform SW2. The gain control and the gain control correction are performed by applying the large gain control function G2.

【0056】図3の(C)は、このように処理を行った
場合のそれぞれの量子化雑音の発生の仕方を示したもの
である。この図3の(C)に示されているように、信号
波形SW1の量子化雑音のアタック部以前の量子化雑音
は、ゲイン制御補正処理による雑音抑圧作用が比較的小
さいため、信号波形SW2の量子化雑音のアタック部以
前の量子化雑音に比較して大きいが、全体を通しての量
子化雑音のエネルギーは小さくなっている。これに対し
て、信号波形SW2に対する全体を通しての量子化雑音
のエネルギーは比較的大きいが、アタック部以前の量子
化雑音は十分に低く押さえられている。プリエコーは聴
感上の大きな障害となるため、このように全体の雑音エ
ネルギーを低下させることに優先させて抑圧させること
が望ましい。
FIG. 3C shows how the quantization noise is generated when the above processing is performed. As shown in FIG. 3C, the quantization noise before the attack portion of the quantization noise of the signal waveform SW1 has a relatively small noise suppression effect due to the gain control correction processing. Although the quantization noise is large compared to the quantization noise before the attack portion, the energy of the quantization noise is small throughout. On the other hand, the energy of the quantization noise throughout the signal waveform SW2 is relatively large, but the quantization noise before the attack portion is sufficiently low. Since the pre-echo is a great obstacle to hearing, it is desirable to suppress the noise by giving priority to the reduction of the overall noise energy.

【0057】次に、図4は、本発明の実施例を実際に信
号の符号化に適用する場合に、アタック部を検出してゲ
イン制御関数を生成させる処理の流れの例を示したもの
である。例えば、この処理を、前記図10の符号化装置
のアタック部検出回路402に相当する処理に組み込む
ことによって、本発明の符号化方法を実現することがで
きる。
Next, FIG. 4 shows an example of the flow of processing for detecting an attack portion and generating a gain control function when the embodiment of the present invention is actually applied to signal encoding. is there. For example, the encoding method of the present invention can be realized by incorporating this processing into the processing corresponding to the attack detection circuit 402 of the encoding apparatus in FIG.

【0058】この図4においては、例えば長さ2Mのブ
ロックをN個のサブブロックに分割し、I番サブブロッ
クにおける最大振幅値P[I] を、I番サブブロックまで
の連続するK個のサブブロックにおける最大振幅値Q
[I] と比較し、それが所定の比率以上になっている場合
にはアタック部が検出されたものとしている。また、最
終的に滑らかな過渡部をもつゲイン制御関数を構成し
て、スペクトルに変換した場合のエネルギーの拡散を防
いでいる。
In FIG. 4, for example, a block having a length of 2M is divided into N sub-blocks, and the maximum amplitude value P [I] in the I-th sub-block is divided into K consecutive blocks up to the I-th sub-block. Maximum amplitude value Q in sub-block
Compared to [I], if the ratio is equal to or more than a predetermined ratio, it is determined that an attack portion has been detected. Finally, a gain control function having a smooth transient portion is formed to prevent the spread of energy when converted into a spectrum.

【0059】すなわち、図4の最初のステップS1にお
いては、1ブロックをN分割したサブブロックの内のI
番サブブロックまでの連続するK個のサブブロック、す
なわちI−K+1番サブブロックからI番サブブロック
までの最大振幅値Q[I] を求め、ステップS2では、I
番サブブロックにおける最大振幅値P[I] を求めてい
る。次のステップS3では、I=0とし、ステップS4
において、上記ゲイン制御量としてのRを、I番までの
K個のサブブロックの最大振幅Q[I] の、その直後のサ
ブブロックの最大振幅P[I+1] に対する比率で求めてい
る。次のステップS5のTは所定の閾値であり、上記R
がTより大きい場合に、アタック部が検出されたものと
して、ステップS9に進んでいる。NOのときにはステ
ップS6に進み、Iをインクリメントして、ステップS
7でIがブロック終端のサブブロック番号Nに達したか
否かを判別し、I=NとなるまでステップS4以降を繰
り返している。ステップS7でYESと判別されたとき
には、ステップS8でL=0、すなわちアタック無しと
し、R=1として、ステップS10に進む。上記ステッ
プS5でYES、すなわちアタックが見つかったときに
は、ステップS9に進んで、L=I+1とし、Rには上
記ステップS4で求められたRの値の整数値を代入す
る。すなわち、このブロックにおけるアタック部以前の
長さはサブブロックL個分であると解釈され、この時の
Rの値がゲイン制御量を表す。ステップS9の処理を終
えて、ステップS10に進む。
That is, in the first step S1 in FIG. 4, I of the sub-blocks obtained by dividing one block into N
The maximum amplitude value Q [I] from the K consecutive sub-blocks up to the I-th sub-block, ie, the I-K + 1 sub-block to the I-th sub-block, is obtained.
The maximum amplitude value P [I] in the number-th sub-block is obtained. In the next step S3, I = 0, and in step S4
In the above, R as the above gain control amount is determined by the ratio of the maximum amplitude Q [I] of the K sub-blocks up to the I-th to the maximum amplitude P [I + 1] of the immediately following sub-block. T in the next step S5 is a predetermined threshold value,
Is larger than T, it is determined that an attack portion has been detected, and the process proceeds to step S9. If NO, the process proceeds to step S6, where I is incremented, and step S6 is performed.
At 7, it is determined whether or not I has reached the sub-block number N at the end of the block. Steps S4 and subsequent steps are repeated until I = N. When YES is determined in the step S7, L = 0 in step S8, that is, there is no attack, R = 1, and the process proceeds to the step S10. If YES in step S5, that is, if an attack is found, the process proceeds to step S9, where L = I + 1, and the integer of the value of R obtained in step S4 is substituted for R. That is, the length of the block before the attack portion is interpreted as L subblocks, and the value of R at this time represents the gain control amount. After finishing the processing in step S9, the process proceeds to step S10.

【0060】ステップS10では、アタック位置Lまで
のサブブロックのゲイン制御関数をRとし、残りを1に
すると共に、最終的に滑らかな過渡部を持つように補間
処理を行った後、処理を終了している。すなわち、この
ステップS10において、LとRの値に基づいてゲイン
制御関数g(n) が構成されるが、アタック部直前のサブ
ブロックでは関数値が滑らかに補間する。これは周波数
領域に変換した場合にエネルギー分布の拡散を防ぎ、効
率の良い符号化を可能にするためである。
In step S10, the gain control function of the sub-block up to the attack position L is set to R, the remainder is set to 1 and an interpolation process is performed so as to finally have a smooth transition portion. are doing. That is, in this step S10, the gain control function g (n) is constructed based on the values of L and R. In the sub-block immediately before the attack portion, the function value is smoothly interpolated. This is to prevent the energy distribution from being spread when converted to the frequency domain, thereby enabling efficient coding.

【0061】このように、アタック部のゲイン制御量を
信号のレベルに応じて変化させることにより、圧縮率の
高い場合にも効果的にプリエコーを防止することができ
るという利点がある。
As described above, by changing the gain control amount of the attack section according to the signal level, there is an advantage that the pre-echo can be effectively prevented even when the compression ratio is high.

【0062】なお、この例では、ゲイン制御はアタック
部の直前でのみ増幅されるようになされているが、これ
は既に説明したように、特に順向マスキングの効果を利
用したものである。ただしもちろん、減衰時に小振幅部
分で増幅がされるようにゲイン制御をすることも可能で
あり、例えばスペクトル変換のブロック長が極端に長
く、順向マスキング効果が十分期待できないような場合
には、減衰時に小振幅部分で増幅するようにしても良
い。また、検出するアタック部の数は、一つのブロック
に対して必ずしも一つである必要は無い。
In this example, the gain control is amplified only immediately before the attack portion. However, as described above, this utilizes the effect of forward masking in particular. However, of course, it is also possible to perform gain control so that amplification is performed in the small amplitude part during attenuation.For example, when the block length of the spectrum conversion is extremely long and the forward masking effect cannot be sufficiently expected, The signal may be amplified in a small amplitude portion at the time of attenuation. Also, the number of attack units to be detected does not necessarily need to be one for one block.

【0063】ゲイン制御関数としてステップ状に急激に
変化するものを使用すると、スペクトルに変換した場合
に、そのエネルギーが拡散してしまい、符号化の効率が
落ちる。そのため制御関数は、アタック部においてもあ
る程度滑らかに変化するような形状を持つことが望まし
い。ただし、その区間は十分に短くなければプリエコー
が聞こえてしまうので、人間の聴覚を考慮して、ゲイン
制御関数は1msec程度の過渡区間を持ち、その区間内で
例えばサイン波形状のように滑らかな変化をさせること
が望ましい。次ブロックの先頭にアタックが生じる場合
に備えて、アタック部の検出範囲を次ブロックの先頭の
サブブロックまで広げておくことによって、ゲイン制御
関数に滑らかな過渡部を持たせることも可能である。
If a gain control function that changes abruptly in a step-like manner is used, when converted into a spectrum, the energy is spread and the coding efficiency is reduced. Therefore, it is desirable that the control function has a shape that smoothly changes to some extent even in the attack portion. However, since the pre-echo will be heard if the section is not sufficiently short, the gain control function has a transient section of about 1 msec in consideration of human hearing, and a smooth section such as a sine wave shape within the section. It is desirable to make a change. In the case where an attack occurs at the head of the next block, by expanding the detection range of the attack part to the sub-block at the head of the next block, the gain control function can have a smooth transition part.

【0064】このように、本発明の方法あるいは装置
は、音響波形をディジタル信号に変換したものを処理す
る装置に適用することも可能であるし、また、一旦ファ
イルになっている波形信号をコンピュータ等で処理する
場合に適用することもできる。また、このようにして得
られた符号を記録媒体に記録することも伝送することも
もちろん可能である。また本発明は、つねに一定のビッ
トレートで符号化を行う場合にも、割り当てられるビッ
ト数がブロック毎に異なるように時間的に変化するビッ
トレートで符号化を行う場合にも適用することが可能で
ある。
As described above, the method or the apparatus of the present invention can be applied to an apparatus for processing a signal obtained by converting an acoustic waveform into a digital signal. For example, the present invention can be applied to the case where the processing is performed by the above method. Further, it is of course possible to record and transmit the code thus obtained on a recording medium. Further, the present invention can be applied to a case where encoding is always performed at a constant bit rate and a case where encoding is performed at a bit rate that changes with time so that the number of allocated bits differs for each block. It is.

【0065】以上の説明においては、符号化装置におい
てディジタル化された波形信号を直接スペクトル変換を
使ってスペクトル信号に変換する場合について述べた
が、もちろん、一旦帯域分割フィルタを使用して分割さ
れた帯域毎にスペクトル変換を使ってスペクトル信号に
変換する場合についても本発明の方法を適用することが
できる。
In the above description, a case has been described where the waveform signal digitized by the encoding device is directly converted into a spectrum signal by using spectrum conversion. The method of the present invention can also be applied to a case in which a spectrum signal is converted using a spectrum conversion for each band.

【0066】次に、図5は、本発明の方法で符号化され
た情報を記録媒体に記録するときの記録フォーマットあ
るいは伝送するときの伝送フォーマットの例について示
したものである。
FIG. 5 shows an example of a recording format when recording information encoded by the method of the present invention on a recording medium or a transmission format when transmitting the information.

【0067】この図5に示す例において、各ブロックの
符号は、各ブロックの符号は、アタック部検出フラグと
スペクトル信号符号、及びアタック部検出フラグの内容
によっては、それらに加えて、アタック部位置情報とゲ
イン制御情報から成るゲイン制御補正関数生成情報とに
より構成されている。アタック位置情報としては、例え
ば、図4のLの値を記録すればよく、ゲイン制御量情報
としては、例えば図4のRの値を記録すればよい。実際
の音楽信号においてプリエコーが問題となるアタック部
の存在するブロックの割合は低いので、このようにアタ
ック位置情報とゲイン制御量情報は実際にアタック部の
存在するブロックだけに記録しておくと効率が良い。た
だし勿論、全てのブロックにおいてゲイン制御補正関数
生成情報を記録するようにしてもよく、この場合、実際
にアタック部の存在しないブロックにおいては、例え
ば、L=0、R=1として記録しておけばよい。
In the example shown in FIG. 5, the code of each block is the same as the code of each block, depending on the contents of the attack part detection flag and the spectrum signal code, and the contents of the attack part detection flag. It is composed of information and gain control correction function generation information composed of gain control information. For example, the value of L in FIG. 4 may be recorded as the attack position information, and the value of R in FIG. 4 may be recorded as the gain control amount information. Since the proportion of blocks in which the attack portion where pre-echo is a problem exists in the actual music signal is low, it is efficient to record the attack position information and gain control amount information only in the block where the attack portion actually exists. Is good. However, it is needless to say that the gain control correction function generation information may be recorded in all blocks. In this case, in a block in which no attack portion actually exists, for example, L = 0 and R = 1 may be recorded. I just need.

【0068】次に、図6は、上記図5に示される記録情
報から復号化手段がゲイン制御補正関数h(n) を生成す
る処理例を示したものである。
Next, FIG. 6 shows an example of processing in which the decoding means generates a gain control correction function h (n) from the recording information shown in FIG.

【0069】例えば、この図6に示す処理を、前記図1
1の復号化装置のゲイン制御補正回路414に相当する
処理に組み込み、生成されたゲイン制御補正関数h(n)
を逆スペクトル変換回路413によって構成された波形
信号要素に乗じることによって、本発明による復号化方
法を実現することができる。もちろん、アタック部が検
出されていないブロックにおいては、実際にh(n) を乗
じる処理を省略するようにしても良い。
For example, the processing shown in FIG.
The gain control correction function h (n) is generated by incorporating it into a process corresponding to the gain control correction circuit 414 of the first decoding device.
Is multiplied by the waveform signal element formed by the inverse spectrum conversion circuit 413, whereby the decoding method according to the present invention can be realized. Of course, the process of actually multiplying h (n) may be omitted in a block in which no attack portion is detected.

【0070】この図6の例においては、ステップS21
で上記アタック検出フラグを検出し、フラグが0のと
き、すなわちアタックが検出されていないときには、ス
テップS22に進んで、ゲイン制御補正関数h(n) を1
にし、終了する。フラグが1のとき、すなわちアタック
が検出されているときには、ステップS23に進み、こ
のブロックの先頭からサブブロックL個分のゲイン制御
関数g(n) をRとし、上記補間処理を行って最終的なゲ
イン制御関数g(n) を求める。次のステップS24で
は、このゲイン制御関数g(n) の逆数1/g(n) を計算
してゲイン制御補正関数h(n) を求めている。
In the example of FIG. 6, step S21
To detect the attack detection flag, and when the flag is 0, that is, when no attack is detected, the process proceeds to step S22, where the gain control correction function h (n) is set to 1
And exit. If the flag is 1, that is, if an attack has been detected, the process proceeds to step S23, where the gain control function g (n) for L subblocks from the beginning of this block is set to R, and the above interpolation process is performed. The gain control function g (n) is obtained. In the next step S24, the reciprocal 1 / g (n) of the gain control function g (n) is calculated to obtain the gain control correction function h (n).

【0071】なお、本発明の方法は、例えば前述した特
開平3−132228号公報に記載されている方法等に
適用することも勿論可能である。
The method of the present invention can of course be applied to, for example, the method described in JP-A-3-132228 described above.

【0072】また、波形信号を直接スペクトル変換によ
って周波数成分に分解する場合だけでなく、例えば、一
旦、帯域分割フィルタによって帯域分割された波形信号
をスペクトル変換によって周波数成分分解する場合に
も、もちろん本発明の方法を適用することができる。さ
らに、フィルタによって波形信号を周波数成分に分解す
る場合にも適用することができる。本発明でいう周波数
成分とはこれらの処理によって得られるものをすべて含
むものであるが、プリエコーが特に大きな問題となるス
ペクトル変換を含む処理で得られる周波数成分に関連し
て適用される場合に、本発明の方法は特にその効果が大
きい。
In addition to the case where a waveform signal is directly decomposed into frequency components by spectrum conversion, for example, the case where a waveform signal once band-divided by a band division filter is frequency-component decomposed by spectrum conversion, the present invention is of course also applicable. The method of the invention can be applied. Further, the present invention can be applied to a case where a waveform signal is decomposed into frequency components by a filter. The frequency components referred to in the present invention include all those obtained by these processes. However, when the pre-echo is applied in relation to the frequency components obtained by the processes including the spectrum conversion, which is a particularly serious problem, the present invention The method is particularly effective.

【0073】さらに、本発明の方法は、音響波形をディ
ジタル信号に変換したものを処理する装置に適用するこ
とも可能であるし、また、一旦ファイルになっている波
形信号をコンピュータ等で処理する場合に適用すること
もできる。また、このようにして得られた符号を記録媒
体に記録することも伝送することももちろん可能であ
る。また本発明の方法は、つねに一定のビットレートで
符号化を行う場合にも、割り当てられるビット数がブロ
ック毎に異なるように時間的に変化するビットレートで
符号化を行う場合にも適用することが可能である。
Further, the method of the present invention can be applied to an apparatus for processing a signal obtained by converting an acoustic waveform into a digital signal, and a waveform signal once stored in a file is processed by a computer or the like. It can also be applied to cases. Further, it is of course possible to record and transmit the code thus obtained on a recording medium. Further, the method of the present invention is applicable to a case where encoding is always performed at a constant bit rate and a case where encoding is performed at a bit rate that changes over time so that the number of allocated bits differs for each block. Is possible.

【0074】以上、音響波形信号を量子化した場合の量
子化雑音を目立たなくさせる場合に関して説明を行なっ
たが、本発明の方法は他の種類の信号の量子化雑音の発
生を目立たせなくする上でも有効であり、例えば画像信
号にも適用することが可能である。しかし、音響信号に
おけるアタック部分でのプリエコーは聴感上の大きな障
害となるため、本発明を音響信号に適用することは非常
に有効である。また、本発明の方法はもちろん多チャネ
ルの音響信号に対して適用可能である。
As described above, the case where the quantization noise when the acoustic waveform signal is quantized is made inconspicuous has been described. However, the method of the present invention makes the generation of quantization noise of other types of signals inconspicuous. The above is also effective, and can be applied to, for example, an image signal. However, since the pre-echo in the attack part of the sound signal causes a great obstacle to hearing, it is very effective to apply the present invention to the sound signal. Also, the method of the present invention is of course applicable to multi-channel audio signals.

【0075】[0075]

【発明の効果】以上の説明からも明らかなように、本発
明に係る情報符号化方法は、周波数成分分解処理への入
力波形信号のゲイン制御処理の際に、波形信号が急激に
大きくなる部分でのゲイン制御処理のゲイン制御量は複
数種類の大きさから選択的に決定するようにしたことに
より、アタック部の振幅変化の度合に応じたゲイン制御
が可能となり、より効率的でより音質の高い符号化が可
能となる。
As is clear from the above description, the information encoding method according to the present invention is not limited to the part where the waveform signal sharply increases in the gain control processing of the input waveform signal to the frequency component decomposition processing. The gain control amount of the gain control process is selectively determined from a plurality of types of magnitudes, so that gain control can be performed in accordance with the degree of amplitude change in the attack portion, and more efficient and more sound quality can be obtained. Higher encoding is possible.

【0076】また、本発明に係る情報復号化方法は、波
形信号合成処理の出力波形信号のゲイン制御補正処理を
行う際に、波形信号が急激に大きくなる部分でのゲイン
制御補正処理のゲイン制御補正量は上記ゲイン制御補正
情報の内容に基づいて決定される複数の大きさの中から
選択されたものを用いることにより、効率的な処理が行
え、品質の高い信号を再生することができる。
In the information decoding method according to the present invention, when performing the gain control correction processing of the output waveform signal in the waveform signal synthesis processing, the gain control of the gain control correction processing in a portion where the waveform signal suddenly increases is performed. By using a correction amount selected from a plurality of sizes determined based on the content of the gain control correction information, efficient processing can be performed and a high-quality signal can be reproduced.

【0077】これらの効果は、情報符号化装置、情報復
号化装置においても同様にいえることである。
These effects can be similarly applied to the information encoding device and the information decoding device.

【0078】これを音響信号あるいはオーディオ信号に
適用することにより、効率的な処理と共に、プリエコー
の発生を防止することができる。
By applying this to an audio signal or an audio signal, it is possible to prevent the occurrence of a pre-echo together with efficient processing.

【0079】さらに、このような符号化方法あるいは装
置で符号化された信号を記録媒体に記録しあるいは伝送
することで、効率のよい記録あるいは伝送が可能であ
る。
Further, by recording or transmitting a signal encoded by such an encoding method or apparatus on a recording medium, efficient recording or transmission is possible.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例が適用される符号化装置の概略
構成を示すブロック回路図である。
FIG. 1 is a block circuit diagram illustrating a schematic configuration of an encoding device to which an embodiment of the present invention is applied.

【図2】本発明の実施例が適用される復号化装置の概略
構成を示すブロック回路図である。
FIG. 2 is a block circuit diagram showing a schematic configuration of a decoding device to which an embodiment of the present invention is applied.

【図3】本発明の実施例におけるウィンドウ化処理時の
ゲイン制御の動作を説明するための図である。
FIG. 3 is a diagram for explaining an operation of gain control during windowing processing according to the embodiment of the present invention.

【図4】本発明の実施例の符号化方法におけるゲイン制
御関数生成の処理手順の一例を概略的に示すフローチャ
ートである。
FIG. 4 is a flowchart schematically illustrating an example of a processing procedure for generating a gain control function in the encoding method according to the embodiment of the present invention.

【図5】本発明の実施例の符号化により得られた符号列
の記録状態を示す図である。
FIG. 5 is a diagram showing a recording state of a code string obtained by encoding according to the embodiment of the present invention.

【図6】本発明の実施例の復号化方法の処理手順の一部
の例を概略的に示すフローチャートである。
FIG. 6 is a flowchart schematically illustrating an example of a part of a processing procedure of a decoding method according to an embodiment of the present invention.

【図7】変換符号化におけるプリエコー発生の動作原理
を説明するための図である。
FIG. 7 is a diagram for explaining the operation principle of pre-echo generation in transform coding.

【図8】従来の変換窓長可変による符号化復号化技術の
動作原理を説明するための図である。
FIG. 8 is a diagram for explaining the operation principle of a conventional encoding / decoding technique using a variable conversion window length.

【図9】従来のウィンドウ化処理技術を用いた符号化復
号化の動作原理を説明するための図である。
FIG. 9 is a diagram for explaining the operation principle of encoding and decoding using the conventional windowing processing technique.

【図10】従来のウィンドウ化処理技術による符号化装
置の概略構成を示すブロック図である。
FIG. 10 is a block diagram illustrating a schematic configuration of an encoding device based on a conventional windowing processing technique.

【図11】従来のウィンドウ化処理技術による復号化装
置の概略構成を示すブロック図である。
FIG. 11 is a block diagram showing a schematic configuration of a decoding device based on a conventional windowing processing technique.

【符号の説明】[Explanation of symbols]

101 帯域分割手段 111〜114 正規化回路 121〜124 量子化回路 131 マルチプレクサ 141 量子化精度決定回路 202 デマルチプレクサ 211〜214 信号成分構成回路 221 帯域合成回路 Reference Signs List 101 band dividing means 111 to 114 normalizing circuit 121 to 124 quantizing circuit 131 multiplexer 141 quantization precision determining circuit 202 demultiplexer 211 to 214 signal component configuration circuit 221 band synthesizing circuit

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−263925(JP,A) 特開 平5−304479(JP,A) 特開 平4−304029(JP,A) 特開 平5−91061(JP,A) 特表 平6−507296(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G10L 19/02 G11B 20/10 301 ────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-3-263925 (JP, A) JP-A-5-304479 (JP, A) JP-A-4-304029 (JP, A) JP-A-5-304 91061 (JP, A) Special table Hei 6-507296 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) H03M 7/30 G10L 19/02 G11B 20/10 301

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力波形信号を複数の帯域に分割する帯
域分割処理と、 上記帯域分割された波形信号のゲインを制御するゲイン
制御処理と、 上記ゲイン制御処理された入力波形信号を所定単位時間
毎にブロック化して周波数成分に分解する周波数成分分
解処理と、 上記周波数成分分解処理の出力情報および上記ゲイン制
御の制御情報の符号化処理とを行う情報符号化方法であ
って、 上記ゲイン制御処理は、上記帯域分割処理された帯域毎
に行い、 上記ゲイン制御の制御情報は、ゲイン制御を行うかどう
かを表すフラグ情報を含み、実際のゲイン制御を行わな
いブロックの上記制御情報は上記フラグのみから構成さ
れる ことを特徴とする情報符号化方法。
1. A and band division processing for dividing the input waveform signal into a plurality of bands, the band and the gain control process for controlling the gain of the divided waveform signal, the gain control process is predetermined unit time input waveform signal
An information encoding method for performing frequency component decomposition processing of dividing the frequency component into frequency components and encoding processing of output information of the frequency component decomposition processing and control information of the gain control, wherein the gain control processing is performed. What is have lines for each band which is the band dividing process, the control information of the gain control, performing gain control
Do not perform actual gain control.
The control information of the new block consists of only the flag.
An information encoding method characterized by being performed.
【請求項2】 入力波形信号を複数の帯域に分割する帯
域分割処理手段と、 上記帯域分割された波形信号のゲイン制御処理を行うゲ
イン制御処理手段と、 上記ゲイン制御処理手段からの出力信号を所定単位時間
毎にブロック化して周波数成分に分解する周波数成分分
解処理手段と、 上記周波数成分分解処理手段からの出力情報および上記
ゲイン制御の制御情報の符号化処理を行う符号化手段と
を有する情報符号化装置であって、 上記ゲイン制御処理は、上記帯域分割処理された帯域毎
に行い、 上記ゲイン制御の制御情報は、ゲイン制御を行うかどう
かを表すフラグ情報を含み、実際のゲイン制御を行わな
いブロックの上記制御情報は上記フラグのみから構成さ
れる ことを特徴とする情報符号化装置。
2. A band division processing means for dividing an input waveform signal into a plurality of bands; a gain control processing means for performing gain control processing of the band-divided waveform signal; and an output signal from the gain control processing means. Predetermined unit time
Information encoding apparatus comprising: a frequency component resolution processing means for decomposing the frequency components into blocks, and encoding means for performing encoding of the control information of the output information and the gain control from the frequency component resolution processing means for each a is, if the gain control process, have rows for each band which is the band dividing process, the control information of the gain control, performing gain control
Do not perform actual gain control.
The control information of the new block consists of only the flag.
Information encoding apparatus which is characterized in that.
【請求項3】 周波数成分信号およびゲイン制御補正情
報の復号化処理と、 上記周波数成分信号から所定単位時間毎にブロック化さ
れた複数の帯域の波形信号を生成する波形信号生成処理
と、 上記波形信号生成処理の出力波形信号のゲイン制御補正
処理と、 上記ゲイン制御補正処理された複数の帯域の波形信号を
合成する帯域合成処理とを行う情報復号化方法であっ
て、 上記ゲイン制御補正処理は、上記波形信号生成処理にお
ける帯域毎に行われ、 上記ゲイン制御補正情報は、ゲイン制御を行うかどうか
を表すフラグ情報を含み、実際のゲイン制御を行わない
ブロックの上記ゲイン制御補正情報は上記フラグのみか
ら構成される ことを特徴とする情報復号化方法。
3. A decoding frequency component signal and a gain control correction information processing blocks for each predetermined unit time from the frequency component signal
Waveform signal generation processing for generating the obtained waveform signals of a plurality of bands, gain control correction processing of the output waveform signal of the waveform signal generation processing, and a band for synthesizing the waveform signals of the plurality of bands subjected to the gain control correction processing An information decoding method for performing synthesis processing, wherein the gain control correction processing is performed for each band in the waveform signal generation processing , and the gain control correction information indicates whether to perform gain control.
Includes flag information indicating the actual gain control is not performed
Is the gain control correction information of the block only the flag?
Information decoding wherein the al constructed.
【請求項4】 周波数成分信号およびゲイン制御補正情
報を復号化処理する復号化手段と、 上記周波数成分信号から所定単位時間毎にブロック化さ
れた複数の帯域の波形信号を生成する波形信号生成処理
手段と、 上記波形信号生成処理手段からの出力波形信号のゲイン
制御補正処理を行うゲイン制御補正処理手段と、 上記ゲイン制御補正処理された複数の帯域の波形信号を
合成する帯域合成処理と有する情報復号化装置であっ
て、 上記ゲイン制御補正処理は、上記波形信号生成処理にお
ける帯域毎に行われ、 上記ゲイン制御補正情報は、ゲイン制御を行うかどうか
を表すフラグ情報を含み、実際のゲイン制御を行わない
ブロックの上記ゲイン制御補正情報は上記フラグのみか
ら構成される ことを特徴とする情報復号化装置。
4. A decoding means for decoding processing frequency component signal and a gain control correction information, blocks every predetermined unit time from the frequency component signal
Waveform signal generation processing means for generating waveform signals of a plurality of bands obtained, gain control correction processing means for performing gain control correction processing of an output waveform signal from the waveform signal generation processing means, An information decoding apparatus having a band synthesis process for synthesizing waveform signals of a plurality of bands, wherein the gain control correction process is performed for each band in the waveform signal generation process , and the gain control correction information is a gain control signal. Whether to do
Includes flag information indicating the actual gain control is not performed
Is the gain control correction information of the block only the flag?
Information decoding apparatus characterized by et constituted.
【請求項5】 時間軸上の信号を所定単位時間毎にブロ
ック化して行う周波数成分分解処理によって得られた
波数成分信号情報およびゲイン制御補正情報が記録さ
れ、 上記ゲイン制御補正情報はゲイン制御を行うかどうかを
表すフラグ情報を含み、実際のゲイン制御を行わないブ
ロックの上記ゲイン制御補正情報は上記フラグのみから
構成されるとともに、上記周波数成分信号の帯域毎に選
択されたものであることを特徴とする情報記録媒体。
5. A signal on a time axis is blocked every predetermined unit time.
The frequency component signal information and the gain control correction information obtained by the frequency component decomposition processing performed by the conversion are recorded, and the gain control correction information indicates whether or not to perform the gain control.
Flag information that does not perform actual gain control.
The lock gain control correction information from the lock only
With the configuration, the information recording medium which is characterized in that which has been selected for each band of the frequency component signal.
JP03282894A 1994-02-04 1994-02-04 Information encoding method and apparatus, information decoding method and apparatus, and information recording medium Expired - Lifetime JP3341440B2 (en)

Priority Applications (8)

Application Number Priority Date Filing Date Title
US08/532,721 US5731767A (en) 1994-02-04 1994-02-03 Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
JP03282894A JP3341440B2 (en) 1994-02-04 1994-02-04 Information encoding method and apparatus, information decoding method and apparatus, and information recording medium
EP95907835A EP0693828B1 (en) 1994-02-04 1995-02-03 Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method
PCT/JP1995/000146 WO1995021489A1 (en) 1994-02-04 1995-02-03 Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method
AU15897/95A AU1589795A (en) 1994-02-04 1995-02-03 Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method
CN02120438.1A CN1281006C (en) 1994-02-04 1995-02-03 Information coding/decoding method and apparatus, information recording medium and information transmission method
CN95190216.4A CN1130833C (en) 1994-02-04 1995-02-03 Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method
AU23853/99A AU719817B2 (en) 1994-02-04 1999-04-19 Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03282894A JP3341440B2 (en) 1994-02-04 1994-02-04 Information encoding method and apparatus, information decoding method and apparatus, and information recording medium

Publications (2)

Publication Number Publication Date
JPH07221649A JPH07221649A (en) 1995-08-18
JP3341440B2 true JP3341440B2 (en) 2002-11-05

Family

ID=12369696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03282894A Expired - Lifetime JP3341440B2 (en) 1994-02-04 1994-02-04 Information encoding method and apparatus, information decoding method and apparatus, and information recording medium

Country Status (1)

Country Link
JP (1) JP3341440B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4265401B2 (en) 2001-06-15 2009-05-20 ソニー株式会社 Encoding apparatus and encoding method
JP4296752B2 (en) 2002-05-07 2009-07-15 ソニー株式会社 Encoding method and apparatus, decoding method and apparatus, and program
FR2897733A1 (en) * 2006-02-20 2007-08-24 France Telecom Echo discriminating and attenuating method for hierarchical coder-decoder, involves attenuating echoes based on initial processing in discriminated low energy zone, and inhibiting attenuation of echoes in false alarm zone

Also Published As

Publication number Publication date
JPH07221649A (en) 1995-08-18

Similar Documents

Publication Publication Date Title
JP3186412B2 (en) Information encoding method, information decoding method, and information transmission method
JP3307138B2 (en) Signal encoding method and apparatus, and signal decoding method and apparatus
US5825320A (en) Gain control method for audio encoding device
WO1995021489A1 (en) Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method
JP3277692B2 (en) Information encoding method, information decoding method, and information recording medium
US5960390A (en) Coding method for using multi channel audio signals
JP4864201B2 (en) System and method for masking quantization noise in speech signals
JPH08223049A (en) Signal coding method and device, signal decoding method and device, information recording medium and information transmission method
JP3277682B2 (en) Information encoding method and apparatus, information decoding method and apparatus, and information recording medium and information transmission method
US20040196770A1 (en) Coding method, coding device, decoding method, and decoding device
JPH1084284A (en) Signal reproducing method and device
JP2003233395A (en) Method and device for encoding audio signal and encoding and decoding system
JP3557674B2 (en) High efficiency coding method and apparatus
KR970002686B1 (en) Method for transmitting an audio signal with an improved signal to noise ratio
JP3341440B2 (en) Information encoding method and apparatus, information decoding method and apparatus, and information recording medium
JPH06242797A (en) Block size determining method of converting and encoding device
JP3263881B2 (en) Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method
JP3513178B2 (en) Information encoding or decoding method and apparatus
JP3336619B2 (en) Signal processing device
US6765930B1 (en) Decoding apparatus and method, and providing medium
JP3230365B2 (en) Information encoding method and apparatus, and information decoding method and apparatus
JPH11330974A (en) Encoding method and device, decoding method and device, digital signal recording method and device, recording medium and digital transmitting method and device
JP3513879B2 (en) Information encoding method and information decoding method
JPH09160593A (en) Method and device for coding signal
JPH09261063A (en) Signal coding method and device

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020319

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020723

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080823

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090823

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100823

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110823

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120823

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130823

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term