JPH05114863A - High-efficiency encoding device and decoding device - Google Patents

High-efficiency encoding device and decoding device

Info

Publication number
JPH05114863A
JPH05114863A JP3271774A JP27177491A JPH05114863A JP H05114863 A JPH05114863 A JP H05114863A JP 3271774 A JP3271774 A JP 3271774A JP 27177491 A JP27177491 A JP 27177491A JP H05114863 A JPH05114863 A JP H05114863A
Authority
JP
Japan
Prior art keywords
band
spectrum
signal
frequency
energy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3271774A
Other languages
Japanese (ja)
Inventor
Kenzo Akagiri
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP3271774A priority Critical patent/JPH05114863A/en
Priority to KR1019920013475A priority patent/KR100340368B1/en
Priority to AT92113130T priority patent/ATE210347T1/en
Priority to EP92113130A priority patent/EP0525809B1/en
Priority to EP97108482A priority patent/EP0805564A3/en
Priority to DE69232251T priority patent/DE69232251T2/en
Priority to CA002075156A priority patent/CA2075156A1/en
Priority to ES92113130T priority patent/ES2164640T3/en
Priority to AU20716/92A priority patent/AU665200B2/en
Publication of JPH05114863A publication Critical patent/JPH05114863A/en
Priority to US08/272,872 priority patent/US5664056A/en
Priority to US08/465,340 priority patent/US5621856A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PURPOSE:To obtain excellent characteristics even for an isolated spectrum by varying a noise shaping factor according to a signal relating to the level of an input signal or the smoothness of the spectrum of the input signal. CONSTITUTION:An MDCT(Modified Discrete Cosine Transform) coefficient is supplied to an input terminal 301 and a band-by-band energy calculating circuit 302 calculates signal energy regarding respective bands obtained by fractionalizing a critical band in the critical band or a high range. A reducing circuit 303 for high-range signal level reduces the high-range signal level more and more as the energy of a band of >=4KHz is smaller and smaller. A spectrum smoothness calculating circuit 305 makes the noise shaping factor small judging that the spectrum is smooth as the ratio of the entire-band addition value of the square of the difference value of energy between adjacent blocks to the entire-band addition value of energy is smaller and an energy dependency bit distributing circuit 304 distributes bits.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、いわゆる高能率符号化
によって入力ディジタルデータの符号化を行ない、伝
送、あるいは記録再生し、復号化して再生信号を得るよ
うな、ディジタルデータの高能率符号化装置及び復号化
装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to high-efficiency coding of digital data such that input digital data is coded by so-called high-efficiency coding, transmitted or recorded / reproduced, and decoded to obtain a reproduced signal. The present invention relates to a device and a decoding device.

【0002】[0002]

【従来の技術】オーディオあるいは音声等の信号の高能
率符号化の手法には種々あるが、例えば、時間軸上のオ
ーディオ信号等をブロック化しないで、複数の周波数帯
域にフィルタで分割して符号化する非ブロック化周波数
帯域分割方式として、帯域分割符号化(サブ・バンド・
コーディング:SBC)等を挙げることができ、また、
時間軸の信号を周波数軸上の信号に変換(直交変換)し
て複数の周波数帯域に分割し、各帯域毎に符号化するよ
うなブロック化周波数帯域分割方式、いわゆる変換符号
化等を挙げることができる。
2. Description of the Related Art There are various techniques for high-efficiency coding of audio or voice signals. For example, an audio signal on the time axis is not divided into blocks but is divided into a plurality of frequency bands by a filter and coded. As a non-blocking frequency band division method, the band division coding (sub band
Coding: SBC), etc.
A block frequency band division method that transforms a signal on the time axis into a signal on the frequency axis (orthogonal transform), divides it into multiple frequency bands, and encodes each band, so-called transform coding, etc. You can

【0003】また、上述の帯域分割符号化と変換符号化
とを組み合わせた高能率符号化の手法も考えられてお
り、この場合には、例えば、上記帯域分割符号化で帯域
分割を行った後、該各帯域毎の信号を周波数軸上の信号
に直交変換し、この直交変換された各帯域毎に符号化が
施される。
A high-efficiency coding method combining the above-mentioned band-division coding and transform coding has also been considered. In this case, for example, after performing band-division by the above-mentioned band-division coding. , The signal in each band is orthogonally transformed into a signal on the frequency axis, and each orthogonally transformed band is encoded.

【0004】ここで、上述した帯域分割のためのフィル
タとしては、例えばQMFフィルタがあり、1976 R.E.
Crochiere, Digital coding of speech in subbands, B
ellSyst.Tech. J. Vol.55, No.8 1976 に述べられてい
る。また ICASSP 83, BOSTONPolyphase Quadrature fil
ters-A new subband coding technique, Joseph H.Roth
weilerには等バンド幅のフィルタ分割手法が述べられて
いる。次に上述した直交変換としては、例えば、入力オ
ーディオ信号を所定単位時間(フレーム)でブロック化
し、当該ブロック毎に高速フーリエ変換(FFT)、離
散的コサイン変換(DCT)、モディファイドDCT変
換(MDCT)等を行うことで時間軸を周波数軸に変換
するようなものがある。MDCTについては ICASSP
1987Subband/Transform Coding Using Filter Bank Des
igns Based on Time DomainAliasing Cancellation,
J.P.Princen, A.B.Bradley, Univ. of Surrey RoyalMel
bourne Inst. of Tech.に述べられている。
Here, as a filter for the above band division, for example, there is a QMF filter, which is 1976 RE.
Crochiere, Digital coding of speech in subbands, B
ellSyst.Tech. J. Vol.55, No.8 1976. Also ICASSP 83, BOSTON Polyphase Quadrature fil
ters-A new subband coding technique, Joseph H. Roth
Weiler describes an equal bandwidth filter partitioning technique. Next, as the above-mentioned orthogonal transform, for example, an input audio signal is divided into blocks in a predetermined unit time (frame), and fast Fourier transform (FFT), discrete cosine transform (DCT), modified DCT transform (MDCT) For example, the time axis is converted to the frequency axis by performing the above. ICASSP for MDCT
1987Subband / Transform Coding Using Filter Bank Des
igns Based on Time DomainAliasing Cancellation,
JPPrincen, ABBradley, Univ. Of Surrey RoyalMel
Bourne Inst. of Tech.

【0005】さらに、周波数帯域分割された各周波数成
分を量子化する周波数分割幅としては、例えば人間の聴
覚特性を考慮した帯域分割が行われる。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
程帯域幅が広くなるような帯域幅で、オーディオ信号を
複数(例えば25バンド)の帯域に分割することがあ
る。また、この時の各帯域毎のデータを符号化する際に
は、各帯域毎に所定のビット配分或いは、各帯域毎に適
応的なビット割当て(ビットアロケーシヨン)による符
号化が行われる。例えば、上記MDCT処理されて得ら
れた係数データを上記ビットアロケーシヨンによって符
号化する際には、上記各ブロック毎のMDCT処理によ
り得られる各帯域毎のMDCT係数データに対して、適
応的な割当てビット数で符号化が行われることになる。
Further, as a frequency division width for quantizing each frequency component divided into frequency bands, for example, band division is performed in consideration of human auditory characteristics. That is, the audio signal may be divided into a plurality of bands (for example, 25 bands) with a bandwidth that is generally called a critical band and becomes wider in a higher band. Further, at the time of encoding the data for each band at this time, encoding is performed by predetermined bit allocation for each band or adaptive bit allocation (bit allocation) for each band. For example, when the coefficient data obtained by the MDCT processing is coded by the bit allocation, it is adaptive to the MDCT coefficient data for each band obtained by the MDCT processing for each block. Encoding will be performed with the allocated number of bits.

【0006】ビット割当手法としては、次の2手法が知
られている。先ず、IEEE Transactions of Accoustics,
Speech, and Signal Processing,vol.ASSP-25, No.4,
August 1977では、各帯域毎の信号の大きさをもとに、
ビット割当を行なっている。この方式では、量子化雑音
スペクトルが平坦となり、雑音エネルギ最小となるが、
聴感覚的にはマスキング効果が利用されていないために
実際の雑音感は最適ではない。
The following two methods are known as bit allocation methods. First, IEEE Transactions of Accoustics,
Speech, and Signal Processing, vol.ASSP-25, No.4,
In August 1977, based on the signal size of each band,
Bit allocation is done. In this method, the quantization noise spectrum becomes flat and the noise energy becomes minimum, but
Since the masking effect is not used auditorily, the actual noise feeling is not optimal.

【0007】次に、ICASSP 1980 The critical band c
oder -- digital encoding of theperceptual requirem
ents of the auditory system, M.A.Kransner, MIT で
は、聴覚マスキングを利用することで、各帯域毎に必要
な信号対雑音比を得て固定的なビット割当を行なう手法
が述べられている。しかしこの手法ではサイン波入力で
特性を測定する場合でも、ビット割当が固定的であるた
めに、特性値がそれほど良い値とならない。
Next, ICASSP 1980 The critical band c
oder-digital encoding of the perceptual requirem
In ents of the auditory system, MAKransner, MIT, a method of performing fixed bit allocation by using auditory masking to obtain a necessary signal-to-noise ratio for each band is described. However, in this method, even when the characteristic is measured with a sine wave input, the characteristic value is not so good because the bit allocation is fixed.

【0008】ここで、上記2手法の内の前者の手法で、
実際の雑音感を最適にするために、ビット配分決定時
に、固定的なノイズシェイピングファクタと呼ばれる係
数を用いて、量子化雑音のスペクトルを聴覚的に適合す
るようにする。このときビット配分は次の(1)式のよ
うに行う。
Here, in the former method of the above two methods,
In order to optimize the actual noise feeling, a fixed noise shaping factor is used when determining the bit allocation so that the spectrum of the quantization noise is auditorily matched. At this time, bit allocation is performed according to the following expression (1).

【0009】[0009]

【数1】 [Equation 1]

【0010】この(1)式において、b(k)はk番目
のブロックのMDCT係数の語長、δは適正バイアス、
σ2 (k)はk番目のブロックの信号電力、Dは全フロ
ックでの平均量子化誤差電力、γはノイズシェイピング
ファクタ、をそれぞれ示している。計算は、全ブロック
のb(k)の和が、使用できる全ビット内に入るよう
に、δを変えて、最適値を求める。
In this equation (1), b (k) is the word length of the MDCT coefficient of the kth block, δ is the proper bias,
σ 2 (k) is the signal power of the k-th block, D is the average quantization error power in all blocks, and γ is the noise shaping factor. The calculation is performed by changing δ so that the sum of b (k) of all blocks falls within all usable bits, and the optimum value is obtained.

【0011】しかしこの手法においても、サイン波入力
で特性を測定する場合、ビット割当がサイン信号の存在
する周波数に充分集中せず、特性値がそれほど良い値と
ならない。
However, even in this method, when the characteristic is measured with a sine wave input, the bit allocation does not sufficiently concentrate on the frequency where the sine signal exists, and the characteristic value is not so good.

【0012】[0012]

【発明が解決しようとする課題】このように、各帯域の
信号の大きさでビット配分を行ない、量子化雑音エネル
ギを最小にすると、聴覚的雑音レベルは最小とならず、
またマスキング効果を考えて、固定的なノイズシェイピ
ングファクタを導入したり、各帯域に固定的なビット配
分を行なうと、サイン波入力時には良い信号対雑音特性
を得にくい。
As described above, when bit allocation is performed according to the signal size of each band and the quantization noise energy is minimized, the auditory noise level is not minimized,
If a fixed noise shaping factor is introduced or fixed bits are allocated to each band in consideration of the masking effect, it is difficult to obtain good signal-to-noise characteristics when a sine wave is input.

【0013】本発明はこのような実情に鑑みてなされた
ものであり、聴覚的にも望ましく、また1kHzサイン波
入力のような孤立スペクトル入力に対しても良好な特性
が得られるビット配分手法を有するような高能率符号化
装置及び復号化装置の提供を目的とする。
The present invention has been made in view of the above circumstances, and is a bit allocation method that is desirable from the viewpoint of hearing and also has good characteristics for an isolated spectrum input such as a 1 kHz sine wave input. It is an object of the present invention to provide such a high-efficiency encoding device and decoding device.

【0014】[0014]

【課題を解決するための手段】本発明に係るディジタル
データの高能率符号化装置は、入力ディジタル信号を複
数の周波数帯域に分割すると共に、各周波数帯域毎に適
応的にブロックサイズを変化させた後、直交変換を行う
ことによりスペクトルデータを求め、このスペクトルデ
ータを臨界帯域毎にノイズシェイピングファクタを用い
て量子化雑音のスペクトルを聴覚的に適合するように適
応的にビット割当てを行って符号化データを得る高能率
符号化装置であって、上記ノイズシェーピングファクタ
を、入力信号の大きさ又は入力信号のスペクトルの滑ら
かさに関連した信号の少なくとも一つに応じて変更する
ことにより、上述した課題を解決する。
A high efficiency coding apparatus for digital data according to the present invention divides an input digital signal into a plurality of frequency bands and adaptively changes a block size for each frequency band. After that, the spectrum data is obtained by performing orthogonal transformation, and this spectrum data is coded by adaptively assigning bits so that the spectrum of the quantization noise is auditorily adapted to each other using the noise shaping factor for each critical band. A high-efficiency encoding apparatus for obtaining data, wherein the noise shaping factor is changed according to at least one of the signals related to the magnitude of the input signal or the smoothness of the spectrum of the input signal, To solve.

【0015】この場合、隣接スペクトル間の差情報に関
係した信号を、スペクトルの滑らかさの指標として用い
ることが好ましい。また、ブロックフローティングのた
めのブロック間の信号の大きさの差情報に関係した信号
を、スペクトルの滑らかさの指標として用いることによ
り、演算量の低減が図られる。また、信号の大きさが小
さいほど、高域信号の大きさを小さく見積もってビット
配分の基礎とすることは、高域の最小可聴限レベルが上
昇していることから、ビットの有効配分を行う上で有益
である。特に概略4kHz以上の最小可聴限レベルの最小
の周波数以上の信号の大きさが小さいほど、高域スペク
トルを低減したスペクトルを基にしたビット割当て(ビ
ットアロケーション)を行うことが有効である。
In this case, it is preferable to use a signal related to the difference information between adjacent spectra as an index of the smoothness of the spectrum. Further, the amount of calculation can be reduced by using the signal related to the difference information of the signal size between blocks for the block floating as an index of the smoothness of the spectrum. Also, the smaller the signal size, the smaller the high-frequency signal size is estimated to be the basis for bit allocation. Since the minimum audible level in the high frequency band is increased, effective bit allocation is performed. Useful above. Particularly, the smaller the signal size above the minimum frequency of the minimum audible level of approximately 4 kHz or higher, the more effective it is to perform bit allocation based on the spectrum in which the high frequency spectrum is reduced.

【0016】さらに、上記高能率符号化装置により符号
化され、伝送又は記録再生された信号を復号化する高能
率復号化装置によっても、上述の課題を解決する。
Further, the above problem can also be solved by a high efficiency decoding device which decodes a signal which is coded by the high efficiency coding device and transmitted or recorded / reproduced.

【0017】[0017]

【作用】本発明によれば、音楽信号のようにスペクトル
が分散している場合にも、マスキング効果により聴感覚
からみた雑音レベルが低くでき、またサイン波入力時に
も信号の大きい帯域にビットを集められるので信号対雑
音比を大きくすることができる。
According to the present invention, even when the spectrum is dispersed like a music signal, the noise level seen from the auditory sense can be lowered by the masking effect, and even when the sine wave is input, bits are set in a large band of the signal. As they are collected, the signal-to-noise ratio can be increased.

【0018】[0018]

【実施例】オーディオPCM信号等の入力ディジタル信
号を、帯域分割符号化(SBC)、適応変換符号化(A
TC)及び適応ビット割当て(APC−AB)の各技術
を用いて高能率符号化する実施例について、図1を参照
しながら説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An input digital signal such as an audio PCM signal is subjected to band division coding (SBC) and adaptive transform coding (A).
An embodiment in which high efficiency coding is performed using the techniques of TC) and adaptive bit allocation (APC-AB) will be described with reference to FIG.

【0019】図1に示す具体的な高能率符号化装置で
は、入力ディジタル信号をフィルタ等により複数の周波
数帯域に分割すると共に、各周波数帯域毎に直交変換を
行って、得られた周波数軸のスペクトルデータを、後述
する人間の聴覚特性を考慮したいわゆる臨界帯域(クリ
ティカルバンド)幅毎に適応的にビット割当して符号化
している。もちろんフィルタ等による非ブロッキングの
周波数分割幅は等分割幅としてもよい。さらに、本発明
実施例においては、直交変換の前に入力信号に応じて適
応的にブロックサイズ(ブロック長)を変化させると共
に、クリティカルバンド単位もしくは高域では臨界帯域
(クリティカルバンド)幅を更に細分化したブロックで
フローティング処理を行っている。このクリティカルバ
ンドとは、人間の聴覚特性を考慮して分割された周波数
帯域であり、ある純音の周波数近傍の同じ強さの狭帯域
バンドノイズによって当該純音がマスクされるときのそ
のノイズの持つ帯域のことである。このクリティカルバ
ンドは、高域ほど帯域幅が広くなっており、上記0〜2
0kHzの全周波数帯域は例えば25のクリティカルバン
ドに分割されている。
In the concrete high-efficiency encoder shown in FIG. 1, the input digital signal is divided into a plurality of frequency bands by a filter and the like, and orthogonal transformation is performed for each frequency band to obtain the obtained frequency axis. The spectrum data is coded by adaptively allocating bits for each so-called critical band width in consideration of human auditory characteristics described later. Of course, the non-blocking frequency division width by a filter or the like may be an equal division width. Furthermore, in the embodiment of the present invention, the block size (block length) is adaptively changed according to the input signal before the orthogonal transformation, and the critical band width is further subdivided in the critical band unit or in the high band. Floating processing is performed on the converted blocks. The critical band is a frequency band divided in consideration of human auditory characteristics, and the band of a pure tone when the pure tone is masked by narrow band noise of the same strength near the frequency of the pure tone. That is. This critical band has a wider bandwidth as it goes to higher frequencies, and the above 0-2
The entire frequency band of 0 kHz is divided into 25 critical bands, for example.

【0020】すなわち、図1において、入力端子10に
は例えば0〜20kHzのオーディオPCM信号が供給さ
れている。この入力信号は、例えばいわゆるQMFフィ
ルタ等の帯域分割フィルタ11により0〜10kHz帯域
と10k〜20kHz帯域とに分割され、0〜10kHz帯
域の信号は同じくいわゆるQMFフィルタ等の帯域分割
フィルタ12により0〜5kHz帯域と5k〜10kHz帯
域とに分割される。帯域分割フィルタ11からの10k
〜20kHz帯域の信号は、直交変換回路の一例であるMo
dified Discrete Cosine Transform(MDCT)回路1
3に送られ、帯域分割フィルタ12からの5k〜10k
Hz帯域の信号はMDCT回路14に送られ、帯域分割フ
ィルタ12からの0〜5kHz帯域の信号はMDCT回路
15に送られることにより、それぞれMDCT処理され
る。
That is, in FIG. 1, an audio PCM signal of 0 to 20 kHz, for example, is supplied to the input terminal 10. The input signal is divided into a band of 0 to 10 kHz and a band of 10 to 20 kHz by a band dividing filter 11 such as a so-called QMF filter, and a signal of a band of 0 to 10 kHz is 0 to 0 by a band dividing filter 12 such as a so-called QMF filter. It is divided into a 5 kHz band and a 5 kHz to 10 kHz band. 10k from band splitting filter 11
The signal in the band of up to 20 kHz is Mo, which is an example of an orthogonal transformation circuit.
dified Discrete Cosine Transform (MDCT) circuit 1
3 to 5k to 10k from the band division filter 12
The Hz band signal is sent to the MDCT circuit 14, and the 0 to 5 kHz band signal from the band division filter 12 is sent to the MDCT circuit 15 for MDCT processing.

【0021】ここで、各MDCT回路13、14、15
のブロックサイズの具体例を図2に示す。この図2の具
体例においては、高域側ほど周波数帯域を広げると共に
時間分解能を高め(ブロック長を短くし)ている。すな
わち、低域側の0〜5kHz帯域の信号及び中域の5k〜
10kHz帯域の信号に対しては1ブロックbL 、bM
サンプル数を例えば256サンプルとし、高域側の10
k〜20kHz帯域の信号に対しては、bH を上記低域及
び中域側のブロックbL 、bM のそれぞれ1/2の長さ
BLL /2、BLM /2の長さでブロック化している。この
ようにして各帯域の直交変換ブロックサンプル数を同じ
としている。また、各々の帯域は、信号の時間的変化が
大きい場合を想定して更に1/2、1/4等の適応的な
ブロック分割が可能である。
Here, each MDCT circuit 13, 14, 15
FIG. 2 shows a concrete example of the block size. In the specific example of FIG. 2, the frequency band is widened and the time resolution is increased (the block length is shortened) on the higher frequency side. That is, a signal in the 0-5 kHz band on the low frequency side and 5 k in the middle frequency band
For a signal in the 10 kHz band, the number of samples in one block b L , b M is , for example, 256 samples.
Each length of 1/2 with respect to the k~20kHz band signal, b H of the low and middle band side block b L, b M
Blocked with lengths of BL L / 2 and BL M / 2. In this way, the number of orthogonal transform block samples in each band is the same. Further, each band can be further adaptively divided into ½, ¼, etc. blocks assuming a case where a signal temporal change is large.

【0022】再び図1において、各MDCT回路13、
14、15にてMDCT処理されて得られた周波数軸上
のスペクトルデータあるいはMDCT係数データは、い
わゆる臨界帯域(クリティカルバンド)毎に又は高域で
は臨界帯域(クリティカルバンド)幅を更に細分化した
ブロック毎にまとめられて、適応ビット割当符号化回路
16、17、18に送られている。
Referring again to FIG. 1, each MDCT circuit 13,
The spectrum data on the frequency axis or MDCT coefficient data obtained by MDCT processing at 14 and 15 is a block obtained by further subdividing the critical band width in each so-called critical band (critical band) or in a high band. It is collected for each and sent to the adaptive bit allocation encoding circuits 16, 17, and 18.

【0023】適応ビット割当符号化回路16、17、1
8により各臨界帯域(クリティカルバンド)毎に又は高
域では臨界帯域(クリティカルバンド)幅を更に細分化
したブロック毎に割り当てられたビット数に応じて、各
スペクトルデータ(あるいはMDCT係数データ)を再
量子化するようにしている。このようにして符号化され
たデータは、出力端子22、24、26を介して取り出
される。このときどのような信号の大きさに関する正規
化がされたかを示す、フローティング情報とどのような
ビット長で量子化がされたかを示すビット長情報が同時
に送られる。
Adaptive bit allocation coding circuits 16, 17, 1
In accordance with the number of bits allocated to each critical band (critical band) in the high band or to each block obtained by further subdividing the critical band width in the high frequency band, each spectrum data (or MDCT coefficient data) is re-reproduced. I try to quantize. The data encoded in this way is taken out via the output terminals 22, 24 and 26. At this time, floating information indicating what kind of signal magnitude is normalized and bit length information indicating what bit length the quantization is performed are sent at the same time.

【0024】図3は、適応ビット割当符号化回路16、
17、18の内部機能の具体例を示す機能ブロック図で
あり、図1における各MDCT回路13、14、15の
出力は、図3の適応ビット割当機能部300の入力端子
301を介して帯域毎のエネルギ算出回路302に送ら
れて、上記クリティカルバンド(臨界帯域)毎のエネル
ギ、または高域ではクリティカルバンドをさらに細分割
した帯域毎のエネルギが、例えば当該帯域内での各振幅
値の2乗平均の平方根を計算すること等により求められ
る。この各帯域毎のエネルギの代わりに、振幅値のピー
ク値、平均値等が用いられることもある。図4は、上記
エネルギ算出回路302からの出力として、例えば臨界
帯域(クリティカルバンド)内の又は高域では臨界帯域
(クリティカルバンド)幅を更に細分化した帯域毎の総
和値のスペクトルの例を示すものであるが、この図4で
は図示を簡略化するため、上記臨界帯域(クリティカル
バンド)の数又は高域では臨界帯域(クリティカルバン
ド)幅を更に細分化した帯域のバンド数を12バンド
(B1 〜B12)で表現している。
FIG. 3 shows an adaptive bit allocation encoding circuit 16,
It is a functional block diagram which shows the specific example of the internal function of 17, 18, and the output of each MDCT circuit 13, 14, 15 in FIG. 1 is for every band via the input terminal 301 of the adaptive bit allocation function part 300 of FIG. Energy of each critical band (critical band), or energy of each band obtained by further subdividing the critical band in the high frequency band, is sent to the energy calculation circuit 302 of FIG. It can be obtained by calculating the square root of the mean. Instead of the energy for each band, a peak value, an average value, etc. of the amplitude value may be used. FIG. 4 shows, as an output from the energy calculation circuit 302, an example of a spectrum of a sum value for each band obtained by further subdividing the critical band width in the critical band (critical band) or in a high band. However, in order to simplify the illustration in FIG. 4, the number of bands in the number of critical bands (critical bands) or the band in which the critical band width is further subdivided in the high range is 12 bands (B1). ~ B12).

【0025】適応ビット割当回路16、17、18の動
作を図3を参照しながらさらに説明する。今MDCT係
数の大きさが各ブロック毎にMDCT回路13、14、
15で求められ、MDCT係数が入力端子300に供給
される。供給されたMDCT係数は、帯域毎のエネルギ
算出回路302、高域信号レベルの低減回路303に与
えられる。帯域毎のエネルギ算出回路302で、クリテ
ィカルバンド又は高域においてはクリティカルバンドを
更に細分割したそれぞれの帯域、に関する信号エネルギ
を算出する。帯域毎のエネルギ算出回路302で算出さ
れたそれぞれの帯域に関するエネルギは、高域信号レベ
ルの低減回路303、スペクトルの滑らかさ算出回路3
05及びノイズシェイピングファクタ決定回路306に
供給される。先ず、高域信号レベルの低減回路303で
は、4kHz以上の帯域のエネルギが小さいほど高域信号
レベルの低減を大きく行う。このことにより、高域の最
小可聴限特性の影響を加味することができる。次に、ス
ペクトルの滑らかさ算出回路305では、隣合ったブロ
ックのエネルギの差分値の2乗の全帯域に亘る加算値と
全帯域のエネルギの加算値との比が小さいほど、スペク
トルが滑らか、と見なして、ノイズシェイピングファク
タを小さくする。エネルギ依存のビット配分回路304
は、ノイズシェイピングファクタ決定回路306からの
ノイズシェイピングファクタと高域信号レベルの低減回
路303からの高域を低減された信号スペクトルを用い
て、上記(1)式によるビット配分を行う。このビット
配分の値が出力端子307を介して取り出され、量子化
の際に使用される。
The operation of the adaptive bit allocation circuits 16, 17, 18 will be further described with reference to FIG. Now, the magnitude of the MDCT coefficient for each block is the MDCT circuits 13, 14,
The MDCT coefficient obtained at 15 is supplied to the input terminal 300. The supplied MDCT coefficient is given to the energy calculation circuit 302 and the high frequency signal level reduction circuit 303 for each band. The energy calculation circuit 302 for each band calculates the signal energy for the critical band or each band obtained by further subdividing the critical band in the high band. The energy regarding each band calculated by the energy calculation circuit 302 for each band includes a high-frequency signal level reduction circuit 303 and a spectrum smoothness calculation circuit 3.
05 and the noise shaping factor determination circuit 306. First, in the high frequency signal level reduction circuit 303, the higher the high frequency signal level is reduced, the smaller the energy in the band of 4 kHz or higher. This makes it possible to take into consideration the influence of the minimum audible limit characteristic in the high frequency range. Next, in the spectrum smoothness calculation circuit 305, the smaller the ratio between the sum of the squared difference values of the energy of adjacent blocks over the entire band and the total value of the energy over the entire band, the smoother the spectrum, And reduce the noise shaping factor. Energy-dependent bit allocation circuit 304
Uses the noise shaping factor from the noise shaping factor determination circuit 306 and the high-frequency-reduced signal spectrum from the high-frequency signal level reduction circuit 303 to perform bit allocation according to the above equation (1). The value of this bit allocation is taken out via the output terminal 307 and used in quantization.

【0026】次に、入力信号のスペクトルが滑らかな場
合と滑らかでない場合のビット割当て及びその結果得ら
れる量子化雑音スペクトルについて、図5乃至図8を参
照しながら説明する。すなわち、信号スペクトルが平坦
なときのビット割当の様子を図5に示し、これに対応す
る量子化雑音(ノイズスペクトル)の様子を図6に示
す。また、スペクトルが滑らかでないとき、例えば信号
スペクトルのトーナリティが高く聴覚的に信号の音程感
があって周波数に偏りが生じているときのビット割当の
様子を図7に示し、これに対応する量子化雑音(ノイズ
スペクトル)の様子を図8に示す。ここで図6、図8内
において、曲線aは信号レベルを、曲線bは量子化雑音
レベルをそれぞれ示している。
Next, bit allocation in the case where the spectrum of the input signal is smooth and in the case where the spectrum is not smooth and the resulting quantization noise spectrum will be described with reference to FIGS. 5 to 8. That is, FIG. 5 shows a state of bit allocation when the signal spectrum is flat, and FIG. 6 shows a state of quantization noise (noise spectrum) corresponding to the bit allocation. Further, FIG. 7 shows the state of bit allocation when the spectrum is not smooth, for example, when the tonality of the signal spectrum is high and the pitch of the signal is audibly perceived, and the frequency is biased. The state of noise (noise spectrum) is shown in FIG. 6 and 8, the curve a shows the signal level and the curve b shows the quantization noise level.

【0027】すなわち図5及び図6は、信号のスペクト
ルが割合平坦である場合を示しており、ノイズシェイピ
ングファクタが概略−1に近付いた様子を示している。
これに対して、図7、図8に示すように、信号スペクト
ルが滑らかでない場合には、ノイズシェイピングファク
タを概略0に近付けることにより、量子化雑音スペクト
ルをホワイトに近付けることができる。これにより孤立
スペクトル入力信号での特性の向上が達成される。
That is, FIGS. 5 and 6 show the case where the spectrum of the signal is relatively flat, and show that the noise shaping factor approaches approximately -1.
On the other hand, as shown in FIGS. 7 and 8, when the signal spectrum is not smooth, the quantization noise spectrum can be brought close to white by bringing the noise shaping factor close to 0. This achieves improved performance with isolated spectrum input signals.

【0028】図9はこのようにして高能率符号化された
信号を、伝送あるいは記録再生した後に、再び復号化す
るための復号回路を示している。各帯域の量子化された
上記MDCT係数は、復号回路入力端子122、12
4、126に与えられ、使用されたブロックサイズ情報
は、入力端子123、125、127に与えられる。復
号化回路116、117、118では適応ビット割当情
報を用いてビット割当を解除する。次にIMDCT(逆
MDCT)回路113、114、115で周波数軸上の
信号が時間軸上の信号に変換される。これらの部分帯域
の時間軸上の信号は、IQMF(逆QMF)回路11
2、111により全帯域信号に復号化され、出力端子1
10より取り出される。
FIG. 9 shows a decoding circuit for decoding the signal thus highly efficient coded, after transmitting or recording / reproducing it. The quantized MDCT coefficients in each band are decoded circuit input terminals 122 and 12
The block size information given to and used in No. 4, 126 is given to the input terminals 123, 125, 127. The decoding circuits 116, 117 and 118 cancel the bit allocation using the adaptive bit allocation information. Next, the IMDCT (inverse MDCT) circuits 113, 114 and 115 convert the signals on the frequency axis into signals on the time axis. The signals on the time axis of these partial bands are IQMF (inverse QMF) circuit 11
2, 111 decoded into full band signal and output terminal 1
It is taken out from 10.

【0029】[0029]

【発明の効果】以上の説明からも明らかなように、本発
明に係るディジタルデータの高能率符号化装置によれ
ば、入力ディジタル信号を複数の周波数帯域に分割する
と共に、各周波数帯域毎に適応的にブロックサイズを変
化させた後、直交変換を行うことによりスペクトルデー
タを求め、このスペクトルデータを臨界帯域毎にノイズ
シェイピングファクタを用いて量子化雑音のスペクトル
を聴覚的に適合するように適応的にビット割当てを行っ
て符号化データを得る高能率符号化装置であって、上記
ノイズシェーピングファクタを、入力信号の大きさ又は
入力信号のスペクトルの滑らかさに関連した信号の少な
くとも一つに応じて変更するようにしているため、この
ビット配分手法は聴覚的にも望ましく、また、1kHzサ
イン波入力のような孤立スペクトル入力に対しても良好
な特性を、何度も繰り返してビット量調整をせず、唯1
回の演算で得られるビット配分が実現できる。
As is apparent from the above description, according to the digital data high-efficiency coding apparatus of the present invention, the input digital signal is divided into a plurality of frequency bands, and each frequency band is adapted. After changing the block size, the spectrum data is obtained by performing orthogonal transformation, and this spectrum data is adaptively applied so that the spectrum of the quantization noise is auditorily adapted by using the noise shaping factor for each critical band. A high-efficiency coder for performing bit allocation to obtain coded data according to at least one of a signal related to a magnitude of an input signal or a smoothness of a spectrum of the input signal. This bit allocation method is also desirable audibly because it is changed, and like the 1 kHz sine wave input, Good characteristics even for standing spectrum input, without bit amount adjustment again and again, only 1
It is possible to realize the bit allocation obtained by performing the calculation once.

【0030】また、上記ディジタルデータの高能率符号
化装置により符号化され、伝送又は記録再生された信号
を復号する高能率復号化装置によっても、同様の効果を
得ることができる。
The same effect can also be obtained by a high-efficiency decoding device that decodes a signal that has been encoded by the high-efficiency encoding device for digital data and transmitted or recorded / reproduced.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例となる符号化装置の構成例を
示すブロック回路図である。
FIG. 1 is a block circuit diagram showing a configuration example of an encoding device as an embodiment of the present invention.

【図2】該実施例装置の信号の周波数及び時間分割の具
体例を示す図である。
FIG. 2 is a diagram showing a specific example of frequency division and time division of a signal of the apparatus of the embodiment.

【図3】該実施例装置に用いられる適応ビット割当符号
化回路のビット配分アルゴリズムの一例を説明するため
の機能ブロック図である。
FIG. 3 is a functional block diagram for explaining an example of a bit allocation algorithm of an adaptive bit allocation encoding circuit used in the device of the embodiment.

【図4】バークスペクトルを示す図である。FIG. 4 is a diagram showing a Bark spectrum.

【図5】上記実施例の概略平坦なスペクトルの信号入力
時のビット配分の例を示す図である。
FIG. 5 is a diagram showing an example of bit allocation at the time of inputting a signal having a substantially flat spectrum in the above embodiment.

【図6】上記実施例の概略平坦なスペクトルの信号入力
時の量子化雑音スペクトルの例を示す図である。
FIG. 6 is a diagram showing an example of a quantization noise spectrum at the time of inputting a signal having a substantially flat spectrum in the above embodiment.

【図7】上記実施例の高いトーナリティーを持つ信号入
力時のビット配分の例を示す図である。
FIG. 7 is a diagram showing an example of bit allocation at the time of inputting a signal having high tonality according to the above-described embodiment.

【図8】上記実施例の高いトーナリティーを持つ信号入
力時の量子化雑音スペクトルの例を示す図である。
FIG. 8 is a diagram showing an example of a quantization noise spectrum at the time of inputting a signal having high tonality according to the above-mentioned embodiment.

【図9】上記実施例の符号化装置に対する復号化装置の
構成例を示すブロック回路図である。
FIG. 9 is a block circuit diagram showing a configuration example of a decoding device for the encoding device of the above embodiment.

【符号の説明】[Explanation of symbols]

10・・・高能率符号化回路入力端子 11、12・・・QMF回路 13、14、15・・・MDCT回路 16、17、18・・・適応ビット割当符号化回路 19、20、21・・・ブロックサイズ決定回路 22、24、26・・・符号化出力端子 23、25、27・・・ブロックサイズ情報出力端子 122、124、126・・・符号化入力端子 123、125、127・・・ブロックサイズ情報入力
端子 116、117、118・・・適応ビット割当復号化回
路 113、114、115・・・IMDCT回路 112、111・・・IQMF回路 110・・・高能率復号化回路出力端子 300・・・適応ビット割当機能部 301・・・適応ビット割当符号化入力端子 302・・・帯域毎のエネルギ算出回路 303・・・高域信号レベルの低減回路 304・・・エネルギ依存のビット配分回路 305・・・スペクトルの滑らかさ算出回路 306・・・ノイズシェイピングファクタ算出回路 307・・・ビット割当量出力端子
10 ... High efficiency coding circuit input terminal 11, 12 ... QMF circuit 13, 14, 15 ... MDCT circuit 16, 17, 18 ... Adaptive bit allocation coding circuit 19, 20, 21 ... Block size determination circuit 22, 24, 26 ... Encoding output terminal 23, 25, 27 ... Block size information output terminal 122, 124, 126 ... Encoding input terminal 123, 125, 127 ... Block size information input terminals 116, 117, 118 ... Adaptive bit allocation decoding circuit 113, 114, 115 ... IMDCT circuit 112, 111 ... IQMF circuit 110 ... High efficiency decoding circuit output terminal 300. ..Adaptive bit allocation function unit 301 ... Adaptive bit allocation coding input terminal 302 ... Energy calculation circuit for each band 303 ... High band signal level Bell reduction circuit 304 ... Energy-dependent bit allocation circuit 305 ... Spectral smoothness calculation circuit 306 ... Noise shaping factor calculation circuit 307 ... Bit allocation amount output terminal

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 入力ディジタル信号を複数の周波数帯域
に分割すると共に、各周波数帯域毎に適応的にブロック
サイズを変化させた後、直交変換を行うことによりスペ
クトルデータを求め、このスペクトルデータを臨界帯域
毎にノイズシェイピングファクタを用いて量子化雑音の
スペクトルを聴覚的に適合するように適応的にビット割
当てを行って符号化データを得る高能率符号化装置であ
って、 上記ノイズシェーピングファクタを、入力信号の大きさ
又は入力信号のスペクトルの滑らかさに関連した信号の
少なくとも一つに応じて変更することを特徴とする高能
率符号化装置。
1. An input digital signal is divided into a plurality of frequency bands, and a block size is adaptively changed for each frequency band, and then orthogonal transformation is performed to obtain spectrum data. A high-efficiency encoding device that obtains encoded data by adaptively allocating bits so that the spectrum of quantization noise is auditorily matched using a noise shaping factor for each band, wherein the noise shaping factor is: A high-efficiency coding device, characterized in that it is changed according to at least one of the signals related to the magnitude of the input signal or the smoothness of the spectrum of the input signal.
【請求項2】 請求項1に記載のディジタルデータの高
能率符号化装置により伝送若しくは記録再生された信号
を復号化して再生信号を得ることを特徴とする高能率復
号化装置。
2. A high-efficiency decoding apparatus for decoding a signal transmitted or recorded / reproduced by the high-efficiency encoding apparatus for digital data according to claim 1 to obtain a reproduced signal.
【請求項3】 上記入力信号が大きいほど、又は上記入
力信号のスペクトルが滑らかなほど、量子化雑音レベル
が平坦に近付くように、上記ノイズシェイピングファク
タを変更することを特徴とする請求項1記載の高能率符
号化装置。
3. The noise shaping factor is changed so that the quantization noise level becomes flatter as the input signal becomes larger or the spectrum of the input signal becomes smoother. High efficiency encoder.
【請求項4】 隣接スペクトル間の差情報に関係した信
号をスペクトルの滑らかさの指標として用いることを特
徴とする請求項3記載の高能率符号化装置。
4. The high efficiency coding apparatus according to claim 3, wherein a signal related to difference information between adjacent spectra is used as an index of spectrum smoothness.
【請求項5】 周波数軸上のブロックフローティングの
ためのブロック間の信号の大きさの差情報に関係した信
号をスペクトルの滑らかさの指標として用いることを特
徴とする請求項4記載の高能率符号化装置。
5. The high-efficiency code according to claim 4, wherein a signal related to signal size difference information between blocks for block floating on the frequency axis is used as an index of spectrum smoothness. Device.
【請求項6】 上記入力信号の大きさが小さいほど、高
域スペクトルを低減したスペクトルを基にしたビット割
当てを行うことを特徴とする請求項4記載の高能率符号
化装置。
6. The high efficiency coding apparatus according to claim 4, wherein the smaller the size of the input signal, the more the bit allocation is performed based on the spectrum in which the high frequency spectrum is reduced.
【請求項7】 概略最小可聴限レベルの最小の周波数以
上の信号の大きさが小さいほど、高域スペクトルを低減
したスペクトルを基にしたビット割当てを行うことを特
徴とする請求項6記載の高能率符号化装置。
7. The high-order according to claim 6, wherein the smaller the signal size above the minimum frequency of the approximate minimum audible level is, the more the bit allocation is performed based on the spectrum in which the high frequency spectrum is reduced. Efficiency encoder.
JP3271774A 1991-08-02 1991-08-27 High-efficiency encoding device and decoding device Withdrawn JPH05114863A (en)

Priority Applications (11)

Application Number Priority Date Filing Date Title
JP3271774A JPH05114863A (en) 1991-08-27 1991-08-27 High-efficiency encoding device and decoding device
KR1019920013475A KR100340368B1 (en) 1991-08-27 1992-07-28 High Efficiency Encoder, Decoder and Digital Data Derivation Method
DE69232251T DE69232251T2 (en) 1991-08-02 1992-07-31 Digital encoder with dynamic quantization bit distribution
EP92113130A EP0525809B1 (en) 1991-08-02 1992-07-31 Digital encoder with dynamic quantization bit allocation
EP97108482A EP0805564A3 (en) 1991-08-02 1992-07-31 Digital encoder with dynamic quantization bit allocation
AT92113130T ATE210347T1 (en) 1991-08-02 1992-07-31 DIGITAL ENCODER WITH DYNAMIC QUANTIZATION BIT DISTRIBUTION
CA002075156A CA2075156A1 (en) 1991-08-02 1992-07-31 Digital encoder with dynamic quantization bit allocation
ES92113130T ES2164640T3 (en) 1991-08-02 1992-07-31 DIGITAL ENCODER WITH DYNAMIC ASSIGNMENT OF QUANTIFICATION BITS.
AU20716/92A AU665200B2 (en) 1991-08-02 1992-07-31 Digital encoder with dynamic quantization bit allocation
US08/272,872 US5664056A (en) 1991-08-02 1994-07-08 Digital encoder with dynamic quantization bit allocation
US08/465,340 US5621856A (en) 1991-08-02 1995-06-05 Digital encoder with dynamic quantization bit allocation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3271774A JPH05114863A (en) 1991-08-27 1991-08-27 High-efficiency encoding device and decoding device

Publications (1)

Publication Number Publication Date
JPH05114863A true JPH05114863A (en) 1993-05-07

Family

ID=17504666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3271774A Withdrawn JPH05114863A (en) 1991-08-02 1991-08-27 High-efficiency encoding device and decoding device

Country Status (2)

Country Link
JP (1) JPH05114863A (en)
KR (1) KR100340368B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012157932A3 (en) * 2011-05-13 2013-01-24 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012157932A3 (en) * 2011-05-13 2013-01-24 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
US9159331B2 (en) 2011-05-13 2015-10-13 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
US9236057B2 (en) 2011-05-13 2016-01-12 Samsung Electronics Co., Ltd. Noise filling and audio decoding
CN105825858A (en) * 2011-05-13 2016-08-03 三星电子株式会社 Bit allocating, audio encoding and decoding
CN105825859A (en) * 2011-05-13 2016-08-03 三星电子株式会社 Bit allocating, audio encoding and decoding
US9489960B2 (en) 2011-05-13 2016-11-08 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
US9711155B2 (en) 2011-05-13 2017-07-18 Samsung Electronics Co., Ltd. Noise filling and audio decoding
US9773502B2 (en) 2011-05-13 2017-09-26 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
RU2648595C2 (en) * 2011-05-13 2018-03-26 Самсунг Электроникс Ко., Лтд. Bit distribution, audio encoding and decoding
US10109283B2 (en) 2011-05-13 2018-10-23 Samsung Electronics Co., Ltd. Bit allocating, audio encoding and decoding
US10276171B2 (en) 2011-05-13 2019-04-30 Samsung Electronics Co., Ltd. Noise filling and audio decoding
RU2705052C2 (en) * 2011-05-13 2019-11-01 Самсунг Электроникс Ко., Лтд. Bit allocation, audio encoding and decoding

Also Published As

Publication number Publication date
KR100340368B1 (en) 2002-11-23
KR930005381A (en) 1993-03-23

Similar Documents

Publication Publication Date Title
JP3134455B2 (en) High efficiency coding apparatus and method
JP3277692B2 (en) Information encoding method, information decoding method, and information recording medium
JP3371590B2 (en) High efficiency coding method and high efficiency decoding method
JP5539203B2 (en) Improved transform coding of speech and audio signals
JP3153933B2 (en) Data encoding device and method and data decoding device and method
JP3186292B2 (en) High efficiency coding method and apparatus
JP3278900B2 (en) Data encoding apparatus and method
JP3203657B2 (en) Information encoding method and apparatus, information decoding method and apparatus, information transmission method, and information recording medium
EP1852851A1 (en) An enhanced audio encoding/decoding device and method
US6415251B1 (en) Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
WO1994028633A1 (en) Apparatus and method for coding or decoding signals, and recording medium
JPH06149292A (en) Method and device for high-efficiency encoding
JP2005338637A (en) Device and method for audio signal encoding
EP1873753A1 (en) Enhanced audio encoding/decoding device and method
JP3341474B2 (en) Information encoding method and decoding method, information encoding device and decoding device, and information recording medium
JP3189401B2 (en) Audio data encoding method and audio data encoding device
JP3557674B2 (en) High efficiency coding method and apparatus
JP3255047B2 (en) Encoding device and method
WO1999044291A1 (en) Coding device and coding method, decoding device and decoding method, program recording medium, and data recording medium
JPH09101799A (en) Signal coding method and device therefor
JP3336619B2 (en) Signal processing device
JPH05114863A (en) High-efficiency encoding device and decoding device
JP3291948B2 (en) High-efficiency encoding method and apparatus, and transmission medium
JP3134383B2 (en) Method and apparatus for highly efficient encoding of digital data
JP3134384B2 (en) Encoding device and method

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19981112