JP3291948B2 - High-efficiency encoding method and apparatus, and transmission medium - Google Patents

High-efficiency encoding method and apparatus, and transmission medium

Info

Publication number
JP3291948B2
JP3291948B2 JP31180394A JP31180394A JP3291948B2 JP 3291948 B2 JP3291948 B2 JP 3291948B2 JP 31180394 A JP31180394 A JP 31180394A JP 31180394 A JP31180394 A JP 31180394A JP 3291948 B2 JP3291948 B2 JP 3291948B2
Authority
JP
Japan
Prior art keywords
bit
bit allocation
amount
band
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31180394A
Other languages
Japanese (ja)
Other versions
JPH08167851A (en
Inventor
誠 光野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP31180394A priority Critical patent/JP3291948B2/en
Publication of JPH08167851A publication Critical patent/JPH08167851A/en
Application granted granted Critical
Publication of JP3291948B2 publication Critical patent/JP3291948B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、ディジタルオーディオ
信号等のディジタル信号をビット圧縮する高能率符号化
方法及び装置、その圧縮データを伝送する伝送媒体(記
録媒体も含む)に関し、特に、処理ブロック毎のエネル
ギーの形状に応じて、該当処理ブロックのビット割当量
を変化させるような高能率符号化方法及び装置、並びに
伝送媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a highly efficient encoding method and apparatus for bit-compressing a digital signal such as a digital audio signal, and a transmission medium (including a recording medium) for transmitting the compressed data. The present invention relates to a high-efficiency encoding method and apparatus that changes the bit allocation amount of a processing block according to the shape of energy for each, and a transmission medium.

【0002】[0002]

【従来の技術】オーディオ或いは音声等の信号の高能率
符号化の手法及び装置には種々あるが、例えば、時間領
域のオーディオ信号等を単位時間毎にブロック化してこ
のブロック毎の時間軸の信号を周波数軸上の信号に変換
(直交変換)して複数の周波数帯域に分割し、各帯域毎
に符号化するブロック化周波数帯域分割方式であるいわ
ゆる変換符号化方式や、時間領域のオーディオ信号等を
単位時間毎にブロック化しないで、複数の周波数帯域に
分割して符号化する非ブロック化周波数帯域分割方式で
ある帯域分割符号化(サブ・バンド・コーディング:S
BC)方式等を挙げることができる。また、上述の帯域
分割符号化と変換符号化とを組み合わせた高能率符号化
の手法及び装置も考えられており、この場合には、例え
ば、上記帯域分割符号化方式で帯域分割を行った後、該
各帯域毎の信号を上記変換符号化方式で周波数領域の信
号に直交変換し、この直交変換された各帯域毎に符号化
を施すことになる。
2. Description of the Related Art There are various methods and apparatuses for high-efficiency encoding of signals such as audio or voice. For example, a time domain audio signal or the like is divided into blocks for each unit time, and a time axis signal for each block is obtained. Is converted into a signal on the frequency axis (orthogonal transform), divided into a plurality of frequency bands, and a so-called transform coding method, which is a block frequency band division method for encoding each band, an audio signal in the time domain, and the like. Is a non-blocking frequency band division scheme (sub-band coding: S
BC) system and the like. Further, a high-efficiency coding method and apparatus combining the above-mentioned band division coding and transform coding are also considered. In this case, for example, after performing band division by the above-mentioned band division coding method, Then, the signal for each band is orthogonally transformed into a signal in the frequency domain by the above-described transform coding method, and encoding is performed for each band subjected to the orthogonal transformation.

【0003】ここで、上述した帯域分割符号化方式に使
用される帯域分割用フィルタとしては、例えばQMF(Q
uadrature Mirror filter)等のフィルタがあり、これは
例えば文献「ディジタル・コーディング・オブ・スピー
チ・イン・サブバンズ」("Digital coding of speech i
n subbands" R.E.Crochiere, Bell Syst.Tech. J.,Vo
l.55,No.8 1976) に述べられている。このQMFのフィ
ルタは、帯域を等バンド幅に2分割するものであり、当
該フィルタにおいては上記分割した帯域を後に合成する
際にいわゆるエリアシングが発生しないことが特徴とな
っている。また、文献「ポリフェーズ・クワドラチァ・
フィルタ −新しい帯域分割符号化技術」("Polyphase
Quadrature filters -A new subband coding techniqu
e", Joseph H. Rothweiler ICASSP 83, BOSTON)には、
等帯域幅のフィルタ分割手法が述べられている。このポ
リフェーズ・クワドラチァ・フィルタにおいては、信号
を等バンド幅の複数の帯域に分割する際に一度に分割で
きることが特徴となっている。
Here, as a band division filter used in the above-mentioned band division coding system, for example, QMF (Q
There is a filter such as the uadrature Mirror filter, which is described, for example, in the document "Digital coding of speech in subbands".
n subbands "RECrochiere, Bell Syst.Tech. J., Vo
l.55, No.8 1976). This QMF filter divides a band into two equal bandwidths, and is characterized in that so-called aliasing does not occur when the divided bands are combined later. In addition, the document "Polyphase Quadratic
Filters-A New Band Division Coding Technique "(" Polyphase
Quadrature filters -A new subband coding techniqu
e ", Joseph H. Rothweiler ICASSP 83, BOSTON)
An equal bandwidth filter splitting technique is described. This polyphase quadrature filter is characterized in that a signal can be divided at a time when divided into a plurality of bands of equal bandwidth.

【0004】また、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、当該ブロック毎に高速フーリエ変換(F
FT)や、離散コサイン変換(DCT)、モディファイ
ドDCT変換(MDCT)などを行うことで時間軸を周
波数軸に変換するような直交変換がある。このMDCT
については、文献「時間領域エリアシング・キャンセル
を基礎とするフィルタ・バンク設計を用いたサブバンド
/変換符号化」("Subband/Transform Coding Using Fil
ter Bank Designs Based on Time Domain Aliasing Can
cellation," J.P.Princen A.B.Bradley, Univ. of Surr
ey Royal Melbourne Inst. of Tech. ICASSP 1987)に述
べられている。
As the above-mentioned orthogonal transform, for example, an input audio signal is divided into blocks in a predetermined unit time (frame), and a fast Fourier transform (F
FT), a discrete cosine transform (DCT), a modified DCT transform (MDCT), and the like, to transform the time axis to the frequency axis. This MDCT
For more information, see the document "Subband / Transform Coding Using Fil," which uses filter bank design based on time-domain aliasing cancellation.
ter Bank Designs Based on Time Domain Aliasing Can
cellation, "JPPrincen ABBradley, Univ. of Surr
ey Royal Melbourne Inst. of Tech. ICASSP 1987).

【0005】更に、周波数帯域分割された各周波数成分
を量子化する場合の周波数分割幅としては、例えば人間
の聴覚特性を考慮した帯域分割がある。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
ほど帯域幅が広くなるような帯域幅で、オーディオ信号
を複数(例えば25バント)の帯域に分割することがあ
る。また、この時の各帯域毎のデータを符号化する際に
は、各帯域毎に所定のビット配分或いは、各帯域毎に適
応的なビット配分による符号化が行われる。例えば、上
記MDCT処理されて得られたMDCT係数データを上
記ビット配分によって符号化する際には、上記各ブロッ
ク毎のMDCT処理により得られる各帯域毎のMDCT
係数データに対して、適応的な配分ビット数で符号化が
行われることになる。
Further, as a frequency division width when quantizing each frequency component divided into frequency bands, for example, there is a band division in consideration of human auditory characteristics. That is, an audio signal may be divided into a plurality of bands (for example, 25 bands) with a bandwidth such that a higher band generally called a critical band (critical band) has a wider bandwidth. When encoding data for each band at this time, predetermined bits are allocated to each band, or encoding is performed by adaptive bit allocation to each band. For example, when the MDCT coefficient data obtained by the MDCT processing is encoded by the bit allocation, the MDCT coefficient for each band obtained by the MDCT processing for each block is used.
Coding is performed on the coefficient data with an adaptive number of allocated bits.

【0006】上記ビット配分手法及びそのための装置と
しては、次の2手法及び装置が知られている。例えば、
文献「音声信号の適応変換符号化」("Adaptive Transf
ormCoding of Speech Signals", IEEE Transactions of
Accoustics, Speech, andSignal Processing, vol.ASS
P-25, No.4, August 1977 )では、各帯域毎の信号の大
きさをもとに、ビット割当を行っている。また、例えば
文献「臨界帯域符号化器 −聴覚システムの知覚の要求
に関するディジタル符号化」("The critical band cod
er --digital encoding of the perceptual requireme
nts of the auditory system", M.A.Kransner MIT, ICA
SSP 1980)では、聴覚マスキングを利用することで、各
帯域毎に必要な信号対雑音比を得て固定的なビット割当
を行う手法及び装置が述べられている。
The following two methods and devices are known as the above-mentioned bit allocation method and a device therefor. For example,
Reference "Adaptive Transf Coding of Speech Signal"("Adaptive Transf
ormCoding of Speech Signals ", IEEE Transactions of
Accoustics, Speech, andSignal Processing, vol.ASS
In P-25, No. 4, August 1977), bits are allocated based on the magnitude of the signal for each band. In addition, for example, the document “Critical band encoder—Digital encoding for perceptual requirements of auditory system” (“The critical band cod
er --digital encoding of the perceptual requireme
nts of the auditory system ", MAKransner MIT, ICA
SSP 1980) describes a method and apparatus for obtaining a required signal-to-noise ratio for each band and performing fixed bit allocation by using auditory masking.

【0007】[0007]

【発明が解決しようとする課題】ところで、上述した従
来の高能率符号化手法及び装置において、各帯域毎に適
応的なビット配分量を算出した場合は、全量子化ブロッ
クの総ビット数が既定のビットレートと同等のビット数
になることが少なく、ほとんどの場合既定ビットレート
と同等のビット数にするためのビット端数調整が必要と
なる。このビット端数調整においては、例えば単純に周
波数に依存した優先順位によりビット端数調整が行われ
ることになるため、入力信号に対しより適応したビット
端数調整を行うことができない。そのため、特に例えば
ビットレートが低く使用可能なビット数が少ない場合に
は、聴感上良好な音質を得ることができない。
In the above-described conventional high-efficiency coding method and apparatus, when the adaptive bit allocation amount is calculated for each band, the total number of bits of all the quantized blocks is fixed. The number of bits is unlikely to be equal to the bit rate of the bit rate, and in most cases, it is necessary to adjust the bit fraction to make the number of bits equal to the predetermined bit rate. In this bit fraction adjustment, for example, the bit fraction adjustment is simply performed according to the priority order depending on the frequency, and therefore, the bit fraction adjustment more suitable for the input signal cannot be performed. Therefore, particularly when the bit rate is low and the number of usable bits is small, for example, good sound quality cannot be obtained in terms of audibility.

【0008】本発明は、このような実情に鑑みてなされ
たものであり、聴覚特性をより活かした効率の良い高能
率符号化方法及び装置、並びに伝送媒体の提供を行い、
低ビットレートにおける音質劣化防止、及び同一ビット
レートにおける音質向上を目的とする。
[0008] The present invention has been made in view of such circumstances, and provides an efficient and highly efficient encoding method and apparatus utilizing the auditory characteristics, and a transmission medium.
The purpose is to prevent sound quality deterioration at a low bit rate and to improve sound quality at the same bit rate.

【0009】[0009]

【課題を解決するための手段】本発明の高能率符号化方
法及び装置は、入力信号を複数の周波数帯域成分に分解
し、上記周波数帯域成分を時間と周波数とに関して分割
した複数の2次元ブロック毎に当該周波数帯域成分に応
じて量子化に必要なビット配分情報を小数値として求
め、求めた上記ビット配分情報を丸め処理して各2次元
ブロック毎の整数値のビット配分量を算出し、上記各2
次元ブロック毎に算出されたビット配分量を、既定のビ
ットレートにより定まるビット量と同等になるよう調整
し、各2次元ブロックのビット配分量を決定し、決定し
た上記ビット配分量に応じて、上記2次元ブロック毎に
上記周波数帯域成分の量子化を行うものであり、上記ビ
ット配分量を決定する際に、上記2次元ブロック毎に算
出したビット配分量の総和が既定ビットレートにより定
まるビット量と同等でないときには、上記ビット配分量
算出ステップにおける丸め処理の情報に基づいて、上記
ビット配分量の調整を行うことにより、上述の目的を達
成する。
SUMMARY OF THE INVENTION A high efficiency coding method and apparatus according to the present invention decomposes an input signal into a plurality of frequency band components and divides the frequency band components with respect to time and frequency into a plurality of two-dimensional blocks. In each case, bit allocation information required for quantization is obtained as a decimal value according to the frequency band component, and the obtained bit allocation information is rounded to calculate a bit allocation amount of an integer value for each two-dimensional block, Each of the above 2
The bit allocation amount calculated for each dimensional block is adjusted to be equal to the bit amount determined by the predetermined bit rate, the bit allocation amount for each two-dimensional block is determined, and according to the determined bit allocation amount, The frequency band component is quantized for each of the two-dimensional blocks, and when determining the bit allocation amount, the total bit allocation amount calculated for each of the two-dimensional blocks is determined by a predetermined bit rate. If not equal to the above, the above object is achieved by adjusting the bit allocation amount based on the information of the rounding process in the bit allocation amount calculation step.

【0010】ここで、本発明の高能率符号化方法及び装
置において、上記ビット配分量を決定する際に、上記2
次元ブロック毎に算出したビット配分量の総和が既定ビ
ットレートにより定まるビット量より多いときには、上
記ビット配分量算出ステップにおいて切り上げが行われ
た2次元ブロックに対応するビット数が優先的に削減さ
れる。また、上記ビット配分量を決定する際に、上記2
次元ブロック毎に算出したビット配分量の総和が既定ビ
ットレートにより定まるビット量より少ないときには、
上記ビット配分量算出ステップにおいて切り捨てが行わ
れた2次元ブロックに対応するビット数が優先的に増加
される。
In the high-efficiency encoding method and apparatus according to the present invention, when determining the bit allocation amount,
When the total bit allocation amount calculated for each dimension block is larger than the bit amount determined by the predetermined bit rate, the number of bits corresponding to the two-dimensional block rounded up in the bit allocation amount calculation step is preferentially reduced. . Also, when determining the bit allocation amount, the above 2
When the sum of the bit allocation amounts calculated for each dimension block is smaller than the bit amount determined by the default bit rate,
The number of bits corresponding to the two-dimensional block that has been truncated in the bit allocation amount calculation step is preferentially increased.

【0011】さらに、本発明の高能率符号化方法及び装
置においては、上記丸め処理の情報として、上記ビット
配分量を算出する際の切り上げ及び/又は切り捨て処理
に関する情報を用いるようにしている。また、上記丸め
処理の情報として、上記ビット配分量を算出する際のビ
ット配分情報の小数点以下の桁の数値を用いることも行
う。
Further, in the high-efficiency encoding method and apparatus of the present invention, information on round-up and / or round-down processing when calculating the bit allocation amount is used as the information on the rounding processing. In addition, as the information of the rounding processing, a numerical value of a digit after the decimal point of the bit allocation information when calculating the bit allocation amount is also used.

【0012】また、本発明の伝送媒体は、高能率符号化
方法により圧縮符号化された入力信号を伝送する伝送媒
体であって、上記入力信号を複数の周波数帯域成分に分
解し、上記周波数帯域成分を時間と周波数とに関して分
割した複数の2次元ブロック毎に当該周波数帯域成分に
応じて量子化に必要なビット配分情報を小数値として求
め、求めた上記ビット配分情報を丸め処理して各2次元
ブロック毎の整数値のビット配分量を算出し、上記各2
次元ブロック毎に算出されたビット配分量を、既定のビ
ットレートにより定まるビット量と同等になるよう調整
することにより各2次元ブロックのビット配分量を決定
し、決定した上記ビット配分量に応じて、上記2次元ブ
ロック毎に上記周波数帯域成分の量子化を行う際に、上
記2次元ブロック毎に算出したビット配分量の総和が既
定ビットレートにより定まるビット量と同等でないとき
には、上記ビット配分量の算出時に行った丸め処理の情
報に基づいて、上記ビット配分量の調整を行って各2次
元ブロックのビット配分量を決定する呼応能率符号化方
法により圧縮符号化された信号を伝送することにより、
上述の目的を達成する。
A transmission medium according to the present invention is a transmission medium for transmitting an input signal compressed and encoded by a high-efficiency encoding method, wherein the input signal is decomposed into a plurality of frequency band components, and For each of a plurality of two-dimensional blocks obtained by dividing the component with respect to time and frequency, bit allocation information necessary for quantization is obtained as a decimal value in accordance with the frequency band component, and the obtained bit allocation information is rounded to obtain 2 bits. The bit allocation amount of the integer value for each dimension block is calculated, and
The bit allocation amount calculated for each two-dimensional block is determined by adjusting the bit allocation amount calculated for each dimensional block to be equal to the bit amount determined by the predetermined bit rate, and according to the determined bit allocation amount. When performing quantization of the frequency band component for each of the two-dimensional blocks, if the sum of the bit allocation amounts calculated for each of the two-dimensional blocks is not equal to the bit amount determined by a predetermined bit rate, Based on the information of the rounding process performed at the time of calculation, by adjusting the bit allocation amount and transmitting a signal that has been compression-encoded by a convergence efficiency coding method of determining the bit allocation amount of each two-dimensional block,
Achieve the above objectives.

【0013】[0013]

【0014】[0014]

【0015】[0015]

【作用】本発明によれば、2次元ブロック毎に算出した
小数部を持つビット情報を、整数化する際に、施される
丸め処理の情報を考慮してビットの端数調整を行い、各
2次元ブロックのビット配分量を決定することにより、
聴感特性をより活かした効率の良いビット配分を行うこ
とができ、ブロックフローティング効率を落とすことの
ない、効率的な圧縮を行うことが可能となる。
According to the present invention, when converting bit information having a decimal part calculated for each two-dimensional block into an integer, the fraction of the bits is adjusted in consideration of the information of the rounding processing to be performed. By determining the bit allocation of the dimension block,
Efficient bit allocation can be performed by making better use of the auditory characteristics, and efficient compression can be performed without lowering the block floating efficiency.

【0016】以上のことにより、同一のビットレートに
おいてより良好な音質を得ることが可能となる。また、
同等の音質を得るために、より低いビットレートで実施
可能となる。
As described above, it is possible to obtain better sound quality at the same bit rate. Also,
In order to obtain the same sound quality, it can be performed at a lower bit rate.

【0017】[0017]

【実施例】以下、図面を参照し、本発明の実施例につい
て説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0018】本実施例では、オーディオPCM信号等の
入力ディジタル信号を、帯域分割符号化(SBC)、適
応変換符号化(ATC)、及び適応ビット配分(APC
−AB)の各技術を用いて高能率符号化する。この技術
について、図1を参照しながら説明する。
In this embodiment, an input digital signal such as an audio PCM signal is subjected to band division coding (SBC), adaptive conversion coding (ATC), and adaptive bit allocation (APC).
-Efficient coding is performed using each of the techniques of AB). This technique will be described with reference to FIG.

【0019】図1に示す本発明の高能率符号化方法が適
用される実施例の具体的な高能率符号化装置では、入力
ディジタル信号をフィルタなどにより複数の周波数帯域
に分割すると共に、各周波数帯域毎に直交変換を行っ
て、得られた周波数軸のスペクトルデータを、後述する
人間の聴覚特性を考慮したいわゆる臨界帯域幅(クリテ
ィカルバンド)毎に適応的にビット配分して符号化して
いる。この時、高域では臨界帯域幅を更に分割した帯域
を用いる。もちろんフィルタなどによる非ブロッキング
の周波数分割幅は、等分割幅としてもよい。
In a specific high-efficiency encoding apparatus to which the high-efficiency encoding method of the present invention shown in FIG. 1 is applied, an input digital signal is divided into a plurality of frequency bands by a filter or the like, and each frequency band is divided into a plurality of frequency bands. The orthogonal transform is performed for each band, and the obtained spectrum data on the frequency axis is adaptively bit-distributed and encoded for each so-called critical bandwidth (critical band) in consideration of human auditory characteristics described later. At this time, in the high band, a band obtained by further dividing the critical bandwidth is used. Of course, a non-blocking frequency division width by a filter or the like may be an equal division width.

【0020】さらに、本発明実施例においては、直交変
換の前に入力信号に応じて適応的にブロックサイズ(直
交変換のブロック長)を変化させると共に、クリティカ
ルバンド単位若しくは高域では臨界帯域幅(クリティカ
ルバンド)を更に細分化したブロック(2次元ブロッ
ク)でフローティング処理を行っている。なお、このク
リティカルバンドとは、人間の聴覚特性を考慮して分割
された周波数帯域であり、ある純音の周波数近傍の同じ
強さの狭帯域バンドノイズによって当該純音がマスクさ
れるときのそのノイズの持つ帯域のことである。このク
リティカルバンドは、高域ほど帯域幅が広くなってお
り、例えば0〜20kHzの全周波数帯域は例えば25
のクリティカルバンドに分割されている。
Furthermore, in the embodiment of the present invention, the block size (orthogonal transform block length) is adaptively changed according to the input signal before the orthogonal transform, and the critical bandwidth (the critical bandwidth in the critical band unit or high band) is changed. Floating processing is performed on blocks (two-dimensional blocks) obtained by further subdividing critical bands. Note that this critical band is a frequency band divided in consideration of human auditory characteristics, and the narrow band noise of the same intensity near the frequency of a certain pure tone masks the noise when the pure tone is masked. It is the band that you have. In this critical band, the higher the frequency band, the wider the bandwidth. For example, the entire frequency band of 0 to 20 kHz is 25, for example.
Has been divided into critical bands.

【0021】すなわち、図1において、入力端子10に
は例えば0〜22kHzのオーディオPCM信号が供給
されている。この入力信号は、例えばいわゆるQMFな
どの帯域分割フィルタ11により0〜11kHz帯域と
11k〜22kHz帯域とに分割され、0〜11kHz
帯域の信号は同じくいわゆるQMF等の帯域分割フィル
タ12により0〜5.5kHz帯域と5.5k〜11k
Hz帯域とに分割される。
That is, in FIG. 1, an audio PCM signal of, for example, 0 to 22 kHz is supplied to the input terminal 10. This input signal is divided into a band of 0 to 11 kHz and a band of 11 to 22 kHz by a band division filter 11 such as a so-called QMF, for example.
The band signals are also divided by a band division filter 12, such as a so-called QMF, into a band of 0 to 5.5 kHz and a band of 5.5 to 11 k.
Hz band.

【0022】上記帯域分割フィルタ11からの11k〜
22kHz帯域の信号は、直交変換回路の一例であるM
DCT(Modified Discrete Cosine Transform)回路1
3に送られ、上記帯域分割フィルタ12からの5.5k
〜11kHz帯域の信号はMDCT回路14に送られ、
上記帯域分割フィルタ12からの0〜5.5kHz帯域
の信号はMDCT回路15に送られることにより、それ
ぞれMDCT処理される。なお、各MDCT回路13〜
15では、各帯域毎に設けたブロック決定回路19、2
0、21により決定されたブロックサイズに基づいてM
DCT処理がなされる。
11k from the band division filter 11
The signal in the 22 kHz band is represented by M which is an example of an orthogonal transformation circuit.
DCT (Modified Discrete Cosine Transform) circuit 1
5.5k from the band division filter 12
The signal in the ~ 11 kHz band is sent to the MDCT circuit 14,
The signals in the 0 to 5.5 kHz band from the band division filter 12 are sent to the MDCT circuit 15 to be subjected to the MDCT processing. Note that each of the MDCT circuits 13 to
In the block 15, the block decision circuits 19, 2 provided for each band are used.
M based on the block size determined by 0,21
DCT processing is performed.

【0023】ここで、上記ブロック決定回路19〜21
により決定される各MDCT回路13〜15でのブロッ
クサイズの具体例を図2の(A)及び(B)に示す。な
お、図2の(A)には直交変換ブロックサイズが長い場
合(ロングモードにおける直交変換ブロックサイズ)
を、図2の(B)には直交変換ブロックサイズが短い場
合(ショートモードにおける直交変換ブロックサイズ)
を示している。
Here, the above-mentioned block decision circuits 19 to 21
FIGS. 2A and 2B show specific examples of the block size in each of the MDCT circuits 13 to 15 determined by the equation (1). FIG. 2A shows a case where the orthogonal transform block size is long (orthogonal transform block size in the long mode).
FIG. 2B shows a case where the orthogonal transform block size is short (orthogonal transform block size in the short mode).
Is shown.

【0024】この図2の具体例においては、3つのフィ
ルタ出力は、それぞれ2つの直交変換ブロックサイズを
持つ。すなわち、低域側の0〜5.5kHz帯域の信号
及び中域の5.5k〜11kHz帯域の信号に対して
は、長いブロック長の場合(図2の(A))は1ブロッ
ク内のサンプル数を128サンプルとし、短いブロック
が選ばれた場合(図2の(B))には1ブロック内のサ
ンプル数を32サンプル毎のブロックとしている。これ
に対して高域側の11k〜22kHz帯域の信号に対し
ては、長いブロック長の場合(図2の(A))は1ブロ
ック内のサンプル数を256サンプルとし、短いブロッ
クが選ばれた場合(図2の(B))には1ブロック内の
サンプル数を32サンプル毎のブロックとしている。こ
のようにして短いブロックが選ばれた場合には各帯域の
直交変換ブロックのサンプル数を同じとして高域程時間
分解能を上げ、なおかつブロック化に使用するウインド
ウの種類を減らしている。
In the specific example of FIG. 2, each of the three filter outputs has two orthogonal transform block sizes. That is, for a signal in the 0-5.5 kHz band on the low band side and a signal in the 5.5 kHz-11 kHz band in the middle band, in the case of a long block length ((A) in FIG. The number is 128 samples, and when a short block is selected (FIG. 2B), the number of samples in one block is a block for every 32 samples. On the other hand, for a signal in the 11 kHz to 22 kHz band on the high frequency side, in the case of a long block length ((A) in FIG. 2), the number of samples in one block is 256, and a short block is selected. In the case ((B) of FIG. 2), the number of samples in one block is a block for every 32 samples. When a short block is selected in this way, the number of samples of the orthogonal transform block in each band is kept the same, and the higher the frequency, the higher the time resolution and the type of window used for blocking.

【0025】再び図1において、上記ブロック決定回路
19〜21で決定されたブロックサイズを示す情報は、
後述の適応ビット割当符号化回路16、17、18に送
られると共に、出力端子23、25、27から出力され
る。
Referring again to FIG. 1, the information indicating the block size determined by the block determination circuits 19 to 21 is as follows.
The signals are sent to adaptive bit assignment encoding circuits 16, 17, and 18 to be described later, and are also output from output terminals 23, 25, and 27.

【0026】各MDCT回路13〜15にてMDCT処
理されて得られた周波数領域のスペクトルデータあるい
はMDCT係数データは、いわゆる臨界帯域(クリティ
カルバンド)または高域では更にクリティカルバンドを
分割した帯域毎にまとめられて適応ビット割当符号化回
路16〜18に送られている。
The spectrum data or the MDCT coefficient data in the frequency domain obtained by the MDCT processing in each of the MDCT circuits 13 to 15 are grouped into a so-called critical band (critical band) or a band obtained by further dividing the critical band in a high band. And sent to the adaptive bit allocation encoding circuits 16-18.

【0027】適応ビット割当符号化回路16〜18で
は、上記ブロックサイズの情報、及び臨界帯域(クリテ
ィカルバンド)または高域では更にクリティカルバンド
を分割した帯域毎に割り当てられたビット数に応じて各
スペクトルデータ(あるいはMDCT係数データ)を再
量子化(正規化して量子化)するようにしている。
In the adaptive bit allocation coding circuits 16 to 18, each spectrum is determined according to the information on the block size and the number of bits allocated to each critical band (critical band) or the critical band in the high band. The data (or MDCT coefficient data) is requantized (normalized and quantized).

【0028】これら各適応ビット割当符号化回路16〜
18によって符号化されたデータは、出力端子22、2
4、26を介して取り出される。また、当該適応ビット
割当符号化回路16〜18では、どのような信号の大き
さに関する正規化がなされたかを示すスケールファクタ
と、どのようなビット長で量子化がされたかを示すビッ
ト長情報も求めており、これらも同時に出力端子22、
24、26から出力される。
Each of these adaptive bit allocation encoding circuits 16 to
The data encoded by 18 is output to output terminals 22, 2
It is taken out via 4, 26. The adaptive bit allocation encoding circuits 16 to 18 also include a scale factor indicating what kind of signal size has been normalized and bit length information indicating what kind of bit length has been used for quantization. At the same time, the output terminal 22,
24 and 26.

【0029】また、図1における各MDCT回路13〜
15の出力からは、上記臨界帯域(クリティカルバン
ド)または高域では更にクリティカルバンドを分割した
帯域毎のエネルギを、例えば当該バンド内での各振幅値
の2乗平均の平方根を計算すること等により求められ
る。もちろん、上記スケールファクタそのものを以後の
ビット配分の為に用いるようにしてもよい。この場合に
は新たなエネルギ計算の演算が不要となるため、ハード
規模の節約となる。また、各バンド毎のエネルギの代わ
りに、振幅値のピーク値、平均値等を用いることも可能
である。
Each of the MDCT circuits 13 to 13 in FIG.
From the output of No. 15, the energy of each band obtained by further dividing the critical band in the critical band or the high band is calculated, for example, by calculating the root mean square of each amplitude value in the band. Desired. Of course, the scale factor itself may be used for subsequent bit allocation. In this case, a new calculation for energy calculation is not required, so that the hardware scale is saved. Further, instead of the energy for each band, a peak value, an average value, or the like of the amplitude values can be used.

【0030】次に、適応ビット割当符号化回路16〜1
8における上記ビット配分の具体的な手法を説明する。
Next, the adaptive bit allocation coding circuits 16-1
8 will be described.

【0031】この場合の適応ビット割当符号化回路の動
作を図3で説明するとMDCT係数の大きさが各ブロッ
ク毎に求められ、そのMDCT係数が入力端子801に
供給される。当該入力端子801に供給されたMDCT
係数は、帯域毎のエネルギ算出回路803及びスペクト
ルのなめらかさ算出回路808に与えられる。帯域毎の
エネルギ算出回路803では、クリティカルバンドまた
は高域においてはクリティカルバンドを更に再分割した
それぞれの帯域に関する信号エネルギを算出する。帯域
毎のエネルギ算出回路803で算出されたそれぞれの帯
域に関するエネルギは、エネルギ依存ビット配分回路8
04、及びスペクトルのなめらかさ算出回路808に供
給される。
The operation of the adaptive bit allocation encoding circuit in this case will be described with reference to FIG. 3. The magnitude of the MDCT coefficient is obtained for each block, and the MDCT coefficient is supplied to the input terminal 801. MDCT supplied to the input terminal 801
The coefficient is provided to the energy calculation circuit 803 for each band and the smoothness calculation circuit 808 of the spectrum. The energy calculation circuit 803 for each band calculates the signal energy for each band obtained by further subdividing the critical band in the critical band or the high band. The energy for each band calculated by the energy calculation circuit 803 for each band is stored in the energy-dependent bit distribution circuit 8.
04 and the smoothness calculating circuit 808 for the spectrum.

【0032】エネルギ依存ビット配分回路804では、
帯域毎エネルギ算出回路803からのエネルギ、及び使
用可能総ビット発生回路802からの使用可能総ビット
を用いて、入力信号のエネルギに依存したビット配分
を、本実施例では128kbpsの内のある割合を用い
て行う。入力信号のトーナリティが高い程、すなわち入
力信号のスペクトラムの凹凸が大きい程、このビット量
が上記128kbpsに占める割合が増加する。なお、
入力信号の凹凸を検出するには、隣接するブロックのブ
ロックフローティング係数の差の絶対値の和を指標とし
て使う。そして、求められた使用可能なビット量につ
き、各帯域のエネルギの対数値に比例したビット配分を
行う。
In the energy-dependent bit distribution circuit 804,
Using the energy from the per-band energy calculation circuit 803 and the total available bits from the total available bits generation circuit 802, a bit distribution depending on the energy of the input signal is calculated. Perform using The higher the tonality of the input signal, that is, the greater the unevenness of the spectrum of the input signal, the greater the ratio of this bit amount to the above 128 kbps. In addition,
To detect the unevenness of the input signal, the sum of the absolute values of the differences between the block floating coefficients of adjacent blocks is used as an index. Then, for the determined available bit amount, bit allocation is performed in proportion to the logarithmic value of the energy of each band.

【0033】聴覚許容雑音レベルに依存したビット配分
算出回路805は、まず上記クリティカルバンド毎に分
割されたスペクトルデータに基づき、いわゆるマスキン
グ効果等を考慮した各クリティカルバンド毎の許容ノイ
ズ量を求め、次に聴覚許容雑音スペクトルを与えるよう
に使用可能総ビットからエネルギ依存ビットを引いたビ
ット分が配分される。
The bit allocation calculating circuit 805 depending on the permissible noise level of the hearing first calculates the permissible noise amount for each critical band in consideration of the so-called masking effect and the like based on the spectrum data divided for each critical band. Are allocated by subtracting the energy-dependent bits from the total available bits so as to give the permissible noise spectrum.

【0034】このようにして求められたエネルギ依存の
ビット数と聴覚許容雑音レベルに依存したビット数は加
算器806において加算され、1次ビット配分回路81
5に供給される。
The number of energy-dependent bits and the number of bits depending on the permissible noise level obtained in this way are added in an adder 806, and the primary bit distribution circuit 81
5 is supplied.

【0035】1次ビット配分回路815では、加算器8
06からの各2次元ブロック(以下量子化のための2次
元ブロックを特に量子化ブロックと呼ぶ)に対応する小
数部を持つビット情報を整数のビット値に変換し、一時
的なビットの配分を行う。
In the primary bit distribution circuit 815, the adder 8
The bit information having a decimal part corresponding to each of the two-dimensional blocks starting from 06 (hereinafter, the two-dimensional block for quantization is particularly referred to as a quantization block) is converted into an integer bit value, and the temporary bit allocation is performed. Do.

【0036】本実施例の加算器806の入力、言い換え
ると乗算器811、812の出力におけるビット情報
は、小数部を持つことが可能である。このことにより、
該当する量子化ブロックに対するビット配分量をより精
緻に求めることが可能となる。
The bit information at the input of the adder 806 of the present embodiment, in other words, the output of the multipliers 811 and 812 can have a decimal part. This allows
It is possible to obtain the bit allocation amount for the corresponding quantized block more precisely.

【0037】具体的な説明を図3を用いて行う。ある1
つの量子化ブロックだけに着目すると例えば、エネルギ
依存のビット配分回路804の出力が2ビット、聴覚許
容雑音レベル依存のビット配分回路805の出力が1ビ
ット、ビット分割率決定回路809の出力のうち、エネ
ルギ依存のビット配分回路804の方への出力が0.
7、聴覚許容雑音レベル依存のビット配分回路805の
方への出力が0.3となっている場合、乗算器811の
出力は1.4ビット、乗算器812の出力は0.3ビッ
トとなる。本実施例のように小数部の値を保持したまま
加算器806で足し合わせると、加算器806の出力は
1.7ビットとなり、その後1次ビット配分回路815
において整数に変換され、この量子化ブロックに対する
1次ビット配分量は2ビットになる。もし例えば、加算
器806の入力が小数部を持たないような構成だった場
合、乗算器811、812の出力は、例えば第一小数点
の値が四捨五入され整数に変換される。例えば上記例で
は、乗算器811の出力1.4ビットは1ビットに、乗
算器812の出力1.7ビットは2ビット、というよう
な整数に変換される。これらの整数を加算器806で足
し合わせると、加算器806の出力、つまり1次ビット
配分量は3ビットになる。上記例を比較すれば明らかな
ように、小数部を保持したまま1次ビット割当量を決定
することにより、入力信号に適応したビット配分量をよ
り精緻に算出することができる。
A specific description will be given with reference to FIG. One
Focusing on only one quantization block, for example, the output of the energy-dependent bit allocation circuit 804 is 2 bits, the output of the bit allocation circuit 805 depending on the permissible noise level is 1 bit, and among the outputs of the bit division ratio determination circuit 809, The output to the energy dependent bit distribution circuit 804 is 0.
7. If the output to the bit allocation circuit 805 depending on the permissible noise level is 0.3, the output of the multiplier 811 is 1.4 bits and the output of the multiplier 812 is 0.3 bits. . When the values of the decimal part are held and added by the adder 806 as in the present embodiment, the output of the adder 806 becomes 1.7 bits, and thereafter, the primary bit distribution circuit 815
Is converted to an integer, and the primary bit allocation amount for this quantized block becomes 2 bits. For example, if the input of the adder 806 has no decimal part, the outputs of the multipliers 811 and 812 are converted to integers by rounding off the value of the first decimal point, for example. For example, in the above example, 1.4 bits of the output of the multiplier 811 are converted into 1 bit, and 1.7 bits of the output of the multiplier 812 are converted into 2 bits. When these integers are added by the adder 806, the output of the adder 806, that is, the primary bit allocation amount becomes 3 bits. As is clear from comparison of the above examples, by determining the primary bit allocation amount while retaining the decimal part, the bit allocation amount adapted to the input signal can be calculated more precisely.

【0038】なお、加算器806の入力におけるビット
情報が小数部を持たない構成を持つ場合には、各乗算器
及び加算器における計算量が少なくなり、且つ、乗算器
811、812の出力及び加算器806の入力における
端子及び伝送路の幅等を減らすことができるので、ハー
ドウェア規模を小さくすることが可能である。
If the bit information at the input of the adder 806 does not have a decimal part, the amount of calculation in each multiplier and adder is reduced, and the outputs and additions of the multipliers 811 and 812 are reduced. Since the width of the terminal and the transmission line at the input of the device 806 can be reduced, the hardware scale can be reduced.

【0039】上記のように1次ビット配分回路815に
おいて、小数部を保持した各量子化ブロック毎のビット
情報が整数に変換される。図4を用いて説明すると、図
中L1で示す小数部を持った各量子化ブロック毎のビッ
ト情報は、整数値へと丸められ、図中L2で示す整数の
ビット数へと変換される。例えば、図中の量子化ブロッ
クB1では3.7ビットというビット情報が、小数点第
一位の桁が四捨五入されて整数の4ビットに丸められて
いる。なお、この図4における丸め処理は、丸めにおけ
る誤差が最も小さくなるように四捨五入を用いている
が、例えばしきい値を変えて3以下を切り捨て4以上を
切り上げる等の異なる丸め処理を行うことも可能であ
る。
As described above, in the primary bit distribution circuit 815, the bit information for each quantized block holding the decimal part is converted into an integer. Referring to FIG. 4, bit information for each quantized block having a decimal part indicated by L1 in the figure is rounded to an integer value, and is converted into an integer bit number indicated by L2 in the figure. For example, in the quantization block B1 in the figure, the bit information of 3.7 bits is rounded to an integer of 4 bits by rounding off the first decimal place. Note that the rounding process in FIG. 4 uses rounding to minimize the rounding error. However, different rounding processes such as changing the threshold value, rounding down 3 or less, and rounding up 4 or more may be performed. It is possible.

【0040】1次ビット配分回路815は、この整数へ
の丸め処理において、切り上げ又は切り捨てのどちらの
処理が行われたかという丸め情報を、メモリ816へ出
力する。
The primary bit distribution circuit 815 outputs to the memory 816 rounding information indicating whether rounding up or rounding down has been performed in the rounding process to the integer.

【0041】メモリ816は、1次ビット配分回路81
5からの、各量子化ブロック毎の切り上げ又は切り捨て
のどちらかを表す丸め情報を一時的に保持し、ビット端
数調整回路814へ出力する。このメモリ816の容量
は、1つの量子化ブロックに対して1ビット分用意す
る。例えば図4の場合には、8つの量子化ブロックを持
つので、メモリ816は8ビットの容量を持つ。
The memory 816 includes a primary bit distribution circuit 81
5 temporarily holds rounding information indicating either rounding up or rounding down for each quantization block, and outputs the rounding information to the bit fraction adjusting circuit 814. The memory 816 has a capacity of one bit for one quantization block. For example, in the case of FIG. 4, since there are eight quantization blocks, the memory 816 has a capacity of 8 bits.

【0042】ビット端数調整回路814では、1次ビッ
ト配分回路815からの各量子化ブロックに対するビッ
ト数、メモリ816からの丸め情報、及び使用可能総ビ
ット発生回路802からの使用可能総ビットを用いて、
本実施例では128kbpsのビットレートに合致する
ようにビットの端数調整を行う。1次ビット配分回路8
15出力時における使用総ビット数、つまりビットレー
トは、各量子化ブロック毎に算出されたビット数である
ため、ほとんどの場合、使用可能総ビット発生回路80
2が出力する使用可能総ビット数とは合致していない。
そのため既定のビットレート、本実施例では128kb
psに合致させるために、ビット端数調整回路814が
必要となる。
The bit fraction adjusting circuit 814 uses the number of bits for each quantized block from the primary bit distribution circuit 815, the rounding information from the memory 816, and the total available bits from the total available bit generation circuit 802. ,
In this embodiment, the fraction of bits is adjusted so as to match the bit rate of 128 kbps. Primary bit distribution circuit 8
Since the total number of bits used, ie, the bit rate, at the time of outputting 15 is the number of bits calculated for each quantization block, in most cases, the total available bit generation circuit 80
2 does not match the total number of available bits output.
Therefore, a predetermined bit rate, 128 kb in this embodiment.
To match ps, a bit fraction adjustment circuit 814 is required.

【0043】例えば、1次ビット配分回路815の出力
が既定のビットレートを越えるビット数になっている場
合、音質に対して聴感上最も影響を及ばさない帯域か
ら、例えば図5の(A)に示すように最も高域側のブロ
ックから低域側に向かって順次1ビットずつ減少させる
方法、又、図5の(B)に示すように最も高域側のブロ
ックから配分ビット数を0にする、つまり帯域制限を行
う方法等がある。図5について補足説明すると、図5の
(A)、(B)共に4ビット分の削減を行っており、斜
線で示した箇所がその削減したビットを示している。
For example, when the output of the primary bit distribution circuit 815 has a number of bits exceeding the predetermined bit rate, the band having the least influence on the sound quality from the viewpoint of the audibility is, for example, shown in FIG. As shown in FIG. 5, a method of sequentially decreasing one bit at a time from the highest frequency block to the low frequency side, or reducing the number of allocated bits from the highest frequency block to 0 as shown in FIG. That is, there is a method of performing band limitation. 5A and 5B, four bits are reduced for each of FIGS. 5A and 5B, and the hatched portions indicate the reduced bits.

【0044】本実施例のビット端数調整回路814で
は、メモリ816からの各量子化ブロック毎の丸め情報
を用い、切り上げを行った量子化ブロックに対し優先的
に高域側から低域側に向かって1ビットずつ削減する方
法を用いて128kbpsと同等のビットレートになる
ように端数調整を行う。図6を用いて説明すると、図4
同様、図6中のL1は1次ビット配分回路815に入力
される小数部を持つビット情報を示し、L2はそのビッ
ト情報を1次ビット配分回路815内で四捨五入によっ
て整数に変換されたビット数を示す。この図6を見れば
明らかなように、丸め処理によって切り上げが行われた
量子化ブロックは、ブロックB3、B5、B6、B8で
あり、逆に切り捨てが行われた量子化ブロックは、ブロ
ックB1、B2、B4、B7である。これらの丸めに関
する情報はメモリ816に記録されている。ビット端数
調整回路814ではこのメモリ816からの丸め情報を
用い、切り上げが行われた量子化ブロックに対し、高域
側から低域側に向かって順次1ビットずつ削減を行う。
The bit fraction adjusting circuit 814 of this embodiment uses the rounding information for each quantized block from the memory 816 and preferentially goes from the high-frequency side to the low-frequency side for the rounded-up quantized block. The fraction is adjusted so that the bit rate becomes equal to 128 kbps by using the method of reducing one bit at a time. Referring to FIG. 6, FIG.
Similarly, L1 in FIG. 6 indicates bit information having a decimal part input to the primary bit allocation circuit 815, and L2 indicates the number of bits obtained by converting the bit information into an integer by rounding in the primary bit allocation circuit 815. Is shown. As is clear from FIG. 6, the quantized blocks rounded up by the rounding process are blocks B3, B5, B6, and B8, and the quantized blocks rounded down are blocks B1, B2, B4, and B7. Information about these roundings is recorded in the memory 816. The bit fraction adjustment circuit 814 uses the rounding information from the memory 816 to sequentially reduce the rounded-up quantized block by one bit from the high-frequency side to the low-frequency side.

【0045】この図6を用いて具体的なビットの削減手
法を説明する。なお図6では、図5同様、4ビット分の
削減によって既定のビットレートと同等のビット数にな
ると仮定する。
A specific bit reduction method will be described with reference to FIG. In FIG. 6, as in FIG. 5, it is assumed that the number of bits becomes equal to the predetermined bit rate by reducing 4 bits.

【0046】先ず、最も高域側のブロックB8に着目す
ると、メモリ816からの丸め情報によって切り上げが
行われていることが分かるため、1ビット分の削減を行
う。次に隣接する低域側の量子化ブロックB7に着目す
ると、切り捨てが行われているのでビットの削減は行わ
ない。次に隣接する低域側の量子化ブロックB6に着目
し、切り上げが行われているので1ビット分の削減を行
う。この一連の処理を既定のビットレートと同等のビッ
ト数になるまで繰り返す。この結果、ビット数の削減が
行われた箇所を図6中の斜線で示す。なお、例えばこの
処理において、高域側から低域側へ順次ビット数を削減
していき、最も低域側の量子化ブロックB1まで到達
し、さらにビット数削減の必要がある場合には、再度最
も高域側の量子化ブロックB8に戻り、図5の(A)又
は(B)で示した方法でビット削減を行う。
First, focusing on the block B8 on the highest frequency side, it can be seen that rounding up has been performed based on the rounding information from the memory 816, so that one bit is reduced. Next, focusing on the adjacent low-frequency side quantization block B7, since the truncation has been performed, the bit is not reduced. Next, paying attention to the adjacent low-frequency-side quantization block B6, since the rounding has been performed, a reduction of one bit is performed. This series of processing is repeated until the number of bits becomes equal to the predetermined bit rate. As a result, a portion where the number of bits is reduced is indicated by hatching in FIG. In this process, for example, in this process, the number of bits is sequentially reduced from the high frequency side to the low frequency side, and reaches the quantization block B1 on the lowest frequency side. Returning to the quantization block B8 on the highest frequency side, bit reduction is performed by the method shown in FIG. 5 (A) or (B).

【0047】逆に、例えば1次ビット端数調整回路81
4の出力が既定のビットレートを下回るビット数になっ
ている場合、音質に対して聴感上最も影響を及ぼす帯域
から、例えば図7に示すように最も低域側の量子化ブロ
ックから高域側に向かって順次1ビットずつビット数を
増加させる方法等がある。図7では4ビット分の増加を
行っており、斜線で示した箇所がその増加したビットを
示している。
Conversely, for example, the primary bit fraction adjustment circuit 81
In the case where the output of bit No. 4 has a number of bits lower than the predetermined bit rate, the band that has the greatest audibility to the sound quality, for example, as shown in FIG. To increase the number of bits one bit at a time. In FIG. 7, the number of bits is increased by 4 bits, and the shaded portions indicate the increased bits.

【0048】本実施例のビット端数調整回路814で
は、メモリ816からの各量子化ブロック毎の丸め情報
を用い、切り捨てを行った量子化ブロックに対し優先的
に低域側から高域側に向かって1ビットずつ増加する方
法を用いて128kbpsと同等のビットレートになる
ようにビットの端数調整を行う。図8を用いて説明する
と、図4同様、図8中のL1は1次ビット配分回路81
5に入力される小数部を持つビット情報を示し、L2は
そのビット情報を1次ビット配分回路815内で四捨五
入によって整数に変換されたビット数を示す。図6同
様、丸め処理によって切り捨てが行われた量子化ブロッ
クは、ブロックB1、B2、B4、B7である。本実施
例のビット端数調整回路814では、これらの切り捨て
が行われた量子化ブロックに対し、優先的に低域側から
高域側に向かって順次1ビットずつ増加を行う。
The bit fraction adjusting circuit 814 of this embodiment uses the rounding information for each quantized block from the memory 816, and preferentially goes from the low frequency side to the high frequency side with respect to the truncated quantized block. The fraction of bits is adjusted so that the bit rate becomes equal to 128 kbps by using a method of increasing one bit at a time. Referring to FIG. 8, as in FIG. 4, L1 in FIG.
5 indicates bit information having a decimal part, and L2 indicates the number of bits obtained by converting the bit information into an integer by rounding in the primary bit distribution circuit 815. As in FIG. 6, the quantized blocks that have been truncated by the rounding process are blocks B1, B2, B4, and B7. In the bit fraction adjusting circuit 814 of the present embodiment, these truncated quantized blocks are preferentially incremented one bit at a time from the low band to the high band.

【0049】具体的に説明すると、まず図8では図7同
様、4ビット分の増加によって既定のビットレートと同
等のビット数になると仮定する。最も低域側の量子化ブ
ロックB1に着目すると、メモリ816からの丸め情報
によって切り捨てが行われていることが分かるため、1
ビット分の増加を行う。次に隣接する高域側の量子化ブ
ロックB2に着目すると、切り捨てが行われているので
1ビット分の増加を行う。次に隣接する高域側の量子化
ブロックB3に着目すると、切り上げが行われているの
でビットの増加は行わない。この一連の処理を既定のビ
ットレートと同等のビット数になるまで繰り返す。この
結果、ビット数の増加が行われた箇所を図8中の斜線で
示す。なお、例えばこの処理において、低域側から高域
側へ順次ビット数を増加させていき、最も高域側の量子
化ブロックB8まで到達し、さらにビット数増加の必要
がある場合には、再度最も低域側の量子化ブロックB1
に戻り、図7で示した方法でビットの増加を行う。
More specifically, in FIG. 8, as in FIG. 7, it is assumed that the number of bits becomes equal to the predetermined bit rate by an increase of 4 bits. Focusing on the quantization block B1 on the lowest frequency side, it can be seen that truncation is performed by the rounding information from the memory 816.
Increment by bits. Next, paying attention to the adjacent high-frequency side quantization block B2, since the truncation has been performed, an increase of one bit is performed. Next, focusing on the adjacent high-frequency quantization block B3, the bits are not increased because the rounding has been performed. This series of processing is repeated until the number of bits becomes equal to the predetermined bit rate. As a result, a portion where the number of bits is increased is indicated by hatching in FIG. In this processing, for example, in this process, the number of bits is sequentially increased from the low-frequency side to the high-frequency side, and reaches the quantization block B8 on the highest frequency side. Lowest quantization block B1
Then, the number of bits is increased by the method shown in FIG.

【0050】このように、1次ビット配分回路815内
での整数化処理における丸め情報を、ビット端数調整回
路814内での既定ビットレートに合致させるためのビ
ット端数調整に用いることにより、入力信号の性質によ
り適応したビット配分を行うことができ、聴感上良好な
音質を得ることが可能となる。特に、低いビットレート
を用いる場合には、1ビットが持つ音質への影響度が増
すため、有効に作用する。
As described above, the rounding information in the integer conversion processing in the primary bit distribution circuit 815 is used for adjusting the bit fraction to match the predetermined bit rate in the bit fraction adjustment circuit 814, so that the input signal , Bit allocation can be performed more adaptively according to the characteristics described above, and it is possible to obtain good sound quality in terms of audibility. In particular, when a low bit rate is used, the effect on the sound quality of one bit increases, which is effective.

【0051】なお、メモリ816においては、切り上げ
又は切り捨てのどちらかを表す丸め情報の代わりに、加
算器806の出力が持つ小数部の数値、具体的には例え
ば小数点第一位の桁の数値を保持する手法も考えられ
る。その数値とは、例えばある量子化ブロックに対する
加算器806の出力が1.7ビットの場合は7を示す。
なおこの手法では、メモリ816の容量は大きくなり、
1量子化ブロック辺りの必要ビット数は4ビットとなる
ので、例えば図4の場合には8つの量子化ブロックを持
つので、メモリ816は32ビットの容量を持つ。
In the memory 816, instead of the rounding information indicating either rounding up or rounding down, the value of the decimal part of the output of the adder 806, specifically, for example, the value of the first digit of the decimal point is stored. It is also conceivable to retain the data. The numerical value indicates, for example, 7 when the output of the adder 806 for a certain quantization block is 1.7 bits.
In this method, the capacity of the memory 816 increases,
Since the required number of bits per quantization block is 4 bits, for example, in the case of FIG. 4, since there are eight quantization blocks, the memory 816 has a capacity of 32 bits.

【0052】このメモリ816が保持する小数部の数値
は、ビット端数調整回路814に送られ、既定ビットレ
ートと同等のビット数に調整するために用いられる。例
えば、1次ビット配分回路815の出力が既定のビット
レートを越えるビット数になっている場合、図6を用い
て説明した方法では、切り上げを行った量子化ブロック
に対し高域側から低域側へと周波数に依存した優先順位
を基にビットの削減が行われたが、この小数点の数値を
用いる方法では、切り上げ処理による誤差の大きさに応
じた優先順位を用いてビットの削減を行う。例えば、四
捨五入により切り上げ処理が施されて2ビットになった
2つの量子化ブロックがあり、それぞれ加算器806の
出力が1.5、1.9であった場合、切り上げ処理によ
って生じる誤差はそれぞれ0.5、0.1であり、前者
の方が誤差が大きい。これは本来必要と思われるビット
数より0.5ビット余分に配分されていることになる。
従ってビットの削減を行う際には、誤差が大きい前者の
量子化ブロックを優先的にビット数の削減を行う方が、
より入力信号に適応した効率の良いビット配分を行うこ
とができる。
The value of the decimal part held by the memory 816 is sent to the bit fraction adjusting circuit 814, and is used to adjust the number of bits to the same as the predetermined bit rate. For example, when the output of the primary bit distribution circuit 815 has a number of bits exceeding a predetermined bit rate, the method described with reference to FIG. Bit reduction was performed based on the priority order depending on the frequency to the side, but in the method using the numerical value of the decimal point, the bit reduction is performed using the priority order according to the magnitude of the error due to the round-up processing. . For example, if there are two quantized blocks that have been rounded up and rounded up to 2 bits and the outputs of the adders 806 are 1.5 and 1.9, respectively, the error generated by the rounding up process is 0. 0.5 and 0.1, and the former has a larger error. This means that 0.5 bits extra than the originally required number of bits are allocated.
Therefore, when performing bit reduction, it is better to preferentially reduce the number of bits for the former quantization block having a large error,
Efficient bit allocation more suitable for the input signal can be performed.

【0053】逆に、例えば1次ビット配分回路815の
出力が既定のビットレートを下回るビット数になってい
る場合、図8を用いて説明した方法では、切り捨てを行
った量子化ブロックに対し低域側から高域側へと周波数
に依存した優先順位を基にビットの増加が行われたが、
この小数点の数値を用いる方法では、切り捨て処理によ
る誤差の大きさに応じた優先順位を用いてビットの増加
を行う。例えば、四捨五入により切り捨て処理が施され
て2ビットになった2つの量子化ブロックがあり、それ
ぞれ加算器806の出力が2.1、2.4であった場
合、切り捨て処理によって生じる誤差はそれぞれ0.
1、0.4であり、後者の方が誤差が大きい。これは本
来必要と思われるビット数より0.4ビット分少なく配
分されていることになる。従ってビットの増加を行う際
には、誤差が大きい後者の量子化ブロックを優先的にビ
ットの増加を行う方が、より入力信号に適応した効率の
良いビット配分を行うことができる。
Conversely, for example, when the output of the primary bit distribution circuit 815 has a number of bits lower than the predetermined bit rate, the method described with reference to FIG. From the frequency side to the high frequency side, the bit was increased based on the priority depending on the frequency,
In the method using the numerical value of the decimal point, the number of bits is increased using a priority order according to the magnitude of an error caused by the truncation processing. For example, if there are two quantized blocks that have been rounded down and rounded down to 2 bits and the outputs of the adders 806 are 2.1 and 2.4, respectively, the errors generated by the rounding down are 0. .
1, 0.4, the latter having a larger error. This means that the bits are distributed by 0.4 bits less than the bit number originally considered necessary. Therefore, when increasing bits, it is possible to perform efficient bit allocation more suitable for an input signal by preferentially increasing bits of the latter quantization block having a large error.

【0054】このようにして、例えば128kbpsの
ビットレートに調整されたビットは、図1の適応ビット
割当符号化回路16〜18によって各クリティカルバン
ド毎若しくは高域においてはクリティカルバンドを更に
複数帯域に分割した帯域に割り当てられたビット数に応
じて各スペクトルデータ(あるいはMDCT係数デー
タ)が再量子化されるようになっている。このようにし
て符号化されたデータは、図1の出力端子22、24、
26を介して取り出される。
The bits adjusted to a bit rate of, for example, 128 kbps are divided into a plurality of critical bands in each critical band or in a high band by the adaptive bit allocation coding circuits 16 to 18 in FIG. Each spectrum data (or MDCT coefficient data) is re-quantized according to the number of bits allocated to the assigned band. The data encoded in this way is output to the output terminals 22, 24,
Retrieved via 26.

【0055】さらに詳しく上記聴覚許容雑音スペクトル
依存のビット配分回路805中の聴覚許容雑音スペクト
ル算出回路について説明すると、MDCT回路13〜1
5で得られたMDCT係数が当該ビット配分回路805
中の許容雑音スペクトル算出回路に与えられる。
More specifically, the permissible noise spectrum calculation circuit in the permissible noise spectrum dependent bit allocation circuit 805 will be described.
5 is assigned to the bit distribution circuit 805.
To the permissible noise spectrum calculation circuit.

【0056】図9は上記許容雑音スペクトル算出回路を
まとめて説明した一具体例の概略構成を示すブロック回
路図である。この図9において、入力端子521には、
MDCT回路13〜15からの周波数領域のスペクトル
データが供給されている。
FIG. 9 is a block circuit diagram showing a schematic configuration of one specific example in which the allowable noise spectrum calculation circuit is collectively described. In FIG. 9, an input terminal 521 includes:
Frequency domain spectrum data is supplied from the MDCT circuits 13 to 15.

【0057】この周波数領域の入力データは、帯域毎の
エネルギ算出回路522に送られて、上記クリティカル
バンド(臨界帯域)毎のエネルギが、例えば当該バンド
内での各振幅値2乗の総和を計算すること等により求め
られる。この各バンド毎のエネルギの代わりに、振幅値
のピーク値、平均値等が用いられることもある。このエ
ネルギ算出回路522からの出力として、例えば各バン
ドの総和値のスペクトルは、一般にバークスペクトルと
称されている。図10はこのような各クリティカルバン
ド毎のバークスペクトルSBを示している。ただし、こ
の図10では、図示を簡略化するため、上記クリティカ
ルバンドのバンド数を12バンド(B1〜B12)で表
現している。
The input data in the frequency domain is sent to the energy calculation circuit 522 for each band, and the energy for each critical band (critical band) is calculated, for example, by summing the square of each amplitude value within the band. Required. Instead of the energy for each band, a peak value or an average value of the amplitude value may be used. As an output from the energy calculation circuit 522, for example, the spectrum of the sum value of each band is generally called a bark spectrum. FIG. 10 shows such a bark spectrum SB for each critical band. However, in FIG. 10, the number of the critical bands is represented by 12 bands (B1 to B12) to simplify the illustration.

【0058】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するために、該バー
クスペクトルSBに所定の重み付け関数を掛けて加算す
るような畳込み(コンボリューション)処理を施す。こ
のため、上記帯域毎のエネルギ算出回路522の出力す
なわち該バークスペクトルSBの各値は、畳込みフィル
タ回路523に送られる。該畳込みフィルタ回路523
は、例えば、入力データを順次遅延させる複数の遅延素
子と、これら遅延素子からの出力にフィルタ係数(重み
付け関数)を乗算する複数の乗算器(例えば各バンドに
対応する25個の乗算器)と、各乗算器出力の総和をと
る総和加算器とから構成されるものである。
Here, in order to consider the influence of the bark spectrum SB on so-called masking, a convolution process is performed such that the bark spectrum SB is multiplied by a predetermined weighting function and added. Therefore, the output of the energy calculation circuit 522 for each band, that is, each value of the bark spectrum SB is sent to the convolution filter circuit 523. The convolution filter circuit 523
Includes, for example, a plurality of delay elements for sequentially delaying input data, a plurality of multipliers (for example, 25 multipliers corresponding to each band) for multiplying an output from these delay elements by a filter coefficient (weighting function). , And a sum adder for summing the outputs of the multipliers.

【0059】なお、上記マスキングとは、人間の聴覚上
の特性により、ある信号によって他の信号がマスクされ
て聞こえなくなる現象をいうものであり、このマスキン
グ効果には、時間領域のオーディオ信号による時間軸マ
スキング効果と、周波数領域の信号による同時刻マスキ
ング効果とがある。これらのマスキング効果により、マ
スキングされる部分にノイズがあったとしても、このノ
イズは聞こえないことになる。このため、実際のオーデ
ィオ信号では、このマスキングされる範囲内のノイズは
許容可能なノイズとされる。
The above-mentioned masking refers to a phenomenon in which a certain signal causes another signal to be masked and become inaudible due to human auditory characteristics. There are an axis masking effect and a simultaneous masking effect by a frequency domain signal. Due to these masking effects, even if there is noise in the masked portion, this noise will not be heard. For this reason, in an actual audio signal, noise within the masked range is regarded as acceptable noise.

【0060】また、上記畳込みフィルタ回路523の各
乗算器の乗算係数(フィルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記バークスペ
クトルSBの畳込み処理が行われる。ただし、Mは1〜
25の任意の整数である。
A specific example of the multiplication coefficient (filter coefficient) of each multiplier of the convolution filter circuit 523 is as follows. When the coefficient of the multiplier M corresponding to an arbitrary band is 1, the multiplier M −1, the coefficient 0.15, the multiplier M-2, the coefficient 0.0019, and the multiplier M-3, the coefficient 0.00000.
086, a coefficient 0.4 by a multiplier M + 1, and a multiplier M + 2
By multiplying the output of each delay element by the coefficient 0.06 by the multiplier M + 3 and the coefficient 0.007 by the multiplier M + 3, the convolution process of the bark spectrum SB is performed. However, M is 1
It is an arbitrary integer of 25.

【0061】次に、上記畳込みフィルタ回路523の出
力は引算器524に送られる。該引算器524は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリューション処理を
行うことによって、クリティカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。
Next, the output of the convolution filter circuit 523 is sent to a subtractor 524. The subtracter 524 calculates a level α corresponding to an allowable noise level described later in the convolved area. The level α corresponding to the permissible noise level (permissible noise level) is, as described later, a level at which the permissible noise level of each critical band is obtained by performing inverse convolution processing. is there.

【0062】ここで、上記引算器524には、上記レベ
ルαを求めるるための許容関数(マスキングレベルを表
現する関数)が供給される。この許容関数を増減させる
ことで上記レベルαの制御を行っている。当該許容関数
は、次に説明するような(n−ai)関数発生回路52
5から供給されているものである。
Here, the subtractor 524 is supplied with an allowance function (a function expressing a masking level) for obtaining the level α. The level α is controlled by increasing or decreasing the allowable function. The permissible function is a (n-ai) function generation circuit 52 described below.
5.

【0063】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリティカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の式で求めることがで
きる。
That is, the level α corresponding to the allowable noise level can be obtained by the following equation, where i is a number sequentially given from the lower band of the critical band.

【0064】α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、式中(n−a
i)が許容関数となる。例としてn=38,a=−0.
5を用いることができる。
Α = S− (n−ai) In this equation, n and a are constants and a> 0, and S is the intensity of the convolution-processed Bark spectrum.
i) is the tolerance function. As an example, n = 38, a = −0.
5 can be used.

【0065】このようにして、上記レベルαが求めら
れ、このデータは、割算器526に伝送される。当該割
算器526では、上記畳込みされた領域での上記レベル
αを逆コンボリューションするためのものである。した
がって、この逆コンボリューション処理を行うことによ
り、上記レベルαからマスキングスレッショールドが得
られるようになる。すなわち、このマスキングスレッシ
ョールドが許容ノイズスペクトルとなる。なお、上記逆
コンボリューション処理は、複雑な演算を必要とする
が、本実施例では簡略化した割算器526を用いて逆コ
ンボリューションを行っている。
In this way, the level α is obtained, and this data is transmitted to the divider 526. In the divider 526, the level α in the convolved area is inversely convolved. Therefore, by performing the inverse convolution processing, a masking threshold can be obtained from the level α. That is, this masking threshold becomes the allowable noise spectrum. Note that the above inverse convolution process requires a complicated operation, but in this embodiment, inverse convolution is performed using a simplified divider 526.

【0066】次に、上記マスキングスレッショールド
は、合成回路527を介して減算器528に伝送され
る。ここで、当該減算器528には、上記帯域毎のエネ
ルギ検出回路522からの出力、すなわち前述したバー
クスペクトルSBが、遅延回路529を介して供給され
ている。したがって、この減算器528で上記マスキン
グスレッショールドとバークスペクトルSBとの減算演
算が行われることで、図11に示すように、上記バーク
スペクトルSBは、当該マスキングスレッショールドM
Sのレベルで示すレベル以下がマスキングされることに
なる。なお、上記遅延回路529は、上記合成回路52
7以前の各回路での遅延量を考慮してエネルギ検出回路
522からのバークスペクトルSBを遅延させるために
設けられている。
Next, the above-mentioned masking threshold is transmitted to the subtractor 528 via the synthesizing circuit 527. Here, the output from the energy detection circuit 522 for each band, that is, the above-described bark spectrum SB is supplied to the subtracter 528 via the delay circuit 529. Therefore, the subtractor 528 performs a subtraction operation between the masking threshold and the bark spectrum SB, and as shown in FIG. 11, the bark spectrum SB becomes the masking threshold M.
The level below the level indicated by the level S is masked. Note that the delay circuit 529 is connected to the synthesis circuit 52.
7 is provided to delay the bark spectrum SB from the energy detection circuit 522 in consideration of the amount of delay in each circuit before 7.

【0067】当該減算器528からの出力は、許容雑音
補正回路530を介し、出力端子531を介して取り出
され、例えば配分ビット数情報が予め記憶されたROM
等(図示せず)に送られる。このROM等は、上記減算
回路528から許容雑音補正回路530を介して得られ
た出力(上記各バンドのエネルギと上記ノイズレベル設
定手段の出力との差分のレベル)に応じ、各バンド毎の
配分ビット数情報を出力する。
The output from the subtracter 528 is taken out via an allowable noise correction circuit 530 and an output terminal 531. For example, a ROM in which information on the number of bits to be allocated is stored in advance.
Etc. (not shown). This ROM or the like distributes each band in accordance with the output (the level of the difference between the energy of each band and the output of the noise level setting means) obtained from the subtraction circuit 528 via the allowable noise correction circuit 530. Output bit number information.

【0068】このようにしてエネルギ依存ビットと聴覚
許容雑音レベルに依存したビットは加算されてその配分
ビット数情報が上記適応ビット割当符号化回路16〜1
8に送られることで、ここでMDCT回路13〜15か
らの周波数領域の各スペクトルデータがそれぞれのバン
ド毎に割り当てられたビット数で量子化されるわけであ
る。
In this way, the energy-dependent bits and the bits depending on the permissible noise level are added, and the information on the number of allocated bits is added to the adaptive bit allocation coding circuits 16-1.
8, the respective spectral data in the frequency domain from the MDCT circuits 13 to 15 are quantized by the number of bits allocated to each band.

【0069】すなわち要約すれば、上記適応ビット割当
符号化回路16〜18では、上記クリティカルバンドの
各バンド帯域毎(クリティカルバンド毎)若しくは高域
においては当該クリティカルバンドを更に複数帯域に分
割した帯域のエネルギ若しくはピーク値と、上記ノイズ
レベル設定手段の出力との差分のレベルに応じて配分さ
れたビット数で上記各バンド毎のスペクトルデータを量
子化することになる。
That is, in summary, in the adaptive bit allocation coding circuits 16 to 18, in each band of the critical band (for each critical band) or in a high band, the band is obtained by further dividing the critical band into a plurality of bands. The spectrum data for each band is quantized by the number of bits allocated according to the level of the difference between the energy or the peak value and the output of the noise level setting means.

【0070】ところで、上述した合成回路527での合
成の際には、最小可聴カーブ発生回路532から供給さ
れる図12に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
レッショールドMSとを合成することができる。この最
小可聴カーブにおいて、雑音絶対レベルがこの最小可聴
カーブ以下ならば該雑音は聞こえないことになる。この
最小可聴カーブは、コーディングが同じであっても例え
ば再生時の再生ボリュームの違いで異なるものとなる
が、現実的なディジタルシステムでは、例えば16ビッ
トダイナミックレンジへの音楽のはいり方にはさほど違
いがないので、例えば4kHz付近の最も耳に聞こえや
すい周波数帯域の量子化雑音が聞こえないとすれば、他
の周波数帯域ではこの最小可聴カーブのレベル以下の量
子化雑音は聞こえないと考えられる。したがって、この
ように例えばシステムの持つダイナミックレンジの4k
Hz付近の雑音が聞こえない使い方をすると仮定し、こ
の最小可聴カーブRCとマスキングスレッショールドM
Sとを共に合成することで許容ノイズレベルを得るよう
にすると、この場合の許容ノイズレベルは、図12中の
斜線で示す部分までとすることができるようになる。な
お、本実施例では、上記最小可聴カーブの4kHzのレ
ベルを、例えば20ビット相当の最低レベルに合わせて
いる。また、この図12は、信号スペクトルSSも同時
に示している。
By the way, at the time of synthesizing by the synthesizing circuit 527, data indicating a so-called minimum audible curve RC, which is a human auditory characteristic as shown in FIG. The above-mentioned masking threshold MS can be synthesized. At this minimum audible curve, if the absolute noise level is below this minimum audible curve, the noise will not be heard. This minimum audible curve will differ depending on the playback volume during playback, for example, even if the coding is the same, but in a realistic digital system, the way in which music enters the 16-bit dynamic range, for example, differs greatly. For example, if quantization noise in the most audible frequency band around 4 kHz is not heard, it is considered that quantization noise below the level of the minimum audible curve is not heard in other frequency bands. Therefore, for example, the dynamic range of the system is 4 k
It is assumed that the noise is not heard around Hz, and the minimum audible curve RC and the masking threshold M
If an allowable noise level is obtained by synthesizing S and S, the allowable noise level in this case can be up to the shaded portion in FIG. In this embodiment, the 4 kHz level of the minimum audible curve is adjusted to the lowest level corresponding to, for example, 20 bits. FIG. 12 also shows the signal spectrum SS.

【0071】また、上記許容雑音補正回路530では、
補正情報出力回路533から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器528から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図12に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大
きさに聞こえ、逆に、50Hz付近では1kHzでの音
圧よりも約15dB高くないと同じ大きさに聞こえな
い。このため、上記最小可聴カーブのレベルを越えた雑
音(許容ノイズレベル)は、この等ラウドネス曲線に応
じたカーブで与えられる周波数特性を持つようにするの
が良いことがわかる。このようなことから、上記等ラウ
ドネス曲線を考慮して上記許容ノイズレベルを補正する
ことは、人間の聴覚特性に適合していることがわかる。
In the allowable noise correction circuit 530,
The permissible noise level in the output from the subtractor 528 is corrected based on, for example, information on the equal loudness curve sent from the correction information output circuit 533. Here, the equal loudness curve is a characteristic curve relating to human auditory characteristics. For example, the loudness curve is obtained by calculating the sound pressure of sound at each frequency that sounds as loud as the pure tone of 1 kHz, and connecting the curves with each other. Also called a sensitivity curve. This equal loudness curve is the minimum audible curve R shown in FIG.
It draws substantially the same curve as C. In this equal loudness curve, for example, at around 4 kHz, even if the sound pressure falls by 8 to 10 dB below 1 kHz, it sounds as large as 1 kHz, and conversely, at around 50 Hz, the sound pressure must be about 15 dB higher than the sound pressure at 1 kHz. It doesn't sound the same size. For this reason, it can be seen that noise exceeding the level of the minimum audible curve (allowable noise level) preferably has a frequency characteristic given by a curve corresponding to the equal loudness curve. From this, it can be seen that correcting the allowable noise level in consideration of the equal loudness curve is suitable for human auditory characteristics.

【0072】以上述べた聴覚許容雑音レベルに依存した
スペクトル形状を使用可能総ビット128Kbpsの内
のある割合を用いるビット配分でつくる。この割合は入
力信号のトーナリティが高くなるほど減少する。
The above-described spectral shape depending on the permissible noise level is created by bit allocation using a certain percentage of the total available bits of 128 Kbps. This ratio decreases as the tonality of the input signal increases.

【0073】次に2つのビット配分手法の間でのビット
量分割手法について説明する。
Next, a description will be given of a bit amount division method between the two bit distribution methods.

【0074】図3に戻って、MDCT回路出力が供給さ
れる入力端子801からの信号は、スペクトルの滑らか
さ算出回路808にも与えられ、ここでスペクトルの滑
らかさが算出される。本実施例では、信号スペクトルの
絶対値の隣接値間の差の絶対値の和を信号スペクトルの
絶対値の和で割った値を、上記スペクトルの滑らかさと
して算出している。
Returning to FIG. 3, the signal from the input terminal 801 to which the output of the MDCT circuit is supplied is also supplied to a spectrum smoothness calculation circuit 808, where the spectrum smoothness is calculated. In this embodiment, a value obtained by dividing the sum of the absolute values of the differences between the adjacent values of the absolute value of the signal spectrum by the sum of the absolute values of the signal spectrum is calculated as the smoothness of the spectrum.

【0075】上記スペクトルの滑らかさ算出回路808
の出力は、ビット分割率決定回路809に与えられ、こ
こでエネルギ依存のビット配分と、聴覚許容雑音スペク
トルによるビット配分間のビット分割率とが決定され
る。ビット分割率はスペクトルの滑らかさ算出回路80
8の出力値が大きいほど、スペクトルの滑らかさが無い
と考えて、エネルギ依存のビット配分よりも、聴覚許容
雑音スペクトルによるビット配分に重点をおいたビット
配分を行う。ビット分割率決定回路809は、それぞれ
エネルギ依存のビット配分及び聴覚許容雑音スペクトル
によるビット配分の大きさをコントロールする乗算器8
11及び812に対してコントロール出力を送る。ここ
で、仮にスペクトルが滑らかであり、エネルギ依存のビ
ット配分に重きをおくように、乗算器811へのビット
分割率決定回路809の出力が0.8の値を取ったと
き、乗算器812へのビット分割率決定回路809の出
力は1−0.8=0.2とする。これら2つの乗算器の
出力は加算器806で足し合わされて最終的なビット配
分情報となって、出力端子807から出力される。
The above-described spectrum smoothness calculating circuit 808
Is supplied to a bit division ratio determination circuit 809, where the energy-dependent bit allocation and the bit division ratio between the bit allocations based on the permissible noise spectrum are determined. The bit division ratio is calculated by the spectrum smoothness calculation circuit 80.
It is considered that the larger the output value of 8 is, the less smooth the spectrum is, so that bit allocation is performed with more emphasis on bit allocation based on the permissible noise spectrum than on energy-dependent bit allocation. The bit division ratio determination circuit 809 includes a multiplier 8 for controlling the size of the energy-dependent bit allocation and the size of the bit allocation based on the permissible noise spectrum.
Send control output to 11 and 812. Here, if the output of the bit division ratio determination circuit 809 to the multiplier 811 takes a value of 0.8 so that the spectrum is smooth and the energy-dependent bit allocation is weighted, the multiplier 812 The output of the bit division ratio determining circuit 809 is 1-0.8 = 0.2. The outputs of these two multipliers are added in an adder 806 to form final bit allocation information, which is output from an output terminal 807.

【0076】このときのビット配分の様子を図13、図
14に示す。また、これに対応する量子化雑音の様子を
図15、図16に示す。図13は信号のスペクトルが割
合平坦である場合を示しており、図14は信号スペクト
ルが高いトーナリティを示す場合を示している。また、
図13及び図14の図中QSは信号レベル依存分のビッ
ト量を示し、図中QNは聴覚許容雑音レベル依存のビッ
ト割当分のビット量を示している。図15及び図16の
図中Lは信号レベルを示し、図中NSは信号レベル依存
分による雑音低下分を、図中NNは聴覚許容雑音レベル
依存のビット割当分による雑音低下分を示している。
FIGS. 13 and 14 show how bits are allocated at this time. FIGS. 15 and 16 show the corresponding quantization noise. FIG. 13 shows a case where the signal spectrum is relatively flat, and FIG. 14 shows a case where the signal spectrum shows high tonality. Also,
In FIGS. 13 and 14, QS indicates a signal level dependent bit amount, and QN indicates a permissible noise level dependent bit allocation bit amount. 15 and 16, L indicates the signal level, NS indicates the noise reduction due to the signal level dependence, and NN indicates the noise reduction due to the permissible noise level-dependent bit allocation. .

【0077】先ず、信号のスペクトルが、割合平坦であ
る場合を示す図15において、聴覚許容雑音レベルに依
存したビット配分は、全帯域に渡り大きい信号雑音比を
取るために役立つ。しかし低域及び高域では比較的少な
いビット配分が使用されている。これは聴覚的にこの帯
域の雑音に対する感度が小さいためである。信号エネル
ギレベルに依存したビット配分の分は量としては少ない
が、ホワイトな雑音スペクトルを生じるように、この場
合には中低域の信号レベルの高い周波数領域に重点的に
配分されている。
First, in FIG. 15 showing a case where the spectrum of the signal is relatively flat, the bit allocation depending on the permissible noise level is useful for obtaining a large signal-to-noise ratio over the entire band. However, relatively low bit allocation is used in the low and high bands. This is because the sensitivity to noise in this band is small acoustically. Although the amount of the bit allocation depending on the signal energy level is small in amount, in this case, the bit allocation is focused on the high-frequency region where the signal level in the middle and low frequencies is high so as to generate a white noise spectrum.

【0078】これに対して、図16に示すように、信号
スペクトルが高いトーナリティを示す場合には、信号エ
ネルギレベルに依存したビット配分量が多くなり、量子
化雑音の低下は極めて狭い帯域の雑音を低減するために
使用される。聴覚許容雑音レベルに依存したビット配分
の集中はこれよりもきつくない。
On the other hand, as shown in FIG. 16, when the signal spectrum exhibits a high tonality, the bit allocation amount depending on the signal energy level increases, and the quantization noise decreases with a very narrow band of noise. Used to reduce The concentration of the bit allocation depending on the permissible noise level is less tight.

【0079】図16に示すように、この両者のビット配
分の和により、孤立スペクトル入力信号での特性の向上
が達成される。
As shown in FIG. 16, the improvement of the characteristics in the isolated spectrum input signal is achieved by the sum of the two bit allocations.

【0080】図17は、図1に示した高能率符号化装置
によって符号化された信号を、再び復号化するための基
本的な本発明実施例の高能率復号化装置を示している。
FIG. 17 shows a basic high efficiency decoding apparatus according to the embodiment of the present invention for decoding again a signal coded by the high efficiency coding apparatus shown in FIG.

【0081】この図17において、各帯域の量子化され
たMDCT係数は復号化装置入力端子122、124、
126に与えられ、使用されたブロックサイズ情報は入
力端子123、125、127に与えられる。復号化回
路116、117、118では適応ビット配分情報を用
いてビット割当を解除する。
In FIG. 17, the quantized MDCT coefficients of each band are input to decoding device input terminals 122 and 124,
The block size information provided to 126 and used is provided to input terminals 123, 125, and 127. The decoding circuits 116, 117 and 118 release the bit allocation using the adaptive bit allocation information.

【0082】次に、IMDCT回路113、114、1
15では周波数領域の信号が時間領域の信号に変換され
る。これらの部分帯域の時間領域信号は、IQMF回路
112、111により、全体域信号に復号化され、出力
端子110へ送られる。
Next, the IMDCT circuits 113, 114, 1
At 15, the signal in the frequency domain is converted to a signal in the time domain. The time domain signals of these partial bands are decoded by the IQMF circuits 112 and 111 into whole-area signals and sent to the output terminal 110.

【0083】次に、本発明実施例の伝送媒体は、上述し
たような本発明実施例の高能率符号化装置により符号化
された信号が記録若しくは伝送されるものであり、記録
メディアとしては例えば光ディスク,光磁気ディスク,
磁気ディスク等のディスク状の記録媒体に上記符号化信
号が記録されたものや、磁気テープ等のテープ状記録媒
体に上記符号化信号が記録されたもの、或いは、符号化
信号が記憶された半導体メモリ,ICカードなどを挙げ
ることができる。また、伝送メディアとしては、電線若
しくは光ケーブルや電波等を挙げることができる。
Next, the transmission medium of the embodiment of the present invention is for recording or transmitting the signal encoded by the high-efficiency coding apparatus of the embodiment of the present invention as described above. Optical disk, magneto-optical disk,
A disk-shaped recording medium such as a magnetic disk in which the above-mentioned encoded signal is recorded, a tape-shaped recording medium such as a magnetic tape in which the above-mentioned encoded signal is recorded, or a semiconductor in which the encoded signal is stored Examples include a memory and an IC card. In addition, examples of the transmission medium include an electric wire, an optical cable, and a radio wave.

【0084】なお、本発明はこの実施例にのみ限定され
るものではなく、例えば、上記の記録再生媒体と上記他
の記録再生媒体とは一体化されている必要はなく、その
間をデータ転送用回線等で結ぶことも可能である。更に
例えば、オーディオPCM信号のみならず、ディジタル
音声(スピーチ)信号やディジタルビデオ信号等の信号
処理装置にも適用可能である。また、上述した最小可聴
カーブの合成処理を行わない構成としてもよい。この場
合には、図9中の最小可聴カーブ発生回路532、合成
回路527が不要となり、上記引算器526からの出力
は、直ちに減算器528へ伝送されることになる。
The present invention is not limited only to this embodiment. For example, the above-mentioned recording / reproducing medium and the other recording / reproducing medium need not be integrated, and a data transfer between them is not necessary. It is also possible to connect with a line or the like. Further, for example, the present invention can be applied not only to an audio PCM signal but also to a signal processing device for a digital voice (speech) signal, a digital video signal, and the like. Further, the configuration may be such that the above-described minimum audible curve synthesis processing is not performed. In this case, the minimum audible curve generating circuit 532 and the synthesizing circuit 527 in FIG. 9 become unnecessary, and the output from the subtracter 526 is immediately transmitted to the subtractor 528.

【0085】また、ビット配分手法は多種多様であり、
最も簡単には固定のビット配分もしくは信号の各帯域エ
ネルギによる簡単なビット配分もしくは固定分と可変分
を組み合わせたビット配分などを使うことが可能であ
る。
Also, there are various bit allocation methods,
In the simplest case, it is possible to use fixed bit allocation, simple bit allocation based on the energy of each band of a signal, or bit allocation combining a fixed portion and a variable portion.

【0086】また、図3中のメモリ816に於て、保持
する各量子化ブロックの数を減らすことも可能である。
保持するブロック数を減らすことによりメモリ816の
容量、及びビット端数調整回路814内での計算量など
を減らすことができ、ハードウェア規模を小さくするこ
とが可能となる。
Further, in the memory 816 in FIG. 3, it is possible to reduce the number of quantization blocks held.
By reducing the number of blocks to be held, the capacity of the memory 816, the amount of calculation in the bit fraction adjustment circuit 814, and the like can be reduced, and the hardware scale can be reduced.

【0087】また、図3中の1次ビット配分回路815
の出力が、既定の例えば128kbpsを下回るビット
レートの場合、ビットの端数調整を行わない構成として
もよい。この場合には、図3中のメモリ816、及びビ
ット端数調整回路814が不要となり、1次ビット配分
回路815の出力は直ちにビット割当量出力端子807
へ伝送されることになる。
The primary bit distribution circuit 815 in FIG.
In the case where the output is a bit rate lower than a predetermined value of, for example, 128 kbps, the configuration may be such that the fraction adjustment of bits is not performed. In this case, the memory 816 and the bit fraction adjusting circuit 814 in FIG. 3 become unnecessary, and the output of the primary bit allocation circuit 815 immediately outputs the bit allocation output terminal 807.
Will be transmitted to

【0088】また、図3中の1次ビット配分回路815
に於て施される丸め処理は、四捨五入だけではなく、例
えば3以下を切り捨て4以上を切り上げる手法など、し
きい値を変えて丸め処理を行うことも可能である。例え
ば、単純に切り上げ又は切り捨て処理を行う手法も考え
られる。
The primary bit distribution circuit 815 in FIG.
Is not limited to rounding, but it is also possible to perform rounding processing by changing the threshold value, for example, by rounding down 3 or less and rounding up 4 or more. For example, a method of simply performing round-up or round-down processing is also conceivable.

【0089】本発明実施例は、以上のような種々の変形
が考えられる。
The embodiment of the present invention can have various modifications as described above.

【0090】[0090]

【発明の効果】以上の説明からも明らかなように、本発
明においては以下の効果を得ることができる。すなわ
ち、各2次元ブロック(量子化ブロック)毎に小数値と
して算出されたビット情報を、整数化する際、施される
丸め処理の情報を考慮して、既定ビットレートにより定
まるビット量と同等になるようにビットの調整を行い、
各2次元ブロックに対するビット配分量を決定すること
により、入力信号に対しより適応的なビットの配分を行
うことが可能となり、同一のビットレートでは、聴感
上、良好な音質を得ることが可能となる。また、低いビ
ットレートでは、音質劣化を防止することができる。
As is clear from the above description, the following effects can be obtained in the present invention. That is, when converting the bit information calculated as a decimal value for each two-dimensional block (quantized block) into an integer, the bit amount is determined to be equal to the bit amount determined by the predetermined bit rate in consideration of information on a rounding process performed. Adjust the bits so that
By determining the bit allocation amount for each two-dimensional block, it is possible to perform more adaptive bit allocation to the input signal, and it is possible to obtain good sound quality in terms of audibility at the same bit rate. Become. At a low bit rate, sound quality degradation can be prevented.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明実施例の高能率符号化装置の構成例を示
すブロック回路図である。
FIG. 1 is a block circuit diagram illustrating a configuration example of a high-efficiency encoding device according to an embodiment of the present invention.

【図2】本実施例装置での周波数及び時間領域における
直交変換ブロックサイズの具体例を示す図である。
FIG. 2 is a diagram illustrating a specific example of an orthogonal transform block size in a frequency and time domain in the apparatus according to the embodiment.

【図3】本発明実施例のビット配分機能の構成例を示す
ブロック回路図である。
FIG. 3 is a block circuit diagram illustrating a configuration example of a bit allocation function according to an embodiment of the present invention.

【図4】小数部を持つ各量子化ブロックのビット情報
と、それらを整数化したビット数を示す図である。
FIG. 4 is a diagram showing bit information of each quantization block having a decimal part and the number of bits obtained by converting the bit information into an integer.

【図5】既定のビットレートを越えたビット数が用いら
れている場合のビット端数調整例を示す図である。
FIG. 5 is a diagram illustrating an example of bit fraction adjustment when a number of bits exceeding a predetermined bit rate is used.

【図6】既定のビットレートを越えたビット数が用いら
れている場合、小数部を持つビット情報を整数化した際
の丸め情報を利用した、ビット端数調整例を示す図であ
る。
FIG. 6 is a diagram illustrating an example of bit fraction adjustment using rounding information when converting bit information having a decimal part into an integer when the number of bits exceeding a predetermined bit rate is used.

【図7】既定のビットレートを下回るビット数が用いら
れている場合のビット端数調整例を示す図である。
FIG. 7 is a diagram illustrating an example of bit fraction adjustment when a bit number lower than a predetermined bit rate is used.

【図8】既定のビットレートを下回るビット数が用いら
れている場合、小数部を持つビット情報を整数化した際
の丸め情報を利用した、ビット端数調整例を示す図であ
る。
FIG. 8 is a diagram illustrating an example of bit fraction adjustment using rounding information when bit information having a decimal part is converted to an integer when a bit number lower than a predetermined bit rate is used.

【図9】本発明実施例の聴覚マスキングスレッショール
ド算定機能の構成例を示すブロック回路図である。
FIG. 9 is a block circuit diagram showing a configuration example of an auditory masking threshold calculation function according to the embodiment of the present invention.

【図10】各臨界帯域信号によるマスキングを示す図で
ある。
FIG. 10 is a diagram illustrating masking by each critical band signal.

【図11】各臨界帯域信号によるマスキングスレッショ
ールドを示す図である。
FIG. 11 is a diagram illustrating a masking threshold by each critical band signal.

【図12】情報スペクトル、マスキングスレショール
ド、最小可聴限を示す図である。
FIG. 12 is a diagram showing an information spectrum, a masking threshold, and a minimum audible limit.

【図13】信号スペクトルが平坦な情報信号に対する信
号レベル依存及び聴覚許容雑音レベル依存のビット配分
を示す図である。
FIG. 13 is a diagram showing a signal distribution and a permissible noise level-dependent bit allocation for an information signal having a flat signal spectrum.

【図14】信号スペクトルのトーナリティが高い情報信
号に対する信号レベル依存及び聴覚許容雑音レベル依存
のビット配分を示す図である。
FIG. 14 is a diagram showing signal level dependency and permissible noise level dependent bit allocation for an information signal having a high tonality of a signal spectrum.

【図15】信号スペクトルが平坦な情報信号に対する量
子化雑音レベルを示す図である。
FIG. 15 is a diagram showing a quantization noise level for an information signal having a flat signal spectrum.

【図16】トーナリティが高い情報信号に対する量子化
雑音レベルを示す図である。
FIG. 16 is a diagram illustrating a quantization noise level for an information signal having a high tonality.

【図17】本発明実施例の高能率復号化装置の構成例を
示すブロック回路図である。
FIG. 17 is a block circuit diagram illustrating a configuration example of a high-efficiency decoding device according to an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

801 MDCT回路出力入力端子 802 使用可能総ビット発生回路 803 帯域毎のエネルギ算出回路 804 エネルギ依存のビット配分回路 805 聴覚許容雑音レベル依存のビット配分回路 806 加算器 807 各帯域のビット割当量出力端子 808 スペクトルの滑らかさ算出回路 809 ビット分割率決定回路 811、812 乗算器 814 ビット端数調整回路 815 1次ビット配分回路 816 メモリ 801 MDCT circuit output input terminal 802 Usable total bit generation circuit 803 Energy calculation circuit for each band 804 Energy-dependent bit allocation circuit 805 Bit allocation circuit depending on permissible noise level 806 Adder 807 Bit allocation output terminal for each band 808 Spectrum smoothness calculation circuit 809 Bit division ratio determination circuit 811 812 Multiplier 814 Bit fraction adjustment circuit 815 Primary bit distribution circuit 816 Memory

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−302532(JP,A) 特開 平5−37396(JP,A) 特開 平5−90973(JP,A) 特開 平5−206866(JP,A) 特開 平6−6236(JP,A) 特開 平7−135470(JP,A) 特開 平7−143009(JP,A) 特表 平4−504192(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G10L 19/00 ──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-4-302532 (JP, A) JP-A-5-37396 (JP, A) JP-A-5-90973 (JP, A) JP-A-5-90973 206866 (JP, A) JP-A-6-6236 (JP, A) JP-A-7-135470 (JP, A) JP-A-7-143009 (JP, A) Japanese Translation of PCT Application No. 4-504192 (JP, A) (58) Field surveyed (Int. Cl. 7 , DB name) H03M 7/30 G10L 19/00

Claims (7)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力信号を複数の周波数帯域成分に分解
する周波数分解ステップと、 上記周波数帯域成分を時間と周波数とに関して分割した
複数の2次元ブロック毎に当該周波数帯域成分に応じて
量子化に必要なビット配分情報を小数値として求め、求
めた上記ビット配分情報を丸め処理して各2次元ブロッ
ク毎の整数値のビット配分量を算出するビット配分量算
出ステップと、 上記各2次元ブロック毎に算出されたビット配分量を、
既定のビットレートにより定まるビット量と同等になる
よう調整し、各2次元ブロックのビット配分量を決定す
るビット配分量決定ステップと、 決定した上記ビット配分量に応じて、上記2次元ブロッ
ク毎に上記周波数帯域成分の量子化を行う周波数帯域成
分量子化ステップとを有し、 上記ビット配分量決定ステップでは、上記2次元ブロッ
ク毎に算出したビット配分量の総和が既定ビットレート
により定まるビット量と同等でないときには、上記ビッ
ト配分量算出ステップにおける丸め処理の情報に基づい
て、上記ビット配分量の調整を行うこと を特徴とする高
能率符号化方法。
An input signal is decomposed into a plurality of frequency band components.
Frequency dividing step, and dividing the frequency band component with respect to time and frequency
According to the frequency band component for each of a plurality of two-dimensional blocks
Bit allocation information required for quantization is obtained as a decimal value, and
The above-mentioned bit allocation information is rounded and processed for each two-dimensional block.
Bit allocation calculation to calculate the bit allocation of integer values for each task
Output step and the bit allocation amount calculated for each of the two-dimensional blocks,
It is equal to the bit amount determined by the default bit rate
And determine the bit allocation amount for each two-dimensional block.
A bit allocation amount determining step, and the two-dimensional block according to the determined bit allocation amount.
Frequency band components that quantize the frequency band components
A quantization step, and in the bit allocation amount determining step, the two-dimensional block
The total bit allocation calculated for each clock is the default bit rate
If the bit amount is not equal to the
Based on the rounding information in the
And adjusting the bit allocation amount .
【請求項2】 上記ビット配分量決定ステップでは、上
2次元ブロック毎に算出したビット配分量の総和が既
定ビットレートにより定まるビット量より多いときに
は、上記ビット配分量算出ステップにおいて切り上げが
行われた2次元ブロックに対応するビット数が優先的に
削減されることを特徴とする請求項1記載の高能率符号
化方法。
In the bit allocation amount determining step, when the sum of the bit allocation amounts calculated for the two-dimensional blocks is larger than the bit amount determined by a predetermined bit rate, the bit allocation amount calculating step The number of bits corresponding to the rounded-up two-dimensional block has priority
2. The high-efficiency encoding method according to claim 1, wherein the number is reduced.
【請求項3】 上記ビット配分量決定ステップでは、上
2次元ブロック毎に算出したビット配分量の総和が既
定ビットレートにより定まるビット量より少ないときに
は、上記ビット配分量算出ステップにおいて切り捨てが
行われた2次元ブロックに対応するビット数が優先的に
増加されることを特徴とする請求項1記載の高能率符号
化方法。
In the bit allocation amount determining step, when the sum of the bit allocation amounts calculated for the two-dimensional blocks is smaller than the bit amount determined by a predetermined bit rate, the bit allocation amount calculating step The number of bits corresponding to the truncated two-dimensional block has priority
2. The high efficiency coding method according to claim 1, wherein the number is increased.
【請求項4】 上記丸め処理の情報として、上記ビット
配分量算出ステップにおける切り上げ及び/又は切り捨
て処理に関する情報を用いることを特徴とする請求項1
記載の高能率符号化方法。
4. The method according to claim 1, wherein the information of the rounding process includes the bit
2. The method according to claim 1, wherein information on round-up and / or round-down processing in the allocation amount calculation step is used.
The high-efficiency encoding method according to the above.
【請求項5】 上記丸め処理の情報として、上記ビット
配分量算出ステップで求めたビット配分情報の小数点以
下の桁の数値を用いることを特徴とする請求項1記載の
高能率符号化方法。
5. The information of the rounding process, wherein the bit
2. The high-efficiency encoding method according to claim 1, wherein a numerical value of a digit after the decimal point of the bit allocation information obtained in the allocation amount calculating step is used .
【請求項6】 入力信号を複数の周波数帯域成分に分解
する周波数分解手段と、 上記周波数帯域成分を時間と周波数とに関して分割した
複数の2次元ブロック毎に当該周波数帯域成分に応じて
量子化に必要なビット配分情報を小数値として求め、求
めた上記ビット配分情報を丸め処理して各2次元ブロッ
ク毎の整数値のビット配分量を算出するビット配分量算
出手段と、 上記各2次元ブロック毎に算出されたビット配分量を、
既定のビットレートにより定まるビット量と同等になる
よう調整し、各2次元ブロックのビット配分量を決定す
るビット配分量決定手段と、 決定した上記ビット配分量に応じて、上記2次元ブロッ
ク毎に上記周波数帯域成分の量子化を行う周波数帯域成
分量子化手段とを有し、 上記ビット配分量決定手段は、上記2次元ブロック毎に
算出したビット配分量の総和が既定ビットレートにより
定まるビット量と同等でないときには、上記ビット配分
量算出手段における丸め処理の情報に基づいて、上記ビ
ット配分量の調整を行うこと を特徴とする高能率符号化
装置。
6. An input signal is decomposed into a plurality of frequency band components.
Frequency dividing means, and the frequency band component is divided with respect to time and frequency.
According to the frequency band component for each of a plurality of two-dimensional blocks
Bit allocation information required for quantization is obtained as a decimal value, and
The above-mentioned bit allocation information is rounded and processed for each two-dimensional block.
Bit allocation calculation to calculate the bit allocation of integer values for each task
Output means, and the bit allocation amount calculated for each of the two-dimensional blocks,
It is equal to the bit amount determined by the default bit rate
And determine the bit allocation amount for each two-dimensional block.
Means for determining the bit allocation amount, and the two-dimensional block according to the determined bit allocation amount.
Frequency band components that quantize the frequency band components
And a quantizing means, wherein the bit allocation amount determining means is provided for each of the two-dimensional blocks.
The sum of the calculated bit allocation amounts depends on the default bit rate
If the bit amount is not equal to
Based on the information of the rounding process in the
A high-efficiency coding apparatus for adjusting the amount of data allocation .
【請求項7】 高能率符号化方法により圧縮符号化され
た入力信号を伝送する伝送媒体であって、 上記入力信号を複数の周波数帯域成分に分解し、 上記周波数帯域成分を時間と周波数とに関して分割した
複数の2次元ブロック毎に当該周波数帯域成分に応じて
量子化に必要なビット配分情報を小数値として求め、求
めた上記ビット配分情報を丸め処理して各2次元ブロッ
ク毎の整数値のビット配分量を算出し、 上記各2次元ブロック毎に算出されたビット配分量を、
既定のビットレートにより定まるビット量と同等になる
よう調整することにより各2次元ブロックのビ ット配分
量を決定し、 決定した上記ビット配分量に応じて、上記2次元ブロッ
ク毎に上記周波数帯域成分の量子化を行う際に、上記2
次元ブロック毎に算出したビット配分量の総和が既定ビ
ットレートにより定まるビット量と同等でないときに
は、上記ビット配分量の算出時に行った丸め処理の情報
に基づいて、上記ビット配分量の調整を行って各2次元
ブロックのビット配分量を決定する高能率符号化方法に
より圧縮符号化された信号を伝送すること を特徴とする
伝送媒体。
7. The method according to claim 1 , wherein said compression coding is performed by a high efficiency coding method.
A transmission medium for transmitting an input signal, wherein the input signal is decomposed into a plurality of frequency band components, and the frequency band components are divided with respect to time and frequency.
According to the frequency band component for each of a plurality of two-dimensional blocks
Bit allocation information required for quantization is obtained as a decimal value, and
The above-mentioned bit allocation information is rounded and processed for each two-dimensional block.
The bit allocation amount of the integer value for each block is calculated, and the bit allocation amount calculated for each of the two-dimensional blocks is calculated by:
It is equal to the bit amount determined by the default bit rate
Bit allocation for each two-dimensional block by adjusting as
The two-dimensional block is determined in accordance with the determined bit allocation amount.
When quantizing the frequency band component for each clock,
The sum of the bit allocation amount calculated for each dimension block is the default
Is not equal to the bit rate determined by the
Is the information of the rounding process performed when calculating the bit allocation amount.
Is adjusted based on
Efficient coding method for determining block bit allocation
A transmission medium for transmitting a more compression-coded signal .
JP31180394A 1994-12-15 1994-12-15 High-efficiency encoding method and apparatus, and transmission medium Expired - Fee Related JP3291948B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31180394A JP3291948B2 (en) 1994-12-15 1994-12-15 High-efficiency encoding method and apparatus, and transmission medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31180394A JP3291948B2 (en) 1994-12-15 1994-12-15 High-efficiency encoding method and apparatus, and transmission medium

Publications (2)

Publication Number Publication Date
JPH08167851A JPH08167851A (en) 1996-06-25
JP3291948B2 true JP3291948B2 (en) 2002-06-17

Family

ID=18021624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31180394A Expired - Fee Related JP3291948B2 (en) 1994-12-15 1994-12-15 High-efficiency encoding method and apparatus, and transmission medium

Country Status (1)

Country Link
JP (1) JP3291948B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1183685C (en) * 1998-05-27 2005-01-05 微软公司 System and method for entropy ercoding quantized transform coefficients of a sigral
DE10331803A1 (en) 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for converting to a transformed representation or for inverse transformation of the transformed representation
JP4822697B2 (en) * 2004-12-01 2011-11-24 シャープ株式会社 Digital signal encoding apparatus and digital signal recording apparatus
JP4963681B2 (en) 2008-03-27 2012-06-27 株式会社メガチップス Image processing device

Also Published As

Publication number Publication date
JPH08167851A (en) 1996-06-25

Similar Documents

Publication Publication Date Title
JP3278900B2 (en) Data encoding apparatus and method
US5737718A (en) Method, apparatus and recording medium for a coder with a spectral-shape-adaptive subband configuration
JP3134455B2 (en) High efficiency coding apparatus and method
EP0575110B1 (en) Compressing and expanding digital signals
JP3336618B2 (en) High-efficiency encoding method and high-efficiency encoded signal decoding method
US5774844A (en) Methods and apparatus for quantizing, encoding and decoding and recording media therefor
JPH04304031A (en) Digital signal coder
JPH05248972A (en) Audio signal processing method
US6097880A (en) Digital signal processing method, digital signal processing apparatus, digital signal recording method, digital signal recording apparatus, recording medium, digital signal transmission method and digital signal transmission apparatus
JPH0846518A (en) Information coding and decoding method, information coder and decoder and information recording medium
JP3557674B2 (en) High efficiency coding method and apparatus
JPH0846517A (en) High efficiency coding and decoding system
JP3291948B2 (en) High-efficiency encoding method and apparatus, and transmission medium
JP3227945B2 (en) Encoding device
JP3227948B2 (en) Decryption device
JP3318824B2 (en) Digital signal encoding method, digital signal encoding device, digital signal recording method, digital signal recording device, recording medium, digital signal transmission method, and digital signal transmission device
JPH11330974A (en) Encoding method and device, decoding method and device, digital signal recording method and device, recording medium and digital transmitting method and device
JP3186331B2 (en) Signal conversion method or apparatus, and recording medium
JPH08167247A (en) High-efficiency encoding method and device as well as transmission medium
KR100340368B1 (en) High Efficiency Encoder, Decoder and Digital Data Derivation Method
JPH07336231A (en) Method and device for coding signal, method and device for decoding signal and recording medium
JPH08237130A (en) Method and device for signal coding and recording medium
JP3200886B2 (en) Audio signal processing method
JPH07181996A (en) Information processing method, information processor and media
JPH11272294A (en) Encoding method, decoding method, encoder, decoder, digital signal recording method and device, storage medium, and digital signal transmitting method and device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020226

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080329

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090329

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100329

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100329

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110329

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130329

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees