JPH07175499A - Device and method for encoding, recording medium and device and method for decoding - Google Patents
Device and method for encoding, recording medium and device and method for decodingInfo
- Publication number
- JPH07175499A JPH07175499A JP20670294A JP20670294A JPH07175499A JP H07175499 A JPH07175499 A JP H07175499A JP 20670294 A JP20670294 A JP 20670294A JP 20670294 A JP20670294 A JP 20670294A JP H07175499 A JPH07175499 A JP H07175499A
- Authority
- JP
- Japan
- Prior art keywords
- bit allocation
- signal
- allocation amount
- channel
- amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、映画フィルム映写シス
テム、ビデオテープレコーダ、ビデオディスクプレーヤ
等のステレオや、いわゆるマルチサウンド音響システム
において用いられる、マルチチャンネルのオーディオ信
号を圧縮符号化する符号化装置及び方法と、記録媒体、
並びに圧縮符号化された信号を復号化する復号化装置及
び方法に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a coding apparatus for compressing and coding a multi-channel audio signal, which is used in a stereo such as a motion picture film projection system, a video tape recorder, a video disc player and so-called multi-sound audio system. And method and recording medium,
The present invention also relates to a decoding device and method for decoding a compression-coded signal.
【0002】[0002]
【従来の技術】オーディオ或いは音声等の信号の高能率
符号化の手法及び装置には種々のものが知られている。2. Description of the Related Art Various methods and devices for high-efficiency coding of signals such as audio or voice are known.
【0003】その手法としては、例えば、時間領域のオ
ーディオ信号等を単位時間毎にブロック化してこのブロ
ック毎の時間軸の信号を周波数軸上の信号に変換(直交
変換)して複数の周波数帯域に分割し、各帯域毎に符号
化するブロック化周波数帯域分割方式、いわゆる変換符
号化(トランスフォームコーティング)がある。As a method thereof, for example, a time domain audio signal or the like is divided into blocks for each unit time, and the time axis signal of each block is converted into a signal on the frequency axis (orthogonal conversion) to obtain a plurality of frequency bands. There is a so-called transform coding (block coating), which is a block frequency band division method in which each frequency band is coded.
【0004】また、時間領域のオーディオ信号等を単位
時間毎にブロック化しないで、複数の周波数帯域に分割
して符号化する非ブロック化周波数帯域分割方式である
帯域分割符号化(サブバンドコーディング:SBC)等
を挙げることができる。Further, band division coding (sub-band coding), which is a non-blocking frequency band division method in which a time domain audio signal or the like is not divided into blocks for each unit time and is divided into a plurality of frequency bands for encoding SBC) etc. can be mentioned.
【0005】さらに、上述の帯域分割符号化と変換符号
化とを組み合わせた高能率符号化の手法及び装置も考え
られている。この場合には、例えば、入力信号を上記帯
域分割符号化で帯域分割した後、各帯域毎の信号を周波
数領域の信号に直交変換し、この直交変換された各帯域
毎の成分に符号化を施す。Further, a high-efficiency coding method and apparatus combining the above-mentioned band division coding and transform coding has been considered. In this case, for example, after the input signal is band-divided by the band-division coding, the signal for each band is orthogonally transformed into a signal in the frequency domain, and the orthogonally transformed components for each band are coded. Give.
【0006】ここで、上述した帯域分割符号化の帯域分
割用フィルタとしては、例えばQMF等のフィルタがあ
り、これは例えば、文献「ディジタル・コーディング・
オブ・スピーチ・イン・サブバンズ」("Digital coding
of speech in subbands" R.E.Crochiere, Bell Syst.
Tech. J., Vol.55,No.8 1976) に述べられている。この
QMFのフィルタは、帯域を等バンド幅に2分割するも
のであり、当該フィルタにおいては上記分割した帯域を
後に合成する際にいわゆるエリアシングが発生しないこ
とが特徴となっている。[0006] Here, as the band division filter of the above-mentioned band division encoding, there is a filter such as QMF, which is disclosed in, for example, the document "Digital Coding."
Of Speech in Subvans "(" Digital coding
of speech in subbands "RE Crochiere, Bell Syst.
Tech. J., Vol.55, No.8 1976). This QMF filter divides the band into two equal bandwidths, and is characterized in that so-called aliasing does not occur when the divided bands are combined later.
【0007】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
このポリフェイズ・クァドラチュア・フィルタにおいて
は、信号を等バンド幅の複数の帯域に分割する際に一度
に分割できることが特徴となっている。In addition, the document "Polyphase Quadrature Filters-New Band Division Coding Technique"("Po
lyphase Quadrature filters -A new subband coding t
echnique ", Joseph H. Rothweiler ICASSP 83, BOSTON)
Describes an equal bandwidth filter partitioning technique.
This polyphase quadrature filter is characterized in that when a signal is divided into a plurality of bands of equal bandwidth, it can be divided at one time.
【0008】さらに、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、ブロック毎に高速フーリエ変換(FF
T)、離散コサイン変換(DCT)、モディファイドD
CT変換(MDCT)などを行うことで時間軸を周波数
軸に変換するような直交変換がある。Further, as the above-mentioned orthogonal transform, for example, the input audio signal is divided into blocks in a predetermined unit time (frame), and fast Fourier transform (FF) is performed for each block.
T), discrete cosine transform (DCT), modified D
There is orthogonal transformation in which a time axis is transformed into a frequency axis by performing CT transformation (MDCT) or the like.
【0009】このMDCTについては、文献「時間領域
エリアシング・キャンセルを基礎とするフィルタ・バン
ク設計を用いたサブバンド/変換符号化」("Subband/Tr
ansform Coding Using Filter Bank Designs Based on
Time Domain Aliasing Cancellation," J.P.Princen A.
B.Bradley, Univ. of Surrey Royal Melbourne Inst.of
Tech. ICASSP 1987)に述べられている。Regarding this MDCT, the document "Subband / Transform Coding Using Filter Bank Design Based on Time Domain Aliasing Cancellation"("Subband / Tr
ansform Coding Using Filter Bank Designs Based on
Time Domain Aliasing Cancellation, "JPPrincen A.
B. Bradley, Univ. Of Surrey Royal Melbourne Inst.of
Tech. ICASSP 1987).
【0010】更に、周波数帯域分割された各周波数成分
を量子化する場合の周波数分割幅としては、例えば人間
の聴覚特性を考慮した帯域分割がある。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
程帯域幅が広くなるような帯域幅で、オーディオ信号を
複数(例えば25バンド)の帯域に分割することがあ
る。Further, as a frequency division width in the case of quantizing each frequency component divided into frequency bands, there is a band division considering human auditory characteristics, for example. That is, an audio signal may be divided into a plurality of bands (for example, 25 bands) with a bandwidth that increases in a higher frequency range generally called a critical band.
【0011】また、この時の各帯域毎のデータを符号化
する際には、各帯域毎に所定のビット配分(Bit allocat
ion)或いは、各帯域毎に適応的なビット配分による符号
化が行われる。When encoding the data for each band at this time, a predetermined bit allocation (Bit allocat
ion) or coding is performed by adaptive bit allocation for each band.
【0012】例えば、上記MDCT処理されて得られた
係数データを上記ビット配分によって符号化する際に
は、上記各ブロック毎のMDCT処理により得られる各
帯域毎のMDCT係数データに対して、適応的な配分ビ
ット数で符号化が行われることになる。For example, when the coefficient data obtained by the MDCT processing is encoded by the bit allocation, it is adaptive to the MDCT coefficient data for each band obtained by the MDCT processing for each block. Encoding will be performed with various allocation bit numbers.
【0013】上記ビット配分手法及びそのための装置と
しては、次の2手法及び装置が知られている。The following two techniques and devices are known as the above-mentioned bit allocation technique and devices therefor.
【0014】例えば、文献「音声信号の適応変換符号
化」("Adaptive Transform Coding of Speech Signal
s", IEEE Transactions of Accoustics, Speech, and S
ignal Processing, vol.ASSP-25, No.4, August 1977
)では、各帯域毎の信号の大きさをもとに、ビット割
当を行っている。For example, the document "Adaptive Transform Coding of Speech Signal"
s ", IEEE Transactions of Accoustics, Speech, and S
ignal Processing, vol.ASSP-25, No.4, August 1977
), Bit allocation is performed based on the signal size of each band.
【0015】また、例えば文献「臨界帯域符号化器 −
聴覚システムの知覚の要求に関するディジタル符号化」
("The critical band coder --digital encoding of
theperceptual requirements of the auditory syste
m", M.A.Kransner MIT, ICASSP 1980)では、聴覚マス
キングを利用することで、各帯域毎に必要な信号対雑音
比を得て固定的なビット割当を行う手法及び装置が述べ
られている。Further, for example, in the document "Critical band encoder-
Digital encoding of the auditory system's perceptual requirements "
("The critical band coder --digital encoding of
the perceptual requirements of the auditory syste
m ", MAKransner MIT, ICASSP 1980) describes a method and a device for performing fixed bit allocation by obtaining a necessary signal-to-noise ratio for each band by using auditory masking.
【0016】[0016]
【発明が解決しようとする課題】ところで、例えば上述
したようなサブバンドコーディング等を用いたオーディ
オ信号の高能率圧縮符号化方式においては、人間の聴覚
上の特性を利用し、オーディオデータを約1/5に圧縮
するような方式が既に実用化されている。By the way, for example, in the high-efficiency compression encoding system for audio signals using the above-mentioned sub-band coding or the like, the human auditory characteristic is utilized to convert the audio data into about 1 A method of compressing to / 5 has already been put into practical use.
【0017】なお、このオーディオデータを約1/5に
圧縮する高能率符号化方式としては、例えばMD(SONY
社商標、Mini Disc)規格に使用されている、ATRAC
(SONY社商標、Adaptive TRansform Acoustic Coding)
と呼ばれる方式がある。As a high-efficiency encoding method for compressing the audio data to about 1/5, for example, MD (SONY
ATRAC used in the company's trademark, Mini Disc) standard
(Trademark of SONY, Adaptive TRansform Acoustic Coding)
There is a method called.
【0018】しかし、上記人間の聴覚上の特性を利用し
た高能率符号化方式では、圧縮符号化してその後復号化
して得られる楽器や人間の声などが、わずかながら、原
音から変化してしまうといった事例も見られる。特に原
音の忠実な再現が必要な記録メデイアの記録フォーマッ
トに用いる場合には、その高音質化が要求されている。However, in the high-efficiency coding method utilizing the human auditory characteristics, the musical instrument or human voice obtained by compression coding and then decoding is slightly changed from the original sound. There are also cases. In particular, when used in a recording medium recording format that requires faithful reproduction of the original sound, high sound quality is required.
【0019】これに対し、上記オーディオ信号を約1/
5に圧縮するような高能率符号化方式(ATRAC方式
等)のフォーマットは、既に実用化されていて、このフ
ォーマットが採用されたハードウェアも広まりつつあ
る。On the other hand, the audio signal is about 1 /
A high-efficiency encoding format (such as ATRAC method) that compresses to 5 has already been put into practical use, and hardware adopting this format is becoming widespread.
【0020】したがって、上記フォーマットの互換性の
無い変更や拡張をすることは、上記フォーマットを使用
してきた生産者だけでなく、一般の使用者にも不利益と
なる。Therefore, incompatible changes or expansions of the above formats are not only disadvantageous to the producers who have used the above formats, but also to general users.
【0021】このため、フォーマット自身は変更せず
に、エンコードやデコードの際に工夫することによる高
音質化の達成が望まれている。Therefore, it is desired to achieve high sound quality by modifying the format itself without changing the format itself.
【0022】なお、高音質化の方法としては、他にリニ
アPCM音声を混在させることが考えられる。しかし、
上記高能率符号化方式の圧縮データとリニアデータとで
は、フレームの長さや1フレーム当たりの時間長が異な
るため、再生時に同期を取ることが難しい。従って、こ
れら2つのフォーマットのデータを同時に用いることは
非常に困難である。As a method of improving the sound quality, it is conceivable to mix linear PCM sound. But,
Since the frame length and the time length per frame are different between the compressed data of the high efficiency coding system and the linear data, it is difficult to synchronize the reproduction. Therefore, it is very difficult to use the data in these two formats at the same time.
【0023】さらに、通常のオーディオ機器の場合のみ
ならず、例えば映画フィルム映写システム、高品位テレ
ビジョン、ビデオテープレコーダ、ビデオディスクプレ
ーヤ等のステレオないしはマルチサウンド音響システム
においては、4〜8チャンネルの複数チャンネルのオー
ディオ信号を扱うようになりつつある。この場合におい
ても、ビットレートを削減する高能率符号化を行うこと
が望まれている。Further, not only in the case of ordinary audio equipment but also in stereo or multi-sound sound systems such as movie film projection systems, high-definition televisions, video tape recorders, video disc players, etc., a plurality of 4 to 8 channels are used. It is beginning to handle audio signals of channels. Even in this case, it is desired to perform high efficiency coding that reduces the bit rate.
【0024】特に、上記映画フィルムにおいて、例えば
レフトチャンネル,レフトセンターチャンネル,センタ
ーチャンネル,ライトセンターチャンネル,ライトチャ
ンネル,サラウンドレフトチャンネル,サラウンドライ
トチャンネル,サブウーファーチャンネルの8チャンネ
ルのディジタルオーディオ信号を記録するような場合が
ある。この場合には、上記ビットレートを削減する高能
率符号化が必要となる。Particularly, in the above-mentioned motion picture film, for example, eight channels of digital audio signals of a left channel, a left center channel, a center channel, a right center channel, a right channel, a surround left channel, a surround right channel and a subwoofer channel are recorded. There is a case. In this case, high-efficiency coding that reduces the bit rate is required.
【0025】すなわち、いわゆるCD(コンパクトディ
スク)などで用いているようなサンプリング周波数4
4.1kHzで16ビットの直線量子化されたオーディ
オデータの上記8チャンネル分を記録できる領域を、上
記映画フィルム上に確保することは困難である。したが
って、当該オーディオデータの圧縮が必要になる。That is, the sampling frequency 4 as used in so-called CDs (compact discs), etc.
It is difficult to secure an area on the motion picture film where the above 8 channels of 16-bit linearly quantized audio data at 4.1 kHz can be recorded. Therefore, it is necessary to compress the audio data.
【0026】なお、上記映画フィルムに記録する8チャ
ンネルの各チャンネルは、例えば映画フィルムの画像記
録領域から再生された画像が映写機によって投影される
スクリーン側に配置された、レフトスピーカ、レフトセ
ンタースピーカ、センタスピーカ、ライトセンタスピー
カ、ライトスピーカ、サラウンドレフトスピーカ、サラ
ウンドライトスピーカ、サブウーファースピーカとそれ
ぞれ対応するものである。Each of the eight channels recorded on the movie film is, for example, a left speaker, a left center speaker, which is arranged on the screen side on which an image reproduced from the image recording area of the movie film is projected by a projector. The speaker corresponds to a center speaker, a right center speaker, a right speaker, a surround left speaker, a surround right speaker, and a subwoofer speaker.
【0027】ここで、上記センタスピーカは、スクリー
ン側の中央に配置され、センタチャンネルのオーディオ
データによる再生音を出力するものである。例えば俳優
のせりふ等の最も重要な再生音を出力する。Here, the center speaker is arranged at the center of the screen side and outputs a reproduced sound based on the audio data of the center channel. For example, the most important reproduced sound such as the dialogue of an actor is output.
【0028】上記サブウーファースピーカは、サブウー
ファーチャンネルのオーディオデータによる再生音を出
力するものである。例えば爆発音などの低域の音という
よりは振動として感じられる音を効果的に出力するもの
であり、爆発シーンなどに効果的に使用されることが多
いものである。The subwoofer speaker outputs a reproduced sound based on audio data of the subwoofer channel. For example, it effectively outputs a sound that is felt as vibration rather than a low-frequency sound such as an explosion sound, and is often used effectively in an explosion scene or the like.
【0029】上記レフトスピーカ及びライトスピーカ
は、上記スクリーンの左右に配置され、レフトチャンネ
ルのオーディオデータによる再生音とライトチャンネル
のオーディオデータによる再生音を出力するもので、ス
テレオ音響効果を発揮する。The left speaker and the right speaker are arranged on the left and right sides of the screen and output a reproduced sound by the left channel audio data and a reproduced sound by the right channel audio data, and exhibit a stereo sound effect.
【0030】上記レフトセンタスピーカは、上記レフト
スピーカとセンタスピーカとの間に配置され、また上記
ライトセンタスピーカは、上記センタスピーカとライト
スピーカとの間に配置されるものである。上記レフトセ
ンタスピーカは、レフトセンタチャンネルのオーディオ
データによる再生音を出力し、上記ライトセンタスピー
カは、ライトセンタチャンネルのオーディオデータによ
る再生音を出力するものである。それぞれ上記レフトス
ピーカ若しくはライトスピーカの補助的な役割を果た
す。The left center speaker is arranged between the left speaker and the center speaker, and the right center speaker is arranged between the center speaker and the right speaker. The left center speaker outputs a reproduced sound based on the audio data of the left center channel, and the right center speaker outputs a reproduced sound based on the audio data of the right center channel. Each plays an auxiliary role of the left speaker or the right speaker.
【0031】特にスクリーンが大きく収容人数の多い映
画館等では、座席の位置によって音像の定位が不安定に
なるという欠点がある。しかし、上記レフトセンタスピ
ーカとライトセンタスピーカを付加することにより、音
像のよりリアルな定位を作り出すのに効果を発揮する。Particularly in a movie theater or the like having a large screen and a large number of people, there is a drawback that the localization of the sound image becomes unstable depending on the position of the seat. However, the addition of the left center speaker and the right center speaker is effective in creating a more realistic localization of the sound image.
【0032】さらに、上記サラウンドレフトスピーカと
サラウンドライトスピーカは、観客席を取り囲むように
配置される。サラウンドレフトチャンネルのオーディオ
データによる再生音と、サラウンドライトチャンネルの
オーディオデータによる再生音を出力するもので、残響
音や拍手、歓声に包まれた印象を与える効果がある。こ
れにより、より立体的な音像を作り出すことができる。Further, the surround left speaker and the surround right speaker are arranged so as to surround the audience seats. It outputs the reproduced sound based on the audio data of the surround left channel and the reproduced sound based on the audio data of the surround right channel, and has the effect of giving the impression of reverberation, applause, and cheers. As a result, a more stereoscopic sound image can be created.
【0033】また、映画フィルムという媒体は、表面に
傷などが発生しやすいため、ディジタルデータをオリジ
ナルのまま記録していたのでは、データ欠けが激しく実
用にならない。このため、エラー訂正符号の能力が非常
に重要である。Further, since a medium called a motion picture film is apt to have scratches on its surface, if digital data is recorded as it is, the data will be seriously lost and it will not be put to practical use. For this reason, the capability of the error correction code is very important.
【0034】従って、上記データ圧縮は、その訂正符号
のためのビットも考慮して、上記フィルム上の記録領域
に記録可能な程度まで圧縮処理を行う必要がある。Therefore, in the data compression, it is necessary to perform the compression processing to the extent that the data can be recorded in the recording area on the film in consideration of the bit for the correction code.
【0035】以上より、上記8チャンネルのディジタル
オーディオデータを圧縮する圧縮方法としては、上述し
たような人間の聴覚の特性を考慮して最適なビット割り
当てを行うことによって、CD並の音質を達成する前記
高能率符号化方式(例えば上記ATRAC方式)を適用
するようにしている。From the above, as a compression method for compressing the above-mentioned 8-channel digital audio data, optimum bit allocation is performed in consideration of the characteristics of human hearing as described above, thereby achieving a sound quality comparable to that of a CD. The high efficiency coding method (for example, the ATRAC method described above) is applied.
【0036】しかし、当該高能率符号化方式では、前述
同様に一般の楽器や人間の声などが原音からわずかなが
ら変化するため、特に原音に忠実な再現を必要とする記
録フォーマットに採用する場合には、何らかの高音質化
の手段が必要となってくる。However, in the high-efficiency coding method, the general musical instrument or human voice slightly changes from the original sound as described above. Therefore, when it is adopted in a recording format that requires faithful reproduction to the original sound. Requires some means of improving the sound quality.
【0037】そしてこの問題は、上記映画フィルムにお
いて、マルチチャンネル記録フォーマットとして、上記
高能率符号化方式以外を用いた場合、記録領域確保の点
から非可逆圧縮を採用する以上、常に存在する問題であ
る。This problem is always present when lossy compression is adopted from the viewpoint of securing the recording area when a multi-channel recording format other than the above high-efficiency encoding method is used in the above-mentioned motion picture film. is there.
【0038】また、上述のようなマルチチャンネルのオ
ーディオ信号を高能率符号化する方式では、各チャンネ
ルが独立して圧縮処理が行われる。Further, in the above-described method of highly efficient encoding of multi-channel audio signals, each channel is independently compressed.
【0039】そのため、例えば、ある1つのチャンネル
が無音状態であっても、そのチャンネルに固定ビット
(バイト)配分量が割り当てられることになる。Therefore, for example, even if a certain channel is in a silent state, a fixed bit (byte) allocation amount is assigned to that channel.
【0040】このように、無音状態のチャンネルに固定
のビット配分量を与えることは、冗長である。As described above, it is redundant to give a fixed bit allocation amount to a silent channel.
【0041】また、レベルの低い信号のチャンネルと、
高い信号のチャンネルとについても、ビット配分量が同
じであるため、各チャンネルにわたってビット配分量を
評価すると、冗長なビットが存在する。In addition, a channel of a low level signal,
Since the bit allocation amount is the same for the high signal channel as well, when the bit allocation amount is evaluated over each channel, there are redundant bits.
【0042】特に、各チャンネル毎にビット配分量が固
定されている場合には、上記のような冗長がさらに顕著
になると考えられる。In particular, when the bit allocation amount is fixed for each channel, it is considered that the above redundancy becomes more remarkable.
【0043】そこで、本発明は、上述したようなことに
鑑み、マルチチャンネルでの圧縮符号化の際のビット配
分量の冗長を無くすと共に、圧縮符号化復号化の高品位
化を可能とする符号化装置及び方法、それに対応する復
号化装置と、圧縮符号化された信号が記録される記録媒
体を提供することを目的としている。Therefore, in view of the above, the present invention eliminates the redundancy of the bit allocation amount at the time of multi-channel compression encoding, and also enables the high-quality compression encoding / decoding. It is an object of the present invention to provide an encoding device and method, a corresponding decoding device, and a recording medium on which a compression-encoded signal is recorded.
【0044】[0044]
【課題を解決するための手段】本発明は、上述の目的を
達成するために提案されたものであり、本発明の符号化
方法が適用される符号化装置(高能率符号化装置)は、
複数チャンネルの信号を各々圧縮符号化する圧縮符号化
手段と、上記圧縮符号化前の各チャンネルの信号のエネ
ルギを検出するエネルギ検出手段と、上記エネルギの時
間的な変化に基づいて各チャンネルへのビット配分量を
決定するビット配分量決定手段とを有し、上記エネルギ
とビット配分量との関係が非線形とされ、複数チャンネ
ルの信号の時間領域サンプル若しくは周波数領域サンプ
ルに対してチャンネル間で可変ビット配分を行うように
したものである。DISCLOSURE OF THE INVENTION The present invention has been proposed in order to achieve the above object, and an encoding device (high efficiency encoding device) to which the encoding method of the present invention is applied is
Compression encoding means for compressing and encoding the signals of a plurality of channels, energy detecting means for detecting the energy of the signal of each channel before the compression encoding, and for each channel based on the temporal change of the energy A bit allocation amount determining means for determining a bit allocation amount, wherein the relationship between the energy and the bit allocation amount is non-linear, and variable bits between channels for time domain samples or frequency domain samples of signals of a plurality of channels It is designed to be distributed.
【0045】本発明の第1の実施例の高能率符号化装置
は、上記エネルギ検出手段が、上記圧縮符号化前の各チ
ャンネルの信号の振幅情報を検出する振幅情報検出手段
であり、これと上記振幅情報の時間的な変化に基づいて
各チャンネルへのビット配分量を決定するビット配分量
決定手段で構成されることを特徴とする。In the high efficiency coding apparatus according to the first embodiment of the present invention, the energy detecting means is amplitude information detecting means for detecting the amplitude information of the signal of each channel before the compression coding. It is characterized by comprising bit allocation amount determining means for determining the bit allocation amount to each channel based on the temporal change of the amplitude information.
【0046】ここで、前記ビット配分量決定手段は、聴
覚特性に基づいて各チャンネルの振幅情報のピーク値に
対するビット配分量を所定の換算式より換算し、当該換
算結果に基づいて各チャンネルに配分すべきビット量を
決定する。Here, the bit allocation amount determining means converts the bit allocation amount with respect to the peak value of the amplitude information of each channel based on the auditory characteristic by a predetermined conversion formula, and allocates to each channel based on the conversion result. Determine the amount of bits to do.
【0047】また、前記ビット配分量決定手段は、所定
の換算式から各チャンネルに配分すべきビット量の概算
量をそれぞれ求め、各チャンネルのビット配分量をそれ
ぞれの概算量に比例して配分することによって全チャン
ネルの総ビット配分量を一定とする。Further, the bit allocation amount determining means obtains an approximate amount of bits to be allocated to each channel from a predetermined conversion formula, and allocates the bit allocation amount of each channel in proportion to each approximate amount. As a result, the total bit allocation amount of all channels is made constant.
【0048】さらに、本発明の第1の実施例の高能率復
号化装置は、上記第1の実施例の高能率符号化装置によ
って符号化された各チャンネルの信号を復号化する復号
化手段を有するものである。Further, the high-efficiency decoding apparatus according to the first embodiment of the present invention comprises decoding means for decoding the signals of the respective channels encoded by the high-efficiency encoding apparatus according to the first embodiment. I have.
【0049】また、本発明の第2の実施例の高能率符号
化装置は、上記エネルギ検出手段が、上記各チャンネル
の信号に対する所定のスケールファクタ(時間と周波数
の2次元領域(ブロックフローティングユニット)の正
規化した値)の時間的変化を検出する手段であり、上記
スケールファクタの変化に応じて、チャンネル間で可変
ビット配分を行うようにしたものである。Further, in the high-efficiency coding apparatus according to the second embodiment of the present invention, the energy detecting means has a predetermined scale factor (two-dimensional area of time and frequency (block floating unit)) for the signal of each channel. Is a means for detecting a temporal change in (normalized value of), and is adapted to perform variable bit allocation among channels according to the change in the scale factor.
【0050】ここで、第2の実施例の高能率符号化装置
でも、前記ビット配分量決定手段は、人間の聴覚の特性
に基づいて各チャンネルのスケールファクタの総和の時
間的変化に対するビット配分量を所定の換算式より換算
し、当該換算結果に基づいて各チャンネルに配分すべき
ビット量を決定する。Here, also in the high-efficiency coding apparatus of the second embodiment, the bit allocation amount determining means determines the bit allocation amount with respect to the temporal change of the sum of the scale factors of the respective channels based on the characteristics of human hearing. Is converted by a predetermined conversion formula, and the bit amount to be distributed to each channel is determined based on the conversion result.
【0051】さらに、前記ビット配分量決定手段は、所
定の換算式から各チャンネルに配分すべきビット量の概
算量をそれぞれ求め、各チャンネルのビット配分量をそ
れぞれの概算量に比例して配分することによって全チャ
ンネルの総ビット配分量を一定とする。Further, the bit allocation amount determining means obtains an approximate amount of bit amount to be allocated to each channel from a predetermined conversion formula, and allocates the bit allocation amount of each channel in proportion to each approximate amount. As a result, the total bit allocation amount of all channels is made constant.
【0052】また、本発明の第2の実施例の高能率復号
化装置は、上記第2の実施例の高能率符号化装置によっ
て符号化された各チャンネルの信号を復号化する復号化
手段を有するものである。Further, the high-efficiency decoding apparatus according to the second embodiment of the present invention comprises decoding means for decoding the signals of the respective channels encoded by the high-efficiency encoding apparatus according to the second embodiment. I have.
【0053】[0053]
【作用】本発明によれば、複数チャンネルのオーディオ
データの圧縮符号化の際には、各チャンネルのエネルギ
の時間的な変化に基づいて、各チャンネルへのビット配
分量を決定して圧縮符号化を行うようにしているため、
各チャンネルに対してその情報量に見合ったビット配分
が可能となる。According to the present invention, when compressing and coding audio data of a plurality of channels, the bit allocation amount to each channel is determined based on the temporal change of the energy of each channel and the coding is performed. Because I am trying to do
It is possible to allocate bits corresponding to the amount of information to each channel.
【0054】また、本発明によれば、複数チャンネルの
オーディオデータの圧縮符号化の際には、各チャンネル
でのエネルギとビット配分量とが非線形に関係付けら
れ、そのビット配分量に基づき圧縮符号化を行うように
しているため、各チャンネルに対してその情報量に見合
ったビット配分が可能となる。Further, according to the present invention, when compressing and coding audio data of a plurality of channels, energy and bit allocation amount in each channel are associated with each other in a non-linear manner, and the compression code is based on the bit allocation amount. Since the conversion is performed, it is possible to allocate bits to each channel according to the amount of information.
【0055】[0055]
【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。Embodiments of the present invention will be described below with reference to the drawings.
【0056】図1及び図2に本発明の第1の実施例装置
の基本的な構造を示す。図1には第1の実施例の高能率
符号化装置(エンコーダ)の構成を示し、図2には第1
の実施例の高能率復号化装置(デコーダ)の構成を示し
ている。FIG. 1 and FIG. 2 show the basic structure of the first embodiment device of the present invention. FIG. 1 shows the configuration of the high-efficiency coding apparatus (encoder) of the first embodiment, and FIG.
2 shows the configuration of a high-efficiency decoding device (decoder) of the embodiment.
【0057】先ず、図1に示すエンコーダの構成につい
て説明する。First, the configuration of the encoder shown in FIG. 1 will be described.
【0058】複数チャンネル(ch1,ch2,・・
・,chn)のオーディオ信号は、これら各チャンネル
に対応する各入力端子201 〜20n 及び伝送線路11
〜1nを経て、同じく各チャンネルに対応する標本化及
び量子化器1001 〜100nに送られる。これら標本
化及び量子化器1001 〜100n では各チャンネル
のオーディオ信号が量子化信号に変換される。これら各
標本化及び量子化器1001 〜100n からの量子化さ
れた信号は、各伝送線路21 〜2n を経て、振幅情報検
出回路200と、ディレイライン3001 〜300n に
送られる。Multiple channels (ch1, ch2, ...
- audio signal chn), each input terminal corresponding to the respective channels 20 1 to 20 n and the transmission line 1 1
.About.1 n and then sent to the sampling and quantizers 100 1 to 100 n , which also correspond to the respective channels. In these sampling and quantizers 100 1 to 100 n , the audio signal of each channel is converted into a quantized signal. These quantized signals from the respective sampling and quantizer 100 1 to 100 n is, through the transmission lines 2 1 to 2 n, the amplitude information detecting circuit 200, is sent to a delay line 300 1 to 300 n .
【0059】上記振幅情報検出回路200は、上記各チ
ャンネルの量子化された信号から振幅情報を検出する。
すなわち、当該振幅情報検出回路200では、後述する
符号化器4001 〜400n が一度に処理するオーディ
オデータのサンプル数分の周期毎(以後時間ブロックと
呼ぶ)に振幅情報のピーク値を求め、各チャンネルに対
応する伝送線路41 〜4n を経て当該ピーク値をビット
配分決定回路500へ渡す。なお、当該振幅情報検出回
路200は、伝送線路11 〜1n からの信号によって振
幅情報を検出するような構成にすることも可能である。The amplitude information detection circuit 200 detects amplitude information from the quantized signal of each channel.
That is, in the amplitude information detection circuit 200, the peak value of the amplitude information is obtained for each cycle (hereinafter referred to as a time block) of the number of samples of audio data processed by the encoders 400 1 to 400 n described later at a time, through the transmission lines 4 1 to 4 n corresponding to respective channels pass the peak value to the bit allocation determining circuit 500. The amplitude information detection circuit 200 can also be configured to detect the amplitude information from the signals from the transmission lines 1 1 to 1 n .
【0060】上記ビット配分決定回路500では、上記
各チャンネル毎のピーク値から各チャンネル毎のビット
配分量を後述するように換算し、当該ビット配分量を伝
送線路51 〜5n を経て各符号化器4001 〜400n
に渡す。In the bit allocation determining circuit 500, the bit allocation amount for each channel is converted from the peak value for each channel as described later, and the bit allocation amount is passed through the transmission lines 5 1 to 5 n for each code. Chemist 400 1 to 400 n
Pass to.
【0061】また、上記ディレイライン3001 〜30
0n では、伝送線路21 〜2n を介して受け取った信号
を上記時間ブロック分だけ遅延させ、当該遅延させた信
号を各伝送線路31 〜3n を介して各符号化器4001
〜400n へ渡す。In addition, the delay lines 300 1 to 30
At 0 n , the signals received via the transmission lines 2 1 to 2 n are delayed by the time block, and the delayed signals are transmitted via the transmission lines 3 1 to 3 n to the encoders 400 1
Pass to ~ 400 n .
【0062】各符号化器4001 〜400n では、上記
時間ブロック毎に圧縮動作を行う。このときの伝送線路
51 〜5n を介して受け取るビット配分量は、各ディレ
イライン3001 〜300n での遅延によって上記伝送
線路31 〜3n で受け取る信号のピーク情報を反映し
たものとなっている。各符号化器4001 〜400nで
は、上記伝送線路51 〜5n を介して受け取ったビット
配分量まで上記伝送線路31 〜3n を介して受け取った
信号を圧縮し、当該圧縮した信号を各伝送線路61 〜6
n を経てフォーマッタ600へ渡す。In each of the encoders 400 1 to 400 n , the compression operation is performed for each time block. Bit allocation amount received via transmission line 5 1 to 5 n In this case, as reflecting the peak information of the signal received by the transmission line 3 1 to 3 n by the delay in each delay line 300 1 to 300 n Has become. In each of the encoders 400 1 to 400 n , the signals received via the transmission lines 3 1 to 3 n are compressed up to the bit allocation amount received via the transmission lines 5 1 to 5 n , and the compressed signals are compressed. Each transmission line 6 1 to 6
It is passed to the formatter 600 via n .
【0063】上記フォーマッタ600は、上記各伝送線
路61 〜6n を経て受け取った上記各チャンネル毎の被
圧縮信号を、所定のフォーマットに従って、エラー訂正
処理を施して、伝送又は記録媒体への記録のためのビッ
トストリームへ組み立てる。このビットストリームは、
伝送線路7を経て出力端子21から出力される。The formatter 600 performs error correction processing on the compressed signals for each of the channels received via the transmission lines 6 1 to 6 n according to a predetermined format, and then transmits or records them on a recording medium. Assemble into a bitstream for. This bitstream is
It is output from the output terminal 21 via the transmission line 7.
【0064】更にこのビットストリームは、例えばレー
ザー記録装置26により、映画フィルム27上の所定の
記録エリア28に書き込まれる。尚、図中の指示符号2
9はパーフォレーションを示し、フィルム送りのために
図示しない映写機のスプロケットが噛み合うための孔で
あり、上記記録エリア28は例えば上記パーフォレーシ
ョン29間に設けられる。Further, this bit stream is written in a predetermined recording area 28 on the motion picture film 27 by the laser recording device 26, for example. The reference numeral 2 in the figure
Reference numeral 9 denotes a perforation, which is a hole for engaging a sprocket of a projector (not shown) for feeding the film, and the recording area 28 is provided between the perforations 29, for example.
【0065】次に、本実施例のデコーダ(高能率復号化
装置)の構成について説明する。Next, the configuration of the decoder (high efficiency decoding apparatus) of this embodiment will be described.
【0066】上記図1のエンコーダ(高能率符号化装
置)で組み立てられたビットストリームは、伝送又は記
録媒体に記録される。この記録されたビットストリーム
は、図示しない所定の再生装置を経て、入力端子22に
供給され、この入力端子22から伝送線路8を経て、デ
フォーマッタ700に送られてくる。The bit stream assembled by the encoder of FIG. 1 (high efficiency coding apparatus) is transmitted or recorded on a recording medium. The recorded bit stream is supplied to the input terminal 22 via a predetermined reproducing device (not shown), and is sent from the input terminal 22 to the deformatter 700 via the transmission line 8.
【0067】当該デフォーマッタ700では、上記伝送
線路8を介して送られてきたビットストリームを、所定
のフォーマットに従って各チャンネル毎の被圧縮信号に
分解する。当該各チャンネル毎に分解された被圧縮信号
は、各チャンネルに対応する各伝送線路91 〜9n を経
て、各チャンネル毎に対応して設けられた復号器800
1 〜800n へ送られる。In the deformatter 700, the bit stream sent via the transmission line 8 is decomposed into compressed signals for each channel according to a predetermined format. The compressed signal decomposed for each channel passes through the transmission lines 9 1 to 9 n corresponding to each channel, and the decoder 800 provided corresponding to each channel.
1 to 800 n .
【0068】各復号器8001 〜800n では、上記各
伝送線路91 〜9n を経て送られてきた被圧縮信号を伸
長し、対応する各伝送線路101 〜10n を経て、D/
A(ディジタル/アナログ)変換器9001 〜900n
へ送る。In each of the decoders 800 1 to 800 n , the compressed signal sent via each of the above transmission lines 9 1 to 9 n is expanded, and through each corresponding transmission line 10 1 to 10 n , D /
A (digital / analog) converter 900 1 to 900 n
Send to.
【0069】各D/A変換器9001 〜900n では、
上記各伝送線路101 〜10n を経て送られてきた上記
伸長された信号(ディジタル信号)を、アナログ信号に
変換する。これらアナログに戻された信号は、それぞれ
対応する各伝送線路111 〜11n 及び出力端子231
〜23n を介して、各チャンネルch1〜chnの復号
化された信号として出力される。In each of the D / A converters 900 1 to 900 n ,
The expanded signal (digital signal) sent through each of the transmission lines 10 1 to 10 n is converted into an analog signal. The signals returned to analog are respectively associated with the respective transmission lines 11 1 to 11 n and the output terminal 23 1.
23 to 23 n and output as decoded signals of the respective channels ch1 to chn.
【0070】上述したような本実施例の高能率符号化装
置において利用する圧縮符号化手法は、ビットレートを
可変することが出来るものであればすべてに応用が可能
である。ここでは、前述した人間の聴覚特性を利用し、
ステレオ2チャンネルのオーディオ信号を固定ビットレ
ートで約1/5に圧縮する圧縮符号化手法(例えばいわ
ゆるMD(ミニディスク:Mini Disc)に用いられるAT
RAC方式)を例に挙げ、当該固定ビットレートの圧縮
を可変ビットレートにする本実施例の圧縮符号化の方法
について述べる。The compression coding method used in the high-efficiency coding apparatus of the present embodiment as described above can be applied to all as long as the bit rate can be changed. Here, using the human auditory characteristics described above,
A compression encoding method for compressing a stereo two-channel audio signal to about 1/5 at a fixed bit rate (for example, AT used in so-called MD (Mini Disc)).
(RAC system) as an example, the compression encoding method of this embodiment in which the compression of the fixed bit rate is changed to the variable bit rate will be described.
【0071】図3にはいわゆるATRAC方式が適用さ
れる符号化の構成を示す。なお、この図3の帯域分割フ
ィルタ401から再量子化器406,フォーマッタ40
7までの構成は、図1の各チャンネルの各符号化器40
01 〜400n と対応するものである。FIG. 3 shows a coding structure to which the so-called ATRAC method is applied. It should be noted that the band quantizing filter 401 of FIG.
The configuration up to 7 is applied to each encoder 40 of each channel of FIG.
This corresponds to 0 1 to 400 n .
【0072】この図3において、入力端子24を介して
供給された標本化及び量子化されたオーディオデータ
は、先ず、帯域分割フィルタ401によって0〜5.5
kHzの低域と、5.5kHz〜11kHzの中域と、
11kHz以上(11kHz〜22kHz)の3つの周
波数帯域に分割される。In FIG. 3, the sampled and quantized audio data supplied through the input terminal 24 is first 0-5.5 by the band division filter 401.
low range of kHz and mid range of 5.5 kHz to 11 kHz,
It is divided into three frequency bands of 11 kHz or higher (11 kHz to 22 kHz).
【0073】これら3つの周波数帯域の信号のうち、上
記帯域分割フィルタ401からの上記低域の信号はMD
CT(Modified Discrete Cosine Transform:改良型離
散余弦変換)演算を行うMDCT回路402Lに、中域
の信号は同じくMDCT演算を行うMDCT回路402
Mに、また、高域の信号はMDCT回路402Hに送ら
れ、これらMDCT回路402L〜402Hでそれぞれ
周波数成分に分解される。Of the signals in these three frequency bands, the low-frequency signal from the band-dividing filter 401 is MD.
An MDCT circuit 402L that performs CT (Modified Discrete Cosine Transform) calculation, and an MDCT circuit 402L that similarly performs MDCT calculation for mid-range signals
The signal of M and the high frequency signal are sent to the MDCT circuit 402H and are decomposed into frequency components by these MDCT circuits 402L to 402H.
【0074】このとき、上記MDCTを施すときの時間
ブロック長は、各周波数帯域毎に可変であり、信号が急
激に変化する部分では、時間ブロック長を短くして、時
間分解能を高め、信号が定常的な部分では時間ブロック
長を長くして、信号成分の有効伝送と量子化雑音を制御
する。At this time, the time block length when applying the MDCT is variable for each frequency band, and in the portion where the signal changes abruptly, the time block length is shortened to improve the time resolution and the signal is In the stationary part, the time block length is increased to control the effective transmission of signal components and the quantization noise.
【0075】この時間ブロック長は、ブロックサイズ評
価器403にて決定されている。すなわち、上記帯域分
割フィルタ401からの3つの周波数帯域の信号は、ブ
ロックサイズ評価器403にも送られ、当該ブロックサ
イズ評価器403が上記MDCTの時間ブロック長を決
定し、この決定した時間ブロック長を示す情報を上記M
DCT回路402L〜402Hに送るようにしている。The time block length is determined by the block size evaluator 403. That is, the signals of the three frequency bands from the band division filter 401 are also sent to the block size evaluator 403, the block size evaluator 403 determines the time block length of the MDCT, and the determined time block length is determined. The information indicating
The data is sent to the DCT circuits 402L to 402H.
【0076】なお、上記MDCTでの2種類の時間ブロ
ック長のうち、長い時間ブロック長を使用するモードは
ロングモードと呼ばれ、11.6msの時間のブロック
長を有する。また、短い時間ブロック長を使用するモー
ドはショートモードと呼ばれ、高域(11kHz以上)
で1.45msの時間のブロック長を有し、、低域
(5.5kHz以下)及び中域(5.5kHzから11
kHz)では2.9msの時間のブロック長を有するこ
とで、時間分解能を上げるようにしている。A mode using a long time block length of the two types of time block lengths in the MDCT is called a long mode and has a block length of 11.6 ms. In addition, the mode that uses a short time block length is called the short mode, and it is in the high range (11 kHz or more).
With a block length of 1.45 ms at low frequencies (less than 5.5 kHz) and mid-range (5.5 kHz to 11 kHz).
At (kHz), the time resolution is improved by having a block length of 2.9 ms.
【0077】このようにして、時間と周波数の2次元領
域(これをブロックフローティングユニット:Block Fl
oating Unit と呼ぶ)上の信号成分に分解されたオーデ
ィオ信号は、正規化回路404L〜404Hによって低
域,中域,高域で合計52個のブロックフローティング
ユニットに分けられると共に、ユニット毎に正規化され
る(スケールファクタの決定がなされる)。In this way, a two-dimensional area of time and frequency (this is a block floating unit: Block Fl
The audio signal decomposed into the above signal components is divided into a total of 52 block floating units in the low band, the middle band, and the high band by the normalization circuits 404L to 404H, and is normalized for each unit. (The scale factor is determined).
【0078】また、上記ビット配分器405では、人間
の聴覚の特性を利用して、そのオーディオ信号がどのよ
うな成分から構成されているかを分析する。この分析結
果が上記正規化回路404L〜404Hからの各ユニッ
ト毎の信号が供給される再量子化器406に送られる。Further, the bit allocator 405 analyzes what kind of component the audio signal is composed of by utilizing the characteristics of human hearing. The result of this analysis is sent to the requantizer 406 to which the signals for each unit from the normalization circuits 404L to 404H are supplied.
【0079】当該再量子化器406は、上記分析結果に
基づいて、各ユニットをどの程度の精度で符号化するか
を求めて、即ちワードレングスの決定を行い、パラメー
タを得ると共に、再量子化を行う。The requantizer 406 determines, based on the analysis result, with what accuracy each unit is to be encoded, that is, determines the word length, obtains the parameter, and requantizes I do.
【0080】最後に、フォーマッタ407では、各ユニ
ット毎の各パラメータ情報と再量子化されたスペクトラ
ム信号とを、所定のフォーマットに従って多重化し、ビ
ットストリームとする。このフォーマッタ407の出力
が出力端子25から出力される。Finally, the formatter 407 multiplexes each parameter information for each unit and the requantized spectrum signal according to a predetermined format to form a bit stream. The output of the formatter 407 is output from the output terminal 25.
【0081】ここで、上述したような符号化の動作はサ
ウンドフレームという単位毎に行われる。Here, the above-described encoding operation is performed for each unit called a sound frame.
【0082】図4には、当該サウンドフレーム40内の
データの記録の様子を示す。FIG. 4 shows how the data in the sound frame 40 is recorded.
【0083】この図4において、1サウンドフレームは
212ビットからなり、ここに44.1kHzのサンプ
リングレートで512サンプル、1チャンネル相当のオ
ーディオ再生用データが圧縮符号化されている。In FIG. 4, one sound frame consists of 212 bits, in which 512 samples and audio reproduction data corresponding to one channel are compression-encoded at a sampling rate of 44.1 kHz.
【0084】上記212ビットのサウンドフレームデー
タは、ブロックサイズモード41、サブブインフオメー
ション量42、ワードレングスデータ43、スケールフ
ァクタデータ44、スペクトラムデータ45、冗長スケ
ールファクタデータ46、冗長ワードレングスデータ4
7、下部のサブインフオメーション量48、及び、下部
のブロックサイズモード49から構成される。The 212-bit sound frame data includes the block size mode 41, the sub-information amount 42, the word length data 43, the scale factor data 44, the spectrum data 45, the redundant scale factor data 46, and the redundant word length data 4.
7, a lower sub-information amount 48, and a lower block size mode 49.
【0085】ここで、212ビットのデータの中には、
エラー訂正用の2度書き部分が含まれている。即ち、冗
長スケールファクタデータ46、冗長ワードレングスデ
ータ47、下部サブインフォメーション量48、下部ブ
ロックサイズモード49である。Here, in the 212-bit data,
It contains a double-writing part for error correction. That is, the redundant scale factor data 46, the redundant word length data 47, the lower sub information amount 48, and the lower block size mode 49.
【0086】この例では、212ビットのうち、186
ビットが2度書きを除いた部分に相当し、実質的なビッ
トレートに換算すると128kbpsになる。In this example, 186 out of 212 bits
The bit corresponds to the part excluding double writing, which is 128 kbps when converted to a substantial bit rate.
【0087】上記ブロックサイズモードは、図3のブロ
ックサイズ評価器403の評価結果を記録するためのデ
ータで、その内容は表1に示すようなものとなってい
る。The block size mode is data for recording the evaluation result of the block size evaluator 403 of FIG. 3, and the contents thereof are as shown in Table 1.
【0088】[0088]
【表1】 [Table 1]
【0089】この表1を見ればわかるように、ロングモ
ードのとき、低域及び中域ではMDCT演算によりそれ
ぞれ128個の周波数成分に、高域では256個の周波
数成分に分解される。As can be seen from Table 1, in the long mode, the frequency component is decomposed into 128 frequency components by the MDCT operation in the low frequency region and the medium frequency region, and is decomposed into 256 frequency components in the high frequency region.
【0090】また、ショートモードのとき、低域、中域
及び高域はそれぞれ32個の周波数成分に分解される。In the short mode, each of the low frequency band, the middle frequency band and the high frequency band is decomposed into 32 frequency components.
【0091】また、サブインフォメーション量42に
は、アマウント1、アマウント2、アマウント3の3つ
の情報が記録される。アマウント1は、記録されている
ワードレングス及びスケールファクタの個数を表し、ア
マウント2は2度書きされているワードレングスの個数
を表し、アマウント3は2度書きされているスケールフ
ァクタの個数を表している。この内容については、表2
に示す。In the sub information amount 42, three pieces of information of amount 1, amount 2, and amount 3 are recorded. Amount 1 represents the number of recorded word lengths and scale factors, amount 2 represents the number of word lengths written twice, and amount 3 represents the number of scale factors written twice. There is. See Table 2 for details.
Shown in.
【0092】[0092]
【表2】 [Table 2]
【0093】ワードレングスは、各ユニットの再量子化
されたときの語長を表す。この内容については表3に示
す。The word length represents the word length of each unit when requantized. The contents are shown in Table 3.
【0094】[0094]
【表3】 [Table 3]
【0095】スケールファクタは各ユニットの正規化し
た値を表す。その内容については表4に示す。The scale factor represents the normalized value of each unit. The contents are shown in Table 4.
【0096】[0096]
【表4】 [Table 4]
【0097】ところで、上記図3におけるビット配分器
405は、再量子化の際に、1サウンドフレームのビッ
ト量を212ビットになるように人間の聴感特性を考慮
してワードレングスの値を決定していく。この212ビ
ットという値を可変にすることで、可変長の符号化装置
を構成できる。By the way, the bit allocator 405 in FIG. 3 determines the word length value in consideration of human auditory perception characteristics so that the bit amount of one sound frame becomes 212 bits at the time of requantization. To go. By making the value of 212 bits variable, a variable-length coding device can be configured.
【0098】すなわち、本発明実施例の高能率符号化装
置の構成である図1のビット配分決定回路500の出力
を、図3のビット配分器405に接続するような構成に
すれば、可変長の符号化装置が構成できるようになる。That is, if the output of the bit allocation determining circuit 500 of FIG. 1 which is the structure of the high efficiency coding apparatus of the embodiment of the present invention is connected to the bit distributor 405 of FIG. The encoding device can be configured.
【0099】以下、このように図3のビット配分器40
5に接続される図1のビット配分決定回路500の動作
について、図5のグラフ及び図6のフローチャートによ
り説明する。Hereinafter, the bit allocator 40 of FIG.
The operation of the bit allocation determining circuit 500 of FIG. 1 connected to the circuit 5 will be described with reference to the graph of FIG. 5 and the flowchart of FIG.
【0100】まず、ビット配分決定回路500は、図6
のステップS61で処理を開始すると、ステップS62
で各チャンネル毎のピーク値を検出する。一般にピーク
値は、各チャンネルにおけるオーディオ信号のエネルギ
に相当する。First, the bit allocation determining circuit 500 is shown in FIG.
When the process is started in step S61 of step S62,
Detects the peak value for each channel. Generally, the peak value corresponds to the energy of the audio signal in each channel.
【0101】次に、ステップS63では、求めたピーク
値に対応するビット配分量を算出する。この算出には、
ピーク値/ビット配分量の対応グラフをテーブルにした
ものを用いる。Next, in step S63, the bit distribution amount corresponding to the obtained peak value is calculated. For this calculation,
A table in which a correspondence graph of peak value / bit allocation amount is used is used.
【0102】図5のグラフが上記ピーク値に対するビッ
ト配分量を換算するためのグラフである。なお、この図
5に示すビット配分量の換算のグラフは、符号化方式と
していわゆるATRAC方式を採用した場合のものであ
る。The graph of FIG. 5 is a graph for converting the bit allocation amount for the peak value. The graph of the bit distribution conversion shown in FIG. 5 is for the case where the so-called ATRAC method is adopted as the encoding method.
【0103】この図5において、横軸は、入力信号のピ
ーク値であり、その取りうる最大値を1に正規化してい
る。In FIG. 5, the horizontal axis is the peak value of the input signal, and the maximum value that can be taken is normalized to 1.
【0104】また、縦軸は、ビット配分量であり、最大
配分量を186バイトとしている。この値はいわゆるM
D(ミニディスク)装置におけるATRAC方式の1サ
ウンドフレームの情報量に等しい。The vertical axis represents the bit distribution amount, and the maximum distribution amount is 186 bytes. This value is so-called M
It is equal to the information amount of one sound frame of the ATRAC system in the D (mini disk) device.
【0105】ここで、図5に示す換算のグラフは、様々
なオーディオ信号を用いて実験をして決定したものであ
る。Here, the conversion graph shown in FIG. 5 is determined by an experiment using various audio signals.
【0106】この図5において、ビット配分量の全体的
な傾向としては、ピーク値の増加と共にビット配分量も
増加するようになってくるが、ピーク値が2のマイナス
3乗を越えた当たりで、減少に転じる。In FIG. 5, the overall tendency of the bit distribution amount is such that the bit distribution amount increases as the peak value increases, but when the peak value exceeds 2 minus the third power. , Turn to decrease.
【0107】これは、信号レベルが充分に大きい(かな
り大きい)ところでは、再量子化による量子化ノイズが
信号レベルによってマスクされるため、再量子化ノイズ
の注入量を増やしても聞こえにくいという実験結果に基
づいている。This is an experiment in which the quantization noise due to requantization is masked by the signal level when the signal level is sufficiently large (quite large), so that it is difficult to hear even if the injection amount of requantization noise is increased. Based on the results.
【0108】一方、図5において、信号レベルが充分に
小さい(かなり小さい)場合、例えばピーク値が2のマ
イナス12乗以下になるとビット配分量を一定(平坦な
ビット配分)としている。これは、ATRAC方式の各
パラメータ情報(図4に示すワードレングスデータやス
ケールファクタデータなど)に必要なビット量がほぼ一
定であるため、ある程度のビット量を確保しておく必要
があるためである。On the other hand, in FIG. 5, when the signal level is sufficiently small (very small), for example, when the peak value becomes 2 −12 or less, the bit allocation amount is fixed (flat bit allocation). This is because the bit amount required for each parameter information of the ATRAC system (word length data, scale factor data, etc. shown in FIG. 4) is almost constant, and it is necessary to secure a certain bit amount. .
【0109】また、レベルが低くなってくるとランダム
なノイズ(白色雑音)が聞こえるようになり、このよう
な信号は全周波数帯域に周波数成分が一様に分布する傾
向にあるので、レベルが小さい割に多くのビット量を必
要とするためである。Further, as the level becomes lower, random noise (white noise) comes to be heard, and the frequency component of such a signal tends to be uniformly distributed in the entire frequency band, so that the level is small. This is because it requires a relatively large amount of bits.
【0110】以上のように、ビット配分量とピーク値と
の関係は、非線形(略S字カーブ)に特徴付けられる。
即ち、聴覚特性を考慮しなければ、ビット配分量とピー
ク値との関係は、比例関係となる。しかし本発明では、
各チャンネル毎に最低限度のビット配分量を確保しつ
つ、エネルギが所定レベル以上の場合には、逆にビット
配分量を減少させる。As described above, the relationship between the bit allocation amount and the peak value is characterized by a non-linearity (substantially S-shaped curve).
That is, if the auditory characteristics are not taken into consideration, the relationship between the bit allocation amount and the peak value is proportional. However, in the present invention,
While keeping the minimum bit allocation amount for each channel, when the energy is equal to or higher than a predetermined level, the bit allocation amount is decreased.
【0111】次に、ステップS64では全体のビット量
は固定か否かの判断を行い、このステップS64で全チ
ャンネルの総ビット配分量を固定にする必要があると判
断したときには、ステップS65に進み、上記の換算が
終わったあと、後述する式(1)の計算を行い、最終的
な各チャンネルごとのビット配分量を計算する。Next, in step S64, it is determined whether or not the total bit amount is fixed. When it is determined in step S64 that the total bit distribution amount of all channels needs to be fixed, the process proceeds to step S65. After the above conversion, the equation (1) described later is calculated, and the final bit allocation amount for each channel is calculated.
【0112】すなわち、nチャンネルあるシステムの1
サウンドフレーム当たりの総ビット配分量をGとし、上
記換算によるビット配分量をCi(i=1,2,・・
・、n)とすると、最終的な各チャンネルに配分される
ビット配分量Siは、 Si=G*Ci/(C1+C2+・・・+Cn) ・・(1) となる。That is, 1 in a system with n channels
Let G be the total bit allocation amount per sound frame, and Ci (i = 1, 2, ...
, N), the final bit allocation amount Si allocated to each channel is Si = G * Ci / (C1 + C2 + ... + Cn) ... (1).
【0113】上記ステップS65の後、又は上記ステッ
プS64でノーと判断された後は、ステップS66に進
んで処理を終了する。After step S65, or after determining NO in step S64, the process proceeds to step S66 to end the process.
【0114】また、上述したようなATRAC方式に対
応することで、図1のフォーマッタ600と図2のデフ
ォーマッタ700は以下のように動作する。By supporting the ATRAC system as described above, the formatter 600 of FIG. 1 and the deformatter 700 of FIG. 2 operate as follows.
【0115】図1のフォーマッタ600は、1サウンド
フレーム毎に各チャンネルの符号化器4001 〜400
n から図4に示すような形で送られてきたデータをチャ
ンネル順に並べて、ビットストリームとして伝送する。
すなわち、マルチプレクサの働きをする。The formatter 600 shown in FIG. 1 includes the encoders 400 1 to 400 of the respective channels for each sound frame.
The data sent from n in the form shown in FIG. 4 is arranged in the order of channels and transmitted as a bit stream.
That is, it functions as a multiplexer.
【0116】また、図2のデフォーマッタ700は、上
記フォーマッタ600でマルチプレクスされたデータを
各チャンネル毎に分解して各復号化器4001 〜400
n に渡すデマルチプレクサの働きをする。Further, the deformatter 700 of FIG. 2 decomposes the data multiplexed by the formatter 600 for each channel and decodes each of the decoders 400 1 to 400.
Acts as a demultiplexer to pass to n .
【0117】上述したように、本発明の第1の実施例装
置によれば、複数のチャンネルを持つオーディオデータ
の圧縮において、各チャンネルの振幅情報の時間的な変
化により、各チャンネルへのビット配分量を決定して符
号化するようにしているため、各チャンネルにその情報
量に見合ったビット配分が可能となり、更なる高能率符
号化が可能となる。As described above, according to the apparatus of the first embodiment of the present invention, in the compression of audio data having a plurality of channels, the bit allocation to each channel is made by the temporal change of the amplitude information of each channel. Since the amount is determined and encoded, it is possible to allocate bits to each channel according to the amount of information, and it is possible to perform higher efficiency encoding.
【0118】すなわち、更なる高音質化もしくは、全チ
ャンネルトータルにおける低ビットレート化が可能とな
る。なお、記録するメデイアによっては固定長が望まし
い場合があるので、第1の実施例装置では、全チャンネ
ルの総ビット配分量を概ね一定とする様に符号化するこ
とも可能である。That is, it is possible to further improve the sound quality or reduce the bit rate in all channels. Since a fixed length may be desirable depending on the medium to be recorded, the first embodiment can perform encoding so that the total bit allocation amount of all channels is substantially constant.
【0119】次に、本発明の第2の実施例について説明
する。Next, a second embodiment of the present invention will be described.
【0120】図7には第2の実施例の高能率符号化装置
(エンコーダ)の構成を示している。FIG. 7 shows the configuration of the high efficiency coding apparatus (encoder) of the second embodiment.
【0121】図7において、複数チャンネル(ch1,
ch2,・・・,chn)のオーディオ信号は、これら
各チャンネルに対応する各入力端子301 〜30n 及び
伝送線路1011 〜101n を経て、同じく各チャンネ
ルに対応する標本化及び量子化器1201 〜120n に
送られる。これら標本化及び量子化器1201 〜120
n では各チャンネルのオーディオ信号が量子化信号に変
換され、これら各標本化及び量子化器1201 〜120
n からの量子化された信号は、各伝送線路1021 〜1
02n を経て、各符号化器2101 〜210n に送られ
る。In FIG. 7, a plurality of channels (ch1,
ch2, · · ·, audio signals chn) passes through each of the input terminals 30 1 to 30 n and the transmission line 101 1 to 101 n corresponding to respective channels, sampling and quantization unit also corresponds to the respective channels 120 1 to 120 n . These sampling and quantizers 120 1 to 120
In n , the audio signal of each channel is converted into a quantized signal, and each of the sampling and quantizers 120 1 to 120 1
The quantized signal from n is transmitted by each transmission line 102 1 -1.
02 n, and is sent to each of the encoders 210 1 to 210 n .
【0122】各符号化器2101 〜210n では、各チ
ャンネルのオーディオ信号を時間と周波数の二次元領域
(ブロックフローティングユニット)に分割し、そのブ
ロックフローティングユニットに属する信号成分をブロ
ックフローティングユニット毎にスケールファクタを用
いて正規化する。ここで求められた各ブロックフローテ
ィングユニットのスケールファクタは、伝送線路103
1 〜103n を通してビット配分決定回路310へ送ら
れる。In each of the encoders 210 1 to 210 n , the audio signal of each channel is divided into a two-dimensional area of time and frequency (block floating unit), and the signal component belonging to the block floating unit is divided into block floating units. Normalize using the scale factor. The scale factor of each block floating unit obtained here is the transmission line 103
It is sent to the bit allocation decision circuit 310 through 1 to 103 n .
【0123】当該ビット配分決定回路310では、伝送
線路1031 〜103n を介して受け取ったスケールフ
ァクタの各チャンネル毎の総和を求め、当該総和から各
チャンネルのビット配分量を後述する換算式(換算のグ
ラフ)により換算し、そのビット配分量を伝送線路10
41 〜104n から各符号化器2101 〜210n へ渡
す。In the bit allocation determining circuit 310, the sum of scale factors received via the transmission lines 103 1 to 103 n is calculated for each channel, and the bit allocation amount of each channel is calculated from the sum by the conversion formula (conversion described below). Graph), and the bit allocation amount is converted to the transmission line 10
4 passed from 1 -104 n to each encoding unit 210 1 to 210 n.
【0124】したがって、各符号化器2101 〜210
n では、上記ビット配分量に応じて、上記伝送線路10
21 〜102n からの信号を再量子化し、当該再量子化
すなわち圧縮した信号を伝送線路1051 〜105n を
介してフォーマッタ410へ渡す。Therefore, each of the encoders 210 1 to 210
At n , depending on the bit allocation amount, the transmission line 10
The signals from 2 1 to 102 n are requantized, and the requantized or compressed signals are passed to the formatter 410 via the transmission lines 105 1 to 105 n .
【0125】フォーマッタ410は、複数のチャンネル
の上記伝送線路1051 〜105nを経て受け取った被
圧縮信号を、所定のフォーマットに従って伝送又は記録
媒体への記録のためにビットストリームへ組み立てる。
このビットストリームは、伝送線路106を介して出力
端子31から出力される。The formatter 410 assembles the compressed signals received via the transmission lines 105 1 to 105 n of a plurality of channels into a bit stream for transmission or recording on a recording medium according to a predetermined format.
This bit stream is output from the output terminal 31 via the transmission line 106.
【0126】更にこのビットストリームは、例えばレー
ザー記録装置26により、映画フィルム27上の所定の
記録エリア28に書き込まれる。Further, this bit stream is written in a predetermined recording area 28 on the motion picture film 27 by the laser recording device 26, for example.
【0127】なお、この第2の実施例におけるデコーダ
側の高能率復号化装置の基本構成については、前記図2
と同様であるため、詳細な説明は省略する。The basic structure of the high-efficiency decoding apparatus on the decoder side in the second embodiment is shown in FIG.
Since it is the same as, the detailed description will be omitted.
【0128】簡単に前記図2を用いて説明すると、当該
第2の実施例の高能率復号化装置のデフォーマッタ70
0でも、上記第2の実施例の高能率符号化装置からのビ
ットストリームを、所定のフォーマットに従って各チャ
ンネル毎の被圧縮信号に分解する。Briefly described with reference to FIG. 2, the deformatter 70 of the high-efficiency decoding apparatus of the second embodiment.
Even with 0, the bit stream from the high-efficiency encoder of the second embodiment is decomposed into compressed signals for each channel according to a predetermined format.
【0129】当該各チャンネル毎に分解された被圧縮信
号は、各チャンネル毎に対応して設けられた復号器80
01 〜800n にて伸長され、さらにD/A(ディジタ
ル/アナログ)変換器9001 〜900n でアナログ信
号に変換される。この各アナログ信号が、各チャンネル
ch1〜chnの復号化された信号として出力される。The compressed signal decomposed for each channel is the decoder 80 provided corresponding to each channel.
The signal is expanded at 0 1 to 800 n , and further converted to an analog signal at D / A (digital / analog) converters 900 1 to 900 n . Each analog signal is output as a decoded signal of each channel ch1 to chn.
【0130】また、この第2の実施例の高能率符号化装
置において利用する圧縮符号化手法は、スケールファク
タを用いて圧縮符号化する方式であれば、全てに応用が
可能である。The compression coding method used in the high efficiency coding apparatus of the second embodiment can be applied to all compression coding methods using a scale factor.
【0131】すなわち、この第2の実施例においても、
前記図3を用いて説明すれば、図7のビット配分決定回
路310の出力を、図3のビット配分器405に接続す
るような構成にすれば、可変長の符号化装置が構成でき
るようになる。That is, also in this second embodiment,
Referring to FIG. 3, a variable length coding apparatus can be configured by connecting the output of the bit allocation determination circuit 310 of FIG. 7 to the bit allocation unit 405 of FIG. Become.
【0132】以下、このように図3のビット配分器40
5に接続される図7のビット配分決定回路310の詳細
な動作について、図8のグラフ及び図9のフローチャー
トにより説明する。Hereinafter, the bit allocator 40 of FIG.
The detailed operation of the bit allocation determination circuit 310 of FIG. 7 connected to No. 5 will be described with reference to the graph of FIG. 8 and the flowchart of FIG.
【0133】先ず、ビット配分決定回路310は、図9
のステップS91で処理を開始すると、ステップS92
において符号化器2101 〜210n からのスケールフ
ァクタから、各チャンネル毎のスケールファクタの総和
を算出する。First, the bit allocation determination circuit 310 is shown in FIG.
When the processing is started in step S91 of step S92,
In, the sum of the scale factors for each channel is calculated from the scale factors from the encoders 210 1 to 210 n .
【0134】次のステップS93では、求めた各チャン
ネルのスケールファクタの総和より、各チャンネル毎の
ビット配分量を算出する。In the next step S93, the bit distribution amount for each channel is calculated from the obtained sum of the scale factors of each channel.
【0135】ここで、スケールファクタは、前述したよ
うに52個あるブロックフローティングユニットに含ま
れる周波数成分を正規化した値である。通常は、そのブ
ロックフローティングユニット内の周波数成分の絶対値
を求め、その絶対値の最大値以上の値であって、かつそ
の中で最小の値のものを、前記表4に示す値の中から選
ぶことになる。Here, the scale factor is a value obtained by normalizing the frequency components included in the 52 block floating units as described above. Usually, the absolute value of the frequency component in the block floating unit is calculated, and the value that is greater than or equal to the maximum value of the absolute values and that is the minimum value is selected from the values shown in Table 4 above. I will choose.
【0136】すなわち、スケールファクタは、ブロック
フローティングユニット内のデータの代表値的な性格、
即ちエネルギを示すと考えられる。従って、スケールフ
ァクタの和を求めれば、全体の情報量を推定することが
できると考えられる。That is, the scale factor is the typical character of the data in the block floating unit,
That is, it is considered to indicate energy. Therefore, it is considered that the total amount of information can be estimated by obtaining the sum of scale factors.
【0137】図8には、図7のビット配分決定回路31
0でのスケールファクタの和に対するビット配分量を示
す。FIG. 8 shows the bit allocation determining circuit 31 of FIG.
The bit allocation amount for the sum of scale factors at 0 is shown.
【0138】この図8も、第1の実施例同様に符号化方
式として、ATRAC方式を使ったときのものである。
なお、この図8の縦軸は前記図5同様のビット配分量
(最大配分量は186バイト)であるが、横軸はスケー
ルファクタの和である。This FIG. 8 also shows the case where the ATRAC system is used as the encoding system as in the first embodiment.
The vertical axis of FIG. 8 is the bit allocation amount (the maximum allocation amount is 186 bytes) as in FIG. 5, but the horizontal axis is the sum of the scale factors.
【0139】この図8に示す換算のグラフも、第1の実
施例の図5同様に、様々なオーディオ信号を用いて実験
をしながら決定したものである。The conversion graph shown in FIG. 8 is also determined through experiments using various audio signals, as in FIG. 5 of the first embodiment.
【0140】全体的な傾向としては、スケールファクタ
の和の値の増加とともに、ビット配分量も増加する。As an overall tendency, the bit allocation amount increases as the value of the sum of scale factors increases.
【0141】しかし、図8において上記スケールファク
タの和の値が約7000を越えた当たりで、ビット配分
量は減少に転じる。これは、上記スケールファクタの和
の値がかなり大きい(信号レベルが充分に大きい)とこ
ろでは、信号レベルも比較的大きく、再量子化による量
子化ノイズが信号レベルによってマスクされるため、再
量子化ノイズの注入量を増やしても聞こえにくいという
実験結果に基づいている。However, in FIG. 8, when the sum of the scale factors exceeds about 7,000, the bit allocation amount starts to decrease. This is because when the sum of the above scale factors is quite large (the signal level is sufficiently large), the signal level is also relatively large, and the quantization noise due to requantization is masked by the signal level, so requantization is performed. It is based on the experimental results that it is difficult to hear even if the injection amount of noise is increased.
【0142】一方、図8において、上記スケールファク
タの和の値が1.5以下(信号レベルが充分に小さい場
合)になるとビット配分量が一定となるのは、ATRA
C方式の各パラメータ情報(前記図4に示すワードレン
グスデータやスケールファクタデータなど)のために必
要なビット量がほぼ一定であるため、このビット量を確
保しておく必要があるためである。On the other hand, in FIG. 8, when the sum value of the scale factors becomes 1.5 or less (when the signal level is sufficiently low), the bit allocation amount becomes constant because ATRA
This is because the bit amount required for each parameter information of the C method (word length data, scale factor data, etc. shown in FIG. 4) is almost constant, and it is necessary to secure this bit amount.
【0143】この例においても、ビット配分量とスケー
ルファクタの総和との関係は、略S字カーブの非線形特
性を成す。Also in this example, the relationship between the bit allocation amount and the sum of the scale factors has a non-linear characteristic of a substantially S-shaped curve.
【0144】なお、この第2の実施例においても、ステ
ップS94において全体のビット量は固定か否かの判断
を行い、このステップS94で全チャンネルの総ビット
配分量を固定にする必要があると判断したときには、ス
テップS95に進み、上記の換算が終わったあと、前記
式(1)の計算を行い、最終的な各チャンネル毎のビッ
ト配分量を計算する。Also in the second embodiment, it is necessary to determine whether or not the total bit amount is fixed in step S94, and to fix the total bit distribution amount of all channels in step S94. When the determination is made, the process proceeds to step S95, and after the above conversion is completed, the formula (1) is calculated, and the final bit allocation amount for each channel is calculated.
【0145】上記ステップS95の後、又は上記ステッ
プS94でノーと判断された後は、ステップS96に進
む。After the above step S95 or after the judgment in step S94 is NO, the process proceeds to step S96.
【0146】また、当該第2の実施例においても、図7
のフォーマッタ410は、1サウンドフレーム毎に各チ
ャンネルの符号化器2101 〜210n から図4に示す
ような形で送られてきたデータをチャンネル順に並べ
て、ビットストリームとして伝送する。すなわち、マル
チプレクサの働きをする。Also in the second embodiment, as shown in FIG.
The formatter 410 arranges the data sent from the encoders 210 1 to 210 n of the respective channels in the form as shown in FIG. 4 for each sound frame, and transmits the data as a bit stream. That is, it functions as a multiplexer.
【0147】さらに、第2の実施例の高能率復号化装置
におけるデフォーマッタも、上記フォーマッタ410で
マルチプレクスされたデータを各チャンネル毎に分解し
て、各復号化器に渡すデマルチプレクサの働きをする。Further, the deformatter in the high-efficiency decoding apparatus of the second embodiment also functions as a demultiplexer which decomposes the data multiplexed by the formatter 410 for each channel and passes it to each decoder. To do.
【0148】上述したように、第2の実施例装置によれ
ば、複数のチャンネルを持つオーディオデータの圧縮に
おいて、各チャンネルのスケールファクタの総和の時間
的な変化により、各チャンネルのビット配分量を決定し
て符号化するようにしている。このため、各チャンネル
にその情報量に見合ったビット配分が可能となり、更な
る高能率符号化が可能となる。As described above, according to the apparatus of the second embodiment, in the compression of audio data having a plurality of channels, the bit allocation amount of each channel is determined by the temporal change of the sum of the scale factors of each channel. It is decided and encoded. Therefore, it is possible to allocate bits to each channel according to the amount of information, and it is possible to perform higher efficiency coding.
【0149】それによって更なる高音質化もしくは、低
ビットレート化を図ることができる。すなわち、当該第
2の実施例装置においても、全チャンネルトータルにお
ける低ビットレート化又は高音質化が可能となる。As a result, higher sound quality or lower bit rate can be achieved. That is, also in the apparatus of the second embodiment, it is possible to reduce the bit rate or improve the sound quality of all channels in total.
【0150】また、この第2の実施例の場合において
も、記録するメデイアによっては固定長が望ましい場合
がある。その場合、全チャンネルの総ビット配分量を概
ね一定とする様に符号化することも可能である。Also in the case of the second embodiment, a fixed length may be desirable depending on the medium to be recorded. In that case, it is possible to perform encoding so that the total bit allocation amount of all channels is substantially constant.
【0151】以上、本発明の第1の実施例、及び第2の
実施例において、記録媒体として映画フィルムを例示し
た。しかし、本発明の要旨を変更しない範囲において、
記録媒体は映画フィルムに止まらず、様々なものが使用
可能である。例えば、光ディスク、磁気テープ等であ
る。As described above, in the first and second embodiments of the present invention, the motion picture film is exemplified as the recording medium. However, within the scope of not changing the gist of the present invention,
The recording medium is not limited to a movie film, and various recording media can be used. For example, it is an optical disk, a magnetic tape, or the like.
【0152】[0152]
【発明の効果】本発明においては、各チャンネルへのビ
ット配分量をそれぞれのチャンネルのエネルギ、例えば
振幅情報又はスケールファクタの総和の時間的な変化に
より決定しているため、各チャンネルにその情報量に見
合ったビット配分が可能となり、更なる高能率符号化が
可能となる。それによって更なる高音質化もしくは、低
ビットレート化が可能となる。According to the present invention, the amount of bit allocation to each channel is determined by the energy of each channel, for example, the amplitude information or the sum of the scale factors, which changes with time. It becomes possible to perform bit allocation commensurate with the above, and it becomes possible to perform higher efficiency coding. Thereby, higher sound quality or lower bit rate can be achieved.
【0153】また、本発明でのマルチチャンネルのオー
ディオ信号とは、少なくとも2チャンネルをいい、望ま
しくは映画のサウンドトラツクのように、5チャンネル
以上において、本発明の効果が顕著になる。Further, the multi-channel audio signal in the present invention means at least two channels, and the effect of the present invention becomes remarkable in five or more channels like a sound track of a movie.
【図1】本発明の第1の実施例の高能率符号化装置の概
略構成を示すブロック回路図である。FIG. 1 is a block circuit diagram showing a schematic configuration of a high efficiency coding apparatus according to a first embodiment of the present invention.
【図2】本発明の第1及び第2の実施例の高能率復号化
装置の概略構成を示すブロック回路図である。FIG. 2 is a block circuit diagram showing a schematic configuration of a high-efficiency decoding device according to first and second embodiments of the present invention.
【図3】ATRAC方式の高能率符号化装置及び本発明
実施例の高能率符号化装置におけるビット配分について
説明するためのブロック回路図である。FIG. 3 is a block circuit diagram for explaining bit allocation in the ATRAC high-efficiency encoder and the high-efficiency encoder of the embodiment of the present invention.
【図4】サウンドフレーム内のデータの記録の様子を説
明するための図である。FIG. 4 is a diagram for explaining how data is recorded in a sound frame.
【図5】第1の実施例におけるビット配分量を説明する
ための図である。FIG. 5 is a diagram for explaining a bit allocation amount in the first embodiment.
【図6】第1の実施例におけるビット配分決定の動作を
説明するためのフローチヤートである。FIG. 6 is a flow chart for explaining the bit allocation determination operation in the first embodiment.
【図7】本発明の第2の実施例の高能率符号化装置の概
略構成を示すブロック回路図である。FIG. 7 is a block circuit diagram showing a schematic configuration of a high-efficiency coding apparatus according to a second embodiment of the present invention.
【図8】第2の実施例におけるビット配分量を説明する
ための図である。FIG. 8 is a diagram for explaining a bit allocation amount in the second embodiment.
【図9】第2の実施例におけるビット配分決定の動作を
説明するためのフローチヤートである。FIG. 9 is a flow chart for explaining the operation of bit allocation determination in the second embodiment.
26 レーザ記録装置 27 映画フィルム 28 記録エリア 29 パーフォレーション 100 標本化及び量子化器 200 振幅情報検出回路 300 ディレイライン 310,500 ビット配分決定回路 400 符号化器 401 帯域分割フィルタ 402L,402M,402H MDCT回路 403 ブロックサイズ評価器 404L,404M,404H 正規化回路 405 ビット配分器 406 再量子化器 600,407,410 フォーマッタ 700 デフォーマッタ 800 復号器 900 D/A変換器 26 laser recording device 27 motion picture film 28 recording area 29 perforation 100 sampling and quantizer 200 amplitude information detection circuit 300 delay line 310,500 bit allocation determination circuit 400 encoder 401 band division filter 402L, 402M, 402H MDCT circuit 403 Block size evaluator 404L, 404M, 404H Normalization circuit 405 Bit distributor 406 Requantizer 600, 407, 410 Formatter 700 Deformatter 800 Decoder 900 D / A converter
Claims (16)
オ信号を、夫々オーディオ信号の性質と人間の聴感を利
用して圧縮符号化する符号化装置であって、 各チャンネルの上記ディジタルオーディオ信号毎に、上
記ディジタルオーディオ信号のエネルギを検出するエネ
ルギ検出手段と、 上記検出結果に基づいて、各チャンネルへのビット配分
量を決定するビット配分量決定手段と、 上記ビット配分量の決定に応じて上記各チャンネル毎に
配分されたビット配分量に基づいて、圧縮符号化を行う
圧縮符号化手段と、 上記各チャンネル毎の圧縮符号化された信号を多重化す
る多重化手段とよりなり、 上記ビット配分量決定手段は、信号のエネルギとビット
配分量との関係が、全体として、信号のエネルギの増加
に伴ってビット配分量が増加する非線形特性であること
を特徴とする符号化装置。1. An encoding device for compressing and encoding digital audio signals of a plurality of channels by utilizing the characteristics of the audio signals and human hearing, respectively. Energy detecting means for detecting energy of an audio signal, bit allocation amount determining means for determining a bit allocation amount to each channel based on the detection result, and for each channel according to the determination of the bit allocation amount. The bit allocation amount determining means is composed of compression encoding means for performing compression encoding based on the distributed bit allocation amount, and multiplexing means for multiplexing the compression encoded signals for each channel. The relationship between the signal energy and the bit allocation amount is that the bit allocation amount increases as the signal energy increases as a whole. Encoding device which is a linear characteristic.
で近似されるものであることを特徴とする請求項1記載
の符号化装置。2. The encoding device according to claim 1, wherein the non-linear characteristic is approximated by a characteristic of a substantially S-shaped curve.
に小さいときに平坦なビット配分特性を有するものであ
ることを特徴とする請求項1記載の符号化装置。3. The coding apparatus according to claim 1, wherein the non-linear characteristic has a flat bit allocation characteristic when the signal energy is sufficiently small.
に大きいときにビット配分が減少する特性を有するもの
であることを特徴とする請求項1記載の符号化装置。4. The encoding apparatus according to claim 1, wherein the non-linear characteristic has a characteristic that bit allocation decreases when the signal energy is sufficiently large.
ネル毎の必要とするビット量の概算量を夫々求め、単位
時間当たりの全チャンネルの合計ビット量を各概算量に
比例して配分し、各チャンネルのビット配分量を決定す
ることを特徴とする請求項1記載の符号化装置。5. The bit allocation amount determining means respectively obtains an approximate amount of a required bit amount for each channel, and distributes a total bit amount of all channels per unit time in proportion to each approximate amount. The encoding device according to claim 1, wherein the bit allocation amount of each channel is determined.
を特徴とする請求項1記載の符号化装置。6. The encoding apparatus according to claim 1, wherein the signal energy has an amplitude characteristic.
徴とする請求項4記載の符号化装置。7. The encoding device according to claim 4, wherein the amplitude characteristic is a peak value.
あることを特徴とする請求項1記載の符号化装置。8. The encoding device according to claim 1, wherein the signal energy is a scale factor.
ディオ信号毎に上記ディジタルオーディオ信号のエネル
ギを検出する手段と、上記検出結果に基づいて各チャン
ネルへのビット配分量を決定する手段と、上記ビット配
分量の決定に応じて上記各チャンネル毎に配分されたビ
ット配分量に基づいて圧縮符号化する手段と、上記各チ
ャンネル毎の圧縮符号化された信号を多重化する手段と
からなり、上記ビット配分量を決定する手段は、信号の
エネルギとビット配分量との関係が、全体として、信号
のエネルギの増加に伴ってビット配分量が増加する非線
形特性である符号化装置によって、上記複数のチャンネ
ルのディジタルオーディオ信号を夫々オーディオ信号の
性質と人間の聴感を利用して圧縮符号化して多重化され
た圧縮符号化信号を、記録してなることを特徴とする記
録媒体。9. A means for detecting the energy of the digital audio signal for each of the digital audio signals of a plurality of channels, a means for determining a bit allocation amount to each channel based on the detection result, and the bit allocation amount. The means for compressing and coding on the basis of the bit distribution amount distributed to each of the channels in accordance with the above decision, and the means for multiplexing the compression coded signal for each of the channels. The deciding means determines the digital energy of the plurality of channels by an encoding device in which the relationship between the signal energy and the bit allocation amount is a non-linear characteristic in which the bit allocation amount increases as the signal energy increases. Each of the audio signals is compression-encoded by using the characteristics of the audio signal and the human sense of hearing, and the multiplexed compression-encoded signal is generated. , A recording medium characterized by being recorded.
ィオ信号を、夫々オーディオ信号の性質と人間の聴感を
利用して圧縮符号化する符号化方法であって、 各チャンネルの上記ディジタルオーディオ信号毎に、信
号のエネルギを検出するエネルギ検出ステップと、 上記検出結果に基づいて各チャンネルへのビット配分量
を決定するビット配分量決定ステップと、 上記ビット配分量の決定に応じて上記各チャンネル毎に
配分されたビット配分量に基づいて、圧縮符号化を行う
圧縮符号化ステップと、 上記各チャンネルの圧縮符号化された信号を多重化する
多重化ステップとよりなり、 上記ビット配分量決定ステップは、信号のエネルギとビ
ット配分量との関係が、全体として、信号のエネルギの
増加に伴ってビット配分量が増加する、非線形特性であ
ることを特徴とする符号化方法。10. A coding method for compressing and coding digital audio signals of a plurality of channels by using the characteristics of the audio signals and human hearing, respectively. An energy detecting step of detecting energy, a bit allocation amount determining step of determining a bit allocation amount to each channel based on the detection result, and a bit allocated to each channel according to the determination of the bit allocation amount. The bit allocation amount determining step includes a compression encoding step for performing compression encoding based on an allocation amount, and a multiplexing step for multiplexing the compression encoded signals of the respective channels. The relationship with the bit allocation is that the bit allocation increases as the signal energy increases as a whole. Encoding method, which is a characteristic.
性で近似されるものであることを特徴とする請求項10
記載の符号化方法。11. The non-linear characteristic is approximated by a characteristic of a substantially S-shaped curve.
The described encoding method.
分に小さいときに平坦なビット配分特性を有するもので
あることを特徴とする請求項10記載の符号化方法。12. The encoding method according to claim 10, wherein the non-linear characteristic has a flat bit allocation characteristic when the signal energy is sufficiently small.
分に大きいときにビット配分が減少する特性を有するも
のであることを特徴とする請求項10記載の符号化方
法。13. The encoding method according to claim 10, wherein the non-linear characteristic has a characteristic that bit allocation decreases when the signal energy is sufficiently large.
ーディオ信号毎に上記ディジタルオーディオ信号のエネ
ルギを検出する手段と、上記検出結果に基づいて各チャ
ンネルへのビット配分量を決定する手段と、上記ビット
配分量の決定に応じて上記各チャンネル毎に配分された
ビット配分量に基づいて圧縮符号化する手段と、上記各
チャンネル毎の圧縮符号化された信号を多重化する手段
とからなり、上記ビット配分量を決定する手段は、信号
のエネルギとビット配分量との関係が、全体として、信
号のエネルギの増加に伴ってビット配分量が増加する非
線形特性である符号化装置により、上記複数のチャンネ
ルのディジタルオーディオ信号を夫々オーディオ信号の
性質と人間の聴感を利用して圧縮符号化して多重化され
た圧縮符号化信号から、各チャンネルの信号を復号化す
る復号化手段を有することを特徴とする復号化装置。14. A means for detecting the energy of the digital audio signal for each of the digital audio signals of a plurality of channels, a means for determining a bit allocation amount to each channel based on the detection result, and the bit allocation amount. The means for compressing and coding on the basis of the bit distribution amount distributed to each of the channels in accordance with the above decision, and the means for multiplexing the compression coded signal for each of the channels. The deciding means determines the digital signals of the plurality of channels by an encoding device in which the relationship between the signal energy and the bit allocation amount is a nonlinear characteristic in which the bit allocation amount increases as the signal energy increases as a whole. Whether the audio signals are compressed and coded by using the characteristics of the audio signals and the human hearing, respectively And a decoding device for decoding the signal of each channel.
か1項に記載の符号化装置、又は、請求項10から請求
項13のうちいずれか1項に記載の符号化方法により、
多重化された圧縮符号化信号が記録された記録媒体か
ら、各チャンネルの信号を復号化する復号化手段を有す
ることを特徴とする復号化装置。15. The encoding device according to any one of claims 1 to 5 or the encoding method according to any one of claims 10 to 13,
A decoding device comprising a decoding means for decoding a signal of each channel from a recording medium in which a multiplexed compressed coded signal is recorded.
ーディオ信号毎に上記ディジタルオーディオ信号のエネ
ルギを検出するステップと、上記検出結果に基づいて各
チャンネルへのビット配分量を決定するステップと、上
記ビット配分量の決定に応じて上記各チャンネル毎に配
分されたビット配分量に基づいて圧縮符号化するステッ
プと、上記各チャンネル毎の圧縮符号化された信号を多
重化するステップと、上記ビット配分量を決定するステ
ップは、信号のエネルギとビット配分量との関係が、全
体として、信号のエネルギの増加に伴ってビット配分量
が増加する非線形特性である符号化方法により、上記複
数のチャンネルのディジタルオーディオ信号を夫々オー
ディオ信号の性質と人間の聴感を利用して圧縮符号化し
て多重化された圧縮符号化信号が記録された記録媒体か
ら、各チャンネルの信号を復号化する復号化ステップを
有することを特徴とする復号化方法。16. A step of detecting energy of the digital audio signal for each of the digital audio signals of a plurality of channels, a step of determining a bit allocation amount for each channel based on the detection result, and the bit allocation amount. Determining the bit allocation amount, the step of compression-encoding based on the bit allocation amount allocated to each channel, the step of multiplexing the compression-encoded signal of each channel, and the bit allocation amount determined. The step of performing the coding is such that the relationship between the signal energy and the bit allocation amount is a non-linear characteristic in which the bit allocation amount increases as the signal energy increases as a whole. Each of them is compressed and encoded by using the characteristics of the audio signal and the human sense of hearing, and multiplexed compression is performed. A decoding method comprising a decoding step of decoding a signal of each channel from a recording medium on which an encoded signal is recorded.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20670294A JP3528260B2 (en) | 1993-10-26 | 1994-08-31 | Encoding device and method, and decoding device and method |
AU77458/94A AU689134B2 (en) | 1993-10-26 | 1994-10-25 | Low bit rate encoder, low bit rate encoding method, low bit rates decoder, low bit rate decoding method for digital audio signals, and recording media on which signals coded by such encoder or encoding method are recorded |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5-267250 | 1993-10-26 | ||
JP26725093 | 1993-10-26 | ||
JP20670294A JP3528260B2 (en) | 1993-10-26 | 1994-08-31 | Encoding device and method, and decoding device and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07175499A true JPH07175499A (en) | 1995-07-14 |
JP3528260B2 JP3528260B2 (en) | 2004-05-17 |
Family
ID=26515806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20670294A Expired - Fee Related JP3528260B2 (en) | 1993-10-26 | 1994-08-31 | Encoding device and method, and decoding device and method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP3528260B2 (en) |
AU (1) | AU689134B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100415356B1 (en) * | 1998-09-30 | 2004-01-16 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | Multi-channel signal encoding and decoding |
US7613609B2 (en) | 2003-04-09 | 2009-11-03 | Sony Corporation | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto |
CN111128206A (en) * | 2013-07-22 | 2020-05-08 | 弗劳恩霍夫应用研究促进协会 | Audio encoder, audio decoder, method, and computer-readable medium |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6014491A (en) * | 1997-03-04 | 2000-01-11 | Parsec Sight/Sound, Inc. | Method and system for manipulation of audio or video signals |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1253255A (en) * | 1983-05-16 | 1989-04-25 | Nec Corporation | System for simultaneously coding and decoding a plurality of signals |
DE4135977C2 (en) * | 1991-10-31 | 1996-07-18 | Fraunhofer Ges Forschung | Method for the simultaneous transmission of signals from N signal sources |
-
1994
- 1994-08-31 JP JP20670294A patent/JP3528260B2/en not_active Expired - Fee Related
- 1994-10-25 AU AU77458/94A patent/AU689134B2/en not_active Ceased
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100415356B1 (en) * | 1998-09-30 | 2004-01-16 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | Multi-channel signal encoding and decoding |
US7613609B2 (en) | 2003-04-09 | 2009-11-03 | Sony Corporation | Apparatus and method for encoding a multi-channel signal and a program pertaining thereto |
CN111128206A (en) * | 2013-07-22 | 2020-05-08 | 弗劳恩霍夫应用研究促进协会 | Audio encoder, audio decoder, method, and computer-readable medium |
Also Published As
Publication number | Publication date |
---|---|
JP3528260B2 (en) | 2004-05-17 |
AU689134B2 (en) | 1998-03-26 |
AU7745894A (en) | 1995-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5737720A (en) | Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation | |
JP3277679B2 (en) | High efficiency coding method, high efficiency coding apparatus, high efficiency decoding method, and high efficiency decoding apparatus | |
JP3404837B2 (en) | Multi-layer coding device | |
Noll | MPEG digital audio coding | |
KR100261254B1 (en) | Scalable audio data encoding/decoding method and apparatus | |
KR100339324B1 (en) | High efficiency coding method, high efficiency code decoding method, high efficiency code coding apparatus, high efficiency code decoding apparatus, and high efficiency coding / decoding system | |
JP3250376B2 (en) | Information encoding method and apparatus, and information decoding method and apparatus | |
JP3397001B2 (en) | Encoding method and apparatus, decoding apparatus, and recording medium | |
KR100528325B1 (en) | Scalable stereo audio coding/encoding method and apparatus thereof | |
JP3227942B2 (en) | High efficiency coding device | |
US20010047256A1 (en) | Multi-format recording medium | |
JP3528260B2 (en) | Encoding device and method, and decoding device and method | |
EP0734019A1 (en) | Information processing method, information processing device and media | |
JP2852862B2 (en) | Method and apparatus for converting PCM audio signal | |
JP3362476B2 (en) | High efficiency coding device and interface device | |
JP3341448B2 (en) | Efficient encoding method for multi-channel audio data | |
JPH09102742A (en) | Encoding method and device, decoding method and device and recording medium | |
JP3594829B2 (en) | MPEG audio decoding method | |
JPH07181996A (en) | Information processing method, information processor and media | |
KR0144297B1 (en) | Apparatus for encoding adaptive digital audio signal | |
JPH07161140A (en) | Apparatuses and methods for transmission and receiving of digital audio signal | |
JPH07161142A (en) | Recording method, recording medium and reproducing method | |
Smyth | An Overview of the Coherent Acoustics Coding System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040216 |
|
LAPS | Cancellation because of no payment of annual fees |