JP3227942B2 - High efficiency coding device - Google Patents

High efficiency coding device

Info

Publication number
JP3227942B2
JP3227942B2 JP26725193A JP26725193A JP3227942B2 JP 3227942 B2 JP3227942 B2 JP 3227942B2 JP 26725193 A JP26725193 A JP 26725193A JP 26725193 A JP26725193 A JP 26725193A JP 3227942 B2 JP3227942 B2 JP 3227942B2
Authority
JP
Japan
Prior art keywords
channel
channels
scale factor
data
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26725193A
Other languages
Japanese (ja)
Other versions
JPH07123008A (en
Inventor
正俊 上野
慎二 宮森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP26725193A priority Critical patent/JP3227942B2/en
Publication of JPH07123008A publication Critical patent/JPH07123008A/en
Application granted granted Critical
Publication of JP3227942B2 publication Critical patent/JP3227942B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、例えば、映画フィルム
映写システム、ビデオテープレコーダ、ビデオディスク
プレーヤ等のステレオや、いわゆるマルチサラウンド音
響システムにおいて用いられるマルチチャネルのディジ
タル信号を圧縮符号化する高能率符号化装置に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a high-efficiency compression / encoding of a multi-channel digital signal used in a stereo such as a movie film projection system, a video tape recorder, a video disk player, etc., or a so-called multi-surround sound system. The present invention relates to an encoding device.

【0002】[0002]

【従来の技術】オーディオ或いは音声等の信号の高能率
符号化の手法及び装置には種々あるが、例えば、時間領
域のオーディオ信号等を単位時間毎にブロック化してこ
のブロック毎の時間軸の信号を周波数軸上の信号に変換
(直交変換)して複数の周波数帯域に分割し、各帯域毎
に符号化するブロック化周波数帯域分割方式、いわゆる
変換符号化(トランスフォームコーティング)や、時間
領域のオーディオ信号等を単位時間毎にブロック化しな
いで、複数の周波数帯域に分割して符号化する非ブロッ
ク化周波数帯域分割方式である帯域分割符号化(サブバ
ンドコーディング:SBC)等を挙げることができる。
また、上述の帯域分割符号化と変換符号化とを組み合わ
せた高能率符号化の手法及び装置も考えられており、こ
の場合には、例えば、上記帯域分割符号化で帯域分割を
行った後、該各帯域毎の信号を周波数領域の信号に直交
変換し、この直交変換された各帯域毎に符号化が施され
る。
2. Description of the Related Art There are various methods and apparatuses for high-efficiency encoding of signals such as audio or voice. For example, a time domain audio signal or the like is divided into blocks for each unit time, and a time axis signal for each block is obtained. Is transformed into a signal on the frequency axis (orthogonal transform), divided into a plurality of frequency bands, and is encoded in each band. Band division coding (sub-band coding: SBC), which is a non-blocking frequency band division method in which an audio signal or the like is divided into a plurality of frequency bands and encoded without being blocked for each unit time, can be used. .
Further, a high-efficiency coding method and apparatus combining the above-described band division coding and transform coding are also considered.In this case, for example, after performing band division by the above band division coding, The signal for each band is orthogonally transformed into a signal in the frequency domain, and the orthogonally transformed band is coded.

【0003】ここで、上述した帯域分割符号化の帯域分
割用フィルタとしては、例えばQMF等のフィルタがあ
り、これは1976 R.E.Crochiere Digital coding of sp
eechin subbands Bell Syst.Tech. J. Vol.55, No.8 1
976に、述べられている。また、ICASSP 83, BOSTON Po
lyphase Quadrature filters-A new subband codingtec
hnique Joseph H. Rothweiler には等バンド幅のフィル
タ分割手法及び装置が述べられている。
[0003] Here, as a filter for band division in the above-mentioned band division coding, for example, there is a filter such as QMF, which is a 1976 RECrochiere Digital coding of sp.
eechin subbands Bell Syst.Tech. J. Vol.55, No.8 1
976 states. Also, ICASSP 83, BOSTON Po
lyphase Quadrature filters-A new subband codingtec
hnique Joseph H. Rothweiler describes an equal bandwidth filter splitting method and apparatus.

【0004】また、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、該ブロック毎に高速フーリエ変換(FF
T)、コサイン変換(DCT)、モディファイドDCT
変換(MDCT)などを行うことで時間軸を周波数軸に
変換するような直交変換がある。このMDCTについて
は、ICASSP 1987 Subband/Transform Coding Using Fil
ter Bank Designs Basedon Time Domain Aliasing Canc
ellation J.P.Princen A.B.Bradley Univ. ofSurrey R
oyal Melbourne Inst.of Tech.に述べられている。
As the above-described orthogonal transform, for example, an input audio signal is divided into blocks in a predetermined unit time (frame), and a fast Fourier transform (FF) is performed for each block.
T), cosine transform (DCT), modified DCT
There is an orthogonal transformation that transforms a time axis into a frequency axis by performing transformation (MDCT) or the like. About this MDCT, ICASSP 1987 Subband / Transform Coding Using Fil
ter Bank Designs Basedon Time Domain Aliasing Canc
ellation JPPrincen ABBradley Univ. of Surrey R
oyal Melbourne Inst. of Tech.

【0005】更に、周波数帯域分割された各周波数成分
を量子化する場合の周波数分割幅としては、例えば人間
の聴覚特性を考慮した帯域分割がある。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
程帯域幅が広くなるような帯域幅で、オーディオ信号を
複数(例えば25バント)の帯域に分割することがあ
る。また、この時の各帯域毎のデータを符号化する際に
は、各帯域毎に所定のビット配分或いは、各帯域毎に適
応的なビット配分による符号化が行われる。例えば、上
記MDCT処理されて得られた係数データを上記ビット
配分によって符号化する際には、上記各ブロック毎のM
DCT処理により得られる各帯域毎のMDCT係数デー
タに対して、適応的な配分ビット数で符号化が行われる
ことになる。
Further, as a frequency division width when quantizing each frequency component divided into frequency bands, for example, there is a band division in consideration of human auditory characteristics. That is, an audio signal may be divided into a plurality of bands (for example, 25 bands) with a bandwidth generally called a critical band (critical band) such that the bandwidth becomes wider as the band becomes higher. When encoding data for each band at this time, predetermined bits are allocated to each band, or encoding is performed by adaptive bit allocation to each band. For example, when the coefficient data obtained by the MDCT process is encoded by the bit allocation, the M
Encoding is performed on the MDCT coefficient data for each band obtained by the DCT process with an adaptive number of allocated bits.

【0006】上記ビット配分手法及びそのための装置と
しては、次の2手法及び装置が知られている。IEEE Tra
nsactions of Accoustics,Speech,and Signal Processi
ng,vol.ASSP-25,No.4,August 1977 では、各帯域毎の信
号の大きさをもとに、ビット配分を行っている。また、
ICASSP 1980 The critical band coder--digital encod
ing ofthe perceptual requirements of the auditory
system M.A. Kransner MIT では、聴覚マスキングを利
用することで、各帯域毎に必要な信号対雑音比を得て固
定的なビット配分を行う手法及び装置が述べられてい
る。
The following two methods and devices are known as the above-mentioned bit allocation method and a device therefor. IEEE Tra
nsactions of Accoustics, Speech, and Signal Processi
In ng, vol. ASSP-25, No. 4, August 1977, bits are allocated based on the magnitude of the signal in each band. Also,
ICASSP 1980 The critical band coder--digital encod
ing ofthe perceptual requirements of the auditory
system MA Kransner MIT describes a method and an apparatus for obtaining a required signal-to-noise ratio for each band and performing fixed bit allocation by using auditory masking.

【0007】[0007]

【発明が解決しようとする課題】ところで、例えば上述
したようなサブバンドコーディング等を用いたオーディ
オ信号の高能率圧縮符号化方式においては、人間の聴覚
上の特性を利用し、オーディオデータを約1/5に圧縮
するような方式が既に実用化されている。なお、このオ
ーディオデータを約1/5に圧縮する方式としては、例
えばいわゆるATRAC(Adaptive TRansform Acousti
c Coding) と呼ばれる方式が存在する。
By the way, in a high-efficiency compression coding method of an audio signal using, for example, the above-described sub-band coding or the like, the audio data is reduced to about 1 by utilizing the characteristics of human hearing. A method of compression to / 5 has already been put to practical use. As a method of compressing the audio data to about 1/5, for example, a so-called ATRAC (Adaptive TRansform Acousti
c Coding).

【0008】また、通常のオーディオ機器の場合のみな
らず、例えば映画フィルム映写システム、高品位テレビ
ジョン、ビデオテープレコーダ、ビデオディスクプレー
ヤ等のステレオないしはマルチサラウンド音響システム
においては、例えば4〜8チャネル等の複数チャネルの
オーディオ或いは音声信号を扱うようになりつつあり、
この場合においても、ビットレートを削減する高能率符
号化を行うことが望まれている。
In addition to ordinary audio equipment, for example, in a stereo or multi-surround sound system such as a movie film projection system, a high-definition television, a video tape recorder, a video disk player, etc., for example, 4 to 8 channels, etc. Of multi-channel audio or voice signals,
Even in this case, it is desired to perform high-efficiency coding for reducing the bit rate.

【0009】特に、上記映画フィルムに対して例えばレ
フトチャネル,レフトセンターチャネル,センターチャ
ネル,ライトセンターチャネル,ライトチャネル,サラ
ウンドレフトチャネル,サラウンドライトチャネル,サ
ブウーファーチャネルの8チャネルのディジタルオーデ
ィオ信号を記録するような場合においては、上記ビット
レートを削減する高能率符号化が必要となる。すなわ
ち、例えばいわゆるCD(コンパクトディスク)などで
用いているようなサンプリング周波数44.1kHzで
16ビットの直線量子化されたオーディオデータの上記
8チャネル分をも記録できる領域は、上記映画フィルム
上に確保することが困難であり、したがって、当該オー
ディオデータの圧縮が必要になる。
In particular, digital audio signals of, for example, eight channels of a left channel, a left center channel, a center channel, a right center channel, a right channel, a surround left channel, a surround right channel, and a subwoofer channel are recorded on the movie film. In such a case, high-efficiency coding for reducing the bit rate is required. That is, for example, an area capable of recording the above eight channels of 16-bit linearly quantized audio data at a sampling frequency of 44.1 kHz as used in a so-called CD (compact disk) is secured on the movie film. Therefore, it is necessary to compress the audio data.

【0010】なお、上記映画フィルムに記録する上記8
チャネルの各チャネルは、例えば当該映画フィルムの画
像記録領域から再生された画像が映写機によって投影さ
れるスクリーン側に配置されたレフトスピーカ、レフト
センタースピーカ、センタスピーカ、ライトセンタスピ
ーカ、ライトスピーカ、サラウンドレフトスピーカ、サ
ラウンドライトスピーカ、サブウーファースピーカとそ
れぞれ対応するものである。ここで、上記センタスピー
カは、スクリーン側の中央に配置され、センタチャネル
のオーディオデータによる再生音を出力するもので例え
ば俳優のせりふ等の最も重要な再生音を出力する。上記
サブウーファースピーカは、サブウーファーチャネルの
オーディオデータによる再生音を出力するもので、例え
ば爆発音などの低域の音というよりは振動として感じら
れる音を効果的に出力するものであり、爆発シーンなど
に効果的に使用されることが多いものである。上記レフ
トスピーカ及びライトスピーカは、上記スクリーンの左
右に配置され、レフトチャネルのオーディオデータによ
る再生音とライトチャネルのオーディオデータによる再
生音を出力するもので、ステレオ音響効果を発揮する。
上記レフトセンタスピーカは上記レフトスピーカとセン
タスピーカとの間に配置され、また上記ライトセンタス
ピーカは上記センタスピーカとライトスピーカとの間に
配置されるものである。上記レフトセンタスピーカはレ
フトセンタチャネルのオーディオデータによる再生音を
出力し、上記ライトセンタスピーカはライトセンタチャ
ネルのオーディオデータによる再生音を出力するもの
で、それぞれ上記レフトスピーカ若しくはライトスピー
カの補助的な役割を果たす。特にスクリーンが大きく収
容人数の多い映画館等では、座席の位置によって音像の
定位が不安定になりやすいが、上記レフトセンタスピー
カとライトセンタスピーカを付加することにより、音像
のよりリアルな定位を作り出すのに効果を発揮する。さ
らに、上記サラウンドレフトスピーカとサラウンドライ
トスピーカは、観客席を取り囲むように配置され、サラ
ウンドレフトチャネルのオーディオデータによる再生音
とサラウンドライトチャネルのオーディオデータによる
再生音を出力するもので、残響音や拍手、歓声に包まれ
た印象を与える効果がある。これにより、より立体的な
音像を作り出すことができる。
[0010] It should be noted that the 8
Each channel of the channels includes, for example, a left speaker, a left center speaker, a center speaker, a right center speaker, a right speaker, and a surround left disposed on a screen side on which an image reproduced from an image recording area of the movie film is projected by a projector. They correspond to speakers, surround light speakers, and subwoofer speakers, respectively. Here, the center speaker is arranged at the center on the screen side, and outputs a reproduction sound based on the audio data of the center channel, and outputs the most important reproduction sound such as an actor's dialogue. The subwoofer speaker outputs a reproduced sound based on the audio data of the subwoofer channel. For example, the subwoofer speaker effectively outputs a sound that is perceived as vibration rather than a low-frequency sound such as an explosion sound. It is often used effectively for such purposes. The left speaker and the right speaker are arranged on the left and right of the screen, and output a reproduction sound based on left channel audio data and a reproduction sound based on right channel audio data, and exhibit a stereo sound effect.
The left center speaker is arranged between the left speaker and the center speaker, and the right center speaker is arranged between the center speaker and the right speaker. The left center speaker outputs a reproduced sound based on the left center channel audio data, and the right center speaker outputs a reproduced sound based on the right center channel audio data. Fulfill. Particularly in a movie theater with a large screen and a large capacity, the localization of the sound image tends to be unstable depending on the position of the seats. However, by adding the left center speaker and the right center speaker, a more realistic localization of the sound image is created. It is very effective. Further, the surround left speaker and the surround right speaker are arranged so as to surround the audience seat, and output a reproduction sound by the audio data of the surround left channel and a reproduction sound by the audio data of the surround right channel. It has the effect of giving the impression of shouting. Thereby, a more three-dimensional sound image can be created.

【0011】また、フィルムという媒体は、表面に傷な
どが発生しやすいため、ディジタルデータをオリジナル
のまま記録していたのでは、データ欠けが激しく実用に
ならない。このため、エラー訂正符号の能力が非常に重
要になり、上記データ圧縮は、その訂正符号も含めて上
記フィルム上の記録領域に記録可能な程度まで行う必要
がある。
Further, since the surface of a medium such as a film is apt to be scratched or the like, if digital data is recorded as it is, the lack of data is so severe that it is not practical. For this reason, the capability of the error correction code becomes very important, and the data compression needs to be performed to such an extent that the data including the correction code can be recorded in the recording area on the film.

【0012】このようなことから、上記8チャネルの各
チャネルのディジタルオーディオデータを圧縮する圧縮
方法としては、上述したような人間の聴覚の特性を考慮
して最適なビット割り当てを行うことによって、例えば
いわゆるCD(コンパクトディスク)などに記録される
ようなサンプリング周波数44.1kHzで16ビット
のディジタルオーディオデータを約1/5に圧縮しなが
らも、CD並の音質を達成する前記高能率符号化方式
(いわゆるATRAC方式など)を適用するようにして
いる。
For this reason, as a compression method for compressing the digital audio data of each of the above-mentioned eight channels, an optimal bit allocation is performed in consideration of the characteristics of human hearing as described above. The above-described high-efficiency encoding method (which compresses 16-bit digital audio data at a sampling frequency of 44.1 kHz, which is recorded on a so-called CD (compact disk) or the like, to about 1/5 and achieves a sound quality comparable to a CD) ( A so-called ATRAC method) is applied.

【0013】しかし、上記ATRAC方式はシングルチ
ャネル用の符号化方式であり、これを用いてマルチチャ
ネルオーディオデータを符号化する場合には、チャンネ
ル間のデータの依存関係や、各チャネルのデータ特性、
フォーマット特性といった要素を用いた効果的なデータ
符号化処理をすることができない。
However, the ATRAC method is a coding method for a single channel, and when multi-channel audio data is coded by using the ATRAC method, data dependence between channels, data characteristics of each channel,
Effective data encoding processing using elements such as format characteristics cannot be performed.

【0014】そこで、本発明は、上述したようなことに
鑑み、マルチチャネルの信号の圧縮符号化において、よ
り高圧縮率を実現でき、また既存の復号化装置をも使用
可能となす高能率符号化装置を提供することを目的とし
ている。
In view of the above, the present invention provides a high-efficiency code which can realize a higher compression rate in compression coding of a multi-channel signal and which can use an existing decoding device. It is intended to provide a chemical conversion device.

【0015】[0015]

【課題を解決するための手段】本発明の高能率符号化装
置は、上述の目的を達成するために提案されたものであ
り、複数チャネルのオーディオディジタル信号を正規化
して符号化し、符号化された信号とともに少なくとも当
該正規化のスケールファクタを含む符号化のパラメータ
情報を出力する高能率符号化装置において、各チャネル
について時間及び周波数の2次元領域のユニット毎にス
ケールファクタを求めるスケールファクタ計算手段と、
スケールファクタに基づいて、スケールファクタを共通
化する少なくとも2以上のチャネルを選択する共通化チ
ャネル選択手段と、共通化チャネル選択手段の出力に基
づいて、選択されたチャネルのスケールファクタを共通
化することによって、出力するパラメータ情報を削減す
るスケールファクタ共通化手段とを備え、当該パラメー
タ情報を削減することで圧縮率を高めるようにしたもの
である。
SUMMARY OF THE INVENTION A high-efficiency coding apparatus according to the present invention has been proposed to achieve the above-mentioned object, and normalizes and codes a plurality of channels of audio digital signals. And a scale factor calculating means for calculating a scale factor for each unit of a two-dimensional area of time and frequency for each channel in a high-efficiency coding apparatus which outputs parameter information of coding including at least the scale factor of the normalization together with the signal. ,
Common channel selecting means for selecting at least two or more channels for commonizing the scale factor based on the scale factor, and commonizing the scale factor of the selected channel based on the output of the common channel selecting means And a scale factor sharing means for reducing the parameter information to be output, and increasing the compression ratio by reducing the parameter information.

【0016】ここで、共通化チャネル選択手段は、2チ
ャネルのスケールファクタに関する所定の評価関数を、
既に選択されたチャネルを含む全チャネルの組み合わせ
に適用することによって共通化するチャネルを選択す
る。また、高能率符号化装置は、共通化チャネル選択手
段で選択されたチャネルについて、スケールファクタ以
外のパラメータ情報の一部又は全部をも共通化するパラ
メータ情報共通化手段を備えていてもよい。また、スケ
ールファクタ共通化手段は、各チャネルのオーディオデ
ィジタル信号を複数帯域に分割した帯域毎にパラメータ
情報の共通化を行うことで、オーディオディジタル信号
の周波数特性に合わせた符号化を可能としている。
Here, the common channel selection means calculates a predetermined evaluation function relating to the scale factor of the two channels,
A channel to be shared is selected by applying to a combination of all channels including the already selected channel. Further, the high-efficiency encoding device may include a parameter information sharing unit that shares some or all of the parameter information other than the scale factor for the channel selected by the common channel selection unit. Further, the scale factor sharing means shares the parameter information for each band obtained by dividing the audio digital signal of each channel into a plurality of bands, thereby enabling encoding in accordance with the frequency characteristics of the audio digital signal.

【0017】[0017]

【作用】本発明によれば、各チャネルのディジタル信号
間の相関が強く全く同一ではないが互いに似ている各チ
ャネルの信号を既存のシングルチャネル用の符号化方式
で符号化すると、各チャネルの符号化されたデータのう
ちのデータの特性を表すパラメータ情報は、各チャネル
間で一致する傾向にあり、したがって、一致しているパ
ラメータ情報をチャネル間で共通化することで、冗長化
を抑えると共に、パラメータ情報の似ているチャネルを
判別することによって共通化による音質の低減を抑制す
るようにしている。
According to the present invention, when the signals of the channels, which are not completely identical but are similar to each other, are strongly correlated between the digital signals of the respective channels, the signals of the respective channels are encoded by the existing single channel coding method. Parameter information indicating the characteristics of the data in the encoded data tends to match between the channels. Therefore, by sharing the matching parameter information among the channels, redundancy is suppressed and By discriminating channels having similar parameter information, reduction in sound quality due to commonality is suppressed.

【0018】[0018]

【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。図1には、本発明実施例の高能率符号
化装置に適用される前記いわゆるATRAC方式の符号
化を行う構成を示す。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 shows a configuration for performing the so-called ATRAC coding which is applied to the high-efficiency coding apparatus according to the embodiment of the present invention.

【0019】この図1において、入力端子24を介して
供給された標本化及び量子化されたオーディオデータ
は、先ず、帯域分割フィルタ401によって0〜5.5
kHzの低域と、5.5kHz〜11kHzの中域と、
11kHz以上(11kHz〜22kHz)の3つの周
波数帯域に分割される。
In FIG. 1, the sampled and quantized audio data supplied via the input terminal 24 is firstly subjected to 0 to 5.5 by the band division filter 401.
kHz low band, 5.5kHz-11kHz middle band,
It is divided into three frequency bands of 11 kHz or more (11 kHz to 22 kHz).

【0020】これら3つの周波数帯域の信号のうち、上
記帯域分割フィルタ401からの上記低域の信号はMD
CT(Modified Discrete Cosine Transform:改良型離
散余弦変換)演算を行うMDCT回路402Lに、中域
の信号は同じくMDCT演算を行うMDCT回路402
Mに、また、高域の信号はMDCT回路402Hに送ら
れ、これらMDCT回路402L〜402Hでそれぞれ
周波数成分に分解される。このとき、上記MDCTを施
すときの時間ブロック長は、各周波数帯域毎に可変であ
り、信号が急激に変化する部分では、時間ブロック長を
短くして、時間分解能を高め、信号が定常的な部分では
時間ブロック長を長くして、信号成分の有効伝送と量子
化雑音を制御する。
Of the signals in these three frequency bands, the low-frequency signal from the band division filter 401 is MD
An MDCT circuit 402L that performs a CT (Modified Discrete Cosine Transform) operation, and an MDCT circuit 402 that performs the same MDCT operation on a mid-range signal.
M and the high-frequency signal are sent to the MDCT circuit 402H, where they are decomposed into frequency components by the MDCT circuits 402L to 402H. At this time, the time block length at the time of performing the MDCT is variable for each frequency band. In a portion where the signal changes abruptly, the time block length is shortened to increase the time resolution, and the signal becomes stationary. In the part, the time block length is lengthened to control the effective transmission of the signal component and the quantization noise.

【0021】この時間ブロック長は、ブロックサイズ評
価器403にて決定されている。すなわち、上記帯域分
割フィルタ401からの3つの周波数帯域の信号は、ブ
ロックサイズ評価器403にも送られ、当該ブロックサ
イズ評価器403が上記MDCTの時間ブロック長を決
定し、この決定した時間ブロック長を示す情報を上記M
DCT回路402L〜402Hに送るようにしている。
The time block length is determined by the block size evaluator 403. That is, the signals of the three frequency bands from the band division filter 401 are also sent to the block size estimator 403, and the block size evaluator 403 determines the time block length of the MDCT, and determines the determined time block length. Information indicating the above M
It is sent to the DCT circuits 402L to 402H.

【0022】なお、上記MDCTでの2種類の時間ブロ
ック長のうち、長い時間ブロック長はロングモードと呼
ばれ、11.6msの時間に相当する。また、短い時間
ブロック長はショートモードと呼ばれ、高域(11kH
z以上)で1.45msまで、低域(5.5kHz以
下)及び中域(5.5kHzから11kHz)では2.
9msまで時間分解能を上げるようにしている。
Note that, of the two types of time block lengths in the MDCT, a long time block length is called a long mode, and corresponds to a time of 11.6 ms. Further, a short time block length is called a short mode, and a high frequency (11 kHz) is used.
z or more) up to 1.45 ms, and 2. in the low range (5.5 kHz or less) and the middle range (5.5 kHz to 11 kHz).
The time resolution is increased up to 9 ms.

【0023】このようにして、時間と周波数の2次元領
域(これをブロックフローティングユニット:Block Fl
oating Unit と呼ぶ)上の信号成分に分解されたオーデ
ィオ信号は、正規化回路404L〜404Hによって低
域,中域,高域で合計52個のブロックフローティング
ユニットに分けられると共に、ユニット毎に規格化(正
規化)される(スケールファクタの決定がなされる)。
In this manner, the two-dimensional area of time and frequency (this is a block floating unit: Block Fl)
The audio signal decomposed into the above signal components is divided into a total of 52 block floating units in low, middle, and high ranges by normalization circuits 404L to 404H, and standardized for each unit. (Normalized) (a scale factor is determined).

【0024】また、上記ビット配分器405では、人間
の聴覚の特性を利用して、そのオーディオ信号がどのよ
うな成分から構成されているかを分析する。この分析結
果が上記正規化回路404L〜404Hからの各ユニッ
ト毎の信号が供給される再量子化器406に送られる。
The bit allocation unit 405 analyzes the components of the audio signal using the characteristics of human hearing. The result of this analysis is sent to the requantizer 406 to which signals from each of the normalization circuits 404L to 404H are supplied.

【0025】当該再量子化器406は、上記分析結果に
基づいて、各ユニットをどの程度の精度で符号化するか
を求めてパラメータ化する(ワードレングスの決定を行
う)と共に、再量子化を行う。
The requantizer 406 determines the degree of precision with which each unit is to be coded based on the analysis result and parameterizes it (determines the word length), and performs requantization. Do.

【0026】最後に、フォーマッタ407では、各ユニ
ット毎の各パラメータ情報と再量子化されたスペクトラ
ム信号とを所定のフォーマットに従ってビットストリー
ムへ組み立てる。このフォーマッタ407の出力が出力
端子25から出力される。
Finally, the formatter 407 assembles each parameter information of each unit and the requantized spectrum signal into a bit stream according to a predetermined format. The output of the formatter 407 is output from the output terminal 25.

【0027】ここで、上述したような符号化の動作はサ
ウンドフレームという単位毎に行われる。
Here, the above-described encoding operation is performed for each unit called a sound frame.

【0028】図2には、当該サウンドフレーム内のデー
タの記録の様子を示す。この図2において、1サウンド
フレームは212バイトからなり、ここに44.1kH
zのサンプリングレートで512サンプル、1チャネル
相当のオーディオ再生用データが圧縮符号化されてい
る。
FIG. 2 shows how data in the sound frame is recorded. In FIG. 2, one sound frame is composed of 212 bytes, and 44.1 kHz is set here.
At a sampling rate of z, 512 samples and audio reproduction data equivalent to one channel are compression-encoded.

【0029】上記212バイトのサウンドフレームデー
タは、ブロックサイズモード、サブインフォメーション
量、ワードレングスデータ、スケールファクタデータ、
スペクトラムデータ、冗長スケールファクタバイト、冗
長ワードレングスバイト、下部のサブインフォメーショ
ン量、及び、下部のブロックサイズモードから構成され
る。ここで、212バイトのデータの中には、エラー訂
正用の2重書き部分(冗長スケールファクタバイト、冗
長ワードレングスバイト、下部ブロックサイズモード)
が含まれている。
The 212-byte sound frame data includes a block size mode, sub information amount, word length data, scale factor data,
It consists of spectrum data, redundant scale factor byte, redundant word length byte, lower sub information amount, and lower block size mode. Here, in the 212-byte data, a double writing portion for error correction (redundant scale factor byte, redundant word length byte, lower block size mode)
It is included.

【0030】上記ブロックサイズモードは、図1のブロ
ックサイズ評価器403の評価結果を記録するためのデ
ータで、その内容は表1に示すようなものとなってい
る。
The block size mode is data for recording the evaluation result of the block size evaluator 403 in FIG. 1, and its contents are as shown in Table 1.

【0031】[0031]

【表1】 [Table 1]

【0032】この表1を見ればわかるように、ロングモ
ードのとき、低域及び中域ではMDCT演算によりそれ
ぞれ128個の周波数成分に、高域では256個の周波
数成分に分解される。また、ショートモードのとき、低
域、中域及び高域はそれぞれ32個の周波数成分に分解
される。
As can be seen from Table 1, in the long mode, the low frequency and the middle frequency are decomposed into 128 frequency components by the MDCT operation, and the high frequency is decomposed into 256 frequency components. Further, in the short mode, the low band, the middle band, and the high band are each decomposed into 32 frequency components.

【0033】また、サブインフォメーション量は、アマ
ウント1、アマウント2、アマウント3の3つの情報が
記録され、アマウント1は、記録されているワードレン
グス及びスケールファクタの個数を表し、アマウント2
は2重書きされているワードレングスの個数を表し、ア
マウント3は2重書きされているスケールファクタの個
数を表している。この内容については、表2に示す。
As the sub-information amount, three pieces of information, ie, amount 1, amount 2, and amount 3, are recorded. The amount 1 indicates the number of recorded word lengths and scale factors.
Indicates the number of double-written word lengths, and the amount 3 indicates the number of double-written scale factors. The contents are shown in Table 2.

【0034】[0034]

【表2】 [Table 2]

【0035】ワードレングスは、各ユニットの再量子化
されたときの語長を表す。この内容については表3に示
す。
The word length represents the word length of each unit when requantized. The contents are shown in Table 3.

【0036】[0036]

【表3】 [Table 3]

【0037】スケールファクタは各ユニットの正規化し
た値を表す。その内容については表4に示す。
The scale factor represents a normalized value of each unit. The contents are shown in Table 4.

【0038】[0038]

【表4】 [Table 4]

【0039】ここで、本実施例では、上記8チャネルの
ATRAC方式によるデータを例えば図3に示すように
記録する。すなわち、順に、20バイトのIDデータ、
それぞれ212バイトのチャネルCh1〜Ch8のデー
タ、4バイトの誤り訂正符号のCRCデータを記録す
る。
Here, in this embodiment, data according to the ATRAC system of the above eight channels is recorded, for example, as shown in FIG. That is, in order, 20 bytes of ID data,
Each of the data of the channels Ch1 to Ch8 of 212 bytes and the CRC data of the error correction code of 4 bytes are recorded.

【0040】この場合の符号化処理は、具体的構成に当
てはめると、図4に示すように、入力端子31〜38を
介するマルチチャネルのオーディオデータ(8チャネル
のデータ)を、各チャネルに対応して設けられた符号器
41〜48によってそれぞれ符号化し、その結果の値を
全く変更せずにマルチプレクサ49によってまとめて、
ひとつのデータとして端子50から出力する処理とな
る。
When the encoding process in this case is applied to a specific configuration, as shown in FIG. 4, multi-channel audio data (8-channel data) via input terminals 31 to 38 is assigned to each channel. Are respectively encoded by the encoders 41 to 48 provided, and the resultant values are combined by the multiplexer 49 without any change.
This is a process of outputting from the terminal 50 as one data.

【0041】ところで、例えばステレオデータのよう
に、2つのチャネルのデータ間の相関が強く、全く同一
ではないが似たデータが入力されるような場合は、各チ
ャネル用の符号器によって符号化されたデータのうち、
データの特性をあらわすパラメータ部分が、これらチャ
ネル間で一致する傾向がある。すなわち、このような一
致しているパラメータ全てをそれ以外のチャネルのパラ
メータと平等に記録するのは冗長である。したがって、
例えば、一致している部分は1チャネルに代表させるな
どの処置を取るのが適切である。
When, for example, stereo data has a strong correlation between data of two channels and similar but not identical data is input, the data is encoded by the encoder for each channel. Of the data
The parameter portion representing the characteristics of data tends to match between these channels. That is, it is redundant to record all such matching parameters equally with the parameters of the other channels. Therefore,
For example, it is appropriate to take measures such as representing the matching part as one channel.

【0042】そこで、本発明実施例の高能率符号化装置
では、これらの状況を踏まえ、複数チャネルのパラメー
タを共通化することによって冗長化を抑えると共に、パ
ラメータの似ているチャネルを判別することにより共通
化による音質の低減を抑制するようにしている。
In view of these circumstances, the high-efficiency coding apparatus according to the embodiment of the present invention takes the above circumstances into consideration and suppresses redundancy by sharing parameters of a plurality of channels, and discriminates channels having similar parameters. Reduction of sound quality due to commonality is suppressed.

【0043】以下、上記パラメータの共通化について説
明する。
Hereinafter, the common use of the above parameters will be described.

【0044】ここで、パラメータを共通化するチャネル
間の必要条件は、両チャネルのブロックサイズモードが
同一であることのみである。ただし、例えば記憶容量な
どの理由により共通化する必要がある場合は、この限り
ではない。その際、時間ブロック長はショートモードを
優先し、いずれかのチャネルがショートモードであれば
共通ブロックサイズモードもショートモードに設定す
る。
Here, the only requirement between channels that share parameters is that the block size mode of both channels be the same. However, this is not always the case when it is necessary to use a common memory for reasons such as storage capacity. At that time, the time block length gives priority to the short mode, and if any channel is in the short mode, the common block size mode is also set to the short mode.

【0045】図1のブロックサイズモードの決定から再
量子化までの処理のみを抜き出して、さらに細かく処理
を分割して具体的構成に当てはめて表すと、図5に示す
ような構成として表すことができる。
If only the processing from the determination of the block size mode to the requantization in FIG. 1 is extracted, and the processing is further divided into small pieces and applied to a specific configuration, the processing can be expressed as a configuration as shown in FIG. it can.

【0046】すなわち、この図5において、帯域分割フ
ィルタ401からの各帯域のオーディオデータが端子9
0を介して供給され、このデータがブロックサイズモー
ド決定回路91に送られ、当該ブロックサイズモード決
定回路91でブロックサイズモードを決定する。その
後、スケールファクタ決定回路93では上記ユニット毎
に規格化(スケールファクタの決定)を行う。次のサブ
インフォメーション量決定回路95では、上記スケール
ファクタとワードレングスの記録媒体へ記録する個数を
決定(サブインフォメーション量決定)し、聴覚特性よ
りビットアロケーションしてワードレングスを決定す
る。再量子化器98では、上記決定されたワードレング
スを用いて上記各帯域のオーディオデータを再量子化す
る。
That is, in FIG. 5, audio data of each band from the band division filter 401 is supplied to the terminal 9.
0, and this data is sent to the block size mode determination circuit 91, and the block size mode determination circuit 91 determines the block size mode. After that, the scale factor determining circuit 93 normalizes (determines the scale factor) for each of the units. The next sub-information amount determination circuit 95 determines the number of the above-mentioned scale factors and word lengths to be recorded on the recording medium (sub-information amount determination), and determines the word length by bit allocation based on auditory characteristics. The requantizer 98 requantizes the audio data of each band using the determined word length.

【0047】ここで、パラメータを共通化する際には、
全く異なるパラメータをもつチャネル同士で共通化する
のは無理があるため、例えば全チャネルのデータサイズ
や記録容量といった制限を回避可能になるまで、最も似
ているパラメータを持つチャネル同士から共通化してい
くのが好ましい。そのパラメータが似ているという評価
に用いる値すなわち共通化コストは、式(1)にて求め
ることができる。なお、式(1)は2チャネル間で共通
化コストを用いる場合の式である。また、この式(1)
において、式中SF1(i)およびSF2(i)は、共
通化コストを計算する2チャネルのユニットi(UNI
T i)のスケールファクタの値を示している。
Here, when sharing the parameters,
Since it is impossible to share channels having completely different parameters, channels having the most similar parameters will be shared until the limitations such as the data size and recording capacity of all channels can be avoided. Is preferred. The value used for the evaluation that the parameters are similar, that is, the commonization cost can be obtained by Expression (1). Equation (1) is an equation in the case of using a common cost between two channels. Also, this equation (1)
In the formulas, SF1 (i) and SF2 (i) are two-channel units i (UNIs) for calculating the common cost.
The scale factor value of Ti) is shown.

【0048】[0048]

【数1】 (Equation 1)

【0049】既にパラメータを共通化したチャネルを含
む全チャネルの組合せについて、上記式(1)を用いて
共通化コストを計算し、その最も小さいチャネル同士を
共通化する。ここまでの作業を、チャネル間の共通化が
必要でなくなるまで続ける。
For the combination of all channels including the channels whose parameters have already been shared, the sharing cost is calculated using the above equation (1), and the smallest channel is shared. The operation up to this point is continued until it becomes unnecessary to share channels.

【0050】この共通化コスト計算を具体的構成に当て
はめると、図6に示すようになる。すなわちこの図6に
おいて、端子100a,100bには2チャネルのチャ
ネルのデータが供給され、各チャネル毎にブロックサイ
ズモード決定回路101a,101bによってブロック
サイズモードが決定される。各ブロックサイズモード決
定回路101a,101bからはブロック毎のオーディ
オデータと共にブロックサイズモードの情報が出力さ
れ、当該ブロックサイズモードの情報は同一チェック回
路102に送られる。
When this common cost calculation is applied to a specific configuration, it becomes as shown in FIG. That is, in FIG. 6, data of two channels is supplied to the terminals 100a and 100b, and the block size mode is determined by the block size mode determination circuits 101a and 101b for each channel. The block size mode determination circuits 101a and 101b output block size mode information together with audio data for each block, and the block size mode information is sent to the same check circuit 102.

【0051】同一チェック回路102ではブロックサイ
ズモードの同一をチェックし、その結果を上記各ブロッ
クサイズモード決定回路101a,101bからのそれ
ぞれ対応するチャネルのブロック毎のオーディオデータ
が供給されるスケールファクタ決定回路103a,10
3bへ送られる。各スケールファクタ決定回路103
a,103bからのスケールファクタの値は共通化コス
ト計算回路104に送られて、ここで上記式(1)の共
通化コストの計算がなされる。
The same check circuit 102 checks whether the block size mode is the same, and compares the result with the scale factor determining circuit to which the audio data for each block of the corresponding channel is supplied from each of the block size mode determining circuits 101a and 101b. 103a, 10
3b. Each scale factor determination circuit 103
The values of the scale factors from a and 103b are sent to the common cost calculation circuit 104, where the common cost of the above equation (1) is calculated.

【0052】この共通化コスト計算回路104からの各
チャネルの計算結果は端子111a,111bを介して
出力され、上記各スケールファクタ決定回路103から
の各チャネルのオーディオデータは端子110a,11
0bから出力される。
The calculation result of each channel from the common cost calculation circuit 104 is output via terminals 111a and 111b, and the audio data of each channel from each scale factor determination circuit 103 is output from terminals 110a and 11b.
0b.

【0053】上述のようにしてパラメータを共通化する
チャネルが決定されたならば、その後は、上記再量子化
までの処理を行う。なお、パラメータを共通化しないチ
ャネルの場合の処理は、図5の処理のままである。これ
に対して、パラメータを共通化するチャネルの場合は、
図7の具体的構成にて示すように、共通化パラメータを
用いて再量子化処理を行う。
After the channel for sharing the parameter is determined as described above, the processing up to the requantization is performed thereafter. Note that the processing in the case of a channel that does not share parameters remains the processing of FIG. On the other hand, in the case of channels that share parameters,
As shown in the specific configuration of FIG. 7, requantization processing is performed using the common parameters.

【0054】すなわちこの図7において、端子113
a,113bには上記図6の対応する端子111a,1
11bからの出力が供給され、端子112a,112b
には図6の対応する端子110a,110bの出力が供
給される。上記端子110a,110bを介した信号
は、各チャネルに対応して設けられた再量子化器108
a,108bに送られる。
That is, in FIG.
a, 113b correspond to the corresponding terminals 111a, 1 in FIG.
11b are supplied, and the terminals 112a, 112b
Are supplied with the outputs of the corresponding terminals 110a and 110b in FIG. A signal passed through the terminals 110a and 110b is supplied to a requantizer 108 provided for each channel.
a, 108b.

【0055】一方、上記端子113a,113bを介し
た信号はスケールファクタ共通化回路105に送られ
る。当該スケールファクタ共通化回路105では、スケ
ールファクタを共通化する。この共通化には、 max(SF1,SF2) を各ユニットについて求め、これを各ユニットのスケー
ルファクタとする。なお上記maxとは、両スケールフ
ァクタの最大値を意味する。最大値を選択することで、
再量子化できないデータの発生を回避する。
On the other hand, the signal via the terminals 113a and 113b is sent to the scale factor sharing circuit 105. The scale factor sharing circuit 105 shares the scale factor. For this commonization, max (SF1, SF2) is obtained for each unit, and this is used as the scale factor of each unit. The above-mentioned max means the maximum value of both scale factors. By choosing the maximum value,
Avoid occurrence of data that cannot be requantized.

【0056】次の共通サブインフォメーション量決定回
路106においては共通サブインフォメーション量を求
め、これをもとに次のワードレングス決定回路107で
はビットアロケーション処理を行ってワードレングスを
決定する。この処理はブロックサイズモード、サブイン
フォメーション量、スケールファクタを用いて求めるた
め、共通化データだけを用いてチャネル間で共通に処理
できる。処理内容も図5に示した処理と同じである。
The next common sub-information amount determining circuit 106 determines the common sub-information amount, and based on this, the next word length determining circuit 107 performs bit allocation processing to determine the word length. Since this process is performed using the block size mode, the amount of sub information, and the scale factor, the process can be performed in common between channels using only the common data. The processing content is the same as the processing shown in FIG.

【0057】最後に、求めた共通パラメータを利用し
て、各再量子化器108a,108bでは各チャネル毎
に再量子化を行う。これにより、パラメータを共通化し
た各チャネルの符号化データが作成され、各チャネルに
対応する端子114a,114bから出力される。
Finally, the requantizers 108a and 108b perform requantization for each channel using the obtained common parameters. As a result, encoded data of each channel with common parameters is created and output from terminals 114a and 114b corresponding to each channel.

【0058】上述した処理を前記8チャネルのオーディ
オデータを符号化する構成に適用すると、符号化処理の
全体としては、図4と比較して、図8に示すような構成
となる。
When the above-described processing is applied to the configuration for encoding the eight-channel audio data, the overall encoding processing is as shown in FIG. 8 as compared with FIG.

【0059】すなわち、この図8において、各チャネル
の入力端子31〜38からのオーディオデータが、共通
チャネル符号器51に送られ、この共通チャネル符号器
51で上述の共通化の処理と符号化が行われる。当該共
通チャネル符号器51からの各チャネルの符号化された
データが、マルチプレクサ52を介して端子53から出
力される。
That is, in FIG. 8, audio data from the input terminals 31 to 38 of each channel is sent to a common channel encoder 51, and the common channel encoder 51 performs the above-described common processing and encoding. Done. The encoded data of each channel from the common channel encoder 51 is output from the terminal 53 via the multiplexer 52.

【0060】ところで、上記符号化に対応する復号化に
おいては、各チャネルの復号を行う復号器の前に上記共
通化データをそれぞれのチャネルに割り振る必要があ
る。すなわち、図9に示すように例えば前記8チャネル
のうちのチャネルCh3とチャネルCh4のパラメータ
が共通化されている場合を例に挙げて説明すると、図9
の(a)に示すような記録媒体でのデータの記録状況
(131)に対し、図9の(b)に示すように共通部分
を各々に分配し(132a,132b)、各チャネルの
復号器(チャネルCh3用の復号器とチャネルCh4用
の復号器)へデータを渡すという処理を行う必要があ
る。
By the way, in the decoding corresponding to the above-mentioned encoding, it is necessary to allocate the above-mentioned common data to each channel before the decoder which decodes each channel. That is, as shown in FIG. 9, for example, a case where the parameters of the channel Ch3 and the channel Ch4 among the eight channels are shared is described as an example.
In the data recording condition (131) on the recording medium as shown in FIG. 9A, common parts are distributed to each as shown in FIG. (A decoder for channel Ch3 and a decoder for channel Ch4).

【0061】ここで、マルチチャネルデータは一般に1
つにまとめられた状態で記録されており、復号化装置に
はこれを各チャネル分のデータに配分する処理が必要で
ある。本実施例のような共通化の処理を行う符号化の方
式を用いる場合、当該復号化装置では、例えば全チャネ
ルを1サウンドフレーム分の内部メモリに一旦格納し、
次に各チャネルに対し該当パラメータを配分できるよ
う、配分器を設計すればよい。また、本実施例の方式に
よれば、共通化の範囲が1サウンドフレーム内に完結し
ているため、同チャネルの時間軸上の複数のサウンドフ
レームを扱う必要がなく、データの選択も容易である。
Here, multi-channel data is generally 1
The data is recorded in a single state, and the decoding device needs to perform processing of allocating the data to the data of each channel. In the case of using an encoding method for performing common processing as in the present embodiment, the decoding device temporarily stores, for example, all channels in an internal memory for one sound frame,
Next, the distributor may be designed so that the corresponding parameter can be distributed to each channel. Further, according to the method of the present embodiment, since the range of commonality is completed within one sound frame, it is not necessary to handle a plurality of sound frames on the time axis of the same channel, and data can be easily selected. is there.

【0062】以上の処理によりパラメータを共通化した
ATRACデータは、1チャネルあたり、式(2)に示
すように、データサイズが小さくなる。 SIA*(4+6)+16[ビット] ・・・(2)
ATRAC data in which parameters are shared by the above processing has a smaller data size per channel, as shown in equation (2). SIA * (4 + 6) +16 [bits] (2)

【0063】ここで、式(2)中のSIAはサブインフ
ォメーション量を示す。例えば、本実施例において用い
ているATRAC方式の場合の上記SIAの最大値は5
2であるから、最高で536ビット、すなわち67バイ
トほどデータサイズが小さくなることになる。また、A
TRAC方式でのデータはパラメータが2重書きされて
おり、これも共通化できる。例えばパラメータ2重書き
領域サイズが26バイトならば、1サウンドフレームの
サイズは212バイトのうちの93バイトが共通化でき
るから、最高で約56%のサイズに圧縮できることを示
している。
Here, SIA in the equation (2) indicates the amount of sub information. For example, the maximum value of the SIA in the case of the ATRAC system used in this embodiment is 5
Since it is 2, the data size is reduced by a maximum of 536 bits, that is, 67 bytes. Also, A
In the data in the TRAC method, the parameters are double-written, which can be also used in common. For example, if the size of the parameter double writing area is 26 bytes, the size of one sound frame can be shared by 93 bytes out of 212 bytes, so that it can be compressed to a maximum size of about 56%.

【0064】なお、上述のようにパラメータを共通化す
ることにより、共通化しない場合に比べ量子化誤差が発
生する場合がある。しかし、通常、ATRAC方式での
データを可変長として用い、本実施例の符号化の方式と
同等サイズまで符号化データサイズを落とした場合に比
べ、本実施例の符号化の方式を用いた場合の方が量子化
誤差は少なく、したがって、本実施例の符号化の方式の
有効性が示される。
Note that, as described above, when the parameters are shared, a quantization error may occur as compared with the case where the parameters are not shared. However, in general, when the data of the ATRAC method is used as a variable length and the size of the coded data of the present embodiment is reduced to the same size as that of the coding system of the present embodiment, Has a smaller quantization error, and thus shows the effectiveness of the encoding method of this embodiment.

【0065】次に、本発明の他の実施例について述べ
る。例えば記録媒体の記録領域に余裕がある場合や、共
通化に起因する精度の低下による量子化雑音の発生が許
されない場合などには、全てのパラメータを共通化する
のではなく、一部のパラメータのみを共通化する手法が
可能である。すなわち、ブロックサイズモード、サブイ
ンフォメーション量、スケールファクタの3要素のみを
共通化する手法である。これにより、前述した実施例の
場合よりも記録媒体での必要記録領域は増えるものの、
前記ATRAC方式による場合よりも必要記録領域は少
なく、かつ量子化雑音の発生も抑制されるため、音質向
上に有効である。なお、ブロックサイズモード、サブイ
ンフォメーション量、ワードレングスの3つを共通化す
る方法は、ATRACフォーマットの特性により多少無
駄が多くなることがある。
Next, another embodiment of the present invention will be described. For example, if there is room in the recording area of the recording medium, or if it is not allowed to generate quantization noise due to a decrease in accuracy due to the commonization, instead of sharing all parameters, some parameters may be used. It is possible to use a method that makes only one common. In other words, this is a method in which only the three elements of the block size mode, the amount of sub information, and the scale factor are shared. Thereby, although the required recording area on the recording medium is increased as compared with the case of the above-described embodiment,
Since the required recording area is smaller than in the case of the ATRAC method and the generation of quantization noise is suppressed, it is effective for improving sound quality. It should be noted that the method of sharing the three of the block size mode, the amount of sub information, and the word length may be somewhat wasteful due to the characteristics of the ATRAC format.

【0066】その他にも、ブロックサイズモードやサブ
インフォメーション量の2要素を共通化する方法も考え
られる。なお、この2要素を共通化する方法ではサイズ
が2バイトであるため圧縮率の向上に関する効果は、上
記各実施例ほどではないが、ATRAC方式よりも良い
ことは言うまでもない。
In addition, a method of sharing two elements, that is, a block size mode and a sub information amount, is also conceivable. It should be noted that the method of sharing these two elements has a size of 2 bytes, so that the effect of improving the compression ratio is not as good as in the above embodiments, but it goes without saying that it is better than the ATRAC method.

【0067】さらに別の方法としては、符号化の帯域分
割の特性を利用して、低域、中域、高域のいずれか、あ
るいはそれらを組合せた帯域に対してのみ共通化する手
法がある。この場合、ブロックサイズモードの部分的共
通化や、サブインフォメーション量の整合が必要となる
が、これにより使用頻度の低い帯域は共通化するといっ
たデータ特性やチャネル特性を活用した符号化ができ、
効果的符号化が可能となる。
As still another method, there is a method of making use of the characteristics of the band division of coding to make the band common among only the low band, the middle band, the high band, or a band obtained by combining them. . In this case, it is necessary to partially share the block size mode and match the amount of sub-information, but this makes it possible to perform encoding using data characteristics and channel characteristics such as sharing a band that is not frequently used,
Effective coding becomes possible.

【0068】上述したように、本発明実施例の高能率符
号化装置によれば、マルチチャネルオーディオデータの
符号化において、ATRAC方式以上の高圧縮率を実現
できる。さらにチャネル数が多いほど、その効果が大き
くなる。また、本実施例装置での符号化されたデータは
パラメータを共通化しただけのATRAC方式のデータ
であり、かつ共通化処理が1サウンドフレーム内で完結
しているため、記録の際にまとめられたデータをチャネ
ル毎に分割する際に、1つの共通化パラメータを該当チ
ャネルに配分するだけで、既存の復号化装置での復号化
が可能となる。
As described above, according to the high-efficiency coding apparatus of the embodiment of the present invention, it is possible to realize a higher compression rate than the ATRAC method in coding multi-channel audio data. Further, as the number of channels increases, the effect increases. In addition, the encoded data in the apparatus of the present embodiment is ATRAC data in which only the parameters are shared, and the common processing is completed within one sound frame. When the divided data is divided for each channel, decoding can be performed by an existing decoding device only by allocating one common parameter to the corresponding channel.

【0069】[0069]

【発明の効果】上述したように、本発明においては、マ
ルチチャネルオーディオデータの符号化において、各チ
ャネルについて時間及び周波数の2次元領域のユニット
毎にスケールファクタを求め、スケールファクタに基づ
いて、スケールファクタを共通化する少なくとも2以上
のチャネルを選択し、選択されたチャネルのスケールフ
ァクタを共通化することにより、既存の圧縮符号化より
もさらなる高圧縮率を実現できる。さらにチャネル数が
多いほど、その効果が大きくなる。
As described above, according to the present invention, in the encoding of multi-channel audio data, a scale factor is determined for each unit of a two-dimensional region of time and frequency for each channel, and the scale factor is determined based on the scale factor. By selecting at least two or more channels having the same factor and sharing the scale factor of the selected channel, it is possible to achieve a higher compression ratio than existing compression coding. Further, as the number of channels increases, the effect increases.

【0070】また、本発明装置によって符号化したデー
タは、パラメータを共通化しただけの既存の圧縮符号化
方式のデータであり、かつ共通化処理も既存の圧縮符号
化方式の1フレーム内で完結しているため、記録の際に
まとめられたデータをチャネル毎に分割する際に、1つ
の共通化パラメータを該当チャネルに配分するだけで、
既存の復号化装置での復号化が可能となる。
The data encoded by the apparatus of the present invention is the data of the existing compression encoding system in which only the parameters are shared, and the common processing is completed within one frame of the existing compression encoding system. Therefore, when the data collected at the time of recording is divided for each channel, only one common parameter is allocated to the corresponding channel.
Decoding with an existing decoding device becomes possible.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例の高能率符号化装置に適用され
るATRAC方式の符号化を行う構成を示すブロック回
路図である。
FIG. 1 is a block circuit diagram showing a configuration for performing ATRAC coding applied to a high-efficiency coding apparatus according to an embodiment of the present invention.

【図2】サウンドフレーム内のディスクの記録の様子を
説明するための図である。
FIG. 2 is a diagram for explaining how a disc is recorded in a sound frame.

【図3】8チャネルのオーディオデータをATRAC方
式で符号化したデータの記録媒体における記録の様子を
示す図である。
FIG. 3 is a diagram illustrating a state of recording on a recording medium of data obtained by encoding 8-channel audio data by the ATRAC method;

【図4】8チャネルの符号化されたオーディオデータを
変更せずに1つのデータにまとめる処理を行う構成を示
すブロック回路図である。
FIG. 4 is a block circuit diagram showing a configuration for performing a process of collecting 8-channel encoded audio data into one data without changing it.

【図5】図1のブロックサイズモードの決定から再量子
化までの処理をより詳細な構成として示すブロック回路
図である。
5 is a block circuit diagram showing, as a more detailed configuration, processing from determination of a block size mode to requantization in FIG.

【図6】2チャネルのオーディオデータから共通化コス
トを求める具体的構成を示すブロック回路図である。
FIG. 6 is a block circuit diagram showing a specific configuration for obtaining a common cost from audio data of two channels.

【図7】2つのチャネルのオーディオデータのパラメー
タを共通化して再量子化する具体的構成を示すブロック
回路図である。
FIG. 7 is a block circuit diagram showing a specific configuration for commonizing parameters of audio data of two channels and requantizing them.

【図8】共通パラメータを利用して各チャネル毎に再量
子化する符号化処理の全体の構成を示すブロック回路図
である。
FIG. 8 is a block circuit diagram showing an overall configuration of an encoding process for requantizing each channel using a common parameter.

【図9】パラメータの共通化を行って符号化したデータ
を復号化する際の復号化装置の動作を説明するための図
である。
FIG. 9 is a diagram for explaining the operation of the decoding device when decoding data encoded by performing parameter sharing.

【符号の説明】[Explanation of symbols]

41〜48・・・符号器 49,52・・・マルチプレクサ 51・・・共通チャネル符号器 91,101a,101b・・・ブロックサイズモード
決定回路 93,103a,103b・・・スケールファクタ決定
回路 95・・・サブインフォメーション量決定回路 97,107・・・ワードレングス決定回路 98,108a,108b,406・・・再量子化器 102・・・同一チェック回路 104・・・共通化コスト計算回路 105・・・スケールファクタ共通化回路 106・・・共通サブインフォメーション量決定回路 401・・・帯域分割フィルタ 402L,402M,402H・・・MDCT回路 403・・・ブロックサイズ評価器 404L,404M,404H・・・正規化回路 405・・・ビット配分器 407・・・フォーマッタ
41 to 48 encoders 49, 52 multiplexer 51 common channel encoders 91, 101a, 101b block size mode determination circuit 93, 103a, 103b scale factor determination circuit 95 ..Sub-information amount determination circuits 97, 107 ... word length determination circuits 98, 108a, 108b, 406 ... requantizers 102 ... identical check circuits 104 ... common cost calculation circuits 105 ... · Scale factor common circuit 106 ··· Common sub-information amount determination circuit 401 ··· Band dividing filter 402L, 402M, 402H ··· MDCT circuit 403 ··· Block size evaluator 404L, 404M and 404H ··· Regular Circuit 405 ··· bit allocation device 407 ··· Omatta

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G11B 20/10 ──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 7 , DB name) H03M 7/30 G11B 20/10

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 複数チャネルのオーディオディジタル信
号を正規化して符号化し、符号化された信号とともに少
なくとも当該正規化のスケールファクタを含む符号化の
パラメータ情報を出力する高能率符号化装置において、 各チャネルについて時間及び周波数の2次元領域のユニ
ット毎にスケールファクタを求めるスケールファクタ計
算手段と、 上記スケールファクタに基づいて、上記スケールファク
タを共通化する少なくとも2以上のチャネルを選択する
共通化チャネル選択手段と、 上記共通化チャネル選択手段の出力に基づいて、選択さ
れたチャネルの上記スケールファクタを共通化するスケ
ールファクタ共通化手段と を備えることを特徴とする高
能率符号化装置。
1. A digital audio signal of a plurality of channels.
The signal is normalized and encoded, and a small
At least the encoding including the normalization scale factor
In a high-efficiency encoding device that outputs parameter information, a unit of a two-dimensional region of time and frequency for each channel is used.
Scale factor meter that calculates the scale factor for each unit
Calculation means and the scale factor based on the scale factor.
Select at least two or more channels that share data
The selected channel is selected based on the output of the common channel selecting means and the output of the common channel selecting means.
Scale to make the above scale factors common for
High, characterized in that it comprises a Rufakuta sharing means
Efficiency coding device.
【請求項2】 上記共通化チャネル選択手段は、2チャ
ネルのスケールファクタに関する所定の評価関数を、既
に選択されたチャネルを含む全チャネルの組み合わせに
適用することによって共通化するチャネルを選択するこ
を特徴とする請求項1記載の高能率符号化装置。
2. The method according to claim 1, wherein the common channel selecting means comprises two channels.
The predetermined evaluation function for the scale factor of the
Combination of all channels including the channel selected in
Select channels to be shared by applying
2. The high-efficiency encoding apparatus according to claim 1, wherein:
【請求項3】 上記共通化チャネル選択手段で選択され
たチャネルについて、スケールファクタ以外の上記パラ
メータ情報の一部又は全部をも共通化するパラメータ情
報共通化手段を備えること を特徴とする請求項1記載の
高能率符号化装置。
3. The method according to claim 1, wherein said selection is made by said common channel selection means.
Parameters other than the scale factor
Parameter information that shares part or all of the meter information
2. The method according to claim 1, further comprising:
High efficiency coding device.
【請求項4】 上記スケールファクタ共通化手段は、各
チャネルのオーディオディジタル信号を複数帯域に分割
した帯域毎に上記パラメータ情報の共通化を行うことを
特徴とする請求項記載の高能率符号化装置。
Wherein said scale factor sharing means for high efficiency coding according to claim 1, characterized in that the sharing of the parameter information for each band obtained by dividing the audio digital signals of the channels in a multiband apparatus.
JP26725193A 1993-10-26 1993-10-26 High efficiency coding device Expired - Fee Related JP3227942B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26725193A JP3227942B2 (en) 1993-10-26 1993-10-26 High efficiency coding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26725193A JP3227942B2 (en) 1993-10-26 1993-10-26 High efficiency coding device

Publications (2)

Publication Number Publication Date
JPH07123008A JPH07123008A (en) 1995-05-12
JP3227942B2 true JP3227942B2 (en) 2001-11-12

Family

ID=17442239

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26725193A Expired - Fee Related JP3227942B2 (en) 1993-10-26 1993-10-26 High efficiency coding device

Country Status (1)

Country Link
JP (1) JP3227942B2 (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US8204261B2 (en) 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
EP1817767B1 (en) 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7761304B2 (en) 2004-11-30 2010-07-20 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio

Also Published As

Publication number Publication date
JPH07123008A (en) 1995-05-12

Similar Documents

Publication Publication Date Title
JP3277679B2 (en) High efficiency coding method, high efficiency coding apparatus, high efficiency decoding method, and high efficiency decoding apparatus
JP3404837B2 (en) Multi-layer coding device
EP0650262B1 (en) Perceptual multi-channel audio coding with adaptive bit allocation
KR100261254B1 (en) Scalable audio data encoding/decoding method and apparatus
JP3278900B2 (en) Data encoding apparatus and method
JP3277692B2 (en) Information encoding method, information decoding method, and information recording medium
JP3397001B2 (en) Encoding method and apparatus, decoding apparatus, and recording medium
JPH08190764A (en) Method and device for processing digital signal and recording medium
WO1995002925A1 (en) High-efficiency encoding method, high-efficiency decoding method, high-efficiency encoding device, high-efficiency decoding device, high-efficiency encoding/decoding system and recording media
JP3250376B2 (en) Information encoding method and apparatus, and information decoding method and apparatus
JP3227942B2 (en) High efficiency coding device
US7835915B2 (en) Scalable stereo audio coding/decoding method and apparatus
JP3528260B2 (en) Encoding device and method, and decoding device and method
JP2852862B2 (en) Method and apparatus for converting PCM audio signal
WO1995016263A1 (en) Information processing method, information processing device and media
JPH09102742A (en) Encoding method and device, decoding method and device and recording medium
JP3341448B2 (en) Efficient encoding method for multi-channel audio data
JPH08123488A (en) High-efficiency encoding method, high-efficiency code recording method, high-efficiency code transmitting method, high-efficiency encoding device, and high-efficiency code decoding method
JP3362476B2 (en) High efficiency coding device and interface device
JP3227948B2 (en) Decryption device
JP3227945B2 (en) Encoding device
JPH07336231A (en) Method and device for coding signal, method and device for decoding signal and recording medium
JPH07161142A (en) Recording method, recording medium and reproducing method
JPH07181996A (en) Information processing method, information processor and media
Stautner High quality audio compression for broadcast and computer applications

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010807

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080907

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090907

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090907

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100907

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110907

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120907

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees