JPH07121194A - High efficiency encoding device and interface device - Google Patents
High efficiency encoding device and interface deviceInfo
- Publication number
- JPH07121194A JPH07121194A JP5265138A JP26513893A JPH07121194A JP H07121194 A JPH07121194 A JP H07121194A JP 5265138 A JP5265138 A JP 5265138A JP 26513893 A JP26513893 A JP 26513893A JP H07121194 A JPH07121194 A JP H07121194A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- circuit
- data
- band
- compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、例えば、映画フィルム
映写システム、ビデオテープレコーダ、ビデオディスク
プレーヤ等のステレオや、いわゆるマルチサラウンド音
響システムにおいて用いられるマルチチャネルのディジ
タル信号を圧縮符号化する高能率符号化装置及び、マル
チチャネルのディジタル信号と既存のディジタルインタ
フェースとの互換を確保するためのインタフェース装置
に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a high efficiency for compressing and encoding a multi-channel digital signal used in, for example, a stereo such as a motion picture film projection system, a video tape recorder, a video disc player or a so-called multi surround sound system. The present invention relates to an encoding device and an interface device for ensuring compatibility between a multi-channel digital signal and an existing digital interface.
【0002】[0002]
【従来の技術】オーディオ或いは音声等の信号の高能率
符号化の手法及び装置には種々あるが、例えば、時間領
域のオーディオ信号等を単位時間毎にブロック化してこ
のブロック毎の時間軸の信号を周波数軸上の信号に変換
(直交変換)して複数の周波数帯域に分割し、各帯域毎
に符号化するブロック化周波数帯域分割方式、いわゆる
変換符号化(トランスフォームコーティング)や、時間
領域のオーディオ信号等を単位時間毎にブロック化しな
いで、複数の周波数帯域に分割して符号化する非ブロッ
ク化周波数帯域分割方式である帯域分割符号化(サブバ
ンドコーディング:SBC)等を挙げることができる。
また、上述の帯域分割符号化と変換符号化とを組み合わ
せた高能率符号化の手法及び装置も考えられており、こ
の場合には、例えば、上記帯域分割符号化で帯域分割を
行った後、該各帯域毎の信号を周波数領域の信号に直交
変換し、この直交変換された各帯域毎に符号化が施され
る。2. Description of the Related Art There are various techniques and devices for high-efficiency coding of audio or voice signals. For example, a time domain audio signal is divided into blocks for each unit time, and a signal on the time axis of each block is used. Is converted into a signal on the frequency axis (orthogonal conversion), divided into multiple frequency bands, and coded for each band. A so-called transform coding (transform coating) or time domain An example is band division coding (subband coding: SBC), which is a non-blocking frequency band division method in which an audio signal or the like is not divided into blocks for each unit time and is divided into a plurality of frequency bands for encoding. .
Further, a method and a device for high efficiency coding in which the above band division coding and transform coding are combined are also considered, and in this case, for example, after performing band division by the band division coding, The signal in each band is orthogonally transformed into a signal in the frequency domain, and each orthogonally transformed band is encoded.
【0003】ここで、上述した帯域分割符号化の帯域分
割用フィルタとしては、例えばQMF等のフィルタがあ
り、これは1976 R.E.Crochiere Digital coding of sp
eechin subbands Bell Syst.Tech. J. Vol.55, No.8 1
976に、述べられている。また、ICASSP 83, BOSTON Po
lyphase Quadrature filters-A new subband codingtec
hnique Joseph H. Rothweiler には等バンド幅のフィル
タ分割手法及び装置が述べられている。Here, as a band division filter for the above-mentioned band division encoding, there is a filter such as QMF, which is a 1976 RECrochiere Digital coding of sp.
eechin subbands Bell Syst.Tech. J. Vol.55, No.8 1
976. Also, ICASSP 83, BOSTON Po
lyphase Quadrature filters-A new subband codingtec
hnique Joseph H. Rothweiler describes an equal bandwidth filter partitioning method and apparatus.
【0004】また、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、該ブロック毎に高速フーリエ変換(FF
T)、コサイン変換(DCT)、モディファイドDCT
変換(MDCT)などを行うことで時間軸を周波数軸に
変換するような直交変換がある。このMDCTについて
は、ICASSP 1987 Subband/Transform Coding Using Fil
ter Bank Designs Basedon Time Domain Aliasing Canc
ellation J.P.Princen A.B.Bradley Univ. ofSurrey R
oyal Melbourne Inst.of Tech.に述べられている。As the above-mentioned orthogonal transform, for example, the input audio signal is divided into blocks in a predetermined unit time (frame), and fast Fourier transform (FF) is performed for each block.
T), cosine transform (DCT), modified DCT
There is an orthogonal transformation in which the time axis is transformed into the frequency axis by performing transformation (MDCT) or the like. About this MDCT, ICASSP 1987 Subband / Transform Coding Using Fil
ter Bank Designs Basedon Time Domain Aliasing Canc
ellation JPPrincen ABBradley Univ. of Surrey R
oyal Melbourne Inst. of Tech.
【0005】更に、周波数帯域分割された各周波数成分
を量子化する場合の周波数分割幅としては、例えば人間
の聴覚特性を考慮した帯域分割がある。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
程帯域幅が広くなるような帯域幅で、オーディオ信号を
複数(例えば25バント)の帯域に分割することがあ
る。また、この時の各帯域毎のデータを符号化する際に
は、各帯域毎に所定のビット配分或いは、各帯域毎に適
応的なビット配分による符号化が行われる。例えば、上
記MDCT処理されて得られた係数データを上記ビット
配分によって符号化する際には、上記各ブロック毎のM
DCT処理により得られる各帯域毎のMDCT係数デー
タに対して、適応的な配分ビット数で符号化が行われる
ことになる。Further, as a frequency division width in the case of quantizing each frequency component divided into frequency bands, for example, there is a band division considering human auditory characteristics. That is, an audio signal may be divided into a plurality of bands (for example, 25 band) with a bandwidth that is generally called a critical band and has a wider bandwidth in a higher band. Further, at the time of encoding the data for each band at this time, encoding is performed by predetermined bit allocation for each band or adaptive bit allocation for each band. For example, when the coefficient data obtained by the MDCT processing is encoded by the bit allocation, M for each block is
The MDCT coefficient data for each band obtained by the DCT process is encoded with an adaptive distribution bit number.
【0006】上記ビット配分手法及びそのための装置と
しては、次の2手法及び装置が知られている。IEEE Tra
nsactions of Accoustics,Speech,and Signal Processi
ng,vol.ASSP-25,No.4,August 1977 では、各帯域毎の信
号の大きさをもとに、ビット配分を行っている。また、
ICASSP 1980 The critical band coder--digital encod
ing ofthe perceptual requirements of the auditory
system M.A. Kransner MIT では、聴覚マスキングを利
用することで、各帯域毎に必要な信号対雑音比を得て固
定的なビット配分を行う手法及び装置が述べられてい
る。The following two methods and apparatuses are known as the above-mentioned bit allocation method and an apparatus therefor. IEEE Tra
nsactions of Accoustics, Speech, and Signal Processi
In ng, vol.ASSP-25, No.4, August 1977, bit allocation is performed based on the signal size of each band. Also,
ICASSP 1980 The critical band coder--digital encod
ing of the perceptual requirements of the auditory
system MA Kransner MIT describes a method and apparatus that uses auditory masking to obtain a required signal-to-noise ratio for each band and perform fixed bit allocation.
【0007】[0007]
【発明が解決しようとする課題】ここで、例えば上述し
たようなサブバンドコーディング等を用いたオーディオ
信号の高能率圧縮符号化方式においては、人間の聴覚上
の特性を利用し、オーディオデータを約1/5に圧縮す
るような方式が既に実用化されている。なお、このオー
ディオデータを約1/5に圧縮する方式としては、例え
ばいわゆるATRAC(Adaptive TRansform Acoustic
Coding) と呼ばれる方式が存在する。Here, in a high-efficiency compression coding system for audio signals using, for example, the above-mentioned sub-band coding, the audio data is approximated by utilizing human auditory characteristics. A method of compressing to 1/5 has already been put into practical use. As a method of compressing this audio data to about 1/5, for example, so-called ATRAC (Adaptive TRansform Acoustic) is used.
There is a method called Coding).
【0008】しかし、上記人間の聴覚上の特性を利用し
た高能率符号化方式では、圧縮符号化してその後復号化
して得られる楽器や人間の声などが、原音から変化して
しまうといった事例も見られ、特に原音の忠実な再現が
必要な記録メディアの記録フォーマットに用いる場合に
は、その高音質化は必須である。However, in the high-efficiency coding method utilizing the auditory characteristics of human beings, there are some cases in which the musical instrument or human voice obtained by compression coding and then decoding changes from the original sound. In particular, when used in a recording format of a recording medium that requires faithful reproduction of the original sound, it is essential to improve the sound quality.
【0009】これに対し、現在、上記オーディオ信号を
約1/5に圧縮するような高能率符号化方式(例えばA
TRAC方式)のフォーマットは、既に確立していて、
このフォーマットが採用されたハードウェアも広まりつ
つある。したがって、当該フォーマットの変更や拡張に
は、大きな労力が必要となる。このため、フォーマット
は変更せずに、エンコードやデコードの際に工夫するこ
とによる高音質化の達成が望まれている。なお、当該高
音質化の方法としては、例えばリニアPCM音声を混在
させることが考えられる。しかし、上記高能率符号化方
式の圧縮データとリニアデータとでは、フレームの長さ
や1フレーム当たりの時間長が異なるため、再生時に同
期を取ることが難しく、これら2つのフォーマットのデ
ータを同時に用いることは非常に困難である。On the other hand, at present, a high-efficiency coding method (for example, A
The TRAC format) has already been established,
Hardware adopting this format is also spreading. Therefore, a large amount of labor is required to change or expand the format. Therefore, it is desired to achieve high sound quality by modifying the encoding and decoding without changing the format. As a method of improving the sound quality, it is possible to mix linear PCM audio, for example. However, since the frame length and the time length per frame are different between the compressed data of the high-efficiency encoding method and the linear data, it is difficult to synchronize them at the time of reproduction, and the data of these two formats are used at the same time. Is very difficult.
【0010】さらに、通常のオーディオ機器の場合のみ
ならず、例えば映画フィルム映写システム、ビデオテー
プレコーダ、ビデオディスクプレーヤ等のステレオない
しはマルチサラウンド音響システムのような複数チャネ
ルのオーディオ或いは音声信号を扱う場合においても、
ビットレートを削減する高能率符号化を行うことが望ま
れている。Further, not only in the case of ordinary audio equipment, but also in the case of handling audio or voice signals of a plurality of channels such as a movie film projection system, a video tape recorder, a stereo or multi-surround audio system such as a video disc player. Also,
It is desired to perform high efficiency coding that reduces the bit rate.
【0011】特に、上記映画フィルムに対して例えばレ
フトチャネル,レフトセンターチャネル,センターチャ
ネル,ライトセンターチャネル,ライトチャネル,サラ
ウンドレフトチャネル,サラウンドライトチャネル,サ
ブウーファーチャネルの8チャネルのディジタルオーデ
ィオ信号を記録するような場合においては、上記ビット
レートを削減する高能率符号化が必要となる。すなわ
ち、例えばいわゆるCD(コンパクトディスク)などで
用いているようなサンプリング周波数44.1kHzで
16ビットの直線量子化されたオーディオデータの上記
8チャネル分をも記録できる領域は、上記映画フィルム
上に確保することが困難であり、したがって、当該オー
ディオデータの圧縮が必要になる。Particularly, for example, eight channels of digital audio signals of a left channel, a left center channel, a center channel, a right center channel, a right channel, a surround left channel, a surround right channel and a subwoofer channel are recorded on the above-mentioned motion picture film. In such a case, high-efficiency coding that reduces the bit rate is required. That is, a region capable of recording even the above 8 channels of 16-bit linearly quantized audio data at a sampling frequency of 44.1 kHz as used in so-called CD (compact disc) is secured on the motion picture film. It is difficult to do so, therefore, compression of the audio data is required.
【0012】なお、上記映画フィルムに記録する上記8
チャネルの各チャネルは、例えば当該映画フィルムの画
像記録領域から再生された画像が映写機によって投影さ
れるスクリーン側に配置されたレフトスピーカ、レフト
センタースピーカ、センタスピーカ、ライトセンタスピ
ーカ、ライトスピーカ、サラウンドレフトスピーカ、サ
ラウンドライトスピーカ、サブウーファースピーカとそ
れぞれ対応するものである。ここで、上記センタスピー
カは、スクリーン側の中央に配置され、センタチャネル
のオーディオデータによる再生音を出力するもので例え
ば俳優のせりふ等の最も重要な再生音を出力する。上記
サブウーファースピーカは、サブウーファーチャネルの
オーディオデータによる再生音を出力するもので、例え
ば爆発音などの低域の音というよりは振動として感じら
れる音を効果的に出力するものであり、爆発シーンなど
に効果的に使用されることが多いものである。上記レフ
トスピーカ及びライトスピーカは、上記スクリーンの左
右に配置され、レフトチャネルのオーディオデータによ
る再生音とライトチャネルのオーディオデータによる再
生音を出力するもので、ステレオ音響効果を発揮する。
上記レフトセンタスピーカは上記レフトスピーカとセン
タスピーカとの間に配置され、また上記ライトセンタス
ピーカは上記センタスピーカとライトスピーカとの間に
配置されるものである。上記レフトセンタスピーカはレ
フトセンタチャネルのオーディオデータによる再生音を
出力し、上記ライトセンタスピーカはライトセンタチャ
ネルのオーディオデータによる再生音を出力するもの
で、それぞれ上記レフトスピーカ若しくはライトスピー
カの補助的な役割を果たす。特にスクリーンが大きく収
容人数の多い映画館等では、座席の位置によって音像の
定位が不安定になりやすいが、上記レフトセンタスピー
カとライトセンタスピーカを付加することにより、音像
のよりリアルな定位を作り出すのに効果を発揮する。さ
らに、上記サラウンドレフトスピーカとサラウンドライ
トスピーカは、観客席を取り囲むように配置され、サラ
ウンドレフトチャネルのオーディオデータによる再生音
とサラウンドライトチャネルのオーディオデータによる
再生音を出力するもので、残響音や拍手、歓声に包まれ
た印象を与える効果がある。これにより、より立体的な
音像を作り出すことができる。The above 8 recorded on the motion picture film
Each of the channels is, for example, a left speaker, a left center speaker, a center speaker, a right center speaker, a right speaker, a surround left speaker arranged on the screen side on which the image reproduced from the image recording area of the movie film is projected by the projector. It corresponds to a speaker, a surround light speaker, and a subwoofer speaker, respectively. Here, the center speaker is arranged in the center of the screen side, and outputs a reproduced sound based on the audio data of the center channel, and outputs the most important reproduced sound such as an actor's dialogue. The subwoofer speaker outputs a reproduced sound based on audio data of the subwoofer channel and effectively outputs a sound felt as vibration rather than a low frequency sound such as an explosion sound. It is often used effectively for such purposes. The left speaker and the right speaker are arranged on the left and right of the screen, and output a reproduced sound by the left channel audio data and a reproduced sound by the right channel audio data, and exhibit a stereo sound effect.
The left center speaker is arranged between the left speaker and the center speaker, and the right center speaker is arranged between the center speaker and the right speaker. The left center speaker outputs a reproduced sound based on the audio data of the left center channel, and the right center speaker outputs a reproduced sound based on the audio data of the right center channel. Each of the left center speaker and the right speaker plays an auxiliary role. Fulfill. Especially in a movie theater with a large screen and a large number of seats, the localization of the sound image tends to be unstable depending on the position of the seat, but by adding the above left center speaker and right center speaker, a more realistic localization of the sound image is created. Exert an effect on. Further, the above-mentioned surround left speaker and surround right speaker are arranged so as to surround the spectators' seats, and output the reproduced sound by the audio data of the surround left channel and the reproduced sound by the audio data of the surround right channel. , It has the effect of giving a cheerful impression. As a result, a more stereoscopic sound image can be created.
【0013】また、フィルムという媒体は、表面に傷な
どが発生しやすいため、ディジタルデータをオリジナル
のまま記録していたのでは、データ欠けが激しく実用に
ならない。このため、エラー訂正符号の能力が非常に重
要になり、上記データ圧縮は、その訂正符号も含めて上
記フィルム上の記録領域に記録可能な程度まで行う必要
がある。Further, since the surface of the medium called film is apt to be scratched, if the digital data is recorded as it is, the data will be seriously lost and it will not be put to practical use. For this reason, the capability of the error correction code becomes very important, and the data compression must be performed to the extent that it can be recorded in the recording area on the film including the correction code.
【0014】このようなことから、上記8チャネルのデ
ィジタルオーディオデータを圧縮する圧縮方法として
は、上述したような人間の聴覚の特性を考慮して最適な
ビット割り当てを行うことによって、例えばいわゆるC
D(コンパクトディスク)などに記録されるようなサン
プリング周波数44.1kHzで16ビットのディジタ
ルオーディオデータを約1/5に圧縮しながらも、CD
並の音質を達成する前記高能率符号化方式(いわゆるA
TRAC方式など)を適用するようにしている。From the above, as a compression method for compressing the 8-channel digital audio data, the optimum bit allocation is performed in consideration of the characteristics of human auditory sense as described above.
While compressing 16-bit digital audio data at a sampling frequency of 44.1 kHz such as that recorded on a D (compact disc) to about 1/5, a CD
The high efficiency encoding method (so-called A
The TRAC method, etc.) is applied.
【0015】しかし、当該高能率符号化方式では、前述
同様に一般の楽器や人間の声などが原音からわずかなが
ら変化するため、特に上記映画フィルムのように原音の
忠実な再現が必要とされるメディアの記録フォーマット
として採用する場合には、何らかの高音質化の手段が必
要となってくる。そして、これは上記映画フィルムへの
マルチチャネル記録フォーマットとして、上記高能率符
号化方式以外を用いたとしても、記録領域確保の点から
非可逆圧縮を採用しなければならない以上、常に付きま
とう問題である。However, in the high-efficiency coding system, since the general musical instrument and the human voice slightly change from the original sound as described above, it is necessary to faithfully reproduce the original sound as in the above movie film. When it is adopted as a recording format of a medium, some means for improving the sound quality is needed. This is a problem that always accompanies the lossy compression from the viewpoint of securing the recording area even if a multi-channel recording format for the motion picture film other than the high efficiency encoding method is used. .
【0016】ところで、近年は、オーディオ機器等のデ
ィジタル化が進み、業務用ばかりでなく民生用にもディ
ジタル化された機器が普及しているが、特に業務用にお
いては、ディジタルオーディオでのマルチチャネル化が
進んでおり、例えば前記8チャネルのディジタルオーデ
ィオを扱う機器も既に使用されている。また、このディ
ジタルオーディオにおけるマルチチャネル化は、民生用
へも広がりつつある。このため、例えば直線量子化した
ディジタルオーディオサンプルを扱う各種既存のディジ
タルオーディオインタフェースと、上記マルチチャネル
のオーディオデータとのフォーマットの互換を確保する
必要がでてきている。さらに同様に、上記既存のディジ
タルオーディオインタフェースと、上記映画フィルム等
に用いられるマルチチャネルの圧縮符号化されたオーデ
ィオデータとのフォーマットの互換を確保することも必
要となっている。By the way, in recent years, the digitization of audio equipment has progressed, and the digitized equipment has become widespread not only for commercial use but also for consumer use. Especially, for commercial use, multi-channel digital audio is used. This is becoming more common, and for example, equipment that handles the 8-channel digital audio is already in use. Also, the multi-channelization of this digital audio is spreading to consumer use. For this reason, it is necessary to ensure the format compatibility between the various existing digital audio interfaces that handle linearly quantized digital audio samples and the multi-channel audio data. Similarly, it is also necessary to ensure format compatibility between the existing digital audio interface and the multi-channel compression-encoded audio data used in the movie film or the like.
【0017】しかし、従来の既存のディジタルオーディ
オインタフェースの例えばEIAJ(日本電子機械工業
会) CP−1201においては、モノラル又はステレ
オ音声信号を伝送,記録することを目的としており、3
チャネル以上のマルチチャネルに対する拡張性がない。
したがって、上述したような圧縮符号化されたものも含
むマルチチャネルディジタルオーディオ信号を、当該伝
送,記録するには、新たなフォーマットを設定する必要
がある。すなわちこれは既存フォーマットとの互換が取
れていないことを意味する。このように、既存のフォー
マットとの間で互換が取れていないことは、例えば、上
記マルチチャネルのディジタルオーディオを民生用の既
存の機器や記録メディアへ展開する際の妨げとなる。こ
のことから、既存のディジタルインタフェースと上記圧
縮符号化されたものも含むマルチチャネルオーディオと
の互換がとれるようになることが望まれる。However, the conventional existing digital audio interface, for example, EIAJ (Japan Electronic Machinery Manufacturers Association) CP-1201, aims at transmitting and recording a monaural or stereo audio signal.
There is no scalability for more than one channel.
Therefore, it is necessary to set a new format in order to transmit and record the multi-channel digital audio signal including the compression-coded one as described above. That is, this means that it is not compatible with existing formats. Such incompatibility with the existing format hinders, for example, the development of the above-mentioned multi-channel digital audio into existing consumer devices and recording media. From this fact, it is desired that the existing digital interface and the multi-channel audio including the above compression-coded one are compatible.
【0018】そこで、本発明は、既存のフォーマットを
変更することなく、マルチチャネルのディジタルオーデ
ィオ信号の高音質化を可能とする高能率符号化装置と、
簡易な構成を付加するだけで現行ディジタルオーディオ
インタフェースとマルチチャネルオーディオとの互換を
確保可能なフォーマット変換装置を提供することを目的
とするものである。Therefore, the present invention provides a high-efficiency coding apparatus capable of improving the sound quality of a multi-channel digital audio signal without changing the existing format.
It is an object of the present invention to provide a format conversion device capable of ensuring compatibility between a current digital audio interface and multi-channel audio simply by adding a simple structure.
【0019】[0019]
【課題を解決するための手段】本発明の高能率符号化装
置は、上述の目的を達成するために提案されたものであ
り、複数のチャネルの各ディジタル信号をそれぞれ所定
の割当ビット数を用いて圧縮符号化する複数の圧縮符号
化手段と、複数のチャネルのうち冗長なディジタル信号
を含むチャネルがあるとき当該冗長なディジタル信号を
含む少なくとも1つのチャネルを冗長チャネルとして決
定する冗長チャネル決定手段と、上記冗長チャネルが決
定されたとき上記複数のチャネルから上記冗長チャネル
を除く少なくとも1つのチャネルを優先チャネルとして
決定する優先チャネル決定手段とを有し、上記優先チャ
ネルのディジタル信号の圧縮符号化は、当該優先チャネ
ルに対応する上記所定の割当ビット数及び上記冗長チャ
ネルに対応する上記所定の割当ビット数を用いて行うよ
うにしたものである。The high-efficiency coding apparatus of the present invention has been proposed to achieve the above-mentioned object, and uses a predetermined number of allocated bits for each digital signal of a plurality of channels. A plurality of compression-encoding means for compression-encoding, and a redundant channel determination means for determining at least one channel including the redundant digital signal as a redundant channel when there is a channel including the redundant digital signal among the plurality of channels. , A priority channel determining means for determining at least one channel excluding the redundant channel from the plurality of channels as a priority channel when the redundant channel is determined, the compression coding of the digital signal of the priority channel is performed. On the predetermined number of allocated bits corresponding to the priority channel and on the redundant channel It is obtained to perform using a predetermined number of allocated bits.
【0020】ここで、上記圧縮符号化手段は、各チャネ
ルのディジタル信号をそれぞれ複数の周波数帯域に分割
し、各チャネル毎にディジタル信号の特性を求め、当該
ディジタル信号の特性に応じて各チャネルの上記割当ビ
ット数を各帯域毎に分配して上記圧縮符号化を行う。上
記優先チャネル決定手段は上記優先チャネルのディジタ
ル信号を複数の周波数帯域に分割する分割手段を備え、
この分割手段の出力を上記優先チャネルに対応する圧縮
符号化手段及び冗長チャネルに対応する圧縮符号化手段
に送る。また、上記冗長チャネル決定手段には上記冗長
チャネルのディジタル信号を削除する削除手段を設け、
当該削除手段により上記冗長チャネルのディジタル信号
を圧縮符号化前に削除する。Here, the compression coding means divides the digital signal of each channel into a plurality of frequency bands, obtains the characteristic of the digital signal for each channel, and determines the characteristic of each channel according to the characteristic of the digital signal. The compression coding is performed by distributing the allocated number of bits for each band. The priority channel determining means comprises a dividing means for dividing the digital signal of the priority channel into a plurality of frequency bands,
The output of the dividing means is sent to the compression coding means corresponding to the priority channel and the compression coding means corresponding to the redundant channel. The redundant channel determining means is provided with deleting means for deleting the digital signal of the redundant channel,
The deleting means deletes the digital signal of the redundant channel before compression coding.
【0021】次に、本発明の高能率符号化装置に対応す
る高能率復号化装置は、それぞれ所定の圧縮符号化処理
が施された複数のチャネルの各ディジタル信号をそれぞ
れ伸張復号化する複数の伸張復号化手段と、上記複数の
チャネルのうち優先チャネルのディジタル信号と同一起
源のディジタル信号を含むチャネルがあるときには、当
該同一起源のディジタル信号を上記優先チャネルのディ
ジタル信号に合成する合成手段とを有するものである。Next, the high-efficiency decoding apparatus corresponding to the high-efficiency encoding apparatus of the present invention expands and decodes the respective digital signals of the plurality of channels which are respectively subjected to the predetermined compression coding processing. Decompression / decoding means and, when there is a channel including a digital signal of the same origin as the digital signal of the priority channel among the plurality of channels, a synthesizing means for synthesizing the digital signal of the same origin into the digital signal of the priority channel. I have.
【0022】ここで、上記合成手段は上記優先チャネル
のディジタル信号と上記同一起源のディジタル信号を周
波数合成する。また、上記同一起源のディジタル信号を
上記優先チャネルのディジタル信号に合成したときに
は、上記同一起源のディジタル信号を有していたチャネ
ルのディジタル信号として所定のディジタル信号を生成
するディジタル信号生成手段を設ける。Here, the synthesizing means frequency-synthesizes the digital signal of the priority channel and the digital signal of the same origin. Further, when the digital signal of the same origin is combined with the digital signal of the priority channel, a digital signal generating means for generating a predetermined digital signal as a digital signal of the channel having the digital signal of the same origin is provided.
【0023】さらに、本発明のインタフェース装置は、
所定の信号処理(例えば直線量子化処理)が施されたデ
ィジタルデータのデータ領域とそれ以外の情報領域とを
少なくとも有するフォーマットの当該データ領域に所定
の圧縮符号化処理を施した複数のチャネルのディジタル
信号を挿入、及び/又は、所定の信号処理(例えば直線
量子化処理)が施されたディジタルデータのデータ領域
とそれ以外の情報領域とを少なくとも有するフォーマッ
トの信号の当該データ領域に挿入された所定の圧縮符号
化処理が施された複数のチャネルのディジタル信号を各
チャネル毎に分離するフォーマット変換手段を具備して
なるものである。Further, the interface device of the present invention is
Digital data of a plurality of channels in which a predetermined compression coding process is applied to a data area of a format having at least a data area of digital data subjected to predetermined signal processing (for example, linear quantization processing) and an information area other than the data area. A predetermined signal inserted and / or inserted into the data area of a signal having a format having at least a data area of digital data that has been subjected to predetermined signal processing (for example, linear quantization processing) and an information area other than that. The format conversion means for separating the digital signals of the plurality of channels, which have been subjected to the compression encoding processing, from each channel.
【0024】[0024]
【作用】本発明の高能率符号化装置によれば、複数のチ
ャネルのうち冗長なディジタル信号を含む冗長チャネル
があるときにはこの冗長チャネルのディジタル信号を削
除し、冗長チャネルのディジタル信号の圧縮符号化に用
いるはずであった割当ビット数を、高品質の圧縮符号化
を行いたい優先チャネルのディジタル信号の圧縮符号化
に使用するようにしている。According to the high efficiency coding apparatus of the present invention, when there is a redundant channel containing a redundant digital signal among a plurality of channels, the digital signal of the redundant channel is deleted and compression coding of the digital signal of the redundant channel is performed. The number of allocated bits, which should have been used for the above, is used for compression coding of the digital signal of the priority channel for which high quality compression coding is desired.
【0025】また、本発明のインタフェース装置によれ
ば、所定の信号処理が施されたディジタルデータのデー
タ領域とそれ以外の情報領域とを少なくとも有する既存
のフォーマットの当該データ領域に所定の圧縮符号化処
理を施した複数のチャネルのディジタル信号を挿入、及
び/又は、既存のフォーマットのデータ領域に挿入され
た所定の圧縮符号化処理が施された複数のチャネルのデ
ィジタル信号を各チャネル毎に分離することで、既存の
フォーマットとの互換性を確保している。Further, according to the interface device of the present invention, predetermined compression encoding is performed on the data area of the existing format having at least the data area of the digital data subjected to the predetermined signal processing and the information area other than the digital data. The processed digital signals of the plurality of channels are inserted and / or the digital signals of the plurality of channels, which are inserted into the data area of the existing format and are subjected to the predetermined compression encoding processing, are separated for each channel. This ensures compatibility with existing formats.
【0026】[0026]
【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。Embodiments of the present invention will be described below with reference to the drawings.
【0027】本発明実施例の高能率符号化装置は、図1
に示すように、複数チャネルCH1〜CHnの各ディジ
タル信号をそれぞれ所定の割当ビット数を用いて圧縮符
号化する複数の圧縮符号化回路521 〜52n と、複数
チャネルCH1〜CHnのうち冗長なディジタル信号を
含むチャネル(図1の例ではチャネルCH2)があると
き当該冗長なディジタル信号を含む少なくとも1つのチ
ャネルを冗長チャネルとして決定する冗長チャネル決定
手段と、上記冗長チャネルが決定されたとき上記複数の
チャネルCH1〜CHnから上記冗長チャネルCH2を
除く少なくとも1つのチャネル(図1の例ではチャネル
CH1)を優先チャネルとして決定する優先チャネル決
定手段とを有し、上記優先チャネルCH1のディジタル
信号の圧縮符号化は、当該優先チャネルCH1に対応す
る上記所定の割当ビット数及び上記冗長チャネルCH2
に対応する上記所定の割当ビット数を用いて行うように
したものである。The high efficiency coding apparatus according to the embodiment of the present invention is shown in FIG.
As shown in FIG. 5, a plurality of compression coding circuits 52 1 to 52 n for compressing and coding each digital signal of the plurality of channels CH1 to CHn using a predetermined allocation bit number, and redundant channels of the plurality of channels CH1 to CHn. Redundant channel determining means for determining at least one channel including the redundant digital signal as a redundant channel when there is a channel including the digital signal (channel CH2 in the example of FIG. 1), and a plurality of the plurality of channels when the redundant channel is determined. Channel CH1 to CHn of at least one channel (channel CH1 in the example of FIG. 1) excluding the redundant channel CH2 as a priority channel, and a compression code of the digital signal of the priority channel CH1. The above-mentioned predetermined allocation corresponding to the priority channel CH1 Wattage and the redundant channel CH2
Is performed by using the predetermined number of allocated bits corresponding to.
【0028】ここで、上記圧縮符号化回路521 〜52
n は、後述するように、各チャネルCH1〜CHnのデ
ィジタル信号をそれぞれ複数の周波数帯域に分割し、各
チャネルCH1〜CHn毎にディジタル信号の特性を求
め、当該ディジタル信号の特性に応じて各チャネルCH
1〜CHnの上記割当ビット数を各帯域毎に分配して上
記圧縮符号化を行う。また、図1に示すように、上記優
先チャネル決定手段は上記優先チャネルCH1のディジ
タル信号を複数の周波数帯域に分割する帯域分割回路6
0を備えてなり、当該帯域分割回路60で分割した一方
の出力を上記優先チャネルCH1に対応する圧縮符号化
回路521 に送り、他方の出力を冗長チャネルCH2に
対応する圧縮符号化回路522 に送る。また、上記冗長
チャネル決定手段には、上記冗長チャネルCH2のディ
ジタル信号を削除する削除回路61を設け、当該削除回
路61によって上記冗長チャネルCH2のディジタル信
号を圧縮符号化回路522 に送る前に削除する。Here, the compression coding circuits 52 1 to 52
As will be described later, n is obtained by dividing the digital signal of each channel CH1 to CHn into a plurality of frequency bands, obtaining the characteristic of the digital signal for each channel CH1 to CHn, and determining each channel according to the characteristic of the digital signal. CH
The above-mentioned compression coding is performed by distributing the above-mentioned allocated bits of 1 to CHn for each band. Further, as shown in FIG. 1, the priority channel determining means divides the digital signal of the priority channel CH1 into a plurality of frequency bands by a band division circuit 6
0, the one output divided by the band division circuit 60 is sent to the compression encoding circuit 52 1 corresponding to the priority channel CH1, and the other output is transmitted to the compression encoding circuit 52 2 corresponding to the redundant channel CH2. Send to. Further, the redundant channel determining means is provided with a deletion circuit 61 for deleting the digital signal of the redundant channel CH2, and the deletion circuit 61 deletes the digital signal of the redundant channel CH2 before sending it to the compression coding circuit 52 2. To do.
【0029】次に、上記本発明実施例の高能率符号化装
置に対応する高能率復号化装置は、それぞれ所定の圧縮
符号化処理(上記各圧縮符号化回路521 〜52n によ
る圧縮符号化処理)が施された複数のチャネルCH1〜
CHnの各ディジタル信号をそれぞれ伸張復号化する複
数の伸張復号化回路541 〜54n と、上記複数のチャ
ネルCH1〜CHnのうち優先チャネルCH1のディジ
タル信号と同一起源のディジタル信号を含むチャネル
(図1の例では符号化装置側で優先チャネルCH1のデ
ィジタル信号を分離して圧縮符号化した復号化装置側の
チャネルCH2)があるときには、当該同一起源のディ
ジタル信号を上記優先チャネルCH1のディジタル信号
に合成する合成回路62とを有するものである。Next, the high-efficiency decoding apparatus corresponding to the high-efficiency encoding apparatus of the above-described embodiment of the present invention respectively performs predetermined compression encoding processing (compression encoding by each of the compression encoding circuits 52 1 to 52 n ). A plurality of channels CH1 to
A plurality of decompression / decoding circuits 54 1 to 54 n for decompressing / decoding each digital signal of CHn, and a channel including a digital signal of the same origin as the digital signal of the priority channel CH1 among the plurality of channels CH1 to CHn (see FIG. In the first example, when there is a decoding device side channel CH2) in which the digital signal of the priority channel CH1 is separated and compression-encoded on the encoding device side, the same origin digital signal is converted into the digital signal of the priority channel CH1. And a synthesizing circuit 62 for synthesizing.
【0030】ここで、上記合成回路62は上記優先チャ
ネルCH1のディジタル信号と上記同一起源のディジタ
ル信号を周波数合成する。また、上記同一起源のディジ
タル信号を上記優先チャネルCH1のディジタル信号に
合成したときには、上記同一起源のディジタル信号を有
していたチャネル(CH2)のディジタル信号として所
定のディジタル信号(本実施例では無音データ)を生成
するディジタル信号生成手段(無音データ生成回路6
3)を設ける。Here, the synthesizing circuit 62 frequency-synthesizes the digital signal of the priority channel CH1 and the digital signal of the same origin. Further, when the digital signal of the same origin is combined with the digital signal of the priority channel CH1, a predetermined digital signal (silence in this embodiment is used as the digital signal of the channel (CH2) having the digital signal of the same origin. Digital signal generating means for generating data (silent data generating circuit 6)
3) is provided.
【0031】先ず、本発明実施例の高能率符号化装置の
具体的構成の説明に先立ち、本実施例装置にて採用する
チャネル間圧縮と周波数分割記録方式について説明す
る。なお、本発明実施例における音声信号には、声のみ
ならず各種音及び音楽信号等を含んでいる。First, before explaining the specific structure of the high-efficiency coding apparatus of the embodiment of the present invention, the inter-channel compression and frequency division recording method adopted in the apparatus of this embodiment will be explained. The voice signal in the embodiment of the present invention includes not only the voice but also various sounds and music signals.
【0032】音声圧縮技術には、入力音声信号を周波数
成分に変換、或いは周波数分割して圧縮する方法をとっ
ている。例えば、サブバンド分割法を用いた音声圧縮符
号化方式(サブバンドコーディング)であれば、入力音
声信号の周波数帯域を分割して各バンド内における信号
エネルギの偏在を減少させることでダイナミックレンジ
を削減し、各サブバンドの信号エネルギに応じたビット
を割り当てて符号化を行うことで圧縮データを得るよう
にしている。The audio compression technique is a method of converting an input audio signal into frequency components or frequency-dividing and compressing. For example, in the case of a voice compression coding method (subband coding) using the subband division method, the dynamic range is reduced by dividing the frequency band of the input voice signal to reduce uneven distribution of signal energy in each band. However, compressed data is obtained by allocating bits corresponding to the signal energy of each subband and performing encoding.
【0033】したがって、例えば、周波数帯域を制限し
て当該制限による特定周波数成分のみに割り当てるビッ
ト数を多くして圧縮を行った場合、当該特定周波数成分
の圧縮したデータは、同じ圧縮法により得られた全周波
数帯域の圧縮データに比べて高音質化されることにな
る。これが本発明の符号化の基本原理である。Therefore, for example, when compression is performed by limiting the frequency band and increasing the number of bits allocated only to the specific frequency component due to the limitation, the compressed data of the specific frequency component is obtained by the same compression method. In addition, the sound quality is improved compared to the compressed data in all frequency bands. This is the basic principle of the encoding of the present invention.
【0034】また、本実施例では、複数チャネルの音声
信号を扱うようにしている。例えば映画フィルムに対し
て、複数チャネルの音声信号を記録(例えば前述した8
チャネルオーディオ記録)するような場合を想定してい
る。ここで、映画というメディアにおいては、演出上全
く音声が無いチャネルが存在したり、特定チャネルのみ
に音声が有る場合が多々存在する。したがって、この場
合の音声信号が存在していないチャネルのフィルム上の
音声データ領域は、冗長であり、他チャネルの高音質化
用に当該領域を用いても問題は発生しない。すなわち、
上記のようなマルチチャネルオーディオにおいては、音
声信号が存在しないチャネルが存在することがあり、こ
の冗長チャネルの音声データをフィルム上に記録しない
代わりに、優先する特定チャネルに対する記録に当該領
域を用いるようにすれば、当該優先する特定チャネルの
高音質記録が実現できることになる。Further, in this embodiment, audio signals of a plurality of channels are handled. For example, for a movie film, a plurality of channels of audio signals are recorded (for example, 8
Channel audio recording) is assumed. Here, in a medium called a movie, there are cases where there is a channel that has no sound in the production, and there is a case where there is sound only in a specific channel. Therefore, the audio data area on the film of the channel in which the audio signal does not exist in this case is redundant, and no problem occurs even if the area is used for improving the sound quality of other channels. That is,
In the above-mentioned multi-channel audio, there may be a channel in which no audio signal exists. Instead of recording the audio data of this redundant channel on the film, use the relevant area for recording for the specific priority channel. By doing so, it is possible to realize high-quality sound recording of the specific channel with priority.
【0035】上述したようなチャネル間圧縮と周波数分
割記録方式を実現する具体的構成が、図1に示す構成で
ある。以下、この図1について説明する。A specific configuration for realizing the above-described inter-channel compression and frequency division recording method is the configuration shown in FIG. Hereinafter, FIG. 1 will be described.
【0036】先ず、記録系について説明する。すなわち
この図1において、入力端子511 〜51n には、それ
ぞれ対応する第1〜第nのn個のチャネルCH1〜CH
nのディジタル音声信号が供給される。また、この図1
の圧縮符号化回路(エンコーダ)521 〜52n は、各
チャネルCH1〜CHnに対応して設けられており、こ
れら各圧縮符号化回路521 〜52n では、例えば後述
するサブバンドコーティングを用いて信号を約1/5に
圧縮符号化する方式(例えばいわゆるATRAC方式)
によって、供給されたディジタル信号の圧縮符号化を行
うものである。First, the recording system will be described. That is, in FIG. 1, the input terminal 51 1 to 51 n, n-number of channels of the first through n corresponding respectively CH1~CH
n digital audio signals are provided. Also, this figure 1
The compression coding circuit (encoder) 52 1 to 52 n of the provided corresponding to the respective channels CH1 through CHn, these in each compression encoding circuit 52 1 to 52 n, using the sub-band coating, for example to be described later Method of compressing and encoding a signal to about 1/5 (for example, so-called ATRAC method)
The compression encoding of the supplied digital signal is carried out by.
【0037】ここで、例えば入力端子512 への第2の
チャネルCH2のディジタル音声信号が上記音声信号が
存在しないような冗長チャネルのディジタル信号である
ものとし、また、入力端子511 への第1のチャネルC
H1のディジタル音声信号が上記高音質化したい優先チ
ャネルのディジタル信号であるとする。Here, for example, it is assumed that the digital audio signal of the second channel CH2 to the input terminal 51 2 is a digital signal of a redundant channel such that the audio signal does not exist, and the digital audio signal to the input terminal 51 1 is Channel C of 1
It is assumed that the digital audio signal of H1 is the digital signal of the priority channel for which the high sound quality is desired.
【0038】上記優先チャネルである第1のチャネルC
H1のディジタル信号は、圧縮符号化を行う前に、帯域
分割回路60によって、複数の周波数帯域に分割する。
なお、この帯域分割のアルゴリズムは、圧縮符号化回路
521 〜52n において用いる圧縮法に応じて最適な方
法を取る。The first channel C which is the above-mentioned priority channel
The H1 digital signal is divided into a plurality of frequency bands by the band division circuit 60 before compression encoding.
Note that the algorithm for the band division, takes the best method depending on the compression method used in the compression encoding circuit 52 1 to 52 n.
【0039】一方、上記冗長チャネル(第2のチャネル
CH2)のディジタル音声信号は、削除回路61によっ
て削除され、当該冗長チャネルCH2用に元々設けられ
ていた圧縮符号化回路522 には送られないようになさ
れる。On the other hand, the digital audio signal of the redundant channel (second channel CH2) is deleted by the deleting circuit 61 and is not sent to the compression coding circuit 52 2 originally provided for the redundant channel CH2. Is done like this.
【0040】このとき、上記帯域分割回路60は、当該
優先チャネルの各帯域の信号を分離して一方を、当該優
先チャネルである第1のチャネルCH1に対して元々設
けられている圧縮符号化回路521 に送り、他方を上記
第2のチャネルCH2用に設けられていた圧縮符号化回
路522 に送る。このようなことから、当該優先チャネ
ルのディジタル音声信号は、上記圧縮符号化回路521
と圧縮符号化回路52 2 の両方の割当ビット数によって
圧縮符号化が行われる(すなわち当該優先チャネルのデ
ィジタル信号に対する割当ビット数が他のチャネルに対
して相対的に増える)ことになり、したがって、他のチ
ャネルに比べて高音質化が図れることになる。At this time, the band division circuit 60
Separate the signals of each band of the priority channel and
Originally set for the first channel CH1 which is the destination channel
Compression coding circuit 521And send the other to the above
The compression encoding times provided for the second channel CH2
Road 522Send to. Therefore, the priority channel
The digital audio signal of the1
And compression encoding circuit 52 2Depending on the number of allocated bits of both
The compression coding is performed (that is, the data of the priority channel is
The number of allocated bits for the digital signal is
Therefore, the other
Higher sound quality can be achieved compared to the channel.
【0041】なお、上記帯域分割回路60における優先
チャネルの信号の各帯域の分離の方法としては、例え
ば、高域と低域に分離したり、低域と中高域に分離或い
は低中域と高域に分離したり、また、人間の聴覚特性に
応じた分離等を考えることができる。ここで、人間の聴
覚特性に応じた分離を行う場合には、人間の聴覚におい
て最も敏感な帯域とそれ以外の帯域に分割することが好
ましい。このような人間の聴覚特性に応じた分離を行う
ことで、後の圧縮符号化における割当ビット数を、聴覚
において最も敏感な帯域に多く割り当てることができる
ようになり、人間の聴覚特性に適応した、より高音質化
が図れるようになる。As a method of separating each band of the signal of the priority channel in the band division circuit 60, for example, it is separated into a high band and a low band, a low band and a mid-high band, or a low mid band and a high band. It is possible to consider separation into regions, or separation according to human auditory characteristics. Here, when performing separation according to human auditory characteristics, it is preferable to divide into a band most sensitive to human hearing and a band other than that. By performing such separation according to the human auditory characteristics, it becomes possible to allocate more allocated bits in the subsequent compression coding to the most sensitive band in the auditory sense, and adapted to the human auditory characteristics. , Higher sound quality can be achieved.
【0042】他のチャネルのディジタル音声信号におい
ては、それぞれ対応して設けられている圧縮符号化回路
に送られ、それぞれ圧縮符号化される。The digital audio signals of the other channels are sent to the compression encoding circuits provided correspondingly, and are respectively compression encoded.
【0043】上記各圧縮符号化回路521 〜52n から
の各圧縮されたデータは、記録媒体53(例えば映画フ
ィルムの音声データ記録領域)に記録される。このと
き、上記優先チャネルの圧縮された音声データは、第1
のチャネル用の記録領域と第2のチャネル用の記録領域
に記録される。他のチャネルの圧縮された音声データは
それぞれ対応している記録領域に記録される。The respective compressed data from the respective compression encoding circuits 52 1 to 52 n are recorded on the recording medium 53 (for example, audio data recording area of movie film). At this time, the compressed audio data of the priority channel is the first
Are recorded in the recording area for the first channel and the recording area for the second channel. The compressed audio data of the other channels are recorded in the corresponding recording areas.
【0044】次に再生系においては、上記記録媒体53
(映画フィルム)の各チャネル毎の音声データ記録領域
から取り出された圧縮された音声データは、それぞれ各
チャネルに対応して設けられている伸張復号化回路(デ
コーダ)541 〜54n においてそれぞれ対応する前記
圧縮符号化回路521 〜52n での圧縮符号化に対応す
る従来同様の伸張復号化が施される。Next, in the reproducing system, the recording medium 53 is used.
The compressed audio data extracted from the audio data recording area for each channel of the (movie film) is respectively corresponded to by the expansion / decoding circuits (decoders) 54 1 to 54 n provided corresponding to the respective channels. Decompression / decoding similar to the conventional one corresponding to the compression / encoding in the compression / encoding circuits 52 1 to 52 n is performed.
【0045】ここで、上記優先チャネル以外の他のチャ
ネルの伸張復号化されたディジタル音声信号は、それぞ
れ対応する出力端子55から出力されるが、上記優先チ
ャネルとして上記第1,第2のチャネルCH1,CH2
用の記録領域に記録され、それぞれ伸張復号化回路54
1 ,542 にて伸張復号化された音声信号は、合成回路
62に送られる。当該合成回路62では、上記分離回路
60における帯域分離に対応する帯域合成を行う。この
合成回路62の出力が、当該優先チャネルすなわち第1
のチャネルCH1のディジタル音声信号として出力端子
551 から取り出される。Here, the decompression-decoded digital audio signals of the channels other than the priority channel are output from the corresponding output terminals 55, and the first and second channels CH1 are used as the priority channels. , CH2
Are recorded in the recording area for recording, and the expansion decoding circuit 54 respectively
The voice signal decompressed and decoded in 1 and 54 2 is sent to the synthesis circuit 62. The synthesis circuit 62 performs band synthesis corresponding to the band separation in the separation circuit 60. The output of the synthesis circuit 62 is the priority channel, that is, the first channel.
Is taken out from the output terminal 55 1 as a digital audio signal of the channel CH1.
【0046】一方、第2のチャネルCH2については、
符号化装置への入力時に音声信号が存在しなかったので
あるから、当該復号化装置側では無音データ作成回路6
3によって無音の信号を発生し、当該無音の信号を第2
のチャネルCH2の信号として出力端子552 から出力
する。On the other hand, for the second channel CH2,
Since no audio signal was present at the time of input to the encoding device, the silence data creating circuit 6 is provided on the decoding device side.
3 generates a silent signal and outputs the silent signal to the second
The signal is output from the output terminal 55 2 as a signal of the channel CH2.
【0047】なお、図1では、第1のチャネルCH1を
優先チャネルとし、第2のチャネルCHを冗長チャネル
とした場合について説明しているため、第1のチャネル
側に分離回路60及び合成回路62を設け、第2のチャ
ネル側に削除回路61及び無音データ作成回路63を設
けた例を示しているが、本実施例装置としては、例えば
各チャネル毎にこれら分離回路及び合成回路と削除回路
及び無音データ作成回路とを設け、それぞれ各チャネル
毎の例えば分離回路及び削除回路において音声信号が存
在するかしないかを判別し、当該音声信号の有無に応じ
て動作を切り換えるようにすることも可能である。この
場合、冗長チャネルと優先チャネルとは対になされ、逆
に、冗長チャネルがない場合には優先チャネルは設定さ
れないことになる。また、優先チャネルについては高音
質化したいチャネル順に設定される。Note that FIG. 1 illustrates the case where the first channel CH1 is the priority channel and the second channel CH is the redundant channel. Therefore, the separation circuit 60 and the combining circuit 62 are provided on the first channel side. Although an example is shown in which the deletion circuit 61 and the silence data creation circuit 63 are provided on the side of the second channel, the device of the present embodiment is, for example, the separation circuit, the combination circuit, the deletion circuit, and the deletion circuit for each channel. It is also possible to provide a silence data creation circuit, determine whether or not an audio signal exists in each of the channels, for example, the separation circuit and the deletion circuit, and switch the operation depending on the presence or absence of the audio signal. is there. In this case, the redundant channel and the priority channel are paired, and conversely, when there is no redundant channel, the priority channel is not set. Further, the priority channels are set in the order of the channels in which high quality sound is desired.
【0048】さらに、複数の冗長チャネルに対して1つ
の優先チャネルを設定することも可能である。例えば、
1つの優先チャネルのデータを複数帯域に分離し、これ
らを複数の冗長チャネル用の圧縮符号化回路(当該優先
チャネル用の圧縮符号化回路も含む)を使用して、より
高音質化を図ることができる。Further, it is possible to set one priority channel for a plurality of redundant channels. For example,
To separate the data of one priority channel into a plurality of bands and to use these compression coding circuits for a plurality of redundant channels (including the compression coding circuit for the priority channel) to achieve higher sound quality. You can
【0049】この場合、図1の構成のうち優先チャネル
に対応する圧縮側の部分のみを抜き出して示すと、図2
のように表すことができる。なお、この図2でも、第1
のチャネルを優先チャネルとした場合を例に挙げてい
る。In this case, when only the compression side portion corresponding to the priority channel in the configuration of FIG. 1 is extracted and shown, FIG.
Can be expressed as In addition, also in FIG. 2, the first
The case where the above channel is set as the priority channel is taken as an example.
【0050】すなわち、この図2において、複数の冗長
チャネルに対して1つの優先チャネルを設定する場合に
は、例えば図1の入力端子511 からの優先チャネルの
データ(PCMデータ)は、周波数帯域分割処理回路7
0(基本的には帯域分割回路60と同様のものである)
に送られる。この周波数帯域分割処理回路70は、例え
ば帯域分割フィルタにより構成され、当該優先チャネル
のデータを複数の周波数帯域(この図2の例ではm個の
周波数帯域)に分割し、これら各周波数帯域のPCMデ
ータを、それぞれ対応するm個の圧縮符号化回路521
〜52m に送る。これら圧縮符号化回路521 〜52m
で圧縮された圧縮データが、端子731〜73m を介し
て出力されて記録媒体に記録(若しくは伝送系に伝送)
される。なお、この図2の例では、冗長チャネルについ
ての説明は省略しているが、上記周波数帯域分割処理回
路70での帯域分割数のm−1個(分割数mから元々の
優先チャネル分の1を除く数)の冗長チャネルが設定さ
れ、これら冗長チャネルでは前記削除回路によりデータ
の削除が行われる。That is, in FIG. 2, when one priority channel is set for a plurality of redundant channels, for example, the priority channel data (PCM data) from the input terminal 51 1 of FIG. Division processing circuit 7
0 (basically the same as the band division circuit 60)
Sent to. The frequency band division processing circuit 70 is composed of, for example, a band division filter, divides the data of the priority channel into a plurality of frequency bands (m frequency bands in the example of FIG. 2), and PCMs of these frequency bands. The data is converted into m corresponding compression coding circuits 52 1
Send to ~ 52 m . These compression encoding circuits 52 1 to 52 m
Compressed data in compressed is recorded on the recording medium is output through the terminals 73 1 to 73 m (or transmitted to the transmission system)
To be done. In the example of FIG. 2, the description of the redundant channels is omitted, but the number of band divisions in the frequency band division processing circuit 70 is m−1 (from the division number m to one of the original priority channels). Redundant channels) are set, and data is deleted by the deletion circuit in these redundant channels.
【0051】この図2の例に対応する伸張側の構成は、
図3に示すようになる。この図3において、上記記録媒
体から(或いは伝送系を介して)供給された圧縮データ
は、上記m個のチャネルに対応する端子811 〜81m
を介し、それぞれ対応する伸張復号化回路541 〜54
m で伸張され、これら伸張されたPCMデータが信号合
成処理回路90(基本的には合成回路62と同様のもの
である)に送られる。当該信号合成処理回路90は、帯
域合成フィルタにより構成れ、上記優先チャネルの各分
割帯域のPCMデータが合成される。この信号合成処理
回路90からの出力PCMデータが、帯域合成された優
先チャネルのデータとなり、端子551 から出力され
る。なお、この図3の例でも、冗長チャネルについての
説明は省略しているが、上記信号合成処理回路90での
帯域合成数のm−1個(帯域数mから元々の優先チャネ
ル分の1を除く数)の冗長チャネルにおいて、前記無音
データ生成回路によって無音のデータが生成される。The structure on the decompression side corresponding to the example of FIG.
As shown in FIG. In FIG. 3, the compressed data supplied from the recording medium (or via the transmission system) corresponds to the terminals 81 1 to 81 m corresponding to the m channels.
Through the corresponding decompression / decoding circuits 54 1 to 54.
Decompressed by m , the decompressed PCM data is sent to the signal combining processing circuit 90 (basically the same as the combining circuit 62). The signal synthesizing processing circuit 90 is composed of a band synthesizing filter and synthesizes the PCM data of each divided band of the priority channel. The PCM data output from the signal synthesis processing circuit 90 becomes band-combined priority channel data and is output from the terminal 55 1 . In the example of FIG. 3 as well, the description of the redundant channels is omitted, but m-1 of the number of band combinations in the signal combination processing circuit 90 (one of the original priority channels is divided from the number of bands m). In the redundant channels (excluding the number), the silent data generation circuit generates silent data.
【0052】また、本実施例装置では、複数の優先チャ
ネルに対して1つの冗長チャネルを設定することも可能
であり、この場合には、例えば、上記複数の優先チャネ
ルでそれぞれ分離した各データを、当該1つの冗長チャ
ネルに対応する圧縮符号化回路に送り、当該圧縮符号化
回路での割当ビットをさらに上記複数の優先チャネルか
ら分離した各データ毎に分けるようにする。その他、冗
長チャネルとなるチャネル及び優先チャネルとなるチャ
ネルは、予め設定しておくこともできる。この場合、冗
長チャネルとなるチャネルは特に重要性が少ないと考え
られるチャネルとし、このチャネルが無音となった場合
にのみ当該チャネルを冗長チャネルとして設定するよう
にし、また優先チャネルとしては特に重要性の高いチャ
ネルを設定するようにする。In the apparatus of this embodiment, it is also possible to set one redundant channel for a plurality of priority channels. In this case, for example, each data separated by the plurality of priority channels is The data is sent to the compression coding circuit corresponding to the one redundant channel, and the allocated bits in the compression coding circuit are further divided for each data separated from the plurality of priority channels. In addition, the channel to be the redundant channel and the channel to be the priority channel can be set in advance. In this case, the channel that will be the redundant channel is considered to be of particularly low importance, and the channel is set as the redundant channel only when this channel becomes silent. Try to set the high channel.
【0053】一方、発音がなされていない(音声データ
が存在しない)ような冗長チャネルがない場合には、図
4に示すように、通常のマルチチャネルオーディオ記録
となる。なお、この図4において、図1と同じ構成要素
には同一の指示符号を付している。On the other hand, when there is no redundant channel such that no sound is produced (voice data does not exist), normal multi-channel audio recording is performed as shown in FIG. In FIG. 4, the same components as those in FIG. 1 are designated by the same reference numerals.
【0054】この図4には、通常のマルチチャネルオー
ディオ記録の場合の信号の流れに対応した部分のみを示
している。この図4において、各入力端子511 〜51
n に供給された各チャネルCH1〜CHnのディジタル
信号は、それぞれ対応する圧縮符号化回路521 〜52
n で圧縮符号化され、さらに、記録媒体53のそれぞれ
対応する記録領域に記録される。その後、各記録領域か
ら読み出された信号は、伸張復号化回路541 〜54n
で伸張及び復号化がなされ、出力端子551 〜55n か
ら出力される。In FIG. 4, only the portion corresponding to the signal flow in the case of normal multi-channel audio recording is shown. In FIG. 4, the input terminals 51 1 to 51 1
digital signals of the channels CH1~CHn supplied to n each corresponding compression encoding circuit 52 1 to 52
It is compression-encoded with n and further recorded in the corresponding recording areas of the recording medium 53. After that, the signals read from the respective recording areas are expanded and decoded by the decompression / decoding circuits 54 1 to 54 n.
The data is decompressed and decoded by and output from the output terminals 55 1 to 55 n .
【0055】この図4では、通常のマルチチャネルオー
ディオ記録の場合の信号の流れに対応した部分のみを示
しているが、図1と対応させて説明すると、図1の構成
において当該通常のマルチチャネルオーディオ記録を行
う場合には、分割回路及び削除回路では前記分割処理及
び削除処理を行わずに、そのまま供給されたチャネルデ
ータを通過させてそれぞれ対応する圧縮符号化回路に送
り、また、伸張復号化回路の出力データもそのまま対応
する出力端子に送るようになされる。In FIG. 4, only the portion corresponding to the signal flow in the case of normal multi-channel audio recording is shown. Explaining in correspondence with FIG. 1, in the configuration of FIG. When audio recording is performed, the division circuit and the deletion circuit do not perform the division processing and the deletion processing, and the supplied channel data is passed through and sent to the corresponding compression encoding circuits, and the decompression decoding is performed. The output data of the circuit is also sent to the corresponding output terminal as it is.
【0056】上述のようなことから、本発明実施例装置
に適用される圧縮方式には、以下の特徴がある。第1
に、サブバンドコーディング、トランスフォームコーデ
ィング共に有効である。第2に、エンコーダ及びデコー
ダについては変更の必要がない。From the above, the compression method applied to the apparatus of the present invention has the following features. First
In addition, both subband coding and transform coding are effective. Second, there is no need to change the encoder and decoder.
【0057】第3に、従来の圧縮データとの共存が可能
である。第4に、特定帯域に優先的にビットを割り当て
る操作も容易である。第5に、2チャネル以上のマルチ
チャネルオーディオに有効である。Third, coexistence with conventional compressed data is possible. Fourth, the operation of preferentially allocating bits to a specific band is easy. Fifth, it is effective for multi-channel audio of two or more channels.
【0058】さらに、これら第1〜第5の特徴につい
て、個々について詳しく説明する。先ず、第1の特徴に
おいて、サブバンドコーディング、トランスフォームコ
ーディングといった、周波数帯域分割を用いた圧縮法に
有効であるのは、上記圧縮符号化回路での圧縮法自体が
フィルタ(QMF(Quadrature Mirror Filter)やPF
B(Polyphase Filter Bank ))を用いて入力信号を複
数の周波数帯域に分割し、その情報を圧縮する処理をし
ているためである。したがって、本実施例のように圧縮
符号化前に分割(帯域分割回路による分割)を行って
も、当該分割による弊害は発生しないし、高音質化も可
能である。Further, each of the first to fifth characteristics will be described in detail. First, in the first feature, the compression method using frequency band division, such as subband coding and transform coding, is effective in that the compression method itself in the compression encoding circuit is a filter (QMF (Quadrature Mirror Filter). ) And PF
This is because the B (Polyphase Filter Bank)) is used to divide the input signal into a plurality of frequency bands and the information is compressed. Therefore, even if the division (the division by the band division circuit) is performed before the compression encoding as in the present embodiment, the harmful effect due to the division does not occur and the sound quality can be improved.
【0059】第2の特徴において、エンコーダはエンコ
ード時に内部で使用する分割フィルタ(サブバンド分割
フィルタ)を用いて周波数分割するのが最適であるが、
直前に帯域分割フィルタ(すなわち前記帯域分割回路)
を付加しても全く同等に実現可能である。このプリエン
コーダの作業(帯域分割回路における処理及び削除回路
における処理)は、削除回路における冗長チャネルの判
別及び分割回路における優先チャネルの判別と、帯域分
割回路における優先チャネルの周波数分割作業だけであ
る。また、デコーダは、デコード時に内部で使用する合
成フィルタ(サブバンド合成フィルタ)を用いて合成す
るのが最適であるが、直後に複数オーディオデータを合
成するフィルタ(すなわち前記合成回路)を付加して
も、全く同等に各データ出力を元に戻すことができる。
このポストデコーダの作業(合成回路における処理及び
無音データ作成回路における処理)は、合成回路におけ
る優先チャネルの合成と、無音データ作成回路における
冗長チャネル用の無音データ作成だけである。これらプ
リエンコーダとポストデコーダのどちらの場合も、付加
する構成要素は少なく、さらに、帯域分割回路における
分割フィルタはエンコーダ内部のサブバンド分割フィル
タと同一のものを使用でき、合成回路における合成フィ
ルタはデコーダ内部のサブバンド合成フィルタと同一の
ものを使用できる。In the second feature, the encoder is optimal for frequency division using a division filter (subband division filter) used internally during encoding.
Immediately before the band division filter (that is, the band division circuit)
It is possible to realize exactly the same by adding. The operations of the pre-encoder (the processing in the band division circuit and the processing in the deletion circuit) are only the determination of the redundant channel in the deletion circuit, the determination of the priority channel in the division circuit, and the frequency division work of the priority channel in the band division circuit. In addition, the decoder is optimal to synthesize using a synthesis filter (subband synthesis filter) used internally during decoding, but immediately after that, a filter (that is, the synthesis circuit) that synthesizes a plurality of audio data is added. Also, each data output can be restored in the same way.
The work of this post-decoder (the processing in the synthesizing circuit and the processing in the silence data creating circuit) is only to synthesize the priority channels in the synthesizing circuit and to create the silence data for the redundant channels in the silence data creating circuit. In both of these pre-encoders and post-decoders, there are few additional components, and the division filter in the band division circuit can be the same as the sub-band division filter in the encoder. The same one as the internal subband synthesis filter can be used.
【0060】第3の特徴においては、圧縮符号化回路に
送られるデータは上記帯域分割回路によって周波数帯域
が変換されているだけで、当該圧縮符号化回路で圧縮さ
れたデータのフォーマットは従来同様で全く変わらない
ため、既存の記録フォーマットに準じて記録することが
可能である。In the third feature, the frequency band of the data sent to the compression coding circuit is only converted by the band division circuit, and the format of the data compressed by the compression coding circuit is the same as the conventional one. Since it does not change at all, it is possible to record according to the existing recording format.
【0061】第4の特徴において、エンコードする際に
は、音質の低下を防ぎたい周波数帯域に優先的にビット
を割り当てることが可能となる。また、分割する各々の
周波数帯域や分割数などはエンコード時に選択でき、デ
コーダは選択内容による影響を受けない。In the fourth feature, when encoding, it is possible to preferentially allocate bits to a frequency band in which deterioration of sound quality is desired to be prevented. Further, each frequency band to be divided and the number of divisions can be selected at the time of encoding, and the decoder is not affected by the selected contents.
【0062】第5の特徴においては、本実施例の場合、
1チャネル分(優先チャネル)のデータが2チャネル分
以上のデータ領域を占有する必要があるため、モノラル
オーディオでは実現できないが、2チャネル以上のマル
チチャネルオーディオ記録において、優先チャネル以外
の他チャネルの領域が無音や未使用といった理由により
使用可能な場合に、高音質化が可能となる。In the fifth feature, in the case of this embodiment,
Since data for one channel (priority channel) must occupy a data area for two or more channels, monaural audio cannot be realized, but in multi-channel audio recording of two or more channels, areas for channels other than the priority channel If the sound can be used due to silence or unused, high sound quality can be achieved.
【0063】さらに、本発明実施例装置によれば、前記
図1のような動作のモードを高音質モードと呼び、前記
図2のような動作のモードを通常モードと呼ぶとする
と、例えば、以下のような応用が考えられる。第1に、
例えば2チャネルオーディオ記録において、ステレオの
通常モードとモノラルの高音質モードを装備することが
できる。Further, according to the apparatus of the embodiment of the present invention, the operation mode as shown in FIG. 1 is called a high sound quality mode, and the operation mode as shown in FIG. 2 is called a normal mode. The following applications are possible. First,
For example, in 2-channel audio recording, a stereo normal mode and a monaural high-quality sound mode can be provided.
【0064】第2に、例えば4チャネルオーディオ記録
において、いわゆる3−1方式などのための通常モード
とステレオの高音質モードを装備することができる。第
3に、2チャネルnトラック(nは自然数)のマルチチ
ャネルオーディオ記録において、高音質モードを装備す
ることができる。この他、特定チャネルをさらに優先さ
せて3チャネル以上の領域を用いて、さらに高音質化す
るといった方法や、メディアのチャネル数が多いときに
は、複数のチャネルに高音質モードを適用することも可
能である。Secondly, for example, in 4-channel audio recording, it is possible to equip the normal mode for the so-called 3-1 system and the high-quality stereo mode. Thirdly, a high sound quality mode can be provided in a 2-channel n-track (n is a natural number) multi-channel audio recording. In addition, it is also possible to give priority to a specific channel and use a region of three or more channels to further improve the sound quality, or to apply the high sound quality mode to a plurality of channels when the number of media channels is large. is there.
【0065】上述したようなことから、本発明実施例の
圧縮の手法は、特に、映画フィルムに対してマルチチャ
ネルオーディオ信号を記録するような場合に有効な高音
質化手法となる。なお、上記映画フィルムに用いられる
8チャネルオーディオ記録においては、レフトチャネ
ル,レフトセンターチャネル,センターチャネル,ライ
トセンターチャネル,ライトチャネル,サラウンドレフ
トチャネル,サラウンドライトチャネル,サブウーファ
ーチャネルの8つのチャネルうち、低周波成分のみの音
声データの出力を目的としたチャネルであるサブウーフ
ァーチャネルは特性上発音しているデータ区間が短いた
め、前記冗長チャネルと判断できる区間が多く、また、
高音質化を図りたい優先チャネルとしては例えばセンタ
ーチャネルを選ぶことができる。From the above, the compression method of the embodiment of the present invention is a method for improving the sound quality, which is particularly effective when a multi-channel audio signal is recorded on a motion picture film. In the 8-channel audio recording used for the above-mentioned motion picture film, among the eight channels of the left channel, left center channel, center channel, right center channel, right channel, surround left channel, surround right channel and subwoofer channel, The subwoofer channel, which is a channel intended to output audio data of only the frequency component, has a short data section that is characteristically sounded, so there are many sections that can be judged as the redundant channel, and
For example, the center channel can be selected as the priority channel for which high sound quality is desired.
【0066】また、本発明実施例での圧縮の方式によれ
ば、既存のフォーマットへの対応も容易であり、記録媒
体(映画フィルム)に記録されているデータが上記高音
質モードかどうかの情報は必要ではない。すなわち、高
音質モードの場合、特定チャネル(優先チャネル)のデ
ータが複数の記録領域に跨がっているため、各記録領域
において記録されているデータがどのチャネルのデータ
を記録しているかの情報を保存しておく方が適切だから
である。なお、各記録領域においていずれのチャネルの
データを記録しているかを情報を保存することによって
記録単位毎に増える情報量は、全チャネル数をnとする
と、 n*log2(n) [ビット] に過ぎず、記録する際のデータの増加はごくわずかであ
る。Further, according to the compression method in the embodiment of the present invention, it is easy to support the existing format, and the information indicating whether the data recorded on the recording medium (cinema film) is in the high sound quality mode or not. Is not necessary. That is, in the high sound quality mode, since the data of a specific channel (priority channel) is spread over a plurality of recording areas, information of which channel the data recorded in each recording area records Because it is more appropriate to save. Note that the amount of information that increases in each recording unit by storing information on which channel data is recorded in each recording area is n * log 2 (n) [bits], where n is the total number of channels. However, the increase in data when recording is negligible.
【0067】ところで、上述した本発明実施例装置で
は、上記マルチチャネルの圧縮されたオーディオデータ
と、直線量子化したディジタルオーディオサンプルを扱
う各種既存のディジタルオーディオインタフェースのフ
ォーマットとの互換をとるため、以下のようなフォーマ
ット変換を行うようにしている。By the way, in the above-described apparatus of the present invention, in order to make the multi-channel compressed audio data compatible with various existing digital audio interface formats for handling linearly quantized digital audio samples, I am trying to convert the format like.
【0068】すなわち、本実施例のフォーマット変換で
は、上記既存のディジタルオーディオインタフェースと
の互換を確保するため、インタフェースのフォーマット
内部まで立ち入らないようにしている。このため、既存
フォーマットのデータ部のみに新たな枠を設けて、あら
ためてデータを格納する形式を取るようにしている。言
い換えれば、本実施例のフォーマット変換では、既存の
ディジタルオーディオの各種フォーマットにおいて直線
量子化されたオーディオサンプルの記録,伝送用に割り
当てられた領域のみを変更するようにしている。このと
き例えば、前記CP−1201で定義される放送局スタ
ジオ用チャネルステータスc1=1(オーディオ以外の
モード)として使用することにより、通常のオーディオ
データとの区別も可能である。なお、このとき本実施例
においては、マルチチャネル用の領域を確保するため、
記録,伝送するフォーマット内での扱いはステレオ音声
信号とする。That is, in the format conversion of the present embodiment, in order to ensure compatibility with the existing digital audio interface, the inside of the interface format is not entered. For this reason, a new frame is provided only in the data section of the existing format so that the data can be stored again. In other words, in the format conversion of this embodiment, only the areas allocated for recording and transmission of linearly quantized audio samples in various existing digital audio formats are changed. At this time, for example, it can be distinguished from normal audio data by using the broadcasting station studio channel status c1 = 1 (mode other than audio) defined by the CP-1201. At this time, in this embodiment, in order to secure the area for multi-channel,
The handling within the format for recording and transmission shall be stereo audio signals.
【0069】このように、本実施例では、ステレオ音声
信号の領域にマルチチャネルオーディオデータを格納す
るため、オーディオデータを圧縮する。例えば、前記サ
ブバンドコーディング等を用い人間の聴覚上の特性を利
用してオーディオ信号を高能率圧縮符号化する方式によ
れば、オーディオデータを約1/4.8に圧縮すること
ができるので、上記既存フォーマットのステレオ領域に
最大9チャネルのオーディオデータの格納が可能とな
る。なお、記録,伝送するフォーマットにおいて標本化
周波数に記録する値は、用いた圧縮法に準じた値とな
る。例えば上記高能率符号化の方式を用いた場合は、常
に44.1kHzとなる。また、量子化ビット数は、最
大24ビットまで用いればその分確保できる領域は大き
くなるが、いわゆるCD(コンパクトディスク)やDA
T(ディジタルオーディオテープ)との互換性や圧縮法
を考えて16ビットとする。これは拡張することも可能
である。As described above, in this embodiment, since the multi-channel audio data is stored in the area of the stereo audio signal, the audio data is compressed. For example, the audio data can be compressed to about 1 / 4.8 according to the method of efficiently compressing and coding the audio signal by using the human auditory characteristic by using the subband coding or the like. Up to 9 channels of audio data can be stored in the stereo area of the existing format. The value recorded in the sampling frequency in the recording and transmitting format is a value according to the compression method used. For example, when the high efficiency coding method is used, the frequency is always 44.1 kHz. Also, if the maximum number of quantization bits is 24 bits, the area that can be secured will increase accordingly, but so-called CD (compact disc) and DA
Considering the compatibility with T (digital audio tape) and the compression method, it is 16 bits. This can be extended.
【0070】以下、図5〜図7を用いて説明する。本実
施例での変換フォーマットにおいて、1フレームのサイ
ズは、ディジタルオーディオの代表的な圧縮法での直線
量子化データの処理単位が384サンプルや256サン
プル或いは512サンプルであることから、大きい方の
512サンプルを選択する。384サンプル他の圧縮法
を用いる場合は、別途フォーマット上の工夫が必要であ
る。Hereinafter, description will be made with reference to FIGS. In the conversion format of the present embodiment, the size of one frame is 512, which is the larger because the processing unit of linearly quantized data in a typical compression method of digital audio is 384 samples, 256 samples, or 512 samples. Select a sample. When using a compression method of 384 samples or the like, it is necessary to devise a separate format.
【0071】したがって、1フレームは512サンプル
で2048バイトとなり、図5に示すように、この領域
内にデータを記録するデータ部204と、そのデータに
関する情報を記録するコード部(202〜203)を設
定することができる。例えば、上記コード部には、フレ
ームの同期をとるシンクコード領域201と、データの
管理情報を記録するコントロールコード領域202、そ
の他の情報を記録するサブインフォメーション領域20
3の3つの領域を確保する。これを情報量可変のために
前詰めで記録すれば、各種データに対し自由な記録が可
能となる。同様に、データ部204はデータサイズ可変
のため後詰めで記録すればよい。Therefore, one frame has 512 samples of 2048 bytes, and as shown in FIG. 5, a data section 204 for recording data and a code section (202 to 203) for recording information on the data are stored in this area. Can be set. For example, in the code section, a sync code area 201 for synchronizing frames, a control code area 202 for recording data management information, and a sub information area 20 for recording other information.
3 areas of 3 are secured. If this is recorded in the right-justified order to change the amount of information, it is possible to freely record various data. Similarly, since the data section 204 has a variable data size, the data section 204 may be recorded in a rear-justified manner.
【0072】ここで、上記シンクコード領域201は、
フレームの同期をとる際に使用するために必要である。
当該シンクコード領域201の領域サイズは4バイトあ
れば良く、シンクコードは例えば16進表現で7379
6e63などがよい。また、当該フォーマットでは、デ
ータ内部の形式までは限定しないので、このシンクコー
ドと同一データがシンク以外で登場する可能性がある。
そのため、シンク判別には、例えば2048バイト毎に
登場するものをシンクとして用いるといった作業が必要
である。Here, the sync code area 201 is
Required for use when synchronizing frames.
The area size of the sync code area 201 may be 4 bytes, and the sync code is represented by hexadecimal 7379, for example.
6e63 or the like is preferable. Further, since the format does not limit the internal format of the data, the same data as this sync code may appear outside the sync.
Therefore, for the sync discrimination, it is necessary to use, for example, one that appears every 2048 bytes as a sync.
【0073】上記コントロールコード領域202は、デ
ータのコントロールコードを記録する領域である。サブ
インフォメーション領域203もコントロールコードを
記録するが、上記コントロールコード領域202は必ず
存在しサイズが一定であるという点でサブインフォメー
ション領域203と異なる。このコントロールコード領
域202は、図6に示すように、例えば5つの領域に分
けることができる。The control code area 202 is an area for recording a data control code. The sub information area 203 also records the control code, but the control code area 202 is always present and is different in size from the sub information area 203. The control code area 202 can be divided into, for example, five areas as shown in FIG.
【0074】この図6において、チャネルカウント領域
210は、データのチャネル数を記録する領域である。
このチャネルカウント領域210のサイズは1バイト
で、将来のチャネル数増加に対応するために、フォーマ
ット上は0x00〜0xffまで任意に設定可能とす
る。In FIG. 6, the channel count area 210 is an area for recording the number of data channels.
The size of the channel count area 210 is 1 byte, and in order to cope with an increase in the number of channels in the future, it is possible to arbitrarily set 0x00 to 0xff in the format.
【0075】データインフォメーション領域211は、
記録データの情報を記録する領域である。このデータイ
ンフォメーション領域211は、図7に示すように、少
なくとも、コーディング方式を記録する領域221の3
ビットと、標本化周波数を記録する領域222の2ビッ
トを確保しておくようにする。なお、データインフォメ
ーション領域211にはこれら領域221,222の他
に、リザーブ領域220を3ビット用意している。The data information area 211 is
This is an area for recording information of recording data. As shown in FIG. 7, the data information area 211 has at least three areas 221 for recording the coding method.
Bits and 2 bits of the area 222 for recording the sampling frequency are reserved. In addition to these areas 221, 222, a reserve area 220 of 3 bits is prepared in the data information area 211.
【0076】データサイズ領域212は、データ領域の
領域サイズを記録する領域である。当該データサイズ領
域212の領域サイズは、2バイトで、フォーマット上
は0x0000〜0xffffまで記録できるが、実際
はフレームサイズの制約により、0x0000〜0x0
7f4の範囲以外になることはない。The data size area 212 is an area for recording the area size of the data area. The area size of the data size area 212 is 2 bytes, and it is possible to record from 0x0000 to 0xffff in the format, but in reality, due to the frame size restriction, 0x0000 to 0x0.
It does not fall outside the range of 7f4.
【0077】サブインフォメーションサイズ領域213
は、サブインフォメーション領域203の領域サイズを
記録する領域である。当該サブインフォメーションサイ
ズ領域213の領域サイズは2バイトで上述同様に0x
0000〜0x07f4の範囲以外になることはない。
なお、このサブインフォメーションサイズ領域213と
上記データサイズ領域212とを合わせたサイズが0x
0000〜0x07f4の範囲以外になることはない。Sub-information size area 213
Is an area for recording the area size of the sub-information area 203. The area size of the sub-information size area 213 is 2 bytes and is 0x as described above.
It does not fall outside the range of 0000 to 0x07f4.
The size of the sub-information size area 213 and the data size area 212 is 0x.
It does not fall outside the range of 0000 to 0x07f4.
【0078】サブインフォメーションモード領域214
は、サブインフォメーションのモードを指定するフラグ
を記録する領域である。当該サブインフォメーションモ
ード領域214の領域サイズは、2バイトで、ここでモ
ードを指定すれば、上記サブインフォメーション領域2
03において、自由に管理情報の記録が可能となる。Sub information mode area 214
Is an area for recording a flag designating a sub information mode. The area size of the sub information mode area 214 is 2 bytes. If the mode is specified here, the sub information area 2
In 03, management information can be freely recorded.
【0079】また、図5のデータ領域204は、マルチ
チャネルディジタル音声データを記録する領域である。
内容が音声でなくてもフォーマット上は問題がない。デ
ータは後詰めで記録し、サブインフォメーション領域2
03との間は0データで埋められる。The data area 204 of FIG. 5 is an area for recording multi-channel digital audio data.
There is no problem in the format even if the content is not voice. Data is recorded in the last position, and sub information area 2
Between 0 and 3 is filled with 0 data.
【0080】以上のフォーマットは一例であるが、この
ようなフレーム形式を設定することにより、マルチチャ
ネルデータを統合して扱うことが可能となる。The above format is an example, but by setting such a frame format, it is possible to handle multi-channel data in an integrated manner.
【0081】すなわち、上記フォーマット変換の具体的
構成においては、図8に示すように、入力端子311 〜
31n を介して供給された第1〜第nチャネルからなる
マルチチャネルのオーディオ圧縮データを、フォーマッ
ト変換ポストエンコーダ30によって上記図5〜図7に
示すようなフォーマットに変換して出力端子32から出
力する。これにより、前記マルチチャネルのオーディオ
圧縮データと上記既存のディジタルオーディオインタフ
ェースとの互換性を確保することができる。[0081] That is, in the specific configuration of the format conversion, as shown in FIG. 8, the input terminals 31 1 to
The multi-channel audio compressed data including the first to nth channels supplied via 31 n are converted into the formats shown in FIGS. 5 to 7 by the format conversion post encoder 30 and output from the output terminal 32. To do. Thereby, compatibility between the multi-channel audio compressed data and the existing digital audio interface can be ensured.
【0082】また、図9に示すように、端子36からの
既存のディジタルオーディオのフォーマットに圧縮され
たマルチチャネルオーディオデータが挿入されたデータ
は、フォーマット変換プリデコーダ35によって第1〜
第nチャネルのマルチチャネル圧縮データが取り出さ
れ、それぞれ対応する出力端子371 〜37n を介して
出力される。これにより、前記マルチチャネルのオーデ
ィオ圧縮データと上記既存のディジタルオーディオイン
タフェースとの互換性を取ることができる。Further, as shown in FIG. 9, the data into which the multi-channel audio data compressed into the existing digital audio format from the terminal 36 is inserted is converted by the format conversion predecoder 35 into the first to first data.
The multi-channel compressed data of the nth channel is taken out and output via the corresponding output terminals 37 1 to 37 n . Thereby, compatibility between the multi-channel audio compressed data and the existing digital audio interface can be achieved.
【0083】上記図8,図9の2つのフォーマット変換
手段を付加するだけで、既存のディジタルオーディオ記
録メディアや伝送系を、マルチチャネルディジタルオー
ディオに対応させることができる。Existing digital audio recording media and transmission systems can be made compatible with multi-channel digital audio simply by adding the two format converting means shown in FIGS. 8 and 9.
【0084】なお、上記本実施例のフォーマット変換を
用いて既存メディアからの信号をマルチチャネル化する
例として、8チャネルのDAT(ディジタルオーディオ
テープ)がある。これは、本実施例のフォーマット変換
を用いてDATに8チャネルの圧縮オーディオデータを
記録する技術であり、これを用いれば映画フィルムから
の8チャネルの圧縮オーディオデータもDATに記録可
能となる。なお、記録するメディアは、上記DATに限
定されず、CD(コンパクトディスク)やビデオディス
クなど44.1kHzの標本化周波数モードがあり、1
6ビットの直線量子化されたオーディオサンプルの記
録、伝送領域が確保されているディジタル記録メディア
であればどのようなものであってもよい。There is an 8-channel DAT (digital audio tape) as an example of converting a signal from an existing medium into a multi-channel by using the format conversion of the present embodiment. This is a technique of recording 8-channel compressed audio data in DAT by using the format conversion of the present embodiment, and by using this technique, 8-channel compressed audio data from a movie film can also be recorded in DAT. The recording medium is not limited to the above-mentioned DAT, and there is a sampling frequency mode of 44.1 kHz such as a CD (compact disc) and a video disc.
Any 6-bit linearly quantized audio sample can be used as long as it is a digital recording medium in which recording and transmission areas are secured.
【0085】図10には、映像と同期したマルチチャネ
ルDATの例を示す。FIG. 10 shows an example of multi-channel DAT synchronized with video.
【0086】この図10において、フォーマット変換プ
リデコーダ35は、映写機やプロジェクタといった映像
装置40からCUE信号を受けると、ディジタルオーデ
ィオテープレコーダ42をスタートさせる。このとき、
プリデコーダ35からは、同期信号,外部コントロール
がディジタルオーディオテープレコーダ42に送られ、
当該ディジタルオーディオテープレコーダ42からはA
ES/EBUフォーマットのデータが供給される。上記
プリデコーダ35は、上記AES/EBUフォーマット
のデータをデコードしてマルチチャネル化し、このマル
チチャネル圧縮データを、前述したようなマルチチャネ
ルオーディオ圧縮データをデコードするデコーダ41に
送る。なお、ディジタルテープレコーダ42は、記録さ
れているタイムコードにより頭出しをすることができ、
したがって上記8チャネルの圧縮オーディオデータを扱
う装置のバックアップシステム等として適用可能とな
る。In FIG. 10, the format conversion predecoder 35 starts the digital audio tape recorder 42 when receiving the CUE signal from the video device 40 such as a projector or a projector. At this time,
A sync signal and external control are sent from the predecoder 35 to the digital audio tape recorder 42,
From the digital audio tape recorder 42,
Data in ES / EBU format is provided. The predecoder 35 decodes the AES / EBU format data into multi-channel data and sends the multi-channel compressed data to the decoder 41 for decoding the multi-channel audio compressed data as described above. Note that the digital tape recorder 42 can find the beginning of the recorded time code,
Therefore, it can be applied as a backup system of an apparatus that handles the above-mentioned 8-channel compressed audio data.
【0087】また、本発明が既存のディジタル記録メデ
ィアにも展開できる点を利用し、圧縮された音声8チャ
ネルデータをビデオディスクに記録し、再生機側で再生
可能なチャネル数(或いは接続スピーカ数)に応じて音
声を選択、出力する装置の開発などの発展が考えられ
る。Further, taking advantage of the fact that the present invention can be applied to the existing digital recording medium, the compressed audio 8 channel data is recorded on the video disk, and the number of channels (or the number of connected speakers) which can be reproduced by the reproducing device side is used. ), The development such as the development of a device that selects and outputs a sound is considered.
【0088】さらに、本発明における伝送においては、
既存のディジタル伝送ケーブルで、上記約1/5の圧縮
方式(例えばいわゆるATRAC方式等)を用いれば最
大9チャネルの伝送が可能となる。また、伝送のインタ
フェースのフォーマットにより、既存の2チャネルモー
ドとの判別も可能であり、既存のディジタルオーディオ
データとのインタフェースの共有が可能である。Further, in the transmission according to the present invention,
With the existing digital transmission cable, if the compression method of about 1/5 (for example, the so-called ATRAC method) is used, transmission of up to 9 channels becomes possible. Further, it is possible to discriminate the existing 2-channel mode depending on the format of the transmission interface, and the interface can be shared with the existing digital audio data.
【0089】また、本実施例のフォーマット変換は、前
記サブインフォメーション領域、データ領域のサイズが
変更可能なフォーマットであり、かつ圧縮法は限定され
ていない。したがって、今後、新しい符号化方式を用い
ることによって、より多くのチャネル化にも対応でき、
より高音質を達成した音声を、記録,伝送することも可
能である。また、本実施例によれば、各フレーム毎にデ
ータサイズを変更可能であり、可変レートや可変チャネ
ルの圧縮符号化方式にも対応できる。The format conversion of this embodiment is a format in which the size of the sub-information area and the data area can be changed, and the compression method is not limited. Therefore, in the future, by using a new coding method, it is possible to support more channels,
It is also possible to record and transmit a voice that achieves higher sound quality. Further, according to the present embodiment, the data size can be changed for each frame, and it is possible to correspond to the variable-rate or variable-channel compression encoding method.
【0090】上述したように、本発明実施例の高能率符
号化装置及び、本実施例の高能率復号化装置は、既存の
サブバンドコーディングを用いたオーディオ圧縮におい
て、エンコーダとデコーダの変更を要することなく、他
チャネルの記録領域を利用して特定チャネル(優先チャ
ネル)を高音質化することを可能としている。すなわ
ち、エンコーダにおいては、先に入力音声に対して複数
に周波数分割しておいてから個々をエンコードする。こ
れにより、各々のデータに関して音声の周波数帯域が限
定されるため、相対的に各周波数に割り当てられる記録
のビット数が増えて高音質化が達成される。このとき、
サブバンドコーディング自体が周波数分割をしているた
め、分割による問題発生の可能性が少なく、また分割法
に工夫を加えれば、特に劣化を防ぐ必要のある周波数帯
域にビットを多く割り当てることも容易である。また、
デコーダにおいては、被分割エンコードデータ各々を各
圧縮法に基づいてデコードし、出力データ同士を合成す
ればよく、デコーダの変更が不要なばかりか、従来デー
タと高音質データの共存も可能である。As described above, the high-efficiency coding apparatus according to the present invention and the high-efficiency decoding apparatus according to the present embodiment require the encoder and the decoder to be changed in the audio compression using the existing subband coding. It is possible to improve the sound quality of a specific channel (priority channel) without using the recording areas of other channels. That is, in the encoder, the input voice is first frequency-divided into a plurality of frequencies and then each is encoded. As a result, since the frequency band of voice is limited for each data, the number of recording bits allocated to each frequency is relatively increased and high sound quality is achieved. At this time,
Since subband coding itself uses frequency division, there is little possibility of problems due to division, and if the division method is devised, it is easy to allocate many bits to the frequency band that needs to prevent deterioration. is there. Also,
In the decoder, each of the divided encoded data may be decoded based on each compression method, and the output data may be combined with each other. Therefore, not only the decoder need not be changed, but also the conventional data and the high sound quality data can coexist.
【0091】また、本発明実施例のインタフェース装置
によれば、既存の2チャネルディジタルオーディオイン
タフェースの伝送,記録フォーマットを用いて、マルチ
チャネル圧縮オーディオデータを伝送,記録,再生でき
るようになる。これにより、例えば既存のディジタル2
チャネルの伝送,記録フォーマットを利用し、マルチチ
ャネルの圧縮オーディオデータを伝送,記録,再生で
き、例えばサブバンドコーディングを用いてデータを約
1/5に圧縮する圧縮符号化方式を用いることで、既存
のディジタル2チャネルの伝送,記録フォーマットにお
いて最大9チャネルまで対応可能となる。Further, according to the interface device of the embodiment of the present invention, the multi-channel compressed audio data can be transmitted, recorded and reproduced by using the transmission and recording format of the existing 2-channel digital audio interface. This allows, for example, existing digital 2
It is possible to transmit, record and reproduce multi-channel compressed audio data by utilizing channel transmission and recording formats. For example, by using a compression encoding method that compresses data to about 1/5 using subband coding, It is possible to support up to 9 channels in the digital 2 channel transmission and recording format.
【0092】次に、上記図1に示した圧縮符号化回路5
21 〜52n の具体的な構成について説明する。これら
圧縮符号化回路521 〜52n では、オーディオPCM
信号等の入力ディジタル信号を、帯域分割符号化(SB
C)、適応変換符号化(ATC)及び適応ビット配分
(APC−AB)の各技術を用いて圧縮符号化してい
る。Next, the compression coding circuit 5 shown in FIG.
A specific configuration of 2 1 to 52 n will be described. In these compression encoding circuits 52 1 to 52 n , audio PCM is used.
An input digital signal such as a signal is subjected to band division encoding (SB
C), adaptive transform coding (ATC), and adaptive bit allocation (APC-AB).
【0093】以下、図11を用いて説明する。図11に
示す本実施例の圧縮符号化回路では、入力ディジタル信
号をフィルタなどにより複数の周波数帯域に分割すると
共に、各周波数帯域毎に直交変換を行って、得られた周
波数軸のスペクトルデータを、後述する人間の聴覚特性
を考慮したいわゆる臨界帯域幅(クリティカルバンド)
毎に適応的にビット配分して符号化している。この時、
高域では臨界帯域幅を更に分割した帯域を用いる。もち
ろんフィルタなどによる非ブロッキングの周波数分割幅
は等分割幅としてもよい。さらに、本実施例において
は、直交変換の前に入力信号に応じて適応的にブロック
サイズ(ブロック長)を変化させると共に、クリティカ
ルバンド単位もしくは高域では臨界帯域幅(クリティカ
ルバンド)を更に細分化したブロックでフローティング
処理を行っている。このクリティカルバンドとは、人間
の聴覚特性を考慮して分割された周波数帯域であり、あ
る純音の周波数近傍の同じ強さの狭帯域バンドノイズに
よって当該純音がマスクされるときのそのノイズの持つ
帯域のことである。このクリティカルバンドは、高域ほ
ど帯域幅が広くなっており、上記0〜22kHzの全周
波数帯域は例えば25のクリティカルバンドに分割され
ている。Hereinafter, description will be made with reference to FIG. In the compression encoding circuit of the present embodiment shown in FIG. 11, the input digital signal is divided into a plurality of frequency bands by a filter or the like, and orthogonal transformation is performed for each frequency band to obtain the spectrum data of the frequency axis. , The so-called critical bandwidth (critical band) in consideration of human auditory characteristics described later
Each bit is adaptively allocated and encoded. This time,
In the high range, a band obtained by further dividing the critical bandwidth is used. Of course, the non-blocking frequency division width by a filter or the like may be an equal division width. Further, in this embodiment, the block size (block length) is adaptively changed according to the input signal before the orthogonal transformation, and the critical bandwidth (critical band) is further subdivided in the critical band unit or in the high range. Floating process is performed in the block. This critical band is a frequency band divided in consideration of human auditory characteristics, and is the band of a pure tone when the pure tone is masked by narrow band noise of the same strength near the frequency of that pure tone. That is. This critical band has a wider bandwidth as it goes higher, and the entire frequency band of 0 to 22 kHz is divided into, for example, 25 critical bands.
【0094】すなわち、図11において、入力端子10
には例えば0〜22kHzのオーディオPCM信号が供
給されている。この入力信号は、例えばいわゆるQMF
等の帯域分割フィルタ11により0〜11kHz帯域と
11k〜22kHz帯域とに分割され、0〜11kHz
帯域の信号は同じくいわゆるQMF等の帯域分割フィル
タ12により0〜5.5 kHz帯域と5.5.k〜11kHz
帯域とに分割される。帯域分割フィルタ11からの11
k〜22kHz帯域の信号は、直交変換回路の一例であ
るMDCT(Modified Discrete Cosine Transform)回
路13に送られ、帯域分割フィルタ12からの5.5 k〜
11kHz帯域の信号はMDCT回路14に送られ、帯
域分割フィルタ12からの0〜5.5 kHz帯域の信号は
MDCT回路15に送られることにより、それぞれMD
CT処理される。なお、各MDCT回路13、14、1
5では、各帯域毎に設けたブロック決定回路19、2
0、21により決定されたブロックサイズに基づいてM
DCT処理がなされる。That is, in FIG. 11, the input terminal 10
Is supplied with an audio PCM signal of 0 to 22 kHz, for example. This input signal is, for example, a so-called QMF.
Is divided into a band of 0 to 11 kHz and a band of 11 to 22 kHz by a band dividing filter 11 such as
Similarly, the band signal is 0 to 5.5 kHz band and 5.5.k to 11 kHz by the band dividing filter 12 such as so-called QMF.
It is divided into a band and. 11 from the band division filter 11
The signal in the k to 22 kHz band is sent to an MDCT (Modified Discrete Cosine Transform) circuit 13 which is an example of an orthogonal transform circuit, and 5.5 k to from the band division filter 12 is transmitted.
The signal in the 11 kHz band is sent to the MDCT circuit 14, and the signal in the 0 to 5.5 kHz band from the band division filter 12 is sent to the MDCT circuit 15.
CT processed. In addition, each MDCT circuit 13, 14, 1
5, block determination circuits 19 and 2 provided for each band
M based on the block size determined by 0, 21
DCT processing is performed.
【0095】ここで、上記ブロック決定回路19、2
0、21により決定される各MDCT回路13、14、
15でのブロックサイズの具体例を図12のA及びBに
示す。なお、図12のAには直交変換ブロックサイズが
長い場合(ロングモードにおける直交変換ブロックサイ
ズ)を、図12のBには直交変換ブロックサイズが短い
場合(ショートモードにおける直交変換ブロックサイ
ズ)を示ししている。この図12の具体例においては、
3つのフィルタ出力は、それぞれ2つの直交変換ブロッ
クサイズを持つ。すなわち、低域側の0〜5.5 kHz帯
域の信号及び中域の5.5 k〜11kHz帯域の信号に対
しては、長いブロック長の場合(図12のA)は1ブロ
ック内のサンプル数を128サンプルとし、短いブロッ
クが選ばれた場合(図12のB)には1ブロック内のサ
ンプル数を32サンプル毎のブロックとしている。これ
に対して高域側の11k〜22kHz帯域の信号に対し
ては、長いブロック長の場合(図12のA)は1ブロッ
ク内のサンプル数を256サンプルとし、短いブロック
が選ばれた場合(図12のB)には1ブロック内のサン
プル数を32サンプル毎のブロックとしている。このよ
うにして短いブロックが選ばれた場合には各帯域の直交
変換ブロックのサンプル数を同じとして高域程時間分解
能を上げ、なおかつブロック化に使用するウインドウの
種類を減らしている。なお、上記ブロック決定回路1
9、20、21で決定されたブロックサイズを示す情報
は、後述の適応ビット配分符号化回路16、17、18
に送られると共に、出力端子23、25、27から出力
される。Here, the block decision circuits 19 and 2 are
MDCT circuits 13 and 14 determined by 0 and 21
A specific example of the block size in 15 is shown in A and B of FIG. 12A shows the case where the orthogonal transform block size is long (the orthogonal transform block size in the long mode), and FIG. 12B shows the case where the orthogonal transform block size is short (the orthogonal transform block size in the short mode). is doing. In the specific example of FIG. 12,
Each of the three filter outputs has two orthogonal transform block sizes. That is, for a signal in the low band of 0 to 5.5 kHz and a signal in the middle band of 5.5 to 11 kHz, if the block length is long (A in FIG. 12), the number of samples in one block is 128 samples. Then, when a short block is selected (B in FIG. 12), the number of samples in one block is a block for every 32 samples. On the other hand, for a signal in the 11 kHz to 22 kHz band on the high frequency side, when the block length is long (A in FIG. 12), the number of samples in one block is 256, and when the short block is selected ( In FIG. 12B), the number of samples in one block is a block for every 32 samples. When a short block is selected in this way, the number of samples of orthogonal transform blocks in each band is set to be the same, the time resolution is increased in the higher frequency range, and the number of windows used for blocking is reduced. The block decision circuit 1
The information indicating the block size determined in 9, 20, and 21 is the adaptive bit allocation coding circuits 16, 17, and 18 described later.
And output from the output terminals 23, 25 and 27.
【0096】再び図11において、各MDCT回路1
3、14、15にてMDCT処理されて得られた周波数
領域のスペクトルデータあるいはMDCT係数データ
は、いわゆる臨界帯域(クリティカルバンド)または高
域では更にクリティカルバンドを分割した帯域毎にまと
められて適応ビット配分符号化回路16、17、18に
送られている。Referring again to FIG. 11, each MDCT circuit 1
The spectrum data in the frequency domain or the MDCT coefficient data obtained by MDCT processing at 3, 14, and 15 are combined into so-called critical bands (critical bands) or bands into which the critical band is further divided in the high band, and adaptive bits are collected. It is sent to the distribution coding circuits 16, 17, and 18.
【0097】適応ビット配分符号化回路16、17、1
8では、上記ブロックサイズの情報、及び臨界帯域(ク
リティカルバンド)または高域では更にクリティカルバ
ンドを分割した帯域毎に割り当てられたビット数に応じ
て各スペクトルデータ(あるいはMDCT係数データ)
を再量子化(正規化して量子化)するようにしている。
適応ビット配分符号化回路16、17、18で符号化さ
れたデータは、出力端子22、24、26を介して取り
出される。また、当該適応ビット配分符号化回路16、
17、18では、どのような信号の大きさに関する正規
化がなされたかを示すスケールファクタと、どのような
ビット長で量子化がされたかを示すビット長情報も求め
ており、これらも同時に出力端子22、24、26から
出力される。Adaptive bit allocation encoding circuits 16, 17, 1
In 8, the spectrum data (or MDCT coefficient data) according to the information of the block size and the number of bits assigned to each critical band (critical band) or a band obtained by further dividing the critical band in the high band.
Is requantized (normalized and quantized).
The data coded by the adaptive bit allocation coding circuits 16, 17, 18 are taken out via the output terminals 22, 24, 26. Also, the adaptive bit allocation encoding circuit 16,
In 17 and 18, the scale factor indicating what kind of signal magnitude the normalization has been made and the bit length information showing what kind of bit length the quantization has been performed, and these are also output terminals at the same time. It is output from 22, 24 and 26.
【0098】また、図11における各MDCT回路1
3、14、15の出力は、上記臨界帯域(クリティカル
バンド)または高域では更にクリティカルバンドを分割
した帯域毎のエネルギを、例えば当該バンド内での各振
幅値の2乗平均の平方根を計算すること等により求めら
れる。もちろん、上記スケールファクタそのものを以後
のビット配分の為に用いるようにしてもよい。この場合
には新たなエネルギ計算の演算が不要となるため、ハー
ド規模の節約となる。また、各バンド毎のエネルギの代
わりに、振幅値のピーク値、平均値等を用いることも可
能である。Further, each MDCT circuit 1 in FIG.
The outputs of 3, 14, and 15 calculate the energy of each band obtained by further dividing the critical band in the critical band (critical band) or the high band, for example, the square root of the root mean square of each amplitude value in the band. It is required by things. Of course, the scale factor itself may be used for subsequent bit allocation. In this case, the calculation of new energy is not required, and the hardware scale is saved. Further, instead of the energy for each band, it is also possible to use the peak value, the average value, etc. of the amplitude values.
【0099】ここで、上記適応ビット配分回路16、1
7、18のより具体的な構成を図13で説明する。この
図13に示す適応ビット配分回路では、MDCT係数の
大きさが各ブロック毎に求められ、そのMDCT係数が
入力端子801に供給される。当該入力端子801に供
給されたMDCT係数は、帯域毎のエネルギ算出回路8
03に与えられる。帯域毎のエネルギ算出回路803で
は、クリティカルバンド又は高域においてはクリティカ
ルバンドを更に再分割したそれぞれの帯域に関する信号
エネルギを算出する。帯域毎のエネルギ算出回路803
で算出されたそれぞれの帯域に関するエネルギは、エネ
ルギ依存ビット配分回路804に供給される。Here, the adaptive bit allocation circuits 16 and 1
A more specific configuration of Nos. 7 and 18 will be described with reference to FIG. In the adaptive bit allocation circuit shown in FIG. 13, the magnitude of the MDCT coefficient is obtained for each block, and the MDCT coefficient is supplied to the input terminal 801. The MDCT coefficient supplied to the input terminal 801 is the energy calculation circuit 8 for each band.
Given to 03. The energy calculation circuit 803 for each band calculates the signal energy for each band obtained by further dividing the critical band or the critical band in the high band. Energy calculation circuit 803 for each band
The energy for each band calculated in step S.3 is supplied to the energy-dependent bit allocation circuit 804.
【0100】エネルギ依存ビット配分回路804では、
使用可能総ビット発生回路802からの使用可能総ビッ
ト、本実施例では128Kbpsの内のある割合(本実
施例では100Kbps)を用いて白色の量子化雑音を
作り出すようなビット配分を行う。このとき、入力信号
のトーナリティが高いほど、すなわち入力信号のスペク
トルの凸凹が大きいほど、このビット量が上記128K
bpsに占める割合が増加する。なお、入力信号のスペ
クトルの凸凹を検出するには、隣接するブロックのブロ
ックフローティング係数の差の絶対値の和を指標として
使う。そして、求められた使用可能なビット量につき、
各帯域のエネルギの対数値に比例したビット配分を行
う。In the energy-dependent bit allocation circuit 804,
The available total bit from the available total bit generation circuit 802, which is a ratio of 128 Kbps in this embodiment (100 Kbps in this embodiment), is used to perform bit allocation so as to generate white quantization noise. At this time, the higher the tonality of the input signal, that is, the larger the unevenness of the spectrum of the input signal, the more the bit amount becomes 128K.
The ratio to bps increases. In addition, in order to detect the unevenness of the spectrum of the input signal, the sum of the absolute values of the differences of the block floating coefficients of the adjacent blocks is used as an index. Then, regarding the available bit amount obtained,
Bit allocation is performed in proportion to the logarithmic value of the energy of each band.
【0101】聴覚許容雑音レベルに依存したビット配分
算出回路805は、先ず上記クリティカルバンド毎に分
割されたスペクトルデータに基づき、いわゆるマスキン
グ効果等を考慮した各クリティカルバンド毎の許容ノイ
ズ量を求め、次に聴覚許容雑音スペクトルを与えるよう
に使用可能総ビットからエネルギ依存ビットを引いたビ
ット分が配分される。このようにして求められたエネル
ギ依存ビットと聴覚許容雑音レベルに依存したビットは
加算されて、図11の適応ビット配分符号化回路16、
17、18により各クリティカルバンド毎もしくは高域
においてはクリティカルバンドを更に複数帯域に分割し
た帯域に割り当てられたビット数に応じて各スペクトル
データ(あるいはMDCT係数データ)を再量子化する
ようにしている。このようにして符号化されたデータ
は、図11の出力端子22、24、26を介して取り出
される。The bit allocation calculation circuit 805, which depends on the permissible hearing noise level, first obtains the permissible noise amount for each critical band in consideration of the so-called masking effect, etc., based on the spectrum data divided for each critical band. Bits obtained by subtracting energy-dependent bits from the total available bits are distributed so as to give a perceptible noise spectrum to the. The energy-dependent bit thus obtained and the bit dependent on the permissible noise level of the hearing are added, and the adaptive bit allocation encoding circuit 16 of FIG.
17 and 18 requantize each spectrum data (or MDCT coefficient data) according to the number of bits allocated to each critical band or in the high frequency band, which is obtained by further dividing the critical band into a plurality of bands. . The data encoded in this way is taken out through the output terminals 22, 24 and 26 of FIG.
【0102】さらに詳しく上記聴覚許容雑音スペクトル
依存のビット配分回路805中の聴覚許容雑音スペクト
ル算出回路について説明すると、MDCT回路13、1
4、15で得られたMDCT係数が上記許容雑音算出回
路に与えられる。More specifically, the auditory permissible noise spectrum calculation circuit in the bit allocation circuit 805 depending on the permissible auditory noise spectrum will be described. The MDCT circuits 13 and 1
The MDCT coefficients obtained in 4 and 15 are given to the allowable noise calculating circuit.
【0103】図14は上記許容雑音算出回路をまとめて
説明した一具体例の概略構成を示すブロック回路図であ
る。この図14において、入力端子521には、MDC
T回路13、14、15からの周波数領域のスペクトル
データが供給されている。FIG. 14 is a block circuit diagram showing a schematic configuration of a specific example in which the above-mentioned allowable noise calculating circuits are collectively described. In FIG. 14, the input terminal 521 has an MDC
The spectrum data in the frequency domain is supplied from the T circuits 13, 14, and 15.
【0104】この周波数領域の入力データは、帯域毎の
エネルギ算出回路522に送られて、上記クリティカル
バンド(臨界帯域)毎のエネルギが、例えば当該バンド
内での各振幅値2乗の総和を計算すること等により求め
られる。この各バンド毎のエネルギの代わりに、振幅値
のピーク値、平均値等が用いられることもある。このエ
ネルギ算出回路522からの出力として、例えば各バン
ドの総和値のスペクトルは、一般にバークスペクトルと
称されている。図15はこのような各クリティカルバン
ド毎のバークスペクトルSBを示している。ただし、こ
の図15では、図示を簡略化するため、上記クリティカ
ルバンドのバンド数を12バンド(B1〜B12)で表現
している。The input data in the frequency domain is sent to the energy calculation circuit 522 for each band, and the energy of each critical band (critical band) is calculated, for example, as the sum of squared amplitude values in the band. It is required by doing. Instead of the energy for each band, a peak value, an average value, etc. of the amplitude value may be used. As an output from the energy calculation circuit 522, for example, the spectrum of the total sum value of each band is generally called a Bark spectrum. FIG. 15 shows such a Bark spectrum SB for each critical band. However, in FIG. 15, in order to simplify the illustration, the number of bands of the critical band is expressed by 12 bands (B1 to B12).
【0105】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するために、該バー
クスペクトルSBに所定の重み付け関数を掛けて加算す
るような畳込み(コンボリューション)処理を施す。こ
のため、上記帯域毎のエネルギ算出回路522の出力す
なわち該バークスペクトルSBの各値は、畳込みフィル
タ回路523に送られる。該畳込みフィルタ回路523
は、例えば、入力データを順次遅延させる複数の遅延素
子と、これら遅延素子からの出力にフィルタ係数(重み
付け関数)を乗算する複数の乗算器(例えば各バンドに
対応する25個の乗算器)と、各乗算器出力の総和をと
る総和加算器とから構成されるものである。なお、上記
マスキングとは、人間の聴覚上の特性により、ある信号
によって他の信号がマスクされて聞こえなくなる現象を
いうものであり、このマスキング効果には、時間領域の
オーディオ信号による時間軸マスキング効果と、周波数
領域の信号による同時刻マスキング効果とがある。これ
らのマスキング効果により、マスキングされる部分にノ
イズがあったとしても、このノイズは聞こえないことに
なる。このため、実際のオーディオ信号では、このマス
キングされる範囲内のノイズは許容可能なノイズとされ
る。Here, in order to consider the influence of so-called masking of the Bark spectrum SB, a convolution processing is performed such that the Bark spectrum SB is multiplied by a predetermined weighting function and added. Therefore, the output of the energy calculation circuit 522 for each band, that is, each value of the Bark spectrum SB is sent to the convolution filter circuit 523. The convolution filter circuit 523
Is, for example, a plurality of delay elements that sequentially delay input data, and a plurality of multipliers (for example, 25 multipliers corresponding to each band) that multiply outputs from these delay elements by a filter coefficient (weighting function). , A sum total adder that sums the outputs of the respective multipliers. Note that the masking is a phenomenon in which one signal is masked by another signal and becomes inaudible due to human auditory characteristics.The masking effect includes a time-axis masking effect by an audio signal in the time domain. And there is the same time masking effect by the signal in the frequency domain. Due to these masking effects, even if there is noise in the masked portion, this noise cannot be heard. Therefore, in the actual audio signal, the noise within the masked range is regarded as an acceptable noise.
【0106】ここで、上記畳込みフィルタ回路523の
各乗算器の乗算係数(フィルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記バークスペ
クトルSBの畳込み処理が行われる。ただし、Mは1〜
25の任意の整数である。Here, a specific example of the multiplication coefficient (filter coefficient) of each multiplier of the convolution filter circuit 523 will be described. When the coefficient of the multiplier M corresponding to an arbitrary band is 1, the multiplier M-1 gives a coefficient of 0.15, multiplier M-2 gives a coefficient of 0.0019, and multiplier M-3 gives a coefficient of 0.0000.
086, multiplier M + 1 gives a coefficient of 0.4, multiplier M + 2
By multiplying the output of each delay element by a coefficient of 0.06 and a coefficient of 0.007 by a multiplier M + 3, the convolution processing of the Bark spectrum SB is performed. However, M is 1 to
It is an arbitrary integer of 25.
【0107】次に、上記畳込みフィルタ回路523の出
力は引算器524に送られる。該引算器524は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリューション処理を
行うことによって、クリティカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。ここで、
上記引算器524には、上記レベルαを求めるるための
許容関数(マスキングレベルを表現する関数)が供給さ
れる。この許容関数を増減させることで上記レベルαの
制御を行っている。当該許容関数は、次に説明するよう
な(n−ai)関数発生回路525から供給されている
ものである。Next, the output of the convolution filter circuit 523 is sent to the subtractor 524. The subtractor 524 calculates a level α corresponding to an allowable noise level described later in the convoluted area. The level α corresponding to the permissible noise level (permissible noise level) is a level at which the critical noise band becomes the permissible noise level for each band by performing inverse convolution processing, as described later. is there. here,
The subtractor 524 is supplied with an allowance function (function expressing a masking level) for obtaining the level α. The level α is controlled by increasing or decreasing this allowance function. The permissible function is supplied from the (n-ai) function generating circuit 525 as described below.
【0108】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリティカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の式で求めることがで
きる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、式中(n-ai)が
許容関数となる。例としてn=38,a=−0.5を用い
ることができる。That is, the level α corresponding to the allowable noise level can be obtained by the following equation, where i is the number given in order from the low band of the critical band. α = S- (n-ai) In this equation, n and a are constants, a> 0, and S is the intensity of the convolution-processed Bark spectrum. In the equation, (n-ai) is the tolerance function. As an example, n = 38 and a = -0.5 can be used.
【0109】このようにして、上記レベルαが求めら
れ、このデータは、割算器526に伝送される。当該割
算器526では、上記畳込みされた領域での上記レベル
αを逆コンボリューションするためのものである。した
がって、この逆コンボリューション処理を行うことによ
り、上記レベルαからマスキングスレッショールドが得
られるようになる。すなわち、このマスキングスレッシ
ョールドが許容ノイズスペクトルとなる。なお、上記逆
コンボリューション処理は、複雑な演算を必要とする
が、本実施例では簡略化した割算器526を用いて逆コ
ンボリューションを行っている。In this way, the level α is obtained, and this data is transmitted to the divider 526. The divider 526 is for deconvolution of the level α in the convolved area. Therefore, by performing the inverse convolution processing, the masking threshold can be obtained from the level α. That is, this masking threshold becomes the allowable noise spectrum. Although the above-mentioned inverse convolution processing requires complicated calculation, in this embodiment, the inverse convolution is performed using the simplified divider 526.
【0110】次に、上記マスキングスレッショールド
は、合成回路527を介して減算器528に伝送され
る。ここで、当該減算器528には、上記帯域毎のエネ
ルギ検出回路522からの出力、すなわち前述したバー
クスペクトルSBが、遅延回路529を介して供給され
ている。したがって、この減算器528で上記マスキン
グスレッショールドとバークスペクトルSBとの減算演
算が行われることで、図13に示すように、上記バーク
スペクトルSBは、該マスキングスレッショールドMS
のレベルで示すレベル以下がマスキングされることにな
る。なお、遅延回路529は上記合成回路527以前の
各回路での遅延量を考慮してエネルギ検出回路522か
らのバークスペクトルSBを遅延させるために設けられ
ている。Next, the masking threshold is transmitted to the subtractor 528 via the synthesizing circuit 527. Here, the output from the energy detection circuit 522 for each band, that is, the above-described Bark spectrum SB is supplied to the subtractor 528 via the delay circuit 529. Therefore, the subtractor 528 subtracts the masking threshold from the Bark spectrum SB, so that the Bark spectrum SB becomes the masking threshold MS, as shown in FIG.
The level below the level indicated by will be masked. The delay circuit 529 is provided in order to delay the Bark spectrum SB from the energy detection circuit 522 in consideration of the delay amount in each circuit before the synthesis circuit 527.
【0111】当該減算器528からの出力は、許容雑音
補正回路530を介し、出力端子531を介して取り出
され、例えば配分ビット数情報が予め記憶されたROM
等(図示せず)に送られる。このROM等は、上記減算
回路528から許容雑音補正回路530を介して得られ
た出力(上記各バンドのエネルギと上記ノイズレベル設
定手段の出力との差分のレベル)に応じ、各バンド毎の
配分ビット数情報を出力する。The output from the subtracter 528 is taken out via the allowable noise correction circuit 530 and the output terminal 531. For example, the ROM in which the distribution bit number information is stored in advance.
Etc. (not shown). The ROM or the like is distributed for each band according to the output (the level of the difference between the energy of each band and the output of the noise level setting means) obtained from the subtraction circuit 528 through the allowable noise correction circuit 530. Outputs bit number information.
【0112】このようにしてエネルギ依存ビットと聴覚
許容雑音レベルに依存したビットは加算されてその配分
ビット数情報を用いて当該適応ビット配分符号化回路1
6、17、18では符号化が行われる。In this way, the energy-dependent bit and the bit dependent on the permissible hearing noise level are added, and the adaptive bit allocation coding circuit 1 is used by using the distributed bit number information.
Encoding is performed in 6, 17, and 18.
【0113】すなわち要約すれば、適応ビット配分符号
化回路16、17、18では、上記クリティカルバンド
の各バンド帯域(クリティカルバンド)毎もしくは高域
においてはクリティカルバンドを更に複数帯域に分割し
た帯域のエネルギもしくはピーク値と上記ノイズレベル
設定手段の出力との差分のレベルに応じて配分されたビ
ット数で上記各バンド毎のスペクトルデータを量子化す
ることになる。In summary, in the adaptive bit allocation coding circuits 16, 17, and 18, the energy of each band band (critical band) of the critical band or the energy of a band obtained by further dividing the critical band in the high band. Alternatively, the spectrum data for each band is quantized by the number of bits distributed according to the level of the difference between the peak value and the output of the noise level setting means.
【0114】ところで、上述した合成回路527での合
成の際には、最小可聴カーブ発生回路532から供給さ
れる図16に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
レッショールドMSとを合成することができる。この最
小可聴カーブにおいて、雑音絶対レベルがこの最小可聴
カーブ以下ならば該雑音は聞こえないことになる。この
最小可聴カーブは、コーディングが同じであっても例え
ば再生時の再生ボリュームの違いで異なるものとなが、
現実的なディジタルシステムでは、例えば16ビットダ
イナミックレンジへの音楽のはいり方にはさほど違いが
ないので、例えば4kHz付近の最も耳に聞こえやすい
周波数帯域の量子化雑音が聞こえないとすれば、他の周
波数帯域ではこの最小可聴カーブのレベル以下の量子化
雑音は聞こえないと考えられる。したがって、このよう
に例えばシステムの持つダイナミックレンジの4kHz
付近の雑音が聞こえない使い方をすると仮定し、この最
小可聴カーブRCとマスキングスレッショールドMSと
を共に合成することで許容ノイズレベルを得るようにす
ると、この場合の許容ノイズレベルは、図16中の斜線
で示す部分までとすることができるようになる。なお、
本実施例では、上記最小可聴カーブの4kHzのレベル
を、例えば20ビット相当の最低レベルに合わせてい
る。また、この図16は、信号スペクトルSSも同時に
示している。By the way, at the time of synthesizing by the above-mentioned synthesizing circuit 527, the data showing the so-called minimum audible curve RC which is the human auditory characteristic as shown in FIG. The masking threshold MS can be combined. In this minimum audible curve, if the absolute noise level is below this minimum audible curve, the noise will not be heard. Even if the coding is the same, this minimum audible curve is different due to the difference in the playback volume during playback,
In a realistic digital system, there is not much difference in how music is put into a 16-bit dynamic range, so if the quantization noise in the most audible frequency band around 4 kHz is inaudible, for example, other It is considered that quantization noise below the level of this minimum audible curve is inaudible in the frequency band. Therefore, for example, the dynamic range of the system is 4 kHz.
If it is assumed that the noise in the vicinity is not heard, and the allowable noise level is obtained by synthesizing the minimum audible curve RC and the masking threshold MS together, the allowable noise level in this case is shown in FIG. It will be possible to go up to the part shown by the diagonal line of. In addition,
In this embodiment, the level of 4 kHz of the minimum audible curve is set to the minimum level equivalent to 20 bits, for example. In addition, FIG. 16 also shows the signal spectrum SS at the same time.
【0115】また、上記許容雑音補正回路530では、
補正情報出力回路533から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器528から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図16に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大
きさに聞こえ、逆に、50Hz付近では1kHzでの音
圧よりも約15dB高くないと同じ大きさに聞こえな
い。このため、上記最小可聴カーブのレベルを越えた雑
音(許容ノイズレベル)は、該等ラウドネス曲線に応じ
たカーブで与えられる周波数特性を持つようにするのが
良いことがわかる。このようなことから、上記等ラウド
ネス曲線を考慮して上記許容ノイズレベルを補正するこ
とは、人間の聴覚特性に適合していることがわかる。In the allowable noise correction circuit 530,
The allowable noise level in the output from the subtractor 528 is corrected based on the information of the equal loudness curve sent from the correction information output circuit 533, for example. Here, the equal loudness curve is a characteristic curve relating to human auditory characteristics, for example, a curve obtained by obtaining the sound pressure of sound at each frequency that sounds the same as a pure tone of 1 kHz, and connecting the curves. Also called sensitivity curve. Further, this equal loudness curve is the minimum audible curve R shown in FIG.
It draws a curve substantially the same as C. In this equal loudness curve, for example, at 4 kHz, even if the sound pressure drops by 8 to 10 dB from 1 kHz, it sounds as loud as 1 kHz, and conversely, at around 50 Hz, it must be about 15 dB higher than the sound pressure at 1 kHz. It doesn't sound the same. Therefore, it is understood that the noise exceeding the level of the minimum audible curve (allowable noise level) should have the frequency characteristic given by the curve corresponding to the equal loudness curve. From this, it can be seen that correcting the permissible noise level in consideration of the equal loudness curve is suitable for human hearing characteristics.
【0116】以上述べた聴覚許容雑音レベルに依存した
スペクトル形状を使用可能総ビット128Kbpsの内
のある割合を用いるビット配分でつくる。この割合は入
力信号のトーナリティが高くなるほど減少する。The spectrum shape depending on the permissible hearing noise level described above is created by bit allocation using a certain ratio of the total usable bits of 128 Kbps. This ratio decreases as the tonality of the input signal increases.
【0117】次にビット量分割手法について説明する。
図13に戻って、MDCT回路出力が供給される入力端
子801からの信号は、スペクトルの滑らかさ算出回路
808にも与えられ、ここでスペクトルの滑らかさが算
出される。本実施例では、信号スペクトルの絶対値の隣
接値間の差の絶対値の和を、信号スペクトルの絶対値の
和で割った値を、上記スペクトルの滑らかさとして算出
している。Next, the bit amount dividing method will be described.
Returning to FIG. 13, the signal from the input terminal 801 to which the MDCT circuit output is supplied is also given to the spectrum smoothness calculation circuit 808, and the spectrum smoothness is calculated here. In this embodiment, a value obtained by dividing the sum of the absolute values of the differences between the adjacent values of the absolute value of the signal spectrum by the sum of the absolute values of the signal spectrum is calculated as the smoothness of the spectrum.
【0118】上記スペクトルの滑らかさ算出回路808
の出力は、ビット分割率決定回路809に与えられ、こ
こでエネルギ依存のビット配分と、聴覚許容雑音スペク
トルによるビット配分間のビット分割率とが決定され
る。ビット分割率はスペクトルの滑らかさ算出回路80
8の出力値が大きいほど、スペクトルの滑らかさが無い
と考えて、エネルギ依存のビット配分よりも、聴覚許容
雑音スペクトルによるビット配分に重点をおいたビット
配分を行う。ビット分割率決定回路809は、それぞれ
エネルギ依存のビット配分及び聴覚許容雑音スペクトル
によるビット配分の大きさをコントロールするマルチプ
ライヤ811及び812に対してコントロール出力を送
る。ここで、仮にスペクトルが滑らかであり、エネルギ
依存のビット配分に重きをおくように、マルチプライヤ
811へのビット分割率決定回路809の出力が0.8
の値を取ったとき、マルチプライヤ812へのビット分
割率決定回路809の出力は1−0.8=0.2とす
る。これら2つのマルチプライヤの出力はアダー806
で足し合わされて最終的なビット配分情報となって、出
力端子807から出力される。The spectrum smoothness calculation circuit 808 described above.
Is supplied to the bit division rate determination circuit 809, and the bit division rate between the energy-dependent bit allocation and the bit allocation according to the perceptual noise spectrum is determined. The bit division rate is the smoothness calculation circuit 80 of the spectrum.
It is considered that the larger the output value of 8, the smoother the spectrum is, and the bit allocation is performed with more emphasis on the bit allocation by the perceptual noise spectrum than the energy-dependent bit allocation. The bit division ratio determination circuit 809 sends control outputs to multipliers 811 and 812 which control the amount of bit distribution depending on the energy and the permissible noise spectrum of the auditory sense, respectively. Here, if the spectrum is smooth and the output of the bit division rate determination circuit 809 to the multiplier 811 is 0.8 so as to emphasize the energy-dependent bit allocation.
, The output of the bit division rate determination circuit 809 to the multiplier 812 is 1-0.8 = 0.2. The output of these two multipliers is the adder 806.
Are added together to form final bit allocation information, which is output from the output terminal 807.
【0119】次に、図17には、図1の伸張復号化回路
41 〜4n の構成を示す。Next, FIG. 17 shows the configuration of the decompression / decoding circuits 4 1 to 4 n shown in FIG.
【0120】この図17において、各帯域の量子化され
たMDCT係数は、入力端子122、124、126に
与えられ、使用されたブロックサイズ情報は、入力端子
123、125、127に与えられる。復号化回路11
6、117、118では適応ビット配分情報を用いてビ
ット割当を解除する。In FIG. 17, the quantized MDCT coefficients of each band are given to the input terminals 122, 124 and 126, and the used block size information is given to the input terminals 123, 125 and 127. Decoding circuit 11
6, 117 and 118 cancel the bit allocation using the adaptive bit allocation information.
【0121】次に、IMDCT回路113、114、1
15では周波数領域の信号が時間領域の信号に変換され
る。これらの部分帯域の時間領域信号は、IQMF回路
112、111により、全体域信号に復号化される。そ
の後、IQMF回路111,112で帯域合成がなさ
れ、出力端子110から出力される。Next, the IMDCT circuits 113, 114, 1
At 15, the frequency domain signal is transformed into a time domain signal. IQMF circuits 112 and 111 decode the time domain signals of these subbands into whole-domain signals. After that, band synthesis is performed in the IQMF circuits 111 and 112, and the result is output from the output terminal 110.
【0122】[0122]
【発明の効果】上述したように、本発明の高能率符号化
装置においては、複数のチャネルのうち冗長なディジタ
ル信号を含む冗長チャネルがあるときにはこの冗長チャ
ネルのディジタル信号を削除し、冗長チャネルのディジ
タル信号の圧縮符号化に用いるはずであった割当ビット
数を、高品質の圧縮符号化を行いたい優先チャネルのデ
ィジタル信号の圧縮符号化に使用するようにしているた
め、圧縮アルゴリズムや記録,伝送フォーマットの変更
が全く必要なく、またマルチチャネルの利点を生かすこ
とによって簡単な構成を付加するだけで高音質化が達成
可能となる。As described above, in the high efficiency coding apparatus of the present invention, when there is a redundant channel including a redundant digital signal among a plurality of channels, the digital signal of this redundant channel is deleted and the redundant channel Since the number of allocated bits that should have been used for compression encoding of digital signals is used for compression encoding of digital signals of priority channels for which high quality compression encoding is desired, compression algorithm, recording, transmission There is no need to change the format, and by taking advantage of multi-channel, high sound quality can be achieved by adding a simple configuration.
【0123】また、本発明のインタフェース装置におい
ては、所定の信号処理が施されたディジタルデータのデ
ータ領域とそれ以外の情報領域とを少なくとも有する既
存のフォーマットの当該データ領域に所定の圧縮符号化
処理を施した複数のチャネルのディジタル信号を挿入、
及び/又は、既存のフォーマットのデータ領域に挿入さ
れた所定の圧縮符号化処理が施された複数のチャネルの
ディジタル信号を各チャネル毎に分離することで、簡単
な構成を付加するのみで既存のフォーマットとの互換性
を確保可能としている。Further, in the interface apparatus of the present invention, the predetermined compression coding processing is performed on the data area of the existing format having at least the data area of the digital data which has been subjected to the predetermined signal processing and the other information area. Insert digital signals of multiple channels,
And / or by separating the digital signals of a plurality of channels, which are inserted into the data area of the existing format and which have been subjected to the predetermined compression encoding processing, for each channel, the existing structure is added only by adding a simple configuration. It is possible to ensure compatibility with the format.
【図1】本発明実施例の高能率符号化及び復号化装置に
おける高音質モードの動作を説明するための図である。FIG. 1 is a diagram for explaining an operation in a high sound quality mode in a high efficiency encoding and decoding device according to an embodiment of the present invention.
【図2】優先チャネルのデータを複数帯域に分割して圧
縮符号化する構成を説明するためのブロック回路図であ
る。FIG. 2 is a block circuit diagram for explaining a configuration in which data of a priority channel is divided into a plurality of bands and compression-encoded.
【図3】複数帯域に分割されて圧縮符号化された優先チ
ャネルのデータを伸張復号化して合成する構成を説明す
るためのブロック回路図である。FIG. 3 is a block circuit diagram for explaining a configuration for decompressing, decoding, and synthesizing data of a priority channel divided into a plurality of bands and compression-coded.
【図4】本発明実施例装置における通常モードの動作を
説明するための図である。FIG. 4 is a diagram for explaining an operation in a normal mode in the device of the embodiment of the present invention.
【図5】本実施例のフォーマット変換時の記録フォーマ
ットのうちのフレームのフォーマットを説明するための
図である。FIG. 5 is a diagram for explaining a frame format of a recording format at the time of format conversion of the present embodiment.
【図6】本実施例のフォーマット変換時の記録フォーマ
ットのうちのコントロールコード領域のフォーマットを
説明するための図である。FIG. 6 is a diagram for explaining the format of a control code area in the recording format at the time of format conversion of the present embodiment.
【図7】本実施例のフォーマット変換時の記録フォーマ
ットのうちのデータインフォメーション領域のフォーマ
ットを説明するための図である。FIG. 7 is a diagram for explaining a format of a data information area of a recording format at the time of format conversion of the present embodiment.
【図8】本実施例装置のフォーマット変換ポストエンコ
ーダを示す図である。FIG. 8 is a diagram showing a format conversion post encoder of the apparatus of the present embodiment.
【図9】本実施例装置のフォーマット変換プリデコーダ
を示す図である。FIG. 9 is a diagram showing a format conversion predecoder of the device of the present embodiment.
【図10】本実施例のフォーマット変換を映像同期シス
テムに適用した例を示す図である。FIG. 10 is a diagram showing an example in which the format conversion of the present embodiment is applied to a video synchronization system.
【図11】本実施例の圧縮符号化回路の構成例を示すブ
ロック回路図である。FIG. 11 is a block circuit diagram showing a configuration example of a compression encoding circuit of the present embodiment.
【図12】本実施例装置での信号の周波数及び時間分割
を示す図である。FIG. 12 is a diagram showing frequency and time division of a signal in the device of this embodiment.
【図13】情報信号の大きさ及び聴覚許容雑音スペクト
ルの2者を用いたビット配分手法を実現する構成を示す
ブロック回路図である。FIG. 13 is a block circuit diagram showing a configuration for implementing a bit allocation method using two parties of the magnitude of an information signal and the permissible noise spectrum of hearing.
【図14】許容雑音レベルを求める構成を示すブロック
回路図である。FIG. 14 is a block circuit diagram showing a configuration for obtaining an allowable noise level.
【図15】各帯域の信号レベルによるマスキングスレシ
ョールドの例を示す図である。FIG. 15 is a diagram showing an example of a masking threshold depending on the signal level of each band.
【図16】情報スペクトル、マスキングスレショール
ド、最小可聴限を示す図である。FIG. 16 is a diagram showing an information spectrum, a masking threshold, and a minimum audible limit.
【図17】本実施例の高能率復号化装置の伸張復号化回
路の構成例を示すブロック回路図である。FIG. 17 is a block circuit diagram showing a configuration example of a decompression decoding circuit of the high efficiency decoding device according to the present embodiment.
521 〜52m ,52n ・・・圧縮符号化回路 53・・・・・・・・・・・記録媒体 541 〜54m ,54n ・・・伸張復号化回路 60・・・・・・・・・・・分割回路 61・・・・・・・・・・・削除回路 62・・・・・・・・・・・合成回路 63・・・・・・・・・・・無音データ生成回路 70・・・・・・・・・・・周波数帯域分割処理回路 90・・・・・・・・・・・信号合成処理回路 30・・・・・・・・・・・フォーマット変換ポストエ
ンコーダ 35・・・・・・・・・・・フォーマット変換プリデコ
ーダ 40・・・・・・・・・・・映像装置 41・・・・・・・・・・・デコーダ 11、12・・・・・・・・QMF回路 13、14、15・・・・・MDCT回路 16、17、18・・・・・適応ビット配分符号化回路 19、20、21・・・・・ブロックサイズ決定回路 22、24、26・・・・・符号化出力端子 23、25、27・・・・・ブロックサイズ情報出力端
子 116、117、118・・・適応ビット配分復号化回
路 113、114、115・・・IMDCT回路 112、111・・・IQMF回路 520・・・許容雑音算出回路 521・・・許容雑音算出回路入力端子 522・・・帯域毎のエネルギ検出回路 523・・・畳込みフィルタ回路 524・・・引算器 525・・・n−ai関数発生回路 526・・・割算器 527・・・合成回路 528・・・減算器 530・・・許容雑音補正回路 532・・・最小可聴カーブ発生回路 533・・・補正情報出力回路 801・・・MDCT回路出力端子 802・・・使用可能総ビット発生回路 803・・・帯域毎のエネルギ算出回路 804・・・エネルギー依存のビット配分回路 805・・・聴覚許容雑音レベル依存のビット配分回路 806・・・アダー 807・・・各帯域のビット割当量出力端子 808・・・スペクトルの滑らかさ算出回路 809・・・ビット分割率決定回路 811、812・・・マルチプライヤ52 1 to 52 m , 52 n ... Compression encoding circuit 53 ... Recording medium 54 1 to 54 m , 54 n Decompression decoding circuit 60 ...・ ・ ・ ・ ・ ・ Splitting circuit 61 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ Delete circuit 62 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ Combining circuit 63 ・ ・ ・ ・ ・ ・ Silence data Generation circuit 70 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ Frequency band division processing circuit 90 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ Signal synthesis processing circuit 30 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ Format conversion post Encoder 35 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ Format conversion predecoder 40 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ Video device 41 ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ Decoder 11, 12 ・ ・ ・... QMF circuit 13, 14, 15 ... MDCT circuit 16, 17, 18 ... Adaptive bit allocation coding circuit 19, 20, 21 ... Block size determination circuit 22, 24, 26 ... Encoding output terminal 23, 25, 27 ... Block size information output terminal 116, 117, 118 ... Adaptive bit allocation decoding circuit 113, 114, 115 ... IMDCT circuit 112, 111 ... IQMF circuit 520 ... Allowable noise calculation circuit 521 ... Allowable noise calculation circuit input terminal 522 ... For each band Energy detection circuit 523 ... Convolution filter circuit 524 ... Subtractor 525 ... n-ai function generation circuit 526 ... Divider 527 ... Synthesis circuit 528 ... Subtractor 530 ... -Allowable noise correction circuit 532 ... Minimum audible curve generation circuit 533 ... Correction information output circuit 801 ... MDCT circuit output terminal 802 ... Usable total bits Raw circuit 803 ... Energy calculation circuit for each band 804 ... Energy-dependent bit allocation circuit 805 ... Auditory permissible noise level-dependent bit allocation circuit 806 ... Adder 807 ... Bit allocation amount of each band Output terminal 808 ... Spectrum smoothness calculation circuit 809 ... Bit division rate determination circuit 811, 812 ... Multiplier
Claims (5)
れぞれ所定の割当ビット数を用いて圧縮符号化する圧縮
符号化手段と、 複数のチャネルのうち冗長なディジタル信号を含むチャ
ネルがあるとき、当該冗長なディジタル信号を含む少な
くとも1つのチャネルを冗長チャネルとして決定する冗
長チャネル決定手段と、 上記冗長チャネルが決定されたとき、上記複数のチャネ
ルから上記冗長チャネルを除く少なくとも1つのチャネ
ルを優先チャネルとして決定する優先チャネル決定手段
とを有し、 上記優先チャネルのディジタル信号の圧縮符号化は、当
該優先チャネルに対応する上記所定の割当ビット数及び
上記冗長チャネルに対応する上記所定の割当ビット数を
用いて行うことを特徴とする高能率符号化装置。1. A compression coding means for compressing and coding each digital signal of a plurality of channels using a predetermined number of allocated bits, and when there is a channel including a redundant digital signal among the plurality of channels, the redundancy is provided. Redundant channel determining means for determining at least one channel including a digital signal as a redundant channel, and when the redundant channel is determined, at least one channel excluding the redundant channel from the plurality of channels is determined as a priority channel. Priority channel determining means, and compression coding of the digital signal of the priority channel is performed using the predetermined number of allocated bits corresponding to the priority channel and the predetermined number of allocated bits corresponding to the redundant channel. A high-efficiency coding device characterized by the above.
ィジタル信号をそれぞれ複数の周波数帯域に分割し、各
チャネル毎にディジタル信号の特性を求め、当該ディジ
タル信号の特性に応じて各チャネルの上記割当ビット数
を各帯域毎に分配して上記圧縮符号化を行うことを特徴
とする請求項1記載の高能率符号化装置。2. The compression coding means divides the digital signal of each channel into a plurality of frequency bands, obtains the characteristics of the digital signal for each channel, and determines the characteristics of each channel according to the characteristics of the digital signal. 2. The high efficiency coding apparatus according to claim 1, wherein the compression coding is performed by distributing the number of allocated bits for each band.
ャネルのディジタル信号を複数の周波数帯域に分割する
分割手段を備えてなり、当該分割手段の出力を上記圧縮
符号化手段に送ることを特徴とする請求項1又は2記載
の高能率符号化装置。3. The priority channel determining means comprises a dividing means for dividing the digital signal of the priority channel into a plurality of frequency bands, and the output of the dividing means is sent to the compression encoding means. The high efficiency encoding device according to claim 1.
ャネルのディジタル信号を削除する削除手段を備えてな
り、当該削除手段により上記冗長チャネルのディジタル
信号を圧縮符号化前に削除することを特徴とする請求項
1記載の高能率符号化装置。4. The redundant channel determining means includes deleting means for deleting the digital signal of the redundant channel, and the deleting means deletes the digital signal of the redundant channel before compression encoding. The high efficiency encoding device according to claim 1.
ータのデータ領域とそれ以外の情報領域とを少なくとも
有するフォーマットの当該データ領域に所定の圧縮符号
化処理を施した複数のチャネルのディジタル信号を挿
入、及び/又は、所定の信号処理が施されたディジタル
データのデータ領域とそれ以外の情報領域とを少なくと
も有するフォーマットの信号の当該データ領域に挿入さ
れた所定の圧縮符号化処理が施された複数のチャネルの
ディジタル信号を各チャネル毎に分離するフォーマット
変換手段を具備してなることを特徴とするインタフェー
ス装置。5. A digital signal of a plurality of channels in which a predetermined compression coding process is applied to a data area of a format having at least a data area of digital data subjected to a predetermined signal processing and an information area other than the data area. Inserted and / or subjected to predetermined compression encoding processing inserted into the data area of a signal of a format having at least a data area of digital data subjected to predetermined signal processing and an information area other than that. An interface device comprising format conversion means for separating digital signals of a plurality of channels for each channel.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26513893A JP3362476B2 (en) | 1993-10-22 | 1993-10-22 | High efficiency coding device and interface device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26513893A JP3362476B2 (en) | 1993-10-22 | 1993-10-22 | High efficiency coding device and interface device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07121194A true JPH07121194A (en) | 1995-05-12 |
JP3362476B2 JP3362476B2 (en) | 2003-01-07 |
Family
ID=17413159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26513893A Expired - Fee Related JP3362476B2 (en) | 1993-10-22 | 1993-10-22 | High efficiency coding device and interface device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3362476B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009532735A (en) * | 2006-04-03 | 2009-09-10 | エルジー エレクトロニクス インコーポレイティド | Media signal processing apparatus and method |
-
1993
- 1993-10-22 JP JP26513893A patent/JP3362476B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009532735A (en) * | 2006-04-03 | 2009-09-10 | エルジー エレクトロニクス インコーポレイティド | Media signal processing apparatus and method |
Also Published As
Publication number | Publication date |
---|---|
JP3362476B2 (en) | 2003-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3404837B2 (en) | Multi-layer coding device | |
JP3277679B2 (en) | High efficiency coding method, high efficiency coding apparatus, high efficiency decoding method, and high efficiency decoding apparatus | |
US5737720A (en) | Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation | |
Noll | MPEG digital audio coding | |
JP3498375B2 (en) | Digital audio signal recording device | |
JP2693893B2 (en) | Stereo speech coding method | |
US6104321A (en) | Efficient encoding method, efficient code decoding method, efficient code encoding apparatus, efficient code decoding apparatus, efficient encoding/decoding system, and recording media | |
JP3397001B2 (en) | Encoding method and apparatus, decoding apparatus, and recording medium | |
JP3250376B2 (en) | Information encoding method and apparatus, and information decoding method and apparatus | |
JPH05313694A (en) | Data compressing and expanding device | |
JP3227942B2 (en) | High efficiency coding device | |
US20010047256A1 (en) | Multi-format recording medium | |
JPH0846517A (en) | High efficiency coding and decoding system | |
WO1995016263A1 (en) | Information processing method, information processing device and media | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
JP3362476B2 (en) | High efficiency coding device and interface device | |
JP3528260B2 (en) | Encoding device and method, and decoding device and method | |
JP2852862B2 (en) | Method and apparatus for converting PCM audio signal | |
JPH09102742A (en) | Encoding method and device, decoding method and device and recording medium | |
JP3341448B2 (en) | Efficient encoding method for multi-channel audio data | |
JPH07181996A (en) | Information processing method, information processor and media | |
JPH07161142A (en) | Recording method, recording medium and reproducing method | |
JP3227948B2 (en) | Decryption device | |
JPH07161140A (en) | Apparatuses and methods for transmission and receiving of digital audio signal | |
JPH07135470A (en) | High efficiency coder, high efficiency decoder and medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020924 |
|
LAPS | Cancellation because of no payment of annual fees |