JP3528260B2 - 符号化装置及び方法、並びに復号化装置及び方法 - Google Patents
符号化装置及び方法、並びに復号化装置及び方法Info
- Publication number
- JP3528260B2 JP3528260B2 JP20670294A JP20670294A JP3528260B2 JP 3528260 B2 JP3528260 B2 JP 3528260B2 JP 20670294 A JP20670294 A JP 20670294A JP 20670294 A JP20670294 A JP 20670294A JP 3528260 B2 JP3528260 B2 JP 3528260B2
- Authority
- JP
- Japan
- Prior art keywords
- bit allocation
- signal
- channel
- allocation amount
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【産業上の利用分野】本発明は、映画フィルム映写シス
テム、ビデオデープレコーダ、ビデオディスクプレーヤ
等のステレオや、いわゆるマルチサウンド音響システム
において用いられる、マルチチャンネルのオーディオ信
号を圧縮符号化する符号化装置及び方法、並びに圧縮符
号化された信号を復号化する復号化装置及び方法に関す
るものである。
テム、ビデオデープレコーダ、ビデオディスクプレーヤ
等のステレオや、いわゆるマルチサウンド音響システム
において用いられる、マルチチャンネルのオーディオ信
号を圧縮符号化する符号化装置及び方法、並びに圧縮符
号化された信号を復号化する復号化装置及び方法に関す
るものである。
【0002】
【従来の技術】オーディオ或いは音声等の信号の高能率
符号化の手法及び装置には種々のものが知られている。
符号化の手法及び装置には種々のものが知られている。
【0003】その手法としては、例えば、時間領域のオ
ーディオ信号等を単位時間毎にブロック化してこのブロ
ック毎の時間軸の信号を周波数軸上の信号に変換(直交
変換)して複数の周波数帯域に分割し、各帯域毎に符号
化するブロック化周波数帯域分割方式、いわゆる変換符
号化(トランスフォームコーティング)がある。
ーディオ信号等を単位時間毎にブロック化してこのブロ
ック毎の時間軸の信号を周波数軸上の信号に変換(直交
変換)して複数の周波数帯域に分割し、各帯域毎に符号
化するブロック化周波数帯域分割方式、いわゆる変換符
号化(トランスフォームコーティング)がある。
【0004】また、時間領域のオーディオ信号等を単位
時間毎にブロック化しないで、複数の周波数帯域に分割
して符号化する非ブロック化周波数帯域分割方式である
帯域分割符号化(サブバンドコーディング:SBC)等
を挙げることができる。
時間毎にブロック化しないで、複数の周波数帯域に分割
して符号化する非ブロック化周波数帯域分割方式である
帯域分割符号化(サブバンドコーディング:SBC)等
を挙げることができる。
【0005】さらに、上述の帯域分割符号化と変換符号
化とを組み合わせた高能率符号化の手法及び装置も考え
られている。この場合には、例えば、入力信号を上記帯
域分割符号化で帯域分割した後、各帯域毎の信号を周波
数領域の信号に直交変換し、この直交変換された各帯域
毎の成分に符号化を施す。
化とを組み合わせた高能率符号化の手法及び装置も考え
られている。この場合には、例えば、入力信号を上記帯
域分割符号化で帯域分割した後、各帯域毎の信号を周波
数領域の信号に直交変換し、この直交変換された各帯域
毎の成分に符号化を施す。
【0006】ここで、上述した帯域分割符号化の帯域分
割用フィルタとしては、例えばQMF等のフィルタがあ
り、これは例えば、文献「ディジタル・コーディング・
オブ・スピーチ・イン・サブバンズ」("Digital coding
of speech in subbands" R.E.Crochiere, Bell Syst.
Tech. J., Vol.55,No.8 1976) に述べられている。この
QMFのフィルタは、帯域を等バンド幅に2分割するも
のであり、当該フィルタにおいては上記分割した帯域を
後に合成する際にいわゆるエリアシングが発生しないこ
とが特徴となっている。
割用フィルタとしては、例えばQMF等のフィルタがあ
り、これは例えば、文献「ディジタル・コーディング・
オブ・スピーチ・イン・サブバンズ」("Digital coding
of speech in subbands" R.E.Crochiere, Bell Syst.
Tech. J., Vol.55,No.8 1976) に述べられている。この
QMFのフィルタは、帯域を等バンド幅に2分割するも
のであり、当該フィルタにおいては上記分割した帯域を
後に合成する際にいわゆるエリアシングが発生しないこ
とが特徴となっている。
【0007】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
このポリフェイズ・クァドラチュア・フィルタにおいて
は、信号を等バンド幅の複数の帯域に分割する際に一度
に分割できることが特徴となっている。
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
このポリフェイズ・クァドラチュア・フィルタにおいて
は、信号を等バンド幅の複数の帯域に分割する際に一度
に分割できることが特徴となっている。
【0008】さらに、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、ブロック毎に高速フーリエ変換(FF
T)、離散コサイン変換(DCT)、モディファイドD
CT変換(MDCT)などを行うことで時間軸を周波数
軸に変換するような直交変換がある。
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、ブロック毎に高速フーリエ変換(FF
T)、離散コサイン変換(DCT)、モディファイドD
CT変換(MDCT)などを行うことで時間軸を周波数
軸に変換するような直交変換がある。
【0009】このMDCTについては、文献「時間領域
エリアシング・キャンセルを基礎とするフィルタ・バン
ク設計を用いたサブバンド/変換符号化」("Subband/Tr
ansform Coding Using Filter Bank Designs Based on
Time Domain Aliasing Cancellation," J.P.Princen A.
B.Bradley, Univ. of Surrey Royal Melbourne Inst.of
Tech. ICASSP 1987)に述べられている。
エリアシング・キャンセルを基礎とするフィルタ・バン
ク設計を用いたサブバンド/変換符号化」("Subband/Tr
ansform Coding Using Filter Bank Designs Based on
Time Domain Aliasing Cancellation," J.P.Princen A.
B.Bradley, Univ. of Surrey Royal Melbourne Inst.of
Tech. ICASSP 1987)に述べられている。
【0010】更に、周波数帯域分割された各周波数成分
を量子化する場合の周波数分割幅としては、例えば人間
の聴覚特性を考慮した帯域分割がある。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
程帯域幅が広くなるような帯域幅で、オーディオ信号を
複数(例えば25バンド)の帯域に分割することがあ
る。
を量子化する場合の周波数分割幅としては、例えば人間
の聴覚特性を考慮した帯域分割がある。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
程帯域幅が広くなるような帯域幅で、オーディオ信号を
複数(例えば25バンド)の帯域に分割することがあ
る。
【0011】また、この時の各帯域毎のデータを符号化
する際には、各帯域毎に所定のビット配分(Bit allocat
ion)或いは、各帯域毎に適応的なビット配分による符号
化が行われる。
する際には、各帯域毎に所定のビット配分(Bit allocat
ion)或いは、各帯域毎に適応的なビット配分による符号
化が行われる。
【0012】例えば、上記MDCT処理されて得られた
係数データを上記ビット配分によって符号化する際に
は、上記各ブロック毎のMDCT処理により得られる各
帯域毎のMDCT係数データに対して、適応的な配分ビ
ット数で符号化が行われることになる。
係数データを上記ビット配分によって符号化する際に
は、上記各ブロック毎のMDCT処理により得られる各
帯域毎のMDCT係数データに対して、適応的な配分ビ
ット数で符号化が行われることになる。
【0013】上記ビット配分手法及びそのための装置と
しては、次の2手法及び装置が知られている。
しては、次の2手法及び装置が知られている。
【0014】例えば、文献「音声信号の適応変換符号
化」("Adaptive Transform Coding of Speech Signal
s", IEEE Transactions of Accoustics, Speech, and S
ignal Processing, vol.ASSP-25, No.4, August 1977
)では、各帯域毎の信号の大きさをもとに、ビット割
当を行っている。
化」("Adaptive Transform Coding of Speech Signal
s", IEEE Transactions of Accoustics, Speech, and S
ignal Processing, vol.ASSP-25, No.4, August 1977
)では、各帯域毎の信号の大きさをもとに、ビット割
当を行っている。
【0015】また、例えば文献「臨界帯域符号化器 −
聴覚システムの知覚の要求に関するディジタル符号化」
("The critical band coder --digital encoding of
theperceptual requirements of the auditory syste
m", M.A.Kransner MIT, ICASSP 1980)では、聴覚マス
キングを利用することで、各帯域毎に必要な信号対雑音
比を得て固定的なビット割当を行う手法及び装置が述べ
られている。
聴覚システムの知覚の要求に関するディジタル符号化」
("The critical band coder --digital encoding of
theperceptual requirements of the auditory syste
m", M.A.Kransner MIT, ICASSP 1980)では、聴覚マス
キングを利用することで、各帯域毎に必要な信号対雑音
比を得て固定的なビット割当を行う手法及び装置が述べ
られている。
【0016】
【発明が解決しようとする課題】ところで、例えば上述
したようなサブバンドコーディング等を用いたオーディ
オ信号の高能率圧縮符号化方式においては、人間の聴覚
上の特性を利用し、オーディオデータを約1/5に圧縮
するような方式が既に実用化されている。
したようなサブバンドコーディング等を用いたオーディ
オ信号の高能率圧縮符号化方式においては、人間の聴覚
上の特性を利用し、オーディオデータを約1/5に圧縮
するような方式が既に実用化されている。
【0017】なお、このオーディオデータを約1/5に
圧縮する高能率符号化方式としては、例えばMD(SONY
社商標、Mini Disc)規格に使用されている、ATRAC
(SONY社商標、Adaptive TRansform Acoustic Coding)
と呼ばれる方式がある。
圧縮する高能率符号化方式としては、例えばMD(SONY
社商標、Mini Disc)規格に使用されている、ATRAC
(SONY社商標、Adaptive TRansform Acoustic Coding)
と呼ばれる方式がある。
【0018】しかし、上記人間の聴覚上の特性を利用し
た高能率符号化方式では、圧縮符号化してその後復号化
して得られる楽器や人間の声などが、わずかながら、原
音から変化してしまうといった事例も見られる。特に原
音の忠実な再現が必要な記録メデイアの記録フォーマッ
トに用いる場合には、その高音質化が要求されている。
た高能率符号化方式では、圧縮符号化してその後復号化
して得られる楽器や人間の声などが、わずかながら、原
音から変化してしまうといった事例も見られる。特に原
音の忠実な再現が必要な記録メデイアの記録フォーマッ
トに用いる場合には、その高音質化が要求されている。
【0019】これに対し、上記オーディオ信号を約1/
5に圧縮するような高能率符号化方式(ATRAC方式
等)のフォーマットは、既に実用化されていて、このフ
ォーマットが採用されたハードウェアも広まりつつあ
る。
5に圧縮するような高能率符号化方式(ATRAC方式
等)のフォーマットは、既に実用化されていて、このフ
ォーマットが採用されたハードウェアも広まりつつあ
る。
【0020】したがって、上記フォーマットの互換性の
無い変更や拡張をすることは、上記フォーマットを使用
してきた生産者だけでなく、一般の使用者にも不利益と
なる。
無い変更や拡張をすることは、上記フォーマットを使用
してきた生産者だけでなく、一般の使用者にも不利益と
なる。
【0021】このため、フォーマット自身は変更せず
に、エンコードやデコードの際に工夫することによる高
音質化の達成が望まれている。
に、エンコードやデコードの際に工夫することによる高
音質化の達成が望まれている。
【0022】なお、高音質化の方法としては、他にリニ
アPCM音声を混在させることが考えられる。しかし、
上記高能率符号化方式の圧縮データとリニアデータとで
は、フレームの長さや1フレーム当たりの時間長が異な
るため、再生時に同期を取ることが難しい。従って、こ
れら2つのフォーマットのデータを同時に用いることは
非常に困難である。
アPCM音声を混在させることが考えられる。しかし、
上記高能率符号化方式の圧縮データとリニアデータとで
は、フレームの長さや1フレーム当たりの時間長が異な
るため、再生時に同期を取ることが難しい。従って、こ
れら2つのフォーマットのデータを同時に用いることは
非常に困難である。
【0023】さらに、通常のオーディオ機器の場合のみ
ならず、例えば映画フィルム映写システム、高品位テレ
ビジョン、ビデオテープレコーダ、ビデオディスクプレ
ーヤ等のステレオないしはマルチサウンド音響システム
においては、4〜8チャンネルの複数チャンネルのオー
ディオ信号を扱うようになりつつある。この場合におい
ても、ビットレートを削減する高能率符号化を行うこと
が望まれている。
ならず、例えば映画フィルム映写システム、高品位テレ
ビジョン、ビデオテープレコーダ、ビデオディスクプレ
ーヤ等のステレオないしはマルチサウンド音響システム
においては、4〜8チャンネルの複数チャンネルのオー
ディオ信号を扱うようになりつつある。この場合におい
ても、ビットレートを削減する高能率符号化を行うこと
が望まれている。
【0024】特に、上記映画フィルムにおいて、例えば
レフトチャンネル,レフトセンターチャンネル,センタ
ーチャンネル,ライトセンターチャンネル,ライトチャ
ンネル,サラウンドレフトチャンネル,サラウンドライ
トチャンネル,サブウーファーチャンネルの8チャンネ
ルのディジタルオーディオ信号を記録するような場合が
ある。この場合には、上記ビットレートを削減する高能
率符号化が必要となる。
レフトチャンネル,レフトセンターチャンネル,センタ
ーチャンネル,ライトセンターチャンネル,ライトチャ
ンネル,サラウンドレフトチャンネル,サラウンドライ
トチャンネル,サブウーファーチャンネルの8チャンネ
ルのディジタルオーディオ信号を記録するような場合が
ある。この場合には、上記ビットレートを削減する高能
率符号化が必要となる。
【0025】すなわち、いわゆるCD(コンパクトディ
スク)などで用いているようなサンプリング周波数4
4.1kHzで16ビットの直線量子化されたオーディ
オデータの上記8チャンネル分を記録できる領域を、上
記映画フィルム上に確保することは困難である。したが
って、当該オーディオデータの圧縮が必要になる。
スク)などで用いているようなサンプリング周波数4
4.1kHzで16ビットの直線量子化されたオーディ
オデータの上記8チャンネル分を記録できる領域を、上
記映画フィルム上に確保することは困難である。したが
って、当該オーディオデータの圧縮が必要になる。
【0026】なお、上記映画フィルムに記録する8チャ
ンネルの各チャンネルは、例えば映画フィルムの画像記
録領域から再生された画像が映写機によって投影される
スクリーン側に配置された、レフトスピーカ、レフトセ
ンタースピーカ、センタスピーカ、ライトセンタスピー
カ、ライトスピーカ、サラウンドレフトスピーカ、サラ
ウンドライトスピーカ、サブウーファースピーカとそれ
ぞれ対応するものである。
ンネルの各チャンネルは、例えば映画フィルムの画像記
録領域から再生された画像が映写機によって投影される
スクリーン側に配置された、レフトスピーカ、レフトセ
ンタースピーカ、センタスピーカ、ライトセンタスピー
カ、ライトスピーカ、サラウンドレフトスピーカ、サラ
ウンドライトスピーカ、サブウーファースピーカとそれ
ぞれ対応するものである。
【0027】ここで、上記センタスピーカは、スクリー
ン側の中央に配置され、センタチャンネルのオーディオ
データによる再生音を出力するものである。例えば俳優
のせりふ等の最も重要な再生音を出力する。
ン側の中央に配置され、センタチャンネルのオーディオ
データによる再生音を出力するものである。例えば俳優
のせりふ等の最も重要な再生音を出力する。
【0028】上記サブウーファースピーカは、サブウー
ファーチャンネルのオーディオデータによる再生音を出
力するものである。例えば爆発音などの低域の音という
よりは振動として感じられる音を効果的に出力するもの
であり、爆発シーンなどに効果的に使用されることが多
いものである。
ファーチャンネルのオーディオデータによる再生音を出
力するものである。例えば爆発音などの低域の音という
よりは振動として感じられる音を効果的に出力するもの
であり、爆発シーンなどに効果的に使用されることが多
いものである。
【0029】上記レフトスピーカ及びライトスピーカ
は、上記スクリーンの左右に配置され、レフトチャンネ
ルのオーディオデータによる再生音とライトチャンネル
のオーディオデータによる再生音を出力するもので、ス
テレオ音響効果を発揮する。
は、上記スクリーンの左右に配置され、レフトチャンネ
ルのオーディオデータによる再生音とライトチャンネル
のオーディオデータによる再生音を出力するもので、ス
テレオ音響効果を発揮する。
【0030】上記レフトセンタスピーカは、上記レフト
スピーカとセンタスピーカとの間に配置され、また上記
ライトセンタスピーカは、上記センタスピーカとライト
スピーカとの間に配置されるものである。上記レフトセ
ンタスピーカは、レフトセンタチャンネルのオーディオ
データによる再生音を出力し、上記ライトセンタスピー
カは、ライトセンタチャンネルのオーディオデータによ
る再生音を出力するものである。それぞれ上記レフトス
ピーカ若しくはライトスピーカの補助的な役割を果た
す。
スピーカとセンタスピーカとの間に配置され、また上記
ライトセンタスピーカは、上記センタスピーカとライト
スピーカとの間に配置されるものである。上記レフトセ
ンタスピーカは、レフトセンタチャンネルのオーディオ
データによる再生音を出力し、上記ライトセンタスピー
カは、ライトセンタチャンネルのオーディオデータによ
る再生音を出力するものである。それぞれ上記レフトス
ピーカ若しくはライトスピーカの補助的な役割を果た
す。
【0031】特にスクリーンが大きく収容人数の多い映
画館等では、座席の位置によって音像の定位が不安定に
なるという欠点がある。しかし、上記レフトセンタスピ
ーカとライトセンタスピーカを付加することにより、音
像のよりリアルな定位を作り出すのに効果を発揮する。
画館等では、座席の位置によって音像の定位が不安定に
なるという欠点がある。しかし、上記レフトセンタスピ
ーカとライトセンタスピーカを付加することにより、音
像のよりリアルな定位を作り出すのに効果を発揮する。
【0032】さらに、上記サラウンドレフトスピーカと
サラウンドライトスピーカは、観客席を取り囲むように
配置される。サラウンドレフトチャンネルのオーディオ
データによる再生音と、サラウンドライトチャンネルの
オーディオデータによる再生音を出力するもので、残響
音や拍手、歓声に包まれた印象を与える効果がある。こ
れにより、より立体的な音像を作り出すことができる。
サラウンドライトスピーカは、観客席を取り囲むように
配置される。サラウンドレフトチャンネルのオーディオ
データによる再生音と、サラウンドライトチャンネルの
オーディオデータによる再生音を出力するもので、残響
音や拍手、歓声に包まれた印象を与える効果がある。こ
れにより、より立体的な音像を作り出すことができる。
【0033】また、映画フィルムという媒体は、表面に
傷などが発生しやすいため、ディジタルデータをオリジ
ナルのまま記録していたのでは、データ欠けが激しく実
用にならない。このため、エラー訂正符号の能力が非常
に重要である。
傷などが発生しやすいため、ディジタルデータをオリジ
ナルのまま記録していたのでは、データ欠けが激しく実
用にならない。このため、エラー訂正符号の能力が非常
に重要である。
【0034】従って、上記データ圧縮は、その訂正符号
のためのビットも考慮して、上記フィルム上の記録領域
に記録可能な程度まで圧縮処理を行う必要がある。
のためのビットも考慮して、上記フィルム上の記録領域
に記録可能な程度まで圧縮処理を行う必要がある。
【0035】以上より、上記8チャンネルのディジタル
オーディオデータを圧縮する圧縮方法としては、上述し
たような人間の聴覚の特性を考慮して最適なビット割り
当てを行うことによって、CD並の音質を達成する前記
高能率符号化方式(例えば上記ATRAC方式)を適用
するようにしている。
オーディオデータを圧縮する圧縮方法としては、上述し
たような人間の聴覚の特性を考慮して最適なビット割り
当てを行うことによって、CD並の音質を達成する前記
高能率符号化方式(例えば上記ATRAC方式)を適用
するようにしている。
【0036】しかし、当該高能率符号化方式では、前述
同様に一般の楽器や人間の声などが原音からわずかなが
ら変化するため、特に原音に忠実な再現を必要とする記
録フォーマットに採用する場合には、何らかの高音質化
の手段が必要となってくる。
同様に一般の楽器や人間の声などが原音からわずかなが
ら変化するため、特に原音に忠実な再現を必要とする記
録フォーマットに採用する場合には、何らかの高音質化
の手段が必要となってくる。
【0037】そしてこの問題は、上記映画フィルムにお
いて、マルチチャンネル記録フォーマットとして、上記
高能率符号化方式以外を用いた場合、記録領域確保の点
から非可逆圧縮を採用する以上、常に存在する問題であ
る。
いて、マルチチャンネル記録フォーマットとして、上記
高能率符号化方式以外を用いた場合、記録領域確保の点
から非可逆圧縮を採用する以上、常に存在する問題であ
る。
【0038】また、上述のようなマルチチャンネルのオ
ーディオ信号を高能率符号化する方式では、各チャンネ
ルが独立して圧縮処理が行われる。
ーディオ信号を高能率符号化する方式では、各チャンネ
ルが独立して圧縮処理が行われる。
【0039】そのため、例えば、ある1つのチャンネル
が無音状態であっても、そのチャンネルに固定ビット
(バイト)配分量が割り当てられることになる。
が無音状態であっても、そのチャンネルに固定ビット
(バイト)配分量が割り当てられることになる。
【0040】このように、無音状態のチャンネルに固定
のビット配分量を与えることは、冗長である。
のビット配分量を与えることは、冗長である。
【0041】また、レベルの低い信号のチャンネルと、
高い信号のチャンネルとについても、ビット配分量が同
じであるため、各チャンネルにわたってビット配分量を
評価すると、冗長なビットが存在する。
高い信号のチャンネルとについても、ビット配分量が同
じであるため、各チャンネルにわたってビット配分量を
評価すると、冗長なビットが存在する。
【0042】特に、各チャンネル毎にビット配分量が固
定されている場合には、上記のような冗長がさらに顕著
になると考えられる。
定されている場合には、上記のような冗長がさらに顕著
になると考えられる。
【0043】そこで、本発明は、上述したようなことに
鑑み、マルチチャンネルでの圧縮符号化の際のビット配
分量の冗長を無くすと共に、圧縮符号化復号化の高品位
化を可能とする符号化装置及び方法、並びに復号化装置
及び方法を提供することを目的としている。
鑑み、マルチチャンネルでの圧縮符号化の際のビット配
分量の冗長を無くすと共に、圧縮符号化復号化の高品位
化を可能とする符号化装置及び方法、並びに復号化装置
及び方法を提供することを目的としている。
【0044】
【課題を解決するための手段】本発明は、上述の目的を
達成するために提案されたものであり、本発明の符号化
方法が適用される符号化装置(高能率符号化装置)は、
複数チャンネルの信号を各々圧縮符号化する圧縮符号化
手段と、上記圧縮符号化前の各チャンネルの信号のエネ
ルギを検出するエネルギ検出手段と、上記エネルギの時
間的な変化に基づいて各チャンネルへのビット配分量を
決定するビット配分量決定手段とを有し、上記エネルギ
とビット配分量との関係が、信号エネルギが所定の第1
の値より小さいときに略々平坦なビット配分特性を有す
るとともに、信号エネルギが所定の第2の値より大きい
ときにビット配分が減少する特性を有し、全体として信
号のエネルギの増加に伴ってビット配分量が増加する非
線形特性とされ、複数チャンネルの信号の時間領域サン
プル若しくは周波数領域サンプルに対してチャンネル間
で可変ビット配分を行うようにしたものである。
達成するために提案されたものであり、本発明の符号化
方法が適用される符号化装置(高能率符号化装置)は、
複数チャンネルの信号を各々圧縮符号化する圧縮符号化
手段と、上記圧縮符号化前の各チャンネルの信号のエネ
ルギを検出するエネルギ検出手段と、上記エネルギの時
間的な変化に基づいて各チャンネルへのビット配分量を
決定するビット配分量決定手段とを有し、上記エネルギ
とビット配分量との関係が、信号エネルギが所定の第1
の値より小さいときに略々平坦なビット配分特性を有す
るとともに、信号エネルギが所定の第2の値より大きい
ときにビット配分が減少する特性を有し、全体として信
号のエネルギの増加に伴ってビット配分量が増加する非
線形特性とされ、複数チャンネルの信号の時間領域サン
プル若しくは周波数領域サンプルに対してチャンネル間
で可変ビット配分を行うようにしたものである。
【0045】
【0046】
【0047】ここで、前記ビット配分量決定手段は、所
定の換算式から各チャンネルに配分すべきビット量の概
算量をそれぞれ求め、各チャンネルのビット配分量をそ
れぞれの概算量に比例して配分することによって全チャ
ンネルの総ビット配分量を一定とする。
定の換算式から各チャンネルに配分すべきビット量の概
算量をそれぞれ求め、各チャンネルのビット配分量をそ
れぞれの概算量に比例して配分することによって全チャ
ンネルの総ビット配分量を一定とする。
【0048】また、本発明の復号化方法が適用される復
号化装置(高能率復号化装置)は、上記符号化装置によ
って符号化された各チャンネルの信号を復号化する復号
化手段を有するものである。
号化装置(高能率復号化装置)は、上記符号化装置によ
って符号化された各チャンネルの信号を復号化する復号
化手段を有するものである。
【0049】
【0050】
【0051】
【0052】
【0053】
【作用】本発明によれば、複数チャンネルのオーディオ
データの圧縮符号化の際には、各チャンネルのエネルギ
の時間的な変化に基づいて、各チャンネルへのビット配
分量を決定して圧縮符号化を行うようにしているため、
各チャンネルに対してその情報量に見合ったビット配分
が可能となる。
データの圧縮符号化の際には、各チャンネルのエネルギ
の時間的な変化に基づいて、各チャンネルへのビット配
分量を決定して圧縮符号化を行うようにしているため、
各チャンネルに対してその情報量に見合ったビット配分
が可能となる。
【0054】また、本発明によれば、複数チャンネルの
オーディオデータの圧縮符号化の際には、各チャンネル
でのエネルギとビット配分量とが非線形に関係付けら
れ、そのビット配分量に基づき圧縮符号化を行うように
しているため、各チャンネルに対してその情報量に見合
ったビット配分が可能となる。
オーディオデータの圧縮符号化の際には、各チャンネル
でのエネルギとビット配分量とが非線形に関係付けら
れ、そのビット配分量に基づき圧縮符号化を行うように
しているため、各チャンネルに対してその情報量に見合
ったビット配分が可能となる。
【0055】
【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。
ながら説明する。
【0056】図1及び図2に本発明の第1の実施例装置
の基本的な構造を示す。図1には第1の実施例の高能率
符号化装置(エンコーダ)の構成を示し、図2には第1
の実施例の高能率復号化装置(デコーダ)の構成を示し
ている。
の基本的な構造を示す。図1には第1の実施例の高能率
符号化装置(エンコーダ)の構成を示し、図2には第1
の実施例の高能率復号化装置(デコーダ)の構成を示し
ている。
【0057】先ず、図1に示すエンコーダの構成につい
て説明する。
て説明する。
【0058】複数チャンネル(ch1,ch2,・・
・,chn)のオーディオ信号は、これら各チャンネル
に対応する各入力端子201 〜20n 及び伝送線路11
〜1nを経て、同じく各チャンネルに対応する標本化及
び量子化器1001 〜100nに送られる。これら標本
化及び量子化器1001 〜100n では各チャンネル
のオーディオ信号が量子化信号に変換される。これら各
標本化及び量子化器1001 〜100n からの量子化さ
れた信号は、各伝送線路21 〜2n を経て、振幅情報検
出回路200と、ディレイライン3001 〜300n に
送られる。
・,chn)のオーディオ信号は、これら各チャンネル
に対応する各入力端子201 〜20n 及び伝送線路11
〜1nを経て、同じく各チャンネルに対応する標本化及
び量子化器1001 〜100nに送られる。これら標本
化及び量子化器1001 〜100n では各チャンネル
のオーディオ信号が量子化信号に変換される。これら各
標本化及び量子化器1001 〜100n からの量子化さ
れた信号は、各伝送線路21 〜2n を経て、振幅情報検
出回路200と、ディレイライン3001 〜300n に
送られる。
【0059】上記振幅情報検出回路200は、上記各チ
ャンネルの量子化された信号から振幅情報を検出する。
すなわち、当該振幅情報検出回路200では、後述する
符号化器4001 〜400n が一度に処理するオーディ
オデータのサンプル数分の周期毎(以後時間ブロックと
呼ぶ)に振幅情報のピーク値を求め、各チャンネルに対
応する伝送線路41 〜4n を経て当該ピーク値をビット
配分決定回路500へ渡す。なお、当該振幅情報検出回
路200は、伝送線路11 〜1n からの信号によって振
幅情報を検出するような構成にすることも可能である。
ャンネルの量子化された信号から振幅情報を検出する。
すなわち、当該振幅情報検出回路200では、後述する
符号化器4001 〜400n が一度に処理するオーディ
オデータのサンプル数分の周期毎(以後時間ブロックと
呼ぶ)に振幅情報のピーク値を求め、各チャンネルに対
応する伝送線路41 〜4n を経て当該ピーク値をビット
配分決定回路500へ渡す。なお、当該振幅情報検出回
路200は、伝送線路11 〜1n からの信号によって振
幅情報を検出するような構成にすることも可能である。
【0060】上記ビット配分決定回路500では、上記
各チャンネル毎のピーク値から各チャンネル毎のビット
配分量を後述するように換算し、当該ビット配分量を伝
送線路51 〜5n を経て各符号化器4001 〜400n
に渡す。
各チャンネル毎のピーク値から各チャンネル毎のビット
配分量を後述するように換算し、当該ビット配分量を伝
送線路51 〜5n を経て各符号化器4001 〜400n
に渡す。
【0061】また、上記ディレイライン3001 〜30
0n では、伝送線路21 〜2n を介して受け取った信号
を上記時間ブロック分だけ遅延させ、当該遅延させた信
号を各伝送線路31 〜3n を介して各符号化器4001
〜400n へ渡す。
0n では、伝送線路21 〜2n を介して受け取った信号
を上記時間ブロック分だけ遅延させ、当該遅延させた信
号を各伝送線路31 〜3n を介して各符号化器4001
〜400n へ渡す。
【0062】各符号化器4001 〜400n では、上記
時間ブロック毎に圧縮動作を行う。このときの伝送線路
51 〜5n を介して受け取るビット配分量は、各ディレ
イライン3001 〜300n での遅延によって上記伝送
線路31 〜3n で受け取る信号のピーク情報を反映し
たものとなっている。各符号化器4001 〜400nで
は、上記伝送線路51 〜5n を介して受け取ったビット
配分量まで上記伝送線路31 〜3n を介して受け取った
信号を圧縮し、当該圧縮した信号を各伝送線路61 〜6
n を経てフォーマッタ600へ渡す。
時間ブロック毎に圧縮動作を行う。このときの伝送線路
51 〜5n を介して受け取るビット配分量は、各ディレ
イライン3001 〜300n での遅延によって上記伝送
線路31 〜3n で受け取る信号のピーク情報を反映し
たものとなっている。各符号化器4001 〜400nで
は、上記伝送線路51 〜5n を介して受け取ったビット
配分量まで上記伝送線路31 〜3n を介して受け取った
信号を圧縮し、当該圧縮した信号を各伝送線路61 〜6
n を経てフォーマッタ600へ渡す。
【0063】上記フォーマッタ600は、上記各伝送線
路61 〜6n を経て受け取った上記各チャンネル毎の被
圧縮信号を、所定のフォーマットに従って、エラー訂正
処理を施して、伝送又は記録媒体への記録のためのビッ
トストリームへ組み立てる。このビットストリームは、
伝送線路7を経て出力端子21から出力される。
路61 〜6n を経て受け取った上記各チャンネル毎の被
圧縮信号を、所定のフォーマットに従って、エラー訂正
処理を施して、伝送又は記録媒体への記録のためのビッ
トストリームへ組み立てる。このビットストリームは、
伝送線路7を経て出力端子21から出力される。
【0064】更にこのビットストリームは、例えばレー
ザー記録装置26により、映画フィルム27上の所定の
記録エリア28に書き込まれる。尚、図中の指示符号2
9はパーフォレーションを示し、フィルム送りのために
図示しない映写機のスプロケットが噛み合うための孔で
あり、上記記録エリア28は例えば上記パーフォレーシ
ョン29間に設けられる。
ザー記録装置26により、映画フィルム27上の所定の
記録エリア28に書き込まれる。尚、図中の指示符号2
9はパーフォレーションを示し、フィルム送りのために
図示しない映写機のスプロケットが噛み合うための孔で
あり、上記記録エリア28は例えば上記パーフォレーシ
ョン29間に設けられる。
【0065】次に、本実施例のデコーダ(高能率復号化
装置)の構成について説明する。
装置)の構成について説明する。
【0066】上記図1のエンコーダ(高能率符号化装
置)で組み立てられたビットストリームは、伝送又は記
録媒体に記録される。この記録されたビットストリーム
は、図示しない所定の再生装置を経て、入力端子22に
供給され、この入力端子22から伝送線路8を経て、デ
フォーマッタ700に送られてくる。
置)で組み立てられたビットストリームは、伝送又は記
録媒体に記録される。この記録されたビットストリーム
は、図示しない所定の再生装置を経て、入力端子22に
供給され、この入力端子22から伝送線路8を経て、デ
フォーマッタ700に送られてくる。
【0067】当該デフォーマッタ700では、上記伝送
線路8を介して送られてきたビットストリームを、所定
のフォーマットに従って各チャンネル毎の被圧縮信号に
分解する。当該各チャンネル毎に分解された被圧縮信号
は、各チャンネルに対応する各伝送線路91 〜9n を経
て、各チャンネル毎に対応して設けられた復号器800
1 〜800n へ送られる。
線路8を介して送られてきたビットストリームを、所定
のフォーマットに従って各チャンネル毎の被圧縮信号に
分解する。当該各チャンネル毎に分解された被圧縮信号
は、各チャンネルに対応する各伝送線路91 〜9n を経
て、各チャンネル毎に対応して設けられた復号器800
1 〜800n へ送られる。
【0068】各復号器8001 〜800n では、上記各
伝送線路91 〜9n を経て送られてきた被圧縮信号を伸
長し、対応する各伝送線路101 〜10n を経て、D/
A(ディジタル/アナログ)変換器9001 〜900n
へ送る。
伝送線路91 〜9n を経て送られてきた被圧縮信号を伸
長し、対応する各伝送線路101 〜10n を経て、D/
A(ディジタル/アナログ)変換器9001 〜900n
へ送る。
【0069】各D/A変換器9001 〜900n では、
上記各伝送線路101 〜10n を経て送られてきた上記
伸長された信号(ディジタル信号)を、アナログ信号に
変換する。これらアナログに戻された信号は、それぞれ
対応する各伝送線路111 〜11n 及び出力端子231
〜23n を介して、各チャンネルch1〜chnの復号
化された信号として出力される。
上記各伝送線路101 〜10n を経て送られてきた上記
伸長された信号(ディジタル信号)を、アナログ信号に
変換する。これらアナログに戻された信号は、それぞれ
対応する各伝送線路111 〜11n 及び出力端子231
〜23n を介して、各チャンネルch1〜chnの復号
化された信号として出力される。
【0070】上述したような本実施例の高能率符号化装
置において利用する圧縮符号化手法は、ビットレートを
可変することが出来るものであればすべてに応用が可能
である。ここでは、前述した人間の聴覚特性を利用し、
ステレオ2チャンネルのオーディオ信号を固定ビットレ
ートで約1/5に圧縮する圧縮符号化手法(例えばいわ
ゆるMD(ミニディスク:Mini Disc)に用いられるAT
RAC方式)を例に挙げ、当該固定ビットレートの圧縮
を可変ビットレートにする本実施例の圧縮符号化の方法
について述べる。
置において利用する圧縮符号化手法は、ビットレートを
可変することが出来るものであればすべてに応用が可能
である。ここでは、前述した人間の聴覚特性を利用し、
ステレオ2チャンネルのオーディオ信号を固定ビットレ
ートで約1/5に圧縮する圧縮符号化手法(例えばいわ
ゆるMD(ミニディスク:Mini Disc)に用いられるAT
RAC方式)を例に挙げ、当該固定ビットレートの圧縮
を可変ビットレートにする本実施例の圧縮符号化の方法
について述べる。
【0071】図3にはいわゆるATRAC方式が適用さ
れる符号化の構成を示す。なお、この図3の帯域分割フ
ィルタ401から再量子化器406,フォーマッタ40
7までの構成は、図1の各チャンネルの各符号化器40
01 〜400n と対応するものである。
れる符号化の構成を示す。なお、この図3の帯域分割フ
ィルタ401から再量子化器406,フォーマッタ40
7までの構成は、図1の各チャンネルの各符号化器40
01 〜400n と対応するものである。
【0072】この図3において、入力端子24を介して
供給された標本化及び量子化されたオーディオデータ
は、先ず、帯域分割フィルタ401によって0〜5.5
kHzの低域と、5.5kHz〜11kHzの中域と、
11kHz以上(11kHz〜22kHz)の3つの周
波数帯域に分割される。
供給された標本化及び量子化されたオーディオデータ
は、先ず、帯域分割フィルタ401によって0〜5.5
kHzの低域と、5.5kHz〜11kHzの中域と、
11kHz以上(11kHz〜22kHz)の3つの周
波数帯域に分割される。
【0073】これら3つの周波数帯域の信号のうち、上
記帯域分割フィルタ401からの上記低域の信号はMD
CT(Modified Discrete Cosine Transform:改良型離
散余弦変換)演算を行うMDCT回路402Lに、中域
の信号は同じくMDCT演算を行うMDCT回路402
Mに、また、高域の信号はMDCT回路402Hに送ら
れ、これらMDCT回路402L〜402Hでそれぞれ
周波数成分に分解される。
記帯域分割フィルタ401からの上記低域の信号はMD
CT(Modified Discrete Cosine Transform:改良型離
散余弦変換)演算を行うMDCT回路402Lに、中域
の信号は同じくMDCT演算を行うMDCT回路402
Mに、また、高域の信号はMDCT回路402Hに送ら
れ、これらMDCT回路402L〜402Hでそれぞれ
周波数成分に分解される。
【0074】このとき、上記MDCTを施すときの時間
ブロック長は、各周波数帯域毎に可変であり、信号が急
激に変化する部分では、時間ブロック長を短くして、時
間分解能を高め、信号が定常的な部分では時間ブロック
長を長くして、信号成分の有効伝送と量子化雑音を制御
する。
ブロック長は、各周波数帯域毎に可変であり、信号が急
激に変化する部分では、時間ブロック長を短くして、時
間分解能を高め、信号が定常的な部分では時間ブロック
長を長くして、信号成分の有効伝送と量子化雑音を制御
する。
【0075】この時間ブロック長は、ブロックサイズ評
価器403にて決定されている。すなわち、上記帯域分
割フィルタ401からの3つの周波数帯域の信号は、ブ
ロックサイズ評価器403にも送られ、当該ブロックサ
イズ評価器403が上記MDCTの時間ブロック長を決
定し、この決定した時間ブロック長を示す情報を上記M
DCT回路402L〜402Hに送るようにしている。
価器403にて決定されている。すなわち、上記帯域分
割フィルタ401からの3つの周波数帯域の信号は、ブ
ロックサイズ評価器403にも送られ、当該ブロックサ
イズ評価器403が上記MDCTの時間ブロック長を決
定し、この決定した時間ブロック長を示す情報を上記M
DCT回路402L〜402Hに送るようにしている。
【0076】なお、上記MDCTでの2種類の時間ブロ
ック長のうち、長い時間ブロック長を使用するモードは
ロングモードと呼ばれ、11.6msの時間のブロック
長を有する。また、短い時間ブロック長を使用するモー
ドはショートモードと呼ばれ、高域(11kHz以上)
で1.45msの時間のブロック長を有し、、低域
(5.5kHz以下)及び中域(5.5kHzから11
kHz)では2.9msの時間のブロック長を有するこ
とで、時間分解能を上げるようにしている。
ック長のうち、長い時間ブロック長を使用するモードは
ロングモードと呼ばれ、11.6msの時間のブロック
長を有する。また、短い時間ブロック長を使用するモー
ドはショートモードと呼ばれ、高域(11kHz以上)
で1.45msの時間のブロック長を有し、、低域
(5.5kHz以下)及び中域(5.5kHzから11
kHz)では2.9msの時間のブロック長を有するこ
とで、時間分解能を上げるようにしている。
【0077】このようにして、時間と周波数の2次元領
域(これをブロックフローティングユニット:Block Fl
oating Unit と呼ぶ)上の信号成分に分解されたオーデ
ィオ信号は、正規化回路404L〜404Hによって低
域,中域,高域で合計52個のブロックフローティング
ユニットに分けられると共に、ユニット毎に正規化され
る(スケールファクタの決定がなされる)。
域(これをブロックフローティングユニット:Block Fl
oating Unit と呼ぶ)上の信号成分に分解されたオーデ
ィオ信号は、正規化回路404L〜404Hによって低
域,中域,高域で合計52個のブロックフローティング
ユニットに分けられると共に、ユニット毎に正規化され
る(スケールファクタの決定がなされる)。
【0078】また、上記ビット配分器405では、人間
の聴覚の特性を利用して、そのオーディオ信号がどのよ
うな成分から構成されているかを分析する。この分析結
果が上記正規化回路404L〜404Hからの各ユニッ
ト毎の信号が供給される再量子化器406に送られる。
の聴覚の特性を利用して、そのオーディオ信号がどのよ
うな成分から構成されているかを分析する。この分析結
果が上記正規化回路404L〜404Hからの各ユニッ
ト毎の信号が供給される再量子化器406に送られる。
【0079】当該再量子化器406は、上記分析結果に
基づいて、各ユニットをどの程度の精度で符号化するか
を求めて、即ちワードレングスの決定を行い、パラメー
タを得ると共に、再量子化を行う。
基づいて、各ユニットをどの程度の精度で符号化するか
を求めて、即ちワードレングスの決定を行い、パラメー
タを得ると共に、再量子化を行う。
【0080】最後に、フォーマッタ407では、各ユニ
ット毎の各パラメータ情報と再量子化されたスペクトラ
ム信号とを、所定のフォーマットに従って多重化し、ビ
ットストリームとする。このフォーマッタ407の出力
が出力端子25から出力される。
ット毎の各パラメータ情報と再量子化されたスペクトラ
ム信号とを、所定のフォーマットに従って多重化し、ビ
ットストリームとする。このフォーマッタ407の出力
が出力端子25から出力される。
【0081】ここで、上述したような符号化の動作はサ
ウンドフレームという単位毎に行われる。
ウンドフレームという単位毎に行われる。
【0082】図4には、当該サウンドフレーム40内の
データの記録の様子を示す。
データの記録の様子を示す。
【0083】この図4において、1サウンドフレームは
212ビットからなり、ここに44.1kHzのサンプ
リングレートで512サンプル、1チャンネル相当のオ
ーディオ再生用データが圧縮符号化されている。
212ビットからなり、ここに44.1kHzのサンプ
リングレートで512サンプル、1チャンネル相当のオ
ーディオ再生用データが圧縮符号化されている。
【0084】上記212ビットのサウンドフレームデー
タは、ブロックサイズモード41、サブブインフオメー
ション量42、ワードレングスデータ43、スケールフ
ァクタデータ44、スペクトラムデータ45、冗長スケ
ールファクタデータ46、冗長ワードレングスデータ4
7、下部のサブインフオメーション量48、及び、下部
のブロックサイズモード49から構成される。
タは、ブロックサイズモード41、サブブインフオメー
ション量42、ワードレングスデータ43、スケールフ
ァクタデータ44、スペクトラムデータ45、冗長スケ
ールファクタデータ46、冗長ワードレングスデータ4
7、下部のサブインフオメーション量48、及び、下部
のブロックサイズモード49から構成される。
【0085】ここで、212ビットのデータの中には、
エラー訂正用の2度書き部分が含まれている。即ち、冗
長スケールファクタデータ46、冗長ワードレングスデ
ータ47、下部サブインフォメーション量48、下部ブ
ロックサイズモード49である。
エラー訂正用の2度書き部分が含まれている。即ち、冗
長スケールファクタデータ46、冗長ワードレングスデ
ータ47、下部サブインフォメーション量48、下部ブ
ロックサイズモード49である。
【0086】この例では、212ビットのうち、186
ビットが2度書きを除いた部分に相当し、実質的なビッ
トレートに換算すると128kbpsになる。
ビットが2度書きを除いた部分に相当し、実質的なビッ
トレートに換算すると128kbpsになる。
【0087】上記ブロックサイズモードは、図3のブロ
ックサイズ評価器403の評価結果を記録するためのデ
ータで、その内容は表1に示すようなものとなってい
る。
ックサイズ評価器403の評価結果を記録するためのデ
ータで、その内容は表1に示すようなものとなってい
る。
【0088】
【表1】
【0089】この表1を見ればわかるように、ロングモ
ードのとき、低域及び中域ではMDCT演算によりそれ
ぞれ128個の周波数成分に、高域では256個の周波
数成分に分解される。
ードのとき、低域及び中域ではMDCT演算によりそれ
ぞれ128個の周波数成分に、高域では256個の周波
数成分に分解される。
【0090】また、ショートモードのとき、低域、中域
及び高域はそれぞれ32個の周波数成分に分解される。
及び高域はそれぞれ32個の周波数成分に分解される。
【0091】また、サブインフォメーション量42に
は、アマウント1、アマウント2、アマウント3の3つ
の情報が記録される。アマウント1は、記録されている
ワードレングス及びスケールファクタの個数を表し、ア
マウント2は2度書きされているワードレングスの個数
を表し、アマウント3は2度書きされているスケールフ
ァクタの個数を表している。この内容については、表2
に示す。
は、アマウント1、アマウント2、アマウント3の3つ
の情報が記録される。アマウント1は、記録されている
ワードレングス及びスケールファクタの個数を表し、ア
マウント2は2度書きされているワードレングスの個数
を表し、アマウント3は2度書きされているスケールフ
ァクタの個数を表している。この内容については、表2
に示す。
【0092】
【表2】
【0093】ワードレングスは、各ユニットの再量子化
されたときの語長を表す。この内容については表3に示
す。
されたときの語長を表す。この内容については表3に示
す。
【0094】
【表3】
【0095】スケールファクタは各ユニットの正規化し
た値を表す。その内容については表4に示す。
た値を表す。その内容については表4に示す。
【0096】
【表4】
【0097】ところで、上記図3におけるビット配分器
405は、再量子化の際に、1サウンドフレームのビッ
ト量を212ビットになるように人間の聴感特性を考慮
してワードレングスの値を決定していく。この212ビ
ットという値を可変にすることで、可変長の符号化装置
を構成できる。
405は、再量子化の際に、1サウンドフレームのビッ
ト量を212ビットになるように人間の聴感特性を考慮
してワードレングスの値を決定していく。この212ビ
ットという値を可変にすることで、可変長の符号化装置
を構成できる。
【0098】すなわち、本発明実施例の高能率符号化装
置の構成である図1のビット配分決定回路500の出力
を、図3のビット配分器405に接続するような構成に
すれば、可変長の符号化装置が構成できるようになる。
置の構成である図1のビット配分決定回路500の出力
を、図3のビット配分器405に接続するような構成に
すれば、可変長の符号化装置が構成できるようになる。
【0099】以下、このように図3のビット配分器40
5に接続される図1のビット配分決定回路500の動作
について、図5のグラフ及び図6のフローチャートによ
り説明する。
5に接続される図1のビット配分決定回路500の動作
について、図5のグラフ及び図6のフローチャートによ
り説明する。
【0100】まず、ビット配分決定回路500は、図6
のステップS61で処理を開始すると、ステップS62
で各チャンネル毎のピーク値を検出する。一般にピーク
値は、各チャンネルにおけるオーディオ信号のエネルギ
に相当する。
のステップS61で処理を開始すると、ステップS62
で各チャンネル毎のピーク値を検出する。一般にピーク
値は、各チャンネルにおけるオーディオ信号のエネルギ
に相当する。
【0101】次に、ステップS63では、求めたピーク
値に対応するビット配分量を算出する。この算出には、
ピーク値/ビット配分量の対応グラフをテーブルにした
ものを用いる。
値に対応するビット配分量を算出する。この算出には、
ピーク値/ビット配分量の対応グラフをテーブルにした
ものを用いる。
【0102】図5のグラフが上記ピーク値に対するビッ
ト配分量を換算するためのグラフである。なお、この図
5に示すビット配分量の換算のグラフは、符号化方式と
していわゆるATRAC方式を採用した場合のものであ
る。
ト配分量を換算するためのグラフである。なお、この図
5に示すビット配分量の換算のグラフは、符号化方式と
していわゆるATRAC方式を採用した場合のものであ
る。
【0103】この図5において、横軸は、入力信号のピ
ーク値であり、その取りうる最大値を1に正規化してい
る。
ーク値であり、その取りうる最大値を1に正規化してい
る。
【0104】また、縦軸は、ビット配分量であり、最大
配分量を186バイトとしている。この値はいわゆるM
D(ミニディスク)装置におけるATRAC方式の1サ
ウンドフレームの情報量に等しい。
配分量を186バイトとしている。この値はいわゆるM
D(ミニディスク)装置におけるATRAC方式の1サ
ウンドフレームの情報量に等しい。
【0105】ここで、図5に示す換算のグラフは、様々
なオーディオ信号を用いて実験をして決定したものであ
る。
なオーディオ信号を用いて実験をして決定したものであ
る。
【0106】この図5において、ビット配分量の全体的
な傾向としては、ピーク値の増加と共にビット配分量も
増加するようになってくるが、ピーク値が2のマイナス
3乗を越えた当たりで、減少に転じる。
な傾向としては、ピーク値の増加と共にビット配分量も
増加するようになってくるが、ピーク値が2のマイナス
3乗を越えた当たりで、減少に転じる。
【0107】これは、信号レベルが充分に大きい(かな
り大きい)ところでは、再量子化による量子化ノイズが
信号レベルによってマスクされるため、再量子化ノイズ
の注入量を増やしても聞こえにくいという実験結果に基
づいている。
り大きい)ところでは、再量子化による量子化ノイズが
信号レベルによってマスクされるため、再量子化ノイズ
の注入量を増やしても聞こえにくいという実験結果に基
づいている。
【0108】一方、図5において、信号レベルが充分に
小さい(かなり小さい)場合、例えばピーク値が2のマ
イナス12乗以下になるとビット配分量を一定(平坦な
ビット配分)としている。これは、ATRAC方式の各
パラメータ情報(図4に示すワードレングスデータやス
ケールファクタデータなど)に必要なビット量がほぼ一
定であるため、ある程度のビット量を確保しておく必要
があるためである。
小さい(かなり小さい)場合、例えばピーク値が2のマ
イナス12乗以下になるとビット配分量を一定(平坦な
ビット配分)としている。これは、ATRAC方式の各
パラメータ情報(図4に示すワードレングスデータやス
ケールファクタデータなど)に必要なビット量がほぼ一
定であるため、ある程度のビット量を確保しておく必要
があるためである。
【0109】また、レベルが低くなってくるとランダム
なノイズ(白色雑音)が聞こえるようになり、このよう
な信号は全周波数帯域に周波数成分が一様に分布する傾
向にあるので、レベルが小さい割に多くのビット量を必
要とするためである。
なノイズ(白色雑音)が聞こえるようになり、このよう
な信号は全周波数帯域に周波数成分が一様に分布する傾
向にあるので、レベルが小さい割に多くのビット量を必
要とするためである。
【0110】以上のように、ビット配分量とピーク値と
の関係は、非線形(略S字カーブ)に特徴付けられる。
即ち、聴覚特性を考慮しなければ、ビット配分量とピー
ク値との関係は、比例関係となる。しかし本発明では、
各チャンネル毎に最低限度のビット配分量を確保しつ
つ、エネルギが所定レベル以上の場合には、逆にビット
配分量を減少させる。
の関係は、非線形(略S字カーブ)に特徴付けられる。
即ち、聴覚特性を考慮しなければ、ビット配分量とピー
ク値との関係は、比例関係となる。しかし本発明では、
各チャンネル毎に最低限度のビット配分量を確保しつ
つ、エネルギが所定レベル以上の場合には、逆にビット
配分量を減少させる。
【0111】次に、ステップS64では全体のビット量
は固定か否かの判断を行い、このステップS64で全チ
ャンネルの総ビット配分量を固定にする必要があると判
断したときには、ステップS65に進み、上記の換算が
終わったあと、後述する式(1)の計算を行い、最終的
な各チャンネルごとのビット配分量を計算する。
は固定か否かの判断を行い、このステップS64で全チ
ャンネルの総ビット配分量を固定にする必要があると判
断したときには、ステップS65に進み、上記の換算が
終わったあと、後述する式(1)の計算を行い、最終的
な各チャンネルごとのビット配分量を計算する。
【0112】すなわち、nチャンネルあるシステムの1
サウンドフレーム当たりの総ビット配分量をGとし、上
記換算によるビット配分量をCi(i=1,2,・・
・、n)とすると、最終的な各チャンネルに配分される
ビット配分量Siは、 Si=G*Ci/(C1+C2+・・・+Cn) ・・(1) となる。
サウンドフレーム当たりの総ビット配分量をGとし、上
記換算によるビット配分量をCi(i=1,2,・・
・、n)とすると、最終的な各チャンネルに配分される
ビット配分量Siは、 Si=G*Ci/(C1+C2+・・・+Cn) ・・(1) となる。
【0113】上記ステップS65の後、又は上記ステッ
プS64でノーと判断された後は、ステップS66に進
んで処理を終了する。
プS64でノーと判断された後は、ステップS66に進
んで処理を終了する。
【0114】また、上述したようなATRAC方式に対
応することで、図1のフォーマッタ600と図2のデフ
ォーマッタ700は以下のように動作する。
応することで、図1のフォーマッタ600と図2のデフ
ォーマッタ700は以下のように動作する。
【0115】図1のフォーマッタ600は、1サウンド
フレーム毎に各チャンネルの符号化器4001 〜400
n から図4に示すような形で送られてきたデータをチャ
ンネル順に並べて、ビットストリームとして伝送する。
すなわち、マルチプレクサの働きをする。
フレーム毎に各チャンネルの符号化器4001 〜400
n から図4に示すような形で送られてきたデータをチャ
ンネル順に並べて、ビットストリームとして伝送する。
すなわち、マルチプレクサの働きをする。
【0116】また、図2のデフォーマッタ700は、上
記フォーマッタ600でマルチプレクスされたデータを
各チャンネル毎に分解して各復号化器4001 〜400
n に渡すデマルチプレクサの働きをする。
記フォーマッタ600でマルチプレクスされたデータを
各チャンネル毎に分解して各復号化器4001 〜400
n に渡すデマルチプレクサの働きをする。
【0117】上述したように、本発明の第1の実施例装
置によれば、複数のチャンネルを持つオーディオデータ
の圧縮において、各チャンネルの振幅情報の時間的な変
化により、各チャンネルへのビット配分量を決定して符
号化するようにしているため、各チャンネルにその情報
量に見合ったビット配分が可能となり、更なる高能率符
号化が可能となる。
置によれば、複数のチャンネルを持つオーディオデータ
の圧縮において、各チャンネルの振幅情報の時間的な変
化により、各チャンネルへのビット配分量を決定して符
号化するようにしているため、各チャンネルにその情報
量に見合ったビット配分が可能となり、更なる高能率符
号化が可能となる。
【0118】すなわち、更なる高音質化もしくは、全チ
ャンネルトータルにおける低ビットレート化が可能とな
る。なお、記録するメデイアによっては固定長が望まし
い場合があるので、第1の実施例装置では、全チャンネ
ルの総ビット配分量を概ね一定とする様に符号化するこ
とも可能である。
ャンネルトータルにおける低ビットレート化が可能とな
る。なお、記録するメデイアによっては固定長が望まし
い場合があるので、第1の実施例装置では、全チャンネ
ルの総ビット配分量を概ね一定とする様に符号化するこ
とも可能である。
【0119】次に、本発明の第2の実施例について説明
する。
する。
【0120】図7には第2の実施例の高能率符号化装置
(エンコーダ)の構成を示している。
(エンコーダ)の構成を示している。
【0121】図7において、複数チャンネル(ch1,
ch2,・・・,chn)のオーディオ信号は、これら
各チャンネルに対応する各入力端子301 〜30n 及び
伝送線路1011 〜101n を経て、同じく各チャンネ
ルに対応する標本化及び量子化器1201 〜120n に
送られる。これら標本化及び量子化器1201 〜120
n では各チャンネルのオーディオ信号が量子化信号に変
換され、これら各標本化及び量子化器1201 〜120
n からの量子化された信号は、各伝送線路1021 〜1
02n を経て、各符号化器2101 〜210n に送られ
る。
ch2,・・・,chn)のオーディオ信号は、これら
各チャンネルに対応する各入力端子301 〜30n 及び
伝送線路1011 〜101n を経て、同じく各チャンネ
ルに対応する標本化及び量子化器1201 〜120n に
送られる。これら標本化及び量子化器1201 〜120
n では各チャンネルのオーディオ信号が量子化信号に変
換され、これら各標本化及び量子化器1201 〜120
n からの量子化された信号は、各伝送線路1021 〜1
02n を経て、各符号化器2101 〜210n に送られ
る。
【0122】各符号化器2101 〜210n では、各チ
ャンネルのオーディオ信号を時間と周波数の二次元領域
(ブロックフローティングユニット)に分割し、そのブ
ロックフローティングユニットに属する信号成分をブロ
ックフローティングユニット毎にスケールファクタを用
いて正規化する。ここで求められた各ブロックフローテ
ィングユニットのスケールファクタは、伝送線路103
1 〜103n を通してビット配分決定回路310へ送ら
れる。
ャンネルのオーディオ信号を時間と周波数の二次元領域
(ブロックフローティングユニット)に分割し、そのブ
ロックフローティングユニットに属する信号成分をブロ
ックフローティングユニット毎にスケールファクタを用
いて正規化する。ここで求められた各ブロックフローテ
ィングユニットのスケールファクタは、伝送線路103
1 〜103n を通してビット配分決定回路310へ送ら
れる。
【0123】当該ビット配分決定回路310では、伝送
線路1031 〜103n を介して受け取ったスケールフ
ァクタの各チャンネル毎の総和を求め、当該総和から各
チャンネルのビット配分量を後述する換算式(換算のグ
ラフ)により換算し、そのビット配分量を伝送線路10
41 〜104n から各符号化器2101 〜210n へ渡
す。
線路1031 〜103n を介して受け取ったスケールフ
ァクタの各チャンネル毎の総和を求め、当該総和から各
チャンネルのビット配分量を後述する換算式(換算のグ
ラフ)により換算し、そのビット配分量を伝送線路10
41 〜104n から各符号化器2101 〜210n へ渡
す。
【0124】したがって、各符号化器2101 〜210
n では、上記ビット配分量に応じて、上記伝送線路10
21 〜102n からの信号を再量子化し、当該再量子化
すなわち圧縮した信号を伝送線路1051 〜105n を
介してフォーマッタ410へ渡す。
n では、上記ビット配分量に応じて、上記伝送線路10
21 〜102n からの信号を再量子化し、当該再量子化
すなわち圧縮した信号を伝送線路1051 〜105n を
介してフォーマッタ410へ渡す。
【0125】フォーマッタ410は、複数のチャンネル
の上記伝送線路1051 〜105nを経て受け取った被
圧縮信号を、所定のフォーマットに従って伝送又は記録
媒体への記録のためにビットストリームへ組み立てる。
このビットストリームは、伝送線路106を介して出力
端子31から出力される。
の上記伝送線路1051 〜105nを経て受け取った被
圧縮信号を、所定のフォーマットに従って伝送又は記録
媒体への記録のためにビットストリームへ組み立てる。
このビットストリームは、伝送線路106を介して出力
端子31から出力される。
【0126】更にこのビットストリームは、例えばレー
ザー記録装置26により、映画フィルム27上の所定の
記録エリア28に書き込まれる。
ザー記録装置26により、映画フィルム27上の所定の
記録エリア28に書き込まれる。
【0127】なお、この第2の実施例におけるデコーダ
側の高能率復号化装置の基本構成については、前記図2
と同様であるため、詳細な説明は省略する。
側の高能率復号化装置の基本構成については、前記図2
と同様であるため、詳細な説明は省略する。
【0128】簡単に前記図2を用いて説明すると、当該
第2の実施例の高能率復号化装置のデフォーマッタ70
0でも、上記第2の実施例の高能率符号化装置からのビ
ットストリームを、所定のフォーマットに従って各チャ
ンネル毎の被圧縮信号に分解する。
第2の実施例の高能率復号化装置のデフォーマッタ70
0でも、上記第2の実施例の高能率符号化装置からのビ
ットストリームを、所定のフォーマットに従って各チャ
ンネル毎の被圧縮信号に分解する。
【0129】当該各チャンネル毎に分解された被圧縮信
号は、各チャンネル毎に対応して設けられた復号器80
01 〜800n にて伸長され、さらにD/A(ディジタ
ル/アナログ)変換器9001 〜900n でアナログ信
号に変換される。この各アナログ信号が、各チャンネル
ch1〜chnの復号化された信号として出力される。
号は、各チャンネル毎に対応して設けられた復号器80
01 〜800n にて伸長され、さらにD/A(ディジタ
ル/アナログ)変換器9001 〜900n でアナログ信
号に変換される。この各アナログ信号が、各チャンネル
ch1〜chnの復号化された信号として出力される。
【0130】また、この第2の実施例の高能率符号化装
置において利用する圧縮符号化手法は、スケールファク
タを用いて圧縮符号化する方式であれば、全てに応用が
可能である。
置において利用する圧縮符号化手法は、スケールファク
タを用いて圧縮符号化する方式であれば、全てに応用が
可能である。
【0131】すなわち、この第2の実施例においても、
前記図3を用いて説明すれば、図7のビット配分決定回
路310の出力を、図3のビット配分器405に接続す
るような構成にすれば、可変長の符号化装置が構成でき
るようになる。
前記図3を用いて説明すれば、図7のビット配分決定回
路310の出力を、図3のビット配分器405に接続す
るような構成にすれば、可変長の符号化装置が構成でき
るようになる。
【0132】以下、このように図3のビット配分器40
5に接続される図7のビット配分決定回路310の詳細
な動作について、図8のグラフ及び図9のフローチャー
トにより説明する。
5に接続される図7のビット配分決定回路310の詳細
な動作について、図8のグラフ及び図9のフローチャー
トにより説明する。
【0133】先ず、ビット配分決定回路310は、図9
のステップS91で処理を開始すると、ステップS92
において符号化器2101 〜210n からのスケールフ
ァクタから、各チャンネル毎のスケールファクタの総和
を算出する。
のステップS91で処理を開始すると、ステップS92
において符号化器2101 〜210n からのスケールフ
ァクタから、各チャンネル毎のスケールファクタの総和
を算出する。
【0134】次のステップS93では、求めた各チャン
ネルのスケールファクタの総和より、各チャンネル毎の
ビット配分量を算出する。
ネルのスケールファクタの総和より、各チャンネル毎の
ビット配分量を算出する。
【0135】ここで、スケールファクタは、前述したよ
うに52個あるブロックフローティングユニットに含ま
れる周波数成分を正規化した値である。通常は、そのブ
ロックフローティングユニット内の周波数成分の絶対値
を求め、その絶対値の最大値以上の値であって、かつそ
の中で最小の値のものを、前記表4に示す値の中から選
ぶことになる。
うに52個あるブロックフローティングユニットに含ま
れる周波数成分を正規化した値である。通常は、そのブ
ロックフローティングユニット内の周波数成分の絶対値
を求め、その絶対値の最大値以上の値であって、かつそ
の中で最小の値のものを、前記表4に示す値の中から選
ぶことになる。
【0136】すなわち、スケールファクタは、ブロック
フローティングユニット内のデータの代表値的な性格、
即ちエネルギを示すと考えられる。従って、スケールフ
ァクタの和を求めれば、全体の情報量を推定することが
できると考えられる。
フローティングユニット内のデータの代表値的な性格、
即ちエネルギを示すと考えられる。従って、スケールフ
ァクタの和を求めれば、全体の情報量を推定することが
できると考えられる。
【0137】図8には、図7のビット配分決定回路31
0でのスケールファクタの和に対するビット配分量を示
す。
0でのスケールファクタの和に対するビット配分量を示
す。
【0138】この図8も、第1の実施例同様に符号化方
式として、ATRAC方式を使ったときのものである。
なお、この図8の縦軸は前記図5同様のビット配分量
(最大配分量は186バイト)であるが、横軸はスケー
ルファクタの和である。
式として、ATRAC方式を使ったときのものである。
なお、この図8の縦軸は前記図5同様のビット配分量
(最大配分量は186バイト)であるが、横軸はスケー
ルファクタの和である。
【0139】この図8に示す換算のグラフも、第1の実
施例の図5同様に、様々なオーディオ信号を用いて実験
をしながら決定したものである。
施例の図5同様に、様々なオーディオ信号を用いて実験
をしながら決定したものである。
【0140】全体的な傾向としては、スケールファクタ
の和の値の増加とともに、ビット配分量も増加する。
の和の値の増加とともに、ビット配分量も増加する。
【0141】しかし、図8において上記スケールファク
タの和の値が約7000を越えた当たりで、ビット配分
量は減少に転じる。これは、上記スケールファクタの和
の値がかなり大きい(信号レベルが充分に大きい)とこ
ろでは、信号レベルも比較的大きく、再量子化による量
子化ノイズが信号レベルによってマスクされるため、再
量子化ノイズの注入量を増やしても聞こえにくいという
実験結果に基づいている。
タの和の値が約7000を越えた当たりで、ビット配分
量は減少に転じる。これは、上記スケールファクタの和
の値がかなり大きい(信号レベルが充分に大きい)とこ
ろでは、信号レベルも比較的大きく、再量子化による量
子化ノイズが信号レベルによってマスクされるため、再
量子化ノイズの注入量を増やしても聞こえにくいという
実験結果に基づいている。
【0142】一方、図8において、上記スケールファク
タの和の値が1.5以下(信号レベルが充分に小さい場
合)になるとビット配分量が一定となるのは、ATRA
C方式の各パラメータ情報(前記図4に示すワードレン
グスデータやスケールファクタデータなど)のために必
要なビット量がほぼ一定であるため、このビット量を確
保しておく必要があるためである。
タの和の値が1.5以下(信号レベルが充分に小さい場
合)になるとビット配分量が一定となるのは、ATRA
C方式の各パラメータ情報(前記図4に示すワードレン
グスデータやスケールファクタデータなど)のために必
要なビット量がほぼ一定であるため、このビット量を確
保しておく必要があるためである。
【0143】この例においても、ビット配分量とスケー
ルファクタの総和との関係は、略S字カーブの非線形特
性を成す。
ルファクタの総和との関係は、略S字カーブの非線形特
性を成す。
【0144】なお、この第2の実施例においても、ステ
ップS94において全体のビット量は固定か否かの判断
を行い、このステップS94で全チャンネルの総ビット
配分量を固定にする必要があると判断したときには、ス
テップS95に進み、上記の換算が終わったあと、前記
式(1)の計算を行い、最終的な各チャンネル毎のビッ
ト配分量を計算する。
ップS94において全体のビット量は固定か否かの判断
を行い、このステップS94で全チャンネルの総ビット
配分量を固定にする必要があると判断したときには、ス
テップS95に進み、上記の換算が終わったあと、前記
式(1)の計算を行い、最終的な各チャンネル毎のビッ
ト配分量を計算する。
【0145】上記ステップS95の後、又は上記ステッ
プS94でノーと判断された後は、ステップS96に進
む。
プS94でノーと判断された後は、ステップS96に進
む。
【0146】また、当該第2の実施例においても、図7
のフォーマッタ410は、1サウンドフレーム毎に各チ
ャンネルの符号化器2101 〜210n から図4に示す
ような形で送られてきたデータをチャンネル順に並べ
て、ビットストリームとして伝送する。すなわち、マル
チプレクサの働きをする。
のフォーマッタ410は、1サウンドフレーム毎に各チ
ャンネルの符号化器2101 〜210n から図4に示す
ような形で送られてきたデータをチャンネル順に並べ
て、ビットストリームとして伝送する。すなわち、マル
チプレクサの働きをする。
【0147】さらに、第2の実施例の高能率復号化装置
におけるデフォーマッタも、上記フォーマッタ410で
マルチプレクスされたデータを各チャンネル毎に分解し
て、各復号化器に渡すデマルチプレクサの働きをする。
におけるデフォーマッタも、上記フォーマッタ410で
マルチプレクスされたデータを各チャンネル毎に分解し
て、各復号化器に渡すデマルチプレクサの働きをする。
【0148】上述したように、第2の実施例装置によれ
ば、複数のチャンネルを持つオーディオデータの圧縮に
おいて、各チャンネルのスケールファクタの総和の時間
的な変化により、各チャンネルのビット配分量を決定し
て符号化するようにしている。このため、各チャンネル
にその情報量に見合ったビット配分が可能となり、更な
る高能率符号化が可能となる。
ば、複数のチャンネルを持つオーディオデータの圧縮に
おいて、各チャンネルのスケールファクタの総和の時間
的な変化により、各チャンネルのビット配分量を決定し
て符号化するようにしている。このため、各チャンネル
にその情報量に見合ったビット配分が可能となり、更な
る高能率符号化が可能となる。
【0149】それによって更なる高音質化もしくは、低
ビットレート化を図ることができる。すなわち、当該第
2の実施例装置においても、全チャンネルトータルにお
ける低ビットレート化又は高音質化が可能となる。
ビットレート化を図ることができる。すなわち、当該第
2の実施例装置においても、全チャンネルトータルにお
ける低ビットレート化又は高音質化が可能となる。
【0150】また、この第2の実施例の場合において
も、記録するメデイアによっては固定長が望ましい場合
がある。その場合、全チャンネルの総ビット配分量を概
ね一定とする様に符号化することも可能である。
も、記録するメデイアによっては固定長が望ましい場合
がある。その場合、全チャンネルの総ビット配分量を概
ね一定とする様に符号化することも可能である。
【0151】以上、本発明の第1の実施例、及び第2の
実施例において、記録媒体として映画フィルムを例示し
た。しかし、本発明の要旨を変更しない範囲において、
記録媒体は映画フィルムに止まらず、様々なものが使用
可能である。例えば、光ディスク、磁気テープ等であ
る。
実施例において、記録媒体として映画フィルムを例示し
た。しかし、本発明の要旨を変更しない範囲において、
記録媒体は映画フィルムに止まらず、様々なものが使用
可能である。例えば、光ディスク、磁気テープ等であ
る。
【0152】
【発明の効果】本発明においては、各チャンネルへのビ
ット配分量をそれぞれのチャンネルのエネルギ、例えば
振幅情報又はスケールファクタの総和の時間的な変化に
より決定しているため、各チャンネルにその情報量に見
合ったビット配分が可能となり、更なる高能率符号化が
可能となる。それによって更なる高音質化もしくは、低
ビットレート化が可能となる。
ット配分量をそれぞれのチャンネルのエネルギ、例えば
振幅情報又はスケールファクタの総和の時間的な変化に
より決定しているため、各チャンネルにその情報量に見
合ったビット配分が可能となり、更なる高能率符号化が
可能となる。それによって更なる高音質化もしくは、低
ビットレート化が可能となる。
【0153】また、本発明でのマルチチャンネルのオー
ディオ信号とは、少なくとも2チャンネルをいい、望ま
しくは映画のサウンドトラツクのように、5チャンネル
以上において、本発明の効果が顕著になる。
ディオ信号とは、少なくとも2チャンネルをいい、望ま
しくは映画のサウンドトラツクのように、5チャンネル
以上において、本発明の効果が顕著になる。
【図1】本発明の第1の実施例の高能率符号化装置の概
略構成を示すブロック回路図である。
略構成を示すブロック回路図である。
【図2】本発明の第1及び第2の実施例の高能率復号化
装置の概略構成を示すブロック回路図である。
装置の概略構成を示すブロック回路図である。
【図3】ATRAC方式の高能率符号化装置及び本発明
実施例の高能率符号化装置におけるビット配分について
説明するためのブロック回路図である。
実施例の高能率符号化装置におけるビット配分について
説明するためのブロック回路図である。
【図4】サウンドフレーム内のデータの記録の様子を説
明するための図である。
明するための図である。
【図5】第1の実施例におけるビット配分量を説明する
ための図である。
ための図である。
【図6】第1の実施例におけるビット配分決定の動作を
説明するためのフローチヤートである。
説明するためのフローチヤートである。
【図7】本発明の第2の実施例の高能率符号化装置の概
略構成を示すブロック回路図である。
略構成を示すブロック回路図である。
【図8】第2の実施例におけるビット配分量を説明する
ための図である。
ための図である。
【図9】第2の実施例におけるビット配分決定の動作を
説明するためのフローチヤートである。
説明するためのフローチヤートである。
26 レーザ記録装置
27 映画フィルム
28 記録エリア
29 パーフォレーション
100 標本化及び量子化器
200 振幅情報検出回路
300 ディレイライン
310,500 ビット配分決定回路
400 符号化器
401 帯域分割フィルタ
402L,402M,402H MDCT回路
403 ブロックサイズ評価器
404L,404M,404H 正規化回路
405 ビット配分器
406 再量子化器
600,407,410 フォーマッタ
700 デフォーマッタ
800 復号器
900 D/A変換器
─────────────────────────────────────────────────────
フロントページの続き
(56)参考文献 特開 平2−63335(JP,A)
特開 平5−56500(JP,A)
特開 平5−248972(JP,A)
特開 平5−108100(JP,A)
特表 平5−505504(JP,A)
特表 平4−506141(JP,A)
(58)調査した分野(Int.Cl.7,DB名)
G10L 19/02
Claims (6)
- 【請求項1】 複数のチャンネルのディジタルオーディ
オ信号を、夫々オーディオ信号の性質と人間の聴感を利
用して圧縮符号化する符号化装置であって、 各チャンネルの上記ディジタルオーディオ信号毎に、上
記ディジタルオーディオ信号のエネルギを検出するエネ
ルギ検出手段と、 上記検出結果に基づいて、各チャンネルへのビット配分
量を決定するビット配分量決定手段と、 上記ビット配分量の決定に応じて上記各チャンネル毎に
配分されたビット配分量に基づいて、圧縮符号化を行う
圧縮符号化手段と、 上記各チャンネル毎の圧縮符号化された信号を多重化す
る多重化手段とよりなり、 上記ビット配分量決定手段は、信号のエネルギとビット
配分量との関係が、全体として、信号のエネルギの増加
に伴ってビット配分量が増加する非線形特性であって、
信号エネルギが所定の第1の値より小さいときに略々平
坦なビット配分特性を有するとともに、信号エネルギが
所定の第2の値より大きいときにビット配分が減少する
特性を有するものであることを特徴とする符号化装置。 - 【請求項2】 上記ビット配分量決定手段は、各チャン
ネル毎の必要とするビット量の概算を夫々求め、単位時
間当たりの各チャンネルの合計ビット量を各概算量に比
例して配分し、各チャンネルのビット配分量を決定する
ことを特徴とする請求項1記載の符号化装置。 - 【請求項3】 複数のチャンネルのディジタルオーディ
オ信号を、夫々オーディオ信号の性質と人間の聴感を利
用して圧縮符号化する符号化方法であって、 各チャンネルの上記ディジタルオーディオ信号毎に、信
号のエネルギを検出するエネルギ検出ステップと、 上記検出結果に基づいて各チャンネルへのビット配分量
を決定するビット配分量決定ステップと、 上記ビット配分量の決定に応じて上記各チャンネル毎に
配分されたビット配分量に基づいて、圧縮符号化を行う
圧縮符号化ステップと、 上記各チャンネルの圧縮符号化された信号を多重化する
多重化ステップとよりなり、 上記ビット配分量決定ステップは、信号のエネルギとビ
ット配分量との関係が、全体として、信号のエネルギの
増加に伴ってビット配分量が増加する非線形特性であっ
て、信号エネルギが所定の第1の値より小さいときに略
々平坦なビット配分特性を有するとともに、信号エネル
ギが所定の第2の値より大きいときにビット配分が減少
する特性を有するものであることを特徴とする符号化方
法。 - 【請求項4】 複数のチャンネルのディジタルオーディ
オ信号毎に上記ディジタルオーディオ信号のエネルギを
検出する手段と、上記検出結果に基づいて各チャンネル
へのビット配分量を決定する手段と、上記ビット配分量
の決定に応じて上記各チャンネル毎に配分されたビット
配分量に基づいて圧縮符号化する手段と、上記各チャン
ネル毎の圧縮符号化された信号を多重化する手段とから
なり、上記ビット配分量を決定する手段は、信号のエネ
ルギとビット配分量との関係が、全体として、信号のエ
ネルギの増加に伴ってビット配分量が増加する非線形特
性であって、信号エネルギが所定の第1の値より小さい
ときに略々平坦なビット配分特性を有するとともに、信
号エネルギが所定の第2の値より大きいときにビット配
分が減少する特性を有する符号化装置によって、上記複
数のチャンネルのディジタルオーディオ信号を夫々オー
ディオ信号の性質と人間の聴感を利用して圧縮符号化し
て多重化された圧縮符号化信号から、各チャンネルの信
号を復号化する復号化手段を有することを特徴とする復
号化装置。 - 【請求項5】 請求項1に記載の符号化装置により、多
重化された圧縮符号化信号が記録された記録媒体から、
各チャンネルの信号を復号化する復号化手段を有するこ
とを特徴とする復号化装置。 - 【請求項6】 複数のチャンネルのディジタルオーディ
オ信号毎に上記ディジタルオーディオ信号のエネルギを
検出するステップと、上記検出結果に基づいて各チャン
ネルへのビット配分量を決定するステップと、上記ビッ
ト配分量の決定に応じて上記各チャンネル毎に配分され
たビット配分量に基づいて圧縮符号化するステップと、
上記各チャンネル毎の圧縮符号化された信号を多重化す
るステップとからなり、上記ビット配分量を決定するス
テップは、信号のエネルギとビット配分量との関係が、
全体として、信号のエネルギの増加に伴ってビット配分
量が増加する非線形特性であって、信号エネルギが所定
の第1の値より小さいときに略々平坦なビット配分特性
を有するとともに、信号エネルギが所定の第2の値より
大きいときにビット配分が減少する特性を有する符号化
方法により、上記複数のチャンネルのディジタルオーデ
ィオ信号を夫々オーディオ信号の性質と人間の聴感を利
用して圧縮符号化して多重化された圧縮符号化信号が記
録された記録媒体から、各チャンネルの信号を復号化す
る復号化ステップを有することを特徴とする復号化方
法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20670294A JP3528260B2 (ja) | 1993-10-26 | 1994-08-31 | 符号化装置及び方法、並びに復号化装置及び方法 |
AU77458/94A AU689134B2 (en) | 1993-10-26 | 1994-10-25 | Low bit rate encoder, low bit rate encoding method, low bit rates decoder, low bit rate decoding method for digital audio signals, and recording media on which signals coded by such encoder or encoding method are recorded |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5-267250 | 1993-10-26 | ||
JP26725093 | 1993-10-26 | ||
JP20670294A JP3528260B2 (ja) | 1993-10-26 | 1994-08-31 | 符号化装置及び方法、並びに復号化装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07175499A JPH07175499A (ja) | 1995-07-14 |
JP3528260B2 true JP3528260B2 (ja) | 2004-05-17 |
Family
ID=26515806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20670294A Expired - Fee Related JP3528260B2 (ja) | 1993-10-26 | 1994-08-31 | 符号化装置及び方法、並びに復号化装置及び方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP3528260B2 (ja) |
AU (1) | AU689134B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6014491A (en) * | 1997-03-04 | 2000-01-11 | Parsec Sight/Sound, Inc. | Method and system for manipulation of audio or video signals |
SE519552C2 (sv) * | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
JP2004309921A (ja) | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
EP2830052A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1253255A (en) * | 1983-05-16 | 1989-04-25 | Nec Corporation | System for simultaneously coding and decoding a plurality of signals |
DE4135977C2 (de) * | 1991-10-31 | 1996-07-18 | Fraunhofer Ges Forschung | Verfahren zur gleichzeitigen Übertragung von Signalen aus N-Signalquellen |
-
1994
- 1994-08-31 JP JP20670294A patent/JP3528260B2/ja not_active Expired - Fee Related
- 1994-10-25 AU AU77458/94A patent/AU689134B2/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
AU689134B2 (en) | 1998-03-26 |
AU7745894A (en) | 1995-05-18 |
JPH07175499A (ja) | 1995-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5737720A (en) | Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation | |
JP3277679B2 (ja) | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 | |
JP3404837B2 (ja) | 多層符号化装置 | |
Noll | MPEG digital audio coding | |
KR100261254B1 (ko) | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 | |
US6169973B1 (en) | Encoding method and apparatus, decoding method and apparatus and recording medium | |
KR100339324B1 (ko) | 고능률부호화방법,고능률부호의복호화방법,고능률부호의부호화장치,고능률부호의복호화장치,및고능률부호화.복호화시스템 | |
JP3250376B2 (ja) | 情報符号化方法及び装置並びに情報復号化方法及び装置 | |
JP3397001B2 (ja) | 符号化方法及び装置、復号化装置、並びに記録媒体 | |
KR100528325B1 (ko) | 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치 | |
JP3227942B2 (ja) | 高能率符号化装置 | |
US20010047256A1 (en) | Multi-format recording medium | |
JP3528260B2 (ja) | 符号化装置及び方法、並びに復号化装置及び方法 | |
EP0734019A1 (en) | Information processing method, information processing device and media | |
JP2852862B2 (ja) | Pcmオーディオ信号の変換方法と装置 | |
JP3341448B2 (ja) | マルチチャンネルオーディオデータの高能率符号化方法 | |
JP3362476B2 (ja) | 高能率符号化装置及びインタフェース装置 | |
JPH09102742A (ja) | 符号化方法および装置、復号化方法および装置、並びに記録媒体 | |
JP3594829B2 (ja) | Mpegオーディオの復号化方法 | |
JPH07181996A (ja) | 情報処理方法、情報処理装置、及びメディア | |
JP3227948B2 (ja) | 復号化装置 | |
JPH07161140A (ja) | ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法 | |
JPH07161142A (ja) | 記録方法、記録媒体、及び再生方法 | |
KR0144297B1 (ko) | 적응적 디지탈 오디오 부호화 장치 | |
Smyth | An Overview of the Coherent Acoustics Coding System |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040216 |
|
LAPS | Cancellation because of no payment of annual fees |