JPH07123008A - 高能率符号化装置 - Google Patents
高能率符号化装置Info
- Publication number
- JPH07123008A JPH07123008A JP26725193A JP26725193A JPH07123008A JP H07123008 A JPH07123008 A JP H07123008A JP 26725193 A JP26725193 A JP 26725193A JP 26725193 A JP26725193 A JP 26725193A JP H07123008 A JPH07123008 A JP H07123008A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- common
- data
- channels
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
当該符号化されたディジタル信号と共に当該符号化のパ
ラメータ情報(スケールファクタ)を出力する高能率符
号化装置において、各チャネル毎の符号化のパラメータ
情報(スケールファクタ)を求め、少なくとも2以上の
チャネル間で当該パラメータ情報(スケールファクタ)
を共通化するスケールファクタ共通化回路105を有す
る。 【効果】 マルチチャネルの信号の圧縮符号化におい
て、より高圧縮率を実現でき、また既存の復号化装置を
も使用可能となる。
Description
映写システム、ビデオテープレコーダ、ビデオディスク
プレーヤ等のステレオや、いわゆるマルチサラウンド音
響システムにおいて用いられるマルチチャネルのディジ
タル信号を圧縮符号化する高能率符号化装置に関するも
のである。
符号化の手法及び装置には種々あるが、例えば、時間領
域のオーディオ信号等を単位時間毎にブロック化してこ
のブロック毎の時間軸の信号を周波数軸上の信号に変換
(直交変換)して複数の周波数帯域に分割し、各帯域毎
に符号化するブロック化周波数帯域分割方式、いわゆる
変換符号化(トランスフォームコーティング)や、時間
領域のオーディオ信号等を単位時間毎にブロック化しな
いで、複数の周波数帯域に分割して符号化する非ブロッ
ク化周波数帯域分割方式である帯域分割符号化(サブバ
ンドコーディング:SBC)等を挙げることができる。
また、上述の帯域分割符号化と変換符号化とを組み合わ
せた高能率符号化の手法及び装置も考えられており、こ
の場合には、例えば、上記帯域分割符号化で帯域分割を
行った後、該各帯域毎の信号を周波数領域の信号に直交
変換し、この直交変換された各帯域毎に符号化が施され
る。
割用フィルタとしては、例えばQMF等のフィルタがあ
り、これは1976 R.E.Crochiere Digital coding of sp
eechin subbands Bell Syst.Tech. J. Vol.55, No.8 1
976に、述べられている。また、ICASSP 83, BOSTON Po
lyphase Quadrature filters-A new subband codingtec
hnique Joseph H. Rothweiler には等バンド幅のフィル
タ分割手法及び装置が述べられている。
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、該ブロック毎に高速フーリエ変換(FF
T)、コサイン変換(DCT)、モディファイドDCT
変換(MDCT)などを行うことで時間軸を周波数軸に
変換するような直交変換がある。このMDCTについて
は、ICASSP 1987 Subband/Transform Coding Using Fil
ter Bank Designs Basedon Time Domain Aliasing Canc
ellation J.P.Princen A.B.Bradley Univ. ofSurrey R
oyal Melbourne Inst.of Tech.に述べられている。
を量子化する場合の周波数分割幅としては、例えば人間
の聴覚特性を考慮した帯域分割がある。すなわち、一般
に臨界帯域(クリティカルバンド)と呼ばれている高域
程帯域幅が広くなるような帯域幅で、オーディオ信号を
複数(例えば25バント)の帯域に分割することがあ
る。また、この時の各帯域毎のデータを符号化する際に
は、各帯域毎に所定のビット配分或いは、各帯域毎に適
応的なビット配分による符号化が行われる。例えば、上
記MDCT処理されて得られた係数データを上記ビット
配分によって符号化する際には、上記各ブロック毎のM
DCT処理により得られる各帯域毎のMDCT係数デー
タに対して、適応的な配分ビット数で符号化が行われる
ことになる。
しては、次の2手法及び装置が知られている。IEEE Tra
nsactions of Accoustics,Speech,and Signal Processi
ng,vol.ASSP-25,No.4,August 1977 では、各帯域毎の信
号の大きさをもとに、ビット配分を行っている。また、
ICASSP 1980 The critical band coder--digital encod
ing ofthe perceptual requirements of the auditory
system M.A. Kransner MIT では、聴覚マスキングを利
用することで、各帯域毎に必要な信号対雑音比を得て固
定的なビット配分を行う手法及び装置が述べられてい
る。
したようなサブバンドコーディング等を用いたオーディ
オ信号の高能率圧縮符号化方式においては、人間の聴覚
上の特性を利用し、オーディオデータを約1/5に圧縮
するような方式が既に実用化されている。なお、このオ
ーディオデータを約1/5に圧縮する方式としては、例
えばいわゆるATRAC(Adaptive TRansform Acousti
c Coding) と呼ばれる方式が存在する。
らず、例えば映画フィルム映写システム、高品位テレビ
ジョン、ビデオテープレコーダ、ビデオディスクプレー
ヤ等のステレオないしはマルチサラウンド音響システム
においては、例えば4〜8チャネル等の複数チャネルの
オーディオ或いは音声信号を扱うようになりつつあり、
この場合においても、ビットレートを削減する高能率符
号化を行うことが望まれている。
フトチャネル,レフトセンターチャネル,センターチャ
ネル,ライトセンターチャネル,ライトチャネル,サラ
ウンドレフトチャネル,サラウンドライトチャネル,サ
ブウーファーチャネルの8チャネルのディジタルオーデ
ィオ信号を記録するような場合においては、上記ビット
レートを削減する高能率符号化が必要となる。すなわ
ち、例えばいわゆるCD(コンパクトディスク)などで
用いているようなサンプリング周波数44.1kHzで
16ビットの直線量子化されたオーディオデータの上記
8チャネル分をも記録できる領域は、上記映画フィルム
上に確保することが困難であり、したがって、当該オー
ディオデータの圧縮が必要になる。
チャネルの各チャネルは、例えば当該映画フィルムの画
像記録領域から再生された画像が映写機によって投影さ
れるスクリーン側に配置されたレフトスピーカ、レフト
センタースピーカ、センタスピーカ、ライトセンタスピ
ーカ、ライトスピーカ、サラウンドレフトスピーカ、サ
ラウンドライトスピーカ、サブウーファースピーカとそ
れぞれ対応するものである。ここで、上記センタスピー
カは、スクリーン側の中央に配置され、センタチャネル
のオーディオデータによる再生音を出力するもので例え
ば俳優のせりふ等の最も重要な再生音を出力する。上記
サブウーファースピーカは、サブウーファーチャネルの
オーディオデータによる再生音を出力するもので、例え
ば爆発音などの低域の音というよりは振動として感じら
れる音を効果的に出力するものであり、爆発シーンなど
に効果的に使用されることが多いものである。上記レフ
トスピーカ及びライトスピーカは、上記スクリーンの左
右に配置され、レフトチャネルのオーディオデータによ
る再生音とライトチャネルのオーディオデータによる再
生音を出力するもので、ステレオ音響効果を発揮する。
上記レフトセンタスピーカは上記レフトスピーカとセン
タスピーカとの間に配置され、また上記ライトセンタス
ピーカは上記センタスピーカとライトスピーカとの間に
配置されるものである。上記レフトセンタスピーカはレ
フトセンタチャネルのオーディオデータによる再生音を
出力し、上記ライトセンタスピーカはライトセンタチャ
ネルのオーディオデータによる再生音を出力するもの
で、それぞれ上記レフトスピーカ若しくはライトスピー
カの補助的な役割を果たす。特にスクリーンが大きく収
容人数の多い映画館等では、座席の位置によって音像の
定位が不安定になりやすいが、上記レフトセンタスピー
カとライトセンタスピーカを付加することにより、音像
のよりリアルな定位を作り出すのに効果を発揮する。さ
らに、上記サラウンドレフトスピーカとサラウンドライ
トスピーカは、観客席を取り囲むように配置され、サラ
ウンドレフトチャネルのオーディオデータによる再生音
とサラウンドライトチャネルのオーディオデータによる
再生音を出力するもので、残響音や拍手、歓声に包まれ
た印象を与える効果がある。これにより、より立体的な
音像を作り出すことができる。
どが発生しやすいため、ディジタルデータをオリジナル
のまま記録していたのでは、データ欠けが激しく実用に
ならない。このため、エラー訂正符号の能力が非常に重
要になり、上記データ圧縮は、その訂正符号も含めて上
記フィルム上の記録領域に記録可能な程度まで行う必要
がある。
チャネルのディジタルオーディオデータを圧縮する圧縮
方法としては、上述したような人間の聴覚の特性を考慮
して最適なビット割り当てを行うことによって、例えば
いわゆるCD(コンパクトディスク)などに記録される
ようなサンプリング周波数44.1kHzで16ビット
のディジタルオーディオデータを約1/5に圧縮しなが
らも、CD並の音質を達成する前記高能率符号化方式
(いわゆるATRAC方式など)を適用するようにして
いる。
ャネル用の符号化方式であり、これを用いてマルチチャ
ネルオーディオデータを符号化する場合には、チャンネ
ル間のデータの依存関係や、各チャネルのデータ特性、
フォーマット特性といった要素を用いた効果的なデータ
符号化処理をすることができない。
鑑み、マルチチャネルの信号の圧縮符号化において、よ
り高圧縮率を実現でき、また既存の復号化装置をも使用
可能となす高能率符号化装置を提供することを目的とし
ている。
置は、上述の目的を達成するために提案されたものであ
り、複数チャネルのディジタル信号を符号化し、当該符
号化されたディジタル信号と共に符号化のパラメータ情
報を出力する高能率符号化装置において、各チャネルの
符号化のパラメータ情報を求め、少なくとも2以上のチ
ャネル間で当該パラメータ情報を共通化することによっ
て、出力するパラメータ情報を削減するパラメータ共通
化手段を有し、当該パラメータ情報を削減することで圧
縮率を高めるようにしたものである。
チャネルのパラメータ情報の一部又は全部をチャネル間
で共通化する。この各チャネルのパラメータ情報の一部
又は全部をチャネル間で共通化する際に、上記パラメー
タ共通化手段は、符号化時に上記パラメータ情報を共通
化するチャネルを所定の評価関数を用いて選択すること
で、音質低下を生む共通化を抑制するようにしている。
また、当該パラメータ共通化手段は、各チャネルのディ
ジタル信号を複数帯域に分割した帯域別に上記パラメー
タ情報の共通化を行うことで、ディジタル信号の周波数
特性に合わせた符号化を可能としている。
間の相関が強く全く同一ではないが互いに似ている各チ
ャネルの信号を既存のシングルチャネル用の符号化方式
で符号化すると、各チャネルの符号化されたデータのう
ちのデータの特性を表すパラメータ情報は、各チャネル
間で一致する傾向にあり、したがって、一致しているパ
ラメータ情報をチャネル間で共通化することで、冗長化
を抑えると共に、パラメータ情報の似ているチャネルを
判別することによって共通化による音質の低減を抑制す
るようにしている。
ながら説明する。図1には、本発明実施例の高能率符号
化装置に適用される前記いわゆるATRAC方式の符号
化を行う構成を示す。
供給された標本化及び量子化されたオーディオデータ
は、先ず、帯域分割フィルタ401によって0〜5.5
kHzの低域と、5.5kHz〜11kHzの中域と、
11kHz以上(11kHz〜22kHz)の3つの周
波数帯域に分割される。
記帯域分割フィルタ401からの上記低域の信号はMD
CT(Modified Discrete Cosine Transform:改良型離
散余弦変換)演算を行うMDCT回路402Lに、中域
の信号は同じくMDCT演算を行うMDCT回路402
Mに、また、高域の信号はMDCT回路402Hに送ら
れ、これらMDCT回路402L〜402Hでそれぞれ
周波数成分に分解される。このとき、上記MDCTを施
すときの時間ブロック長は、各周波数帯域毎に可変であ
り、信号が急激に変化する部分では、時間ブロック長を
短くして、時間分解能を高め、信号が定常的な部分では
時間ブロック長を長くして、信号成分の有効伝送と量子
化雑音を制御する。
価器403にて決定されている。すなわち、上記帯域分
割フィルタ401からの3つの周波数帯域の信号は、ブ
ロックサイズ評価器403にも送られ、当該ブロックサ
イズ評価器403が上記MDCTの時間ブロック長を決
定し、この決定した時間ブロック長を示す情報を上記M
DCT回路402L〜402Hに送るようにしている。
ック長のうち、長い時間ブロック長はロングモードと呼
ばれ、11.6msの時間に相当する。また、短い時間
ブロック長はショートモードと呼ばれ、高域(11kH
z以上)で1.45msまで、低域(5.5kHz以
下)及び中域(5.5kHzから11kHz)では2.
9msまで時間分解能を上げるようにしている。
域(これをブロックフローティングユニット:Block Fl
oating Unit と呼ぶ)上の信号成分に分解されたオーデ
ィオ信号は、正規化回路404L〜404Hによって低
域,中域,高域で合計52個のブロックフローティング
ユニットに分けられると共に、ユニット毎に規格化(正
規化)される(スケールファクタの決定がなされる)。
の聴覚の特性を利用して、そのオーディオ信号がどのよ
うな成分から構成されているかを分析する。この分析結
果が上記正規化回路404L〜404Hからの各ユニッ
ト毎の信号が供給される再量子化器406に送られる。
基づいて、各ユニットをどの程度の精度で符号化するか
を求めてパラメータ化する(ワードレングスの決定を行
う)と共に、再量子化を行う。
ット毎の各パラメータ情報と再量子化されたスペクトラ
ム信号とを所定のフォーマットに従ってビットストリー
ムへ組み立てる。このフォーマッタ407の出力が出力
端子25から出力される。
ウンドフレームという単位毎に行われる。
タの記録の様子を示す。この図2において、1サウンド
フレームは212バイトからなり、ここに44.1kH
zのサンプリングレートで512サンプル、1チャネル
相当のオーディオ再生用データが圧縮符号化されてい
る。
タは、ブロックサイズモード、サブインフォメーション
量、ワードレングスデータ、スケールファクタデータ、
スペクトラムデータ、冗長スケールファクタバイト、冗
長ワードレングスバイト、下部のサブインフォメーショ
ン量、及び、下部のブロックサイズモードから構成され
る。ここで、212バイトのデータの中には、エラー訂
正用の2重書き部分(冗長スケールファクタバイト、冗
長ワードレングスバイト、下部ブロックサイズモード)
が含まれている。
ックサイズ評価器403の評価結果を記録するためのデ
ータで、その内容は表1に示すようなものとなってい
る。
ードのとき、低域及び中域ではMDCT演算によりそれ
ぞれ128個の周波数成分に、高域では256個の周波
数成分に分解される。また、ショートモードのとき、低
域、中域及び高域はそれぞれ32個の周波数成分に分解
される。
ウント1、アマウント2、アマウント3の3つの情報が
記録され、アマウント1は、記録されているワードレン
グス及びスケールファクタの個数を表し、アマウント2
は2重書きされているワードレングスの個数を表し、ア
マウント3は2重書きされているスケールファクタの個
数を表している。この内容については、表2に示す。
されたときの語長を表す。この内容については表3に示
す。
た値を表す。その内容については表4に示す。
ATRAC方式によるデータを例えば図3に示すように
記録する。すなわち、順に、20バイトのIDデータ、
それぞれ212バイトのチャネルCh1〜Ch8のデー
タ、4バイトの誤り訂正符号のCRCデータを記録す
る。
てはめると、図4に示すように、入力端子31〜38を
介するマルチチャネルのオーディオデータ(8チャネル
のデータ)を、各チャネルに対応して設けられた符号器
41〜48によってそれぞれ符号化し、その結果の値を
全く変更せずにマルチプレクサ49によってまとめて、
ひとつのデータとして端子50から出力する処理とな
る。
に、2つのチャネルのデータ間の相関が強く、全く同一
ではないが似たデータが入力されるような場合は、各チ
ャネル用の符号器によって符号化されたデータのうち、
データの特性をあらわすパラメータ部分が、これらチャ
ネル間で一致する傾向がある。すなわち、このような一
致しているパラメータ全てをそれ以外のチャネルのパラ
メータと平等に記録するのは冗長である。したがって、
例えば、一致している部分は1チャネルに代表させるな
どの処置を取るのが適切である。
では、これらの状況を踏まえ、複数チャネルのパラメー
タを共通化することによって冗長化を抑えると共に、パ
ラメータの似ているチャネルを判別することにより共通
化による音質の低減を抑制するようにしている。
明する。
間の必要条件は、両チャネルのブロックサイズモードが
同一であることのみである。ただし、例えば記憶容量な
どの理由により共通化する必要がある場合は、この限り
ではない。その際、時間ブロック長はショートモードを
優先し、いずれかのチャネルがショートモードであれば
共通ブロックサイズモードもショートモードに設定す
る。
量子化までの処理のみを抜き出して、さらに細かく処理
を分割して具体的構成に当てはめて表すと、図5に示す
ような構成として表すことができる。
ィルタ401からの各帯域のオーディオデータが端子9
0を介して供給され、このデータがブロックサイズモー
ド決定回路91に送られ、当該ブロックサイズモード決
定回路91でブロックサイズモードを決定する。その
後、スケールファクタ決定回路93では上記ユニット毎
に規格化(スケールファクタの決定)を行う。次のサブ
インフォメーション量決定回路95では、上記スケール
ファクタとワードレングスの記録媒体へ記録する個数を
決定(サブインフォメーション量決定)し、聴覚特性よ
りビットアロケーションしてワードレングスを決定す
る。再量子化器98では、上記決定されたワードレング
スを用いて上記各帯域のオーディオデータを再量子化す
る。
全く異なるパラメータをもつチャネル同士で共通化する
のは無理があるため、例えば全チャネルのデータサイズ
や記録容量といった制限を回避可能になるまで、最も似
ているパラメータを持つチャネル同士から共通化してい
くのが好ましい。そのパラメータが似ているという評価
に用いる値すなわち共通化コストは、式(1)にて求め
ることができる。なお、式(1)は2チャネル間で共通
化コストを用いる場合の式である。また、この式(1)
において、式中SF1(i)およびSF2(i)は、共
通化コストを計算する2チャネルのユニットi(UNI
T i)のスケールファクタの値を示している。
む全チャネルの組合せについて、上記式(1)を用いて
共通化コストを計算し、その最も小さいチャネル同士を
共通化する。ここまでの作業を、チャネル間の共通化が
必要でなくなるまで続ける。
はめると、図6に示すようになる。すなわちこの図6に
おいて、端子100a,100bには2チャネルのチャ
ネルのデータが供給され、各チャネル毎にブロックサイ
ズモード決定回路101a,101bによってブロック
サイズモードが決定される。各ブロックサイズモード決
定回路101a,101bからはブロック毎のオーディ
オデータと共にブロックサイズモードの情報が出力さ
れ、当該ブロックサイズモードの情報は同一チェック回
路102に送られる。
ズモードの同一をチェックし、その結果を上記各ブロッ
クサイズモード決定回路101a,101bからのそれ
ぞれ対応するチャネルのブロック毎のオーディオデータ
が供給されるスケールファクタ決定回路103a,10
3bへ送られる。各スケールファクタ決定回路103
a,103bからのスケールファクタの値は共通化コス
ト計算回路104に送られて、ここで上記式(1)の共
通化コストの計算がなされる。
チャネルの計算結果は端子111a,111bを介して
出力され、上記各スケールファクタ決定回路103から
の各チャネルのオーディオデータは端子110a,11
0bから出力される。
チャネルが決定されたならば、その後は、上記再量子化
までの処理を行う。なお、パラメータを共通化しないチ
ャネルの場合の処理は、図5の処理のままである。これ
に対して、パラメータを共通化するチャネルの場合は、
図7の具体的構成にて示すように、共通化パラメータを
用いて再量子化処理を行う。
a,113bには上記図6の対応する端子111a,1
11bからの出力が供給され、端子112a,112b
には図6の対応する端子110a,110bの出力が供
給される。上記端子110a,110bを介した信号
は、各チャネルに対応して設けられた再量子化器108
a,108bに送られる。
た信号はスケールファクタ共通化回路105に送られ
る。当該スケールファクタ共通化回路105では、スケ
ールファクタを共通化する。この共通化には、 max(SF1,SF2) を各ユニットについて求め、これを各ユニットのスケー
ルファクタとする。なお上記maxとは、両スケールフ
ァクタの最大値を意味する。最大値を選択することで、
再量子化できないデータの発生を回避する。
路106においては共通サブインフォメーション量を求
め、これをもとに次のワードレングス決定回路107で
はビットアロケーション処理を行ってワードレングスを
決定する。この処理はブロックサイズモード、サブイン
フォメーション量、スケールファクタを用いて求めるた
め、共通化データだけを用いてチャネル間で共通に処理
できる。処理内容も図5に示した処理と同じである。
て、各再量子化器108a,108bでは各チャネル毎
に再量子化を行う。これにより、パラメータを共通化し
た各チャネルの符号化データが作成され、各チャネルに
対応する端子114a,114bから出力される。
オデータを符号化する構成に適用すると、符号化処理の
全体としては、図4と比較して、図8に示すような構成
となる。
の入力端子31〜38からのオーディオデータが、共通
チャネル符号器51に送られ、この共通チャネル符号器
51で上述の共通化の処理と符号化が行われる。当該共
通チャネル符号器51からの各チャネルの符号化された
データが、マルチプレクサ52を介して端子53から出
力される。
おいては、各チャネルの復号を行う復号器の前に上記共
通化データをそれぞれのチャネルに割り振る必要があ
る。すなわち、図9に示すように例えば前記8チャネル
のうちのチャネルCh3とチャネルCh4のパラメータ
が共通化されている場合を例に挙げて説明すると、図9
の(a)に示すような記録媒体でのデータの記録状況
(131)に対し、図9の(b)に示すように共通部分
を各々に分配し(132a,132b)、各チャネルの
復号器(チャネルCh3用の復号器とチャネルCh4用
の復号器)へデータを渡すという処理を行う必要があ
る。
つにまとめられた状態で記録されており、復号化装置に
はこれを各チャネル分のデータに配分する処理が必要で
ある。本実施例のような共通化の処理を行う符号化の方
式を用いる場合、当該復号化装置では、例えば全チャネ
ルを1サウンドフレーム分の内部メモリに一旦格納し、
次に各チャネルに対し該当パラメータを配分できるよ
う、配分器を設計すればよい。また、本実施例の方式に
よれば、共通化の範囲が1サウンドフレーム内に完結し
ているため、同チャネルの時間軸上の複数のサウンドフ
レームを扱う必要がなく、データの選択も容易である。
ATRACデータは、1チャネルあたり、式(2)に示
すように、データサイズが小さくなる。 SIA*(4+6)+16[ビット] ・・・(2)
ォメーション量を示す。例えば、本実施例において用い
ているATRAC方式の場合の上記SIAの最大値は5
2であるから、最高で536ビット、すなわち67バイ
トほどデータサイズが小さくなることになる。また、A
TRAC方式でのデータはパラメータが2重書きされて
おり、これも共通化できる。例えばパラメータ2重書き
領域サイズが26バイトならば、1サウンドフレームの
サイズは212バイトのうちの93バイトが共通化でき
るから、最高で約56%のサイズに圧縮できることを示
している。
ることにより、共通化しない場合に比べ量子化誤差が発
生する場合がある。しかし、通常、ATRAC方式での
データを可変長として用い、本実施例の符号化の方式と
同等サイズまで符号化データサイズを落とした場合に比
べ、本実施例の符号化の方式を用いた場合の方が量子化
誤差は少なく、したがって、本実施例の符号化の方式の
有効性が示される。
る。例えば記録媒体の記録領域に余裕がある場合や、共
通化に起因する精度の低下による量子化雑音の発生が許
されない場合などには、全てのパラメータを共通化する
のではなく、一部のパラメータのみを共通化する手法が
可能である。すなわち、ブロックサイズモード、サブイ
ンフォメーション量、スケールファクタの3要素のみを
共通化する手法である。これにより、前述した実施例の
場合よりも記録媒体での必要記録領域は増えるものの、
前記ATRAC方式による場合よりも必要記録領域は少
なく、かつ量子化雑音の発生も抑制されるため、音質向
上に有効である。なお、ブロックサイズモード、サブイ
ンフォメーション量、ワードレングスの3つを共通化す
る方法は、ATRACフォーマットの特性により多少無
駄が多くなることがある。
インフォメーション量の2要素を共通化する方法も考え
られる。なお、この2要素を共通化する方法ではサイズ
が2バイトであるため圧縮率の向上に関する効果は、上
記各実施例ほどではないが、ATRAC方式よりも良い
ことは言うまでもない。
割の特性を利用して、低域、中域、高域のいずれか、あ
るいはそれらを組合せた帯域に対してのみ共通化する手
法がある。この場合、ブロックサイズモードの部分的共
通化や、サブインフォメーション量の整合が必要となる
が、これにより使用頻度の低い帯域は共通化するといっ
たデータ特性やチャネル特性を活用した符号化ができ、
効果的符号化が可能となる。
号化装置によれば、マルチチャネルオーディオデータの
符号化において、ATRAC方式以上の高圧縮率を実現
できる。さらにチャネル数が多いほど、その効果が大き
くなる。また、本実施例装置での符号化されたデータは
パラメータを共通化しただけのATRAC方式のデータ
であり、かつ共通化処理が1サウンドフレーム内で完結
しているため、記録の際にまとめられたデータをチャネ
ル毎に分割する際に、1つの共通化パラメータを該当チ
ャネルに配分するだけで、既存の復号化装置での復号化
が可能となる。
ルチチャネルオーディオデータの符号化において、各チ
ャネル毎の符号化のパラメータ情報を求め、少なくとも
2以上のチャネル間で当該パラメータ情報を共通化する
ことにより、既存の圧縮符号化よりもさらなる高圧縮率
を実現できる。さらにチャネル数が多いほど、その効果
が大きくなる。
タは、パラメータを共通化しただけの既存の圧縮符号化
方式のデータであり、かつ共通化処理も既存の圧縮符号
化方式の1フレーム内で完結しているため、記録の際に
まとめられたデータをチャネル毎に分割する際に、1つ
の共通化パラメータを該当チャネルに配分するだけで、
既存の復号化装置での復号化が可能となる。
るATRAC方式の符号化を行う構成を示すブロック回
路図である。
説明するための図である。
式で符号化したデータの記録媒体における記録の様子を
示す図である。
変更せずに1つのデータにまとめる処理を行う構成を示
すブロック回路図である。
化までの処理をより詳細な構成として示すブロック回路
図である。
トを求める具体的構成を示すブロック回路図である。
タを共通化して再量子化する具体的構成を示すブロック
回路図である。
子化する符号化処理の全体の構成を示すブロック回路図
である。
を復号化する際の復号化装置の動作を説明するための図
である。
決定回路 93,103a,103b・・・スケールファクタ決定
回路 95・・・サブインフォメーション量決定回路 97,107・・・ワードレングス決定回路 98,108a,108b,406・・・再量子化器 102・・・同一チェック回路 104・・・共通化コスト計算回路 105・・・スケールファクタ共通化回路 106・・・共通サブインフォメーション量決定回路 401・・・帯域分割フィルタ 402L,402M,402H・・・MDCT回路 403・・・ブロックサイズ評価器 404L,404M,404H・・・正規化回路 405・・・ビット配分器 407・・・フォーマッタ
Claims (4)
- 【請求項1】 複数チャネルのディジタル信号を符号化
し、当該符号化されたディジタル信号と共に当該符号化
のパラメータ情報を出力する高能率符号化装置におい
て、 各チャネル毎の符号化のパラメータ情報を求め、少なく
とも2以上のチャネル間で当該パラメータ情報を共通化
するパラメータ共通化手段を有することを特徴とする高
能率符号化装置。 - 【請求項2】 上記パラメータ共通化手段は、各チャネ
ルのパラメータ情報の一部又は全部をチャネル間で共通
化することを特徴とする請求項1記載の高能率符号化装
置。 - 【請求項3】 上記パラメータ共通化手段は、上記パラ
メータ情報を共通化するチャネルを、所定の評価関数を
用いて選択することを特徴とする請求項2記載の高能率
符号化装置。 - 【請求項4】 上記パラメータ共通化手段は、各チャネ
ルのディジタル信号を複数帯域に分割した帯域別に上記
パラメータ情報の共通化を行うことを特徴とする請求項
3記載の高能率符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26725193A JP3227942B2 (ja) | 1993-10-26 | 1993-10-26 | 高能率符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP26725193A JP3227942B2 (ja) | 1993-10-26 | 1993-10-26 | 高能率符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07123008A true JPH07123008A (ja) | 1995-05-12 |
JP3227942B2 JP3227942B2 (ja) | 2001-11-12 |
Family
ID=17442239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26725193A Expired - Fee Related JP3227942B2 (ja) | 1993-10-26 | 1993-10-26 | 高能率符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3227942B2 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006072270A1 (en) * | 2005-01-10 | 2006-07-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Compact side information for parametric coding of spatial audio |
US7116787B2 (en) | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7583805B2 (en) | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7720230B2 (en) | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US7761304B2 (en) | 2004-11-30 | 2010-07-20 | Agere Systems Inc. | Synchronizing parametric coding of spatial audio with externally provided downmix |
US7787631B2 (en) | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
US8204261B2 (en) | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US8340306B2 (en) | 2004-11-30 | 2012-12-25 | Agere Systems Llc | Parametric coding of spatial audio with object-based side information |
-
1993
- 1993-10-26 JP JP26725193A patent/JP3227942B2/ja not_active Expired - Fee Related
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7116787B2 (en) | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US8200500B2 (en) | 2001-05-04 | 2012-06-12 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7693721B2 (en) | 2001-05-04 | 2010-04-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7941320B2 (en) | 2001-05-04 | 2011-05-10 | Agere Systems, Inc. | Cue-based audio coding/decoding |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7583805B2 (en) | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
US8238562B2 (en) | 2004-10-20 | 2012-08-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7720230B2 (en) | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US8204261B2 (en) | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US8340306B2 (en) | 2004-11-30 | 2012-12-25 | Agere Systems Llc | Parametric coding of spatial audio with object-based side information |
US7787631B2 (en) | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US7761304B2 (en) | 2004-11-30 | 2010-07-20 | Agere Systems Inc. | Synchronizing parametric coding of spatial audio with externally provided downmix |
KR100895609B1 (ko) * | 2005-01-10 | 2009-04-30 | 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. | 공간 오디오의 파라메트릭 코딩을 위한 조밀한 부수 정보 |
US7903824B2 (en) | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
WO2006072270A1 (en) * | 2005-01-10 | 2006-07-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Compact side information for parametric coding of spatial audio |
JP2008527431A (ja) * | 2005-01-10 | 2008-07-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 空間音声のパラメトリック符号化のためのコンパクトなサイド情報 |
Also Published As
Publication number | Publication date |
---|---|
JP3227942B2 (ja) | 2001-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3277679B2 (ja) | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 | |
JP3404837B2 (ja) | 多層符号化装置 | |
EP0650262B1 (en) | Perceptual multi-channel audio coding with adaptive bit allocation | |
KR100261254B1 (ko) | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 | |
JP3277692B2 (ja) | 情報符号化方法、情報復号化方法及び情報記録媒体 | |
JP3278900B2 (ja) | データ符号化装置及び方法 | |
US5774844A (en) | Methods and apparatus for quantizing, encoding and decoding and recording media therefor | |
JP3397001B2 (ja) | 符号化方法及び装置、復号化装置、並びに記録媒体 | |
WO1995002925A1 (fr) | Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite | |
JP3250376B2 (ja) | 情報符号化方法及び装置並びに情報復号化方法及び装置 | |
KR100330288B1 (ko) | 부호화방법및장치,복호화장치 | |
US7835915B2 (en) | Scalable stereo audio coding/decoding method and apparatus | |
JP3227942B2 (ja) | 高能率符号化装置 | |
JP3277699B2 (ja) | 信号符号化方法及び装置並びに信号復号化方法及び装置 | |
JP3528260B2 (ja) | 符号化装置及び方法、並びに復号化装置及び方法 | |
WO1995016263A1 (fr) | Procede, dispositif et support concernant le traitement de l'information | |
JP3341448B2 (ja) | マルチチャンネルオーディオデータの高能率符号化方法 | |
JPH09102742A (ja) | 符号化方法および装置、復号化方法および装置、並びに記録媒体 | |
JPH08123488A (ja) | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 | |
JP3318824B2 (ja) | デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置 | |
JP3362476B2 (ja) | 高能率符号化装置及びインタフェース装置 | |
JPH07181996A (ja) | 情報処理方法、情報処理装置、及びメディア | |
JPH07336231A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 | |
JPH07161142A (ja) | 記録方法、記録媒体、及び再生方法 | |
JPH07161140A (ja) | ディジタルオーディオ信号の伝送装置及び受信装置、並びにディジタルオーディオ信号の伝送方法及び受信方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20010807 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080907 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090907 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090907 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100907 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110907 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120907 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |