JP2009512892A

JP2009512892A - マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置

Info

Publication number: JP2009512892A
Application number: JP2008536503A
Authority: JP
Inventors: ウォンジュン，ヤン; スクパン，ヒー; オオー，ヒェン; スーキム，ドン; ヒュンリム，ジェ
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2005-10-20
Filing date: 2006-10-20
Publication date: 2009-03-26
Anticipated expiration: 2026-10-20
Also published as: WO2007046659A1; KR100866885B1; US20100310079A1; US20110085669A1; WO2007046660A1; US8804967B2; US20080262853A1; EP1952391B1; JP2009512893A; EP1952391A4; KR20070043651A; US8498421B2; ES2587999T3; JP5507844B2; JP5536335B2; KR20080066808A; EP1952392A4; KR101165640B1; EP1952392B1; EP1952391A1

Abstract

本発明は、マルチチャンネルオーディオ信号の符号化及び復号化方法とその装置に関するものである。本符号化方法では、マルチチャンネルオーディオ信号とダウンミックス信号とを用いて空間情報を算出し、マルチチャンネルオーディオ信号とダウンミックス信号とを用いてダウンミックス信号を補償する補償パラメータを算出する。そして、算出した空間情報と補償パラメータを符号化された付加情報と符号化されたダウンミックス信号とを結合したビットストリームを生成する。本発明によると、ダウンミックス信号を補償する補償パラメータを使用して復号化されたマルチチャンネルオーディオ信号を補償することにより、マルチチャンネルオーディオ信号の全体的な音質の低下を防止することができる。

Description

本発明は、符号化及び復号化方法とその装置に関し、より詳しくは、ダウンミックス信号を補償できる付加情報を使用してマルチチャンネルオーディオ信号を符号化及び復号化できる符号化及び復号化方法とその装置に関する。

一般的なマルチチャンネルオーディオ信号符号化方法では、各々のチャンネル別信号を全て符号化する代わりに、マルチチャンネルオーディオ信号をモノあるいはステレオ信号にダウンミックスした（down-mixed）信号を空間情報と共に符号化する方式を使用する。この際、空間情報はダウンミックス信号から本来のマルチチャンネルオーディオ信号を生成することに使われる。

図１は、一般的なマルチチャンネルオーディオ信号符号化／復号化装置の一例に対するブロック図である。図１を参照すると、オーディオ信号エンコーダは、マルチチャンネルオーディオ信号をステレオあるいはモノ信号にダウンミックスしたダウンミックス信号を生成するダウンミックス（down-mix）モジュール、及び空間情報を生成する空間パラメータ推定（spatial parameter estimation）モジュールを具備する。使用環境によってはダウンミックス信号を外部で加工したアーティステックダウンミックス（artistic down-mix）信号にて入力を受けることもある。オーディオ信号デコーダは転送された空間情報を解析した後、これに基づいてダウンミックス信号で本来のマルチチャンネルオーディオ信号を生成する。ところが、オーディオ信号エンコーダでダウンミックス信号を生成する場合、あるいはアーティステックダウンミックス信号を生成する場合、互いに異なるチャンネルの信号を合算する過程で信号レベルの減衰が発生することがある。例えば、信号レベルが各々Ｌ１及びＬ２である２つのチャンネルを合算する場合、２つのチャンネルの信号が完壁に重畳されず、一部相殺されて、２つのチャンネルを合算したチャンネルのレベルＤＬ１２がＬ１＋Ｌ２より小さくなる場合である。

このような場合、減衰されたダウンミックス信号のレベルは、復号化過程で信号歪みをもたらす。例えば、空間情報の中で、相互チャンネル間のレベル差を表すＣＬＤ（Channel Level Difference）の場合、ＣＬＤ値に相互チャンネル間のレベル関係は分かるが、これらのチャンネルを合算して生成したダウンミックス信号のレベルが減衰されている場合は、復号化された信号は本来の信号より大きさが減ることになる。

このような現象により、復号化されたマルチチャンネルオーディオ信号が特定周波数で信号が上昇（boost）されるか、抑制（suppress）される効果が発生し、これによって、全体的に音質の低下が発生することになる。また、信号の一部の相殺によりレベル減衰の発生は周波数領域によって異なるので、オーディオ信号がエンコーダとデコーダを経ることになると、周波数によって歪みの程度が変化することになる。したがって、このような現象を防止するために、ダウンミックス信号の特定周波数領域のエネルギーが変化する方法では解決が容易でない。

本発明の目的は、ダウンミックス信号を補償できる付加情報を使用して符号化される符号化及びその装置を提供することにある。

本発明の他の目的は、ダウンミックス信号を補償できる付加情報を使用して符号化されたマルチチャンネルオーディオ信号を復号化する復号化方法とその装置を提供することにある。

上記の目的を達成するための本発明に係る符号化方法は、マルチチャンネルオーディオ信号とダウンミックス信号とを用いて空間情報を算出するステップと、上記マルチチャンネルオーディオ信号と上記ダウンミックス信号とを用いて、補償パラメータを算出するステップを含む。

また、上記の目的を達成するための本発明に係る符号化装置は、マルチチャンネルオーディオ信号とダウンミックス信号とを用いて空間情報を算出する空間情報算出部と、上記マルチチャンネルオーディオ信号と上記ダウンミックス信号とを用いて、補償パラメータを算出する補償パラメータ算出部を含む。

一方、本発明に係る復号化方法は、受信した信号からダウンミックス信号と付加情報とを抽出するステップと、上記付加情報から空間情報及び補償パラメータを抽出するステップと、上記ダウンミックス信号と上記空間情報とを用いてマルチチャンネルオーディオ信号を生成するステップと、生成したマルチチャンネルオーディオ信号を上記補償パラメータを使用して補償されたマルチチャンネルオーディオ信号を生成するステップを含む。

本発明によると、受信したオーディオ信号のビットストリームで符号化されたダウンミックス信号と付加情報とを抽出するデマルチプレクサ、上記ダウンミックス信号を復号化してダウンミックス信号を生成するコアエンコーダ、上記付加情報から空間情報及び補償パラメータを抽出するパラメータエンコーダ、及び上記ダウンミックス信号と上記空間情報とを用いてマルチチャンネルオーディオ信号を生成し、生成した上記マルチチャンネルオーディオ信号を上記補償パラメータを用いて補償したマルチチャンネルオーディオ信号を出力するマルチチャンネル合成部を含む復号化装置が提供される。

上記の目的を達成するために、本発明では、上記の符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読取可能な記録媒体を提供する。

上記の目的を達成するために、本発明では、上記の復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読取可能な記録媒体を提供する。

符号化方法において、マルチチャンネルオーディオ信号及びダウンミックス信号に基づいて空間情報が算出され、マルチチャンネルオーディオ信号及びダウンミックス信号に基づいてダウンミックス信号を補償するための補償パラメータが算出される。その後、空間情報、補償パラメータ及びダウンミックス信号を符号化し、符号化の結果を合成することによってビットストリームが生成される。したがって、ダウンミックス信号を補償するための補償パラメータを利用してマルチチャンネルオーディオ信号を補償することによって、マルチチャンネルオーディオ信号に関し音質が歪曲されることを防止することができる。

以下、図面を参照しつつ本発明をより詳細に説明する。

本発明に係る符号化及び復号化方法とその装置は、基本的にマルチチャンネルオーディオ信号の処理過程に適用されるが、必ずしもそれに限定されるのではなく、本発明に係る条件を満たす他の信号の処理過程に適用可能である。

図２は、本発明の一実施形態に係る符号化装置のブロック図である。図２を参照すると、本実施形態に係る符号化装置は、ダウンミックス部１１０、補償パラメータ算出部１２０、空間情報算出部１３０、及びビットストリーム生成部１７０を含む。ビットストリーム生成部１７０は、コアエンコーダ１４０、パラメータエンコーダ１５０、及びマルチプレクサ１６０を含む。

ダウンミックス部１１０は、マルチチャンネルオーディオ信号をモノ信号あるいはステレオ信号にダウンミックスしたダウンミックス信号を生成する。補償パラメータ算出部１２０は、ダウンミックス部１１０で生成されるか、あるいは入力されたアーティステックダウンミックス信号と、ダウンミックス信号の生成に使われたマルチチャンネルオーディオ信号との間のレベルサイズを比較した結果、あるいはエンベロープ（envelope）を比較した結果などにより、ダウンミックス信号の補償のために使われる補償パラメータを算出する。空間情報算出部１３０は、マルチチャンネルオーディオ信号の空間情報を算出する。

ビットストリーム生成部１７０において、コアエンコーダ１４０はダウンミックス信号を符号化して符号化されたダウンミックス信号を生成する。パラメータエンコーダ１５０は、補償パラメータと空間情報とを符号化して付加情報を生成する。そして、マルチプレクサ１６０は、符号化されたダウンミックス信号と付加情報とを結合したビットストリームを生成する。このような構成において、ダウンミックス部１１０は、入力されるマルチチャンネルオーディオ信号をダウンミックスしてダウンミックス信号を生成する。例えば、５個のチャンネルを有するマルチチャンネルオーディオ信号をステレオ信号にダウンミックスする場合、ダウンミックスチャンネル１は、マルチチャンネルオーディオ信号で１、３、４チャンネルの成分を組合せて算出することができ、ダウンミックスチャンネル２は、チャンネル２、３、５の成分を組合せて算出することができる。

ダウンミックス信号が生成されると、補償パラメータ算出部１２０は、ダウンミックス信号の補償に使われる補償パラメータを算出する。この際、補償パラメータは多様な方法により算出可能であり、その一例として次のような方法により算出することもできる。
５個のチャンネルを有するマルチチャンネルオーディオ信号において、特定周波数バンドで５個のチャンネルの信号レベルが各々Ｌ１、Ｌ２、Ｌ３、Ｌ４、Ｌ５とし、ダウンミックスチャンネル１は１、３、４チャンネルの成分を有し、ダウンミックスチャンネル２は２、３、５チャンネルの成分を有する場合、ダウンミックスチャンネル１の信号レベルＤＬ１３４と、ダウンミックスチャンネル２の信号レベルＤＬ２３５は、次の式１のような関係を有することになる。

（式１）
ＤＬ１３４ＤＬ１＋ｇ３^＊Ｌ３＋ｇ４^＊Ｌ４
ＤＬ２３５ＤＬ２＋ｇ３^＊Ｌ３＋ｇ５^＊Ｌ５

ここで、ｇ３、ｇ４、ｇ５はダウンミックス時に発生する利得（gain）を表す。復号化過程において、このようなダウンミックス信号からまたマルチチャンネルオーディオ信号に生成する場合、生成された５個のチャンネル信号のレベルＬ１´、Ｌ２´、Ｌ３´、Ｌ４´、Ｌ５´は、各々本来の信号レベルであるＬ１、Ｌ２、Ｌ３、Ｌ４、Ｌ５と等しくなることが理想的である。したがって、このために、ダウンミックスチャンネル１の補償パラメータＣＦ１２３、及びダウンミックスチャンネル２の補償パラメータＣＦ２３５を次の式２の通り算出することができる。

（式２）
ＣＦ１３４＝（Ｌ１＋ｇ３^＊Ｌ３＋ｇ４^＊Ｌ４）／ＤＬ１３４
ＣＦ２３５＝（Ｌ２＋ｇ３^＊Ｌ３＋ｇ５^＊Ｌ５）／ＤＬ２３５

上記の例では、転送されるデータ量の減少のために、ダウンミックスチャンネル別に補償パラメータを算出したが、補償パラメータはマルチチャンネルオーディオ信号の各チャンネル別に算出することもできる。即ち、ダウンミックス信号と各チャンネルのエネルギーあるいはエンベロープの比で算出することも可能である。

補償パラメータの生成と共に、空間情報算出部１３０は空間情報を算出する。空間情報には、ＣＬＤ、ＩＣＣ（Inter-channel Cross Correlation）、ＣＰＣ（Channel Prediction Coefficient）のような情報が含まれる。

コアエンコーダ１４０はダウンミックス信号を符号化し、パラメータエンコーダ１５０は空間情報と補償パラメータとを符号化して付加情報を生成する。この際、補償パラメータは既存のＣＬＤ符号化に使われることと同一な方式により符号化することができ、あるいは異なる方式により符号化することができる。例えば、補償パラメータは、時間あるいは周波数差分符号化（differential coding）、グループＰＣＭ符号化、パイロットベース（pilot-based）符号化、及びホフマンコードブック（Huffman code book）などを用いて符号化することができる。マルチプレクサ１６０は、このような生成された符号化されたダウンミックス信号と付加情報とを結合してビットストリームを生成する。このような過程により、ダウンミックス信号のレベル減殺を補償する補償パラメータが付加情報として含まれたビットストリームを生成することができる。

一方、レベル補償を必要としない場合は、補償パラメータと関連したフラグを「０」に置くことにより、転送される付加情報のビットレートを低減させることができる。また、補償パラメータＣＦ１３４、ＣＦ２３５の値があまり差がない場合、２つの補償パラメータを転送する代わりに、一つの代表値を有する補償パラメータを使用することもできる。また、補償パラメータが時間によって変化せず、一定の値に維持された場合、特定フラグを通じて以前の値を使用するという情報を与えることもできる。

本実施形態に従って、補償パラメータは、入力を受けたマルチチャンネルオーディオ信号とダウンミックス信号との間のレベルを比較した結果を用いて設定されるが、これと異なる方法により補償パラメータを設定するか、推定して使用することができる。即ち、補償パラメータは本来の信号とダウンミックス信号との間のレベル減殺が生じることをモデリングした値であるので、上記した実施形態のように、レベル比だけでなく、如何なるウェーブ形態や、線形／非線形な特性を有する利得補償値で表現されることができる。このように、数学的にモデリングされる値に補償パラメータを使用する場合、はるかに少ないビットでも効率的に転送及び補償が可能になる。

図３は、本発明の一実施形態に係る復号化装置に対するブロック図である。図３を参照すると、本実施形態に係る復号化装置は、デマルチプレクサ３１０、コアデコーダ３２０、パラメータデコーダ３３０、及びマルチチャンネル合成部３４０を含む。

デマルチプレクサ３１０は、伝送を受けたビットストリームで付加情報と符号化されたダウンミックス信号とを各々分離する。コアデコーダ３２０は、デマルチプレクサ３１０から分離された符号化されたダウンミックス信号を復号化してダウンミックス信号を生成する。パラメータデコーダ３３０は、デマルチプレクサ３１０から分離された付加情報から空間情報と補償パラメータとを生成する。そして、マルチチャンネル合成部３４０は、ダウンミックス信号、空間情報、及び補償パラメータを用いてマルチチャンネルオーディオ信号を生成する。

図４は、本発明の一実施形態に係る復号化装置の動作方法の説明に提供されるフローチャートである。図３及び図４を参照して、本発明の一実施形態に係る復号化装置の動作方法を説明すると、次の通りである。まず、マルチチャンネルオーディオ信号のビットストリームを受信すると（Ｓ４００）、デマルチプレクサ３１０は、受信したビットストリームで符号化されたダウンミックス信号と付加情報とを各々分離する（Ｓ４０５）。コアデコーダ３２０は、符号化されたダウンミックス信号を復号化してダウンミックス信号を生成する（Ｓ４１０）。そして、パラメータデコーダ３３０は、付加情報データを復号化して補償パラメータ及び空間情報を生成する（Ｓ４２０）。マルチチャンネル合成部３４０では、空間情報とダウンミックス信号とを用いてマルチチャンネルオーディオ信号を生成し（Ｓ４３０）、生成したマルチチャンネルオーディオ信号を補償パラメータを使用して補償する（Ｓ４４０）。この際、マルチチャンネル合成部３４０は、復号化によって、ダウンミックス信号と空間情報に基づいて式（３）の通り補償パラメータを使用して各チャンネル出力を補償することができる。
（式３）
Ｌ１″＝Ｌ１´^＊ＣＦ１３４
Ｌ２″＝Ｌ２´^＊ＣＦ２３５
Ｌ３″＝Ｌ３´^＊（ＣＦ１２４＋ＣＦ２３５）／２
Ｌ４″＝Ｌ４´^＊ＣＦ１３４
Ｌ５″＝Ｌ５´^＊ＣＦ２３５

ここでＬ１´，Ｌ２´，Ｌ３´，Ｌ４´及びＬ５´は、チャンネルのエネルギーレベルを表し、ＣＦ１３４及びＣＦ２３５は補償パラメータを表している。

このような過程により、空間情報と共に転送された補償パラメータを用いてマルチチャンネルオーディオ信号の復号化過程に使用して復号化されたマルチチャンネルオーディオ信号を補償することで、特定周波数帯域で信号歪みを防止することができる。また、前述したような補償パラメータを使用して各チャンネル出力を補償することは一例であり、本発明は前述したような補償パラメータに限定されるのではない。例えば、各補償パラメータとして各チャンネルのエンベロープを転送する場合、空間情報を転送せず、各チャンネルのエンベロープ情報を使用して空間情報に代わるように構成することもできる。延いては、空間情報が転送されない場合、ダウンミックスされた２つのチャンネル以上の信号のみを用いて復号化装置で類似空間情報を抽出して、これを用いて復号化過程を遂行することもできる。

図５は、本発明の他の実施形態に係る復号化装置に対するブロック図である。図５では、空間情報を付加情報として使用せず、ダウンミックス信号のみを用いてマルチチャンネルオーディオ信号を生成する場合を説明する。

図５を参照すると、本実施形態に係る復号化装置は、コアデコーダ５１０、フレーム化部５２０、空間情報推定部５３０、及びマルチチャンネル合成部５４０を含む。

コアデコーダ５１０は、伝送を受けたビットストリームを復号化してダウンミックス信号を生成してフレーム化部５２０に伝達する。この際、ビットストリームへ転送されるダウンミックスされた信号はＰｒｏｌｏｇｉｃやＬｏｇｉｃ７のようなマトリックス形態でダウンミックスされているものが好ましいか、必ずこれに限定されるのではない。

フレーム化部５２０は、コアデコーダ５１０から出力されたダウンミックスされた信号に対し、ＳＡＣフレーム単位の同期を合せることができるようにデータを整列する。このようなフレーム化過程において、ダウンミックス信号に対して分析フィルタバンク（analysis filter bank）を通過したＱＭＦ（quadrature mirror filter）及びハイブリッドバンドドメイン（hybrid band domain）信号を作り出す場合、この信号は直ちに復号化過程に使用することができるので、ハイブリッドドメイン信号自体を直接マルチチャンネル合成部５４０に伝達することも可能である。

空間情報推定部５３０は、フレーム化部５２０で整列されたダウンミックス信号のみを用いて、ＣＬＤ、ＩＣＣ、ＣＰＣなどの空間情報を生成する。空間情報推定部５３０は、ＳＡＣフレームに合せて空間情報を生成するが、この場合、フレーム長さだけのダウンミックス信号を集めて処理することもでき、サンプル単位でＰＣＭサンプルに対応する空間情報を生成することもできる。空間情報推定部５３０で生成される空間情報は転送するデータでないので、量子化などの圧縮のための処理過程は不要であるので、最大限多くの情報を使用することが有利である。

そして、マルチチャンネル合成部５４０は、フレーム化部５２０を通じて転送されるダウンミックス信号と空間情報推定部５３０を通じて転送される空間情報とを用いてマルチチャンネルオーディオ信号を生成する。

このような構成と動作により、空間情報を付加情報として転送する一般的な方式にビット率を低めることができ、既存のマトリックス形態のダウンミックスされたコンテンツに対しても同一な方法によりマルチチャンネル信号を生成することができる。

図６は、本発明の更に他の実施形態に係る復号化装置に対するブロック図である。図６では、転送されたビットストリームにダウンミックスオーディオ信号だけでなく、空間情報を含んでいる場合、転送された空間情報を参照して復号化装置で追加的な空間情報を生成し、これを復号化に使用する場合を説明する。

図６を参照すると、本実施形態に係る復号化装置は、デマルチプレクサ６１０、コアデコーダ６２０、フレーム化部６３０、空間情報推定部６４０、マルチチャンネル合成部６５０、及び結合部６６０を含む。
デマルチプレクサ６１０は、伝送されたビットストリームで空間情報と符号化されたダウンミックス信号とを各々分離する。コアデコーダ６２０は、デマルチプレクサ６１０から分離された符号化されたダウンミックス信号を復号化してダウンミックス信号を生成する。フレーム化部６３０はコアデコーダ６２０から出力されたダウンミックスされた信号に対し、ＳＡＣフレーム単位の同期を合せることができるようにデータを整列する。空間情報推定部６４０は、転送された空間情報を用いて追加的な空間情報を推定して生成する。結合部６６０は、転送された空間情報と空間情報推定部６４０で生成した空間情報とを結合してマルチチャンネル合成部６５０に伝達する。そして、マルチチャンネル合成部６５０は、ダウンミックス信号と空間情報とを用いてマルチチャンネルオーディオ信号を生成する。

このような構成により、入力ビットストリームを含む空間情報だけでなくダウンミックス信号などから推定された追加の空間情報を全て利用することができる。この際、入力ビットストリームを含む空間情報のタイプに従って、次のような多様な形態の応用が可能であり、以下に詳細を記載する。

少しのタイムスロット及びデータバンド（data band）しか有さない空間情報を受信した場合であって、即ち空間情報に対する転送ビット率が低く、空間情報のデータバンド数が低い、又は空間情報の転送頻度が低い場合、空間情報推定部６４０が空間情報とダウンミックスＰＣＭ信号とに基づいて空間情報によって省略された情報を生成し、これによってマルチチャンネル信号の品質を向上させることができる。例えば、受信した空間情報のデータバンド数が５の場合、空間情報推定部６４０で空間情報と供に受信したダウンミックス信号を参照して、空間情報を２８のデータバンドを有する空間情報に変換する。受信したタイムスロット数が２つだけである場合、空間情報推定部６４０が空間情報と供に受信したダウンミックス信号を参照して補間された８個のタイムスロットを生成する。

ＣＬＤ、ＩＣＣ、ＣＰＣのうち、一部データのみ受信された場合、例えばビット率を低めるために、空間情報のうちのＩＣＣのみを受信し、ＣＬＤやＣＰＣは受信しない場合、空間情報推定部６４０でＣＬＤとＣＰＣを推定して生成することによって、マルチチャンネル信号の品質を向上させることができる。同様に、ＣＬＤのみ受信された場合、ＩＣＣを推定して使用する等の方法が可能である。

符号化装置は、ＯＴＴ（One-To-Two）又はＴＴＴ（Two-To-Three）ボックス（box）を利用して、入力されたマルチチャンネル信号をダウンミックス信号へダウンミックスする。ＯＴＴ又はＴＴＴボックスのうちの一部のみを受信する場合、空間情報推定部６４０は、推定によって他のＯＴＴ及びＴＴＴボックスに従って空間情報を生成し、及び受信した空間情報及び生成した空間情報に基づいてマルチチャンネルオーディオ信号を生成することが可能である。この場合、空間情報の推定は、受信した空間情報に対応するＳＡＣ復号化の後、遂行することが好ましい。例えば、２つのチャンネルのダウンミックス信号（例えば、左（Ｌ）及び右（Ｒ）チャンネル）とＴＴＴボックスに対応する空間情報のみを受信した場合、空間情報推定部６４０は、受信したダウンミックス信号のＬ及びＲチャンネル信号に基づいて（Ｌ）、（Ｃ）及び（Ｒ）チャンネル信号を生成することが可能である。

その後、空間情報推定部６４０はＯＴＴボックスに対応した空間情報を生成することが可能である。次に、マルチチャンネル合成部６５０が、受信した空間情報及び空間情報推定部６４０によって生成された空間情報に基づいて、マルチチャンネルオーディオ信号を生成することが可能である。この方法は、出力チャンネル数が多い場合に出力チャンネル数に対応する信号を生成することに適用可能である。例えば、５２５フォーマットを有するビットストリームが７チャンネルまで再生可能な復号化装置に入力された場合、復号化装置は、ＳＡＣ復号化により５チャンネル信号（ハイブリッドドメイン）を生成し、推定によって５チャンネルを７チャンネルに拡張することに必要とされる空間情報を生成し、追加復号化を遂行して、一つのビットストリームが提供可能なチャンネル数以上の信号を生成することができる。

本発明は、コンピュータで読取可能な記録媒体にコンピュータが読取可能なコードとして具現することが可能である。コンピュータが読取可能な記録媒体は、コンピュータシステムにより読取られることができるデータが格納される全ての種類の記録装置を含む。コンピュータが読取できる記録媒体の例には、ＲＯＭ、ＲＡＭ、ＣＤ−ＲＯＭ、磁気テープ、フロッピー（登録商標）ディスク、光データ格納装置などがあり、またインターネットを通じた転送のようなキャリアウェーブの形態で具現されることも含む。また、コンピュータが読取可能な記録媒体はネットワークにより連結されたコンピュータシステムに分散されて、分散方式によりコンピュータが読取できるコードが格納され、実行されることができる。

以上では、本発明の好ましい実施形態に対して図示及び説明したが、本発明は前述した特定の実施形態に限定されず、請求範囲で請求する本発明の要旨を逸脱することなく、当該発明が属する技術分野で通常の知識を有する者により多様な変形実施が可能であることは勿論であり、このような変形実施は本発明の技術的思想や展望から個別的に理解されてはならない。

本発明によると、入力を受けたマルチチャンネルオーディオ信号とダウンミックスされた信号のレベルなどを比較した結果により算出された補償パラメータを付加情報に使用して、復号化されたマルチチャンネルオーディオ信号を補償することができる。また、空間情報の一部を付加情報に使用して転送された付加情報とダウンミックス信号を用いて追加的な空間情報を生成して使用することもできる。したがって、復号化されたマルチチャンネルオーディオ信号が特定周波数で信号が歪曲されることを防止することができ、復号化されたマルチチャンネルオーディオ信号の全体的な音質を向上させることができる。

本発明は、マルチチャンネルオーディオ信号の符号化及び復号課過程などに使われて、補償パラメータを用いてダウンミックス信号を補償することで、音質の低下などを防止することができる。

一般的なマルチチャンネルオーディオ信号符号化／復号化装置の一例を示すブロック図である。本発明の一実施形態に係る符号化装置のブロック図である。本発明の一実施形態に係る復号化装置のブロック図である。本発明の一実施形態に係る復号化装置の動作方法の説明に提供されるフローチャートである。本発明の他の実施形態に係る復号化装置のブロック図である。本発明の更に他の実施形態に係る復号化装置のブロック図である。

Claims

受信した信号からダウンミックス信号と付加情報とを抽出するステップと、
前記付加情報から空間情報及び補償パラメータを抽出するステップと、
前記ダウンミックス信号と前記空間情報とを用いてマルチチャンネルオーディオ信号を生成するステップと、
生成したマルチチャンネルオーディオ信号を前記補償パラメータを使用して補償されたマルチチャンネルオーディオ信号を生成するステップと、
を有することを特徴とする復号化方法。
前記補償パラメータは、ダウンミックス信号レベルと前記ダウンミックス信号の生成に使われたマルチチャンネルオーディオ信号のレベルの比較結果に基づいて算出されたパラメータである、請求項１に記載の復号化方法。
前記補償パラメータは、ダウンミックス信号のエンベロープと前記ダウンミックス信号の生成に使われたマルチチャンネルオーディオ信号のエンベロープとの比較結果に基づいて算出されたパラメータである、請求項１に記載の復号化方法。
受信した信号から符号化されたダウンミックス信号と付加情報とを抽出するデマルチプレクサと、
前記ダウンミックス信号を復号化してダウンミックス信号を生成するコアエンコーダと、
前記付加情報から空間情報及び補償パラメータを抽出するパラメータエンコーダと、
前記ダウンミックス信号と前記空間情報とを用いてマルチチャンネルオーディオ信号を生成し、生成した前記マルチチャンネルオーディオ信号を前記補償パラメータを用いて補償したマルチチャンネルオーディオ信号を出力するマルチチャンネル合成部と、
を有することを特徴とする復号化装置。
前記補償パラメータは、ダウンミックス信号レベルと前記ダウンミックス信号の生成に使われたマルチチャンネルオーディオ信号のレベルとの比較結果に基づいて算出されたパラメータである、請求項４に記載の復号化装置。
前記補償パラメータは、ダウンミックス信号のエンベロープと前記ダウンミックス信号の生成に使われたマルチチャンネルオーディオ信号のエンベロープとの比較結果に基づいて算出されたパラメータである、請求項４に記載の復号化装置。
前記マルチチャンネル合成部は、補償されたマルチチャンネルオーディオ信号は、前記生成したマルチチャンネルオーディオ信号の各チャンネル別信号のレベルに対応する補償パラメータを用いて、前記補償されたマルチチャンネルオーディオ信号を生成する、請求項４に記載の復号化装置。
マルチチャンネルオーディオ信号とダウンミックス信号とを用いて空間情報を算出するステップと、
前記マルチチャンネルオーディオ信号と前記ダウンミックス信号とを用いて、前記ダウンミックス信号を補償する補償パラメータを算出するステップと、
を有することを特徴とする符号化方法。
前記空間情報、前記補償パラメータ、及び前記ダウンミックス信号を符号化して結合したビットストリームを生成するステップをさらに有する、請求項８に記載の符号化方法。
前記補償パラメータは、前記ダウンミックス信号のレベルと前記マルチチャンネルオーディオ信号のレベルとの比較結果に基づいて算出される、請求項８に記載のマルチチャンネルオーディオ信号符号化方法。
前記補償パラメータは、前記ダウンミックス信号のエンベロープと前記マルチチャンネルオーディオ信号のエンベロープとの比較結果に基づいて算出される、請求項８に記載のマルチチャンネルオーディオ信号符号化方法。
マルチチャンネルオーディオ信号とダウンミックス信号とを用いて空間情報を算出する空間情報算出部と、
前記マルチチャンネルオーディオ信号と前記ダウンミックス信号とを用いて、前記ダウンミックス信号を補償する補償パラメータを算出する補償パラメータ算出部と、
前記補償パラメータ及び前記空間情報を符号化して生成した付加情報と、前記ダウンミックス信号を符号化された信号を結合したビットストリームを生成するビットストリーム生成部と、
を有することを特徴とする符号化装置。
前記補償パラメータ算出部は、前記ダウンミックス信号レベルと前記マルチチャンネルオーディオ信号のレベルとの比較結果に基づいて、前記補償パラメータを算出する、請求項１２に記載の符号化装置。
前記補償パラメータ算出部は、前記ダウンミックス信号のエンベロープと前記マルチチャンネルオーディオ信号のエンベロープとの比較結果に基づいて、前記補償パラメータを算出する、請求項１２に記載の符号化装置。
受信した信号からダウンミックス信号と付加情報とを抽出するステップと、
前記付加情報から空間情報及び補償パラメータを抽出するステップと、
前記ダウンミックス信号と前記空間情報を用いてマルチチャンネルオーディオ信号を生成するステップと、
生成したマルチチャンネルオーディオ信号を前記補償パラメータを使用して補償されたマルチチャンネルオーディオ信号を生成するステップと、
を有する復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読取可能な記録媒体。
マルチチャンネルオーディオ信号とダウンミックス信号とを用いて空間情報を算出するステップと、
前記マルチチャンネルオーディオ信号と前記ダウンミックス信号とを用いて、前記ダウンミックス信号を補償する補償パラメータを算出するステップと、
前記空間情報、前記補償パラメータ、及び前記ダウンミックス信号を符号化して結合したビットストリームを生成するステップと、
を有する符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読取可能な記録媒体。