JP2013508770A

JP2013508770A - 位相情報と残余信号を用いる符号化／復号化装置及び方法

Info

Publication number: JP2013508770A
Application number: JP2012535143A
Authority: JP
Inventors: キム，ジュン−フェ; オ，ウン−ミ
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2009-10-23
Filing date: 2010-10-25
Publication date: 2013-03-07
Anticipated expiration: 2030-10-25
Also published as: KR101945309B1; CN105323632A; US8948404B2; KR101710113B1; WO2011049416A2; US20150124974A1; US10163445B2; EP2502421A2; JP6219903B2; EP2502421A4; KR20110044693A; US20110103592A1; JP5833557B2; JP2016029500A; WO2011049416A3; EP2978233A1; KR101835850B1; CN102577384A; KR20170021821A; EP3358566A1

Abstract

複数のチャネル信号を符号化／復号化するシステム及び方法が開示される。位相情報と残余信号を用いて複数のチャネル信号をアップミックスすることによって本来の信号に近い音質に復元することができる。

Description

本発明の実施形態は複数のチャネル信号を符号化／復号化する装置及び方法に関し、より詳しくは、位相情報と残余信号を用いて複数のチャネル信号を符号化／復号化する装置及び方法に関する。

複数のチャネル信号をコーディングする方法としてＭＰＥＧサラウンドコーディングがある。ＭＰＥＧサラウンドは、入力されたステレオ信号をダウンミックスしてモノ信号を生成し、ステレオ信号のパラメータを抽出した後モノ信号とパラメータを符号化してもよい。ＭＰＥＧサラウンド技術は１−ｔｏ−２（ｏｎｅ−ｔｏ−ｔｗｏ）と２−ｔｏ−３（Ｔｗｏ−ｔｏ−Ｔｈｒｅｅ）を基本にして、複数のチャネル信号に対してダウンミックス／アップミックスしてもよい。

ＭＰＥＧサラウンドの場合、複数のチャネル信号をパラメータに表してコーディングするとき、パラメータによってビットレートを増加させても本来の信号を復元することが困難である問題がある。したがって、複数のチャネル信号をパラメータに表しても本来の信号に近く復元することのできる方法が求められている。

本発明の一実施形態に係る符号化装置は、Ｎ個のチャネル信号に対して位相情報に関連する空間パラメータを抽出して符号化するパラメータ符号化部と、前記空間パラメータを用いて前記Ｎ個のチャネル信号をＭ個のチャネル信号にダウンミックスするダウンミックス部と、前記Ｎ個のチャネル信号に関連する残余信号を符号化する残余信号符号化部と、前記ダウンミックスされたＭ個のチャネル信号を符号化するチャネル信号符号化部とを備えてもよい。

本発明の一実施形態に係る復号化装置、符号化されたＭ個のチャネル信号をＡＣＥＬＰ、ｗＬＰＴ、またはＡＡＣのいずれか１つに基づいて復号化するチャネル信号復号化部と、符号化された空間パラメータを復号化するパラメータ復号化部と、前記空間パラメータを用いて位相情報を推定する位相情報推定部と、符号化された残余信号を復号化する残余信号復号化部と、前記位相情報を用いて前記Ｍ個のチャネル信号に対するアップミックスマトリックスを算出するマトリックス算出部と、前記残余信号とアップミックスマトリックスを用いて前記Ｍ個のチャネル信号をＮ個のチャネル信号にアップミックスするアップミックス部とを備えてもよい。

本発明の一実施形態に係る復号化装置は、ＭＰＥＧＵＳＡＣ（ＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｅｒ）に符号化されたＭ個のチャネル信号を動作するＬＰＤ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎＤｏｍａｉｎ）に基づいたＡＣＥＬＰ（ＡｌｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）、ｗＬＰＴ（ｗｅｉｇｈｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＴｒａｎｓｆｏｒｍ）、またはＦＤ（ＦｒｅｑｕｅｎｃｙＤｏｍａｉｎ）に基づいたＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）のいずれか１つによって復号化するチャネル信号復号化部と、符号化された空間パラメータを復号化するパラメータ復号化部と、前記空間パラメータを用いて位相情報を推定する位相情報推定部と、符号化された残余信号を復号化する残余信号復号化部と、前記位相情報を用いて前記Ｍ個のチャネル信号に対するアップミックスマトリックスを算出するマトリックス算出部と、前記残余信号とアップミックスマトリックスを用いて前記Ｍ個のチャネル信号をＮ個のチャネル信号にアップミックスするアップミックス部とを備えてもよい。

本発明の一実施形態に係る符号化方法は、Ｎ個のチャネル信号に対して位相情報と空間パラメータを抽出して符号化するステップと、前記空間パラメータを用いて前記Ｎ個のチャネル信号をＭ個のチャネル信号にダウンミクシンするステップと、前記Ｎ個のチャネル信号に関連する残余信号を符号化するステップと、前記ダウンミックスされたＭ個のチャネル信号を符号化するステップとを含んでもよい。

本発明の一実施形態に係る復号化方法は、符号化されたＭ個のチャネル信号を復号化するステップと、符号化された空間パラメータを復号化するステップと、前記空間パラメータを用いて位相情報を推定するステップと、符号化された残余信号を復号化するステップと、前記位相情報を用いて前記Ｍ個のチャネル信号に対するアップミックスマトリックスを算出するステップと、前記残余信号及びアップミックスマトリックスを用いて前記Ｍ個のチャネル信号をＮ個のチャネル信号にアップミックスするステップとを含んでもよい。

本発明の一実施形態に係る復号化方法は、ＭＰＥＧＵＳＡＣ（ＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｅｒ）に符号化されたＭ個のチャネル信号を動作するＬＰＤ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎＤｏｍａｉｎ）に基づいたＡＣＥＬＰ（ＡｌｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）、ｗＬＰＴ（ｗｅｉｇｈｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＴｒａｎｓｆｏｒｍ）、またはＦＤ（ＦｒｅｑｕｅｎｃｙＤｏｍａｉｎ）に基づいたＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）のいずれか１つによって復号化するステップと、符号化された空間パラメータを復号化するステップと、前記空間パラメータを用いて位相情報を推定するステップと、符号化された残余信号を復号化するステップと、前記位相情報を用いて前記Ｍ個のチャネル信号に対するアップミックスマトリックスを算出するステップと、前記残余信号とアップミックスマトリックスを用いて前記Ｍ個のチャネル信号をＮ個のチャネル信号にアップミックスするステップとを含んでもよい。

本発明の一実施形態によれば、位相情報と残余信号によってダウンミックスされたチャネル信号をアップミックスすることによって本来の信号に近く復元することにある。

本発明の一実施形態に係る符号化装置及び復号化装置を示す図である。本発明の一実施形態に係る符号化装置の細部構成を示すブロックダイアグラムである。本発明の一実施形態に係る復号化装置の細部構成を示すブロックダイアグラムである。本発明の一実施形態に係るアップミックスマトリックスを算出する過程を示す図である。本発明の一実施形態に係る符号化過程を示す図である。本発明の一実施形態に係る復号化過程を示す図である。本発明の一実施形態に係る復号化の順序を示す図である。

以下、本発明の実施形態を添付する図面を参照しながら詳細に説明する。

図１は、本発明の一実施形態に係る符号化装置及び復号化装置を示す図である。図１を参考すれば、符号化装置１０１は、Ｎ個のチャネル信号をダウンミックスしたＭ個のチャネル信号を符号化する。ここで、ＮはＭよりも大きい値を表す。例えば、符号化装置１０１は、２つのチャネル信号から構成されたステレオ信号が入力されれば、１つのチャネル信号から構成されたモノ信号にダウンミックスして符号化してもよい。Ｎは２以上の値を表し、Ｍは１以上の値を表す。

本発明の一実施形態に係る符号化装置１０１は、Ｎ個のチャネル信号間の関係を表す空間パラメータを抽出して符号化してもよい。ここで、空間パラメータは復号化装置１０２で推定する位相情報に関連がある。そして、符号化装置１０１は、Ｎ個のチャネル信号を空間パラメータの表現によって発生するエラー信号の残余信号を抽出して符号化してもよい。これによって、符号化装置１０１は、ダウンミックスされたＭ個のチャネル信号、空間パラメータ、及び残余信号を符号化した後、ビットストリームを介して復号化装置１０２に送信する。

復号化装置１０２は、ビットストリームに含まれた残余信号と空間パラメータを復号化してもよい。そして、復号化装置１０２は、空間パラメータによって推定された位相情報を用いてアップミックスマトリックスを算出する。その後、復号化装置１０２は、算出されたアップミックスマトリックスと残余信号を用いてＭ個のチャネル信号をアップミックスしてＮ個のチャネル信号を復元してもよい。

本発明の一実施形態に係る復号化装置は、Ｎ個のチャネル信号間の関係を表す空間パラメータを介して推定された位相情報と残余信号を用いることによって、本来の信号のＮ個のチャネル信号に近く復元することができる。

図２は、本発明の一実施形態に係る符号化装置の細部構成を示すブロックダイアグラムである。図２を参考すれば、符号化装置２０１は、パラメータ符号化部２０２、ダウンミックス部２０３、残余信号符号化部２０４、及びチャネル信号符号化部２０５を備えてもよい。

パラメータ符号化部２０２は、Ｎ個のチャネル信号に対して位相情報に関連する空間パラメータを抽出して符号化する。例えば、パラメータ符号化部２０２は、２つのチャネル信号を示すステレオ信号が入力されれば、左側信号と右側信号との間の関係を表す空間パラメータを抽出して符号化してもよい。

一例として、パラメータ符号化部２０２は、Ｎ個のチャネル信号をＱＭＦ（ＱｕａｄｒａｔｕｒｅＭｉｒｒｏｒＦｉｌｔｅｒ）分析とナイキストフィルタバンク分析（ＮｙｑｕｉｓｔＦｉｌｔｅｒＢａｎｋＡｎａｌｙｓｉｓ）によってサブサンプルに変換して空間パラメータを抽出する。これによって、パラメータ符号化部２０２は、抽出された空間パラメータを量子化した後、無損失符号化を行う。

ここで、空間パラメータは、Ｎ個のチャネル信号のエネルギーレベルによる強度差を示すＩＩＤ（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＩｎｔｅｎｓｉｔｙＤｉｆｆｅｒｅｎｃｅ）あるいはＣＬＤ（ｃｈａｎｎｅｌｌｅｖｅｌｄｉｆｆｅｒｅｎｃｅｓ）、Ｎ個のチャネル信号の波形の類似性による相関度を示すＩＣＣ（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＣｏｈｅｒｅｎｃｅまたはＩｎｔｅｒ−ｃｈａｎｎｅｌＣｏｒｒｅｌａｔｉｏｎ）、Ｎ個のチャネル信号間の位相差を示すＩＰＤ（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＰｈａｓｅＤｉｆｆｅｒｅｎｃｅ）を含んでもよい。ここで、入力信号が２つのチャネル信号から構成されたステレオ信号である場合、空間パラメータはステレオ信号に含まれた２つのチャネル間の関係を表す。

ダウンミックス部２０３は、空間パラメータを用いてＮ個のチャネル信号をＭ個のチャネル信号にダウンミックスしてもよい。ここで、ＮはＭよりも大きい値である。例えば、ダウンミックス部２０３は、ステレオ信号（Ｎ＝２）をモノ信号（Ｍ＝１）にダウンミックスしてもよい。

残余信号符号化部２０４は、空間パラメータによって抽出された残余信号を符号化してもよい。残余信号は、Ｎ個のチャネル信号を空間パラメータを表すことによって発生するエラー信号を意味する。一例として、残余信号はＭＤＣＴ方式によってＭＰＥＧＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）に符号化される。

チャネル信号符号化部２０５は、ダウンミックスされたＭ個のチャネル信号を符号化してもよい。具体的に、チャネル信号符号化部２０５は、ダウンミックスされたＭ個のチャネル信号をナイキストフィルタバンクによってＱＭＦドメインに変換した後、ＳＢＲ（ＳｐｅｃｔｒａｌＢａｎｄｗｉｄｔｈＲｅｐｌｉｃａｔｉｏｎ）符号化を行う。その後、チャネル信号符号化部２０５は、ＱＭＦ合成によって時間ドメインに変換した後コア符号化される。ここで、コア符号化は、ＭＰＥＧＵＳＡＣ（ＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｅｒ）で動作するＬＰＤ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎＤｏｍａｉｎ）に基づいたＡＣＥＬＰ（ＡｌｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）、ｗＬＰＴ（ｗｅｉｇｈｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＴｒａｎｓｆｏｒｍ）、またはＦＤ（ＦｒｅｑｕｅｎｃｙＤｏｍａｉｎ）に基づいたＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）のいずれか１つであってもよい。

図３は、本発明の一実施形態に係る復号化装置の細部構成を示すブロックダイアグラムである。図３を参考すれば、復号化装置３０１は、チャネル信号復号化部３０２、パラメータ復号化部３０３、位相情報推定部３０４、残余信号復号化部３０５、マトリックス算出部３０６、及びアップミックス部３０７を備えてもよい。

チャネル信号復号化部３０２は、符号化されたＭ個のチャネル信号を復号化してもよい。ここで、チャネル信号復号化部３０２は、ＭＰＥＧＵＳＡＣ（ＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｅｒ）で動作するＬＰＤ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎＤｏｍａｉｎ）に基づいたＡＣＥＬＰ（ＡｌｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）、ｗＬＰＴ（ｗｅｉｇｈｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＴｒａｎｓｆｏｒｍ）、またはＦＤ（ＦｒｅｑｕｅｎｃｙＤｏｍａｉｎ）に基づいたＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）のいずれか１つによってビットストリームから符号化されたＭ個のチャネル信号を復号化してもよい。そして、チャネル信号復号化部３０２は、ＱＭＦ分析によって復元されたＭ個のチャネル信号をサブバンド信号に変換する。その後、復元されたＭ個のチャネル信号は、サブバンド信号に変換されたＭ個のチャネル信号に対してＳＢＲ復号化を行う。ＳＢＲ復号化が行われたＭ個のチャネル信号はナイキストフィルタバンクが適用され得る。

パラメータ復号化部３０３は、ビットストリームから符号化された空間パラメータを復号化してもよい。ここで、空間パラメータは、Ｎ個のチャネル信号のエネルギーレベルによる強度差を示すＩＩＤ（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＩｎｔｅｎｓｉｔｙＤｉｆｆｅｒｅｎｃｅ）あるいはＣＬＤ（ｃｈａｎｎｅｌｌｅｖｅｌｄｉｆｆｅｒｅｎｃｅｓ）、Ｎ個のチャネル信号の波形の類似性による相関度を示すＩＣＣ（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＣｏｈｅｒｅｎｃｅまたはＩｎｔｅｒ−ｃｈａｎｎｅｌＣｏｒｒｅｌａｔｉｏｎ）、Ｎ個のチャネル信号の間の位相差を示すＩＰＤ（Ｉｎｔｅｒ−ｃｈａｎｎｅｌＰｈａｓｅＤｉｆｆｅｒｅｎｃｅ）を含んでもよい。

位相情報推定部３０４は空間パラメータを用いて位相情報を推定する。一例として、位相情報推定部３０４は、空間パラメータを用いてＮ個のチャネル信号間の位相差がＭ個のチャネル信号に基づいて分布する程度を表すパラメータ（ＯＰＤ：ＯｖｅｒａｌｌＰｈａｓｅＤｉｆｅｒｅｎｃｅ）を推定する。

残余信号復号化部３０５は符号化された残余信号を復号化してもよい。ここで、残余信号復号化部３０５は、ＭＤＣＴ（ＭｏｄｉｆｉｅｄＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）を用いてビットストリームから残余信号を復号化してもよい。その後、残余信号復号化部３０５は復号化された残余信号をＱＭＦドメインに変換してもよい。もし、ビットストリームに残余信号が含まれてない場合、残余信号復号化部３０５はデコリレータ（ｄｅｃｏｒｒｅｌａｔｏｒ）を用いて別途の信号を生成する。

マトリックス算出部３０６は、位相情報を用いてＭ個のチャネル信号に対するアップミックスマトリックスを算出する。

アップミックス部３０７は、残余信号とアップミックスマトリックスを用いてＭ個のチャネル信号をＮ個のチャネル信号にアップミックスしてもよい。もし、残余信号が復号化されていない場合、アップミックス部３０７は、デコリレータによって生成された別の信号を用いてアップミックスしてもよい。アップミックスされたＮ個のチャネル信号は、ナイキストフィルタバンクとＱＭＦ合成によって最終的に復元され得る。

図４は、本発明の一実施形態に係るアップミックスマトリックスを算出する過程を示す図である。図４において、復号化装置３０１の入力信号はダウンミックスされたモノ信号であり、出力信号はステレオ信号であると仮定する。図４を参考すれば、復号化装置３０１のマトリックス算出部３０６は、空間パラメータから推定された位相情報を用いてモノ信号を左側信号と右側信号から構成されたステレオ信号にアップミックスするためのアップミックスマトリックスを算出する。ここで、モノ信号は１つのチャネル信号を意味し、ステレオ信号は２つのチャネル信号を意味する。そして、空間パラメータはＩＰＤとＣＬＤによって推定されたＯＰＤを意味する。

ステレオ信号に対してＩＰＤは下記の数式（１）によって決定される。

ＩＰＤ＝∠（Ｌ・Ｒ）（１）
ここで、Ｌ・Ｒは左チャネル信号と右チャネル信号のドット積（ｄｏｔｐｒｏｄｕｃｔ）、ＩＰＤは左チャネル信号と右チャネル信号がなす角度、＊は複素共役（ｃｏｍｐｌｅｘｃｏｎｊｕｇａｔｅ）をそれぞれ意味する。

ステレオ信号に対してＯＰＤは下記の数式（２）により決定される。

ＯＰＤ＝∠（Ｌ・Ｍ）（２）
ここで、Ｌ・Ｍは左チャネル信号と右チャネル信号のドット積、ＯＰＤは左チャネル信号と右チャネル信号がなす角度、＊は複素共役をそれぞれ意味する。

ここで、ＯＰＤは下記の数式（３）によって表してもよい。

マトリックス算出部３０６は数式（３）によって算出された位相情報のＯＰＤを用いて下記の数式（４）のアップミックスマトリックスを算出する。

これによって、アップミックス部３０７は、残余信号とダウンミックスされたモノ信号に数式（４）のアップミックスマトリックスを適用してアップミックスした後位相合成を行う。

また、マトリックス算出部３０６は、数式（３）によって算出された位相情報のＯＰＤを用いて下記の数式（５）のアップミックスマトリックスを算出する。ここで、ｒｅｓＢａｎｄは残余信号の符号化が行われるバンドを意味する。

アップミックス部３０７は、残余信号とダウンミックスされたモノ信号に数式（５）のアップミックスマトリックスを適用してアップミックスしてもよい。ここで、位相合成はダウンミックスされたモノ信号にのみ適用され、残余信号を用いて最終的なステレオ信号が生成される。

数式（４）と数式（５）において、

は下記の数式（６）によって決定される。

そして、

は下記の数式（７）によって決定される。

ここで、アップミックス部３０７は、下記の数式（８）によって残余信号とダウンミックスされたモノ信号に数式（４）または数式（５）のアップミックスマトリックスを適用してアップミックスしてもよい。アップミックスによってステレオ信号が生成される。

ここで、ｘはＱＭＦ（ＱｕａｄｒａｔｕｒｅＭｉｒｒｏｒＦｉｌｔｅｒ）ドメインのダウンミックスされたモノ信号であり、ｑはステレオ信号の残余信号である。もし、残余信号がないであれば、デコリレータによって生成された別の信号が用いられてもよい。

図４に示すアップミックスマトリックスはＭＰＥＧサラウンドのＯＴＴ（ｏｎｅ−ｔｏ−ｔｗｏ）モジュールに適用されることによって多チャンネルへの拡張が容易である。

図５は、本発明の一実施形態に係る符号化過程を示す図である。図５に示された符号化過程は図２に示す符号化装置によって行われる。そして、図５は、入力信号で２つのチャネル信号から構成されたステレオ信号の場合を示す。

符号化装置２０１は入力されたステレオ信号に対してＱＭＦ分析を行ない（Ｓ５０１）、ナイキストフィルタバンク分析を行って（Ｓ５０２）サブサンプルに変換してもよい。その後、符号化装置２０１は、サブサンプルに変換されたステレオ信号に対して空間パラメータを抽出する（Ｓ５０３）。符号化装置２０１は、抽出された空間パラメータを量子化及び無損失符号化してビットストリームを生成する。

そして、符号化装置２０１は、空間パラメータを用いてステレオ信号をモノ信号にダウンミックスする（Ｓ５０８）。その後、符号化装置２０１は、ダウンミックスされたモノ信号をナイキストフィルタバンク合成を介してＱＭＦドメインに変換する（Ｓ５０９）。

一方、符号化装置２０１は、ステレオ信号を空間パラメータに表すことによって発生するエラー信号の残余信号を抽出する（Ｓ５０４）。符号化装置は抽出された残余信号にＭＤＣＴを行って（Ｓ５０５）符号化（Ｓ５０６）し、ビットストリームを生成する。ここで、符号化装置は、ＭＤＣＴドメインでＭＰＥＧＡＡＣを用いて残余信号を符号化してもよい。

ステップＳ５０１からステップＳ５０８の過程がＭＰＥＧサラウンド符号化部で行われる。ここで、ＭＰＥＧサラウンド符号化部は、図２に示すパラメータ符号化部２０２、ダウンミックス部２０３、及び残余信号符号化部２０４を備えてもよい。

符号化装置は、ＱＭＦドメインに変換されたモノ信号にＳＢＲ符号化を行う（Ｓ５１０）。その後、符号化装置はＱＭＦ合成を介して時間ドメインに変換した後（Ｓ５１１）、ＵＳＡＣコアの符号化を行って（Ｓ５１２）、モノ信号のビットストリームを生成する。ステップＳ５１０の過程がＳＢＲ符号化部で行われ、ステップＳ５１２の過程がＵＳＡＣコアの符号化部で行われてもよい。ここで、ＵＳＡＣコアの符号化部は図２に示すチャネル信号符号化部２０５を備えてもよい。

図６は、本発明の一実施形態に係る復号化過程を示す図である。図６に示された符号化過程は図３に示す復号化装置によって行われる。復号化装置は、ＵＳＡＣコア復号化によってビットストリームからモノ信号を復号化する（Ｓ６０１）。ここで、復号化装置は、ＡＣＥＬＰ、ｗＬＰＴ、及びＡＡＣのいずれか１つの方式によってモノ信号を復号化してもよい。

そして、復号化装置はＱＭＦ分析によって時間ドメインのモノ信号をサブバンド信号に変換する（Ｓ６０２）。その後、復号化装置は、サブバンド信号に変換されたモノ信号に対してＳＢＲ復号化を行う（Ｓ６０３）。ステップＳ６０１の過程がＵＳＡＣコア復号化部で行われ、ステップＳ６０３の過程がＳＢＲ復号化部で行われる。ここで、ＵＳＡＣ復号化部は図３に示すチャネル信号復号化部３０２を備えてもよい。

復号化装置はＳＢＲ復号化が行われたモノ信号にナイキストフィルタバンク分析を適用する（Ｓ６０４）。そして、復号化装置はビットストリームから空間パラメータを復号化した後（Ｓ６０５）、位相情報のＯＰＤを推定する（Ｓ６０６）。これによって、復号化装置は推定されたＯＰＤを用いてアップミックスマトリックスを算出する（Ｓ６０７）。

一方、復号化装置はビットストリームから残余信号を復号化する（Ｓ６０９）。そして、復号化装置は、ＭＤＣＴドメインの残余信号をＱＭＦドメインに変換してもよい（Ｓ６１０）。それで、復号化装置はモノ信号と残余信号にアップミックスマトリックスを適用してアップミックスする（Ｓ６１１）。もし、ビットストリームに残余信号を含んでいなければ、復号化装置はデコリレータによって特定信号を生成し（Ｓ６０８）、モノ信号と特定信号にアップミックスマトリックスを適用してアップミックスしてもよい。その後、復号化装置は、ナイキストフィルタバンク分析とＱＭＦ合成を行って（Ｓ６１２）、時間ドメインのステレオ信号を復元する。

ステップＳ６０４〜ステップＳ６１２はＭＰＥＧサラウンド復号化部で行われてもよく、ＭＰＥＧサラウンド復号化部は図３に示すパラメータ復号化部３０３、位相情報推定部３０４、残余信号復号化部３０５、マトリックス算出部３０６、及びアップミックス部３０７を備えてもよい。

図７は、本発明の一実施形態に係る復号化の順序を示す図である。特に、図７は、復号化が行われるとき、これをシグナリングする方法に関する。

本発明の一実施形態によれば、次にシンタックス（ｓｙｎｔａｘ）によって復号化を行うための基本情報はヘッダに表現され、ビットストリームに含まれてもよい。

ここで、bsStereoSbrとbsPseudoLrは残余信号をコーディングするために必要な構成要素として、次のように定義され得る。

bsStereoSbr This flag signals the usage of the stereo SBR in combination with MPEG Surround decoding.
bsStereoSbrは下の表１のように定義される。bsStereoSbrによって図７に示すような復号化の順序が決定される。

bsStereoSbr情報はＭＰＥＧサラウンドモジュールと組み合わせることのできるＳＢＲ（ＳｐｅｃｔｒａｌＢａｎｄＲｅｐｌｉｃａｔｉｏｎ）モジュールの位置とチャネル数を示す。ＭｏｎｏＳＢＲが適用されれば、ダウンミックス信号が入力されてＳＢＲ復号化が行われた後ＭＰＥＧサラウンドステレオ復号化が行われる。そして、ＳｔｅｒｅｏＳＢＲが適用されれば、ＭＰＥＧサラウンドステレオ復号化が行われた後ＳＢＲ復号化が行われて、最終的なステレオ信号は復元される。

bsPseudoLr This flag signals that an inverse mid/side rotation should be applied to the core signal prior to MPEG Surround processing.
bsPseudoLrは下の表２のように定義される。

channelConfigurationはUSAC core coderのチャネル数を示すものとして、Syntax of USACSpecificConfig（）によればUSAC core coderがステレオ信号の２つのチャネル信号に符号化された場合、SBR configurationに対してシグナリングする。しかし、ＭＰＥＧサラウンドを採用しているＵＳＡＣ技術は５−２−５及び７−２−７のツリー構造を支援し、ここでchannelConfigurationは２に送信される。ここで、５．１チャネル信号にアップミックスするためbsStereoSbrに該当のSBR configurationを定義することはできない。基本的に５−２−５、７−２−７構造でＳＢＲが適用された場合、ダウンミックスされた信号に先にＳＢＲを適用し、最終複数のチャネル信号にアップミックスされる。

このような理由により、Syntax of USACSpecificConfig（）は次のように修正されてもよい。

Modified Syntax of USACSpecificConfig（）ではSpatialSpecificConfig（）を先に解釈し、その後に取得されたbsTreeConfigによりbsStereoSbrとbsPseudoLrが送信される。このような過程により、従来の５−２−５及び７−２−７との互換性の問題が解決される。bsTreeConfigが０ｘ０７である場合２−１−２を意味し、これはステレオ信号を生成することを表す。

また、残余信号の符号化は高いビット率に適用されるため、ＭＰＥＧサラウンドのbitrate modeを示すｂｓ２１２Ｍｏｄｅによって選択的に復号化されてもよい。また、bsResidualCoding情報を用いて残余信号が選択的に復号化されてもよい。

bs212Mode indicates operation mode of SpatialFrame()according to:
bsStereoSbrは下記の表３のように定義される。

他の実現形態として、前記の条件はbsTreeConfigあるいはbs212ModeあるいはbsResidualCodingを適用して判断してもよい。

本発明の実施形態に係る方法は、多様なコンピュータ手段を介して様々な処理を実行することができるプログラム命令の形態で実現され、コンピュータ読取可能な記録媒体に記録されてもよい。コンピュータ読取可能な媒体は、プログラム命令、データファイル、データ構造などのうちの１つまたはその組合せを含んでもよい。媒体に記録されるプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり、使用可能なものであってもよい。

上述したように、本発明を限定された実施形態と図面によって説明したが、本発明は、上記の実施形態に限定されることなく、本発明が属する分野における通常の知識を有する者であれば、このような実施形態から多様な修正及び変形が可能である。

したがって、本発明の範囲は、開示された実施形態に限定されるものではなく、特許請求の範囲だけではなく特許請求の範囲と均等なものなどによって定められるものである。

１０１、２０１符号化装置
１０２、３０１復号化装置
２０２パラメータ符号化部
２０３ダウンミックス部
２０４残余信号符号化部
２０５チャネル信号符号化部
３０２チャネル信号復号化部
３０３パラメータ復号化部
３０４位相情報推定部
３０５残余信号復号化部
３０６マトリックス算出部
３０７アップミックス部

Claims

Ｎ個のチャネル信号に対して位相情報に関連する空間パラメータを抽出して符号化するパラメータ符号化部と、
前記空間パラメータを用いて前記Ｎ個のチャネル信号をＭ個のチャネル信号にダウンミックスするダウンミックス部と、
前記Ｎ個のチャネル信号に関連する残余信号を符号化する残余信号符号化部と、
前記ダウンミックスされたＭ個のチャネル信号を符号化するチャネル信号符号化部と、
を備えることを特徴とする符号化装置。
前記残余信号符号化部は、前記Ｎ個のチャネル信号を空間パラメータに表すとき発生するエラー信号の残余信号を抽出することを特徴とする請求項１に記載の符号化装置。
符号化されたＭ個のチャネル信号をＡＣＥＬＰ、ｗＬＰＴ、またはＡＡＣのいずれか１つに基づいて復号化するチャネル信号復号化部と、
符号化された空間パラメータを復号化するパラメータ復号化部と、
前記空間パラメータを用いて位相情報を推定する位相情報推定部と、
符号化された残余信号を復号化する残余信号復号化部と、
前記位相情報を用いて前記Ｍ個のチャネル信号に対するアップミックスマトリックスを算出するマトリックス算出部と、
前記残余信号とアップミックスマトリックスを用いて前記Ｍ個のチャネル信号をＮ個のチャネル信号にアップミックスするアップミックス部と、
を備えることを特徴とする復号化装置。
前記空間パラメータは、Ｎ個のチャネル信号のエネルギーレベルによる強度差を示すエネルギー差パラメータ（ＣＬＤ：ＣｈａｎｎｅｌＬｅｖｅｌＤｉｆｆｅｒｅｎｃｅｓ）及びＮ個のチャネル信号間の位相差を示す位相差パラメータ（ＩＰＤ：Ｉｎｔｅｒ−ｃｈａｎｎｅｌＰｈａｓｅＤｉｆｆｅｒｅｎｃｅ）のうち少なくとも１つを含み、
前記位相情報推定部は、前記空間パラメータを用いて前記Ｎ個のチャネル信号間の位相差がＭ個のチャネル信号に基づいて分布する程度を表すパラメータ（ＯＰＤ：ＯｖｅｒａｌｌＰｈａｓｅＤｉｆｅｒｅｎｃｅ）を推定することを特徴とする請求項３に記載の復号化装置。
前記残余信号は、前記Ｎ個のチャネル信号を空間パラメータに表すとき発生するエラー信号であることを特徴とする請求項３に記載の復号化装置。
ＭＰＥＧＵＳＡＣ（ＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｅｒ）に符号化されたＭ個のチャネル信号を動作するＬＰＤ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎＤｏｍａｉｎ）に基づいたＡＣＥＬＰ（ＡｌｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）、ｗＬＰＴ（ｗｅｉｇｈｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＴｒａｎｓｆｏｒｍ）、またはＦＤ（ＦｒｅｑｕｅｎｃｙＤｏｍａｉｎ）に基づいたＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）のいずれか１つによって復号化するチャネル信号復号化部と、
符号化された空間パラメータを復号化するパラメータ復号化部と、
前記空間パラメータを用いて位相情報を推定する位相情報推定部と、
符号化された残余信号を復号化する残余信号復号化部と、
前記位相情報を用いて前記Ｍ個のチャネル信号に対するアップミックスマトリックスを算出するマトリックス算出部と、
前記残余信号とアップミックスマトリックスを用いて前記Ｍ個のチャネル信号をＮ個のチャネル信号にアップミックスするアップミックス部と、
を備えることを特徴とする復号化装置。
Ｎ個のチャネル信号に対して位相情報と空間パラメータを抽出して符号化するステップと、
前記空間パラメータを用いて前記Ｎ個のチャネル信号をＭ個のチャネル信号にダウンミクシンするステップと、
前記Ｎ個のチャネル信号に関連する残余信号を符号化するステップと、
前記ダウンミックスされたＭ個のチャネル信号を符号化するステップと、
を含むことを特徴とする符号化方法。
前記残余信号を符号化するステップは、前記Ｎ個のチャネル信号を空間パラメータに表すとき発生するエラー信号の残余信号を抽出することを特徴とする請求項７に記載の符号化方法。
符号化されたＭ個のチャネル信号を復号化するステップと、
符号化された空間パラメータを復号化するステップと、
前記空間パラメータを用いて位相情報を推定するステップと、
符号化された残余信号を復号化するステップと、
前記位相情報を用いて前記Ｍ個のチャネル信号に対するアップミックスマトリックスを算出するステップと、
前記残余信号及びアップミックスマトリックスを用いて前記Ｍ個のチャネル信号をＮ個のチャネル信号にアップミックスするステップと、
を含むことを特徴とする復号化方法。
前記空間パラメータは、Ｎ個のチャネル信号のエネルギーレベルによる強度差を示すエネルギー差パラメータ及びＮ個のチャネル信号の間の位相差を示す位相差パラメータのうち少なくとも１つを含み、
前記位相情報を推定するステップは、前記空間パラメータを用いて前記Ｎ個のチャネル信号間の位相差がＭ個のチャネル信号に基づいて分布する程度を表すパラメータを推定することを特徴とする請求項９に記載の復号化方法。
前記残余信号は、前記Ｎ個のチャネル信号を空間パラメータに表すとき発生するエラー信号であることを特徴とする請求項９に記載の復号化方法。
ＭＰＥＧＵＳＡＣ（ＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｅｒ）に符号化されたＭ個のチャネル信号を動作するＬＰＤ（ＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎＤｏｍａｉｎ）に基づいたＡＣＥＬＰ（ＡｌｇｅｂｒａｉｃＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）、ｗＬＰＴ（ｗｅｉｇｈｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅＴｒａｎｓｆｏｒｍ）、またはＦＤ（ＦｒｅｑｕｅｎｃｙＤｏｍａｉｎ）に基づいたＡＡＣ（ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ）のいずれか１つによって復号化するステップと、
符号化された空間パラメータを復号化するステップと、
前記空間パラメータを用いて位相情報を推定するステップと、
符号化された残余信号を復号化するステップと、
前記位相情報を用いて前記Ｍ個のチャネル信号に対するアップミックスマトリックスを算出するステップと、
前記残余信号とアップミックスマトリックスを用いて前記Ｍ個のチャネル信号をＮ個のチャネル信号にアップミックスするステップと、
を含むことを特徴とする復号化方法。
請求項７〜請求項１２のいずれか一項の方法を行うプログラムを記録したコンピュータで読み出し可能な記録媒体。