JP2015529046A

JP2015529046A - オーディオ信号処理方法および装置

Info

Publication number: JP2015529046A
Application number: JP2015523020A
Authority: JP
Inventors: オ・ヒョンオ; ソン・チョンオク
Original assignee: Intellectual Discovery Co Ltd
Current assignee: Intellectual Discovery Co Ltd
Priority date: 2012-07-31
Filing date: 2013-07-26
Publication date: 2015-10-01
Also published as: US20150179180A1; CN104509131A; WO2014021586A1; EP2863658A1; EP2863658A4; KR20140016780A

Abstract

本発明は、オーディオ信号処理方法および装置であって、ダウンミックス信号を受信するステップと、第１位相チャンネルおよび第２位相チャンネルの位相差に相当するチャンネル間位相差（ＩＰＤ）情報を受信するステップと、前記第１位相チャンネルおよび前記第２位相チャンネルのレベル差であるチャンネル間レベル差を受信するステップと、前記チャンネル間レベル差に基づいて、第１加重値および第２加重値の定義を決定するステップと、前記定義に従って、前記チャンネル間位相差を用いて、前記第１加重値および前記第２加重値を計算するステップと、前記第１加重値および前記第２加重値に基づいて、前記第１位相チャンネルおよび前記ダウンミックス信号の間の位相差に相当する全域位相差（ＯＰＤ）情報を生成するステップとを含むオーディオ信号処理方法が開示される。

Description

本発明は、オーディオ信号を処理することができるオーディオ信号処理方法および装置に関するものであって、具体的には、オーディオ信号をエンコーディングまたはデコーディングすることができるオーディオ信号処理方法および装置に関するものである。

一般的に、ビデオ映像の大型化の傾向に伴い、オーディオも聴取者を取り囲むような感じを持たせるための要求がある。サウンドの実在感または臨場感（ｉｍｍｅｒｓｉｖｅ、ｅｎｖｅｌｏｐｍｅｎｔ）を高めるために、オーディオ信号のチャンネル数が２ｃｈまたは５．１ｃｈよりも多くなり得るが、最大数十個に達するチャンネル数に相当するオーディオ信号（例：２２．２ｃｈ）が処理可能である。

最大数十個に達する多数のチャンネル信号がエンコーダでダウンミックスされ、このダウンミックス信号がデコーダに伝送できるが、このダウンミックス信号は、デコーダで原チャンネル信号と近くアップミックスされなければならない。

本発明は、上記の問題を解決するためになされたものであって、エンコーダから受信されたアップミックスパラメータ（例：チャンネル間位相差）を用いて、ダウンミックス信号のうちの１以上のチャンネルが２以上のチャンネルにアップミックスすることができるオーディオ信号処理方法および装置を提供することを目的とする。

本発明の他の目的は、第１位相チャンネルおよび第２位相チャンネルの間の位相差に相当するチャンネル間位相差（ＩＰＤ：ｉｎｔｅｒ−ｃｈａｎｎｅｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）がエンコーダから受信された場合、これを用いて、第１位相チャンネルおよびダウンミックス信号の間の位相差に相当する全域位相差（ＯＰＤ：ｏｖｅｒａｌｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）を生成することができるオーディオ信号処理方法および装置を提供することである。

本発明のさらに他の目的は、第１位相チャンネル（例：左チャンネル）および第２位相チャンネル（例：右チャンネル）の位相差が１８０度に近づくにつれて発生するエラーを防止するために、チャンネル間位相差（ＩＰＤ）から全域位相差（ＯＰＤ）を生成するにあたり、加重値を適用することができるオーディオ信号処理方法および装置を提供することである。

本発明のさらに他の目的は、前記加重値を適用するにあたり、第１位相チャンネル（例：左チャンネル）の大きさに応じて、第１位相チャンネルに適用される第１加重値の定義を可変させることができるオーディオ信号処理方法および装置を提供することである。

本発明のさらに他の目的は、エンコーダからアップミックスパラメータおよびアップミックスレジデュアルが受信される場合、ダウンミックス信号に前記アップミックスパラメータおよびアップミックスレジデュアルを選択的に適用することにより、出力信号のチャンネル数を異ならせてスケーラブルオーディオアップミキシングを実現することができるオーディオ信号処理方法および装置を提供することである。

本発明は、上記の目的を達成するために、本発明にかかるオーディオ信号処理方法は、ダウンミックス信号を受信するステップと、第１位相チャンネルおよび第２位相チャンネルの位相差に相当するチャンネル間位相差（ＩＰＤ：ｉｎｔｅｒ−ｃｈａｎｎｅｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）情報を受信するステップと、前記第１位相チャンネルおよび前記第２位相チャンネルのレベル差であるチャンネル間レベル差を受信するステップと、前記チャンネル間レベル差に基づいて、第１加重値および第２加重値の定義を決定するステップと、前記定義に従って、前記チャンネル間位相差を用いて、前記第１加重値および前記第２加重値を計算するステップと、前記第１加重値および前記第２加重値に基づいて、前記第１位相チャンネルおよび前記ダウンミックス信号の間の位相差に相当する全域位相差（ＯＰＤ：ｏｖｅｒａｌｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）情報を生成するステップとを含む。

本発明によれば、前記全域位相差（ＯＰＤ）情報および前記ダウンミックス信号を用いて、前記第１位相チャンネルおよび前記第２位相チャンネルを生成するステップを含むことができる。

本発明によれば、前記定義は、第１定義および第２定義を含み、前記チャンネル間位相差によって前記第１位相チャンネルのレベル値が大きい場合、前記第１加重値が前記第２加重値より大きく、前記チャンネル間位相差によって前記第２位相チャンネルのレベル値が大きい場合、前記第２加重値が前記第１加重値より大きくてよい。

本発明の他の側面によれば、ダウンミックス信号を受信し、第１位相チャンネルおよび第２位相チャンネルの位相差に相当するチャンネル間位相差（ＩＰＤ：ｉｎｔｅｒ−ｃｈａｎｎｅｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）を受信し、前記第１位相チャンネルおよび前記第２位相チャンネルのレベル差であるチャンネル間レベル差を受信するデマルチプレキシング部と、前記チャンネル間レベル差に基づいて、第１加重値および第２加重値の定義を決定する加重値定義決定部と、前記定義に従って、前記チャンネル間位相差を用いて、前記第１加重値および前記第２加重値を計算する加重値生成部と、前記第１加重値および前記第２加重値に基づいて、前記第１位相チャンネルおよび前記ダウンミックス信号の間の位相差に相当する全域位相差（ＯＰＤ：ｏｖｅｒａｌｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）情報を生成するＯＰＤ生成部とを含むオーディオ信号処理装置が提供される。

本発明によれば、前記全域位相差（ＯＰＤ）および前記ダウンミックス信号を用いて、前記第１位相チャンネルおよび前記第２位相チャンネルを生成するＯＰＤ適用部を含むことができる。

本発明のさらに他の側面によれば、ダウンミックス信号を受信するステップと、第１位相チャンネルおよび第２位相チャンネルの位相差に相当するチャンネル間位相差（ＩＰＤ：ｉｎｔｅｒ−ｃｈａｎｎｅｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）を受信するステップと、前記第１位相チャンネルおよび前記第２位相チャンネルのレベル差であるチャンネル間レベル差を受信するステップと、前記第１位相チャンネルに適用される第１加重値および、前記第２位相チャンネルに適用される第２加重値を算出するステップと、前記チャンネル間レベル差に基づいて、前記第１位相チャンネルおよび前記ダウンミックス信号の間の和の定義を決定するステップと、前記和の定義に従って、前記第１加重値および前記第２加重値に基づいて、前記第１位相チャンネルおよび前記ダウンミックス信号の間の位相差に相当する全域位相差（ＯＰＤ：ｏｖｅｒａｌｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）情報を生成するステップとを含むオーディオ信号処理方法が提供される。

本発明によれば、前記全域位相差（ＯＰＤ）および前記ダウンミックス信号を用いて、前記第１位相チャンネルおよび前記第２位相チャンネルを生成するステップを含むことができる。

本発明によれば、前記和の定義は、第１和の定義および第２和の定義を含み、前記チャンネル間位相差によって前記第１位相チャンネルのレベル値が大きい場合、前記第１和の定義における前記第１加重値が前記第２加重値より大きく、前記チャンネル間位相差によって前記第２位相チャンネルのレベル値が大きい場合、前記第２和の定義における前記第２加重値が前記第１加重値より大きくてよい。

本発明のさらに他の側面によれば、ダウンミックス信号を受信するステップと、アップミックスパラメータおよびアップミックスレジデュアルのうちの１つ以上を受信するステップと、前記アップミックスパラメータを受信する場合、前記ダウンミックス信号に前記アップミックスパラメータを適用することにより、パラメトリックＭ個の出力チャンネルを生成するステップと、前記アップミックスパラメータおよび前記アップミックスレジデュアルをすべて受信する場合、前記ダウンミックス信号に対して前記アップミックスパラメータおよび前記アップミックスレジデュアルを適用することにより、ディスクリートＮ個の出力チャンネルを生成するステップとを含むオーディオ信号処理方法が提供される。

本発明は、次のような効果と利点を提供する。

まず、アップミックスパラメータを用いて、ダウンミックス信号から５．１ｃｈ以上のマルチチャンネルにアップミキシングすることができるため、マルチチャンネルをそのままエンコーディングした時に比べて、ビット効率を高めることができる。

第二に、スピーカセッティングがモノまたはステレオであるため、ダウンミックス信号をアップミキシング過程なしにデコーディングしてもよい場合、５．１ｃｈ以上のマルチチャンネルを復元した後にダウンミックスする必要がないため、演算量および複雑度を低減することができる。

第三に、チャンネル間位相差に基づいて全域位相差を算出することができるため、全域位相差を別途に伝送する必要がなく、ビット数を減少させることができる。

第四に、アップミキシングに必要なＯＰＤを生成するにあたり、加重値を適用するため、第１位相チャンネルおよび第２位相チャンネルの位相差が１８０度に近い場合に発生する干渉相殺効果を低減することができる。

第五に、第１位相チャンネルの大きさが小さい時、大きい加重値を適用した時、歪みがむしろ増加するのを防止することができる。

第六に、デコーディング部がスケーラブルな構造を有することで、各デバイスのスピーカセットアップに応じて、ビットストリームのデコーディングレベルを異ならせることにより、ビット効率を高められるだけでなく、演算量と複雑度を低減することができる。

同じ視聴距離上で映像の大きさ（例：ＵＨＤＴＶおよびＨＤＴＶ）に応じた視聴角度を説明するための図である。マルチチャンネルの一例として２２．２ｃｈのスピーカ配置を示す図である。マルチチャンネル信号がダウンミックスされる過程を示す図である。本発明の一実施例によるデコーダの構成を示す図である。図４の出力チャンネル生成部１２０の第１実施例である。図４の出力チャンネル生成部１２０の第２実施例である。図４の出力チャンネル生成部１２０の第３実施例である。図５〜図７のアップミキシング部１２２の一実施例による詳細構成図である。位相差に応じた歪み現象を説明するための図である。本発明の他の実施例によるエンコーダおよびデコーダの構成を示す図である。本発明の一実施例によるオーディオ信号処理装置が実現された製品の概略構成図である。

以下、添付した図面を参照して、本発明の好ましい実施例を詳細に説明する。これに先立ち、本明細書および請求の範囲に使用された用語や単語は、通常または辞書的な意味に限定して解釈されてはならず、発明者は自らの発明を最も最善の方法で説明するために用語の概念を適切に定義することができるという原則に則って、本発明の技術的思想に符合する意味と概念で解釈されなければならない。したがって、本明細書に記載された実施例と図面に示された構成は、本発明の最も好ましい一実施例に過ぎず、本発明の技術的思想をすべて代弁するものではないので、本出願時点において、これらを代替できる多様な均等物と変形例があり得ることを理解しなければならない。

本発明において、次の用語は次のような基準により解釈され得、記載されていない用語でも下記の趣旨によって解釈され得る。コーディングは、場合によって、エンコーディングまたはデコーディングと解釈され得、情報（ｉｎｆｏｒｍａｔｉｏｎ）は、値（ｖａｌｕｅｓ）、パラメータ（ｐａｒａｍｅｔｅｒ）、係数（ｃｏｅｆｆｉｃｉｅｎｔｓ）、成分（ｅｌｅｍｅｎｔｓ）などをすべて網羅する用語であって、場合によって、意味は異なって解釈できるが、本発明はこれに限定されない。

図１は、同じ視聴距離上で映像の大きさ（例：ＵＨＤＴＶおよびＨＤＴＶ）に応じた視聴角度を説明するための図である。ディスプレイの作製技術が発展し、消費者の要求に応じて映像の大きさが大型化する傾向にある。図１に示されているように、ＨＤＴＶ（１９２０＊１０８０ピクセルの映像）の場合に比べて、ＵＨＤＴＶ（７６８０＊４３２０ピクセルの映像）は、約１６倍大きくなった映像である。ＨＤＴＶが居間の壁面に設置され、視聴者が一定の視聴距離をおいて居間のソファーに座った場合、視聴角度が約３０度となり得る。しかし、同じ視聴距離でＵＨＤＴＶが設置された場合、視聴角度は約１００度に達する。このように高画質高解像度の大型スクリーンが設置された場合、この大型コンテンツにふさわしいような高い実在感と臨場感を有するサウンドが提供されることが好ましい。視聴者がまるで現場にいるのとほぼ同じ環境を提供するためには、１−２個のサラウンドチャンネルスピーカが存在するだけでは足りないことがある。したがって、より多いスピーカおよびチャンネル数を有するマルチチャンネルオーディオ環境が要求されることがある。

前記説明のように、ホームシアター環境のほか、個人３Ｄテレビ（ｐｅｒｓｏｎａｌ３ＤＴＶ）、スマートフォンテレビ、２２．２チャンネルのオーディオプログラム、自動車、３Ｄｖｉｄｅｏ、テレプレゼンスルーム（ｔｅｌｅｐｒｅｓｅｎｃｅｒｏｏｍ）、クラウドベースのゲーム（ｃｌｏｕｄ−ｂａｓｅｄｇａｍｉｎｇ）などがあり得る。

図２は、マルチチャンネルの一例として２２．２ｃｈのスピーカ配置を示す図である。２２．２ｃｈは音場感を高めるためのマルチチャンネル環境の一例であってよいし、本発明は、特定のチャンネル数または特定のスピーカ配置に限定されない。図２を参照すれば、最も高いレイヤ（ｔｏｐｌａｙｅｒ）に計９個のチャンネルが提供できる。前面に３個、中間位置に３個、サラウンド位置に３個の計９個のスピーカが配置されていることが分かる。中間レイヤ（ｍｉｄｄｌｅｌａｙｅｒ）には、前面に５個、中間位置に２個、サラウンド位置に計３個のスピーカが配置できる。前面の５個のスピーカのうち、中央位置の３個は、テレビスクリーン内に含まれてよい。底（ｂｏｔｔｏｍｌａｙｅｒ）には、前面に計３個のチャンネルおよび２個のＬＦＥチャンネルが設けられてよい。

このように、最大数十個のチャンネルに達するマルチチャンネル信号を伝送し再生するにあたり、高い演算量が必要であり得る。また、通信環境などを考慮する時、高い圧縮率が要求されることがある。それだけでなく、一般家庭では、マルチチャンネル（例：２２．２ｃｈ）のスピーカ環境を備える場合は多くなく、２ｃｈまたは５．１ｃｈのセットアップを有する聴取者が多いため、すべてのユーザに共通に伝送する信号がマルチチャンネルをそれぞれエンコーディングして送る場合には、そのマルチチャンネルを２ｃｈおよび５．１ｃｈに再変換して再生しなければならない場合、通信的な非効率が発生するだけでなく、２２．２ｃｈのＰＣＭ信号を格納しなければならないため、メモリ管理における非効率が発生することがある。

したがって、マルチチャンネル信号（総Ｍチャンネル、入力チャンネルの数）をそれぞれエンコーディングして伝送するよりは、より小さいチャンネル数（Ｎチャンネル、出力チャンネルの数）に減少させる過程であるダウンミックス過程（Ｍ−Ｎｄｏｗｎｍｉｘ）を行った後にデコーダに伝送できる。デコーダは、ダウンミックス信号を受信し、そのダウンミックス信号をそのまま再生したり、または、ダウンミックス過程で抽出された情報を用いて、原信号と同じチャンネル数の信号をダウンミックス信号から生成することができる。

図３は、マルチチャンネル信号がダウンミックスされる過程を示す図である。エンコーダで定められたツリー構造によってダウンミックスできるが、５．１ｃｈがマルチチャンネル信号の場合を一例に挙げてダウンミックス過程を説明する。しかし、本発明は、特定のツリー構造または特定の入力チャンネルの数などによって限定されず、マルチチャンネル信号は２２．２ｃｈになってもよい。また、ダウンミックスされた信号のチャンネル（Ｎ個のチャンネル）も、図３では、モノまたはステレオを例に挙げて説明しているが、Ｎ個のチャンネルは、入力チャンネルの数（Ｍ）より小さい場合であれば、いずれの場合も可能（５．１ｃｈなど）であることを明らかにする。

図３を参照すれば、左チャンネル、右チャンネル、センターチャンネル、サラウンド左チャンネル、サラウンド右チャンネルが、マルチチャンネルまたはその一部になってよい。センターチャンネルは、スケーリングされた後に、左チャンネルおよび右チャンネルにそれぞれ配分される。追加的に、サラウンド左チャンネルおよびサラウンド右チャンネルが存在する場合、その大きさが調整された後に、左チャンネルおよび右チャンネルにそれぞれ含まれてよい。その結果、左和チャンネル（Ｌｔ／Ｌｏ）および右和チャンネル（Ｒｔ／Ｒｏ）が生成可能であり、その２つのチャンネルが再び合わされてモノ信号が生成されてもよい。

一方、このようにダウンミックスする過程で、逆位相の信号間の相殺干渉効果によって信号の品質が劣化する問題が生じることがある。具体的には、周辺チャンネル同士で単純に和（ｓｕｍ）をする方式でダウンミックスを行えば、結局、同一信号の互いに異なる位相（ｐｈａｓｅ）信号が加えられる確率が高い。この過程で、ある信号は増幅効果または減衰効果が発生し、結果的には、相関歪み（ｃｏｒｒｅｌａｔｉｏｎｄｉｓｔｏｒｔｉｏｎ）が発生することがある。また、トップレイヤ（ｔｏｐｌａｙｅｒ）やボトムレイヤ（ｂｏｔｔｏｍ）上のチャンネルを中間レイヤ（ｍｉｄｄｌｅｌａｙｅｒ）に単純に加えてダウンミックスする場合、所望のサウンドシーン（ｓｏｕｎｄｓｃｅｎｅ）の実現が事実上不可能である。

このようにモノまたはステレオ信号などにダウンミックスされた信号は、デコーダで５．１ｃｈ以上のマルチチャンネル信号にアップミキシンできる。先に説明したように、ダウンミックス過程で相殺干渉効果によって音質が劣化し得るため、アップミキシングする過程でこれに対する補償処理を行うことができる。その過程については、以下、図４などを参照しながら説明する。

図４は、本発明の一実施例によるデコーダの構成を示す図である。図４を参照すれば、本発明の一実施例によるデコーダは、デマルチプレクサ１１０と、出力チャンネル生成部１２０とを含む。デマルチプレクサ１１０は、エンコーダからオーディオ信号のビットストリームを受信し、このビットストリームからダウンミックス信号（ＤＭＸ）およびアップミキシングパラメータ（ＵＰ）を抽出する。もちろん、ダウンミックス信号およびアップミキシングパラメータは、１つのビットストリームでなく、それぞれの別のオーディオ信号のビットストリームを介して受信できる。

出力チャンネル生成部１２０は、受信されたダウンミックス信号（ＤＭＸ）にアップミキシングパラメータ（ＵＰ）を適用することにより、マルチチャンネル信号（チャンネル数Ｎ個）を生成することができる。ここで、マルチチャンネル信号は、先に言及したように、ダウンミックス信号のチャンネル数（Ｍ）より大きい数のチャンネルを有する信号であって、５．１ｃｈ、２２．２ｃｈなどになってよい。しかし、マルチチャンネル信号の個数（Ｎ）は、エンコーダの入力チャンネル数と同一であってよいが、場合によっては、同一でなくてもよい。

ここで、アップミックスパラメータ（ＵＰ）は、空間パラメータおよびチャンネル間位相差（ＩＰＤ）情報を含むことができる。ここで、空間パラメータは、チャンネル間レベル差（ＣＬＤ：ＣｈａｎｎｅｌＬｅｖｅｌＤｉｆｆｅｒｅｎｃｅｓ）を含み、チャンネル間相関関係（ＩＣＣ：ＩｎｔｅｒＣｈａｎｎｅｌＣｏｈｅｒｅｎｃｅｓ）をさらに含むことができる。１つのＯＴＴ（Ｏｎｅ−Ｔｏ−Ｔｗｏ）ボックスを介して２つのチャンネル（第１入力チャンネルおよび第２入力チャンネル）が１つのチャンネル（第１出力チャンネル）にダウンミックスされる場合、チャンネル間レベル差（ＣＬＤ）は、第１入力チャンネルおよび第２入力チャンネルの間のレベル差であり、チャンネル間相関関係（ＩＣＣ）は、第１入力チャンネルおよび第２入力チャンネルの間の相関関係である。

一方、チャンネル間位相差（ＩＰＤ：ｉｎｔｅｒ−ｃｈａｎｎｅｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）情報は、チャンネル間位相差（ＩＰＤ）そのものであるか、位相差（ＩＰＤ）が量子化またはエンコーディングされた値であってよい。デマルチプレクサ１１０は、受信されたチャンネル間位相差（ＩＰＤ）情報からチャンネル間位相差を取得する。ここで、チャンネル間位相差（ＩＰＤ）は、第１入力チャンネルおよび第２入力チャンネルの間の位相差に相当する。ここで、前記第１入力チャンネルおよび第２入力チャンネルの代わりに、第１位相チャンネルおよび第２位相チャンネルと名付けることができる。

出力チャンネル生成部１２０は、このようにアップミックスパラメータ（ＵＰ）を１つ以上のアップミキシング部を介してダウンミックス信号に適用することにより、マルチチャンネルに相当する出力チャンネル信号を生成することができるが、出力チャンネル生成部１２０の多様な実施例（１２０Ａ、１２０Ｂ、１２０Ｃ）を、図５〜図７を参照しながら説明する。

図５〜図７は、図４の出力チャンネル生成部１２０の第１実施例（１２０Ａ）〜第３実施例（１２０Ｂ）である。まず、図５を参照すれば、第１実施例による出力チャンネル生成部１２０Ａは、１つのアップミキシング部１２２を含む。アップミキシング部１２２は、１つの入力信号にアップミキシングパラメータ（ＵＰ）を適用することにより、第１位相チャンネル（Ｐ１）および第２位相チャンネル（Ｐ２）を生成する。ここでの入力信号は、受信されたダウンミックス信号そのものであってもよく、ダウンミックス信号のうちの１つのチャンネル信号であってもよい。ここでのアップミキシングパラメータ（ＵＰ）は、チャンネル間位相差（ＩＰＤ）およびチャンネル間レベル差（ＣＬＤ）を含むことができる。一方、第１−１実施例（１２０Ａ．１）に示されているように、入力信号はデコリレータＤでデコリレーティングされた後、入力信号およびデコリレーションされた信号がアップミキシング部１２２に入力されてもよい。

一方、アップミキシング部１２２は、チャンネル間位相差（ＩＰＤ）を全域位相差（ＯＰＤ：ｏｖｅｒａｌｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）に変換した後に前記入力信号に適用できるが、ここで、全域位相差は、前記第１位相チャンネルおよび前記ダウンミックス信号の間の位相差（または第１位相チャンネルおよび入力信号の間の位相差）に相当する。アップミキシング部１２２に関する詳細な説明は、以後、図８を参照しながら具体的に説明する。

図６を参照すれば、第２実施例による出力チャンネル生成部１２０Ｂの構成が分かる。出力チャンネル生成部１２０Ｂは、２つのアップミキシング部１２２を含むが、これらアップミキシング部は並列に配置される。第１アップミキシング部１２２．１は、入力信号＿１にアップミキシングパラメータ（ＵＰ）を適用して、第１位相チャンネル（Ｐ１）および第２位相チャンネル（Ｐ２）を生成するが、ここで、入力信号＿１は、ダウンミックス信号のうちの一部であってよい。例えば、ダウンミックス信号がステレオ信号の場合、入力信号＿１は、左チャンネル信号であってよい。第２アップミキシング部１２２．２は、入力信号＿２にアップミキシングパラメータ（ＵＰ）を適用して、第３位相チャンネル（Ｐ３）および第４位相チャンネル（Ｐ４）を生成するが、入力信号＿２は、ダウンミックス信号がステレオ信号の場合、右チャンネル信号であってよい。

同様に、第１アップミキシング部１２２．１および第２アップミキシング部１２２．２の詳細構成については、図８を参照しながら以後に説明する。

図７を参照すれば、第３実施例による出力チャンネル生成部１２０Ｃの構成が分かる。出力チャンネル生成部１２０Ｃは、３つのアップミキシング部１２２が階層的に配置されている。第１アップミキシング部１２２．１の出力である第１位相チャンネル（Ｐ１）および第２位相チャンネル（Ｐ２）が、第２アップミキシング部１２２．２および第３アップミキシング部１２２．３にそれぞれ入力チャンネルとして入力される。第１アップミキシング部１２２．１は、第１実施例または第１−１実施例のアップミキシング部とほぼ同一の動作を行うことができる。第２アップミキシング部１２２．２は、第１位相チャンネル（Ｐ１）にアップミックスパラメータ（ＵＰ）を適用して、第３位相チャンネル（Ｐ３）および第４位相チャンネル（Ｐ４）を生成し、第３アップミキシング部１２２．３は、第２位相チャンネル（Ｐ２）にアップミックスパラメータ（ＵＰ）を適用して、第５位相チャンネル（Ｐ５）および第６位相チャンネル（Ｐ６）を生成する。

前記第１実施例〜第３実施例の出力チャンネル生成部１２０Ａ〜１２０Ｃのほか、多数のアップミキシング部１２２が並列および直列に組み合わされて多様なツリー構造を構成することができ、本発明は特定のツリー構造に限定されない。

以下、前記実施例に１つ以上含まれるアップミキシング部１２２の詳細構成について説明する。

図８は、図５〜図７のアップミキシング部１２２の一実施例による詳細構成を示す図である。アップミキシング部１２２は、チャンネル間位相差（ＩＰＤ）情報を全域位相差（ＯＰＤ）に変換し、空間パラメータを適用することにより、１つ以上のチャンネルから２以上のチャンネル信号を生成する。図８を参照すれば、アップミキシング部１２２は、加重値定義決定部１２２ａと、加重値生成部１２２ｂと、ＯＰＤ生成部１２２ｃと、ＯＰＤ適用部１２２ｄとを含む。

まず、図９を参照しながら、位相差による相殺歪み現象を説明する。図９を参照すれば、モノ信号、および左チャンネル、右チャンネルの間の位相が示されている。図９（Ａ）は、数式１のように、左チャンネルおよび右チャンネルを単純に和（ｓｕｍｍａｔｉｏｎ）をしてモノ信号を生成した時の位相差が示されている。

ここで、ｓはモノ信号、ｌは左チャンネル信号、ｒは右チャンネル信号である。

図９（Ａ）に示されているように、モノ信号（ｓ）を示すベクトルと、左チャンネル信号（ｌ）を示すベクトルとの間の角度が、全域位相差（ＯＰＤ）である。左チャンネル信号（ｌ）と右チャンネル信号（ｒ）ベクトルの間の角度は、チャンネル間位相差（ＩＰＤ）に相当することができる。図９（Ａ）において、チャンネル間位相差（ＩＰＤ）が９０度未満であるため、モノ信号（ｓ＝１／２＊（ｌ＋ｒ））の増幅効果が起こり、元の左チャンネルおよび右チャンネル信号よりモノ信号（ｓ）の大きさが大きくなったことが分かる。しかし、チャンネル間位相差（ＩＰＤ）が１８０度に近づくと、元の左チャンネル信号および右チャンネル信号それぞれの大きさにかかわらず、それらベクトルのベクトル和であるモノ信号（ｓ）の大きさが０に近づく減衰効果が現れることがある。

このような問題を解決するために、数式１のような定義の代わりに、図９（Ｂ）に示された一例のように、各信号に加重値（ｗ_１およびｗ_２）を適用して和信号を生成する定義を用いる。その定義のうち、一例は、次の通りである。

ここで、ｓはダウンミックス信号（または入力チャンネル信号）、ｌは第１位相チャンネル信号（または左チャンネル信号）、ｒは第２位相チャンネル信号（または右チャンネル信号）、ｗ_１は第１位相チャンネル信号に適用される第１加重値、ｗ_２は第２位相チャンネル信号に適用される第２加重値である。

第１加重値（ｗ_１）および第２加重値（ｗ_２）は、第１位相チャンネル（ｌ）および第２位相チャンネル（ｒ）を選択的に拡張するための値である。より具体的には、チャンネル間レベル差（ＣＬＤ）に基づいて、第１位相チャンネル（ｌ）および第２位相チャンネル（ｒ）の相対的なレベルの大きさを考慮して、レベルの大きさが大きい信号に大きい値の加重値を与えるように、第１加重値および第２加重値が適用される。

このように第１位相チャンネル（ｌ）および第２位相チャンネル（ｒ）を選択的に拡張する理由は、第１位相チャンネル（ｌ）および第２位相チャンネル（ｒ）のうちの小さい値を有する信号に対して高い値の加重値を適用すれば、むしろ加重値を適用する前よりエラーが大きく発生し得るからである。したがって、第１位相チャンネルおよび第２位相チャンネルのうち、レベルの高い信号に高い値の加重値を適用する。

前記第１加重値および第２加重値の一例は、下記の数式の通りであってよい。

第１定義および第２定義において、いずれも第１加重値はｗ_１、第２加重値はｗ_２である。

前記数式３〜７を参照すれば、第１位相チャンネルおよび第２位相チャンネルをそれぞれスケーリングするための加重値の定義は、第１定義および第２定義を含むことができるが、チャンネル間レベル差によって第１定義および第２定義が選択的に適用される。本発明の一実施例によれば、第１位相チャンネルのチャンネルレベル値が第２位相チャンネルのチャンネルレベル値より大きい場合（または、大きいか等しい場合）、第１定義が適用され、第１位相チャンネルのチャンネルレベル値が第２位相チャンネルのチャンネルレベル値以下の場合（または、小さい場合）、第２定義が適用されてよい。すなわち、前記数式で定義されたＣＬＤが０より大きい場合（または、大きいか等しい場合）、第１定義が適用され、ＣＬＤが０以下の場合（または、小さい場合）、第２定義が適用されてよい。一方、本発明の他の実施例によれば、第１位相チャンネルのチャンネルレベル値が予め設定された値より大きい場合、第１定義が適用され、第１位相チャンネルのチャンネルレベル値が予め設定された値以下の場合、第２定義が適用されてよい。

前記のような定義に基づいて、図８に示されたアップミキシング部１２２の詳細構成について説明する。

加重値定義決定部１２２ａは、アップミキシングパラメータ（ＵＰ）の空間パラメータのうち、チャンネル間レベル差（ＣＬＤ）に基づいて、第１位相チャンネル（Ｐ１）の第１加重値（ｗ_１）および第２位相チャンネル（Ｐ２）の第２加重値（ｗ_２）を決定する定義を選択する。具体的には、チャンネル間レベル差（ＣＬＤ）は、第１位相チャンネルおよび第２位相チャンネルの間のレベル差を示すため、前記ＣＬＤを考慮すれば、第１位相チャンネルおよび第２位相チャンネルのうち、どの信号のレベルが高いかが分かる。第１位相チャンネルのレベル値が相対的に高い場合、加重値定義決定部１２２ａは、第１加重値（ｗ_１）の値が第２加重値（ｗ_２）の値より高いように、第１定義を選択することができる。逆に、第２位相チャンネルのエネルギーが高い場合、加重値定義決定部１２２ａは、第２加重値（ｗ_２）の値が第１加重値（ｗ_１）の値より高いように、第２定義を選択することができる。

加重値定義決定部１２２ａが第１定義を選択した場合、加重値生成部１２２ｂは、第１定義に従って、第１加重値および第２加重値を算出することができる。すなわち、数式３の第１定義に従って、第１加重値および第２加重値が算出できる。一方、加重値定義決定部１２２ａが第２定義を選択した場合、加重値生成部１２２ｂは、第２定義に従って、第１加重値および第２加重値を算出することができる。すなわち、数式４の第２定義に従って、第１加重値および第２加重値が算出できる。数式３〜７に示されているように、第１加重値および第２加重値を算出するにあたり、チャンネル間レベル差（ＣＬＤ）、チャンネル間相関関係（ＩＣＣ）、およびチャンネル間位相差（ＩＰＤ）が利用できる。

第１定義に従って第１加重値および第２加重値が算出される場合、ＩＰＤの値が１８０度に近いほど、第１加重値は大きくなってよい。逆に、第２定義に従って第１加重値および第２加重値が算出される場合、ＩＰＤの値が１８０度に近いほど、第２加重値が大きくなってよい。

前記のように、チャンネル間レベル差の値によって第１定義および第２定義が選択的に適用されることにより、第１位相チャンネルおよび第２位相チャンネルのうち、大きいレベル値を有するチャンネルに対して高い加重値が適用される。本発明の実施例によれば、ＩＰＤの値が１８０度に近いほど、第１位相チャンネルおよび第２位相チャンネルのうち、レベル値の大きい信号に対応する加重値の値が大きく設定できる。

このように加重値生成部１２２ｂによって第１加重値および第２加重値が生成されると、ＯＰＤ生成部１２２ｃは、前記第１加重値および第２加重値に基づいて、チャンネル間位相差（ＩＰＤ）を全域位相差（ＯＰＤ）に変換する。第１加重値および第２加重値が決定されると、数式２によって、ダウンミックス信号および第１位相チャンネル信号の間の関係が決定される。すると、全域位相差（ＯＰＤ）は、ダウンミックス信号および第１位相チャンネルの間の位相差であるので、チャンネル間位相差（ＩＰＤ）は全域位相差（ＯＰＤ）に変換できるのである。

具体的には、チャンネル間位相差（ＩＰＤ）および全域位相差（ＯＰＤ）の関係式の一例は、次の通りである。

前記数式８〜９によれば、全域位相差（ＯＰＤ）を算出するために、チャンネル間位相差（ＩＰＤ）だけでなく、チャンネル間レベル差（ＣＬＤ）がさらに利用できる。

すると、ＯＰＤ適用部１２２ｄは、全域位相差（ＯＰＤ）に基づいて、入力信号（またはダウンミックス信号）から第１位相チャンネル（Ｐ１）および第２位相チャンネル（Ｐ２）を生成する。１つの信号にＯＰＤを適用して２つのチャンネルを生成することで、チャンネル数を増加させるアップミキシング過程が行われるのである。

一方、本発明の他の実施例によれば、前記数式３〜７で説明したように、第１加重値および第２加重値の定義を決定する代わりに、和信号（ｓ、ダウンミックス信号）および位相チャンネルの間の関係に対する定義を、次のように決定することができる。

すなわち、数式１０〜１２の実施例によれば、第１加重値（ｗ_１）および第２加重値（ｗ_２）に対する定義は同一であるのに対し、チャンネル間レベル差によって、和信号（ｓ）が第１和および第２和のうちのいずれかに決定できる。本発明の一実施例によれば、第１位相チャンネル（ｌ）のチャンネルレベル値が第２位相チャンネル（ｒ）のチャンネルレベル値より大きい場合（または、大きいか等しい場合）、第１和が和信号（ｓ）として決定され、第１位相チャンネル（ｌ）のチャンネルレベル値が第２位相チャンネル（ｒ）のチャンネルレベル値以下の場合（または、小さい場合）、第２和が和信号（ｓ）として決定されてよい。一方、本発明の他の実施例によれば、第１位相チャンネル（ｌ）のチャンネルレベル値が予め設定された値より大きい場合、第１和が和信号（ｓ）として決定され、第１位相チャンネル（ｌ）のチャンネルレベル値が予め設定された値以下の場合、第２和が和信号（ｓ）として決定されてよい。したがって、数式１０〜１２の実施例においても、第１位相チャンネルのレベル値が第２位相チャンネルのレベル値より高い場合、第１位相チャンネルに対してより高い値の加重値が適用され、第２位相チャンネルのレベル値が高い場合、第２位相チャンネルに対してより高い値の加重値が適用されてよい。

本発明によるアップミキシング部１２２において、前記決定された和信号（ｓ）に基づいて第１位相チャンネルおよび第２位相チャンネルを生成する方法は、前述の通りである。すなわち、アップミキシング部１２２は、前記数式１０〜１２によって決定された和の定義と、第１加重値（ｗ_１）および第２加重値（ｗ_２）に基づいて、全域位相差（ＯＰＤ）情報を生成することができる。また、アップミキシング部１２２は、全域位相差（ＯＰＤ）を用いてダウンミックス信号（ｓ）から第１位相チャンネルおよび第２位相チャンネルを生成し、アップミキシングを行うことができる。

前記のような本発明の実施例によれば、アップミキシング部でチャンネル数を増加させるために必要なＯＰＤを生成するにあたり、チャンネルの間の位相差が１８０度に近づく時に発生する相殺干渉効果を低減することができる。それだけでなく、第１位相チャンネルおよび第２位相チャンネルのうち、チャンネルレベルの低い信号に対して高い加重値を適用する時に発生する歪み現象を低減することができる。

図１０は、本発明の他の実施例によるエンコーダおよびデコーダの構成を示す図である。図１０は、デコーダのスピーカセットアップがそれぞれ異なる場合に、スケーラブルなコーディングのための構造を示す。

エンコーダは、ダウンミキシング部２１０を含み、デコーダは、第１デコーディング部２３０〜第３デコーディング部２５０のうちの１つ以上と、デマルチプレキシング部２２０とを含む。

ダウンミキシング部２１０は、マルチチャンネルに相当する入力信号（ＣＨ＿Ｎ）をダウンミキシングすることにより、ダウンミックス信号（ＤＭＸ）を生成する。この過程で、アップミックスパラメータ（ＵＰ）およびアップミックスレジデュアル（ＵＲ）のうちの１つ以上を生成する。その後、ダウンミックス信号（ＤＭＸ）、アップミックスパラメータ（ＵＰ）（およびアップミックスレジデュアル（ＵＲ））をマルチプレキシングすることにより、１以上のビットストリームを生成し、デコーダに伝送する。

ここで、アップミックスパラメータ（ＵＰ）は、１以上のチャンネルを２以上のチャンネルにアップミキシングするために必要なパラメータであって、先に本発明の一実施例とともに説明したように、空間パラメータおよびチャンネル間位相差（ＩＰＤ）などが含まれてよい。

そして、アップミックスレジデュアル（ＵＲ）は、原信号の入力信号（ＣＨ＿Ｎ）と復元された信号との差であるレジデュアル信号に相当する。ここで、復元された信号は、ダウンミックス信号（ＤＭＸ）にアップミックスパラメータ（ＵＰ）を適用してアップミキシングされた信号であってもよいし、ダウンミキシング部２１０によってダウンミキシングされていないチャンネルがｄｉｓｃｒｅｔｅな方式でエンコーディングされた信号であってよい。

デコーダのデマルチプレキシング部２２０は、１以上のビットストリームからダウンミックス信号（ＤＭＸ）およびアップミックスパラメータ（ＵＰ）を抽出し、アップミックスレジデュアル（ＵＲ）をさらに抽出することができる。

デコーダは、スピーカセットアップ環境に応じて、第１デコーディング部２３０〜第３デコーディング部２５０のうちの１つ（または１つ以上）を選択的に含むことができる。デバイスの種類（スマートフォン、ステレオテレビ、５．１ｃｈホームシアター、２２．２ｃｈホームシアターなど）に応じて、ラウドスピーカのセットアップ環境が多様であり得る。このように多様な環境にもかかわらず、２２．２ｃｈなどのマルチチャンネル信号を生成するためのビットストリームおよびデコーダが選択的でなければ、２２．２ｃｈの信号をすべて復元した後に、スピーカの再生環境に応じて、再びダウンミックスしなければならない。この場合、復元およびダウンミックスに必要な演算量が非常に高いだけでなく、遅延が発生することもある。

しかし、本発明の他の実施例によれば、各デバイスのセットアップ環境に応じて、デコーダが第１デコーディング部〜第３デコーディング部のうちの１つ（または１つ以上）を選択的に備えることにより、前記のような不都合を解消することができる。

第１デコーディング部２３０は、ダウンミックス信号（ＤＭＸ）のみをデコーディングする構成であって、チャンネル数の増加を伴わない。すなわち、第１デコーディング部２３０は、ダウンミックス信号がモノの場合、モノチャンネル信号を出力し、ステレオの場合、ステレオ信号を出力するものである。第１デコーディング部２３０は、スピーカチャンネル数が１つまたは２つの、ヘッドホンが備えられた装置、スマートフォン、テレビなどに好適であり得る。

一方、第２デコーディング部２４０は、ダウンミックス信号（ＤＭＸ）およびアップミックスパラメータ（ＵＰ）を受信し、これに基づいて、パラメトリックＭチャンネル（ＰＭ）を生成する。第２デコーディング部２４０は、第１デコーディング部２３０に比べて出力チャンネル数が増加する。しかし、アップミックスパラメータ（ＵＰ）が総Ｍチャンネルまでのアップミックスに相当するパラメータのみが存在する場合、第２デコーディング部２４０は、原チャンネル数（Ｎ）に及ばないＭチャンネル数の信号を出力することができる。例えば、エンコーダの入力信号である原信号が２２．２ｃｈ信号であり、Ｍチャンネルは、５．１ｃｈ、７．１ｃｈチャンネルなどであってよい。

第３デコーディング部２５０は、ダウンミックス信号（ＤＭＸ）およびアップミックスパラメータ（ＵＰ）だけでなく、アップミックスレジデュアル（ＵＲ）まで受信する。第２デコーディング部２４０は、Ｍチャンネルのパラメトリックチャンネルを生成するのに対し、第３デコーディング部２５０は、これにアップミックスレジデュアル信号（ＵＲ）まで追加的に適用することにより、Ｎ個のチャンネルの復元された信号を出力することができる。

各デバイスは、第１デコーディング部〜第３デコーディング部のうちの１つ以上を選択的に備え、ビットストリームのうち、アップミックスパラメータ（ＵＰ）およびアップミックスレジデュアル（ＵＲ）を選択的にパーシングすることにより、各スピーカセットアップ環境に合わせた信号を直ちに生成することにより、複雑度および演算量を低減することができる。

図１１は、本発明の一実施例によるオーディオ信号処理装置が実現された製品の関係を示す図である。まず、図１１を参照すれば、有無線通信部３１０は、有無線通信方式によりビットストリームを受信する。具体的には、有無線通信部３１０は、有線通信部３１０Ａ、赤外線通信部３１０Ｂ、ブルートゥース部３１０Ｃ、無線ＲＡＮ通信部３１０Ｄのうちの１つ以上を含むことができる。

ユーザ認証部３２０は、ユーザ情報を受信してユーザ認証を行うものであって、指紋認識部３２０Ａ、虹彩認識部３２０Ｂ、顔認識部３２０Ｃ、および音声認識部３２０Ｄのうちの１つ以上を含むことができるが、それぞれ指紋、虹彩情報、顔輪郭情報、音声情報を受信して、ユーザ情報に変換し、ユーザ情報および既に登録されているユーザデータと一致するか否かを判断して、ユーザ認証を行うことができる。

入力部３３０は、ユーザが様々な種類の命令を入力するための入力装置であって、キーパッド部３３０Ａ、タッチパッド部３３０Ｂ、リモコン部３３０Ｃのうちの１つ以上を含むことができるが、本発明はこれに限定されない。

信号コーディングユニット３４０は、有無線通信部３１０を介して受信されたオーディオ信号および／またはビデオ信号に対してエンコーディングまたはデコーディングを行い、時間ドメインのオーディオ信号を出力する。前記信号コーディングユニット３４０は、オーディオ信号処理装置３４５を含むことができる。この時、オーディオ信号処理装置３４５は、先に説明した本発明の実施例（すなわち、一実施例によるデコーダ１００、および他の実施例によるエンコーダおよびデコーダ２００）に相当するものであって、このようにオーディオ処理装置３４５およびこれを含む信号コーディングユニット３４０は、１つ以上のプロセッサによって実現できる。

制御部３５０は、入力装置から入力信号を受信し、信号コーディングユニット３４０および出力部３６０のすべてのプロセスを制御する。出力部３６０は、信号コーディングユニット３４０によって生成された出力信号などが出力される構成要素であって、スピーカ部３６０Ａと、ディスプレイ部３６０Ｂとを含むことができる。出力信号がオーディオ信号の時、出力信号はスピーカに出力され、ビデオ信号の時、出力信号はディスプレイを介して出力される。

本発明によるオーディオ信号処理方法は、コンピュータで実行されるためのプログラムに作成され、コンピュータ読み取り可能な記録媒体に格納されてよいし、本発明によるデータ構造を有するマルチメディアデータもコンピュータ読み取り可能な記録媒体に格納されてよい。前記コンピュータ読み取り可能な記録媒体は、コンピュータシステムによって読み込まれるデータが格納されるすべての種類の格納装置を含む。コンピュータ読み取り可能な記録媒体の例には、ＲＯＭ、ＲＡＭ、ＣＤ−ＲＯＭ、磁気テープ、フロッピー（登録商標）ディスク、光データ記憶装置などがあり、また、キャリアウエーブ（例えば、インターネットを介した伝送）の形態で実現されるものも含む。さらに、前記エンコーディング方法によって生成されたビットストリームは、コンピュータ読み取り可能な記録媒体に格納されたり、有／無線通信網を用いて伝送可能である。

以上、本発明は、限定された実施例と図面によって説明されたが、本発明はこれによって限定されず、本発明の属する技術分野における通常の知識を有する者によって本発明の技術思想と以下に記載される特許請求の範囲の均等範囲内で多様な修正および変形が可能であることは当然である。

上述のように、発明を実施するための形態において、関連事項を記述した。

本発明は、オーディオ信号をエンコーディングしデコーディングするのに適用可能である。

Claims

ダウンミックス信号を受信するステップと、
第１位相チャンネルおよび第２位相チャンネルの位相差に相当するチャンネル間位相差（ＩＰＤ：ｉｎｔｅｒ−ｃｈａｎｎｅｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）情報を受信するステップと、
前記第１位相チャンネルおよび前記第２位相チャンネルのレベル差であるチャンネル間レベル差を受信するステップと、
前記チャンネル間レベル差に基づいて、前記第１位相チャンネルに適用される第１加重値、および前記第２位相チャンネルに適用される第２加重値の定義を決定するステップと、
前記決定された定義および前記チャンネル間位相差を用いて、前記第１加重値および前記第２加重値を計算するステップと、
前記第１加重値および前記第２加重値に基づいて、前記第１位相チャンネルおよび前記ダウンミックス信号の間の位相差に相当する全域位相差（ＯＰＤ：ｏｖｅｒａｌｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）情報を生成するステップとを含むことを特徴とする、オーディオ信号処理方法。
前記全域位相差（ＯＰＤ）情報および前記ダウンミックス信号を用いて、前記第１位相チャンネルおよび前記第２位相チャンネルを生成するステップを含むことを特徴とする、請求項１に記載のオーディオ信号処理方法。
前記定義は、前記第１加重値が第２加重値より大きいか等しい第１定義、および前記第１加重値が第２加重値より小さいか等しい第２定義を含み、
前記決定するステップは、前記チャンネル間レベル差に基づいて、
前記第１位相チャンネルのレベル値が第２位相チャンネルのレベル値より大きい場合、前記第１定義を選択し、
前記第２位相チャンネルのレベル値が第１位相チャンネルのレベル値より大きい場合、前記第２定義を選択することを特徴とする、請求項１に記載のオーディオ信号処理方法。
ダウンミックス信号を受信し、第１位相チャンネルおよび第２位相チャンネルの位相差に相当するチャンネル間位相差（ＩＰＤ：ｉｎｔｅｒ−ｃｈａｎｎｅｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）情報を受信し、前記第１位相チャンネルおよび前記第２位相チャンネルのレベル差であるチャンネル間レベル差を受信するデマルチプレキシング部と、
前記チャンネル間レベル差に基づいて、前記第１位相チャンネルに適用される第１加重値、および前記第２位相チャンネルに適用される第２加重値の定義を決定する加重値定義決定部と、
前記決定された定義および前記チャンネル間位相差を用いて、前記第１加重値および前記第２加重値を計算する加重値生成部と、
前記第１加重値および前記第２加重値に基づいて、前記第１位相チャンネルおよび前記ダウンミックス信号の間の位相差に相当する全域位相差（ＯＰＤ：ｏｖｅｒａｌｌｐｈａｓｅｄｉｆｆｅｒｅｎｃｅ）情報を生成するＯＰＤ生成部とを含むことを特徴とする、オーディオ信号処理装置。