JP5158814B2 - 減数されたチャネルへの復号化 - Google Patents

減数されたチャネルへの復号化 Download PDF

Info

Publication number
JP5158814B2
JP5158814B2 JP2009500706A JP2009500706A JP5158814B2 JP 5158814 B2 JP5158814 B2 JP 5158814B2 JP 2009500706 A JP2009500706 A JP 2009500706A JP 2009500706 A JP2009500706 A JP 2009500706A JP 5158814 B2 JP5158814 B2 JP 5158814B2
Authority
JP
Japan
Prior art keywords
channel
parameter
signal
channels
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2009500706A
Other languages
English (en)
Other versions
JP2009530672A (ja
Inventor
ラルス ヴィレモース
クリストファー クジェルリング
ジェローン ブレーバールト
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of JP2009530672A publication Critical patent/JP2009530672A/ja
Application granted granted Critical
Publication of JP5158814B2 publication Critical patent/JP5158814B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/006Systems employing more than two channels, e.g. quadraphonic in which a plurality of audio signals are transformed in a combination of audio signals and modulated signals, e.g. CD-4 systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Description

本発明は、オーディオ信号の復号化に関し、特に、オリジナル・マルチチャネル信号のパラメトリック・マルチチャネル・ダウンミックスから、このオリジナル・マルチチャネル信号の数よりも少ない数のチャネルへの復号化に関する。
オーディオ符号化の近年の発達により、ステレオ(又はモノラル)信号と、それに対応する制御データとに基づくオーディオ信号を、マルチチャネル表示へと再生させることが可能となった。これらの方法は、ドルビープロロジック等のような、行列に基づく旧式の方法とは基本的に相違する。なぜなら、送信されたモノラル又はステレオチャネルに基づくサラウンドチャネルの再生を制御するための、追加的な制御データが送信されるからである。この再生は、アップミックスとも呼ぶ。
このようなパラメトリック・マルチチャネル・オーディオデコーダは、例えばMPEGサラウンドであり、送信されたM個のチャネル及び追加的な制御データに基づいて、N個(N>M)のチャネルを再生する。この追加的な制御データは、N個の全てのチャネルを送信する場合に比べて非常に低いデータレートを有するため、符号化効率を著しく向上させ、同時に、M個のチャネルを有する装置とN個のチャネルを有する装置との両方に対して互換性を確立できる。
これらのパラメトリック・サラウンド符号化の方法は、通常、IID(チャネル間強度差)及びICC(チャネル間コヒーレンス)に基づくサラウンド信号のパラメータ化を備える。これらのパラメータは、アップミックスの過程におけるチャネルペア間のパワー比率及び相関関係を示す。従来技術においても使用されたさらなるパラメータは、予測パラメータであり、アップミックスの過程において中間チャネルあるいは出力チャネルを予測するために使用される。
このようなマルチチャネル符号化の2つの著名な例として、BCC符号化(バイノーラル・キュー・コーディング)とMPEGサラウンドとが挙げられる。BCC符号化においては、幾つかのオーディオ入力チャネルが、DFT(離散フーリエ変換)に基づく変換を使用して、オーバーラップするウインドウを備えた空間表示へと変換される。その結果として生成された一律のスペクトルは、その後、オーバーラップのない部分へと分割される。各部分は、同等矩形帯域(ERB)に比例する帯域幅を備える。その後、ICLD (チャネル間レベル差) 及びICTD(チャネル間時間差)と呼ばれる空間パラメータが各部分について推定される。ICLD は2つのチャネル間のレベル差を示し、ICTDは異なるチャネルの2つの信号間の時間差(位相シフト)を示す。このレベル差及び時間差は、ある共通の参照チャネルに対して各チャネル毎に与えられる。これらのパラメータが導かれた後、これらのパラメータは量子化され符号化されて送信される。
BCC符号化においては、単一の参照チャネルに対する個々のパラメータが推定される。一方、他のパラメトリック・サラウンド符号化システム、例えばMPEGサラウンドにおいては、ツリー構造のパラメータ化が使用される。即ち、各パラメータは単一の共通参照チャネルに対して推定されるのではなく、異なる参照チャネルであってオリジナル・マルチチャネル信号の組合せであってもよい参照チャネルに対して推定されることを意味する。例えば、5.1チャネル信号の場合、前チャネルの組合せの間で推定されても良いし、後チャネルの組合せの間で推定されても良い。
パラメトリック符号化のスキームにとっても、既に確立されたオーディオ標準に対する後方の互換性を備えることは非常に望ましいことである。例えば、モノラルダウンミックス信号の場合、高い忠実性を備えながらステレオ再生信号を創造する可能性があれば望ましい。つまりこの場合は、追加的に送信されたパラメータを最適な方法で使用して、モノラル音声ダウンミックス信号がステレオ信号へとアップミックスされることを意味する。
マルチチャネル符号化においてよくある問題の一つは、アップミックスにおけるエネルギー保存である。なぜなら、音源の空間位置を人間が知覚するときは、信号音のラウドネス(大きさ)、すなわちその信号内に含まれたエネルギーによって支配されるからである。ゆえに、信号を再生する際には細心の注意を払い、各再生チャネルに対して正確なラウドネス与える必要があり、再生された信号の知覚的品質を劣化させるようなアーチファクトの導入を防止すべきである。ダウンミックスの間に信号の振幅が一般的に合算されることから、相関パラメータあるいはコヒーレンスパラメータによって示される干渉の可能性が生じる。
減数されたチャネル(マルチチャネル信号の原チャネル数よりも少ない数のチャネル)の復号の場合には、BCCのようなスキームが処理上簡素である。なぜなら、全てのパラメータが同じ単一の参照チャネルを参照として送信されるからである。よって、この参照チャネルの情報を備えていれば、アップミックスに必要な関連するレベル情報(絶対エネルギー量)は、全てのチャネルについて容易に導出することができる。ゆえに、まずマルチチャネル信号全体の再生を必要とせずに、減数されたチャネルを再生することができる。またこのように、BCCの場合には、変数の積ではなく単一の変数を使用するので、マルチチャネル信号のエネルギーのためのエネルギー計算がより簡素となっている。しかし、これは単に第一の段階である。減数されたチャネルのエネルギーや相関関係を、オリジナル・マルチチャネル信号の部分的ダウンミックスにできるだけ近似するように導出する段階になれば、MPEGサラウンドとBCCとにおける複雑さのレベルは同等である。
反対に、MPEGサラウンドのようなツリー構造では、各々のチャネルのための関連情報は、単一のパラメータの中には含まれていない。ゆえに、従来技術においては、減数されたチャネルの再生には、エネルギー保存の必要条件を満たすために、マルチチャネル信号を再生した後で、減数されたチャネルへのダウンミックスが必要となる。そのため、計算が非常に複雑になるという明らかな欠点が発生する。
本発明の目的は、パラメトリック・マルチチャネル信号から、減数されたチャネルをより効率的に取得するための概念を提供することである。
本発明の第1の実施態様によれば、この目的は、ダウンミックス信号をマルチチャネル信号の中間チャネル表示へとアップミックスするためのアップミックス・パラメータを導出するパラメータ計算機であって、前記中間チャネル表示は前記ダウンミックス信号よりも多くかつ前記マルチチャネル信号よりも少ないチャネルを有し、前記ダウンミックス信号は前記マルチチャネル信号の空間特性を示すマルチチャネル・パラメータと関連付けられ、前記マルチチャネル信号は前記中間チャネル表示には含まれないチャネルを有し、前記マルチチャネル・パラメータは前記中間チャネル表示には含まれない前記チャネルに関する情報を有するものにおいて、前記中間チャネル表示には含まれない前記チャネルに関する情報を有する前記パラメータを使用して、前記マルチチャネル・パラメータから前記アップミックス・パラメータを導出するためのパラメータ再計算器を備えるパラメータ計算機によって達成される。
本発明の第2の実施態様によれば、この目的は、パラメータ再生機を有するチャネル再生機によって達成され、このチャネル再生機は、パラメータ計算機と、アップミックス・パラメータ及びダウンミックス信号を使用して中間チャネル表示を導出するためのアップミクサとを含む。上記パラメータ計算機は、ダウンミックス信号をマルチチャネル信号の中間チャネル表示へとアップミックスするためのアップミックス・パラメータを導出するパラメータ計算機であって、中間チャネル表示はダウンミックス信号よりも多くかつマルチチャネル信号よりも少ないチャネルを有し、ダウンミックス信号はマルチチャネル信号の空間特性を示すマルチチャネル・パラメータと関連付けられ、マルチチャネル信号は中間チャネル表示には含まれないチャネルを有し、マルチチャネル・パラメータは中間チャネル表示には含まれないチャネルに関する情報を有し、中間チャネル表示には含まれないチャネルに関する情報を有するパラメータを使用して、マルチチャネル・パラメータからアップミックス・パラメータを導出するためのパラメータ再計算器を備える。
本発明の第3の実施態様によれば、この目的は、ダウンミックス信号をマルチチャネル信号の中間チャネル表示へとアップミックスするためのアップミックス・パラメータを生成する方法であって、中間チャネル表示はダウンミックス信号よりも多くかつマルチチャネル信号よりも少ないチャネルを有し、ダウンミックス信号はマルチチャネル信号の空間特性を示すマルチチャネル・パラメータと関連付けられ、マルチチャネル信号は中間チャネル表示には含まれないチャネルを有し、マルチチャネル・パラメータは中間チャネル表示には含まれないチャネルに関する情報を有し、中間チャネル表示には含まれないチャネルに関する情報を有するパラメータを使用して、マルチチャネル・パラメータからアップミックス・パラメータを導出する工程を備える方法により達成される。
本発明の第4の実施態様によれば、この目的は、ダウンミックス信号をマルチチャネル信号の中間チャネル表示へとアップミックスするためのアップミックス・パラメータを導出するパラメータ計算機を備えたオーディオ受信機又はオーディオ再生機であって、中間チャネル表示はダウンミックス信号よりも多くかつマルチチャネル信号よりも少ないチャネルを有し、ダウンミックス信号はマルチチャネル信号の空間特性を示すマルチチャネル・パラメータと関連付けられ、マルチチャネル信号は中間チャネル表示には含まれないチャネルを有し、マルチチャネル・パラメータは中間チャネル表示には含まれないチャネルに関する情報を有するものであり、パラメータ計算機は、中間チャネル表示には含まれないチャネルに関する情報を有するパラメータを使用して、マルチチャネル・パラメータからアップミックス・パラメータを導出するパラメータ再計算器を備えているオーディオ受信機又はオーディオ再生機により達成される。
本発明の第5の実施態様によれば、この目的は、ダウンミックス信号をマルチチャネル信号の中間チャネル表示へとアップミックスするためのアップミックス・パラメータを生成する方法を備えた受信又はオーディオ再生の方法であって、中間チャネル表示はダウンミックス信号よりも多くかつマルチチャネル信号よりも少ないチャネルを有し、ダウンミックス信号はマルチチャネル信号の空間特性を示すマルチチャネル・パラメータと関連付けられ、マルチチャネル信号は中間チャネル表示には含まれないチャネルを有し、マルチチャネル・パラメータは中間チャネル表示には含まれないチャネルに関する情報を有する方法であり、中間チャネル表示には含まれないチャネルに関する情報を有するパラメータを使用して、マルチチャネル・パラメータからアップミックス・パラメータを導出する工程を備える方法により達成される。
本発明は次の知見を基礎とする。即ち、送信されたダウンミックス信号を中間チャネル表示へとアップミックスするためのアップミックス・パラメータであって、マルチチャネル再生と同様のアップミキシング・アルゴリズムを使用するアップミックスが可能となるようなアップミックス・パラメータを導出することにより、効率よくかつ高い忠実度を持って、マルチチャネル信号の中間チャネル表示を再生できる、という知見である。パラメータ再計算器を使用し、中間チャネル表示には含まれないチャネルの情報を有するパラメータをも考慮にいれながら、アップミックス・パラメータを導出すれば、これを達成することができる。
本発明の一実施例によれば、デコーダは、5チャネルのマルチチャネル信号のパラメトリック・ダウンミックスからステレオ出力信号を再生することができ、このパラメトリック・ダウンミックスは、モノラル音声ダウンミックス信号と、それに関連するマルチチャネル・パラメータとを含む。本発明によれば、ステレオ信号のアップミックスのためのアップミックス・パラメータを導出するために空間パラメータが結合されるが、この結合の際には、左前チャネル又は右前チャネルには関連していないマルチチャネル・パラメータをも考慮に入れる。これにより、アップミックスされるステレオチャネルのための絶対パワーが導出でき、かつ左右のチャネル間のコヒーレンス量も導出でき、高い忠実性を持って、マルチチャネル信号をステレオ再生することができる。さらに、ICCパラメータとCLDパラメータとが導出され、既存のアルゴリズム及び構成を使用するアップミキシングを可能にする。再生されたステレオチャネルに関連しないチャネルのパラメータを使用することで、信号内部におけるエネルギー保存が高い精度で可能となる。ラウドネスが非制御状態で変化すれば再生信号の品質劣化を招くことから、この高い精度のエネルギー保存は非常に重要である。
一般的には、本発明の概念を適用すれば、従来技術の方法と同様に、マルチチャネル信号の中間的フル再生を必要とせずに、マルチチャネル信号のモノラルダウンミックスからステレオアップミックスを再生することができる。これにより、明らかにデコーダ側での計算上の複雑さをかなり低減できる。アップミックスに含まれないチャネル(即ち左前及び右前のチャネル)に関連するマルチチャネル・パラメータをも使用することで、いかなる追加的なアーチファクトあるいはラウドネスの変化も導入されることなく、信号のエネルギーが完全に保存された再生が可能となる。より具体的には、左と右との再生チャネル間のエネルギー比率は、多数の有効マルチチャネル・パラメータから計算され、左前と右前のチャネルに関連しないマルチチャネル・パラメータをも考慮に入れて計算される。明らかに、左と右との再生(アップミックスされた)チャネル間のラウドネスの比率は、再生ステレオ信号のリスニングの品質にとっては支配的である。本発明の概念を使用しない場合には、正確なエネルギー比率を備えたチャネル再生は、上述したツリー構造では不可能である。
よって、本発明の概念を実現すれば、ステレオ信号の厳密な再生のために導出された訳ではないマルチチャネル・パラメータに基づいて、マルチチャネル信号のダウンミックスの高品質なステレオ再生が可能となる。
留意すべきは、再生チャネルの数が2つ以外の場合、例えば再生環境としてはよくあるように、中央チャネルもまた高い忠実性を持って再生されなければならない場合にも、本発明の概念が使用できるという点である。
以下に、従来技術のマルチチャネル符号化スキーム(特にツリー構造)についてさらに詳細に検討し、本発明の概念の利点を明らかにする。
以下に述べる本発明の概念は、主にMPEG符号化に関して述べるが、マルチチャネル信号のパラメトリック符号化に基づいた他のスキームに関しても、同様に適応可能である。つまり、以下に説明する実施例は、ツリー構造のマルチチャネル・システムのための減数されたチャネル復号に関する本発明の原理を単に示すものであり、本願に記載の構成及び詳細に対する修正及び変更が可能であることは、当業者にとって明らかである。よって、本発明の範囲は請求項でのみ限定されるものであり、以下に記載する実施例の説明における特定の詳細な説明によって限定されるものではない。
上述したように、いくつかのパラメトリック・サラウンド符号化システム、例えばMPEGサラウンドにおいては、ツリー構造のパラメータ化が使用されている。このようなパラメータ化は図1及び図2の中で示される。
図1には、標準的な5.1チャネルのオーディオ信号をパラメータ化する2つの方法を示し、左前チャネル2と中央チャネル3と右前チャネル4と左サラウンドチャネル5と右サラウンドチャネル6とを備えている。低周波強化チャネル7(LFE)を選択的にさらに備えても良い。
一般的に、個々のチャネル又はチャネルのペアは、マルチチャネル・パラメータ、例えば相関パラメータであるICCやレベルパラメータであるCLDにより、相互関係が特徴づけられている。パラメータ化の可能例を以下の章で簡単に説明し、その結果としてもたらされるツリー構造の復号化スキームを図2で説明する。
図1の上側に示される例(5−1−51パラメータ化)においては、マルチチャネル信号は、左サラウンドチャネル5と右サラウンドチャネル6との間の関係と、左前チャネル2と右前チャネル4との間の関係と、中央チャネル3と低周波強化チャネル7との間の関係と、を表現するCLD及びICCパラメータにより特徴づけられている。しかし、信号全体が単一のモノラルチャネルへとダウンミックスされる場合には、チャネルのセットをくまなく表現するために、追加的なパラメータが必要となる。そこで、低周波強化スピーカ7と中央スピーカ3との組合せを左前チャネル2と右前チャネル4との組合せへと関連させる、追加的なパラメータ(CLD1とICC1)が使用される。さらに、サラウンドチャネル5及び6の組合せとマルチチャネル信号の他のチャネルとの関係を示す、一組の追加的なパラメータ(CLD0とICC0)が必要となる。
下側に示される例(5−1−52パラメータ化)においては、左前チャネル2と左サラウンドチャネル5との関係、右前チャネル4と右サラウンドチャネル6との関係、中央チャネル3と低周波強化チャネル7との関係を示すパラメータが使用される。また、左のチャネル2及び5の組合せと右のチャネル4及び6の組合せとの間の関係を示す、追加的なパラメータ(CLD1とICC1)が使用される。さらにまた、中央チャネル3及び低周波強化チャネル7の組合せと他のチャネルの組合せとの間の関係を示す、追加的なパラメータ(CLD0とICC0)が使用される。
図2は、図1に記載の色々なパラメータ化の基礎となる符号化の概念を示す。デコーダ側では、OTT(1から2への)と呼ばれるツリー状構造のモジュールが使用される。全てのOTTモジュールが一つのモノラル信号を2つの出力信号へとアップミックスする。復号化においては、OTTボックスのパラメータは符号化における場合とは逆の順序で適用される。ゆえに、5−1−51のツリー構造では、OTTモジュール20が、ダウンミックス信号22(m)を受け取り、パラメータCLD0及びICC0を使用して2つのチャネルを導出するが、その一つは左サラウンドチャネル5及び右サラウンドチャネル6の組合せであり、他の一つはマルチチャネルの残りのチャネルの組合せである。
次に、OTTモジュール24が、CLD1とICC1とを使用して、中央チャネル3及び低周波強化チャネル7の組合せである第1のチャネルと、左前チャネル2及び右前チャネル4の組合せである第2のチャネルとを導出する。同様に、OTTモジュール26が、CLD2とICC2とを使用して、左サラウンドチャネル5及び右サラウンドチャネル6を導出する。また、OTTモジュール27が、CLD4を使用して、中央チャネル3及び低周波強化チャネル7を導出し、OTTモジュール28が、CLD3とICC3とを使用して、左前チャネル2及び右前チャネル4を導出する。最終的に、チャネルの全セットの再構成30が単一のモノラル音声ダウンミックスチャネル22から導出される。5−1−52のツリー構造では、OTTモジュールの基本的なレイアウトは5−1−51のツリー構造と同様である。しかし、個々のOTTモジュールは、5−1−51の場合とは異なるチャネルの組合せを導出し、このチャネルの組合せは、図1の5−1−52の場合で説明されたパラメータ化に対応する。
図1と図2から、色々なパラメータ化のツリー構造は、使用されたパラメータ化についての視覚化にすぎないことが明らかである。さらに重要な点は、個々のパラメータは異なるチャネル間の関係を示すパラメータであるという点であり、この点が、近似的なパラメータが単一の参照チャネルに関連して導出される、例えばBCCコーディングのスキームとは対称的である。
ゆえに、図示したパラメータ化においては、個々のチャネルを視覚化されたOTTボックスに関連したパラメータを使用して単純に導出することは不可能であり、残りのパラメータのうち、いくつか又は全てを追加的に考慮する必要がある。
パラメータ化のツリー構造は、図3に示された実際の信号の流れあるいは処理の単なる視覚化であり、図3はまた、送信された少数のチャネルからのアップミックスが、行列を乗算することで達成されることを示す。図3は、受信されたダウンミックスチャネル40の復号化を表す。ダウンミックスチャネル40はアップミックスブロック42へと入力されて再生マルチチャネル信号44が導出されるが、この信号44のチャネルの構成は、使用されたパラメータ化によって異なる。しかし、再生ブロック42で使用される行列の行列要素はツリー構造から直接的に導出される。再生ブロック42を詳細に見れば、プレデコリレータ行列46を備えており、この行列46は送信されたチャネル40から追加的なデコリレート信号を導出する。これらデコリレート信号は、次にミックス行列48へと入力され、個々の入力チャネルをミキシングすることでマルチチャネル信号44が導出される。
図4に示すように、再生チャネルの数を減少させるための単純な手法は、ツリーから、単に1つ又は2つのボックスを「剪定」(削減)するようなものであろう。図4は、可能性のあるツリーの剪定を破線によって示しているが、この剪定は、再生の際にツリーの右手側にあるOTTモジュールを削減するものであり、その結果、出力チャネルの数を減少させる。しかし、低ビットレートの符号化を最高の品質で提供することから導入されている、図1及び図2に表されている先行技術のパラメータ化を使用する一方で、オリジナル・マルチチャネル信号の左側のダウンミックスと右側のダウンミックスとを適切に表現するステレオ出力を得るために、単純な剪定をすることは不可能である。図5は、上述の信号からステレオ出力を生成する先行技術の手法を示すものであり、まず初めにマルチチャネル信号を完全に再生し、その後、その再生信号を、追加的なダウンミクサ60を使って信号をステレオ表示にダウンミックスするという自明の方法を示している。この手法には明らかに、高度な複雑性や粗悪な音質などといったいくつかの不利な点がある。
上述のような、モノラルダウンミックスと、本来ステレオ出力への「剪定」を支持するものではないパラメータ化におけるパラメトリック・サラウンドパラメータとから、ステレオ出力を取得する際に起こる問題に対する解決法を、以下に、一般的な場合として示す。その後、2つの具体的な実施例により、上述のパラメータ化における本発明の概念の活用法を示す。つまり、モノラルダウンミックスと、ステレオ出力への「剪定」を支持するものではないパラメータ化におけるパラメトリック・サラウンドパラメータとから、ステレオ出力を取得するという問題に対する解決法を提供する。
パラメータの再計算の一般的な手法を以下に概説する。特にこの手法は、任意のN個のマルチチャネルオーディオチャネルから、ステレオ出力パラメータを計算する場合に当てはまる。更にこの手法では、オーディオ信号は、実数値化又は複素変調されてもよいフィルタバンクを使用して導出されるサブバンド表示によって表現できると仮定している。
全ての信号は、空間パラメータによって定義される時間周波数タイルに相当するサブバンドサンプルの無限ベクトルであると仮定し、かつ、再生されるマルチチャネルオーディオ信号のサブバンドサンプルyは、オーディオチャネルのサブバンドサンプルm1,m2,…,mMと、行列アップミックス操作に従ってデコリレートされたオーディオチャネルのサブバンドサンプルd1,d2,…,dDとによって形成されると仮定すると、
y=Rx
であり、このとき、
Figure 0005158814
である。
全ての信号は行ベクトルとみなされる。行列RはN×(M+D)のサイズを持ち、図3に示す行列M1とM2との組合せの効果を表現し、アップミックスブロック42に示される。ダウンミックスされた信号の適切なパワーパラメータ及び相関パラメータを、オリジナル・マルチチャネルオーディオ信号のサブバンドサンプルのND個のチャネルに対して得るための一般的な方法は、ND×Nのダウンミックス行列Dによって定義される仮想ダウンミックスの分散行列を形成することであり、
D=Dy
である。
この分散行列は、複素共役との乗算により計算され、
Figure 0005158814
へと転換され、この式中の内部分散行列xx* は、デコリレータの特性と送信されたパラメータとから知られることが多い。
この式が真実となる重要で特別な場合とは、M=1の場合であり、このときこの内部分散行列は、実際にサイズM+Dの単位行列に等しくなることが多い。その結果、ND=2であるステレオ出力に対し、CLD及びICCパラメータは以下の式から導かれ、
Figure 0005158814
すなわち
Figure 0005158814
となる。
ここでも以下の記載においても、次の式が適用されることに留意すべきである。複素ベクトルx,yに関し、複素内積と自乗ノルム(squared norm)は
Figure 0005158814
で定義され、この式中の星印は複素共役を示す。
次に、本発明の2つの実施例を、図1と図2に示した異なるパラメータ化(5−1−51と5−1−52)について説明する。本発明の実施例においては、モノラルダウンミックスと対応するMPEGサラウンドパラメータ(マルチチャネル・パラメータ)とを基にしてステレオ信号を出力するためには、CLD及びICCパラメータの単一のセットに対し、モノラル信号からステレオ信号への直接的なアップミックスに使用可能なアップミックス・パラメータが再計算される必要がある。
さらに、個々のオーディオチャネルの処理は、フレーム状に即ち離散時間部分で実行されると仮定される。ゆえに、1つのチャネルの中に含まれるパワー又はエネルギーについて説明するとき、「パワー」又は「エネルギー」とは、一つの特定のチャネルの一つのフレーム内に含まれるエネルギー又はパワーとして理解されるべきである。
一般的に、例えばCLDやICC等のパラメータは単一のフレームに対しても有効である。k個のサンプル値aiを持つフレームがあるとすると、このフレーム内のエネルギーEは、例えばフレーム内のサブバンドサンプル値の自乗の合計となり、次式で表される。
Figure 0005158814
送信され、かつダウンミックス信号mをマルチチャネル信号の中間チャネル表示(ステレオ)へとアップミックスするためのアップミックス・パラメータの計算に使用されるチャネルレベル差(CLD)は、次式で定義され、
Figure 0005158814
0及びR0は、パラメータCLDが導出されるべきフレーム内の当該の信号のパワーを示す。
ゆえに、5−1−51の場合には、4つのCLDパラメータCLDX,X=0,1,2,3が、モノラルダウンミックスチャネルmのパワーにより正規化されたチャネルパワーを取得するために使用可能となる。
Figure 0005158814
チャネル利得は次式により定義される。
Figure 0005158814
最終的な目的は、次式
Figure 0005158814
により形成されたステレオチャネル(中間チャネル表示)の正規化されたパワー及び相関関係の適切な推定値が見つかるように、最適なステレオチャネルl0及びr0を導出することであり、このとき中央ダウンミックスの重みは
Figure 0005158814
である。この仮定によりパワーを計算すると、次の結果が得られる。
Figure 0005158814
パラメータ
Figure 0005158814
により与えられる相関情報を組み入れようと試みるよりも、むしろ、組合せられた左チャネルlと組合せられた右チャネルrとの両方が中央チャネルcとは相関関係がないと仮定することが、最も有利であることがわかる。よって、ステレオ出力チャネルの正規化されたパワーは次式により推定される。
Figure 0005158814
上記出力チャネルのパワーを導出した後、好適なCLDパラメータは、上述したCLDパラメータの定義を用いて容易に計算可能となる。
本発明の概念に従えば、ステレオアップミックスを可能にするためにICCパラメータが導出される。上記2つの出力チャネルの相関関係は次式により示される。
Figure 0005158814
ここで、仮定を簡素にするための有利なセットとして、組合せられた左チャネルlと組合せられた右チャネルrとの両方が中央チャネルcとは相関関係がないと仮定し、かつ、サラウンドチャネルが前チャネルとは相関関係がないと仮定する。これらの仮定は次式により表される。
Figure 0005158814
その結果、pの推定値は、正規化された左/右の相関関係を示す2つのICCパラメータ ICCX,X=2,3に依存し、
Figure 0005158814
この式は、
Figure 0005158814
と表現できる。
ゆえに、最終的な相関値はマルチチャネルのパラメータ化の多数のパラメータに依存することになり、高度な忠実性を持つ信号の再生を可能にする。ICCパラメータは最終的に次式を用いて導出される。
Figure 0005158814
本発明の概念に従えば、再生チャネル間のパワー配分は、高い正確性を持って再現される。しかし、全体的なエネルギー保存を確実にするためには、一体的なパワースケーリングを両方のチャネルに適用することが追加的に必要であるかもしれない。再現された信号の空間的な知覚にとっては、チャネル間の相対的なエネルギー配分が極めて重大であることから、一体的なスケーリングは再現信号の知覚的品質を劣化させるおそれがある。ここで強調すべきは、一体的なスケーリングは、パラメータによって定義された時間周波数タイルの内部でのみ大域といえる点である。つまり、誤ったスケーリングはパラメータタイルのスケールにおいて局所的に信号への影響を与えることになる。換言すれば、周波数及び時間に依存する利得の両方を適用すれば、スペクトルのカラーライゼーションや時間変調のアーチファクトにつながる。ステレオアップミックスのプロセスが、モノラルダウンミックスチャネルmのパワーを保存することを確実にするためには、一体的なスケーリングのための利得調整ファクタが必要となる。
このファクタは次式
Figure 0005158814
で定義され、5−1−51構成においてはg=1となる。なぜなら、
Figure 0005158814
となるからである。
本発明のさらなる実施例として、本発明の概念を5−1−52のツリー構成に適用した場合について以下に説明する。高い忠実性を持つステレオ信号の生成のためには、ツリーの頂点の枝に相当する2つの第1のCLD及びICCパラメータのセットが重要となる。
まず、組合せられた左及び右のチャネルと、中央チャネルとの正規化されたチャネルパワーを取得するために、X=0,1とする2つのCLDパラメータCLDX が使用され、
Figure 0005158814
このとき、チャネル利得は次式により定義される。
Figure 0005158814
最終目的は、次式のダウンミックスチャネルのパワーと相関関係とを導出することであり、
Figure 0005158814
このとき、中央ダウンミックスの重みは次式で表され、
Figure 0005158814
この仮定からパワーを計算すると、次の結果が得られる。
Figure 0005158814
ここで有利な仮定とは、チャネル l及びcの間のICCとチャネルr及びcの間のICCとの両方が、チャネルl+r及びcの間の与えられたICC0に等しいという仮定である。この仮定により、次の推定が導かれ、
Figure 0005158814
正規化されたパワーの推定は次式で表される。
Figure 0005158814
先の実施例と同様に、パワー値をL0及びR0として、好適なCLDパラメータは、次式で導くことができる。
Figure 0005158814
相関パラメータ及び最終的にはICCパラメータの導出は、相関値の一般的な定義から開始する。
Figure 0005158814
全ての必要な情報は5−1−51のツリー構成のパラメータから導かれる。なぜなら、
Figure 0005158814
となるからである。
最終的な結果は、次式で示される。
Figure 0005158814
必要となる利得調整ファクタgは次式で定義される。
Figure 0005158814
ここで留意すべきは、生成されたCLD及びICCパラメータは、さらに量子化されてもよく、その結果、アップミックス行列の生成のために、デコーダ内で複雑な計算に代えてルックアップテーブルを使用できるようにしてもよい。これにより、アップミックスのプロセスの効率をさらに増大させることができる。
一般的に、アップミックスは、既存のOTTモジュールを使用することができる。これは、本発明の概念が、既存の復号化シナリオにおいて容易に実現可能であるという意味で有利である。
一般的に、アップミックス行列は次式により表現される。
Figure 0005158814
このとき、
Figure 0005158814
であり、かつ、
Figure 0005158814
である。
よって、本発明に従ってパラメータCLDとICCとを導出した後に、送信されたダウンミックスのステレオアップミックスは、標準的なアップミックスモジュールを使用しながら、高度な忠実性を持って実現することができる。
本発明の更なる実施例においては、本発明に係るチャネル再生機は、アップミックス・パラメータを導出するためのパラメータ計算機と、このアップミックス・パラメータ及び送信されたダウンミックス信号を使用して中間チャネル表示を生成するアップミクサと、を備える。
図6は本発明の概念を示し、本発明に係るパラメータ計算機502が多数のICCパラメータ504と多数のCLDパラメータ506とを受け取る。本発明の1つの実施例に従えば、パラメータ計算機502は、ステレオ信号の再生のために、このステレオアップミックスのチャネルには含まれないか関連していないチャネルの情報を有するマルチチャネル・パラメータ(ICC及びCLD)をも使用して、単一のCLDパラメータ508と単一のICCパラメータ510とを導出する。
本発明の概念は、2つ以上のチャネルを有するアップミックスを用いるシナリオにも容易に適用できることに留意すべきである。その意味では、本発明のアップミックスを一般的に定義すれば、マルチチャネル信号の中間チャネル表示であって、このマルチチャネル信号の中間チャネル表示は、ダウンミックス信号よりも多数のチャネルを有し、かつマルチチャネル信号よりも少数のチャネルを有すると定義される。よくある構成例としては、追加的な中央チャネルが再生される場合がある。
図7は本発明の概念の適用例を示し、本発明に係るパラメータ計算機502と、1から2へのOTTボックス520とが示される。OTTボックス520は、送信されたモノラル信号522を入力として受け取る。本発明に係るパラメータ計算機502は、複数のICCパラメータ504と複数のCLDパラメータ506とを受け取り、単一のCLDパラメータ508と単一のICCパラメータ510とを生成する。
上記単一のCLDパラメータ508と単一のICCパラメータ510とは、OTTモジュール520へと入力され、モノラル音声のダウンミックス信号522のアップミックスを支配する。その結果、OTTモジュール520の出力では、マルチチャネル信号の中間チャネル表示となるステレオ信号524が出力される。
図8は本発明に係る受信機又はオーディオ再生機600を示し、本発明に係るオーディオデコーダ601と、ビットストリーム入力602と、オーディオ出力604とを備える。
ビットストリームは本発明に係る受信機/オーディオ再生機600の入力602から入力される。デコーダ601はこのビットストリームを復号化し、復号化された信号は、受信機/オーディオ再生機600の出力604において出力又は再生される。
本発明の概念はこれまで主にMPEGサラウンド符号化について説明してきたが、しかし、特定のパラメトリック符号化のシナリオへの適用に限定されるものではないことは勿論である。本発明の概念は高い柔軟性をもつことから、他の符号化スキーム、例えば7.1又は7.2チャネル構成あるいはBCCスキームに対しても容易に適用可能である。
MPEG符号化に関する本発明の実施例では、一般的なCLD及びICCパラメータの生成のためにいくつかの単純化の仮定を導入したが、この仮定は必須ではない。これらの単純化を導入しないことも勿論可能である。
本発明の方法の実施条件にもよるが、本発明の方法は、ハードウエア又はソフトウエアのいずれにおいても実現可能である。デジタル記憶媒体、特に、電子的に読取可能な制御信号が記憶されているディスク、DVD、CDなどを使用し、プログラム可能なコンピュータシステムと協働させて、本発明の方法を実現させることができる。ゆえに、一般的に言えば、本発明はプログラムコードが機械的に読取可能なキャリアに記憶されたコンピュータプログラム製品であり、このコンピュータプログラム製品がコンピュータで作動するときに、このプログラムコードは本発明の方法を実行することができる。換言すれば、本発明の方法は、このコンピュータプログラムがコンピュータで作動するときに、本発明の方法の少なくとも1つを実行するプログラムコードを備えたコンピュータプログラムである。
上述の説明は特定の実施例を参照しながら具体的に述べたものであるが、本発明の概念や範囲から外れることなく態様や詳細において様々な修正が可能であることは、当業者には明らかである。また、上述した説明よりもより広い範囲の概念であって、請求項から理解される範囲から外れることなく、本発明の概念に様々な修正を加えて、様々な実施例に適用可能となることも理解されるであろう。
ツリー構造のパラメータ化の例を示す図である。 ツリー構造の復号化スキームの例を示す図である。 従来技術のマルチチャネルエンコーダの例を示す図である。 従来技術のデコーダの例を示す図である。 ダウンミックス・マルチチャネル信号のステレオ再生のための従来技術の例を示す図である。 本発明に係るパラメータ計算機の例を示す図である。 本発明に係るチャネル再生機の例を示す図である。 本発明に係る受信機又はオーディオ再生機の例を示す図である。
符号の説明
2 左前チャネル
3 中央チャネル
4 右前チャネル
5 左サラウンドチャネル
6 右サラウンドチャネル
7 低周波強化チャネル
502 パラメータ再計算器(パラメータ計算機)
504,510 ICCパラメータ
506,508 CLDパラメータ
520 OTTモジュール
522 ダウンミックス信号(モノラル信号)
524 中間チャネル表示(ステレオ信号)

Claims (10)

  1. マルチチャネル信号のモノラルダウンミックス信号をステレオ表示へとアップミックスするためのチャネル再生機であって、前記ステレオ表示は前記モノラルダウンミックス信号よりも多くかつ前記マルチチャネル信号よりも少ないチャネルを有し、前記ステレオ表示は前記マルチチャネル信号の左側ダウンミックス及び右側ダウンミックスを表示するものであり、前記モノラルダウンミックス信号は前記マルチチャネル信号の空間特性を示すマルチチャネル・パラメータと関連付けられ、前記マルチチャネル信号は前記ステレオ表示には含まれないチャネルを有し、前記マルチチャネル・パラメータは前記ステレオ表示には含まれない前記チャネルに関する情報を有するものにおいて、
    前記マルチチャネル・パラメータからアップミックス・パラメータを導出するパラメータ計算機であって、前記マルチチャネル・パラメータは、前記マルチチャネル信号の他のチャネル又はチャネルの他の組合せに対する前記マルチチャネル信号の1つのチャネル又は1つのチャネル組合せの、相関関係に関する情報を持つ複数の相関パラメータ(ICC)とエネルギー情報を持つ複数のレベルパラメータ(CLD)とを含み、前記アップミックス・パラメータは単一のCLDパラメータと単一のICCパラメータとを含み、前記CLDパラメータは前記ステレオ表示の左チャネルと右チャネルとの間のエネルギー情報を有するレベルパラメータであり、前記ICCパラメータは前記ステレオ表示の左チャネルと右チャネルとの間の相関関係に関する情報を有する相関パラメータである、パラメータ計算機と、
    前記アップミックス・パラメータ及び前記モノラルダウンミックス信号を使用して前記ステレオ表示を導出するアップミクサとを含み、
    前記マルチチャネル信号は、左前チャネル(LF)と左サラウンドチャネル(LS)と右前チャネル(RF)と右サラウンドチャネル(RS)と中央チャネル(C)とを有し、
    前記パラメータ計算機は、
    前記左サラウンドチャネル(LS)及び右サラウンドチャネル(RS)の組合せと、前記マルチチャネル信号の残りのチャネルの組合せと、に関するエネルギー情報を有する第1のレベルパラメータ(CLD 0 )と、
    前記左前チャネル(LF)及び右前チャネル(RF)の組合せと、前記中央チャネル(C)と、に関するエネルギー情報を有する第2のレベルパラメータ(CLD 1 )と、
    前記左サラウンドチャネル(LS)と、前記右サラウンドチャネル(RS)と、に関するエネルギー情報を有する第3のレベルパラメータ(CLD 2 )と、
    前記左前チャネル(LF)と、前記右前チャネル(RF)と、に関するエネルギー情報を有する第4のレベルパラメータ(CLD 3 )と、
    前記左サラウンドチャネル(LS)と前記右サラウンドチャネル(RS)との相関関係に関する情報を有する第1の相関パラメータ(ICC 2 )と、
    前記左前チャネル(LF)と前記右前チャネル(RF)との相関関係に関する情報を有する第2の相関パラメータ(ICC 3 )と、
    を使用して、前記CLDパラメータ及び前記ICCパラメータを導出するものであり、
    前記パラメータ計算機は、前記CLDパラメータを次式
    Figure 0005158814
    により導出し、このときL 0 及びR 0 は、次式
    Figure 0005158814
    により導出されたステレオ出力チャネルL及びRの正規化されたパワーであり、前記マルチチャネル信号のパワーは、次式のように第1〜第4のレベルパラメータから導出され、
    Figure 0005158814
    Figure 0005158814
    前記ICCパラメータは、次式
    Figure 0005158814
    により導出され、相関推定値pは次式
    Figure 0005158814
    により定義されることを特徴とする、チャネル再生機。
  2. マルチチャネル信号のモノラルダウンミックス信号をステレオ表示へとアップミックスするためのチャネル再生機であって、前記ステレオ表示は前記モノラルダウンミックス信号よりも多くかつ前記マルチチャネル信号よりも少ないチャネルを有し、前記ステレオ表示は前記マルチチャネル信号の左側ダウンミックス及び右側ダウンミックスを表示するものであり、前記モノラルダウンミックス信号は前記マルチチャネル信号の空間特性を示すマルチチャネル・パラメータと関連付けられ、前記マルチチャネル信号は前記ステレオ表示には含まれないチャネルを有し、前記マルチチャネル・パラメータは前記ステレオ表示には含まれない前記チャネルに関する情報を有するものにおいて、
    前記マルチチャネル・パラメータからアップミックス・パラメータを導出するパラメータ計算機であって、前記マルチチャネル・パラメータは、前記マルチチャネル信号の他のチャネル又はチャネルの他の組合せに対する前記マルチチャネル信号の1つのチャネル又は1つのチャネル組合せの、相関関係に関する情報を持つ複数の相関パラメータ(ICC)とエネルギー情報を持つ複数のレベルパラメータ(CLD)とを含み、前記アップミックス・パラメータは単一のCLDパラメータと単一のICCパラメータとを含み、前記CLDパラメータは前記ステレオ表示の左チャネルと右チャネルとの間のエネルギー情報を有するレベルパラメータであり、前記ICCパラメータは前記ステレオ表示の左チャネルと右チャネルとの間の相関関係に関する情報を有する相関パラメータである、パラメータ計算機と、
    前記アップミックス・パラメータ及び前記モノラルダウンミックス信号を使用して前記ステレオ表示を導出するアップミクサとを含み、
    前記マルチチャネル信号は、左前チャネル(LF)と左サラウンドチャネル(LS)と右前チャネル(RF)と右サラウンドチャネル(RS)と中央チャネル(C)とを有し、
    前記パラメータ計算機は、
    前記中央チャネル(C)と、前記マルチチャネル信号の他のチャネルの組合せと、に関するエネルギー情報を有する第1のレベルパラメータ(CLD 0 )と、
    前記左前チャネル(LF)及び左サラウンドチャネル(LS)の組合せと、前記右前チャネル(RF)及び右サラウンドチャネル(RS)の組合せと、に関するエネルギー情報を有する第2のレベルパラメータ(CLD 1 )と、
    前記中央チャネル(C)と、前記マルチチャネル信号の他のチャネルの組合せと、の相関関係に関する情報を有する第1の相関パラメータ(ICC 0 )と、
    前記左前チャネル(LF)及び左サラウンドチャネル(LS)の組合せと、前記右前チャネル(RF)及び右サラウンドチャネル(RS)の組合せと、の相関関係に関する情報を有する第2の相関パラメータ(ICC 1 )と、
    を使用して、前記CLDパラメータ及び前記ICCパラメータを導出するものであり、
    前記パラメータ計算機は、前記CLDパラメータを次式
    Figure 0005158814
    により導出し、このときL 0 及びR 0 は、次式
    Figure 0005158814
    により導出されたステレオ出力チャネルL及びRの正規化されたパワーであり、前記マルチチャネル信号のパワーは、次式のように第1、第2のレベルパラメータから導出され、
    Figure 0005158814
    Figure 0005158814
    前記ICCパラメータは、次式
    Figure 0005158814
    により導出され、このとき相関推定値pは次式
    Figure 0005158814
    により定義されることを特徴とする、チャネル再生機。
  3. 前記パラメータ計算機は、前記マルチチャネル信号のサブバンド表示を表すマルチチャネル・パラメータを使用することを特徴とする請求項1又は2に記載のチャネル再生機。
  4. 前記パラメータ計算機は、複素数化されたマルチチャネル・パラメータを使用することを特徴とする請求項1又は2に記載のチャネル再生機。
  5. マルチチャネル信号のモノラルダウンミックス信号をステレオ表示へとアップミックスするためのチャネル再生方法であって、前記ステレオ表示は前記モノラルダウンミックス信号よりも多くかつ前記マルチチャネル信号よりも少ないチャネルを有し、前記ステレオ表示は前記マルチチャネル信号の左側ダウンミックス及び右側ダウンミックスを表示するものであり、前記モノラルダウンミックス信号は前記マルチチャネル信号の空間特性を示すマルチチャネル・パラメータと関連付けられ、前記マルチチャネル信号は前記ステレオ表示には含まれないチャネルを有し、前記マルチチャネル・パラメータは前記ステレオ表示には含まれない前記チャネルに関する情報を有するものにおいて、
    前記マルチチャネル・パラメータからアップミックス・パラメータを導出する工程であって、前記マルチチャネル・パラメータは、前記マルチチャネル信号の他のチャネル又はチャネルの他の組合せに対する前記マルチチャネル信号の1つのチャネル又は1つのチャネル組合せの、相関関係に関する情報を持つ複数の相関パラメータ(ICC)とエネルギー情報を持つ複数のレベルパラメータ(CLD)とを含み、前記アップミックス・パラメータは単一のCLDパラメータと単一のICCパラメータとを含み、前記CLDパラメータは前記ステレオ表示の左チャネルと右チャネルとの間のエネルギー情報を有するレベルパラメータであり、前記ICCパラメータは前記ステレオ表示の左チャネルと右チャネルとの間の相関関係に関する情報を有する相関パラメータである、工程と、
    前記アップミックス・パラメータ及び前記モノラルダウンミックス信号を使用して前記ステレオ表示へとアップミックスする工程と、を含み、
    前記マルチチャネル信号は、左前チャネル(LF)と左サラウンドチャネル(LS)と右前チャネル(RF)と右サラウンドチャネル(RS)と中央チャネル(C)とを有し、
    前記導出する工程は、
    前記左サラウンドチャネル(LS)及び右サラウンドチャネル(RS)の組合せと、前記マルチチャネル信号の残りのチャネルの組合せと、に関するエネルギー情報を有する第1のレベルパラメータ(CLD 0 )と、
    前記左前チャネル(LF)及び右前チャネル(RF)の組合せと、前記中央チャネル(C)と、に関するエネルギー情報を有する第2のレベルパラメータ(CLD 1 )と、
    前記左サラウンドチャネル(LS)と、前記右サラウンドチャネル(RS)と、に関するエネルギー情報を有する第3のレベルパラメータ(CLD 2 )と、
    前記左前チャネル(LF)と、前記右前チャネル(RF)と、に関するエネルギー情報を有する第4のレベルパラメータ(CLD 3 )と、
    前記左サラウンドチャネル(LS)と前記右サラウンドチャネル(RS)との相関関係に関する情報を有する第1の相関パラメータ(ICC 2 )と、
    前記左前チャネル(LF)と前記右前チャネル(RF)との相関関係に関する情報を有する第2の相関パラメータ(ICC 3 )と、
    を使用して、前記CLDパラメータ及び前記ICCパラメータを導出するものであり、
    前記CLDパラメータを次式
    Figure 0005158814
    により導出し、このときL 0 及びR 0 は、次式
    Figure 0005158814
    により導出されたステレオ出力チャネルL及びRの正規化されたパワーであり、前記マルチチャネル信号のパワーは、次式のように第1〜第4のレベルパラメータから導出され、
    Figure 0005158814
    Figure 0005158814
    前記ICCパラメータは、次式
    Figure 0005158814
    により導出され、相関推定値pは次式
    Figure 0005158814
    により定義されることを特徴とする、チャネル再生方法。
  6. マルチチャネル信号のモノラルダウンミックス信号をステレオ表示へとアップミックスするためのチャネル再生方法であって、前記ステレオ表示は前記モノラルダウンミックス信号よりも多くかつ前記マルチチャネル信号よりも少ないチャネルを有し、前記ステレオ表示は前記マルチチャネル信号の左側ダウンミックス及び右側ダウンミックスを表示するものであり、前記モノラルダウンミックス信号は前記マルチチャネル信号の空間特性を示すマルチチャネル・パラメータと関連付けられ、前記マルチチャネル信号は前記ステレオ表示には含まれないチャネルを有し、前記マルチチャネル・パラメータは前記ステレオ表示には含まれない前記チャネルに関する情報を有するものにおいて、
    前記マルチチャネル・パラメータからアップミックス・パラメータを導出する工程であって、前記マルチチャネル・パラメータは、前記マルチチャネル信号の他のチャネル又はチャネルの他の組合せに対する前記マルチチャネル信号の1つのチャネル又は1つのチャネル組合せの、相関関係に関する情報を持つ複数の相関パラメータ(ICC)とエネルギー情報を持つ複数のレベルパラメータ(CLD)とを含み、前記アップミックス・パラメータは単一のCLDパラメータと単一のICCパラメータとを含み、前記CLDパラメータは前記ステレオ表示の左チャネルと右チャネルとの間のエネルギー情報を有するレベルパラメータであり、前記ICCパラメータは前記ステレオ表示の左チャネルと右チャネルとの間の相関関係に関する情報を有する相関パラメータである、工程と、
    前記アップミックス・パラメータ及び前記モノラルダウンミックス信号を使用して前記ステレオ表示へとアップミックスする工程と、を含み、
    前記マルチチャネル信号は、左前チャネル(LF)と左サラウンドチャネル(LS)と右前チャネル(RF)と右サラウンドチャネル(RS)と中央チャネル(C)とを有し、
    前記導出する工程は、
    前記中央チャネル(C)と、前記マルチチャネル信号の他のチャネルの組合せと、に関するエネルギー情報を有する第1のレベルパラメータ(CLD 0 )と、
    前記左前チャネル(LF)及び左サラウンドチャネル(LS)の組合せと、前記右前チャネル(RF)及び右サラウンドチャネル(RS)の組合せと、に関するエネルギー情報を有する第2のレベルパラメータ(CLD 1 )と、
    前記中央チャネル(C)と、前記マルチチャネル信号の他のチャネルの組合せと、の相関関係に関する情報を有する第1の相関パラメータ(ICC 0 )と、
    前記左前チャネル(LF)及び左サラウンドチャネル(LS)の組合せと、前記右前チャネル(RF)及び右サラウンドチャネル(RS)の組合せと、の相関関係に関する情報を有する第2の相関パラメータ(ICC 1 )と、
    を使用して、前記CLDパラメータ及び前記ICCパラメータを導出するものであり、
    前記CLDパラメータを次式
    Figure 0005158814
    により導出し、このときL 0 及びR 0 は、次式
    Figure 0005158814
    により導出されたステレオ出力チャネルL及びRの正規化されたパワーであり、前記マルチチャネル信号のパワーは、次式のように第1、第2のレベルパラメータから導出され、
    Figure 0005158814
    Figure 0005158814
    前記ICCパラメータは、次式
    Figure 0005158814
    により導出され、相関推定値pは次式
    Figure 0005158814
    により定義されることを特徴とする、チャネル再生方法。
  7. 請求項1ないしの何れか1項に記載のチャネル再生機を備えたオーディオ受信機又はオーディオ再生機。
  8. 請求項5又は6に記載のチャネル再生方法を備えたオーディオ受信方法又はオーディオ再生方法。
  9. コンピュータに請求項5又は6に記載のチャネル再生方法を実行させるためのプログラムコードを備えたコンピュータプログラム。
  10. コンピュータに請求項8に記載のオーディオ受信方法又はオーディオ再生方法を実行させるためのプログラムコードを備えたコンピュータプログラム。
JP2009500706A 2006-03-29 2006-08-18 減数されたチャネルへの復号化 Active JP5158814B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
SE0600713-2 2006-03-29
SE0600713 2006-03-29
US78891106P 2006-04-03 2006-04-03
US60/788,911 2006-04-03
US11/464,149 2006-08-11
US11/464,149 US7965848B2 (en) 2006-03-29 2006-08-11 Reduced number of channels decoding
PCT/EP2006/008175 WO2007110102A1 (en) 2006-03-29 2006-08-18 Reduced number of channels decoding

Publications (2)

Publication Number Publication Date
JP2009530672A JP2009530672A (ja) 2009-08-27
JP5158814B2 true JP5158814B2 (ja) 2013-03-06

Family

ID=37450828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009500706A Active JP5158814B2 (ja) 2006-03-29 2006-08-18 減数されたチャネルへの復号化

Country Status (11)

Country Link
US (1) US7965848B2 (ja)
EP (1) EP1999744B1 (ja)
JP (1) JP5158814B2 (ja)
KR (1) KR101002835B1 (ja)
CN (1) CN101410890B (ja)
BR (1) BRPI0621530B1 (ja)
ES (1) ES2398573T3 (ja)
HK (1) HK1122127A1 (ja)
PL (1) PL1999744T3 (ja)
TW (1) TWI339836B (ja)
WO (1) WO2007110102A1 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE390683T1 (de) 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
KR100857108B1 (ko) * 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US9088855B2 (en) * 2006-05-17 2015-07-21 Creative Technology Ltd Vector-space methods for primary-ambient decomposition of stereo audio signals
MY145497A (en) * 2006-10-16 2012-02-29 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
BRPI0715312B1 (pt) * 2006-10-16 2021-05-04 Koninklijke Philips Electrnics N. V. Aparelhagem e método para transformação de parâmetros multicanais
DE102006050068B4 (de) * 2006-10-24 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
WO2009057329A1 (ja) * 2007-11-01 2009-05-07 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
US8705749B2 (en) * 2008-08-14 2014-04-22 Dolby Laboratories Licensing Corporation Audio signal transformatting
EP2211335A1 (en) * 2009-01-21 2010-07-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
KR101692394B1 (ko) * 2009-08-27 2017-01-04 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR20110022251A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
KR101641685B1 (ko) * 2010-03-29 2016-07-22 삼성전자주식회사 멀티채널 오디오의 다운믹스 방법 및 장치
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
WO2013120510A1 (en) 2012-02-14 2013-08-22 Huawei Technologies Co., Ltd. A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN109712630B (zh) * 2013-05-24 2023-05-30 杜比国际公司 包括音频对象的音频场景的高效编码
EP3061089B1 (en) 2013-10-21 2018-01-17 Dolby International AB Parametric reconstruction of audio signals
RU2641463C2 (ru) 2013-10-21 2018-01-17 Долби Интернэшнл Аб Структура декоррелятора для параметрического восстановления звуковых сигналов
EP2866227A1 (en) * 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US9866986B2 (en) 2014-01-24 2018-01-09 Sony Corporation Audio speaker system with virtual music performance
TWI587286B (zh) 2014-10-31 2017-06-11 杜比國際公司 音頻訊號之解碼和編碼的方法及系統、電腦程式產品、與電腦可讀取媒體
WO2016133366A1 (ko) * 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
KR20160101692A (ko) 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
US9826332B2 (en) * 2016-02-09 2017-11-21 Sony Corporation Centralized wireless speaker system
US9924291B2 (en) 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
US9826330B2 (en) 2016-03-14 2017-11-21 Sony Corporation Gimbal-mounted linear ultrasonic speaker assembly
US9794724B1 (en) 2016-07-20 2017-10-17 Sony Corporation Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating
US9854362B1 (en) 2016-10-20 2017-12-26 Sony Corporation Networked speaker system with LED-based wireless communication and object detection
US9924286B1 (en) 2016-10-20 2018-03-20 Sony Corporation Networked speaker system with LED-based wireless communication and personal identifier
US10075791B2 (en) 2016-10-20 2018-09-11 Sony Corporation Networked speaker system with LED-based wireless communication and room mapping
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
WO2022164229A1 (ko) * 2021-01-27 2022-08-04 삼성전자 주식회사 오디오 처리 장치 및 방법
WO2022258876A1 (en) * 2021-06-10 2022-12-15 Nokia Technologies Oy Parametric spatial audio rendering

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
EP1500084B1 (en) * 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
KR100602975B1 (ko) 2002-07-19 2006-07-20 닛본 덴끼 가부시끼가이샤 오디오 복호 장치와 복호 방법 및 프로그램을 기록한 컴퓨터 판독가능 기록매체
PL373120A1 (en) 2002-08-07 2005-08-08 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
JP4988717B2 (ja) * 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US7765104B2 (en) * 2005-08-30 2010-07-27 Lg Electronics Inc. Slot position coding of residual signals of spatial audio coding application
US8654983B2 (en) * 2005-09-13 2014-02-18 Koninklijke Philips N.V. Audio coding
KR100857108B1 (ko) * 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
EP1964442B1 (en) * 2005-12-20 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing three output channels using two input channels
EP1971978B1 (en) * 2006-01-09 2010-08-04 Nokia Corporation Controlling the decoding of binaural audio signals

Also Published As

Publication number Publication date
ES2398573T3 (es) 2013-03-20
BRPI0621530B1 (pt) 2019-11-12
EP1999744A1 (en) 2008-12-10
JP2009530672A (ja) 2009-08-27
WO2007110102A1 (en) 2007-10-04
TW200737127A (en) 2007-10-01
HK1122127A1 (en) 2009-05-08
KR20080103094A (ko) 2008-11-26
CN101410890A (zh) 2009-04-15
EP1999744B1 (en) 2012-11-28
KR101002835B1 (ko) 2010-12-21
US7965848B2 (en) 2011-06-21
BRPI0621530A2 (pt) 2011-12-13
PL1999744T3 (pl) 2013-04-30
TWI339836B (en) 2011-04-01
CN101410890B (zh) 2012-01-25
US20070233293A1 (en) 2007-10-04

Similar Documents

Publication Publication Date Title
JP5158814B2 (ja) 減数されたチャネルへの復号化
US10863299B2 (en) Binaural multi-channel decoder in the context of non-energy-conserving upmix rules
JP5698189B2 (ja) オーディオ符号化
KR101010464B1 (ko) 멀티 채널 신호의 파라메트릭 표현으로부터 공간적 다운믹스 신호의 생성
RU2406262C2 (ru) Декодирование уменьшенного количества каналов

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110913

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120124

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120424

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121206

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5158814

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151221

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250