JP2004529515A - マルチチャンネル・オーディオを再構築するために2チャンネル・マトリックス符号化オーディオを復号する方法 - Google Patents

マルチチャンネル・オーディオを再構築するために2チャンネル・マトリックス符号化オーディオを復号する方法 Download PDF

Info

Publication number
JP2004529515A
JP2004529515A JP2002535441A JP2002535441A JP2004529515A JP 2004529515 A JP2004529515 A JP 2004529515A JP 2002535441 A JP2002535441 A JP 2002535441A JP 2002535441 A JP2002535441 A JP 2002535441A JP 2004529515 A JP2004529515 A JP 2004529515A
Authority
JP
Japan
Prior art keywords
audio
channel
sub
band
sound field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002535441A
Other languages
English (en)
Inventor
スミス,ウィリアム・ピー
スミス,スティーブン・エム
ヤン,ミン
Original Assignee
デジタル・シアター・システムズ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by デジタル・シアター・システムズ・インコーポレーテッド filed Critical デジタル・シアター・システムズ・インコーポレーテッド
Publication of JP2004529515A publication Critical patent/JP2004529515A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Abstract

本発明は、ディスクリート・サラウンドサウンド・プレゼンテーションをより厳密に近似するマルチチャンネル・オーディオ(34)を再構築するために2チャンネル・マトリックス符号化オーディオ(32)を復号する方法を提供する。これは、2チャンネル・マトリックス符号化オーディオをサブバンド・フィルタリングし(54)、サブバンド信号のそれぞれを拡張音場(68)へマップして(70)マルチチャンネル・サブバンド信号を生成し、それらのサブバンド信号を合成して(78)マルチチャンネル・オーディオを再構築することによって、達成される。サブバンドを拡張音場について別々にステアリングすることによって、様々なサウンドを、音場についての異なる位置に同時に配置することができ、各サウンド要素のより正確な配置とより明確な明瞭度を可能とする。

Description

【0001】
発明の背景
発明の分野
本発明は、マルチチャンネル・オーディオに関し、より具体的には、ディスクリート・サラウンド・サウンド・プレゼンテーションをより厳密に近似するマルチチャンネルを再構築するために、2チャンネル・マトリックス符号化されたオーディオを復号する方法に関する。
【0002】
関連技術の説明
マルチチャンネル・オーディオは、映画およびホーム・シアタの標準となり、音楽、自動車、コンピュータ、ゲーム、および他のオーディオ応用分野で、ますます受け入れられるようになりつつあり、そして、ブロードキャスト・テレビジョンについても検討されている。マルチチャンネル・オーディオは、リスニング(傾聴)環境と、あらゆるオーディオ・ビジュアル・システムのプレゼンテーション(提示)全体とを大きく改善するサラウンド・サウンド環境を提供する。ステレオからマルチチャンネル・オーディオへの移行は、いくつかの要因によって加速されたが、とりわけ、より高品質のオーディオ・プレゼンテーションに対する消費者の欲求によって加速された。より高品質とは、より多いチャンネルだけでなく、より忠実度の高いチャンネルと、チャンネル間の向上した分離性または「ディスクリート性」をも意味する。消費者と製造業者の両方にとって重要な他の要因は、既存のスピーカ・システムおよび符号化されたコンテンツとの旧版互換性の保持と、それらの既存のシステムおよびコンテンツを用いてのオーディオ・プレゼンテーションの改良である。
【0003】
最初期のマルチチャンネル・システムは、複数のオーディオ・チャンネル、例えば、左、右、中央、およびサラウンド(L、R、C、S)のチャンネルを、左トータルおよび右トータル(Lt、Rt)のチャンネルにマトリックス符号化し、それらを標準のステレオ・フォーマットで記録した。ドルビー(R)・プロロジック(Dolby Prologic)(TM)などのような、これらの2チャンネル・マトリックス符号化システムは、サラウンド・サウンド・オーディオを提供したが、オーディオ・プレゼンテーションは、ディスクリート的でなく、クロストークと位相ひずみとにより特徴付けられる。マトリックス復号アルゴリズムは、単一の主な信号を識別して、その信号を5点音場に配置し、それにより、L、R、C、およびSの信号を再構築する。その結果は、「煮詰まっていない」オーディオ・プレゼンテーションとなることがあり、別々の信号が空間的に明確に分離されず、特に、主ではないが重要な信号が事実上失われる可能性がある。
【0004】
消費者アプリケーションの現在の規格は、ディスクリート5.1チャンネル・オーディオであり、これは、サラウンド・チャンネルを左サラウンド・チャンネルと右サラウンド・チャンネルに分割して、サブウーファ・チャンネルを追加する(L、R、C、Ls、Rs、Sub)。各チャンネルは、独立して圧縮され、次いで、5.1フォーマットで一緒にミックスされて、それにより、各信号のディスクリート性を維持する。ドルビー(R)AC−3(TM)、ソニー(R)SDDS(TM)、およびDTS(R)コヒーレント・アコースティックス(Coherent Acoustics)(TM)は、すべて、5.1システムの例である。最近、中央サラウンド・チャンネルCsを追加する6.1チャンネル・オーディオが導入された。真にディスクリート的なオーディオは、オーディオ・チャンネルの明確な空間的分離を提供し、複数の主な信号をサポートして、それにより、より豊かでより自然なサウンド・プレゼンテーションを提供することができる。
【0005】
消費者は、ディスクリート・マルチチャンネル・オーディオに慣れ、家庭用として5.1スピーカ・システムに投資してきたので、明らかに質の劣るサラウンド・サウンド・プレゼンテーションを受け入れるのは不本意である。残念ながら、コンテンツのうちの比較的少数のみが、現在、5.1フォーマットで利用可能である。コンテンツの大部分は、主にドルビー(R)・プロロジック(TM)である2チャンネル・マトリックス符号化フォーマットでのみ利用可能である。プロロジック・デコーダが多く装備されているので、5.1コンテンツも、プロロジック・フォーマットで符号化されることが続くことになる。従って、当業界には、「ディスクリート」マルチチャンネル・オーディオをより厳密に近似するマルチチャンネル・オーディオを再構築するように、2チャンネル・マトリックス符号化されたオーディオを復号する方法を提供するという、まだ満たされていない要求が依然として存在する。
【0006】
ドルビー(R)・プロロジック(TM)は、最初期の2チャンネル・マトリックス符号化マルチチャンネル・システムの1つを提供した。プロロジックは、位相シフト・サラウンド・サウンド項を導入することによって、4チャンネル(L、R、C、S)を2チャンネル(Lt、Rt)に絞り込んだ。次いで、これらの2チャンネルを既存の2チャンネル・フォーマットに符号化する。復号は、2ステップのプロセスであり、既存のデコーダがLt、Rtを受信し、次いで、プロロジック・デコーダがLt、RtをL、R、C、Sに拡張する。4つの信号(未知)をわずかに2つのチャンネル(式)上で搬送するので、プロロジック復号オペレーションは、単なる近似であり、真のディスクリート・マルチチャンネル・オーディオを提供することはできない。
【0007】
図1に示すように、スタジオ2は、幾つかの、例えば48の、オーディオ・ソースをミックスして、4チャンネル・ミックス(L、R、C、S)を提供する。プロロジック・エンコーダ4は、このミックスを以下のようにマトリックス符号化する。
【0008】
Lt=L+0.707C+S(+90°) (1)
Rt=R+0.707C+S(−90°) (2)
これらは、2つのディスクリート・チャンネルで搬送され、既存の2チャンネル・フォーマットに符号化され、フィルム、CD、またはDVDなどの媒体6に記録される。
【0009】
プロロジック・マトリックス・デコーダ8は、2つのディスクリート・チャンネルLt、Rtを復号し、それらを4つのディスクリート再構築チャンネルLr、Rr、Cr、およびSrに拡張する。これらのディスクリート再構築チャンネルは、増幅されて、5スピーカ・システム10へ分配される。アクティブ・デコードを実施するために、多くの異なる専有されたアルゴリズムが使用され、これらはすべて、Lt+Rt、Lt−Rt、LtおよびRtのパワーを測定することに基づいて、利得ファクタGiを計算するものであり、
Lr=G1*Lt+G2*Rt (3)
Rr=G3*Lt+G4*Rt (4)
Cr=G5*Lt+G6*Rt (5)
Sr=G7*Lt+G8*Rt (6)
となる。
【0010】
より具体的には、ドルビー(R)は、図2に示すように、5点音場11の中心のヌル点に対し、1組の利得係数を提供する。デコーダは、2チャンネル・マトリックス符号化された信号LtおよびRtの絶対パワーを測定し、下の式により、L、R、CおよびSのパワー・レベルを計算する。
【0011】
Lpow(t)=C1*Lt+C2*Lpow(t−1) (7)
Rpow(t)=C1*Rt+C2*Rpow(t−1) (8)
Cpow(t)=C1*(Lt+Rt)+C2*Cpow(t−1) (9)
Spow(t)=C1*(Lt−Rt)+C2*Spow(t−1) (10)
上式で、C1とC2は、時間平均の度合いを指図する係数であり、(t−1)パラメータは、前のインスタンスにおけるそれぞれのパワー・レベルである。
【0012】
次いで、これらのパワー・レベルを用いて、下式により、L/R主ベクトルとC/S主ベクトルとを計算する。
【0013】
Lpow(t)>Rpow(t)の場合、Dom L/R=1−Rpow(t)/Lpow(t)であり、そうでない場合、Dom L/R=Lpow(t)/Rpow(t)−1 (11)
および
Cpow(t)>Spow(t)の場合、Dom C/S=1−Spow(t)/Cpow(t)であり、そうでない場合、Dom C/R=Cpow(t)/Spow(t)−1 (12)。
【0014】
L/R主ベクトルとC/S主ベクトルのベクトル和は、単一の主信号が発出されるところである5点音場における主ベクトル12を確定する。デコーダは、以下のように、主ベクトルにより、ヌル点における利得係数の組をスケールする。
【0015】
[G]Dom=[G]Null+DomL/R*[G]+DomC/S*[G] (13)
上式で、[G]は、1組の利得係数G1,G2,...,G8を表す。
【0016】
これは、主となる点が、5点音場のR/C象限にあることを想定している。一般に、主となる点がどの象限にあるかに基づいて、適切なパワー・レベルが式に挿入される。次いで、[G]Dom係数を用いて、式3〜6により、L、R、CおよびSのチャンネルを再構築し、次いで、それらを増幅器へ渡し、更にスピーカ構成へ渡す。
【0017】
ディスクリート5.1システムと比較したとき、欠点は明瞭である。サラウンド・サウンド・プレゼンテーションには、クロストークと位相ひずみが含まれ、最善でも、ディスクリート・オーディオ・プレゼンテーションを近似する程度である。様々な位置から発出されるか、または異なるスペクトル・バンドにある単一の主信号以外の信号は、その単一の主信号によって曇ってしまう傾向がある。
【0018】
ドルビー(R)AC−3(TM)、ソニー(R)SDDS(TM)、およびDTS(R)Coherent Acoustics(TM)などの5.1サラウンド・サウンド・システムは、マルチチャンネル・オーディオのディスクリート性を維持し、それにより、より豊かでより自然なオーディオ・プレゼンテーションを提供する。図3に示すように、スタジオ20は、5.1チャンネル・ミックスを提供する。5.1エンコーダ22は、各信号または各チャンネルを独立して圧縮し、それらを一緒に多重化して、オーディオ・データを所与の5.1フォーマットにパックし、これが、DVDなどの適切な媒体24に記録される。5.1デコーダ26は、1回にフレーム、ビット・ストリームを復号するものであり、それは、オーディオ・データを抽出し、それを5.1チャンネルにデマルチプレクスし、次いで各チャンネルを圧縮解除して信号(Lr、Rr、Cr、Lsr、Rsr、Sub)を再生することによって行われる。5.1ディスクリート・オーディオ信号を搬送するこれらの5.1ディスクリート・チャンネルは、スピーカ構成28の適切なディスクリート・スピーカへと向けられる(サブウーファは図示していない)。
【0019】
発明の概要
上記の問題を考慮して、本発明は、ディスクリート・サラウンド・サウンド・プレゼンテーションをより厳密に近似するマルチチャンネル・オーディオを再構築するために、2チャンネル・マトリックス符号化オーディを復号する方法を提供する。
【0020】
これは、2チャンネル・マトリックス符号化されたオーディオをサブバンド・フィルタリングし、サブバンド信号のそれぞれを拡張された音場にマッピングしてマルチチャンネル・サブバンド信号を生成し、それらのサブバンド信号を合成してマルチチャンネル・オーディオを再構築することによって、達成される。拡張された音場についてサブバンドを別々にステアリングすることによって、様々な音を、音場について、異なる位置で同時に配置することができ、各サウンド要素のより正確な配置とより明確な明瞭度とを可能とする。
【0021】
サブバンド・フィルタリングのプロセスは、複数の主信号、即ちそれぞれのサブバンドに1つの主信号、を提供するものである。そうすることにより、そうでない場合には単一の主信号によってマスクされ得るであろう、オーディオ・プレゼンテーションにとって重要な信号が、異なるサブバンドに存在することを条件として、サラウンド・サウンド・プレゼンテーションにおいて保持される。性能と計算との兼合いを最適にするために、バーク・フィルタ(bark filter)手法が好ましい可能性がある。バーク・フィルタ手法では、サブバンドが人の耳の感度にあわせて調節される。
【0022】
音場を拡張することによって、デコーダは、より正確にオーディオ信号を音場に配置することができる。そうすることにより、そうでない場合には同じ位置から発出されるように見える信号を、よりディスクリート的に見えるように分離することができる。性能を最適化するために、拡張された音場をマルチチャンネル入力に整合させることが好ましい可能性がある。例えば、9点音場は、L、R、C、Ls、RsおよびCsのチャンネルのそれぞれの点を含むディスクリートの点を提供し、それぞれの点が1組の最適化された利得係数を有する。
【0023】
本発明のこれらおよび他の特徴と利点は、添付の図面および好ましい実施形態の以下の詳細な記述から、当業者には明らかになるであろう。
【0024】
発明の詳細な説明
本発明は、「ディスクリート」マルチチャンネル・オーディオをより厳密に近似するマルチチャンネル・オーディオを再構築するように、2チャンネル・マトリックス符号化オーディオを復号する方法を提供するという、業界の要求を満たす。この技術は、マルチチャンネルA/V受信器に組み込まれる可能性がもっとも高く、それにより、単一のユニットで、真の5.l(または6.1)マルチチャンネル・オーディと、2チャンネル・マトリックス符号化オーディオとに適応することができる。真のディスクリート・マルチチャンネル・オーディオには劣るが、2チャンネル・マトリックス符号化コンテンツからのサラウンド・サウンド・プレゼンテーションにより、より自然でより豊かなオーディオ経験が提供されることになる。これは、2チャンネル・オーディオをサブバンド・フィルタリングし、それぞれのスピーカ位置についての最適化した利得係数を有するディスクリート点を含む拡張音場内において、サブバンド・オーディオをステアリングし、次いで、マルチチャンネル・サブバンドを合成してマルチチャンネル・オーディオを再構築することによって、達成される。好ましい実施態様は、サブバンド・フィルタリングと拡張音場の特徴との両方を使用するが、これを独立して使用することもできる。
【0025】
図4に示したように、デコーダ30は、2チャンネル・マトリックス符号化信号32(Lt、Rt)を受信して、マルチチャンネル信号34を再構築し、この信号は次いで増幅されてスピーカ36へ分配され、より自然でより豊かなサラウンド・サウンド経験を提供する。復号アルゴリズムは、特定の2チャンネル・マトリックス符号化とは独立であり、従って、信号32(Lt、Rt)は、標準的なプロロジックのミックス(L、R、C、S)、5.0のミックス(L、R、C、Ls、Rs)、6.0のミックス(L、R、C、Ls、Rs、Cs)、またはその他を表すことができる。マルチチャンネル・オーディオの再構築は、ユーザのスピーカ構成に依存する。例えば、6.0信号に対しては、デコーダは、Csスピーカが存在する場合はディスクリート中央サウンドCsチャンネルを生成するが、そうでない場合、その信号はLsチャンネルおよびRsチャンネルにミックスダウンされて、ファントム中央サラウンドを提供する。同様に、ユーザが、5より少ないスピーカを有する場合、デコーダはミックスダウンする。サブウーファまたは0.1チャンネルはミックスには含まれない、ということに留意されたい。バス応答は、再構築されたチャンネルから低周波数信号を抽出する別個のソフトウエアによって提供されるものであり、本発明の一部ではない。
【0026】
デコーダ30には、サブバンド・フィルタ38と、マトリックス・デコーダ40と、合成フィルタ42とが含まれ、これらは共になり、2チャンネル・マトリックス符号化オーディオLtおよびRtを復号して、マルチチャンネル・オーディオを再構築する。図5に示したように、復号および再構築には、以下の一連のステップが必要である。
【0027】
1. 各入力チャンネル(Lt、Rt)について、例えば64の、サンプルのブロックを抽出する(ステップ50)。
【0028】
2. 例えば図6aに示したタイプの64バンド多相フィルタバンク52などのような、マルチバンド・フィルタ・バンク38を用いて、各ブロックをフィルタリングし、サブバンド・オーディオ信号を形成する(ステップ54)。
【0029】
3.(オプション) 結果として得られるサブバンド・サンプルを、図7に示すように、最も近い結果的なバーク・バンド56にグループ分けする(ステップ58)。バーク・バンド(bark band)は、更に組み合わされて、計算労力を低減されることが可能である。
【0030】
4. LtサブバンドとRtサブバンドのそれぞれについて、パワー・レベルを測定する(ステップ60)。
【0031】
5. L、R、CおよびSのサブバンドのそれぞれについて、パワー・レベルを計算する(ステップ62)。
【0032】
Lpow(t)=C1*Lt+C2*Lpow(t−1) (14)
Rpow(t)=C1*Rt+C2*Rpow(t−1) (15)
Cpow(t)=C1*(Lt+Rt)+C2*Cpow(t−1) (16)
Spow(t)=C1*(Lt−Rt)+C2*Spow(t−1) (17)
上式で、iは、サブバンドを示し、C1およびC2は、時間平均係数であり、(t−1)は前のインスタンスを表す。
【0033】
6. 各サブバンドについて、L/R主ベクトルとC/S主ベクトルを計算する(ステップ64)。
【0034】
Lpow(t)>Rpow(t)の場合、DomL/R=1−Rpow(t)/Lpow(t)
そうでない場合、DomL/R=Lpow(t)/Rpow(t)−1 (18)
および
Cpow(t)>Spow(t)の場合、DomC/S=1−Spow(t)/Cpow(t)
そうでない場合、DomC/R=Cpow(t)/Spow(t)−1 (19)
7. 低速および高速の平均処理とスレッショルド処理との両方を使用して、各サブバンドについて、L/R主ベクトルとC/S主ベクトルを平均し、マトリックス変数を計算するために、何れの平均を使用するかを決定する(ステップ66)。これは、適切な場合、即ち、大きな変化の場合において、意図しない遊走を回避しつつ、迅速なステアリングを可能にする。
【0035】
8. Lt、Rtサブバンド信号を、図8に示したタイプの拡張音場68にマップし、これにより、スピーカの配置に対して動画/DVDチャンネル構成を整合させる(ステップ70)。9点の格子(より大きなプロセッサの力で拡張可能)は、音空間における位置を示す。各点は、[G]によって表された1組の利得値G1,G2,...,G12に対応し、これらの値は、L/R主ベクトルとC/S主ベクトルが、その点に対応する信号ベクトル72を定義するときに、スピーカのそれぞれに対する「最適の」出力を生成するように決定される。
【0036】
上記の式18と19において定義されるように、DomL/RとDomC/Sは、それぞれ、[−1、1]の領域の値を有し、ここで、主ベクトルの符号は、ベクトル72が存在する象限を示し、ベクトルの大きさは、各サブバンドに対しての象限内における相対的位置を示す。
【0037】
各サブバンドにおける信号ベクトル72の利得係数は、信号ベクトル72が存在する象限の4コーナ(4−corners)における利得係数の値に基づいて計算されることが好ましい。1つの手法は、その点における利得係数を、コーナの点における係数値に基づいて、補間することである。
【0038】
左上象限に存在する点に対する一般化した補間の式は、以下の式によって与えられる。
【0039】
[G]vector =D1*[G]Null+D2*[G]+D3*[G]+D4*[G]UL (20)
上式で、D1、D2、D3およびD4は、線形補間係数であり、以下のように与えられる。
【0040】
D1=1−ヌル(0,0)とベクトル72との間の距離
D2=1−L(0,1)とベクトル72との間の距離
D3=1−C(1、0)とベクトル72との間の距離
D4=1−UL(1,1)とベクトル72との間の距離
上式で、「距離」は、あらゆる適切な距離計量である。
【0041】
より高次の関数を使用することができるが、初期の試験では、簡単な1次または線形の補間で最適に実施されることを示し、その場合に係数は以下のように与えられる。
【0042】
D1=(1−|DomLR|−|DomCS|+|DomLR|*|DomCS|)
D2=(|DomLR|−|DomLR|*|DomCS|)
D3=(|DomCS|−|DomLR|*|DomCS|)
D4=(|DomLR|*|DomCS|)
上式で、|*|は大きさの関数であり、iはサブバンドを示す。
【0043】
信号ベクトル72がヌル点に一致する場合、係数は、デフォルトとなりヌル点の係数になる。その点が、象限の中心(1/2,1/2)にある場合、4つのコーナ点は、すべて、その値の4分の1が均等に寄与する。その点が、1つの点の近くにある場合、その点は、より重く寄与するが、その寄与は線形的なものである。例えば、その点が、ヌル点の近くの(1/4,1/4)にある場合、その寄与は、9/16[G]Null、3/16[G]、3/16[G]、および1/16[G]ULである。
【0044】
9. 以下のように、マルチチャンネル・サブバンド・オーディオ信号を再構築する(ステップ74)。
【0045】
Lr=G1*Lt+G2*Rt (21)
Rr=G3*Lt+G4*Rt (22)
Cr=G5*Lt+G6*Rt (23)
Lsr=G7*Lt+G8*Rt (24)
Rsr=G9*Lt+G10*Rt (25)
Csr=G11*Lt+G12*Rt (26)
ここにおいて[G」vector はG1,G2,...,G12を提供する。
【0046】
10. マルチチャンネル・サブバンド・オーディオ信号を、例えば逆多相フィルタ76などのような、図6bに示したタイプの合成フィルタ42を通過させて、再構築されたマルチチャンネル・オーディオを生成する(ステップ78)。オーディオのコンテンツに応じて、再構築されたオーディオは、サブバンドあたり1つまでの、複数の主信号を備えることが可能である。
【0047】
この手法は、プロロジックなど既知のステアリングされマトリックのスシステムに対して、2つの重要な利点を有する。
【0048】
1. サブバンドを別々にステアリングすることによって、様々なサウンドを、マトリックスについて、異なる位置に同時に配置することができ、各サウンド要素のより正確な配置とより著しい明瞭度とを可能にする。
【0049】
2. 本マトリックスは、3つのフロント・チャンネルと2つまたは3つのリア・チャンネルとの動画/DVDチャンネル構成を観察する。これにより、マトリックスを通じてのLt/Rtの再生と5.1/6.1ディスクリートDVDとの双方に対する単一ラウド・スピーカ・レイアウトが最適に使用される。
【0050】
本発明のいくつかの例示的な実施形態について示し、記述してきたが、当業者なら、多くの変形形態と代替実施形態を思い付くであろう。そのような変形形態と代替実施形態は企図され、請求項で定義された本発明の精神および範囲から逸脱せずに実施することができる。
【図面の簡単な説明】
【図1】
図1は、上述のように、2チャンネル・マトリックス符号化サラウンド・サウンドシステムのブロック図である。
【図2】
図2は、上述のように、5点音場を示す。
【図3】
図3は、上述のように、5.1チャンネル・サラウンド・サウンドシステムのブロック図である。
【図4】
図4は、本発明による、2チャンネル・マトリックス符号化オーディオからマルチチャンネル・オーディオを再構築するためのデコーダのブロック図である。
【図5】
図5は、本発明による、2チャンネル・マトリックス符号化オーディオからマルチチャンネル・オーディオを再構築するステップを示すフローチャートである。
【図6】
図6aは、ディスクリート・マルチチャンネル・オーディオを再構築するために使用される図4に示したサブバンドフィルタを示し、図6bは、ディスクリート・マルチチャンネル・オーディオを再構築するために使用される図4に示した合成フィルタを示す。
【図7】
図7は、特定のバーク・サブバンド・フィルタを示す。
【図8】
図8は、ディスクリート・マルチチャンネル・・オーディオ・プレゼンテーションに整合する9点拡張音場を示す。

Claims (19)

  1. ディスクリート・サラウンドサウンド・プレゼンテーションを近似するマルチチャンネル・オーディオ(34)を再構築するために2チャンネル・マトリックス符号化オーディオ(32)を復号する方法であって、
    前記2チャンネル・マトリックス符号化オーディオを、複数の2チャンネル・サブバンド・オーディオ信号にサブバンド・フィルタリングするステップ(54)と、
    マルチチャンネル・サブバンド・オーディオ信号を形成するために、音場(68)において、前記2チャンネル・サブバンド・オーディオ信号を別々にステアリングするステップ(70)と、
    前記マルチチャンネル・オーディオを再構築するために、サブバンドにおいて、前記マルチチャンネル・サブバンド・オーディオ信号を合成するステップ(78)と
    を備える方法。
  2. 再構築された前記マルチチャンネル・オーディオが、複数の主オーディオ信号を含む、請求項1に記載の方法。
  3. 前記主オーディオ信号が、異なるサブバンドに存在する、請求項2に記載の方法。
  4. 前記2チャンネル・サブバンド・オーディオ信号をステアリングする前記ステップが、それぞれの前記サブバンドについて前記音場における主ベクトル(72)を計算するステップ(64)を備え、前記主ベクトルが、前記サブバンドにおける前記主オーディオ信号によって決定されるものである、請求項3に記載の方法。
  5. サブバンド・フィルタリングする前記ステップが、前記サブバンド・オーディオ信号を複数のバーク・バンドにグループ分けする(58)、請求項1に記載の方法。
  6. 前記2チャンネル・マトリックス符号化オーディオが、少なくとも左、右、中央、左サラウンドおよび右サラウンド(L、R、C、Ls、Rs)のオーディオ・チャンネルを含み、前記2チャンネル・サブバンド・オーディオ信号が、それぞれの前記オーディオ・チャンネルに対するディスクリート点を含む拡張音場(68)へとステアリングされる、請求項1に記載の方法。
  7. それぞれの前記ディスクリート点が、前記2チャンネル・サブバンド・オーディオ信号が前記拡張音場におけるその点へステアリングされるときに、それぞれ、L、R、C、Ls、Rsのスピーカのそれぞれにおいて最適のオーディオ出力を生成するように予め決定された1組の利得値に対応する、請求項6に記載の方法。
  8. それぞれの前記ディスクリート点が、前記サブバンド・オーディオ信号が前記拡張音場におけるその点へステアリングされるときに、中央サラウンド(Cs)・スピーカにおいて最適のオーディオ出力を生成するように時前に決定された利得値を更に含む、請求項7に記載の方法。
  9. オーディオ信号をステアリングすることが、
    それぞれの前記サブバンドについての前記音場における主ベクトルを計算するステップ(64)であって、前記主ベクトルが前記サブバンドにおける前記主オーディオ信号によって決定されるものである、ステップと、
    前記ディスクリート点に対する前記所定の利得値と前記主ベクトルとを用いて、それぞれのサブバンドに対して1組の利得値を計算するステップと、
    前記2チャンネル・サブバンド・オーディオ信号と前記利得値とを用いて、前記マルチチャンネル・サブバンド・オーディオ信号を計算するステップと
    を含む、
    請求項7に記載の方法。
  10. 各サブバンドに対しての前記利得値を、前記主ベクトルの周囲の所定の利得値の線形補間を行うことにより計算して、前記主ベクトルにより示される前記音場における前記点での利得値の組を定義する、請求項9に記載の方法。
  11. 前記拡張音場が9点音場を含み、それぞれの前記ディスクリート点が、前記2チャンネル・サブバンド・オーディオ信号が前記拡張音場におけるその点へステアリングされるときに、それぞれ、L、R、C、Ls、Rsのスピーカのそれぞれにおいて最適のオーディオ出力を生成するように予め決定された1組の利得値に対応する、請求項1に記載の方法。
  12. ディスクリート・サラウンドサウンド・プレゼンテーションを近似するマルチチャンネル・オーディオ(34)を再構築するために2チャンネル・マトリックス符号化オーディオ(32)を復号する方法であって、
    少なくとも左、右、中央、左サラウンドおよび右サラウンド(L、R、C、Ls、Rs)のオーディオ・チャンネルを含む2チャンネル・マトリックス符号化オーディオを提供するステップと、
    前記マルチチャンネル・オーディオを再構築するために、それぞれの前記オーディオ・チャンネルに対するディスクリート点を含む拡張音場(68)において、前記2チャンネル・マトリックス符号化オーディオをステアリングするステップと、
    前記L、R、C、LsおよびRsのオーディオ・チャンネルのそれぞれに対するスピーカを含むスピーカ構成(36)へ前記マルチチャンネル・オーディオを分配するステップと
    を備える方法。
  13. それぞれの前記ディスクリート点は、前記2チャンネル・マトリックス符号化オーディオが前記拡張音場におけるその点へステアリングされるときに、それぞれ、前記L、R、C、Ls、Rsの前記スピーカのそれぞれにおいて最適のオーディオ出力を生成するように予め決定された1組の利得値に対応する、請求項12に記載の方法。
  14. それぞれの前記ディスクリート点は、前記サブバンド・オーディオ信号が前記拡張音場におけるその点へステアリングされるときに、中央サラウンド(Cs)・スピーカにおいて最適のオーディオ出力を生成するように予め決定された利得値を更に含む、請求項13に記載の方法。
  15. ディスクリート・サラウンドサウンド・プレゼンテーションを近似するマルチチャンネル・オーディオ(34)を再構築するために2チャンネル・マトリックス符号化オーディオ(32)を復号する方法であって、
    少なくとも左、右、中央、左サラウンドおよび右サラウンド(L、R、C、Ls、Rs)のオーディオ・チャンネルを含む2チャンネル・マトリックス符号化オーディオを提供するステップと、
    前記2チャンネル・マトリックス符号化オーディオを、複数の2チャンネル・サブバンド・オーディオ信号へとサブバンド・フィルタリングする(54)ステップと、
    マルチチャンネル・サブバンド・オーディオ信号を形成するために拡張音場において前記2チャンネル・サブバンド・オーディオ信号を別々にステアリングするステップ(70)であって、前記音場は、それぞれの前記オーディオ・チャンネルに対するディスクリート点を有するものであり、それぞれの前記ディスクリート点は、前記2チャンネル・サブバンド・オーディオ信号が前記拡張音場のその点へステアリングされるときに、それぞれ、L、R、C、Ls、Rsのスピーカのそれぞれにおいて最適のオーディオ出力を生成するように予め決定された1組の利得値に対応するものである、ステップと、
    前記マルチチャンネル・オーディオを再構築するためにサブバンドにおける前記マルチチャンネル・サブバンド・オーディオ信号を合成する(78)ステップと
    を備える方法。
  16. 再構築した前記マルチチャンネル・オーディオが複数の主オーディオ信号を含み、前記複数の主オーディオ信号は異なるサブバンドに存在する、請求項15に記載の方法。
  17. 前記サブバンド・フィルタリングが、前記サブバンド・オーディオ信号を複数のバーク・バンドにグループ分けする(58)、請求項15に記載の方法。
  18. それぞれの前記ディスクリート点は、前記サブバンド・オーディオ信号が前記拡張音場におけるその点へステアリングされるときに、中央サラウンド(Cs)スピーカにおいて最適のオーディオ出力を生成するように予め決定された利得値を更に含む、請求項15に記載の方法。
  19. 拡張音場が9点音場を含む、請求項15に記載の方法。
JP2002535441A 2000-10-06 2001-10-04 マルチチャンネル・オーディオを再構築するために2チャンネル・マトリックス符号化オーディオを復号する方法 Pending JP2004529515A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/680,737 US7003467B1 (en) 2000-10-06 2000-10-06 Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
PCT/US2001/030997 WO2002032186A2 (en) 2000-10-06 2001-10-04 Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio

Publications (1)

Publication Number Publication Date
JP2004529515A true JP2004529515A (ja) 2004-09-24

Family

ID=24732305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002535441A Pending JP2004529515A (ja) 2000-10-06 2001-10-04 マルチチャンネル・オーディオを再構築するために2チャンネル・マトリックス符号化オーディオを復号する方法

Country Status (11)

Country Link
US (2) US7003467B1 (ja)
EP (1) EP1354495B1 (ja)
JP (1) JP2004529515A (ja)
KR (1) KR100666019B1 (ja)
CN (1) CN100496149C (ja)
AU (1) AU2002211400A1 (ja)
CA (1) CA2423893C (ja)
HK (1) HK1071271A1 (ja)
IL (2) IL155129A0 (ja)
TR (1) TR200300428T2 (ja)
WO (1) WO2002032186A2 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
US7660424B2 (en) 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CA2424093A1 (en) * 2003-03-31 2004-09-30 Dspfactory Ltd. Method and device for acoustic shock protection
US7929708B2 (en) * 2004-01-12 2011-04-19 Dts, Inc. Audio spatial environment engine
GB2410164A (en) * 2004-01-16 2005-07-20 Anthony John Andrews Sound feature positioner
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7853022B2 (en) * 2004-10-28 2010-12-14 Thompson Jeffrey K Audio spatial environment engine
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
WO2008102527A1 (ja) * 2007-02-20 2008-08-28 Panasonic Corporation マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路
ATE493731T1 (de) * 2007-06-08 2011-01-15 Dolby Lab Licensing Corp Hybridableitung von surround-sound-audiokanälen durch steuerbares kombinieren von umgebungs- und matrixdekodierten signalkomponenten
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101415026B1 (ko) * 2007-11-19 2014-07-04 삼성전자주식회사 마이크로폰 어레이를 이용한 다채널 사운드 획득 방법 및장치
KR101439205B1 (ko) 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
AU2008344073B2 (en) * 2008-01-01 2011-08-11 Lg Electronics Inc. A method and an apparatus for processing an audio signal
AU2008344132B2 (en) * 2008-01-01 2012-07-19 Lg Electronics Inc. A method and an apparatus for processing an audio signal
TWI449442B (zh) * 2009-01-14 2014-08-11 Dolby Lab Licensing Corp 用於無回授之頻域主動矩陣解碼的方法與系統
PL3598447T3 (pl) 2009-01-16 2022-02-14 Dolby International Ab Transpozycja harmonicznych rozszerzona o iloczyn wektorowy
KR20110022252A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
EP2510709A4 (en) * 2009-12-10 2015-04-08 Reality Ip Pty Ltd IMPROVED MATRIX DECODER FOR SURROUND SOUND
KR101785379B1 (ko) * 2010-12-31 2017-10-16 삼성전자주식회사 공간 음향에너지 분포 제어장치 및 방법
US8693697B2 (en) * 2011-06-06 2014-04-08 Reality Ip Pty Ltd Matrix encoder with improved channel separation
EP2909971B1 (en) 2012-10-18 2020-09-02 Dolby Laboratories Licensing Corporation Systems and methods for initiating conferences using external devices
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
EP3429233B1 (en) 2013-07-30 2019-12-18 DTS, Inc. Matrix decoder with constant-power pairwise panning
KR102294767B1 (ko) 2013-11-27 2021-08-27 디티에스, 인코포레이티드 고채널 카운트 멀티채널 오디오에 대한 멀티플렛 기반 매트릭스 믹싱
EP3072017B1 (de) * 2014-01-22 2019-06-19 Siemens Aktiengesellschaft Digitaler messeingang für ein elektrisches automatisierungsgerät, elektrisches automatisierungsgerät mit einem digitalen messeingang und verfahren zum verarbeiten von digitalen eingangs-messwerten
US9306606B2 (en) * 2014-06-10 2016-04-05 The Boeing Company Nonlinear filtering using polyphase filter banks
JP6569571B2 (ja) 2016-03-15 2019-09-04 ヤマハ株式会社 信号処理装置及び信号処理方法
JP6969368B2 (ja) 2017-12-27 2021-11-24 ヤマハ株式会社 オーディオデータ処理装置、及びオーディオデータ処理装置の制御方法。
JP2019205114A (ja) 2018-05-25 2019-11-28 ヤマハ株式会社 データ処理装置、及びデータ処理方法。
US20230370777A1 (en) * 2020-10-07 2023-11-16 Clang A method of outputting sound and a loudspeaker

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1514162A (en) * 1974-03-25 1978-06-14 Ruggles W Directional enhancement system for quadraphonic decoders
US4704728A (en) * 1984-12-31 1987-11-03 Peter Scheiber Signal re-distribution, decoding and processing in accordance with amplitude, phase, and other characteristics
US5046098A (en) * 1985-03-07 1991-09-03 Dolby Laboratories Licensing Corporation Variable matrix decoder with three output channels
US5172415A (en) * 1990-06-08 1992-12-15 Fosgate James W Surround processor
ATE138238T1 (de) * 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
US5274740A (en) * 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
JP2509789B2 (ja) * 1992-08-22 1996-06-26 三星電子株式会社 可聴周波数帯域分割を利用した音響信号歪み補正装置
US5319713A (en) * 1992-11-12 1994-06-07 Rocktron Corporation Multi dimensional sound circuit
FI102799B1 (fi) * 1993-06-15 1999-02-15 Nokia Technology Gmbh Paranettu Dolby Prologic -dekooderi
TW272341B (ja) * 1993-07-16 1996-03-11 Sony Co Ltd
JP3404837B2 (ja) * 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
EP0688113A2 (en) * 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
US5870480A (en) * 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
US5796844A (en) * 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation
TW510143B (en) 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
US6970567B1 (en) 1999-12-03 2005-11-29 Dolby Laboratories Licensing Corporation Method and apparatus for deriving at least one audio signal from two or more input audio signals
ATE546018T1 (de) 2000-08-31 2012-03-15 Dolby Lab Licensing Corp Verfahren und anordnung zur audiomatrixdekodierung
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio

Also Published As

Publication number Publication date
WO2002032186A2 (en) 2002-04-18
IL155129A (en) 2009-11-18
CA2423893A1 (en) 2002-04-18
IL155129A0 (en) 2003-10-31
KR100666019B1 (ko) 2007-01-10
US7003467B1 (en) 2006-02-21
EP1354495A2 (en) 2003-10-22
WO2002032186A3 (en) 2003-08-14
EP1354495B1 (en) 2013-04-10
TR200300428T2 (tr) 2005-12-21
KR20030038786A (ko) 2003-05-16
CN1575621A (zh) 2005-02-02
AU2002211400A1 (en) 2002-04-22
US20060095269A1 (en) 2006-05-04
HK1071271A1 (en) 2005-07-08
CN100496149C (zh) 2009-06-03
CA2423893C (en) 2006-04-25

Similar Documents

Publication Publication Date Title
JP2004529515A (ja) マルチチャンネル・オーディオを再構築するために2チャンネル・マトリックス符号化オーディオを復号する方法
US20200335115A1 (en) Audio encoding and decoding
TWI489887B (zh) 用於喇叭或耳機播放之虛擬音訊處理技術
JP5587551B2 (ja) オーディオ符号化
KR100458021B1 (ko) 기록/재생용 다중 채널 오디오 강화 시스템 및 그 제공 방법
CN101133680B (zh) 用于产生已编码立体声信号的设备及方法
JP4732807B2 (ja) オーディオ信号処理
JP4944902B2 (ja) バイノーラルオーディオ信号の復号制御
JP4939933B2 (ja) オーディオ信号符号化装置及びオーディオ信号復号化装置
US7889870B2 (en) Method and apparatus to simulate 2-channel virtualized sound for multi-channel sound
JP5227946B2 (ja) フィルタ適応周波数分解能
EP0571455B1 (en) Sound reproduction system
CN112019993B (zh) 用于音频处理的设备和方法
JP4497161B2 (ja) 音像生成装置及び音像生成プログラム
KR100598602B1 (ko) 가상 입체 음향 생성 장치 및 그 방법
JP7332745B2 (ja) 音声処理方法及び音声処理装置
KR102217832B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060525

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060824

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060831

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061127

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080221