JP2008516275A - コンパクトなサイド情報を用いたマルチチャネルの階層的オーディオ符号化 - Google Patents

コンパクトなサイド情報を用いたマルチチャネルの階層的オーディオ符号化 Download PDF

Info

Publication number
JP2008516275A
JP2008516275A JP2007535185A JP2007535185A JP2008516275A JP 2008516275 A JP2008516275 A JP 2008516275A JP 2007535185 A JP2007535185 A JP 2007535185A JP 2007535185 A JP2007535185 A JP 2007535185A JP 2008516275 A JP2008516275 A JP 2008516275A
Authority
JP
Japan
Prior art keywords
channel
information
coherence
original
master
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007535185A
Other languages
English (en)
Other versions
JP4519919B2 (ja
Inventor
アンドレーアス ヘルツァー
ユールゲン ヘレ
ハイコ プルンハーゲン
クリストファー クジュルリング
ヨナス レーデン
ラーシュ ヴィレモース
ヨナス エングデガルド
イェルーン ブレーバールト
エリク スフエイエルス
ウェルナー オーメン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Original Assignee
Koninklijke Philips NV
Dolby International AB
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Dolby International AB, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008516275A publication Critical patent/JP2008516275A/ja
Application granted granted Critical
Publication of JP4519919B2 publication Critical patent/JP4519919B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Abstract

マルチチャネルオーディオ信号のパラメトリック表現は、第1および第2のチャネル間のコヒーレンスを表現するコヒーレンス情報が、聴取位置に関して左側からの情報だけを有する第1のチャネルを含みさらに聴取位置に関して右側からの情報だけを有する第2のチャネルを含むチャネルペアに対してだけ階層的符号化処理において導出される場合、コンパクトなサイド情報を用いてオーディオ信号の空間特性をうまく表現する。階層的処理においてオーディオ信号の複数のオーディオチャネルが反復してモノラルチャネルにダウンミックスされるので、マルチチャネルオーディオ信号の空間特性を表現するために必要な情報を伝えるチャネルペアだけに関与する符号化ステップから適切なパラメータを選ぶことができる。
【選択図】図1

Description

本発明は、マルチチャネルオーディオ処理に関し、特に、マルチチャネルオーディオ信号の空間特性を表現するためのコンパクトなパラメトリックサイド情報の生成および使用に関する。
近年、マルチチャネルオーディオ再生技術がますます重要になっている。これは、周知のMP3技術等のオーディオ圧縮/符号化技術により、制限のある帯域幅を有するインターネットまたは他の伝送チャネルを介して、オーディオ記録を配信することが可能になったという事実によるものである。ステレオフォーマットにおいてすべての記録を配信すること、すなわち、第1のつまり左ステレオチャネルと第2のつまり右ステレオチャネルとを含むオーディオ記録のデジタル表現を配信することが可能であるという事実により、MP3符号化技術はよく知られるようになった。
しかしながら、従来の2チャネルサウンドシステムには基本的な欠点がある。したがって、サラウンド技術が開発されている。推奨されるマルチチャネルサラウンド表現フォーマットは、2つのステレオチャネルLおよびRに加えて、追加のセンターチャネルCおよび2つのサラウンドチャネルLs、Rsをさらに含む。この基準サウンドフォーマットは、3ステレオ/2ステレオとも呼ばれるもので、3つのフロントチャネルおよび2つのサラウンドチャネルを意味する。再生環境では、5つの適切な位置での少なくとも5つのスピーカは、5つの適切に配置されたスピーカの特定の距離において、最適なスイートスポットを得る必要がある。
マルチチャネルオーディオ信号のパラメトリック符号化(パラメトリックステレオ(PS)、「空間オーディオ符号化」、「バイノーラルキュー符号化」(BCC)等)のための近年のアプローチでは、(モノラルチャネルとすることも、いくつかのチャネルとすることもできる)ダウンミックス信号およびパラメトリックサイド情報(「空間キュー」)によってマルチチャネルオーディオ信号を表し、その知覚空間サウンドステージを特徴付ける。種々のアプローチおよび技術を、以下の段落で簡単にレビューする。
パラメトリックステレオとして周知の関連した技術については、J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)およびE.シュイエールス(Schuijers)の「低ビットレートでの高品質パラメトリック空間オーディオ符号化(High−Quality Parametric Spatial Audio Coding at Low Bitrates)」、AES第116回コンベンション予稿集6072、2004年5月、ベルリンと、E.シュイエールス(Schuijers)、J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)およびJ.エングデガールド(Engdegard)の「低複雑性パラメトリックステレオ符号化(Low Complexity Parametric Stereo Coding)」、AES第116回コンベンション予稿集6073、2004年5月、ベルリンとに記載されている。
マルチチャネルオーディオ信号の伝送に必要なデータ量を低減する本技術では、いくつかの技術が周知である。このために、図11を参照すると、ジョイントステレオ装置60を示している。この装置は、例えば、インテンシティステレオ(IS)またはバイノーラルキュー符号化(BCC)を実施する装置とすることができる。このようなデバイスは、一般に、入力として少なくとも2つのチャネル(CH1、CH2、・・・CHn)を受信し、1つのキャリアチャネルおよびパラメトリックデータを出力する。パラメトリックデータは、デコーダにおいて、元のチャネル(CH1、CH2、・・・CHn)の近似値を算出できるように、定義されている。
通常、キャリアチャネルは、サブバンドサンプル、スペクトル係数、時間領域サンプル等を含み、これらにより、基礎の信号が比較的よい表現になるが、パラメトリックデータはスペクトル係数のこのようなサンプルを含まないが、乗算、時間シフティング、周波数シフティング、位相シフティング等による重み付けのような特定の再構成アルゴリズムを制御するための制御パラメータを含む。したがって、パラメトリックデータは、信号または関連付けられたチャネルの比較的粗い表現しか含んでいない。数字を提示すると、キャリアチャネルが必要とするデータ量は、MPEG符号化スキームにおいて60〜70キロビット/秒の範囲にできるが、1つのチャネルに対してパラメトリックサイド情報が必要とするデータ量は、5.1チャネル信号に対して約10キロビット/秒の範囲にできる。パラメトリックデータの一例としては、以下に説明するように、周知のスケールファクタ、インテンシティステレオ情報またはバイノーラルキューパラメータが挙げられる。
BCC技術については、例えば、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「ステレオおよびマルチチャネルオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural Cue Coding applied to Stereo and Multi−Channel Audio Compression)」、AESコンベンション論文5574、2002年5月、ミュンヘンに、「知覚パラメータ化を用いた空間オーディオの効率的な表現(Efficient representation of spatial audio using perceptual paremetrization)」、IEEE WASPAA論文、2001年10月、ニューヨーク州モホンクに、および両方ともC.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の著作である「バイノーラルキュー符号化のための聴覚空間キューの推定(Estimation of auditory spatial cues for binaural cue coding)」および「バイノーラルキュー符号化:空間オーディオの新規で効率的な表現(Binaural cue coding:a novel and efficient representation of spatial audio)」、ICASSPの2つの論文、2002年5月、フロリダ州オーランドに記載されている。
BCC符号化では、オーバーラップウィンドウを有するDFT(離散フーリエ変換)ベースの変換を用いて、多数のオーディオ入力チャネルは、スペクトル表現に変換されている。得られるスペクトルは、重なりのない区分に分割される。各区分は、等価矩形帯域幅(ERB)に比例する帯域幅を有する。チャネル間レベル差(ICLD)およびチャネル間時間差(ICTD)は、この区分毎に推定される。チャネル間レベル差ICLDおよびチャネル間時間差ICTDは、通常、基準チャネルに関して各チャネルに与えられ、さらに量子化される。送信パラメータは最終的に規定の公式に従って算出され(符号化され)、これらは、処理される信号の特定の区分に依存する。
デコーダ側では、デコーダは、モノラル信号およびBCCビットストリームを受信する。モノラル信号は、周波数領域に変換され、空間合成ブロックに入力され、このブロックは、復号化されたICLDおよびICTD値も受信する。空間合成ブロックでは、マルチチャネル信号を合成するために、モノラル信号の重み付け動作を実行するためにBCCパラメータ(ICLDおよびICTD)値が用いられ、マルチチャネル信号は、周波数/時間変換後の元のマルチチャネルオーディオ信号を再構成したものを表す。
BCCの場合、ジョイントステレオモジュール60は、パラメトリックチャネルデータが量子化され符号化されてICLDまたはICTDパラメータを生じるように、チャネルサイド情報を出力し、元のチャネルのうちの1つは、チャネルサイド情報を符号化する間、基準チャネルとして用いられる。
通常、キャリアチャネルは、関与する元のチャネルの総計として形成されるものである。
したがって、上記の技術では、キャリアチャネルだけを処理することができるが、2つ以上の入力チャネルの1つ以上の近似値を生成するためのパラメータデータを処理することができない再生装置に対して安定したモノラル表現をさらに提供する。
バイノーラルキュー符号化(BCC)として周知のオーディオ符号化技術については、米国特許出願公開第2003/0219130A1号、米国特許出願公開第2003/0026441A1号および米国特許出願公開第2003/0035553A1号にも詳細に記載されている。さらに引例として、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「バイノーラルキュー符号化パートII:スキームおよび応用例(Binaural Cue Coding. Part II:Schemes and Applications)」、オーディオおよびスピーチプロシーディング(Audio and Speech Proc.)におけるIEEEトランザクション、11巻、第6号、2003年11月と、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「フレキシブルレンダリングを用いたオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural cue coding applied to audio compression with flexible rendering)」、AES第113回コンベンション、2002年10月、ロサンジェルスとがある。フォーラおよびバウムガルテが著したBCC技術に関する引例の米国特許出願公開公報および2つの引例の技術刊行物は、ここに引例としてすべて組み込まれている。
ICLDおよびICTDパラメータは、最も重要なサウンドソースローカライゼーションパラメータを表すにもかかわらず、これらのパラメータを用いた空間表現は、達成可能な最高品質を制限するだけである。この制限を克服し、高品質のパラメトリック符号化を可能にするために、(J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)およびE.シュイエールス(Schuijers)の「ステレオオーディオのパラメトリック符号化(Parametric coding of stereo audio)」、応用信号処理に関するEURASIPジャーナル(Eurasip J. Applied Signal Proc.)、2005巻、第9号、1305−1322頁に記載のような)パラメトリックステレオは、チャネル間強度差(IIDs)、チャネル間位相差(IPDs)およびチャネル間コヒーレンス(IC)といわれる3つのタイプの空間パラメータを適用する。コヒーレンスパラメータを取込んだ空間パラメータの拡張は、サウンドステージの知覚空間の「拡散性」または空間の「コンパクト性」のパラメータ化を可能にする。
以下に、マルチチャネルオーディオ符号化のための代表的な一般的BCCスキームについて、図12〜図14を参照して、さらに詳細に説明する。図9は、マルチチャネルオーディオ信号の符号化/伝送のための、そのような一般的バイノーラルキュー符号化スキームを示す。BCCエンコーダ112の入力110のマルチチャネルオーディオ入力信号は、ダウンミックスブロック114でダウンミキシングされる。本例では、入力110の元のマルチチャネル信号は、フロント左チャネル、フロント右チャネル、左サラウンドチャネル、右サラウンドチャネルおよびセンターチャネルを有する、5チャネルサラウンド信号である。本発明の好適な実施の形態では、ダウンミックスブロック114は、これらの5つのチャネルを単純に加算して、モノラル信号にすることにより、和信号を生じる。マルチチャネル入力信号を用いて、1つのチャネルを有するダウンミックス信号が得られるような、他のダウンミキシングスキームが周知である。この1つのチャネルは、和信号ライン115に出力される。BCC解析ブロック116により得られたサイド情報は、サイド情報ライン117に出力される。BCC解析ブロックでは、上記で説明したように、チャネル間レベル差(ICLD)およびチャネル間時間差(ICTD)が算出される。BCC解析ブロック116は、チャネル間相関値(ICC値)を算出するためにも形成される。好ましくは量子化され符号化された形式で、和信号およびサイド情報がBCCデコーダ120に送信される。BCCデコーダは、出力マルチチャネルオーディオ信号のサブバンドを生成するために、送信和信号を多数のサブバンドに分解して、スケーリングを行い、遅延して、他の処理を行う。出力121の再構成されたマルチチャネル信号のICLD、ICTDおよびICCパラメータ(キュー)が、BCCエンコーダ112の入力110の元のマルチチャネル信号に対するそれぞれのキューと同様になるように、この処理が実行される。このために、BCCデコーダ120は、BCC合成ブロック122およびサイド情報処理ブロック123を含む。
以下に、図13を参照して、BCC合成ブロック122の内部構成を説明する。ライン115上の和信号が、時間/周波数変換ユニットまたはフィルタバンクFB125に入力される。ブロック125の出力には、オーディオフィルタバンク125が1:1変換を実行する場合、すなわち、N個の時間領域サンプル(クリティカルサブサンプリング)からN個のスペクトル係数を生じる変換の場合、N個のサブバンド信号または、極端な場合では、ブロックとなったスペクトル係数が存在する。
BCC合成ブロック122は、さらに、遅延ステージ126、レベル変更ステージ127、相関処理ステージ128および逆フィルタバンクステージIFB129を備える。ステージ129の出力では、5チャネルサラウンドシステムの場合に、図12に示すように、例えば5つのチャネルを有する再構成されたマルチチャネルオーディオ信号が、1セットのスピーカ124に出力される。
図13に示すように、入力信号s(n)は、エレメント125により、周波数領域またはフィルタバンク領域に変換される。同じ信号のいくつかのバージョンが分岐しているノード130で示されるように得られるように、エレメント125による信号出力は乗算される。元の信号のバージョンの数は、再構成される出力信号における出力チャネルの数と等しい。一般に、ノード130での元の信号の各バージョンが特定の遅延d1、d2、・・・、di、・・・、dNを受ける場合、遅延パラメータは図12のサイド情報処理ブロック123により算出され、BCC解析ブロック116で決定されるように、チャネル間時間差から導出される。
同じことが、乗算パラメータa1、a2、・・・、ai、・・・、aNについて当てはまり、これらについても、BCC解析ブロック116により算出されるように、チャネル間レベル差に基づいてサイド情報処理ブロック123により算出される。
遅延されレベルが操作された信号間の特定の相関がブロック128の出力で得られるように、BCC解析ブロック116により算出されるICCパラメータがブロック128の機能を制御するために用いられる。ステージ126、127、128の順序は、図13に示す場合と異なっていてもよいことに、ここで留意されたい。
オーディオ信号のフレーム単位に関する処理において、BCC解析がフレーム単位で実行され、すなわち、時間可変的、そして周波数単位でも実行されることに、注意すべきである。これは、各スペクトル帯域に対してBCCパラメータが個別に得られるという意味である。これは、さらに、オーディオフィルタバンク125が入力信号を例えば32個のバンドパス信号に分解する場合、BCC解析ブロックは、32個の帯域のそれぞれに対して1セットのBCCパラメータを得るという意味である。当然、図13に詳細に示される、図12のBCC合成ブロック122が、本例の32個の帯域に基づく再構成を実行する。
以下に、図14を参照して、特定のBCCパラメータを決定するセットアップを示す。通常、ICLD、ICTDおよびICCパラメータは、任意のチャネルペア間で定義することができる。ここで概説する1つの方法は、基準チャネルと互いのチャネルとの間で、ICLDおよびICTDパラメータからなる。これについて、図14Aに示す。
ICCパラメータは、別の方法で決定することもできる。一般に大抵の場合、図14Bに示すように、考えられるすべてのチャネルペア間で、エンコーダ内のICCパラメータを推定することができる。この場合、考えられるすべてのチャネルペア間の元のマルチチャネル信号とほぼ同じになるように、デコーダがICCを合成する。しかしながら、一度に最も強力な2つのチャネル間のICCパラメータだけを推定することが提案されていた。このスキームは、図14Cに示され、1つの時点で、チャネル1とチャネル2との間でICCパラメータが推定され、別の時点で、チャネル1とチャネル5との間でICCパラメータが算出される例が示されている。次に、デコーダが、デコーダ内の最も強力なチャネル間のチャネル間相関を合成し、残りのチャネルペアに対するチャネル間コヒーレンスを算出して合成するためのある発見的ルールを適用する。
例えば、送信ICLDパラメータに基づいてパラメータa1、・・・、aNを算出するには、上記引例のAESコンベンション論文5574を参照する。ICLDパラメータは、元のマルチチャネル信号におけるエネルギー分布を表す。一般性を失うことなく、他のすべてのチャネルとフロント左チャネルとの間のエネルギー差を示す4つのICLDパラメータが、図14Aに示される。サイド情報処理ブロック123では、再構成されたすべての出力チャネルの総エネルギーが送信和信号のエネルギーと同じになるように(または比例するように)、乗算パラメータa1、・・・、aNがICLDパラメータから導出される。これらのパラメータを決定するための簡単な方法は、2ステージ処理であり、これは、第1のステージでは、左フロントチャネルの乗算ファクタが1に設定され、図14Aの他のチャネルの乗算ファクタが送信ICLD値から決定される。次に、第2のステージでは、5つのチャネルすべてのエネルギーが算出され、送信和信号のエネルギーと比較される。次に、すべてのチャネルは、すべてのチャネルに対して等しいダウンスケーリングファクタを用いて、ダウンスケーリングされ、ダウンスケーリングファクタは、ダウンスケーリング後、再構成されたすべての出力チャネルの総エネルギーが送信和信号の総エネルギーと等しくなるように、選択される。
当然、乗算ファクタを算出する他の方法もあり、これらは、2ステージ処理を利用せず、1ステージ処理だけを必要とするものである。
遅延パラメータに関して、左フロントチャネルの遅延パラメータd1がゼロに設定される場合、BCCエンコーダから送信される遅延パラメータICTDは、直接用いることができることに留意されたい。遅延を行っても信号のエネルギーを変更しないので、ここでは再スケーリングを行う必要がない。
図14を参照してすでに概説したように、パラメトリックサイド情報、すなわち、チャネル間レベル差(ICLD)、チャネル間時間差(ICTD)またはチャネル間コヒーレンスパラメータ(ICC)は、算出され、5つのチャネルそれぞれに送信されることができる。このことは、通常、1つの5チャネル信号に対して4セットのチャネル間レベル差を送信することを意味している。同じことがチャネル間時間差についても当てはまる。チャネル間コヒーレンスパラメータについては、例えば2セットのこれらのパラメータを送信するだけで十分である。
図13を参照してすでに概説したように、信号の1つのフレームまたは時間部分に対して、レベル差パラメータ、時間差パラメータまたはコヒーレンスパラメータは1つだけではない。むしろ、周波数依存のパラメータ化が行えるように、いくつかの異なる周波数帯域に対してこれらのパラメータが決定される。例えば32の周波数チャネル、すなわち、32の周波数帯域を有するフィルタバンクをBCC解析およびBCC合成に用いることは好ましいので、パラメータは、かなりの量のデータを占有することになる。他のマルチチャネル伝送と比較して、パラメトリック表現ではデータ速度が相当遅くなるが、マルチチャネルサラウンド信号等の3つ以上のチャネルを有する信号を表すために必要なデータ速度を、継続してさらに低減する必要がある。
マルチチャネルオーディオ信号の符号化は、1つのモノラルチャネル中にパラメトリックステレオ符号化を実行するいくつかの既存のモジュールを用いて、うまく実施することができる。国際特許出願国際公開第2004/008805A1号は、どのようにしてパラメトリックステレオコーダを階層的セットアップに順序付けし、所定数の入力オーディオ信号を順次に1つのモノラルチャネルにダウンミックスして行くかを教示している。ダウンミックスされたモノラルチャネルの空間特性を表現するパラメトリックサイド情報は、最終的には、反復ダウンミックスプロセスにおいて順次に生成されるすべてのパラメトリック情報からなる。すなわち、例えば、最終モノラル信号を構築するために関与する3つのステレオからモノラルへのダウンミックス処理がある場合、マルチチャネルオーディオ信号のパラメトリック表現を構築する最終セットのパラメータは、1つのステレオからモノラルへのダウンミックス処理ごとに導出される3セットのパラメータからなる。
従来技術の方法をさらに詳細に説明するために、階層的ダウンミックスエンコーダが図15に示される。図15は、1つのモノラルオーディオチャネル202とパラメトリックサイド情報とに変換される6つの元のオーディオチャネル200a〜200fを示す。そのため、6つの元のオーディオ信号200a〜200fを時間領域から周波数領域に変換する必要があり、これは変換ユニット204によって実行され、オーディオチャネル200a〜200fを周波数領域において対応するチャネル206a〜206fに変換する。階層的アプローチに従って、チャネル206a〜206fは、ペアワイズで3つのモノラルチャネルL、RおよびC(それぞれ、208a、208bおよび208c)にダウンミックスされる。3つのチャネルペアがダウンミックスされる間に、各チャネルペアに対する、元のステレオ信号の空間特性を表現するパラメータセットが導出され、モノラル信号にダウンミックスされる。このようにして、この最初のダウンミックスステップにおいて、3つのパラメータセット210a〜210cが、信号206a〜206fの空間情報を維持するために生成される。
階層的ダウンミックスの次のステップにおいて、チャネル208aおよび208bはチャネル212(LR)にダウンミックスされ、パラメータセット210d(パラメータセット4)を生成する。最終的にただ1つのモノラルチャネルを導出するために、チャネル208cおよび212のダウンミックスが必要で、この結果チャネル214(M)が得られる。これにより第5のパラメータセット210e(パラメータセット5)が生成される。最後に、ダウンミックスされたモノラルオーディオ信号214は、標準の装置で再生可能なオーディオ信号202を導出するために、時間領域に逆変換される。
前述のように、従来技術によるダウンミックスオーディオ信号202のパラメトリック表現は、すべてのパラメータセット210a〜210eからなり、このことは、モノラルオーディオ信号202から元のマルチチャネルオーディオ信号(チャネル200a〜200f)を再構築することを望む場合、すべてのパラメータセット210a〜210eがモノラルダウンミックス信号202のサイド情報として必要だということを意味する。
米国特許出願第11/032,689号(以降、単に「従来技術によるキュー結合」という)は、非階層的符号化スキームにおいて、サイド情報を節減するためにいくつかのキュー値を1つの送信値に結合するためのプロセスを記載している。そのためには、最初に、すべてのチャネルがダウンミックスされ、後に、送信キュー値(これを1つの値にすることも可能)を形成するためにキューコードが結合され、結合は、所定の数学関数により定まり、その中には、入力信号から直接的に導出される空間パラメータが変数として組み込まれる。
2つ(「ステレオ」)またはそれ以上の(「マルチチャネル」)オーディオ入力チャネルをパラメトリック符号化する最新技術は、入力信号から直接空間パラメータを導出する。このようなパラメータの例としては、チャネル間レベル差(ICLD)またはチャネル間強度差(IID)、チャネル間時間遅延(ICTD)またはチャネル間位相差(IPD)、およびチャネル間相関/コヒーレンス(ICC)があり、それぞれ、周波数を選択するやり方で、すなわち、周波数帯域毎に送信される。従来技術によるキュー結合の明細書は、いくつかのキュー値を1つの値に結合してエンコーダからデコーダ側に送信できると教示する。復号化プロセスは、マルチチャネル出力信号を再構成するために、元々個別の送信キュー値の代わりに1つの送信値を用いる。好適な実施の形態において、このスキームは、ICCパラメータに適用される。これが、信号の大部分の空間品質を維持しながら、キューサイド情報のサイズの大幅な削減につながると示されている。しかしながら、これを階層的符号化スキームでどのように活用できるかについては明確でない。
従来技術によるキュー結合に関するその特許出願は、2つの送信ダウンミックスチャネルに基づくシステムを例として、発明の原理を説明している。図15を参照すると、提案された方法において、Lf/LrおよびRf/RrのチャネルペアのICC値は、1つの送信ICCパラメータに結合される。2つの結合ICC値は、フロント左チャネルLfおよびリア左チャネルLrをチャネルLにダウンミックスする間、および、フロント右およびリア右チャネルをチャネルRにダウンミックスする間で得られたものである。したがって、最終的に1つの送信ICCパラメータに結合される2つの結合ICC値は、両方とも元のチャネルのフロント/バック相関についての情報を伝え、これらの2つのICC値の結合は、通常この情報の大部分を維持することになる。LおよびRチャネルを1つのモノラルチャネルにさらにダウンミックスしなければならないとすれば、ダウンミックスチャネルLおよびRの左/右相関についての情報を伝える第3のICC値を得ることになる。従来技術によるキュー結合によれば、3つのICC値を1つの送信ICCパラメータに変換する所定の関数を適用して3つのICC値を結合しなければならないことになる。
このとき、フロント/バック情報を左/右情報と混合するという問題があり、これは、元のマルチチャネルオーディオ信号の再生のためには明らかな不利点である。米国特許出願第11/032,689号においては、左/右情報を保持する2つのダウンミックスチャネル、LおよびRチャネルを送信し、さらにフロント/バック情報を保持する1つのICC値を送信することによって、この問題を回避している。これは、送信される完全な追加のダウンミックスチャネルに起因する大幅なデータ率増加を代償として元のチャネルの空間特性を維持することである。
米国特許出願公開第2003/0219130A1号 米国特許出願公開第2003/0026441A1号 米国特許出願公開第2003/0035553A1号 国際公開第2004/008805A1号 J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)およびE.シュイエールス(Schuijers)の「低ビットレートでの高品質パラメトリック空間オーディオ符号化(High−Quality Parametric Spatial Audio Coding at Low Bitrates)」、AES第116回コンベンション予稿集6072、2004年5月、ベルリン E.シュイエールス(Schuijers)、J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)およびJ.エングデガールド(Engdegard)の「低複雑性パラメトリックステレオ符号化(Low Complexity Parametric Stereo Coding)」、AES第116回コンベンション予稿集6073、2004年5月、ベルリン C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「ステレオおよびマルチチャネルオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural Cue Coding applied to Stereo and Multi−Channel Audio Compression)」、AESコンベンション論文5574、2002年5月、ミュンヘン 「知覚パラメータ化を用いた空間オーディオの効率的な表現(Efficient representation of spatial audio using perceptual paremetrization)」、IEEE WASPAA論文、2001年10月、ニューヨーク州モホンク C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「バイノーラルキュー符号化のための聴覚空間キューの推定(Estimation of auditory spatial cues for binaural cue coding)」、ICASSP論文、2002年5月、フロリダ州オーランド C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「バイノーラルキュー符号化:空間オーディオの新規で効率的な表現(Binaural cue coding:a novel and efficient representation of spatial audio)」、ICASSP論文、2002年5月、フロリダ州オーランド C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「バイノーラルキュー符号化パートII:スキームおよび応用例(Binaural Cue Coding. Part II:Schemes and Applications)」、オーディオおよびスピーチプロシーディング(Audio and Speech Proc.)におけるIEEEトランザクション、11巻、第6号、2003年11月 C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「フレキシブルレンダリングを用いたオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural cue coding applied to audio compression with flexible rendering)」、AES第113回コンベンション、2002年10月、ロサンジェルス J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)およびE.シュイエールス(Schuijers)の「ステレオオーディオのパラメトリック符号化(Parametric coding of stereo audio)」、応用信号処理に関するEURASIPジャーナル(Eurasip J. Applied Signal Proc.)、2005巻、第9号、1305−1322頁
本発明の目的は、階層的符号化スキームとの関連において、コンパクトなサイド情報を用いたマルチチャネルオーディオ信号のパラメトリック表現を生成および用いるための改良された概念を提供することである。
本発明の第1の様態によれば、この目的は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有するオーディオ信号のパラメトリック表現を生成するためのエンコーダによって達成され、エンコーダは、パラメトリック情報を生成するためのジェネレータであって、ジェネレータは、いくつかのチャネルペアを別々に処理し、処理されたチャネルペアに対するレベル情報を導出し、さらに左側からの情報だけを有する第1のチャネルおよび右側からの情報だけを有する第2のチャネルを含むチャネルペアに対するコヒーレンス情報を導出する、ジェネレータと、チャネルペアに対するレベル情報を選定し、さらにコヒーレンス情報を用いて左/右コヒーレンス度を決定することによって、パラメトリック表現を提供するための提供器とを備える。
本発明の第2の様態によれば、この目的は、元のオーディオ信号のパラメトリック表現を処理するためのデコーダによって達成され、元のオーディオ信号は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有し、デコーダは、オーディオ信号のパラメトリック表現を提供するためのレシーバであって、レシーバは、チャネルペアに対するレベル情報を提供し、さらに左チャネルおよび右チャネルを含むチャネルペアに対する左/右コヒーレンス度を提供し、左/右コヒーレンス度は、左側からの情報だけを有する第1のチャネルおよび右側からの情報だけを有する第2のチャネルを含む少なくとも1つのチャネルペア間のコヒーレンス情報を表す、レシーバと、チャネルペアに対するパラメトリック情報を供給するためのプロセッサであって、プロセッサは、パラメトリック表現からレベル情報を選択し、さらに左/右コヒーレンス度を用いて少なくとも1つのチャネルペアに対するコヒーレンス情報を導出し、この少なくとも1つのチャネルペアは、左側からの情報だけを有する第1のチャネルおよび右側からの情報だけを有する第2のチャネルを含む、プロセッサとを備える。
本発明の第3の様態によれば、この目的は、オーディオ信号のパラメトリック表現を生成するための方法によって達成される。
本発明の第4の様態によれば、この目的は、コンピュータ上で動作するときに、上述の方法を実施するコンピュータプログラムによって達成される。
本発明の第5の様態によれば、この目的は、元のオーディオ信号のパラメトリック表現を処理するための方法によって達成される。
本発明の第6の様態によれば、この目的は、コンピュータ上で動作するときに、上述の方法を実施するコンピュータプログラムによって達成される。
本発明の第7の様態によれば、この目的は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有するオーディオ信号のパラメトリック表現を構築することにより生成される符号化オーディオデータによって達成され、パラメトリック表現は、チャネルペアに対するレベル差と、左側からの情報だけを有する第1のチャネルおよび右側からの情報だけを有する第2のチャネルを含むチャネルペアからのコヒーレンス情報から導出される左/右コヒーレンス度とを備える。
マルチチャネルオーディオ信号のパラメトリック表現は、第1および第2のチャネル間のコヒーレンスを表現するコヒーレンス情報が、聴取位置に関して左側からの情報だけを有する第1のチャネルを含みさらに聴取位置に関して右側からの情報だけを有する第2のチャネルを含むチャネルペアに対してだけ階層的符号化処理において導出される場合、コンパクトなサイド情報を用いてオーディオ信号の空間特性をうまく表現する、という発見に本発明は基づいている。階層的処理において元のオーディオ信号の複数のオーディオチャネルが反復して望ましくはモノラルチャネルにダウンミックスされるので、元のオーディオ信号の空間特性をできるだけ良好に表現するために必要な所望の情報を運ぶチャネルペアだけに関与するステップに対する符号化処理の間に適切なサイド情報パラメータを選ぶようにすることができる。このことにより、これらの選ばれたパラメータまたはこれらのパラメータの結合に基づいて元のオーディオ信号のパラメトリック表現を構築することができ、サイド情報サイズを大幅に節減しながら、ダウンミックス信号の空間情報を保持することができる。
提案された概念は、1つの(モノラル)送信チャネルしか利用できない場合においても、キュー値を結合してダウンミックスオーディオ信号のサイド情報の割合を節減することを可能にする。本発明の概念は、エンコーダのいろいろな階層的トポロジーをも可能にする。元のサウンドイメージを忠実に再生するために階層的符号化/復号化アプローチを用いて、どのようにして適切な1つのICC値を導出し、空間オーディオデコーダにおいて適用することができるかを、具体的に明確にする。
本発明の1つの実施の形態は、5.1チャネルオーディオ信号の左フロントおよび左リアチャネルを左マスターチャネルに結合し、同時に、右フロントおよび右リアチャネルを右マスターチャネルに結合する階層的符号化構造を実施する。左チャネルおよび右チャネルを別々に結合して、本発明では、重要な左/右コヒーレンス情報は、主として維持され、第2の符号化ステップにおいて導出され、このステップにおいて、左マスターおよび右マスターチャネルは、ステレオマスターチャネルにダウンミックスされる。このダウンミックス処理の間に、全体システムに対するICCパラメータが導出され、これは、このICCパラメータが、左/右コヒーレンスによく近似するICCパラメータとなるからである。本発明のこの実施の形態において、従来技術における場合のように、任意のチャネルペアを表現する、1セットのICCパラメータに何らかのアーティフィシャルな関数を適用するのではなく、単に、適切な方法において階層的符号化ステップを構成することによって、6つのオーディオチャネルの最も重要な左/右コヒーレンスを表現するICCパラメータを得る。
本発明の前述した実施の形態の変形において、5.1オーディオ信号のセンターチャネルおよび低周波チャネルはセンターマスターチャネルにダウンミックスされ、このチャネルは、主としてセンターチャネルについての情報を保持し、これは、低周波チャネルが、人間によって信号の音源をローカライズすることがほとんどできないような低い周波数を有する信号だけを含んでいるからである。センターマスターチャネルを表現するパラメータによって、前述のようにして導出されるICC値をさらに操作することは利点となる。これは、例えば、エネルギー情報でICC値を重み付けすることによって行うことができ、このエネルギー情報は、ステレオマスターチャネルに関してセンターマスターチャネルを介してどれ位の大きさのエネルギーが送信されるかを示す。
本発明のさらなる実施の形態において、階層的符号化処理は、第1のステップにおいて、5.1オーディオ信号の左フロントおよび右フロントチャネルがフロントマスターチャネルにダウンミックスされる一方で、左リアおよび右リアチャネルはリアマスターチャネルにダウンミックスされるように実行される。したがって、各ダウンミックス処理において、重要な左/右コヒーレンスについての情報を含むICC値が生成される。その後、結合されて送信されたICCパラメータが2つの別個のICC値の結合から導出され、送信ICCパラメータを導出する有利な方法は、チャネルのレベルパラメータを重み付けとして用いて、ICC値の重み付け和を構築することである。
本発明の変形において、センターチャネルおよび低周波チャネルはセンターマスターチャネルにダウンミックスされ、その後、センターマスターチャネルおよびフロントマスターチャネルはステレオマスターチャネルにダウンミックスされる。後者のダウンミックス処理において、センターおよびステレオチャネル間の相関が、受信され、送信ICCパラメータを操作または変形するために用いられ、このようにして、フロントオーディオ信号へのセンター貢献も考慮に入れられる。前述したシステムの主な利点は、オーディオ信号に最も貢献するチャネルが主として送信ICC値を規定するように、コヒーレンス情報を構築できることである。これは、通常、フロントチャネルとなるが、例えば、ミュージックコンサートのマルチチャネル表現において、主にリアチャネルのICC値を用いて、拍手する聴衆の信号を際立たせることもできる。さらなる利点は、マルチチャネルオーディオ信号の空間特性に基づいて、フロントおよびリアチャネル間の重み付けをダイナミックに変化できることである。
本発明の1つの実施の形態において、発明の階層的デコーダは、既存の復号化ステップに必要な数よりも少ない数のICCパラメータを受信する。このデコーダは、各復号化ステップに必要なICCパラメータを受信ICCパラメータから導出することが可能である。
これは、受信ICCパラメータおよび受信ICLD値に基づく導出ルールを用いて、または、これに換えて所定の値を用いて、追加のICCパラメータを導出して行うことができる。
しかしながら、好適な実施の形態において、デコーダは、各個別の復号化ステップに対して1つの送信ICCパラメータを用いることが可能である。これには、最も重要な相関として左/右相関が、本発明の概念内において送信ICCパラメータにおいて維持されるという利点がある。このようにすれば、聴取者は、非常にうまく元の信号に似せている信号の再生を体験することになる。ICCパラメータは再構成された信号の知覚的幅広さを規定していることをここで再述したい。送信後に、デコーダが送信ICCパラメータを変形すると、再構成された信号の知覚的幅広さを表現しているICCパラメータは、階層的再生内において、左/右およびフロント/バックの相関に対してかなり違ってしまうことになる。これは最も不利な点であり、このことは、聴取者が自分の頭を動かしたり回したりすると、信号が知覚的に広がったり狭まったりするのが感じられ、当然ながらこれはとても気に障ることであるからである。これは、1つの受信ICCパラメータを階層的デコーダの復号化ユニットに配信することによって回避することができる。
別の好適な実施の形態において、本発明のデコーダは、フルセットのICC値または1つのICC値を受信することが可能であり、このデコーダは、ビットストリーム内においてストラテジーインディケイションを受信することによって、適用する復号化ストラテジーを認識する。また、このような下位互換性を持つデコーダは、従来技術の環境においても動作が可能で、フルセットのICCデータを送信する従来技術の信号も復号化する。
本発明の好適な実施の形態が添付図面を参照して後に説明されるが、これらの図としては:
図1は、本発明の階層的オーディエンコーダの実施の形態のブロック図を示し、
図2は、本発明のオーディオエンコーダの実施の形態を示し、
図2aは、本発明のオーディオエンコーダのIICパラメータの実行可能な操作スキームを示し、
図3aおよび図3bは、サイドチャネル情報のグラフ表示を示し、
図4は、本発明のオーディオエンコーダの第2の実施の形態を示し、
図5は、本発明のオーディオデコーダの好適な実施の形態のブロック図を示し、
図6は、本発明のオーディオデコーダの実施の形態を示し、
図7は、本発明のオーディオデコーダの別の実施の形態を示し、
図8は、本発明のトランスミッタまたはオーディオレコーダを示し、
図9は、本発明のレシーバまたはオーディオプレーヤを示し、
図10は、本発明の伝送システムを示し、
図11は、従来技術のジョイントステレオエンコーダを示し、
図12は、従来技術のBCCエンコーダ/デコーダ連鎖のブロック図表示を示し、
図13は、BCC合成ブロックの従来技術実施のブロック図を示し、
図14は、BCCパラメータを決定するためのスキームの表示を示し、
図15は、従来技術の階層的エンコーダを示す。
図1は、オーディオ信号のパラメトリック表現を生成する本発明のエンコーダのブロック図を示す。図1は、連続してオーディオチャネルを結合し、さらに1つのチャネルに結合されるチャネルペアの空間特性を表現する空間パラメータを生成するジェネレータ220を示す。図1は、チャネルペア間のレベル差情報を選択することによって、さらにジェネレータ220により生成されるコヒーレンス情報を用いて左/右コヒーレンス度を決定することによって、マルチチャネルオーディオ信号のパラメトリック表現を提供する提供器222をさらに示す。
階層的マルチチャネルオーディオ符号化についての本発明の概念の原理を明示するために、図1は、4つの元のオーディオチャネル224a〜224dを反復して結合して、1つのチャネル226を得る場合を示す。元のオーディオチャネル224aおよび224bは、それぞれ元の4チャネルオーディオ信号の左フロントおよび左リアチャネルを表し、チャネル224cおよび224dは、それぞれ右フロントおよび右リアチャネルを表す。一般性を損なわないように、各種の空間パラメータのうち2つだけが、図1に示される(ICLDおよびICC)。本発明によれば、ジェネレータ220は、重要な左/右コヒーレンス情報を伝えるICCパラメータを結合処理の間に導出することができるというような方法で、オーディオチャネル224a〜224dを結合する。
第1のステップにおいて、左サイド情報だけを含むチャネル224aおよび224bは、左マスターチャネル228a(L)に結合され、さらに右サイド情報だけを含む2つのチャネル224cおよび224dは、右マスターチャネル228b(R)に結合される。この結合の間に、ジェネレータは、2つのICLDパラメータ230aおよび230bを生成し、両方とも、1つのチャネルに結合される2つの元のチャネルのレベル差についての情報を含む空間パラメータである。また、ジェネレータは、1つのチャネルに結合される2つのチャネル間の相関を表現するICCパラメータ232aおよび232bも生成する。ICLDおよびICCパラメータ230a、230b、232aおよび232bは、提供器222に転送される。
階層的生成プロセスの次のステップにおいて、左マスターチャネル228aは、右マスターチャネル228bと結合され、オーディオチャネル226が得られ、ジェネレータは、ICLDパラメータ234およびICCパラメータ236を提供し、両方とも提供器222に送信される。ここで重要なことは、この結合ステップにおいて生成されるICCパラメータ236がオーディオチャネル224a〜224dによって表される元の4チャネルオーディオ信号の重要な左/右コヒーレンス情報を主として表すことに留意することである。
したがって、提供器222は、パラメトリック表現がパラメータ230a、b、232a、b、234および236を備えるように、得られる空間パラメータ230a、b、232a、b、234および236からパラメトリック表現を構築する。
図2は、5.1マルチチャネル信号を1つのモノラル信号に符号化する本発明のオーディオエンコーダの好適な実施の形態を示す。
図2は、3つの変換ユニット240a〜240cと、5つの2対1ダウンミキサ242a〜242eと、パラメータ結合ユニット244と、逆変換ユニット246とを示す。元の5.1チャネルオーディオ信号は、左フロントチャネル248a、左リアチャネル248b、右フロントチャネル248c、右リアチャネル248d、センターチャネル248e、および低周波チャネル248fによって与えられる。ここで重要なことは、左サイド情報248aおよび248bだけを含む1つのチャネルが1つのチャネルペアを形成し、右サイド情報248cおよび248dだけを含むチャネルがもう1つのチャネルペアを形成し、さらに、センターチャネル248eおよび248fが第3のチャネルペアを形成するというような方法で、元チャネルがグループ化されることに留意することである。
変換ユニット240a〜240cは、チャネル248a〜248fを時間領域から、周波数サブバンド領域におけるこれらのスペクトル表現250a〜250fに変換する。第1の階層的符号化ステップ252において、左チャネル250aおよび250bは、左マスターチャネル254aに符号化され、右チャネル250cおよび250dは、右マスターチャネル254bに符号化され、さらにセンターチャネル250eおよび低周波チャネル250fは、センターマスターチャネル256に符号化される。この第1の階層的符号化ステップ252の間に、関与する3つの2対1エンコーダ242a〜242cは、ダウンミックスされたチャネル254a、254bおよび256を生成し、さらに、重要な空間パラメータセット260a、260bおよび260cを生成し、ここで、パラメータセット260a(パラメータセット1)は、チャネル250aおよび250b間の空間情報を表現し、パラメータセット260b(パラメータセット2)は、チャネル250cおよび250d間の空間関係を表現し、さらに、パラメータセット260c(パラメータセット3)は、チャネル250eおよび250f間の空間関係を表現する。
第2の階層的ステップ262において、左マスターチャネル254aおよび右マスターチャネル254bは、ステレオマスターチャネル264にダウンミックスされ、空間パラメータセット266(パラメータセット4)を生成し、このパラメータセット266のICCパラメータは、重要な左/右相関情報を含む。パラメータセット266から結合されたICC値を構築するために、パラメータセット266を、データ接続268を介してパラメータ結合ユニット244に転送することができる。第3の階層的符号化ステップ272において、ステレオマスターチャネル264は、得られるモノラルチャネル274を形成するために、センターマスターチャネル256と結合される。このダウンミックス処理の間に導出されるパラメータセット276を、データ接続278を介してパラメータ結合ユニット244に転送することができる。最後に、得られるチャネル274は、オーディオチャネル248a〜248fによって表される元の5.1チャネル信号の最終モノラル表現となるモノラルダウンミックスオーディオ信号280を構築するために、逆変換ユニット246によって時間領域に変換される。
モノラルダウンミックスオーディオ信号280から元の5.1チャネルの信号を再構成するために、5.1チャネルオーディオ信号のパラメトリック表現がさらに必要である。図2に示されるツリー構造では、左フロントおよびバックチャネルがL信号254aに結合されることが分かる。同様に、右フロントおよびバックチャネルはR信号254bに結合される。引き続いて、LおよびR信号の結合が実行され、パラメータセット4(266)を導出する。この階層的構造の場合において、結合されたICC値を導出する簡単な方法は、パラメータセット4のICC値を選び、これを結合ICC値とし、次にこれをパラメータ結合ユニット244によって5.1チャネル信号のパラメトリック表現に組み込むことである。
もっと高度な方法は、図2aに示すように、(例えば、パラメータセット5のパラメータを用いることによって)センターチャネルの作用を考慮に入れることもできる。
例として、LR(264)チャネルおよびパラメータセット5のCチャネル(256)に含まれるエネルギーのエネルギー比E(LR)/E(C)を、ICC値を操作するために用いることができる。ほとんどのエネルギーがLRパスから来ている場合、送信ICCの値は、パラメータセット4のICC値ICC(LR)に近付くはずである。ほとんどのエネルギーがCパス256から来ている場合、送信ICCの値は、図2aに示すように、次第に1に近付くはずである。この図は、エネルギー比が所定の閾値286を超えたときに2つの極値間で切り替えること(操作関数288a)による、または、これら極値間をスムースに移行すること(操作関数288b)による、ICCパラメータの操作を実施する2つの可能な方法を示す。
図3aおよび図3bは、従来技術を用いて階層的エンコーダ構造から導出される5.1オーディオチャネルのパラメトリック表現(図3a)と、オーディオコーディングに対する本発明の概念を用いたもの(図3b)との比較を示す。
図3aは、従来技術によって提供されるような1つの時間フレームおよび離散周波数間隔のパラメトリック表現を示す。図2の2対1エンコーダ242a〜242eの各々は、ICLDおよびICCパラメータの1つのペアを導出し、このパラメータペアの元が図3a中に示される。従来技術のアプローチによれば、2対1エンコーダ242a〜242eによって提供されるすべてのパラメータを、5.1チャネルオーディオ信号を再構築するためのサイド情報として、ダウンミックスモノラルオーディオ信号280とともに送信する必要がある。
図3bは、本発明の概念に従って導出されるパラメータを示す。2対1エンコーダ242a〜242eの各々は、1つのパラメータ、ICLDパラメータだけに直接的に貢献する。1つの送信ICCパラメータICCCは、パラメータ結合ユニット244によって導出されるのであって、2対1エンコーダ242a〜242eによって直接提供されるのではない。図3aおよび図3bから明らかなように、階層的エンコーダに対する本発明の概念によって、従来技術に比べてサイド情報データの量を大幅に削減することができる。
図4は、階層的符号化処理において、コンパクトなサイド情報を供給して、5.1チャネルオーディオ信号をモノラルオーディオ信号に符号化することを可能にする、本発明の別の好適な実施の形態を示す。ハードウェア構造の原理は図2に記載したものと同じなので、2つの図において同一のアイテムには同一の番号を付ける。違いは、入力チャネル248a〜248fのグループ化の違い、つまり順番の違いによるものであり、個々のチャネルは、図2におけるダウンミックス順序とは異なった順序でモノラルチャネル274にダウンミックスされる。したがって、図4に示す本発明の実施の形態を理解するために非常に重要である図2の記載と異なる態様についてのみ以下に説明する。
左フロントチャネル248aおよび右フロントチャネル284cは、チャネルペアを形成するためにともにグループ化され、センターチャネル248eおよび低周波チャネル248fは、別の入力チャネルペアを形成し、さらに5.1オーディオ信号の第3の入力チャネルペアは、左リアチャネル248bおよび右リアチャネル248dで形成される。
第1の階層的符号化ステップ252において、左フロントチャネル250aおよび右フロントチャネル250cは、フロントマスターチャネル290(F)にダウンミックスされ、センターチャネル250eおよび低周波チャネル250fは、センターマスターチャネル292(C)にダウンミックスされ、さらに左リアチャネル250bおよび右リアチャネル250dは、リアマスターチャネル294(S)にダウンミックスされる。パラメータセット300a(パラメータセット1)は、フロントマスターチャネル290を表現し、パラメータセット300b(パラメータセット2)は、センターマスターチャネル292を表現し、さらにパラメータセット300c(パラメータセット3)は、リアマスターチャネル294を表現する。
ここで重要なことは、パラメータセット300aおよびパラメータセット300cが、元のチャネル248a〜248f間の重要な左/右相関を表現する情報を保持することに留意することである。そのため、パラメータセット300aおよびパラメータセット300cは、データリンク302aおよび302bを介してパラメータ結合ユニット244に提供される。
第2の符号化ステップ262において、フロントマスターチャネル290およびセンターマスターチャネル292は、純フロントチャネル304にダウンミックスされ、パラメータセット300d(パラメータセット4)を生成する。このパラメータセット300dも、データリンク306を介してパラメータ結合ユニット244に提供される。
第3の階層的符号化ステップ272において、純フロントチャネル304は、リアマスターチャネル294とともに得られるチャネル274(M)にダウンミックスされ、続いてこれは、最終モノラルダウンミックスオーディオチャネル280を形成するために、逆変換ユニット246によって時間領域に変換される。また、純フロントチャネル304およびリアマスターチャネル294のダウンミックスにより生成されるパラメータセット300e(パラメータセット5)も、データリンク310を介してパラメータ結合ユニット244に提供される。
図4のツリー構造は、最初に、フロントとリアとに別々に、左右のチャネルの結合を実行する。これにより、基本的な左/右の相関/コヒーレンスは、パラメータセット1および3(300a、300c)に存在する。結合ICC値は、パラメータ結合ユニット244によって、パラメータセット1および3のICC値間で重み付け平均を構築することによって、構築することができる。これは、より大きな重み付けが、より強いチャネルペア(Lf/Rf対Lr/Rr)に与られるということである。次により重み付け和を構築する結合ICCパラメータICCCを導出することによって、同様なことが達成でき、
ICCC=(A*ICC1+B*ICC2)/(A+B)
ここで、Aは、ICC1に対応するチャネルペア内のエネルギーを意味し、Bは、ICC2に対応するチャネルペア内のエネルギーを意味する。
別の実施の形態において、さらに高度な方法として、(例えば、パラメータセット4のパラメータを考慮に入れることによって)センターチャネルの作用を考慮に入れることもできる。
図5は、元の4チャネルオーディオ信号のパラメトリック表現である受信されたコンパクトなサイド情報を処理する本発明のデコーダを示す。図5は、4チャネルオーディオ信号のコンパクトなパラメトリック表現を提供するレシーバ310と、コンパクトなパラメトリック表現を処理して4チャネルオーディオ信号の完全なパラメトリック表現を供給し、受信モノラルオーディオ信号から4チャネルオーディオ信号を再構成することを可能にするプロセッサ312とを備える。
レシーバ310は、空間パラメータICLD(B)314、ICLD(F)316、ICLD(R)318およびICC320を受信する。提供されたパラメトリック表現は、パラメータ314〜320からなり、元のオーディオチャネル324a〜324dの空間特性を表現する。
最初のアップミックスステップとして、プロセッサ312は、2つのチャネル324aおよび324b(RfおよびLf)の結合である第1のチャネルペア326aと、2つのチャネル324cおよび324d(RrおよびLr)の結合である第2のチャネルペア326bとを表現する空間パラメータを供給する。そのためには、チャネルペアのレベル差314が必要となる。両方のチャネルペア326aおよび326bは、左チャネルおよび右チャネルを含むので、これらのチャネルペア間の差は、主にフロント/バック相関を表現する。したがって、主として左/右コヒーレンスについての情報を伝えている受信ICCパラメータ320は、左/右コヒーレンス情報が望ましくはチャネルペア326aおよび326bに対する個別のICCパラメータを供給するために用いられるように、プロセッサ312によって処理される。
次のステップにおいて、プロセッサ312は、チャネル326aから単一のオーディオチャネル324aおよび324bを、チャネル326bからチャネル324cおよび324dを再構成することを可能にする適切な空間パラメータを供給する。そのためには、プロセッサ312は、2つのチャネルペアに対して、レベル差316および318を供給し、さらに、適切なICC値を供給しなければならなく、これは、チャネルペア326aおよび326bの各々が重要な左/右コヒーレンス情報を含むからである。
1つの例において、プロセッサ312は、単に、結合された受信ICC値320をアップミックスチャネルペア326aおよび326bに提供することができる。この代わりに、受信された結合ICC値320は、例えば重み付けを2つのチャネルペアのレベル差314に基づくようにして、2つのチャネルペアに対する個別のICC値を導出するために、重み付けすることができる。
本発明の好適な実施の形態において、プロセッサは、チャネル324a〜324dの再生の間に余分なアーチファクトが導入されることを回避するために、1つ1つのアップミックスステップに対して受信ICCパラメータ320を提供する。
図6は、元の5.1オーディオ信号のコンパクトなパラメトリック表現を用いて、モノラルオーディオ信号を5.1マルチチャネルオーディオ信号に復号化する、本発明による階層的復号化手順を組み込んだデコーダの好適な実施の形態を示す。
図6は、変換ユニット350と、パラメータ処理ユニット352と、5つの1対2デコーダ354a〜354eと、3つの逆変換ユニット356a〜356cとを示す。
図6による本発明のデコーダの実施の形態は、図2に記載したエンコーダと対をなすものであって、モノラルダウンミックスオーディオチャネル358を受信するように設計され、このチャネルは、最終的に、オーディオチャネル360a(lf)、360b(lr)、360c(rf)、360d(rr)、360e(co)および360f(lfe)からなる5.1オーディオ信号にアップミックスされる。ダウンミックスチャネル358(m)は、受信され、変換ユニット350を用いて、時間領域から周波数領域に、その周波数表現362に変換される。パラメータ処理ユニット352は、ダウンミックスチャネル358と並行して、結合されたコンパクトな空間パラメータセット364を受信する。
階層的復号化処理の第1のステップ363において、モノラルダウンミックスチャネル362は、ステレオマスターチャネル364(LR)およびセンターマスターチャネル366(C)にアップミックスされる。
階層的復号化処理の第2のステップ368において、ステレオマスターチャネル364は、左マスターチャネル370(L)および右マスターチャネル372(R)にアップミックスされる。
復号化処理の第3のステップにおいて、左マスターチャネル370は、左フロントチャネル374aおよび左リアチャネル374bにアップミックスされ、右マスターチャネル372は、右フロントチャネル374cおよび右リアチャネル374dにアップミックスされ、さらにセンターマスターチャネル366は、センターチャネル374eおよび低周波チャネル374fにアップミックスされる。
最後に、6つの単一のオーディオチャネル374a〜374fは、逆変換ユニット356a〜356cによって、時間領域における表現に変換され、このようにして、6つのオーディオチャネル360a〜360fを有する再構成された5.1オーディオ信号を構築する。5.1オーディオ信号の元の空間特性を保持するためには、パラメータ処理ユニット352、特にパラメータ処理ユニットが個別のパラメータセット380a〜380eを提供する方法、特にパラメータ処理ユニット352が個別のパラメータセット380a〜380eを導出する方法が極めて重要である。
受信された結合ICCパラメータは、元の6チャネルオーディオ信号の重要な左/右コヒーレンスを表現する。したがって、パラメータ処理ユニット352は、送信されてきたパラメータセット364内において最初に受信された空間値の左/右相関情報に似せて、パラメータセット4(380d)のICC値を構築する。最も単純な実施の形態では、パラメータ処理ユニット352は、受信された結合ICCパラメータをそのまま用いる。
本発明によるデコーダの別の好適な実施の形態が図7に示され、図7のデコーダは、図4のエンコーダと対になるものである。
図7のエンコーダは、図6のデコーダと同じ機能ブロックを備えるので、以下の説明は、図6のものと異なる階層的復号化処理におけるステップに限定する。これは、元の5.1オーディオ信号が、図6で受信されるものと異なる方法でダウンミックスされるので、モノラル信号362が、異なる順序および異なるチャネル結合でアップミックスされるというのが主な理由である。
階層的復号化処理の第1のステップ363において、モノラル信号362は、リアマスターチャネル400(S)および純フロントチャネル402(CF)にアップミックスされる。
第2のステップ368において、純フロントチャネル402は、フロントマスターチャネル404およびセンターマスターチャネル406にアップミックスされる。
第3の復号化ステップ372において、フロントマスターチャネルは、左フロントチャネル374aおよび右フロントチャネル374cにアップミックスされ、センターマスターチャネル406は、センターチャネル374eおよび低周波チャネル374fにアップミックスされ、さらにリアマスターチャネル400は、左リアチャネル374bおよび右リアチャネル374dにアップミックスされる。最後に、6つのオーディオチャネル374a〜374fは、周波数領域から時間領域表現360a〜360fに変換され、再構成された5.1オーディオ信号を構築する。
エンコーダによってサイド情報として符号化された元の5.1信号の空間特性を維持するために、パラメータ処理ユニット352は、1対2デコーダ354a〜354eに対して、パラメータセット410a〜410eを供給する。第3のアップミックスプロセス372においてLf、Rf、LrおよびRrチャネルを構築するために重要な左/右相関情報が必要なので、パラメータ処理ユニット352は、パラメータセット410aおよび410cを構築するために単に送信ICCパラメータを取っている最も簡単な実施の形態において、パラメータセット410aおよび420cにおいて適切なICC値を供給し供給する。可能な代替例において、受信ICCパラメータに適切な重み関数を適用し、例えばその重み付けがフロントマスターチャネル404およびリアマスターチャネル400において送信されるエネルギーによって決まるようにして、受信ICCパラメータをパラメータセット410aおよび410cに対する個別のパラメータに変換することができる。また、もっと高度な実施の形態において、パラメータ処理ユニット352は、パラメータセット5およびパラメータセット4(410a、410b)に対する個別のICC値を供給するために、センターチャネルの情報を考慮に入れることができる。
図8は、エンコーダ220、入力インタフェース502および出力インタフェース504を有する本発明のオーディオトランスミッタまたはレコーダ500を示す。
トランスミッタ/レコーダ500の入力インタフェース502には、オーディオ信号を供給することができる。オーディオ信号は、トランスミッタ/レコーダ内において本発明のエンコーダ220を用いて符号化され、符号化された表現は、トランスミッタ/レコーダ500の出力インタフェース504から出力される。次に、符号化された表現を送信または記憶媒体に保存することができる。
図9は、本発明のデコーダ312、ビットストリーム入力部522およびオーディオ出力部524を有する本発明のレシーバまたはオーディオプレーヤ520を示す。
本発明のレシーバ/オーディオプレーヤ520の入力部522には、ビットストリームを入力することができる。次に、ビットストリームは、デコーダ312を用いて復号化され、復号化された信号は、本発明のレシーバ/オーディオプレーヤ520の出力部524から出力または再生される。
図10は、本発明のトランスミッタ500および本発明のレシーバ520を備える伝送システムを示す。
トランスミッタ500の入力インタフェース502に入力されたオーディオ信号は、符号化され、トランスミッタ500の出力部504からレシーバ520の入力部522に転送される。レシーバは、オーディオ信号を復号化し、オーディオ信号を再生するかまたはその出力部524から出力する。
説明した本発明のデコーダの例は、マルチチャネルオーディオ信号をモノラルオーディオ信号にダウンミックスする。当然のことであるが、これに換えて、マルチチャネル信号をステレオ信号にダウンミックスすることも可能であり、例えば、図2および図4で説明した実施の形態については、階層的符号化処理における1つのステップをバイパスできる。また、他のどのような数の得られるチャネルも可能である。
オーディオ信号の空間特性のコンパクトなパラメトリック表現を供給/使用して、マルチチャネルオーディオ情報を階層的に符号化または復号化するための本提案の方法を、主として、複数のICC情報を1つの送信ICC値に結合することによりサイド情報を縮小するものとして説明している。ここで、前記で説明した本発明は、決して1つの結合ICC値の使用だけに限定されるものでないことを指摘しておく。他に、例えば、1つが重要な左/右相関を表現し、他の1つがフロント/バック相関を表現する、2つの結合値を生成することができる。
これを例えば図2に示した本発明の実施の形態においてうまく実施することができ、一方では左フロントチャネル250aおよび左リアチャネル250bが左マスターチャネル254aに結合され、他方では右フロントチャネル250cおよび右リアチャネル250dが右マスターチャネル254bに結合される。このようにして、これらの2つの符号化ステップによって、元のオーディオ信号のフロントバック相関についての情報を生成し、これにより、フロント/バック相関情報を保持して、追加のICC値を提供するために容易に処理することができる。
さらに、本発明の好適な変形例において、パラメータを個別に送信する従来技術を用いることと、エンコーダからデコーダに送信されるサイド情報信号に応じて、結合された送信パラメータを用いることとの両方をすることができる符号化/復号化処理を有すると有利である。このようなシステムは、(個別に送信されるパラメータを用いて)より高度な表現精度を有利に実現し、さらに、もう一つのやり方として、(結合パラメータを用いて)サイド情報の低いビット比率を有利に実現することもできる。
通常、この設定は、用いられる伝送システムが受容できるサイド情報の量など、アプリケーション要件に応じて、ユーザによって選択される。このようにすれば、同一の統合エンコーダ/デコーダアーキテクチャを用いることができ、さらに、幅広い範囲にわたるサイド情報ビット使用率/精度の妥協点の範囲内において動作が可能となる。これは、いろいろな要求および送信能力を伴う、幅広い範囲の可能性あるアプリケーションをカバーするために重要な能力である。
このように有利な実施の形態の別の変形例において、エンコーダによって動作モードを自動的に選択でき、例えば、結合された送信モードが用いられた場合、復号化された値の理想的結果からの逸脱を解析する。有意な逸脱が見られない場合、結合パラメータ送信が用いられる。デコーダは、それ自体に、提供されたサイド情報の解析に基づいて、どのモードを用いるのが適切かを判断させることも可能である。例えば、仮に、提供されるパラメータがただ1つしかない場合、デコーダは、自動的に、結合された送信パラメータを用いる復号化モードに切り替える。
本発明の別の有利な変形例において、エンコーダ/デコーダは、オーディオ再生品質とサイド情報の望ましい低ビット使用率とのできるだけ最良の妥協点を確実に得るために、結合された送信パラメータを用いるモードから、個別に送信パラメータを用いるモードに自動的に切り替える。
図2、図4、図6および図7におけるエンコーダ/デコーダの好適な実施の形態から分かるように、これらのユニットは、同じ機能ブロックを用いている。そこで、別の好適な実施の形態では、1つのハウジング内において同一のハードウェアを用いてエンコーダとデコーダとを構築する。
本発明の他の実施の形態では、チャネルペアとして異なるチャネルをともにグループ化することによって、いろいろな符号化スキーム間をダイナミックに切り替えることができ、所定のマルチチャネルオーディオ信号に対する最良のオーディオ品質を提供する符号化スキームをダイナミックに用いることができる。
モノラルダウンミックスチャネルをマルチチャネルオーディオ信号のパラメトリック表現と同時に送信する必要はない。また、パラメトリック表現だけを送信し、マルチチャネルオーディオ信号のモノラルダウンミックスを例えばレコードとして既に所有している聴取者が、自分の既存のマルチチャネル装置およびパラメトリックサイド情報を用いてマルチチャネル信号を再生することができるようにすることも可能である。
要するに、本発明は、既知の従来技術のパラメータから、これらの結合パラメータをうまく決定することを可能にする。階層的エンコーダ/デコーダ構造においてパラメータを結合するという本発明の概念を適用して、マルチチャネルオーディオ信号をモノラルベースのパラメトリック表現にダウンミックスして、低率のサイド情報(=ビット率の削減)で、元の信号の精度のよいパラメータ化を得ることができる。
エンコーダが、送信されなければならないパラメータの数を削減することを目的として、いくつかのパラメータを結合することが本発明の目的の1つである。次に、デコーダは、図15に示した例の従来技術のシステムにおける場合のように、デフォルトのパラメータ値を用いる代わりに、送信されてきたパラメータの中から欠けているパラメータを導出する。
この利点は、図15に例を示した、従来技術を用いた階層的パラメトリックマルチチャネルオーディオコーダの実施の形態を再度検討してみれば、明らかである。これにおいて、入力信号(左フロント、右フロント、左リア、右リア、センターおよび低周波エンハンスメントチャネルにそれぞれ対応するLf、Rf、Lr、Rr、CおよびLFE)は、必要な時間/周波数タイルを得るために、セグメント化されて周波数領域に変換される。得られる信号は、ペアワイズ法で連続して結合される。例えば、信号LfおよびLrは、信号「L」に結合される。対応する空間パラメータセット(1)が、信号LfおよびLr間の(すなわち1つ以上のIID、ICC、IPDからなる)空間特性をモデル化するために、生成される。図15に示す従来技術による実施の形態において、この処理は、1つの出力チャネル(M)が得られるまで繰り返され、出力チャネルは、5つのパラメータセットを伴う。その結果、従来技術の階層的符号化技術は、すべてのパラメータセットの送信が必要ということになる。
しかしながら、すべてのパラメータセットは、あり得るすべての空間パラメータに対する値を含む必要はない。例えば、図15におけるパラメータセット1は、IIDおよびICCパラメータからなってもよく、また、パラメータセット3は、IDDパラメータだけからなってもよい。特定のパラメータが特定のセットに対して送信されない場合、従来技術の階層的デコーダは、これらのパラメータに対してデフォルト値を適用する(例えばICC=+1、IPD=0など)。このように、各パラメータセットは、特定の信号の結合だけを表し、残りのチャネルペアの空間特性を表現しない。
パラメータが送信されない信号の空間特性についての知識が上記のように欠けてしまうことは、本発明の概念を用いれば回避することができ、この場合、エンコーダは、元の信号の最も重要な空間特性が維持されるように特定のパラメータを結合する。
例えば、ICCパラメータが1つの値に結合される場合、結合パラメータを、すべての個別のパラメータの代わりとしてデコーダにおいて用いることができる(または、デコーダにおいて用いられる個別のパラメータを、送信されたパラメータから導出することができる)。デコーダによる再構成の後に、元のマルチチャネル信号のサウンドイメージにできるだけ近いイメージが維持されるように、エンコーダのパラメータ結合処理を実行することが重要な特徴となる。すなわち、ICCパラメータの送信にあたっては、元のサウンドフィールドの幅(非相関)を保持する必要がある。
最も重要なICC値は、左/右軸間の値であり、これは、通常、聴取設定において、聴取者は前を向いているからである。これは、オーディオ信号の適切なパラメトリック表現が反復符号化処理間に得られ、得られる結合ICC値が主として左/右の非相関を表すように、階層的符号化構造を構築することを有利に考慮に入れることができる。これについては、後記で本発明の好適な実施の形態を説明する際に、さらに詳しく説明する。
本発明の符号化/復号化スキームは、以下の2つの手段により、空間オーディオシステムの階層的構造を用いて、エンコーダからデコーダに送信されるパラメータの数の削減を可能にする。
・個別のエンコーダパラメータを結合して結合パラメータを形成し、これが個別のパラメータの代わりに送信される。パラメータの結合は、信号のサウンドイメージ(L/Rの相関/コヒーレンスを含む)ができるだけ維持されるように実行される。
・送信された結合パラメータが、いくつかの送信された個別のパラメータの代わりに、デコーダにおいて用いられる(または、実際に用いられるパラメータが、結合パラメータから導出される)。
本発明の方法の特定の実現要求によっては、本発明の方法は、ハードウェアまたはソフトウェアで実施することができる。この実施は、本発明の方法が実行されるように、プログラム可能なコンピュータシステムと協働する、デジタル記憶媒体、特に、それに格納される電子的に読み取り可能な制御信号を有するディスク、DVDまたはCDを用いて、実行することができる。したがって、一般に、本発明は、機械読み取り可能なキャリアに格納されるプログラムコードを有するコンピュータプログラム製品であり、そのプログラムコードは、そのコンピュータプログラム製品がコンピュータ上で実行されるときに、本発明の方法を実行するために働く。したがって、言い換えれば、本発明の方法は、コンピュータプログラムがコンピュータ上で実行されるときに、少なくとも1つの本発明の方法を実行するためのプログラムコードを有するコンピュータプログラムである。
前述のように、特定の実施の形態を参照して特に図示して説明してきたが、本発明の精神、範囲を逸脱することなく、形態や詳細を様々変更することができることが、当業者ならば理解できるであろう。ここに開示するより広い概念から逸脱することなく、異なる実施の形態に適用して、変更が可能なことが、特許請求の範囲から理解できるであろう。
図1は、本発明の階層的オーディエンコーダの実施の形態のブロック図を示す。 図2は、本発明のオーディオエンコーダの実施の形態を示す。 図2aは、本発明のオーディオエンコーダのIICパラメータの実行可能な操作スキームを示す。 図3aは、サイドチャネル情報のグラフ表示を示す。 図3aは、サイドチャネル情報のグラフ表示を示す。 図4は、本発明のオーディオエンコーダの第2の実施の形態を示す。 図5は、本発明のオーディオデコーダの好適な実施の形態のブロック図を示す。 図6は、本発明のオーディオデコーダの実施の形態を示す。 図7は、本発明のオーディオデコーダの別の実施の形態を示す。 図8は、本発明のトランスミッタまたはオーディオレコーダを示す。 図9は、本発明のレシーバまたはオーディオプレーヤを示す。 図10は、本発明の伝送システムを示す。 図11は、従来技術のジョイントステレオエンコーダを示す。 図12は、従来技術のBCCエンコーダ/デコーダ連鎖のブロック図表示を示す。 図13は、BCC合成ブロックの従来技術実施のブロック図を示す。 図14は、BCCパラメータを決定するためのスキームの表示を示す。 図15は、従来技術の階層的エンコーダを示す。

Claims (39)

  1. 聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの右チャネルを有するオーディオ信号のパラメトリック表現を生成するためのエンコーダであって、
    パラメトリック情報を生成するためのジェネレータであって、前記ジェネレータは、いくつかのチャネルペアを別々に処理し、処理されたチャネルペアに対するレベル情報を導出し、さらに前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含むチャネルペアに対するコヒーレンス情報を導出する、ジェネレータと、
    チャネルペアに対する前記レベル情報を選択することと、前記コヒーレンス情報を用いて左/右コヒーレンス度を決定し、さらに前記左/右コヒーレンス度を出力データストリームに導入することとによって、前記パラメトリック表現を提供するための提供器とを備える、エンコーダ。
  2. 前記ジェネレータは、
    左フロントチャネルlfおよび左リアチャネルlrを処理してlf/lrレベル情報を導出し、前記左フロントチャネルlfおよび前記左リアチャネルlrの結合が左マスターチャネルLMを形成するようにし、さらに右フロントチャネルrfおよび右リアチャネルrrを処理してrf/rrレベル情報を導出し、前記右フロントチャネルrfおよび前記右リアチャネルrrの結合が右マスターチャネルRMを形成するようにし、さらに
    前記左マスターチャネルLMおよび前記右マスターチャネルRMを処理してlm/rmレベル情報を導出しさらに前記コヒーレンス情報を導出し、前記左マスターチャネルLMおよび前記右マスターチャネルRMの結合がステレオマスターチャネルSMを形成するようにする、請求項1に記載のエンコーダ。
  3. 前記ジェネレータは、センターチャネルceおよび低周波チャネルloを処理してce/loレベル情報を導出し、前記センターチャネルceおよび前記低周波チャネルloの結合がセンターマスターチャネルCMを形成するようにする、請求項2に記載のエンコーダ。
  4. 前記ジェネレータは、前記ステレオマスターチャネルSMおよび前記センターマスターチャネルCMを処理してsm/cmレベル情報を導出し、前記ステレオマスターチャネルSMおよび前記センターマスターチャネルCMの結合がダウンミックスチャネルを形成するようにし、さらに
    前記提供器は、前記コヒーレンス情報および前記sm/cmレベル情報を用いて前記左/右コヒーレンス度を決定する、請求項3に記載のエンコーダ。
  5. 前記提供器は、前記sm/cmレベル情報が、前記センターマスターチャネルCMにおけるエネルギーよりも前記ステレオマスターチャネルSMにおけるエネルギーの方が多いことを示す場合に、前記sm/cmレベル情報が、前記センターマスターチャネルCMにおけるエネルギーの方が多いことを示す状態と比べて、前記左/右コヒーレンス度を前記コヒーレンス情報により近づけ、前記状態の場合に、前記左/右コヒーレンス度を1により近づけるように、前記sm/cmレベル情報に応じて前記左/右コヒーレンス度を算出する、請求項4に記載のエンコーダ。
  6. 前記提供器は、前記sm/cmレベル情報が、前記ステレオマスターチャネルSMにおけるエネルギーおよび前記センターマスターチャネルCMにおけるエネルギーの比率が所定の値を超えることを示す場合に、前記sm/cmレベル情報が、前記ステレオマスターチャネルSMにおける前記エネルギーの前記センターマスターチャネルCMにおける前記エネルギーに対する比率が前記所定の値以下のままであることを示す状態と比べて、前記左/右コヒーレンス度を前記コヒーレンス情報に設定し、前記状態の場合に、前記左/右コヒーレンス度を1に設定するように、前記sm/cmレベル情報に応じて前記左/右コヒーレンス度を算出する、請求項4に記載のエンコーダ。
  7. 前記提供器は、前記左/右コヒーレンス度が前記パラメトリック表現内において前記オーディオ信号の唯一のコヒーレンス情報であるように、前記パラメトリック表現を提供する、請求項1に記載のエンコーダ。
  8. 前記ジェネレータは、左フロントチャネルlfおよび右フロントチャネルrfを処理してlf/rfレベル情報および第1のコヒーレンス情報を導出し、前記左フロントチャネルlfおよび前記右フロントチャネルrfの結合がフロントマスターチャネルFMを形成するようにし、さらに左リアチャネルlrおよび右リアチャネルrrを処理してlr/rrレベル情報を導出しさらに第2のコヒーレンス情報を導出し、前記左リアチャネルlrおよび前記右リアチャネルrrの結合がリアマスターチャネルRMを形成するようにし、さらに
    前記提供器は、前記第1のコヒーレンス情報および前記第2のコヒーレンス情報を結合して前記左/右コヒーレンス度を決定する、請求項1に記載のエンコーダ。
  9. 前記提供器は、前記フロントマスターチャネルFMのレベル情報および前記リアマスターチャネルRMのレベル情報を重み付けとして用いて、前記第1および前記第2のコヒーレンス情報の重み付け和に基づいて前記左/右コヒーレンス度を決定する、請求項8に記載のエンコーダ。
  10. 前記ジェネレータは、センターチャネルceおよび低周波チャネルloを処理してce/loレベル情報を導出し、前記センターチャネルceおよび前記低周波チャネルloの結合がセンターマスターチャネルCMを形成するようにする、請求項8に記載のエンコーダ。
  11. 前記ジェネレータは、前記フロントマスターチャネルFMおよび前記センターマスターチャネルCMを処理してfm/cmレベル情報を導出し、前記フロントマスターチャネルFMおよび前記センターマスターチャネルCMの結合が純フロントチャネルPFを形成するようにし、さらに
    前記提供器は、前記第1および前記第2のコヒーレンス情報を結合してさらに前記fm/cmレベル情報を用いて前記左/右コヒーレンス度を決定する、請求項10に記載のエンコーダ。
  12. 前記ジェネレータは、前記純フロントチャネルPFおよび前記リアマスターチャネルRMを処理してpf/rmレベル情報を導出し、前記純フロントチャネルPFおよび前記リアマスターチャネルRMの結合がダウンミックスチャネルを形成するようにする、請求項11に記載のエンコーダ。
  13. 前記ジェネレータは、前記チャネルペアを所定の長さの離散時間フレームで処理する、請求項1に記載のエンコーダ。
  14. 前記ジェネレータは、前記チャネルペアを所定のバンド幅の離散周波数間隔で処理する、請求項1に記載のエンコーダ。
  15. 前記ジェネレータは、聴取位置に関して前記フロント側からの情報だけを有する第1のチャネルおよび前記バック側からの情報だけを有する第2のチャネルを含むチャネルペアに対する追加のコヒーレンス情報を導出し、さらに
    前記提供器は、前記追加のコヒーレンス情報を用いてフロント/バックコヒーレンス度を決定する前記パラメトリック表現を提供する、請求項1に記載のエンコーダ。
  16. 元のオーディオ信号のパラメトリック表現を処理するためのデコーダであって、前記元のオーディオ信号は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有し、
    前記オーディオ信号の前記パラメトリック表現を提供するためのレシーバであって、前記レシーバは、チャネルペアに対するレベル情報を提供し、さらに左チャネルおよび右チャネルを含むチャネルペアに対する左/右コヒーレンス度を提供し、前記左/右コヒーレンス度は、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む少なくとも1つのチャネルペア間のコヒーレンス情報を表す、レシーバと、
    チャネルペアに対するパラメトリック情報を供給するためのプロセッサであって、前記プロセッサは、前記パラメトリック表現からレベル情報を選択し、さらに前記左/右コヒーレンス度を用いて少なくとも1つのチャネルペアに対するコヒーレンス情報を導出し、前記少なくとも1つのチャネルペアは、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む、プロセッサとを備える、デコーダ。
  17. 前記レシーバは、
    元の左フロントチャネルlfおよび元の左リアチャネルlrのチャネルペアに対するlf/lrレベル情報を提供し、前記元の左フロントチャネルlfおよび前記元の左リアチャネルlrの結合が左マスターチャネルLMを形成するようにし、
    元の右フロントチャネルrfおよび元の右リアチャネルrrのチャネルペアに対するrf/rrレベル情報を提供し、前記元の右フロントチャネルrfおよび前記元の右リアチャネルrrの結合が右マスターチャネルRMを形成するようにし、
    前記左マスターチャネルLMおよび前記右マスターチャネルRMのチャネルペアに対するlm/rmレベル情報を提供し、前記左マスターチャネルLMおよび前記右マスターチャネルRMの結合がステレオマスターチャネルSMを形成するようにし、さらに
    前記プロセッサは、前記左/右コヒーレンス度を用いて前記左マスターチャネルLMおよび前記右マスターチャネルRMに対するコヒーレンス情報を提供し、
    前記デコーダは、アップミキサをさらに備え、前記アップミキサは、
    前記lm/rmレベル情報および前記左/右コヒーレンス度を用いて前記ステレオマスターチャネルSMから前記左マスターチャネルLMおよび前記右マスターチャネルRMを生成するための第1の1対2アップミキサと、
    前記lf/lrレベル情報および所定のコヒーレンス情報を用いて前記左マスターチャネルLMから前記元の左フロントチャネルlfおよび前記元の左リアチャネルlrを生成するための第2の1対2アップミキサと、
    前記rf/rrレベル情報および所定のコヒーレンス情報を用いて前記右マスターチャネルRMから前記元の右フロントチャネルrfおよび前記元の右リアチャネルrrを生成するための第3の1対2アップミキサとを有する、請求項16に記載のデコーダ。
  18. 前記レシーバは、元のセンターチャネルceおよび元の低周波チャネルloのチャネルペアに対するce/loレベル情報を提供し、前記元のセンターチャネルceおよび前記元の低周波チャネルloの結合がセンターマスターチャネルCMを形成するようにし、さらに
    前記アップミキサは、前記ce/loレベル情報および所定のコヒーレンス情報を用いて前記センターマスターチャネルCMから前記元のセンターチャネルceおよび前記元の低周波チャネルloを生成するための第4の1対2アップミキサをさらに備える、請求項17に記載のデコーダ。
  19. 前記レシーバは、前記ステレオマスターチャネルSMおよび前記センターマスターチャネルCMのチャネルペアに対するsm/cmレベル情報を提供し、前記ステレオマスターチャネルSMおよび前記センターマスターチャネルCMの結合がダウンミックスチャネルを形成するようにし、さらに
    前記アップミキサは、前記sm/cmレベル情報および所定のコヒーレンス情報を用いて前記ダウンミックスチャネルから前記ステレオマスターチャネルSMおよび前記センターマスターチャネルCMを生成するための第5の1対2アップミキサをさらに備える、請求項18に記載のデコーダ。
  20. 前記レシーバは、
    元の左フロントチャネルlfおよび元の右フロントチャネルrfのチャネルペアに対するlf/rfレベル情報を提供し、前記元の左フロントチャネルlfおよび前記元の右フロントチャネルrfの結合がフロントマスターチャネルFMを形成するようにし、
    元の左リアチャネルlrおよび元の右リアチャネルrrのチャネルペアに対するlr/rrレベル情報を提供し、前記元の左リアチャネルlrおよび前記元の右リアチャネルrrの結合がリアマスターチャネルRMを形成するようにし、さらに
    前記プロセッサは、前記左/右コヒーレンス度を用いて前記元の左フロントチャネルlfおよび前記元の右フロントチャネルrfに対する第1のコヒーレンス情報を供給し、さらに前記元の左リアチャネルlrおよび前記元の右リアチャネルrrに対する第2のコヒーレンス情報を供給し、
    前記デコーダは、アップミキサをさらに備え、前記アップミキサは、
    前記lf/rfレベル情報および前記左/右コヒーレンス度を用いて前記フロントマスターチャネルFMから前記元の左フロントチャネルlfおよび前記元の右フロントチャネルrfを生成するための第1の1対2アップミキサと、
    前記lr/rrレベル情報および前記左/右コヒーレンス度を用いて前記リアマスターチャネルRMから前記元の左リアチャネルlrおよび前記元の右リアチャネルrrを生成するための第2の1対2アップミキサとを有する、請求項16に記載のデコーダ。
  21. 前記レシーバは、元のセンターチャネルceおよび元の低周波チャネルloのチャネルペアに対するce/loレベル情報を提供し、前記元のセンターチャネルceおよび前記元の低周波チャネルloの結合がセンターマスターチャネルCMを形成するようにし、さらに
    前記アップミキサは、前記ce/loレベル情報および所定のコヒーレンス情報を用いて前記センターマスターチャネルCMから前記元のセンターチャネルcoおよび前記元の低周波チャネルloを生成するための第3の1対2アップミキサをさらに備える、請求項20に記載のデコーダ。
  22. 前記レシーバは、前記フロントマスターチャネルFMおよび前記センターマスターチャネルCMのチャネルペアに対するfm/cmレベル情報を提供し、前記フロントマスターチャネルFMおよび前記センターマスターチャネルCMの結合が純フロントチャネルPFを形成するようにし、さらに
    前記アップミキサは、前記fm/cmレベル情報および所定のコヒーレンス情報を用いて前記純フロントチャネルPFから前記フロントマスターチャネルFMおよび前記センターマスターチャネルCMを生成するための第4の1対2アップミキサをさらに備える、請求項21に記載のデコーダ。
  23. 前記レシーバは、前記純フロントチャネルPFおよび前記リアマスターチャネルRMのチャネルペアに対するpf/rmレベル情報を提供し、前記純フロントチャネルPFおよび前記リアマスターチャネルRMの結合がダウンミックスチャネルを形成するようにし、さらに
    前記アップミキサは、前記pf/rmレベル情報および所定のコヒーレンス情報を用いて前記ダウンミックスチャネルから前記純フロントチャネルPFおよび前記リアマスターチャネルRMを生成するための第5の1対2アップミキサをさらに備える、請求項22に記載のデコーダ。
  24. 前記レシーバは、聴取位置に関してフロント側からの情報だけを有する第1のチャネルおよびバック側からの情報だけを有する第2のチャネルを含むチャネルペアに対する追加のフロント/バックコヒーレンス度を提供し、さらに
    前記プロセッサは、前記フロント/バックコヒーレンス度を用いて少なくとも1つのチャネルペアに対するコヒーレンス情報を供給し、前記少なくとも1つのチャネルペアは、前記フロント側からの情報だけを有する第1のチャネルおよび前記バック側からの情報だけを有する第2のチャネルを含む、請求項16に記載のデコーダ。
  25. 前記プロセッサは、受信された左/右コヒーレンスを前記コヒーレンス度として配信することによってすべてのチャネルペアに対するコヒーレンス度を導出する、請求項16に記載のデコーダ。
  26. 前記レシーバは、
    チャネルペアに対するレベル情報を提供し、さらに左チャネルおよび右チャネルを含むチャネルペアに対する左/右コヒーレンス度を提供し、前記左/右コヒーレンス度は、聴取位置に関して前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む少なくとも1つのチャネルペア間のコヒーレンス情報を表す、第1のモードで動作し、または
    チャネルペアに対する前記レベル情報および同じチャネルペアに対する前記コヒーレンス度を提供する第2のモードで動作し、さらに
    前記プロセッサは、チャネルペアに対するパラメトリック情報を供給し、
    前記第1のモードにおいて、前記プロセッサは、前記パラメトリック表現から前記レベル情報を選択し、さらに前記左/右コヒーレンス度を用いて少なくとも1つのチャネルペアに対する前記コヒーレンス情報を導出し、前記少なくとも1つのチャネルペアは、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含み、または
    前記第2のモードにおいて、前記プロセッサは、前記パラメトリック表現から前記レベル情報を選択し、さらに前記パラメトリック表現から前記コヒーレンス情報を選択する、請求項16に記載のデコーダ。
  27. 前記レシーバは、受信されたモード情報を用いて動作モードを選択するためのモードレシーバをさらに備え、前記モード情報は、用いられる前記第1または前記第2のモードを示す、請求項26に記載のデコーダ。
  28. 前記レシーバは、前記左/右コヒーレンス度を前記元の信号の唯一のコヒーレンス情報として提供する、請求項16に記載のデコーダ。
  29. 聴取位置に関して少なくとも2つの元の左チャネルおよび少なくとも2つの元の右チャネルを有するオーディオ信号のパラメトリック表現を生成するための方法であって、前記方法は、
    いくつかのチャネルペアを別々に処理し、処理されたチャネルペアに対するレベル情報を導出することと、左側からの情報だけを有する第1のチャネルおよび右側からの情報だけを有する第2のチャネルを含むチャネルペアに対するコヒーレンス情報を導出することとによって、パラメトリック情報を生成する工程と、
    伝送ペアに対するレベル情報を選択することと、前記コヒーレンス情報を用いて左/右コヒーレンス度を決定し、さらに前記左/右コヒーレンス度を出力データストリームに導入することとによって、前記パラメトリック表現を提供する工程とを備える、方法。
  30. 元のオーディオ信号のパラメトリック表現を処理するための方法であって、前記元のオーディオ信号は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有し、前記方法は、
    チャネルペアに対するレベル情報を提供することと、左チャネルおよび右チャネルを含むチャネルペアに対する左/右コヒーレンス度を提供することとによって、前記オーディオ信号の前記パラメトリック表現を提供する工程であって、前記左/右コヒーレンス度は、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む少なくとも1つのチャネルペア間のコヒーレンス情報を表す、工程と、
    前記パラメトリック表現からレベル情報を選択することと、前記左/右コヒーレンス度を用いて少なくとも1つのチャネルペアに対するコヒーレンス情報を導出することとによって、チャネルペアに対するパラメトリック情報を供給する工程であって、前記少なくとも1つのチャネルペアは、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む、工程とを備える、方法。
  31. サイド情報を有する符号化されたオーディオデータであって、前記サイド情報は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有するオーディオ信号のパラメトリック表現を備え、前記パラメトリック表現は、チャネルペアに対するレベル差と、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含むチャネルペアからのコヒーレンス情報から導出される左/右コヒーレンス度とを備え、前記パラメトリック表現は、前記聴取位置に関して同じ側の元のチャネル間のコヒーレンス度を含まない、オーディオデータ。
  32. サイド情報を有する符号化されたオーディオデータが格納されたコンピュータ読み取り可能な記憶媒体であって、前記サイド情報は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有するオーディオ信号のパラメトリック表現を備え、前記パラメトリック表現は、チャネルペアに対するレベル差と、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含むチャネルペアからのコヒーレンス情報から導出される左/右コヒーレンス度とを備え、前記パラメトリック表現は、前記聴取位置に関して同じ側の元のチャネル間のコヒーレンス度を含まない、記憶媒体。
  33. 元のオーディオ信号のパラメトリック表現を処理するためのデコーダを有するレシーバまたはオーディオプレーヤであって、前記元のオーディオ信号は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有し、
    前記オーディオ信号の前記パラメトリック表現を提供するためのレシーバであって、前記レシーバは、チャネルペアに対するレベル情報を提供し、さらに左チャネルおよび右チャネルを含むチャネルペアに対する左/右コヒーレンス度を提供し、前記左/右コヒーレンス度は、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む少なくとも1つのチャネルペア間のコヒーレンス情報を表す、レシーバと、
    チャネルペアに対するパラメトリック情報を供給するためのプロセッサであって、前記プロセッサは、前記パラメトリック表現からレベル情報を選択し、さらに前記左/右コヒーレンス度を用いて少なくとも1つのチャネルペアに対するコヒーレンス情報を導出し、前記少なくとも1つのチャネルペアは、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む、プロセッサとを備える、レシーバまたはオーディオプレーヤ。
  34. 聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有するオーディオ信号のパラメトリック表現を生成するためのエンコーダを有するトランスミッタまたはオーディオレコーダであって、
    パラメトリック情報を生成するためのジェネレータであって、前記ジェネレータは、いくつかのチャネルペアを別々に処理し、処理されたチャネルペアに対するレベル情報を導出し、さらに前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含むチャネルペアに対するコヒーレンス情報を導出する、ジェネレータと、
    チャネルペアに対する前記レベル情報を選択することと、前記コヒーレンス情報を用いて左/右コヒーレンス度を決定し、さらに前記左/右コヒーレンス度を出力データストリームに導入することとによって、前記パラメトリック表現を提供する提供器とを備える、トランスミッタまたはオーディオレコーダ。
  35. オーディオを受信または再生する方法であって、前記方法は、元のオーディオ信号のパラメトリック表現を処理するための方法を有し、前記元のオーディオ信号は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有し、前記方法は、
    チャネルペアに対するレベル情報を提供することと、左チャネルおよび右チャネルを含むチャネルペアに対する左/右コヒーレンス度を提供することとによって、前記オーディオ信号の前記パラメトリック表現を提供する工程であって、前記左/右コヒーレンス度は、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む少なくとも1つのチャネルペア間のコヒーレンス情報を表す、工程と、
    前記パラメトリック表現からレベル情報を選択することと、前記左/右コヒーレンス度を用いて少なくとも1つのチャネルペアに対するコヒーレンス情報を導出することとによって、チャネルペアに対するパラメトリック情報を供給する工程であって、前記少なくとも1つのチャネルペアは、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む、工程とを備える、方法。
  36. オーディオを送信または録音する方法であって、前記方法は、聴取位置に関して少なくとも2つの元の左チャネルおよび少なくとも2つの元の右チャネルを有するオーディオ信号のパラメトリック表現を生成するための方法を有し、前記方法は、
    いくつかのチャネルペアを別々に処理し、処理されたチャネルペアに対するレベル情報を導出することと、左側からの情報だけを有する第1のチャネルおよび右側からの情報だけを有する第2のチャネルを含むチャネルペアに対するコヒーレンス情報を導出することとによって、パラメータ情報を生成する工程と、
    伝送ペアに対するレベル情報を選択することと、前記コヒーレンス情報を用いて左/右コヒーレンス度を決定し、さらに前記左/右コヒーレンス度を出力データストリームに導入することとによって、前記パラメトリック表現を提供する工程とを備える、方法。
  37. トランスミッタおよびレシーバを有する伝送システムであって、前記トランスミッタは、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有するオーディオ信号のパラメトリック表現を生成するためのエンコーダを有し、前記トランスミッタは、
    パラメトリック情報を生成するためのジェネレータであって、前記ジェネレータは、いくつかのチャネルペアを別々に処理し、処理されたチャネルペアに対するレベル情報を導出し、さらに前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含むチャネルペアに対するコヒーレンス情報を導出する、ジェネレータと、
    チャネルペアに対する前記レベル情報を選択することと、前記コヒーレンス情報を用いて左/右コヒーレンス度を決定し、さらに前記左/右コヒーレンス度を出力データストリームに導入することとによって、前記パラメトリック表現を提供する提供器とを備え、さらに
    前記レシーバは、元のオーディオ信号のパラメトリック表現を処理するためのデコーダを有し、前記元のオーディオ信号は、聴取位置に関して左側に少なくとも2つの元の左チャネルおよび右側に少なくとも2つの元の右チャネルを有し、前記レシーバは、
    前記オーディオ信号の前記パラメトリック表現を提供するためのレシーバであって、前記レシーバは、チャネルペアに対するレベル情報を提供し、さらに左チャネルおよび右チャネルを含むチャネルペアに対する左/右コヒーレンス度を提供し、前記左/右コヒーレンス度は、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む少なくとも1つのチャネルペア間のコヒーレンス情報を表す、レシーバと、
    チャネルペアに対するパラメトリック情報を供給するためのプロセッサであって、前記プロセッサは、前記パラメトリック表現からレベル情報を選択し、さらに前記左/右コヒーレンス度を用いて少なくとも1つのチャネルペアに対するコヒーレンス情報を導出し、前記少なくとも1つのチャネルペアは、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む、プロセッサとを備える、伝送システム。
  38. 送信および受信の方法であって、前記送信の方法は、聴取位置に関して少なくとも2つの元の左チャネルおよび少なくとも2つの元の右チャネルを有するオーディオ信号のパラメトリック表現を生成するための方法を有し、前記送信の方法は、
    いくつかのチャネルペアを別々に処理し、処理されたチャネルペアに対するレベル情報を導出することと、左側からの情報だけを有する第1のチャネルおよび右側からの情報だけを有する第2のチャネルを含むチャネルペアに対するコヒーレンス情報を導出することとによって、パラメータ情報を生成する工程と、
    伝送ペアに対するレベル情報を選択することと、前記コヒーレンス情報を用いて左/右コヒーレンス度を決定し、さらに前記左/右コヒーレンス度を出力データストリームに導入することによって、前記パラメトリック表現を提供する工程とを備え、さらに
    前記受信の方法は、元のオーディオ信号のパラメトリック表現を処理するための方法を有し、前記元のオーディオ信号は、聴取位置に関して前記左側に少なくとも2つの元の左チャネルおよび前記右側に少なくとも2つの元の右チャネルを有し、前記受信の方法は、
    チャネルペアに対するレベル情報を提供することと、左チャネルおよび右チャネルを含むチャネルペアに対する左/右コヒーレンス度を提供することとによって、前記オーディオ信号の前記パラメトリック表現を提供する工程であって、前記左/右コヒーレンス度は、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む少なくとも1つのチャネルペア間のコヒーレンス情報を表す、工程と、
    前記パラメトリック表現からレベル情報を選択することと、前記左/右コヒーレンス度を用いて少なくとも1つのチャネルペアに対するコヒーレンス情報を導出することとによって、チャネルペアに対するパラメトリック情報を供給する工程であって、前記少なくとも1つのチャネルペアは、前記左側からの情報だけを有する第1のチャネルおよび前記右側からの情報だけを有する第2のチャネルを含む、工程とを備える、送信および受信の方法。
  39. コンピュータ上で動作するときに、請求項29、請求項30、請求項35、請求項36または請求項38のいずれかに記載の方法を実行するためのプログラムコードを有するコンピュータ。
JP2007535185A 2005-04-15 2006-02-01 コンパクトなサイド情報を用いたマルチチャネルの階層的オーディオ符号化 Active JP4519919B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US67154405P 2005-04-15 2005-04-15
US11/314,711 US7961890B2 (en) 2005-04-15 2005-12-21 Multi-channel hierarchical audio coding with compact side information
PCT/EP2006/000875 WO2006108462A1 (en) 2005-04-15 2006-02-01 Multi-channel hierarchical audio coding with compact side-information

Publications (2)

Publication Number Publication Date
JP2008516275A true JP2008516275A (ja) 2008-05-15
JP4519919B2 JP4519919B2 (ja) 2010-08-04

Family

ID=36190759

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007535185A Active JP4519919B2 (ja) 2005-04-15 2006-02-01 コンパクトなサイド情報を用いたマルチチャネルの階層的オーディオ符号化

Country Status (12)

Country Link
US (1) US7961890B2 (ja)
EP (1) EP1869667B1 (ja)
JP (1) JP4519919B2 (ja)
KR (1) KR100878367B1 (ja)
CN (1) CN101031959B (ja)
BR (1) BRPI0605865B1 (ja)
ES (1) ES2740104T3 (ja)
MY (1) MY147652A (ja)
PL (1) PL1869667T3 (ja)
RU (1) RU2367033C2 (ja)
TW (1) TWI314840B (ja)
WO (1) WO2006108462A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013524281A (ja) * 2010-04-09 2013-06-17 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
JP2013528822A (ja) * 2010-04-09 2013-07-11 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオエンコーダ、オーディオデコーダ、及び複素数予測を使用したマルチチャンネルオーディオ信号処理方法

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP2009508176A (ja) * 2005-09-14 2009-02-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
CN101297353B (zh) * 2005-10-26 2013-03-13 Lg电子株式会社 编码和解码多声道音频信号的方法及其装置
KR100953641B1 (ko) * 2006-01-19 2010-04-20 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
WO2007091845A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
EP1989920B1 (en) * 2006-02-21 2010-01-20 Koninklijke Philips Electronics N.V. Audio encoding and decoding
KR100773562B1 (ko) 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
MX2009003570A (es) * 2006-10-16 2009-05-28 Dolby Sweden Ab Codificacion mejorada y representacion de parametros para codificacion de objetos de mezcla descendente de multicanal.
CA2673624C (en) * 2006-10-16 2014-08-12 Johannes Hilpert Apparatus and method for multi-channel parameter transformation
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
EP2097895A4 (en) * 2006-12-27 2013-11-13 Korea Electronics Telecomm DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION
ES2593822T3 (es) * 2007-06-08 2016-12-13 Lg Electronics Inc. Método y aparato para procesar una señal de audio
BRPI0806228A8 (pt) * 2007-10-16 2016-11-29 Panasonic Ip Man Co Ltd Dispositivo de sintetização de fluxo, unidade de decodificação e método
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
KR101392546B1 (ko) * 2008-09-11 2014-05-08 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 마이크로폰 신호를 기반으로 공간 큐의 세트를 제공하는 장치, 방법 및 컴퓨터 프로그램과, 2채널 오디오 신호 및 공간 큐의 세트를 제공하는 장치
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
ES2415155T3 (es) 2009-03-17 2013-07-24 Dolby International Ab Codificación estéreo avanzada basada en una combinación de codificación estéreo izquierda/derecha o central/lateral seleccionable de manera adaptativa y de codificación estéreo paramétrica
WO2010105695A1 (en) * 2009-03-20 2010-09-23 Nokia Corporation Multi channel audio coding
KR20110022252A (ko) * 2009-08-27 2011-03-07 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
RU2577199C2 (ru) * 2009-10-20 2016-03-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство для обеспечения представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, устройство для обеспечения битового потока, представляющего многоканальный звуковой сигнал, способы, компьютерная программа и битовый поток, использующий передачу сигналов с контролем искажения
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
KR101641685B1 (ko) * 2010-03-29 2016-07-22 삼성전자주식회사 멀티채널 오디오의 다운믹스 방법 및 장치
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
JP5533502B2 (ja) * 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
EP2464146A1 (en) 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a pre-calculated reference curve
EP2691951B1 (en) 2011-03-28 2016-08-24 Dolby Laboratories Licensing Corporation Reduced complexity transform for a low-frequency-effects channel
US9830917B2 (en) 2013-02-14 2017-11-28 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
EP2956935B1 (en) * 2013-02-14 2017-01-04 Dolby Laboratories Licensing Corporation Controlling the inter-channel coherence of upmixed audio signals
US9478224B2 (en) 2013-04-05 2016-10-25 Dolby International Ab Audio processing system
PL2992529T3 (pl) 2014-07-28 2017-03-31 Telefonaktiebolaget Lm Ericsson (Publ) Wyszukiwanie kształtu przez piramidowy kwantyzator wektorowy
EP2980789A1 (en) * 2014-07-30 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhancing an audio signal, sound enhancing system
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
US20190096410A1 (en) * 2016-03-03 2019-03-28 Nokia Technologies Oy Audio Signal Encoder, Audio Signal Decoder, Method for Encoding and Method for Decoding
EP3301673A1 (en) * 2016-09-30 2018-04-04 Nxp B.V. Audio communication method and apparatus
GB2574239A (en) * 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
GB2576769A (en) * 2018-08-31 2020-03-04 Nokia Technologies Oy Spatial parameter signalling
CN110070878B (zh) * 2019-03-26 2021-05-04 苏州科达科技股份有限公司 音频码流的解码方法及电子设备
WO2024073401A2 (en) * 2022-09-30 2024-04-04 Sonos, Inc. Home theatre audio playback with multichannel satellite playback devices

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09505193A (ja) * 1994-03-18 1997-05-20 フラウンホーファー・ゲゼルシャフト ツア フェルデルンク デル アンゲワンテン フォルシュンク アインゲトラーゲナー フェライン 複数のオーディオ信号を符号化する方法
US20030219130A1 (en) * 2002-05-24 2003-11-27 Frank Baumgarte Coherence-based audio coding and synthesis
US20050074127A1 (en) * 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
WO2005101370A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Apparatus and method for generating a level parameter and apparatus and method for generating a multi-channel representation

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3912605B4 (de) 1989-04-17 2008-09-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
WO1992005556A1 (en) 1990-09-19 1992-04-02 N.V. Philips' Gloeilampenfabrieken Record carrier on which a main data file and a control file have been recorded, method of and device for recording the main data file and the control file, and device for reading the record carrier
ES2138076T3 (es) 1993-05-05 2000-01-01 Koninkl Philips Electronics Nv Sistema de transmision que comprende al menos un codificador.
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6539357B1 (en) 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
TWI235004B (en) 2002-05-22 2005-06-21 Hitachi Ltd Data output apparatus and data output method
WO2004008806A1 (en) 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09505193A (ja) * 1994-03-18 1997-05-20 フラウンホーファー・ゲゼルシャフト ツア フェルデルンク デル アンゲワンテン フォルシュンク アインゲトラーゲナー フェライン 複数のオーディオ信号を符号化する方法
US20030219130A1 (en) * 2002-05-24 2003-11-27 Frank Baumgarte Coherence-based audio coding and synthesis
US20050074127A1 (en) * 2003-10-02 2005-04-07 Jurgen Herre Compatible multi-channel coding/decoding
WO2005101370A1 (en) * 2004-04-16 2005-10-27 Coding Technologies Ab Apparatus and method for generating a level parameter and apparatus and method for generating a multi-channel representation

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013524281A (ja) * 2010-04-09 2013-06-17 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
JP2013525829A (ja) * 2010-04-09 2013-06-20 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
JP2013525830A (ja) * 2010-04-09 2013-06-20 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
JP2013528822A (ja) * 2010-04-09 2013-07-11 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオエンコーダ、オーディオデコーダ、及び複素数予測を使用したマルチチャンネルオーディオ信号処理方法

Also Published As

Publication number Publication date
BRPI0605865B1 (pt) 2019-09-03
WO2006108462A1 (en) 2006-10-19
TW200701822A (en) 2007-01-01
RU2367033C2 (ru) 2009-09-10
BRPI0605865A (pt) 2007-12-18
JP4519919B2 (ja) 2010-08-04
TWI314840B (en) 2009-09-11
US20060233380A1 (en) 2006-10-19
EP1869667B1 (en) 2019-05-08
EP1869667A1 (en) 2007-12-26
ES2740104T3 (es) 2020-02-05
CN101031959A (zh) 2007-09-05
KR100878367B1 (ko) 2009-01-15
CN101031959B (zh) 2011-06-22
KR20070088461A (ko) 2007-08-29
PL1869667T3 (pl) 2019-11-29
MY147652A (en) 2012-12-31
US7961890B2 (en) 2011-06-14
RU2007104337A (ru) 2008-08-10

Similar Documents

Publication Publication Date Title
JP4519919B2 (ja) コンパクトなサイド情報を用いたマルチチャネルの階層的オーディオ符号化
US20200335115A1 (en) Audio encoding and decoding
CN103489449B (zh) 音频信号译码器、提供上混信号表示型态的方法
US8296155B2 (en) Method and apparatus for decoding a signal
RU2355046C2 (ru) Устройство и способ для формирования многоканального сигнала или набора параметрических данных
RU2430430C2 (ru) Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования
KR100924577B1 (ko) 오디오 소스의 파라메트릭 조인트 코딩
JP5450085B2 (ja) オーディオ処理方法及び装置
KR101010464B1 (ko) 멀티 채널 신호의 파라메트릭 표현으로부터 공간적 다운믹스 신호의 생성
RU2388068C2 (ru) Временное и пространственное генерирование многоканальных аудиосигналов
KR101146841B1 (ko) 바이노럴 오디오 신호를 생성하기 위한 방법 및 장치
JP4987736B2 (ja) オーディオ断片またはオーディオデータストリームの符号化ステレオ信号を生成するための装置および方法
RU2406165C2 (ru) Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов
US20100153118A1 (en) Audio encoding and decoding
RU2485605C2 (ru) Усовершенствованный метод кодирования и параметрического представления кодирования многоканального объекта после понижающего микширования
RU2395854C2 (ru) Способ и устройство для обработки медиасигнала

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100519

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4519919

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140528

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250