JP2008519301A - ステレオ互換性のあるマルチチャネルオーディオ符号化 - Google Patents

ステレオ互換性のあるマルチチャネルオーディオ符号化 Download PDF

Info

Publication number
JP2008519301A
JP2008519301A JP2007539523A JP2007539523A JP2008519301A JP 2008519301 A JP2008519301 A JP 2008519301A JP 2007539523 A JP2007539523 A JP 2007539523A JP 2007539523 A JP2007539523 A JP 2007539523A JP 2008519301 A JP2008519301 A JP 2008519301A
Authority
JP
Japan
Prior art keywords
parameters
spatial
stereo
parameter
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007539523A
Other languages
English (en)
Other versions
JP4616349B2 (ja
Inventor
ラルス ヴィレモエス
ハイコ プルンハーゲン
ヨナス レーデン
ヨナス エングデガルド
イェルーン ブレーバールト
エリク スフエイエルス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Original Assignee
Koninklijke Philips NV
Dolby International AB
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Dolby International AB, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008519301A publication Critical patent/JP2008519301A/ja
Application granted granted Critical
Publication of JP4616349B2 publication Critical patent/JP4616349B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transceivers (AREA)

Abstract

マルチチャネルオーディオ信号の再構成を計算するためにモノラルダウンミックス信号とともに使用されることに適したパラメータを有するマルチチャネルオーディオ信号のパラメトリック表現(12)は、デコーダ使用可能なステレオパラメータ(24)とこのデコーダ使用可能なステレオパラメータ(24)とともに1つまたは複数の空間パラメータ(20)を表現する1つまたは複数の空間パラメータ(26)に関する情報とを有するパラメトリック表現(12)を得る、1つまたは複数の空間パラメータ(20)とステレオパラメータ(22)とを組み合わせることによって、パラメトリック表現(12)を生成するために、パラメータコンバイナ(18)が用いられるときに、ステレオ下位互換性のある方法で効率的に導出することができる。
【選択図】図1

Description

本発明は、マルチチャネルオーディオ符号化に関し、特に、パラメトリックステレオ再生環境に対して完全に下位互換性のあるマルチチャネルオーディオ信号のパラメトリック表現の生成および使用の概念に関する。
本発明は、パラメトリックステレオパラメータを用いた2チャネルステレオ信号の符号化と互換性のある方法で空間オーディオパラメータを用いたオーディオ信号のマルチチャネル表現の符号化に関する。本発明は、空間オーディオパラメータとパラメトリックステレオパラメータとを効率的に符号化し、符号化されたパラメータを下位互換性のある方法でビットストリームに埋め込むための新しい方法を教示する。特に、本発明は、復号化されたステレオまたはマルチチャネルオーディオ信号の品質を損わずに、下位互換ビットストリームにおけるパラメトリックステレオおよび空間オーディオパラメータの総ビットレートを極力低減することを目的とする。復号化されたステレオ信号の品質の多少の低下が許容される場合は、総ビットレートをさらに下げることができる。
近年、マルチチャネルオーディオの再生技術は、ますます重要になっている。5つまたはそれ以上の独立したオーディオチャネルを有するマルチチャネルオーディオ信号の効率的な伝送を目的として、ステレオまたはマルチチャネル信号のいくつかの圧縮方法が開発されている。マルチチャネルオーディオ信号のパラメトリック符号化のための最近のアプローチ(パラメトリックステレオ(PS)、バイノーラルキュー符号化(BCC)など)は、ダウンミックス信号(モノラルの場合もいくつかのチャネルを含む場合もある)と、その知覚空間サウンドステージを特徴付ける「空間キュー」ともいわれるパラメトリックサイド情報とによってマルチチャネルオーディオ信号を表す。
マルチチャネルエンコーダは、通常、少なくとも2つのチャネルを入力として受信し、1つまたは複数のキャリアチャネルとパラメトリックデータとを出力する。パラメトリックデータは、デコーダにおいて元のマルチチャネル信号の近似値を計算できるように導出される。通常、キャリアチャネル(チャネル群)は、基礎となる信号の比較的細かい表現を提供するサブバンドサンプル、スペクトル係数、時間領域サンプルなどを含み、他方、パラメトリックデータは、スペクトル係数のこのようなサンプルを含まないが、特定の再構成アルゴリズムを制御するための制御パラメータを代わりに含む。このような再構成は、時間シフト、周波数シフト、位相シフト、乗算による重み付けなどを含むこともできる。したがって、パラメトリックデータは、信号または関連チャネルの比較的粗い表現のみを含む。
バイノーラルキュー符号化(BCC)技術は、たとえば、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「ステレオおよびマルチチャネルオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural Cue Coding applied to Stereo and Multi−Channel Audio Compression)」、AESコンベンション論文5574、2002年5月、ミュンヘンや、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の共著である「バイノーラルキュー符号化のための聴覚空間キューの推定(Estimation of auditory spatial cues for binaural cue coding)」および「バイノーラルキュー符号化:空間オーディオの通常で効率的な表現(Binaural cue coding:a normal and efficient representation of spatial audio)」、ICASSPの2つの出版物、2002年5月、フロリダ州オーランドなどの複数の出版物に記載されている。
BCC符号化では、多数のオーディオ入力チャネルは、オーバーラップウィンドウを有するDFT(離散フーリエ変換)に基づく変換を用いて、スペクトル表現に変換される。次に、得られる一様なスペクトルは、重なり合わないパーティションに分割される。各パーティションは、等価矩形帯域幅(ERB)に比例する帯域幅を有する。次に、ICLD(チャネル間レベル差)およびICTD(チャネル間時間差)と呼ばれる空間パラメータは、パーティションごとに推定される。ICLDパラメータは、2つのチャネル間のレベル差を表し、ICTDパラメータは、異なるチャネルの2つの信号間の時間差(位相シフト)を表す。レベル差および時間差は、通常、基準チャネルに関して各チャネルに与えられる。これらのパラメータの導出の後に、これらのパラメータは、量子化され、最終的に伝送のために符号化される。
ICLDおよびICTDパラメータは、最も重要なサウンドソースローカライゼーションパラメータを表すにもかかわらず、これらのパラメータを用いた空間表現は、追加パラメータを導入することによって拡張することができる。
「パラメトリックステレオ」と呼ばれる関連技術は、送信されてきたモノラル信号とパラメータサイド情報とに基づいて、2チャネルステレオ信号をパラメトリック符号化する。チャネル間強度差(IIDs)、チャネル間位相差(IPDs)およびチャネル間コヒーレンス(IC)といわれる3つのタイプの空間パラメータが導入される。コヒーレンスパラメータ(相関パラメータ)を取り込んだ空間パラメータセットの拡張は、サウンドステージの知覚空間の「拡散性」または空間の「コンパクト性」のパラメータ化を可能にする。パラメトリックステレオについては、J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)およびE.シュイエールス(Schuijers)の「ステレオオーディオのパラメトリック符号化(Parametric Coding of stereo audio)」、応用信号処理に関するEURASIPジャーナル(Eurasip, J. Applied Signal Proc.)、2005巻、第9号、1305−1322頁に、J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)およびE.シュイエールス(Schuijers)の「低ビットレートでの高品質パラメトリック空間オーディオ符号化(High−Quality Parametric Spatial Audio Coding at Low Bitrates)」、AES第116回コンベンション予稿集6072、2004年5月、ベルリンに、およびE.シュイエールス(Schuijers)、J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)およびJ.エングデガールド(Engdegard)の「低複雑度パラメトリックステレオ符号化(Low Complexity Parametric Stereo Coding)」、AES第116回コンベンション予稿集6073、2004年5月、ベルリンに詳細に説明されている。
上述のように、パラメトリックステレオ符号化および空間オーディオ符号化のためのシステムが、近年開発されている。パラメトリックステレオにおいて、2チャネルステレオオーディオ信号が、モノラルダウンミックスオーディオ信号と、ステレオパラメータを運ぶ追加サイド情報とによって表される(PCT/SE02/01372「低ビットレートオーディオ符号化アプリケーションのための効率的でスケーラブルなパラメトリックステレオ符号化(Efficient and scalable Parametric Stereo Coding for Low Bitrate Audio Coding Applications)」を参照)ので、レガシーパラメトリックステレオデコーダは、モノラル信号とサイド情報とから2チャネルステレオ信号を再構成する。
空間オーディオ符号化スキームにおいて、マルチチャネルサラウンドオーディオ信号は、モノラルまたはステレオダウンミックスオーディオ信号と空間オーディオパラメータを運ぶ追加サイド情報とによって表される。周知の例は、ホームエンタテインメントシステムに対して用いられる5.1チャネル構成である。
レガシー空間オーディオデコーダは、モノラルまたはステレオ信号と追加空間オーディオパラメータとに基づいて、5.1マルチチャネル信号を再構成する。
一般に、パラメトリックステレオまたは空間オーディオ符号化システムで使用されるダウンミックス信号は、異なった信号タイプの伝送に必要な伝送帯域幅をさらに狭めるために、(MPEG AACのような)低ビットレートの知覚オーディオ符号化技術を用いてさらに符号化される。さらに、このダウンミックス信号は、通常、レガシーデコーダ、すなわちパラメトリックステレオまたは空間オーディオパラメータを処理するように動作しないデコーダに対する下位互換性が保証されるように、1つのビットストリームにおいてパラメトリックステレオまたは空間オーディオサイド情報と組み合わされる。このように、レガシーオーディオデコーダは、送信されるモノラルまたはステレオダウンミックス信号のみを再構成する。パラメトリックステレオまたは空間オーディオ符号化を実現するデコーダが用いられる場合、このデコーダは、ビットストリームに埋め込まれるサイド情報も復元し、完全な2チャネルステレオまたは5.1チャネルサラウンド信号を再構成する。
空間オーディオ符号化がモノラルダウンミックス信号に基づいて用いられる場合、レガシー知覚オーディオデコーダがモノラルダウンミックス信号を導出できるだけでなく、空間オーディオ復号化をサポートしていないパラメトリックステレオデコーダに対してこのようなビットストリームのパラメトリックステレオ復号化がさらに可能になるように、信号を提供することによって下位互換性を上げることがさらに望ましい。この目的を達成するためには、両情報、すなわちパラメトリックステレオサイド情報と空間オーディオサイド情報とをビットストリームに含める必要がある。この明白なアプローチは、ビットストリーム内のサイド情報が増えすぎて望ましくない。つまり、モノラル信号とサイド情報とを運ぶための総最大ビットレートを維持する必要があるシナリオにおいては、サイド情報が増加すると、知覚符号化されたモノラルダウンミックスに使用できるデータレートが下がるため、復号化されたモノラルダウンミックス信号のオーディオ品質を低下させることは明らかである。
パラメトリックステレオおよび空間オーディオパラメータとサイド情報とを同時に含むという従来技術の別のアプローチでは、空間オーディオパラメータのセットを構成する際に、これらのパラメータのサブセットを用いてモノラルダウンミックス信号から2チャネルステレオ信号を再構成できるように空間オーディオパラメータのセットを構成する必要がある。このサブセットは、パラメトリックサイド情報として、パラメトリックステレオビットストリームと互換性のある方法でビットストリームに埋め込まれ、このサブセットに属さない残りの空間オーディオパラメータは、空間オーディオコーダに互換性のあるビットストリームに空間オーディオサイド情報として埋め込まれる。デコーダ側では、パラメトリックステレオのみを実施するデコーダは、パラメトリックステレオサイド情報として埋め込まれているパラメータのサブセットに基づいて、2チャネルステレオ信号を再構成する。他方、空間オーディオを実施するデコーダは、パラメトリックステレオサブセットと、残りの空間オーディオパラメータとを復元する。この空間パラメータの完全なセットによって、マルチチャネル信号を再構成できる。
しかしながら、このアプローチは、下位互換性のあるパラメトリックステレオの再構成またはマルチチャネルの再構成のどちらかのオーディオ品質を損うという欠点がある。第1の場合では、空間オーディオパラメータとしても用いられるパラメータのサブセットは、5.1信号の2つのチャネル間の相互関係を表すため、この点は明らかである。最も自然な選択は、左フロント(l)および右フロント(r)チャネルであるが、ステレオダウンミックスの左(l0)および右(r0)チャネルの関係に対する正しい値とはかなり異なりうる。第2の場合では、ステレオダウンミックスの正しい値は、上記の第1サブセットを形成し、つまり、マルチチャネルサラウンド信号の左フロントおよび右フロントチャネル間の関係を表すために用いられる。しかしながら、マルチチャネル互換性のある方法でこれらをビットストリームに埋め込むには、パラメータの量子化が必要であるために、空間オーディオの再構成がかなり不完全になりうる。
C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「ステレオおよびマルチチャネルオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural Cue Coding applied to Stereo and Multi−Channel Audio Compression)」、AESコンベンション論文5574、2002年5月、ミュンヘン C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「バイノーラルキュー符号化のための聴覚空間キューの推定(Estimation of auditory spatial cues for binaural cue coding)」、ICASSP出版物、2002年5月、フロリダ州オーランド C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「バイノーラルキュー符号化:空間オーディオの通常で効率的な表現(Binaural cue coding:a normal and efficient representation of spatial audio)」、ICASSP出版物、2002年5月、フロリダ州オーランド J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)およびE.シュイエールス(Schuijers)の「ステレオオーディオのパラメトリック符号化(Parametric Coding of stereo audio)」、応用信号処理に関するEURASIPジャーナル(Eurasip, J. Applied Signal Proc.)、2005巻、第9号、1305−1322頁 J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)およびE.シュイエールス(Schuijers)の「低ビットレートでの高品質パラメトリック空間オーディオ符号化(High−Quality Parametric Spatial Audio Coding at Low Bitrates)」、AES第116回コンベンション予稿集6072、2004年5月、ベルリン E.シュイエールス(Schuijers)、J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)およびJ.エングデガールド(Engdegard)の「低複雑度パラメトリックステレオ符号化(Low Complexity Parametric Stereo Coding)」、AES第116回コンベンション予稿集6073、2004年5月、ベルリン
本発明の目的は、パラメトリックステレオ再構成の品質も空間オーディオ再構成の品質もほとんど損わずに、より効率的な表現を可能とする、マルチチャネルオーディオ信号のパラメトリック表現を作成しおよび用いるための概念を提供することである。
この目的は、請求項1に記載のマルチチャネルオーディオデコーダまたは請求項11に記載のオーディオエンコーダによって達成される。
本発明は、モノラルダウンミックス信号とともに用いられることに適したパラメータを有するマルチチャネルオーディオ信号のパラメトリック表現を、パラメータコンバイナが空間パラメータのセットとステレオパラメータとを組み合わせることによってそのパラメトリック表現を生成するために用いられる場合に、下位互換性のある方法で効率的に導出でき、その結果、デコーダ使用可能なステレオパラメータとこのデコーダ使用可能なステレオパラメータとともに空間パラメータのセットを表す空間パラメータのセットに関する情報とを有するパラメトリック表現を得るという知見に基づく。
空間パラメータと空間パラメータによっても表される同じマルチチャネルオーディオ信号のステレオダウンミックスを表しているステレオパラメータとの間の相互関係を用いることによって、パラメトリックステレオパラメータに基づいて、空間パラメータのサブセットを好都合に予測できる。
ステレオパラメータによって表される2チャネルステレオ信号は、5.1マルチチャネル信号のステレオダウンミックスの何らかの形態を表すので、パラメトリックステレオシステムのステレオパラメータと空間オーディオ符号化システムの空間パラメータとの間には、上記のように依存関係が存在する。本発明は、これらのステレオパラメータを空間オーディオパラメータのサブセットと組み合わせて用いることによって、上記のサブセットに含まれていない残りの空間オーディオパラメータの値を予測する。したがって、そのサブセットに含まれていない空間オーディオパラメータの予測値と実際値との間の差だけを運べばよいことになる。この差(すなわち予測誤差)のエントロピーは、一般に、実際のパラメータ自体のエントロピーより小さい。これは、本発明および以降のある種のエントロピー符号化を使用するシステムで用いることができる。このようなシステムは、すべてのパラメータを独立に埋め込むだけのシステムに比べて、パラメトリックステレオおよび空間オーディオパラメータのためのサイド情報のビットレートを低くできる。同時に、本発明を使用するこのようなシステムは、パラメトリックステレオ再構成の品質を損わないだけでなく、空間オーディオ再構成の品質も損わないことに注目されたい。
パラメトリックステレオデコーダに対して下位互換性のあるパラメトリック表現を提供することが目標であるので、パラメトリックステレオデコーダから再構成される2チャネルステレオ信号の品質が損われないようにするために、ステレオダウンミックスを表している正しいパラメータが用いられることが好ましい。しかしながら、本発明の別の実施の態様において、空間オーディオパラメータに対するパラメータ予測の性能を向上するために、エンコーダにおいて、推定された空間パラメータに基づいて、パラメトリックステレオパラメータが多少修正される。パラメトリックステレオ(PS)パラメータのこの修正によって、パラメトリックステレオ復号化のみを実施するデコーダによって再構成されるステレオ信号の品質が多少低下することは明らかである。本発明のこの実施の態様によって、PSパラメータの修正による影響を再構成された空間オーディオ信号の品質に及ぼさずに、互換ビットストリームに埋め込まれているPSおよび空間サイド情報に必要な総ビットレートが下げられる。
本発明の好適な実施の態様において、マルチチャネルオーディオ信号のパラメトリック表現を導出するためのエンコーダは、マルチチャネル信号のステレオダウンミックスのパラメトリックステレオパラメータと空間オーディオパラメータとが完全に下位互換性のある方法で埋め込まれるビットストリームを生成するために用いられる。すなわち、パラメトリックステレオパラメータのみを処理できるパラメトリックステレオデコーダが、パラメトリックステレオパラメータを用いて高品質のステレオ信号を再構成できるようになる。さらに、本発明のエンコーダは、一部の空間パラメータを実際の空間パラメータと空間パラメータの予測の差分表現に置き換え、この空間パラメータの予測は、上記のステレオパラメータと置換されない空間オーディオパラメータのセットとに基づく。空間オーディオパラメータ表現とパラメトリックステレオ表現の両パラメータはチャネル対間のレベル差と相関とを表すので、空間オーディオパラメータとステレオパラメータとはどちらも同じデータ基礎、すなわちマルチチャネル信号から導出されるため、空間オーディオパラメータとステレオパラメータとの間には相関がある。したがって、予測値と実際値との間の差を送信時に用いることによって、ビットレートを節約でき、その理由は、この差のエントロピーは、基礎となる空間オーディオパラメータのエントロピーより通常はるかに小さいからである。予測が完全である場合、予測値と実際値との間の差は当然ゼロになる。つまり、置換された空間パラメータの表現としてゼロ値のみを送信するかまたはパラメトリック表現内に格納すればよいことになるので、この表現に対して、通常行われるように、さらなるエントロピー符号化ステップが実行される場合は、極めて好都合である。
上述の概念を用いることによって、本発明のエンコーダまたはデコーダは、空間オーディオおよびパラメトリックステレオパラメータの下位互換性のある伝送を、精度を低下させずに行うにもかかわらず、空間オーディオパラメータおよびパラメトリックステレオパラメータをビットストリーム内でそれぞれ独立に送信するだけのシナリオに比べて、ビットレートを下げることができるという明らかな利点を有する。
本発明のさらなる実施の態様においては、空間パラメータの予測と修正空間パラメータの伝送との前に、パラメトリックステレオパラメータに小さな修正が加えられる。これは、パラメトリックステレオパラメータの小さな修正によって予測の安定性が向上するため、総ビットレートのさらなる低下が可能になるという大きな利点がある。ただし、実際には最適なパラメトリックステレオパラメータが符号化プロセス中に修正されるため、修正ステレオパラメータを用いて再構成されるステレオアップミックスの品質が多少低下するという代償を伴う。
本発明のさらなる実施の態様においては、本発明のオーディオエンコーダは、エンコーダに入力されたマルチチャネル信号からモノラル信号を生成するために、空間ダウンミキサを備える。このモノラル信号は、モノラルダウンミックス信号の送信時に用いられるビットレートをさらに下げるために、オーディオエンコーダによって、たとえば知覚オーディオ圧縮を用いて、さらに圧縮される。最終的に、ビットストリームジェネレータが、モノラル信号、空間オーディオパラメータおよびパラメトリックステレオパラメータを単一のパラメトリックステレオ互換ビットストリームに組み合わせるために、ビットストリームを生成する。
本発明のさらなる実施の態様においては、パラメトリックエンコーダまたはデコーダが制御ユニットを備えることによって、必要なビットレートのさらなる低下を可能にしている。これは、実際の空間パラメータとその予測値との間の差を用いて生成される空間パラメータの差分表現に必要なビットレートと、空間パラメータを直接符号化する場合に必要なビットレートとを比較することによって実現される。符号化は、2ステップの符号化手順によって実行され、すなわち、最初に各パラメータを個別に時間および/または周波数差分符号化し、次に(たとえば、ハフマンエンコーダ、算術エンコーダまたはランレングスエンコーダを用いて)エントロピー符号化を行う。このプロセスは、(上述のパラメータセット全体にわたる予測と比べて)パラメータごとに固有の履歴に基づく予測可能性(または冗長性)を利用する。差分予測符号化の結果としてビットレートが上がる場合、所定の時間フレームにおいて空間パラメータを直接送信することによってビットレートのさらなる節約が可能である。どの方式を選択したかの決定は、デコーダ側で処理されるビットストリームで送信することも、デコーダが通知を受けずに適切な検出アルゴリズムを適用することによって本来用いられる方式を決定することもできる。
上述のように本発明により生成される信号は、パラメトリックステレオデコーダに対して下位互換性があるだけでなく、本発明のデコーダへの送信時に完全な空間(サラウンド)信号の再生に必要な情報を保持するという大きな利点を有する。
したがって、パラメトリックステレオパラメータと空間オーディオパラメータとを受信する本発明のデコーダは、マルチチャネル信号の空間特性を表している空間オーディオパラメータの完全なセットを本発明のビットストリームから導出するために、差分送信されてきた空間オーディオパラメータに対して同じ予測と逆の変換とを適用することによって、空間パラメータの完全なセットを再構成することができる。
言い換えると、パラメトリックステレオパラメータと受信された空間オーディオパラメータとを組み合わせて空間パラメータの完全なセットを再構成するために用いられる組み合わせ規則は、エンコーダ側において適用される規則の逆である。上述のように差分符号化が行われる場合、最初に、パラメトリックステレオパラメータのうちの1つまたは複数と受信された空間オーディオパラメータのうちの1つまたは複数とを用いて、所望のパラメータの予測値が計算される。次に、予測値と送信値との間の和が計算され、この和が空間パラメータの完全なセットの所望のパラメータである。
本発明のさらなる実施に態様においては、本発明のデコーダは、高品質のパラメトリックステレオパラメータを用いてマルチチャネル信号のステレオ表現を再構成することもできる。これは、本発明のデコーダをニーズに応じて構成できるという大きな利点を有する。すなわち、ステレオ再生環境のみを利用できる場合、本発明のデコーダによって高品質ステレオ信号を再生できるデコーダを構成できる。他方、マルチチャネル再生環境を利用できる場合、サラウンドサウンドの聴取を楽しめるように、信号のマルチチャネル表現を再生できるデコーダを構成できる。
本発明のさらなる実施の態様においては、ビットレートが節約されるオーディオ信号の格納または伝送を可能にするために、本発明のエンコーダがトランスミッタまたはオーディオレコーダ内に含まれる。したがって、ステレオ信号としても、フルサラウンド信号としても優れた品質でのオーディオ信号の再生が可能になる。
本発明のさらなる実施に態様においては、信号の受信またはさまざまなスピーカセットアップによる再生を可能にするために、本発明のデコーダがレシーバまたはオーディオプレーヤ内に含まれる。したがって、既存の再生環境に最も適した表現でオーディオ信号を再生することができる。
要するに、本発明は以下の特長を備える。
−マルチチャネルオーディオ信号の互換性のある符号化、この符号化は、
エンコーダ側において、マルチチャネル信号を1つのチャネル表現にダウンミックスするステップと、
エンコーダ側において、マルチチャネル信号が与えられると、マルチチャネル信号を表しているパラメータを定義するステップと、
エンコーダ側において、マルチチャネル信号が与えられると、マルチチャネル信号のステレオダウンミックスを表しているパラメータを定義するステップと、
エンコーダ側において、パラメータの両セットをビットレート効率がよくかつ下位互換性のある方法でビットストリームに埋め込むステップと、
デコーダ側において、埋め込まれたパラメータをビットストリームから抽出するステップと、
デコーダ側において、ビットストリームから抽出されたパラメータからマルチチャネル信号を表しているパラメータを再構成するステップと、
デコーダ側において、ビットストリームデータから再構成されたパラメータとダウンミックスされた信号とが与えられると、マルチチャネル出力信号を再構成するステップとを備える。
−ステレオダウンミックスを表しているパラメータを、パラメトリックステレオ復号化のみをサポートする(レガシー)復号化方法によって復号化できるように、ビットストリームに埋め込む。
−マルチチャネル信号を表しているパラメータのセットを第1サブセットと第2サブセットとに分割する。
−パラメータの第1サブセット内の値を、パラメータの第2サブセットに基づいて、さらにマルチチャネル信号のステレオダウンミックスを表すパラメータに基づいて、予測する。
−パラメータの第1サブセットが直接符号化されるかまたは予測パラメータ値に対する差のみが符号化されるかを、制御機構が自動的に選択する。
−マルチチャネル信号を表している元のパラメータとステレオダウンミックスを表している元のパラメータとの両方が、修正パラメータを導出するための基礎として用いられる、ステレオダウンミックスを表すパラメータを修正する。
−ルックアップテーブルが、予測パラメータ値を見つけるために用いられる。
−多項式関数が、予測パラメータ値を見つけるために用いられる。
−ステレオダウンミックスを生成するために用いられた方法から導出された数学関数が、予測パラメータ値を見つけるために用いられる。
次に、本発明の好適な実施の形態が添付図面を参照しながら説明されるが、これらの図面としては:
図1は、本発明のエンコーダのブロック図を示し、
図2は、本発明による生成されたビットストリームを示し、
図3は、本発明のエンコーダのさらなる実施の形態を示し、
図4は、図3の本発明のエンコーダの詳細を示し、
図5は、本発明のデコーダを示し、
図6は、本発明のマルチチャネルデコーダの好適な実施の形態を示し、
図7は、図6の本発明のマルチチャネルデコーダの詳細を示し、
図8は、本発明の信号の下位互換性を説明し、
図9は、本発明のエンコーダを有するトランスミッタまたはオーディオレコーダを示し、
図10は、本発明のマルチチャネルデコーダを有するレシーバまたはオーディオプレーヤを示し、
図11は、伝送システムを示す。
後述の実施の形態は、空間オーディオの改良されたパラメトリックステレオ互換性のある符号化のための本発明の原理を単に例示するものである。本願明細書に記載の構成および詳細の変更および変形が当業者には当然明らかになるであろう。したがって、本発明の目的は、特許請求の範囲によってのみ限定されるものであり、本願明細書に記載の実施の形態の記述および説明によって提示された特定の詳細によって限定されるものではない。
図1は、マルチチャネルオーディオ信号のパラメトリック表現12を導出するための本発明のエンコーダ10を示す。エンコーダ10は、空間パラメータ計算器14と、ステレオパラメータ計算器16と、パラメータコンバイナ18とを備える。
空間パラメータ計算器14は、マルチチャネル信号の空間特性を表している空間パラメータ20のセットを計算する。ステレオパラメータ計算器16は、マルチチャネル信号のステレオダウンミックスの空間特性を表しているステレオパラメータ22を計算する。空間パラメータ20のセットとステレオパラメータ22とは、パラメータコンバイナ18に転送され、パラメトリック表現12が導出される。パラメトリック表現12は、デコーダ使用可能なステレオパラメータ24と空間パラメータ26のセットに関する情報とを含む。
図2は、下位互換ビットストリームの一例を示し、この下位互換ビットストリームは、図1による本発明のエンコーダによって生成されるようにマルチチャネルオーディオ信号のパラメトリック表現である。このビットストリームは、ステレオパラメータセクション30と空間パラメータセクション32とを含む。ステレオパラメータセクション30は、その先頭にステレオヘッダ34を有し、その後に2つのデコーダ使用可能なステレオパラメータ36aおよび36bが続き、ステレオパラメータ36aおよび36bは、ステレオ信号を再構成するためにパラメトリックステレオデコーダによって用いられる。パラメトリックステレオパラメータのみを処理できるデコーダは、ステレオヘッダ34に含まれている情報によってパラメトリックステレオパラメータ36aおよび36bを識別する。
空間オーディオセクション32は、空間ヘッダ38で始まり、その後に4つの空間オーディオパラメータ40a〜40dを含む。本発明によるマルチチャネルデコーダは、空間ヘッダ38と、ステレオヘッダ34によって識別されるステレオパラメータ36aおよび36bとの助けで、空間パラメータ40a〜40dを識別することによって、空間パラメータ40a〜40dを用いる。図2に示すように、空間パラメータ40aが消費するビットレートは、空間パラメータ40b〜40dが消費するビットレートより低い。図2に示されている例において、空間パラメータ40aは、基礎となる元の空間パラメータと予測空間パラメータとの差によって表され、この予測空間パラメータは、ステレオパラメータ36aまたは36bのうちの1つまたは複数と、空間オーディオパラメータ40b〜40dのうちの1つまたは複数とを用いて導出される。したがって、本発明のマルチチャネルデコーダは、ビットストリームで送信されてきた空間パラメータ40aに関する情報の基礎となる空間パラメータを再構成するために、ステレオパラメータ36aおよび36bと空間パラメータ40b〜40dとの両方を必要とする。
図3は、3つのチャネル、すなわち左チャネルl、右チャネルrおよび中央チャネルcを有するマルチチャネルオーディオ信号50のパラメトリック表現を導出するための本発明のエンコーダ52の好適な実施の形態を示す。
本発明のエンコーダ52は、空間ダウンミキサ54と、空間パラメータ推定器56と、ステレオダウンミキサ58と、パラメトリックステレオパラメータ推定器60と、オーディオエンコーダ62と、パラメータコンバイナ(ジョイント符号化ブロック)64と、ビットストリーム計算器(マルチプレクサ)66とを備える。
空間ダウンミキサ54と、空間パラメータ推定器56と、ステレオダウンミキサ58とは、マルチチャネル信号50を入力として受信する。空間ダウンミキサ54は、マルチチャネル信号50からモノラルダウンミックス信号68を作成し、空間パラメータ推定器56は、マルチチャネル信号の空間特性を表している空間パラメータ70を導出し、ステレオダウンミキサ58は、マルチチャネル信号50からステレオダウンミックス信号72を作成する。
ステレオダウンミックス信号72は、パラメトリックステレオパラメータ推定器60に入力され、パラメトリックステレオパラメータ推定器60は、ステレオダウンミックス信号72の空間特性を表しているステレオダウンミックス信号からステレオパラメータ74を導出する。モノラルダウンミックス信号68は、オーディオエンコーダ62に入力され、オーディオエンコーダ62は、たとえば知覚オーディオ符号化技術を用いた符号化によって、モノラルダウンミックス信号68を表しているオーディオビットストリーム76を導出する。パラメータコンバイナ64は、空間パラメータ70とパラメトリックステレオパラメータ74とを入力として受信し、空間パラメータのセットを空間パラメータの予測値と空間パラメータ自体との差に置き換えることによって、デコーダ使用可能なステレオパラメータ78(パラメトリックステレオサイド情報)と、空間パラメータ80に関する情報(空間サイド情報)とを出力として導出する。この点について、以降の図を参照しながら、より詳細に説明する。
最終的に、ビットストリーム計算器66は、オーディオビットストリーム76と、空間パラメータセット80に関する情報と、デコーダ使用可能なステレオパラメータ78とを入力として受信し、これらの入力をパラメトリックステレオ互換ビットストリーム82に組み合わせ、このビットストリーム82は、たとえば図2に詳しく示されているように、パラメータのセグメントを複数含みうる。
ビットストリーム計算器66は、単純なマルチプレクサであってもよい。しかしながら、これらの3つの入力を1つの互換ビットストリームに組み合わせる他の手段が、本発明によるビットストリームを導出するために実施されてもよい。
すなわち、図3は、チャネルl、rおよびcを含む1つのマルチチャネルオーディオ信号を入力として取り、空間デコーダによる復号化と、PSデコーダによる下位互換性のある復号化とが可能な互換ビットストリームを生成するエンコーダを示している。空間ダウンミキサは、マルチチャネル信号l、r、cを取り、モノラルダウンミックス信号mを生成する。次に、この信号は、モノラル信号を表しているコンパクトなオーディオビットストリームを提供するために、オプションの知覚オーディオエンコーダで符号化することができる。空間パラメータ推定は、マルチチャネル信号l、r、cを入力として取り、量子化された空間パラメータのセットを生成する。これらのパラメータは、時間および周波数の関数にできる。ステレオへのダウンミックスは、たとえばITU−Rダウンミックス式または代わりのアプローチを用いて、マルチチャネル信号の2チャネルステレオダウンミックスl0、r0を生成する。パラメトリックステレオ(PS)パラメータ推定は、このステレオダウンミックスを入力として取り、量子化されたPSパラメータのセットを生成し、これらのPSパラメータは、時間および周波数の関数にできる。ジョイント符号化ブロックは、空間パラメータとPSパラメータとを入力として取り、パラメトリックステレオサイド情報(PSサイド情報)と空間サイド情報とを生成する。最終的に、マルチプレクサは、オーディオビットストリームと、空間およびPSの両サイド情報ビットストリームとを入力として取り、(PSのみを実施する)レガシーデコーダによる下位互換性のある復号化が可能であるように、これらのサイド情報をビットストリームに埋め込む。
図4は、図3に示すパラメータコンバイナ64を詳しく示す。パラメータコンバイナ64は、パラメータ分割器90と、パラメトリックステレオパラメータ修正器92と、空間パラメータ予測器94と、コンバイナ96と、制御ユニット98と、空間パラメータアセンブラ100と、第1差分エンコーダ102と、第2差分エンコーダ104と、第3差分エンコーダ106aと、第4差分エンコーダ106bとを備える。
パラメータコンバイナ64は、空間パラメータ70とパラメトリックステレオパラメータ74とを入力として受信する。パラメトリックステレオパラメータ74は、パラメトリックステレオパラメータ修正器92の第1入力端に入力され、空間パラメータ70は、パラメトリックステレオパラメータ修正器92の第2入力端に入力される。空間パラメータ70は、パラメータ分割器90にも入力される。パラメトリックステレオパラメータ修正器92はオプション装置であり、空間パラメータ70の情報を用いてパラメトリックステレオパラメータ74を修正することによってデコーダ使用可能なステレオパラメータ110を導出するために用いられうる。
パラメータ分割器タ90は、空間パラメータ70を空間パラメータの第1サブセット112と空間パラメータの第2サブセット114とに分割し、第1サブセット112は、マルチチャネル信号の最終パラメトリック表現内で差分予測に置換しうる空間パラメータのサブセットである。
第1サブセット内のパラメータの予測は、デコーダ使用可能なステレオパラメータ110と空間パラメータの第2サブセット114とを用いて実行されるので、デコーダ使用可能なパラメータ110と空間パラメータ114の第2サブセットとが空間パラメータ予測器94に入力される。空間パラメータ予測器94は、デコーダ使用可能なパラメトリックステレオパラメータ110と空間パラメータ114の第2サブセットとを用いて予測パラメータ116を導出する。予測パラメータ116は、第1サブセットのパラメータ112の予測であり、第1サブセットのパラメータ112と比較されることになる。
したがって、予測パラメータ116とパラメータ112の第1サブセットとの差が、コンバイナ96によってパラメータごとに計算され、コンバイナ96は、このようにして差分パラメータ118を導出する。パラメータ112の第1サブセットは、第3差分エンコーダ106aに入力され、第3差分エンコーダ106aは、時間または周波数の差分符号化を適用して、パラメータの第1サブセットを差分符号化する。差分パラメータ118は、第4差分エンコーダ106bに入力される。
図4に示す本発明の好適な実施に形態によると、第1サブセット112の差分符号化された表現は差分パラメータ118の差分符号化された表現と、どちらの表現がビットストリーム内に必要なビット数が多いかを推定するために、制御ユニット98によって比較される。制御ユニット98は、必要ビット数が少ない第1サブセット112の表現を空間パラメータアセンブラ100に供給するために、スイッチ120を制御する一方で、どちらの表現が用いられたかに関する情報が、制御ユニット98から空間パラメータアセンブラ100に転送される。
空間パラメータの第2サブセット114も第2差分エンコーダ104によって差分符号化され、第2サブセット114の差分符号化された表現が空間パラメータアセンブラ100に入力され、空間パラメータアセンブラ100は、このようにして空間パラメータ70に関する全情報を得る。空間パラメータアセンブラ100は、第1サブセット112および第2サブセット114の各表現を、空間パラメータ70に関する全情報を保持している空間パラメータ80のセットに関する情報に組み立て直すことによって、最終的に、空間パラメータ80に関する情報を導出する。
したがって、空間パラメータ80のセットに関する最終的な情報は、その差分符号化にもかかわらず修正されなかった空間パラメータの第2サブセットと、空間パラメータの第1サブセットの表現とを含み、この表現は、必要なビットレートが低い表現がどちらであるかに応じて、第1サブセット112の直接の差分符号化された表現であるか、または差分パラメータ118の差分符号化された表現である。
本発明のパラメータコンバイナ64によって導出されるデコーダ使用可能なパラメトリックステレオパラメータ78は、第1差分エンコーダ102によって導出される。第1差分エンコーダ102は、修正パラメトリックステレオパラメータ110を入力として受け取り、この修正パラメトリックステレオパラメータ110の差分符号化によってデコーダ使用可能なパラメトリックステレオパラメータ78を導出する。
すなわち、図4は、空間パラメータとPSパラメータとの両方を入力として取り、空間サイド情報とPSサイド情報との両方を生成するジョイント符号化ブロックを示している。オプションのPSパラメータ修正ブロックは、空間パラメータとPSパラメータとの両方を入力として取り、修正PSパラメータを生成する。これにより、空間パラメータのより良い予測が可能になるが、修正PSパラメータから再構成される2チャネルステレオ信号の品質が損われるという代償を伴う。PSパラメータ修正ブロックを用いない場合は、入力されたPSパラメータが空間パラメータ予測ブロックおよびPS符号化への入力として直接使われる。(修正)PSパラメータセットは、パラメータセットを表すために必要なビット数を最小化するために、時間または周波数方向の後続パラメータの差の符号化である時間差分(dt)または周波数差分(df)符号化と、無損失のエントロピー符号化であるハフマン符号化とを用いて符号化することができる。パラメータ分割ブロックは、空間パラメータのセットを、直接符号化される第2サブセットと、パラメータ予測を用いて符号化できる残りのパラメータをすべて含む補足的な第1サブセットとに分割する。空間パラメータ予測ブロックは、空間パラメータの第2サブセットと(修正)PSパラメータとを入力として取り、空間パラメータの第1サブセットに対する予測値を計算する。次に、これらの予測値を第1サブセット内の空間パラメータの実際の値から引くことによって、予測誤差値のセットを得る。
第2パラメータサブセットは、このパラメータサブセットを表すために必要なビット数を最小化するために、時間または周波数差分符号化とハフマン符号化とを用いて符号化することができる。また、第1パラメータサブセットは、このパラメータサブセットを表すために必要なビット数を最小化するために、時間または周波数差分符号化とハフマン符号化とを用いて符号化することができる。第1パラメータサブセットの予測誤差値は、このパラメータサブセットを表すために必要なビット数を最小化するために、時間または周波数差分符号化とハフマン符号化とを用いて符号化することができる。制御ブロックは、第1パラメータサブセットを表すために必要なビット数を最小化するために、第1パラメータサブセットが直接符号化されるべきか、または予測誤差が符号化されるべきかを選択する。この選択は、サブセット内の各パラメータに対して個々に行うことができる。この選択の実際の決定は、サイド情報としてビットストリームで伝達することも、空間パラメータ予測の一部である規則に基づいて行うこともできる。後者の場合、この決定をサイド情報として伝達する必要はない。最後に、マルチプレクサが、空間サイド情報を形成するために、符号化されたすべてのデータを組み合わせる。
本発明の符号化または復号化の概念を用いるために、パラメータの予測をさまざまな方法で実施可能である。一般には、空間パラメータの第1サブセットの予測をステレオパラメータと空間パラメータの第2サブセットとから導出するために適切に設計されたルックアップテーブルを用いることもでき、または、特定のダウンミックスプロセスの知識と空間パラメータおよびステレオパラメータの導出方法とに基づいて、予測パラメータを導出するための解析関数を適用することもできる。以下の段落では、適切な予測を実現するための具体例をいくつか概説する。
この概説は、次の3つのチャネル
Figure 2008519301
を有するマルチチャネル信号に基づき、このマルチチャネル信号は、単なる例と見なされたい。提示された原理は、他のチャネル構成にも準用されることは言うまでもない。たとえば、5.1チャネル構成の場合、左信号(l)を形成するためにパラメトリックステレオモジュールを用いて左フロントおよび左サラウンドチャネルを組み合わせることができ、右信号(r)を形成するためにパラメトリックステレオモジュールを用いて右フロントおよび右サラウンドチャネルを組み合わせることができ、さらに中央信号(c)を形成するためにパラメトリックステレオモジュールを用いて中央フロントおよび低周波数エンハンスメントチャネルを組み合わせることができる。
以下の説明では、空間パラメータ予測ブロックについてより詳細に論じる。ステレオダウンミックス信号の2つのチャネルを、
Figure 2008519301
と表し、さらに、モノラルダウンミックスを、
Figure 2008519301
と表す。
Figure 2008519301
最も一般的な意味で、これは、表関数(ルックアップテーブル)
Figure 2008519301
で構成される。
このとき差分信号は、予測誤差
Figure 2008519301
に等しい。
Figure 2008519301
Figure 2008519301
Figure 2008519301
このような設計の第1の例は、上述の線形予測設計の特例であり、単に
Figure 2008519301
と表される。
この単純な予測は、(最小予測誤差ではなく)より安定した予測誤差が得られるという利点を有するため、上述の予測誤差の時間差分または周波数差分符号化に適している。これは、上述の多項式のようなあらゆる予測について言える。
Figure 2008519301
相互相関の場合、ICCパラメータに対する式は、
Figure 2008519301
である。
コヒーレンスの場合、実数値の演算が式(7)において絶対値(複素数の大きさ)の演算に置き換えられる。
Figure 2008519301
Figure 2008519301
Figure 2008519301
Figure 2008519301
Figure 2008519301
ここで再度強調するが、上述の予測スキームは、エンコーダ側にもデコーダ側にも実施できる予測スキーム候補の単なる例である。
図5は、パラメトリック表現202を処理するための本発明のマルチチャネルオーディオデコーダ200を示す。
パラメトリック表現202は、マルチチャネル信号の空間特性を表している空間パラメータ204のセットに関する情報と、このマルチチャネル信号のステレオダウンミックスの空間特性を表しているデコーダ使用可能なステレオパラメータ206とを含む。本発明のマルチチャネルオーディオデコーダ200は、空間パラメータ210を得るために、デコーダ使用可能なステレオパラメータ206と空間パラメータのセットに関する情報とを組み合わせるためのパラメータ再構成器208を有する。
図6は、本発明によるマルチチャネルオーディオデコーダ220の実施の形態を示す。マルチチャネルオーディオデコーダ220は、ビットストリーム分解器(デマルチプレクサ)222と、オーディオデコーダ224と、パラメータ再構成器(ジョイントデコーダ)226と、アップミキサ228とを有する。
ビットストリーム分解器222は、オーディオビットストリーム231と空間パラメータ232のセットに関する情報とデコーダ使用可能なステレオパラメータ(PSサイド情報)234とを含む下位互換ビットストリーム230を受信する。ビットストリーム分解器は、オーディオビットストリーム231と、空間パラメータ232のセットに関する情報と、デコーダ使用可能なステレオパラメータ234とを導出するために、下位互換ビットストリーム230を分解または分離する。オーディオデコーダ224は、オーディオビットストリーム231を入力として受信し、このオーディオビットストリーム231からモノラルダウンミックス信号236を導出する。
パラメータ再構成器226は、空間パラメータ232のセットに関する情報とデコーダ使用可能なステレオパラメータ234とを入力として受信する。パラメータ再構成器226は、空間パラメータ238のセットを導出するために、空間パラメータのセットに関する情報とデコーダ使用可能なステレオパラメータとを組み合わせ、この空間パラメータセット238は、アップミキサ228に入力され、アップミキサ228は、さらに、モノラルダウンミックス信号236を第2入力として受信する。アップミキサ228は、空間パラメータ238とモノラルダウンミックス信号236とに基づいて、その出力でマルチチャネル信号240の再構成を導出する。
したがって、図6は、互換ビットストリームを入力として取り、チャネルl、rおよびcを含むマルチチャネルオーディオ信号を生成する空間オーディオデコーダを示す。最初に、デマルチプレクサが互換ビットストリームを入力として取り、これをオーディオビットストリームと、空間サイド情報およびPSサイド情報とに分解する。このモノラル信号に対して知覚オーディオ符号化が行われた場合、対応するオーディオデコーダがこのオーディオビットストリームを入力として取り、復号化されたモノラルオーディオ信号mを生成し、この信号は、知覚オーディオコーデックによって導入された歪の影響を受けている。ジョイント復号化ブロックは、空間サイド情報とPSサイド情報とを入力として取り、空間パラメータを再構成する。最後に、空間再構成器が復号化されたモノラル信号mと空間パラメータとを入力として取り、マルチチャネルオーディオ信号を再構成する。
図7は、マルチチャネルオーディオデコーダ220によって用いられるパラメータ再構成器226の詳細を示す。パラメータ再構成器226は、空間パラメータ逆アセンブラ250と、制御ユニット252と、空間パラメータ予測器254と、空間パラメータアセンブラ256と、第1差分デコーダ258と、第2差分デコーダ260と、第3差分エンコーダ262aと、第4差分デコーダ262bとを備える。
空間パラメータ逆アセンブラ250は、空間パラメータ232のセットに関する情報を入力として受信し、この空間オーディオパラメータ232のセットに関する情報から第1サブセット266と第2サブセット268とを導出する。第1サブセット266は、エンコーダ側で実行される予測差分表現によって表されている可能性があるパラメータを含み、第2サブセット268は、ビットストリーム内で修正されずに送信されてきた空間パラメータのセットに関する情報のサブセットを含む。
さらに、制御ユニット252は、場合によっては、符号化中に予測差分表現が用いられたか否かを示す制御情報を空間パラメータ逆アセンブラから受信する。この情報の使用は任意であり、制御ユニット252は、指示パラメータにアクセスせずに、代わりに適切なアルゴリズムを用いて、このような予測が行われたか否かを導出することもできる。
パラメータ268の第2サブセットは、第2差分デコーダ260に入力され、第2差分デコーダ260は、空間パラメータ270の第2サブセットを導出するために第2サブセットを差分復号化する。
第1差分デコーダ258は、符号化された表現からパラメトリックステレオパラメータ272を導出するために、デコーダ使用可能なステレオパラメータ234を入力として受信する。空間パラメータ予測器254は、エンコーダ側のそれに対応するものと同様に動作し、そのため、空間パラメータ予測器254は、予測パラメータ274を導出するために、第1入力としてパラメトリックステレオパラメータ272と、第2入力として第2サブセットの空間パラメータ270とを受信する。
制御ユニット252は、空間パラメータのセットに関する情報の第1サブセットに対して可能な2つの異なるデータ経路を制御する。制御ユニット252が空間パラメータのセットの情報の第1サブセットが予測差分符号化を用いて送信されてこなかったことを示す場合、制御ユニット252は、逆予測を行わずに空間パラメータ280のセットの第1サブセットを導出するために第1サブセット266が第3差分デコーダ262aに入力されるように、スイッチ278aおよび278bを切り替える。次に、空間パラメータ280の第1サブセットは、空間パラメータアセンブラ256の第2入力端に入力される。
しかしながら、制御ユニット252が差分予測パラメータであることを示すと、空間パラメータのセットの情報の第1サブセット266は、第4差分デコーダ262bに入力され、第1サブセット266の差分予測表現が差分デコーダの出力端282から導出される。次に、差分表現と予測パラメータ274との和が加算器284によって計算され、エンコーダ側で実行された差分予測操作の逆操作が行われる。この結果、空間パラメータ280の第1セットが、空間パラメータアセンブラ256の第2入力端から得られる。空間パラメータアセンブラ256は、その出力端に、符号化された信号のマルチチャネル再構成の基礎となる空間パラメータ290の完全なセットを提供するために、空間パラメータ280の第1セットと空間パラメータ270の第2セットとを組み合わせる。
要するに、図7は、空間サイド情報とPSサイド情報とを入力として取り、空間パラメータを再構成するジョイント復号化ブロックを示す。デマルチプレクサは、空間サイド情報を、空間パラメータの符号化された第2サブセットと、空間パラメータの符号化された第1サブセットと、制御情報とに分割する。復号化ブロックは、空間パラメータの符号化された第2サブセットを入力として取り、このパラメータサブセットを再構成する。これは、ハフマン符号化および時間差分(dt)または周波数差分(df)符号化がエンコーダで用いられていた場合、再構成時にハフマン復号化および時間差分(dt)または周波数差分(df)復号化を含む。復号化ブロックは、PSサイド情報を入力として取り、(修正)PSパラメータを再構成する。空間パラメータ予測ブロックは、空間パラメータの第2サブセットと(修正)PSパラメータとを入力として取り、エンコーダ内においてそれに対応するものによるの同様に、空間パラメータの第1サブセットの予測値を計算する。制御ブロックは、それに対応するエンコーダ内の制御ブロックがどの選択決定を行ったかを判定する。この選択に応じて、空間パラメータの符号化された第1サブセットは、直接復号化されるかまたは予測を考慮して復号化される。どちらの場合も、これは、ハフマン符号化および時間または周波数差分符号化がエンコーダで用いられた場合、ハフマン復号化および時間または周波数差分復号化を含む。予測が用いられなかったと制御ブロックが判定した場合、復号化ブロックの出力は、空間パラメータの再構成された第1サブセットとして取られる。それ以外の場合、復号化ブロックの出力は予測誤差値を含み、予測誤差値は、空間パラメータの第1サブセットの元の値を得るために、空間パラメータ予測によって生成される予測パラメータ値に追加される。最後に、空間パラメータの再構成された第1および第2サブセットが、空間パラメータの完全なセットを形成するためにマージされる。
図8は、本発明の概念の完全な下位互換性の大きな利点を強調するために、本発明の互換ビットストリームが信号のステレオアップミックスを導出するためにレガシーパラメトリックステレオデコーダによってどのように処理されるかを示す。
パラメトリックステレオデコーダ300は、互換ビットストリーム302を入力として受信する。パラメトリックステレオデコーダ300は、デマルチプレクサ304と、オーディオデコーダ306と、差分デコーダ308と、アップミキサ310とを備える。デマルチプレクサ304は、オーディオビットストリーム312とデコーダ使用可能なパラメトリックステレオパラメータ314とを互換ビットストリーム302から導出する。
パラメトリックステレオデコーダ300は空間オーディオパラメータに基づいて動作できないので、デマルチプレクサ304は、たとえばデコーダにとって分からないビットストリーム内の関連データセクションとヘッダフィールドとをスキップすることによって、互換ビットストリーム302に含まれている空間オーディオパラメータを単に無視する。オーディオビットストリーム312は、オーディオデコーダ306に入力され、モノラルダウンミックス信号316が導出され、一方、デコーダ使用可能なステレオパラメータ314は、パラメトリックステレオパラメータ318を導出するために、差分デコーダ308によって差分復号化される。モノラルダウンミックス信号316とパラメトリックステレオパラメータ318とはアップミキサ310に入力され、アップミキサ310は、モノラルダウンミックス信号316とパラメトリックステレオパラメータ318とを用いてステレオアップミックス信号320を導出する。
言い換えると、図8は、互換ビットストリームを入力として取り、チャネルl0およびr0を含む2チャネルステレオオーディオ信号を生成するパラメトリックステレオ(PS)デコーダを示している。最初に、デマルチプレクサが互換ビットストリームを入力として取り、これをオーディオビットストリームとPSサイド情報とに分解する。互換ビットストリームには空間サイド情報が下位互換性のある方法で埋め込まれているので、デマルチプレクサに影響を及ぼすことはない。知覚オーディオ符号化がモノラル信号に行われていた場合、対応するオーディオデコーダがオーディオビットストリームを入力として取り、復号化されたモノラルオーディオ信号mを生成し、この信号は、知覚オーディオコーデックによって導入された歪の影響を受けている。PS復号化ブロックは、PSサイド情報を入力として取り、PSパラメータを再構成する。これは、ハフマン符号化および時間差分(dt)または周波数差分(df)符号化がエンコーダで用いられていた場合、ハフマン復号化および時間差分(dt)または周波数差分(df)復号化を含む。最後に、PS再構成器は、復号化されたモノラル信号mとPSパラメータとを入力として取り、2チャネルのステレオ信号を再構成する。
図9は、オーディオエンコーダ10と、入力インタフェース332と、出力インタフェース334とを有する本発明のオーディオトランスミッタまたはレコーダ330を示す。
オーディオ信号は、トランスミッタ/レコーダ330の入力インタフェース332に供給することができる。このオーディオ信号は、トランスミッタ/レコーダ内で本発明のエンコーダ10によって符号化され、その符号化された表現がトランスミッタ/レコーダ330の出力インタフェース334から出力される。この符号化された表現は、次に送信することも記憶媒体に格納することも可能である。
図10は、本発明のオーディオデコーダ180と、ビットストリーム入力端342と、オーディオ出力端344とを有する本発明のレシーバまたはオーディオプレーヤ340を示す。
ビットストリームは、本発明のレシーバ/オーディオプレーヤ340の入力端342に入力することができる。次に、このビットストリームは、デコーダ180によって復号化され、復号化された信号は、本発明のレシーバ/オーディオプレーヤ340の出力端344から出力または再生される。
図11は、本発明のトランスミッタ330と本発明のレシーバ340とを備える伝送システムを示す。
トランスミッタ330の入力インタフェース332に入力されたオーディオ信号は、符号化され、トランスミッタ330の出力インタフェース334からレシーバ340の入力インタフェース342に転送される。レシーバは、このオーディオ信号を復号化し、オーディオ信号をその出力端344から再生または出力する。
本発明の概念をまとめると、本発明は、パラメトリックステレオパラメータを用いた2チャネルステレオ信号の符号化と互換性のある方法で、空間オーディオパラメータを用いたオーディオ信号のマルチチャネル表現の符号化に関すると言うことができる。本発明は、空間オーディオパラメータとパラメトリックステレオパラメータとを効率的に符号化し、符号化されたパラメータを下位互換性のある方法でビットストリームに埋め込むための新しい方法を教示する。特に、本発明は、復号化されたステレオまたはマルチチャネルオーディオ信号の品質を損わずに、下位互換ビットストリーム内のパラメトリックステレオおよび空間オーディオパラメータの総ビットレートの低減化を目的とする。ただし、復号化されたステレオ信号の品質の多少の低下が許容される場合は、総ビットレートをさらに下げることができる。
本発明の信号の下位互換性を表しているビットストリームとその生成とは、モノラルダウンミックス信号を表しているパラメータを損わず、このようなパラメータを図示のビットストリームに容易に組み込むことができることは言うまでもない。
パラメータを予測するために適切な規則を導出することができれば、パラメトリックステレオパラメータを用いて空間オーディオパラメータの任意の数値を予測できる。したがって、上に詳述した予測規則は、単なる例として理解されるべきものである。他の予測規則によって同じビット節約効果を導き出すことができることは明らかであるので、本発明は、上述の予測規則のうちの1つの使用に限定されるものでは決してない。
上述の本発明のエンコーダの例では、マルチチャネル信号のステレオダウンミックスを導出するパラメトリックステレオダウンミキサ58が用いられているが、実際の実施において、ダウンミキシング規則が既知であり、したがってパラメトリックステレオパラメータをマルチチャネル信号から直接導出できる場合、ステレオダウンミキサを省くことができる。
所定の実施において、モノラルダウンミックス信号は、オーディオエンコーダによってさらに符号化されるかまたはデコーダ側で復号化される。符号化および復号化は、任意であり、すなわち、モノラルダウンミックス信号のさらなる圧縮を省くことによっても、本発明の概念を組み込んだ本発明のエンコーダおよびデコーダが得られる。
本発明のエンコーダおよびデコーダ内の制御ユニットを省き、空間パラメータのサブセットを差分予測パラメータによって表すという一般的決定を目指してもよく、ただし、この場合、制御ユニットを省けるという利点がある代わりに、差分予測表現が伝送ビットレートの節約につながらない場合が稀にあり、このような場合にビットレートが多少高くなるという代償が伴う。
所定の例において、信号経路に使用される追加のデコーダが差分エンコーダまたは差分デコーダといわれるが、パラメータの圧縮に適した他の何れか適切なエンコーダまたはデコーダ、特に差分デコーダまたはエンコーダとハフマンデコーダまたはエンコーダとの組み合わせを用いることも可能である。このような組み合わせを用いて、最初にパラメータが差分符号化され、次にこの差分符号化されたパラメータがハフマン符号化されると、差分予測表現は、一般に、それ自体の基礎となる空間パラメータより低いエントロピーを有するので、より小さいビットレートを用いたパラメトリック表現になる。
本発明の概念をまとめると、本発明は以下を教示する。
第1の態様としては、マルチチャネルオーディオ信号の互換性のある符号化の方法であって、エンコーダ側において、マルチチャネル信号を1つのチャネル表現にダウンミックスし、エンコーダ側においてマルチチャネル信号が与えられると、マルチチャネル信号を表しているパラメータを定義し、エンコーダ側においてマルチチャネル信号が与えられると、マルチチャネル信号のステレオダウンミックスを表しているパラメータを定義し、エンコーダ側において、パラメータの両セットをビットレート効率がよくかつ下位互換性のある方法でビットストリームに埋め込み、デコーダ側において、埋め込まれたパラメータをビットストリームから抽出し、デコーダ側において、ビットストリームから抽出されたパラメータからマルチチャネル信号を表しているパラメータを再構成し、デコーダ側において、ビットストリームデータから再構成されたパラメータとダウンミックスされた信号とが与えられると、マルチチャネル出力信号を再構成することを特徴とする方法。
第2の態様としては、第1の態様による方法であって、ステレオダウンミックスを表しているパラメータを、パラメトリックステレオ復号化のみをサポートする(レガシー)復号化方法によって復号化できるように、ビットストリームに埋め込むことを特徴とする方法。
第3の態様としては、第1の態様による方法であって、マルチチャネル信号を表しているパラメータのセットを第1サブセットと第2サブセットとに分割することを特徴とする方法。
第4の態様としては、第3の態様による方法であって、パラメータの第1サブセット内の値を、パラメータの第2サブセットに基づいて、さらにマルチチャネル信号のステレオダウンミックスを表すパラメータに基づいて、予測することを特徴とする方法。
第5の態様としては、第4の態様による方法であって、パラメータの第1サブセットが直接符号化されるかまたは予測パラメータ値に対する差のみが符号化されるかを、自動的に選択する制御方法を特徴とする方法。
第6の態様としては、第3の態様による方法であって、マルチチャネル信号を表している元のパラメータとステレオダウンミックスを表している元のパラメータとの両方が、修正パラメータを導出するための基礎として用いられる、ステレオダウンミックスを表すパラメータの修正を特徴とする方法。
第7の態様としては、第4の態様による方法であって、ルックアップテーブルが、予測パラメータ値を見つけるために用いられることを特徴とする方法。
第8の態様としては、第4の態様による方法であって、第4の態様において多項式関数が、予測パラメータ値を見つけるために用いられる方法。
第9の態様としては、第4の態様による方法であって、ステレオダウンミックスを生成するために用いられる方法から導出された数学関数が、予測パラメータ値を見つけるために用いられることを特徴とする方法。
第10の態様としては、マルチチャネルオーディオ信号の表現を符号化するための装置であって、マルチチャネル信号を1つのチャネル表現にダウンミックスするための手段と、マルチチャネル信号を表しているパラメータを定義するための手段と、マルチチャネル信号のステレオダウンミックスを表しているパラメータを定義するための手段と、パラメータの両セットをビットレート効率がよくかつ下位互換性のある方法でビットストリームに埋め込む手段とを特徴とする装置。
第11の態様としては、ダウンミックスされた信号と対応パラメータセットとに基づいてマルチチャネル信号を再構成するための装置であって、ビットストリームに埋め込まれているパラメータセットを抽出するための手段と、ビットストリームから抽出されたパラメータからマルチチャネル信号を表しているパラメータを再構成するための手段と、ビットストリームデータから再構成されたパラメータセットとダウンミックスされた信号とが与えられると、マルチチャネル出力信号を再構成するための手段とを特徴とする装置。
本発明の方法の特定の実現要求によっては、本発明の方法は、ハードウェアまたはソフトウェアで実施することができる。この実施は、本発明の方法が実行されるように、プログラム可能なコンピュータシステムと協働する、デジタル記憶媒体、特に、それに格納される電子的に読み取り可能な制御信号を有するディスク、DVDまたはCDを用いて、実行することができる。そのため、本発明は、一般に、機械で読み取り可能なキャリアに格納されるプログラムコードを有するコンピュータプログラム製品であり、そのプログラムコードは、そのコンピュータプログラム製品がコンピュータ上で実行されるときに、本発明の方法を実行するために働く。したがって、言い換えれば、本発明の方法は、コンピュータプログラムがコンピュータ上で実行されるときに、少なくとも1つの本発明の方法を実行するためのプログラムコードを有するコンピュータプログラムである。
上述のように、特定の実施の形態を参照して特に図示して説明してきたが、本発明の精神、範囲を逸脱することなく、形態や詳細を様々変更することができることが、当業者ならば理解できるであろう。ここに開示するより広い概念から逸脱することなく、異なる実施の形態に適用して、変更が可能なことが、特許請求の範囲から理解できるであろう。
図1は、本発明のエンコーダのブロック図を示す。 図2は、本発明による生成されたビットストリームを示す。 図3は、本発明のエンコーダのさらなる実施の形態を示す。 図4は、図3の本発明のエンコーダの詳細を示す。 図5は、本発明のデコーダを示す。 図6は、本発明のマルチチャネルデコーダの好適な実施の形態を示す。 図7は、図6の本発明のマルチチャネルデコーダの詳細を示す。 図8は、本発明の信号の下位互換性を説明する。 図9は、本発明のエンコーダを有するトランスミッタまたはオーディオレコーダを示す。 図10は、本発明のマルチチャネルデコーダを有するレシーバまたはオーディオプレーヤを示す。 図11は、伝送システムを示す。

Claims (27)

  1. パラメトリック表現(202)を処理するためのマルチチャネルオーディオデコーダ(200)であって、前記パラメトリック表現(202)は、マルチチャネル信号の空間特性を表している1つまたは複数の空間パラメータ(204)に関する情報と前記マルチチャネル信号のステレオダウンミックスの空間特性を表しているステレオパラメータ(206)とを含み、前記1つまたは複数の空間パラメータ(204)に関する前記情報と前記ステレオパラメータ(206)とは、組み合わせ規則を用いて組み合わされることによって、1つまたは複数の空間パラメータ(210)を得る、前記デコーダは、
    前記1つまたは複数の空間パラメータ(210)を得るために前記組み合わせ規則を用いて前記ステレオパラメータ(206)と前記1つまたは複数の空間パラメータ(204)に関する前記情報とを組み合わせるためのパラメータ再構成器(208)を備える、マルチチャネルオーディオデコーダ装置(200)。
  2. 前記組み合わせ規則は、前記組み合わせが前記ステレオパラメータ(206)とパラメータの第1サブセットとを組み合わせることによって導出される置換パラメータによる前記1つまたは複数の空間パラメータ(204)に関する前記情報の前記パラメータの前記第1サブセットの置き換えを含むようになっている、請求項1に記載のマルチチャネルオーディオデコーダ(200)。
  3. 前記組み合わせ規則は、置換パラメータがパラメータの前記第1サブセットからの対応パラメータと同パラメータの予測との一次結合よって導出され、前記予測が前記1つまたは複数の空間パラメータ(204)に関する前記情報の第2サブセットのパラメータと前記ステレオパラメータ(206)とを用いて導出され、これらが予測規則を用いて組み合わされるようになっている、請求項2に記載のマルチチャネルオーディオデコーダ(200)。
  4. 前記予測規則は、前記予測が前記ステレオパラメータ(206)を用いて導出されるようになっている、請求項3に記載のマルチチャネルオーディオデコーダ(200)。
  5. 前記予測規則は、前記ステレオパラメータ(206)が前記空間パラメータの前記予測として用いられるようになっている、請求項4に記載のマルチチャネルオーディオデコーダ(200)。
  6. 前記ステレオパラメータ(206)は、前記ステレオダウンミックスのチャネル間の強度差を表している第1パラメータP1と前記ステレオダウンミックスのチャネル間の相関を表している第2パラメータP2とを含み、
    パラメータの前記第2サブセットは、前記マルチチャネル信号の左チャネルおよび右チャネルの和と前記マルチチャネル信号の中央チャネルとの間の強度差を表しているパラメータS3を含み、さらに
    前記予測規則は、前記マルチチャネル信号の前記左チャネルおよび前記右チャネルの間の強度差を表しているパラメータである、パラメータの前記第1サブセットのパラメータS1が、次式
    Figure 2008519301
  7. 前記パラメータ再構成器(226)は、パラメータの前記第1サブセットが置換パラメータに置換されるか否かを決定するための決定ユニット(252)をさらに備える、先行する請求項のいずれかに記載のマルチチャネルオーディオデコーダ(200、220)。
  8. ビットストリーム(230)から前記ステレオパラメータ(234)の表現と前記1つまたは複数の空間パラメータ(232)に関する前記情報の表現とを分解するためにビットストリーム分解器(222)をさらに備え、前記ビットストリーム(230)は、レガシーパラメトリックステレオ装置によって処理できるように下位互換性がある、先行する請求項のいずれかに記載のマルチチャネルオーディオデコーダ(200、220)。
  9. 前記ステレオパラメータ(234)の前記表現と前記1つまたは複数の空間パラメータ(232)に関する前記情報の前記表現とから前記ステレオパラメータ(272)と前記1つまたは複数の空間パラメータ(266、268)に関する前記情報とを導出するためにエントロピーデコーダと差分デコーダ(258、260、262a、262b)とをさらに備える、請求項8に記載のマルチチャネルオーディオデコーダ(200、220)。
  10. 前記ビットストリーム分解器(222)は、前記ビットストリームから前記マルチチャネル信号のモノラルダウンミックスであるモノラルダウンミックス信号(236)を分解するようにさらに動作し、さらに
    前記ダウンミックス信号(236)と前記1つまたは複数のパラメータ(238)とを用いてマルチチャネル信号(240)の再構成を導出するためのアップミキサ(228)をさらに備える、請求項8または請求項9に記載のマルチチャネルオーディオデコーダ(220)。
  11. 前記ビットストリーム(230)から分解されるモノラルダウンミックス信号(231)の符号化された表現から前記モノラルダウンミックス信号(236)を導出するためのオーディオデコーダ(224)をさらに備える、請求項10に記載のマルチチャネルオーディオデコーダ(220)。
  12. マルチチャネルオーディオ信号のパラメトリック表現(12)を導出するためのエンコーダ(10)であって、前記パラメトリック表現(12)は、モノラルダウンミックス信号とともに使用されることに適したパラメータを有し、前記エンコーダ(10)は、
    前記マルチチャネル信号の空間特性を表している1つまたは複数の空間パラメータ(20)を計算するための空間パラメータ計算器(14)と、
    前記マルチチャネル信号から導出されるステレオダウンミックス信号の空間特性を表しているステレオパラメータ(22)を計算するためのステレオパラメータ計算器(16)と、
    組み合わせ規則を用いて前記1つまたは複数の空間パラメータ(20)と前記ステレオパラメータ(22)とを組み合わせることによって前記パラメトリック表現(12)を生成するためのパラメータコンバイナ(18)であって、デコーダ使用可能なステレオパラメータ(24)と前記デコーダ使用可能なステレオパラメータ(24)とともに前記1つまたは複数の空間パラメータ(20)を表す前記1つまたは複数の空間パラメータ(26)に関する情報とを得る組み合わせ規則を用いるように動作するパラメータコンバイナ(18)とを備える、エンコーダ(10)。
  13. 前記ステレオパラメータ計算器(16)は、前記マルチチャネル信号(50)から前記ステレオダウンミックス信号(72)を導出するためのステレオダウンミキサ(58)をさらに備える、請求項12に記載のエンコーダ(10、52)。
  14. 前記マルチチャネル信号(50)から前記モノラルダウンミックス信号(68)を導出するための空間ダウンミキサ(54)をさらに備える、請求項12または請求項13に記載のエンコーダ(10、52)。
  15. レガシーパラメトリックステレオデコーダに対して下位互換性のある方法で、前記パラメトリック表現と前記モノラルダウンミックスとを含むビットストリーム(82)を導出するためのビットストリーム計算器(66)をさらに備える、請求項12ないし請求項14のいずれかに記載のエンコーダ(10、52)。
  16. 前記空間ダウンミキサ(54)は、圧縮規則を用いて前記モノラルダウンミックス信号(68)を圧縮するためのオーディオエンコーダ(62)をさらに備える、請求項14または請求項15に記載のエンコーダ。
  17. パラメトリック表現を処理するための方法であって、前記パラメトリック表現は、マルチチャネル信号の空間特性を表している1つまたは複数の空間パラメータに関する情報と前記マルチチャネル信号のステレオダウンミックスの空間特性を表しているステレオパラメータとを含み、前記1つまたは複数の空間パラメータに関する前記情報と前記ステレオパラメータとは、組み合わせ規則を用いて組み合わされることによって、前記1つまたは複数の空間パラメータを得る、前記方法は、
    前記1つまたは複数の空間パラメータを得るために前記組み合わせ規則を用いて前記ステレオパラメータと前記1つまたは複数の空間パラメータに関する前記情報とを組み合わせるステップを備える、方法。
  18. マルチチャネルオーディオ信号のパラメトリック表現を導出するための方法であって、前記パラメトリック表現は、モノラルダウンミックス信号とともに使用されることに適したパラメータを有し、前記方法は、
    前記マルチチャネル信号の空間特性を表している1つまたは複数の空間パラメータを計算するステップと、
    前記マルチチャネル信号から導出されるステレオダウンミックス信号の空間特性を表しているステレオパラメータを計算するステップと、
    組み合わせ規則を用いて前記1つまたは複数の空間パラメータと前記ステレオパラメータとを組み合わせることによって前記パラメトリック表現を生成するステップであって、デコーダ使用可能なステレオパラメータと前記デコーダ使用可能なステレオパラメータとともに前記1つまたは複数の空間パラメータを表す前記1つまたは複数の空間パラメータに関する情報とを得る前記組み合わせ規則を用いるステップとを備える、方法。
  19. マルチチャネルオーディオ信号のパラメトリック表現であって、前記パラメトリック表現は、モノラルダウンミックス信号とともに使用されることに適したパラメータを有し、前記パラメトリック表現は、前記マルチチャネル信号のステレオダウンミックスの空間特性を表しているデコーダ使用可能なステレオパラメータと、前記マルチチャネルオーディオ信号の空間特性を表している1つまたは複数の空間パラメータおよび前記ステレオパラメータを組み合わせることによって生成される1つまたは複数の空間パラメータに関する情報とを有し、前記1つまたは複数の空間パラメータに関する前記情報は、前記デコーダ使用可能なステレオパラメータとともに、前記1つまたは複数の空間パラメータを表す、パラメトリック表現。
  20. 請求項19に記載のマルチチャネルオーディオ信号のパラメトリック表現が格納されている、コンピュータ読み取り可能な記憶媒体。
  21. 請求項12に記載のマルチチャネルオーディオ信号のパラメトリック表現を導出するためのエンコーダを有する、トランスミッタまたはオーディオレコーダ(330)。
  22. 請求項1に記載のマルチチャネルオーディオデコーダ(200)を有する、レシーバまたはオーディオプレーヤ(340)。
  23. 送信またはオーディオ記録の方法であって、請求項18に記載のマルチチャネルオーディオ信号のパラメトリック表現を導出するための方法を有する、方法。
  24. 受信またはオーディオ再生の方法であって、請求項17に記載のパラメトリック表現を処理するための方法を有する、方法。
  25. トランスミッタ(330)とレシーバ(340)とを有する伝送システムであって、
    前記トランスミッタ(330)は、請求項12に記載のマルチチャネルオーディオ信号のパラメトリック表現を導出するためのエンコーダを有し、さらに
    前記レシーバ(340)は、請求項1に記載のマルチチャネルオーディオデコーダを有する、送信システム。
  26. 送受信方法であって、請求項18に記載のマルチチャネルオーディオ信号のパラメトリック表現を導出するための方法を有する送信方法と、
    請求項17に記載のパラメトリック表現を処理するための方法を有する受信方法とを備える、送受信方法。
  27. コンピュータ上で実行されるときに、請求項17、請求項18、請求項23、請求項24または請求項26に記載の方法を実行するためのコンピュータプログラム。
JP2007539523A 2004-11-02 2005-10-31 ステレオ互換性のあるマルチチャネルオーディオ符号化 Active JP4616349B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0402650A SE0402650D0 (sv) 2004-11-02 2004-11-02 Improved parametric stereo compatible coding of spatial audio
PCT/EP2005/011663 WO2006048226A1 (en) 2004-11-02 2005-10-31 Stereo compatible multi-channel audio coding

Publications (2)

Publication Number Publication Date
JP2008519301A true JP2008519301A (ja) 2008-06-05
JP4616349B2 JP4616349B2 (ja) 2011-01-19

Family

ID=33448766

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007539523A Active JP4616349B2 (ja) 2004-11-02 2005-10-31 ステレオ互換性のあるマルチチャネルオーディオ符号化

Country Status (13)

Country Link
US (2) US7916873B2 (ja)
EP (1) EP1784819B1 (ja)
JP (1) JP4616349B2 (ja)
KR (1) KR100936498B1 (ja)
CN (1) CN101036183B (ja)
AT (1) ATE393951T1 (ja)
DE (1) DE602005006424T2 (ja)
ES (1) ES2306235T3 (ja)
HK (1) HK1106606A1 (ja)
RU (1) RU2381570C2 (ja)
SE (1) SE0402650D0 (ja)
TW (1) TWI330825B (ja)
WO (1) WO2006048226A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012520481A (ja) * 2009-03-13 2012-09-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 補助データの埋め込み及び抽出
JP2013504908A (ja) * 2009-09-10 2013-02-07 ドルビー インターナショナル アーベー Fmステレオ無線レシーバのオーディオ信号のパラメトリックステレオを用いた改善
JP2014520473A (ja) * 2011-06-24 2014-08-21 コーニンクレッカ フィリップス エヌ ヴェ 符号化された多チャンネルオーディオ信号を処理するオーディオ信号プロセッサ及びその方法
JP2016514394A (ja) * 2013-02-20 2016-05-19 クゥアルコム・インコーポレイテッドQualcomm Incorporated ステガノグラフィ方式で埋め込まれた音声データを用いた遠隔会議
JP2016538585A (ja) * 2013-10-22 2016-12-08 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ダウンミックス行列を復号及び符号化するための方法、音声コンテンツを呈示するための方法、ダウンミックス行列のためのエンコーダ及びデコーダ、音声エンコーダ及び音声デコーダ
JP2021009399A (ja) * 2016-08-10 2021-01-28 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネル信号の符号化方法およびエンコーダ

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
CA3035175C (en) 2004-03-01 2020-02-25 Mark Franklin Davis Reconstructing audio signals with multiple decorrelation techniques
PL1769491T3 (pl) * 2004-07-14 2010-03-31 Koninl Philips Electronics Nv Przekształcanie kanałów audio
US7945447B2 (en) * 2004-12-27 2011-05-17 Panasonic Corporation Sound coding device and sound coding method
BRPI0519454A2 (pt) * 2004-12-28 2009-01-27 Matsushita Electric Ind Co Ltd aparelho de codificaÇço reescalonÁvel e mÉtodo de codificaÇço reescalonÁvel
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
WO2006103581A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007004830A1 (en) 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1913578B1 (en) 2005-06-30 2012-08-01 LG Electronics Inc. Method and apparatus for decoding an audio signal
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
CN101233571B (zh) * 2005-07-29 2012-12-05 Lg电子株式会社 处理音频信号的方法和装置
JP5113049B2 (ja) * 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド 符号化されたオーディオ信号の生成方法及びオーディオ信号の処理方法
US7987097B2 (en) * 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
KR100857107B1 (ko) * 2005-09-14 2008-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
KR100857113B1 (ko) * 2005-10-05 2008-09-08 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
WO2007040349A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
JP5161109B2 (ja) * 2006-01-19 2013-03-13 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置
BRPI0707136A2 (pt) * 2006-01-19 2011-04-19 Lg Electronics Inc método e aparelho para processamento de um sinal de mìdia
US8560303B2 (en) * 2006-02-03 2013-10-15 Electronics And Telecommunications Research Institute Apparatus and method for visualization of multichannel audio signals
KR101294022B1 (ko) 2006-02-03 2013-08-08 한국전자통신연구원 공간큐를 이용한 다객체 또는 다채널 오디오 신호의 랜더링제어 방법 및 그 장치
CA2637722C (en) 2006-02-07 2012-06-05 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US20090177479A1 (en) * 2006-02-09 2009-07-09 Lg Electronics Inc. Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
ES2339888T3 (es) * 2006-02-21 2010-05-26 Koninklijke Philips Electronics N.V. Codificacion y decodificacion de audio.
JP5254808B2 (ja) 2006-02-23 2013-08-07 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
EP1999745B1 (en) * 2006-03-30 2016-08-31 LG Electronics Inc. Apparatuses and methods for processing an audio signal
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
EP2036204B1 (en) * 2006-06-29 2012-08-15 LG Electronics Inc. Method and apparatus for an audio signal processing
CN101485094B (zh) * 2006-07-14 2012-05-30 安凯(广州)软件技术有限公司 最大熵意义下后向兼容多通道音频编码与解码方法和系统
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
WO2008039045A1 (en) * 2006-09-29 2008-04-03 Lg Electronics Inc., Apparatus for processing mix signal and method thereof
KR100891668B1 (ko) 2006-10-12 2009-04-02 엘지전자 주식회사 믹스 신호 처리 방법 및 장치
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
KR100891672B1 (ko) 2006-10-12 2009-04-03 엘지전자 주식회사 믹스 신호의 처리 방법 및 장치
WO2008060111A1 (en) 2006-11-15 2008-05-22 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR100891669B1 (ko) 2006-12-01 2009-04-02 엘지전자 주식회사 믹스 신호의 처리 방법 및 장치
KR100891671B1 (ko) 2006-12-01 2009-04-03 엘지전자 주식회사 믹스신호 제어 방법 및 장치
JP5270566B2 (ja) 2006-12-07 2013-08-21 エルジー エレクトロニクス インコーポレイティド オーディオ処理方法及び装置
KR101062353B1 (ko) 2006-12-07 2011-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 그 장치
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
WO2008096313A1 (en) * 2007-02-06 2008-08-14 Koninklijke Philips Electronics N.V. Low complexity parametric stereo decoder
CN101647060A (zh) * 2007-02-13 2010-02-10 Lg电子株式会社 处理音频信号的方法和装置
US20100121470A1 (en) * 2007-02-13 2010-05-13 Lg Electronics Inc. Method and an apparatus for processing an audio signal
TWI374671B (en) 2007-07-31 2012-10-11 Realtek Semiconductor Corp Audio encoding method with function of accelerating a quantization iterative loop process
KR101505831B1 (ko) 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
EP2232486B1 (en) * 2008-01-01 2013-07-17 LG Electronics Inc. A method and an apparatus for processing an audio signal
ES2391801T3 (es) * 2008-01-01 2012-11-30 Lg Electronics Inc. Procedimiento y aparato para procesar una señal de audio
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
EP2111062B1 (en) 2008-04-16 2014-11-12 LG Electronics Inc. A method and an apparatus for processing an audio signal
CN102007532B (zh) 2008-04-16 2013-06-19 Lg电子株式会社 用于处理音频信号的方法和装置
KR101061128B1 (ko) * 2008-04-16 2011-08-31 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
US8060042B2 (en) * 2008-05-23 2011-11-15 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101629862B1 (ko) * 2008-05-23 2016-06-24 코닌클리케 필립스 엔.브이. 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
EP2169666B1 (en) * 2008-09-25 2015-07-15 Lg Electronics Inc. A method and an apparatus for processing a signal
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
US8479015B2 (en) * 2008-10-17 2013-07-02 Oracle International Corporation Virtual image management
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
CN105225667B (zh) * 2009-03-17 2019-04-05 杜比国际公司 编码器系统、解码器系统、编码方法和解码方法
US8666752B2 (en) 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
WO2011045549A1 (fr) * 2009-10-16 2011-04-21 France Telecom Decodage parametrique stereo optimise
EP2346028A1 (en) 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
CN102157152B (zh) 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
US9236047B2 (en) 2010-05-21 2016-01-12 Microsoft Technology Licensing, Llc Voice stream augmented note taking
TWI516138B (zh) 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
KR101748756B1 (ko) * 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
KR101662680B1 (ko) * 2012-02-14 2016-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 멀티-채널 오디오 신호의 적응적 다운-믹싱 및 업-믹싱을 수행하기 위한 방법 및 장치
JP6163545B2 (ja) 2012-06-14 2017-07-12 ドルビー・インターナショナル・アーベー 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え
KR101434206B1 (ko) 2012-07-25 2014-08-27 삼성전자주식회사 신호 복호화 장치
KR102173422B1 (ko) * 2012-11-15 2020-11-03 가부시키가이샤 엔.티.티.도코모 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
BR122021009025B1 (pt) 2013-04-05 2022-08-30 Dolby International Ab Método de decodificação para decodificar dois sinais de áudio e decodificador para decodificar dois sinais de áudio
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
WO2014191793A1 (en) * 2013-05-28 2014-12-04 Nokia Corporation Audio signal encoder
TWI774136B (zh) 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
CN117037810A (zh) * 2013-09-12 2023-11-10 杜比国际公司 多声道音频内容的编码
RU2648632C2 (ru) 2014-01-13 2018-03-26 Нокиа Текнолоджиз Ой Классификатор многоканального звукового сигнала
KR101500972B1 (ko) * 2014-03-05 2015-03-12 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
US9848275B2 (en) * 2014-04-02 2017-12-19 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
US9674598B2 (en) 2014-04-15 2017-06-06 Fairchild Semiconductor Corporation Audio accessory communication with active noise cancellation
US10366695B2 (en) * 2017-01-19 2019-07-30 Qualcomm Incorporated Inter-channel phase difference parameter modification
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
WO2023088560A1 (en) * 2021-11-18 2023-05-25 Nokia Technologies Oy Metadata processing for first order ambisonics
CN115691515A (zh) * 2022-07-12 2023-02-03 南京拓灵智能科技有限公司 一种音频编解码方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005523624A (ja) * 2002-04-22 2005-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号合成方法
JP2006520927A (ja) * 2003-03-17 2006-09-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多重チャネル信号の処理方法
JP2007531027A (ja) * 2004-04-16 2007-11-01 コーディング テクノロジーズ アクチボラゲット レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR9105987A (pt) 1990-09-19 1993-02-02 Philips Nv Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
CN1705980A (zh) 2002-02-18 2005-12-07 皇家飞利浦电子股份有限公司 参数音频编码
WO2003090208A1 (en) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
BR0305555A (pt) * 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
WO2004072956A1 (en) 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005523624A (ja) * 2002-04-22 2005-08-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号合成方法
JP2006520927A (ja) * 2003-03-17 2006-09-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多重チャネル信号の処理方法
JP2007531027A (ja) * 2004-04-16 2007-11-01 コーディング テクノロジーズ アクチボラゲット レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP2007532960A (ja) * 2004-04-16 2007-11-15 コーディング テクノロジーズ アクチボラゲット マルチチャネルオーディオ信号を表示するための装置と方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012520481A (ja) * 2009-03-13 2012-09-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 補助データの埋め込み及び抽出
US9877132B2 (en) 2009-09-10 2018-01-23 Dolby International Ab Audio signal of an FM stereo radio receiver by using parametric stereo
JP2013504908A (ja) * 2009-09-10 2013-02-07 ドルビー インターナショナル アーベー Fmステレオ無線レシーバのオーディオ信号のパラメトリックステレオを用いた改善
US8929558B2 (en) 2009-09-10 2015-01-06 Dolby International Ab Audio signal of an FM stereo radio receiver by using parametric stereo
JP2014520473A (ja) * 2011-06-24 2014-08-21 コーニンクレッカ フィリップス エヌ ヴェ 符号化された多チャンネルオーディオ信号を処理するオーディオ信号プロセッサ及びその方法
US9626975B2 (en) 2011-06-24 2017-04-18 Koninklijke Philips N.V. Audio signal processor for processing encoded multi-channel audio signals and method therefor
JP2016514394A (ja) * 2013-02-20 2016-05-19 クゥアルコム・インコーポレイテッドQualcomm Incorporated ステガノグラフィ方式で埋め込まれた音声データを用いた遠隔会議
US9947326B2 (en) 2013-10-22 2018-04-17 Fraunhofer-Gesellschaft zur Föderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
JP2016538585A (ja) * 2013-10-22 2016-12-08 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ダウンミックス行列を復号及び符号化するための方法、音声コンテンツを呈示するための方法、ダウンミックス行列のためのエンコーダ及びデコーダ、音声エンコーダ及び音声デコーダ
US10468038B2 (en) 2013-10-22 2019-11-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US11393481B2 (en) 2013-10-22 2022-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
US11922957B2 (en) 2013-10-22 2024-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
JP2021009399A (ja) * 2016-08-10 2021-01-28 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネル信号の符号化方法およびエンコーダ
JP7091411B2 (ja) 2016-08-10 2022-06-27 華為技術有限公司 マルチチャネル信号の符号化方法およびエンコーダ
JP2022137052A (ja) * 2016-08-10 2022-09-21 華為技術有限公司 マルチチャネル信号の符号化方法およびエンコーダ
JP7443423B2 (ja) 2016-08-10 2024-03-05 華為技術有限公司 マルチチャネル信号の符号化方法およびエンコーダ
US11935548B2 (en) 2016-08-10 2024-03-19 Huawei Technologies Co., Ltd. Multi-channel signal encoding method and encoder

Also Published As

Publication number Publication date
RU2381570C2 (ru) 2010-02-10
DE602005006424D1 (de) 2008-06-12
DE602005006424T2 (de) 2009-05-28
US7916873B2 (en) 2011-03-29
US20110211703A1 (en) 2011-09-01
CN101036183B (zh) 2011-06-01
WO2006048226A1 (en) 2006-05-11
US8654985B2 (en) 2014-02-18
ES2306235T3 (es) 2008-11-01
SE0402650D0 (sv) 2004-11-02
EP1784819B1 (en) 2008-04-30
TWI330825B (en) 2010-09-21
EP1784819A1 (en) 2007-05-16
JP4616349B2 (ja) 2011-01-19
HK1106606A1 (en) 2008-03-14
US20060133618A1 (en) 2006-06-22
RU2007120634A (ru) 2008-12-10
ATE393951T1 (de) 2008-05-15
TW200627379A (en) 2006-08-01
KR20070051915A (ko) 2007-05-18
CN101036183A (zh) 2007-09-12
KR100936498B1 (ko) 2010-01-13

Similar Documents

Publication Publication Date Title
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
US9966080B2 (en) Audio object encoding and decoding
JP4521032B2 (ja) 空間音声パラメータの効率的符号化のためのエネルギー対応量子化
JP4685925B2 (ja) 適応残差オーディオ符号化
EP1909265B1 (en) Interpolation and signalling of spatial reconstruction parameters for multichannel coding and decoding of audio sources
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP5106383B2 (ja) オーディオ符号化および復号化
KR100888474B1 (ko) 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101271069B1 (ko) 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법
RU2382419C2 (ru) Многоканальный кодер
CN110890101B (zh) 用于基于语音增强元数据进行解码的方法和设备
JP2011501823A (ja) アップミックスを使用した音声符号器
KR20080032146A (ko) 파라메트릭 멀티 채널 오디오 코딩과 매트릭스 서라운드멀티 채널 코딩 사이의 갭을 브릿징하는 개념
JP2012516596A (ja) ダウンミックスオーディオ信号をアップミックスするためのアップミキサー、方法、および、コンピュータ・プログラム
JP6520937B2 (ja) オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
JP6179122B2 (ja) オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
CN113614827B (zh) 用于预测性译码中的低成本错误恢复的方法和设备
KR20080030848A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101021

R150 Certificate of patent or registration of utility model

Ref document number: 4616349

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250