JP4856641B2 - 符号化されたマルチチャネル信号を発生するための装置および方法並びに符号化されたマルチチャネル信号を復号化するための装置および方法 - Google Patents

符号化されたマルチチャネル信号を発生するための装置および方法並びに符号化されたマルチチャネル信号を復号化するための装置および方法 Download PDF

Info

Publication number
JP4856641B2
JP4856641B2 JP2007528760A JP2007528760A JP4856641B2 JP 4856641 B2 JP4856641 B2 JP 4856641B2 JP 2007528760 A JP2007528760 A JP 2007528760A JP 2007528760 A JP2007528760 A JP 2007528760A JP 4856641 B2 JP4856641 B2 JP 4856641B2
Authority
JP
Japan
Prior art keywords
parameter set
parameter
data stream
channel
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007528760A
Other languages
English (en)
Other versions
JP2008511848A (ja
Inventor
ユールゲン ヘレ
ラルフ スペルシュナイダー
ジョーハン ヒルペアト
カルステン リンツマイアー
ハラルド ポップ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2008511848A publication Critical patent/JP2008511848A/ja
Application granted granted Critical
Publication of JP4856641B2 publication Critical patent/JP4856641B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Error Detection And Correction (AREA)

Description

本発明は、パラメトリックオーディオマルチチャネル処理技術に関し、特に、再構成に利用可能ないくつかの異なるパラメータセットがある場合のパラメトリックサイド情報の効率的な構成に関する。
推奨されたマルチチャネルサラウンド表現は、2つのステレオチャネルに加えて、中央チャネルCおよび2つのサラウンドチャネル、すなわち、左サラウンドチャネルLsおよび右サラウンドチャネルRsを含み、さらに、適用可能な場合、LFEチャネル(LFE=低周波エンハンスメント)とも呼ばれるサブウーファチャネルを含む。この基準サウンドフォーマットは、3/2(プラスLEF)ステレオとも呼ばれ、最近では、3つの前チャネル、2つのサラウンドチャネルおよび1つのLEFチャネルがあることを意味する5.1マルチチャネルとも呼ばれる。一般に、この推奨されたマルチチャネルサラウンド表現に対して5個または6個の伝送チャネルが必要である。再生環境では、正しく置かれた5つのラウドスピーカから所定の距離離れた最適ないわゆるスイートスポットを得るために、それぞれの5つの異なった位置に、少なくとも5つのラウドスピーカが必要である。しかしながら、その位置決めに関して、サブウーファは、比較的自由な方法で使用することができる。
マルチチャネルオーディオ信号を送信するために必要とされるデータ量を減らすためのいくつかの技術がある。このような技術は、ジョイントステレオ技術とも呼ばれる。このために、図5を参照する。図5は、ジョイントステレオ装置60を示す。この装置は、例えば、インテンシティステレオ技術(IS技術)またはバイノーラルキュー符号化(BCC)を実施する装置とすることができる。このような装置は、一般に、入力信号として少なくとも2つのチャネル(CH1、CH2、・・・CHn)を受信し、少なくとも1つのキャリアチャネル(ダウンミックス)およびパラメトリックデータ、すなわち1つ以上のパラメータセットを出力する。パラメトリックデータは、各元のチャネル(CH1、CH2、・・・CHn)の近似値をデコーダで算出することができるように決められる。
通常、キャリアチャネルは、サブバンドサンプル、スペクトル係数または時間領域サンプル等を含み、これらにより、基礎となる信号の比較的細かな表現を提供する一方、パラメトリックデータおよび/またはパラメータセットは、そのようなサンプルまたはスペクトル係数を含まない。その代わり、パラメトリックデータは、乗算による重み付け、時間シフト、周波数シフトなどのように、所定の再構成アルゴリズムを制御するための制御パラメータを含む。このため、パラメトリックデータは、信号または関連付けられたチャネルの比較的粗い表現だけを含む。キャリアチャネルにより必要とされるデータ量は、数字で表現すると、60から70キロビット/秒の範囲内になる一方、パラメトリックサイド情報のより必要とされるデータ量は、1つのチャネルに対して1.5キロビット/秒からのオーダーになる。以下で説明するように、パラメトリックデータの一例は、既知のスケールファクタ、インテンシティステレオ情報またはバイノーラルキューパラメータである。
インテンシティステレオ符号化技術は、J.ヘレ(Herre)、K.H.ブランデンブルグ(Brandenburg)およびD.レーデラー(Lederer)の「インテンシティステレオ符号化(Intensity stereo coding)」という題名のAES予稿集3799、1994年2月、アムステルダム、に記載されている。一般に、インテンシティステレオの概念は、2つのステレオオーディオチャネルのデータに適用される主軸変換に基づいている。大部分のデータポイントが第1の主軸のまわりに置かれる場合、符号化を行う前に2つの信号を所定の角度回転することにより符号化利得を達成することができる。しかしながら、これは、常に実際のステレオ再生技術に適用されるわけではない。左右チャネルに対して再構成された信号は、同じ送信信号の別々に重み付けまたはスケーリングされたバージョンからなる。それにもかかわらず、再構成された信号は、振幅において異なるが、それらの位相情報については同一である。しかしながら、2つの元のオーディオチャネルのエネルギー時間エンベロープは、周波数選択的な方式において典型的に動作する選択的なスケーリング動作により維持される。これは、エネルギーエンベロープにより主要な空間キューが決定される高い周波数での人間のサウンド知覚に一致する。
さらに、実際の実施において、送信信号、すなわちキャリアチャネルは、2つの成分を回転させる代わりに、左チャネルおよび右チャネルの和信号で形成される。さらに、この処理、すなわちスケーリング動作を実行するためのインテンシティステレオパラメータの発生は、周波数選択的な方法において実行され、すなわち、各スケールファクタバンド、すなわち各エンコーダの周波数区分に対して互いに独立して実行される。好ましくは、2つのチャネルは、結合または「キャリア」チャネルを形成するために結合される。結合チャネルの他に、第1のチャネルのエネルギー、第2のチャネルのエネルギーおよび結合または和チャネルのエネルギーに依存するインテンシティステレオ情報が決定される。
BCC技術については、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「ステレオおよびマルチチャネルオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural cue coding applied to stereo and multi−channel audio compression)」という題名のAESコンベンション論文5574、2002年5月、ミュンヘン、に記載されている。BCC符号化では、オーバーラップウィンドウを有するDFTベースの変換を用いて、多数のオーディオ入力チャネルが、スペクトル表現に変換される。得られるスペクトルは、重なりのない区分に分割される。各区分は、等価矩形帯域幅(ERB)に比例する帯域幅を有する。いわゆるチャネル間レベル差(ICLD)のほかにいわゆるチャネル間時間差(ICTD)が、各区分、すなわち各帯域および各フレームk、すなわち時間サンプルのブロックに対して算出される。ICDTおよびICDTパラメータは、BCCビットストリームを得るために量子化および符号化される。チャネル間レベル差およびチャネル間時間差は、基準チャネルに関して、各チャネルに与えられる。特に、パラメータは、処理される信号の特定の区分に依存する所定の式に従って算出される。
デコーダ側において、デコーダは、モノラル信号およびBCCビットストリーム、すなわちチャネル間時間差に対する第1のパラメータセットおよびチャネル間レベル差に対する第2のパラメータセットを受信する。モノラル信号は、周波数領域に変換され、復号化されたICLDおよびICTD値も受信する合成ブロックに入力される。合成ブロックまたは再構成ブロックにおいて、BCCパラメータ(ICLDおよびICTD)は、マルチチャネル信号を再構成するためにモノラル信号の重み付け動作を実行するために用いられ、次に、このマルチチャネル信号は、周波数/時間変換後、元のマルチチャネルオーディオ信号の再構成を表す。
BCCの場合、ジョイントステレオモジュール60は、パラメトリックチャネルデータが量子化され、ICLDおよびICTDパラメータを符号化するように、チャネルサイド情報を出力するために動作し、元のチャネルのうちの1つは、チャネルサイド情報を符号化するために基準チャネルとして用いられる。通常、キャリアチャネルは、関与する元のチャネルの和で形成される。
もちろん、上記の技術では、キャリアチャネルを復号化できるが、2つ以上の入力チャネルの1つ以上の近似値を発生するためのパラメータデータを発生できないデコーダに対して、モノラル表現を提供するにすぎない。
BCC技術と呼ばれるオーディオ符号化技術については、米国特許出願公開第2003/0219130A1号、米国特許出願公開第2003/0026441A1号および米国特許出願公開第2003/0035553A1号にさらに記載されている。さらに、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「バイノーラルキュー符号化パートII:スキームおよびアプリケーション(Binaural Cue Coding. Part. II:Schemes and Applications)」、オーディオおよびスピーチプロシーディング(Audio and Speech Proc.)におけるIEEEトランザクション、11巻、第6号、1993年11月、も参照のこと。さらに、C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「ステレオおよびマルチチャネルオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural Cue Coding applied to Stereo and Multi−Channel Audio compression)」、オーディオ技術学会(AES)第112回コンベンション予稿集、2002年5月およびJ.ヘレ(Herre)、C.フォーラ(Faller)、C.エルテル(Ertel)、J.ヒルパート(Hilpert)、A.ヘルツァー(Hoelzer)およびC.シュピンガー(Spenger)の「MP3サラウンド:マルチチャネルオーディオの効率的で互換性のある符号化(MP3 Surround:Efficient and Compatible Coding of Multi−Channel Audio)」、第116回AESコンベンション予稿集6049、2004年、ベルリン、も参照のこと。以下、図6〜図8を参照して、マルチチャネルオーディオ符号化のための典型的で一般的なBCCスキームについてさらに詳細に説明する。図6は、マルチチャネルオーディオ信号の符号化/伝送のための一般的なBCC符号化スキームを示す。マルチチャネルオーディオ入力信号は、BCCエンコーダ112の入力110に入力され、いわゆるダウンミックスブロック114において「ミックスダウン」、すなわち、1つの和チャネルに変換される。本例において、入力110における信号は、前左チャネル、前右チャネル、左サラウンドチャネル、右サラウンドチャネルおよび中央チャネルを有する5チャネルのサラウンド信号である。典型的には、ダウンミックスブロックは、これらの5つのチャネルをモノラル信号に単純に加算することにより和信号を発生する。他のダウンミックススキームについては、当技術において公知であり、これらは全て、マルチチャネル入力信号を用いて、1つのチャネルを有するか、または、いかなる場合においても元の入力チャネルの数よりも少ない多数のダウンミックスチャネルを有するダウンミックス信号を発生する。本例では、ダウンミックス動作は、4つのキャリアチャネルが5つの入力チャネルから発生されていれば、すでに達成されていることになる。1つの出力チャネルおよび/または多数の出力チャネルは、和信号ライン115に出力される。
BCC解析ブロック116により得られるサイド情報は、サイド情報ライン117に出力される。BCC解析ブロックでは、ICLD、ICTDまたはチャネル間相関値(ICC値)に対するパラメータセットを算出することもできる。このように、BCC合成ブロック122における再構成に対して3つまでの異なるパラメータセット(ICLD、ICTDおよびICC)があることになる。
和信号およびパラメータセットを有するサイド情報は、典型的には、量子化および符号化されたフォーマットにおいてBCCデコーダ120に送信される。BCCデコーダは、送信和信号を多数のサブバンドに分割し、再構成されるいくつかのチャネルのサブバンドを発生するために、スケーリング、遅延およびさらなる処理を実行する。この処理は、出力121における再構成されたマルチチャネル信号のICLD、ICTDおよびICCパラメータ(キュー)がBCCエンコーダ112の入力110における元のマルチチャネル信号に対するそれぞれのキューと同様になるように実行される。このために、BCCデコーダ120は、BCC合成ブロック122およびサイド情報処理ブロック123を含む。
以下に、図7を参照して、BCC合成ブロック122の内部構造を例示する。ライン115上の和信号は、典型的にはフィルタバンクFB125として具現化される時間/周波数変換ブロックに入力される。ブロック125の出力には、オーディオフィルタバンク125がN個の時間領域サンプルからN個のスペクトル係数を発生する変換を実行する場合、N個のサブバンド信号、または、極端な場合ではスペクトル係数のブロックがある。
BCC合成ブロック122は、さらに、遅延ステージ126、レベル修正ステージ127、相関処理ステージ128および逆フィルタバンクを表すステージIFB129を含む。ステージ129の出力では、例えば、5チャネルのサラウンドシステムの場合に、5つのチャネルを有する再構成されたマルチチャネルオーディオ信号が、図6に示されるように、1セットのラウドスピーカ124に出力される。
図7は、さらに、入力信号s(n)がエレメント125により、周波数領域またはフィルタバンク領域に変換されることを示す。エレメント125により出力される信号は、ノード130で示されるように、同じ信号のいくつかのバージョンが得られるように、乗算される。元の信号のバージョンの数は、再構成される出力信号における出力チャネルの数と等しい。元の信号の各バージョンがノード130における所定の遅延d1、d2、・・・di、dNを受ける場合、結果として、ブロック126の出力では、同じ信号のバージョンを含むが異なる遅延を有する状況になる。遅延パラメータは、図6のサイド情報処理ブロック123により算出され、BCC解析ブロック116により決定されたように、チャネル間時間差から導出される。
同じことが、乗算パラメータa1、a2・・・ai、aNについて適用され、これらについても、BCC解析ブロック116により決定されるチャネル間レベル差に基づきサイド情報処理ブロック123によって算出される。
ICCパラメータは、遅延されレベルが操作された信号間の所定の相関値がブロック128の出力で得られるように、BCC解析ブロック116により算出され、さらにブロック128の機能を制御するために用いられる。ステージ126、127、128の順序は、図7に示すものと異なっていてもよいことに留意されたい。
さらに、オーディオ信号のブロック的な処理において、BCC解析も、ブロック的に実行されることにも留意されたい。さらに、BCC解析も、周波数的に実施され、すなわち、周波数選択的な方法で実施される。これは、各スペクトル帯域に対して、ICLDパラメータ、ICTDパラメータおよびICCパラメータがあることを意味する。このため、全ての帯域にわたる少なくとも1つのチャネルに対するICTDパラメータは、ICTDパラメータセットを表す。これは、少なくとも1つの出力チャネルを再構成するための全ての周波数帯域に対する全てのICLDパラメータを表すICLDパラメータセットにも適用される。これは、次に、入力チャネルまたは和チャネルに基づき少なくとも1つの出力チャネルを再構成するための種々の帯域に対するいくつかの個別のICCパラメータも含むICCパラメータセットにも適用される。
以下において、BCCパラメータの決定がわかる状況を示す図8を参照する。通常、ICLD、ICTDおよびICCパラメータは、チャネルペア間で決めることができる。しかしながら、典型的には、ICLDおよびICTDパラメータの決定は、入力チャネルのおのおのに明確なパラメータセットがあるように、基準チャネルおよび相互入力チャネル間で実行される。これは、図8Bでも示される。
しかしながら、ICCパラメータは、別に決めることもできる。一般に、ICCパラメータは、図8Bでも概略的に示されているように、任意のチャネルペア間でエンコーダにおいて発生することができる。この場合、デコーダは、任意のチャネルペア間で元の信号に存在するものとほぼ同じ結果が得られるように、ICC合成を実行する。しかしながら、任意の時間、すなわち各時間フレームにおいて最も強い2つのチャネル間でICCパラメータだけを算出する提案がされていた。このスキームは、図8Cに表され、同図は、ある時点で、チャネル1および2間のICCパラメータが算出され送信され、別の時点で、チャネル1および5間のICCパラメータが算出される例を示す。デコーダは、その後、デコーダの最も強い2つのチャネル間のチャネル間相関を合成し、さらに典型的には、残りのチャネルペアに対するチャネル間コヒーレンスを合成するためのヒューリスティックルールを実行する。
例えば、送信ICLDパラメータに基づいて乗算パラメータa1、・・・aNを算出するには、前述のAESコンベンション論文5574を参照する。ICLDパラメータは、元のマルチチャネル信号におけるエネルギー分布を表す。一般性を失うことなく、図8Aは、前左チャネルと他の全てのチャネルとの間のエネルギー差を表す4つのICLDパラメータがあることを示す。サイド情報処理ブロック123において、乗算パラメータa1、・・・aNは、再構成された全ての出力チャネルの総エネルギーが送信和信号のエネルギーと同じになるか、または、少なくともこのエネルギーに比例するように、ICLDパラメータから導出される。これらのパラメータを決定する1つの方法は、2ステージ処理であり、これは、第1のステージにおいて、左前チャネルに対する乗算ファクタが1に設定され、他方、図8Cの他のチャネルに対する乗算ファクタが送信ICLD値に設定される。次に、第2のステージにおいて、5つのチャネル全てのエネルギーが算出され、送信和信号のエネルギーと比較される。次に、全てのチャネルは、すなわち全てのチャネルに対して等しいスケーリングファクタを用いてダウンスケーリングされ、このスケーリングファクタは、スケーリング後、再構成された全ての出力チャネルの総エネルギーが送信和信号および/または複数の送信和信号の総エネルギーと等しくなるように選択される。
さらなるパラメータセットとしてBCCエンコーダからBCCデコーダに送信されるチャネル間コヒーレンス測定値ICCに関して、20log10-6から20log106の間の値を有する乱数により全てのサブバンドの重み付けファクタを乗算するといった乗算ファクタの修正によってコヒーレンス操作を実行することができるということに留意されたい。擬似乱数シーケンスは、典型的には、全ての重要な帯域のバリアンスがほぼ等しく、各重要な帯域内での平均値がゼロになるように選択される。同じシーケンスは、各々の異なるフレームまたはブロックのスペクトル係数に対して用いられる。したがって、オーディオシーンの幅は、擬似乱数シーケンスのバリアンスを修正することにより制御される。より大きいバリアンスは、より大きい聴覚幅も発生する。バリアンス修正は、重要な帯域の幅を有する個別の帯域において実行することができる。このように、異なる聴覚幅を有する各対象が、聴覚シーンにおいて、いくつか同時に存在できるようになる。擬似乱数シーケンスに対して適した振幅の分布は、米国特許出願公開第2002/0219130A1号で表されているように、対数目盛上での均一な分布である。
通常のステレオデコーダにも適しているビットストリームフォーマットなどの互換性方法で5つのチャネルを送信するために、G.タイレ(Theile)およびG.ストール(Stoll)の「MUSICAMサラウンド:ISO/IEC11172−3と互換性のある汎用マルチチャネル符号化システム(MUSICAM Surround:A universal multi−channel coding system compatible with ISO/IEC 11172−3)」、AES予稿集、1992年10月、サンフランシスコ、に記載されているいわゆるマトリクス技術が用いられる。
さらに、B.グリル(Grill)、J.ヘレ(Herre)、K.H.ブランデンブルグ(Brandenburg)、I.エバーライン(Eberlein)、J.コラー(Koller)およびJ.ミラー(Miller)の出版物「改良されたMPEG2オーディオマルチチャネル符号化(Improved MPEG 2 Audio multi−channel encoding)」、AES予稿集3865、1994年2月、アムステルダム、にマルチチャネル符号化技術がさらに記載され、ここでは、元の入力チャネルからダウンミックスチャネルを得るために互換性マトリクスが用いられる。
要約すると、BCC技術によればマルチチャネルオーディオ素材の効率的であって後方互換性もある符号化をすることが可能になるが、これについては、例えば、「複雑さの低いパラメトリックステレオ符号化(Low−Complexity Parametric Stereo Coding)」という題名のE.シュイヤー(Schuijer)、J.ブレーバールト(Breebaart)、H.パーンハーゲン(Purnhagen)およびJ.エングデガルド(Engdegard)による専門家の出版物、第119回AESコンベンション予稿集6073、2004年、ベルリン、にも記載されている。これに関連して、MPEG4標準、および特にパラメトリックオーディオ技術の拡張について述べる必要があるが、この標準部分は、同じく記号表示ISO/IEC14496−3:2001/FDAM2(パラメトリックオーディオ)でも知られている。これに関して、特に、「syntax of the ps_data()」という題名のMPEG4標準の表8.9のシンタクスに言及する必要がある。この例では、シンタクスエレメント「enable_icc」および「enable_ipdopd」について言及する必要があり、これらのシンタクスエレメントは、ICCパラメータおよびチャネル間時間差に対応する位相の伝送をオン/オフするために用いられる。さらに、シンタクスエレメント「icc_data()」、「ipd_data()」および「opd_data()」についても言及する必要がある。
要約すると、一般的に、このようなパラメトリックマルチチャネル技術は、1つまたはいくつかの伝送キャリアチャネルを使用して用いられることに留意されたい。ここでは、M個の伝送チャネルは、N個の出力チャネルまたはK個の出力チャネルを再構成するためにN個の元のチャネルから形成され、ここで、Kは、元のチャネル数N以下である。
ここまで説明したどの技術でも問題になっているのは、BCCデコーダおよびパラメトリックサイド情報の異なるバージョンなどに対して、マルチチャネルデコーダのためのデコーダの異なるタイプ間でどのようなフォーマット互換性が作成されるかという問題である。特に、異なるマルチチャネルデコーダが市場に存在すると同時にその一方で、異なるマルチチャネルデコーダにより発生される異なるパラメータセットを有するサイド情報が市場にあり、このため1つのデコーダだけを有するユーザにも利用可能である場合は、2つの問題が生ずる。
第1は、復号化において最適なマルチチャネルサウンド品質を提供する高計算能力を有するデコーダを有することが望ましいということである。しかしながら、同時に、携帯電話といった移動式装置のデコーダといったリソースの限られた条件下で動作するデコーダもある。当然ながら、このようなデコーダであっても可能な限り良好な品質のマルチチャネル出力を提供するが、限られた計算量しかもたないようにする必要もある。その結果、この種の拡張性をサポートする空間再構成のためのパラメータセットを有するビットストリームフォーマットが有り得るかどうか、すなわち、非常に複雑な復号化もできるし、ひいてはあまり複雑でなく、それに応じて品質も劣るが最善の品質および復号化を実現することもできるものが有り得るのか、という問題が発生する。
BCCエンコーダの新しい世代/バージョン、ひいてはBCCビットストリームを導入する場合に考慮しなければならない点は、BCCビットストリームの異なるバージョンとBCCデコータとの間の互換性がどのように維持されるかという問題である。言い換えると、新しいBCCパラメータセットおよび同じく更新された古いパラメータセットは、後方互換性であることが望ましい。これによって、当然ながら、技術の進歩によって新しい改良されたマルチチャネルスキームが利用可能になった場合に、このスキームをBCCユーザが導入できるように更新までの方針を提供することが望ましい。他方、新しいBCCビットストリームフォーマットができると、通常、これらのビットストリームと種々の(古い)BCCデコーダバージョンとの間で不適合が起こる。
特に、マルチチャネルエンコーダ/デコーダが用いられるフィールドで、必ずしも最大の計算能力を利用することができるわけでなく、必ずしも常に完全なサウンドの品質が必要とされないアプリケーションのフィールドの数が増えていることに留意されたい。
米国特許出願公開第2003/0219130A1号 米国特許出願公開第2003/0026441A1号 米国特許出願公開第2003/0035553A1号 J.ヘレ(Herre)、K.H.ブランデンブルグ(Brandenburg)およびD.レーデラー(Lederer)の「インテンシティステレオ符号化(Intensity stereo coding)」、AES予稿集3799、1994年2月、アムステルダム C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「ステレオおよびマルチチャネルオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural cue coding applied to stereo and multi−channel audio compression)」、AESコンベンション論文5574、2002年5月、ミュンヘン、 C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「バイノーラルキュー符号化パートII:スキームおよびアプリケーション(Binaural Cue Coding. Part. II:Schemes and Applications)」、オーディオおよびスピーチプロシーディング(Audio and Speech Proc.)におけるIEEEトランザクション、11巻、第6号、1993年11月 C.フォーラ(Faller)およびF.バウムガルテ(Baumgarte)の「ステレオおよびマルチチャネルオーディオ圧縮に応用されるバイノーラルキュー符号化(Binaural Cue Coding applied to Stereo and Multi−Channel Audio compression)」、オーディオ技術学会(AES)第112回コンベンション予稿集、2002年5月 J.ヘレ(Herre)、C.フォーラ(Faller)、C.エアテル(Ertel)、J.ヒルパート(Hilpert)、A.ヘルツァー(Hoelzer)およびC.シュピンガー(Spenger)の「MP3サラウンド:マルチチャネルオーディオの効率的で互換性のある符号化(MP3 Surround:Efficient and Compatible Coding of Multi−Channel Audio)」、第116回AESコンベンション予稿集6049、2004年、ベルリン、 G.タイレ(Theile)およびG.ストール(Stoll)の「MUSICAMサラウンド:ISO/IEC11172−3と互換性のある汎用マルチチャネル符号化システム(MUSICAM Surround:A universal multi−channel coding system compatible with ISO/IEC 11172−3)」、AES予稿集、1992年10月、サンフランシスコ B.グリル(Grill)、J.ヘレ(Herre)、K.H.ブランデンブルグ(Brandenburg)、I.エバーライン(Eberlein)、J.コラー(Koller)およびJ.ミラー(Miller)の「改良されたMPEG2オーディオマルチチャネル符号化(Improved MPEG 2 Audio multi−channel encoding)」、AES予稿集3865、1994年2月、アムステルダム E.シュイヤー(Schuijer)、J.ブレーバールト(Breebaart)、H.パーンハーゲン(Purnhagen)およびJ.エングデガルド(Engdegard)の「複雑さの低いパラメトリックステレオ符号化(Low−Complexity Parametric Stereo Coding)」、第119回AESコンベンション予稿集6073、2004年、ベルリン
本発明の目的は、効率的で柔軟な、すなわち、例えば、新しいパラメータセットの統合または古いパラメータセットの更新を可能にし、同時に、さまざまな異なるアプリケーションで柔軟に用いられる概念を提供することである。
この目的は、請求項1に記載の符号化されたマルチチャネル信号を発生するための装置、請求項2に記載の符号化されたマルチチャネル信号を復号化するための装置、請求項15に記載の符号化されたマルチチャネル信号を発生するための方法、請求項16に記載のマルチチャネル信号を復号化するための方法、または、請求項17に記載のプログラムによって達成される。
本発明は、少なくとも1つの伝送チャネルまたはキャリアチャネルに加えて、少なくとも2つの異なるパラメータセットを含むデータストリームとして、符号化されたマルチチャネル信号が書き込まれる場合に、符号化されたマルチチャネル信号の効率的で後方互換性のある復号化が達成され、ここで、出力チャネルの再構成が少なくとも2つのパラメータセットより少ないパラメータセットで実行されるように、2つのパラメータセットがデータストリームに書き込まれるという研究結果に基づいている。本発明により、パラメータセットのうちのどの1つが再構成で必要であり、どのパラメータセットが再構成で任意に必要であるかをデコーダが識別するように、データストリームが書き込まれる。この場合、デコーダは、再構成に対して不可欠な(すなわち、義務的な)パラメータセットだけを用いることができ、外部の事情によって求められる場合は、任意のパラメータセットを単に無視する場合もある。これによって、再構成のための必須のパラメータセットだけを用いる場合にデコーダが高速であり、限られた計算能力で管理する一方、同時に、符号化されたマルチチャネル信号を表す同一のデータストリームに基づいて高品質のマルチチャネル再構成を他のデコーダが実行するが、これがさらに時間および/またはさらに計算能力および/またはさらに一般的にはさらなるデコーダリソースも必要とすることになる。
本発明の好適な実施の形態において、必須のパラメータセットはチャネル間レベル差を含むものである。本発明によって見出されたように、これらのチャネル間レベル差は、あらゆるタイプの再構成状況のための出力チャネル間における基本的なマルチチャネルサウンド分布を決める上で極めて重要である。ヘッドホン、すなわち1つの伝送チャネルから2つの出力チャネルを経由して表現される場合、または、いわゆる相対的に「乾燥した」音響状況、すなわちエコーのほとんどない音響状況でマルチチャネルオーディオ表現が発生する場合のいずれかにおいて、チャネル間時間差が主に関連することから、このチャネル間時間差が任意のパラメータセットとして分類される。このように、チャネル間時間差は、任意のパラメータセットとしてすでに分類される場合もある。
チャネル間相関値は、サウンドソースの幅を提供し、さらに、多くの非相関サウンドコンポーネンツを含む複雑なサウンドソース、例えばクラッシックのオーケストラを有するシナリオに聴取者が置かれる場合の聴取者に対して印象を発生する上で重要である。ICCパラメータセットは、品質に大きな影響を与えることが明らかであることから、任意のパラメータセットとして分類される場合があるが、再構成において、比較的大きな計算量をもたらすものの、これは、例えば、チャネル間レベル差の必須のパラメータセットではあまり重要ではなく、その理由として、本質的に重み付け動作、すなわち、計算に関して効率的に実行される乗算だけが必要とされるからである。
データストリームにおけるパラメータセットを有する符号化されたマルチチャネル信号の後方互換性の問題に関して、例えば、高バージョン数を有するパラメータセットは、デコーダによる再構成がこのパラメータセットなしで行われるように、データストリームに書き込まれ、その結果、デコーダは、再構成のために第1のパラメータセットだけを用い、第2のパラメータセットをスキップし、この際、この第2のパラメータセットを処理できなくするようにこれを確立する。
デコーダ側において、これは、つまり、デコーダが完全にパラメータセットを読み込んでこれを処理しなければならないが、この際、このパラメータセットを必須のパラメータセットとして識別するものの、デコーダは、再構成に対して必須でない、すなわち任意のものとしてマークされるパラメータセットに遭遇した場合に、パラメータセットに属するビットストリームにおいてビットを単にスキップすることを意味する。このようにして、デコーダは、符号化されたマルチチャネル信号を取扱うことが可能になる第2のパラメータセットのシンタクスに関して何らかの知見を有する必要はないが、単にこれをスキップし、再構成で必要とされる符号化されたマルチチャネル信号の次のエリアを単に続行することができる。
好ましくは、このようにして、長さ情報は、任意のものとしてマークされるパラメータセットに対するデータストリームに挿入されるが、これによって、デコーダは、高速で効率的な方法でこのパラメータセットと関連付けられるビットを単にスキップし、復号化で必須のものとしてマークされるパラメータセットだけを取得することができるようになる。後方互換性に関して、さらに、バージョン数が少なくとも各任意のパラメータセットと関連付けられ、このパラメータセットがどのエンコーダバージョンで発生されたかを特定することが好ましい。このようにして、例えば、最低バージョンのチャネル間レベル差に対するパラメータセットは、データストリームにおいて必須のものとしてマークされる一方、後のエンコーダバージョンのチャネル間レベル差に対するパラメータセットは、他のバージョン数を得るため、デコーダは、より高いバージョン数を有するパラメータセットを処理できなくなるようにこれを確立する場合に再構成に対するより低いバージョン数の対応するパラメータセットを単に用いるだけである。
最後に、マルチチャネル信号を表すデータストリームは、必ずしも同様に伝送チャネルを含む必要はないことに留意されたい。その代わりに、BCCパラメータが後に対応するチャネルにCDに書き込まれるような場合のように、伝送チャネルが別々に発生されて送信されるが、ここで、CDは、既にM個(=1個以上)の伝送チャネルを含む。
本発明の好適な実施の形態が添付図面に関して以下において説明されるが、これらの図としては:
図1aは、本発明の実施の形態による所定のデータストリームシンタクスを有する符号化されたマルチチャネル信号の概要であり、
図1bは、本発明の実施の形態による図1aの制御ブロックの詳細な表現であり、
図2aは、本発明の実施の形態によるエンコーダのブロック回路図であり、
図2bは、本発明の実施の形態によるデコーダのブロック回路図であり、
図3aから図3dは、本発明によるパラメータセット構成の好適な実施の形態を示し、
図4aから図4cは、本発明によるパラメータセットデータの好適な実施の形態を示し、
図5は、マルチチャネルエンコーダの一般的な表現を示し、
図6は、BCCエンコーダ/BCCデコーダパスの概略ブロック図であり、
図7は、図6のBCC合成ブロックのブロック回路図であり、
図8Aから図8Cは、パラメータセットICLD、ICTDおよびICCの計算のための典型的なシナリオの表現を示す。
図2aは、M個の伝送チャネルと、少なくとも2つのパラメータセットを有するパラメータ情報との両方を提供するための手段22の入力20に送られるN個の元のチャネルを備える符号化されていないマルチチャネル信号を表す符号化されたマルチチャネル信号を発生するための装置の好適な実施の形態を示す。特に、手段22の出力23における伝送チャネル出力の数Mは、元のオーディオチャネルの数Nよりも小さい。K個の出力チャネルを再構成するためのパラメータ情報をともに表す個別のパラメータセットは、提供するための手段22の出力24a、24b、24cに適用される。Mが1以上でかつNより小さい場合に、M個の伝送チャネルは、出力側においてデータストリームを書き込むための手段25に供給され、これは、出力24a、24b、24cにおけるパラメータセットとちょうど同じく出力26に適用される。
上記のように、ダウンミックス情報(M個の伝送チャネル)も、パラメータ情報と別に送信/保存される場合がある。
符号化されたマルチチャネル信号を表すデータストリームを書き込むための手段25は、M個の伝送チャネルをデータストリームに書き込み、さらに第1、第2、第3のパラメータセットをデータストリームに書き込むように設計されるため、3つのパラメータセットのうちの1つのパラメータセットを用いないで、さらに好ましくは3つのパラメータセットのうちの少なくとも2つのパラメータセットを用いないで、K個の出力チャネルの再構成が行われる。これに関して、提供するための手段22の出力24aから24cにおけるパラメータセットは、第1のパラメータセットのような1つのパラメータセットが再構成で絶対に必要である一方、さらに2つのパラメータセット、すなわち第2のパラメータセットおよび第3のパラメータセットは、再構成に対して任意に必要とされるだけであるものとして決められるようにマークされる。
書き込むための手段25は、その後、以下に述べるように、第1のパラメータセットを必須のパラメータセットとしてデータストリームに書き込み、さらに、第2のパラメータセットおよび第3のパラメータセットを単なる任意のパラメータセットとしてデータストリームに書き込む。
図2aの出力26におけるデータストリームは、図2bで示されるマルチチャネルデコーダのデータストリーム入力27に送られる。データストリームのデータは、データストリームを読み込むための手段28に供給されるが、ここで、図2aで示されるエンコーダとちょうど同じように、データストリームを読み込むための手段28も、データストリームから抽出されるM個の伝送チャネルに対する論理出力29と、データストリームに含まれるパラメータセットに対する論理出力30a、30bとをさらに備える。第1のパラメータセットが必須のものとしてマークされるか、再構成に対して絶対に必要とされるような本発明の好適な実施の形態において、読み込むための手段28は、この第1のパラメータセットを、論理出力30aを経由して再構成するための手段31に提供する。例えば、読み込むための手段28が、必須のパラメータセットだけを読み込み、さらにこれを再構成するための手段31に供給するように固定的に設定される場合、手段28は、入力27においてデータストリームにおける第2のパラメータセットを単にスキップするが、これは図2bにおける中断された論理出力30bによって記号的に表される。
必須のパラメータセットだけ、またはさらに任意のパラメータセットがデータストリームから抽出され、手段31に供給される制御も、制御入力32を経由して手段28に供給される場合があるが、ここで、リソースアベイラビリティ情報および/またはそこから導出される制御情報は制御入力32を経由して到達する。
例えば、データストリームを読み込むための手段28が、必須のパラメータセットだけでなく任意のパラメータセットも抽出し、さらにこれらのパラメータセットを対応する論理出力を経由して再構成するための手段31に供給するように指示され、これによって次に、この手段が出力33でK個の出力チャネルを提供し、ここでKは図2aの入力20における元の入力チャネルの元の数N以下であるように、十分なバッテリーパワーが利用可能であるように、バッテリーパワー式デコーダがこれを確立することで、リソースアベイラビリティ情報は構成される。デコーダは、データストリームにおいて符号化される全ての出力チャネルを発生することを望むために、数Kは数Nと等しいことが望ましいことに留意されたい。
データストリームを読み込むためのデータストリーム読み込み手段28についても、少なくとも第1のパラメータセットにおいて読み込むために動作し、さらにデータストリームにおける拡張性が利用可能である場合、すなわちデータストリームにおけるパラメータセットが再構成で用いられない場合に、第2のパラメータセットのような少なくとも1つのパラメータセットをスキップできるように動作する。次に、M個の伝送チャネルおよび第1のパラメータセットを用い、第2のパラメータセットを用いずに、K個の出力チャネルを再構成するために再構成手段31が動作できるようになる。
本発明の実施の形態において、提供するための手段22は、N個の元のチャネルを受信し、出力側においてM個の伝送チャネルおよび個別のパラメータセットを提供するBCCエンコーダである。あるいは、提供するための手段22は、入力側において、例えば、図7のエレメント114および116によって発生される非拡張フォーマット(パラメータセットのみ、または伝送チャネルを有するパラメータセット)において既に書き込まれている情報を受信し、さらに、拡張可能フォームにおいてパラメータセットをデータストリームに書き込むためにビットストリームを対応して書き換えるように書き込むための手段25に指示する、いわゆるビットストリームトランスコーダであってもよい。つまり、データストリームを理解できるようにするために、デコーダは、データストリームの全てのデータを読み込んで解析する必要はないが、任意のパラメータセットを検出した場合に任意のパラメータセットと関連付けられるデータをスキップする場合がある。
このように、拡張可能なパラメータセットを有するデータストリームの実際の書き込み対して種々の可能性がある。実施の形態において、パラメータセットに対するデータの開始は、固定データストリームラスタに従って定められる場合がある。この場合、任意のパラメータセットと関連付けられる長さ情報の伝送は、必須ではない。しかしながら、この固定ラスタによって、ビット挿入によってデータストリームのデータ量を人為的に拡張する場合もある。このように、各任意のパラメータセットを長さ情報と関連付け、これによって、長さ情報を有する場合に、デコーダが任意のパラメータセットをスキップする、すなわち長さ情報に基づいて、好ましくはシリアルデータストリームにおける一定数のビットを単にスキップし、その後、データストリームの正しい場所、すなわち新しいパラメータセットおよび/または新しい情報に対するデータが開始する場合に、読み込みおよびそこでの解析を再開することが好ましい。
新しいパラメータセットの開始を伝達する他の可能性としては、例えば、同期パターンを特定のビットパターンを有する実際のデータに先行させる、すなわち、パラメータセットに対するデータがここで開始して後の同期パターンで終了することをデコーダに対して伝達するために、ビットパターン検索だけに基づいてデータの実解析に基づかずに識別される場合があるというものがある。この場合、パラメータセットが任意のパラメータセットとして識別されていると、デコーダは、任意のパラメータセットの開始と関連付けられる同期パターンを探し、次に、次の同期パターンに遭遇するまで解析することなく同期パターンに続くビットでパターン検索を実行する。2つの同期パターン間のビットは、その後、再構成のために用いられず、単に無視される一方、任意のパラメータセットの終了を伝達する次の同期パターンにおけるデータは、このデータがさらなる任意のパラメータセットに属していなければ、ビットストリームシンタクスに従って所定のように用いられる場合もある。
本発明の好適な実施の形態において、いくつかのチャネルの再構成で必要とされる少なくとも2つのパラメータセットは、その知覚的な重要性に関して分類される。知覚、すなわち再構成されたマルチチャネル信号の品質で最の重要なパラメータセットは、データストリームにおいて必須のパラメータセットとしてマークされる一方、他のパラメータセットは、任意のパラメータセットとしてだけマークされる。必須の、任意の、および、例えばスタジオ再構成だけで必要なパラメータセットへのさらなる等級付けは、また、2つだけのスケーリングステップの代わりに、例えば3つのスケーリングステップを達成するために実行される場合もある。義務的なまたは好ましくは任意のパラメータセットのいずれかをマークすることだけで十分であるが、この理由は、マークされていないことから自動的にそれぞれマークされていないパラメータセットのタイプが得られるためであるという点に留意されたい。
図1aは、データストリームの概略表示を示し、図1aに示される実施の形態において、このデータストリームは、まず、制御ブロック10と、11で指定されるM個の伝送チャネルのデータであるブロックと、各パラメータセットに対するブロック12a、12b、・・・12cとを含む。本発明の好適な実施の形態において、制御ブロック10は、図1bに概略的に示されるように情報の種々の個別の部分を含む。これによって、制御ブロック10のエントリ100は、タイトル「numBccDataMand」を有するフィールドによって必須のパラメータセットの数を伝達する。さらに、フィールド101は、任意のパラメータセットがあるかどうかを伝達する。この目的のために、「OptBccDataPresent」とマークされるフィールドが用いられる。制御ブロック10のさらなるフィールドは、変数「numBccDataOpt」を有する任意のパラメータセットの数をさらに伝達する。さらなるブロック103、104、105は、各パラメータセットに対するパラメータセットiのタイプおよび/またはバージョン数を伝達する。ネイム「BccDataId」を有するさらなるフィールドは、このために用いられる。フィールド106、107、108のさらなる任意のシーケンスは、任意のものとしてマークされる、すなわち任意のパラメータセットの数に含まれる各パラメータセットに対して「Lengthinfo」が指定される任意の長さ情報を与える。この長さ情報は、対応する、関連付けられた、例えばi番目のパラメータセットのビット長を与える。以下に論じるように、「Lengthinfo」は、長さまたはその他の場合、実際の長さ指定を伝達する上で必要なビット数に関する情報を含む。
図3aから図3dは、パラメータセット構成の好適なフォームを示す。パラメータセット構成は、各フレームに対して行われる場合もあるが、例えば、多くのフレームを含むファイルの開始といったフレーム群に対して1回だけ行う場合もある。このように、図3aは、擬似コードにおける任意のパラメータセットの存在および数の定義を与えるが、ここで、「uimsbf」は、「符号なし整数で最も重要なビットが最初」、すなわち符号を含まず、最も重要なビットがデータストリームにおける最初の整数を表す。このように、BCCデータ数を特定する変数numBccDataは、例えば、制御ブロック10のフィールド100で最初に表される。
さらに、フィールド101は、任意のパラメータセットがあるかどうか(optBccDataPresent)を確立するために用いられる。その後、任意のパラメータセットの数(numBccDataOpt)は、任意のパラメータセットのさらなる情報、または、これが行われた場合にいわゆる「チャンク」(OptChunkInfo)を得るために読み込まれる。変数numBccDataOptM1は、「マイナス1」を表す接尾辞「M1」を含む。これは、図3dにおいて「+1」の追加によって再びバランスが取られる。
図3bは、実施の形態において、パラメータセットデータ識別子がフィールド103から105において有する値の概要を示す。このように、変数「BccDataId」は、まず名前、すなわちパラメータのタイプ、すなわちICLD、ICTDおよびICCを含み、同時にバージョン数V1またはV2をそれぞれ含む場合がある。このように、図3bにおいて、データストリームは、実際に、第1のバージョンV1と後の第2のバージョンV2とのチャネル間レベル差を同時に含む場合があるが、ここで、第1のバージョンに対する適切な対応デコーダは、ICLD_V1において必須のパラメータセットとして単に読み込む場合があり、ICLD_V2を無視する一方、高バージョン数を有するデコーダは、ICLD_V2において、すなわち必須のパラメータセットとして単に読み込むが、このシナリオにおいてただ任意で必要とされるパラメータとしてICLD_V1を無視する。あるいは、データセットは、義務的なデータセットがデータストリームにおいて1つのバージョンで常に存在するだけになるように、書き込まれる場合もある。
図3cは、任意のパラメータセットの識別を示す。任意のパラメータセットに関する情報において、図1bのパラメータセット識別子103から105は、任意の各パラメータセットに関する情報を得るために各パラメータセットに対して読み込まれる。さらに、パラメータセットの長さは、図3cのコマンド「OptChunkLen()」で表されるように、ビットストリームにおいて送信されるのであれば、各任意のパラメータセットに対して読み込まれる。
任意のパラメータセットに対する長さ情報の決定に関して、本発明の好適な実施の形態において、各任意のパラメータセットと関連付けられるデータからの各パラメータセットに対してビット長がどのように読み込まれるかを示す図3dを参照すること。
デコーダで実行されるループを読み取るパラメータセットは、図4aで概略的に示される。このように、図1のブロック12aから12cにある実際のパラメータセットデータは、BccData()において読み込まれる。
長さ情報の読み込みについては、図4bに示される。例えば、BccDataLenBitsは、チャンクの実際のビット長を伝達する上で必要なビット数を表す。BccDataLenは、次に、チャンクが有するビット長を実際に与える。この2ステージシステムは、一方で柔軟であり、他方でデータを節約するが、その理由は、大きく異なるタイプでこれにより長さの異なるパラメータセットに対して特に適用される、非常に大きく変動するビット長をチャンクが有する場合に、特に効率的であるからである。これによって、ほとんど任意の長さを有するさらなるチャンクの将来的な定義が可能になる。
図4cは、最終的にパラメータセットスイッチを表し、ここで、図3bに示されるように、パラメータセットが対応する再構成アルゴリズムと関連付けられるようにパラメータセット識別子が評価されることから、例えば、チャネル間レベル差がチャネル間時間差におよびその逆に考えられるようなケースは発生しない。
図4cは、さらに、パラメータセットが任意のものとして識別され、さらに任意のパラメータセットを用いる復号化が所望されない場合に、このパラメータセットのビット数が、全ての必須のパラメータセットが読み込まれる(または、デコーダに知られていないデータ、例えば、パラメータセットがある)(「解析を終了し、出力を開始する」)場合に、さらなる任意のパラメータセットを考慮することなく出力を開始するために、スキップされる(「スキップし、継続する」)ことを示す。このように、そのようなデコーダは、出力が少なくとも1つの義務的なチャンクにおいて既に読み込まれ、さらにデータストリームにおいてさらなる情報を解析できない場合に、出力を開始する。このように、デコーダは、これが理解しないデータストリームコンテンツによって完全なエラー出口に誘起されない。これによって非常に強固なデコーダができる。
以下において、本発明の機能が、本発明の好適な実施の形態に基づいて、さらに詳細に説明される。例えば、ICLD、ICTD、ICCのような種々のタイプのパラメータ情報や、将来的に決められる他のパラメータセット情報は、異なる別々のデータ部分、すなわち異なるスケーリング層に収容される。この目的のために、図4aから図4cを再び参照すること。パラメータセットは、チャネル間レベル差パラメータセットのような必須のまたは(義務的な)パラメータセットと、チャネル間時間差パラメータおよびチャネル間相関値パラメータセットとのような任意のパラメータセットに区別される。
必須のパラメータセットの数(numBccDataMand)と任意のパラメータセットの存在(OptBccDataPresent)および数(numBccDataOpt)とに関する情報が提供される。通常、必須のパラメータセットの数(numBccDataMand)に関する情報は、システム仕様に依存するため、必ずしも明示的に送信されなくてもよいが、エンコーダとデコーダとの間に固定的に定められる場合もある。対照的に、任意のパラメータセットの数(numBccDataOpt)を明示的に送信することが好ましい。存在パラメータ(OptBccDataPresent)は、図3aに示されるように、任意のパラメータセットの存在を示す場合、任意のパラメータセットに関して対応する評価が開始される。
本発明の好適な実施の形態において、各パラメータセットに対する識別子(BccDataId)がさらに提供される。この識別子は、ICLD、ICTDまたはICCのようなパラメータセットタイプおよび/または図3bでも示されるように、特定のパラメータセットのシンタクスバージョンに関する情報を提供する。通常、必須のパラメータセットに対する識別子は、黙示的に伝達される一方、任意のパラメータに対する識別子は、明示的に伝達される。しかしながら、この場合、例えば、遭遇される第1のパラメータセットが、例えば、固定的に定められたシナリオにおいてチャネル間レベル差パラメータセットを含む必須のパラメータセットになるように、エンコーダとデコーダとの間に定められなければならない。あるいは、パラメータセットタイプ情報も、同じくパラメータセットタイプのオーダーを黙示的に表すことによって決められる場合がある。
パラメータセットは、好ましくは、パラメータセット長さ情報を含む。このようなパラメータセット長さ情報を提供することは、パラメータセットの正確なビットストリームシンタックスを知ることも必要とされるデコーダなしで関連付けられたビットを単にスキップすることによって、このパラメータセットをデコーダが無視できるようになる。この目的のために、図4bを参照のこと。
本発明の好適な実施の形態において、単に必須のパラメータセットにおけるデータを破棄できる代わりに、いずれにしてもデコーダが何らかの場合において必須のパラメータセットにおけるデータを解析し処理しなければならないことから、必須のパラメータセットはパラメータセット長さ情報を含まない。このように、デコーダは、パラメータセットを見出すが、何らかの関連するさらなる情報を含まない場合、パラメータセット(例えば、ICLD)が所定の利用可能なパラメータセット内にあり、何らかの対応する情報を含まないという事実のために、このパラメータセットが必須のパラメータセットであるということを想定してデコーダが実施されることがあり得る。
任意のパラメータセットに対して、パラメータセット長さ情報は、送信されるか、または、アプリケーションの例に依存しない場合もある。単純なルールとしては、エンコーダとデコーダとの間の相互運用性を改善するために、全ての任意のパラメータセットがパラメータ長さ情報を含む。しかしながら、ビットを節約するために、長さ情報は、最終パラメータセットに対して送信されない場合があり、その理由は、これらのデータをスキップして、次のパラメータセットにアクセスする必要がなく、いずれにしてもこのパラメータセットが最終パラメータセットであるためである。この手順は、図1aに示されるように、データブロックが第iのパラメータセット12cで実際に終わりになり、次に、例えば、和信号および/または処理したばかりのM個の伝送チャネルのブロックに対してさらなる制御情報等がない場合に、明らかに有用である。
明示的な伝達は、例えば、リソースアベイラビリティ情報32(図2b)により、パラメータ長さ情報の伝送は、図3dに基づいて既に示したように、パラメータセット長さ情報の存在/長さに関してデコーダに知らせるビットストリームエレメントによってエンコーダで動的に伝達される場合もある。
以下において、図2bに示されるデコーダの復号化プロセスに対する好適な実施の形態が論じられる。好適なデコーダは、好ましくはチャネル間レベル差パラメータセットである必須の(義務的な)パラメータセットのアベイラビリティをまずチェックする。さらに、ILDパラメータセットのシンタクスバージョン数が、デコーダそのものが復号化できるバージョン数よりも大きな場合で、例えば、デコーダが1からnのシンタクスバージョンをサポートする場合、図2bの再構成するための手段31によって再構成が行われない場合もある。他の全ての場合において、有効な復号化プロセスの所定のフォームは、必須のパラメータセットの復号化によって、さらに任意のパラメータセットが用いられない場合、必須のパラメータセットだけを用いてマルチチャネル合成を実行することによって行われる場合もある。
しかしながら、デコーダは、任意のパラメータセットを検出すると、このパラメータセットを用いるか、または、そのコンテンツを破棄する場合がある。2つの可能性のいずれの1つが選択されるかは、例えば、以下で論じるシナリオによる。
任意のパラメータセットのシンタクスバージョン数が、このパラメータセットタイプに対するデコーダそのもののインストールされたシンタクスバージョンの能力より高い場合、このパラメータセットタイプは、デコーダによって処理されずにスキップされる。しかしながら、この場合でも、任意のパラメータセットタイプを用いて改良されたマルチチャネル再構成を実行することなく、有効な符号化が達成される。しかしながら、任意のパラメータセットのコンテンツがデコーダの能力に応じて考慮に入れられる場合、高品質の再構成が行われる。
例えば、チャネル間コヒーレンス値を用いる合成はかなりの量の計算リソースを占拠する場合があることに留意されたい。このため、例えば、複雑さの低いデコーダは、リソース制御情報に応じてこのパラメータセットを無視する一方、高出力品質を提供することのできるデコーダは、再構成のために全てのパラメータセット、すなわち必須のおよび任意のパラメータセットの両方を抽出して用いる。好適な実施に形態において、パラメータセットを利用/破棄する決定は、対応する時間で、すなわち動的に計算リソースのアベイラビリティに基づいて行われる。
本発明の概念は、既存のデコーダによる復号化能力、すなわち後方互換性に干渉することなく、必須でない、すなわち任意のパラメータセットタイプに対するビットストリームフォーマットを適合して更新する可能性を提供する。さらに、本発明は、いかなる場合においても、古いデコーダが最悪の場合にラウドスピーカの破壊をもたらすことがある無効な出力を発生することもあり、この際、必須のパラメータセットの、すなわち、ILD情報のシンタクスバージョン数を増やすことによって、または、例えば、図3bのフィールド「BccDataId」NO.4で任意に示されるように、シンタクスの更新が行われる。
このように、本発明の概念は、第1の場所において全てのパラメータセットをまず読み込むことができ、次に、対応するパラメータを用いて図7で示されるような対応するプロセッサエレメントを駆動できるようにするために、ビットストリームにおいて用いられる各パラメータセットの全シンタクスをデコーダが知らなければならない過去のビットストリームシンタクスとは異なる。本発明のデコーダは、ブロック126および128をスキップし、この際、低品質であってもマルチチャネル再構成を実行するために、チャネル間レベル差だけが必須のパラメータセットとして抽出される。
要約すると、以下にエンコーダの本質的な特徴が再度表されるが、この特徴は、低データ速度のデータストリームを用いて効率的で高品質の復号化を達成するためにデコーダによって有利に用いられる。
パラメータセットが、再構成されたマルチチャネル信号の品質に関してK個の出力チャネルの再構成において他のパラメータセットよりも重要でない場合、書き込むための手段25は、重要でないデータセットを用いることなく再構成が可能になるように、データセットを書き込むように設計される。
好ましくは、書き込むための手段25は、さらに、関連付けられた識別子100から105を用いてパラメータセットを提供するように設計され、ここで、パラメータセットに対する識別子は、パラメータセットが再構成で絶対に用いられなければならないことを示すか、または、他のパラメータセットに対する識別子は、パラメータセットが再構成のために任意に用いられるだけであることを示す。
好ましくは、書き込むための手段25は、デコーダが第2のパラメータセット部分(12b)を読み込んで解釈することなくK個の出力チャネルを再構成するように、第1のパラメータセットを第1のパラメータセット部分12aに書き込み、さらに第2のパラメータセットを第2のパラメータセット部分12bに書き込むために、データストリームのデータセットの伝送チャネル部分11にM個の伝送チャネルを書き込むように、さらに設計される。
パラメータセットが、チャネル間レベル差、チャネル間時間差、チャネル間位相差、または、チャネル間コヒーレンス情報を含むグループから選択される場合、書き込むための手段25は、複号化のために必須なものとしてチャネル間レベル差パラメータセットをマークし、さらに復号化のために任意なものとしてそのグループの少なくとも1つの他のパラメータセットをマークするように設計される。
好ましくは、書き込むための手段25は、デコーダが長さ情報に基づいてデータ量をスキップすることができるように、データセットにおけるどのデータ量が第2のパラメータセットに属するかを示す長さ情報106から108を有する第2のパラメータセットを提供するように設計され、ここで、長さ情報は、好ましくは、長さフィールドのビット長を伝達するための第1のフィールドを備え、さらに長さフィールドは、第2のパラメータセットのビット量が与えられるビット長を備える。
好ましくは、書き込むための手段25は、任意のパラメータセットなしでK個の出力チャネルの再構成がデコーダによって行われるこの任意のパラメータセットの数を示すデータストリームに数情報102を書き込むようにさらに設計される。
好ましくは、書き込み手段25は、シンタクスバージョン情報が所定の状態にある場合にだけ、デコーダが対応するパラメータセットを用いて再構成を実行するように、シンタクスバージョン情報103から105をパラメータセットと関連付けるようにさらに設計される。
好ましくは、適用可能な場合、第2のパラメータセットとさらなる任意のパラメータセットとに対するシンタクスバージョン情報だけがさらにある。
さらに、データストリームにおいてパラメータセットのシーケンスにおける最後の任意のパラメータセットは、何らかの関連付けられた長さ情報を備えない場合もある。
さらに、書き込むための手段25は、データストリームにおいて動的にパラメータセット長さ情報の存在および長さを伝達するように設計される場合もある。
提供するための手段22は、少なくとも1つの元のチャネルの時間サンプルのブロックのシーケンスに基づくM個の伝送チャネルに対するデータブロックのシーケンスを提供するように設計される場合もある。
状況によっては、発生および/または復号化のための本発明の方法は、ハードウェアまたはソフトウェアで実施されてもよい。この実施は、その方法が実行されるように、プログラム可能なコンピュータシステムと協働する、電子的に読み出すことができる制御信号を有する、デジタル保存媒体、特に、フロッピー(登録商標)ディスクまたはCD上で行うことができる。本発明は、一般に、コンピュータプログラム製品がコンピュータ上で実行されるときに、機械で読み出し可能なキャリアに格納されたこの方法を実行するためのプログラムコードを有するコンピュータプログラム製品にも存在する。言い換えると、本発明は、コンピュータプログラムがコンピュータ上で実行されるときに、この方法を実行するためのプログラムコードを有するコンピュータプログラムとしても実現することができる。
図1aは、本発明の実施の形態による所定のデータストリームシンタクスを有する符号化されたマルチチャネル信号の概要である。 図1bは、本発明の実施の形態による図1aの制御ブロックの詳細な表現である。 図2aは、本発明の実施の形態によるエンコーダのブロック回路図である。 図2bは、本発明の実施の形態によるデコーダのブロック回路図である。 図3aは、本発明によるパラメータセット構成の好適な実施の形態を示す。 図3bは、本発明によるパラメータセット構成の好適な実施の形態を示す。 図3cは、本発明によるパラメータセット構成の好適な実施の形態を示す。 図3dは、本発明によるパラメータセット構成の好適な実施の形態を示す。 図4aは、本発明によるパラメータセットデータの好適な実施の形態を示す。 図4bは、本発明によるパラメータセットデータの好適な実施の形態を示す。 図4cは、本発明によるパラメータセットデータの好適な実施の形態を示す。 図5は、マルチチャネルエンコーダの一般的な表現を示す。 図6は、BCCエンコーダ/BCCデコーダパスの概略ブロック図である。 図7は、図6のBCC合成ブロックのブロック回路図である。 図8Aから図8Cは、パラメータセットICLD、ICTDおよびICCの計算のための典型的なシナリオの表現を示す。

Claims (17)

  1. N個の元のチャネルを備え、符号化されていないマルチチャネル信号を表す符号化されたマルチチャネル信号を発生するための装置であって、Nは2以上であり、
    M個の伝送チャネル(23)からK個の出力チャネルを再構成するためのパラメータ情報(24a、24b、24c)を提供するための手段(22)であって、Mは1以上でかつN以下であり、KはMより大きくかつN以下であり、前記パラメータ情報は1つの同一の出力チャネルを再構成するための少なくとも1つの第1のパラメータセットおよび異なる第2のパラメータセットを備え、前記第2のパラメータセットは関連付けられたシンタクスバージョン情報(103から105)を備える手段と、
    データストリーム(26)を書き込むための手段(25)であって、書き込むための前記手段(25)は、前記K個の出力チャネルのうちの少なくとも1つの出力チャネルの再構成が前記第1のパラメータを用いて、前記第2のパラメータセットを用いることなく、さらに前記M個の伝送チャネル(23)のうちの少なくとも1つの伝送チャネルを用いて行われるように、前記第1および第2のパラメータセットを前記データストリームに書き込むように設計される手段とを備え、
    書き込むための前記手段(25)は、前記第2のパラメータセットのデータ量を示す長さ情報を前記データストリームに書き込むように構成される、装置。
  2. N個の元のチャネルを備え、符号化されていないマルチチャネル信号を表す符号化されたマルチチャネル信号を復号化するための装置であって、前記符号化されたマルチチャネル信号はM個の伝送チャネルからK個の出力チャネルを再構成するためのパラメータ情報を備えるデータストリームによって表され、Mは1以上でかつN以下であり、KはMより大きくかつN以下であり、前記パラメータ情報は1つの同一の出力チャネルを再構成するための少なくとも2つの異なるパラメータセットを備え、さらに、第1および第2のパラメータセットは、前記K個の出力チャネルの再構成が前記第1のパラメータセットを用いて、さらに前記第2のパラメータセットを用いることなく行われるように、前記データストリームに書き込まれ、前記第2のパラメータセットは関連付けられたシンタクスバージョン情報(103から105)を備える装置であって、
    前記データストリームを読み込むためのデータストリーム読み込み手段(28)を備え、前記第2のパラメータセットは前記第2のパラメータセットのデータ量を示す長さ情報を備え、
    前記第2のパラメータセットに関連付けられる前記シンタクスバージョン情報が復号化するための前記装置の所定のシンタクスバージョン情報と互換性がない場合に、前記第1のパラメータセット(30a)が読み込まれ、さらに前記第2のパラメータセット(30b)がスキップされ、前記シンタクスバージョン情報が前記所定のシンタクスバージョン情報と互換性がある場合に、前記第2のパラメータセットが読み込まれ、さらに
    前記データストリーム読み込み手段(28)は、前記第2のパラメータセットのデータを解析することなく、前記長さ情報に基づいて、前記長さ情報によって示されるデータストリームにおけるデータ量をスキップするように構成される、装置。
  3. 前記M個の伝送チャネルおよび前記第1のパラメータセットを用いるが、前記第2のパラメータセットを用いずに、前記K個の出力チャネルを再構成するための再構成手段(32)をさらに備える、請求項2に記載の装置。
  4. 前記第1のパラメータセットは、関連付けられたシンタクスバージョン情報(103から105)を備え、さらに
    前記読み込み手段(28)は、読み込まれたシンタクスバージョン情報が復号化するための前記装置の所定のシンタクスバージョン情報と互換性がある場合にだけ再構成が前記再構成手段によって実行されるように、前記関連付けられたシンタクスバージョン情報を読み込み、さらに前記再構成手段(31)を駆動するように設計される、請求項2または請求項3に記載の装置。
  5. 前記読み込み手段(28)は、リソースアベイラビリティ情報を得るために制御可能(32)であり、さらに
    前記読み込み手段(28)は、前記リソースアベイラビリティ情報が十分なリソースを示す場合に前記第2のパラメータセットにおいて読み込み、さらに前記リソースアベイラビリティ情報が不十分なリソースを示す場合に前記第2のパラメータセットをスキップするようにさらに設計される、請求項2ないし請求項4にいずれかに記載の装置。
  6. 1つのパラメータセットは、再構成されたマルチチャネル信号の品質に関して、前記K個の出力チャネルの再構成において他のパラメータセットよりも重要性が低く、さらに、前記データストリーム読み込み手段(28)は、前記重要性の低いデータセットをスキップするように設計される、請求項2ないし請求項5のいずれかに記載の装置。
  7. 前記データストリームは、関連付けられた識別子(100から105)を有するパラメータセットを備え、あるパラメータセットに対する識別子は、このパラメータセットが再構成に対して絶対に用いられなければならないことを示すか、または、他のパラメータセットに対する識別子は、このパラメータセットが再構成に対して単に任意に用いられてもよいことを示し、前記データストリーム読み込み手段(28)は、前記識別子を検出し、必須のパラメータセットを読み込み、さらに前記検出された識別子に基づいて任意のパラメータをスキップするように設計される、請求項2ないし請求項6のいずれかに記載の装置。
  8. 前記データストリームは、第1のパラメータセット部分(12a)における第1のパラメータセットと、第2のパラメータセット部分(12b)における第2のパラメータセットとを備え、前記データストリーム読み込み手段は、前記パラメータセット部分に関して前記データストリームを解釈し、前記第1のパラメータセット部分において読み込み、さらに前記第2のパラメータセット部分をスキップするように設計される、請求項2ないし請求項7のいずれかに記載の装置。
  9. パラメータセットは、チャネル間レベル差、チャネル間時間差、チャネル間位相差、または、チャネル間コヒーレンス情報を含むグループから選択され、前記データストリームにおいて、前記チャネル間レベル差パラメータセットは、復号化するために絶対に必要とされるものとしてマークされ、さらに前記グループの少なくとも1つの他のパラメータセットは、復号化に対して任意なものとしてマークされ、さらに、前記データストリーム読み込み手段(28)は、前記チャネル間レベル差パラメータセットにおいて読み込み、さらに前記グループから他のパラメータセットをスキップするように設計される、請求項2ないし請求項8のいずれかに記載の装置。
  10. 前記データストリームは、任意のパラメータセットなしで前記K個の出力チャネルの再構成が前記装置によって行われるこの任意のパラメータセットの数を示す数情報(102)を備え、前記データストリーム読み込み手段は、前記数情報に基づいて少なくとも1つの任意のパラメータセットを読み込むように設計される、請求項2ないし請求項9のいずれかに記載の装置。
  11. 適用可能な場合、前記第2のパラメータセットとさらなる任意のパラメータセットとに対して前記データストリームにおいて関連付けられたシンタクスバージョン情報があり、前記第1のパラメータセットに対してシンタクスバージョン情報がない、請求項2に記載の装置。
  12. 前記データストリームにおいてパラメータセットのシーケンスにおける最終の任意のパラメータセットは、何らかの関連付けられた長さ情報を備えず、前記データストリーム読み込み手段(28)は、前記最終の任意のパラメータセットにおける読み込み前に何らかの長さ情報を読み込んで解釈しないように設計される、請求項2ないし請求項11のいずれかに記載の装置。
  13. パラメータセット長さ情報の存在および長さは、前記データストリームにおいて動的に伝達され、さらに、前記データストリーム読み込み手段(28)は、前記データストリームにおいてパラメータセット長さ情報の前記存在をまず検出し、次に、検出された存在に基づいて前記データストリームから前記パラメータセット長さ情報の前記長さを抽出するように設計される、請求項2ないし請求項12のいずれかに記載の装置。
  14. 前記M個の伝送チャネルはBCCダウンミックスチャネルであり、前記パラメータセットはBCCパラメータを含み、さらに、前記再構成手段(32)はBCC合成を実行するように設計される、請求項3ないし請求項13のいずれかに記載の装置。
  15. N個の元のチャネルを備え、符号化されていないマルチチャネル信号を表す符号化されたマルチチャネル信号を発生するための方法であって、Nが2以上であり、
    M個の伝送チャネル(23)からK個の出力チャネルを再構成するためのパラメータ情報(24a、24b、24c)を提供するステップ(22)であって、Mは1以上でかつN以下であり、KはMより大きくかつN以下であり、前記パラメータ情報は1つの同一の出力チャネルを再構成するための少なくとも2つの異なるパラメータセットを備えるステップと、
    前記K個の出力チャネルのうちの少なくとも1つの出力チャネルの再構成が、第1のパラメータセットを用いて、第2のパラメータセットを用いることなく、さらに前記M個の伝送チャネル(23)のうちの少なくとも1つの伝送チャネルを用いて行われるように、第1および第2のパラメータセットをデータストリームに書き込むことによってデータストリーム(26)を書き込むステップ(25)であって、前記第2のパラメータセットは関連付けられたシンタクスバージョン情報(103から105)を備えるステップ(25)とを備え、
    前記書き込むステップ(25)は、前記第2のパラメータセットのデータ量を示す長さ情報を前記データストリームに書き込むように構成される、方法。
  16. N個の元のチャネルを備え、符号化されていないマルチチャネル信号を表す符号化されたマルチチャネル信号を復号化するための方法であって、前記符号化されたマルチチャネル信号はM個の伝送チャネルからK個の出力チャネルを再構成するためのパラメータ情報を備えるデータストリームによって表され、Mは1以上でかつN以下であり、KはMより大きくかつN以下であり、前記パラメータ情報は1つの同一の出力チャネルを再構成するための少なくとも2つの異なるパラメータセットを備え、さらに、第1および第2のパラメータセットは、前記K個の出力チャネルの再構成が前記第1のパラメータセットを用いて、さらに前記第2のパラメータセットを用いることなく行われるように、前記データストリームに書き込まれ、前記第2のパラメータセットは関連付けられたシンタクスバージョン情報(103から105)を備える方法であって、
    前記データストリームを読み込むステップ(28)を備え、
    前記第2のパラメータセットは前記第2のパラメータセットのデータ量を示す長さ情報を備え、
    前記第2のパラメータセットに関連付けられる前記シンタクスバージョン情報が復号化するための前記方法の所定のシンタクスバージョン情報と互換性がない場合に、前記第1のパラメータセット(30a)が読み込まれ、さらに前記第2のパラメータセット(30b)がスキップされ、前記シンタクスバージョン情報が前記所定のシンタクスバージョン情報と互換性がある場合に、前記第2のパラメータセットが読み込まれ、さらに
    前記読み込むステップ(28)は、前記第2のパラメータセットのデータを解析することなく、前記長さ情報に基づいて、前記長さ情報によって示されるデータストリームにおけるデータ量をスキップするように構成される、方法。
  17. コンピュータに、請求項15または請求項16に記載の方法を実行させるためのプログラム。
JP2007528760A 2004-09-03 2005-08-29 符号化されたマルチチャネル信号を発生するための装置および方法並びに符号化されたマルチチャネル信号を復号化するための装置および方法 Active JP4856641B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102004042819.0 2004-09-03
DE102004042819A DE102004042819A1 (de) 2004-09-03 2004-09-03 Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
PCT/EP2005/009293 WO2006027138A1 (de) 2004-09-03 2005-08-29 Erzeugung eines codierten multikanalsignals und decodierung eines codierten multikanalsignals

Publications (2)

Publication Number Publication Date
JP2008511848A JP2008511848A (ja) 2008-04-17
JP4856641B2 true JP4856641B2 (ja) 2012-01-18

Family

ID=35094601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007528760A Active JP4856641B2 (ja) 2004-09-03 2005-08-29 符号化されたマルチチャネル信号を発生するための装置および方法並びに符号化されたマルチチャネル信号を復号化するための装置および方法

Country Status (17)

Country Link
US (1) US8145498B2 (ja)
EP (1) EP1763870B1 (ja)
JP (1) JP4856641B2 (ja)
KR (1) KR100908081B1 (ja)
CN (1) CN101044550B (ja)
AU (1) AU2005281937B2 (ja)
BR (1) BRPI0515623B1 (ja)
CA (1) CA2578190C (ja)
DE (1) DE102004042819A1 (ja)
ES (1) ES2454670T3 (ja)
HK (1) HK1107174A1 (ja)
IL (1) IL181469A (ja)
MX (1) MX2007002569A (ja)
NO (1) NO338928B1 (ja)
PL (1) PL1763870T3 (ja)
RU (1) RU2379768C2 (ja)
WO (1) WO2006027138A1 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006126859A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
WO2007083952A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
EP1984913A4 (en) 2006-02-07 2011-01-12 Lg Electronics Inc DEVICE AND METHOD FOR CODING / DECODING A SIGNAL
ATE538604T1 (de) * 2006-03-28 2012-01-15 Ericsson Telefon Ab L M Verfahren und anordnung für einen decoder für mehrkanal-surroundton
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US9418667B2 (en) 2006-10-12 2016-08-16 Lg Electronics Inc. Apparatus for processing a mix signal and method thereof
DE102007007830A1 (de) * 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
WO2009093867A2 (en) 2008-01-23 2009-07-30 Lg Electronics Inc. A method and an apparatus for processing audio signal
KR101024924B1 (ko) * 2008-01-23 2011-03-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
US8615088B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal using preset matrix for controlling gain or panning
WO2010036062A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8346379B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
US8346380B2 (en) * 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
KR101600352B1 (ko) 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
KR20100137159A (ko) * 2009-06-22 2010-12-30 삼성전자주식회사 방송 수신기 및 그의 채널 전환 방법
EP2495973B1 (en) * 2009-10-30 2019-02-27 Sun Patent Trust Decoding method, decoder apparatus, encoding method, and encoder apparatus
EP2544466A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor
US9451252B2 (en) 2012-01-14 2016-09-20 Qualcomm Incorporated Coding parameter sets and NAL unit headers for video coding
WO2013149670A1 (en) * 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
EP2839653A4 (en) * 2012-04-16 2015-11-25 Nokia Technologies Oy METHOD AND DEVICE FOR VIDEO CODING
US9716892B2 (en) * 2012-07-02 2017-07-25 Qualcomm Incorporated Video parameter set including session negotiation information
US9288603B2 (en) * 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
EP2717261A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
RU2015134093A (ru) * 2013-01-14 2017-02-16 Конинклейке Филипс Н.В. Многоканальный кодер и декодер с эффективной передачей информации о положении
CN116665683A (zh) * 2013-02-21 2023-08-29 杜比国际公司 用于参数化多声道编码的方法
EP4300488A3 (en) 2013-04-05 2024-02-28 Dolby International AB Stereo audio encoder and decoder
US20140307803A1 (en) 2013-04-08 2014-10-16 Qualcomm Incorporated Non-entropy encoded layer dependency information
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CN107533846B (zh) * 2015-04-24 2022-09-16 索尼公司 发送装置、发送方法、接收装置与接收方法
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
US10356800B2 (en) * 2016-05-09 2019-07-16 Qualcomm Incorporated Scalable numerology with symbol boundary alignment for uniform and non-uniform symbol duration in wireless communication
WO2019088863A1 (ru) * 2017-10-30 2019-05-09 Общество С Ограниченной Ответственностью "Теквел Разработка" Способ и компьютерное устройство для автоматического определения топологии связей
CN108039175B (zh) 2018-01-29 2021-03-26 北京百度网讯科技有限公司 语音识别方法、装置及服务器
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
US11528574B2 (en) 2019-08-30 2022-12-13 Sonos, Inc. Sum-difference arrays for audio playback devices

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000151413A (ja) * 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP2001209399A (ja) * 1999-12-03 2001-08-03 Lucent Technol Inc 第1成分と第2成分を含む信号を処理する装置と方法
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6266782B1 (en) * 1998-11-30 2001-07-24 Siemens Information And Communication Networks, Inc. Apparatus and methods for inband protocol correction in distributed object networking
JP4244492B2 (ja) * 2000-03-24 2009-03-25 ソニー株式会社 情報処理装置、情報配信システム、情報処理方法、及び記録媒体
US6718507B1 (en) * 2000-09-12 2004-04-06 At&T Corp. System and method for representing compressed information
JP2002175097A (ja) * 2000-12-06 2002-06-21 Yamaha Corp 音声信号のエンコード/圧縮装置およびデコード/伸長装置
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
EP1417842B1 (en) * 2001-08-03 2005-11-30 Koninklijke Philips Electronics N.V. Protection of streaming a/v data
US8340302B2 (en) 2002-04-22 2012-12-25 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
EP1500083B1 (en) 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
JP4431568B2 (ja) 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
US6903669B1 (en) * 2003-10-03 2005-06-07 Cirrus Logic, Inc. Systems and methods for decoding compressed data
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000151413A (ja) * 1998-11-10 2000-05-30 Matsushita Electric Ind Co Ltd オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JP2001209399A (ja) * 1999-12-03 2001-08-03 Lucent Technol Inc 第1成分と第2成分を含む信号を処理する装置と方法
JP2001339311A (ja) * 2000-05-26 2001-12-07 Yamaha Corp オーディオ信号圧縮回路および伸長回路
JP2004078183A (ja) * 2002-06-24 2004-03-11 Agere Systems Inc オーディオ信号のマルチチャネル/キュー符号化/復号化

Also Published As

Publication number Publication date
PL1763870T3 (pl) 2014-08-29
EP1763870A1 (de) 2007-03-21
RU2007112113A (ru) 2008-10-20
BRPI0515623B1 (pt) 2019-05-21
CA2578190C (en) 2012-09-11
RU2379768C2 (ru) 2010-01-20
JP2008511848A (ja) 2008-04-17
CA2578190A1 (en) 2006-03-16
NO20070903L (no) 2007-04-03
AU2005281937A1 (en) 2006-03-16
WO2006027138A1 (de) 2006-03-16
MX2007002569A (es) 2007-07-05
DE102004042819A1 (de) 2006-03-23
US8145498B2 (en) 2012-03-27
KR20070051875A (ko) 2007-05-18
EP1763870B1 (de) 2014-03-05
KR100908081B1 (ko) 2009-07-15
ES2454670T3 (es) 2014-04-11
BRPI0515623A (pt) 2008-07-29
BRPI0515623A8 (pt) 2018-07-31
CN101044550A (zh) 2007-09-26
NO338928B1 (no) 2016-10-31
IL181469A0 (en) 2007-07-04
US20070219808A1 (en) 2007-09-20
IL181469A (en) 2011-09-27
HK1107174A1 (en) 2008-03-28
CN101044550B (zh) 2011-05-11
AU2005281937B2 (en) 2008-10-09

Similar Documents

Publication Publication Date Title
JP4856641B2 (ja) 符号化されたマルチチャネル信号を発生するための装置および方法並びに符号化されたマルチチャネル信号を復号化するための装置および方法
US11343631B2 (en) Compatible multi-channel coding/decoding
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
US7693721B2 (en) Hybrid multi-channel/cue coding/decoding of audio signals
US7292901B2 (en) Hybrid multi-channel/cue coding/decoding of audio signals
US20070168183A1 (en) Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100811

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100818

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101025

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111028

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4856641

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250