JP4601669B2 - マルチチャネル信号またはパラメータデータセットを生成する装置および方法 - Google Patents

マルチチャネル信号またはパラメータデータセットを生成する装置および方法 Download PDF

Info

Publication number
JP4601669B2
JP4601669B2 JP2007530606A JP2007530606A JP4601669B2 JP 4601669 B2 JP4601669 B2 JP 4601669B2 JP 2007530606 A JP2007530606 A JP 2007530606A JP 2007530606 A JP2007530606 A JP 2007530606A JP 4601669 B2 JP4601669 B2 JP 4601669B2
Authority
JP
Japan
Prior art keywords
data
parameter
configuration
channel
queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2007530606A
Other languages
English (en)
Other versions
JP2008512708A (ja
Inventor
ラルフ スペルシュナイダー
ユールゲン ヘレ
ジョーハン ヒルペアト
クリスティアン エルテル
シュテファン ガヤーズベアガー
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2008512708A publication Critical patent/JP2008512708A/ja
Application granted granted Critical
Publication of JP4601669B2 publication Critical patent/JP4601669B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Channel Selection Circuits, Automatic Tuning Circuits (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereo-Broadcasting Methods (AREA)

Description

本発明は、パラメトリックマルチチャネル処理技術に関し、特に、柔軟なデータシンタックスの生成および/または読み出しを行い、パラメータデータをダウンミキシングおよび/または伝送チャネルのデータに対する対応付けを行うエンコーダ/デコーダに関する。
2つのステレオチャネルの他に、推奨されるマルチチャネルサラウンド表現は、センターチャネルCおよび2つのサラウンドチャネル、すなわち、左サラウンドチャネルLsおよび右サラウンドチャネルRsを含み、適用可能な場合は、LFE(LFE=低周波数拡張)チャネルとも呼ぶサブウーファーチャネルをさらに含んでいる。この基準サウンドフォーマットは、3ステレオ/2ステレオ(プラスLFE)とも呼ばれるもので、最近では、3つのフロントチャネルおよび2つのサラウンドチャネルを意味する5.1マルチチャネルとも呼ばれている。一般に、5つまたは6つの伝送チャネルを必要とする。再生環境では、5つの正確に配置したスピーカからの決まった距離で、最適ないわゆるスイートスポットを得るために、5つの別々の位置に、それぞれ少なくとも5つスピーカが必要である。しかしながら、その位置決めに関して、サブウーファーを比較的自由に用いることが可能である。
マルチチャネル音声信号伝送に必要なデータ量を低減する技術が、いくつかある。このような技術を、ジョイントステレオ技術とも呼ぶ。このために、図5を参照すると、図5はジョイントステレオ装置60を示している。この装置を、例えば、インテンシティステレオ技術(IS技術)またはバイノーラルキュー符号化技術(BCC技術)を行う装置とすることができる。このような装置は一般に、入力信号として少なくとも2つのチャネル(CH1、CH2、・・・CHn)を受け取り、少なくとも1つのキャリアチャネル(ダウンミキシング)およびパラメトリックデータ、すなわち、1つ以上のパラメータセットを出力する。パラメトリックデータは、デコーダにおいて、オリジナルチャネル(CH1、CH2、・・・CHn)それぞれの近似値を算出できるように、定義されている。
通常、キャリアチャネルは、サブバンドサンプル、スペクトル係数、時間領域サンプル等を含んでいる。これらにより、基礎の信号が比較的よい表現を提供するが、パラメトリックデータおよび/またはパラメータセットは、このようなサンプルまたはスペクトル係数を含んでいない。その代わり、パラメトリックデータは、乗算、時間シフティング、周波数シフティング、等による重み付けといった、特定の再生アルゴリズムを制御する制御パラメータを含んでいる。従って、パラメトリックデータは、信号または対応付けられたチャネルの比較的粗い表現しか含んでいない。数字で言うと、キャリアチャネルが必要とするデータ量(これは圧縮されたもので、すなわち、例えばAACにより符号化されているもの)は、60〜70キロビット/秒の範囲であるが、1つのチャネルに対しパラメトリック副情報が必要とするデータ量は、1.5〜2.5キロビット/秒の範囲である。パラメトリックデータの一例としては、以下に説明するように、周知のスケールファクタ、インテンシティステレオ情報またはバイノーラルキューパラメータが挙げられる。
インテンシティステレオ符号化技術については、AES予稿集3799、“インテンシティステレオ符号化(Intensity Stereo Coding)”、J.ヘア(Herre)、K.H.ブランデンブルグ(Brandenburg)、D.レーデラー(Lederer)(1994年2月、アムステルダム)に記載されている。一般に、インテンシティステレオの概念は、2つの立体音響音声チャネルのデータに対して行う主軸変換に基づいている。大部分のデータポイントが第1の主軸のまわりに集中している場合は、符号化を行う前に、決まった角度で2つの信号を回転することにより、符号化利得を得ることができる。しかしながら、実際の立体音響生成技術に常に当てはまるとは限らない。左チャネルおよび右チャネルに対して再生した信号は、同じ送信信号の別々に重み付けされたものまたはスケーリングしたバージョンからなる。しかしながら、再生した信号は、それらの振幅が異なっているものの、それらの位相情報については全く同じである。しかし、2つのオリジナルの音声チャネルのエネルギー時間包絡線を、選択的スケーリング演算により保存する。これは通常、周波数選択的に演算するものである。これは、高い周波数での人間の音声認識に一致し、主要な空間キューを、エネルギー包絡線により求める。
また、実際に実施するにあたっては、2つの成分を回転させる代わりに、送信信号、すなわち、キャリアチャネルを、左チャネルおよび右チャネルの和信号から生成する。なお、この処理、すなわち、スケーリング演算を行うために、インテンシティステレオパラメータを生成するのは、周波数選択的に行う。すなわち、各スケールファクタ帯域、すなわち、エンコーダの周波数区分に対し独立して行う。好ましくは、2つのチャネルを合成して合成チャネルまたは“キャリア”チャネルを生成する。合成チャネルの他に、インテンシティステレオ情報を求める。これは、第1のチャネルのエネルギー、第2のチャネルのエネルギーまたは合成あるいは総計したチャネルのエネルギーに依存する。
BCC技術については、AES大会論文5574、“ステレオおよびマルチチャネル音声圧縮に応用したバイノーラルキュー符号化(Binaural cue coding applied to stereo and multi‐channel audio compression)”、C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)(2002年5月、ミュンヘン)に記載されている。BCC符号化では、オーバーラップウィンドウを有するDFTベースの変換を用いて、多数の音声入力チャネルをスペクトル表現に変換している。得られるスペクトルを、それぞれ指数を有する重なりのない区分に分割する。各区分は、等価矩形帯域幅(ERB)に比例する帯域幅を有している。いわゆるチャネル間レベル差(ICLD)とともにいわゆるチャネル間時間差(ICTD)を、この区分毎に推定する。すなわち、各帯域と各フレームkとに対し、すなわち、時間サンプルブロックに対して計算する。ICLDパラメータおよびICTDパラメータを量子化して符号化すると、BCCビットストリームが得られる。参照チャネルに対して、チャネル間レベル差およびチャネル間時間差を各チャネルに与える。パラメータを、処理される信号の特定の区分によって、規定の公式に従って算出する。
デコーダ側では、デコーダは、モノラル信号およびBCCビットストリームを受信する。すなわち、フレーム毎のチャネル間時間差の第1のパラメータセットおよびチャネル間レベル差の第2のパラメータセットである。モノラル信号を周波数領域に変換して、合成ブロックに入力する。このブロックは、復号化ICLDおよびICTD値も受信する。合成ブロックまたは再生ブロックでは、BCCパラメータ(ICLDおよびICTD)を用いて、モノラル信号の重み付け演算を行って、マルチチャネル信号を再生する。次に、周波数/時間変換を行うと、オネジナルのマルチチャネル音声信号を再生したものを表すようになる。
BCCの場合、ジョイントステレオモジュール60は、パラメトリックチャネルデータを量子化して、ICLDパラメータおよびICTDパラメータを符号化するように、チャネル副情報を出力するよう動作する。オリジナルチャネルのうちの1つを、参照チャネルとして用いて、チャネル副情報を符号化することができる。通常、キャリアチャネルは、関係するオリジナルチャネルの総計として構成されるものである。
当然、上記の技術では、キャリアチャネルしか復号化することができず、パラメータデータを処理して、2つ以上の入力チャネルの1つ以上の近似値を生成することができないデコーダに対して、モノラル表現を生成するだけである。
BCC技術と呼ばれる音声符号化技術についてはさらに、米国特許出願公開公報第2003/0219130号、第2003/0026441号および第2003/0035553号にも記載されている。さらに、“バイノーラルキュー符号化パートII:方法および応用例(Binaural Cue Coding Part II:Schemes and Applications)”、C.フォーラおよびF.バウムガルテ、IEEE会報、オーディオおよびスピーチ学会紀要(Transactions on Audio and Speech Proc.)11巻、第6号、1993年11月に記載されている。さらに、C.フォーラおよびF.バウムガルテ“ステレオおよびマルチチャネル音声圧縮に応用したバイノーラルキュー符号化”予稿集、第112回音声工学学会(AES)大会2002年5月、およびJ.ヘア(Herre)、C.フォーラ(Faller)、C.エルテル(Ertel)、J.ヒルパート(Hilpert)、A.ホルツァー(Hoelzer)、C.スペンガー(Spenger)“MP3サラウンド:効率的で互換性のあるマルチチャネル音声の符号化(MP3 Surround:Efficient and Compatible Coding of Multi−Channel Audio)”予稿集6049、第116回AES大会、ベルリン、2004年、を参照のこと。以下に、マルチチャネル音声符号化のための代表的な、一般的BCC法について、図6〜8を参照して、さらに詳細に説明する。図6は、マルチチャネル音声信号の符号化/伝送を行う一般的BCC符号化法を示す。マルチチャネル音声入力信号を、BCCエンコーダ112の入力110に入力して、いわゆるダウンミキシングブロック114でダウンミキシングする。すなわち、1つの総計したチャネルに変換する。本例では、入力110の信号は、フロント左チャネル、フロント右チャネル、左サラウンドチャネル、右サラウンドチャネルおよびセンターチャネルを有する、5チャネルサラウンド信号である。通常、ダウンミキシングブロックは、これらの5つのチャネルを単純に加算して、モノラル信号にすることにより、和信号を生成する。技術的に周知のダウンミキシング手法はすべて、マルチチャネル入力信号を用いて、1つのチャネルまたは多数のダウンミキシングチャネルを有するダウンミキシング信号を生成するものである。いずれの場合もオリジナルの入力チャネルの数よりも少なくなる。本例では、4つのキャリアチャネルが5つの入力チャネルから生成している場合は、ダウンミキシングがすでに行われていることになる。1つの出力チャネルおよび/または多数の出力チャネルを、和信号ライン115に出力する。
BCC分析ブロック116により取得した副情報を、副情報ライン117に出力する。BCC分析ブロックでは、チャネル間レベル差(ICLD)、チャネル間時間差(ICTD)またはチャネル間相関値(ICC値)を算出することもできる。従って、BCC合成ブロック122で再生するための3つの異なるパラメータセット、すなわちチャネル間レベル差(ICLD)、チャネル間時間差(ICTD)およびチャネル間相関値(ICC)がある。
通常、パラメータセットを有する和信号および副情報を、量子化して符号化した形式で、BCCデコーダ120に送信する。BCCデコーダは、送信された(符号化伝送の場合は復号化した)和信号を複数のサブバンドに分割して、スケーリング、遅延、さらに処理を行って、再生されるいくつかのチャネルのサブバンドを生成する。出力121で再生したマルチチャネル信号のICLD、ICTDおよびICCパラメータ(キュー)が、BCCエンコーダ112に入力する入力110のオリジナルのマルチチャネル信号に対するそれぞれのキューと同様になるように、この処理を行う。このために、BCCデコーダ120は、BCC合成ブロック122および副情報処理ブロック123を含んでいる。
以下に、図7を参照して、BCC合成ブロック122の内部構成を説明する。ライン115上の和信号を、通常フィルタバンクFB125として実施する時間/周波数変換ブロックに入力する。ブロック125の出力には、N個の数のサブバンド信号が存在する。あるいは、音声フィルタバンク125が、Nスペクトル係数をN時間領域サンプルから生成する変換を行う場合は、極端な場合、スペクトル係数ブロックが存在する。
BCC合成ブロック122はさらに、遅延ステージ126、レベル変更ステージ127、相関処理ステージ128および逆フィルタバンクを示すステージIFB129を備える。ステージ129の出力では、5チャネルサラウンドシステムの場合では、図6に示すように、例えば5つのチャネルを有する再生したマルチチャネル音声信号を、1セットのスピーカ124に出力する。
図7にはさらに、装置125により、入力信号s(n)を周波数領域またはフィルタバンク領域に変換することを示している。ノード130で示すように、同じ信号のいくつかのバージョンを取得するように、装置125による信号出力を乗算する。オリジナルの信号のバージョン数は、再生した出力信号における出力チャネルの数と等しい。ノード130でのオリジナルの信号の各バージョンをそれぞれ遅延d1、d2、・・・、di、・・・、dNで遅延する場合、結果は、ブロック126の出力におけるような状態となり、同じ信号の異なる遅延を有するバージョンを含んでいる。遅延パラメータを図6の副情報処理ブロック123で算出して、BCC分析ブロック116で求められたようなチャネル間時間差から導出する。
乗算パラメータa1、a2、・・・、ai、・・・、aNについて、同じことが当てはまる。BCC分析ブロック116で求められたチャネル間レベル差に基づいて、副情報処理ブロック123により算出する。
遅延してレベル操作を行った信号間の特定の相関値をブロック128の出力で決定するように、BCC分析ブロック116によってICCパラメータを算出して、これらを用いてブロック128の機能を制御する。ここで、ステージ126、127、128の順序は、図7に示す場合と異なっていてもよいことに留意されたい。
さらに、音声信号の処理をブロック的に行う際には、BCC分析についてもブロック的に行うことに留意されたい。なお、BCC分析についても、周波数的に、すなわち、周波数選択的なやり方で行う。このことは、各スペクトル帯域に対して、ブロック毎に、ICLDパラメータ、ICTDパラメータおよびICCパラメータが存在することを意味している。全帯域に渡って、少なくとも1つのチャネルに対して少なくとも1つのブロックがあり、これに対してICTDパラメータが存在するので、これがICTDパラメータセットを表すことになる。少なくとも1つの出力チャネルを再生する全周波数帯域の少なくとも1つのブロックに対する全ICLDパラメータを表すICLDパラメータセットにも、同じことが当てはまる。そして、同じことがICCパラメータセットにも当てはまる。これもやはり、入力チャネルまたは総計したチャネルに基づいて、少なくとも1つの出力チャネルを再生する各種の帯域の少なくとも1つのブロックに対するいくつかの個別のICCパラメータを含んでいる。
以下に、図8を参照して、あるBCCパラメータを求める状況を示す。通常、ICLD、ICTDおよびICCパラメータを、任意のチャネル対の間で定義することができる。通常、ICLDおよびICTDパラメータを、参照チャネルおよび入力チャネル相互の間で求めるので、参照チャネルを除いて、入力チャネルそれぞれに互いに異なるパラメータセットが存在する。これについて、図8Aに示す。
しかしながら、ICCパラメータを別の方法で求めることもできる。一般に、図8Bに概略で示すように、任意のチャネル対の間で、エンコーダでICCパラメータを生成することができる。この場合は、任意のチャネル対の間のオリジナルの信号に存在するものとほぼ同じ結果が得られるように、デコーダがICC合成を行う。しかしながら、任意の時間で、すなわち、各時間フレームに対する2つの最も強力なチャネル間のICCパラメータだけを計算することが提案されていた。この手法を図8Cに示す。ある時間で、チャネル1とチャネル2との間でICCパラメータを算出して送信して、別の時間で、チャネル1とチャネル5との間でICCパラメータを算出する例が示されている。次に、デコーダが、デコーダ内の最も強力なチャネル間のチャネル間相関を合成して、さらに通常は、残りのチャネル対に対するチャネル間コヒーレンスを合成するための、ある発見的規則を適用する。
例えば、送信ICLDパラメータに基づいて乗算パラメータa1、・・・、aNを算出するには、上記引例のAES大会論文5574を参照する。ICLDパラメータは、オリジナルのマルチチャネル信号内のエネルギー分布を表す。一般性を失うことなく、他の全チャネルとフロント左チャネルとの間のエネルギー差を示す4つのICLDパラメータを、図8Aに示す。副情報処理ブロック123では、再生したすべての出力チャネルの総エネルギーが送信和信号のエネルギーと同じになるようにまたは少なくともこのエネルギーと比例するように、乗算パラメータa1、・・・、aNをICLDパラメータから導出する。これらのパラメータを求める1つの方法は、2段処理である。これは、第1のステージでは、左フロントチャネルの乗算係数を1に設定して、図8Cの他のチャネルの乗算係数を送信ICLD値に設定する。次に、第2のステージでは、5つのチャネルすべてのエネルギーを算出して、送信和信号のエネルギーと比較する。次に、すなわち全チャネルに対して等しいダウンスケーリング係数を用いて、全チャネルにスケーリングを行う。ダウンスケーリングを行った後の再生したすべての出力チャネルの総エネルギーが送信和信号の総エネルギーと等しくなるように、ダウンスケーリング係数を選択する。
さらにパラメータセットとしてのBCCエンコーダからBCCデコーダに送信したチャネル間コヒーレンス測定値ICCに関して、20log10-6から20log106の間の値を有する乱数により全サブバンドの重み付け係数を乗算するというように、乗算係数を変更することにより、コヒーレンス操作を行うことができることに留意されたい。通常、すべての重要な帯域に対してバリアンスがほぼ一定になり、各々の重要な帯域内で平均値がゼロとなるように、疑似ランダムシーケンスを選択する。同じシーケンスを、各々の異なるフレームまたはブロックのスペクトル係数に対して行う。従って、疑似ランダムシーケンスのバリアンスを変更することにより、音声場面の幅を制御する。より大きいバリアンスにより、聴取範囲の幅がより大きくなる。バリアンス変更を、重要な帯域にわたるそれぞれの帯域で行うことができる。聴取範囲の幅が異なる複数の対象を、聴取場面の中で同時に存在させることが可能になる。疑似ランダムシーケンスに対し適した振幅分布は、米国特許出願公開公報第2003/0219130号で概要を説明したように、対数目盛に対して均一な分布である。
互換性があるように5つのチャネルを送信するためには、たとえば、通常のステレオデコーダにも適用できるビットストリームフォーマットで送信するためには、以下に記載されている、いわゆるマトリックス化技術を用いていた。“MUSICAMサラウンド:ISO/IEC11172‐3により互換性のあるユニバーサルマルチチャネル符号化システム(MUSICAM Surround:A universal multiーchannel coding system compatible with ISO/IEC 11172−3)”、G.セイラー(Theile)およびG.ストール(Stoll)、AES予稿集、1992年10月、サンフランシスコ。
なお、別のマルチチャネル符号化技術について、次の出版物に記載されている。“向上したMPEG‐2音声マルチチャネル符号化(Improved MPEG 2 Audio multi−channel encoding)”、B.グリル(Grill)、J.ヘア(Herre)、K.H.ブランデンブルク(Brandenburg)、E.エベルレイン(Eberlein)、J.コラー(Koller)、J.ミラー(Miller)、AES予稿集3865、1994年2月、アムステルダム。これは、互換性マトリックスを用いて、ダウンミキシングチャネルをオリジナルの入力チャネルから得るものである。
要約すると、BCC技術により可能になるマルチチャネル音声素材の効率的な後方互換性符号化について、次の専門誌に記載されている。例えば、E.シュイエールス(Schuijers)、J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)、J.エングデガールド(Engdegard)、“低複雑性パラメトリックステレオ符号化(LowーComplexity Parametric Stereo Coding)”、2004年、AES第119回大会、ベルリン、予稿集6073。この意味で、MPEG−4規格および特にパラメトリック音声技術の拡張について説明する必要がある。この規格部分については、ISO/IEC14496−3:2001/FDAM2(パラメトリック音声)という名称でも周知である。この点について、特に、“ps−data()のシンタックス”というタイトルの、MPEG−4規格表8.9のシンタックスについて説明する。この例では、シンタックス要素“enable_icc”と“enable_ipdopd”とについて説明する。これらのシンタックス要素を用いて、チャネル間時間差に対応するICCパラメータおよび位相の伝送のオン・オフを行う。シンタックス要素“ice_data()”、“ipd_data()”および“opd_data()”について、さらに説明する。
要約すると、一般に、1つまたはいくつかの送信キャリアチャネルを用いるのに、このようなパラメトリックマルチチャネル技術を用いることに留意されたい。M個の送信チャネルをN個のオリジナルチャネルから生成して、やはりN個の出力チャネルまたはK個の出力チャネルを再生する。Kは、オリジナルチャネルNの数以下である。
図6からわかるように、BCC分析は、一方ではパラメータデータと、他方では1つ以上の伝送チャネル(ダウンミキシングチャネル)とを、N個のオリジナルチャネルを有するマルチチャネル信号から生成する典型的な分離前処理である。通常、次に、図6に図示していないが、例えば典型的なMP3またはAACステレオ/モノラルエンコーダでこれらのダウンミキシングチャネルを圧縮するので、出力側で、圧縮形式で伝送チャネルデータを表すビットストリームと、さらにパラメータデータを表す別のビットストリームとが存在する。従って、BCC分析は、ダウンミキシングチャネルおよび/または図6の和信号115を実際に音声符号化することとは独立して行われる。
デコーダ側でも同様である。マルチチャネル機能を有するデコーダは、まず、用いられた符号化アルゴリズムより、圧縮ダウンミキシング信号を含むビットストリームを復号化して、出力側で、1つ以上の伝送チャネルを再び生成する。すなわち、通常は、PCMデータ(PCM=パルス符号変調)の時間シーケンスとして生成する。次に、BCC合成は、信号自給自足的にパラメータデータストリームにより信号を送り、出力側で、いくつかの出力チャネルを生成するデータを備えた互いに異なる分離して独立した後処理として行われる。好ましくは、オリジナルの入力チャネルと同じ数の出力チャネルを、音声復号化ダウンミキシング信号から生成する。
従って、BCC分析の利点は、BCC分析用の互いに異なるフィルタバンクと、BCC合成用の互いに異なるフィルタバンクとを有しているので、例えば、音声エンコーダ/デコーダのフィルタバンクから独立していて、一方では音声圧縮と、他方ではマルチチャネル再生とについて全く妥協する必要がない。概して、音声圧縮をマルチチャネルパラメータ処理と独立して行って、2つの領域に最適になるようにする。
しかしながら、この概念には、マルチチャネル再生と、音声復号化とのために、完全な伝達を行わなければならないという欠点がある。このことは特に、一般的な場合のように、音声デコーダおよびマルチチャネル再生手段の2つが、同じまたは同様の工程を行うので、同じ環境設定および/または相互に依存した環境設定を必要とするという点で不利である。完全に別の概念では、送信データを2回送信して、データ量を人為的に“拡張”することになり、最終的に、音声符号化/復号化とマルチチャネル分析/合成とを分離する概念を選択するという事実に基づくことになる。
他方では、マルチチャネル再生と音声復号化とを完全に“結合する”と、柔軟性を相当制限することになる。なぜならば、その場合、最適なやり方で各処理工程を行うことが可能な2つの処理工程を分離するという、実際に重要な目的を放棄しなくてはならないからである。従って、特に、“タンデム”符号化とも呼ばれるいくつかの連続符号化/復号化ステージの場合に、相当品質が損なわれるという問題が発生することになる。BCCデータを符号化音声データと完全に結合すると、復号化を行う毎にマルチチャネル再生を行って、記録する際に、マルチチャネル合成を再び行わなければならなくなる。パラメトリック技術は全て、損失が多いという性質があるので、分析、合成、分析を繰り返すことにより損失が累積して、各エンコーダ/デコーダステージで、認知できる音声信号の品質がさらに低下する。
この場合、パラメータデータの分析/合成処理を同時に行うことなく、音声データ復号化/符号化を行うことは、タンデムチェーンの各音声コーデックが全く同じに動作する場合に限って可能になる。すなわち、サンプリングレート、ブロック長、アドバンス長、ウインドウ化、変換等が同じであること、すなわち、一般に、コンフィグレーションが同じである場合、また、個々のブロック境界についても維持している場合に可能になる。しかしながら、このような概念では、概念全体の柔軟性を相当制限することになる。特に、パラメトリックマルチチャネル技術が、例えば、パラメータデータをさらに加えることにより、既存のステレオデータを補足することを意図しているという事実について、この制限はますます厳しいものになる。ブロック長が全く異なっていたり、周波数領域では動作しないものの時間領域では動作したりというように、多くの異なるエンコーダから既存のステレオデータを生成しているので、このような制限ははじめから、こっけいなまでに、後の補足となる概念をとるものである。
米国特許出願公開公報第2003/0219130号 米国特許出願公開公報第2003/0026441号 米国特許出願公開公報第2003/0035553号 AES予稿集3799、"インテンシティステレオ符号化(Intensity Stereo Coding)"、J.ヘア(Herre)、K.H.ブランデンブルグ(Brandenburg)、D.レーデラー(Lederer)(1994年2月、アムステルダム) AES大会論文5574、"ステレオおよびマルチチャネル音声圧縮に応用したバイノーラルキュー符号化(Binaural cue coding applied to stereo and multi‐channel audio compression)"、C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)(2002年5月、ミュンヘン) "バイノーラルキュー符号化パートII:方法および応用例(Binaural Cue Coding Part II:Schemes and Applications)"、C.フォーラおよびF.バウムガルテ IEEE会報、オーディオおよびスピーチ学会紀要(Transactions on Audio and Speech Proc.)11巻、第6号、1993年11月 C.フォーラおよびF.バウムガルテ"ステレオおよびマルチチャネル音声圧縮に応用したバイノーラルキュー符号化"予稿集、第112回音声工学学会(AES)大会2002年5月 J.ヘア(Herre)、C.フォーラ(Faller)、C.エルテル(Ertel)、J.ヒルパート(Hilpert)、A.ホルツァー(Hoelzer)、C.スペンガー(Spenger)"MP3サラウンド:効率的で互換性のあるマルチチャネル音声の符号化(MP3 Surround:Efficient and Compatible Coding of Multi−Channel Audio)"予稿集6049、第116回AES大会、ベルリン、2004年 "MUSICAMサラウンド:ISO/IEC11172‐3により互換性のあるユニバーサルマルチチャネル符号化システム(MUSICAM Surround:A universal multiーchannel coding system compatible with ISO/IEC 11172−3)"、G.セイラー(Theile)およびG.ストール(Stoll)、AES予稿集、1992年10月、サンフランシスコ "向上したMPEG‐2音声マルチチャネル符号化(Improved MPEG 2 Audio multi−channel encoding)"、B.グリル(Grill)、J.ヘア(Herre)、K.H.ブランデンブルク(Brandenburg)、E.エベルレイン(Eberlein)、J.コラー(Koller)、J.ミラー(Miller)、AES予稿集3865、1994年2月、アムステルダム E.シュイエールス(Schuijers)、J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)、J.エングデガールド(Engdegard)、"低複雑性パラメトリックステレオ符号化(LowーComplexity Parametric Stereo Coding)"、2004年、AES第119回大会、ベルリン、予稿集6073
本発明の目的は、マルチチャネル音声信号または再生パラメータデータセットを生成する柔軟で効率的な概念を提供することである。
この目的は、請求項1に記載のマルチチャネル信号の生成装置、請求項14に記載のマルチチャネル信号の生成方法、請求項15に記載のパラメータデータセットの生成装置、請求項18に記載のパラメータデータ出力の生成方法、請求項19に記載のパラメータデータ出力の生成装置、請求項20に記載のパラメータデータ出力の生成方法、または請求項21に記載のコンピュータプログラムにより、達成される。
本発明は、伝送チャネルデータおよびパラメータデータを含むことができ、エンコーダ側で挿入し、デコーダ側で評価するパラメータコンフィグレーションキューを含むことができるデータストリームを備えることにより、一方では効率性と、他方では柔軟性とを達成することが可能であるという知見に基づいている。このキューは、マルチチャネル再生手段が入力データ、すなわち、エンコーダからデコーダへ送信されたデータから設定されているかどうか、または、マルチチャネル再生手段が、符号化伝送チャネルデータを復号化した、符号化アルゴリズムに対するキューで設定されているかどうかを示すものである。マルチチャネル再生手段は、符号化伝送チャネルデータを復号化する音声デコーダの環境設定と全く同じ環境設定を有しているもの、あるいは、少なくともこの設定に基づくものである。
デコーダが第1の状況を検出した場合、すなわち、パラメータコンフィグレーションキューが第1の意味を有している場合、デコーダは、受信した入力データからさらにコンフィグレーション情報を検索して、マルチチャネル再生手段を適切に設定して、次にこの情報を用いることにより、マルチチャネル再生手段の環境設定を行う。例えば、このような環境設定は、ブロック長、アドバンス、サンプリング周波数、フィルタバンク制御データ、いわゆるグラニュール情報(1フレーム内にいくつBCCブロックがあるか)、チャネルコンフィグレーション(例えば、“mp3”の場合は必ず5.1出力を生成する)、パラメータデータを必ずスケーリングする場合の情報(例えば、ICLD)であるが(ICTD)等でない情報とすることが可能である。
しかしながら、デコーダが、パラメータコンフィグレーションキューは、第1の意味と異なる第2の意味を有していることを確定した場合、マルチチャネル再生手段は、伝送チャネルデータ、すなわち、ダウンミキシングチャネルの符号化/復号化の基となる音声符号化アルゴリズムに関する情報により、マルチチャネル再生手段の環境設定を選択する。
一方におけるパラメータデータと、他方における圧縮ダウンミキシングデータとの間の別の概念とは対照的に、本発明のマルチチャネル音声信号の生成装置は、言ってみれば、マルチチャネル再生手段のコンフィグレーションのために、実質的に完全に分離した自給自足的音声データおよび/または自給自足的に動作する上流側の音声デコーダで“盗み”を働いて、自身を構成するものである。
本発明の概念は特に、異なる音声符号化アルゴリズムについて考える場合に、本発明の好適な実施の形態において威力を発揮する。この場合、同期動作を行うために、すなわち、実際に独立したマルチチャネル再生アルゴリズムが音声復号化アルゴリズムと同期して動作するように、マルチチャネル再生手段が音声デコーダと同期して動作するため、すなわち、対応するアドバンス長等が、それぞれ異なる符号化アルゴリズムに対して動作するために、大量の明示的伝達情報を送信する必要がある。
本発明によれば、1つのビットで十分なパラメータコンフィグレーションキューは、そのコンフィグレーションのために、どの音声エンコーダに対して下流側となるのか調べることを、デコーダに伝達するものである。これに続いて、音声エンコーダが、多数の異なる音声エンコーダに対して現在上流側にあることを示す情報を、デコーダは受信する。この情報を受信した際に、好ましくは、この音声符号化アルゴリズムでマルチチャネルデコーダに保存したコンフィグレーションテーブルを入力して、考えられる音声符号化アルゴリズムそれぞれに対して定義済みのコンフィグレーション情報を検索して、少なくとも1つのマルチチャネル再生手段の環境設定を行う。このことにより、データストリームで設定を明示的に伝達する場合と比較して、従って、マルチチャネル再生手段と音声デコーダとの間の関係を全く考慮しないで、本発明のようにマルチチャネル再生手段により、音声デコーダデータの“盗み”を働かない場合と比較して、データ速度を大幅に節減する。
他方では、本発明の概念は、やはりコンフィグレーション情報を明示的に伝達することに固有の、高い柔軟性を提供することにある。なぜならば、データストリーム内で1つのビットで十分なパラメータコンフィグレーションキューにより、必要な場合には、データストリームで全コンフィグレーション情報を実際に送信する可能性があること、あるいは、混合した形式で、データストリームでパラメータコンフィグレーション情報の少なくとも一部分を送信して、構成情報のセットから、必要な情報の別の部分を抽出する可能性があるからである。
本発明の好適な実施の形態では、エンコーダからデコーダに送信したデータはさらに、既存の環境設定または前に伝達した環境設定と比較して、環境設定をすっかり変更するかどうか、前のものを継続するかどうか、または連続キューのある設定に反応して、パラメータコンフィグレーションキューを読み込んで、音声デコーダに対してマルチチャネル再生手段を調整する必要があることを確定するかどうか、またはコンフィグレーションに関する明示的情報が少なくとも部分的に伝送データに含まれているかどうかについて、デコーダに対する連続キュー伝達を含んでいる。
以下に、添付の図面を参照して、本発明の好適な実施の形態について詳細に説明する。
図1は、本発明のパラメータデータセットの生成装置のブロック回路図を示す。パラメータデータセットを、図1に示す装置の出力10で出力することができる。パラメータデータセットは、図1に図示していない伝送チャネルデータとともに、N個のオリジナルチャネルを表す後述のパラメータデータを含んでいる。伝送チャネルデータは通常、M個の伝送チャネルを含んでいる。M個の伝送チャネルは、N個の数のオリジナルチャネルよりも少なく、かつ1以上である。
エンコーダ側に収容される図1に示す装置は、例えば、BCC分析またはインテンシティステレオ分析等を行うように設計されたマルチチャネルパラメータ手段11を含んでいる。この場合、マルチチャネルパラメータ手段11は、入力12でN個のオリジナルチャネルを受信する。また、一方、マルチチャネルパラメータ手段11を、未処理パラメータ入力13に供給した既存の未処理のパラメータデータを用いて、手段11の出力でパラメータデータを生成するトランスコーダ手段として設計してもよい。パラメータデータが、任意のBCC分析手段が生成するような単純なBCCデータである場合、マルチチャネルパラメータ手段11の処理は、単に入力13からのデータを手段11の出力にコピーする機能からなる。しかしながら、マルチチャネルパラメータ手段11を、未処理のパラメータデータストリームのシンタックスを変更して、例えば、送信データを加えたり、既存の未処理のパラメータデータと互いに少なくとも部分的に独立して、復号化したり省いたりすることもできるパラメータセットを書き込んだりするように設計することもできる。
図1に示す装置はさらに、手段11の出力で、パラメータコンフィグレーションキューPKHを求めて、パラメータデータと対応付ける伝達手段14を含んでいる。特に、パラメータデータセットに含まれるコンフィグレーション情報をマルチチャネル再生に用いる場合に、第1の意味を有するように、伝達手段がパラメータコンフィグレーションキューを決定するように設計する。あるいは、伝送チャネルデータの符号化に用いる符号化アルゴリズムおよび/またはこれに用いられた符号化アルゴリズムに基づくコンフィグレーションデータをマルチチャネル再生に用いる場合に、第2の意味を持つように、伝達手段14がパラメータコンフィグレーションキューを決定する。
最後に、図1の本発明の装置は、コンフィグレーション情報をパラメータデータおよびパラメータコンフィグレーションキューと対応付けて、出力10で最終的にパラメータデータセットを得るように設計されたコンフィグレーションデータ書き込み手段15を含んでいる。従って、パラメータデータセット10は、マルチチャネルパラメータ手段11からのパラメータデータと、伝達手段14からのパラメータコンフィグレーションキューPKHとを含み、適用可能な場合は、コンフィグレーションデータ書き込み手段15からのコンフィグレーションデータを含んでいる。パラメータデータセットには、図1に合成手段16として一般に呼ばれる構成要素で象徴的に示されるように、求められたシンタックスに基づいて、これらのデータセットの構成要素が配置され、通常は時分割されている。
本発明の好適な実施の形態では、パラメータコンフィグレーションキューが第1の意味を有する場合に限って、すなわち、マルチチャネル再生で、いずれにしろデコーダに存在するコンフィグレーション情報にはアクセスされないが、明示的伝達が存在する場合、すなわち、さらにコンフィグレーション情報がパラメータデータセットに存在する場合に、制御ライン17を介して、伝達手段14をコンフィグレーションデータ書き込み手段15に接続して、コンフィグレーションデータ書き込み手段15を起動する。パラメータコンフィグレーションキューが第2の意味を有するもう一方の場合では、出力10で、データをパラメータデータセットに挿入するために、コンフィグレーションデータ書き込み手段15を起動しない。というのは、デコーダでこのようなデータを読み込まなかったり、デコーダで必要としなかったり、またはその両方であるからで、これについては後述する。混合した解決方法では、すべてをデータストリームで伝達する代わりに、コンフィグレーションの一部分だけを伝達して、残りを、例えば、デコーダのコンフィグレーションテーブルから抽出する。
伝達手段14は、制御入力18を含んでいる。これを介して、パラメータコンフィグレーションキューが第1または第2の意味を有しているかどうかを、伝達手段14に通知する。図4aおよび図4bで説明するように、いわゆる“同期”動作において、第2の意味を有し、デコーダ側のモードで符号化アルゴリズムに関する情報を得て、それによってデコーダ側でマルチチャネル再生手段に環境設定を行うように、パラメータコンフィグレーションキューを選択することは好適である。しかしながら、非同期動作では、パラメータコンフィグレーションキューの第1の意味を決定し、これを、データ自体にコンフィグレーション情報があるようにデコーダが解釈して、伝送チャネルデータが基礎にする音声符号化アルゴリズムを用いないように、制御入力18が伝達手段を動作させる。
パラメータデータセットおよび/またはパラメータデータ出力を、固定した形式にする必要はないことに留意されたい。従って、コンフィグレーションキュー、コンフィグレーションデータおよびパラメータデータを、ストリームまたはパケットで共に送信する必要はなく、デコーダには互いに別々に供給することもできる。
図4aのいわゆる“同期”動作について、以下に説明する。説明のために、図4aにパラメータデータを伝達手段14が生成したパラメータコンフィグレーションキューが存在し、さらに、適用可能な場合は、さらにコンフィグレーションデータ書き込み手段15が生成したコンフィグレーション情報が存在するフレーム40のシーケンスとして示す。フレーム40のシーケンスの前に、ヘッダ41が配置されている。手段11の出力のパラメータデータを、フレーム1、2、3、4に格納する。これが、図4aにおいて、ペイロードデータとも呼ばれる理由である。
決定された意味を有し、連続キューFSHが別の意味を持つ場合に、図1の伝達手段14の出力と、さらに図4aのヘッダ41で説明した連続キューFSHにより、デコーダに、前に通信したものと同じ環境設定を維持する、すなわち連続させるようにする。データストリームのコンフィグレーション情報に基づいて、またはデコーダ側の音声符号化アルゴリズムに対するキューで読み出したコンフィグレーションデータに基づいて、マルチチャネル再生手段に環境設定を行うかどうか、パラメータコンフィグレーションキューにより決定する。
図4aはさらに、時間対応の符号化伝送データのブロックのシーケンス42を示している。これは、4つのフレーム、フレーム1、フレーム2、フレーム3、フレーム4を有している。パラメータデータを符号化伝送チャネルデータに時間対応付けを行うことを、図4aに縦の矢印で示す。従って、符号化伝送チャネルデータのブロックは常に入力データのブロックと関係づけられていたり、重なりウインドウを用いる場合には、前のブロックと比較して、どのくらいの量のブロック内のデータが少なくとも進んでいるか、同期動作では、ブロック長および/またはパラメータデータを得る進行に同期していたり、またはその両方である。これにより、一方では再生パラメータと、他方では伝送チャネルデータとの間の接続が確実に喪失しないようになる。
これについて、短い例により説明する。5チャネル入力信号があると仮定し、この5チャネル入力信号それぞれが、時間xから時間yまでの時間サンプルを含む、5つの異なる音声チャネルを有しているとする。図6のダウンミキシングステージ114では、マルチチャネル入力データと同期する少なくとも1つの伝送チャネルを生成する。従って、時間xから時間yまでの伝送チャネルデータの一部は、時間xから時間yまでの個々のマルチチャネル入力データの一部と対応する。なお、図6のBCC分析手段116は、例えば、時間xから時間yまでの伝送チャネルデータの時間区分に対してやはり正確にパラメータデータを生成するので、デコーダ側では、時間xから時間yまでの伝送チャネルデータから時間xから時間yまでの個々の出力チャネルデータと時間xから時間yまでのパラメータデータとを再び生成する。
パラメータデータの生成と書き込みとを行うフレーミングが、エンコーダが1つ以上の伝送チャネルを圧縮するフレーミングと等しい場合に、同期動作が自動的に行われる。従って、パラメータデータおよび符号化伝送チャネルデータの両方のフレーム(図4aの40および42)が、常に同じ時間部分に対応し、マルチチャネル再生装置は、音声フレームに対応するデータを常に容易に処理でき、パラメータフレームを同時に処理することが可能になる。
同期動作では、ダウンミキシングデータの伝送に用いられる音声エンコーダのフレーム長は、パラメトリックマルチチャネル手法が用いるフレーム長に等しい。同様に、当然、フレーム長、パラメータデータおよび符号化伝送チャネルデータの間に整数の関係が存在する可能性がある。この場合、1つのビットストリームを生成するように、パラメトリックマルチチャネル符号化の副情報を、音声ダウンミキシング信号の符号化ビットストリームに多重化することも可能である。既存のステレオデータに“改良”を行う場合、やはり2つの異なるデータストリームが存在する。しかしながら、2つのフレームのシーケンスの間には、1:1の関係および/またはm:1の関係またはm:nの関係が存在する。フレーミングラスタは、互いにずれることはない。従って、音声データフレームと、対応するパラメトリック副情報データフレームとの間には、明白な対応がある。このモードは、各種の応用例に対して好適である。
本発明によれば、パラメータコンフィグレーションキューは、このような場合に第1の意味を持つ。このことは、マルチチャネル再生手段が、自分に基礎となる音声エンコーダに関する情報を供給して、それに基づいて、その環境設定、すなわち、例えば、アドバンスまたはブロック長に対する時間サンプル数等を選択するので、ヘッダ41にはコンフィグレーション情報が全くなかったり、部分的にしか存在しなかったりすることを意味している。
これに対して、図4bは非同期動作を示している。伝送チャネルデータ42’が、例えば、フレーム構造を有していないが、PCMサンプルのストリームとして発生する場合に限って、非同期動作は存在する。あるいは、音声エンコーダが、不規則なフレーム構造を有していたり、パラメータデータ40のフレームラスタと異なるフレーム長および/またはフレームラスタを有するフレーム構造を単に有していたりする場合に、このような非同期状況が発生する。ここで、パラメトリックマルチチャネル符号化手法および音声符号化/復号化手段は、互いに依存しない独立分離処理ステージとして考えられる。このことは、符号化/復号化を行ういくつかの連続するステージが存在する、いわゆるタンデム符号化シナリオの場合に特に利点がある。パラメータデータを圧縮音声データに固定して接続した場合、マルチチャネル合成およびそれに続くマルチチャネル分析を、符号化/復号化それぞれを行う際に同時に行う必要がある。これらの動作は損失が多いので、損失が徐々に累積して、マルチチャネル印象の劣化が次第に増加することになる。
このようなタンデムチェーンでは、パラメータコンフィグレーションキューを第2の意味に設定して、コンフィグレーション情報をデータストリームに書き込むことにより、基礎となる音声エンコーダと独立して、デコーダでマルチチャネル再生手段の環境設定が可能になる。従って、マルチチャネル合成またはマルチチャネル分析を必ず同時に行う必要がなく、任意のやり方でダウンミキシングデータを復号化/符号化することが可能である。パラメータデータシンタックスに基づいて、データストリームに、好ましくはパラメータデータストリームにコンフィグレーション情報を挿入することにより、パラメータデータと、復号化伝送チャネルデータの時間サンプルを絶対的に対応付けることが可能になる。すなわち、同期動作のように、自給自足的で、しかも、エンコーダフレーム処理規則には対応付けられない対応が可能となる。
非同期動作では、マルチチャネル分析/合成をいつも行うわけではないため、マルチチャネルサウンド特性の劣化が防止される。従って、パラメトリックマルチチャネル符号化/復号化のフレームサイズを、必ずしも音声エンコーダのフレームサイズに関連付ける必要はない。
図1の装置を、エンコーダと、いわゆる“フォワードトランスコーダ”の両方のものとして実施することができる。第1の場合、マルチチャネルパラメータ手段が、パラメータデータ自体を算出する。第2の場合、すでに決まった形式のパラメータデータを受信して、パラメータコンフィグレーションキューおよび対応付けられたコンフィグレーションデータを有する本発明のパラメータデータ出力を生成する。従って、フォワードトランスコーダは、本発明のパラメータデータ出力を任意のデータ出力から生成する。
この手段の逆のことを、いわゆる“バックワードトランスコーダ”で行う。これは、本発明のパラメータデータ出力から、ある出力を生成するものであり、パラメータコンフィグレーションキューはもはや含まれていないものの、コンフィグレーションデータについては完全に含まれているので、コンフィグレーションに対するマルチチャネル再生では、音声符号化アルゴリズムを用いる必要はない。
本発明によれば、バックワードトランスコーダを、M個の伝送チャネルを含む伝送チャネルデータとともに、N個のオリジナルチャネルを表すパラメータデータ出力の生成装置として設計する。ここで、Mは、Nより小さく、かつ1以上の数であり、マルチチャネル再生手段のためのコンフィグレーション情報が入力データに含まれているという第1の意味、またはその符号化バージョンから伝送チャネルデータを復号化した符号化アルゴリズム(23)に基づいて、マルチチャネル再生手段がコンフィグレーション情報を用いるという第2の意味を有するパラメータコンフィグレーションキュー(41)を含む入力データを用いる。コンフィグレーションデータを書き込む書き込み手段を含み、まず入力データを読み込んで、パラメータコンフィグレーションキューが第2の意味を有する場合は、パラメータコンフィグレーションキューを解釈して(30)、その符号化バージョンから伝送チャネルデータを復号化した符号化アルゴリズム(23)に関する情報を検索して、コンフィグレーションデータとして出力するように、書き込み手段を設計する。
以下、図2に、本発明の好適な実施の形態によるマルチチャネル音声信号の生成装置のブロック回路図を示す。マルチチャネル音声信号を生成するために、M個の伝送チャネルを表す伝送チャネルデータを含み、さらにK個の出力チャネルを得るためのパラメータデータ21を含む入力データを用いる。M個の伝送チャネルおよびパラメータデータは、ともにN個のオリジナルチャネルを表す。ここで、MはNより小さく、かつ1以上の数で、KはMより大きい。さらに、入力データは、すでに説明したように、パラメータコンフィグレーションキューPKHを含んでいるが、伝送チャネルデータ20は、符号化アルゴリズムに基づいて符号化した伝送チャネルデータ22を復号化したバージョンである。図2に示す実施の形態では、例えば、MP3の概念またはMPEG−2(AAC)の概念、または任意の他の符号化概念に基づいて動作する符号化アルゴリズムを有する音声デコーダ23により、復号化アルゴリズムを実現する。
図2のデコーダ側で用いる装置は、伝送チャネルデータ20およびパラメータデータ21から、出力25においてK個の出力チャネルを生成するように設計されたマルチチャネル再生手段24を有している。
さらに、図2に示す本発明の装置は、伝達ライン27を介して、環境設定を伝達するマルチチャネル再生手段24を構成するように設計されたコンフィグレーション手段26を含んでいる。コンフィグレーション手段26は、入力データと、好ましくはパラメータデータ21とを受信して、パラメータコンフィグレーションキュー、連続キューFSHと、あるとすればコンフィグレーションデータを読み込んで対応する処理を行なう。さらに、コンフィグレーション手段は、復号化伝送チャネルデータが基礎にする音声符号化アルゴリズム、すなわち、音声エンコーダ23が実行する符号化アルゴリズムに関する情報を得るための符号化アルゴリズム伝達入力28を含んでいる。別のやり方で情報を得ることもできる。例えば、符号化/復号化を行った符号化アルゴリズムを有するものからわかる場合は、復号化伝送チャネルデータを観察することから情報が得られる。あるいは、音声デコーダ23自体が、その識別情報をコンフィグレーション手段26に通信してもよい。あるいは、コンフィグレーション手段26が、符号化伝送チャネルデータ22を解析して、符号化アルゴリズムの符号化を行った符号化伝送チャネルデータから、キューを求めてもよい。通常、このような“符号化アルゴリズム署名”は、エンコーダの各出力データストリームに含まれている。
以下に、図3aのブロック図を参照して、コンフィグレーション手段の好適な実施例について説明する。ブロック30に示すように、入力データからパラメータコンフィグレーションキューPKHを読み込んで解釈するように、コンフィグレーション手段26を設計する。パラメータコンフィグレーションキューが第1の意味を有する場合、コンフィグレーション手段は、パラメータデータストリームの読み込みを継続して、ブロック31に示すように、パラメータデータストリーム内のコンフィグレーション情報(または、コンフィグレーション情報の少なくとも一部分)を抽出する。しかしながら、ステップ30で、パラメータコンフィグレーションキューPKHが第2の意味を有していると判定した場合、コンフィグレーション手段は、ステップ32で、復号化伝送チャネルデータが基礎にする符号化アルゴリズムに関する情報を得る。
本発明のマルチチャネル信号の生成装置を設計するために基本的に考えられる符号化アルゴリズムがいくつかある場合、ステップ32の次に、マルチチャネル再生手段が、デコーダ側に存在する情報に基づいて、環境設定を確定するステップ33を行う。これは、例えば、ルックアップテーブル(LUT)形式で行ってもよい。ステップ32の終わりで、音声エンコーダIDキューを得る場合、ステップ33で、音声エンコーダIDキューを用いて、ルックアップテーブルを入力する。ここで、音声エンコーダIDキューを、インデックスとして用いる。インデックスに対応付けるものとして、このような音声エンコーダに対応付けられたブロック長、サンプリングレート、アドバンス等の、各種の環境設定がある。
次に、ステップ34で、環境設定をマルチチャネル再生手段に適用する。しかしながら、パラメータコンフィグレーションキューの第1の意味をステップ30で選択した場合、図3のブロック31とブロック34との間の接続矢印で示すように、パラメータデータストリームに含まれるコンフィグレーション情報に基づいて、同じ環境設定を行う。
明示的な方法と、暗黙的な方法という2つのコンフィグレーション情報伝達方法をサポートする点で、本発明の手法は柔軟性がある。このことが、パラメータコンフィグレーションキューPKHが果たす役割であって、好ましくは、フラグとして挿入されるもので、最も好ましくは、コンフィグレーション情報自体の伝達を示すたった1つのビットのみを必要とするものである。それに続いて、パラメトリックマルチチャネルデコーダは、このフラグの評価を行う。明示的に利用できるコンフィグレーション情報の利用可能性をこのフラグで伝達する場合、このコンフィグレーション情報を用いる。他方では、暗黙伝達をフラグで表す場合、デコーダは、用いた音声または音声符号化方法に関する情報を用いて、伝達した符号化方法に基づいて、コンフィグレーション情報を適用する。このために、好ましくは、パラメトリックマルチチャネルデコーダおよび/またはマルチチャネル再生手段は、決まった数の音声または音声エンコーダに対する標準コンフィグレーション情報を含むルックアップテーブルを有する。しかしながら、固有の解決方法等を含むルックアップテーブル以外の他の可能性も存在する。一般に、デコーダは、実際に存在するエンコーダID情報に基づいて、コンフィグレーション情報に、それ自体に存在する所定の情報を供給することができる。
最小限の努力をさらに行うことにより、パラメータ手法の完全な設定を行うことができるという点で、この概念は特に利点がある。ここで、全コンフィグレーション情報を、ビット的に相当の労力をもって、データストリーム自体に明示的に書き込む必要がある状況と対照的に、極端な場合では、1つのビットで十分である。
本発明によれば、伝達を前後に切り替えて行うこともできる。これにより、伝送チャネルデータ表現が変わったとしても、例えば、伝送チャネルデータを復号化して後からもう一度符号化する場合でも、すなわち、タンデム符号化状況の場合でも、単純なマルチチャネルデータ処理が可能になる。
従って、本発明の概念により、一方では同期動作の場合に、そして他方では、必要ならば、非同期動作に切り替える場合に、すなわち、効率的ビット節減実施例では、伝達ビットの節減が可能になり、他方では、柔軟な処理が可能になる。これは、既存のステレオデータをマルチチャネル表現に“補足”することに関連して、特に関心を引くものである。
以下では、図4cに、シンタックス擬似コード例により、本発明のマルチチャネル音声信号の生成装置の一例の実施例を示す。はじめに、変数“useSameBccConfig”の値を読み込む。ここで、変数は、連続キューとして作用する。従って、この変数が、すなわち、連続キューが、例えば、1と等しい値を有する場合は、パラメータコンフィグレーションキューを連続して解釈するだけである。しかしながら、連続キューが1と等しくない場合は、すなわち、別の意味を持つ場合は、前に送信したコンフィグレーションを用いる。マルチチャネル再生手段にまだコンフィグレーションが存在しない場合は、ちょうど第1のコンフィグレーション情報および/または環境設定を得るまで待つ。
次に、パラメータコンフィグレーションキューを調べる。変数“codecToBccConfigAlignment”は、パラメータコンフィグレーションキューPKHとして作用する。この変数が1と等しい場合は、すなわち、第2の意味を持つ場合は、デコーダはコンフィグレーション情報をさらに用いることはないが、図4cの“case”から開始する線でわかるように、MP3、CoderXまたはCoderY等のエンコーダIDに基づいて、コンフィグレーション情報を確定する。例として、図4cに示すシンタックスは、MP3、CoderXおよびCoderYしかサポートしないことに留意されたい。しかしながら、任意の他の符号化名称/IDを付加することもできる。
例えば、MP3がエンコーダ情報として確定している場合、変数bccConfigIDを、例えば、MP3_V1に設定する。これは、シンタックスバージョンV1の基礎となるMP3エンコーダのコンフィグレーションである。続いて、このBCCコンフィグレーションIDに基づいて、決まったパラメータセットでデコーダを構成する。従って、例えば、576サンプルのブロック長を、環境設定として起動する。従って、このブロック長を有するフレーミングを通知する。別の環境設定/追加の環境設定を、サンプリングレート等にしてもよい。しかしながら、パラメータコンフィグレーションキュー(codecToBccConfigAlignment)が第1の意味を持つ場合、すなわち、例えば値0の場合は、デコーダは、コンフィグレーション情報をデータストリームから明示的に受信する。すなわち、データストリームから、つまり、入力データから、互いに異なるbccConfigIDを受信する。次に、以下の手順は、ちょうど説明したことと同じである。しかしながら、この場合、符号化伝送チャネルデータを復号化するデコーダのIDを、マルチチャネル再生手段の設定を行うためには用いない。
従って、MP3音声デコーダがマルチチャネル再生手段の設定を行う場合は、bccConfigIDを、伝送チャネルデータを復号化するために用いることもできる。他方では、データストリームに任意の他のコンフィグレーション情報bccConfigIDが存在する場合もあって、基礎となる音声エンコーダがMP3エンコーダであるか否かにかかわらず、これを評価する場合もある。CoderXおよびCoderY等の他の定義済みの環境設定や、さらに、コンフィグレーション情報(bccConfigID)を個別に設定するといった、自由に設定を行う場合に、同じことが当てはまる。好適な実施の形態では、データストリームにさらにコンフィグレーション情報が存在する。次に、デコーダに存在する既に定義済みのコンフィグレーション情報と、明示的に送信したコンフィグレーション情報とを混合したものを用いる必要があることをデコーダに通知する。
上述の実施の形態とは異なり、本発明を、パラメトリック符号化映像信号等の、音声信号以外の他のマルチチャネル信号に適用することもできる。
状況によるが、本発明の生成方法および/または復号化方法を、ハードウェアまたはソフトウェアで実施することもできる。本発明の方法を実行するプログラム可能コンピュータシステムと協働するデジタル記憶媒体、特に、電気的に読み取り可能な制御信号を格納したフレキシブルディスクまたはCD上で実施することができる。従って、一般に、本発明は、コンピュータプログラム製品をコンピュータ上で実行する場合は、機械読み取り可能キャリアに格納したプログラムコードを有するコンピュータプログラム製品である。換言すれば、本発明の方法は、コンピュータプログラムをコンピュータ上で実行する場合は、本発明の方法を実行するプログラムコードを有するコンピュータプログラムである。
エンコーダ側で用いられる本発明のパラメータデータセットの生成装置のブロック回路図を示す。 デコーダ側で用いられるマルチチャネル音声信号の生成装置を示すブロック回路図である。 本発明の好適な実施の形態における、図2のコンフィグレーション手段の動作原理のフロー図である。 音声デコーダとマルチチャネル再生手段との間の同期動作を行うためのデータストリームの図解図である。 図4bは、音声デコーダとマルチチャネル再生手段との間の非同期動作を行うためのデータストリームの概略表現を示す図である。 図4cは、シンタックス形式のマルチチャネル音声信号の生成装置の好適な実施の形態を示す図である。 マルチチャネルエンコーダを一般的に示したものである。 BCCエンコーダ/BCCデコーダ経路の概略ブロック図である。 図6のBCC合成ブロックのブロック回路図である。 図8A〜図8Cは、パラメータセットICLD、ICTDおよびICCを算出する典型的なシナリオを示したものである。

Claims (21)

  1. K個の出力チャネルを得るためのM個の伝送チャネルとパラメータデータとを表す伝送チャネルデータを含む入力データを用いるマルチチャネル信号の生成装置であって、該M個の伝送チャネルと該パラメータデータとがともにN個のオリジナルチャネルを表し、MがNより小さく、かつ1以上の数で、KがMより大きく、該入力データがパラメータコンフィグレーションキュー(41)を含み、
    該K個の出力チャネルを該伝送チャネルデータと該パラメータデータとから生成するマルチチャネル再生手段(24)と、
    該マルチチャネル再生手段の設定を行うコンフィグレーション手段(26)とを備え、
    該コンフィグレーション手段が、
    該入力データを読み込んで、該パラメータコンフィグレーションキューを解釈(30)し、
    該パラメータコンフィグレーションキューが第1の意味を有する場合は、該入力データに含まれるコンフィグレーション情報を抽出(31)して、該マルチチャネル再生手段の環境設定を行い(34)、
    該パラメータコンフィグレーションキューが該第1の意味と異なる第2の意味を有する場合は、該マルチチャネル再生手段の該環境設定が、符号化アルゴリズム(23)の環境設定と全く同じであるか、または該符号化アルゴリズム(23)の環境設定に基づくように、その符号化バージョンから該伝送チャネルデータを復号化した符号化アルゴリズム(23)に関する情報を用いて、該マルチチャネル再生手段の設定を行う(34)ように設計されている、装置。
  2. 前記伝送チャネルデータが、伝送チャネルデータシンタックスを有する伝送チャネルデータストリームを含み、
    前記パラメータデータが、パラメータデータシンタックスを有するパラメータデータストリームを含み、該伝送チャネルデータシンタックスが、該パラメータデータシンタックスと異なり、
    このシンタックスに基づいて、前記パラメータコンフィグレーションキューを前記パラメータデータに挿入し、
    該パラメータデータシンタックスに基づいて、前記コンフィグレーション手段(26)が、前記パラメータデータを読み込んで、前記パラメータコンフィグレーションキューを抽出(30)するように設計されている、請求項1に記載の装置。
  3. 前記マルチチャネル再生手段(24)が、ブロックで処理を行うように設計されていて、前記伝送チャネルデータがサンプルシーケンスであって、前記環境設定が、ブロックの処理を行う毎に、前記マルチチャネル再生手段(24)が新規に処理を行うブロック長またはサンプルのアドバンス数を含む、請求項1または請求項2に記載の装置。
  4. 前記伝送チャネルデータが、少なくとも1つの前記伝送チャネルの時間サンプルで、前記マルチチャネル再生手段(24)が、前記伝送チャネルデータの時間サンプルのブロックを周波数領域表現に変換するフィルタバンクを備える、請求項3に記載の装置。
  5. 前記パラメータデータが、パラメータ値のブロックのシーケンスを含み、パラメータ値のブロックが、少なくとも1つの前記伝送チャネルの時間部分に対応付けられていて、前記マルチチャネル再生手段(24)が、前記環境設定により、該パラメータ値のブロックと、少なくとも1つの前記伝送チャネルの対応付けられた時間部分とを用いて前記K個の出力チャネルを生成するように設計されている、請求項1ないし請求項4のいずれかに記載の装置。
  6. 前記符号化アルゴリズム(23)が、複数の各種の符号化アルゴリズムのうちの1つであり、
    前記コンフィグレーション手段(26)が、インデックスと、符号化アルゴリズムの該インデックスに対応付けられたコンフィグレーション情報のセットとを含むルックアップテーブル手段を備え、それぞれ前記符号化アルゴリズムの前記環境設定を含み、
    前記コンフィグレーション手段(26)が、前記ルックアップテーブルの該インデックスを前記符号化アルゴリズムに関する該情報から求め、前記マルチチャネル再生手段の前記コンフィグレーション情報を求める(33)ように設計されている、請求項1ないし請求項5のいずれかに記載の装置。
  7. パラメータコンフィグレーションキューが前記第1の意味を有する場合に、前記入力データが、前記マルチチャネル再生手段(24)のコンフィグレーション情報を含み、前記パラメータコンフィグレーションキューが前記第2の意味を有する場合に、前記マルチチャネル再生手段のコンフィグレーション情報を一部しか含まないか、あるいは全く含まない、請求項1ないし請求項6のいずれかに記載の装置。
  8. 前記パラメータコンフィグレーションキューが前記第2の意味を有する場合は、前記コンフィグレーション手段(26)が、必要となるコンフィグレーション情報の一部だけを前記入力データから抽出して、コンフィグレーション情報の残りの部分を前記マルチチャネル再生手段がわかっている事前設定したコンフィグレーション情報から用いるように設計されている、請求項1ないし請求項7のいずれかに記載の装置。
  9. 前記パラメータコンフィグレーションキューが前記第2の意味を有する場合に、前記コンフィグレーション手段(26)が、前記伝送チャネルデータを前記符号化伝送チャネルデータから生成するデコーダに前記コンフィグレーション手段を接続する接続ラインを介して、前記符号化アルゴリズムに関する前記情報を得るように、または、前記伝送チャネルデータまたは前記符号化伝送チャネルデータを読み込むことにより、前記符号化アルゴリズムに関する前記情報を得るように設計されている、請求項1ないし請求項8のいずれかに記載の装置。
  10. 前記入力データがさらに連続キュー(41)を含み、
    前記コンフィグレーション手段(26)が、該連続キューが第1の意味を有する場合に、該連続キューを読み込んで解釈(29)して、前記マルチチャネル再生手段の固定して設定した環境設定または前に通知した環境設定を行い、該連続キューが前記第1の意味と異なる第2の意味を有する場合に限って、前記パラメータコンフィグレーションキューに基づいて、前記マルチチャネル再生手段の設定(30)を行うように設計されている、請求項1ないし請求項9のいずれかに記載の装置。
  11. パラメータデータシンタックスに基づいて、前記連続キューが前記パラメータデータに対応付けられていて、前記連続キューが前記パラメータデータストリーム内のフラグである、請求項10に記載の装置。
  12. パラメータデータシンタックスに基づいて、前記パラメータコンフィグレーションキューが前記パラメータデータに対応付けられていて、前記パラメータコンフィグレーションキューが前記パラメータデータストリーム内のフラグである、請求項1ないし請求項11のいずれかに記載の装置。
  13. 前記連続キューまたは前記パラメータコンフィグレーションキューそれぞれが、1つのビットを含む、請求項11または請求項12に記載の装置。
  14. K個の出力チャネルを得るためのM個の伝送チャネルとパラメータデータとを表す伝送チャネルデータを含む入力データを用いるマルチチャネル信号の生成方法であって、該M個の伝送チャネルと該パラメータデータとがともにN個のオリジナルチャネルを表し、MがNより小さく、かつ1以上の数で、KがMより大きく、該入力データがパラメータコンフィグレーションキュー(41)を含み、
    再生アルゴリズムに基づいて、該K個の出力チャネルを該伝送チャネルデータと該パラメータデータとから再生(24)するステップと、
    次のサブステップにより、該再生アルゴリズムの設定を行う(26)ステップとを含み、
    該サブステップは、
    該入力データを読み込んで、該パラメータコンフィグレーションキューを解釈(30)するステップと、
    該パラメータコンフィグレーションキューが第1の意味を有する場合は、該入力データに含まれるコンフィグレーション情報を抽出(31)して、該再生アルゴリズムの環境設定を行う(34)ステップと、
    該パラメータコンフィグレーションキューが該第1の意味と異なる第2の意味を有する場合は、該環境設定が符号化アルゴリズム(23)の環境設定と全く同じであるか、または該符号化アルゴリズム(23)の環境設定に基づくように、符号化バージョンから該伝送チャネルデータの復号化を行った符号化アルゴリズム(23)に関する情報を用いて、該再生アルゴリズムの該環境設定を行う(34)ステップとを含む、方法。
  15. MがNより小さく、かつ1より大きい数のM個の伝送チャネルを含む伝送チャネルデータとともにN個のオリジナルチャネルを表すパラメータデータ出力の生成装置であって、
    該パラメータデータを供給するマルチチャネルパラメータ手段(11)と、
    マルチチャネル再生手段に該パラメータデータ出力に含まれるコンフィグレーションデータを用いる場合は、該パラメータコンフィグレーションキューが第1の意味を有し、コンフィグレーションデータを該M個の伝送チャネルの符号化または復号化に用いられる符号化アルゴリズムに基づくマルチチャネル再生に用いる場合は、該パラメータコンフィグレーションキューが第2の意味を有するパラメータコンフィグレーションキューを求める伝達手段(14)と、
    該コンフィグレーションデータを出力して、該パラメータデータ出力を得るコンフィグレーションデータ出力手段(15)とを備える、装置。
  16. 前記コンフィグレーションデータ出力手段(15)が、連続キューを前記パラメータデータセットに挿入するように設計され、
    第1の意味を有する場合に、該連続キューが、固定して設定し、前に通知した環境設定をマルチチャネル再生に用いるようにして、該連続キューが前記第1の意味と異なる第2の意味を有する場合に、前記パラメータコンフィグレーションキューを用いて、マルチチャネル再生のコンフィグレーションを設定するようにした、請求項15に記載の装置。
  17. 前記パラメータコンフィグレーションキューが前記第2の意味(17)を有する場合に、前記コンフィグレーションデータ出力手段が、必要なコンフィグレーションデータを、前記パラメータデータセットと全く、あるいは一部しか対応付けないように設計されている、請求項15または16に記載の装置。
  18. MがNより小さく、かつ1より大きい数のM個の伝送チャネルを含む伝送チャネルデータとともにN個のオリジナルチャネルを表すパラメータデータ出力の生成方法であって、
    該パラメータデータを供給(11)するステップと、
    該パラメータデータ出力に含まれるコンフィグレーションデータをマルチチャネル再生アルゴリズムに用いる場合に、該パラメータコンフィグレーションキューが第1の意味を有し、コンフィグレーションデータを該M個の伝送チャネルの符号化または復号化に用いられる符号化アルゴリズムに基づくマルチチャネル再生に用いる場合は、該パラメータコンフィグレーションキューが第2の意味を有するパラメータコンフィグレーションキューを求める(14)ステップと、
    該コンフィグレーションデータを出力(15)して、該パラメータデータ出力を得るステップとを含む、方法。
  19. マルチチャネル再生手段のためのコンフィグレーションデータが該入力データに含まれているという第1の意味、または、その符号化バージョンから該伝送チャネルデータを復号化した符号化アルゴリズム(23)に基づいて、該マルチチャネル再生手段がコンフィグレーションデータを用いるという第2の意味を有するパラメータコンフィグレーションキュー(41)を含む入力データを用いて、MがNより小さく、かつ1より大きい数のM個の伝送チャネルを含む伝送チャネルデータとともにN個のオリジナルチャネルを表すパラメータデータ出力の生成装置であって、
    コンフィグレーションデータを出力する出力手段を備え、
    出力手段が、
    該入力データを読み込んで、該パラメータコンフィグレーションキューを解釈(30)して、
    該パラメータコンフィグレーションキューが該第2の意味を有する場合は、その符号化バージョンから該伝送チャネルデータを復号化した符号化アルゴリズム(23)に関する情報を該コンフィグレーションデータとして検索して出力し、該パラメータコンフィグレーションキューが該第1の意味を有する場合は、該入力データに含まれるマルチチャネル再生手段のためのコンフィグレーションデータを出力するように設計されている、装置。
  20. マルチチャネル再生手段のためのコンフィグレーションデータが該入力データに含まれているという第1の意味、または、その符号化バージョンから該伝送チャネルデータを復号化した符号化アルゴリズム(23)に基づいて、該マルチチャネル再生手段がコンフィグレーションデータを用いるという第2の意味を有するパラメータコンフィグレーションキュー(41)を含む入力データを用いて、MがNより小さく、かつ1より大きい数のM個の伝送チャネルを含む伝送チャネルデータとともにN個のオリジナルチャネルを表すパラメータデータ出力の生成方法であって、
    該入力データを読み込んで、該パラメータコンフィグレーションキューを解釈(30)するステップと、
    該パラメータコンフィグレーションキューが第2の意味を有する場合は、その符号化バージョンから該伝送チャネルデータを復号化した符号化アルゴリズム(23)に関する情報を検索して、該検索したコンフィグレーションデータを出力し、該パラメータコンフィグレーションキューが第1の意味を有する場合は、該入力データに含まれるマルチチャネル再生手段のためのコンフィグレーションデータを出力するステップとを含む、方法。
  21. コンピュータに、請求項14、18または20に記載の方法を実行させるためのコンピュータプログラム。
JP2007530606A 2004-09-08 2005-08-10 マルチチャネル信号またはパラメータデータセットを生成する装置および方法 Active JP4601669B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004043521A DE102004043521A1 (de) 2004-09-08 2004-09-08 Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
PCT/EP2005/008694 WO2006027079A1 (de) 2004-09-08 2005-08-10 Vorrichtung und verfahren zur wiederherstellung eines multikanal-audiosignals und zum erzeugen eines parameterdatensatzes hierfür

Publications (2)

Publication Number Publication Date
JP2008512708A JP2008512708A (ja) 2008-04-24
JP4601669B2 true JP4601669B2 (ja) 2010-12-22

Family

ID=35502612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007530606A Active JP4601669B2 (ja) 2004-09-08 2005-08-10 マルチチャネル信号またはパラメータデータセットを生成する装置および方法

Country Status (18)

Country Link
US (1) US8731204B2 (ja)
EP (1) EP1687809B1 (ja)
JP (1) JP4601669B2 (ja)
KR (1) KR100857920B1 (ja)
CN (1) CN101014999B (ja)
AT (1) ATE409938T1 (ja)
AU (1) AU2005281966B2 (ja)
BR (1) BRPI0515651B1 (ja)
CA (1) CA2579114C (ja)
DE (2) DE102004043521A1 (ja)
ES (1) ES2314706T3 (ja)
HK (1) HK1093595A1 (ja)
IL (1) IL181743A0 (ja)
MX (1) MX2007002854A (ja)
NO (1) NO338932B1 (ja)
PT (1) PT1687809E (ja)
RU (1) RU2355046C2 (ja)
WO (1) WO2006027079A1 (ja)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100740807B1 (ko) 2004-12-31 2007-07-19 한국전자통신연구원 공간정보기반 오디오 부호화에서의 공간정보 추출 방법
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
JP4859925B2 (ja) 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
KR101169280B1 (ko) 2005-08-30 2012-08-02 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
EP2112652B1 (en) 2006-07-07 2012-11-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for combining multiple parametrically coded audio sources
KR101438387B1 (ko) * 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
KR100917843B1 (ko) * 2006-09-29 2009-09-18 한국전자통신연구원 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
CN101529898B (zh) 2006-10-12 2014-09-17 Lg电子株式会社 用于处理混合信号的装置及其方法
CN101169866B (zh) * 2006-10-26 2010-09-01 朱明程 自重构片上多媒体处理系统及其自重构实现方法
US8600532B2 (en) * 2007-12-09 2013-12-03 Lg Electronics Inc. Method and an apparatus for processing a signal
US8654988B2 (en) * 2008-05-05 2014-02-18 Qualcomm Incorporated Synchronization of signals for multiple data sinks
EP2124486A1 (de) * 2008-05-13 2009-11-25 Clemens Par Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals
KR20110052562A (ko) 2008-07-15 2011-05-18 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
JP5258967B2 (ja) 2008-07-15 2013-08-07 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
KR101499785B1 (ko) 2008-10-23 2015-03-09 삼성전자주식회사 모바일 디바이스를 위한 오디오 처리 장치 및 그 방법
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
JP6100164B2 (ja) 2010-10-06 2017-03-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
PL2676268T3 (pl) * 2011-02-14 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób przetwarzania zdekodowanego sygnału audio w domenie widmowej
US8600692B2 (en) * 2011-03-17 2013-12-03 Sysacom Automatically configurable sensing device
KR101748760B1 (ko) 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
WO2014020181A1 (en) * 2012-08-03 2014-02-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for multi-instance spatial-audio-object-coding employing a parametric concept for multichannel downmix/upmix cases
CN103686179B (zh) * 2012-09-26 2019-05-07 中兴通讯股份有限公司 使用参数集的编码、解码方法及装置、电子设备
WO2014161996A2 (en) 2013-04-05 2014-10-09 Dolby International Ab Audio processing system
CN103336747B (zh) * 2013-07-05 2015-09-09 哈尔滨工业大学 VxWorks操作系统下CPCI总线数字量输入与开关量输出可配置驱动器及驱动方法
EP2840811A1 (en) 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder
CN103412833A (zh) * 2013-08-30 2013-11-27 哈尔滨工业大学 VxWorks操作系统下CPCI总线扫描ADC功能模块驱动设备及其控制方法
EP2863386A1 (en) 2013-10-18 2015-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
CN103744805B (zh) * 2014-01-03 2016-04-27 哈尔滨工业大学 VxWorks下CPCI总线开关量与模拟量输出模块硬件架构与时序可配置驱动方法
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2018127764A1 (en) 2017-01-06 2018-07-12 Telefonaktiebolaget Lm Ericsson (Publ) Explicit configuration of paging and control channel in system information
US10542052B2 (en) * 2017-04-27 2020-01-21 Samsung Electronics Co., Ltd. Multi-area grouping

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5329000A (en) * 1991-10-31 1994-07-12 Becton, Dickinson And Company Purification of DNA with silicon tetrahydrazide
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
ES2165370T3 (es) * 1993-06-22 2002-03-16 Thomson Brandt Gmbh Metodo para obtener una matriz decodificadora multicanal.
EP0631458B1 (en) 1993-06-22 2001-11-07 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
DK1064824T3 (da) 1997-11-14 2002-09-16 Waves Usa Inc W Dekoderkredsløb for stereofonisk surround-sound
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
JPH11330980A (ja) 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
US6452941B1 (en) * 1998-09-16 2002-09-17 Telefonaktiebolaget Lm Ericsson (Publ) Method and system for alternating transmission of codec mode information
DE19900961A1 (de) 1999-01-13 2000-07-20 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Wiedergabe von Mehrkanaltonsignalen
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
TW533746B (en) 2001-02-23 2003-05-21 Formosa Ind Computing Inc Surrounding sound effect system with automatic detection and multiple channels
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
TW569551B (en) 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
US8498422B2 (en) * 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
US20040037433A1 (en) 2002-08-21 2004-02-26 Heng-Chien Chen Multi-channel wireless professional audio system
EP1414273A1 (en) * 2002-10-22 2004-04-28 Koninklijke Philips Electronics N.V. Embedded data signaling
JP2005352396A (ja) * 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
BRPI0706488A2 (pt) * 2006-02-23 2011-03-29 Lg Electronics Inc método e aparelho para processar sinal de áudio

Also Published As

Publication number Publication date
US20070206690A1 (en) 2007-09-06
IL181743A0 (en) 2007-07-04
NO338932B1 (no) 2016-10-31
KR100857920B1 (ko) 2008-09-10
NO20071132L (no) 2007-04-03
JP2008512708A (ja) 2008-04-24
KR20070065314A (ko) 2007-06-22
CN101014999B (zh) 2011-04-27
PT1687809E (pt) 2009-01-14
US8731204B2 (en) 2014-05-20
ATE409938T1 (de) 2008-10-15
CN101014999A (zh) 2007-08-08
EP1687809B1 (de) 2008-10-01
HK1093595A1 (en) 2007-03-02
BRPI0515651A (pt) 2008-07-29
CA2579114C (en) 2011-05-10
CA2579114A1 (en) 2006-03-16
AU2005281966A1 (en) 2006-03-16
DE502005005522D1 (de) 2008-11-13
EP1687809A1 (en) 2006-08-09
RU2355046C2 (ru) 2009-05-10
AU2005281966B2 (en) 2008-07-17
WO2006027079A1 (de) 2006-03-16
ES2314706T3 (es) 2009-03-16
MX2007002854A (es) 2007-05-08
RU2007112943A (ru) 2008-10-20
BRPI0515651B1 (pt) 2019-07-02
DE102004043521A1 (de) 2006-03-23

Similar Documents

Publication Publication Date Title
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
US7916873B2 (en) Stereo compatible multi-channel audio coding
US8145498B2 (en) Device and method for generating a coded multi-channel signal and device and method for decoding a coded multi-channel signal
RU2406166C2 (ru) Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов
JP4685925B2 (ja) 適応残差オーディオ符号化
US7903751B2 (en) Device and method for generating a data stream and for generating a multi-channel representation
RU2576476C2 (ru) Декодер аудиосигнала, кодер аудиосигнала, способ формирования представления сигнала повышающего микширования, способ формирования представления сигнала понижающего микширования, компьютерная программа и бистрим, использующий значение общего параметра межобъектной корреляции
KR101056325B1 (ko) 복수의 파라미터적으로 코딩된 오디오 소스들을 결합하는 장치 및 방법
JP5883561B2 (ja) アップミックスを使用した音声符号器
KR100947013B1 (ko) 멀티채널 오디오 신호의 시간적 및 공간적 정형
KR101158698B1 (ko) 복수-채널 인코더, 입력 신호를 인코딩하는 방법, 저장 매체, 및 인코딩된 출력 데이터를 디코딩하도록 작동하는 디코더
US20090326958A1 (en) Methods and Apparatuses for Encoding and Decoding Object-Based Audio Signals
US20070168183A1 (en) Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
KR20070003544A (ko) 아비트러리다운믹스게인을 이용한 클리핑복원
KR20080071971A (ko) 미디어 신호 처리 방법 및 장치
TWI309140B (en) Device and method for generating a multi-channel signal or a parameter data set

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100921

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100928

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131008

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4601669

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250