JP2008517339A - 空間音声パラメータの効率的符号化のためのエネルギー対応量子化 - Google Patents

空間音声パラメータの効率的符号化のためのエネルギー対応量子化 Download PDF

Info

Publication number
JP2008517339A
JP2008517339A JP2007537308A JP2007537308A JP2008517339A JP 2008517339 A JP2008517339 A JP 2008517339A JP 2007537308 A JP2007537308 A JP 2007537308A JP 2007537308 A JP2007537308 A JP 2007537308A JP 2008517339 A JP2008517339 A JP 2008517339A
Authority
JP
Japan
Prior art keywords
channel
parameter
quantization
energy
inverse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007537308A
Other languages
English (en)
Other versions
JP4521032B2 (ja
Inventor
ヨナス レーデン
ヨナス エングデガルド
ハイコ プルンハーゲン
イェルーン ブレーバールト
エリク スフエイエルス
デ パール ステーフェン ファン
ジョーハン ヒルペアト
ユールゲン ヘレ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Dolby International AB
Original Assignee
Koninklijke Philips NV
Dolby International AB
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Dolby International AB, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008517339A publication Critical patent/JP2008517339A/ja
Application granted granted Critical
Publication of JP4521032B2 publication Critical patent/JP4521032B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Abstract

チャネル又はチャネルペアの特性の指標であるパラメータであって、マルチチャネル信号の、別のチャネルに対するチャネル又はチャネルペアの指標であるパラメータを、チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいて生成した量子化基準を用いて、もっと効率的に量子化することができる。心理音響学的なアプローチを取り入れた量子化基準を生成することによって、より粗な量子化を行い、符号化された表現から再構成する際に知覚音質を大きく損なうことなくマルチチャネル信号の符号化表現のサイズを削減することができる。
【選択図】図1

Description

本発明は、空間音声パラメータの量子化に関し、具体的には、量子化空間音声パラメータを使って、再現された音声信号の知覚音質を大きく損なうことなくより効率的な圧縮を可能にする構想に関する。
近年、マルチチャネル音声再生技術がますます重要になっている。5チャネル以上の別々の音声チャネルを有するマルチチャネル音声信号を効率的に伝送する点に関して、ステレオ信号またはマルチチャネル信号を圧縮する方法がいくつか開発されている。マルチチャネル音声信号のパラメトリック符号化に関する最近のアプローチ(パラメトリックステレオ(PS)、“バイノーラルキュー符号化”(BCC)等)は、(モノラルチャネルまたはいくつかのチャネルからなる)ダウンミキシング信号およびパラメトリックサイド情報により、マルチチャネル音声信号を表している。これは、“空間キュー”とも呼ばれ、その知覚空間サウンドステージを特徴付けるものである。
一般に、マルチチャネル符号化装置は入力として少なくとも2つのチャネルを入力して、1つ以上のキャリアチャネルとパラメトリックデータとを出力する。デコーダで元のマルチチャネル信号の近似値を算出できるように、パラメトリックデータが導出される。通常、キャリアチャネル(複数のチャネル)は、サブバンドサンプル、スペクトル係数、時間領域サンプル等を含み、基礎となる信号の比較的よい表現を提供するが、パラメトリックデータはこのようなスペクトル係数のサンプルは含んでおらず、その代わりに、特定の再生アルゴリズムを制御する制御パラメータを含んでいる。このような再生は、乗算、時間シフティング、周波数シフティング、位相シフティング等による重み付けを含むこともできる。従って、パラメトリックデータは、信号または対応付けられたチャネルの比較的粗い表現だけが含まれる。
バイノーラルキュー符号化(BCC)技術は、多数の刊行物に記載されている。例えば、“ステレオおよびマルチチャネル音声圧縮に応用したバイノーラルキュー符号化(Binaural cuecoding applied to stereo and multi‐channel audio compression)”、C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)、(2002年5月、AES変換論文誌5574、ミュンヘン)、“バイノーラルキュー符号化のための聴覚空間キューの推定(Estimation of auditory spatial cues for binaural cue coding)”(2ICASSP刊行物)、および“バイノーラルキュー符号化:空間音声の正常で効率的な表現(Binaural cue coding: a normal and efficient representation of spatial audio)”C.フォーラ(Faller)、F.バウムガルテ(Baumgarte)2002年5月フロリダ州オーランド。
BCC符号化では、重なりウィンドウを用いた変換に基づくDFT(離散フーリエ変換)を用いて、多数の音声入力チャネルがスペクトル表現に変換される。次に、得られた均一なスペクトルは、重複しない部分にそれぞれ分割される。各部分は、等価の矩形帯域幅(ERB)に正比例する帯域幅を有している。次に、ICLD(チャネル間レベル差)およびICTD(チャネル間時間差)と呼ばれる空間パラメータが、各部分に対して推定される。ICLDパラメータは2つのチャネル間のレベル差を記述し、ICTDパラメータは、異なるチャネルの2つの信号の間の時間差(位相シフト)を記述する。通常、基準チャネルに対して、レベル差および時間差が各チャネルに与えられる。これらのパラメータを導出した後で、パラメータが量子化されて、最後に送信するために符号化される。
ICLDパラメータおよびICTDパラメータは、最も重要な音源ローカリゼーションパラメータを表しているが、さらにパラメータを導入することにより、これらのパラメータを用いて空間表現を向上させることができる。
“パラメトリックステレオ”と呼ぶ関連技術は、送信したモノラル信号とともにパラメータサイド情報に基づいて、2チャネルステレオ信号のパラメトリック符号化について記載する。これに関連して、チャネル間強度差(IID)、チャネル間位相差(IPD)、およびチャネル間コヒーレンス(ICC)と呼ぶ3種類の空間パラメータが取り入れられている。コヒーレンスパラメータ(相関パラメータ)を用いて空間パラメータセットを拡張することは、知覚空間の“拡散”またはサウンドステージの空間の“まとまり具合”をパラメータ化することが可能にする。パラメトリックステレオは、次の文献により詳細に記載されている。“ステレオ音声のパラメトリック符号化(Parametric coding of stereo audio)”、J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)、およびE.シュイエールス(Schuijers)、(符号応用紀要(EURASIPJ.Appl.Sign.Proc.)2005年9月、1305−1322頁)”、“低ビットレートでの高品質パラメトリック空間音声符号化(High‐Quality Parametric Spatial Audio Coding at Low Bit rates)”、J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)、E.シュイエールス(Schuijers)、(2004年5月、AES第116回大会、ベルリン、予稿集6072)、および“低複雑性パラメトリックステレオ符号化(Low Complexity Parametric Stereo Coding)”、E.シュイエールス(Schuijers)、J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)、J.エングデガールド(Engdegard)、(2004年5月、AES第116回大会、ベルリン、予稿集6073)。
国際公開出願第2004/008805号は、いくつかのパラメトリックステレオモジュールを組合せてこれを階層的に構成し、ダウンミックス信号とパラメトリックサイド情報とで構成される元のマルチチャネルの音声信号表現を導き出して、マルチチャネル音声信号を効率的に圧縮できる方法を教示している。
BCC及びパラメトリックステレオ(PS)のアプローチにおいて、音声チャネル間のレベル差(強度差ICLD又はエネルギー差IIDとも呼ばれる)の表現は、ステレオ/マルチチャネル音声信号のパラメトリック表現の肝要な部分である。このような情報及び他の空間パラメータは、各時間/周波数スロット毎に、エンコーダからデコーダに送信される。従って、コーディング効率の見地から、音声の質を維持しながらこれらのパラメータをできるだけコンパクトに表現することに高い関心が寄せられている。
BCCコーディングにおいて、レベル差は、いわゆる「基準チャネル」との対比で表現され、基準チャネルと対比したdB単位の均一な尺度で量子化されるが、人間が聴いた場合、このことは、基準チャネルに対して低レベルのチャネルは、かなりのマスキング効果を受けるという事実をうまく利用していない。あるチャネルが全く信号を含んでいないような極端な場合、この特定のチャネルを表現するパラメータによって使われるバンド幅は完全に無駄になる。一つのチャネルが他のチャネルより非常に弱く、再生時に聴取者がその微弱なチャネルをほとんど聞くことができないといったような、より一般的なケースでは、その微弱チャネルは、ほとんど、より強い信号によってマスクされているので、微弱チャネルの再生精度が低下しても、同じ知覚音質を維持することができる。
マルチチャネル信号を符号化する際に生じる状況及び問題を説明するために、図10aを参照すると、広く使われている5チャネルの信号が図示されている。該5チャネルは、左背面チャネル101(A、信号a(t)を有する)、左前面チャネル102(B、信号b(t)を有する)、中央チャネル103(C、信号c(t)を有する)右前面チャネル104(D、信号d(t)を有する)及び右背面チャネル(E,信号e(t)を有する)で構成される。単独チャネル間又はチャネルペア間の強度の関係は矢印で示される。すなわち、前面左チャネル102と前面右チャネル104との間の強度配分はr1(110)で示され、左背面チャネルと右背面チャネルとの間の強度配分はr4(112)で示される。左前面チャネル102及び右前面チャネル104の組合せと、中央チャネル103との間の強度配分はr2(114)で示され、背面チャネルの組合せと前面チャネルの組合せとの間の強度配分はr3(116)で示されている。例として、単純なモノローグをレコードする場合、エネルギーの部分は、中央チャネル103に包含されることになろう。この例では、特に背面のチャネルはわずか(又はゼロ)のエネルギーしか含有しない。従って、この例では、再生において使われるのは、ほとんど中央チャネル102又は前面のチャネルなので、背面チャネルの特質を表現するパラメータは単なる無駄使いとなる。
図10aに基づいて、チャネル間又はチャネルの組合せ間のエネルギー配分を計算する方法を次の項で説明する。
図10aには、5チャネルスピーカ設定に対するマルチチャネルパラメータ化が図示され、いくつかの音声チャネルが、101〜105で示されており、a(t)101は左サラウンドチャネルの信号を表し、b(t)102は左前面チャネルの信号を表し、c(t)103は中央チャネルの信号を表し、d(t)104は右前面チャネルの信号を表し、e(t)105は右サラウンドチャネルの信号を表している。スピーカ設定は、前面部と背面部とに分けられている。前面設定チャネル全体(102,103及び104)と背面チャネル(101及び105)との間のエネルギー配分が、図10a中に矢印で図示され、r3パラメータで示されている。中央チャネル103と、左前面チャネル102及び右前面チャネル103との間のエネルギー配分はr2で示される。左サラウンドチャネル101と右サラウンドチャネル105との間のエネルギー配分はr4で示される。最後に、左前面チャネル102と右前面チャネル104との間のエネルギー配分はr1で示される。r1〜r4は、異なる領域のパラメータ化なので、エネルギー配分に加えて、例えばこれら領域間の相関のような、他の肝要な領域特性もパラメータ化できることは明らかである。各パラメータr1〜r4に加えて、各ローカル(チャネル分域)のエネルギーを計算することができる。例えば、ローカルエネルギーr4は、チャネルA101とE105とのエネルギー和である。
Figure 2008517339
ここでE[・]は次により定義される期待値である。
Figure 2008517339
図10bは、例えば国際公開出願第2004/008805号に記載されたような、階層的に順序付けられたパラメトリックステレオモジュールによって構成されたマルチチャネル音声デコーダを示す。ここでは、図10aで説明された音声チャネル101〜105は、単一のモノラルダウンミックス信号120(M)と、第一2チャネルデコーダ122、第二2チャネルデコーダ124、第三2チャネルデコーダ126、及び第四2チャネルデコーダ128による対応するサイド情報とから、ステップバイステップで再生される。図から分かるように、図10bのツリー構造において、第一2チャネルデコーダは、モノラルダウンミックス信号120を2つの信号に分解し第二及び第三2チャネルデコーダ124及び126に送る。ここで、第三2チャネルデコーダ126に送信されたチャネルは、左背面チャネル101と右背面チャネル105とが組合わされた結合チャネルである。第二2チャネルデコーダ124に送信されたチャネルは、中央チャネル103と、これも同様に前面左チャネル102及び前面右チャネル104の合成である結合チャネルとの組み合わせである。
そうして、階層的復号化の第二ステップを経た後に、送信された空間パラメータを用い、左背面チャネル101と、右背面チャネル105と、中央チャネル103と、前面左チャネル及び前面右チャネルの組合せである結合チャネルとが再構成される。送信された空間パラメータは、2チャネルデコーダ122、124及び126の各々が使用するためのレベルパラメータを含む。
階層的復号化の第三ステップにおいて、第四2チャネルデコーダ128は、第四2チャネルデコーダ用のサイド情報として送信されたレベル情報を使って、前面左チャネル102と前面右チャネル104とを導き出す。図10bに示すような従来技術の階層型デコーダを使って、各単独出力チャネルに対し求められるエネルギーは、入力信号と各出力信号との間にあるさまざまなパラメトリックステレオモジュールからのエネルギーによる。すなわち、ある特定の出力チャネルのエネルギーは、複数のパラメトリックステレオモジュールのIID/ICLDパラメータに依存することができる。また、このような、連結されたパラメトリックステレオモジュールのツリー状の構造においては、サイド情報の一部としてデコーダにより用いられるIIDを生成するために、各パラメータステレオモジュール内でIIDパラメータの非均一な量子化を適用する。これは、ローカルに(すなわち、各個別のパラメトリックステレオモジュール内で)非均一なIID量子化の利点を利用することである。それにもかかわらず、最適策とはいえない。なぜなら、各々のモジュール(「葉」)での量子化は、他の、相対的にレベルの高い、従ってマスキング影響をもたらす可能性のある他の音声チャネルのエネルギー/レベルと無関係に実行されるからである。
「リーフ(葉)」モジュールはより上のツリー(樹木)レベル(例、「ルート(根)」モジュール)の全体的なレベル配分については不知であるので、こういったことは起こり得る。各リーフはそれ自体の対応IID/ICLDパラメータを持っており、これがそのリーフの入力から出力チャネルへのエネルギー配分を指定している。例えば、リーフ「r3」のIID/ICLDパラメータ(第一2チャネルデコーダ122により処理される)は入ってくるエネルギーの90%をリーフr2に送り、残りのエネルギー(10%)をリーフr4に送るよう指定することができる。このプロセスは、ツリー中の各リーフで繰り返される。各エネルギー配分パラメータの表現精度には限度があるので、各出力チャネルA〜Eに求められるエネルギーと実際のエネルギーとの間の偏差の大きさは、IID/ICLDパラメータ中の量子化誤差及びエネルギー配分誤差(これによる量子化誤差の拡散)の程度による。すなわち、r1〜r4の全てのパラメータ化段階において、特定のパラメータのタイプ、例えばICC又はIIDに対し、同じ量子化テーブルが使われると、ローカル的にだけ最適なIID/ICD量子化が行われる。このことは、従来技術による実施では、r1〜r4の各パラメータ化段階において、(ローカル)出力チャネルの出力エネルギーの誤差は、最も弱い出力チャネルに対して最大になるということを意味する。
前項で説明したように、マルチチャネル音声信号の空間知覚を表現するレベルパラメータ(IID又はICD)もしくはICC、位相差、又は時間差のような他のパラメータの該量子化は、まだ最適とはいえない、というのは、チャネル中の低いエネルギーによってほとんどがマスクされるようなチャネルを表現する空間パラメータのためバンド幅が浪費されるからである。
国際公開第2004/008805号 J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)、およびE.シュイエールス(Schuijers)、"ステレオ音声のパラメトリック符号化(Parametric coding of stereo audio)"、(符号応用紀要(EURASIPJ.Appl.Sign.Proc.)2005年9月、1305−1322頁)" J.ブレーバールト(Breebaart)、S.ファン・デ・パール(van de Par)、A.コーラウシュ(Kohlrausch)、E.シュイエールス(Schuijers)、"低ビットレートでの高品質パラメトリック空間音声符号化(High‐Quality Parametric Spatial Audio Coding at Low Bit rates)"、(2004年5月、AES第116回大会、ベルリン、予稿集6072) J.ブレーバールト(Breebaart)、H.プルンハーゲン(Purnhagen)、J.エングデガールド(Engdegard)、"低複雑性パラメトリックステレオ符号化(Low Complexity Parametric Stereo Coding)"、E.シュイエールス(Schuijers)、(2004年5月、AES第116回大会、ベルリン、予稿集6073)
本発明の目的は、マルチチャネル音声信号の空間パラメータの量子化についての改良された構想を提供することである。
本発明の第一の様態よれば、この目的は、入力パラメータを量子化するためのパラメータ量子化器(quantizer)によって実現される。該入力パラメータは、マルチチャネル信号の、別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、該量子化器は、チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいて量子化基準(quantization rule)を生成するための、量子化基準ジェネレータと、生成された量子化基準を使って入力パラメータから量子化パラメータを導き出すための、バリュー量子化器とを含む。
本発明の第二の様態によれば、この目的は、パラメータを導き出すために量子化パラメータを逆量子化するためのパラメータ逆量子化器(dequantizer)によって実現され、該パラメータは、マルチチャネル信号の、別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、該逆量子化器は、チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいて逆量子化基準を生成するための、逆量子化基準ジェネレータと、生成された逆量子化基準を使って量子化パラメータからパラメータを導き出すための、バリュー逆量子化器とを含む。
本発明の第三の様態によれば、この目的は、入力パラメータを量子化する方法によって実現され、該入力パラメータは、マルチチャネル信号の、別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、該方法は、チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいて量子化基準を生成する工程と、生成された量子化基準を使って入力パラメータから量子化パラメータを導き出す工程とを含む。
本発明の第四の様態によれば、この目的は、パラメータを導出するために、量子化パラメータを逆量子化する方法によって実現され、該パラメータは、マルチチャネル信号の別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、該方法は、該チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいて逆量子化基準を生成する工程と、生成された逆量子化基準を使って量子化パラメータからパラメータを導き出す工程とを含む。
本発明の第五の様態によれば、この目的は、単独チャネル又はチャネルペアの特性の指標であるパラメータを量子化表現する量子化パラメータを含有するマルチチャネル信号表現によって実現され、該パラメータは、マルチチャネル信号の、別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、該量子化パラメータは、チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいた量子化基準を使って導き出される。
本発明の第六の様態によれば、この目的は、前記のマルチチャネル信号表現を格納したマシン可読の記憶媒体によって実現される。
本発明の第七の様態によれば、この目的は、入力パラメータを量子化するためのパラメータ量子化器を備えたトランスミッタ又は音声レコーダによって実現され、該入力パラメータは、マルチチャネル信号の別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、該量子化器は、チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいて量子化基準を生成するための、量子化基準ジェネレータと、生成された量子化基準を使って入力パラメータから量子化パラメータを導き出すための、バリュー量子化器とを含む。
本発明の第八の様態によれば、この目的は、パラメータを導き出すために量子化パラメータを逆量子化するためのパラメータ逆量子化器を備えるレシーバ又はオーディオプレーヤによって実現され、該パラメータは、マルチチャネル信号の別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、該逆量子化器は、チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいて逆量子化基準を生成するための、逆量子化基準ジェネレータと、生成された逆量子化基準を使って量子化パラメータからパラメータを導き出すための、バリュー逆量子化器とを含む。
本発明の第九の様態によれば、この目的は、送信又は音声レコーディングの方法によって実現され、該方法は入力パラメータを量子化する方法を含み、該入力パラメータは、マルチチャネル信号の別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、該量子化方法は、チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいて量子化基準を生成する工程と、生成された量子化基準を使って入力パラメータから量子化パラメータを導き出す工程とを含む。
本発明の第十の様態によれば、この目的は、受信又は音声再生の方法によって実現され、該方法は、パラメータを導出するために、量子化パラメータを逆量子化する方法を含み、該パラメータは、マルチチャネル信号の別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、該逆量子化方法は、チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づいて逆量子化基準を生成する工程と、生成された逆量子化基準を使って量子化パラメータからパラメータを導き出す工程とを含む。
本発明の第十一の様態によれば、この目的は、トラスミッタとレシーバとを備えた通信システムにより実現され、トランスミッタは入力パラメータを量子化するためのパラメータ量子化器を備え、レシーバは量子化パラメータを逆量子化するためのパラメータ逆量子化器を備える。
本発明の第十二の様態によれば、この目的は、送信及び受信の方法によって実現され、該方法は、入力パラメータを量子化する方法を備えた送信方法、及び量子化されたパラメータを逆量子化する方法を備えた受信の方法を含む。
本発明の第十三の様態によれば、この目的は、コンピュータを動作させると、前記の方法の一つを実行するコンピュータプログラムによって実現される。
本発明は、マルチチャネル信号の単独チャネル又はチャネルペアの特性を別の単独チャネル又はチャネルペアに対する指標としたパラメータを用い、該チャネル又はチャネルペアのエネルギー指標とマルチチャネル信号のエネルギー指標との関係に基づき生成された量子化基準を使って、より効率的な量子化ができる、という発見に基づく。
本発明の考え方には、表現する信号のエネルギーに応じて、量子化基準を生成するか、あるいは入手可能な量子化基準群から適切な量子化基準を選定するかを選べるという大きな利点がある。これにより、心理音響学的モデルを適用して実際の信号に対する必要性に適合した量子化基準を使うために、符号化過程においては量子化器に、復号化過程においては逆量子化器に適用することができる。特に、マルチチャネル信号内のあるチャネルが他のチャネルに比べて非常に少ないエネルギーしか包含していない場合、これに対する量子化は、高いエネルギーを持つ信号に対するよりも、ずっと粗くすることができる。これは、再生時に高エネルギー信号が低エネルギー信号をマスクすると言う事実、すなわち、聴取者は、低エネルギー信号の内容をほとんど認識できず、そして、低エネルギー信号への高いマスキングのため聴取者が違いに気付くことなく、低エネルギー信号に対し粗な量子化による劣化ができるという事実による。
本発明の一つの実施形態において、パラメータを量子化するためのパラメータ量子化器は、量子化基準を生成するための量子化基準ジェネレータと、生成された量子化基準を使って入力パラメータから量子化パラメータを導き出すためのバリュー量子化器とを備える。適切な量子化基準を生成するために、量子化器のセレクタは、入力として、符号化対象のマルチチャネル音声信号の全体エネルギー、及び、空間パラメータを量子化する対象のチャネル又はチャネルペアのローカルエネルギーを受信する。全体エネルギー及びローカルエネルギーを知得した量子化算式セレクタは、どの量子化基準を使うか、すなわち、比較的低いローカルエネルギーを持つチャネル又はチャネルペアに対しより粗い量子化基準を選択するかどうかを決定することができる。また、これに換えて、量子化算式セレクタは、ローカル及び全体エネルギーに応じて、既存の量子化基準を変更するために、又は完全に新規の量子化基準を計算するために、アルゴリズムルールを導出する。1つの可能性は、例えば、送信されるサイド情報のサイズを減らす目的を達成するために、線形量子化器または非線形量子化器の前に信号に適用される一般のスケールファクタを算出することである。
本発明のさらなる実施形態において、マルチチャネル信号はペア単位で符号化される、すなわち、各ダウンミキサがそのダウンミキサに入力された2つのチャネルからモノチャネルを生成する、ツリー状構造に配置された2対1ダウンミキサを使って符号化される。本発明の概念によって、エネルギー依存性量子化を、ローカルにおいてだけでなく、すなわち入力中に利用可能な情報を持つ2対1ダウンミキサ各々においてだけでなく、信号エネルギーの和に関する全体的な認識に基づいて実施することができる。これにより、知覚される信号の知覚音質は格段に向上する。
本発明の概念によって、符号化されたマルチチャネル音声信号の音質が、ほとんど影響を与えられずに、サイド情報のサイズを削減することができる。
本発明のさらなる実施形態において、本発明のパラメータ量子化器は、差分エンコーダ及びハフマンエンコーダに前置されたパラメータエンコーダに組み込まれ、後続の2つのエンコーダは、パラメータのビットストリームを生成するために、量子化パラメータをさらに符号化するために使われる。本発明のこのようなエンコーダは、量子化パラメータを表現するために必要な符号ワードのサイズを低減することに加えて、より粗な量子化は、差分エンコーダ及びハフマンエンコーダに供給される同一符号ワードの存在度が自動的に増加し、これにより、量子化パラメータをいっそう圧縮してサイド情報のサイズをさらに低減できるという大きな利点を有する。
本発明のさらなる実施形態において、本発明のパラメータ量子化器は、量子化算式(quantizer)ファクタ関数ジェネレータ及びパラメータ乗算器を備える。量子化算式ファクタ関数ジェネレータは、入力として全体及びローカルのエネルギーを受信し、これら入力量に応じ、一のスケーラ(倍率)値を導き出す。パラメータ乗算器(maltiplier)は、除算変形されたパラメータを量子化器に転送に先立って、パラメータを該量子化算式ファクタで除算するために、パラメータ及び導き出された量子化算式ファクタfを受信する。量子化器は、これら変形されたパラメータに対し固定された量子化基準を適用する。
この実施形態の変形は、量子化器の後にパラメータ除算器を配置し、量子化器から得られた指標を除算するために、導き出された量子化算式ファクタfを使う。この結果に対しては、その後に再び整数指標に丸め直す必要がある。
パラメータにスケーリング(拡大縮小)ファクタを適用することには、相異なる量子化基準を選択するのと同じ効果がある、というのは、例えば、大きなファクタで除算することは、入力パラメータのスペースが効率的に圧縮され、既存の量子化基準のより小さな部分だけで処理できるからである。この処理方法には、デコーダ及びエンコーダ側の追加メモリを節減できるという利点がある、というのは、追加のハードウェア又はソフトウェアをあまり必要としない簡単な乗算によってスケーリングがされるので、一つの量子化基準だけを格納又は処理すればよいからである。さらなる利点は、量子化算式ファクタを用いることによって、何らかの可能な関数依存性を使って、量子化算式ファクタを導き出すことができる。これによって、所与のサンプルに対し、あらかじめ定めた量子化基準を選定するのでなく、全体の可能な入力パラメータ範囲の中で、量子化器又は逆量子化器の感度係数を連続的に調整して行くことができる。
本発明の好適な実施形態を、添付の図面を参照して引き続き説明する。
図1は、本発明のパラメータ量子化器のブロック図を示す。
図2a〜cは、適用可能性のあるいくつかの量子化基準を示す。
図3は、本発明のパラメータ量子化器を備えたパラメータエンコーダの実施形態を示す。
図4a、bは、本発明のパラメータ量子化器を備えたパラメータエンコーダの別の実施形態を示す。
図5は、スケールファクタ関数の例を示す。
図6は、非リニアな量子化基準を示す。
図7は、本発明のパラメータ逆量子化器を示す。
図8は、本発明のパラメータ逆量子化器を備えたパラメータデコンプレッサーを示す。
図9aは、本発明のパラメータ逆量子化器の実施形態を示す。
図9bは、本発明のパラメータ逆量子化器のさらなる実施形態を示す。
図9cは、エネルギー対応逆量子化の実施例を示す。
図9dは、エネルギー対応逆量子化のさらなる実施例を示す。
図9eは、パラメータの量子化及び逆量子化の例を示す。
図10aは、5チャネルのマルチチャネル音声信号の表現を示す。
図10bは、従来技術による階層型パラメトリックマルチチャネルデコーダを示す。
図1は、量子化器200及び量子化算式セレクタ202を有する量子化器199である。量子化算式セレクタ202は、符号化するパラメータの元のチャネル又はチャネルペアのローカルエネルギー及びマルチチャネル音声信号の全体エネルギーを受信する。両方のエネルギー情報に基づいて、量子化算式セレクタ202は、量子化器200に入力するパラメータ206から量子化パラメータ204を導き出すために量子化器200により用いられる量子化基準を生成する。従って、この場合、量子化算式セレクタ202は、量子化基準ジェネレータとして機能する。
量子化算式セレクタ202への入力パラメータは、元となるマルチチャネル信号の全体エネルギー、及び、量子化されるパラメータによって表現されるチャネルのローカルエネルギーである。本発明の好適な実施形態において、ローカルエネルギーと全体エネルギーとの比率が、どの量子化算式を用いるかを決めるため使える指標を与える。例として、この比率q(相対ローカルエネルギー)を、次式を用いてdB単位で計算できる。
Figure 2008517339
選定された量子化算式は、量子化器において、パラメータ206を量子化するために使用される。
本発明は、パラメータ化段階のエネルギーが全体エネルギーに比較して低い、すなわち、相対ローカルエネルギーqが小さい場合には、IID/ICLD(及び同様な特性)に対し、より粗な量子化を用いることができると教示する。本発明は、低重要度/低エネルギーの音声信号よりも、主要な/高いエネルギーの信号を高い精度でパラメータ化することがより重要であるという心理音響学的な関係を利用する。このことをさらに明確にするため、再度、図10aを参照する。サラウンドチャネルは、より小さなエネルギーしか持たないので、元となるマルチチャネル信号における音の情景内で、エネルギー/信号が、主に前面イメージとして、すなわち、左前面チャネル102、中央チャネル103及び右前面チャネル104に存在する場合、サラウンドチャネルについてはより低い精度で量子化することができる。より粗な量子化によりもたらされる付加的量子化誤差は知覚できない、なぜなら、前面のチャネルは、ずっと高いエネルギーを持っており、このためr4の量子化誤差(及び、その結果生じるサラウンドチャネルA及びEのエネルギー誤差)はチャネルB、D、及び/又はCにマスクされるからである。
最も極端な例として、サラウンドチャネルA及びEには、いくつかの微弱なノイズしかなく、前面チャネルB、C、及びDは全振幅の信号を発している。この場合、16ビットの元のPCM信号は、80dBよりも大きなエネルギー差を示す。従って、(粗い)量子化に起因するいかなる違いを聴き取らせることもなく、任意の粗さでパラメータr4を量子化することができる。
図2a〜2cは、量子化誤差の異なったレベルを組み入れた、可能な3つの量子化基準を示す。すべての図は、x軸に元のパラメータを、y軸にそれらパラメータに割り当てられた整数値を示す。さらに、図2a〜2cは、送信又は保存に使える各量子化ステップ指標に対応する点線が示されている。送信された指標は、デコーダ側で使用され、例えば、参照テーブルと組み合わせてこれを逆量子化することができる。
図2aには、量子化カーブ230によって最も細かな量子化が示され、該カーブはx軸を離散的なパラメータ間隔で13の整数値にマップする。図2bでは、量子化カーブ232によって中間的な量子化が行われ、図2cの量子化カーブ234によって最も粗な量子化が行われる。取り込まれる量子化誤差が一番大きいのは図2cに示された例で、最も小さいのが図2aに示された例であることは明らかである。
これら3つの量子化基準は、量子化算式セレクタ202により選択することのできる量子化基準の例である。すなわち、図2a〜cは、3つの異なるリニアな量子化基準を例示したものであり、x軸は入力値を表し、y軸は量子化された対応値を示している。
図2a〜2cのx軸とy軸とは同一の目盛り幅なので、図2aは3つのうち最も細かな量子化となっており、従って量子化誤差は最小となる。図2cは最も粗な量子化であり、したがって、量子化誤差は最大である。また、この基準は、最も少ない量子化ステップ数なので、差分コーディング及びハフマンコーディングの後では最も低いビット率をもたらすことになる。
例として、前に説明したように、ローカルエネルギーと全体エネルギーとの間の相対ローカルエネルギーqに基いて、妥当な量子化基準を生成することができる。対応する量子化基準の選定として、可能なq値の範囲を例として以下の表に要約する。
Figure 2008517339
図3は、本発明のパラメータ量子化器199、差分エンコーダ220、及びハフマンエンコーダ222を備えた本発明のパラメータ圧縮器を示す。図3の本発明のパラメータエンコーダは、差分エンコーダ220に対する入力として、量子化パラメータを使用することによって、図1のパラメータ量子化器を拡張する。差分エンコーダ220は、差分符号化量子化パラメータを導出するために、量子化されたパラメータ204を差分符号化する。差分符号化された量子化パラメータは、ハフマンエンコーダ222に入力する。ハフマンエンコーダ222は、ハフマンコーディングスキームを、出力として最終的なパラメータのビットストリームであるパラメータビットストリームエレメント224を導出する差分符号化量子化パラメータに適用する。
差分エンコーダ及びハフマンエンコーダを有する本発明のパラメータ量子化器の組合せは特に魅力がある、というのは、より粗な量子化は、同じ符号(量子化パラメータ)の存在度を高くするからである。入力符号の使用最大数が、より粗な量子化によって低減される場合、差分エンコーダ220とハフマンエンコーダ222との組合せが、よりコンパクトな量子化パラメータの符号化表現(パラメータビットストリームエレメント224)を明白に提供する。
図4aは、本発明のパラメータ量子化器250、差分エンコーダ252、及びハフマンエンコーダ254を用いた本発明のパラメータエンコーダを示す。
パラメータ量子化器250は、量子化算式ファクタジェネレータ256、パラメータスケーラ258、及び量子化器260を備える。このケースでは、量子化算式ファクタジェネレータ256は、パラメータスケーラ258とともに、量子化基準ジェネレータとしての機能を果たす。
量子化算式関数ジェネレータ256は、入力として、マルチチャネル音声信号の全体エネルギー、及びパラメータ量子化するチャネル又はチャネルペアのローカルエネルギーを受信する。量子化算式ファクタジェネレータ256は、ローカルエネルギー及び全体エネルギーに基づいて、スケールファクタ262(f)を生成する。好適な実施形態において、これは、ローカルエネルギーと全体エネルギーとの間の比率をベースとして行われ、次式により相対ローカルエネルギーを生成する。
Figure 2008517339
量子化算式ファクタf(262)を計算するために、量子化算式ファクタジェネレータ256内で、この比率qが使用され、該ファクタは、パラメータスケーラ258に対する入力として使われ、スケーラは、量子化するパラメータをさらに受信する。
パラメータスケーラ258は、例えば、量子化算式ファクタ262によってパラメータを除算するなどのスケーリングを入力パラメータに適用する。このパラメータのスケーリングは異なる量子化基準を選択することと同等である。スケールされたパラメータは、次いで量子化器260に入力され、本発明のこの実施形態では、該量子化器は固定された量子化基準を適用する。これ以降の量子化パラメータの処理は、図3の処理と同等であり、最終的にパラメータビットストリームエレメントを生成するために、パラメータは差分符号化され、その後ハフマン符号化される。
パラメータにスケーリングファクタを適用することは、量子化基準が連続的なやり方で必要に合わせられるという利点を持っている、というのは、量子化ファクタ262を導き出す解析関数は、基本的にはどのような形式でも取れるからである。
図4bは、本発明のパラメータエンコーダ270のさらなる実施形態を示し、これは図4aで示した本発明のパラメータエンコーダ250と相似である。それゆえ、パラメータエンコーダ250との相違だけを、次の段落で簡潔に説明することにする。
本発明のパラメータエンコーダ270は、パラメータスケーラ(パラメータエンコーダ250のパラメータスケーラ258)を備えない。量子化のエネルギー依存性を実現するため、その代わりに、パラメータ量子化器270は圧縮デバイス272を備える。このことは、このケースでは、量子化算式ファクタジェネレータ256が圧縮デバイス272とともに量子化基準ジェネレータとしての機能を果たすことを意味する。圧縮デバイス272は量子化器260及び量子化算式ファクタジェネレータ256に連結される。圧縮デバイス272は、固定された量子化スキームを使って量子化器260によって量子化された量子化パラメータを入力として、受信する。エネルギー依存性を導入するため、圧縮デバイスは、入力として量子化パラメータを使い、スケールファクタ262を用いて該量子化パラメータのスケール調整をする。これにより、デルタコーダー252に送信する量子化パラメータの可能な限りの数を減少させてビット率を節減する。この圧縮については、例えば、スケーリングファクタ262によって量子化パラメータ指標を除算することによって達成できる。
相対ローカルエネルギー比率qからスケールファクタ262を導き出すための可能な関数が図5に示される。図5は、スケールファクタfを導き出すために使うことの可能な、例として、4つの異なった可能な関数300、302、303、及び304を示す。第一のファクタ関数(factor function)300は、定数関数であり、エネルギー依存性はない。
ファクタ関数302及び304は、ファクタ関数を実行する2つの可能性を示し、ファクタ関数302は、積極性がより低いものであり、従って、ファクタ関数304を使うよりも取り込まれる量子化誤差の増加は少なくなろう。その反面、ファクタ関数302は、ファクタ関数304よりもビット率の削減は少ない。ファクタ関数303は、エネルギー分配率qから量子化算式ファクタを導き出すための第四の可能性を示しており、ファクタ関数303は階段状の形をしていて、これにより、エネルギー分配率qの間隔を、同じパラメータの量子化算式ファクタに割り当てている。
図6は、非均一な量子化算式を例示しており、dB単位におけるx軸上の入力は、y軸上に目盛られたdB単位の出力yを生成するために、関数310によって量子化される。このような非均一な量子化算式関数を、同様に空間パラメータの量子化するために使用することができる。BCCコーディングスキームにおいてマルチチャネル信号内の最強度のチャネルが基準チャネルとして選択された場合、このことは特別な関心事となる。図6に示された非均一な量子化算式は、基準チャネルに比較してエネルギーレベルが低くなるにつれ量子化ステップが増加し、こういった必要性に適するような量子化算式関数310の例示である。これは特に魅力のある特性である、というのは、エネルギーレベル量子化誤差は、最強度のチャネルに対するよりも小さなエネルギーを持つチャネルに対して大きくなりやすいからである。
図7は、逆量子化器502と逆量子化算式セレクタ504とを備えた本発明のパラメータ逆量子化器を示す。逆量子化算式セレクタ504は、マルチチャネル音声信号の全体エネルギー及びチャネル又はチャネルペアのローカルエネルギーを、逆量子化対象の量子化パラメータ505とともに受信する。受信したエネルギー情報に基づいて、逆量子化算式セレクタ504は、量子化パラメータ505を逆量子化するために、逆量子化器502によって使われる逆量子化基準を導き出す。よって、このケースでは逆量子化算式セレクタ504は、逆量子化基準ジェネレータとして機能する。
なお、逆量子化算式セレクタ504は、色々なやり方で動作をさせることができる。第一の可能性は、逆量子化算式セレクタ504が、直接量子化基準を導き出し、導き出した量子化基準を逆量子化器502に転送するものである。別のやり方として、逆量子化算式セレクタ504が、逆量子化基準を指定してこれを逆量子化器502に転送し、逆量子化器は、例えば、該逆量子化器502中に格納された、いくつかの量子化基準の中から適正な逆量子化基準を選定するために、その逆量子化基準指定を用いることができる。
図8は、パラメータ逆量子化器500、差分デコーダ510、及びハフマンデコーダ512を備えた本発明のパラメータデコーダである。
ハフマンデコーダ512は、パラメータビットストリームエレメント513を受信し、これに関連して、逆量子化算式セレクタ504は、パラメータビットストリームエレメント513によって表現されているチャネル又はチャネルペアのエネルギーと、マルチチャネル音声信号の全体エネルギーとを受信する。パラメータビットストリームエレメント513は、図3に示すように、本発明のエンコーダにより生成される。それ故に、パラメータビットストリームエレメント513は、逆量子化器502に供給される前に、ハフマンデコーダ512によってハフマン復号化され、差分デコーダ510によって差分復号化される。ハフマンデコーダ512及び差分デコーダ510による復号化の後、図7の本発明のパラメータの説明で既に述べたように、本発明のパラメータ逆量子化器500によって逆量子化が実行される。
すなわち、図8は、エネルギー依存性逆量子化器500を例示したものであり、本デコーダは本発明のエンコーダに対応する。パラメータビットストリームエレメントは、ハフマン復号化され、差分復号化されて指標に変換される。入力として全体エネルギー及びローカルエネルギーと共に、エンコーダ内で使用されたのと同様な基準及び関数を用いて、逆量子化算式セレクタ504中で適正な逆量子化算式が選定される。選定された逆量子化算式が、指標を逆量子化パラメータに逆量子化(逆量子化器502を用いて)するために使われる。
図9aは、本発明のパラメータデコーダのさらなる実施形態を示し、該デコーダは、本発明のエネルギー依存性逆量子化器520、ハフマンデコーダ512及び差分デコーダ510を備える。パラメータ逆量子化器520は、逆量子化算式ファクタジェネレータ522、逆量子化器524、及びパラメータスケーラ526を含む。このケースでは、逆量子化算式ファクタジェネレータ522は、パラメータスケーラ526とともに逆量子化基準ジェネレータとしての機能を果たしている。
ハフマンデコーダ及び差分デコーダによってパラメータビットストリームエレメント513が復号化された後、量子化パラメータは、逆量子化器524によって逆量子化され、その際、逆量子化器524は、該量子化パラメータを生成するために用いられた量子化基準に合致する逆量子化基準を使用する。逆量子化算式ファクタジェネレータ522は、ローカルエネルギーとマルチチャネル音声信号の全体エネルギーとの比率からスケールファクタ528(f)を導き出す。次いでパラメータスケーラ526は、スケールファクタ528を逆量子化パラメータに乗算することによって、該スケールファクタを逆量子化パラメータに適用する。
パラメータスケーラ526によるスケーリングの後、本発明のパラメータデコーダの出力においてデコンプレッションされた逆量子化パラメータが得られる。
図9bは、本発明のパラメータデコーダ530のさらなる実施形態を示し、これは本発明のパラメータデコーダ520と相似である。よって、パラメータデコーダ520との違いだけが、次の段落で詳述される。
本発明のパラメータデコーダ530は、デコンプレッサー(decompressor)532を有し、デコンプレッサー532は、本発明のパラメータデコーダ520におけるパラメータスケーラ526として同様な機能を達成するものを生じる。デコンプレッサー532は、入力として量子化パラメータを受信し、さらなる入力として、ファクタジェネレータ522からスケールファクタ528を受信する。このことは、このケースでは、ファクタジェネレータ522は、デコンプレッサー532とともに逆量子化基準ジェネレータとしての機能を果たしていることを意味する。エネルギー加重された逆量子化の機能性を実行するために、量子化パラメータは、デコンプレッサー532によってスケール調整された後、こうしてスケール調整された量子化パラメータは逆量子化器524に入力される。次いで逆量子化器524は、固定された逆量子化基準を用いて逆量子化パラメータを導き出すために、スケール調整された量子化パラメータを逆量子化する。このデコンプレッションは、例えば、量子化パラメータ指標にスケールファクタ528とを乗算することによって達成できる。
符号化及び復号化におけるパラメータスケーラ258及びパラメータスケーラ526のスケーリングは、符号化の際は除算であり、復号化の際は乗算であると説明しているが、符号化及び復号化に当たってはパラメータに適用される各種量子化基準を使うに際して、他の任意の種類のスケーリングは、同様な効果を有する。
なお、図10bに例示したような積み重ね型パラメータ化(階層的復号化又は符号化)のケースにおいて、デコーダ装置は、エネルギー配分をルート(ダウンミックスチャネル)からリーフに復号化できるので、各パラメータ化r1〜r4(2チャネルデコーダ122、124、126、及び128)のローカルエネルギーは明確になっており、これをデコーダ側のローカルエネルギーとして使用することができる。さらに、エンコーダも、ルートからリーフへの量子化をすれば、全く同じローカルエネルギーを、量子化セレクタ及び量子化算式ファクタ関数に対するローカルエネルギーとしてエンコーダで使用することができる。
すなわち、全体エネルギー及びローカルエネルギー情報を用いて、どの逆量子化基準を使うかをデコーダが自立的に決定するようにできる。あるいはこれに換えて、対象パラメータを逆量子化するにはどの逆量子化基準が適切かを何らかの追加サイド情報によって、デコーダに合図することもできる。
本発明の別々の実施形態で説明しているが、スケールファクタの適用と、適切な逆量子化基準の選定とが、本発明のエンコーダ又はデコーダの一つの実施形態の中で組み合わせることもできる。
もっと詳細な例として、付加送信されてきた空間パラメータ(CLD、ICC)を使って、送信されたモノラル信号Mからマルチチャネル信号を再構成するための、エネルギー依存性逆量子化を実行する2つの可能な方式を図9c及び9dが示される。これらの図を説明する前に、これら図に示されたツリー状の構造は、空間パラメータの再構成のためだけに重要なのであり、マルチチャネル信号の個別チャネル生成のための実際の混合分離は、通常、単一のステップ内で実施される。
図9cは、パラメータCLDは、元となる信号のいくつかのチャネルを用いて組み合わされたチャネルの間のエネルギー配分をパラメータCLD0が表現するように導き出される。
第一の階層的アップミックス段階1000において、CLD0は、2つのチャネルの間のエネルギー関係を表現し、そのうちの第一チャネルは、前面左、前面右、中央、及び低周波増強チャネルの組合せ1002である。第二チャネルは、背面左及び背面右チャネルの組合せである。すなわち、パラメータCLD0は、全ての背面チャネルと全ての前面チャネルとの間のエネルギー配分を表現する。
従って、CLD0によって、背面チャネルにはわずかなエネルギーしか包含されていないことを示させば、背面左と背面右チャネルとの間の空間特性を表現するパラメータがより強く量子化されることは明らかである、というのは、全てのチャネルが同時に再生された場合、粗い量子化によって追加的に取り込まれる歪みは、ほとんど聞き取ることができないからである。
実際の逆量子化を実行する前に、図9bに示す本発明のパラメータ逆量子化器は、例えば、逆量子化するパラメータにパラメータ指標を乗算して逆量子化を実施するために、スケールファクタ528を計算する。従って、パラメータCLD0が送信されれば、例えば図9bのデコーダを使用している場合、後記の式によって、他の階層ステップで最終的に使われるCLDパラメータを計算することができる。
以下の記載において、用語「DEQ」は、手順DEQに与えられたパラメータに対し固定された逆量子化テーブルを適用することを表す。これは、送信されたパラメータIDX CLD(0,L)を、次の式で示すように、直接逆量子化できることを意味する。
Figure 2008517339
CLDパラメータは、2つのチャネルの間のエネルギー配分を表しており、これらチャネルは、図9cに示すようにチャネルの組合せなので、ここで以下の式により、相対ローカルエネルギーFCを求めることができる。
Figure 2008517339
従って、背面チャネルの相対ローカルエネルギーは次のようになる。
Figure 2008517339
次に、前記式及び本発明の概念により、組合せ信号1002において包含される全体的エネルギーを取り入れてCLD1を次のように計算できる。
Figure 2008517339
前式の表現「facFunc」は、相対ローカルエネルギーFCに関係なく、実値を与える関数を表す。すなわち、式4は、逆量子化の前に、送信されたパラメータ指標IDX CLD(1,1,m)は、中間的な量子化パラメータを導き出すために、スケールファクタ(facFunc)を乗算しことを表現する。中間的な量子化パラメータは整数値とは限らないので、IdxCLDEdQを導き出すために、中間的な量子化パラメータを丸めなければならない。次いでこれが、次の演算に用いる最終的なパラメータに逆量子化される。
Figure 2008517339
逆量子化は、例えば次表のような、標準逆量子化テーブルを使って行われる。
Figure 2008517339
得られたパラメータCLD1は、第二階層ステップ1004におけるチャネル分離から分かるように、前面左及び前面右チャネルを組み合わせたチャネルと、中央及び低周波増強チャネルを組み合わせたチャネルとの間のエネルギー関係を表現する。このような、前面左と前面右とによる前面チャネルに包含されるエネルギーを表現する相対ローカルエネルギーFを、次式により計算することができる。
Figure 2008517339
前記で、階層ボックス1006に対する中間的な量子化パラメータIDX CLD EDQを次式によって計算できるとして、背面チャネルのエネルギーを表現する相対ローカルエネルギーSを求めた。
Figure 2008517339
前記の処理により、前面チャネルのエネルギーだけを表現する相対ローカルエネルギー(F5151)が得られたので、今度は次式によって、前面左と前面右チャネルとの間の関係を表すパラメータCLD3を、エネルギー依存的方法で求めることができる。
Figure 2008517339
一つの可能な実施例において、中央チャネルと低周波増強チャネルとの間のエネルギー関係を表すパラメータCAD4を、ファクタ関数を使わないで求めることができる。
Figure 2008517339
また、別の実施形態において、当然のことながら、パラメータCAD4の導出においてもエネルギー依存性を導入することは可能である。
図9dは、空間パラメータの導出に対して階層的に設定する別の可能例を示す。
図9cと同様に、個別のCLDパラメータは、以下の式によって求められる。
Figure 2008517339
Figure 2008517339
なお、例えば、図5に示した関数の一つとして、本発明の構想を導入するために、異なるファクタ関数が使われる。
前述したように、概して言えば、本発明の概念は、他の信号部分比べて相対的に低いエネルギーしか包含していない信号部分のパラメータ(CLD)がより粗い方法で量子化されると言う意味でのエネルギー依存の量子化を用いることである。すなわち、ファクタ関数は、低エネルギー成分音に対しては適用ファクタが大きくなるような関数としなければならない。
これをもっと詳細に説明するため、図9eに一例を示すが、これは、符号化及び復号化過程での乗算を示し、本発明の概念をさらに進んで提示するものである。参照は、提示される実施例を算出するために、前記で示した量子化テーブルに、さらになされる。
表9dの左列1100には、量子化器側での量子化指標の乗算を示し、列1102には、逆量子化器側の送信されたパラメータの再構成示す。送信されたパラメータは、列1104に示される。相対的に低いエネルギーを持つチャネルの組合せの2つの例が示されている。これは、共通のスケールファクタ4.5によって示され、このスケールファクタは1よりも相当大きい(図4参照)。本発明の概念に従って、量子化指標IDXは、量子化器側での量子化の後、スケールファクタで除算される。次いで、得られた結果は整数値に丸められ、差分及びハフマン符号化される(図4a参照)。従って、指標例10及び9は、双方とも送信指標2のIDXtransmとなる。
逆量子化器は、逆量子化に使用される再構成された指標IDXrekを導出するために、送信された指標にスケールファクタを乗じる。量子化器側の最初の例の指標10に見られるように、量子化器側における除算された指標の丸めに起因して1の追加誤差が生じている。他方、量子化器側でのスケールファクタによる除算結果が、偶然に整数値の指標IDXtransmになった場合には、追加誤差は発生しない。
明らかに、スケールファクタfを大きくするに従って、追加誤差が生じる危険は大きくなる。このことは、低エネルギーの信号に加わる追加誤差の確率がかなり高いことを意味する。問題となっているCLDパラメータによって表現される信号が比較的均等なエネルギーを有する場合には、CLD値は1に近くなり、スケールファクタもそのようになる。(例えば、図5参照)。このことは、パラメータがエネルギー依存的やり方で符号化されているチャネルにおおむね同等なエネルギーを割り当てられている場合には、通常、量子化においてこれらチャネルに追加誤差が生じることはない、ということを意味している。これは、当然ながら非常に都合が良いことである、というのは、マルチチャネル信号内のあらゆるチャネルがおおむね同等なエネルギーを持つ場合、同時再生においてあらゆる単一のチャネルが可聴であり、従って、取り込まれた誤差は、聴取者に明瞭に聞き分けられるからである。
相対的に低いエネルギーを有するチャネルに対して誤差が容認されるだけであることは、明らかに、本発明の非常に大きな利点である。他方、これらのチャネルについて、関連するパラメータの指標を何らかの大きな数で除算することによって、これらチャネルの指標値は平均してゼロに近くなる。このことは、マルチチャネル信号の送信されるパラメータのため費やされるビット率を効率的に削減するために、後続する差分符号化及びハフマン符号化処置において徹底的に利用される。
使用する逆/量子化基準を決める基礎となるローカルエネルギーと全体エネルギーとの関係は、先の段落では対数尺度で表されている。当然のことながら、これだけが、本発明の概念を実現するために使うことのできる尺度ではない。例えば明白な差のような、ローカルエネルギー又は全体エネルギー間のエネルギー差異を表す他の任意の尺度が、決定させるために用いられる
本発明の別の重要な特質は、典型的には、例えばCLDのようなパラメータの制御によって入ってくるエネルギーを2つの出力チャネルに配分する(入ってくるエネルギーが2つの出力チャネルのエネルギーの和に等しいことになる)2チャネルデコーダ(PS)と組合せて、エネルギーにおける差異、すなわち、各2チャネルデコーダ(122、124、126、及び128)に対する全体エネルギーとローカルエネルギーとの間の「相対ローカルエネルギー」は、CLDパラメータによって定義される。このことは、全体エネルギー及びローカルエネルギーを実際に測定する必要はないことを意味する、というのは、スケールファクタを計算するために通常使われるdB単位のエネルギー差がCLDパラメータによって定義されるからである。
本発明の方法の特定の実施要件によるが、本発明の方法を、ハードウェアまたはソフトウェアで実施することができる。本発明の方法を実行するプログラム可能コンピュータシステムと協働する、デジタル記憶媒体、特に、電気的に読み取り可能な制御信号を格納されたディスクまたはCDを用いることにより、実施することができる。一般に、本発明は、機械読み取り可能キャリアに格納したプログラムコードを有するコンピュータプログラム製品である。コンピュータプログラム製品をコンピュータ上で実行する場合は、プログラムコードは、本発明の方法を実行する。換言すれば、従って、本発明の方法は、コンピュータプログラムをコンピュータ上で実行する場合は、少なくとも1つの本発明の方法を実行するプログラムコードを有するコンピュータプログラムである。
前述のように、特定の実施の形態を参照して特に図示して説明してきたが、本発明の精神、範囲を逸脱することなく、形態や詳細を様々変更することができることが、当業者ならば理解できるであろう。ここに開示するより広い概念から逸脱することなく、異なる実施の形態に適用して、変更が可能なことが、以下の特許請求の範囲から理解できるであろう。
本発明のパラメータ量子化器のブロック図を示す。 適用可能性のあるいくつかの量子化基準を示す。 適用可能性のあるいくつかの量子化基準を示す。 適用可能性のあるいくつかの量子化基準を示す。 本発明のパラメータ量子化器を備えたパラメータエンコーダの実施形態を示す。 本発明のパラメータ量子化器を備えたパラメータエンコーダの別の実施形態を示す。 本発明のパラメータ量子化器を備えたパラメータエンコーダの別の実施形態を示す。 スケールファクタ関数の例を示す。 非リニアな量子化基準を示す。 本発明のパラメータ逆量子化器を示す。 本発明のパラメータ逆量子化器を備えたパラメータデコンプレッサーを示す。 本発明のパラメータ逆量子化器の実施形態を示す。 本発明のパラメータ逆量子化器のさらなる実施形態を示す。 エネルギー対応逆量子化の実施例を示す。 エネルギー対応逆量子化のさらなる実施例を示す。 パラメータの量子化及び逆量子化の例を示す。 5チャネルのマルチチャネル音声信号の表現を示す。 従来技術による階層型パラメトリックマルチチャネルデコーダを示す。

Claims (44)

  1. 入力パラメータを量子化するためのパラメータ量子化器であって、前記入力パラメータは、マルチチャネル信号の別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、
    前記チャネル又は前記チャネルペアのエネルギー指標と前記マルチチャネル信号のエネルギー指標との関係に基づいて量子化基準を生成するための量子化基準ジェネレータと、
    前記生成された量子化基準を用いて、前記入力パラメータから量子化されたパラメータを導き出すためのバリュー量子化器とを含む、
    パラメータ量子化器。
  2. 前記量子化基準ジェネレータは、低いエネルギー指標を有するチャネル又はチャネルペアに対しては、高いエネルギー指標を有するチャネル又はチャネルペアに対するよりも、量子化が粗になるような前記量子化基準を生成するよう機能する、請求項1に記載のパラメータ量子化器。
  3. 前記量子化基準ジェネレータは、2つ以上のあらかじめ定めた量子化基準から一つの量子化基準を選択するよう機能する、請求項1に記載のパラメータ量子化器。
  4. 前記量子化基準ジェネレータは、前記チャネル又は前記チャネルペアの前記エネルギー指標と前記マルチチャネル信号の前記エネルギー指標との関係に基づいて、新規の量子化基準を計算するよう機能する、請求項1に記載のパラメータ量子化器。
  5. 前記量子化基準ジェネレータは、前記量子化基準の前記計算がスケールファクタの計算を含めるよう機能する、請求項4に記載のパラメータ量子化器。
  6. 前記スケールファクタを使って前記入力パラメータを変形するためのパラメータスケーラをさらに含む、請求項5に記載のパラメータ量子化器。
  7. 前記パラメータスケーラは、前記変形が、前記スケールファクタによって前記入力パラメータを除算することが含まれるように、前記入力パラメータを変形するよう機能する、請求項6に記載のパラメータ量子化器。
  8. 圧縮デバイスをさらに含み、
    前記パラメータ量子化器は、所定の量子化基準を用いて、中間的な量子化パラメータを導き出すよう機能し、
    前記圧縮デバイスは、前記中間量子化パラメータと前記スケールファクタとを使って、前記量子化パラメータを導き出すよう機能する、
    請求項5に記載のパラメータ量子化器。
  9. 前記量子化基準ジェネレータは、前記入力パラメータに対する前記量子化基準の適用が、所定の入力パラメータ範囲内の全ての入力パラメータに対し同一の量子化パラメータを割り当てることが含むようにして量子化基準を生成するよう機能する、
    請求項1に記載のパラメータ量子化器。
  10. 前記入力パラメータは、前記マルチチャネル音声信号の空間的知覚を表現する空間パラメータであり、前記入力パラメータは、以下のパラメータリスト:
    チャネル間相関/コヒーレンス(ICC)、
    チャネル間レベル/強度差(ICLD又はIID)、
    チャネル間位相差(IPD)、及び
    チャネル間時間差(ICTD)
    から選択される、請求項1に記載のパラメータ量子化器。
  11. 差分エンコーダ及びハフマンエンコーダをさらに含み、
    前記差分エンコーダは、前記量子化パラメータの差分符号化した表現を導き出すよう機能し、
    前記ハフマンエンコーダは、前記差分符号化表現のハフマン符号化した表現を導き出すよう機能する、
    請求項1に記載のパラメータ量子化器。
  12. パラメータを導き出すために量子化パラメータを逆量子化するためのパラメータ逆量子化器であって、前記パラメータは、マルチチャネル信号の、別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であって、
    前記単独チャネル又は前記チャネルペアのエネルギー指標と前記マルチチャネル信号のチャネル群から導き出されるエネルギー指標との関係に基づいて逆量子化基準を生成するための逆量子化基準ジェネレータと、
    前記生成された逆量子化基準を用いて、前記量子化パラメータから前記パラメータを導き出すためのバリュー逆量子化器とを
    含む、パラメータ逆量子化器。
  13. 前記逆量子化基準ジェネレータは、前記チャネル又は前記チャネルペアを有さないチャネルの組合せから導き出された、前記マルチチャネル信号のチャネル群から導き出されるエネルギー指標を使うよう機能する、請求項12に記載のパラメータ逆量子化器。
  14. 前記逆量子化基準ジェネレータは、低いエネルギー指標を有するチャネル又はチャネルペアに対しては、高いエネルギー指標を有するチャネル又はチャネルペアに対するよりも、逆量子化が粗になるような前記逆量子化基準を生成するよう機能する、請求項12に記載のパラメータ逆量子化器。
  15. 前記逆量子化基準ジェネレータは、メモリに格納された2つ以上の固定逆量子化基準から一つの逆量子化基準を選択するよう機能する、請求項12に記載のパラメータ逆量子化器。
  16. 前記逆量子化基準ジェネレータは、前記チャネル又は前記チャネルペアの前記エネルギー指標と前記マルチチャネル信号のチャネル群から導き出される前記エネルギー指標との関係に基づいて、前記新規の逆量子化基準を計算するよう機能する、請求項12に記載のパラメータ逆量子化器。
  17. 前記量子化基準ジェネレータは、前記量子化基準の前記計算がスケールファクタの計算を含むよう機能する、請求項12に記載のパラメータ逆量子化器。
  18. 前記スケールファクタを使って前記パラメータを変形するためのパラメータスケーラをさらに含む、請求項17に記載のパラメータ逆量子化器。
  19. 前記パラメータスケーラは、前記変形が前記スケールファクタにより前記パラメータに乗算することを含むようにして、前記パラメータを変形するよう機能する、請求項17に記載のパラメータ逆量子化器。
  20. 前記逆量子化基準ジェネレータは、前記スケールファクタを使って、前記量子化パラメータから中間的な量子化パラメータを得るためのデコンプレッサーをさらに含み、
    前記バリュー逆量子化器は、固定された逆量子化基準を使って、前記中間的な量子化パラメータから前記パラメータを導き出すよう機能する、
    請求項17に記載のパラメータ逆量子化器。
  21. 前記デコンプレッサーは、前記スケールファクタと前記量子化パラメータとの乗算によって前記中間的な量子化パラメータを導き出すよう機能する、請求項20に記載のパラメータ逆量子化器。
  22. 前記逆量子化基準ジェネレータは、前記中間的な量子化パラメータから整数化された中間的な量子化パラメータ得るための丸め器をさらに含み、
    前記バリュー逆量子化器は、固定された逆量子化基準を使って、前記整数値化された中間的な量子化パラメータから前記パラメータを導き出すよう機能する、
    請求項20に記載のパラメータ逆量子化器。
  23. 前記量子化パラメータは、左前面チャネル及び右前面チャネルの組合せと、中央チャネル及び低周波増強チャネルの組合せとの間のエネルギー関係に対する指標であり、
    前記エネルギー指標は、前記前面左及び前記前面右チャネルを組み合わせた第一チャネルと、前記中央チャネル及び前記低周波増強チャネルを組み合わせた第二チャネルとを有するチャネルペアに対するエネルギー指標であり、
    前記マルチチャネル信号のチャネル群から導き出された前記エネルギー指標は、背面左と背面右チャネルとの組合せから得られたエネルギー指標である、
    請求項12に記載のパラメータ逆量子化器。
  24. 前記量子化パラメータは、背面左と背面右チャネルとの間のエネルギー関係に対する指標であり、
    前記エネルギー指標は、前記背面左と前記背面右チャネルとを有するチャネルペアに対するエネルギー指標であり、
    前記マルチチャネル信号のチャネル群から導き出された前記エネルギー指標は、左前面と右前面と中央と低周波増強チャネルとの組合せから得られたエネルギー指標である、
    請求項12に記載のパラメータ逆量子化器。
  25. 前記量子化パラメータは、前面左と前面右チャネルとの間のエネルギー関係に対する指標であり、
    前記エネルギー指標は、前記前面左と前記前面右チャネルとを有するチャネルペアに対するエネルギー指標であり、及び
    前記マルチチャネル信号のチャネル群から導き出された前記エネルギー指標は、中央チャネルと低周波増強チャネルとの組合せから得られたエネルギー指標である、
    請求項12に記載のパラメータ逆量子化器。
  26. 前記量子化パラメータは、左前面及び左背面チャネルの組み合わせと、右前面及び右背面チャネルの組み合わせとの間のエネルギー関係に対する指標であり、
    前記エネルギー指標は、前記左前面及び前記左背面チャネルを組み合わせた第一チャネルと、前記右前面及び前記右背面チャネルを組み合わせた第二チャネルとを有するチャネルペアに対するエネルギー指標であり、
    前記マルチチャネル信号のチャネル群から導き出された前記エネルギー指標は、中央チャネルと低周波増強チャネルとの組合せから得られたエネルギー指標である、
    請求項12に記載のパラメータ逆量子化器。
  27. 請求項12によるパラメータ逆量子化器であって、前記量子化パラメータは、左前面と左背面チャネルとの間のエネルギー関係に対する指標であり、
    前記エネルギー指標は、前記左前面と前記左背面チャネルとを有するチャネルペアに対するエネルギー指標であり、
    前記マルチチャネル信号のチャネル群から導き出された前記エネルギー指標は、右前面と右背面チャネルとの組合せから得られたエネルギー指標である、
    請求項12に記載のパラメータ逆量子化器。
  28. 前記量子化パラメータは、右前面と右背面チャネルとの間のエネルギー関係に対する指標であり、
    前記エネルギー指標は、前記右前面と前記右背面チャネルとを有するチャネルペアに対するエネルギー指標であり、
    前記マルチチャネル信号のチャネル群から導き出された前記エネルギー指標は、左前面と左背面チャネルとの組合せから得られたエネルギー指標である、
    請求項12に記載のパラメータ逆量子化器。
  29. 前記逆量子化基準ジェネレータは、前記量子化パラメータに対する前記逆量子化基準の適用工程が、前記量子化パラメータにパラメータを割り当てる工程を含むように、逆量子化基準を生成するよう機能する、請求項12に記載のパラメータ逆量子化器。
  30. 差分デコーダ及びハフマンデコーダをさらに含み、
    前記ハフマンデコーダは、受信されたハフマン符号化表現からハフマン復号化表現を導き出すよう機能し、
    前記差分デコーダは、前記ハフマン復号化表現から前記量子化パラメータを導き出すよう機能する、
    請求項12に記載のパラメータ逆量子化器。
  31. 前記パラメータは、前記マルチチャネル音声信号の空間的知覚を表現する空間パラメータであり、前記入力パラメータは、以下のパラメータリスト:
    チャネル間相関/コヒーレンス(ICC)、
    チャネル間レベル/強度差(ICLD又はIID)、
    チャネル間位相差(IPD)、及び
    チャネル間時間差(ICTD)
    から選択される、請求項12に記載のパラメータ逆量子化器。
  32. 入力パラメータを量子化するための方法であって、前記入力パラメータは、マルチチャネル信号の、別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、前記方法は、
    前記チャネル又は前記チャネルペアのエネルギー指標と前記マルチチャネル信号のエネルギー指標との関係に基づいて量子化基準を生成する工程と、
    前記生成された量子化基準を用いて、前記入力パラメータから量子化されたパラメータを導き出す工程とを
    含む、方法。
  33. パラメータを導き出すために量子化パラメータを逆量子化する方法であって、前記パラメータは、マルチチャネル信号の、別の単独チャネル又はチャネルペアに対する単独チャネル又はチャネルペアの特性の指標であり、
    前記チャネル又は前記チャネルペアのエネルギー指標と前記マルチチャネル信号のエネルギー指標との関係に基づいて逆量子化基準を生成する工程と、
    前記生成された逆量子化基準を用いて、前記量子化パラメータから前記パラメータを導き出す工程とを
    含む、方法。
  34. 単独チャネル又はチャネルペアの特性に対する指標であるパラメータを量子化表現している量子化パラメータを含有するマルチチャネル信号表現であって、前記パラメータは、マルチチャネル信号の、別の単独チャネル又はチャネルペアに対する前記単独チャネル又は前記チャネルペアの特性の指標であり、前記量子化パラメータは、前記チャネル又は前記チャネルペアのエネルギー指標と前記マルチチャネル信号のエネルギー指標との関係に基づいた量子化基準を使って導き出される、信号表現。
  35. 請求項34に記載のマルチチャネル信号の表現を格納した、記憶媒体。
  36. 請求項1に記載のパラメータ量子化器を有する、トランスミッタ又は音声レコーダ。
  37. 請求項12に記載の逆量子化器を有する、レシーバ又はオーディオプレーヤ。
  38. 請求項32に記載の量子化する方法を含む方法である、送信または音声レコーディング方法。
  39. 請求項33に記載の逆量子化する方法を有する方法である、受信又は音声再生方法。
  40. 請求項1に記載のパラメータ量子化器を有するトランスミッタ及び請求項12に記載のパラメータ逆量子化器を有するレシーバである、前記トランスミッタおよび前記レシーバを有する通信システム。
  41. 請求項32に記載の量子化する方法を有する送信方法および請求項33に記載の逆量子化する方法を有する受信方法を含む方法である、送信及び受信の方法。
  42. コンピュータ上で動作して、請求項32、請求項33、請求項38、請求項39、又は請求項41のいずれかによる方法を実行するためのコンピュータプログラム。
  43. マルチチャネル信号を再構成したものを生成するための、マルチチャネルデコーダであって、
    請求項12に記載のパラメータ逆量子化器と、
    前記パラメータ逆量子化器によって逆量子化されたパラメータを使って、送信されたダウンミックス信号から前記マルチチャネル信号を前記再構成したものをアップミックスするためのアップミキサとを
    含むデコーダ。
  44. マルチチャネル信号の符号化された表現を生成するためのマルチチャネルエンコーダであって、
    請求項1に記載のパラメータ量子化器と、
    前記量子化器によって量子化されたパラメータを使って、前記マルチチャネル信号からダウンミックス信号を生成するためのダウンミキサであって、前記ダウンミックス信号は前記マルチチャネル信号よりも少数のチャネルを有する、ダウンミキサとを
    含むエンコーダ。
JP2007537308A 2005-04-19 2006-04-10 空間音声パラメータの効率的符号化のためのエネルギー対応量子化 Active JP4521032B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US67294305P 2005-04-19 2005-04-19
PCT/EP2006/003284 WO2006111294A1 (en) 2005-04-19 2006-04-10 Energy dependent quantization for efficient coding of spatial audio parameters

Publications (2)

Publication Number Publication Date
JP2008517339A true JP2008517339A (ja) 2008-05-22
JP4521032B2 JP4521032B2 (ja) 2010-08-11

Family

ID=36581679

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007537308A Active JP4521032B2 (ja) 2005-04-19 2006-04-10 空間音声パラメータの効率的符号化のためのエネルギー対応量子化

Country Status (15)

Country Link
US (1) US8054981B2 (ja)
EP (1) EP1754222B1 (ja)
JP (1) JP4521032B2 (ja)
KR (1) KR100878371B1 (ja)
CN (1) CN1993733B (ja)
AT (1) ATE378675T1 (ja)
BR (1) BRPI0605857A (ja)
DE (1) DE602006000239T2 (ja)
ES (1) ES2297825T3 (ja)
HK (1) HK1095993A1 (ja)
MY (1) MY141427A (ja)
PL (1) PL1754222T3 (ja)
RU (1) RU2376655C2 (ja)
TW (1) TWI327306B (ja)
WO (1) WO2006111294A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009518659A (ja) * 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置
JP2012023540A (ja) * 2010-07-14 2012-02-02 Asahi Kasei Electronics Co Ltd マルチビットデルタシグマ変調器及びadコンバータ
JP2016524191A (ja) * 2013-06-17 2016-08-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 異なる信号次元からのパラメータ・ベクトルの多段階量子化
JP2017503214A (ja) * 2014-01-13 2017-01-26 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
CN113678199A (zh) * 2019-03-28 2021-11-19 诺基亚技术有限公司 空间音频参数的重要性的确定及相关联的编码
JP2022509440A (ja) * 2018-10-31 2022-01-20 ノキア テクノロジーズ オーユー 空間オーディオパラメータの符号化及び対応する復号の決定

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8768691B2 (en) * 2005-03-25 2014-07-01 Panasonic Corporation Sound encoding device and sound encoding method
KR20080071971A (ko) * 2006-03-30 2008-08-05 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
WO2008069584A2 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
JP5404412B2 (ja) * 2007-11-01 2014-01-29 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2009125046A1 (en) * 2008-04-11 2009-10-15 Nokia Corporation Processing of signals
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
JP5752134B2 (ja) * 2009-10-15 2015-07-22 オランジュ 最適化された低スループットパラメトリック符号化/復号化
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
KR20120038311A (ko) * 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
PL2740222T3 (pl) 2011-08-04 2015-08-31 Dolby Int Ab Usprawniony stereofoniczny radiowy odbiornik FM poprzez użycie stereo parametrycznego
EP2702587B1 (en) 2012-04-05 2015-04-01 Huawei Technologies Co., Ltd. Method for inter-channel difference estimation and spatial audio coding device
CN104509130B (zh) * 2012-05-29 2017-03-29 诺基亚技术有限公司 立体声音频信号编码器
US9380317B2 (en) * 2012-10-08 2016-06-28 Qualcomm Incorporated Identification of operation points applicable to nested SEI message in video coding
US9544566B2 (en) 2012-12-14 2017-01-10 Qualcomm Incorporated Disparity vector derivation
CN116665683A (zh) 2013-02-21 2023-08-29 杜比国际公司 用于参数化多声道编码的方法
KR102072365B1 (ko) * 2013-04-05 2020-02-03 돌비 인터네셔널 에이비 고급 양자화기
US9821908B2 (en) * 2013-06-07 2017-11-21 Bell Helicopter Textron Inc. System and method for assisting in rotor speed control
US9530422B2 (en) 2013-06-27 2016-12-27 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
TWI579831B (zh) 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
RU2696952C2 (ru) * 2014-10-01 2019-08-07 Долби Интернешнл Аб Аудиокодировщик и декодер
EP3201918B1 (en) * 2014-10-02 2018-12-12 Dolby International AB Decoding method and decoder for dialog enhancement
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
ES2938244T3 (es) * 2016-11-08 2023-04-05 Fraunhofer Ges Forschung Aparato y procedimiento para codificar o decodificar una señal multicanal usando una ganancia lateral y una ganancia residual
GB2574239A (en) * 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
GB2595883A (en) * 2020-06-09 2021-12-15 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003337598A (ja) * 2002-05-20 2003-11-28 Sony Corp 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
JP2004535145A (ja) * 2001-07-10 2004-11-18 コーディング テクノロジーズ アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化
JP2005533426A (ja) * 2002-07-12 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符合化方法
JP2006528482A (ja) * 2003-07-24 2006-12-21 キアゲン ゲゼルシャフト ミット ベシュレンクテル ハフツング 核酸の逆転写及び/または増幅方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU642540B2 (en) 1990-09-19 1993-10-21 Philips Electronics N.V. Record carrier on which a main data file and a control file have been recorded, method of and device for recording the main data file and the control file, and device for reading the record carrier
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
EP1451809A1 (en) * 2001-11-23 2004-09-01 Koninklijke Philips Electronics N.V. Perceptual noise substitution
JP4431568B2 (ja) 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004535145A (ja) * 2001-07-10 2004-11-18 コーディング テクノロジーズ アクチボラゲット 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化
JP2003337598A (ja) * 2002-05-20 2003-11-28 Sony Corp 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
JP2005533426A (ja) * 2002-07-12 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符合化方法
JP2004309921A (ja) * 2003-04-09 2004-11-04 Sony Corp 符号化装置、符号化方法及びプログラム
JP2006528482A (ja) * 2003-07-24 2006-12-21 キアゲン ゲゼルシャフト ミット ベシュレンクテル ハフツング 核酸の逆転写及び/または増幅方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009518659A (ja) * 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置
JP2012023540A (ja) * 2010-07-14 2012-02-02 Asahi Kasei Electronics Co Ltd マルチビットデルタシグマ変調器及びadコンバータ
JP2016524191A (ja) * 2013-06-17 2016-08-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 異なる信号次元からのパラメータ・ベクトルの多段階量子化
JP2017503214A (ja) * 2014-01-13 2017-01-26 ノキア テクノロジーズ オサケユイチア マルチ・チャンネル・オーディオ信号分類器
JP2022509440A (ja) * 2018-10-31 2022-01-20 ノキア テクノロジーズ オーユー 空間オーディオパラメータの符号化及び対応する復号の決定
JP7213364B2 (ja) 2018-10-31 2023-01-26 ノキア テクノロジーズ オーユー 空間オーディオパラメータの符号化及び対応する復号の決定
US12009001B2 (en) 2018-10-31 2024-06-11 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
CN113678199A (zh) * 2019-03-28 2021-11-19 诺基亚技术有限公司 空间音频参数的重要性的确定及相关联的编码

Also Published As

Publication number Publication date
US20070016416A1 (en) 2007-01-18
CN1993733A (zh) 2007-07-04
RU2007106874A (ru) 2008-08-27
BRPI0605857A (pt) 2007-12-18
TWI327306B (en) 2010-07-11
RU2376655C2 (ru) 2009-12-20
EP1754222A1 (en) 2007-02-21
JP4521032B2 (ja) 2010-08-11
US8054981B2 (en) 2011-11-08
CN1993733B (zh) 2010-12-08
DE602006000239D1 (de) 2007-12-27
KR100878371B1 (ko) 2009-01-15
ES2297825T3 (es) 2008-05-01
WO2006111294A1 (en) 2006-10-26
DE602006000239T2 (de) 2008-09-18
TW200703238A (en) 2007-01-16
EP1754222B1 (en) 2007-11-14
PL1754222T3 (pl) 2008-04-30
KR20070062502A (ko) 2007-06-15
ATE378675T1 (de) 2007-11-15
MY141427A (en) 2010-04-30
HK1095993A1 (en) 2007-05-25

Similar Documents

Publication Publication Date Title
JP4521032B2 (ja) 空間音声パラメータの効率的符号化のためのエネルギー対応量子化
JP4616349B2 (ja) ステレオ互換性のあるマルチチャネルオーディオ符号化
JP4887307B2 (ja) ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成
KR100913987B1 (ko) 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법
AU2006222285B2 (en) Device and method for generating an encoded stereo signal of an audio piece or audio data stream
US9361896B2 (en) Temporal and spatial shaping of multi-channel audio signal
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP5624967B2 (ja) マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法
JP5883561B2 (ja) アップミックスを使用した音声符号器
US7719445B2 (en) Method and apparatus for encoding/decoding multi-channel audio signal
US20080040103A1 (en) Temporal envelope shaping for spatial audio coding using frequency domain wiener filtering

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100521

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4521032

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140528

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250