JP5554065B2 - 複雑さの軽減されたパラメトリックステレオデコーダ - Google Patents

複雑さの軽減されたパラメトリックステレオデコーダ Download PDF

Info

Publication number
JP5554065B2
JP5554065B2 JP2009547800A JP2009547800A JP5554065B2 JP 5554065 B2 JP5554065 B2 JP 5554065B2 JP 2009547800 A JP2009547800 A JP 2009547800A JP 2009547800 A JP2009547800 A JP 2009547800A JP 5554065 B2 JP5554065 B2 JP 5554065B2
Authority
JP
Japan
Prior art keywords
parameters
noise
signal
parameter
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009547800A
Other languages
English (en)
Other versions
JP2010518423A (ja
JP2010518423A5 (ja
Inventor
マレク ズィー シュツェルバ
エリク ジー ピー スハイゥイェルス
パウルス エイチ エイ ディレン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2010518423A publication Critical patent/JP2010518423A/ja
Publication of JP2010518423A5 publication Critical patent/JP2010518423A5/ja
Application granted granted Critical
Publication of JP5554065B2 publication Critical patent/JP5554065B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Description

本発明は、音声符号化の分野に関する。より詳細には、本発明は、ステレオ音声符号化に関し、特に、本発明は、パラメタ化された音声信号をステレオ音声信号に復号するよう構成される音声デコーダ、及び斯かるデコーダを含むデバイスを提供する。本発明は、復号化方法及び斯かる方法を実行するよう構成されるコンピュータ実行可能プログラムコードも提供する。
シヌソイド符号化(SSC)は、完全な帯域幅の高品質音声符号化が可能な、よく知られたパラメトリック符号化スキームである。例えば、[ISO/IEC 14496-3 :2001/AMD2, "Information Technology - Generic Coding of Audiovisual Objects. Part 3: Audio. Amendment 2: High Quality Parametric Audio Coding"]、及び [Werner Oomen, Erik Schuijers, Bert den Brinker, Jeroen Breebaart, "Advances in Parametric Coding for High-Quality Audio", 114th AES Convention, Amsterdam, The Netherlands, March 22-25 2003, preprint 5852]を参照されたい。斯かるSSC符号化スキームは、モノラル又はステレオ音声信号を多数のオブジェクトへと分割する。各オブジェクトは、パラメタ化され、低ビットレートで効率的にエンコードされることができる。これらの3つのオブジェクトは、トランジエント(時間領域における動的な変化を表す)、シヌソイド(決定論的な要素を表す)及びノイズ(明白な時間的又はスペクトル局所化を持たない要素を表す)である。ステレオ音声信号の場合には、パラメタの4つのセットが関連する。即ち2つのステレオチャネル間の関係を記載する空間画像パラメタのセットである。
通常は、デコーダ側で、音声信号の斯かるパラメトリックなステレオ表現がスペクトル領域においてデコードされる。例えば、[Jeroen Breebaart, Steven van de Par, Armin Kohlrausch, Erik Schuijers, "High-Quality Parametric Spatial Audio Coding at Low Bitrates", 116th AES Convention, Berlin, Germany, May 8-1 1 2004, preprint 6072]を参照されたい。ほとんどの場合、スペクトル領域のステレオ表現は、例えば高速フーリエ変換(FFT)又は直交ミラーフィルタ(QMF)領域への変換といった計算処理を含む。
例えば[Erik Schuijers, Jeroen Breebaart, Heiko Purnhagen, Jonas Engdegard, "Low Complexity Parametric Stereo Coding", 116th AES Convention, Berlin, Germany, May 8-1 1 2004, preprint 6073]を参照されたい。SSCデコーダの複雑さを減らすため、シヌソイド要素は、スペクトル領域において直接合成されることができる。しかしながら、シヌソイド要素だけが、スペクトル領域において効率的に合成されることができる。他の要素、即ちトランジエント及びノイズをスペクトル領域に変換することは、実質的なコンピュータの演算負荷を必要とする。
シヌソイド要素の合計である時間信号だけをスペクトル領域に変換し、その後シヌソイド部分のみに関してスペクトル領域においてステレオ相関分離処理を実行することも知られている。この処理から生じるステレオスペクトル領域表現が、時間領域ステレオシヌソイド部分に到達する各チャネルに対して合成フィルタバンクを分離するために適用される。最終的に、ノイズ及びトランジエント要素が、時間領域におけるステレオシヌソイド部分に追加される。しかしながら、斯かるソリューションはノイズ及びトランジエント音声が音像において「目立つ」ように見え、更に、スペクトル領域におけるステレオ相関分離処理が相当の計算量を必要とする複雑な処理であるという知覚的な不都合点を持つ。
結論として、既知のステレオ復号方法は、利用可能な信号処理能力が制限されるデバイス、例えばモバイル及び小型デバイスには適していない。
上記に基づき、本発明の目的は、復号を実行するために必要とされる計算パワーを減らすため、ステレオ、即ち2つのチャネルの音声信号を低い複雑さで復号することが可能な音声デコーダを提供することである。
この目的は、本発明の第1の側面によれば、少なくとも信号パラメタのセットと空間画像パラメタとを含むパラメトリック音声表現に応答して、第1及び第2の音声チャネルを生成する音声デコーダを提供することにより実現され、このデコーダは、
−信号パラメタのセットに基づき、パラメタの第1及び第2のセットを生成するよう構成されるパラメタ処理ユニットであって、パラメタ処理ユニットが、空間画像パラメタに基づき、上記パラメタの第1及び第2のセットの間の差を生成するよう構成される、パラメタ処理ユニットと、
−パラメタの上記第1のセットに基づき、第1の音声チャネルを生成するよう構成される第1の信号合成器と、
−パラメタの上記第2のセットに基づき、第2の音声チャネルを生成するよう構成される第2の信号合成器とを有する。
こうして、上記第1の側面によれば、上記個別のステレオチャネルに対して独立した信号合成器又は生成器、好ましくは独立したシヌソイド合成器を提供することにより、計算量が減らされる。これらの信号合成器が、上記パラメタ処理ユニットからの信号パラメタの個別の第1及び第2のセットと共に提供される。信号パラメタのこれらの第1及び第2のセットは、好ましくは上記パラメタ領域において、即ち上記入力された空間画像データにおける上記ステレオ情報に対応する信号パラメタの第1及び第2のセットを生成するため、信号パラメタの上記入力セットにおける1つ又は複数の要素を操作又は変更することにより準備される。これによって、簡単なパラメタ操作だけがアップミキシングにおいて必要とされる、複雑さが非常に低いデコーダの実施形態を提供することが可能である。なぜなら、これは、上記従来技術においてといった必要とされる計算的に複雑なスペクトル領域変換が関係することなく実行されることができるからである。
第1及び第2の信号合成器は、好ましくは、同じタイプの合成器、例えば同一のタイプの合成器及び好ましくは同一の合成器である。
第1及び第2の信号合成器は、シヌソイド、トランジエントタイプ又はノイズタイプ合成器を含むことができる。しかしながら、好ましくは、上記パラメタ処理ユニットは、第1及び第2の、好ましくは同一の信号合成器に適用される、シヌソイドパラメタの第1及び第2のセットを生成するよう構成される。基本的なデコーダ実施形態において、上記第1及び第2の信号合成器は、周波数、振幅及び位相のセットをパラメタとして取るそれぞれ同一のシヌソイド合成器である。
パラメタ処理ユニットは、チャネル間相関パラメタ、チャネル間強度差パラメタ、チャネル間位相及びチャネル間時間差パラメタの少なくとも1つに基づき、パラメタの上記第1及び第2のセットの間の上記差を生成することができる。好ましくは、これらのパラメタの2つ又はそれ以上が、信号パラメタの上記セットのアップミキシングを実行する際に考慮される。
上記第1及び第2の信号合成器が個別の第1及び第2のシヌソイド合成器を含む実施形態において、上記パラメタ処理ユニットは、シヌソイドパラメタの第1及び第2のセットを生成するように構成されることができる。シヌソイドパラメタの上記2つのセットにおける少なくとも1つの、好ましくは複数のシヌソイド要素が、振幅、周波数及び位相の少なくとも1つ、好ましくは複数に対して異なる。
デコーダは、低周波発振器及び乱数発生器の少なくとも1つを含む値生成器を含むことができる。パラメタ処理ユニットは、上記値生成器から受信される値に基づきパラメタの上記第1及び第2のセットの間の差をもたらすよう、この値生成器を利用する。
デコーダは、好ましくは、信号パラメタの上記セットの少なくとも1つの信号パラメタの遅延されたバージョンを生成するよう構成される遅延ユニットを含む。その後パラメタ処理ユニットは、信号パラメタの上記セットの上記少なくとも1つの信号パラメタに基づき、パラメタの上記第1及び第2のセットを生成するだけでなく、上記少なくとも1つの信号パラメタの上記遅延されたバージョンも生成する。好ましくは、これは、以下の態様で行われる。上記パラメタ処理ユニットは、パラメタの第1の中間ステレオセットを形成するため、信号パラメタの上記セットの上記少なくとも1つの信号パラメタに基づき、アップミキシングをまず実行する。次に、ステレオパラメタの第2の中間セットを形成するため、上記少なくとも1つの信号パラメタの上記遅延されたバージョンに基づき、第2のアップミキシングが実行される。最終的に、ステレオパラメタの上記第1及び第2の中間セットは、パラメタの上記第1及び第2のセットを形成するよう結合される。遅延ユニットが、可変の遅延を提供するように構成されることができる。例えば、上記可変の遅延は、パラメタの上記第1及び第2のセットのうちの1つにおける少なくとも1つのパラメタ要素の関数である。
パラメタ処理ユニットは、パラメタの上記第1及び第2のセットの1つにおける少なくとも1つのシヌソイド要素の振幅、周波数及び位相の少なくとも1つを上記空間画像パラメタに基づき変更する、例えばスケール化するよう構成されることができる。パラメタ処理ユニットは、パラメタの上記第1及び第2のセットのシヌソイド要素の振幅に対する利得、位相に対するシフト及び周波数に対するシフトのうちの少なくとも1つを適用するよう更に構成されることができる。
各ステレオチャネルに関する個別のシヌソイド合成器に基づくデコーダ実施形態は、上記パラメトリック音声表現における個別のノイズ及びトランジエントパラメタに基づき、個別のノイズ及びトランジエント信号を生成するよう構成されるノイズ合成器及び/又はトランジエント合成器を更に含むことができ、上記ノイズ及びトランジエント信号が、上記第1及び第2の音声チャネルと結合される。好ましくは、上記ノイズ及びトランジエント信号は、上記時間領域において上記第1及び第2のシヌソイド合成器の出力と結合される。
トランジエント合成器を含むデコーダ実施形態は、上記個別の第1及び第2の音声チャネルに適用されることになる異なる第1及び第2のトランジエント信号部分を生成するため、上記トランジエント信号に異なる利得を適用するよう構成される利得計算ユニットを更に含むことができる。同様に、ノイズ合成器を持つデコーダの実施形態は、上記個別の第1及び第2の音声チャネルに適用されることになる異なる第1及び第2のノイズ信号部分を生成するため、上記ノイズ信号に異なる利得を適用するよう構成される利得計算ユニットを更に含むことができる。
ノイズ合成器を持つ実施形態は、パラメトリック音声表現における上記ノイズパラメタに基づき、第2のノイズ信号を生成するよう構成される第2のノイズ合成器を更に含むことができる。この第2のノイズ合成器は、上記第1のノイズ合成器により生成される上記ノイズ信号と本質的に無相関のノイズ信号を生成するよう構成され、上記第1及び第2のノイズ信号が、上記個別の第1及び第2の音声チャネルに適用される第1及び第2のノイズ信号部分を形成するためにミックスされる。
ノイズ合成器を持つ実施形態は、低周波ノイズを生成するよう構成される低周波ノイズ発生器を更に含むことができる。この低周波ノイズは、上記ノイズ合成器により生成される上記第1のノイズ信号と本質的に無相関の第2のノイズ信号を生成するため、上記ノイズ合成器により生成される上記ノイズ信号で乗算され、上記第1及び第2のノイズ信号が、上記個別の第1及び第2の音声チャネルに適用される第1及び第2のノイズ信号部分を形成するためにミックスされる。
好ましくは、上記デコーダは、上記入力パラメトリック音声表現の各フレームに対してパラメタの上記第1及び第2のセットを更新するよう構成される。
第2の側面において、本発明は、上記第1の側面に基づかれる音声デコーダを含むデバイスを提供する。このデバイスは、例えば音声映像電子装置といったエンタテインメント電子機器を含む任意のタイプの電子デバイスとすることができ、上述されるように、上記デコーダはモバイル装置にも適している。このデコーダは、パラメトリックデコーダ、MPEG4パラメトリック音声、音楽合成器、モバイルデバイス、リングトーン、ゲームデバイス、携帯プレーヤ(例えばソリッドステート音声)といった分野に含まれ、又はこれらの分野に関連付けられるデバイスに適している。上記第1の側面に関して述べられたのと同じ利点及び同じ実施形態が、上記第2の側面に関しても同様に適用されることを理解されたい。
第3の側面において、本発明は、少なくとも信号パラメタのセットと空間画像パラメタとを含むパラメトリック音声表現に応じて、第1及び第2の音声チャネルを生成する方法を提供する。この方法は、
−信号パラメタの上記セットに基づきパラメタの第1及び第2のセットを生成するステップであって、パラメタの上記第1及び第2のセットの間の差が、上記空間画像パラメタに基づき生成される、ステップと、
−パラメタの上記第1のセットを合成することにより第1の音声チャネルを生成するステップと、
−パラメタの上記第2のセットを合成することにより第2の音声チャネルを生成するステップとを有する。
上記第1の側面に関して述べられたのと同じ利点及び同じ実施形態が、上記第3の側面に関しても同様に適用されることを理解されたい。
第4の側面において、本発明は、上記第3の側面に基づかれる方法を実行するよう構成されるコンピュータ実行可能プログラムコードを提供する。斯かるプログラムコードは原則として、専用の信号プロセッサ又は一般的な計算ハードウェア上で実行されることができる。上記第1の側面に関して述べられたのと同じ利点及び同じ実施形態が、上記第4の側面に関しても同様に適用されることを理解されたい。
第5の側面において、本発明は、上記第4の側面に基づかれるコンピュータ実行可能プログラムコードを有するデータ搬送波又はコンピュータ可読記憶媒体を提供する。ストレージメディアのほんの一例を挙げれば、メモリスティック、メモリカード、CD、DVD又はブルーレイベースのディスク又は例えば携帯ハードディスクといったハードディスクである。上記第1の側面に関して述べられたのと同じ利点及び同じ実施形態が、上記第5の側面に関しても同様に適用されることを理解されたい。
上記第1の側面に関して説明される任意の下位の側面が、上記他の側面のいずれかとそれぞれ結合されることができる点を理解されたい。
本発明による基本的なステレオ音声デコーダの実施形態を示す図である。 別の基本的なステレオ音声デコーダの実施形態を示す図である。 シヌソイド、トランジエント及びノイズ要素を持つパラメトリック信号を復号するよう構成されるステレオ音声デコーダの実施形態を示す図である。 シヌソイド、トランジエント及びノイズ要素を持つパラメトリック信号を復号するよう構成される別のステレオ音声デコーダの実施形態を示す図である。 シヌソイド、トランジエント及びノイズ要素を持つパラメトリック信号を復号するよう構成される更に別のステレオ音声デコーダの実施形態を示す図である。 シヌソイド、トランジエント及びノイズ要素を持つパラメトリック信号を復号するよう構成されるまた別のステレオ音声デコーダの実施形態を示す図である。 パラメトリック音声信号を表すデジタルビットストリームを受信し、2つの音声チャネルにこの信号を復号するデバイスを示す図である。
本発明が以下、例示に過ぎないものを用いて、添付の図面を参照して、説明されることになる。
以下において、図1〜図5に図示される信号ブロック図を参照して、5つのデコーダの実施形態が記載されることになる。全ての図において、デコーダは、点線ボックスにより示される。
図1は、本発明の原理を説明するための基本的なステレオ音声デコーダの実施形態を示す。このデコーダ実施形態は、各フレームに対して信号パラメタS1のセットと少なくとも1つの空間画像パラメタX1とを含むパラメトリック音声表現S1、X1のフレームのストリームを入力として捉える。特に、信号パラメタS1は、各要素に対して例えば周波数、振幅及び位相を表す値を含むシヌソイド要素のセットの表現を含むか、又は少なくとも、信号パラメタS1は、斯かる値が得られることができる表現を含む。空間画像パラメタX1は、1)ステレオチャネル間の相互相関又はコヒーレンスを表すチャネル間相互相関(ICC)パラメタ、2)ステレオチャネル間の強度差を表すチャネル間強度差(IID)パラメタ、3)チャネル間位相差(IPD)又は時間差パラメタ、及び4)ステレオチャネル間で位相差がどのように分散されるかを表す全体の位相差(OPD)パラメタ、の1つ又は複数を含むことができる。例えば、[Heiko Purnhagen, "Low Complexity Parametric Stereo Coding in MPEG-4", Proc. Of the 7th International Conference on Digital Audio Effects (DAFx'04), Naples, Italy, October 5-8, 2004]を参照されたい。
シヌソイドパラメタS1及び空間画像パラメタX1は、別々のシヌソイド合成器SS1、SS2に適用される、シヌソイドパラメタP1及びP2の2つの分離したセットへのモノラルシヌソイドパラメタデータS1のアップミキシングを形成するために空間画像パラメタX1を利用するパラメタ処理ユニットPに適用される。これらのシヌソイド合成器SS1、SS2、は、パラメタP1、P2の別々のセットに基づき、別々の音声フレームを生成し、これらの別々の音声フレームは、それぞれ第1及び第2の音声チャネルC1、C2を形成する。
パラメタ処理ユニットPにおけるアップミキシング処理は、従来技術において知られるように実行されることができる。しかしながら、シヌソイドパラメタP1、P2のステレオセットに到達するよう空間画像パラメタX1を適用することにより、パラメタ処理ユニットPがシヌソイドパラメタのモノラルセット上で直接アップミキシングを実行することが好ましい。本質的には、シヌソイドパラメタP1及びP2のセットは、入力されたシヌソイドパラメタのコピーから生成されることができる。ここで、チャネル差は、空間画像パラメタX1に基づき1つ又は複数のシヌソイド要素に関する振幅、周波数及び位相の1つ又は複数を変える又は操作することにより得られる。この変更又は操作は、1つのチャネルだけに関する又は両方のチャネルに関するパラメタ上で実行されることができる。
従って、上記によれば、ステレオ合成が、入力パラメタの簡単な処理で実行され、計算量を必要とするスペクトル領域変換が回避されることができる。従って、斯かるステレオ音声デコーダは、モバイル及び小型デバイスにおける用途に適している。
従来技術に基づく特定のアップミキシング処理を説明すると、この処理は、上述されるように、IC及びIID値を含む空間画像パラメタX1に基づかれる。これらのIC及びIID値は周波数帯ごとに特定されることができる。ここで、周波数スケールは、サイコアコースティック的に(psycho-acoustically)関連する。即ち、Bark又はERBのような周波数スケールである。


ステレオ信号
Figure 0005554065
は、
Figure 0005554065
に基づき再構成されることができる。ここで、
Figure 0005554065
は、アップミックス行列であり、
Figure 0005554065
が成り立ち、
Figure 0005554065
であり、
Figure 0005554065
は、
Figure 0005554065
として近似されることができる。Mは、復号されたモノラル信号であり、Dは、相関分離されたバージョンである。相関分離された信号は、好ましくは適切な全域通過フィルタを用いて生成され、及び好ましくは復号されたモノラル信号に類似するスペクトル及び時間エネルギー分布を持つ。
好ましくは、デコーダは、S1、X1から1つの入力フレームを取り出し、それに応じて、入力フレームを表す対応する出力チャネルC1、C2を出力する。
図2は、図1を参照して説明された基本的なデコーダの拡張されたバージョンを説明する。図2のデコーダは信号パラメタ表現S1を受信する、即ちシヌソイドパラメタのセットを含む遅延ユニットDを含む。この信号パラメタ表現S1は、例えば図1に関して上述されるように、パラメタ処理ユニットPに適用される。しかしながら、遅延ユニットDは、信号パラメタ表現S1の追加的な遅延バージョンをパラメタ処理ユニットPに適用する。従って、特定の時間において、現在のシヌソイドパラメタS1は、例えば以前のフレームに対応するパラメタといった以前の時間における入力パラメタに対応する、遅延されたバージョンであるシヌソイドパラメタS1dと共に両方利用可能である。空間画像パラメタX1に基づき、パラメタ処理ユニットPは、シヌソイドパラメタの合計4つのセットに達する、シヌソイドパラメタS1及びS1dの両方のセットを一度に操作する。即ちステレオシヌソイドパラメタの2つの別々のセットが、両方とも同じ空間画像パラメタX1に基づかれる。従って、各チャネルに関して、利用可能なパラメタのセットが2つある。個別のステレオチャネルに対するシヌソイドパラメタのこれらの2つのセットは、個別の出力チャネルC1、C2に対する信号を生成する個別のシヌソイド合成器SS1、SS2における合成のため、パラメタP1、P2の第1及び第2のセットを形成するようその後結合される。
図3〜6は、パラメトリック音声表現を入力として取るよう構成される4つの異なるステレオ音声デコーダ実施形態を示す。ここで信号パラメタのセットは、シヌソイドパラメタS1、トランジエントパラメタT1、及びノイズパラメタN1を含む。これらのパラメータは、2つの出力チャネルC1、C2、トランジエント合成器TS、1つ又は2つのノイズ合成器NS、NS1、NS2及び低周波ノイズ発生器LFNのそれぞれに関して、別々のシヌソイド合成器SS1、SS2により独立に合成される。トランジエントパラメタT1は、好ましくは、時間エンベロープ、及び基礎となる周期的パラメタにより表される要素を含む。トランジエントに対する周期的パラメタは通常、シヌソイドパラメタ、即ち周波数振幅及び位相である。ノイズパラメタN1は、好ましくは、スペクトル及び時間エンベロープにより表される要素を含む。
2つのシヌソイド合成器SS1、SS2、トランジエント合成器TS、ノイズ合成器NS、NS1、NS2及び低周波ノイズ発生器LFNから出力が、2つの音声チャネルC1、C2を形成するようその後最終的に結合される。更に、3つのデコーダはすべて、上述されるように1つ又は複数の空間画像パラメタX1を入力として取り、4つ全ての実施形態において、デコーダは、空間画像パラメタX1を受信し、それに従って利得のセットを出力するよう構成される利得計算ユニットGCを含む。利得計算ユニットGCのより詳細な機能は、各実施形態に関して説明されることになる。ある実施形態において、パラメタ処理ユニットPが直接示される。一方、2つの実施形態において、このユニットは遅延ユニットD及びアップミキシングマトリクスMに分割される。
最後に、図3〜6の全てにおいて、「+」は合計点の合計ユニットを示す。一方、「x」は乗算器又は乗算点を示す。
図3は、図1に関して表されるのと同じ機能を持つ同じ要素P、SS1、SS2を含む実施形態を示す。個別のトランジエント及びノイズ合成器TS、NSにより生成されるモノラルトランジエント信号及びモノラルノイズ信号は、空間画像パラメタX1から利得計算ユニットGCにおいて得られる利得パラメタに対する、2つの出力チャネルC1、C2の間で分散される。それぞれノイズ及びトランジエントに関して個別の利得値が使用されることができる。しかしながら更なる簡略化のため、ノイズ及びトランジエントの両方に関して同じ利得が使用されることができる。図示される実施形態において、ノイズ及びトランジエント信号は、各チャネルに対する利得を用いて適用される前に、結合されたノイズ及びトランジエント信号に対して合計される。こうして、ノイズ及びトランジエント信号部分に対して同じ利得が適用される。好ましくは、ノイズ合成器NSは、周波数ワープ(ラゲール)フィルタを使用する。
代替的に、以下シヌソイド要素に関して後述するように、特定の周波数帯におけるそれらの周波数及び適切なIID及び/又はICC値に対してトランジエント要素を分散させることが可能である。
図3の実施形態において、パラメタ処理ユニットPは、ステレオパラメタに対するパラメタS1の入力セットにおけるシヌソイド要素の元の周波数、振幅及び位相パラメタを変える機能を含む。特に、シヌソイド要素が属する特定の周波数帯に関連付けられる着信ステレオパラメタに関して、要素のシヌソイドパラメタが変更されることが好ましい。より詳細には、1)シヌソイド要素の振幅が、IIDパラメタに関して変更される、2)シヌソイド要素の周波数が、ICCパラメタ値及び/又はデコーダに構築される低周波発振器(LFO)の現在の設定値に関して変更される、及び3)シヌソイド要素の位相が、ICCパラメタ、シヌソイド要素の周波数及びデコーダに構築される低周波発振器(LFO)の現在の設定値に関して変更される、ことが提案される。
図3の実施形態において、相関分離された信号D(式(1)〜(6)を参照)は、適切な位相及び周波数シフトと低周波発振器とを結合することによりシミュレーションされる。しかしながら、低周波発振器なしの実施形態を使用することも可能である。この場合、シヌソイド要素の位相は、ICCパラメタ値及び要素周波数に関して変更される。乱数発生器が、低周波発振器ユニットの追加又は置換として使用されることもできる。
約2kHz以下で周波数に関する位相調整を用いて、送信されたICC値を正確に再生するため、知覚関連(ERB)帯域に含まれる全体の(重みつき)平均相回転が実質的にゼロに近いことが重要である。なぜなら、それ以外の場合、事実上異なる空間画像をもたらすIPDキューが合成されるからである。しかしながら、最も低い知覚関連帯域に対して、これは実現することは難しい。なぜなら、これらの帯域に対する帯域幅は通常、2、3のシヌソイド要素だけが存在することを可能にするからである。従って、別の実施形態において、超低周波に配置される要素に関して、2つのステレオチャネル間の適切な相関分離を確実にするため、小さな周波数調整だけが実行される。一方、高い周波数に配置される要素に関しては、位相調整だけが実行される。
図4は、別のステレオ音声デコーダの実施形態を説明する。ここでは、ステレオ相関分離が、過去の(サブ)フレームからのシヌソイドパラメタを用いて実行され、シヌソイド入力パラメタS1のセットの遅延バージョンをアップミキシングユニットMに提供する遅延ユニットDを導入することにより、即ち図2の実施形態に関連して説明されるのと類似する態様で、実行される。ノイズ及びトランジエント合成器NS、TSからのノイズ及びトランジエント信号成分を利得計算ユニットGCを用いて出力チャネルC1、C2に分散させることに関して、図3に関して説明された機能が、図4の実施形態にも当てはまる。
好ましくは、遅延ユニットDは、過去のシヌソイドパラメタをアップミキシングユニットMに提供するのに使用される遅延線を含む。遅延線の長さは、固定又は可変とすることができる。特に、遅延時間は、シヌソイド要素周波数の関数とすることができる。シヌソイド要素の元の周波数、振幅及び位相パラメタが、相関分離された要素を形成するのに使用される。モノラル及び遅延モノラル信号の両方に対するシヌソイドパラメタが、パラメタアップミキシングユニットMに提供される。アップミキシングユニットMは、提供される空間画像パラメタX1に基づき、元の及び遅延されたシヌソイド要素の振幅をスケール化する。以下のルールが実現されることができる。1)元のシヌソイド要素の振幅が、特定の要素の周波数に関連するIID(及びICC)パラメタの値に関して、出力チャネルC1、C2の1つに対して変更される。2)遅延するシヌソイド要素の振幅が、特定の要素の周波数に関連するIID及びICCパラメタの値に関して、出力チャネルの両方に対して変更される。3)出力チャネルのうちの1つに対する遅延シヌソイド要素の位相が、逆にされる(即ち180度分変更される)。
より詳細には、IIDパラメタ値に関係なく、遅延されるシヌソイド要素の振幅が、ICCパラメタのみに関して変更されることができる。
固定長遅延に基づかれる好ましいソリューションは、全域通過相関分離フィルタ特性を提供するものではない。連続スペクトラムにより特徴付けられる信号に適用される場合、斯かる特性は信号色彩を生じさせるだろう。しかしながら、固定長遅延が静止シヌソイド要素にのみ適用されるので、色彩効果は信号品質に関する負の効果を持たない。
図5は、図4からのものの拡張バージョンである、更に別のステレオ音声デコーダの実施形態を示す。従って、上記の説明は、図5の実施形態にも同様に当てはまる。
拡張は、より好適なステレオ撮像を提供するため、より高度なノイズ合成が図5の実施形態において含まれるということである。図から分かるように、2つのノイズ合成器NS1、NS2が含まれ、両方のノイズ合成器NS1、NS2は同じ入力ノイズパラメタN1を受信する。しかしながら、ノイズ合成器NS1、NS2は、通常異なるシードで開始される独立した乱数発生器を用いて作成される、その内部的に生成された源信号が無相関であるという側面においてのみ異なる。合成器NS1、NS2の両方における後続の処理(時間エンベロープ、ラゲール周波数ノイズシェーピング)は、同一である。こうして、合成器は、個別の第1及び第2の無相関のノイズ信号n1、n2を生成する。両方のノイズ合成器NS1、NS2が本質的に同じ動作であるにもかかわらず、あるノイズ合成器NS1の出力ノイズ信号n1は、「モノラル」ノイズとして機能する。一方、他のノイズ合成器NS2からの出力ノイズ信号n2は、ステレオアップミキシングに関する「相関分離された」ノイズをとして機能する。
本実施形態において、利得計算ユニットGCは、トランジエント信号に対する、及びノイズ合成器出力信号n1、n2のどちらかに対する個別のパニング利得を(パラメトリック空間画像パラメタX1から)計算する。2つの出力チャネルC1、C2への上述した信号の合計前に、これらのパニング利得が適用される。従って、図5に示されるように、2つのノイズ信号n1、n2は共に、出力信号C1、C2の両方に貢献する。
トランジエント合成器TSからのトランジエント信号に関するパニング利得は、通常は式(2)から(6)において、1)IIDに関しては、パラメトリックステレオ帯域にわたる個別のIID値の(重みなし又は重みつき)平均で置換することにより、及び2)ICCに関しては、値「1」(完全相関したトランジエント信号を意味する)で置換することにより計算される。これは、α=β=0であること、及び行列Hが、
Figure 0005554065
となることを意味する。従って、トランジエントパニング利得は、それぞれC及びCに等しい。
ノイズ合成器NS1、NS2からの「モノラル」及び「相関分離された」ノイズ信号n1、n2に関する利得は通常、式(2)から(6)において、1)IIDに関しては、パラメトリックステレオ帯域にわたる個別のIID値の(重みなし又は重みつき)平均で置換することより、及び2)ICCに関しては、パラメトリックステレオ帯域にわたる個別のICCの(重みなし又は重みつき)平均で置換することにより計算される。従って、利得係数は、結果として生じる行列Hにより規定され、ステレオノイズ貢献は、
Figure 0005554065
となる。ここで、Mnoise及びDnoiseはそれぞれ、「モノラル」及び「相関分離された」ノイズ合成器出力信号n1、n2に等しい。
図5の実施形態において、トランジエント及びノイズ信号n1、n2に関するパニング利得は好ましくは異なる。
説明が簡単になるという理由から、図5及び図6における利得計算ユニットGCからの利得は、ボックスGCからの単一の出力線により示される。しかしながら、図5及び6の利得計算ユニットGCが全ての乗算点に対して異なる利得を生成することができる点、又は利得のいくつか若しくは全てが同じ値を持つことができる点を理解されたい。
図6は、図5に記載されるものの変形例である、更に別のステレオ音声デコーダの実施形態を示す。従って、上記の説明は、図6の実施形態に関してほとんど同様に適用される。図6における変形例は、より低いデコーダ複雑さを提供するため、より効率的なノイズ合成が実施形態に含まれることを示す。図6に示されるように、ノイズ合成器NS及び低周波ノイズ発生器LFNが含まれる。ノイズ合成器NSだけが、入力雑音パラメタN1を受信する。第1のノイズ信号n1に本質的に無相関であるが、スペクトル形状及び時間エンベロープに関してノイズ信号n1を近似する第2のノイズ信号n2を作成するよう、その後、ノイズ合成器NSにより生成されるノイズ信号n1が、低周波ノイズ発生器により生成される低周波ノイズ信号lfnにより乗算される。この場合も、ノイズ信号n1は「モノラル」ノイズとして機能する。一方、ノイズ信号n2はステレオアップミキシングに関する「相関分離された」ノイズとして機能する。低周波ノイズ発生器は通常、単一のノイズ合成器において必要とされる(時間エンベロープ、ラゲール周波数ノイズシェーピング)処理より計算的に複雑でないので、この変形例は、複雑さの減少をもたらす。
図7は、例えばモバイルDVD又はMP3プレーヤ又は携帯電話又はゲームデバイスといった例えばモバイル又は小型デバイスのようなデバイスDVを示す。デバイスDVは、パラメトリック表現における符号化ステレオ音声信号を含むデジタルビットストリームBSを受信するよう構成される。このパラメトリック表現は、本発明に基づかれる、従って上記説明に基づかれるステレオ音声デコーダADに与えられる。いくつかの実施形態において、ステレオ音声デコーダADは、デジタルステレオPCM出力信号を提供するよう構成され、この出力信号は、増幅器により増幅されるアナログステレオ信号を出力するデジタルアナログ変換器にその後適用され、こうして、ステレオヘッドホン又はステレオラウドスピーカのセットに対して適用されることができる2つの出力チャネルO1、O2のセットが生じる。
本発明を要約すると、複雑さが低減されたステレオ音声デコーダが提供される。高いステレオ音質が、限られた計算パワーでも得られることができ、こうして、本発明は、小型及びモバイル装置に適している。ステレオデコーダは、信号パラメタ(S1)及びステレオ関連パラメタ(X1)を含むパラメトリック音声入力に応答して、ステレオ出力チャネル(C1、C2)のセットを生成する。パラメタプロセッサ(M)は、入力信号パラメタ(S1)に基づきパラメタ(P1、P2)の2つの異なるセットを生成する。こうして、ステレオ関連パラメタ(X1)に対応する信号パラメタ(S1)を変更又は操作することにより、信号パラメタ(S1)がアップミキシングされる。2つの異なるパラメタ(P1、P2)は、個別のステレオ出力チャネル(C1、C2)を形成する個別の信号合成器(SS1、SS2)により最終的に合成される。ステレオ復号がスペクトル領域の代わりにパラメタ領域において実行されることができるので、必要とされる計算負荷は、従来技術において知られるものと比較して減らされる。信号合成器(SS1、SS2)は好ましくは、シヌソイド合成器である。デコーダは好ましくは、ステレオ出力チャネル(C1、C2)に適用されるトランジエント及びノイズ信号部分を生成するためのトランジエント及びノイズ合成器も含む。更に、ステレオ関連パラメタ(X1)に基づき異なる利得を適用することにより、異なるトランジエント及びノイズ信号部分が出力チャネル(C1、C2)に対して提供されることができる。好ましい実施形態において、2つのパラメタ(P1、P2)は、例えば入力遅延経路を用いて、以前の信号パラメタ入力だけでなく現在の信号パラメタから決定される。
本発明は、特定の実施形態と共に説明されてきたが、本書に記載される特定の形式に限定されることを意図するものではない。むしろ、本発明の範囲は、添付された特許請求の範囲によってのみ限定される。特許請求の範囲において、「有する」という用語は、他の要素又はステップの存在を排除するものではない。更に、個別の特徴が異なる請求項に含まれることができるが、これらは可能であれば有利に結合されることができる。異なる請求項に含まれることは、これらの特徴の組み合わせが、実現できない及び/又は有利でないことを意味するものではない。更に、単数形の参照は、複数性を排除するものではない。従って、「a」「an」「第1」「第2」等への参照は、複数性を除外するものではない。更に、請求項における参照符号は、発明の範囲を限定するものとして解釈されるべきではない。

Claims (18)

  1. 少なくとも信号パラメタのセットと空間画像パラメタとを含むパラメトリック音声表現に基づき、第1及び第2の音声チャネルを生成する音声デコーダであって、
    前記信号パラメタの領域において前記空間画像パラメタに基づき前記信号パラメタのセットにおける少なくとも1つの要素を操作又は変更することにより、パラメタの第1及び第2のセットを生成するよう構成されるパラメタ処理ユニットであって、前記空間画像パラメタに基づき、前記パラメタの第1及び第2のセットの間の差を生成するよう構成される、パラメタ処理ユニットと、
    前記パラメタの第1のセットに基づき、第1の音声チャネルを生成するよう構成される第1の信号合成器と、
    前記パラメタの第2のセットに基づき、第2の音声チャネルを生成するよう構成される第2の信号合成器とを有する、音声デコーダ。
  2. 第1及び第2の信号合成器が、同じタイプの合成器である、請求項1に記載の音声デコーダ。
  3. 前記パラメタ処理ユニットが、前記第1及び第2の音声チャネルに関する、チャネル間相関パラメタ、チャネル間強度差パラメタ、チャネル間位相及びチャネル間時間差パラメタの少なくとも1つに基づき、前記パラメタの第1及び第2のセットの間の差を生成する、請求項1に記載の音声デコーダ。
  4. 前記パラメタ処理ユニットが、シヌソイドパラメタの第1及び第2のセットを生成するよう構成され、前記第1及び第2の信号合成器は、個別の第1及び第2のシヌソイド合成器を含む、請求項2に記載の音声デコーダ。
  5. 前記パラメタ処理ユニットが、シヌソイドパラメタの第1及び第2のセットを生成するよう構成され、前記シヌソイドパラメタの2つのセットの少なくとも1つのシヌソイド要素は、振幅、周波数及び位相の少なくとも1つに関して異なる、請求項2に記載の音声デコーダ。
  6. 前記パラメタ処理ユニットが、前記空間画像パラメタに基づき、前記パラメタの第1及び第2のセットのうちの1つにおける少なくとも1つのシヌソイド要素の振幅、周波数及び位相のうちの少なくとも1つを変更するよう更に構成される、請求項4に記載の音声デコーダ。
  7. 前記パラメタ処理ユニットが、前記パラメタの第1及び第2のセットのシヌソイド要素の振幅に対する利得、位相に対するシフト及び周波数に対するシフトのうちの少なくとも1つを適用するよう更に構成される、請求項4に記載の音声デコーダ。
  8. 前記パラメトリック音声表現における個別のトランジエント及びノイズパラメタに基づき、個別のトランジエント及びノイズ信号を生成するよう構成されるトランジエント合成器及びノイズ合成器を更に含み、前記トランジエント及びノイズ信号が、前記第1及び第2の音声チャネルと結合される、請求項4に記載の音声デコーダ。
  9. 前記個別の第1及び第2の音声チャネルに適用されることになる異なる第1及び第2のトランジエント信号部分を生成するため、前記トランジエント信号に異なる利得を適用するよう構成される利得計算ユニットを更に含む、請求項8に記載の音声デコーダ。
  10. 前記個別の第1及び第2の音声チャネルに適用されることになる異なる第1及び第2のノイズ信号部分を生成するため、前記ノイズ信号に異なる利得を適用するよう構成される利得計算ユニットを更に含む、請求項8に記載の音声デコーダ。
  11. 前記パラメトリック音声表現における前記ノイズパラメタに基づき、第2のノイズ信号を生成するよう構成される第2のノイズ合成器を更に含み、前記第2のノイズ合成器が、前記ノイズ合成器としての第1のノイズ合成器により生成される前記ノイズ信号としての第1のノイズ信号と本質的に無相関のノイズ信号を生成するよう構成され、前記第1及び第2のノイズ信号は、前記個別の第1及び第2の音声チャネルに適用される第1及び第2のノイズ信号部分を形成するためにミックスされる、請求項8に記載の音声デコーダ。
  12. 前記デコーダが、前記パラメトリック音声表現の各フレームに対して前記パラメタの第1及び第2のセットを更新するよう構成される、請求項1に記載の音声デコーダ。
  13. 請求項1乃至1のいずれかに記載の音声デコーダを含むデバイス。
  14. 少なくとも信号パラメタのセット及び空間画像パラメタを含むパラメトリック音声表現に応じて、第1及び第2の音声チャネルを生成する方法において、
    前記信号パラメタの領域において前記空間画像パラメタに基づき前記信号パラメタのセットにおける少なくとも1つの要素を操作又は変更することにより、パラメタの第1及び第2のセットを生成するステップであって、前記パラメタの第1及び第2のセットの間の差が、前記空間画像パラメタに基づき生成される、ステップと、
    前記パラメタの第1のセットを合成することにより第1の音声チャネルを生成するステップと、
    前記パラメタの第2のセットを合成することにより第2の音声チャネルを生成するステップとを有する、方法。
  15. 前記第1及び第2の音声チャネルが、同じタイプの合成により生成される、請求項1に記載の方法。
  16. パラメタの前記第1及び第2のセットが、シヌソイドパラメタを含み、前記パラメタの前記第1及び第2のセットを合成するステップは、シヌソイド合成を含む、請求項1に記載の方法。
  17. 請求項1に記載の方法を実行するよう構成されるコンピュータ実行可能なプログラム。
  18. 請求項1に記載のコンピュータ実行可能プログラムを表すデータを含むデータ担体。
JP2009547800A 2007-02-06 2008-02-04 複雑さの軽減されたパラメトリックステレオデコーダ Expired - Fee Related JP5554065B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP07101766 2007-02-06
EP07101766.9 2007-02-06
PCT/IB2008/050401 WO2008096313A1 (en) 2007-02-06 2008-02-04 Low complexity parametric stereo decoder

Publications (3)

Publication Number Publication Date
JP2010518423A JP2010518423A (ja) 2010-05-27
JP2010518423A5 JP2010518423A5 (ja) 2011-03-24
JP5554065B2 true JP5554065B2 (ja) 2014-07-23

Family

ID=39495140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009547800A Expired - Fee Related JP5554065B2 (ja) 2007-02-06 2008-02-04 複雑さの軽減されたパラメトリックステレオデコーダ

Country Status (6)

Country Link
US (1) US8553891B2 (ja)
EP (1) EP2118887A1 (ja)
JP (1) JP5554065B2 (ja)
KR (1) KR101370354B1 (ja)
CN (1) CN101606192B (ja)
WO (1) WO2008096313A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
US9025776B2 (en) 2010-02-01 2015-05-05 Rensselaer Polytechnic Institute Decorrelating audio signals for stereophonic and surround sound using coded and maximum-length-class sequences
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
JP5814340B2 (ja) 2010-04-09 2015-11-17 ドルビー・インターナショナル・アーベー Mdctベース複素予測ステレオ符号化
KR20110116079A (ko) 2010-04-17 2011-10-25 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
EP2393060A1 (en) * 2010-06-02 2011-12-07 Thomson Licensing Providing a watermarked decoded audio or video signal derived from a watermarked audio or video signal that was low bit rate encoded and decoded
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP5581449B2 (ja) * 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
US8489403B1 (en) * 2010-08-25 2013-07-16 Foundation For Research and Technology—Institute of Computer Science ‘FORTH-ICS’ Apparatuses, methods and systems for sparse sinusoidal audio processing and transmission
CN103026406B (zh) 2010-09-28 2014-10-08 华为技术有限公司 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
EP2862165B1 (en) 2012-06-14 2017-03-08 Dolby International AB Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
ES2934646T3 (es) * 2013-04-05 2023-02-23 Dolby Int Ab Sistema de procesamiento de audio
CN105338446B (zh) * 2014-07-04 2019-03-12 南宁富桂精密工业有限公司 音频声道控制电路
EP4149122A1 (en) * 2016-11-23 2023-03-15 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for adaptive control of decorrelation filters

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6298322B1 (en) 1999-05-06 2001-10-02 Eric Lindemann Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
EP1446796A1 (en) * 2001-10-26 2004-08-18 Koninklijke Philips Electronics N.V. Tracking of sinusoidal parameters in an audio coder
AU2003219426A1 (en) 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
DE60317203T2 (de) * 2002-07-12 2008-08-07 Koninklijke Philips Electronics N.V. Audio-kodierung
WO2004008806A1 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US7734473B2 (en) * 2004-01-28 2010-06-08 Koninklijke Philips Electronics N.V. Method and apparatus for time scaling of a signal
CN1318705C (zh) 2004-06-28 2007-05-30 吴冀生 水冲击止逆排水装置
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
CN101015230B (zh) * 2004-09-06 2012-09-05 皇家飞利浦电子股份有限公司 音频信号增强
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
EP1851760B1 (en) 2005-02-10 2015-10-07 Koninklijke Philips N.V. Sound synthesis
EP1905008A2 (en) * 2005-07-06 2008-04-02 Koninklijke Philips Electronics N.V. Parametric multi-channel decoding
KR101120909B1 (ko) * 2006-10-16 2012-02-27 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 멀티 채널 파라미터 변환 장치, 방법 및 컴퓨터로 판독가능한 매체

Also Published As

Publication number Publication date
EP2118887A1 (en) 2009-11-18
KR101370354B1 (ko) 2014-03-06
CN101606192B (zh) 2014-10-08
US20100023335A1 (en) 2010-01-28
CN101606192A (zh) 2009-12-16
JP2010518423A (ja) 2010-05-27
WO2008096313A1 (en) 2008-08-14
KR20090119843A (ko) 2009-11-20
US8553891B2 (en) 2013-10-08

Similar Documents

Publication Publication Date Title
JP5554065B2 (ja) 複雑さの軽減されたパラメトリックステレオデコーダ
ES2553382T3 (es) Un aparato y un método para generar datos de salida por ampliación de ancho de banda
ES2378734T3 (es) Codificación mejorada y representación de parámetros de codificación de objetos de mezcla descendente multicanal
JP4944902B2 (ja) バイノーラルオーディオ信号の復号制御
AU2005281937B2 (en) Generation of a multichannel encoded signal and decoding of a multichannel encoded signal
CA2554002C (en) Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JP5133401B2 (ja) 出力信号の合成装置及び合成方法
JP4589962B2 (ja) レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP5563647B2 (ja) マルチチャンネル復号化方法及びマルチチャンネル復号化装置
US8687829B2 (en) Apparatus and method for multi-channel parameter transformation
JP4944245B2 (ja) 強化された知覚的品質を備えたステレオ信号を生成する方法及び装置
US8239209B2 (en) Method and apparatus for decoding an audio signal using a rendering parameter
TWI314024B (en) Enhanced method for signal shaping in multi-channel audio reconstruction
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
RU2411693C2 (ru) Генерация декоррелированных сигналов
CN110890101B (zh) 用于基于语音增强元数据进行解码的方法和设备
JP2009522895A (ja) バイノーラルオーディオ信号の復号
TW200926147A (en) Audio coding using downmix
CN101361115A (zh) 解码信号的方法和装置
JP2009500669A (ja) パラメトリック・マルチチャンネル復号化
JP2022529731A (ja) 出力ダウンミックス表現を生成するための装置及びコンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110203

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120619

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20120905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140219

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140428

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140528

R150 Certificate of patent or registration of utility model

Ref document number: 5554065

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees