JP2008522244A - オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング - Google Patents
オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング Download PDFInfo
- Publication number
- JP2008522244A JP2008522244A JP2007544408A JP2007544408A JP2008522244A JP 2008522244 A JP2008522244 A JP 2008522244A JP 2007544408 A JP2007544408 A JP 2007544408A JP 2007544408 A JP2007544408 A JP 2007544408A JP 2008522244 A JP2008522244 A JP 2008522244A
- Authority
- JP
- Japan
- Prior art keywords
- channels
- audio
- audit
- cue
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012550 audit Methods 0.000 claims abstract description 95
- 238000011161 development Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims description 26
- 230000015572 biosynthetic process Effects 0.000 claims description 19
- 238000003786 synthesis reaction Methods 0.000 claims description 19
- 238000004091 panning Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 5
- 238000010988 intraclass correlation coefficient Methods 0.000 description 55
- 210000002370 ICC Anatomy 0.000 description 54
- 230000005236 sound signal Effects 0.000 description 53
- 230000000875 corresponding effect Effects 0.000 description 40
- 238000012545 processing Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 13
- 230000008447 perception Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 210000005069 ears Anatomy 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008450 motivation Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 210000003454 tympanic membrane Anatomy 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000009429 electrical wiring Methods 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000000763 evoking effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本願は、その教示が参照によって本明細書に組み込まれている、弁理士整理番号Faller 19として2004年11月30日に出願した米国仮出願第60/631798号の利益を主張するものである。
本願の主題は、次の米国特許出願の主題に関連し、これらの米国特許出願のすべての教示が、参照によって本明細書に組み込まれている。
○弁理士整理番号Faller 5として2001年5月4日に出願した米国特許出願第09/848877号、
○弁理士整理番号Baumgarte 1−6−8として2001年11月7日に出願した米国特許出願第10/045458号(これ自体は、2001年8月10日に出願した米国仮出願第60/311565号の利益を主張する)、
○弁理士整理番号Baumgarte 2−10として2002年5月24日に出願した米国特許出願第10/155437号、
○弁理士整理番号Baumgarte 3−11として2002年9月18日に出願した米国特許出願第10/246570号、
○弁理士整理番号Baumgarte 7−12として2004年4月1日に出願した米国特許出願第10/815591号、
○弁理士整理番号Baumgarte 8−7−15として2004年9月8日に出願した米国特許出願第10/936464号、
○2004年1月20日に出願した米国特許出願第10/762100号(Faller 13−1)、
○弁理士整理番号Allamanche 1−2−17−3として2004年12月7日に出願した米国特許出願第11/006492号、
○弁理士整理番号Allamanche 2−3−18−4として2004年12月7日に出願した米国特許出願第11/006482号、
○弁理士整理番号Faller 22−5として2005年1月10日に出願した米国特許出願第11/032689号、および、
○弁理士整理番号Faller 20として2005年2月15日に出願した米国特許出願第11/058747号(これ自体は、2004年11月30日に出願した米国仮出願第60/631917号の利益を主張する)。
本願の主題は、次の論文に記載の主題にも関連し、これらの論文のすべての教示が、参照によって本明細書に組み込まれている。
○F.Baumgarte and C.Faller、「Binaural Cue Coding−Part I:Psychoacoustic fundamentals and design principles」、IEEE Trans.on Speech and Audio Proc.,vol.11,no.6、2003年11月、
○C.Faller and F.Baumgarte、「Binaural Cue Coding−Part II:Schemes and applications」、IEEE Trans.on Speech and Audio Proc.,vol.11,no.6、2003年11月、および
○C.Faller、「Coding of spatial audio compatible with different playback formats」、Preprint 117th Conv.Aud.Eng.Soc.、2004年10月。
本発明は、オーディオ信号のエンコーディングと、エンコードされたオーディオ・データからのオーディトリ・シーン(auditory scene)の後続合成とに関する。
図2は、エンコーダ202とデコーダ204とを含む包括的なバイノーラル・キュー・コーディング(BCC)オーディオ処理システム200のブロック図である。エンコーダ202には、ダウンミキサ206とBCCエスティメータ208とが含まれる。
好ましい実施態様では、1つまたは複数の被送出和信号に、入力オーディオ信号の信号成分のすべてが含まれる。目標は、各信号成分が十分に維持されることである。オーディオ入力チャネルの単純な合計は、しばしば、信号成分の増幅または減衰をもたらす。言い換えると、「単純な」和の信号成分の電力は、しばしば、各チャネルの対応する信号成分の電力の和より大きいまたはこれより小さい。和信号の信号成分の電力が、全入力チャネルの対応する電力とほぼ同一になるように和信号を等化するダウンミキシング技法を、使用することができる。
任意選択のスケーリングを提供することに加えて、またはその代わりに、スケーリング/遅延ブロック306は、任意選択として信号に遅延を適用することができる。
各逆フィルタ・バンク308は、周波数領域の対応するスケーリングされた係数
包括的なBCC合成
ここで、UECは、実数値を有するE×Cアップミキシング行列である。周波数領域でアップミキシングを実行することは、アップミキシングを各異なるサブバンドで個別に適用することを可能にする。
単一の和信号を仮定すると、BCCは、ICTD、ICLD、およびICCがオリジナル・オーディオ信号の対応するキューを近似するように、ステレオ・オーディオ信号またはマルチチャネル・オーディオ信号を合成する。次では、オーディトリ・スペイシャル・イメージ(auditory spatial image)属性に関するICTD、ICLD、およびICCの役割を述べる。
次では、ICTD、ICLD、およびICCがどのように推定されるかを説明する。これらの(量子化され、コーディングされた)空間的キューの送出のビットレートは、2〜3kb/sに過ぎないものとすることができ、したがって、BCCを用いると、ステレオ・オーディオ信号およびマルチチャネル・オーディオ信号を、単一オーディオ・チャネルに必要なものに近いビットレートで送出することが可能である。
次の測定値が、2つの(たとえば、ステレオ)オーディオ・チャネルの対応するサブバンド信号
○ICTD[サンプル単位]:
d1=max{−d,0}
d2=max{d,0} (9)
であり、
○ICLD[dB]:
3つ以上の入力チャネルがある場合には、通常、C=5チャネルの場合について図6に示されているように、基準チャネル(たとえば、チャネル番号1)と他のチャネルとの間でICTDおよびICLDを定義することが十分であり、ここで、τ1c(k)およびΔL1c(k)は、それぞれ基準チャネル1とチャネルcとの間のICTDおよびICLDを表す。
図8に、単一の被送出和信号s(n)と空間的キューとを与えられてステレオ・オーディオ信号またはマルチチャネル・オーディオ信号を生成するのにBCCデコーダ内で使用できる、図4のBCCシンセサイザ400の実施態様のブロック図を示す。和信号s(n)は、サブバンドに分解され、ここで、
遅延dcは、次の式(12)に従って、ICTD τ1c(k)から決定される。
出力サブバンド信号が、チャネルcと基準チャネル1との間で所望のICLD ΔL12(k)を有するためには、利得係数acが、次の式(13)を満足しなければならない。
ある種の実施形態で、ICC合成の目的は、ICTDおよびICLDに影響せずに、遅延およびスケーリングが適用された後のサブバンド間の相関を減らすことである。これは、ICTDおよびICLDが、平均変動が各サブバンド内で0になる(聴覚臨界帯域)ように周波数の関数として効果的に変更されるように、図8のフィルタhcを指定することによって達成することができる。
前に説明したように、BCCは、2つ以上の送出チャネルを用いて実施することができる。C個のオーディオ・チャネルを1つの単一(被送出)チャネルではなくE個のチャネルとして表す、C−to−E BCCと表されるBCCの変形形態を説明した。C−to−E BCCには、次の(少なくとも)2つの動機付けがある。
ICTDキュー、ICLDキュー、およびICCキューを定義する方法など、C−to−E BCCの信号処理の詳細は、2004年1月20日に出願した米国特許出願第10/762100号(Faller 13−1)に記載されている。
上で説明したように、従来のC−to−E BCC方式では、エンコーダは、C個のオリジナル・チャネルから統計的なチャネル間差パラメータ(たとえば、ICTDキュー、 ICLDキュー、および/またはICCキュー)を導出する。図6および7A〜Bに表されているように、これらの特定のBCCキューは、オーディトリ・スペイシャル・イメージの作成に使用されるラウドスピーカの個数および位置の関数である。これらのBCCキューは、オーディトリ・スペイシャル・イメージの知覚的属性を直接には表さないので、「非オブジェクト・ベースの」BCCキューと呼ばれる。
図10〜12に、1つの可能な5チャネル・サラウンド構成を示すが、図11Aでは、左ラウドスピーカ(#1)が、中央ラウドスピーカ(#3)の30°左に置かれ、右ラウドスピーカ(#2)が、中央ラウドスピーカの30°右に置かれ、左後ラウドスピーカ(#4)が、中央ラウドスピーカの110°左に置かれ、右後ラウドスピーカ(#5)が、中央ラウドスピーカの110°右に置かれている。
オーディトリ・イベントの幅w(b,k)は、次の式(16)に従って推定することができる。
w(b,k)=1−ICC(b,k) (16)
ここで、ICC(b,k)は、角度α(b,k)によって定義される方向を囲む2つのラウドスピーカの信号の間のコヒーレンス推定値である。
デコーダ処理は、オブジェクト・ベースのBCCキューを、レベル差(ICLD)およびコヒーレンス値(ICC)などの非オブジェクト・ベースのBCCキューに変換し、したがってこれらの非オブジェクト・ベースのBCCキューを従来のBCCデコーダで使用することによって実施することができる。
ΔL12(k)=20log10(a2/a1) (19)
図14に、角度φ0およびφと倍率a1およびa2とを示すが、s(n)は、振幅パニングが倍率a1およびa2に基づいて適用される時に角度φに現れるモノ信号を表す。図15は、φ0=30°の標準的なステレオ構成に関する、式(18)のステレオフォニック正弦法則によるICLDとステレオ・イベント角度φとの間の関係をグラフ的に表す。
本発明を、キュー・コードが1つまたは複数のオーディオ・チャネル(すなわち、E個の被送出チャネル)と共に送出されるBCCコーディング方式の文脈で説明してきたが、代替実施形態では、キュー・コードを、被送出チャネルを既に有し、おそらくは他のBCCコードを既に有する場所(たとえば、デコーダまたはストレージ・デバイス)に送出することができる。
Claims (33)
- オーディオ・チャネルをエンコードする方法であって、
2つ以上のオーディオ・チャネルの1つまたは複数のキュー・コードを生成することであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、生成することと、
前記1つまたは複数のキュー・コードを送出することと
を含む方法。 - 前記2つ以上のオーディオ・チャネルに対応するE個の被送出オーディオ・チャネルを送出することをさらに含み、E≧1である請求項1に記載の発明。
- 前記2つ以上のオーディオ・チャネルは、C個の入力オーディオ・チャネルを含み、C>Eであり、
前記C個の入力チャネルは、前記E個の被送出チャネルを生成するためにダウンミキシングされる
請求項2に記載の発明。 - 前記1つまたは複数のキュー・コードは、デコーダがE個の被送出チャネルのデコーディング中に前記少なくとも1つのオブジェクト・ベースのキュー・コードに基づいて合成処理を実行することを可能にするために送出され、前記E個の被送出オーディオ・チャネルは、前記2つ以上のオーディオ・チャネルに対応し、E≧1である請求項1に記載の発明。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、異なる時刻に異なるサブバンド内で推定される請求項1に記載の発明。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、(1)基準方向に対する相対的な前記オーディトリ・シーン内のオーディトリ・イベントの絶対角度、(2)前記オーディトリ・イベントの幅、(3)前記オーディトリ・シーンのエンベロップメントの度合、および(4)前記オーディトリ・シーンの指向性のうちの複数を含む請求項1に記載の発明。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、基準方向に対する相対的な前記オーディトリ・シーン内のオーディトリ・イベントの絶対角度を含む請求項1に記載の発明。
- 前記オーディトリ・イベントの前記絶対角度は、
(i)前記オーディオ・チャネルの相対電力ベクトルのベクトル和を生成することと、
(ii)前記基準方向に対する相対的な前記ベクトル和の角度に基づいて、前記オーディトリ・イベントの前記絶対角度を決定することと
によって推定される請求項7に記載の発明。 - 前記オーディトリ・イベントの前記絶対角度は、
(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別することと、
(ii)前記2つの最も強いチャネルの間のレベル差を計算することと、
(iii)前記2つの最も強いチャネルの間の相対角度を計算するために振幅パニング・ローを適用することと、
(iv)前記相対角度を前記オーディトリ・イベントの前記絶対角度に変換することと
によって推定される請求項7に記載の発明。 - 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーン内のオーディトリ・イベントの幅を含む請求項1に記載の発明。
- 前記オーディトリ・イベントの前記幅は、
(i)前記オーディトリ・イベントの絶対角度を推定することと、
(ii)前記絶対角度を囲む2つのオーディオ・チャネルを識別することと、
(iii)前記2つの識別されたチャネルの間のコヒーレンスを推定することと、
(iv)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅を計算することと
によって推定される請求項10に記載の発明。 - 前記オーディトリ・イベントの前記幅は、
(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別することと、
(ii)前記2つの最も強いチャネルの間のコヒーレンスを推定することと、
(iii)前記推定されたコヒーレンスに基づいて前記オーディトリ・イベントの前記幅を計算することと
によって推定される請求項10に記載の発明。 - 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーンのエンベロップメントの度合を含む請求項1に記載の発明。
- 前記エンベロップメントの度合は、
(i)オーディオ・チャネルの異なる対の間のコヒーレンスを推定することと、
(ii)前記推定されたコヒーレンスの加重和としてエンベロップメントの前記度合を計算することであって、各推定されたコヒーレンスは、前記対応するオーディオ・チャネル対の電力に基づいて重みを付けられる、計算することと
によって推定される請求項13に記載の発明。 - 前記エンベロップメントの度合は、
(i)前記オーディオ・チャネル内の2つの最も強いチャネルを識別することと、
(ii)前記2つの最も強いチャネルを除くすべてのオーディオ・チャネルの電力に基づいて第1和を生成することと、
(iii)前記2つの最も強いチャネルを含むすべてのオーディオ・チャネルの電力に基づいて第2和を生成することと、
(iv)前記第1和と前記第2和との間の比に基づいてエンベロップメントの前記度合を計算することと
によって推定される請求項13に記載の発明。 - 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーンの指向性を含む請求項1に記載の発明。
- 前記指向性は、
(i)前記オーディトリ・シーン内のオーディトリ・イベントの幅を推定することと、
(ii)前記オーディトリ・シーンのエンベロップメントの度合を推定することと、
(iii)前記幅およびエンベロップメントの前記度合の加重和として前記指向性を計算することと
によって推定される請求項16に記載の発明。 - オーディオ・チャネルをエンコードする装置であって、
2つ以上のオーディオ・チャネルの1つまたは複数のキュー・コードを生成する手段であって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、生成する手段と、
前記1つまたは複数のキュー・コードを送出する手段と
を含む装置。 - E個の被送出オーディオ・チャネルを生成するためにC個の入力オーディオ・チャネルをエンコードする装置であって、
2つ以上のオーディオ・チャネルの1つまたは複数のキュー・コードを生成するように適合されたコード・エスティメータであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、コード・エスティメータと、
前記E個の被送出チャネルを生成するために前記C個の入力チャネルをダウンミキシングするように適合されたダウンミキサであって、C>E≧1であり、前記装置は、デコーダが前記E個の被送出チャネルのデコーディング中に合成処理を実行することを可能にするために前記キュー・コードに関する情報を送出するように適合される、ダウンミキサと
を含む装置。 - 前記装置は、ディジタル・ビデオ・レコーダ、ディジタル・オーディオ・レコーダ、コンピュータ、衛星送信器、ケーブル送信器、地上波放送送信器、ホーム・エンターテイメント・システム、およびムービー・シアター・システムからなる群から選択されたシステムであり、
前記システムは、前記コード・エスティメータと前記ダウンミキサとを含む
請求項19に記載の装置。 - その上にプログラム・コードをエンコードされた機械可読媒体であって、前記プログラム・コードが機械によって実行される時に、前記機械は、オーディオ・チャネルをエンコードする方法を実施し、前記方法は、
2つ以上のオーディオ・チャネルの1つまたは複数のキュー・コードを生成することであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、生成することと、
前記1つまたは複数のキュー・コードを送出することと
を含む機械可読媒体。 - オーディオ・チャネルをエンコードすることによって生成されるエンコードされたオーディオ・ビットストリームであって、
1つまたは複数のキュー・コードは、2つ以上のオーディオ・チャネルについて生成され、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立であり、
E≧1であり、前記2つ以上のオーディオ・チャネルに対応する前記1つまたは複数のキュー・コードおよびE個の被送出オーディオ・チャネルは、前記エンコードされたオーディオ・ビットストリーム内にエンコードされる
エンコードされたオーディオ・ビットストリーム。 - C個の再生オーディオ・チャネルを生成するためにE個の被送出オーディオ・チャネルをデコードする方法であって、C>E≧1であり、
前記E個の被送出オーディオ・チャネルに対応するキュー・コードを受け取ることであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、受け取ることと、
1つまたは複数のアップミキシングされたチャネルを生成するために、前記E個の被送出チャネルのうちの1つまたは複数をアップミキシングすることと、
前記キュー・コードを前記1つまたは複数のアップミキシングされたチャネルに適用することによって、前記C個の再生チャネルのうちの1つまたは複数を合成することと
を含む方法。 - 少なくとも2つの再生チャネルは、
(i)前記再生オーディオ・チャネルをレンダリングするのに使用される2つ以上のラウドスピーカの位置に基づいて、前記少なくとも1つのオブジェクト・ベースのキュー・コードを少なくとも1つの非オブジェクト・ベースのキュー・コードに変換することと、
(ii)前記少なくとも2つの再生チャネルを生成するために、前記少なくとも1つの非オブジェクト・ベースのキュー・コードを少なくとも1つのアップミキシングされたチャネルに適用することと
によって合成される請求項23に記載の発明。 - 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、(1)基準方向に対する相対的な前記オーディトリ・シーン内のオーディトリ・イベントの絶対角度、(2)前記オーディトリ・イベントの幅、(3)前記オーディトリ・シーンのエンベロップメントの度合、および(4)前記オーディトリ・シーンの指向性のうちの1つまたは複数を含み、
前記少なくとも1つの非オブジェクト・ベースのキュー・コードは、(1)チャネル間相関(ICC)コード、チャネル間レベル差(ICLD)コード、およびチャネル間時間差(ICTD)コードのうちの1つまたは複数を含む
請求項24に記載の発明。 - 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、基準方向に対する相対的な前記オーディトリ・シーン内のオーディトリ・イベントの絶対角度を含む請求項23に記載の発明。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーン内のオーディトリ・イベントの幅を含む請求項23に記載の発明。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーンのエンベロップメントの度合を含む請求項23に記載の発明。
- 前記少なくとも1つのオブジェクト・ベースのキュー・コードは、前記オーディトリ・シーンの指向性を含む請求項23に記載の発明。
- C個の再生オーディオ・チャネルを生成するためにE個の被送出オーディオ・チャネルをデコードする装置であって、C>E≧1であり、
前記E個の被送出オーディオ・チャネルに対応するキュー・コードを受け取る手段であって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、受け取る手段と、
1つまたは複数のアップミキシングされたチャネルを生成するために、前記E個の被送出チャネルのうちの1つまたは複数をアップミキシングする手段と、
前記キュー・コードを前記1つまたは複数のアップミキシングされたチャネルに適用することによって、前記C個の再生チャネルのうちの1つまたは複数を合成する手段と
を含む装置。 - C個の再生オーディオ・チャネルを生成するためにE個の被送出オーディオ・チャネルをデコードする装置であって、C>E≧1であり、
前記E個の被送出オーディオ・チャネルに対応するキュー・コードを受け取るように適合されたレシーバであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、レシーバと、
1つまたは複数のアップミキシングされたチャネルを生成するために、前記E個の被送出チャネルのうちの1つまたは複数をアップミキシングするように適合されたアップミキサと、
前記キュー・コードを前記1つまたは複数のアップミキシングされたチャネルに適用することによって、前記C個の再生チャネルのうちの1つまたは複数を合成するように適合されたシンセサイザと
を含む装置。 - 前記装置は、ディジタル・ビデオ・プレイヤ、ディジタル・オーディオ・プレイヤ、コンピュータ、衛星受信器、ケーブル受信器、地上波放送受信器、ホーム・エンターテイメント・システム、およびムービー・シアター・システムからなる群から選択されたシステムであり、
前記システムは、前記レシーバ、前記アップミキサ、および前記シンセサイザを含む
請求項31に記載の装置。 - その上にプログラム・コードをエンコードされた機械可読媒体であって、前記プログラム・コードが機械によって実行される時に、前記機械は、C>E≧1である、C個の再生オーディオ・チャネルを生成するためにE個の被送出オーディオ・チャネルをデコードする方法を実施し、前記方法は、
前記E個の被送出オーディオ・チャネルに対応するキュー・コードを受け取ることであって、少なくとも1つのキュー・コードは、前記オーディオ・チャネルに対応するオーディトリ・シーンの特性を直接に表すオブジェクト・ベースのキュー・コードであり、前記特性は、前記オーディトリ・シーンの作成に使用されるラウドスピーカの個数および位置と独立である、受け取ることと、
1つまたは複数のアップミキシングされたチャネルを生成するために、前記E個の被送出チャネルのうちの1つまたは複数をアップミキシングすることと、
前記キュー・コードを前記1つまたは複数のアップミキシングされたチャネルに適用することによって、前記C個の再生チャネルのうちの1つまたは複数を合成することと
を含む機械可読媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63179804P | 2004-11-30 | 2004-11-30 | |
US60/631,798 | 2004-11-30 | ||
PCT/US2005/042772 WO2006060279A1 (en) | 2004-11-30 | 2005-11-22 | Parametric coding of spatial audio with object-based side information |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008522244A true JP2008522244A (ja) | 2008-06-26 |
JP5106115B2 JP5106115B2 (ja) | 2012-12-26 |
Family
ID=36087701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007544408A Active JP5106115B2 (ja) | 2004-11-30 | 2005-11-22 | オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング |
Country Status (6)
Country | Link |
---|---|
US (1) | US8340306B2 (ja) |
EP (1) | EP1817767B1 (ja) |
JP (1) | JP5106115B2 (ja) |
KR (1) | KR101215868B1 (ja) |
TW (1) | TWI427621B (ja) |
WO (1) | WO2006060279A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010505328A (ja) * | 2006-09-29 | 2010-02-18 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号をエンコーディング及びデコーディングする方法及び装置 |
JP2010521867A (ja) * | 2007-03-16 | 2010-06-24 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
US8463605B2 (en) | 2007-01-05 | 2013-06-11 | Lg Electronics Inc. | Method and an apparatus for decoding an audio signal |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7447317B2 (en) | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
KR100682915B1 (ko) * | 2005-01-13 | 2007-02-15 | 삼성전자주식회사 | 다채널 신호 부호화/복호화 방법 및 장치 |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8917874B2 (en) * | 2005-05-26 | 2014-12-23 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
JP4814344B2 (ja) * | 2006-01-19 | 2011-11-16 | エルジー エレクトロニクス インコーポレイティド | メディア信号の処理方法及び装置 |
CN103366747B (zh) * | 2006-02-03 | 2017-05-17 | 韩国电子通信研究院 | 用于控制音频信号的渲染的设备和方法 |
WO2007091842A1 (en) | 2006-02-07 | 2007-08-16 | Lg Electronics Inc. | Apparatus and method for encoding/decoding signal |
US20070223740A1 (en) * | 2006-02-14 | 2007-09-27 | Reams Robert W | Audio spatial environment engine using a single fine structure |
US7876904B2 (en) | 2006-07-08 | 2011-01-25 | Nokia Corporation | Dynamic decoding of binaural audio signals |
EP2575129A1 (en) | 2006-09-29 | 2013-04-03 | Electronics and Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
WO2008046531A1 (en) * | 2006-10-16 | 2008-04-24 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
WO2008046530A2 (en) | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
US8130966B2 (en) * | 2006-10-31 | 2012-03-06 | Anthony Grimani | Method for performance measurement and optimization of sound systems using a sliding band integration curve |
WO2008060111A1 (en) * | 2006-11-15 | 2008-05-22 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
CN101632117A (zh) | 2006-12-07 | 2010-01-20 | Lg电子株式会社 | 用于解码音频信号的方法和装置 |
KR101086347B1 (ko) * | 2006-12-27 | 2011-11-23 | 한국전자통신연구원 | 부가정보 비트스트림 변환을 포함하는 다양한 채널로구성된 다객체 오디오 신호의 부호화 및 복호화 장치 및방법 |
WO2008100100A1 (en) | 2007-02-14 | 2008-08-21 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
EP2215629A1 (en) * | 2007-11-27 | 2010-08-11 | Nokia Corporation | Multichannel audio coding |
JP5243554B2 (ja) * | 2008-01-01 | 2013-07-24 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
WO2009084919A1 (en) | 2008-01-01 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
JP5122681B2 (ja) * | 2008-05-23 | 2013-01-16 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ |
EP2154911A1 (en) | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
JP5679340B2 (ja) * | 2008-12-22 | 2015-03-04 | コーニンクレッカ フィリップス エヌ ヴェ | 送信効果処理による出力信号の生成 |
US8139773B2 (en) * | 2009-01-28 | 2012-03-20 | Lg Electronics Inc. | Method and an apparatus for decoding an audio signal |
US9888335B2 (en) * | 2009-06-23 | 2018-02-06 | Nokia Technologies Oy | Method and apparatus for processing audio signals |
WO2011021114A1 (en) | 2009-08-20 | 2011-02-24 | Nds Limited | Electronic book security features |
WO2011064438A1 (en) * | 2009-11-30 | 2011-06-03 | Nokia Corporation | Audio zooming process within an audio scene |
JP2015509212A (ja) * | 2012-01-19 | 2015-03-26 | コーニンクレッカ フィリップス エヌ ヴェ | 空間オーディオ・レンダリング及び符号化 |
CA2880412C (en) * | 2012-08-10 | 2019-12-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and methods for adapting audio information in spatial audio object coding |
CN105247613B (zh) | 2013-04-05 | 2019-01-18 | 杜比国际公司 | 音频处理系统 |
RU2628177C2 (ru) | 2013-05-24 | 2017-08-15 | Долби Интернешнл Аб | Способы кодирования и декодирования звука, соответствующие машиночитаемые носители и соответствующие устройство кодирования и устройство декодирования звука |
DE102013223201B3 (de) | 2013-11-14 | 2015-05-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes |
US9552819B2 (en) * | 2013-11-27 | 2017-01-24 | Dts, Inc. | Multiplet-based matrix mixing for high-channel count multichannel audio |
EP2879131A1 (en) | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
CN105657633A (zh) | 2014-09-04 | 2016-06-08 | 杜比实验室特许公司 | 生成针对音频对象的元数据 |
US11128978B2 (en) * | 2015-11-20 | 2021-09-21 | Dolby Laboratories Licensing Corporation | Rendering of immersive audio content |
US10362423B2 (en) | 2016-10-13 | 2019-07-23 | Qualcomm Incorporated | Parametric audio decoding |
EP3765954A4 (en) * | 2018-08-30 | 2021-10-27 | Hewlett-Packard Development Company, L.P. | SPACE CHARACTERISTICS OF MULTI-CHANNEL AUDIO SOURCE |
US11019449B2 (en) | 2018-10-06 | 2021-05-25 | Qualcomm Incorporated | Six degrees of freedom and three degrees of freedom backward compatibility |
DE102021200553B4 (de) * | 2021-01-21 | 2022-11-17 | Kaetel Systems Gmbh | Vorrichtung und Verfahren zum Ansteuern eines Schallerzeugers mit synthetischer Erzeugung des Differenzsignals |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002029808A2 (en) * | 2000-10-04 | 2002-04-11 | University Of Miami | Auxiliary channel masking in an audio signal |
JP2002511683A (ja) * | 1998-04-07 | 2002-04-16 | ドルビー、レイ・ミルトン | 低ビットレート空間符号化方法及び装置 |
WO2003090208A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | pARAMETRIC REPRESENTATION OF SPATIAL AUDIO |
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
WO2004036548A1 (en) * | 2002-10-14 | 2004-04-29 | Thomson Licensing S.A. | Method for coding and decoding the wideness of a sound source in an audio scene |
JP2004193877A (ja) * | 2002-12-10 | 2004-07-08 | Sony Corp | 音像定位信号処理装置および音像定位信号処理方法 |
JP2004535145A (ja) * | 2001-07-10 | 2004-11-18 | コーディング テクノロジーズ アクチボラゲット | 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化 |
Family Cites Families (90)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4236039A (en) * | 1976-07-19 | 1980-11-25 | National Research Development Corporation | Signal matrixing for directional reproduction of sound |
CA1268546A (en) * | 1985-08-30 | 1990-05-01 | Shigenobu Minami | Stereophonic voice signal transmission system |
DE3639753A1 (de) * | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
DE3943879B4 (de) * | 1989-04-17 | 2008-07-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Digitales Codierverfahren |
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
US5703999A (en) * | 1992-05-25 | 1997-12-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels |
DE4236989C2 (de) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US5371799A (en) * | 1993-06-01 | 1994-12-06 | Qsound Labs, Inc. | Stereo headphone sound source localization system |
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
JP3227942B2 (ja) | 1993-10-26 | 2001-11-12 | ソニー株式会社 | 高能率符号化装置 |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3277679B2 (ja) * | 1994-04-15 | 2002-04-22 | ソニー株式会社 | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 |
JPH0969783A (ja) | 1995-08-31 | 1997-03-11 | Nippon Steel Corp | オーディオデータ符号化装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5771295A (en) * | 1995-12-26 | 1998-06-23 | Rocktron Corporation | 5-2-5 matrix system |
US7012630B2 (en) | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
CN1137546C (zh) * | 1996-02-08 | 2004-02-04 | 皇家菲利浦电子有限公司 | 对一组数字信息信号进行编码的装置和方法 |
US5825776A (en) * | 1996-02-27 | 1998-10-20 | Ericsson Inc. | Circuitry and method for transmitting voice and data signals upon a wireless communication channel |
US5889843A (en) * | 1996-03-04 | 1999-03-30 | Interval Research Corporation | Methods and systems for creating a spatial auditory environment in an audio conference system |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
KR0175515B1 (ko) * | 1996-04-15 | 1999-04-01 | 김광호 | 테이블 조사 방식의 스테레오 구현 장치와 방법 |
US6987856B1 (en) * | 1996-06-19 | 2006-01-17 | Board Of Trustees Of The University Of Illinois | Binaural signal processing techniques |
US6697491B1 (en) | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
JP3707153B2 (ja) | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
SG54383A1 (en) * | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
US5912976A (en) * | 1996-11-07 | 1999-06-15 | Srs Labs, Inc. | Multi-channel audio enhancement system for use in recording and playback and methods for providing same |
US6131084A (en) | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6111958A (en) * | 1997-03-21 | 2000-08-29 | Euphonics, Incorporated | Audio spatial enhancement apparatus and methods |
US6236731B1 (en) | 1997-04-16 | 2001-05-22 | Dspfactory Ltd. | Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids |
US5860060A (en) * | 1997-05-02 | 1999-01-12 | Texas Instruments Incorporated | Method for left/right channel self-alignment |
US5946352A (en) * | 1997-05-02 | 1999-08-31 | Texas Instruments Incorporated | Method and apparatus for downmixing decoded data streams in the frequency domain prior to conversion to the time domain |
US6108584A (en) * | 1997-07-09 | 2000-08-22 | Sony Corporation | Multichannel digital audio decoding method and apparatus |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6021389A (en) * | 1998-03-20 | 2000-02-01 | Scientific Learning Corp. | Method and apparatus that exaggerates differences between sounds to train listener to recognize and identify similar sounds |
TW444511B (en) | 1998-04-14 | 2001-07-01 | Inst Information Industry | Multi-channel sound effect simulation equipment and method |
JP3657120B2 (ja) | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
JP2000151413A (ja) | 1998-11-10 | 2000-05-30 | Matsushita Electric Ind Co Ltd | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 |
JP2000152399A (ja) * | 1998-11-12 | 2000-05-30 | Yamaha Corp | 音場効果制御装置 |
US6408327B1 (en) | 1998-12-22 | 2002-06-18 | Nortel Networks Limited | Synthetic stereo conferencing over LAN/WAN |
US6282631B1 (en) * | 1998-12-23 | 2001-08-28 | National Semiconductor Corporation | Programmable RISC-DSP architecture |
ES2208297T3 (es) * | 1999-04-07 | 2004-06-16 | Dolby Laboratories Licensing Corporation | Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal. |
US6539357B1 (en) | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
JP4438127B2 (ja) | 1999-06-18 | 2010-03-24 | ソニー株式会社 | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 |
US6823018B1 (en) | 1999-07-28 | 2004-11-23 | At&T Corp. | Multiple description coding communication system |
US6434191B1 (en) * | 1999-09-30 | 2002-08-13 | Telcordia Technologies, Inc. | Adaptive layered coding for voice over wireless IP applications |
US6614936B1 (en) * | 1999-12-03 | 2003-09-02 | Microsoft Corporation | System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding |
US6498852B2 (en) * | 1999-12-07 | 2002-12-24 | Anthony Grimani | Automatic LFE audio signal derivation system |
US6845163B1 (en) | 1999-12-21 | 2005-01-18 | At&T Corp | Microphone array for preserving soundfield perceptual cues |
DE60042335D1 (de) * | 1999-12-24 | 2009-07-16 | Koninkl Philips Electronics Nv | Mehrkanal-audiosignalverarbeitungsgerät |
US6782366B1 (en) * | 2000-05-15 | 2004-08-24 | Lsi Logic Corporation | Method for independent dynamic range control |
TW507194B (en) * | 2000-05-24 | 2002-10-21 | Nat Science Council | Variable-rate residual-transform vocoders using auditory perception approximation |
JP2001339311A (ja) | 2000-05-26 | 2001-12-07 | Yamaha Corp | オーディオ信号圧縮回路および伸長回路 |
US6850496B1 (en) | 2000-06-09 | 2005-02-01 | Cisco Technology, Inc. | Virtual conference room for voice conferencing |
US6973184B1 (en) | 2000-07-11 | 2005-12-06 | Cisco Technology, Inc. | System and method for stereo conferencing over low-bandwidth links |
US7236838B2 (en) * | 2000-08-29 | 2007-06-26 | Matsushita Electric Industrial Co., Ltd. | Signal processing apparatus, signal processing method, program and recording medium |
JP3426207B2 (ja) | 2000-10-26 | 2003-07-14 | 三菱電機株式会社 | 音声符号化方法および装置 |
TW510144B (en) | 2000-12-27 | 2002-11-11 | C Media Electronics Inc | Method and structure to output four-channel analog signal using two channel audio hardware |
US6885992B2 (en) * | 2001-01-26 | 2005-04-26 | Cirrus Logic, Inc. | Efficient PCM buffer |
US20030007648A1 (en) * | 2001-04-27 | 2003-01-09 | Christopher Currell | Virtual audio system and techniques |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US6934676B2 (en) | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
US7668317B2 (en) * | 2001-05-30 | 2010-02-23 | Sony Corporation | Audio post processing in DVD, DTV and other audio visual products |
TW544654B (en) * | 2001-07-06 | 2003-08-01 | Shyue-Yun Wan | Method of eliminating noise on sound storage and regeneration system |
JP2003044096A (ja) | 2001-08-03 | 2003-02-14 | Matsushita Electric Ind Co Ltd | マルチチャンネルオーディオ信号符号化方法、マルチチャンネルオーディオ信号符号化装置、記録媒体および音楽配信システム |
KR20040029113A (ko) * | 2001-08-27 | 2004-04-03 | 더 리전트 오브 더 유니버시티 오브 캘리포니아 | 주파수-진폭-변조-인코딩(fame) 방법들을 사용하여음향 신호들을 개선하기 위한 장치/방법, 및 인공와우이식기 |
WO2003069954A2 (en) | 2002-02-18 | 2003-08-21 | Koninklijke Philips Electronics N.V. | Parametric audio coding |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
WO2003094369A2 (en) | 2002-05-03 | 2003-11-13 | Harman International Industries, Incorporated | Multi-channel downmixing device |
US6940540B2 (en) * | 2002-06-27 | 2005-09-06 | Microsoft Corporation | Speaker detection and tracking using audiovisual data |
CN100539742C (zh) * | 2002-07-12 | 2009-09-09 | 皇家飞利浦电子股份有限公司 | 多声道音频信号编解码方法和装置 |
BR0305555A (pt) | 2002-07-16 | 2004-09-28 | Koninkl Philips Electronics Nv | Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado |
JP4649208B2 (ja) * | 2002-07-16 | 2011-03-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオコーディング |
US7644001B2 (en) | 2002-11-28 | 2010-01-05 | Koninklijke Philips Electronics N.V. | Differentially coding an audio signal |
EP1595247B1 (en) * | 2003-02-11 | 2006-09-13 | Koninklijke Philips Electronics N.V. | Audio coding |
FI118247B (fi) | 2003-02-26 | 2007-08-31 | Fraunhofer Ges Forschung | Menetelmä luonnollisen tai modifioidun tilavaikutelman aikaansaamiseksi monikanavakuuntelussa |
EP1600984B1 (en) * | 2003-03-03 | 2012-08-08 | Mitsubishi Heavy Industries, Ltd. | Cask, composition for neutron shielding body, and method of manufacturing the neutron shielding body |
US20060171542A1 (en) | 2003-03-24 | 2006-08-03 | Den Brinker Albertus C | Coding of main and side signal representing a multichannel signal |
US7343291B2 (en) * | 2003-07-18 | 2008-03-11 | Microsoft Corporation | Multi-pass variable bitrate media encoding |
US20050069143A1 (en) * | 2003-09-30 | 2005-03-31 | Budnikov Dmitry N. | Filtering for spatial audio rendering |
US7672838B1 (en) * | 2003-12-01 | 2010-03-02 | The Trustees Of Columbia University In The City Of New York | Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
US7761289B2 (en) * | 2005-10-24 | 2010-07-20 | Lg Electronics Inc. | Removing time delays in signal paths |
-
2005
- 2005-11-22 EP EP05852198.0A patent/EP1817767B1/en active Active
- 2005-11-22 JP JP2007544408A patent/JP5106115B2/ja active Active
- 2005-11-22 KR KR1020077015056A patent/KR101215868B1/ko active IP Right Grant
- 2005-11-22 WO PCT/US2005/042772 patent/WO2006060279A1/en active Application Filing
- 2005-11-22 US US11/667,747 patent/US8340306B2/en not_active Expired - Fee Related
- 2005-11-28 TW TW094141787A patent/TWI427621B/zh not_active IP Right Cessation
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002511683A (ja) * | 1998-04-07 | 2002-04-16 | ドルビー、レイ・ミルトン | 低ビットレート空間符号化方法及び装置 |
WO2002029808A2 (en) * | 2000-10-04 | 2002-04-11 | University Of Miami | Auxiliary channel masking in an audio signal |
JP2004535145A (ja) * | 2001-07-10 | 2004-11-18 | コーディング テクノロジーズ アクチボラゲット | 低ビットレートオーディオ符号化用の効率的かつスケーラブルなパラメトリックステレオ符号化 |
WO2003090208A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | pARAMETRIC REPRESENTATION OF SPATIAL AUDIO |
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
WO2004036548A1 (en) * | 2002-10-14 | 2004-04-29 | Thomson Licensing S.A. | Method for coding and decoding the wideness of a sound source in an audio scene |
JP2004193877A (ja) * | 2002-12-10 | 2004-07-08 | Sony Corp | 音像定位信号処理装置および音像定位信号処理方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8504376B2 (en) | 2006-09-29 | 2013-08-06 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
JP2010505328A (ja) * | 2006-09-29 | 2010-02-18 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号をエンコーディング及びデコーディングする方法及び装置 |
US7979282B2 (en) | 2006-09-29 | 2011-07-12 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US7987096B2 (en) | 2006-09-29 | 2011-07-26 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
JP4787362B2 (ja) * | 2006-09-29 | 2011-10-05 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号をエンコーディング及びデコーディングする方法及び装置 |
US9792918B2 (en) | 2006-09-29 | 2017-10-17 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US9384742B2 (en) | 2006-09-29 | 2016-07-05 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US8625808B2 (en) | 2006-09-29 | 2014-01-07 | Lg Elecronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US8762157B2 (en) | 2006-09-29 | 2014-06-24 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
US8463605B2 (en) | 2007-01-05 | 2013-06-11 | Lg Electronics Inc. | Method and an apparatus for decoding an audio signal |
US8725279B2 (en) | 2007-03-16 | 2014-05-13 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US8712060B2 (en) | 2007-03-16 | 2014-04-29 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
US9373333B2 (en) | 2007-03-16 | 2016-06-21 | Lg Electronics Inc. | Method and apparatus for processing an audio signal |
JP2010521867A (ja) * | 2007-03-16 | 2010-06-24 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
Also Published As
Publication number | Publication date |
---|---|
TWI427621B (zh) | 2014-02-21 |
TW200636677A (en) | 2006-10-16 |
WO2006060279A1 (en) | 2006-06-08 |
EP1817767A1 (en) | 2007-08-15 |
KR101215868B1 (ko) | 2012-12-31 |
KR20070086851A (ko) | 2007-08-27 |
JP5106115B2 (ja) | 2012-12-26 |
US20080130904A1 (en) | 2008-06-05 |
EP1817767B1 (en) | 2015-11-11 |
US8340306B2 (en) | 2012-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5106115B2 (ja) | オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング | |
JP4856653B2 (ja) | 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング | |
JP5017121B2 (ja) | 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化 | |
CA2593290C (en) | Compact side information for parametric coding of spatial audio | |
CA2582485C (en) | Individual channel shaping for bcc schemes and the like |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121002 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5106115 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151012 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |