JP6049762B2 - オーディオ処理 - Google Patents
オーディオ処理 Download PDFInfo
- Publication number
- JP6049762B2 JP6049762B2 JP2014556112A JP2014556112A JP6049762B2 JP 6049762 B2 JP6049762 B2 JP 6049762B2 JP 2014556112 A JP2014556112 A JP 2014556112A JP 2014556112 A JP2014556112 A JP 2014556112A JP 6049762 B2 JP6049762 B2 JP 6049762B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- channel
- downmix
- mixing
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 86
- 238000002156 mixing Methods 0.000 claims description 143
- 239000011159 matrix material Substances 0.000 claims description 56
- 238000000034 method Methods 0.000 claims description 28
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000012937 correction Methods 0.000 claims description 13
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 230000003595 spectral effect Effects 0.000 claims description 11
- 238000000354 decomposition reaction Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 8
- 238000012986 modification Methods 0.000 claims description 7
- 230000004048 modification Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 3
- 238000001308 synthesis method Methods 0.000 claims description 3
- 230000001360 synchronised effect Effects 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000005236 sound signal Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 231100000989 no adverse effect Toxicity 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Description
本願は2012年2月24日に出願された米国仮特許出願第61/603,001号および2012年5月11日に出願された米国仮特許出願第61/645,809号の優先権を主張するものである。両出願の内容はここに参照によってその全体において組み込まれる。
本稿に開示される発明は、概括的には多チャネル・オーディオ符号化に、より詳細にはパラメトリック多チャネル・オーディオ・エンコードおよびデコードのための技法に関する。
本発明のある例示的な実施形態は、パラメトリック符号化された多チャネル・オーディオの分解および合成を可能にする方法および装置を提案する。本発明のある例示的な実施形態は、独立請求項に記載される特徴をもつ、空間的合成方法、空間的分解方法およびそれらの方法を実行するための装置およびコンピュータ・プログラム・プロダクトを提供する。
・前記mチャネル・ダウンミックス信号を受領し、前記ダウンミックス信号のクロスミックスおよび非線形処理によって得られる修正されたダウンミックス信号Dを出力するダウンミックス修正処理器と;
・前記ダウンミックス信号および前記修正されたダウンミックス信号を受領し、前記ダウンミックス信号チャネルおよび前記修正されたダウンミックス信号チャネルのみのnチャネル線形結合を形成し、これを前記nチャネル・アップミックス信号として出力する第一の混合行列とを有する。
図1は、オーディオ処理システム100としての本発明のある例示的実施形態をブロック図の形で示している。ビットストリームPから、オーディオ・デコーダ140はダウンミックス信号X=[l0 r0]Tおよび混合パラメータα1、α2、α3、β1、β2、β3、g、k1、k2を抽出する。これらの混合パラメータは、ビットストリームP中のそれぞれの混合パラメータ・データ・フィールドにおいて量子化された形で含まれる。本開示のいくつかの事例では、いくつかの接続線は、多チャネル信号を伝送するよう適応されていることが明示的に示されている。その場合、これらの線はそれぞれのチャネル数に隣接して横断線を付されている。図1に示したシステムでは、ダウンミックス信号Xは二つのチャネルを含み、下記で定義するアップミックス信号Yは六つのチャネルを含む。よって、m=2、n=6である。混合パラメータにパラメトリックに依存する動作をするアップミックス段110は、ダウンミックス信号を受領する。ダウンミックス修正処理器120が前記ダウンミックス信号を、非線形処理によっておよび前記ダウンミックス信号の線形結合を形成することによって修正し、それにより修正されたダウンミックス信号D=[d1 d2]Tを得る。第一の混合行列130はダウンミックス信号Xおよび修正されたダウンミックス信号Dを受領して、次の線形結合を形成することによって、アップミックス信号Y=[lf ls rf rs c lfe]Tを出力する。
上記の式に示される線形結合に戻ると、さらに、利得パラメータk1、k2はビットストリームP中の共通の単一の混合パラメータに依存しうることがわかる。
本発明のさらなる実施形態が、上記の記述を吟味したあとでは、当業者に明白となるであろう。たとえ本稿および図面が実施形態および例を開示しているとしても、本発明はこれらの個別的な例に制約されるものではない。付属の請求項によって定義される本発明の範囲から外れることなく数多くの修正および変形ができる。請求項に参照符号があったとしても、その範囲を限定するものと理解されることはない。
いくつかの実施例を記載しておく。
〔付番実施例1〕
空間的合成を実行するためのオーディオ処理システム(100)であって、
当該システムは、デコードされたmチャネル・ダウンミックス信号(X)を受領し、それに基づいて、nチャネル・アップミックス信号(Y)を出力するアップミックス段(110)を有しており、2≦m<nであり、前記アップミックス段は:
前記mチャネル・ダウンミックス信号を受領し、前記ダウンミックス信号のクロスミックスおよび非線形処理によって得られる修正されたダウンミックス信号(d 1 ,d 2 ;D)を出力するダウンミックス修正処理器(120)と;
前記ダウンミックス信号および前記修正されたダウンミックス信号を受領し、前記ダウンミックス信号チャネルおよび修正されたダウンミックス信号チャネルのみのnチャネル線形結合を形成し、これを前記nチャネル・アップミックス信号として出力する第一の混合行列(130)とを有する、
オーディオ処理システム。
〔付番実施例2〕
前記第一の混合行列が、前記第一の混合行列によって実行される前記線形結合における少なくとも一つの利得を制御する一つまたは複数の混合パラメータ(α 1 、α 2 、α 3 、β 1 、β 2 、β 3 、g、k 1 、k 2 )を受け容れる、付番実施例1記載のオーディオ処理システム。
〔付番実施例3〕
付番実施例2記載のオーディオ処理システムであって;
前記第一の混合行列が量子化されたフォーマットで前記混合パラメータを受け容れ;
前記nチャネル・アップミックス信号は、前記ダウンミックス信号および前記修正されたダウンミックス信号両方の線形結合として得られるチャネルのセットを含み;
前記第一の混合行列によって実行される前記線形結合において、チャネルの前記セットを得るために適用されるすべての利得は前記混合パラメータのうち一つまたは複数の混合パラメータの多項式であり、各多項式の次数は2以下である、
オーディオ処理システム。
〔付番実施例4〕
付番実施例2記載のオーディオ処理システムであって;
前記第一の混合行列が量子化されたフォーマットで前記混合パラメータを受け容れ;
前記第一の混合行列によって実行される前記線形結合において、前記ダウンミックス信号中のチャネルに適用されるすべての利得は前記混合パラメータのうち一つまたは複数の混合パラメータの多項式であり、各多項式の次数は2に等しい、
オーディオ処理システム。
〔付番実施例5〕
付番実施例2ないし4のうちいずれか一項記載のオーディオ処理システムであって;
前記第一の混合行列が量子化されたフォーマットで前記混合パラメータを受け容れ;
前記修正されたダウンミックス信号中のチャネルに適用されるすべての利得は前記混合パラメータのうち一つまたは複数の混合パラメータの多項式であり、各多項式の次数は1以下である、
オーディオ処理システム。
〔付番実施例6〕
付番実施例2記載のオーディオ処理システムであって、前記ダウンミックス信号中のあるチャネルからの、前記アップミックス信号中の空間的に対応するチャネルへの寄与は、混合パラメータ(g)によって個々に制御可能であり、前記ダウンミックス信号中の同じチャネルへの他の任意の寄与は一様に量子化された混合パラメータ(α 1 、α 2 、α 3 、β 1 、β 2 、β 3 )によって制御可能である、オーディオ処理システム。
〔付番実施例7〕
付番実施例2ないし6のうちいずれか一項記載のオーディオ処理システムであって、
前記混合パラメータの一つは二つの利得パラメータ(k 1 、k 2 )をエンコードし;
前記第一の混合行列によって実行される前記線形結合における一つまたは複数の利得は、これら二つの利得パラメータの一つに線形に依存する、
オーディオ処理システム。
〔付番実施例8〕
付番実施例2ないし7のうちいずれか一項記載のオーディオ処理システムであって、
前記アップミックス段は、ダウンミックスおよびアップミックス信号の周波数領域表現に対して作用するよう構成されており、
各信号および各混合パラメータは時間フレームにセグメント分割され、複数の周波数サブバンドを含み、すべての信号は、各時間フレームについて、第一の単一のサブバンド構成を共有し、すべての混合パラメータは、各時間フレームについて、第二の単一のサブバンド構成を共有し、
前記第二のサブバンド構成は、前記第一の混合行列によって実行される前記線形結合において前記信号の関連する周波数サブバンドに適用される利得を制御する前記混合パラメータの周波数サブバンドを定義する、
オーディオ処理システム。
〔付番実施例9〕
前記混合パラメータのうち少なくとも一つの混合パラメータのすべての周波数サブバンドが一様な分解能に関して量子化される、付番実施例8記載のオーディオ処理システム。
〔付番実施例10〕
前記一様な分解能が、前記混合パラメータのすべての周波数サブバンドに共通である、付番実施例9記載のオーディオ処理システム。
〔付番実施例11〕
前記第一の混合行列によって、前記アップミックス信号を、すべての周波数サブバンドについて定性的に一様な仕方で生成するよう構成されている、付番実施例8ないし10のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例12〕
付番実施例8ないし11のうちいずれか一項記載のオーディオ処理システムであって、前記ダウンミックスおよびアップミックス信号の部分的に複素な周波数領域表現に対して作用するよう構成されており、前記部分的に複素な周波数領域表現のそれぞれは、
・上周波数範囲においては、多次元空間の第一の部分空間において表現された対応する信号のスペクトル内容を表わす第一のスペクトル成分を、
・下周波数範囲においては、前記第一のスペクトル成分に加えて、前記多次元空間の、前記第一の部分空間には含まれない部分を含む前記多次元空間の第二の部分空間おいて表現された対応する信号のスペクトル内容を表わす第二のスペクトル成分を含む、
オーディオ処理システム。
〔付番実施例13〕
前記部分的に複素な周波数領域表現のそれぞれは:前記上周波数範囲において臨界サンプリングされる、付番実施例12記載のオーディオ処理システム。
〔付番実施例14〕
付番実施例2ないし13のうちいずれか一項記載のオーディオ処理システムであって、前記ダウンミックス修正処理器は:
前記mチャネル・ダウンミックス信号を受領し、前記ダウンミックス信号チャネルの線形結合を形成し、これをmチャネル中間信号(Z)として出力する第二の混合行列(121)と;
前記mチャネル中間信号を受領し、m個の脱相関されたチャネルを含む前記修正されたダウンミックス信号を出力する脱相関器(122)とを有しており、
前記第二の混合行列は、前記一つまたは複数の混合パラメータの少なくとも一つを受け容れるよう構成されており、前記少なくとも一つの混合パラメータは、前記第二の混合行列によって実行される前記線形結合における少なくとも一つの係数を制御する、
オーディオ処理システム。
〔付番実施例15〕
前記脱相関器が、それぞれが対応する信号チャネルに関連付けられたm個の同一の構成のサブ脱相関器(123、124)を含む、付番実施例14記載のオーディオ処理システム。
〔付番実施例16〕
前記脱相関器が、実数値の係数をもつ少なくとも一つ無限インパルス応答ラティス・フィルタを含み、前記無限インパルス応答ラティス・フィルタは前記中間信号のチャネルを受領し、前記修正されたダウンミックス信号のチャネルの一つを出力する、付番実施例14または15記載のオーディオ処理システム。
〔付番実施例17〕
前記脱相関器は、前記中間信号における音の終わりを検出し、それに応答して是正動作を行なうよう構成されたアーチファクト減衰器(125)を有する、付番実施例14ないし16のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例18〕
前記ダウンミックス信号をエンコードするビットストリーム(P)を受領し、それに基づいて前記デコードされたmチャネル・ダウンミックス信号を出力するオーディオ・デコーダ(140)をさらに有する、付番実施例1ないし17のうちいずれか一項記載のオーディオ処理システム。
〔付番実施例19〕
空間的合成方法であって、
ダウンミックス修正処理器において、mチャネル・ダウンミックス信号(X)を、前記ダウンミックス信号のクロスミックスおよび非線形処理によって修正して、修正されたダウンミックス信号を得る段階と;
第一の混合行列において、前記ダウンミックス信号および前記修正されたダウンミックス信号のnチャネル線形結合を形成し、これをnチャネル・アップミックス信号(Y)として出力する段階とを含み、2≦m<nである、
方法。
〔付番実施例20〕
空間的分解を実行するオーディオ処理システム(400)であって:
nチャネル入力信号(Y)を受領し、前記nチャネル信号中のチャネルのmチャネル線形結合を形成し、これをmチャネル出力信号(X)として出力するダウンミックス段(410)であって、2≦m<nである、ダウンミックス段と;
前記nチャネル入力信号(Y)を受領し、空間的合成オーディオ処理システムによって実行される線形結合における少なくとも一つの利得を制御する一つまたは複数の混合パラメータ(α 1 、α 2 、α 3 、β 1 、β 2 、β 3 、g、k 1 、k 2 )を出力するパラメータ抽出器(420)であって、前記線形結合は少なくとも前記mチャネル出力信号および前記mチャネル出力信号の非線形処理から帰結する信号を含む、パラメータ抽出器とを有しており、
前記ダウンミックス段および前記パラメータ抽出器は独立に動作する、
オーディオ処理システム。
〔付番実施例21〕
前記ダウンミックス段および前記パラメータ抽出器がいずれも、前記ダウンミックス段における前記mチャネル線形結合の形成を定量的に制御するダウンミックス指定へのアクセスをもつ、付番実施例20記載のオーディオ処理システム。
〔付番実施例22〕
前記ダウンミックス段は前記信号の時間領域表現に対して作用するよう構成されている、付番実施例20または21記載のオーディオ処理システム。
〔付番実施例23〕
空間的分解方法であって:
ダウンミックス段において、nチャネル入力信号(Y)中のチャネルのmチャネル線形結合を形成して、mチャネル出力信号(X)を得る段階であって、2≦m<nである、段階と;
前記ダウンミックス段とは独立に動作するパラメータ抽出器において、空間的合成の際に実行される線形結合における少なくとも一つの利得を制御する一つまたは複数の混合パラメータ(α 1 、α 2 、α 3 、β 1 、β 2 、β 3 、g、k 1 、k 2 )を抽出する段階であって、前記線形結合は少なくとも前記mチャネル出力信号および前記mチャネル出力信号の非線形処理から帰結する信号を含む、段階とを含む、
方法。
〔付番実施例24〕
付番実施例19または23記載の方法を実行するためのコンピュータ可読命令をもつコンピュータ可読媒体を含むコンピュータ・プログラム・プロダクト。
〔付番実施例25〕
m=2かつn=6である、付番実施例1ないし24のうちいずれか一項記載の方法または装置。
Claims (20)
- 空間的合成を実行するためのオーディオ処理システムであって、
当該システムは、ダウンミックス信号をエンコードするビットストリーム(P)を受領し、それに基づいてデコードされたmチャネル・ダウンミックス信号を出力するオーディオ・デコーダ(140)と、前記デコードされたmチャネル・ダウンミックス信号を受領し、それに基づいて、nチャネル・アップミックス信号を出力するアップミックス段を有しており、2≦m<nであり、前記アップミックス段は:
前記mチャネル・ダウンミックス信号を受領し、修正されたmチャネル・ダウンミックス信号を出力するダウンミックス修正処理器であって、前記ダウンミックス修正処理器は前記ダウンミックス信号をクロスミックスし、非線形な仕方で処理するよう適応されている、ダウンミックス修正処理器と;
前記ダウンミックス信号および前記修正されたダウンミックス信号を受領する第一の混合行列であって、前記mチャネル・ダウンミックス信号および修正されたダウンミックス信号のみのnチャネル線形結合を実行するよう適応されており、前記nチャネル・アップミックス信号を出力する第一の混合行列とを有しており、
前記第一の混合行列が、前記第一の混合行列によって実行される前記線形結合における少なくとも一つの利得を制御する一つまたは複数の混合パラメータを受領するよう構成されており、
前記混合パラメータは量子化されたフォーマットであり;
前記nチャネル・アップミックス信号は、前記ダウンミックス信号および前記修正されたダウンミックス信号両方の線形結合として得られるチャネルのセットを含み;
前記第一の混合行列によって実行される前記線形結合において、チャネルの前記セットを得るために適用されるすべての利得は前記混合パラメータのうち一つまたは複数の混合パラメータの多項式であり、各多項式の次数は2以下である、
オーディオ処理システム。 - 請求項1記載のオーディオ処理システムであって;
前記第一の混合行列が量子化されたフォーマットで前記混合パラメータを受領するよう適応されており;
前記第一の混合行列によって実行される前記線形結合において、前記ダウンミックス信号中のチャネルに適用されるすべての利得は前記混合パラメータのうち一つまたは複数の混合パラメータの多項式であり、各多項式の次数は2に等しい、
オーディオ処理システム。 - 請求項1ないし2のうちいずれか一項記載のオーディオ処理システムであって;
前記第一の混合行列が量子化されたフォーマットで前記混合パラメータを受領するよう適応されており;
前記修正されたダウンミックス信号中のチャネルに適用されるすべての利得は前記混合パラメータのうち一つまたは複数の混合パラメータの多項式であり、各多項式の次数は1以下である、
オーディオ処理システム。 - 請求項1記載のオーディオ処理システムであって、前記ダウンミックス信号中のあるチャネルからの、前記アップミックス信号中の空間的に対応するチャネルへの寄与は、混合パラメータ(g)によって個々に制御可能であり、前記ダウンミックス信号中の同じチャネルへの他の任意の寄与は一様に量子化された混合パラメータ(α1、α2、α3、β1、β2、β3)によって制御可能である、オーディオ処理システム。
- 請求項1ないし4のうちいずれか一項記載のオーディオ処理システムであって、
前記混合パラメータの一つは二つの利得パラメータ(k1、k2)をエンコードし;
前記第一の混合行列によって実行される前記線形結合における一つまたは複数の利得は、これら二つの利得パラメータの一つに線形に依存する、
オーディオ処理システム。 - 請求項1ないし5のうちいずれか一項記載のオーディオ処理システムであって、
前記アップミックス段は、ダウンミックスおよびアップミックス信号の周波数領域表現に対して作用するよう構成されており、
各信号および各混合パラメータは時間フレームにセグメント分割され、複数の周波数サブバンドを含み、すべての信号は、各時間フレームについて、第一の単一のサブバンド構成を共有し、すべての混合パラメータは、各時間フレームについて、第二の単一のサブバンド構成を共有し、
前記第二のサブバンド構成は、前記第一の混合行列によって実行される前記線形結合において前記信号の関連する周波数サブバンドに適用される利得を制御する前記混合パラメータの周波数サブバンドを定義する、
オーディオ処理システム。 - 前記混合パラメータのうち少なくとも一つの混合パラメータのすべての周波数サブバンドが一様な分解能に関して量子化される、請求項6記載のオーディオ処理システム。
- 前記一様な分解能が、前記混合パラメータのすべての周波数サブバンドに共通である、請求項7記載のオーディオ処理システム。
- 前記第一の混合行列によって、前記アップミックス信号を、すべての周波数サブバンドについて定性的に一様な仕方で生成するよう構成されている、請求項6ないし8のうちいずれか一項記載のオーディオ処理システム。
- 請求項6ないし9のうちいずれか一項記載のオーディオ処理システムであって、前記ダウンミックスおよびアップミックス信号の部分的に複素な周波数領域表現に対して作用するよう構成されており、前記部分的に複素な周波数領域表現のそれぞれは、
・上周波数範囲においては、多次元空間の第一の部分空間において表現された対応する信号のスペクトル内容を表わす第一のスペクトル成分を、
・下周波数範囲においては、前記第一のスペクトル成分に加えて、前記多次元空間の、前記第一の部分空間には含まれない部分を含む前記多次元空間の第二の部分空間おいて表現された対応する信号のスペクトル内容を表わす第二のスペクトル成分を含む、
オーディオ処理システム。 - 前記部分的に複素な周波数領域表現のそれぞれは:前記上周波数範囲において臨界サンプリングされる、請求項10記載のオーディオ処理システム。
- 請求項1ないし11のうちいずれか一項記載のオーディオ処理システムであって、前記ダウンミックス修正処理器は:
前記mチャネル・ダウンミックス信号を受領し、前記ダウンミックス信号チャネルの線形結合を形成し、これをmチャネル中間信号(Z)として出力する第二の混合行列(121)と;
前記mチャネル中間信号を受領し、m個の脱相関されたチャネルを含む前記修正されたダウンミックス信号を出力する脱相関器(122)とを有しており、
前記第二の混合行列は、前記一つまたは複数の混合パラメータの少なくとも一つを受け容れるよう構成されており、前記少なくとも一つの混合パラメータは、前記第二の混合行列によって実行される前記線形結合における少なくとも一つの係数を制御する、
オーディオ処理システム。 - 前記脱相関器が、それぞれが対応する信号チャネルに関連付けられたm個の同一の構成のサブ脱相関器(123、124)を含む、請求項12記載のオーディオ処理システム。
- 前記脱相関器が、実数値の係数をもつ少なくとも一つ無限インパルス応答ラティス・フィルタを含み、前記無限インパルス応答ラティス・フィルタは前記中間信号のチャネルを受領し、前記修正されたダウンミックス信号のチャネルの一つを出力する、請求項12または13記載のオーディオ処理システム。
- 前記脱相関器は、前記中間信号における音の終わりを検出し、それに応答して是正動作を行なうよう構成されたアーチファクト減衰器(125)を有する、請求項12ないし14のうちいずれか一項記載のオーディオ処理システム。
- 空間的合成方法であって、
オーディオ・デコーダによって、ダウンミックス信号をエンコードするビットストリーム(P)を受領し、それに基づいてデコードされたmチャネル・ダウンミックス信号を出力する段階と;
ダウンミックス修正処理器において、前記mチャネル・ダウンミックス信号を、前記ダウンミックス信号のクロスミックスおよび非線形処理によって修正して、修正されたダウンミックス信号を得る段階と;
第一の混合行列において、前記ダウンミックス信号および前記修正されたダウンミックス信号のnチャネル線形結合を形成し、これをnチャネル・アップミックス信号として出力する段階とを含み、2≦m<nであり、
前記第一の混合行列において、前記第一の混合行列によって実行される前記線形結合における少なくとも一つの利得を制御する一つまたは複数の混合パラメータを受領し、前記第一の混合行列は量子化されたフォーマットであり;
前記nチャネル・アップミックス信号は、前記ダウンミックス信号および前記修正されたダウンミックス信号両方の線形結合として得られるチャネルのセットを含み;
前記第一の混合行列によって実行される前記線形結合において、チャネルの前記セットを得るために適用されるすべての利得は前記混合パラメータのうち一つまたは複数の混合パラメータの多項式であり、各多項式の次数は2以下である、
方法。 - 空間的分解および空間的合成を実行するオーディオ処理システムであって:
当該システムは、空間的分解システムおよび空間的合成システムを有しており、
前記空間的分解システムは:
nチャネル入力信号を受領し、前記nチャネル信号中のチャネルのmチャネル線形結合を形成し、これをmチャネル出力信号として出力するダウンミックス段であって、2≦m<nである、ダウンミックス段と;
前記nチャネル入力信号を受領し、前記空間的合成システムにおける少なくとも一つの利得を制御するよう適応された一つまたは複数の混合パラメータを出力するパラメータ抽出器とを有しており、
前記ダウンミックス段および前記パラメータ抽出器は、前記ダウンミックス段および前記パラメータ抽出器の間の情報交換なしにおよび/または前記ダウンミックス段および前記パラメータ抽出器が同期されることなしに、並列に動作し、
前記空間的合成システムは:
前記mチャネル・ダウンミックス信号を受領し、それに基づいて、nチャネル・アップミックス信号を出力するアップミックス段を有しており、2≦m<nであり、前記アップミックス段は:
前記mチャネル・ダウンミックス信号を受領し、修正されたmチャネル・ダウンミックス信号を出力するダウンミックス修正処理器であって、前記ダウンミックス修正処理器は前記ダウンミックス信号をクロスミックスし、非線形な仕方で処理するよう適応されている、ダウンミックス修正処理器と;
前記mチャネル・ダウンミックス信号および修正されたダウンミックス信号のnチャネル線形結合を実行するよう適応されており、前記nチャネル・アップミックス信号を出力する第一の混合行列とを有しており、
前記第一の混合行列が、前記第一の混合行列によって実行される前記線形結合における前記利得を制御する一つまたは複数の混合パラメータを受領するよう構成されており、前記混合パラメータは量子化されたフォーマットであり、
前記nチャネル・アップミックス信号は、前記ダウンミックス信号および前記修正されたダウンミックス信号両方の線形結合として得られるチャネルのセットを含み;
前記第一の混合行列によって実行される前記線形結合において、チャネルの前記セットを得るために適用されるすべての利得は前記混合パラメータのうち一つまたは複数の混合パラメータの多項式であり、各多項式の次数は2以下である、
オーディオ処理システム。 - 前記ダウンミックス段および前記パラメータ抽出器がいずれも、前記ダウンミックス段における前記mチャネル線形結合の形成を定量的に制御するダウンミックス指定へのアクセスをもつ、請求項17記載のオーディオ処理システム。
- 前記ダウンミックス段は前記信号の時間領域表現に対して作用するよう構成されている、請求項17または18記載のオーディオ処理システム。
- 請求項16記載の方法を実行するためのコンピュータ可読命令をもつコンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261603001P | 2012-02-24 | 2012-02-24 | |
US61/603,001 | 2012-02-24 | ||
US201261645809P | 2012-05-11 | 2012-05-11 | |
US61/645,809 | 2012-05-11 | ||
PCT/EP2013/053610 WO2013124446A1 (en) | 2012-02-24 | 2013-02-22 | Audio processing |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015506653A JP2015506653A (ja) | 2015-03-02 |
JP6049762B2 true JP6049762B2 (ja) | 2016-12-21 |
Family
ID=47754490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014556112A Active JP6049762B2 (ja) | 2012-02-24 | 2013-02-22 | オーディオ処理 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9728194B2 (ja) |
EP (1) | EP2817802B1 (ja) |
JP (1) | JP6049762B2 (ja) |
CN (1) | CN104160442B (ja) |
WO (1) | WO2013124446A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6212645B2 (ja) * | 2013-09-12 | 2017-10-11 | ドルビー・インターナショナル・アーベー | オーディオ・デコード・システムおよびオーディオ・エンコード・システム |
JP6201047B2 (ja) | 2013-10-21 | 2017-09-20 | ドルビー・インターナショナル・アーベー | オーディオ信号のパラメトリック再構成のための脱相関器構造 |
RU2704266C2 (ru) * | 2014-10-31 | 2019-10-25 | Долби Интернешнл Аб | Параметрическое кодирование и декодирование многоканальных аудиосигналов |
KR101964107B1 (ko) | 2015-02-18 | 2019-04-01 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 신호를 필터링하기 위한 오디오 신호 처리 장치 및 방법 |
KR102051436B1 (ko) | 2015-04-30 | 2019-12-03 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 신호 처리 장치들 및 방법들 |
US10115403B2 (en) * | 2015-12-18 | 2018-10-30 | Qualcomm Incorporated | Encoding of multiple audio signals |
US11234072B2 (en) | 2016-02-18 | 2022-01-25 | Dolby Laboratories Licensing Corporation | Processing of microphone signals for spatial playback |
CN110800048B (zh) * | 2017-05-09 | 2023-07-28 | 杜比实验室特许公司 | 多通道空间音频格式输入信号的处理 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1214690C (zh) * | 1997-09-05 | 2005-08-10 | 雷克西康公司 | 5-2-5矩阵编码器和解码器系统 |
US6768979B1 (en) * | 1998-10-22 | 2004-07-27 | Sony Corporation | Apparatus and method for noise attenuation in a speech recognition system |
US6282631B1 (en) * | 1998-12-23 | 2001-08-28 | National Semiconductor Corporation | Programmable RISC-DSP architecture |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
SE0301273D0 (sv) | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
US20070211908A1 (en) | 2004-09-22 | 2007-09-13 | Koninklijke Philips Electronics, N.V. | Multi-channel audio control |
SG124306A1 (en) | 2005-01-20 | 2006-08-30 | St Microelectronics Asia | A system and method for expanding multi-speaker playback |
EP1829424B1 (en) * | 2005-04-15 | 2009-01-21 | Dolby Sweden AB | Temporal envelope shaping of decorrelated signals |
DE602005018023D1 (de) * | 2005-04-29 | 2010-01-14 | Harman Becker Automotive Sys | Kompensation des Echos und der Rückkopplung |
JP2006325162A (ja) | 2005-05-20 | 2006-11-30 | Matsushita Electric Ind Co Ltd | バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置 |
CN101278598B (zh) * | 2005-10-07 | 2011-05-25 | 松下电器产业株式会社 | 音频信号处理装置以及音频信号处理方法 |
US9426596B2 (en) * | 2006-02-03 | 2016-08-23 | Electronics And Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
RU2439719C2 (ru) * | 2007-04-26 | 2012-01-10 | Долби Свиден АБ | Устройство и способ для синтезирования выходного сигнала |
JP5773124B2 (ja) | 2008-04-21 | 2015-09-02 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
PT2146344T (pt) | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
JP5919683B2 (ja) * | 2011-08-29 | 2016-05-18 | ティアック株式会社 | マルチトラックレコーダ装置 |
-
2013
- 2013-02-22 CN CN201380010478.6A patent/CN104160442B/zh active Active
- 2013-02-22 US US14/377,260 patent/US9728194B2/en active Active
- 2013-02-22 JP JP2014556112A patent/JP6049762B2/ja active Active
- 2013-02-22 EP EP13706500.9A patent/EP2817802B1/en active Active
- 2013-02-22 WO PCT/EP2013/053610 patent/WO2013124446A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US9728194B2 (en) | 2017-08-08 |
WO2013124446A1 (en) | 2013-08-29 |
EP2817802B1 (en) | 2016-12-07 |
US20160019899A1 (en) | 2016-01-21 |
CN104160442B (zh) | 2016-10-12 |
CN104160442A (zh) | 2014-11-19 |
EP2817802A1 (en) | 2014-12-31 |
JP2015506653A (ja) | 2015-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6049762B2 (ja) | オーディオ処理 | |
US11894003B2 (en) | Reconstruction of audio scenes from a downmix | |
RU2628898C1 (ru) | Неравномерное квантование параметров для усовершенствованной связи | |
KR102486365B1 (ko) | 오디오 신호들의 파라메트릭 재구성 | |
JP6732739B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
TWI843389B (zh) | 音訊編碼器、降混訊號產生方法及非暫時性儲存單元 | |
CN106796804B (zh) | 用于对话增强的解码方法和解码器 | |
JP6201047B2 (ja) | オーディオ信号のパラメトリック再構成のための脱相関器構造 | |
JP6248186B2 (ja) | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150605 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151006 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160729 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20160808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6049762 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |