JP6336558B2 - オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 - Google Patents
オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 Download PDFInfo
- Publication number
- JP6336558B2 JP6336558B2 JP2016247398A JP2016247398A JP6336558B2 JP 6336558 B2 JP6336558 B2 JP 6336558B2 JP 2016247398 A JP2016247398 A JP 2016247398A JP 2016247398 A JP2016247398 A JP 2016247398A JP 6336558 B2 JP6336558 B2 JP 6336558B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- decoding
- speakers
- field representation
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 66
- 239000011159 matrix material Substances 0.000 claims description 137
- 238000004091 panning Methods 0.000 claims description 11
- 238000013459 approach Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 10
- 238000012360 testing method Methods 0.000 description 8
- 230000004807 localization Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011069 regeneration method Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/13—Aspects of volume control, not necessarily automatic, in stereophonic sound systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Description
本発明は、オーディオ音場表現をデコードする方法および装置に関し、より詳細にはオーディオ再生のためのアンビソニックス・フォーマットされたオーディオ表現に関する。
本節は、以下に記載されるおよび/または特許請求される本発明のさまざまな側面に関係しうる技術の諸側面を読者に紹介するために意図されている。この議論は、読者に、本発明のさまざまな側面のよりよい理解を容易にするための背景情報を与える助けとなると考えられる。よって、これらの記述はこの観点で読まれるべきであり、出所が明示的に言及されている場合は別として、従来技術の自認として読まれるべきではないことは理解しておくべきである。
正確な定位(localisation)は、いかなる空間的なオーディオ再生システムにとっても主要な目標である。そのような再生システムは、会議システム、ゲームまたは3Dサウンドから裨益する他の仮想環境にとってきわめて実用的である。3Dにおけるサウンド・シーンは、自然な音場として合成されるまたは捕捉されることができる。たとえばアンビソニックスのような音場信号は所望される音場の表現を担う。アンビソニックス・フォーマットは、音場の球面調和関数分解に基づく。基本的なアンビソニックス・フォーマットまたはBフォーマットは次数0および1の球面調和関数を使うが、いわゆる高次アンビソニックス(HOA: Higher Order Ambisonics)は少なくとも2次のさらなる球面調和関数も使う。個々のスピーカー信号を得るにはデコード・プロセスが必要とされる。オーディオ・シーンを合成するには、所与の音源の空間定位を得るために、空間的なスピーカー配置に関するパン関数(panning functions)が必要とされる。自然な音場が記録される場合、空間的情報を捕捉するために、マイクロホン・アレイが必要とされる。既知のアンビソニックス手法はそれを達成するための非常に好適なツールである。アンビソニックス・フォーマットされた信号は、所望される音場の表現を担持する。デコード・プロセスは、そのようなアンビソニックス・フォーマットされた信号から、個々のスピーカー信号を得るために必要とされる。この場合にも、パン関数はデコード関数から導出されることができるので、パン関数は、空間定位のタスクを記述するための主要な問題である。スピーカーの空間配置は本稿ではスピーカー・セットアップと称される。
一般的に使われるスピーカー・セットアップは、二つのスピーカーを用いるステレオ・セットアップ、五つのスピーカーを使う標準的なサラウンド・セットアップおよび五つより多くのスピーカーを使うサラウンド・セットアップの拡張である。これらのセットアップはよく知られているが、これらは二次元(2D)に制約される。たとえば、高さ情報は再生されない。
三次元(3D)再生のためのスピーカー・セットアップは、たとえば22.2フォーマットのNHK超高精細度TVまたはダブリングハウス(mdg-musikproduction dabringhaus und grimm、www.mdg.de)の2+2+2構成および非特許文献2の10.2セットアップのための提案である非特許文献1に記述される。空間的再生およびパン戦略に言及するわずかばかりの既知のシステムの一つは、非特許文献3におけるベクトル基底振幅パン(VBAP: vector base amplitude panning)手法である。VBAP(ベクトル基底振幅パン)は、非特許文献3によって、任意のスピーカー・セットアップで仮想音響源を再生するために使用された。2D平面内に仮想源を置くためには一対のスピーカーが必要とされる。一方、3Dの場合には、スピーカーの三つ組みが必要とされる。各仮想源について、利得(仮想源の位置に依存する)の異なるモノフォニック信号が、フル・セットアップからの選択された諸スピーカーに与えられる。次いで、すべての仮想源についてのスピーカー信号が合計される。VBAPは、スピーカー間でのパンのためのスピーカー信号の利得を計算するために、幾何学的な手法を適用する。
本稿で考えられ、新たに提案される例示的な3Dスピーカー・セットアップ例は、図2に示すように位置される16個のスピーカーをもつ。この位置決めは、実際的な考察から選ばれたもので、それぞれ三つのスピーカーをもつ四つの柱があり、これらの柱の間に追加的なスピーカーがある。より詳細には、聴取者の頭部のまわりの円上に、45度の角度をはさんで八つのスピーカーが均等に分布させられる。追加的な四つのスピーカーは上部および下部に位置され、90度の方位角をはさむ。アンビソニックスに関しては、このセットアップはイレギュラーであり、デコーダ設計における問題につながる。これについては、非特許文献4で触れられている。
非特許文献5に記載されるような通常のアンビソニックス・デコードは、一般に知られているモード・マッピング・プロセスを用いる。モードは、明瞭に区別される入射方向について球面調和関数の値を含むモード・ベクトルによって記述される。個々のスピーカーによって与えられるすべての方向の組み合わせが、スピーカー・セットアップのモード行列につながる。よって、モード行列はスピーカー位置を表す。明瞭に区別される源信号のモードを再生するために、スピーカーのモードは、個々のスピーカーの重ね合わされるモードを足し合わせると所望されるモードになるよう、重み付けされる。必要な重みを得るために、スピーカー・モード行列の逆行列表現が計算される必要がある。信号デコードに関しては、重みはスピーカーの駆動信号をなし、逆スピーカー・モード行列は「デコード行列」と称され、これがアンビソニックス・フォーマットされた信号表現をデコードするために適用される。特に、多くのスピーカー・セットアップ、たとえば図2に示したセットアップについて、モード行列の逆を求めることは難しい。
上述したように、普通に使われるスピーカー・セットは2Dに制約されている。すなわち、高さ情報は再現されない。数学的に非正規な(non-regular)空間分布をもつスピーカー・セットアップの音場表現をデコードすることは、一般に知られている技法では、定位および音色付け(coloration)の問題につながる。アンビソニックス信号をデコードするためには、デコード行列(すなわちデコード係数の行列)が使用される。アンビソニックス信号、特にHOA信号の通常のデコードでは、少なくとも二つの問題が発生する。第一に、正しいデコードのためには、デコード行列を求めるために信号源の方向を知ることが必要である。第二に、既存のスピーカー・セットアップへのマッピングは、次の数学的問題のため、系統的に誤っている:数学的に正しいデコードは、正のスピーカー振幅ばかりでなく、いくらかの負のスピーカー振幅をも与える。しかしながら、これらは誤って正の信号として再生され、そのため上述の問題が生じるのである。
K. Hamasaki, T. Nishiguchi, R. Okumaura, and Y. Nakayama 、"Wide listening area with exceptional spatial sound quality of a 22.2 multichannel sound system"、Audio Engineering Society Preprints、Vienna、Austria、May 2007
T. Holman、Sound for Film and Television"、2nd ed.、Boston、Focal Press、2002
Pulkki 、"Virtual sound source positioning using vector base amplitude panning"、Journal of Audio Engineering Society、vol.45, no.6、pp.456-466、June 1997
H. Pomberger and F. Zotter、"An ambisonics format for flexible playback layouts," Proceedings of the 1st Ambisonics Symposium、Graz、Austria、July 2009
M. Poletti、"Three-dimensional surround sound systems based on spherical harmonics"、J. Audio Eng. Soc、vol.53, no.11、pp.1004-1025、Nov. 2005
本発明は、きわめて改善された定位および音色付け属性をもって非正規な空間分布のための音場表現をデコードする方法を記述する。
本方法は、音場データ、たとえばアンビソニックス・フォーマットのデータのためのデコード行列を得る別の方法を表し、システム推定様式でプロセスを用いる。一組の可能な入射方向を考えて、所望されるスピーカーに関係するパン関数が計算される。パン関数は、アンビソニックス・デコード・プロセスの出力として取られる。必要とされる入力信号は、すべての考えられる方向のモード行列である。したがって、下記に示されるように、デコード行列は、重み付け行列に、入力信号のモード行列の逆バージョンを右からかけることによって得られる。
上述した第二の問題に関し、スピーカー位置を表すいわゆるモード行列の逆と、位置依存の重み付け関数(「パン関数」)Wとから、デコード行列を得ることも可能であることが見出された。本発明の一つの側面は、これらのパン関数Wが、普通に使われるのとは異なる方法を使って導出できるということである。有利には、単純な幾何学的方法が使われる。そのような方法は、いかなる信号源方向の知識も必要とすることなく、よって上述した第一の問題を解決する。一つのそのような方法は「ベクトル基底振幅パン」(VBAP)として知られる。本発明によれば、VBAPは必要とされるパン関数を計算するために使われ、該パン関数が次いでアンビソニックス・デコード行列を計算するために使われる。(スピーカー・セットアップを表す)モード行列の逆が必要とされるという点でもう一つの問題が生じる。しかしながら、厳密な逆行列は求めるのが難しく、これも誤ったオーディオ再生につながる。よって、ある追加的な側面は、デコード行列を得るために、求めるのがずっと簡単な擬似逆モード行列(pseudo-inverse mode matrix)が計算される。
本発明は二段階のアプローチを使う。第一段階は、再生のために使われるスピーカー・セットアップに依存するパン関数の導出である。第二段階では、すべてのスピーカーについて、これらのパン関数からアンビソニックス・デコード行列が計算される。
本発明の一つの利点は、音源のパラメータ記述が必要とされず、アンビソニックスのような音場記述が使用できるということである。
本発明によれば、オーディオ再生のためのオーディオ音場表現をデコードする方法が、複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を計算する段階と、前記源方向からモード行列を計算する段階と、前記モード行列の擬似逆モード行列を計算する段階と、前記オーディオ音場表現をデコードする段階とを含み、前記デコードは、少なくとも前記パン関数および前記擬似逆モード行列から得られるデコード行列に基づく。
もう一つの側面によれば、オーディオ再生のためのオーディオ音場表現をデコードする装置が、複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を計算する第一計算手段と、前記源方向からモード行列を計算する第二計算手段と、前記モード行列の擬似逆モード行列を計算する第三計算手段と、前記音場表現をデコードするデコーダ手段とを含み、前記デコードはデコード行列に基づき、前記デコーダ手段は、少なくとも前記パン関数および前記擬似逆モード行列を使って前記デコード行列を得る。第一、第二および第三計算手段は単一のプロセッサであっても、または二つ以上の別個のプロセッサであってもよい。
さらにもう一つの側面によれば、コンピュータ可読媒体が、オーディオ再生のためのオーディオ音場表現をデコードする方法をコンピュータに実行させる実行可能命令を記憶しており、前記方法は、複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を計算する段階と、前記源方向からモード行列を計算する段階と、前記モード行列の擬似逆行列を計算する段階と、前記オーディオ音場表現をデコードする段階とを含み、前記デコードは、少なくとも前記パン関数および前記擬似逆モード行列から得られるデコード行列に基づく。
本発明の有利な実施形態は従属請求項、以下の記述および図面に開示される。
本発明の例示的な実施形態が付属の図面を参照して記載される。
前記方法のフローチャートである。
16個のスピーカーをもつ例示的な3Dセットアップを示す図である。
正規化されていない(non-regularized)モード・マッチングを使ったデコードから帰結するビーム・パターンを示す図である。
正規化された(regularized)モード行列を使ったデコードから帰結するビーム・パターンを示す図である。
VBAPから導出されるデコード行列を使ったデコードから帰結するビーム・パターンを示す図である。
聴取試験の結果を示す図である。
装置のブロック図である。
図1に示されるように、オーディオ再生のためのオーディオ音場表現SFcをデコードする方法は、複数のスピーカーのそれぞれについて、それらのスピーカーの位置102(Lはスピーカーの数)および複数の源方向103(Sは源方向の数)に基づいて幾何学的な方法を使ってパン関数Wを計算する段階110と、前記源方向および前記音場表現の与えられた次数Nからモード行列Ξを計算する段階120と、前記モード行列Ξの擬似逆モード行列Ξ+を計算する段階130と、前記オーディオ音場表現SFcをデコードしてデコードされたサウンド・データAUdecが得られる段階130、140とを含む。前記デコードは、少なくとも前記パン関数Wおよび前記擬似逆モード行列Ξ+から得られる(135)デコード行列Dに基づく。ある実施形態では、擬似逆モード行列はΞ+=ΞH[ΞΞH]-1に従って得られる。音場表現の次数Nはあらかじめ定義されていてもよいし、あるいは入力信号SFcから抽出105されてもよい。
図7に示されるように、オーディオ再生のためのオーディオ音場表現をデコードする装置は、複数のスピーカーのそれぞれについて、それらのスピーカーの位置102および複数の源方向103に基づいて幾何学的な方法を使ってパン関数Wを計算する第一計算手段210と、前記源方向からモード行列Ξを計算する第二計算手段220と、前記モード行列Ξの擬似逆モード行列Ξ+を計算する第三計算手段230と、前記音場表現をデコードするデコーダ手段240とを有する。前記デコードはデコード行列Dに基づき、該デコード行列Dは、少なくとも前記パン関数Wおよび前記擬似逆モード行列Ξ+から、デコード行列計算手段235(たとえば乗算器)によって得られる。デコーダ手段240はデコード行列Dを使って、デコードされたオーディオ信号AUdecを得る。第一、第二および第三計算手段220、230、240は単一のプロセッサであっても、または二つ以上の別個のプロセッサであってもよい。音場表現の次数Nはあらかじめ定義されていてもよいし、あるいは入力信号SFcから該次数を抽出する手段205によって取得されてもよい。
特に有用な3Dスピーカー・セットアップは16個のスピーカーをもつ。図2に示されるように、それぞれ三つのスピーカーをもつ四つの柱があり、これらの柱の間に追加的なスピーカーがある。聴取者の頭部のまわりの円上に、45度の角度をはさんで八つのスピーカーが均等に分布させられる。追加的な四つのスピーカーが上部および下部に90度の方位角をはさんで位置される。アンビソニックスに関しては、このセットアップはイレギュラーであり、デコーダ設計における問題につながる。
下記において、ベクトル基底振幅パン(VBAP)について詳細に述べる。ある実施形態では、VBAPは、本願において、任意のスピーカー・セットアップをもって仮想音響源を配置するために使われる。ここで、聴取位置からの諸スピーカーの同じ距離が想定される。VBAPは3D空間において一つの仮想源を配置するために三つのスピーカーを使う。各仮想源について、利得の異なるモノフォニック信号が、使用されるべき諸スピーカーに与えられる。異なるスピーカーについての利得は仮想源の位置に依存する。VBAPは、スピーカー間でのパンのためのスピーカー信号の利得を計算するための幾何学的なアプローチである。3Dの場合、三角形に配置された三つのスピーカーはベクトル基底を構築する。各ベクトル基底はスピーカー番号k,m,nおよび長さ1に規格化されたデカルト座標で与えられるスピーカー位置ベクトルlk,lm,lnによって同定される。スピーカーk,m,nについてのベクトル基底は
Lkmn={lk,lm,ln} (1)
によって定義される。
Lkmn={lk,lm,ln} (1)
によって定義される。
仮想源の所望される方向Ω=(θ,φ)は、方位角φおよび傾斜角θとして与えられる必要がある。したがって、デカルト座標での仮想源の長さ1の位置ベクトルp(Ω)は、
p(Ω)={cosφsinθ,sinφsinθ,cosθ}T (2)
によって定義される。
p(Ω)={cosφsinθ,sinφsinθ,cosθ}T (2)
によって定義される。
仮想源位置は、ベクトル基底および利得因子g(Ω)=(~gk,~gm,~gn)Tを用いて、
p(Ω)=Lkmn g(Ω)=~gklk+~gmlm+~gnln (3)
によって表現できる。
p(Ω)=Lkmn g(Ω)=~gklk+~gmlm+~gnln (3)
によって表現できる。
ベクトル基底行列の逆を求めることによって、必要とされる利得因子は
g(Ω)=L-1 kmnp(Ω) (4)
によって計算できる。
g(Ω)=L-1 kmnp(Ω) (4)
によって計算できる。
使用されるベクトル基底は、非特許文献3に従って決定される:まず、すべてのベクトル基底について非特許文献3に従って利得が計算される。次いで、各ベクトル基底について、それらの利得因子にわたる最小が、~gmin=min{~gk,~gm,~gn}を用いて評価される。最後に、~gminが最高値をもつベクトル基底が使用される。結果として得られる利得因子は負であってはならない。聴取する部屋の音響特性に依存して、利得因子はエネルギー保存のために規格化されてもよい。
下記において、例示的な音場フォーマットであるアンビソニックス・フォーマットが記述される。アンビソニックス表現は、一つの位置における音場の数学的な近似を用いる音場記述方法である。球面座標系を使うと、空間内の点r=(r,θ,φ)における圧力は、球面フーリエ変換
によって記述される。ここで、kは波数である。通常、nは有限の次数Mまでである。この級数の係数Am n(k)が音場を記述し(有効領域外の源を想定する)、jn(kr)は第一種の球面ベッセル関数であり、Ym n(θ,φ)は球面調和関数を表す。係数Am n(k)は、このコンテキストにおいてアンビソニックス係数と見なされる。球面調和関数Ymn(θ,φ)は傾斜角および方位角のみに依存し、単位球面上での関数を記述する。
簡単のため、音場表現のためにしばしば平面波が想定される。方向Ωsからの音響源として平面波を記述するアンビソニックス係数は次のようになる。
音場のアンビソニックス表現からスピーカー信号を計算するためには、モード・マッチングが普通に使われるアプローチである。基本的な発想は、所与のアンビソニックス音場記述A(Ωs)を、スピーカーの音場記述A(Ωl)の重み付けされた和
によって表現するというものである。ここで、Ωlはスピーカーの方向を表し、wlは重み、Lはスピーカーの数である。式(8)からパン関数を導出するために、既知の入射方向Ωsを想定する。源音場とスピーカー音場がいずれも平面波であれば、因子4πin(式(6)参照)を落とすことができ、式(8)は「モード」とも称される球面調和関数ベクトルの複素共役のみに依存する。行列記法を使うと、これは次のように書ける。
Y(Ωs)*=Ψw(Ωs) (9)
ここで、Ψは当該スピーカー・セットアップのモード行列
Ψ=[Y(Ω1)*,Y(Ω2)*,…,Y(ΩL)*] (10)
であり、O×L個の要素をもつ。所望される重み付けベクトルwを得るためには、これを達成するためのさまざまな戦略が知られている。M=3が選ばれると、Ψは正方であり、可逆でありうる。ただし、非正規なスピーカー・セットアップのため、行列はスケーリングが悪い。そのような場合、しばしば擬似逆行列が選ばれ
D=[ΨHΨ]-1ΨH (11)
がL×Oのデコード行列Dを与える。最後に、
w(Ωs)=DY(Ωs)* (12)
と書くことができる。ここで、重みw(Ωs)は式(9)についての最小エネルギー解である。擬似逆行列を使うことからの帰結についてはのちに述べる。
ここで、Ψは当該スピーカー・セットアップのモード行列
Ψ=[Y(Ω1)*,Y(Ω2)*,…,Y(ΩL)*] (10)
であり、O×L個の要素をもつ。所望される重み付けベクトルwを得るためには、これを達成するためのさまざまな戦略が知られている。M=3が選ばれると、Ψは正方であり、可逆でありうる。ただし、非正規なスピーカー・セットアップのため、行列はスケーリングが悪い。そのような場合、しばしば擬似逆行列が選ばれ
D=[ΨHΨ]-1ΨH (11)
がL×Oのデコード行列Dを与える。最後に、
w(Ωs)=DY(Ωs)* (12)
と書くことができる。ここで、重みw(Ωs)は式(9)についての最小エネルギー解である。擬似逆行列を使うことからの帰結についてはのちに述べる。
下記において、パン関数とアンビソニックス・デコード行列との間のつながりについて述べる。アンビソニックスから出発して、個々のスピーカーについてのパン関数は式(12)を使って計算できる。
Ξ=[Y(Ω1)*,Y(Ω2)*,…,Y(ΩS)*] (13)
をS個の入力信号方向(Ωs)のモード行列であるとする。入力信号方向はたとえば、1°…180°まで1度のきざみで走る傾斜角および1…360°までの方位角をもつ球面グリッドである。このモード行列はO×S個の要素をもつ。式(12)を使うと、結果として得られる行列WはL×S個の要素をもつ。行lはそれぞれのスピーカーについてのS個のパン重みをもつ。
をS個の入力信号方向(Ωs)のモード行列であるとする。入力信号方向はたとえば、1°…180°まで1度のきざみで走る傾斜角および1…360°までの方位角をもつ球面グリッドである。このモード行列はO×S個の要素をもつ。式(12)を使うと、結果として得られる行列WはL×S個の要素をもつ。行lはそれぞれのスピーカーについてのS個のパン重みをもつ。
W=DΞ (14)
代表例として、単一のスピーカー2のパン関数が図3のビーム・パターンとして示されている。この例では次数M=3のデコード行列Dである。見て取れるように、パン関数値は、スピーカーの物理的な位置付けには全く関係しない。これは、選ばれた次数についての空間的なサンプリング方式として十分でない、スピーカーの数学的に非正規な位置付けのためである。したがって、デコード行列は正規化されていないモード行列と称される。この問題は、式(11)におけるスピーカー・モード行列Ψの正規化によって克服できる。この解決策が機能するのは、デコード行列の空間分解能を代償するが、その代償はアンビソニックス次数の低下として表されうる。図4は、正規化されたモード行列を使う、特に正規化のためにモード行列の諸固有値の平均を使うデコードから帰結する例示的なビーム・パターンを示している。図3と比べると、対象とされるスピーカーの方向が今や明瞭に認識される。
代表例として、単一のスピーカー2のパン関数が図3のビーム・パターンとして示されている。この例では次数M=3のデコード行列Dである。見て取れるように、パン関数値は、スピーカーの物理的な位置付けには全く関係しない。これは、選ばれた次数についての空間的なサンプリング方式として十分でない、スピーカーの数学的に非正規な位置付けのためである。したがって、デコード行列は正規化されていないモード行列と称される。この問題は、式(11)におけるスピーカー・モード行列Ψの正規化によって克服できる。この解決策が機能するのは、デコード行列の空間分解能を代償するが、その代償はアンビソニックス次数の低下として表されうる。図4は、正規化されたモード行列を使う、特に正規化のためにモード行列の諸固有値の平均を使うデコードから帰結する例示的なビーム・パターンを示している。図3と比べると、対象とされるスピーカーの方向が今や明瞭に認識される。
導入部で概説したように、パン関数が既知である場合には、アンビソニックス信号の再生のためのデコード行列Dを得るもう一つの方法が可能である。パン関数Wは、仮想源方向Ωの集合上で定義された所望される信号と見られ、これらの方向のモード行列Ξは入力信号のはたらきをする。すると、デコード行列は次式を使って計算できる。
D=WΞH[ΞΞH]-1=WΞ+ (15)
ここで、ΞH[ΞΞH]-1または単にΞ+は、モード行列Ξの擬似逆行列である。この新たなアプローチでは、W内のパン関数をVBAPから取り、これからアンビソニックス・デコード行列を計算する。
ここで、ΞH[ΞΞH]-1または単にΞ+は、モード行列Ξの擬似逆行列である。この新たなアプローチでは、W内のパン関数をVBAPから取り、これからアンビソニックス・デコード行列を計算する。
Wについてのパン関数は、式(4)を使って計算された利得値g(Ω)として取られる。ここで、Ωは式(13)に従って選ばれる。式(15)を使う、結果として得られるデコード行列は、VBAPパン関数を容易にするアンビソニックス・デコード行列である。VBAPから導出されるデコード行列を使うデコードから帰結するビーム・パターンを示す例が図5に描かれている。有利なことに、サイドローブSLが、図4の正規化されたモード・マッチング結果のサイドローブSLregより有意に小さい。さらに、個々のスピーカーについてのVBAP導出されたビーム・パターンは、スピーカー・セットアップの幾何構造に従う。これは、VBAPパン関数が、対象とされる方向のベクトル基底に依存するからである。結果として、本発明に基づく新しいアプローチは、スピーカー・セットアップのすべての方向にわたってよりよい結果を生じる。
源方向103はかなり自由に定義できる。源方向の数Sについての条件は、少なくとも(N+1)2でなければならないというものである。よって、音場信号SFcの所与の次数Nがあれば、S≧(N+1)2に従ってSを定義し、S個の源方向を単位球面上にわたって均等に分配することが可能である。上述したように、結果は1°…180°までx度(たとえばx=1…5またはx=10,20など)の一定のきざみで走る傾斜角および1…360°までの方位角をもつ球面グリッドであることができる。各源方向Ω=(θ,φ)は方位角φおよび傾斜角θによって与えられることができる。
有利な効果は聴取試験において確認された。単一源の定位の評価のために、仮想源が基準としての本物の源に対して比較される。本物の源については、所望される位置にあるスピーカーが使われる。使用される再生方法はVBAP、アンビソニックス・モード・マッチング・デコードおよび本発明に基づくVBAPパン関数を使う新たに提案されるアンビソニックス・デコードである。第二、第三の方法については、試験される各位置および試験される各入力信号について、三次のアンビソニックス信号が生成される。この合成アンビソニックス信号は次いで対応するデコード行列を使ってデコードされる。使用された試験信号は、広帯域ピンクノイズおよび男性の発話信号である。試験された位置は、前方領域に、次の方向をもって配置される。
Ω1=(76.1°,−23.2°)、Ω2=(63.3°,−4.3°) (16)
聴取試験は、約0.2sの平均残響時間をもつ音響室内で実施された。九人の人が聴取試験に参加した。被験者には、すべての再生方法の、基準と比較しての空間的な再生性能を等級付けるよう依頼された。仮想源の定位および音色の変化を表すために単一の等級値が見出される必要があった。図5は聴取試験の結果を示している。
聴取試験は、約0.2sの平均残響時間をもつ音響室内で実施された。九人の人が聴取試験に参加した。被験者には、すべての再生方法の、基準と比較しての空間的な再生性能を等級付けるよう依頼された。仮想源の定位および音色の変化を表すために単一の等級値が見出される必要があった。図5は聴取試験の結果を示している。
この結果が示すように、正規化されないアンビソニックス・モード・マッチング・デコードは、試験対象となった他の方法より知覚的に悪く等級付けされた。この結果は図3に対応する。アンビソニックス・モード・マッチング方法は、この聴取試験においてアンカーのはたらきをする。もう一つの利点は、他の方法よりもVBAPについてのほうが、ノイズ信号に対する信頼区間が大きいということである。平均値は、VBAPパン関数を使うアンビソニックス・デコードについて最も高い値を示す。このように、空間分解能は――使用されるアンビソニックス次数のため――低下するが、この方法はパラメトリックVBAP手法に比しての利点を示す。VBAPに比べ、堅牢パン関数およびVBAPパン関数を用いるアンビソニックス・デコードはいずれも、仮想源をレンダリングするために三つのスピーカーだけが使われるのではないという利点をもつ。VBAP単独スピーカーは、仮想源位置がスピーカーの物理的位置の一つに近い場合に優勢となりうる。ほとんどの被験者は、直接適用されるVBAPよりもアンビソニックス駆動のVBAPのほうが音色の変化(timbre alteration)が少ないと報告した。VBAPについての音色の変化の問題は非特許文献3からすでに知られている。VBAPとは逆に、新たに提案される方法は、一つの仮想源の再生のために三つより多くのスピーカーを使うが、驚くことに、音色付け(coloration)がより少ない。
結論として、VBAPパン関数からアンビソニックス・デコード行列を得る新たな方法が開示される。種々のラウドスピーカー・セットアップについて、このアプローチはモード・マッチング・アプローチの行列に比べて有利である。これらのデコード行列の属性および帰結について上記で論じている。まとめると、VBAPパン関数を用いる新たに提案されるアンビソニックス・デコードは、よく知られたモード・マッチング手法の典型的な諸問題を回避する。聴取試験により、VBAP導出されたアンビソニックス・デコードは、VBAPの直接的な使用が生成できるよりもよい空間的な再生品質を生成することができる。VBAPがレンダリングされるべき仮想源のパラメータによる記述を必要とするのに対し、提案される方法は音場記述のみを必要とする。
本発明の好ましい実施形態に適用される本発明の根本的な新たな特徴について図示し、説明し、指摘してきたが、本発明の精神から外れることなく、当業者によって、開示される装置の形および詳細ならびにその動作において、記載される装置および方法にさまざまな省略、代替、変更をしてもよいことは理解されるであろう。実質的に同じ機能を実質的に同じ仕方で実行して同じ結果を達成する要素のあらゆる組み合わせが本発明の範囲内であることが明白に意図されている。ある記載される実施形態から別の実施形態への要素の転用も完全に意図されており、考えられている。詳細の修正は本発明の範囲から外れることなくできることが理解される。本稿および(適切な場合には)請求項および図面において開示される各特徴は、独立して、あるいは任意の適切な組み合わせにおいて設けられてもよい。諸特徴は、適切な場合には、ハードウェア、ソフトウェアまたは両者の組み合わせで実装されてもよい。請求項に現れる参照符号があったとしても単に例解のためであって、請求項の範囲に対する限定する効果はもたない。
いくつかの態様を記載しておく。
〔態様1〕
オーディオ再生のためのオーディオ音場表現をデコードする方法であって:
・複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を計算する段階と;
・前記源方向からモード行列を計算する段階と;
・前記モード行列の擬似逆モード行列を計算する段階と;
・前記オーディオ音場表現をデコードする段階とを含み、前記デコードは、少なくとも前記パン関数および前記擬似逆モード行列から得られるデコード行列に基づく、
方法。
〔態様2〕
パン関数を計算する前記段階において使われる前記幾何学的な方法がベクトル基底振幅パン(VBAP)である、態様1記載の方法。
〔態様3〕
前記音場表現が少なくとも二次のアンビソニックス・フォーマットである、態様1または2記載の方法。
〔態様4〕
Ξは前記複数の源方向のモード行列であるとして、前記擬似逆モード行列(Ξ+)がΞH[ΞΞH]-1に従って得られる、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
Wは各スピーカーについてのパン関数の集合であるとして、前記デコード行列が、D=WΞH[ΞΞH]-1=WΞ+に従って得られる、態様4記載の方法。
〔態様6〕
オーディオ再生のためのオーディオ音場表現をデコードする装置であって:
・複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を計算する第一計算手段と;
・前記源方向からモード行列を計算する第二計算手段と;
・前記モード行列の擬似逆モード行列を計算する第三計算手段と;
・前記音場表現をデコードするデコーダ手段とを有しており、前記デコードはデコード行列に基づき、前記デコーダ手段は、少なくとも前記パン関数および前記擬似逆モード行列を使って前記デコード行列を得る、
装置。
〔態様7〕
態様6記載の装置であって、当該デコードする装置がさらに、
前記パン関数および前記擬似逆モード行列から前記デコード行列を計算する手段を有する、
装置。
〔態様8〕
パン関数を計算する前記段階において使われる前記幾何学的な方法がベクトル基底振幅パン(VBAP)である、態様6または7記載の装置。
〔態様9〕
前記音場表現が少なくとも二次のアンビソニックス・フォーマットである、態様6ないし8のうちいずれか一項記載の装置。
〔態様10〕
Ξは前記複数の源方向のモード行列であるとして、前記擬似逆モード行列Ξ+がΞ+=ΞH[ΞΞH]-1に従って得られる、態様6ないし9のうちいずれか一項記載の装置。
〔態様11〕
Wは各スピーカーについてのパン関数の集合であるとして、前記デコード行列が、D=WΞH[ΞΞH]-1=WΞ+に従ってデコード行列を計算する手段において得られる、態様10記載の装置。
〔態様12〕
オーディオ再生のためのオーディオ音場表現をデコードする方法をコンピュータに実行させる実行可能命令を記憶しているコンピュータ可読媒体であって、前記方法が:
・複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を計算する段階と;
・前記源方向からモード行列を計算する段階と;
・前記モード行列の擬似逆モード行列を計算する段階と;
・前記オーディオ音場表現をデコードする段階とを含み、前記デコードは、少なくとも前記パン関数および前記擬似逆モード行列から得られるデコード行列に基づく、
コンピュータ可読媒体。
〔態様13〕
パン関数を計算する前記段階において使われる前記幾何学的な方法がベクトル基底振幅パン(VBAP)である、態様12記載のコンピュータ可読媒体。
〔態様14〕
前記音場表現が少なくとも二次のアンビソニックス・フォーマットである、態様12または13記載のコンピュータ可読媒体。
〔態様15〕
Ξは前記複数の源方向のモード行列であるとして、前記擬似逆モード行列Ξ+がΞ+=ΞH[ΞΞH]-1に従って得られる、態様12ないし14のうちいずれか一項記載のコンピュータ可読媒体。
〔態様1〕
オーディオ再生のためのオーディオ音場表現をデコードする方法であって:
・複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を計算する段階と;
・前記源方向からモード行列を計算する段階と;
・前記モード行列の擬似逆モード行列を計算する段階と;
・前記オーディオ音場表現をデコードする段階とを含み、前記デコードは、少なくとも前記パン関数および前記擬似逆モード行列から得られるデコード行列に基づく、
方法。
〔態様2〕
パン関数を計算する前記段階において使われる前記幾何学的な方法がベクトル基底振幅パン(VBAP)である、態様1記載の方法。
〔態様3〕
前記音場表現が少なくとも二次のアンビソニックス・フォーマットである、態様1または2記載の方法。
〔態様4〕
Ξは前記複数の源方向のモード行列であるとして、前記擬似逆モード行列(Ξ+)がΞH[ΞΞH]-1に従って得られる、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
Wは各スピーカーについてのパン関数の集合であるとして、前記デコード行列が、D=WΞH[ΞΞH]-1=WΞ+に従って得られる、態様4記載の方法。
〔態様6〕
オーディオ再生のためのオーディオ音場表現をデコードする装置であって:
・複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を計算する第一計算手段と;
・前記源方向からモード行列を計算する第二計算手段と;
・前記モード行列の擬似逆モード行列を計算する第三計算手段と;
・前記音場表現をデコードするデコーダ手段とを有しており、前記デコードはデコード行列に基づき、前記デコーダ手段は、少なくとも前記パン関数および前記擬似逆モード行列を使って前記デコード行列を得る、
装置。
〔態様7〕
態様6記載の装置であって、当該デコードする装置がさらに、
前記パン関数および前記擬似逆モード行列から前記デコード行列を計算する手段を有する、
装置。
〔態様8〕
パン関数を計算する前記段階において使われる前記幾何学的な方法がベクトル基底振幅パン(VBAP)である、態様6または7記載の装置。
〔態様9〕
前記音場表現が少なくとも二次のアンビソニックス・フォーマットである、態様6ないし8のうちいずれか一項記載の装置。
〔態様10〕
Ξは前記複数の源方向のモード行列であるとして、前記擬似逆モード行列Ξ+がΞ+=ΞH[ΞΞH]-1に従って得られる、態様6ないし9のうちいずれか一項記載の装置。
〔態様11〕
Wは各スピーカーについてのパン関数の集合であるとして、前記デコード行列が、D=WΞH[ΞΞH]-1=WΞ+に従ってデコード行列を計算する手段において得られる、態様10記載の装置。
〔態様12〕
オーディオ再生のためのオーディオ音場表現をデコードする方法をコンピュータに実行させる実行可能命令を記憶しているコンピュータ可読媒体であって、前記方法が:
・複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を計算する段階と;
・前記源方向からモード行列を計算する段階と;
・前記モード行列の擬似逆モード行列を計算する段階と;
・前記オーディオ音場表現をデコードする段階とを含み、前記デコードは、少なくとも前記パン関数および前記擬似逆モード行列から得られるデコード行列に基づく、
コンピュータ可読媒体。
〔態様13〕
パン関数を計算する前記段階において使われる前記幾何学的な方法がベクトル基底振幅パン(VBAP)である、態様12記載のコンピュータ可読媒体。
〔態様14〕
前記音場表現が少なくとも二次のアンビソニックス・フォーマットである、態様12または13記載のコンピュータ可読媒体。
〔態様15〕
Ξは前記複数の源方向のモード行列であるとして、前記擬似逆モード行列Ξ+がΞ+=ΞH[ΞΞH]-1に従って得られる、態様12ないし14のうちいずれか一項記載のコンピュータ可読媒体。
Claims (13)
- 複数のスピーカーでの再生のためにアンビソニックス・オーディオ音場表現をデコードする方法であって:
・複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を取得する段階と;
・前記源方向および前記アンビソニックス・オーディオ音場表現の次数からモード行列を取得する段階と;
・前記モード行列から基底行列を取得する段階と;
・デコード行列を用いて前記アンビソニックス・オーディオ音場表現をデコードする段階とを含み、前記デコード行列は、前記パン関数および前記基底行列に基づき、前記源方向は単位球上に均等に分布しており、前記源方向の数はSであり、前記アンビソニックス・オーディオ音場表現の前記次数はNであり、S≧(N+1)2である、
方法。 - パン関数を取得する前記段階において使われる前記幾何学的な方法がベクトル基底振幅パン(VBAP)である、請求項1記載の方法。
- 前記アンビソニックス・オーディオ音場表現が少なくとも二次である、請求項1記載の方法。
- 前記基底行列が、前記モード行列と転置行列との積に基づく、請求項1記載の方法。
- 前記パン関数が行列として表わされ、前記基底行列が前記モード行列の正則化である、請求項1記載の方法。
- 前記パン関数が利得値として表わされる、請求項1記載の方法。
- 複数のスピーカーでの再生のためにアンビソニックス・オーディオ音場表現をデコードする装置であって:
・複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を取得する手段と;
・前記源方向および前記アンビソニックス・オーディオ音場表現の次数からモード行列を取得する手段と;
・前記モード行列から基底行列を取得する手段と;
・デコード行列を用いて前記アンビソニックス・オーディオ音場表現をデコードする手段とを有しており、前記デコード行列は前記パン関数および前記基底行列に基づき、前記源方向は単位球上に均等に分布しており、前記源方向の数はSであり、前記アンビソニックス・オーディオ音場表現の前記次数はNであり、S≧(N+1)2である、
装置。 - パン関数を取得する前記手段によって使われる前記幾何学的な方法がベクトル基底振幅パン(VBAP)である、請求項7記載の装置。
- 前記アンビソニックス・オーディオ音場表現が少なくとも二次である、請求項7記載の装置。
- 前記基底行列が、前記モード行列と転置行列との積に基づく、請求項7記載の装置。
- 前記パン関数が行列として表わされ、前記基底行列が前記モード行列の正則化である、請求項7記載の装置。
- 前記パン関数が利得値として表わされる、請求項7記載の装置。
- オーディオ再生のためのアンビソニックス・オーディオ音場表現をデコードする方法をコンピュータに実行させる実行可能命令を記憶しているコンピュータ可読媒体であって、前記方法が:
・複数のスピーカーのそれぞれについて、それらのスピーカーの位置および複数の源方向に基づいて幾何学的な方法を使ってパン関数を取得する段階と;
・前記源方向および前記アンビソニックス・オーディオ音場表現の次数からモード行列を取得する段階と;
・前記モード行列から基底行列を取得する段階と;
・デコード行列を用いて前記アンビソニックス・オーディオ音場表現をデコードする段階とを含み、前記デコード行列は、前記パン関数および前記基底行列に基づき、前記源方向は単位球上に均等に分布しており、前記源方向の数はSであり、前記アンビソニックス・オーディオ音場表現の前記次数はNであり、S≧(N+1)2である、
コンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10305316.1 | 2010-03-26 | ||
EP10305316 | 2010-03-26 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015087361A Division JP6067773B2 (ja) | 2010-03-26 | 2015-04-22 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018088655A Division JP6615936B2 (ja) | 2010-03-26 | 2018-05-02 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017085620A JP2017085620A (ja) | 2017-05-18 |
JP6336558B2 true JP6336558B2 (ja) | 2018-06-06 |
Family
ID=43989831
Family Applications (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013500527A Active JP5559415B2 (ja) | 2010-03-26 | 2011-03-25 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2014116480A Active JP5739041B2 (ja) | 2010-03-26 | 2014-06-05 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2015087361A Active JP6067773B2 (ja) | 2010-03-26 | 2015-04-22 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2016247398A Active JP6336558B2 (ja) | 2010-03-26 | 2016-12-21 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2018088655A Active JP6615936B2 (ja) | 2010-03-26 | 2018-05-02 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2019201467A Active JP6918896B2 (ja) | 2010-03-26 | 2019-11-06 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2021120443A Active JP7220749B2 (ja) | 2010-03-26 | 2021-07-21 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2023012686A Pending JP2023052781A (ja) | 2010-03-26 | 2023-01-31 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013500527A Active JP5559415B2 (ja) | 2010-03-26 | 2011-03-25 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2014116480A Active JP5739041B2 (ja) | 2010-03-26 | 2014-06-05 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2015087361A Active JP6067773B2 (ja) | 2010-03-26 | 2015-04-22 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018088655A Active JP6615936B2 (ja) | 2010-03-26 | 2018-05-02 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2019201467A Active JP6918896B2 (ja) | 2010-03-26 | 2019-11-06 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2021120443A Active JP7220749B2 (ja) | 2010-03-26 | 2021-07-21 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
JP2023012686A Pending JP2023052781A (ja) | 2010-03-26 | 2023-01-31 | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
Country Status (12)
Country | Link |
---|---|
US (9) | US9100768B2 (ja) |
EP (1) | EP2553947B1 (ja) |
JP (8) | JP5559415B2 (ja) |
KR (9) | KR101755531B1 (ja) |
CN (1) | CN102823277B (ja) |
AU (1) | AU2011231565B2 (ja) |
BR (2) | BR122020001822B1 (ja) |
ES (1) | ES2472456T3 (ja) |
HK (1) | HK1174763A1 (ja) |
PL (1) | PL2553947T3 (ja) |
PT (1) | PT2553947E (ja) |
WO (1) | WO2011117399A1 (ja) |
Families Citing this family (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101755531B1 (ko) | 2010-03-26 | 2017-07-07 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 |
EP2541547A1 (en) | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
MX337790B (es) | 2011-07-01 | 2016-03-18 | Dolby Lab Licensing Corp | Sistema y herramientas para autoria y representacion mejorada de audio tridimensional. |
US9084058B2 (en) | 2011-12-29 | 2015-07-14 | Sonos, Inc. | Sound field calibration using listener localization |
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
EP2645748A1 (en) * | 2012-03-28 | 2013-10-02 | Thomson Licensing | Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal |
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9219460B2 (en) | 2014-03-17 | 2015-12-22 | Sonos, Inc. | Audio settings based on environment |
US9106192B2 (en) | 2012-06-28 | 2015-08-11 | Sonos, Inc. | System and method for device playback calibration |
US9288603B2 (en) | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
EP4284026A3 (en) | 2012-07-16 | 2024-02-21 | Dolby International AB | Method and device for rendering an audio soundfield representation |
EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
US9473870B2 (en) | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
US9479886B2 (en) | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
EP2738962A1 (en) * | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
EP2946468B1 (en) * | 2013-01-16 | 2016-12-21 | Thomson Licensing | Method for measuring hoa loudness level and device for measuring hoa loudness level |
US9736609B2 (en) | 2013-02-07 | 2017-08-15 | Qualcomm Incorporated | Determining renderers for spherical harmonic coefficients |
EP2765791A1 (en) * | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
US9756444B2 (en) | 2013-03-28 | 2017-09-05 | Dolby Laboratories Licensing Corporation | Rendering audio using speakers organized as a mesh of arbitrary N-gons |
RU2769677C2 (ru) * | 2013-04-26 | 2022-04-04 | Сони Корпорейшн | Способ и устройство обработки звука |
EP2991383B1 (en) * | 2013-04-26 | 2021-01-27 | Sony Corporation | Audio processing device and audio processing system |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9495968B2 (en) * | 2013-05-29 | 2016-11-15 | Qualcomm Incorporated | Identifying sources from which higher order ambisonic audio data is generated |
BR112015030103B1 (pt) * | 2013-05-29 | 2021-12-28 | Qualcomm Incorporated | Compressão de representações decomposta de campo sonoro |
EP3923279B1 (en) * | 2013-06-05 | 2023-12-27 | Dolby International AB | Apparatus for decoding audio signals and method for decoding audio signals |
EP2824661A1 (en) * | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
EP2866475A1 (en) * | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
EP2879408A1 (en) * | 2013-11-28 | 2015-06-03 | Thomson Licensing | Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition |
CN111179951B (zh) * | 2014-01-08 | 2024-03-01 | 杜比国际公司 | 包括编码hoa表示的位流的解码方法和装置、以及介质 |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
US9264839B2 (en) | 2014-03-17 | 2016-02-16 | Sonos, Inc. | Playback device configuration based on proximity detection |
KR102201726B1 (ko) * | 2014-03-21 | 2021-01-12 | 돌비 인터네셔널 에이비 | 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치 |
EP2922057A1 (en) | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
US10412522B2 (en) * | 2014-03-21 | 2019-09-10 | Qualcomm Incorporated | Inserting audio channels into descriptions of soundfields |
JP6374980B2 (ja) | 2014-03-26 | 2018-08-15 | パナソニック株式会社 | サラウンドオーディオ信号処理のための装置及び方法 |
CN106465027B (zh) * | 2014-05-13 | 2019-06-04 | 弗劳恩霍夫应用研究促进协会 | 用于边缘衰落幅度平移的装置和方法 |
US9847087B2 (en) * | 2014-05-16 | 2017-12-19 | Qualcomm Incorporated | Higher order ambisonics signal compression |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) * | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
CN110415712B (zh) * | 2014-06-27 | 2023-12-12 | 杜比国际公司 | 用于解码声音或声场的高阶高保真度立体声响复制(hoa)表示的方法 |
EP2960903A1 (en) | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
US9910634B2 (en) * | 2014-09-09 | 2018-03-06 | Sonos, Inc. | Microphone calibration |
US9952825B2 (en) | 2014-09-09 | 2018-04-24 | Sonos, Inc. | Audio processing algorithms |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
US10140996B2 (en) | 2014-10-10 | 2018-11-27 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
EP3073488A1 (en) | 2015-03-24 | 2016-09-28 | Thomson Licensing | Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field |
US9693165B2 (en) | 2015-09-17 | 2017-06-27 | Sonos, Inc. | Validation of audio calibration using multi-dimensional motion check |
EP3351015B1 (en) | 2015-09-17 | 2019-04-17 | Sonos, Inc. | Facilitating calibration of an audio playback device |
US10070094B2 (en) * | 2015-10-14 | 2018-09-04 | Qualcomm Incorporated | Screen related adaptation of higher order ambisonic (HOA) content |
CN105392102B (zh) * | 2015-11-30 | 2017-07-25 | 武汉大学 | 用于非球面扬声器阵列的三维音频信号生成方法及系统 |
US10412531B2 (en) | 2016-01-08 | 2019-09-10 | Sony Corporation | Audio processing apparatus, method, and program |
EP3402223B1 (en) | 2016-01-08 | 2020-10-07 | Sony Corporation | Audio processing device and method, and program |
CN108476365B (zh) | 2016-01-08 | 2021-02-05 | 索尼公司 | 音频处理装置和方法以及存储介质 |
US9743207B1 (en) | 2016-01-18 | 2017-08-22 | Sonos, Inc. | Calibration using multiple recording devices |
US11106423B2 (en) | 2016-01-25 | 2021-08-31 | Sonos, Inc. | Evaluating calibration of a playback device |
US10003899B2 (en) | 2016-01-25 | 2018-06-19 | Sonos, Inc. | Calibration with particular locations |
US9864574B2 (en) | 2016-04-01 | 2018-01-09 | Sonos, Inc. | Playback device calibration based on representation spectral characteristics |
US9860662B2 (en) | 2016-04-01 | 2018-01-02 | Sonos, Inc. | Updating playback device configuration information based on calibration data |
US9763018B1 (en) | 2016-04-12 | 2017-09-12 | Sonos, Inc. | Calibration of audio playback devices |
US9794710B1 (en) | 2016-07-15 | 2017-10-17 | Sonos, Inc. | Spatial audio correction |
US10372406B2 (en) | 2016-07-22 | 2019-08-06 | Sonos, Inc. | Calibration interface |
US10459684B2 (en) | 2016-08-05 | 2019-10-29 | Sonos, Inc. | Calibration of a playback device based on an estimated frequency response |
US11012803B2 (en) | 2017-01-27 | 2021-05-18 | Auro Technologies Nv | Processing method and system for panning audio objects |
US10861467B2 (en) | 2017-03-01 | 2020-12-08 | Dolby Laboratories Licensing Corporation | Audio processing in adaptive intermediate spatial format |
US10972859B2 (en) | 2017-04-13 | 2021-04-06 | Sony Corporation | Signal processing apparatus and method as well as program |
CN107147975B (zh) * | 2017-04-26 | 2019-05-14 | 北京大学 | 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 |
US11277705B2 (en) | 2017-05-15 | 2022-03-15 | Dolby Laboratories Licensing Corporation | Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals |
US10405126B2 (en) * | 2017-06-30 | 2019-09-03 | Qualcomm Incorporated | Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems |
US10674301B2 (en) * | 2017-08-25 | 2020-06-02 | Google Llc | Fast and memory efficient encoding of sound objects using spherical harmonic symmetries |
US10264386B1 (en) * | 2018-02-09 | 2019-04-16 | Google Llc | Directional emphasis in ambisonics |
US11206484B2 (en) | 2018-08-28 | 2021-12-21 | Sonos, Inc. | Passive speaker authentication |
US10299061B1 (en) | 2018-08-28 | 2019-05-21 | Sonos, Inc. | Playback device calibration |
US20200402523A1 (en) * | 2019-06-24 | 2020-12-24 | Qualcomm Incorporated | Psychoacoustic audio coding of ambisonic audio data |
US10734965B1 (en) | 2019-08-12 | 2020-08-04 | Sonos, Inc. | Audio calibration of a portable playback device |
CN112530445A (zh) * | 2020-11-23 | 2021-03-19 | 雷欧尼斯(北京)信息技术有限公司 | 高阶Ambisonic音频的编解码方法及芯片 |
US11743670B2 (en) | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4095049A (en) * | 1976-03-15 | 1978-06-13 | National Research Development Corporation | Non-rotationally-symmetric surround-sound encoding system |
CA2406926A1 (en) * | 2000-04-19 | 2001-11-01 | Sonic Solutions | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics in three dimensions |
JP2002218655A (ja) | 2001-01-16 | 2002-08-02 | Nippon Telegr & Teleph Corp <Ntt> | 空港における給電システム |
FR2847376B1 (fr) | 2002-11-19 | 2005-02-04 | France Telecom | Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede |
US7558393B2 (en) * | 2003-03-18 | 2009-07-07 | Miller Iii Robert E | System and method for compatible 2D/3D (full sphere with height) surround sound reproduction |
EP1737267B1 (en) | 2005-06-23 | 2007-11-14 | AKG Acoustics GmbH | Modelling of a microphone |
JP4928177B2 (ja) * | 2006-07-05 | 2012-05-09 | 日本放送協会 | 音像形成装置 |
DE102006053919A1 (de) | 2006-10-11 | 2008-04-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US20080232601A1 (en) | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
EP2094032A1 (en) * | 2008-02-19 | 2009-08-26 | Deutsche Thomson OHG | Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same |
JP4922211B2 (ja) * | 2008-03-07 | 2012-04-25 | 日本放送協会 | 音響信号変換装置、その方法及びそのプログラム |
PL2154677T3 (pl) | 2008-08-13 | 2013-12-31 | Fraunhofer Ges Forschung | Urządzenie do wyznaczania konwertowanego przestrzennego sygnału audio |
WO2011012455A1 (en) | 2009-07-30 | 2011-02-03 | Oce-Technologies B.V. | Automatic table location in documents |
KR101755531B1 (ko) * | 2010-03-26 | 2017-07-07 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 |
EP2879408A1 (en) * | 2013-11-28 | 2015-06-03 | Thomson Licensing | Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition |
JP6589838B2 (ja) | 2016-11-30 | 2019-10-16 | カシオ計算機株式会社 | 動画像編集装置及び動画像編集方法 |
-
2011
- 2011-03-25 KR KR1020127025099A patent/KR101755531B1/ko active IP Right Grant
- 2011-03-25 KR KR1020217026627A patent/KR102622947B1/ko active IP Right Grant
- 2011-03-25 KR KR1020177018317A patent/KR101795015B1/ko active IP Right Grant
- 2011-03-25 BR BR122020001822-4A patent/BR122020001822B1/pt active IP Right Grant
- 2011-03-25 US US13/634,859 patent/US9100768B2/en active Active
- 2011-03-25 AU AU2011231565A patent/AU2011231565B2/en active Active
- 2011-03-25 WO PCT/EP2011/054644 patent/WO2011117399A1/en active Application Filing
- 2011-03-25 PL PL11709968T patent/PL2553947T3/pl unknown
- 2011-03-25 JP JP2013500527A patent/JP5559415B2/ja active Active
- 2011-03-25 PT PT117099689T patent/PT2553947E/pt unknown
- 2011-03-25 KR KR1020197005396A patent/KR102018824B1/ko active IP Right Grant
- 2011-03-25 CN CN201180016042.9A patent/CN102823277B/zh active Active
- 2011-03-25 KR KR1020187023439A patent/KR101953279B1/ko active IP Right Grant
- 2011-03-25 BR BR112012024528-7A patent/BR112012024528B1/pt active IP Right Grant
- 2011-03-25 KR KR1020247000412A patent/KR20240009530A/ko active Application Filing
- 2011-03-25 KR KR1020197025623A patent/KR102093390B1/ko active IP Right Grant
- 2011-03-25 ES ES11709968.9T patent/ES2472456T3/es active Active
- 2011-03-25 EP EP11709968.9A patent/EP2553947B1/en active Active
- 2011-03-25 KR KR1020177031814A patent/KR101890229B1/ko active IP Right Grant
- 2011-03-25 KR KR1020207008095A patent/KR102294460B1/ko active IP Right Grant
-
2013
- 2013-02-15 HK HK13101957.4A patent/HK1174763A1/xx unknown
-
2014
- 2014-06-05 JP JP2014116480A patent/JP5739041B2/ja active Active
-
2015
- 2015-04-22 JP JP2015087361A patent/JP6067773B2/ja active Active
- 2015-06-25 US US14/750,115 patent/US9460726B2/en active Active
-
2016
- 2016-08-23 US US15/245,061 patent/US9767813B2/en active Active
- 2016-12-21 JP JP2016247398A patent/JP6336558B2/ja active Active
-
2017
- 2017-08-21 US US15/681,793 patent/US10037762B2/en active Active
-
2018
- 2018-05-02 JP JP2018088655A patent/JP6615936B2/ja active Active
- 2018-06-26 US US16/019,233 patent/US10134405B2/en active Active
- 2018-11-13 US US16/189,768 patent/US10629211B2/en active Active
-
2019
- 2019-07-17 US US16/514,446 patent/US10522159B2/en active Active
- 2019-11-06 JP JP2019201467A patent/JP6918896B2/ja active Active
-
2020
- 2020-04-18 US US16/852,459 patent/US11217258B2/en active Active
-
2021
- 2021-07-21 JP JP2021120443A patent/JP7220749B2/ja active Active
- 2021-12-22 US US17/560,223 patent/US11948583B2/en active Active
-
2023
- 2023-01-31 JP JP2023012686A patent/JP2023052781A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6615936B2 (ja) | オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180403 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180502 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6336558 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |