JP2014523172A - 高次Ambisonics表現に含まれるサウンドオブジェクトの相対位置を変更する方法と装置 - Google Patents

高次Ambisonics表現に含まれるサウンドオブジェクトの相対位置を変更する方法と装置 Download PDF

Info

Publication number
JP2014523172A
JP2014523172A JP2014517583A JP2014517583A JP2014523172A JP 2014523172 A JP2014523172 A JP 2014523172A JP 2014517583 A JP2014517583 A JP 2014517583A JP 2014517583 A JP2014517583 A JP 2014517583A JP 2014523172 A JP2014523172 A JP 2014523172A
Authority
JP
Japan
Prior art keywords
warping
vector
coefficients
dimension
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014517583A
Other languages
English (en)
Other versions
JP5921678B2 (ja
JP2014523172A5 (ja
Inventor
ジャックス,ピーター
バトケ,ヨハン−マルクス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2014523172A publication Critical patent/JP2014523172A/ja
Publication of JP2014523172A5 publication Critical patent/JP2014523172A5/ja
Application granted granted Critical
Publication of JP5921678B2 publication Critical patent/JP5921678B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/024Positioning of loudspeaker enclosures for spatial sound reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Abstract

高次AmbisonicsHOAは、2次元及び3次元の両方で、優れた空間解像度を有する複雑なオーディオシーンの取得、操作、録音、送信及び再生を容易にする空間的サウンドフィールドの表現である。サウンドフィールドは、フーリエ・ベッセル級数により空間の基準点及びその周りにおいて近似される。本発明は、高次Ambisonics表現として取得または生成されたサウンドフィールド情報の空間的内容及び/または再生を修正するためにスペースワーピング(12,13,14;16)を用いる。2次元と3次元のサウンドフィールドに対するワーピング特性は異なってもよい。ワーピングは、シーン分析や分解を行わずに、空間領域で行われる。ある順序で入力されたHOA係数は、重みまたは規則的に配置された(仮想的)ラウドスピーカの入力信号に復号される。

Description

オーディオシーンの2次元または3次元の高次Ambisonics表現内に含まれるサウンドオブジェクトの相対位置を変更する方法と装置に関する。
高次Ambisonics(HOA)は、2次元及び3次元の両方で、優れた空間解像度を有する複雑なオーディオシーンの取得、操作、録音、送信及び再生を容易にする空間的サウンドフィールドの表現である。サウンドフィールドは、フーリエ・ベッセル級数により空間の基準点及びその周りにおいて近似される。
HOA手法で取得したオーディオシーンの空間構成を操作する手法は限られた数しかない。原理的には、2つの方法がある。すなわち、
A)例えば、DirACを介して、オーディオシーンを別々のサウンドオブジェクトと関連位置情報とに分解し、位置パラメータを操作して新しいシーンを合成する。欠点は、高度で間違いやすいシーン分解が必須だということである。
B)HOAベクトルの線形変換により、HOA表現の内容を修正できる。これについては、前後方向の回転、鏡映、及び強調のみが提案されている。これらの既知の変換ベースの修正手法はすべて、シーン内の複数のオブジェクトの相対的位置を一定に保つ。
シーンの内容を操作または修正するために、HOAの回転と鏡映を含み、特定方向の優越性を修正するスペースワーピング(space warping)が提案されている(非特許文献1−3)。
G.J. Barton, M.A. Gerzon著「Ambisonic Decoders for HDTV」(AES Convention, 1992) J. Daniel著「Representation de champs acoustiques, application a la transmission et a la reproduction de scenes sonores complexes dans un contexte multimedia」(PhD thesis, Universite de Paris 6, 2001, Paris, France) M. Chapman, Ph. Cotterell著「Towards a Comprehensive Account of Valid Ambisonic Transformations」(Ambisonics Symposium, 2009, Graz, Austria)
本発明により解決されるべき問題は、シーンの組成を分析する必要性無しに、HOAベースのオーディオシーン内に含まれる複数のサウンドオブジェクトの相対的位置の変更を容易にすることである。この問題は、請求項1に開示した方法により解決される。この方法を利用する装置を請求項2に開示した。
本発明は、高次Ambisonics表現として取得または生成されたサウンドフィールド情報の空間的内容及び/または再生を修正するためにスペースワーピングを用いる。HOAドメインにおけるスペーシャルワーピングは、マルチステップアプローチ、またはより計算的に効率のよいシングルステップの線形行列乗算を表す。2次元と3次元のサウンドフィールドに対するワーピング特性は異なってもよい。
ワーピングは、シーン分析や分解を行わずに、空間領域で行われる。ある順序で入力されたHOA係数は、重みまたは規則的に配置された(仮想的)ラウドスピーカの入力信号に復号される。発明的スペースワーピング処理には複数の利点がある。すなわち、
・パラメータ化に自由度があるので、非常に柔軟である、
・非常に効率的に、すなわち比較的低い複雑性で、実装できる、
・シーン分析や分解が必要ない。
原理的に、本発明的方法は、オーディオシーンの2次元または3次元の高次Ambisonics(HOA)表現内に含まれる複数のサウンドオブジェクトの相対位置を変更するのに適している、次元Oinの入力ベクトルAinが入力信号のフーリエ級数の係数を決定し、次元Ooutの出力ベクトルAoutが、対応する変更後の出力信号のフーリエ級数の係数を決定する。前記方法は次のステップを含む。
・前記入力HOA係数の入力ベクトルAinを、
<外1>
Figure 2014523172
を計算することにより、モード行列Ψの逆行列Ψ −1を用いて、規則的に配置されたラウドスピーカの位置に対する空間領域の入力信号sinに復号するステップ、
・前記入力信号sinを、
<外2>
Figure 2014523172
を計算することにより、前記適合させた出力HOA係数の出力ベクトルAoutに空間領域でワープ及びエンコードするステップであって、元のラウドスピーカ位置の角度が、前記出力ベクトルAout中のターゲットラウドスピーカ位置のターゲット角度に、1対1にマッピングされるワーピング関数f(Φ)により、モード行列のモードベクトルが修正されるステップ。
原理的に、本発明的装置は、オーディオシーンの2次元または3次元の高次Ambisonics(HOA)表現内に含まれる複数のサウンドオブジェクトの相対位置を変更するのに適し、次元Oinの入力ベクトルAinが入力信号のフーリエ級数の係数を決定し、次元Ooutの出力ベクトルAoutが、対応する変更後の出力信号のフーリエ級数の係数を決定する。前記装置は次の手段を含む。
・前記入力HOA係数の入力ベクトルAinを、
<外3>
Figure 2014523172
を計算することにより、モード行列Ψの逆行列Ψ −1を用いて、規則的に配置されたラウドスピーカの位置に対する空間領域の入力信号sinに復号するように構成された手段、
・前記入力信号sinを、
<外4>
Figure 2014523172
を計算することにより、前記適合させた出力HOA係数の出力ベクトルAoutに空間領域でワープ及びエンコードするように構成された手段であって、元のラウドスピーカ位置の角度が、前記出力ベクトルAout中のターゲットラウドスピーカ位置のターゲット角度に、1対1にマッピングされるワーピング関数f(Φ)により、モード行列のモードベクトルが修正される手段。
本発明のこれ以外の有利な実施形態は、それぞれの従属項に開示されている。
添付した図面を参照して、本発明の実施形態を例として説明する。
空間領域におけるワーピングの原理を示す図である。 in=3、Nout=12、及びワーピング関数がf(Φ)=Φ+2 atan (a sinΦ/ (1-a cos Φ)) ワーピング関数及び「内部」順序Nwarpが異なる場合の行列歪みを示す図である。
結局、理解できるように、スペースワーピングの発明的アプリケーションを2次元の設定で説明し、HOA表現は円形ハーモニクス(circular harmonics)に依存し、表現されるサウンドフィールドは平面音波のみを含むものと仮定する。その後、説明を球面ハーモニクス(spherical harmonics)に基づいて3次元の場合に拡張する。
記法
Ambisonics理論では、空間中のある点及びその周りにおけるサウンドフィールドは、先を切り捨てたフーリエ・ベッセル級数により記述される。一般的に、基準点は、選択した座標系の原点にあると仮定する。
球面座標を用いる3次元アプリケーションの場合、すべての確定されたインデックスn=0,1,・・・,Nとm=−n,・・・,nの係数A を有するフーリエ級数は、方位角Φ、傾きθ、原点からの距離rにおけるサウンドフィールドの圧力を
Figure 2014523172
と記述する。
ここで、kは波数であり、
<外5>
Figure 2014523172
<外6>
Figure 2014523172
で用いられる。特定の順序Nの場合、フーリエ・ベッセル級数の係数の数は
<外7>
Figure 2014523172
円座標を用いる2次元アプリケーションの場合、カーネル関数は方位角Φのみに依存する。m≠nであるすべての係数は、値がゼロであり省略できる。それゆえ、HOA係数の数は
<外8>
Figure 2014523172
のみに減少する。さらに、傾きθ=π/2は一定である。留意点として、2次元の場合、かつサウンドオブジェクトが円上に完全に一様に分布している場合、すなわち
<外9>
Figure 2014523172
である場合、Ψ内のモードベクトルは、周知の離散フーリエ変換DFTのカーネル関数と同じである。
カーネル関数の定義には異なる複数の慣例があり、Ambisonics係数Anmの定義も異なる。しかし、細かい定義は、本願で説明するスペースワーピング手法の基本的な仕様と特徴には影響しない。
HOA「信号」は、各時点のAmbisonics係数のベクトルAを含む。2次元、すなわち円の設定の場合、係数ベクトルの典型的な組成と順序は
Figure 2014523172
である。3次元の球面の設定の場合、係数の通常の順序は異なり
Figure 2014523172
となる。HOA表現のエンコーディングは線形に振る舞い、それゆえ複数の離れたサウンドオブジェクトのHOA係数は、結果的なサウンドフィールドのHOA係数を求めるために、合計できる。
明白なエンコーディング
複数の方向からの複数のサウンドオブジェクトの明白なエンコーディングは、ベクトル代数で簡単に求められる。「エンコーディング」は、同じ時点lにおける、及び音波が座標系の原点に到着する方向φとθにおける、個々のサウンドオブジェクト(i=0・・・M−1)の圧力貢献s(k,l)に関する情報から、時点lと波数kにおけるHOA計数A(k,l)
Figure 2014523172
のベクトルを求めることである。
2次元設定と式(2)で確定したHOAベクトルの成分を仮定すると、モード行列Ψは、モードベクトル
<外10>
Figure 2014523172
Figure 2014523172
である。
上で定義したように、HOA表現のエンコーディングは、入力信号(サウンドオブジェクト)が空間的に分布しているので、空間・周波数変換と解釈できる。行列Ψによるこの変換は、サウンドオブジェクトの数がHOA係数の数に等しい、すなわちM=Oの場合、及び方向φiが単位円の周りに広がっている(reasonably spread)場合にのみ、情報損失無しに逆変換できる。数学的に言うと、逆変換できる条件は、モード行列Ψが正方行列(O×O)であり、逆行列があることである。
単純な復号
復号により、リアルまたはバーチャルラウドスピーカのドライバ信号が得られ、そのドライバ信号は入力HOA係数により記述される所望のサウンドフィールドを正確に再生するために用いられる。かかる復号は数Mとラウドスピーカの位置とに依存する。次の重要な3つの場合を区別しなければならない(注釈、これらの場合は、ラウドスピーカがジオメトリ的に合理的に設置されているという仮定の下で、「ラウドスピーカの数」により確定されるという意味で単純化される。より正確には、ターゲットのラウドスピーカの設置のモードマトリックスのランクにより確定される。下記の復号規則の例では、モードマッチング復号原理を用いるが、他の復号原理も利用でき、3つのシナリオに対する復号規則は異なることになる。
・過剰決定の場合(overdetermined case):ラウドスピーカの数はHOA係数の数より多く、すなわちM>0である。この場合、復号問題には位置的な解法はないが、すべての潜在的解法のM次元空間のM−O次元サブ空間にあるさまざまな許容可能解が存在する。典型的には、ラウドスピーカ信号s、
Figure 2014523172
を決定するために、特定のラウドスピーカ設定のモードマトリックスΨの疑似逆行列を用いる。
この解は、粗再生パワー
<外11>
Figure 2014523172
が最小となるラウドスピーカ信号を与える(例えば、L.L.Scharf, 「Statistical Signal Processing. Detection, Estimation, and Time Series Analysis」, Addison-Wesley Publishing Company, Reading, Massachusetts, 1990を参照されたい)規則的なラウドスピーカの設定の場合(これは2次元の場合に容易に行い得る)、行列演算
<外12>
Figure 2014523172
は単位行列となり、式(6)の復号規則は
<外13>
Figure 2014523172
に単純化される。
・決定された場合:ラウドスピーカの数はHOA係数の数と同じである。復号問題にはただ1つの解しかなく、それはモードマトリックスΨの逆行列Ψ−1により
Figure 2014523172
確定される。
・劣決定の場合:ラウドスピーカの数MはHOA係数の数Oより少ない。サウンドフィールドを復号する数学的問題は、劣決定(underdetermined)であり、一意的かつ厳密な解は無い。その替わりに、所望のサウンドフィールドに最もマッチしそうなラウドスピーカ信号を決定するには、数値的な最適化を用いなければならない。
安定した解を求めるために、例えば式
Figure 2014523172
により、正規化を適用できる。ここで、Iは単位行列であり、スカラー係数λは正規化の量を確定する。一例として、λは
<外14>
Figure 2014523172
の固有値の平均に設定できる。
得られるビームパターンは、準最適であり得る。一般的に、このアプローチで得られるビームパターンは過剰に指向的であり、多くのサウンド情報が過小評価される。
上記のすべてのデコーダの例では、ラウドスピーカは平面波を放射すると仮定した。現実世界のラウドスピーカの再生特性は異なり、復号規則がその特性を考慮しなければならない。
ベーシックワーピング
本発明の空間ワーピングの原理を図1aに示す。ワーピングは空間領域で行われる。それゆえ、字数Nin、次元Oinの入力HOA係数Ainは、まず規則的に配置された(バーチャル)ラウドスピーカの重みまたは入力信号sinに、ステップ/段階12で復号される。この復号ステップでは、決定デコーダ(determined decoder)、すなわち仮想ラウドスピーカの数OwarpがHOA係数Oin以上であるデコーダを用いると有利である。後者の場合(HOA係数よりラウドスピーカが多い場合)、HOA係数のベクトルAinの次数または次元は、ステップ/段階11において、高次にゼロ係数を加えることにより、容易に拡張できる。ターゲットベクトルsinの次元は、結局、Owarpで示される。
復号規則は
Figure 2014523172
である。
<外15>
Figure 2014523172
である。これにより、モードマトリックスΨが復号行列Ψ −1を決定するのに調子がよいことが保証される。
次に、バーチャルラウドスピーカの位置が、所望のワーピング特性により、「ワープ」処理で修正される。そのワープ処理は、ステップ/段階14において、モードマトリックスΨを用いて、ターゲットベクトルsin(またはsout)の符号化と合成され、次元Owarpの、またはさらに下記の処理ステップが施されて、次元Ooutの、ワープしたHOA係数のベクトルAoutが得られる。原理的に、ワーピング特性はソース角からターゲット角への1対1マッピングにより完全に確定できる。すなわち、各ソース角φin=0・・・2πとθin=0・・・2πに対して、ターゲット角が確定され、2次元の場合、
Figure 2014523172
であり、3次元の場合、
Figure 2014523172
Figure 2014523172
である。
理解のため、この(仮想的な)再方向付けは、ラウドスピーカを新しい位置へ物理的に動かすことと対比できる。
この手順により生じるひとつの問題は、ある角度にある隣接するラウドスピーカ間の距離が、ワーピング関数f(φ)の傾きにより変わることである(これはこの後2次元の場合について説明する):f(φ)の傾きが1より大きいとき、ワープしたサウンドフィールド中の同じ角度空間は、元のサウンドフィールドよりも、少ない「ラウドスピーカ」で占められ、その逆も成り立つ。言い換えると、ラウドスピーカの密度D
Figure 2014523172
のように振る舞う。
次に、これは、空間ワーピングにより、リスナの周りのサウンドバランスが変わることを意味する。ラウドスピーカの密度が高くなる、すなわち
<外16>
Figure 2014523172
である領域は、より支配的になり、
<外17>
Figure 2014523172
オプションとして、アプリケーションの要請に依存して、ラウドスピーカ密度の上記の変化は、重みステップ/段階13においてバーチャルラウドスピーカ出力信号sinに利得関数g(φ)を適用することにより、対抗(counter)され、信号soutが得られる。原理的に、任意の重み付け関数g(φ)を指定できる。ワーピング関数f(φ)の微分に比例する具体的な有利な一変形例
Figure 2014523172
が経験的に決定されている。
この特定の重み付け関数を用いて、適当に高い内部次数(inner order)と出力次数(outer order)を仮定して(下の「HOA次数の設定のしかた」セクションを参照)、ワープされた角度f(φ)におけるパンニング関数の振幅は、元の角度φにおける元のパンニング関数と等しく保たれる。それにより、オープニング角ごとの均一なサウンドバランス(振幅)が得られる。
上記の重み付け関数例からは離れて、例えば、オープニング角ごとにパワーを等しくするために、他の重み付け関数を用いることもできる。
最後に、ステップ/段階14において、重み付けされたバーチャルラウドスピーカ信号はワープされ、
<外18>
Figure 2014523172
を実行することにより、モードマトリックスΨで再びエンコードされる。Ψは、ワーピング関数f(Φ)により、Ψ1とは異なるモードベクトルを含む。結果は、ワープされたサウンドフィールドのOwarp次元HOA表現である。
ターゲットHOA表現の次数または次元はΨ2の次元より低い(後の「HOA次数の設定のしかた」セクションを参照)場合、ワープされた係数のいくつか(すなわち、一部)はステップ/段階15で除去(取り除き)されねばならない。一般的に、この取り除き操作はウィンドウ操作により記述できる:エンコードされたベクトル
<外19>
Figure 2014523172
は、除去される最高次には0である係数を含むウィンドウベクトルwとかけられる。このかけ算は、さらなる重み付けを表すと考えることができる。最も単純な場合には、正方形ウィンドウが適用できるが、文献M.A. Poletti、「A Unified Theory of Horizontal Holographic Sound Systems」(Journal of the Audio Engineering Society, 48(12), pp.1155- 1182, 2000)のセクション3に記載されているように、より高度なウィンドウを用いることもでき、または上記のJ.Danielの博士論文のセクション3.3.2に記載された「同相(in-phase)」または「max. rE」ウィンドウを用いることもできる。
3次元のワーピング関数
2次元の場合について、ワーピング関数f(φ)、及び関連する重み付け関数g(φ)の概念を上で説明した。以下は、高次元であり、球面ジオメトリを適用しなければならないために、より高度である3次元の場合への拡張である。2つの簡単なシナリオを導入する。両方とも、1次元のワーピング関数f(φ)またはf(θ)により所望の空間的ワーピングを指定できる。
経度方向の空間的ワーピングでは、空間的ワーピングは、方位角φのみの関数として実行できる。この場合は、上で説明した2次元の場合とほぼ同様である。ワーピング関数は
Figure 2014523172
Figure 2014523172
により完全に確定される。
それにより、2次元の場合のように、同様のワーピング関数を適用できる。空間的ワーピングは、赤道上においてサウンドオブジェクトに対し最大のインパクトを有し、球の極においてサウンドオブジェクトに対し最小のインパクトを有する。球面上の(ワープされた)サウンドオブジェクトの密度は、方位角のみに依存する。それゆえ、一定密度に重み付け関数は
Figure 2014523172
ワーピングを適用しその後に逆回転する前に球面を(仮想的に)回転することにより、空間におけるワーピング特性の自由な方向付けが可能である。
緯度方向の空間的ワーピングでは、子午線に沿ってのみ空間的ワーピングができる。ワーピング関数は
Figure 2014523172
Figure 2014523172
により確定される。
球面上のこのワーピング関数の重要な特性は、方位角が一定に保たれても、方位角方向の2点の角度距離は傾きの変化により変化することがあるということである。理由は、2本の子午線間の角度距離が赤道で最大であるが、2つの極ではゼロになるからである。この事実は重み付け関数で考慮しなければならない。
2点AとBの角度距離cは、球面幾何学の余弦則により決定でき、
Figure 2014523172
、ここでφABは2点AとBの間の角度距離である。I.N. Bronstein, K.A. Semendjajew, G. Musiol, H. Muhlig著「Taschenbuch der Mathematik」(Verlag Harri Deutsch, Thun, Frankfurt /Main, 5th edition, 2000)の式(3.188c)を参照されたい。同じ傾きθにおける2点間の角度距離に関して、この式は
Figure 2014523172
と単純化できる。
この式は、空間中の点と、小さい方位角φεだけ離れた他の点との間の角距離を求めるために使うことができる。「小さい」とは、実際のアプリケーションにおいて現実的に小さいが、ゼロではないことを意味し、理論的には、極限値φε→0である。ワーピング前後の各距離間の比は、サウンドオブジェクトの密度がφ方向で変化する係数
Figure 2014523172
を与える。
最終的に、重み付け関数は、φ方向とθ方向の2つの重み付け関数の積
Figure 2014523172
である。ここで再び、前出のシナリオのように、空間におけるワーピング特性の自由な方向付けは、回転により実現可能である。
単一ステップ処理
Figure 2014523172
と記述する。ここで、diag(・)はそのベクトル引数の値を主対角線の成分としてもつ対角行列を示し、gは重み付け関数であり、wは上記の、すなわちステップ/段階15で実行される取り除きに備えた重み付けと、係数取り除き(coefficients-stripping)そのものの2つの関数からの取り除き(stripping)を準備するウィンドウベクトルであるり、式(24)のウィンドウベクトルは、重み付けのみに作用する。
マルチステップアプローチにおける次数の2つのアダプテーション、すなわちデコーダに先行する次数の拡張と、エンコーディング後のHOA係数の取り除きも、対応する劣及び/またはラインを除去することにより、変換行列Tに組み込める。それゆえ、サイズOout×Oinの行列を求め、入力HOAベクトルに直接適用できる。そして、空間的ワーピング演算は
Figure 2014523172
となる。
有利にも、Owarp×OwarpからOout×Oinへの変換行列Tの次元の有効な低減により、図1bによる単一ステップ処理を実行するのに必要な計算上の複雑性は、図1aのマルチステップアプローチに必要なものようりも大幅に少なくなり、それでも単一ステップ処理で完全に同じ結果が得られる。具体的に、それにより、マルチステップ処理が中間信号の低い次数Nwarpで実行された場合に生じ得る歪みを回避する(詳細は下の「HOA次数の設定のしかた」セクションを参照されたい)。
技術水準:回転及び鏡映
サウンドフィールドの回転と鏡映は、空間的ワーピングの「単純な」サブカテゴリーと考えられる。これらの変換の特別な特性は、サウンドオブジェクト相互の相対的位置は変わらないということである。すなわち、元のサウンドシーンにおいて、例えば、他のサウンドオブジェクトの右側30°にあったサウンドオブジェクトは、回転されたサウンドシーンにおいても同じ他のオブジェクトの右側30°にある。鏡映の場合、符号は変わるが、角距離は同じである。
サウンドフィールド情報の回転と鏡映のアルゴリズムとアプリケーションは研究され、例えば上記のBarton/Gerzon及びJ.Danielの文献、及びM. Noisternig, A. Sontacchi, Th . Musil, R. Holdrich著「A 3D Ambisonic Based Binaural Sound Reproduction System」(Proc. of the AES 24th Intl. Conf. on Multichannel Audio, Banff, Canada, 2003)及びH. Pomberger, F. Zotter著「An Ambisonics Format for Flexible Playback Layouts」(1st Ambisonics Symposium, Graz, Austria, 2009)に記載されている。
これらのアプローチは回転行列の解析的表現に基づく。例えば、円形サウンドフィールド(2次元の場合)の任意の角度αの回転は、ワーピングマトリックスTαとのかけ算により行い得る。Tα
Figure 2014523172
では係数のサブセットが非ゼロである。
この例のように、回転及び/または鏡映演算のすべてのワーピングマトリックスは、同じ次数の係数のみが互いに影響するという特殊な特性を有する。それゆえ、これらのワーピングマトリックスは、非ゼロ要素が非常に少なく、出力Noutは、空間的情報を失うことなく、入力次数Ninと等しくできる。
サウンドフィールド情報の回転や鏡映が必要である多数の興味深いアプリケーションがある。一例は、ヘッドトラッキングシステムを有するヘッドホンを介したサウンドフィールドの再生である。頭部の回転角によりHRTF(head-related transfer function)を補間するのではなく、東部の位置によりサウンドフィールドを予め回転して、再生には一定のHRTFを用いると都合がよい。この処理は、上記のNoisternig/Sontacchi/Musil/Holdrichの文献に記載されている。
他の例が、サウンドフィールド情報のエンコーディングの場合について、上記のPomberger/Zotterの文献に記載されている。HOAベクトルにより記述される空間領域を、円(2次元の場合)または球の一部に制約することも可能である。制約のため、HOAベクトルの一部はゼロになる。あの文献で提唱されているアイデアは、この冗長性低減特性をサウンドフィールド情報のミクストオーダーコーディング(mixed-order coding)に利用するものである。上記の制約は空間の特定領域にのみ得られるため、伝送された部分的情報を空間の所望の領域にシフトするためには、一般的には回転演算が必要である。
実施例
図2は、2次元(円)の場合における空間的ワーピングの一例を示す。ワーピング関数は、一実数値パラメータを有する離散時間オールパスフィルタの位相応答に似た、
Figure 2014523172
とした。M. Kappelan著「Eigenschaften von Allpass-Ketten und ihre Anwendung bei der nicht-aquidistanten spektralen Analyse und Synthese」(PhD thesis, Aachen University (RWTH) , Aachen, Germany, 1998)を参照。
ワーピング関数を図2aに示した。2π周期のワーピング関数を保証し、一パラメータaを有する空間的歪みの量を修正できるので、このワーピング関数f(φ)を選択した。
図2bに示した対応する重み付け関数g(φ)は、必然的に、そのワーピング関数から得られる。
図2cは、7×25シングルステップ変換ワーピングマトリックスTを示す。この行列の個々の係数の対数絶対値を、添付のグレースケールまたはシェーディングバーにより、グレースケールまたはシェーディングタイプにより示した。この行列例は、入力HOA次数Nε=3、出力次数Nout=12に対して設計されている。低次係数から高次係数まで変換により分散した情報のほとんどをキャプチャするためには、高い出力次数が必要である。出力次数がさらに減れば、ワーピング演算の精度が悪くなるだろう。ワーピングマトリックスの非ゼロ係数が無視されるからである(より詳細については、以下の「HOA次数の設定のしかた」セクションを参照されたい)。
このワーピングマトリックスの非常に有用な特性は、その多くの部分がゼロであるということである。これにより、この演算を実行する時に多くの計算パワーを節約できるが、シングルステップ変換行列のある部分がゼロであることは原則ではない。
図2dと図2eは、いくつかの平面波により生じるビームパターンの例におけるワーピング特性を示す。両図は、φの位置0,2/7π、4/7π、6/7π、8/7π、10/7π及び12/7πにおける、すべての振幅が1である7つの同じ入力平面波のものであり、7つの角振幅分布を示し、すなわち過剰決定の規則的デコーディング演算のベクトルs
Figure 2014523172
を示す。ここで、HOAベクトルAは、元のベクトルまたは平面波のセットをワープしたもののどちらかである。円の外側の数字は角度φを表す。バーチャルラウドスピーカ数(例えば、360)は、HOAパラメータの数よりかなり多い。前方方向から来る平面波の振幅分布またはビームパターンは、φ=0である。
図2dは、元のHOA表現の振幅分布を示す。7つのすべての分布は、似た形状であり、メインローブと同じ幅を有する。メインローブの最大は、予想通り、元の7つのサウンドオブジェクトの角度φ=(0、2/7π、・・・)にある。メインローブは、元のHOAベクトルの限定次数Nin=3に対応する幅を有する。
図2eは、同じサウンドオブジェクトの振幅分布であるが、ワーピング演算を行った後のものを示す。一般的に、オブジェクトは0°の前方向に向けて動かされ、ビームパターンは変更されている:前方向φ=0のまわりのメインローブは、狭くなり、よりフォーカスされている。一方、180°のまわりの後ろ方向のメインローブは大幅に広くなった。サイドでは、90°と270°で最大のインパクトがあり、ビームパターンは、これらの角度に対する図2bの重み付け関数g(φ)の大きな傾きのため、非対称になっている。ビームパターンのこれらの大きな変化(狭くなり形状が変わる変化)は、ワープされたHOAベクトルの高次Nout=12により可能になっている。理論的には、前方向のメインローブの分解能は、2.33倍だけ増加している。一方、後ろ方向の分解能は1/2.33倍だけ減少している。ローカルの次元が空間的に変わるミクストオーダー信号が生成される。ワープされたHOA係数を満足行く精度で表すには
<外20>
Figure 2014523172
の最小出力次元が必要であると仮定できる。以下の「HOA次元の設定のしかた」セクションでは、本来のローカル次元をより詳細に説明する。
特性
上記のワーピングステップは一般的であり非常に柔軟である。少なくとも次の基本演算を実現できる:任意の軸及び/または面のよる回転及び/または鏡映、連続ワーピング関数による空間的歪み、及び特定方向の重み付け(空間的ビームフォーミング)。
以下のサブセクションでは、本発明のスペースワーピングの多くの特性を強調し、これらの詳細により何ができて何ができないかについてガイダンスを与える。さらにまた、いくつかのデザインルールを説明する。原理的に、次のパラメータは所望のワーピング特性を得るために、自由度があり調節できる:
・ワープ関数f(θ,φ);
・重み付け関数g(θ,φ);
・内部次元Nwarp
・出力次元Nout
・ベクトルwを用いた出力係数のウィンドウイング
線形性
マルチステップ処理の基本的な変換ステップは、定義により線形である。中間で起こっている新しいロケーションへのサウンドソースの非線形マッピングは、エンコーディングマトリックスの確定にインパクトがあるが、エンコーディングマトリックス自体は線形のままである。その結果、合成されたスペースワーピング演算とTとの行列のかけ算は、線形演算であり、すなわち
Figure 2014523172
である。この特性は本質的である。この特性により、異なる複数のサウンドソースからの同時的な貢献を含む複雑なサウンドフィールド情報を処理できるからである。
空間不変性
定義により(ワーピング関数が傾き1または−1で完全に線形でない限り)、スペースワーピング変換は空間的に不変ではない。これは、その演算が、半球上の異なる位置にあったサウンドオブジェクトに対して異なる振る舞いをすることを意味する。数学的に言えば、この特性は、少なくともいくつかの任意の角度α∈]0...2π[に対するワーピング関数f(φ)の非線形性、すなわち
Figure 2014523172
の結果である。
可逆性
一般的には、変換行列Tは数学的反転によっては単純に逆にできない。ひとつの明らかな理由はTは通常は非正方行列であることにある。正方なスペースワーピング行列であっても可逆ではない。低次係数から高次係数に広がっている情報が失われ(HOA次元の設定のしかたセクションと実施例セクションの例とを比較されたい)、演算で情報が失われることは、その演算が逆転できないことを意味するからである。
それゆえ、スペースワーピング演算を少なくとも近似的に逆転する他の方法を見つけなければならない。逆ワーピング変換Trevは、ワーピング関数f(・)の逆関数frev(・)
Figure 2014523172
を介してデザインできる。HOA次元の選択によって、この処理は逆変換を近似する。
HOA次元の設定のしかた
スペースワーピング変換をデザインする時に考慮すべき重要な側面は、HOA次元である。入力ベクトルAinの次数Ninは外的制約により予め決まっているが、出力ベクトルAoutの次数Noutと実際の非線形ワーピング演算の「内部」次数Nwarpは、大体任意に割り当てできる。しかし、両方の次数NinとNwarpは両方とも以下に説明するように注意して選択しなければならない。
「内部」次元Nwarp;
「内部」次元Nwarpは、上記のマルチステップスペースワーピングにおける実際のでコーディング、ワーピング、及びエンコーディングステップの精度を確定する。一般的に、次数Nwarpは入力次数Ninと出力次数Noutの両方より大幅に大きくなければならない。この要件の理由は、ワーピング演算が一般的に非線形演算なので、歪みとアーティファクトが生じることにある。
このことを説明するため、図3は、図2の例に用いたのと同じワーピング関数の完全なワーピングマトリックスの例を示す。図3a、図3c、及び図3eは、それぞれワーピング関数f(φ)、f(φ)及びf(φ)を示す。図3b、図3d、及び図3fは、それぞれワーピングマトリックスT(dB)、T(dB)、及びT(dB)を示す。例示のために、特定の入力次元Ninまたは出力次元Noutのワーピングマトリックスを決定するために、これらのワーピングマトリックスはクリッピングされていない。そのかわり、図3b、図3d、及び図3f中の中央のボックスの点線は、最終結果の目標サイズNout×Nin、すなわちクリッピングされた変換行列を示す。このように、ワーピングマトリックスへの非線形歪みのインパクトは明らかに見える。この例では、目標次元は任意的にNin=30及びNout=100に設定されている。
基本的な問題が図3bから分かる:明らかに、空間領域における非線形処理により、ワーピングマトリックス内の係数が主対角線の周りに広がり、行列の中心から遠くなればなるほどより大きく広がる。中心から非常に遠いところでは、yは縦軸として、例では|y|≧90のところでは、広がった係数は行列全体の境界に達しており、「跳ね返る」ように見える。これにより特殊な歪みが発生し、ワーピングマトリックスの大きな部分に及ぶ。実験的な評価では、歪みプロダクト(distortion products)が行列の目標エリア(図中、点線で示した)内に配置されるとすぐに、これらの歪みが変換性能を大きく損なうことが観察された。
図3bの第1の例の場合、処理の「内部」次数がNwarp=200とされ、これは出力次数Nout=100より大幅に大きいので、うまくいっている。歪んだ領域は点線のボックスには及んでいない。
他のシナリオを図3dに示した。内部次数は出力次数に等しく指定されており、すなわちNwarp=Nout=100である。図は、歪みの範囲は、内部次数に対して線形にスケールすることを示している。その結果、変換の出力の高次係数は歪みプロダクト(distortion products)により汚染されている。かかるスケーリング特性の利点は、内部次数Nwarpを適宜大きくすることにより、これらのタイプの非線形歪みを回避できるらしいことである。
図3fは、係数がa=0.7と大きいよりアグレッシブなワーピング関数を有する例を示す。ワーピング関数がよりアグレッシブなので、内部次数Nwarp=200の場合であっても、歪みは目標行列エリアに及んでしまう。この場合、前出のパラグラフで求めたように、過剰プロビジョニングよりも内部次数はより大きくしなければならない。このワーピング関数の実験は、内部次数を例えばN=400に増加することにより、これらの非線形歪みがなくなることを示している。
要するに、ワーピング演算が強ければ強いほど、内部次数Nwarpは大きくなければならない。最小内部次数を求める公式はまだ無い。しかし、疑わしい場合には、過剰プロビジョンの「内部」次数が役に立つ。非線形効果はワーピングマトリックスのサイズに対して線形にスケールするからである。原理的に、「内部」次数は任意で高くすることができる。具体的に、シングルステップの変換行列を求める場合、内部次数は最終的なワーピング演算の複雑性に対しては、何ら役割を果たさない。
出力次数Nout
ワーピング変換の出力次数Noutを記述するため、次の2つの側面を考慮すべきである:
・一般的に、異なる次数の係数に広がったすべての情報を保持するために、出力次数は入力次数Ninより大きくなければならない。実際に必要なサイズは、ワーピング関数の特性にも依存する。経験から言って、ワーピング関数f(φ)が「ブロードバンド」でなければないほど、必要な出力次数は小さくなる。いくつかの場合には、必要な出力次数Noutを制限するため、ワーピング関数をローパスフィルタにかけることができると思われる。
一例は図3bに示されている。このワーピング関数の場合、点線のボックスで示したように、出力次数Nout=100は情報の損失を防ぐのに十分である。出力次数が大幅に、例えばNout=50に低減されると、変換行列のいくつかの非ゼロ係数が残り、対応する情報損失が生じると考えられる。
・いくつかの場合には、限定された次数のみを処理できる処理または装置に対して、出力HOA係数を用いる。例えば、ターゲットは、限られた数のスピーカを有するラウドスピーカセットアップであり得る。かかるアプリケーションでは、出力次数は目標システムの能力により指定されるべきである。Noutが十分小さければ、ワーピング変換により空間的情報が効果的に低減される。
内部次数Nwarpの出力次数Noutへの低減は、高次係数をドロップすることにより行い得る。これは、HOA出力ベクトルへの正方形のウィンドウの適用に対応する。あるいは、上記のM.A. PolettiやJ. Danielの文献に記載されているように、.より高度な帯域幅低減手法を適用できる。それにより、正方形のウィンドウイングよりもより多くの情報が失われ易いが、よりよい方向パターンが実現できる。
本発明は、例えば、録音、ポストプロダクション、伝送、再生などのオーディオ処理チェーンの異なる複数の部分で用いることができる。

Claims (10)

  1. オーディオシーンの2次元または3次元の高次AmbisonicsHOA表現内に含まれる複数のサウンドオブジェクトの相対的位置を変更する方法であって、
    次元Oinを有する入力ベクトルAinが入力信号のフーリエ級数の係数を決定し、次元Ooutを有する出力ベクトルAoutが、対応する変更後の出力信号のフーリエ級数の係数を決定し、前記方法は、
    モード行列Ψの逆行列Ψ −1を用いて、sin=Ψ −1inを計算することにより、入力HOA係数の前記入力ベクトルAinを、規則的に配置されたラウドスピーカの位置に対して、空間領域の入力信号sinにデコードするステップと、
    out=Ψinを計算することにより、前記入力信号sinを、適合させた出力HOA係数を有する前記出力ベクトルAoutに、空間領域でワープ及びエンコードするステップであって、
    元のラウドスピーカの位置の角度(φin,θin)が、前記出力ベクトルAout中のターゲットラウドスピーカ位置のターゲット角度(φout,θin)に、1対1マッピングされるワーピング関数f(Φ)により、前記モード行列Ψ2のモードベクトルが修正される、ステップとを有する方法。
  2. オーディオシーンの2次元または3次元の高次AmbisonicsHOA表現内に含まれる複数のサウンドオブジェクトの相対的位置を変更する装置であって、
    次元Oinを有する入力ベクトルAinが入力信号のフーリエ級数の係数を決定し、次元Ooutを有する出力ベクトルAoutが、対応する変更後の出力信号のフーリエ級数の係数を決定し、前記装置は、
    モード行列Ψの逆行列Ψ −1を用いて、sin=Ψ −1inを計算することにより、入力HOA係数の前記入力ベクトルAinを、規則的に配置されたラウドスピーカの位置に対して、空間領域の入力信号sinにデコードするように構成された手段と、
    out=Ψinを計算することにより、前記入力信号sinを、適合させた出力HOA係数を有する前記出力ベクトルAoutに、空間領域でワープ及びエンコードするように構成された手段であって、元のラウドスピーカの位置の角度(φin,θin)が、前記出力ベクトルAout中のターゲットラウドスピーカ位置のターゲット角度(φout,θin)に、1対1マッピングされるワーピング関数f(Φ)により、前記モード行列Ψ2のモードベクトルが修正される、手段とを有する装置。
  3. 前記空間領域の入力信号sinは、前記ワープ及びエンコードするステップの前に、ゲイン関数g(φ)またはg(θ,φ)により重み付けされる、請求項1に記載の方法、または
    前記ワープ及びエンコードする前に、ゲイン関数g(φ)またはg(θ,φ)により前記空間領域の入力信号sinを重み付けするように構成された手段を含む、請求項2に記載の装置。
  4. 2次元Ambisonicsの場合、前記ゲイン関数は
    <外1>
    Figure 2014523172
    3次元Ambisonicsの場合、前記ゲイン関数は、φ方向とθ方向において、
    <外2>
    Figure 2014523172
    であり、
    φは方位角であり、θは傾斜角であり、φεは小さい方位角である、
    請求項3に記載の方法、または請求項3に記載の装置。
  5. 仮想的ラウドスピーカの数または次元OwarpがHOA係数の数または次元Oin以上である場合、前記デコードするステップの前に、より高次のゼロ係数を追加することにより、前記入力ベクトルAinの次数または次元を拡張する、請求項1、3または4に記載の方法、または
    前記デコードをする前に、仮想ラウドスピーカの数または次元がHOA係数の数または次元Oin以上である場合に、より高い次数のゼロ係数を加えることにより、前記入力ベクトルAinの次数または次元を拡張するように構成された手段を含む、請求項2ないし4いずれか一項に記載の装置。
  6. HOA係数の次数または次元が前記モード行列Ψの次数または次元より低い場合、前記出力ベクトルAoutを提供するため、前記ワープされた係数の一部を取り除くために、前記ワープされエンコードされ場合によっては重み付けされた信号Ψinを、より高次にゼロ係数を有するウィンドウベクトルwを用いて、さらに重み付けする、請求項1、3ないし5いずれか一項に記載の方法、または
    最高時にゼロ係数を有するウィンドウベクトルwを用いて、前記ワープされ、エンコードされ、場合によっては重み付けされた信号Ψinをさらに重み付けし、前記出力ベクトルAoutを提供するために、前記ワープされた係数の一部を除去するように構成された手段を含む、請求項2ないし5いずれか一項に記載の装置。
  7. 前記デコード、重み付け、及びワープ/デコードするステップは、共にサイズOwarp×Owarpの変換行列
    <外3>
    Figure 2014523172
    を用いることにより実行され、diag(w)は前記ウィンドウベクトルwの値を主対角線の成分として有する対角行列を示し、diag(g)は前記ゲイン関数gを主対角線の成分として有する対角行列を示す、請求項1、3および6に記載の方法、または
    <外6>
    Figure 2014523172
  8. 前記変換行列TをサイズOout×Oinとなるような形状にするため、前記変換行列Tの対応する列及び/またはラインをスペースワーピング演算Aout=TAinを実行するように除去する、請求項7に記載の方法、または
    前記変換行列TをサイズOout×Oinとなるような形状にするため、共に前記デコード、重み付け、及びワープ/デコードを実行するように構成された手段において、前記変換行列Tの対応する列及び/またはラインをスペースワーピング演算Aout=TAinを実行するように除去する、請求項7に記載の装置。
  9. 請求項1、3ないし8いずれか一項に記載の方法によりエンコードされたデジタルオーディオ信号。
  10. 請求項9に記載のデジタルオーディオ信号を含む、格納した、または記録した光ディスクなどの記憶媒体。
JP2014517583A 2011-06-30 2012-06-15 高次Ambisonics表現に含まれるサウンドオブジェクトの相対位置を変更する方法と装置 Active JP5921678B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11305845A EP2541547A1 (en) 2011-06-30 2011-06-30 Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP11305845.7 2011-06-30
PCT/EP2012/061477 WO2013000740A1 (en) 2011-06-30 2012-06-15 Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation

Publications (3)

Publication Number Publication Date
JP2014523172A true JP2014523172A (ja) 2014-09-08
JP2014523172A5 JP2014523172A5 (ja) 2015-08-06
JP5921678B2 JP5921678B2 (ja) 2016-05-24

Family

ID=46354265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014517583A Active JP5921678B2 (ja) 2011-06-30 2012-06-15 高次Ambisonics表現に含まれるサウンドオブジェクトの相対位置を変更する方法と装置

Country Status (11)

Country Link
US (1) US9338574B2 (ja)
EP (2) EP2541547A1 (ja)
JP (1) JP5921678B2 (ja)
KR (1) KR102012988B1 (ja)
CN (1) CN103635964B (ja)
AU (1) AU2012278094B2 (ja)
BR (1) BR112013032878B1 (ja)
DK (1) DK2727109T3 (ja)
HU (1) HUE051678T2 (ja)
TW (1) TWI526088B (ja)
WO (1) WO2013000740A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013187908A (ja) * 2012-03-06 2013-09-19 Thomson Licensing 高次アンビソニックス・オーディオ信号の再生のための方法および装置
JP2019519128A (ja) * 2016-04-06 2019-07-04 フェイスブック,インク. 両眼視野/単眼視野間の移行
JP2019113858A (ja) * 2013-07-11 2019-07-11 ドルビー・インターナショナル・アーベー Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置
JP2019532569A (ja) * 2016-09-14 2019-11-07 マジック リープ, インコーポレイテッドMagic Leap,Inc. 空間化オーディオを用いた仮想現実、拡張現実、および複合現実システム
JP2019208286A (ja) * 2015-10-14 2019-12-05 クアルコム,インコーポレイテッド 高次アンビソニック(hoa)コンテンツの画面に関連した適応

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9460729B2 (en) * 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
KR102031826B1 (ko) * 2013-01-16 2019-10-15 돌비 인터네셔널 에이비 Hoa 라우드니스 레벨을 측정하기 위한 방법 및 hoa 라우드니스 레벨을 측정하기 위한 장치
US9913064B2 (en) * 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
US10178489B2 (en) * 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
US9609452B2 (en) 2013-02-08 2017-03-28 Qualcomm Incorporated Obtaining sparseness information for higher order ambisonic audio renderers
US9883310B2 (en) 2013-02-08 2018-01-30 Qualcomm Incorporated Obtaining symmetry information for higher order ambisonic audio renderers
EP2765791A1 (en) * 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
US9685163B2 (en) 2013-03-01 2017-06-20 Qualcomm Incorporated Transforming spherical harmonic coefficients
US9854377B2 (en) 2013-05-29 2017-12-26 Qualcomm Incorporated Interpolation for decomposed representations of a sound field
CN105340008B (zh) * 2013-05-29 2019-06-14 高通股份有限公司 声场的经分解表示的压缩
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9712939B2 (en) 2013-07-30 2017-07-18 Dolby Laboratories Licensing Corporation Panning of audio objects to arbitrary speaker layouts
EP2866475A1 (en) * 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
US9813837B2 (en) 2013-11-14 2017-11-07 Dolby Laboratories Licensing Corporation Screen-relative rendering of audio and encoding and decoding of audio for such rendering
CN111179955B (zh) 2014-01-08 2024-04-09 杜比国际公司 包括编码hoa表示的位流的解码方法和装置、以及介质
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US9922656B2 (en) * 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
EP4089674A1 (en) 2014-03-21 2022-11-16 Dolby International AB Method for decompressing a compressed hoa signal and apparatus for decompressing a compressed hoa signal
EP2922057A1 (en) * 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
AU2015238448B2 (en) * 2014-03-24 2019-04-18 Dolby International Ab Method and device for applying Dynamic Range Compression to a Higher Order Ambisonics signal
CN106105270A (zh) * 2014-03-25 2016-11-09 英迪股份有限公司 用于处理音频信号的系统和方法
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
WO2015197517A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Coded hoa data frame representation that includes non-differential gain values associated with channel signals of specific ones of the data frames of an hoa data frame representation
EP3162086B1 (en) * 2014-06-27 2021-04-07 Dolby International AB Apparatus for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values
EP2960903A1 (en) 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
EP3489953B8 (en) * 2014-06-27 2022-06-15 Dolby International AB Determining a lowest integer number of bits required for representing non-differential gain values for the compression of an hoa data frame representation
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US9940937B2 (en) 2014-10-10 2018-04-10 Qualcomm Incorporated Screen related adaptation of HOA content
KR102605480B1 (ko) * 2014-11-28 2023-11-24 소니그룹주식회사 송신 장치, 송신 방법, 수신 장치 및 수신 방법
WO2016182184A1 (ko) * 2015-05-08 2016-11-17 삼성전자 주식회사 입체 음향 재생 방법 및 장치
WO2017118551A1 (en) * 2016-01-04 2017-07-13 Harman Becker Automotive Systems Gmbh Sound wave field generation
EP3188504B1 (en) 2016-01-04 2020-07-29 Harman Becker Automotive Systems GmbH Multi-media reproduction for a multiplicity of recipients
EP3209036A1 (en) 2016-02-19 2017-08-23 Thomson Licensing Method, computer readable storage medium, and apparatus for determining a target sound scene at a target position from two or more source sound scenes
MC200186B1 (fr) * 2016-09-30 2017-10-18 Coronal Encoding Procédé de conversion, d'encodage stéréophonique, de décodage et de transcodage d'un signal audio tridimensionnel
US10721578B2 (en) 2017-01-06 2020-07-21 Microsoft Technology Licensing, Llc Spatial audio warp compensator
AR112504A1 (es) 2017-07-14 2019-11-06 Fraunhofer Ges Forschung Concepto para generar una descripción mejorada de campo de sonido o un campo de sonido modificado utilizando una descripción multi-capa
RU2736418C1 (ru) * 2017-07-14 2020-11-17 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Принцип формирования улучшенного описания звукового поля или модифицированного описания звукового поля с использованием многоточечного описания звукового поля

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57500268A (ja) * 1980-02-23 1982-02-12
JP2002505058A (ja) * 1997-06-17 2002-02-12 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 空間形成されたオーディオの再生
JP2005519502A (ja) * 2002-02-28 2005-06-30 レミ・ブリュノ 音場の再生のためのユニットを制御する方法及び装置
JP2006506918A (ja) * 2002-11-19 2006-02-23 フランス テレコム ソシエテ アノニム オーディオデータ処理方法及びこの方法を実現する集音装置
JP2010252220A (ja) * 2009-04-20 2010-11-04 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置およびそのプログラム
JP2013507796A (ja) * 2009-10-07 2013-03-04 ザ・ユニバーシティ・オブ・シドニー 記録された音場の再構築
JP2013514696A (ja) * 2009-12-17 2013-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法
JP2013524564A (ja) * 2010-03-26 2013-06-17 トムソン ライセンシング オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001084000A (ja) * 1999-09-08 2001-03-30 Roland Corp 波形再生装置
AU2002359445A1 (en) 2001-11-21 2004-07-14 Aliphcom Method and apparatus for removing noise from electronic signals
JP2006516548A (ja) 2002-12-30 2006-07-06 アンジオテック インターナショナル アクツィエン ゲゼルシャフト 迅速ゲル化ポリマー組成物からの薬物送達法
CN1226718C (zh) * 2003-03-04 2005-11-09 无敌科技股份有限公司 语音速度调整方法
GB2410164A (en) * 2004-01-16 2005-07-20 Anthony John Andrews Sound feature positioner
EP1779385B1 (en) * 2004-07-09 2010-09-22 Electronics and Telecommunications Research Institute Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
JP2010514696A (ja) 2006-12-21 2010-05-06 ギリアード・パロ・アルト・インコーポレイテッド 心血管症状の低減
JP5302190B2 (ja) * 2007-05-24 2013-10-02 パナソニック株式会社 オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路
GB2467534B (en) * 2009-02-04 2014-12-24 Richard Furse Sound system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57500268A (ja) * 1980-02-23 1982-02-12
JP2002505058A (ja) * 1997-06-17 2002-02-12 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 空間形成されたオーディオの再生
JP2005519502A (ja) * 2002-02-28 2005-06-30 レミ・ブリュノ 音場の再生のためのユニットを制御する方法及び装置
JP2006506918A (ja) * 2002-11-19 2006-02-23 フランス テレコム ソシエテ アノニム オーディオデータ処理方法及びこの方法を実現する集音装置
JP2010252220A (ja) * 2009-04-20 2010-11-04 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置およびそのプログラム
JP2013507796A (ja) * 2009-10-07 2013-03-04 ザ・ユニバーシティ・オブ・シドニー 記録された音場の再構築
JP2013514696A (ja) * 2009-12-17 2013-04-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法
JP2013524564A (ja) * 2010-03-26 2013-06-17 トムソン ライセンシング オーディオ再生のためのオーディオ音場表現のデコードのための方法および装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013187908A (ja) * 2012-03-06 2013-09-19 Thomson Licensing 高次アンビソニックス・オーディオ信号の再生のための方法および装置
JP2019113858A (ja) * 2013-07-11 2019-07-11 ドルビー・インターナショナル・アーベー Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置
US10841721B2 (en) 2013-07-11 2020-11-17 Dolby Laboratories Licensing Corporation Methods and apparatus for decoding encoded HOA signals
JP2021036333A (ja) * 2013-07-11 2021-03-04 ドルビー・インターナショナル・アーベー Hoa信号の係数領域表現からこのhoa信号の混合した空間/係数領域表現を生成する方法および装置
US11297455B2 (en) 2013-07-11 2022-04-05 Dolby Laboratories Licensing Corporation Methods and apparatus for decoding encoded HOA signals
US11540076B2 (en) 2013-07-11 2022-12-27 Dolby Laboratories Licensing Corporation Methods and apparatus for decoding encoded HOA signals
US11863958B2 (en) 2013-07-11 2024-01-02 Dolby Laboratories Licensing Corporation Methods and apparatus for decoding encoded HOA signals
JP2019208286A (ja) * 2015-10-14 2019-12-05 クアルコム,インコーポレイテッド 高次アンビソニック(hoa)コンテンツの画面に関連した適応
JP2019519128A (ja) * 2016-04-06 2019-07-04 フェイスブック,インク. 両眼視野/単眼視野間の移行
JP2019532569A (ja) * 2016-09-14 2019-11-07 マジック リープ, インコーポレイテッドMagic Leap,Inc. 空間化オーディオを用いた仮想現実、拡張現実、および複合現実システム
JP2021073763A (ja) * 2016-09-14 2021-05-13 マジック リープ, インコーポレイテッドMagic Leap,Inc. 空間化オーディオを用いた仮想現実、拡張現実、および複合現実システム
JP7165215B2 (ja) 2016-09-14 2022-11-02 マジック リープ, インコーポレイテッド 空間化オーディオを用いた仮想現実、拡張現実、および複合現実システム

Also Published As

Publication number Publication date
AU2012278094B2 (en) 2017-07-27
AU2012278094A1 (en) 2014-01-16
US9338574B2 (en) 2016-05-10
TWI526088B (zh) 2016-03-11
CN103635964B (zh) 2016-05-04
EP2727109A1 (en) 2014-05-07
EP2727109B1 (en) 2020-08-05
WO2013000740A1 (en) 2013-01-03
EP2541547A1 (en) 2013-01-02
BR112013032878A2 (pt) 2017-01-24
CN103635964A (zh) 2014-03-12
BR112013032878B1 (pt) 2021-04-13
HUE051678T2 (hu) 2021-03-29
US20140133660A1 (en) 2014-05-15
TW201301911A (zh) 2013-01-01
KR102012988B1 (ko) 2019-08-21
JP5921678B2 (ja) 2016-05-24
DK2727109T3 (da) 2020-08-31
KR20140051927A (ko) 2014-05-02

Similar Documents

Publication Publication Date Title
JP5921678B2 (ja) 高次Ambisonics表現に含まれるサウンドオブジェクトの相対位置を変更する方法と装置
JP7368563B2 (ja) オーディオ再生のためのオーディオ音場表現をレンダリングするための方法および装置
CN107534810B (zh) 用于提供改进的触觉反馈的方法
Zotter et al. Energy-preserving ambisonic decoding
US10515645B2 (en) Method and apparatus for transforming an HOA signal representation
JP2019047478A (ja) 音響信号処理装置、音響信号処理方法および音響信号処理プログラム
Lecomte et al. On the use of a Lebedev grid for Ambisonics
Støfringsdal et al. Conversion of discretely sampled sound field data to auralization formats
Koyama et al. Structured sparse signal models and decomposition algorithm for super-resolution in sound field recording and reproduction
Kentgens et al. Space warping based dimensionality reduction of higher order ambisonics signals
WO2023074800A1 (ja) 情報処理装置および方法、並びにプログラム
Sundstrom Speaker Placement Agnosticism: Improving the Distance-based Amplitude Panning Algorithm

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150612

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150612

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160412

R150 Certificate of patent or registration of utility model

Ref document number: 5921678

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250