JP2022515998A - 空間的に拡張された音源を再生するための装置および方法、または、空間的に拡張された音源からビットストリームを生成するための装置および方法 - Google Patents
空間的に拡張された音源を再生するための装置および方法、または、空間的に拡張された音源からビットストリームを生成するための装置および方法 Download PDFInfo
- Publication number
- JP2022515998A JP2022515998A JP2021535562A JP2021535562A JP2022515998A JP 2022515998 A JP2022515998 A JP 2022515998A JP 2021535562 A JP2021535562 A JP 2021535562A JP 2021535562 A JP2021535562 A JP 2021535562A JP 2022515998 A JP2022515998 A JP 2022515998A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- sound
- spatially expanded
- information
- bitstream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 77
- 230000005236 sound signal Effects 0.000 claims abstract description 120
- 238000009877 rendering Methods 0.000 claims abstract description 29
- 230000002093 peripheral effect Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 11
- 230000001419 dependent effect Effects 0.000 claims description 10
- 230000005484 gravity Effects 0.000 claims description 9
- 230000033001 locomotion Effects 0.000 claims description 9
- 238000004091 panning Methods 0.000 claims description 7
- 238000012805 post-processing Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 230000008602 contraction Effects 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 238000009795 derivation Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 abstract description 5
- 238000013459 approach Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000003860 storage Methods 0.000 description 7
- 230000003190 augmentative effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000011049 filling Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 241001289753 Graphium sarpedon Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000013707 sensory perception of sound Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
Description
このセクションは、聴取者の視点、例えば、0度の仰角で特定の方位角の範囲(従来のステレオ/サラウンドサウンドの場合のような)または特定の範囲の方位角および仰角(3Dオーディオまたは仮想現実の場合のように、ユーザの動き、すなわちピッチ/ヨー/ロール軸における頭部の回転が3自由度[“3DoF”]の場合)から見た2D面上の拡張音源をレンダリングすることに関係する方法を説明する。
このセクションは、3D空間内、すなわち6自由度(“6DoF”)を有する仮想現実に必要とされるような立体的な方法で、拡張された音源をレンダリングすることに適する方法を説明する。これは、ユーザの動きの6自由度、すなわちピッチ/ヨー/ロール軸での頭部の回転に加えて、3つの並進運動方向x/y/zを意味する。
1.音源の方位角(および仰角)とは対照的に、その距離はあまり確実に知覚することができない。そのため、元の音量を聴取者に対して垂直な平面に投影しても、知覚に大きな変化はない(しかし、レンダリングに必要な点音源の数を減らすことはできる)。
2.点音源として左右に配置された2つの非相関の音は、それらの間の空間を音で知覚的に満たす傾向がある。
1.リスナー位置:このブロックは、例えば、仮想現実追跡システムによって測定されるような聴取者の瞬間的な位置を提供する。ブロックは、検出するための検出器100またはリスナー位置を受信するためのインターフェース100として実装することができる。
2.空間的に拡張された音源の位置およびジオメトリ:このブロックは、例えば、仮想現実シーン表現の一部としてレンダリングするために空間的に拡張された音源の位置およびジオメトリデータを提供する。
3.投影および凸包の計算:このブロック120は、空間的に拡張された音源のジオメトリの凸包を計算し、そのあとリスナー位置に向かう方向に投影する(例えば、“イメージ平面”、以下を参照)。代替的に、同じ機能は、最初にジオメトリをリスナー位置に向かう方向に投影し、そのあと凸包を計算することによって実現することができる。
4.周囲の点音源の位置:このブロック140は、前のブロックによって計算された凸包投影データから使用された周囲の点音源の位置を計算する。この計算では、リスナー位置および聴取者の近く/距離を考慮してもよい(以下を参照)。出力は、n個の周囲の点音源の位置である。
5.レンダラコア:レンダラコア162は、特定された目標位置にそれらを位置決めすることによって、n個の周囲の点音源の音を頭に描く。これは、例えば、頭部伝達関数を使用するバイノーラルレンダラまたはスピーカ再生(例えば、ベクトルベースの振幅パンニング)のためのレンダラであってもよい。レンダラコアは、k個の入力オーディオ基礎信号(例えば、楽器の録音の非相関信号)およびm≧(n-k)の追加的な非相関オーディオ信号からl個のスピーカまたはヘッドホン出力信号を生成する。
6.音源基礎信号:このブロック164は、互いに(十分に)非相関的であり、レンダリングされる音源を表すk個の基礎オーディオ信号についての入力である(例えば、楽器のモノ-k=1-またはステレオ-k=2-録音)。k個の基礎オーディオ信号は、例えば、デコーダ側の生成器から受信されるビットストリーム(例えば、図11の要素301,302を参照)から得られるか、または外部音源からの再生サイトに提供されることができる。
7.デコリレータ:この任意ブロック166は、n個の周囲の点音源をレンダリングするために必要とされる、追加的な非相関オーディオ信号を生成する。
8.信号出力:レンダラは、スピーカ(例えば、n=5.1)またはバイノーラル(典型的にはn=2)のレンダリングについてl個の出力信号を提供する。
● それらを凸包投影の周りに均一に配置することができる。
● それらを凸包投影の極値点に配置することできる。
● それらを凸包投影の水平方向および/または垂直方向の極値点に配置することができる(実施例のセクションにおいて図を参照)。
●全ての周囲の点音源は、空間的に拡張された音源全体の距離と等しい距離を有し、例えば、聴取者の頭部に対する空間的に拡張された音源の重心を介して定義される。
●各周囲の点音源の距離は、投影面への周囲の点音源の投影が同じ場所となるよう、空間的に拡張された音源のジオメトリへの投影された凸包の位置の逆投影によって決定される。凸包から空間的に拡張された音源への周囲の点音源の逆投影は必ずしも一意に決定されるとは限らず、追加の投影規則を適用しなければならない(実施例のセクションを参照)。
●周囲の点音源のレンダリングは距離特性を必要としないが、方位角および仰角における相対的な角度配置のみを必要とする場合は、周囲の点音源の距離は全く決定されなくてもよい。
●パラメータの説明、すなわち、追加のパラメータを受け入れる数学的な表現を介したジオメトリの定形化。例えば、3Dにおける楕円体形状はデカルト座標系上の陰関数によって説明することができ、追加のパラメータは3つすべての方向における主軸の延長である。さらに、パラメータは楕円体面の3D回転、変形関数を含むことができる。
●多角形の説明、すなわち、線、三角形、正方形、四面体および直方体などの基本的な幾何学的形状の集合。基本的な多角形および多面体をより複雑なジオメトリに連結することもできる。
1.ビットストリームへの所望の空間的に拡張された音源のオーサリング/符号化するステップ
2.生成されたビットストリームの送信/蓄積するステップ。本発明によれば、ビットストリームは、他の要素を除いて、モノラルまたはステレオのピアノ録音のような、空間的に拡張された音源ジオメトリ(パラメトリックまたは多角形)および関連付けられた音源基礎信号の記述を含む。波形は、mp3またはMPEG-2/4 Advanced Audio Coding (AAC)などの知覚オーディオ符号化アルゴリズムを使用して圧縮されてもよい(図10のアイテム260を参照)。
3.前述のような送信されたビットストリームに基づいて、空間的に拡張された音源の復号化/レンダリングするステップ。
空間的に拡張された音源に対する聴取者の距離に応じて、周囲の点音源の数を変化させることができる。一例として、空間的に拡張された音源と聴取者とがお互いから遠く離れている場合には、投影された凸包の開き角度(開口)は小さくなり、したがって、より少数の周囲の点音源を有利に選択することができ、計算およびメモリの複雑さを省くことができる。極端な場合には、全ての周囲の点音源は単一の残りの点音源に縮小される。基礎信号と導出された信号との間の干渉が結果として生じる周囲の点音源の信号のオーディオ品質を劣化させないことを保証するために、適切なダウンミキシング技術を適用することができる。同様の技術は、空間的に拡張された音源のジオメトリが聴取者の相対的な視点に依存して非常に不規則である場合、リスナー位置に対して空間的に拡張された音源が近い場合にも適用することができる。例えば、有限長の線である空間的に拡張された音源のジオメトリは、投影面上で単一の点に向かって縮退し得る。一般に、投影された凸包上の周囲の点音源の角度範囲が狭い場合、空間的に拡張された音源をより少ない周囲の点音源によって表すことができる。極端な場合には、全ての周囲の点音源は、単一の残りの点音源に縮小される。
各周囲の点音源は、凸包投影の外側に向かって空間的な広がりを示すので、レンダリングされた空間的に拡張された音源の知覚される聴覚イメージの幅は、レンダリングに使用される凸包よりも幾分大きい。これを所望のターゲットジオメトリと調整するために、2つの可能性がある:
1.オーサリング中の補償:コンテンツオーサリング中に、レンダリング方法の追加の広がりが考慮される。具体的には、実際にレンダリングされたサイズが所望のようになるように、コンテンツオーサリング中に、幾分小さい空間的に拡張された音源のジオメトリが選択される。これは、オーサリング環境(例えば、再生スタジオ)におけるレンダラまたはレンダラコアの効果をモニタリングすることによってチェックすることができる。この場合、送信されるビットストリームおよびレンダラまたはレンダラコアは、ターゲットサイズと比較して低減されたターゲットジオメトリを使用する。
2.レンダリング中の補償:空間的に拡張された音源のレンダラまたはレンダラコアは、レンダリング方法によって追加の知覚的な広がりを認識することができ、したがって、この効果を補償することを可能にすることができる。単純な例として、レンダリングのために使用されるジオメトリを、周囲の点音源の配置に適用される前に、
○一定の係数a<1.0(例えば、a=0.9)だけ低減することができる。または、
○一定の開き角度 アルファ=5度だけ低減することができる。
この場合、送信されたビットストリームは、空間的に拡張された音源のジオメトリの最終的なターゲットサイズを含む。
さらに、ピアノのように左側に低音を有したり、逆に右側に低音の音を有したりするような、音の寄与に依存するジオメトリを有する空間的に拡張された音源をモデル化するために、空間的に拡張された音源に対するユーザ位置を考慮することによって、周囲の点音源を提供するための実際の信号を、記録されたオーディオ信号から生成することができる。
例:アップライトピアノの音は、その音響挙動によって特徴付けられる。これは、(少なくとも)2つのオーディオ基礎信号、1つはピアノキーボードの下端近く(“低音”)、および1つはキーボードの上端近く(“高音”)によってもモデル化される。これらの基礎信号は、ピアノ音を記録するときに適切なマイクロフォンの使用によって得ることができ、6DoFレンダラまたはレンダラコアに送信され、それらの間に十分な相関性があることを保証する。
●ユーザがピアノに正面(キーボード)側から対面する場合、2つの周囲の点音源は、ピアノキーボードの左および右の端部の近くで互いに大きく離れている。この場合、低いキーについての基礎信号を左の周囲の点音源に直接供給することができ、高いキーについての基礎信号を右の周囲の点音源を駆動するために直接的に使用することができる。
●聴取者はピアノの周りを右へ約90度だけ歩くときに、ピアノ音量モデル(例えば、楕円)の投影が側方から見たときに小さくなるので、2つの周囲の点音源は互いに非常に近接してパンニングされる。基礎信号が周囲の点音源の信号を直接的に駆動するために使用され続ける場合、1つの周囲の点音源は主に高い音を含み、他方では、他の1つが大部分の低い音を伝えるだろう。これは物理的な観点から望ましくないので、ピアノの重心に対するユーザの動きと同じ角度だけ、ギブンス回転によって周囲の点音源の信号を形成する2つの基礎信号を回転させることによって、レンダリングを改善することができる。このようにして、両方の信号は同様のスペクトルコンテンツの信号を含み、依然として非相関である(基礎信号が非相関であると仮定する)。
位置依存および方向依存の効果、例えば、空間的に拡張された音源の指向性パターンを考慮するために、実際の信号を前処理または後処理することができる。言い換えると、前述のように、空間的に拡張された音源から発されるすべての音は、例えば、方向依存の音放射パターンを示すように修正することができる。ピアノ信号の場合には、これは、ピアノの背面に向かう放射が、ピアノの前面に向かう放射よりも高周波数コンテンツが少ないことを意味し得る。さらに、周囲の点音源の信号の前処理および後処理は、周囲の点音源の各々に対して個別に調整されてもよい。例えば、指向性パターンを周囲の点音源の各々に対して異なるように選択することができる。ピアノを表す空間的に拡張された音源の所与の例では、低いおよび高いキー範囲の指向性パターンは、上述のように類似していてもよいが、ペダリングノイズのような追加の信号は、より無指向性の指向性パターンを有する。
●点音源の信号間の破壊的干渉のより低い可能性
●ビットストリーム情報のコンパクトなサイズ(幾何学的形状の近似、1つ以上の波形)
●VR/ARレンダリングの目的のために音楽消費のために制作されたレガシー録音(例えば、ピアノのステレオ録音)の使用を可能にする。
●球形の空間的に拡張された音源
●楕円体の空間的に拡張された音源
●線状の空間的に拡張された音源
●直方体の空間的に拡張された音源
●距離依存の周囲の点音源
●ピアノ形状の空間的に拡張された音源
a)2つの周囲の点音源が2つの水平方向の極値点に配置され、2つの周囲の点音源が2つの垂直方向の極値点に配置される。一方、極値点の位置決めは単純であり、通常は適切である。この例は、この方法がお互いに相対的に近い周囲の点音源の位置を生成してもよいことを示す。
b)4つの周囲の点音源のすべてが、投影された凸包上に均一に配置される。周囲の点音源の位置のオフセットは、一番上の周囲の点音源がa)における一番上の周囲の点音源の位置と一致するように選択される。周囲の点音源の位置のオフセットの選択は、周囲の点音源を介して幾何学的形状の表現にかなり影響を与えることが分かる。
c)4つの周囲の点音源のすべては、縮小投影された凸包上に均一に配置される。周囲の点音源のオフセット位置は、b)で選択されたオフセット位置に等しい。投影された凸包の収縮動作は、投影された凸包の重心に向かって、方向に依存しない延伸倍率で予め形成される。
●空間的に拡張された音源の知覚された音響空間を満たすために、好ましくはその内部全体が非相関の点音源(周囲の点音源)で満たされないが、聴取者に面している場合に(例えば、“聴取者に向かう空間的に拡張された音源の凸包の投影”)、その周囲だけを満たす。具体的には、これは、周囲の点音源の位置が空間的に拡張された音源のジオメトリに付与されていないが、リスナー位置に対する空間的に拡張された音源の相対位置を考慮に入れて動的に計算されることを意味する。
○周囲の点音源の動的計算(数および位置)
●空間的に拡張された音源の形状の近似が使用される(圧縮された表現を使用するシナリオのため:ビットストリームの一部として送信される)。
●エンコーダでは、空間的に拡張された音源の形状は、空間的に拡張された音源を特徴付ける
○モノ信号、または、
○ステレオ信号(好ましくは、十分に非相関である)、または、
○より多くの記録された信号(好ましくは、十分に非相関である)
のいずれかであってもよい空間的に拡張された音源の“基本”波形とともにサイド情報として符号化されるだろう。これらの波形を低ビットレートで符号化することができる。
●デコーダ/レンダラにおいて、空間的に拡張された音源の形状および対応する波形は、ビットストリームから取り出され、前述のように、空間的に拡張された音源をレンダリングするために使用される。
Alary, B., Politis, A., & Vaelimaeki, V. (2017). Velvet Noise Decorrelator.
Baumgarte, F., & Faller, C. (2003). Binaural Cue Coding-Part I: Psychoacoustic Fundamentals and Design Principles. Speech and Audio Processing, IEEE Transactions on, 11(6), S. 509-519.
Blauert, J. (2001). Spatial hearing (3 Ausg.). Cambridge; Mass: MIT Press.
Faller, C., & Baumgarte, F. (2003). Binaural Cue Coding-Part II: Schemes and Applications. Speech and Audio Processing, IEEE Transactions on, 11(6), S. 520-531.
Kendall, G. S. (1995). The Decorrelation of Audio Signals and Its Impact on Spatial Imagery. Computer Music Journal, 19(4), S. p 71-87.
Lauridsen, H. (1954). Experiments Concerning Different Kinds of Room-Acoustics Recording. Ingenioren, 47.
Pihlajamaeki, T., Santala, O., & Pulkki, V. (2014). Synthesis of Spatially Extended Virtual Source with Time-Frequency Decomposition of Mono Signals. Journal of the Audio Engineering Society, 62(7/8), S. 467-484.
Potard, G. (2003). A study on sound source apparent shape and wideness.
Potard, G., & Burnett, I. (2004). Decorrelation Techniques for the Rendering of Apparent Sound Source Width in 3D Audio Displays.
Pulkki, V. (1997). Virtual Sound Source Positioning Using Vector Base Amplitude Panning. Journal of the Audio Engineering Society, 45(6), S. 456-466.
Pulkki, V. (1999). Uniform spreading of amplitude panned virtual sources.
Pulkki, V. (2007). Spatial Sound Reproduction with Directional Audio Coding. J. Audio Eng. Soc, 55(6), S. 503-516.
Pulkki, V., Laitinen, M.-V., & Erkut, C. (2009). Efficient Spatial Sound Synthesis for Virtual Worlds.
Schlecht, S. J., Alary, B., Vaelimaeki, V., & Habets, E. A. (2018). Optimized Velvet-Noise Decorrelator.
Schmele, T., & Sayin, U. (2018). Controlling the Apparent Source Size in Ambisonics Unisng Decorrelation Filters.
Schmidt, J., & Schroeder, E. F. (2004). New and Advanced Features for Audio Presentation in the MPEG-4 Standard.
Verron, C., Aramaki, M., Kronland-Martinet, R., & Pallone, G. (2010). A 3-D Immersive Synthesizer for Environmental Sounds. Audio, Speech, and Language Processing, IEEE Transactions on, title=A Backward-Compatible Multichannel Audio Codec, 18(6), S. 1550-1561.
Zotter, F., & Frank, M. (2013). Efficient Phantom Source Widening. Archives of Acoustics, 38(1), S. 27-37.
Zotter, F., Frank, M., Kronlachner, M., & Choi, J.-W. (2014). Efficient Phantom Source Widening and Diffuseness in Ambisonics.
Claims (47)
- 空間内に定義された位置およびジオメトリを有する空間的に拡張された音源を再生するための装置であって、
リスナー位置を受信するためのインターフェース(100)と、
前記リスナー位置、前記空間的に拡張された音源のジオメトリに関する情報および前記空間的に拡張された音源の位置に関する情報を使用して、前記空間的に拡張された音源に関連付けられた二次元または三次元の凸包の投影面への投影を計算するためのプロジェクタと、
前記投影面を使用して、前記空間的に拡張された音源について少なくとも2つの音源の位置を計算するための音位置計算機と、
前記位置で前記少なくとも2つの音源をレンダリングして、2つ以上の出力信号を有する前記空間的に拡張された音源の再生を得るためのレンダラであって、前記レンダラは異なる前記位置に対して異なる音信号を使用するように構成され、前記異なる音信号は前記空間的に拡張された音源に関連付けられる、レンダラと、
を含む、装置。 - 前記検出器は追跡システムを使用して前記空間内の瞬間的なリスナー位置を検出するように構成される、または、前記インターフェース(100)は前記インターフェースを介して入力された位置データを使用するように構成される、請求項1に記載の装置。
- シーン記述を受信するように構成される装置であって、前記シーン記述は前記定義された位置に関する前記情報および前記空間的に拡張された音源の前記定義されたジオメトリに関する前記情報、ならびに前記空間的に拡張された音源に関連付けられた少なくとも1つの音信号を含み、
前記装置はさらに、前記シーン記述を解析して、前記定義された位置に関する前記情報(341)、前記定義されたジオメトリに関する前記情報(331)および前記少なくとも1つの音源信号(301,302)を取り出すためのシーン記述パーサ(180)を備える、または、
前記シーン記述は、前記空間的に拡張された音源について、少なくとも2つの基礎音信号(301,302)と、前記空間的に拡張された音源のジオメトリに関する前記情報(331)についてはそれぞれの基礎音信号の位置情報(321)とを含み、また前記音位置計算機(140)は、前記投影面を使用して前記少なくとも2つの音源の前記位置を計算するときに、前記少なくとも2つの基礎信号の位置情報を使用するように構成される、請求項1または2に記載の装置。 - 前記プロジェクタ(120)は、前記空間的に拡張された音源の前記ジオメトリに関する情報(331)を使用して前記空間的に拡張された音源の前記凸包を計算し、前記リスナー位置を使用して前記凸包を前記聴取者に向かう方向に投影して、前記投影面上に前記二次元または三次元の凸包の前記投影を得るように構成される、または、
前記プロジェクタ(120)は、前記空間的に拡張された音源の前記ジオメトリに関する前記情報(331)によって定義される前記空間的に拡張された音源のジオメトリを前記リスナー位置に向かう方向に投影し、投影されたジオメトリの前記凸包を計算して、前記投影面上に前記二次元または三次元の凸包の前記投影を得るように構成される、請求項1ないし3のうちのいずれか1項に記載の装置。 - 前記音位置計算機(140)は、前記空間内の前記音源位置を凸包投影データおよび前記リスナー位置から計算するように構成される、請求項1ないし4のうちのいずれか1項に記載の装置。
- 前記音位置計算機(140)は、前記少なくとも2つの音源が周囲の音源であり、且つ前記投影面上に位置するように、前記位置を計算するように構成される、または、
前記音位置計算機(140)は、複数の前記周囲の音源のうちの1つの周囲の音源の位置が、前記聴取者に対して前記投影面の右側および/または前記聴取者に対して前記投影面の左側、および/または、前記聴取者に対して前記投影面の頂部、および/または前記聴取者に対して前記投影面の前記底部に配置されるように計算するように構成されることを特徴とする、請求項1ないし5のうちのいずれか1項に記載の装置。 - 前記レンダラ(160)は、
既定のスピーカ設定のためのスピーカ信号を得るための前記音源の前記位置に依存したパンニング動作を使用して、または、
ヘッドホン信号を得るための前記音源の前記位置に依存した、頭部伝達関数を使用するバイノーラルレンダリング動作を使用して、
前記少なくとも2つの音源をレンダリングするように構成される、請求項1ないし6のうちのいずれか1項に記載の装置。 - 第1の数の関連する音源信号が前記空間的に拡張された音源に関連付けられ、前記第1の数は1以上であり、前記関連する音源信号は同一の空間的に拡張された音源に関連し、
前記音位置計算機(140)は、前記空間的に拡張された音源の前記レンダリングに使用される音源の第2の数を決定し、前記第2の数は1よりも大きく、
前記第2の数が前記第1の数よりも大きい場合、前記レンダラ(160)は、前記第1の数の音源信号(164)のうちの1つ以上から非相関信号を生成するための1つ以上のデコリレータ(166)を含む、請求項1ないし7のうちのいずれか1項に記載の装置。 - 前記インターフェース(100)は、前記空間内の前記聴取者の経時変化する位置を受信するように構成され、
前記プロジェクタ(120)は、前記空間内の経時変化する投影を計算するように構成され、
前記音位置計算機(140)は、前記空間内の前記音源の経時変化する数または音源または経時変化する位置を計算するように構成され、
前記レンダラ(160)は、前記経時変化する数の音源または前記空間内の前記経時変化する位置の前記少なくとも2つの音源をレンダリングするように構成される、請求項1ないし8のうちのいずれか1項に記載の装置。 - 前記インターフェース(100)は、前記リスナー位置を6自由度で受信するように構成され、
前記プロジェクタ(120)は、前記6自由度に依存して前記投影を計算するように構成される、請求項1ないし9のうちのいずれか1項に記載の装置。 - 前記プロジェクタ(120)は、
前記聴取者の視線に垂直な平面等の画像平面として前記投影を計算する、または、
前記聴取者の頭部の周囲の球面として前記投影を計算する、または、
前記聴取者の頭部の中心から既定の距離に位置する投影面として前記投影を計算する、または、
聴取者の頭部の空間的配置に対する球面座標から導出される方位角および仰角から空間的に拡張された音源の凸包の前記投影を計算する、
ように構成される、請求項1ないし10のうちのいずれか1項に記載の装置。 - 前記音位置計算機(140)は、前記位置が前記凸包の前記投影の周囲に均一に分布するように、または、前記位置が前記凸包の投影の極値点または周辺点に配置されるように、または、前記位置が前記凸包の前記投影の水平または垂直の極値点または周辺点に位置するように、前記位置を計算するように構成される、請求項1ないし11のうちのいずれか1項に記載の装置。
- 前記音位置計算機(140)は、周囲の音源のための位置に加えて、前記聴取者に対して前記凸包の前記投影上、またはその前、またはその後、またはその範囲内に位置する補助音源の位置を決定するように構成される、請求項1ないし12のうちのいずれか1項に記載の装置。
- 前記プロジェクタ(120)は、水平方向および垂直方向などの異なる方向に、変数または既定の量、もしくは種々の変数または既定の量の分、前記凸包の前記投影を前記凸包または前記投影の重心等に向かって追加的に収縮させるように構成される、請求項1ないし13のうちのいずれか1項に記載の装置。
- 前記音位置計算機(140)は、前記リスナー位置に対して左側の周囲の音源と右側の周囲の音源との間の前記投影面上に少なくとも1つの追加の補助音源が位置するように計算するように構成される、または、
前記音位置計算機(140)は、前記リスナー位置に対して左側の周囲の音源と右側の周囲の音源との間の前記投影面上に少なくとも1つの追加の補助音源が位置するように計算するように構成され、前記左側の周囲の音源と前記右側の周囲の音源との間の中間に単一の追加の補助音源が配置される、もしくは2つ以上の追加の補助音源が前記左側の周囲の音源と前記右側の周囲の音源との間に等間隔に配置される、請求項1ないし14のうちのいずれか1項に記載の装置。 - 前記音位置計算機(140)は、前記空間的に拡張された音源の周囲の前記聴取者の円運動を前記インターフェースを介して受信した場合、または、固定された聴取者に関して前記空間的に拡張された音源の回転を前記インターフェースを介して受信した場合に、好ましくは前記投影の重心の周囲で、前記空間的に拡張された音源の前記音の位置の回転を実行するように構成される、請求項1ないし15のうちのいずれか1項に記載の装置。
- 前記レンダラ(160)は各音源について、前記聴取者と前記音源との間の前記距離に依存して開き角度を受信し、前記開き角度に依存して前記音源をレンダリングするように構成される、請求項1ないし16のうちのいずれか1項に記載の装置。
- 前記レンダラ(160)は各音源についての距離情報を受信するように構成され、
前記レンダラ(160)は、前記聴取者のより近くに配置されている音源が、前記聴取者からより遠く配置されかつ同じ音量を有する音源と比較して、より大きい音量でレンダリングされるように、前記距離に依存して前記音源をレンダリングするように構成される、請求項1ないし17のうちのいずれか1項に記載の装置。 - 前記音位置計算機(140)は、
各音源について、前記聴取者に対する前記空間的に拡張された音源の前記距離と等しい距離を決定する、または、
前記空間的に拡張された音源の前記ジオメトリへの前記投影上の前記音源の位置の逆投影によって、各音源の距離を決定する
ように構成され、
前記レンダラ(160)は、前記距離に関する前記情報を使用して前記音源を生成するように構成される、請求項1ないし18のうちのいずれか1項に記載の装置。 - 前記ジオメトリに関する前記情報(331)は、一次元の線または曲線、楕円、長方形、または多角形、もしくは多角形のグループ等の二次元領域、あるいは楕円体、直方体または多面体等の三次元物体として定義される、および/または、
前記情報は、パラメトリック記述または多角形記述または前記多角形記述のパラメトリック表現として定義される、請求項1ないし19のうちのいずれか1項に記載の装置。 - 前記音位置計算機(140)は、前記空間的に拡張された音源までの前記聴取者の距離に依存して音源の数を決定するように構成され、前記音源の数は前記聴取者と前記空間的に拡張された音源との間の距離が大きい場合のより小さい数と比べると、距離が小さい場合により大きくなる、請求項1ないし20のうちのいずれか1項に記載の装置。
- 前記空間的に拡張された音源によって導入される広がりに関する情報を受信するように構成され、
前記プロジェクタ(120)は、前記広がりを少なくとも部分的に補償するために、前記広がりに関する前記情報を使用して、前記凸包または前記投影に収縮動作を適用するように構成される、請求項1ないし21のうちのいずれか1項に記載の装置。 - 前記レンダラ(160)は、前記音源の前記位置が定義された許容範囲内で互いに同一である場合に、前記空間的に拡張された音源に関連付けられた基礎信号を例えばギブンス回転を使用して合成することによって、前記音源をレンダリングして回転基礎信号を取得し、前記回転基礎信号を前記位置にレンダリングするように構成される、請求項1ないし22のうちのいずれか1項に記載の装置。
- 前記レンダラ(160)は、位置依存特性または方向依存特性に従って前記少なくとも2つの音源を生成するときに、前処理または後処理を実行するように構成される、請求項1ないし23のうちのいずれか1項に記載の装置。
- 前記空間的に拡張された音源は、前記ジオメトリに関する前記情報(331)として、前記空間的に拡張された音源が球面、および楕円体、線、直方体またはピアノ形状の空間的に拡張された音源であるとの情報を有する、請求項1ないし24のうちのいずれか1項に記載の装置。
- 前記空間的に拡張された音源についての圧縮された記述を表すビットストリームを受信し、ここで前記ビットストリームは、前記ビットストリームまたは前記装置によって受信された符号化されたオーディオ信号に含まれる前記空間的に拡張された音源のための異なる音信号の第1の数を示すビットストリーム要素(311)を含み、前記数は1以上であり、
前記ビットストリーム要素(311)を読み込んで、前記ビットストリームまたは前記符号化されたオーディオ信号に含まれる前記空間的に拡張された音源のための異なる音信号の前記第1の数を取り出す
ように構成され、
前記音位置計算機(140)は、前記空間的に拡張された音源の前記レンダリングに使用される音源の第2の数を決定し、前記第2の数は1よりも大きく、
前記レンダラ(160)は、前記ビットストリームから抽出された前記第1の数に依存して、1つ以上の非相関信号の第3の数を生成する(164,166)ように構成され、前記第3の数は前記第2の数と前記第3の数との間の差から導出される、請求項1ないし25のうちのいずれか1項に記載の装置。 - 空間的に拡張された音源についての圧縮された記述を表すビットストリームを生成するための装置であって、前記装置は、
前記空間的に拡張された音源のための1つ以上の異なる音信号を提供するためのサウンドプロバイダ(200)と、
前記空間的に拡張された音源のジオメトリに関する情報(331,341)を計算するためのジオメトリプロバイダ(220)と、
前記圧縮されたサウンドシーンを表す前記ビットストリームを生成するための出力データ形成器(240)であって、前記ビットストリームは前記1つ以上の異なる音信号および前記ジオメトリに関する前記情報(331,341)を含む、出力データ形成器(240)と、
を含む、装置。 - 前記ジオメトリに関する前記情報(331,341)は、空間内の前記空間的に拡張された音源の位置を示す位置情報(341)を含む、請求項27に記載の装置。
- 前記出力データ形成器(240)は、前記1つ以上の異なる音信号の各音信号についての前記個々の位置に関する前記情報(321)を、前記個々の位置に関する情報(321)が対応する前記音信号の前記位置を示すように、前記ビットストリームに組み込むように構成される、請求項27または28に記載の装置。
- 前記サウンドプロバイダ(200)は、前記空間的に拡張された音源のために少なくとも2つの異なる音信号を提供するように構成され、前記出力データ形成器(240)は、前記ビットストリームが前記少なくとも2つの異なる音信号(301,302)と、前記空間的に拡張された音源の前記ジオメトリに関する前記情報(331)については前記少なくとも2つの異なる音信号の各音信号の前記個々の位置に関する情報(321)とを含むように、前記ビットストリームを生成するように構成される、請求項27、28または29に記載の装置。
- 前記サウンドプロバイダ(200)は、
単一または複数のマイクロフォンの位置または向きで自然音源の記録を実行する、または、
単一または複数の基礎信号から1つ以上の非相関フィルタによって音信号を導出する、
ように構成される、請求項27ないし30のうちのいずれか1項に記載の装置。 - 前記サウンドプロバイダ(200)は、オーディオ信号エンコーダ(260)を使用して前記1つ以上の音信号をビットレート圧縮するように構成され、
前記出力データ形成器(240)は、前記ビットレート圧縮された前記空間的に拡張された音源のための1つ以上の音信号(301,302)を使用するように構成される、請求項27ないし31のうちのいずれか1項に記載の装置。 - 前記ジオメトリプロバイダ(220)は、前記空間的に拡張された音源のジオメトリから、パラメトリック記述または多角形記述または前記多角形記述のパラメトリック表現を導出するように構成され、前記出力データ形成器(240)は、前記ジオメトリに関する前記情報(331,341)として、前記パラメトリック記述または前記多角形記述または前記多角形記述の前記パラメトリック表現を前記ビットストリームに組み込むように構成される、請求項27ないし32のうちのいずれか1項に記載の装置。
- 前記出力データ形成器(240)は、前記ビットストリームに含まれるまたは前記ビットストリームに関連付けられた符号化されたオーディオ信号に含まれる前記空間的に拡張された音源のための前記1つ以上の異なる音信号の数を示すビットストリーム要素(311)を前記ビットストリームに組み込むように構成され、前記数は1以上である、請求項27ないし33のうちのいずれか1項に記載の装置。
- 空間内に定義された位置およびジオメトリを有する空間的に拡張された音源を再生するための方法であって、
リスナー位置を受信するステップと、
前記リスナー位置、前記空間的に拡張された音源のジオメトリに関する情報(331)、および前記空間的に拡張された音源の前記位置に関する情報(341)を使用して、前記空間的に拡張された音源に関連付けられた二次元または三次元の凸包の投影面上への投影を計算するステップと、
前記投影面を使用して、前記空間的に拡張された音源について少なくとも2つの音源の位置を計算するステップと、
前記位置で前記少なくとも2つの音源をレンダリングして、2つ以上の出力信号を有する前記空間的に拡張された音源の再生を得るためのレンダリングするステップであって、前記レンダリングするステップは異なる前記位置に対して異なる音信号を使用するステップを含み、前記異なる音信号は前記空間的に拡張された音源に関連付けられる、ステップと、
を含む方法。 - 空間的に拡張された音源について圧縮された記述を表すビットストリームを生成する方法であって、
前記空間的に拡張された音源のための1つ以上の異なる音信号を提供するステップと、
前記空間的に拡張された音源のジオメトリに関する情報(331,341)を提供するステップと、
前記圧縮されたサウンドシーンを表す前記ビットストリームを生成するステップであって、前記ビットストリームは前記1つ以上の異なる音信号(301,302)と、前記空間的に拡張された音源の前記ジオメトリに関する前記情報(331,341)とを含む、ステップと、
を含む方法。 - 前記空間的に拡張された音源の前記ジオメトリに関する前記情報(331,341)は、空間内の前記空間的に拡張された音源の位置情報(341)を含む、請求項36に記載の方法。
- 前記ビットストリームを生成するステップは、前記1つ以上の異なる音信号(301,302)の各音信号の個々の前記位置に関する情報(321)を前記ビットストリームに組み込むステップを含む、請求項36または37に記載の方法。
- 前記提供するステップは、前記空間的に拡張された音源のための少なくとも2つの異なる音信号を提供するステップを含み、前記ビットストリームを生成するステップは、前記ビットストリームが前記少なくとも2つの異なる音信号(301,302)と、前記少なくとも2つの異なる音信号の各音信号の前記個々の位置情報(321)とを含み、前記情報が前記空間的に拡張された音源の前記ジオメトリに関する情報(331,341)については対応する前記音信号の前記位置を示す、請求項36、37または38に記載の方法。
- 前記ビットストリームを生成するステップは、前記ビットストリームに含まれるまたは前記ビットストリームに関連付けられた符号化されたオーディオ信号に含まれる前記空間的に拡張された音源のための前記1つ以上の異なる音信号(301,302)の数を示すビットストリーム要素(311)を前記ビットストリームに導入する組み込むステップを含む、請求項36ないし39のうちのいずれか1項に記載の方法。
- 空間的に拡張された音源についての圧縮された記述を表すビットストリームであって、
前記空間的に拡張された音源のための1つ以上の異なる音信号(301,302)と、
前記空間的に拡張された音源のジオメトリに関する情報(331,341)と、
を含むビットストリーム。 - 前記異なる音信号が2つ以上である場合に、対応する前記音信号の位置を示す、前記2つ以上の異なる音信号の各音信号の個々の位置情報(301,302)をさらに含む、請求項41に記載のビットストリーム。
- 前記1つ以上の異なる音信号の各音信号の個々の前記位置に関する情報(321)であって、前記個々の位置に関する前記情報(321)は前記空間的に拡張された音源の前記ジオメトリに関する前記情報(331,341)については前記対応する音信号の位置を示す、前記個々の位置に関する情報(321)をさらに含む、請求項41または42に記載のビットストリーム。
- 前記空間的に拡張された音源の前記ジオメトリに関する前記情報(331,341)は前記空間的に拡張された音源の位置情報(341)を含む、請求項41,42または43に記載のビットストリーム。
- 前記空間的に拡張された音源の前記ジオメトリに関する前記情報(331,341)については前記対応する音信号の第1の位置を示す、第1の音信号(301)のための第1の位置情報(321)と、
前記空間的に拡張された音源の前記ジオメトリに関する前記情報(331 341)については対応する前記音信号の第2の位置を示す、第2の音信号(302)のための第2の位置情報(321)であって、前記第2の位置情報は前記第1の位置情報とは異なる、第2の位置情報とを含む、請求項41ないし44のいずれか1項に記載のビットストリーム。 - 前記ビットストリームに含まれる、または前記ビットストリームに関連付けられた符号化されたオーディオ信号に含まれる、前記空間的に拡張された音源のための前記少なくとも1つの異なる音信号の数を示すビットストリーム要素(311)をさらに含み、前記数は1または1よりも大きい、請求項40ないし45いずれか1項に記載のビットストリーム。
- コンピュータまたはプロセッサ上で動作しているときに、請求項35ないし40のうちのいずれか1つの方法を実行するためのコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023189461A JP2024020307A (ja) | 2018-12-19 | 2023-11-06 | 空間的に拡張された音源を再生するための装置および方法、または、空間的に拡張された音源からビットストリームを生成するための装置および方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18214182.0 | 2018-12-19 | ||
EP18214182 | 2018-12-19 | ||
PCT/EP2019/085733 WO2020127329A1 (en) | 2018-12-19 | 2019-12-17 | Apparatus and method for reproducing a spatially extended sound source or apparatus and method for generating a bitstream from a spatially extended sound source |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023189461A Division JP2024020307A (ja) | 2018-12-19 | 2023-11-06 | 空間的に拡張された音源を再生するための装置および方法、または、空間的に拡張された音源からビットストリームを生成するための装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022515998A true JP2022515998A (ja) | 2022-02-24 |
JPWO2020127329A5 JPWO2020127329A5 (ja) | 2023-03-14 |
Family
ID=65010413
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021535562A Pending JP2022515998A (ja) | 2018-12-19 | 2019-12-17 | 空間的に拡張された音源を再生するための装置および方法、または、空間的に拡張された音源からビットストリームを生成するための装置および方法 |
JP2023189461A Pending JP2024020307A (ja) | 2018-12-19 | 2023-11-06 | 空間的に拡張された音源を再生するための装置および方法、または、空間的に拡張された音源からビットストリームを生成するための装置および方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023189461A Pending JP2024020307A (ja) | 2018-12-19 | 2023-11-06 | 空間的に拡張された音源を再生するための装置および方法、または、空間的に拡張された音源からビットストリームを生成するための装置および方法 |
Country Status (13)
Country | Link |
---|---|
US (2) | US11937068B2 (ja) |
EP (1) | EP3900401A1 (ja) |
JP (2) | JP2022515998A (ja) |
KR (2) | KR102659722B1 (ja) |
CN (1) | CN113316943B (ja) |
AU (1) | AU2019409705B2 (ja) |
BR (1) | BR112021011170A2 (ja) |
CA (2) | CA3123982C (ja) |
MX (1) | MX2021007337A (ja) |
SG (1) | SG11202106482QA (ja) |
TW (1) | TWI786356B (ja) |
WO (1) | WO2020127329A1 (ja) |
ZA (1) | ZA202105016B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4091344A1 (en) * | 2020-01-14 | 2022-11-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reproducing a spatially extended sound source or apparatus and method for generating a description for a spatially extended sound source using anchoring information |
JP2023515886A (ja) | 2020-03-02 | 2023-04-14 | マジック リープ, インコーポレイテッド | 没入型のオーディオプラットフォーム |
CN114067810A (zh) * | 2020-07-31 | 2022-02-18 | 华为技术有限公司 | 音频信号渲染方法和装置 |
JP7538662B2 (ja) | 2020-09-01 | 2024-08-22 | 日本放送協会 | バイノーラル信号生成装置及びプログラム |
KR102658471B1 (ko) * | 2020-12-29 | 2024-04-18 | 한국전자통신연구원 | 익스텐트 음원에 기초한 오디오 신호의 처리 방법 및 장치 |
AU2022258764A1 (en) * | 2021-04-14 | 2023-10-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Spatially-bounded audio elements with derived interior representation |
EP4331241A1 (en) * | 2021-04-29 | 2024-03-06 | Dolby International AB | Methods, apparatus and systems for modelling audio objects with extent |
WO2023061965A2 (en) * | 2021-10-11 | 2023-04-20 | Telefonaktiebolaget Lm Ericsson (Publ) | Configuring virtual loudspeakers |
AU2022384608A1 (en) * | 2021-11-09 | 2024-05-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Renderers, decoders, encoders, methods and bitstreams using spatially extended sound sources |
AU2022388677A1 (en) * | 2021-11-09 | 2024-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for synthesizing a spatially extended sound source using modification data on a potentially modifying object |
US20230171559A1 (en) * | 2021-11-26 | 2023-06-01 | Electronics And Telecommunications Research Institute | Acoustic signal processing device for spatially extended sound source and method |
TW202406368A (zh) * | 2022-06-15 | 2024-02-01 | 瑞典商都比國際公司 | 用於基於體素之幾何表示之聲學三維範圍模型化之方法、系統和設備 |
CN115408442B (zh) * | 2022-08-15 | 2023-03-10 | 云南大学 | 基于扩展空间同位模式的土地覆盖分布关系挖掘方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08149600A (ja) * | 1994-11-18 | 1996-06-07 | Yamaha Corp | 3次元サウンドシステム |
JP2006503491A (ja) * | 2002-10-15 | 2006-01-26 | 韓國電子通信研究院 | 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法 |
JP2006516164A (ja) * | 2002-10-14 | 2006-06-22 | トムソン ライセンシング | オーディオシーンにおける音源のワイドネスを符号化および復号化する方法 |
JP2007003989A (ja) * | 2005-06-27 | 2007-01-11 | Asahi Kasei Homes Kk | 音環境解析シミュレーションシステム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1297691A2 (en) * | 2000-03-07 | 2003-04-02 | Sarnoff Corporation | Camera pose estimation |
CN102172047B (zh) | 2008-07-31 | 2014-01-29 | 弗劳恩霍夫应用研究促进协会 | 双耳信号的信号生成设备和方法 |
KR20130122516A (ko) | 2010-04-26 | 2013-11-07 | 캠브리지 메카트로닉스 리미티드 | 청취자의 위치를 추적하는 확성기 |
JP2015509212A (ja) * | 2012-01-19 | 2015-03-26 | コーニンクレッカ フィリップス エヌ ヴェ | 空間オーディオ・レンダリング及び符号化 |
RU2602346C2 (ru) | 2012-08-31 | 2016-11-20 | Долби Лэборетериз Лайсенсинг Корпорейшн | Рендеринг отраженного звука для объектно-ориентированной аудиоинформации |
EP2733964A1 (en) * | 2012-11-15 | 2014-05-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Segment-wise adjustment of spatial audio signal to different playback loudspeaker setup |
US10499176B2 (en) * | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
US10262462B2 (en) * | 2014-04-18 | 2019-04-16 | Magic Leap, Inc. | Systems and methods for augmented and virtual reality |
WO2016180493A1 (en) * | 2015-05-13 | 2016-11-17 | Huawei Technologies Co., Ltd. | Method and apparatus for driving an array of loudspeakers with drive signals |
JP6786834B2 (ja) * | 2016-03-23 | 2020-11-18 | ヤマハ株式会社 | 音響処理装置、プログラムおよび音響処理方法 |
KR20170125660A (ko) * | 2016-05-04 | 2017-11-15 | 가우디오디오랩 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP3472832A4 (en) | 2016-06-17 | 2020-03-11 | DTS, Inc. | DISTANCE-BASED PANORAMIC USING NEAR / FAR FIELD RENDERING |
US11096004B2 (en) * | 2017-01-23 | 2021-08-17 | Nokia Technologies Oy | Spatial audio rendering point extension |
-
2019
- 2019-12-17 CA CA3123982A patent/CA3123982C/en active Active
- 2019-12-17 CN CN201980084851.XA patent/CN113316943B/zh active Active
- 2019-12-17 KR KR1020217022719A patent/KR102659722B1/ko active IP Right Grant
- 2019-12-17 CA CA3199318A patent/CA3199318A1/en active Pending
- 2019-12-17 AU AU2019409705A patent/AU2019409705B2/en active Active
- 2019-12-17 JP JP2021535562A patent/JP2022515998A/ja active Pending
- 2019-12-17 EP EP19818155.4A patent/EP3900401A1/en active Pending
- 2019-12-17 KR KR1020237043727A patent/KR20240005112A/ko active Search and Examination
- 2019-12-17 SG SG11202106482QA patent/SG11202106482QA/en unknown
- 2019-12-17 BR BR112021011170-0A patent/BR112021011170A2/pt unknown
- 2019-12-17 WO PCT/EP2019/085733 patent/WO2020127329A1/en unknown
- 2019-12-17 MX MX2021007337A patent/MX2021007337A/es unknown
- 2019-12-18 TW TW108146529A patent/TWI786356B/zh active
-
2021
- 2021-05-27 US US17/332,265 patent/US11937068B2/en active Active
- 2021-07-16 ZA ZA2021/05016A patent/ZA202105016B/en unknown
-
2023
- 2023-11-06 JP JP2023189461A patent/JP2024020307A/ja active Pending
-
2024
- 2024-02-02 US US18/431,423 patent/US20240179486A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08149600A (ja) * | 1994-11-18 | 1996-06-07 | Yamaha Corp | 3次元サウンドシステム |
JP2006516164A (ja) * | 2002-10-14 | 2006-06-22 | トムソン ライセンシング | オーディオシーンにおける音源のワイドネスを符号化および復号化する方法 |
JP2006503491A (ja) * | 2002-10-15 | 2006-01-26 | 韓國電子通信研究院 | 空間性が拡張された音源を有する3次元音響シーンの生成及び消費方法 |
JP2007003989A (ja) * | 2005-06-27 | 2007-01-11 | Asahi Kasei Homes Kk | 音環境解析シミュレーションシステム |
Also Published As
Publication number | Publication date |
---|---|
SG11202106482QA (en) | 2021-07-29 |
KR20210101316A (ko) | 2021-08-18 |
TWI786356B (zh) | 2022-12-11 |
AU2019409705A1 (en) | 2021-08-12 |
MX2021007337A (es) | 2021-07-15 |
US11937068B2 (en) | 2024-03-19 |
WO2020127329A1 (en) | 2020-06-25 |
JP2024020307A (ja) | 2024-02-14 |
CA3199318A1 (en) | 2020-06-25 |
CA3123982C (en) | 2024-03-12 |
US20240179486A1 (en) | 2024-05-30 |
CA3123982A1 (en) | 2020-06-25 |
KR102659722B1 (ko) | 2024-04-23 |
CN113316943A (zh) | 2021-08-27 |
US20210289309A1 (en) | 2021-09-16 |
BR112021011170A2 (pt) | 2021-08-24 |
CN113316943B (zh) | 2023-06-06 |
TW202027065A (zh) | 2020-07-16 |
KR20240005112A (ko) | 2024-01-11 |
ZA202105016B (en) | 2022-04-28 |
EP3900401A1 (en) | 2021-10-27 |
AU2019409705B2 (en) | 2023-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113316943B (zh) | 再现空间扩展声源的设备与方法、或从空间扩展声源生成比特流的设备与方法 | |
RU2736274C1 (ru) | Принцип формирования улучшенного описания звукового поля или модифицированного описания звукового поля с использованием dirac-технологии с расширением глубины или других технологий | |
RU2617553C2 (ru) | Система и способ для генерирования, кодирования и представления данных адаптивного звукового сигнала | |
US9299353B2 (en) | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction | |
RU2740703C1 (ru) | Принцип формирования улучшенного описания звукового поля или модифицированного описания звукового поля с использованием многослойного описания | |
US20220377489A1 (en) | Apparatus and Method for Reproducing a Spatially Extended Sound Source or Apparatus and Method for Generating a Description for a Spatially Extended Sound Source Using Anchoring Information | |
KR20220153079A (ko) | 큐 정보 항목을 이용한 공간 확장 음원을 합성하기 위한 장치 및 방법 | |
TW202332290A (zh) | 使用空間擴展音源之呈現器、解碼器、編碼器、方法及位元串流 | |
RU2780536C1 (ru) | Оборудование и способ для воспроизведения пространственно протяженного источника звука или оборудование и способ для формирования потока битов из пространственно протяженного источника звука | |
US20240298135A1 (en) | Apparatus, Method or Computer Program for Synthesizing a Spatially Extended Sound Source Using Modification Data on a Potentially Modifying Object | |
TW202337236A (zh) | 用以使用基本空間扇區合成空間擴展音源之裝置、方法及電腦程式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210818 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220906 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221201 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20230306 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231106 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20231211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240904 |