JP6983484B2 - マルチレイヤ記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト - Google Patents
マルチレイヤ記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト Download PDFInfo
- Publication number
- JP6983484B2 JP6983484B2 JP2020500725A JP2020500725A JP6983484B2 JP 6983484 B2 JP6983484 B2 JP 6983484B2 JP 2020500725 A JP2020500725 A JP 2020500725A JP 2020500725 A JP2020500725 A JP 2020500725A JP 6983484 B2 JP6983484 B2 JP 6983484B2
- Authority
- JP
- Japan
- Prior art keywords
- sound field
- sound
- layer
- sound source
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000010410 layer Substances 0.000 claims description 303
- 238000000034 method Methods 0.000 claims description 63
- 238000013519 translation Methods 0.000 claims description 33
- 238000000926 separation method Methods 0.000 claims description 31
- 238000009792 diffusion process Methods 0.000 claims description 30
- 238000004458 analytical method Methods 0.000 claims description 28
- 230000015572 biosynthetic process Effects 0.000 claims description 20
- 238000004091 panning Methods 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 18
- 230000005236 sound signal Effects 0.000 claims description 18
- 238000003786 synthesis reaction Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 17
- 238000012937 correction Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 3
- 230000004048 modification Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 239000002356 single layer Substances 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 claims 2
- 241000255925 Diptera Species 0.000 claims 1
- 230000014616 translation Effects 0.000 description 25
- 230000033458 reproduction Effects 0.000 description 17
- 230000009466 transformation Effects 0.000 description 16
- 230000008859 change Effects 0.000 description 14
- 238000009877 rendering Methods 0.000 description 9
- 230000003321 amplification Effects 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005755 formation reaction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 101100259947 Homo sapiens TBATA gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 235000019634 flavors Nutrition 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/012—Head tracking input arrangements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/305—Electronic adaptation of stereophonic audio signals to reverberation of the listening space
- H04S7/306—For headphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Pinball Game Machines (AREA)
- Building Environments (AREA)
Description
・拡張された表現は、既存の拡張されていない表現(例えば、レンダリング用)に変換することができ、
・拡張表現を使用する場合、既存のソフトウェアとハードウェアの実施態様を再利用することができるという意味で、これらの表現/システムとの下位互換性を提供することが実施形態の目的である。
で表される到来方向(DoA)から録音される。このDoAは、録音の解析から推定できる。それは距離
から来ている。この情報は、レイヤ距離として、または一般的に図3bの項目352、353、354として各レイヤのメタデータに含まれ、録音位置から任意の方向rを有するレイヤlの各音源を、基準点からのレイヤの距離(例えばメートルなどで与えられる)にマッピングする深度マップm(l、r)の形式で距離情報として表現できると仮定する。
拡散度は、このベクトル[18]の変動係数から推定される。
(k、n)を取得する。信号の直接部分のDoAは、反対方向の単位長さベクトルとして計算される。
方向は各時間−周波数ビンの単位長さの3次元ベクトルとして符号化されるため、距離情報を統合するのは簡単である。方向ベクトルは、ベクトルの長さが対応する音源dr(k、n)の距離を表すように、対応するマップエントリと乗算される。
=
(k、n)
ここで、dr(k、n)は、マイクの録音位置から、時間nおよび周波数ビンkでアクティブな音源を指すベクトルである。
の新しい変換方向ベクトルd1(k、n)を生成できる(図7を参照)。リスナーのPoVから音源までの距離が導出され、DoAは単一のステップで適応される。
リアルな再現の重要な側面は、距離の減衰である。減衰は、音源とリスナーとの間の距離の関数であると仮定される[19]。方向ベクトルの長さは、再生のために減衰または増幅を符号化することである。録音位置までの距離は、距離マップに従ってdr(k、n)で符号化され、再生される距離はd1(k、n)で符号化される。ベクトルを単位長に正規化し、古い距離と新しい距離の比率とを乗算すると、d1(k、n)を元のベクトルの長さで除算することによって必要な長さが与えられることが分かる。
リスナーの向きの変更は、次の手順で適用される。トラッキングによって与えられる方向は、原点としての録音位置を基準としたピッチ、ヨー、およびロール
Tで構成されるベクトルとして記述できる。音源方向は、リスナーの方向に従って回転され、これは、2D回転行列を使用して実施される。
結果として得られるリスナーのDoAは、単位長に正規化されたベクトルによって与えられる。
変換された方向ベクトル、拡散度、および複雑なスペクトルを使用して、均一に分散された8+4仮想スピーカ設定用の信号を合成する。8つの仮想スピーカは、リスナー平面上で45°の方位角のステップ(仰角0°)で配置され、4つの仮想スピーカは、45°の仰角で90°のクロスフォーメーションで配置される。合成は、スピーカチャネル
ごとに直接部分および拡散部分に分割され、
はスピーカの数[16]である。
直接部分では、エッジフェージング振幅パンニング(EFAP)パンニングが適用され、仮想スピーカジオメトリ[20]が与えられると、正しい方向から音が再生される。DoAベクトルrp(k、n)が与えられると、これは各仮想スピーカチャネル
のパンニングゲインGi(r)を提供する。各DoAの距離依存ゲインは、結果の方向ベクトルの長さdp(k、n)から導出される。チャネル
の直接合成は次のようになる。
ここで、指数γは、通常は約1に設定される調整係数である[19]。γ=0の場合、距離依存ゲインはオフになることに留意されたい。
圧力
は、
非相関信号
を生成するために使用される。これらの非相関信号は、拡散成分として個々のスピーカチャネルに追加される。これは標準の方法[16]に従う。
各チャネルの拡散部分と直接部分が一緒に加算され、信号は逆STFTによって時間領域に変換される。これらのチャネル時間領域信号は、バイノーラル化された信号を作成するために、スピーカの位置に応じて左右の耳のHRTFと畳み込まれる。
好ましくは、図10に示すように、特定の音源のボリュームまたは音量を新しい場所、すなわち新しいまたは異なる基準位置に適合させるために、新しい音場記述を生成する際に到来方向ごとの距離も使用される。
例えば、音場が単一の音源のみを有すると決定される場合、距離変更はブロック1270aで既に実行されてもよい。
のように推定することができ、STFTドメインで表される。
参考文
Claims (29)
- 拡張音場記述を生成するための装置であって、
少なくとも1つの基準位置についての音場を示す少なくとも1つの音場記述を生成するための音場生成器(100、250、260)と、
前記音場の空間情報に関連するメタデータを生成するためのメタデータ生成器(110)と、を含み、
前記少なくとも1つの音場記述および前記メタデータは、前記拡張音場記述を構成し、
前記音場生成器(100、250、260)は、前記基準位置についての第1の音場記述を生成するように構成され、前記第1の音場記述は、前記基準位置の周りの第1のボリュームに位置する音源からの音データのみを含み、且つ、前記基準位置についての第2の音場記述を生成するように構成され、前記第2の音場記述は、前記基準位置の周りの第2のボリュームに位置する第2の音源からの音データのみを含み、前記第2のボリュームは前記第1のボリュームとは異なり、
前記メタデータ生成器(110)は、前記第1のボリュームおよび/または前記第2のボリュームの空間記述を提供するように構成されるか、
或いは、
前記音場生成器(100)は、複数のレイヤの各レイヤについて、1つもしくは複数のダウンミックス信号および個別方向データ、ならびに任意選択で異なる時間−周波数ビンに対する拡散度データを有する音場のDirAC(指向性オーディオ符号化)記述を生成するように構成され、
前記メタデータ生成器(110)は、レイヤごとに単一の距離情報項目を生成するように構成されるか、
或いは、
前記メタデータ生成器(110)は、前記メタデータとして、前記第1の音場記述についての第1の幾何学的情報(352)、および前記第2の音場記述についての第2の幾何学的情報(353)を生成するように構成され、
前記第1の幾何学的記述(352)は、第1のボリュームから基準点までの第1の代表距離であり、前記第2の幾何学的情報(353)は、第2のボリュームから前記基準点までの第2の代表距離であり、前記基準点は、前記基準位置であるかまたは前記基準位置から前記基準点を指すベクトルによって記述される、装置。 - 前記第1のボリュームは前記基準位置の周りの球であり、前記第2のボリュームは前記基準位置の周りの球殻であり、前記球殻は前記球の直径よりも大きい直径を有するか、または、
前記第1のボリュームは第1の球殻であり、前記第2のボリュームは第2の球殻であり、前記第1の球殻の直径は前記第2の球殻の直径よりも小さく、
前記メタデータ生成器(110)は、前記球および前記球殻あるいは第1の球殻および第2の球殻の空間記述を提供するように構成される、
請求項1に記載の装置。 - 前記第1の音場記述および前記第2の音場記述は、アンビソニックスまたはDirAC(指向性オーディオ符号化)記述である、
請求項1または2に記載の装置。 - 前記音場生成器(100、250、260)は、静的に、または前記音場に依存して、前記第1および前記第2の異なるボリュームを決定するように構成される、
請求項1から3のいずれか一項に記載の装置。 - 前記メタデータ生成器(110)は、各音場記述の距離範囲を決定するように構成され、前記距離範囲は、各ボリュームに対して均一または不均一であり、前記距離範囲が各ボリュームに対して不均一である場合、前記基準位置からさらに離れて延在するボリュームの距離範囲は、前記基準位置により近い距離範囲よりも大きい、
請求項1から4のいずれか一項に記載の装置。 - 送信または保存のための出力信号を生成するための出力インターフェース(120)をさらに含み、前記出力信号は、時間フレームについて、前記時間フレームの前記音場および前記空間情報から導出された1つまたは複数のオーディオ信号を含む、請求項1から5のいずれか一項に記載の装置。
- 前記装置は、前記拡張音場記述が、第1の音場記述(330)、第2の音場記述(340)、および前記第1の音場記述および前記第2の音場記述に関する空間情報(350)を前記メタデータとして含むように、前記拡張音場記述を生成するように構成される、
請求項1から6のいずれか一項に記載の装置。 - 前記メタデータ生成器(110)は、前記メタデータとして、前記第1の音場記述についての第1の幾何学的情報(352)、および前記第2の音場記述についての第2の幾何学的情報(353)を生成するように構成される、
請求項1から7に記載の装置。 - 音場記述および前記音場記述の空間情報に関連するメタデータから修正音場記述を生成するための装置であって、
前記空間情報、前記音場記述、およびある基準位置から異なる基準位置への並進を示す並進情報を使用して前記修正音場を計算するための音場計算器(420)を含み、
前記音場計算器(420)は、レイヤごとに、
前記音場記述としてのDirAC(指向性オーディオ符号化)記述について、方向データ、深度情報、および前記並進情報を使用して、異なる時間−周波数ビンの修正方向データを計算し、
前記修正方向データを使用して、前記DirAC記述を複数のオーディオチャネルを含む音響記述にレンダリングして前記修正音場記述を取得するか、または、前記時間−周波数ビンの前記方向データの代わりに前記修正方向データ、および任意選択で、前記DirAC記述に含まれている拡散度データを使用して、前記修正音場記述として前記DirAC記述を送信または保存する、ように構成されるか、
或いは、
前記音場計算器(420)は、前記修正音場記述を取得する際に、レイヤごとに、時間−周波数ビンについて、前記方向データを維持するか、または前記時間−周波数ビンの前記拡散データに基づいて修正方向データを計算する、ように決定するように構成され、修正方向データは、所定のまたは適応的な拡散度レベルよりも低い拡散度を示す拡散度データについてのみ計算されるか、
或いは、
前記音場記述は、レイヤごとに、複数の音場成分を含み、前記複数の音場成分は、全方向性成分および少なくとも1つの指向性成分を含み、
前記音場計算器(420)は、レイヤごとに、
前記音場成分を解析して、異なる周波数ビンについて、到来方向情報を導出するための音場解析器(422)と、
前記方向情報およびメタデータを使用して、周波数ビンごとに修正到来方向情報を計算するための並進変換器(423)であって、前記メタデータは、距離情報をレイヤに関連付ける深度マップを含む、並進変換器(423)と、
前記レイヤの前記深度マップによって提供される距離に応じた距離補償情報と、前記修正到来方向情報に関連する前記周波数ビンに関連付けられた新しい距離と、を使用して、前記修正音場を計算するための距離補償器と、を含むか、
或いは、
前記音場計算器(420)は、レイヤごとに、
前記基準位置から前記音場の前記解析(1102)により得られた音源(510)を指す第1のベクトルを計算し(1104)、
前記第1のベクトルおよび前記並進情報を使用して、前記異なる基準位置(500)から前記音源(510)を指す第2のベクトルを計算し(1106)、前記並進情報は、前記基準位置(522)から前記異なる基準位置(500)への並進ベクトルを定義し、
前記異なる基準位置(500)、前記音源(510)の位置、および前記第2のベクトルを使用して、あるいは、前記異なる基準位置(500)から前記音源(510)の位置までの距離および前記第2のベクトルを使用して、距離修正値を計算する(1106)、ように構成されるか、
或いは、
前記音場計算器(420)は、レイヤごとに、
前記音場記述から音源信号を決定し、音解析により前記基準位置に関連する前記音源信号の方向を決定し(1200)、
前記並進情報を使用して、前記異なる基準位置に関連する前記音源信号の新しい方向を計算し(1230)、
前記異なる基準位置に関連する前記音源の距離情報を計算し(1230)、
前記距離情報、前記音源信号、前記新しい方向を使用して前記修正音場を合成する(1260)、ように構成され、
前記音場計算器(420)は、レイヤごとに、または単一レイヤのみに、拡散信号を前記音源信号の直接部分に追加するように構成され、前記直接部分は、前記拡散信号に追加される前に前記距離情報によって修正されるか、
或いは、
前記音場計算器(420)は、レイヤ音場記述ごとに、前記メタデータから前記レイヤ音場記述の代表距離を受け取るように構成され、
前記音場計算器は、前記並進情報によって決定された前記修正された基準位置に関して前記音源が同じレイヤに残っているかどうかの決定を使用して、前記レイヤ音場記述から決定された音源のスケーリング値を決定するように構成され、
前記スケーリング値は、前記音源が前記異なる基準位置に対して下位レイヤにある場合には、1より大きいと決定され、
前記スケーリング値は、前記音源が前記異なる基準位置に対して上位レイヤにある場合には、1より小さいと決定されるか、
或いは、
前記音場計算器(420)は、各レイヤ音場記述を解析して、前記レイヤ音場記述に含まれる各音源の到来方向情報を取得し、
前記到来方向情報および前記レイヤ音場記述の前記メタデータを使用して、前記レイヤ音場記述の音源から前記修正された基準位置までの距離を決定し、
前記レイヤ音場記述の前記音源から前記異なる基準位置までの前記距離と、前記音源が抽出された前記音場記述の前記メタデータと、を使用して、スケーリング係数を決定する、ように構成されるか、
或いは、
前記音場計算器(420)は、音源の位置および前記並進情報を使用して、前記異なる基準位置から前記音源の前記位置までの距離を決定し、
前記異なる基準位置までの前記距離を、前記異なる基準位置の周りのレイヤの代表距離と比較して、前記比較に従って前記異なる基準位置の周りのレイヤに前記音源がレンダリングされるか、
或いは、
前記音場計算器(420)は、音源について、到来方向情報および幾何学的情報を使用して、前記基準位置から前記音源への第1のベクトルを形成するように構成され、レイヤ音場記述の各音源に前記同じ幾何学的情報が使用され、
前記音場計算器(420)は、前記第1のベクトルおよび前記レイヤ音場記述の各音源の前記並進情報から第2のベクトルを形成するように構成され、
前記音場計算器は、前記第2のベクトルの長さを前記第1のベクトルの長さで除算することにより、各音源のスケーリング値を計算するように構成される、装置。 - 前記音場計算器(420)は、
前記音場記述として、第1のレイヤ音場記述と第2のレイヤ音場記述を受け取り、
前記第1および前記第2のレイヤ音場記述の音源分離を実行して、前記第1および前記第2のレイヤ音場記述の音源と抽出された音源の到来方向(DoA)データとを抽出し、
抽出された音源ごとに、前記DoAデータおよび前記並進情報を使用して、前記異なる位置についての修正DoAデータを計算し、
前記抽出された音源と前記修正DoAデータを処理して、前記修正音場記述を取得する、ように構成される、
請求項9に記載の装置。 - 前記音場計算器(420)は、
レイヤ音場記述ごとに個別に音源分離を実行し、レイヤごとにアンビエンス/拡散/残差信号を抽出するか、または、
すべてのレイヤについて前記音源分離を一緒に実行し、少なくとも2つのレイヤの単一のアンビエンス/拡散/残差信号を抽出する、ように構成される、
請求項9に記載の装置。 - 前記音場計算器(420)は、抽出された音源ごとに、修正DoA(抽出された音源の到来方向)データを使用して音場記述を生成し、
前記対応する抽出された音源と特定のレイヤの前記異なる基準位置との間の距離に基づいて音源の音場記述を選択し、前記レイヤ内の選択された各音源の前記音場記述を追加して、修正レイヤ音場記述を取得するか、または、
前記音響シーンの各音源の前記音場記述を追加して、修正された全体音場記述を取得する、ように構成される、
請求項9に記載の装置。 - 前記音場計算器(420)は、修正レイヤ音場記述を計算する際にレイヤごとにアンビエンス/拡散/残差信号を追加するか、あるいは前記全体音場記述に追加される単一のアンビエンス/拡散/残差信号を計算する、ように構成される、
請求項12に記載の装置。 - 前記音場計算器(420)は、音源ごとに、修正距離を計算し、抽出された音源の前記修正距離を使用して修正レイヤ音場記述を計算するように構成される、
請求項9から13のいずれか一項に記載の装置。 - 前記音場計算器(420)は、各レイヤ音場記述の対応する成分ごとに、前記レイヤ音場記述を追加して、全体音場記述を取得するように構成される、
請求項9から14のいずれか一項に記載の装置。 - 前記音場計算器(420)は、前記修正音場記述に回転を適用するように構成され、前記修正音場記述は、前記異なる基準位置に関連するレイヤ音場記述または全体音場記述である、
請求項9から15のいずれか一項に記載の装置。 - 前記並進情報または前記修正音場に対する意図されたリスナーの回転を示す回転情報を提供するための変換インターフェース(410)と、
前記音場計算器(420)に前記メタデータを提供するためのメタデータサプライヤ(402、400)と、
前記音場計算器(420)に前記音場記述を提供するための音場サプライヤ(404、400)と、
前記修正音場記述と、前記並進情報を使用して前記メタデータから導出された修正メタデータと、を含む前記修正音場を出力するための、または各スピーカチャネルが所定のスピーカ位置に関連する複数のスピーカチャネルを出力するための、または前記修正音場のバイノーラル表現を出力するための、出力インターフェース(421)と、
をさらに含む、請求項9から16のいずれか一項に記載の装置。 - 前記第1のベクトルは、到来方向の単位ベクトルに前記メタデータに含まれる距離を乗算することによって計算されるか、または、
前記第2のベクトルは、前記第1のベクトルから前記並進ベクトルを減算することによって計算されるか、または、
前記距離修正値は、前記第2のベクトルを前記第1のベクトルのノルムで除算することにより計算される、
請求項9に記載の装置。 - 前記音場計算器(420)は、前記並進情報に加えて、回転情報を受け取るように構成され、
前記音場計算器(420)は、前記回転情報を使用して回転変換(424)を実行し、音場の到来方向データを回転させるように構成され、前記到来方向データは、前記音場記述の音場解析および前記並進情報を使用することにより得られた到来方向データから導出される、
請求項9から18のいずれか一項に記載の装置。 - 前記音場計算器(420)は、レイヤごとに、
音場解析により前記音場記述および音源の方向から前記音源を決定し(1200、1240)、
音源ごとに、前記メタデータを使用して前記基準位置から前記音源までの距離を決定し(1220)、
前記音源の方向および前記並進情報を使用して、前記異なる基準位置に関連する前記音源の新しい方向を決定し(1250)、
前記異なる基準位置に関連する前記音源の新しい距離情報を決定し(1230)、
前記音源の前記新しい方向、前記新しい距離情報、および前記音場記述もしくは前記音場記述から導出された前記音源に対応する音源信号を使用して、前記修正音場を生成する(1260)、
ように構成される、請求項9から19のいずれか一項に記載の装置。 - 前記音場計算器は、レイヤごとに、
前記音場記述から音源信号を決定し、音解析により前記基準位置に関連する前記音源信号の方向を決定し(1200)、
前記並進情報を使用して、前記異なる基準位置に関連する前記音源信号の新しい方向を計算し(1230)、
前記異なる基準位置に関連する前記音源の距離情報を計算し(1230)、
前記距離情報、前記音源信号、前記新しい方向を使用して前記修正音場を合成する(1260)、
ように構成される、請求項9から20のいずれか一項に記載の装置。 - 前記音場計算器(420)は、
再生設定に関連して前記新しい方向により与えられた方向に音源信号をパンニングすることにより、
ならびに前記パンニングを実行する前または前記パンニングを実行した後に、前記距離情報を使用して前記音源信号をスケーリングすることにより、前記修正音場を合成するように構成される、請求項21に記載の装置。 - 前記音場計算器(420)は、レイヤごとに、
前記音場記述の時間−周波数変換を実行し、時間フレームの複数の周波数ビンの到来方向を計算し(422)、
周波数ビンごとに前記新しい方向を計算(423、424)し、
周波数ビンごとに前記距離情報を計算し、
周波数ビンのオーディオ信号、前記周波数ビンの前記新しい方向から導出された前記周波数ビンのパンニングゲイン、および前記対応するレイヤの前記距離情報から導出された前記周波数ビンのスケーリング値を使用して、周波数ビンごとに直接合成を実行する、
ように構成される、請求項19から22のいずれか一項に記載の装置。 - 前記音場計算器(420)は、レイヤごとに、
前記周波数ビンの前記オーディオ信号から導出された拡散オーディオ信号を使用し、かつ前記周波数ビンの前記音解析によって導出された拡散度パラメータを使用して拡散合成を実行し、前記直接部分と前記拡散部分とを組み合わせて、前記周波数ビンの合成オーディオ信号を取得し、
時間フレームの前記周波数ビンの前記オーディオ信号を使用して周波数−時間変換を実行し、前記修正音場として時間領域合成オーディオ信号を取得する、
ように構成される、請求項23に記載の装置。 - 前記音場計算器(420)は、音源ごとに、前記異なる基準位置に関連する音場を合成するように構成され、前記合成は、
音源ごとに、前記音源信号の前記新しい方向を使用して音源信号を処理して(430)、前記異なる基準位置に関連する前記音源信号の音場記述を取得し、
前記音源信号を処理する前に前記音源信号を修正するか、または前記方向情報を使用して前記音場記述を修正し、
前記音源の前記音場記述を追加して、前記異なる基準位置に関連する修正音場を取得する、
ことを含む、請求項19から24のいずれか一項に記載の装置。 - 前記音解析(1200)は、音源分離アルゴリズムによって前記音源信号を決定し、前記拡散信号を取得するために前記音場記述から前記音源信号の少なくともいくつかを減算するように構成される、
請求項19から25のいずれか一項に記載の装置。 - 拡張音場の記述を生成するための方法であって、
少なくとも1つの基準位置についての音場を示す少なくとも1つの音場記述を生成するステップと、
前記音場の空間情報に関連するメタデータを生成するステップと、を含み、
前記少なくとも1つの音場記述および前記メタデータは、前記拡張音場記述を構成し、
前記少なくとも1つの音場記述を生成するステップは、前記基準位置についての第1の音場記述を生成することを含み、前記第1の音場記述は、前記基準位置の周りの第1のボリュームに位置する音源からの音データのみを含み、且つ、前記基準位置についての第2の音場記述を生成することを含み、前記第2の音場記述は、前記基準位置の周りの第2のボリュームに位置する第2の音源からの音データのみを含み、前記第2のボリュームは前記第1のボリュームとは異なり、
前記メタデータを生成するステップは、前記第1のボリュームおよび/または前記第2のボリュームの空間記述を提供することを含むか、
或いは、
前記少なくとも1つの音場記述を生成するステップは、複数のレイヤの各レイヤについて、1つもしくは複数のダウンミックス信号および個別方向データ、ならびに任意選択で異なる時間−周波数ビンに対する拡散度データを有する音場のDirAC(指向性オーディオ符号化)記述を生成することを含み、
前記記メタデータを生成するステップは、レイヤごとに単一の距離情報項目を生成することを含むか、
或いは、
前記生成するステップは、前記メタデータとして、前記第1の音場記述についての第1の幾何学的情報(352)、および前記第2の音場記述についての第2の幾何学的情報(353)を生成することを含み、
前記第1の幾何学的記述(352)は、第1のボリュームから基準点までの第1の代表距離であり、前記第2の幾何学的情報(353)は、第2のボリュームから前記基準点までの第2の代表距離であり、前記基準点は、前記基準位置であるかまたは前記基準位置から前記基準点を指すベクトルによって記述される、方法。 - 音場記述および前記音場記述の空間情報に関連するメタデータから修正音場記述を生成するための方法であって、前記方法は、
前記空間情報、前記音場記述、およびある基準位置から異なる基準位置への並進を示す並進情報を使用して前記修正音場を計算するステップを含み、
前記計算するステップは、レイヤごとに、
前記音場記述としてのDirAC(指向性オーディオ符号化)記述について、方向データ、深度情報、および前記並進情報を使用して、異なる時間−周波数ビンの修正方向データを計算し、
前記修正方向データを使用して、前記DirAC記述を複数のオーディオチャネルを含む音響記述にレンダリングして前記修正音場記述を取得するか、または、前記時間−周波数ビンの前記方向データの代わりに前記修正方向データ、および任意選択で、前記DirAC記述に含まれている拡散度データを使用して、前記修正音場記述として前記DirAC記述を送信または保存する、ことを含むか、
或いは、
前記計算するステップは、前記修正音場記述を取得する際に、レイヤごとに、時間−周波数ビンについて、前記方向データを維持するか、または前記時間−周波数ビンの前記拡散データに基づいて修正方向データを計算する、ように決定するように構成され、修正方向データは、所定のまたは適応的な拡散度レベルよりも低い拡散度を示す拡散度データについてのみ計算されるか、
或いは、
前記音場記述は、レイヤごとに、複数の音場成分を含み、前記複数の音場成分は、全方向性成分および少なくとも1つの指向性成分を含み、
前記計算するステップは、レイヤごとに、
前記音場成分を解析して、異なる周波数ビンについて、到来方向情報を導出することと、
前記方向情報およびメタデータを使用して、周波数ビンごとに修正到来方向情報を計算することであって、前記メタデータは、距離情報をレイヤに関連付ける深度マップを含む、修正到来方向情報を計算することと、
前記レイヤの前記深度マップによって提供される距離に応じた距離補償情報と、前記修正到来方向情報に関連する前記周波数ビンに関連付けられた新しい距離と、を使用して、前記修正音場を計算することと、を含むか、
或いは、
前記計算するステップは、レイヤごとに、
前記基準位置から前記音場の前記解析(1102)により得られた音源(510)を指す第1のベクトルを計算する(1104)ことと、
前記第1のベクトルおよび前記並進情報を使用して、前記異なる基準位置(500)から前記音源(510)を指す第2のベクトルを計算すること(1106)であって、前記並進情報は、前記基準位置(522)から前記異なる基準位置(500)への並進ベクトルを定義する、第2のベクトルを計算する(1106)ことと、
前記異なる基準位置(500)、前記音源(510)の位置、および前記第2のベクトルを使用して、あるいは、前記異なる基準位置(500)から前記音源(510)の位置までの距離および前記第2のベクトルを使用して、距離修正値を計算する(1106)ことと、を含むか、
或いは、
前記計算するステップは、レイヤごとに、
前記音場記述から音源信号を決定し、音解析により前記基準位置に関連する前記音源信号の方向を決定する(1200)ことと、
前記並進情報を使用して、前記異なる基準位置に関連する前記音源信号の新しい方向を計算する(1230)ことと、
前記異なる基準位置に関連する前記音源の距離情報を計算する(1230)ことと、
前記距離情報、前記音源信号、前記新しい方向を使用して前記修正音場を合成する(1260)ことと、
レイヤごとに、または単一レイヤのみに、拡散信号を前記音源信号の直接部分に追加することであって、前記直接部分は、前記拡散信号に追加される前に前記距離情報によって修正される、追加することと、を含むか、
或いは、
前記計算するステップは、レイヤ音場記述ごとに、前記メタデータから前記レイヤ音場記述の代表距離を受け取ることと、
前記並進情報によって決定された前記修正された基準位置に関して前記音源が同じレイヤに残っているかどうかの決定を使用して、前記レイヤ音場記述から決定された音源のスケーリング値を決定することと、を含み、
前記スケーリング値は、前記音源が前記異なる基準位置に対して下位レイヤにある場合には、1より大きいと決定され、
前記スケーリング値は、前記音源が前記異なる基準位置に対して上位レイヤにある場合には、1より小さいと決定されるか、
或いは、
前記計算するステップは、各レイヤ音場記述を解析して、前記レイヤ音場記述に含まれる各音源の到来方向情報を取得することと、
前記到来方向情報および前記レイヤ音場記述の前記メタデータを使用して、前記レイヤ音場記述の音源から前記修正された基準位置までの距離を決定することと、
前記レイヤ音場記述の前記音源から前記異なる基準位置までの前記距離と、前記音源が抽出された前記音場記述の前記メタデータと、を使用して、スケーリング係数を決定することと、を含むか、
或いは、
前記計算するステップは、音源の位置および前記並進情報を使用して、前記異なる基準位置から前記音源の前記位置までの距離を決定することと、
前記異なる基準位置までの前記距離を、前記異なる基準位置の周りのレイヤの代表距離と比較して、前記比較に従って前記異なる基準位置の周りのレイヤに前記音源がレンダリングされることと、を含むか、
或いは、
前記計算するステップは、音源について、到来方向情報および幾何学的情報を使用して、前記基準位置から前記音源への第1のベクトルを形成することであって、レイヤ音場記述の各音源に前記同じ幾何学的情報が使用される、第1のベクトルを形成することと、
前記第1のベクトルおよび前記レイヤ音場記述の各音源の前記並進情報から第2のベクトルを形成することと、
前記第2のベクトルの長さを前記第1のベクトルの長さで除算することにより、各音源のスケーリング値を計算することと、を含む、方法。 - コンピュータまたはプロセッサで実行される場合に、請求項27に記載の方法または請求項28に記載の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17181484 | 2017-07-14 | ||
EP17181484.1 | 2017-07-14 | ||
PCT/EP2018/069145 WO2019012133A1 (en) | 2017-07-14 | 2018-07-13 | CONCEPT OF GENERATING AN ENHANCED AUDIO FIELD DESCRIPTION OR A MODIFIED AUDIO FIELD DESCRIPTION USING A MULTILAYER DESCRIPTION |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020527745A JP2020527745A (ja) | 2020-09-10 |
JP6983484B2 true JP6983484B2 (ja) | 2021-12-17 |
Family
ID=59631529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020500725A Active JP6983484B2 (ja) | 2017-07-14 | 2018-07-13 | マルチレイヤ記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト |
Country Status (14)
Country | Link |
---|---|
US (2) | US11153704B2 (ja) |
EP (1) | EP3652736A1 (ja) |
JP (1) | JP6983484B2 (ja) |
KR (2) | KR102540642B1 (ja) |
CN (1) | CN111183479B (ja) |
AR (1) | AR112504A1 (ja) |
AU (2) | AU2018298876A1 (ja) |
BR (1) | BR112020000759A2 (ja) |
CA (1) | CA3069403C (ja) |
RU (1) | RU2740703C1 (ja) |
SG (1) | SG11202000285QA (ja) |
TW (1) | TWI692753B (ja) |
WO (1) | WO2019012133A1 (ja) |
ZA (1) | ZA202000023B (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109683845B (zh) * | 2017-10-18 | 2021-11-23 | 宏达国际电子股份有限公司 | 声音播放装置、方法及非暂态存储媒体 |
US11019449B2 (en) * | 2018-10-06 | 2021-05-25 | Qualcomm Incorporated | Six degrees of freedom and three degrees of freedom backward compatibility |
US11432097B2 (en) * | 2019-07-03 | 2022-08-30 | Qualcomm Incorporated | User interface for controlling audio rendering for extended reality experiences |
US11430451B2 (en) | 2019-09-26 | 2022-08-30 | Apple Inc. | Layered coding of audio with discrete objects |
JPWO2021140959A1 (ja) * | 2020-01-10 | 2021-07-15 | ||
CN113747335A (zh) * | 2020-05-29 | 2021-12-03 | 华为技术有限公司 | 音频渲染方法及装置 |
US11558707B2 (en) | 2020-06-29 | 2023-01-17 | Qualcomm Incorporated | Sound field adjustment |
JP2024531541A (ja) * | 2021-09-03 | 2024-08-29 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 空間的メタデータ出力を有する音楽シンセサイザー |
GB2614254A (en) * | 2021-12-22 | 2023-07-05 | Nokia Technologies Oy | Apparatus, methods and computer programs for generating spatial audio output |
GB2620591A (en) * | 2022-07-12 | 2024-01-17 | Frontier Dev Ltd | System for audio and video simulation |
US20240298131A1 (en) * | 2023-03-03 | 2024-09-05 | Sony Interactive Entertainment Inc. | Systems and methods for modifying spatial audio |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1512514A (en) | 1974-07-12 | 1978-06-01 | Nat Res Dev | Microphone assemblies |
JPH08107600A (ja) | 1994-10-04 | 1996-04-23 | Yamaha Corp | 音像定位装置 |
US5970152A (en) | 1996-04-30 | 1999-10-19 | Srs Labs, Inc. | Audio enhancement system for use in a surround sound environment |
JP2006074589A (ja) | 2004-09-03 | 2006-03-16 | Matsushita Electric Ind Co Ltd | 音響処理装置 |
EP2205007B1 (en) | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
EP2346028A1 (en) * | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
EP2450880A1 (en) | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
CN103460285B (zh) * | 2010-12-03 | 2018-01-12 | 弗劳恩霍夫应用研究促进协会 | 用于以几何为基础的空间音频编码的装置及方法 |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2600343A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for merging geometry - based spatial audio coding streams |
EP2600637A1 (en) | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for microphone positioning based on a spatial power density |
US9584912B2 (en) | 2012-01-19 | 2017-02-28 | Koninklijke Philips N.V. | Spatial audio rendering and encoding |
US9479886B2 (en) | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
JP6038312B2 (ja) * | 2012-07-27 | 2016-12-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ラウドスピーカ・エンクロージャ・マイクロホンシステム記述を提供する装置及び方法 |
EP2891338B1 (en) | 2012-08-31 | 2017-10-25 | Dolby Laboratories Licensing Corporation | System for rendering and playback of object based audio in various listening environments |
WO2014080074A1 (en) | 2012-11-20 | 2014-05-30 | Nokia Corporation | Spatial audio enhancement apparatus |
CN104019885A (zh) * | 2013-02-28 | 2014-09-03 | 杜比实验室特许公司 | 声场分析系统 |
US9685163B2 (en) | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
US9466305B2 (en) * | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9384741B2 (en) | 2013-05-29 | 2016-07-05 | Qualcomm Incorporated | Binauralization of rotated higher order ambisonics |
US20140355769A1 (en) * | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
CN104244164A (zh) | 2013-06-18 | 2014-12-24 | 杜比实验室特许公司 | 生成环绕立体声声场 |
US20150127354A1 (en) | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
EP2866475A1 (en) | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
DE102013225892A1 (de) | 2013-12-13 | 2015-06-18 | Robert Bosch Gmbh | Schrägscheibenmaschine, Schrägscheibe und Verfahren zur hydrostatischen Entlastung einer Stellteilanbindung einer Schrägscheibenmaschine und zum Druckabbau eines Arbeitsmediums während eines Umsteuervorgangs der Schrägscheibenmaschine |
SG11201605692WA (en) | 2014-01-16 | 2016-08-30 | Sony Corp | Audio processing device and method, and program therefor |
US10412522B2 (en) | 2014-03-21 | 2019-09-10 | Qualcomm Incorporated | Inserting audio channels into descriptions of soundfields |
EP3007167A1 (en) | 2014-10-10 | 2016-04-13 | Thomson Licensing | Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field |
CN105635635A (zh) | 2014-11-19 | 2016-06-01 | 杜比实验室特许公司 | 调节视频会议系统中的空间一致性 |
WO2017098949A1 (ja) * | 2015-12-10 | 2017-06-15 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
US10659906B2 (en) * | 2017-01-13 | 2020-05-19 | Qualcomm Incorporated | Audio parallax for virtual reality, augmented reality, and mixed reality |
US10182303B1 (en) | 2017-07-12 | 2019-01-15 | Google Llc | Ambisonics sound field navigation using directional decomposition and path distance estimation |
-
2018
- 2018-07-13 RU RU2020106735A patent/RU2740703C1/ru active
- 2018-07-13 JP JP2020500725A patent/JP6983484B2/ja active Active
- 2018-07-13 WO PCT/EP2018/069145 patent/WO2019012133A1/en active Search and Examination
- 2018-07-13 CN CN201880060027.6A patent/CN111183479B/zh active Active
- 2018-07-13 KR KR1020207001252A patent/KR102540642B1/ko active IP Right Grant
- 2018-07-13 KR KR1020227006623A patent/KR102652670B1/ko active IP Right Grant
- 2018-07-13 BR BR112020000759-5A patent/BR112020000759A2/pt unknown
- 2018-07-13 AR ARP180101957 patent/AR112504A1/es active IP Right Grant
- 2018-07-13 CA CA3069403A patent/CA3069403C/en active Active
- 2018-07-13 SG SG11202000285QA patent/SG11202000285QA/en unknown
- 2018-07-13 EP EP18737641.3A patent/EP3652736A1/en active Pending
- 2018-07-13 AU AU2018298876A patent/AU2018298876A1/en not_active Abandoned
- 2018-07-16 TW TW107124519A patent/TWI692753B/zh active
-
2020
- 2020-01-02 ZA ZA2020/00023A patent/ZA202000023B/en unknown
- 2020-01-03 US US16/733,662 patent/US11153704B2/en active Active
-
2021
- 2021-06-01 US US17/336,202 patent/US11863962B2/en active Active
- 2021-09-03 AU AU2021225242A patent/AU2021225242B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
AU2018298876A1 (en) | 2020-02-27 |
TW201909170A (zh) | 2019-03-01 |
AR112504A1 (es) | 2019-11-06 |
BR112020000759A2 (pt) | 2020-07-14 |
RU2740703C1 (ru) | 2021-01-20 |
KR102652670B1 (ko) | 2024-04-01 |
SG11202000285QA (en) | 2020-02-27 |
EP3652736A1 (en) | 2020-05-20 |
CA3069403C (en) | 2023-05-09 |
KR102540642B1 (ko) | 2023-06-08 |
JP2020527745A (ja) | 2020-09-10 |
US20210289310A1 (en) | 2021-09-16 |
ZA202000023B (en) | 2021-10-27 |
TWI692753B (zh) | 2020-05-01 |
KR20220044973A (ko) | 2022-04-12 |
WO2019012133A1 (en) | 2019-01-17 |
KR20200041860A (ko) | 2020-04-22 |
CA3069403A1 (en) | 2019-01-17 |
US11153704B2 (en) | 2021-10-19 |
US11863962B2 (en) | 2024-01-02 |
US20200145776A1 (en) | 2020-05-07 |
AU2021225242B2 (en) | 2023-07-06 |
CN111183479B (zh) | 2023-11-17 |
AU2021225242A1 (en) | 2021-09-30 |
CN111183479A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11950085B2 (en) | Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description | |
JP6983484B2 (ja) | マルチレイヤ記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト | |
KR102448736B1 (ko) | 깊이-확장형 DirAC 기술 또는 기타 기술을 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210128 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210423 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6983484 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |