JP2017501440A - 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置 - Google Patents
特異値分解を用いる高次Ambisonics符号化と復号の方法と装置 Download PDFInfo
- Publication number
- JP2017501440A JP2017501440A JP2016534923A JP2016534923A JP2017501440A JP 2017501440 A JP2017501440 A JP 2017501440A JP 2016534923 A JP2016534923 A JP 2016534923A JP 2016534923 A JP2016534923 A JP 2016534923A JP 2017501440 A JP2017501440 A JP 2017501440A
- Authority
- JP
- Japan
- Prior art keywords
- mode matrix
- matrix
- encoder
- decoder
- rank
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims description 29
- 239000011159 matrix material Substances 0.000 claims abstract description 194
- 239000013598 vector Substances 0.000 claims abstract description 93
- 238000004091 panning Methods 0.000 claims description 19
- 230000036962 time dependent Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 230000006399 behavior Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000009977 dual effect Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 238000005284 basis set Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 235000013367 dietary fats Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000010520 ghee Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
<複素ベクトル空間>
Ambisonicsでは複素関数を扱わなければならない。それゆえ、複素ベクトル空間に基づく記法を導入する。これは抽象的な複素ベクトルで用いられ、3次元「xyz」座標系から知られている実幾何学的ベクトルを表現するものではない。そうではなく、各複素ベクトルは、物理系の可能性のある状態を記述し、d個の成分xiを有するd次元空間における列ベクトルにより構成され、ディラックによれば、これらの列指向ベクトルはケットベクトルとよばれ、|x〉と記される。d次元空間において、任意の|x〉は、その成分xi及びd個の正規直交基底ベクトル|ei〉により構成される:
ここで、d次元空間は通常の「xyz」3次元空間ではない。
内積は同じ次元のブラ及びケットベクトルから構成でき、複素スカラー値になる。ランダムベクトル|x〉が正規直交ベクトル基底におけるその成分で記述されるとき、特定の基底(base)の特定の成分、すなわち|x〉の|ei〉への投影は、内積により与えられる:
ブラ及びケットベクトルの間にある、2つの縦線ではなく1つだけの縦線を考える。
となるようにかけることにより得られる。
次元mx1のケット及び次元1xnのブラベクトルが外積によりかけられると、m行n列のマトリックスAが得られる:
<Ambisonicsマトリックス(複数)>
Ambisonicsベースの説明は、完全なサウンドフィールドを時間変化するマトリックス(複数)にマッピングするのに必要な依存性を考慮する。高次Ambisonics(HOA)符号化又は復号マトリックス(複数)では、行(列)の数は音源またはサウンドシンクからの特定の方向に関する。
簡単のため、方向部分のみを考慮する(ラジアル依存性はベッセル関数により記述される)。
そして、特定の方向Ωsは、列ベクトル|Yn m(Ωs)〉により記述される。ここで、nはAmbisonics次数を表し、mはAmbisonics次数Nのインデックスである。対応する値は、それぞれm=1,...,N及びn=−m,...,0,...,mである。
2以上の音源がある場合、次数nのs個の個別のベクトル|Yn m(Ωs)〉が結合されると、すべての方向が含まれる。これにより、OxSモード成分を含むモードマトリックスΞが得られる。すなわちΞの各列は特定の方向を表す:
すべての信号値は信号ベクトル|x(kT)〉に結合される。信号ベクトルは、各個別の音源信号
以下、簡単のため、|x(kT)〉などの時間変動信号では、〆サンプル数kはもう記載しない、すなわち無視される。そして、|x〉では式(8)に示したように、モードマトリックスΞとかけられる。これにより、すべての信号成分が同じ方向Ωsの対応する列と線形結合され、式(5)によるO個のAmbisonicsモード成分又は係数を有するケットベクトル|a〉s)が得られる
生成するタスクを有する。したがって、ラウドスピーカモードマトリックスΨは、球面調和関
次マトリックス(複数)の場合、モードの数はラウドスピーカの数と等しく、|y〉は逆モードマトリックスΨにより決定できる。任意のマトリックスの場合、行及ひ列の数は異なり得るので、ラウドスピーカ信号|y〉は疑似逆により決定できる。非特許文献1を参照。そして、Ψの疑
エンコーダ及びデコーダサイドで記述されるサウンドフィールドはほぼ同じである、すなわち
有限Ambisonics次数の場合、|x〉で記述される実数値の音源信号と、|y〉で記述されるラウドスピーカ信号は異なる。それゆえ、|x〉を|y〉にマッピングするパニングマトリックスGを用いることができる。そして、式(8)及び(10)から、エンコーダ及びデコーダのチェイン演算は:
<線形汎関数>
今後の式を簡単にするため、「発明の概要」セクションまでパニングマトリックスは無視する。
必要な基底ベクトルの数が無限になると、離散的基底から連続的基底に変えられる。
それゆえ、関数f無限数のモード成分を有するベクトルとして解釈できる。
これは数学的には「汎関数」と呼ばれている。決定論的に、ケットベクトルから特定の出力ケットベクトルへのマッピングを行うからである。
これは、関数fとケット|x〉間の内積により記述できる。これは、一般的には複素数cとなる:
If〆汎関数がケットベクトルの線形結合を保存するとき、fは「線形汎関数」と呼ばれる。
エルミート演算子に制約がある限り、以下の特徴を考慮しなければならない。
エルミート演算子は常に次の特徴を有する:
・ 実固有値。
・ 異なる固有値に対する直交固有関数の完全なセット。
それゆえ、すべての関数はこれらの固有関数により構成することができる。非特許文献2を参
できる:
〆インデックス(複数)n,mは決定論的に用いられる。これらは1次元インデックスjにより置換され、及びインデックス(複数)n′,m′は同じサイズのインデックスiにより置換される。各副空間は、異なるi、jを有する副空間と直交していることにより、無限次元空間における線形独立、正規直交単位ベクトルとして記述できる:
Cjの定数値は積分の前に設定できる:
1つの副空間(インデックスj)から他の副空間(インデックスi)へのマッピングには、固有関数Yj及びYiが互いに直交している限り、同じインデックス(複数)i=jのハーモニクスの積分のみが必要である:
本質的な側面は、連続的記述からブラ/ケット記法への偏光するとき、積分解は球面調和関数のブラ及びケット記述の間の内積の和で置換できることである。一般的に、連続的基底を用いた内積を用いて、ケットベースの波動記述|x〉の離散的表現を連続的表現にマッピングできる。
例えば、x(ra)は、位置ベース(すなわち、動径)raにおけるケット表現である:
異なる種類のモードマトリックス(複数)Ψ及びΞを見る時、特異値分解を用いて、任意の種類のマトリックス(複数)を処理する。
<特異値分解>
特異値分解(SVD,非特許文献3を参照)により、m行n列の任意のマトリックスAの3つの
トリックス(複数)は、実空間の直交マトリックス(複数)と等価である。すなわち、その列は正規直交ベクトル基底を表す:
マトリックス(複数)U及びVは、すべての4つの副空間の正規直交基底(base)を含む。
・ Uの最初のr列:Aの列空間
・ Vの最初のr列:Aの行空間
・ Vの最後のn−r列:Aのヌル空間
マトリックスΣはすべての特異値を含む。これはAの振る舞いを特徴付けるために用いることができる。一般的に、Σはm×nの正方対角マトリックスであり、r個の対角要素σiまでを有し、
すなわち、式(20)及び(21)において、σ1は最大値を有し、σrは最小値を有する。
及びn>m=rの場合、
このように、SVDは、低ランク近似により非常に効率的に実装できる。上記のGolub/van Loanテキストブックを参照されたい。この近似は、元のマトリックスを厳密に記述するが、しかし、rランク−1マトリックス(複数)までを含む。ディラック記法を用いて、マトリックスAはrラ
式(11)のエンコーダデコーダチェインを見ると、マトリックスΞのようにエンコーダのモードマトリックス(複数)のみがあるが、しかし、マトリックスΨのようなモードマトリックス(複数)又は他の1つの非常に高度なデコーダマトリックスの逆も考慮すべきである。一
素共役転置を行うことにより、SVDから直接調べることができ、その結果:
より与えられ、一方、特異値σiは反転しなければならない。結果として得られる疑似逆は次のようになる:
異なるマトリックス(複数)のSVDベースの分解を、ベクトルベースの記述(式(8)及び(10)参照)と組み合わせと、符号化プロセスについて:
エンコーダからのAmbisonicsサウンドフィール記述|as〉は、入力信号|x〉及び出力信号|y〉よ
のようになる:
<Ambisonicsマトリックス(複数)への影響>
高次Ambisonics(HOA)モードマトリックス(複数)Ξ及びΨは、音源又はラウドスピーカの位置(式(6)参照)、及びそのAmbisonics次数により直接的に影響される。ジオメトリが規則的であり、すなわちソース又はラウドスピーカ位置間の相互の角距離がほぼ等しいとき、式(27)を解くことができる。
<逆問題>
たちの悪いマトリックス(複数)は大きいk(A)を有するため、問題である。反転又は疑似反転の場合、たちの悪いマトリックスでは、小さい特異値σiが非常に支配的になるという問題がある。P.Ch.Hansen著「Rank−Deficient and Discrete Ill−Posed problems:Numerical Aspects of Linear Inversion」(Society for Industrial and Applied Mathematics(SIAM),1998)では、特異値がどう減衰するかを記述することにより、2つの基本的タイプの問題が区別されている(第1.1章、第2−3ページ):
・ ランク欠損(rank−deficient)問題、これはマトリックス(複数)が大きい特異値及び小さい特異値のクラスター間にギャップを有する問題である(非漸次的減衰);
・ 離散的不良設定問題、これは平均的に、マトリックス(複数)のすべての特異値が漸次的にゼロに減衰する、すなわち特異値スペクトルにギャップがない。
<信号に関連する依存性>
その反転問題の低減は、例えば、モードマトリックスのランクの低減により、すなわち最小特異値を回避することにより実現できる。しかし、そうすると閾値を最小の可能性のある値σrに使うべきである(式(20)及び(21)を参照)。かかる最小特異値の最適値は、上記のHansen
依存する(ここでは、|x〉により記述する)。式(27)から、この信号は再生に影響するが、信号の依存性はデコーダでは制御できないことが分かる。
<非正規直交基底の問題>
状態ベクトル|as〉は、HOAエンコーダ及びHOAデコーダ間で伝送されるが、各システム式(25)及び(26)によると、異なる基底で記述される。しかし、正規直交基底が使われれば、状態は変化しない。そして、モード成分は、ある基底から他の基底に投影できる。そのため、原理的には、各ラウドスピーカセットアップ又はサウンド記述は、正規直交基底系上で構成されるべきである。これにより、これらの基底(base)間のベクトル表現の変更、例えば、Ambisonicsでは、3次元空間から2次元副空間への投影が可能となるからである。
上記の問題は、本発明プロセスにより避けることができ、請求項1に開示の方法により解決される。この方法を利用する装置は、請求項2に開示される。
本発明によると、復号プロセスの元の基底と組み合わせた符号化プロセスの逆基底を、最低モードマトリックスランク及びトランケートされた特異値分解を考慮して用いる。
原理的には、本発明の方法は、特異値分解を用いた高次Ambisonics符号化と復号に好適であり、前記方法は:
オーディオ入力信号を受け取るステップと、
音源の方向値及び前記オーディオ入力信号のAmbisonics次数とに基づき、球面調和関数の対応するケットベクトル及び対応するエンコーダモードマトリックスを構成するステップと、
前記エンコーダモードマトリックスに特異値分解を実行するステップであって、2つの対応するエンコーダユニタリーマトリックス(複数)及び特異値及び関連するエンコーダモードマトリックスランク(rs)を含む対応するエンコーダ対角マトリックスが出力されるステップと、
前記オーディオ入力信号、前記特異値及び前記エンコーダモードマトリックスランクから閾値を決定するステップと、
前記特異値の少なくとも1つを前記閾値と比較し、対応する最終エンコーダモードマトリックスランクを決定するステップと、
ラウドスピーカの方向値及びデコーダAmbisonics次数に基づき、前記方向値に対応する方向にある特定のラウドスピーカの球面調和関数の対応するケットベクトル及び対応するデコーダモードマトリックスを構成するステップと、
前記デコーダモードマトリックスに特異値分解を実行するステップであって、2つの対応するデコーダユニタリーマトリックス(複数)及び特異値を含む対応するデコーダ対角マトリックスが出力され、前記デコーダモードマトリックスの対応する最終的ランクが決定されるステップと、
前記最終エンコーダモードマトリックスランク及び前記最終デコーダモードマトリックスランクから最終的モードマトリックスランクを決定するステップと、
前記エンコーダユニタリーマトリックス(複数)、前記エンコーダ対角マトリックス及び前記最終的モードマトリックスランクから前記エンコーダモードマトリックスの随伴疑似逆を計算し、結果としてAmbisonicsケットベクトルを求め、
前記最終的モードマトリックスランクにより前記Ambisonicsケットベクトルの成分数を低減し、適応されAmbisonicsケットベクトルを提供するステップと、
前記適応されたAmbisonicsケットベクトル、前記デコーダユニタリーマトリックス(複数)、前記デコーダ対角マトリックス及び前記最終的モードマトリックスランクから随伴デコーダモードマトリックスを計算し、結果として得られるすべてのラウドスピーカの出力信号のケットベクトルを求めるステップとを含む。
オーディオ入力信号を受け取る手段と、
音源の方向値及び前記オーディオ入力信号のAmbisonics次数とに基づき、球面調和関数の対応するケットベクトル及び対応するエンコーダモードマトリックスを構成する手段と、
前記エンコーダモードマトリックスに特異値分解を実行する手段であって、2つの対応するエンコーダユニタリーマトリックス(複数)及び特異値及び関連するエンコーダモードマトリックスランクを含む対応するエンコーダ対角マトリックスが出力される手段と、
前記オーディオ入力信号、前記特異値及び前記エンコーダモードマトリックスランクから閾値を決定する手段と、
前記特異値の少なくとも1つを前記閾値と比較し、対応する最終エンコーダモードマトリックスランクを決定する手段と、
ラウドスピーカの方向値及びデコーダAmbisonics次数に基づき、前記方向値に対応する方向にある特定のラウドスピーカの球面調和関数の対応するケットベクトル及び対応するデコーダモードマトリックスを構成する手段と、
前記デコーダモードマトリックスに特異値分解を実行する手段であって、2つの対応するデコーダユニタリーマトリックス(複数)及び特異値を含む対応するデコーダ対角マトリックスが出力され、前記デコーダモードマトリックスの対応する最終的ランクが決定される手段と、
前記最終エンコーダモードマトリックスランク及び前記最終デコーダモードマトリックスランクから最終的モードマトリックスランクを決定する手段と、
前記エンコーダユニタリーマトリックス(複数)、前記エンコーダ対角マトリックス及び前記最終的モードマトリックスランクから前記エンコーダモードマトリックスの随伴疑似逆を計算し、結果としてAmbisonicsケットベクトルを求め、
前記最終的モードマトリックスランクにより前記Ambisonicsケットベクトルの成分数を低減し、適応されたAmbisonicsケットベクトルを提供する手段と、
前記適応されたAmbisonicsケットベクトル、前記デコーダユニタリーマトリックス(複数)、前記デコーダ対角マトリックス及び前記最終的モードマトリックスランクから随伴デコーダモードマトリックスを計算し、結果として得られるすべてのラウドスピーカの出力信号のケットベクトルを求める手段とを含む装置。
<HOAエンコーダ>
逆基底ベクトルを説明するため、ケットベースの記述はブラ空間に変更される。ブラ空間では、すべてのベクトルがケットのエルミート共役又は随伴である。これは、モードマトリックス(複数)の疑似反転を用いることにより実現される。
そして、式(8)によると、(デュアル)ブラベースのAmbsonicsベクトルは、(デュアル)モードマトリックスΞdを用いても再定式化できる:
エンコーダサイドで結果として得られるAmbisonicsベクトル〈as|は、ここではブラセマンティックである。しかし、統一的記述、すなわちケットセマンティックに戻ることが望ましい。Ξの
式(24)によると、
これにより、Ambisonics成分の次の記述が得られる:
をエンコーダサイドについて行う場合、デコーダサイドで対応するデュアル基底ベクトルに変更される。
<HOAデコーダ>
デコーダが元々疑似逆に基づく場合、ラウドスピーカ信号|y〉を導くため:
すなわち、ラウドスピーカ信号は:
式(22)を考慮すると、デコーダの式は:
る。これが意味するのは、デコーダにおいて必要な算術演算が少なくなることである。虚部の符号を切り替えるだけでよく、転置はメモリアクセスの修正のみの問題だからである:
仮定すると、式(32)を用いて、完全なエンコーダデコーダチェインは次の依存性を有する:
現実のシナリオでは、式(11)のパニングマトリックスG及び有限Ambisonics次数を考慮すべきである。後者により基底ベクトルの限定された数の線形結合が得られ、これはサウンドフィールドの記述に用いられる。さらに、基底ベクトルの線形独立性は、数値的丸め誤差又は測定誤差などの付加的誤差ソースにより影響される。実際的視点から、これは数値的ランクにより回避できる(上記のHansenの著作の第3.1章を参照)、これにより、すべての基底ベクトルが一定の許容度内で線形独立であることが保証される。
ノイズに対してよりロバストにするため、入力信号のSNRを考慮する。これはエンコーダケット及び入力の計算されAmbisonics表現に影響する。そのため、必要に応じて、すなわちたちの悪いモードマトリックス(複数)を反転しなければならない場合、σi値は、エンコーダにおいて入力信号のSNRに応じて規格化(regularised)される。
<エンコーダにおける規格化>
規格化は異なる方法で実行できる。例えば、トランケートされたSVDを介して閾値を用いることにより、実行できる。SVDによりσiが降順に得られ、ここで、最低レベル又は最高インデックス(σrで示す)のσiは、非常に頻繁に切り替わる成分を含み、及びノイズ効果及びSNRが生じる(式(20)及び(21)及び上記のHansenの著作を参照)。このように、トランケーションSVD(TSVD)はすべてのσi値を閾値と比較し、及びその閾値σεを越える雑音が大きい成分を無視する。閾値σεは一定であってもよく、又は入力信号のSNRに応じて最適に修正されてもよい。
マトリックスのトレースは、すべての対角マトリックス要素の和を意味する。
TSVDブロック(図1乃至3の10、20、30)は次のタスクを有する:
・ モードマトリックスランクrの計算;
・ 閾値より低いノイズが大きい成分を除去し、及び最終的モードマトリックスランクrfinを設定。
ら得られる。結果として得られるマトリックスは、実対角固有値を有する二次マトリックスであり、実対角固有値は、適当な特異値の二次値と等価である。すべての固有値の和は、マトリックスΣ2のトレースにより
と記述できるが、これが一定であるなら、系の物理特性は保存される。これはマトリックスΨにも当てはまる。
このように、エンコーダサイド(図1乃至3の15、25、35)のブロックONBS又はデコーダサイド(図1乃至3の19、29、39)のブロックONB1が特異値を修正し、規格化前後のtrace(Σ2)が保存されるようになる(図5及び図6を参照):
・ 元の及び目標のトランケートされたマトリックスΣtのトレースが一定
・ 次式を満たす定数値Δσを計算する
・ トランケートされたマトリックスΣtのすべての新しい特異値σi,tについて再計算する:
に変更されたとき、エンコーダ及びデコーダに対する簡略化を達成でき、次の通りとなる:
(備考:σi及び|a〉が付加的エンコーダ又はデコーダインデックス無しで用いられる場合、エンコーダサイド又は/及びデコーダサイドを指す)。この基底は正規直交であり、|a〉のノルムを表す。すなわち、|a〉の替わりに、規格化は|a′〉を使え、これはマトリックス(複数)Σ及びνは必要とするが、しかし、マトリックスUはもはや必要としない。
ある。
それゆえ、本発明では、SVDを両サイドで用いるが、これは、正規直交基底及び個別のマトリックス(複数)Ξ及びΨの特異値を行うためだけではなく、そのランクrfinを求めるためでもある。
<成分適応>
Ξのソースランクを考慮することにより、閾値又は最終的ソースランクに対して対応するσεの一部を無視することにより、成分数を低減でき、よりロバストな符号化マトリックスを提供できる。それゆえ、デコーダサイドにおける対応する成分数により送信されるAmbisonics成分の数の適応が行われる。通常、それはAmbisonics次数0に依存する。ここでは、エンコーダマ
るべきである。Adapt#Compステップ/ステージ16において、成分数は次のように適応される:
ダ及びデコーダ演算が低減される;
ーダ演算が低減される。
結果として、エンコーダサイド及びデコーダサイドで用いられる最終的モードマトリックスラ
このように、エンコーダ及びデコーダの間に、他のサイドのランクを交換する双方向信号があるとき、ランク差を用いて、可能な圧縮を改善し、及びエンコーダにおける及びデコーダにおける演算数を低減することができる。
<パニング関数の考慮>
スピーカセットアップに対して得られたエネルギー分布に関する問題のため、前述した。式(11)を参照されたい。これらの問題は、Ambisonicsで通常用いることができる限定された次数を処理しなければならない(Ambisonicsマトリックス(複数)への影響ないし非正規直交基底に伴う問題のセクションを参照されたい)。
パニングマトリックスGに対する要請に関して、符号化に続き、一部の音響ソースのサウンドフィールドはAmbisonics状態ベクトル|as〉により表される良い状態にあると仮定する。しかし、デコーダサイドにおいて、状態がどうなっているか正確には分からない。すなわち、系の現在の状態に関する完全な知識はない。それゆえ、式(9)及び(8)の間の内積を保存する逆基底を取る。
エンコーダサイドにおいてすでに疑似逆を用いているので、次の長所がある:
・ 符号化/復号チェインにおける演算数がより小さい;
・ SNR振る舞いに関する数値的側面の改善;
・ 線形独立のものだけでなく修正されたモードマトリックス(複数)の正規直交列;
・ 基底の変更の単純化;
・ ランク−1近似の使用により、メモリ使用量(memory effort)が減少し、及び演算数が減
演算ではなく、M+N演算のみが必要である;
・ デコーダにおける疑似逆を回避できるので、デコーダサイドにおける適応が単純化される;
・ 数値的に非安定なσの逆問題を回避できる。
図1では、エンコーダ又は送信者サイドにおいて、音源のs=1,...,S個の異なる方向値Ωs及びAmbisonics次数Nsがステップまたはステージ11に入力され、それから、次元OxSを有するエンコーダモードマトリックスΞOxSと球面調和関数の対応するケットベクトルs|Y(Ωs)〉を形成する。マトリックスΞOxSは、入力信号ベクトル|x(Ωs)〉に対応して生成される。入力信号ベクトルは、異なる方向ΩsのS個の音源信号を有する。それゆえ、マトリックスΞOxSは、球面調和ケットベクトル|Y(Ωs)〉の集まりである。信号x(Ωs)だけでなく位置も時間とともに変わるので、計算マトリックスΞOxSは動的に実行され得る。このマトリックは、ソースの非正規直交基底NONBsを有する。入力信号|x(Ωs)〉及びランク値rsから、特定の特異な閾値σεがステップまたはステージ12において決定される。エンコーダモードマトリックスΞOxS及び閾値σεはトランケーション特異値分解TSVD処理10に入力される(上記の特異値分解セクション参照)。この処理は、ステップまたはステージ13において、モードマトリックスΞOxSに対して、その特異値を求
のi番目の特異値である)。
ステップ/ステージ12において、閾値σεは、エンコーダにおけるセクション規格化に応じて決
数のサンプル値にわたり測定される。
及び次元OxLを有する対応するデコーダモードマトリックスΨOxLがステップまたはステージ18において決定される。
計算され、及びステップ/ステージ16に入力される。
ステップまたはステージ16において、上記のように、最終エンコーダモードマトリックスラ
ンクrfinが決定される。最終的モードマトリックスランクrfinはステップ/ステージ15及びステップ/ステージ17に入力される。
の出力は、対応する時間従属Ambisonicsケット又は状態ベクトル|a′s〉である。上記のHOAエンコーダセクションを参照されたい。
ション「HOAデコーダ」を参照されたい。復号は、通常のモードマトリックスの共役転置を用いて行われる。通常のモードマトリックスは、特定のラウドスピーカ位置に依存する。
図1のステップ/ステージ11ないし19は、原理的に、図2のステップ/ステージ21ないし29、及び図3のステップ/ステージ31ないし39にそれぞれ対応している。
かるパニング関数を用いる理由は、上記のセクション「パニング関数の考慮」で説明した。
図1と比較して、図3において、パニングマトリックスGは、ステップ/ステージ37の出力において、すべてのラウドスピーカの時間従属出力信号の予備的ケットベクトルに対するパニング処理371を制御する。これにより、すべてのラウドスピーカの時間従属出力信号の適応された
図4は、エンコーダモードマトリックスΞOxSの特異値分解SVD処理40に基づき閾値σεを決定す
角全特異値σiを含む、式(20)及び(21)を参照)及びマトリックスΣのランクrsを与える。
X=[|x(Ωs,t=0)〉,...,|x(Ωs,t=T)〉](=マトリックスSxT)のT個サンプルのブロックを調べ
定される(ブロック49)。
図5は、ステップ/ステージ15、25、35における、リデューストモードマトリックスランクrfin、及び|α′s〉の計算の場合における特異値の再計算を示す。図1/2/3のブロック10/20/30からのエ
テージ54に入力される。全エネルギー値と低減された全エネルギー値との間の差ΔE、値
入力される。
の結果はケットベクトル|a′s〉である。
Claims (7)
- 特異値分解を用いる高次Ambisonics(HOA)符号化と復号の方法であって、前記方法は:
オーディオ入力信号を受け取るステップと、
音源の方向値及び前記オーディオ入力信号のAmbisonics次数とに基づき、球面調和関数の対応するケットベクトル及び対応するエンコーダモードマトリックスを構成するステップと、
前記エンコーダモードマトリックスに特異値分解を実行するステップであって、2つの対応するエンコーダユニタリーマトリックス及び特異値及び関連するエンコーダモードマトリックスランクを含む対応するエンコーダ対角マトリックスが出力されるステップと、
前記オーディオ入力信号、前記特異値及び前記エンコーダモードマトリックスランクから閾値を決定するステップと、
前記特異値の少なくとも1つを前記閾値と比較し、対応する最終エンコーダモードマトリックスランクを決定するステップと、
ラウドスピーカの方向値及びデコーダAmbisonics次数に基づき、前記方向値に対応する方向にある特定のラウドスピーカの球面調和関数の対応するケットベクトル及び対応するデコーダモードマトリックスを構成するステップと、
前記デコーダモードマトリックスに特異値分解を実行するステップであって、2つの対応するデコーダユニタリーマトリックス及び特異値を含む対応するデコーダ対角マトリックスが出力され、前記デコーダモードマトリックスの対応する最終的ランクが決定されるステップと、
前記最終エンコーダモードマトリックスランク及び前記最終デコーダモードマトリックスランクから最終的モードマトリックスランクを決定するステップと、
前記エンコーダユニタリーマトリックス、前記エンコーダ対角マトリックス及び前記最終的モードマトリックスランクから前記エンコーダモードマトリックスの随伴疑似逆を計算し、結果としてAmbisonicsケットベクトルを求め、
前記最終的モードマトリックスランクにより前記Ambisonicsケットベクトルの成分数を低減し、適応されたAmbisonicsケットベクトルを提供するステップと、
前記適応されたAmbisonicsケットベクトル、前記デコーダユニタリーマトリックス、前記デコーダ対角マトリックス及び前記最終的モードマトリックスランクから随伴デコーダモードマトリックスを計算し、結果として得られるすべてのラウドスピーカの出力信号のケットベクトルを求めるステップとを含む方法。 - 特異値分解を用いて高次Ambisonics(HOA)符号化と復号をする装置であって、前記装置は:
オーディオ入力信号を受け取る手段と、
音源の方向値及び前記オーディオ入力信号のAmbisonics次数とに基づき、球面調和関数の対応するケットベクトル及び対応するエンコーダモードマトリックスを構成する手段と、
前記エンコーダモードマトリックスに特異値分解を実行する手段であって、2つの対応するエンコーダユニタリーマトリックス及び特異値及び関連するエンコーダモードマトリックスランクを含む対応するエンコーダ対角マトリックスが出力される手段と、
前記オーディオ入力信号、前記特異値及び前記エンコーダモードマトリックスランクから閾値を決定する手段と、
前記特異値の少なくとも1つを前記閾値と比較し、対応する最終エンコーダモードマトリックスランクを決定する手段と、
ラウドスピーカの方向値及びデコーダAmbisonics次数に基づき、前記方向値に対応する方向にある特定のラウドスピーカの球面調和関数の対応するケットベクトル及び対応するデコーダモードマトリックスを構成する手段と、
前記デコーダモードマトリックスに特異値分解を実行する手段であって、2つの対応するデコーダユニタリーマトリックス及び特異値を含む対応するデコーダ対角マトリックスが出力され、前記デコーダモードマトリックスの対応する最終的ランクが決定される手段と、
前記最終エンコーダモードマトリックスランク及び前記最終デコーダモードマトリックスランクから最終的モードマトリックスランクを決定する手段と、
前記エンコーダユニタリーマトリックス、前記エンコーダ対角マトリックス及び前記最終的モードマトリックスランクから前記エンコーダモードマトリックスの随伴疑似逆を計算し、結果としてAmbisonicsケットベクトルを求め、
前記最終的モードマトリックスランクにより前記Ambisonicsケットベクトルの成分数を低減し、適応されたAmbisonicsケットベクトルを提供する手段と、
前記適応されたAmbisonicsケットベクトル、前記デコーダユニタリーマトリックス、前記デコーダ対角マトリックス及び前記最終的モードマトリックスランクから随伴デコーダモードマトリックスを計算し、結果として得られるすべてのラウドスピーカの出力信号のケットベクトルを求める手段とを含む装置。 - 球面調和関数の前記ケットベクトル及び前記エンコーダモードマトリックスを構成するとき、線形演算を実行し、前記オーディオ入力信号中の音源位置をラウドスピーカ出力信号の前記ケットベクトルの前記ラウドスピーカの位置にマッピングするパニング関数を用い、
特定のラウドスピーカの球面調和関数の前記ケットベクトル及び前記デコーダモードマトリックスを構成するとき、線形演算を実行し、前記オーディオ入力信号の音源位置をラウドスピーカ出力信号の前記ケットベクトルの前記ラウドスピーカの位置にマッピングする、対応するパニング関数を用いる、
請求項1に記載の方法、又は請求項2に記載の装置。 - 前記随伴デコーダモードマトリックス及びすべてのラウドスピーカの時間従属出力信号の予め適応されたケットベクトルを計算した後、
すべてのラウドスピーカの時間従属出力信号のこれらの予め適応されたケットベクトルのパニングが、パニングマトリックスを用いて実行され、結果としてすべてのラウドスピーカの出力信号の前記ケットベクトルを求める、
請求項1に記載の方法、又は請求項2に記載の装置。 - 前記閾値を決定するため、前記特異値のセットにおいて、第1の特異値から始めてアマウント値ギャップを検出し、後続の特異値のアマウント値が現在の特異値のアマウント値より、所定係数だけ小さいとき、その現在の特異値のアマウント値を前記閾値とする、請求項1ないし4いずれか一項に記載の方法、又は請求項1ないし4いずれか一項に記載の装置。
- コンピュータにより実行されると、前記コンピュータに、請求項1に記載の方法を実行させるコンピュータプログラム。.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13306629.0 | 2013-11-28 | ||
EP13306629.0A EP2879408A1 (en) | 2013-11-28 | 2013-11-28 | Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition |
PCT/EP2014/074903 WO2015078732A1 (en) | 2013-11-28 | 2014-11-18 | Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019041597A Division JP6707687B2 (ja) | 2013-11-28 | 2019-03-07 | 特異値分解を用いる高次Ambisonics復号の方法と装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017501440A true JP2017501440A (ja) | 2017-01-12 |
JP2017501440A5 JP2017501440A5 (ja) | 2017-11-30 |
JP6495910B2 JP6495910B2 (ja) | 2019-04-03 |
Family
ID=49765434
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016534923A Active JP6495910B2 (ja) | 2013-11-28 | 2014-11-18 | 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置 |
JP2019041597A Active JP6707687B2 (ja) | 2013-11-28 | 2019-03-07 | 特異値分解を用いる高次Ambisonics復号の方法と装置 |
JP2020087853A Active JP6980837B2 (ja) | 2013-11-28 | 2020-05-20 | 特異値分解を用いる高次Ambisonics復号の方法と装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019041597A Active JP6707687B2 (ja) | 2013-11-28 | 2019-03-07 | 特異値分解を用いる高次Ambisonics復号の方法と装置 |
JP2020087853A Active JP6980837B2 (ja) | 2013-11-28 | 2020-05-20 | 特異値分解を用いる高次Ambisonics復号の方法と装置 |
Country Status (7)
Country | Link |
---|---|
US (3) | US9736608B2 (ja) |
EP (3) | EP2879408A1 (ja) |
JP (3) | JP6495910B2 (ja) |
KR (2) | KR102319904B1 (ja) |
CN (4) | CN107889045A (ja) |
HK (3) | HK1246554A1 (ja) |
WO (1) | WO2015078732A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101795015B1 (ko) * | 2010-03-26 | 2017-11-07 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 |
US9881628B2 (en) * | 2016-01-05 | 2018-01-30 | Qualcomm Incorporated | Mixed domain coding of audio |
KR102128281B1 (ko) * | 2017-08-17 | 2020-06-30 | 가우디오랩 주식회사 | 앰비소닉 신호를 사용하는 오디오 신호 처리 방법 및 장치 |
JP6920144B2 (ja) * | 2017-09-07 | 2021-08-18 | 日本放送協会 | バイノーラル再生用の係数行列算出装置及びプログラム |
US10264386B1 (en) * | 2018-02-09 | 2019-04-16 | Google Llc | Directional emphasis in ambisonics |
CN113115157B (zh) * | 2021-04-13 | 2024-05-03 | 北京安声科技有限公司 | 耳机的主动降噪方法及装置、半入耳式主动降噪耳机 |
CN115938388A (zh) * | 2021-05-31 | 2023-04-07 | 华为技术有限公司 | 一种三维音频信号的处理方法和装置 |
CN117250604B (zh) * | 2023-11-17 | 2024-02-13 | 中国海洋大学 | 一种目标反射信号与浅海混响的分离方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06202700A (ja) * | 1991-04-25 | 1994-07-22 | Japan Radio Co Ltd | 音声符号化装置 |
JP2008535015A (ja) * | 2005-03-30 | 2008-08-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化および復号化 |
JP2008542807A (ja) * | 2005-05-25 | 2008-11-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチチャネル信号の予測符号化 |
JP2010525403A (ja) * | 2007-04-26 | 2010-07-22 | ドルビー インターナショナル アクチボラゲット | 出力信号の合成装置及び合成方法 |
JP2013507796A (ja) * | 2009-10-07 | 2013-03-04 | ザ・ユニバーシティ・オブ・シドニー | 記録された音場の再構築 |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2858512A1 (fr) | 2003-07-30 | 2005-02-04 | France Telecom | Procede et dispositif de traitement de donnees sonores en contexte ambiophonique |
GB0817950D0 (en) | 2008-10-01 | 2008-11-05 | Univ Southampton | Apparatus and method for sound reproduction |
US8391500B2 (en) | 2008-10-17 | 2013-03-05 | University Of Kentucky Research Foundation | Method and system for creating three-dimensional spatial audio |
KR101795015B1 (ko) * | 2010-03-26 | 2017-11-07 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치 |
NZ587483A (en) | 2010-08-20 | 2012-12-21 | Ind Res Ltd | Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2592846A1 (en) * | 2011-11-11 | 2013-05-15 | Thomson Licensing | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field |
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
EP2645748A1 (en) * | 2012-03-28 | 2013-10-02 | Thomson Licensing | Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal |
EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
KR102681514B1 (ko) * | 2012-07-16 | 2024-07-05 | 돌비 인터네셔널 에이비 | 오디오 재생을 위한 오디오 음장 표현을 렌더링하는 방법 및 장치 |
US9685163B2 (en) * | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
-
2013
- 2013-11-28 EP EP13306629.0A patent/EP2879408A1/en not_active Withdrawn
-
2014
- 2014-11-18 KR KR1020167014251A patent/KR102319904B1/ko active IP Right Grant
- 2014-11-18 CN CN201711438488.6A patent/CN107889045A/zh active Pending
- 2014-11-18 CN CN201711438504.1A patent/CN107995582A/zh active Pending
- 2014-11-18 JP JP2016534923A patent/JP6495910B2/ja active Active
- 2014-11-18 WO PCT/EP2014/074903 patent/WO2015078732A1/en active Application Filing
- 2014-11-18 EP EP14800035.9A patent/EP3075172B1/en active Active
- 2014-11-18 CN CN201480074092.6A patent/CN105981410B/zh active Active
- 2014-11-18 KR KR1020217034751A patent/KR102460817B1/ko active IP Right Grant
- 2014-11-18 EP EP17200258.6A patent/EP3313100B1/en active Active
- 2014-11-18 CN CN201711438479.7A patent/CN108093358A/zh active Pending
- 2014-11-18 US US15/039,887 patent/US9736608B2/en active Active
-
2017
- 2017-08-14 US US15/676,843 patent/US10244339B2/en active Active
-
2018
- 2018-05-08 HK HK18105960.5A patent/HK1246554A1/zh unknown
- 2018-06-11 HK HK18107560.5A patent/HK1248438A1/zh unknown
- 2018-07-04 HK HK18108667.5A patent/HK1249323A1/zh unknown
-
2019
- 2019-03-07 JP JP2019041597A patent/JP6707687B2/ja active Active
- 2019-03-14 US US16/353,891 patent/US10602293B2/en active Active
-
2020
- 2020-05-20 JP JP2020087853A patent/JP6980837B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06202700A (ja) * | 1991-04-25 | 1994-07-22 | Japan Radio Co Ltd | 音声符号化装置 |
JP2008535015A (ja) * | 2005-03-30 | 2008-08-28 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化および復号化 |
JP2008542807A (ja) * | 2005-05-25 | 2008-11-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | マルチチャネル信号の予測符号化 |
JP2010525403A (ja) * | 2007-04-26 | 2010-07-22 | ドルビー インターナショナル アクチボラゲット | 出力信号の合成装置及び合成方法 |
JP2013507796A (ja) * | 2009-10-07 | 2013-03-04 | ザ・ユニバーシティ・オブ・シドニー | 記録された音場の再構築 |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
JP2015520411A (ja) * | 2012-05-14 | 2015-07-16 | トムソン ライセンシングThomson Licensing | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
Non-Patent Citations (1)
Title |
---|
FILIPPO M.FAZI, ET AL.: "The ill-conditioning problem in Sound Field Reconstruction", CONVENTION PAPER PRESENTED AT THE 123RD CONVENTION, JPN6018040774, October 2007 (2007-10-01), pages 1 - 12, ISSN: 0003970536 * |
Also Published As
Publication number | Publication date |
---|---|
EP3075172B1 (en) | 2017-12-13 |
JP6980837B2 (ja) | 2021-12-15 |
WO2015078732A1 (en) | 2015-06-04 |
US10602293B2 (en) | 2020-03-24 |
EP2879408A1 (en) | 2015-06-03 |
HK1246554A1 (zh) | 2018-09-07 |
US10244339B2 (en) | 2019-03-26 |
HK1249323A1 (zh) | 2018-10-26 |
KR102460817B1 (ko) | 2022-10-31 |
EP3313100B1 (en) | 2021-02-24 |
CN107995582A (zh) | 2018-05-04 |
EP3075172A1 (en) | 2016-10-05 |
JP2019082741A (ja) | 2019-05-30 |
US9736608B2 (en) | 2017-08-15 |
US20170374485A1 (en) | 2017-12-28 |
CN105981410A (zh) | 2016-09-28 |
CN105981410B (zh) | 2018-01-02 |
HK1248438A1 (zh) | 2018-10-12 |
JP2020149062A (ja) | 2020-09-17 |
JP6707687B2 (ja) | 2020-06-10 |
CN107889045A (zh) | 2018-04-06 |
KR102319904B1 (ko) | 2021-11-02 |
KR20210132744A (ko) | 2021-11-04 |
US20170006401A1 (en) | 2017-01-05 |
CN108093358A (zh) | 2018-05-29 |
JP6495910B2 (ja) | 2019-04-03 |
KR20160090824A (ko) | 2016-08-01 |
EP3313100A1 (en) | 2018-04-25 |
US20190281400A1 (en) | 2019-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6495910B2 (ja) | 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置 | |
JP5921678B2 (ja) | 高次Ambisonics表現に含まれるサウンドオブジェクトの相対位置を変更する方法と装置 | |
RU2631023C2 (ru) | Матрицы оптимального микширования и использование декорреляторов при обработке пространственного звука | |
KR102207035B1 (ko) | 고차 앰비소닉 오디오 신호로부터 스테레오 라우드스피커 신호를 디코딩하기 위한 방법 및 장치 | |
BR112014013335A2 (pt) | aparelho e método para posicionamento de microfone com base em uma densidade de potência espacial | |
KR20180082461A (ko) | 파라메트릭 바이너럴 출력 시스템 및 방법을 위한 머리추적 | |
JP6106571B2 (ja) | 音源位置推定装置、方法及びプログラム | |
JP6087856B2 (ja) | 音場収音再生装置、システム、方法及びプログラム | |
Hollebon et al. | Experimental study of various methods for low frequency spatial audio reproduction over loudspeakers | |
Morgenstern et al. | Enhanced spatial analysis of room acoustics using acoustic multiple-input multiple-output (MIMO) systems | |
CN110637466B (zh) | 扬声器阵列与信号处理装置 | |
CN114287137A (zh) | 基于高斯分布和k最近邻算法的房间校准 | |
Gayer et al. | Ambisonics Encoding For Arbitrary Microphone Arrays Incorporating Residual Channels For Binaural Reproduction | |
Martinez et al. | Fast sound field reproduction in box-shaped rooms: Rigid walls case | |
JP2023049443A (ja) | 推定装置および推定方法 | |
KR20240142538A (ko) | 공간 오디오의 렌더링을 가능하게 하기 위한 장치, 방법, 및 컴퓨터 프로그램 | |
Yetkin et al. | On the Selection of Interpolation Points for Rational Krylov Methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171018 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180928 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190307 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6495910 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |