JP2015520411A - 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 - Google Patents
高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 Download PDFInfo
- Publication number
- JP2015520411A JP2015520411A JP2015511988A JP2015511988A JP2015520411A JP 2015520411 A JP2015520411 A JP 2015520411A JP 2015511988 A JP2015511988 A JP 2015511988A JP 2015511988 A JP2015511988 A JP 2015511988A JP 2015520411 A JP2015520411 A JP 2015520411A
- Authority
- JP
- Japan
- Prior art keywords
- hoa
- component
- signal
- dominant
- order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 230000008569 process Effects 0.000 claims abstract description 22
- 239000013598 vector Substances 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 12
- 230000001131 transforming effect Effects 0.000 claims description 7
- 230000001419 dependent effect Effects 0.000 claims description 5
- 238000009877 rendering Methods 0.000 claims description 5
- 238000009432 framing Methods 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 claims 1
- 235000009508 confectionery Nutrition 0.000 abstract description 2
- 238000007906 compression Methods 0.000 description 31
- 239000011159 matrix material Substances 0.000 description 31
- 230000006835 compression Effects 0.000 description 28
- 238000005070 sampling Methods 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 20
- 238000009499 grossing Methods 0.000 description 18
- 230000006837 decompression Effects 0.000 description 17
- 239000006185 dispersion Substances 0.000 description 13
- 230000014509 gene expression Effects 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 9
- 238000000354 decomposition reaction Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 3
- 238000004091 panning Methods 0.000 description 3
- 238000010845 search algorithm Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 238000012887 quadratic function Methods 0.000 description 2
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
- H04H20/89—Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- User Interface Of Digital Computer (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Separation Using Semi-Permeable Membranes (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
高次アンビソニックス(HOA)信号表現を圧縮する方法であって、
支配的な方向を推定するステップであって、前記支配的な方向は、エネルギが支配的なHOA信号成分の電力分布方向に依存する、ステップと、
前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解するステップであって、前記残留アンビエント成分は、前記HOA信号表現と前記支配的な方向信号の表現との間の差分を表す、ステップと、
前記残留アンビエント成分の次数を元の次数より減らすことにより、前記残留アンビエント成分を圧縮するステップと、
低次数化された前記残留アンビエント成分を、空間ドメインに変換するステップと、
変換された前記残留アンビエント成分と前記支配的な方向信号とを知覚的に符号化するステップと
を有する方法である。
実施の形態により解決される課題は、HOA信号表現の高い空間分解能を維持しつつHOA信号を圧縮することである。この課題は特許請求の範囲に記載されている方法により解決される。本願はそのような方法を利用する装置も開示する。
高次アンビソニックス(HOA)信号表現を圧縮する方法であって、
支配的な方向を推定するステップであって、前記支配的な方向は、エネルギが支配的なHOA信号成分の電力分布方向に依存する、ステップと、
前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解するステップであって、前記残留アンビエント成分は、前記HOA信号表現と前記支配的な方向信号の表現との間の差分を表す、ステップと、
前記残留アンビエント成分の次数を元の次数より減らすことにより、前記残留アンビエント成分を圧縮するステップと、
低次数化された前記残留アンビエント成分を、空間ドメインに変換するステップと、
変換された前記残留アンビエント成分と前記支配的な方向信号とを知覚的に符号化するステップと
を有する方法である。
高次アンビソニックス(HOA)信号表現を圧縮する方法であって、
支配的な方向を推定するステップであって、前記支配的な方向は、エネルギが支配的なHOA信号成分の電力分布方向に依存する、ステップと、
前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解するステップであって、前記残留アンビエント成分は、前記HOA信号表現と前記支配的な方向信号の表現との間の差分を表す、ステップと、
前記残留アンビエント成分の次数を元の次数より減らすことにより、前記残留アンビエント成分を圧縮するステップと、
低次数化された前記残留アンビエント成分を、空間ドメインに変換するステップと、
変換された前記残留アンビエント成分と前記支配的な方向信号とを知覚的にエンコードするステップとを有し、
知覚的にエンコードされた支配的な方向信号と、知覚的にエンコードされた変換された残留アンビエント成分とを、知覚的にデコードするステップと、
知覚的にデコードされた変換された残留アンビエント成分を逆変換し、HOAドメインの表現を取得するステップと、
逆変換された残留アンビエント成分について次数拡張の処理を実行し、元の次数のアンビエントHOA成分を取得するステップと、
知覚的にデコードされた支配的な方向信号と、前記方向情報と、前記元の次数のアンビエントHOA成分とを合成し、HOA信号表現を取得するステップと
を有する方法。
高次アンビソニックス(HOA)信号表現を圧縮する装置であって、
支配的な方向を推定するように形成された手段であって、前記支配的な方向は、エネルギが支配的なHOA信号成分の電力分布方向に依存する、手段と、
前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解するように形成された手段であって、前記残留アンビエント成分は、前記HOA信号表現と前記支配的な方向信号の表現との間の差分を表す、手段と、
前記残留アンビエント成分の次数を元の次数より減らすことにより、前記残留アンビエント成分を圧縮するように形成された手段と、
低次数化された前記残留アンビエント成分を、空間ドメインに変換するように形成された手段と、
変換された前記残留アンビエント成分と前記支配的な方向信号とを知覚的に符号化するように形成された手段と
を有する装置。
高次アンビソニックス(HOA)信号表現を圧縮する装置であって、
支配的な方向を推定するように形成された手段であって、前記支配的な方向は、エネルギが支配的なHOA信号成分の電力分布方向に依存する、手段と、
前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解するように形成された手段であって、前記残留アンビエント成分は、前記HOA信号表現と前記支配的な方向信号の表現との間の差分を表す、手段と、
前記残留アンビエント成分の次数を元の次数より減らすことにより、前記残留アンビエント成分を圧縮するように形成された手段と、
低次数化された前記残留アンビエント成分を、空間ドメインに変換するように形成された手段と、
変換された前記残留アンビエント成分と前記支配的な方向信号とを知覚的に符号化するように形成された手段とを有し、
知覚的にエンコードされた支配的な方向信号と、知覚的にエンコードされた変換された残留アンビエント成分とを、知覚的にデコードするように形成された手段と、
知覚的にデコードされた変換された残留アンビエント成分を逆変換し、HOAドメインの表現を取得するように形成された手段と、
逆変換された残留アンビエント成分について次数拡張の処理を実行し、元の次数のアンビエントHOA成分を取得するように形成された手段と、
知覚的にデコードされた支配的な方向信号と、前記方向情報と、前記元の次数のアンビエントHOA成分とを合成し、HOA信号表現を取得するように形成された手段と
を有する装置。
本発明による実施形態は添付図面を参照しながら説明される。
アンビソニックス信号は、球面調和(SH)展開を利用してソースフリー領域のサウンドフィールドを記述する。ソースフリー領域は、音源が特定されていない領域等と言及されてもよい。この理論の実現可能性は、音圧の時間及び空間的な振る舞いが本質的には波動方程式により決定されるという物理的性質に起因する。
アンビソニックスに関する詳細な説明を行うため、以下においては球面座標系又は極座標系が仮定され、空間内の点x=(r,θ,φ)Tは、半径r>0(すなわち、座標系の原点に至るまでの距離)と、原線又は極軸であるz軸に対してなす傾斜角θ∈[0,π]と、xy平面内でx軸から図った方位角φ∈[0,2π]とにより表現される。この球面座標系において、結合されたソースフリー領域(connected source-free area)における音圧p(t,x)の波動方程式は以下のように与えられる。
アンビソニックスの目的は、座標系の原点付近のサウンドフィールドを表現することである。一般性を失うことなく、対象の領域は、座標系の中心から半径Rの球又はボールであると仮定され、数学的には{x|0≦r≦R}という集合により指定される。この表現に関する重要な仮定は、このボールが如何なる音源も含んでいないと仮定されることである。「音源」は「サウンドソース」等と言及されてもよい。このボールの中の差ウドフィールドの表現を見出す問題は、「インテリア問題(interior problem)」又は「内部問題」と言及されてもよい(例えば、上記のウィリアムの書籍)。
座標系の原点を中心とする音源の無いボールの中のサウンドフィールドは、全ての可能な方向からボールに入射する様々な角波数kの平面波の無線級数の重ね合わせとして表現できる(この点については、例えば、上記のウィリアムスの書籍における「Plane-wave decomposition...」等を参照されたい)。Ω0の方向からの角波数kの平面波の複素振幅は、D(k,Ω0)により与えられると仮定すると、数式(11)及び数式(19)を用いて行った導出法と同様に、次数SH関数展開に関する対応するアンビソニックス係数は、次式のように与えられる。
スケール変更されたアンビソニックス係数cn m(k)及び振幅密度関数D(k,Ω)に、時間に関する逆フーリエ変換を適用すると、対応する時間領域の表現として次式が得られる。
実際には、座標系の原点付近のサウンドフィールドは、n≦Nである次数の有限個のアンビソニックス係数cn m(k)のみを利用して記述される。次式に従って打ち切られたSH関数の級数から振幅密度関数を計算することは、真の振幅密度関数D(k,Ω)に対して或る種の空間分散成分(spatial dispersion)を導入する(例えば、上記の文献の「Plane-wave decompression...」を参照されたい)。
数式(34)において、数式(20)の平面波に関するアンビソニックス係数が使用され、数式(35)及び数式(36)においていくつかの数学的理論が使用されている(例えば、上記の文献の「Plane-wave decompression...」を参照されたい)。数式(33)の性質は数式(14)を利用して示すことが可能である。
νN(Θ)=ST(Ω)S(Ω0) (47)
分散は時間領域では次のように等価的に表現可能である
或るアプリケーションの場合、有限数J個の離散的な方向Ωjにおける時間ドメインの振幅密度関数のサンプルから、スケーリングされた時間ドメインのアンビソニックス係数C~n m(t)を決定することが望ましい。数式(28)における積分は、次のように有限個の総和により近似される。
c~n m(t)=0 (51)
が成立することである。
ここで、Ψは次式により規定されるモード行列を示す。
数式(53)によれば、数式(52)が成立するのに必要な条件は、サンプリング点の数JがJ≧0を満たすことであることが、分かる。J個のサンプリング点における時間領域の振幅密度の値を次のようにベクトル形式にまとめ、
導入されたベクトル表記を利用すると、時間領域の振幅密度関数サンプルの値から、スケーリングされた時間領域のアンビソニックス係数を計算することは、次のように表現できる。
所定の固定されたアンビソニックス次数Nの場合、サンプリング条件の数式(52)が成り立つように、サンプリング点Ωjの個数J≧0及び対応するウェイトを計算することは、しばしば可能ではない。しかしながら、サンプリング条件が十分に近似されるようにサンプリング点が選択される場合、モード行列ΨのランクはOになり、条件の数は少なくなる。その場合、モード行列Ψの擬似的なインバースであるΨ+が存在し、
Ψ+:=(ΨΨH)-1ΨΨH (60)
時間領域の振幅密度関数サンプルのベクトルから、スケーリングされた時間領域のアンビソニックス係数ベクトルc(t)の妥当な近似は、
c(t)≒Ψ+w(t) (61)
により与えられる。J=0でありかつモード行列のランクがOであった場合、擬似的なインバースは、次式が成立するので、そのインバースに一致する。
更に、サンプリング条件の数式(52)が満たされる場合、
Ψ-H=ΨG (63)
が成立し、近似的な数式(59)及び(61)は等価であり一致する。
本発明は、所与のHOA信号表現の圧縮に関連する。上述したように、HOA信号表現は、時間ドメインにおける所定数の支配的方向信号とHOAドメインにおけるアンビエント成分とに分解され、その後に低次数化によりアンビエント成分のHOA表現を圧縮する処理が続く。この処理は、テストを監視することを前提とし、周辺のサウンドフィールド成分は、低次のHOA表現で十分に正確に表現可能であるという仮定を活用する。支配的な方向の信号を抽出することで、圧縮及びそれに対応する圧縮解除の処理の後に、高い空間分解能を維持することを保証できる。
_通常の時間ドメイン方向信号X(l)は、何らかの既知の知覚的圧縮技術を利用して、知覚的コーダ27において個別的に圧縮されることが可能である。
図3には、受信又は再生される信号についての圧縮解除処理が示されている。圧縮処理の場合と同様に、2つのステップが含まれている。
本発明の実施形態により解決される課題は、HOA表現に対する既存の圧縮方法と比較してデータレートの顕著な減少を図ることである。以下、圧縮されていないHOA表現に対する達成可能な圧縮率を議論する。圧縮率は、次数がNである非圧縮HOA信号C(l)を伝送するのに必要なデータレートと、圧縮された信号表現を伝送するのに必要なデータレートとの比率から得られ、圧縮された信号表現は、D個の知覚的に符号化された方向信号X(l)及び対応する方向情報ΩDOM(l)バーとアンビエントHOA成分を表現するNRED個の知覚的に符号化された空間ドメイン信号WA,RED(l)とを有する。
背景技術で説明したように、特許文献1で説明されている空間ドメイン信号の知覚的圧縮は、信号同士の間の残存する相互相関の影響を被り、知覚的符号化ノイズの露呈(unmasking)を招いてしまうことが懸念される。本発明によれば、支配的な方向の信号が、先ず、知覚的に符号化される前にHOAサウンドフィールド表現から取り出される。これは、HOA表現を構築する場合に、知覚的な復号化の後に、符号化ノイズが、その方向信号と厳密に一致する空間的な指向性を有することを意味する。特に、符号化ノイズだけでなく指向性信号の任意の方向に対する影響が、有限次数の空間分解能の箇所で説明したように空間分散関数により決定論的に記述される。言い換えれば、任意の時点において、符号化ノイズを表現するHOA係数ベクトルは、方向信号を表現するHOA係数ベクトルを正確に何倍かしたものである。このため、ノイズを含むHOA係数の任意の重み付け加算は、知覚的符号化ノイズの如何なる露呈も招かなくなる。
本発明による方向推定は、エネルギが支配的なHOA成分の電力指向性分布に依存している。電力指向性分布(directional power distribution)は、HOA表現に関するランクが削減された相関行列から計算され、これはHOA表現の相関行列の固有値分解から得られる。上記の書籍の「Plane-wave decomposition...」で使用されている方向推定と比較すると、本実施形態は高精度である利点をもたらすが、その理由は、方向推定に関して全てのHOA表現を利用するのではなく、エネルギの観点から支配的なHOA成分に着目することにより、電力指向方向の空間的な不明瞭化を減らすことができるからである。
HOA表現を、複数の方向信号及び関連する方向情報とHOAドメインのアンビエント成分とに分解する技術は、Pulkkiの文献の「Spatial Sound Reproduction with Directional Audio Coding」に示されている方法に従って、HOA表現の信号適応DirACライクレンダリング(signal-adaptive DirAC like rendering)に使用可能である。
<入力フォーマットの決定>
入力として、数式(26)で決定されたスケーリングされた時間領域HOA係数c~n m(t)が、レートfs=1/Tsでサンプリングされると仮定する。ベクトルc(j)は、サンプリング時間tがt=jTs、j∈Zに属する全ての係数により形成されるように定義される:
スケーリングされたHOA係数の到来ベクトルc(j)は、フレーム化ステップ又はステージ21において、次式のように長さがBのオーバーラップ(又は重複)しないフレーム群にフレーム化される:
支配的な方向を推定するため、次のような相関行列が算出される:
B(l)=V(l)Λ(l)VT(l) (68)
に従って実行され、ここで、行列V(l)は次式のように固有値ベクトルvi(l)(1≦i≦O)により形成される:
λ1(l)≧λ2(l)≧・・・≧λO(l) (71)
そして、支配的な固有値のインデックス群{1,...,I^(l)}が求められる。これを行う可能な方法の1つは、ブロードバンド指向方向電力とアンビエント電力との比率の所望の最小値DARMINを計算し、次式に従ってI^(l)を決定することである:
そして、次式のようなベクトルが算出される:
(a)
現在の支配的な方向ΩCURRDOM,d~(l)(1≦d~≦D^(l))は、先行するフレームにより、平滑化方向ΩDOM,d(l)バー(1≦d≦D)に割り当てられる。割り当て関数fA,l:{1,...,D~(l)}→{1,...,D}は、次式のように、割り当てられた方向同士の間の角度の合計が最小化されるように決定される:
平滑化方向ΩDOM,d(l)バー(1≦d≦D)はステップ(a)を用いて算出される。平滑化又はスムージングは、ユークリッド幾何学よりもむしろ球面幾何学に基づく。現在の支配的な方向ΩCURRDOM,d~(l)(1≦d~≦D^(l))の各々に関し、平滑化は、球面上の2点を通る大円の部分的な円弧に沿って実行され、それらはΩCURRDOM,d~(l)及びΩCURRDOM,d~(l-1)バーにより指定される。具体的には、平滑化因子αΩと共に指数的に重み付けされる移動平均を計算することにより、方位角及び傾斜角は独立に平滑化される。傾斜角に関し、これは次のような平滑化処理を行うことになる:
方向信号の計算は、モードマッチング(mode matching)に基づく。特に、方向信号を探す探索が行われ、その方向信号のHOA表現は所与のHOA信号の最良の近似をもたらすものである。連続するフレームの間の方向の変化は、方向信号の不連続性を招く場合があるので、オーバーラップするフレームの方向信号の推定計算を実行した後に、適切なウィンドウ関数を利用して、連続するオーバーラップするフレームの結果を平滑化する。しかしながら、平滑化(スムージング)は、1フレームの遅延を招く。
ΞACT(l)XINST,ACT(l)-[C(l-1) C(l)] (97)
のような誤差のユークリッドノルムを最小化するように算出される。その解は次式により与えられる:
xINST,WIN,d(l,j):=xINST,d(l,j)・w(j), 1≦j≦2B (99)
ウィンドウ関数の具体例は、次式に示すような周期的なハミングウィンドウにより与えられる:
xd((l-1)B+j)=xINST,WIN,d(l-1,B+j)+xINST,d(l,j) (101)
(l-1)番目のフレームに対する全ての平滑化された方向信号のサンプルは、次式のように、行列X(l-1)に配置される:
アンビエントHOA成分CA(l-1)は、次式のように、全体のHOA表現C(l-1)から、全体の方向性HOA成分CDIR(l-1)を減算することにより得られる:
CA(l-1)は成分で表現すると次式のようになり、
球面調和変換は、低次数化されたアンビエントHOA成分CA,RED(l)にモード行列のインバースを乗算することで実行される:
WA,RED(l)=(ΞA)-1CA,RED(l) (111)
である。
<逆球面調和変換>
知覚的な圧縮解除が施された空間ドメイン信号W^A,RED(l)は、次式のように、逆球面調和変換により、次数がNREDであるHOAドメイン表現C^A,RED(l)に変換される:
HOA表現C^A,RED(l)のアンビソニックス次数は、次式に従って0(ゼロ)を付加することにより、Nに拡大される:
最終的な圧縮解除されたHOA係数は、次式のように、指向性成分及びアンビエントHOA成分の加算により算出される:
以下、<支配的な方向の推定>の説明箇所で言及した方向探索アルゴリズムに関する事項を説明する。先ず、これは幾つかの仮定に基づいている。
HOA係数ベクトルc(j)は、一般に、次式のように時間領域の振幅密度関数d(j,Ω)に関連しており、
DAR(l)≧DARMIN (126)
である。
説明の便宜上、相関行列B(l)(数式(67))が、L-1個の先行するフレームのサンプルを考慮することなく、l番目のフレームのサンプルのみに基づいて算出される状況を考察する。この処理は、Lを1に設定すること(L=1)に相当する。従って、相関行列は次式のように表現できる:
Claims (9)
- 高次アンビソニックス(HOA)信号表現を圧縮する方法であって、
支配的な方向を推定するステップであって、前記支配的な方向は、エネルギが支配的なHOA信号成分の電力分布方向に依存する、ステップと、
前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解するステップであって、前記残留アンビエント成分は、前記HOA信号表現と前記支配的な方向信号の表現との間の差分を表す、ステップと、
前記残留アンビエント成分の次数を元の次数より減らすことにより、前記残留アンビエント成分を圧縮するステップと、
低次数化された前記残留アンビエント成分を、空間ドメインに変換するステップと、
変換された前記残留アンビエント成分と前記支配的な方向信号とを知覚的に符号化するステップと
を有する方法。 - 高次アンビソニックス(HOA)信号表現を圧縮する方法であって、
支配的な方向を推定するステップであって、前記支配的な方向は、エネルギが支配的なHOA信号成分の電力分布方向に依存する、ステップと、
前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解するステップであって、前記残留アンビエント成分は、前記HOA信号表現と前記支配的な方向信号の表現との間の差分を表す、ステップと、
前記残留アンビエント成分の次数を元の次数より減らすことにより、前記残留アンビエント成分を圧縮するステップと、
低次数化された前記残留アンビエント成分を、空間ドメインに変換するステップと、
変換された前記残留アンビエント成分と前記支配的な方向信号とを知覚的にエンコードするステップとを有し、
知覚的にエンコードされた支配的な方向信号と、知覚的にエンコードされた変換された残留アンビエント成分とを、知覚的にデコードするステップと、
知覚的にデコードされた変換された残留アンビエント成分を逆変換し、HOAドメインの表現を取得するステップと、
逆変換された残留アンビエント成分について次数拡張の処理を実行し、元の次数のアンビエントHOA成分を取得するステップと、
知覚的にデコードされた支配的な方向信号と、前記方向情報と、前記元の次数のアンビエントHOA成分とを合成し、HOA信号表現を取得するステップと
を有する方法。 - 高次アンビソニックス(HOA)信号表現を圧縮する装置であって、
支配的な方向を推定するように形成された手段であって、前記支配的な方向は、エネルギが支配的なHOA信号成分の電力分布方向に依存する、手段と、
前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解するように形成された手段であって、前記残留アンビエント成分は、前記HOA信号表現と前記支配的な方向信号の表現との間の差分を表す、手段と、
前記残留アンビエント成分の次数を元の次数より減らすことにより、前記残留アンビエント成分を圧縮するように形成された手段と、
低次数化された前記残留アンビエント成分を、空間ドメインに変換するように形成された手段と、
変換された前記残留アンビエント成分と前記支配的な方向信号とを知覚的に符号化するように形成された手段と
を有する装置。 - 高次アンビソニックス(HOA)信号表現を圧縮する装置であって、
支配的な方向を推定するように形成された手段であって、前記支配的な方向は、エネルギが支配的なHOA信号成分の電力分布方向に依存する、手段と、
前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解するように形成された手段であって、前記残留アンビエント成分は、前記HOA信号表現と前記支配的な方向信号の表現との間の差分を表す、手段と、
前記残留アンビエント成分の次数を元の次数より減らすことにより、前記残留アンビエント成分を圧縮するように形成された手段と、
低次数化された前記残留アンビエント成分を、空間ドメインに変換するように形成された手段と、
変換された前記残留アンビエント成分と前記支配的な方向信号とを知覚的に符号化するように形成された手段とを有し、
知覚的にエンコードされた支配的な方向信号と、知覚的にエンコードされた変換された残留アンビエント成分とを、知覚的にデコードするように形成された手段と、
知覚的にデコードされた変換された残留アンビエント成分を逆変換し、HOAドメインの表現を取得するように形成された手段と、
逆変換された残留アンビエント成分について次数拡張の処理を実行し、元の次数のアンビエントHOA成分を取得するように形成された手段と、
知覚的にデコードされた支配的な方向信号と、前記方向情報と、前記元の次数のアンビエントHOA成分とを合成し、HOA信号表現を取得するように形成された手段と
を有する装置。 - HOA係数の到来ベクトルをオーバーラップしないフレームにするフレーム化処理が行われ、フレームの持続時間は25msである、請求項1に記載の方法又は請求項3に記載の装置。
- 現在のフレーム各々に関し、隣接するフレームの内容が考慮されるように、前記支配的な方向の推定は、長くオーバーラップするフレーム群に依存する、請求項1又は5に記載の方法又は請求項3又は5に記載の装置。
- 前記支配的な方向信号及び変換されたアンビエント成分が共に知覚的に圧縮される、請求項1、5又は6に記載の方法又は請求項3、5又は6に記載の装置。
- 前記HOA信号成分を、時間ドメインにおける複数の支配的な方向信号及び関連する方向情報と、HOAドメインにおける残留アンビエント成分とに分解する処理が、前記HOA信号表現の信号適応DirAC的なレンダリングに使用され、DirACはPulkki等による指向性オーディオコーディングを意味する、請求項1、5〜7のうちの何れか1項に記載の方法又は請求項3、5〜7のうちの何れか1項に記載の装置。
- 請求項1、5〜8のうちの何れか1項に記載の方法に従って圧縮されたHOA信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12305537.8A EP2665208A1 (en) | 2012-05-14 | 2012-05-14 | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP12305537.8 | 2012-05-14 | ||
PCT/EP2013/059363 WO2013171083A1 (en) | 2012-05-14 | 2013-05-06 | Method and apparatus for compressing and decompressing a higher order ambisonics signal representation |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017174629A Division JP6500065B2 (ja) | 2012-05-14 | 2017-09-12 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015520411A true JP2015520411A (ja) | 2015-07-16 |
JP2015520411A5 JP2015520411A5 (ja) | 2016-06-09 |
JP6211069B2 JP6211069B2 (ja) | 2017-10-11 |
Family
ID=48430722
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015511988A Active JP6211069B2 (ja) | 2012-05-14 | 2013-05-06 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2017174629A Active JP6500065B2 (ja) | 2012-05-14 | 2017-09-12 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2019049327A Active JP6698903B2 (ja) | 2012-05-14 | 2019-03-18 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2020078865A Active JP7090119B2 (ja) | 2012-05-14 | 2020-04-28 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2022095120A Active JP7471344B2 (ja) | 2012-05-14 | 2022-06-13 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017174629A Active JP6500065B2 (ja) | 2012-05-14 | 2017-09-12 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2019049327A Active JP6698903B2 (ja) | 2012-05-14 | 2019-03-18 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2020078865A Active JP7090119B2 (ja) | 2012-05-14 | 2020-04-28 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2022095120A Active JP7471344B2 (ja) | 2012-05-14 | 2022-06-13 | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
Country Status (10)
Country | Link |
---|---|
US (6) | US9454971B2 (ja) |
EP (5) | EP2665208A1 (ja) |
JP (5) | JP6211069B2 (ja) |
KR (6) | KR102231498B1 (ja) |
CN (10) | CN104285390B (ja) |
AU (5) | AU2013261933B2 (ja) |
BR (1) | BR112014028439B1 (ja) |
HK (1) | HK1208569A1 (ja) |
TW (6) | TWI725419B (ja) |
WO (1) | WO2013171083A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017501440A (ja) * | 2013-11-28 | 2017-01-12 | ドルビー・インターナショナル・アーベー | 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置 |
JP2017513053A (ja) * | 2014-03-21 | 2017-05-25 | クアルコム,インコーポレイテッド | 音場の記述へのオーディオチャンネルの挿入 |
JP2018025808A (ja) * | 2012-05-14 | 2018-02-15 | ドルビー・インターナショナル・アーベー | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2020074008A (ja) * | 2012-12-12 | 2020-05-14 | ドルビー・インターナショナル・アーベー | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2738962A1 (en) | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
EP2765791A1 (en) | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9883312B2 (en) | 2013-05-29 | 2018-01-30 | Qualcomm Incorporated | Transformed higher order ambisonics audio data |
US20150127354A1 (en) * | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
EP4089675A1 (en) * | 2014-01-08 | 2022-11-16 | Dolby International AB | Method and apparatus for improving the coding of side information required for coding a higher order ambisonics representation of a sound field |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
JP6243060B2 (ja) | 2014-03-21 | 2017-12-06 | ドルビー・インターナショナル・アーベー | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
KR102201726B1 (ko) | 2014-03-21 | 2021-01-12 | 돌비 인터네셔널 에이비 | 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치 |
CN109087653B (zh) * | 2014-03-24 | 2023-09-15 | 杜比国际公司 | 对高阶高保真立体声信号应用动态范围压缩的方法和设备 |
WO2015145782A1 (en) * | 2014-03-26 | 2015-10-01 | Panasonic Corporation | Apparatus and method for surround audio signal processing |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US10134403B2 (en) * | 2014-05-16 | 2018-11-20 | Qualcomm Incorporated | Crossfading between higher order ambisonic signals |
US9620137B2 (en) * | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
CN107077852B (zh) | 2014-06-27 | 2020-12-04 | 杜比国际公司 | 包括与hoa数据帧表示的特定数据帧的通道信号关联的非差分增益值的编码hoa数据帧表示 |
CN106471822B (zh) * | 2014-06-27 | 2019-10-25 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的设备 |
EP2960903A1 (en) | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
KR20240047489A (ko) | 2014-06-27 | 2024-04-12 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 방법 |
EP2963949A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
CN106463132B (zh) * | 2014-07-02 | 2021-02-02 | 杜比国际公司 | 对压缩的hoa表示编码和解码的方法和装置 |
US9800986B2 (en) | 2014-07-02 | 2017-10-24 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
EP2963948A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
CN106471579B (zh) * | 2014-07-02 | 2020-12-18 | 杜比国际公司 | 用于对hoa信号表示的子带内的主导方向信号的方向进行编码/解码的方法和装置 |
US9838819B2 (en) | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
EP3165007B1 (en) | 2014-07-03 | 2018-04-25 | Dolby Laboratories Licensing Corporation | Auxiliary augmentation of soundfields |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
EP3007167A1 (en) * | 2014-10-10 | 2016-04-13 | Thomson Licensing | Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field |
EP3073488A1 (en) * | 2015-03-24 | 2016-09-28 | Thomson Licensing | Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field |
WO2017017262A1 (en) | 2015-07-30 | 2017-02-02 | Dolby International Ab | Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation |
EP3345409B1 (en) | 2015-08-31 | 2021-11-17 | Dolby International AB | Method for frame-wise combined decoding and rendering of a compressed hoa signal and apparatus for frame-wise combined decoding and rendering of a compressed hoa signal |
IL276591B2 (en) * | 2015-10-08 | 2023-09-01 | Dolby Int Ab | Layered coding for voice or compressed sound field representations |
US9959880B2 (en) * | 2015-10-14 | 2018-05-01 | Qualcomm Incorporated | Coding higher-order ambisonic coefficients during multiple transitions |
MY188581A (en) * | 2015-11-17 | 2021-12-22 | Dolby Laboratories Licensing Corp | Headtracking for parametric binaural output system and method |
US20180338212A1 (en) * | 2017-05-18 | 2018-11-22 | Qualcomm Incorporated | Layered intermediate compression for higher order ambisonic audio data |
US10657974B2 (en) * | 2017-12-21 | 2020-05-19 | Qualcomm Incorporated | Priority information for higher order ambisonic audio data |
US10595146B2 (en) | 2017-12-21 | 2020-03-17 | Verizon Patent And Licensing Inc. | Methods and systems for extracting location-diffused ambient sound from a real-world scene |
JP6652990B2 (ja) * | 2018-07-20 | 2020-02-26 | パナソニック株式会社 | サラウンドオーディオ信号処理のための装置及び方法 |
CN110211038A (zh) * | 2019-04-29 | 2019-09-06 | 南京航空航天大学 | 基于dirac残差深度神经网络的超分辨率重建方法 |
CN113449255B (zh) * | 2021-06-15 | 2022-11-11 | 电子科技大学 | 一种改进的稀疏约束下环境分量相位角估计方法、设备及存储介质 |
CN115881140A (zh) * | 2021-09-29 | 2023-03-31 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序产品 |
CN115096428B (zh) * | 2022-06-21 | 2023-01-24 | 天津大学 | 一种声场重建方法、装置、计算机设备和存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133366A (ja) * | 2010-12-21 | 2012-07-12 | Thomson Licensing | 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置 |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100206333B1 (ko) * | 1996-10-08 | 1999-07-01 | 윤종용 | 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법 |
DE69835521T2 (de) * | 1997-05-19 | 2007-01-18 | Verance Corp., San Diego | Vorrichtung und verfahren für die einbettung und wiedergewinnung von informationen in analogen signalen mit verwendung der verteilten signalmerkmale |
FR2779951B1 (fr) | 1998-06-19 | 2004-05-21 | Oreal | Composition tinctoriale contenant une pyrazolo-[1,5-a]- pyrimidine a titre de base d'oxydation et un coupleur naphtalenique, et procedes de teinture |
US7231054B1 (en) * | 1999-09-24 | 2007-06-12 | Creative Technology Ltd | Method and apparatus for three-dimensional audio display |
US6763623B2 (en) * | 2002-08-07 | 2004-07-20 | Grafoplast S.P.A. | Printed rigid multiple tags, printable with a thermal transfer printer for marking of electrotechnical and electronic elements |
KR20050075510A (ko) * | 2004-01-15 | 2005-07-21 | 삼성전자주식회사 | 통신 단말기를 위한 3차원 입체음향의 재생/저장 장치 및방법 |
US7688989B2 (en) * | 2004-03-11 | 2010-03-30 | Pss Belgium N.V. | Method and system for processing sound signals for a surround left channel and a surround right channel |
CN1677490A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
ATE527833T1 (de) * | 2006-05-04 | 2011-10-15 | Lg Electronics Inc | Verbesserung von stereo-audiosignalen mittels neuabmischung |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US8712061B2 (en) * | 2006-05-17 | 2014-04-29 | Creative Technology Ltd | Phase-amplitude 3-D stereo encoder and decoder |
DE102006047197B3 (de) * | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
US7558685B2 (en) * | 2006-11-29 | 2009-07-07 | Samplify Systems, Inc. | Frequency resolution using compression |
KR100913092B1 (ko) * | 2006-12-01 | 2009-08-21 | 엘지전자 주식회사 | 믹스신호의 인터페이스 표시 방법 및 장치 |
CN101206860A (zh) * | 2006-12-20 | 2008-06-25 | 华为技术有限公司 | 一种可分层音频编解码方法及装置 |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
US20090043577A1 (en) * | 2007-08-10 | 2009-02-12 | Ditech Networks, Inc. | Signal presence detection using bi-directional communication data |
CN101939782B (zh) * | 2007-08-27 | 2012-12-05 | 爱立信电话股份有限公司 | 噪声填充与带宽扩展之间的自适应过渡频率 |
GB2467668B (en) * | 2007-10-03 | 2011-12-07 | Creative Tech Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
GB2467247B (en) * | 2007-10-04 | 2012-02-29 | Creative Tech Ltd | Phase-amplitude 3-D stereo encoder and decoder |
WO2009067741A1 (en) * | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
JP5328804B2 (ja) * | 2007-12-21 | 2013-10-30 | フランス・テレコム | 適応型ウィンドウを有する変換ベースの符号化/復号化 |
CN101202043B (zh) * | 2007-12-28 | 2011-06-15 | 清华大学 | 音频信号的编码方法和装置与解码方法和装置 |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
BRPI0907508B1 (pt) * | 2008-02-14 | 2020-09-15 | Dolby Laboratories Licensing Corporation | Método, sistema e método para modificar uma entrada estéreo que inclui sinais de entrada esquerdo e direito |
US8812309B2 (en) * | 2008-03-18 | 2014-08-19 | Qualcomm Incorporated | Methods and apparatus for suppressing ambient noise using multiple audio signals |
US8611554B2 (en) * | 2008-04-22 | 2013-12-17 | Bose Corporation | Hearing assistance apparatus |
ES2401487T3 (es) * | 2008-07-11 | 2013-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
PL2154677T3 (pl) * | 2008-08-13 | 2013-12-31 | Fraunhofer Ges Forschung | Urządzenie do wyznaczania konwertowanego przestrzennego sygnału audio |
US8964994B2 (en) * | 2008-12-15 | 2015-02-24 | Orange | Encoding of multichannel digital audio signals |
WO2010076460A1 (fr) * | 2008-12-15 | 2010-07-08 | France Telecom | Codage perfectionne de signaux audionumériques multicanaux |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
CN101770777B (zh) * | 2008-12-31 | 2012-04-25 | 华为技术有限公司 | 一种线性预测编码频带扩展方法、装置和编解码系统 |
GB2476747B (en) * | 2009-02-04 | 2011-12-21 | Richard Furse | Sound system |
KR101410575B1 (ko) * | 2010-02-24 | 2014-06-23 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 강화 다운믹스 신호를 생성하는 장치, 강화 다운믹스 신호를 생성하는 방법 및 컴퓨터 프로그램 |
WO2011104463A1 (fr) * | 2010-02-26 | 2011-09-01 | France Telecom | Compression de flux audio multicanal |
CN102823277B (zh) * | 2010-03-26 | 2015-07-15 | 汤姆森特许公司 | 解码用于音频回放的音频声场表示的方法和装置 |
US20120029912A1 (en) * | 2010-07-27 | 2012-02-02 | Voice Muffler Corporation | Hands-free Active Noise Canceling Device |
NZ587483A (en) * | 2010-08-20 | 2012-12-21 | Ind Res Ltd | Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
EP2451196A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
FR2969804A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Filtrage perfectionne dans le domaine transforme. |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9288603B2 (en) * | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
EP2733963A1 (en) * | 2012-11-14 | 2014-05-21 | Thomson Licensing | Method and apparatus for facilitating listening to a sound signal for matrixed sound signals |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
KR102031826B1 (ko) * | 2013-01-16 | 2019-10-15 | 돌비 인터네셔널 에이비 | Hoa 라우드니스 레벨을 측정하기 위한 방법 및 hoa 라우드니스 레벨을 측정하기 위한 장치 |
EP2765791A1 (en) * | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
US9959875B2 (en) * | 2013-03-01 | 2018-05-01 | Qualcomm Incorporated | Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams |
EP2782094A1 (en) * | 2013-03-22 | 2014-09-24 | Thomson Licensing | Method and apparatus for enhancing directivity of a 1st order Ambisonics signal |
US9883312B2 (en) * | 2013-05-29 | 2018-01-30 | Qualcomm Incorporated | Transformed higher order ambisonics audio data |
EP2824661A1 (en) * | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
KR101480474B1 (ko) * | 2013-10-08 | 2015-01-09 | 엘지전자 주식회사 | 오디오 재생장치와 이를 포함하는 시스템 |
EP3073488A1 (en) * | 2015-03-24 | 2016-09-28 | Thomson Licensing | Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field |
US10796704B2 (en) * | 2018-08-17 | 2020-10-06 | Dts, Inc. | Spatial audio signal decoder |
US11429340B2 (en) * | 2019-07-03 | 2022-08-30 | Qualcomm Incorporated | Audio capture and rendering for extended reality experiences |
-
2012
- 2012-05-14 EP EP12305537.8A patent/EP2665208A1/en not_active Withdrawn
-
2013
- 2013-05-03 TW TW108114778A patent/TWI725419B/zh active
- 2013-05-03 TW TW110112090A patent/TWI823073B/zh active
- 2013-05-03 TW TW106146055A patent/TWI634546B/zh active
- 2013-05-03 TW TW107119510A patent/TWI666627B/zh active
- 2013-05-03 TW TW102115828A patent/TWI600005B/zh active
- 2013-05-03 TW TW106122256A patent/TWI618049B/zh active
- 2013-05-06 EP EP23168515.7A patent/EP4246511A3/en active Pending
- 2013-05-06 CN CN201380025029.9A patent/CN104285390B/zh active Active
- 2013-05-06 CN CN201710354502.8A patent/CN106971738B/zh active Active
- 2013-05-06 CN CN201710350511.XA patent/CN107017002B/zh active Active
- 2013-05-06 EP EP13722362.4A patent/EP2850753B1/en active Active
- 2013-05-06 KR KR1020207016239A patent/KR102231498B1/ko active IP Right Grant
- 2013-05-06 KR KR1020217008100A patent/KR102427245B1/ko active IP Right Grant
- 2013-05-06 AU AU2013261933A patent/AU2013261933B2/en active Active
- 2013-05-06 CN CN202310171516.1A patent/CN116229995A/zh active Pending
- 2013-05-06 CN CN202110183761.5A patent/CN112712810B/zh active Active
- 2013-05-06 BR BR112014028439-3A patent/BR112014028439B1/pt active IP Right Grant
- 2013-05-06 KR KR1020227026008A patent/KR102526449B1/ko active IP Right Grant
- 2013-05-06 CN CN202110183877.9A patent/CN112735447B/zh active Active
- 2013-05-06 EP EP19175884.6A patent/EP3564952B1/en active Active
- 2013-05-06 WO PCT/EP2013/059363 patent/WO2013171083A1/en active Application Filing
- 2013-05-06 US US14/400,039 patent/US9454971B2/en active Active
- 2013-05-06 EP EP21214985.0A patent/EP4012703B1/en active Active
- 2013-05-06 CN CN201710350513.9A patent/CN107180638B/zh active Active
- 2013-05-06 KR KR1020147031645A patent/KR102121939B1/ko active IP Right Grant
- 2013-05-06 KR KR1020237013799A patent/KR102651455B1/ko active IP Right Grant
- 2013-05-06 CN CN202310181331.9A patent/CN116312573A/zh active Pending
- 2013-05-06 CN CN201710350455.XA patent/CN107170458B/zh active Active
- 2013-05-06 JP JP2015511988A patent/JP6211069B2/ja active Active
- 2013-05-06 KR KR1020247009545A patent/KR20240045340A/ko active Search and Examination
- 2013-05-06 CN CN201710350454.5A patent/CN107180637B/zh active Active
-
2015
- 2015-09-17 HK HK15109104.7A patent/HK1208569A1/xx unknown
-
2016
- 2016-07-27 US US15/221,354 patent/US9980073B2/en active Active
- 2016-11-25 AU AU2016262783A patent/AU2016262783B2/en active Active
-
2017
- 2017-09-12 JP JP2017174629A patent/JP6500065B2/ja active Active
-
2018
- 2018-03-21 US US15/927,985 patent/US10390164B2/en active Active
-
2019
- 2019-03-05 AU AU2019201490A patent/AU2019201490B2/en active Active
- 2019-03-18 JP JP2019049327A patent/JP6698903B2/ja active Active
- 2019-07-01 US US16/458,526 patent/US11234091B2/en active Active
-
2020
- 2020-04-28 JP JP2020078865A patent/JP7090119B2/ja active Active
-
2021
- 2021-06-09 AU AU2021203791A patent/AU2021203791B2/en active Active
- 2021-12-10 US US17/548,485 patent/US11792591B2/en active Active
-
2022
- 2022-06-13 JP JP2022095120A patent/JP7471344B2/ja active Active
- 2022-08-08 AU AU2022215160A patent/AU2022215160A1/en active Pending
-
2023
- 2023-10-16 US US18/487,280 patent/US20240147173A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133366A (ja) * | 2010-12-21 | 2012-07-12 | Thomson Licensing | 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020144384A (ja) * | 2012-05-14 | 2020-09-10 | ドルビー・インターナショナル・アーベー | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP7471344B2 (ja) | 2012-05-14 | 2024-04-19 | ドルビー・インターナショナル・アーベー | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
US11792591B2 (en) | 2012-05-14 | 2023-10-17 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order Ambisonics signal representation |
JP2022120119A (ja) * | 2012-05-14 | 2022-08-17 | ドルビー・インターナショナル・アーベー | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2019133175A (ja) * | 2012-05-14 | 2019-08-08 | ドルビー・インターナショナル・アーベー | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
US10390164B2 (en) | 2012-05-14 | 2019-08-20 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics signal representation |
JP7090119B2 (ja) | 2012-05-14 | 2022-06-23 | ドルビー・インターナショナル・アーベー | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
US11234091B2 (en) | 2012-05-14 | 2022-01-25 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
JP2018025808A (ja) * | 2012-05-14 | 2018-02-15 | ドルビー・インターナショナル・アーベー | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 |
JP2020074008A (ja) * | 2012-12-12 | 2020-05-14 | ドルビー・インターナショナル・アーベー | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
US11184730B2 (en) | 2012-12-12 | 2021-11-23 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
JP7100172B2 (ja) | 2012-12-12 | 2022-07-12 | ドルビー・インターナショナル・アーベー | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
US11546712B2 (en) | 2012-12-12 | 2023-01-03 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
JP7353427B2 (ja) | 2012-12-12 | 2023-09-29 | ドルビー・インターナショナル・アーベー | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2021107938A (ja) * | 2012-12-12 | 2021-07-29 | ドルビー・インターナショナル・アーベー | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2019082741A (ja) * | 2013-11-28 | 2019-05-30 | ドルビー・インターナショナル・アーベー | 特異値分解を用いる高次Ambisonics復号の方法と装置 |
JP2017501440A (ja) * | 2013-11-28 | 2017-01-12 | ドルビー・インターナショナル・アーベー | 特異値分解を用いる高次Ambisonics符号化と復号の方法と装置 |
JP2017513053A (ja) * | 2014-03-21 | 2017-05-25 | クアルコム,インコーポレイテッド | 音場の記述へのオーディオチャンネルの挿入 |
US10412522B2 (en) | 2014-03-21 | 2019-09-10 | Qualcomm Incorporated | Inserting audio channels into descriptions of soundfields |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6698903B2 (ja) | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 | |
JP2015520411A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20150513 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150513 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150515 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20151021 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160330 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160411 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160411 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20160603 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160610 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20160826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170801 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170912 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6211069 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |