JP6285458B2 - 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 - Google Patents
音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 Download PDFInfo
- Publication number
- JP6285458B2 JP6285458B2 JP2015546945A JP2015546945A JP6285458B2 JP 6285458 B2 JP6285458 B2 JP 6285458B2 JP 2015546945 A JP2015546945 A JP 2015546945A JP 2015546945 A JP2015546945 A JP 2015546945A JP 6285458 B2 JP6285458 B2 JP 6285458B2
- Authority
- JP
- Japan
- Prior art keywords
- hoa
- residual
- signal
- dominant
- directional signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 59
- 230000000875 corresponding effect Effects 0.000 claims description 46
- 238000007906 compression Methods 0.000 claims description 22
- 230000006835 compression Effects 0.000 claims description 19
- 230000005428 wave function Effects 0.000 claims description 19
- 230000006837 decompression Effects 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 16
- 238000009499 grossing Methods 0.000 claims description 12
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 230000003111 delayed effect Effects 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims description 9
- 230000002596 correlated effect Effects 0.000 claims description 5
- 239000004615 ingredient Substances 0.000 claims 16
- 241000287463 Phalacrocorax Species 0.000 claims 2
- 230000003796 beauty Effects 0.000 claims 2
- 239000003638 chemical reducing agent Substances 0.000 claims 2
- 230000008447 perception Effects 0.000 claims 2
- 235000021419 vinegar Nutrition 0.000 claims 1
- 239000000052 vinegar Substances 0.000 claims 1
- NTABMUJQZABQGD-UHFFFAOYSA-N dimethylindole red Chemical compound CC1(C)C2=CC=CC=C2N(C)\C1=C\C=C\C1=CC=[N+](CCCS([O-])(=O)=O)C2=CC=CC=C12 NTABMUJQZABQGD-UHFFFAOYSA-N 0.000 description 25
- 239000011159 matrix material Substances 0.000 description 16
- 238000000354 decomposition reaction Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 230000009466 transformation Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 230000009467 reduction Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 3
- 238000009877 rendering Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
- H04H20/89—Stereophonic broadcast systems using three or more audio channels, e.g. triphonic or quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Description
−HOA係数の現在の時間フレームから支配的な音源方向を推定するステップと、
−上記HOA係数および上記支配的な音源方向に依存して、上記HOA表現を時間領域内の支配的な方向性信号と残差のHOA成分とに分解するステップであって、上記残差のHOA成分を表現する均一なサンプリング方向において平面波関数を取得するために、上記残差のHOA成分が離散空間領域に変換され、上記平面波関数が上記支配的な方向性信号から予測されることによって、上記予測を記述するパラメータがもたらされ、対応する予測誤りが上記HOAの領域に再び変換される、上記分解するステップと、
−上記残差のHOA成分の現在の次数をより低い次数に低減するステップであって、結果として、低次元化された残差のHOA成分が得られる、上記低減するステップと、
−上記低次元化された残差のHOA成分を相関除去して対応する残差のHOA成分時間領域信号を取得するステップと、
−圧縮された支配的な方向性信号および圧縮された残差の成分信号を供給するように、上記支配的な方向性信号および上記残差のHOA成分時間領域信号を知覚符号化するステップと、を含む。
−HOA係数の現在の時間フレームから支配的な音源方向を推定するように構成された手段と、
−上記HOA係数および上記支配的な音源方向に依存して、上記HOA表現を時間領域内の支配的な方向性信号と残差のHOA成分とに分解するように構成された手段であって、上記残差のHOA成分を表現する均一なサンプリング方向で平面波関数を取得するために、上記残差のHOA成分が離散空間領域に変換され、上記平面波関数が上記支配的な方向性信号から予測されることによって、上記予測を記述するパラメータが供給され、対応する予測誤りが上記HOAの領域に再び変換される、上記手段と、
−上記残差のHOA成分の現在の次数をより低い次数に低減するように構成された手段であって、結果として、低次元化された残差のHOA成分が生成される、上記手段と、
−上記低次元化された残差のHOA成分を相関除去して、対応する残差のHOA成分時間領域信号を取得するように構成された手段と、
−圧縮された支配的な方向性信号および圧縮された残差の成分信号を供給するように、上記支配的な方向性信号および上記残差のHOA成分時間領域信号を知覚符号化するように構成された手段と、を含む。
−圧縮解除された支配的な方向性信号および空間領域内の残差のHOA成分を表現する圧縮解除された時間領域信号を供給するように、上記圧縮された支配的な方向性信号および上記圧縮された残差の成分信号を知覚復号するステップと、
−上記圧縮解除された時間領域信号を再相関させて、対応する低次元化された残差のHOA成分を取得するステップと、
−上記低次元化された残差のHOA成分の次数を当初の次数に拡張するステップであって、対応する圧縮解除された残差のHOA成分を供給する、上記拡張するステップと、
−上記圧縮解除された支配的な方向性信号と、上記当初の次数の圧縮解除された残差のHOA成分と、上記推定された支配的な音源方向と、上記予測を記述する上記パラメータとを使用して、HOA係数の対応する圧縮解除され、再合成されたフレームを合成するステップと、を含む。
−圧縮解除された支配的な方向性信号および空間領域内の残差のHOA成分を表現する圧縮解除された時間領域信号を供給するように、上記圧縮された支配的な方向性信号および上記圧縮された残差の成分信号を知覚復号するように構成された手段と、
−上記圧縮解除された時間領域信号を再相関させるように構成された手段であって、対応する低次元化された残差のHOA成分を取得する、上記手段と、
−上記低次元化された残差のHOA成分の次数を当初の次数に拡張するように構成された手段であって、対応する圧縮解除された残差のHOA成分を供給する、上記手段と、
−上記圧縮解除された支配的な方向性信号と、上記当初の次数の圧縮解除された残差のHOA成分と、上記推定された支配的な音源方向と、上記予測を記述する上記パラメータとを使用することによってHOA係数の対応する圧縮解除され、再合成されたフレームを合成するように構成された手段と、を含む。
本発明に係る圧縮処理は、図1aおよび図1bの各々に例示されたステップである2つの連続するステップを含む。個々の信号の正確な定義は、HOA分解および再合成の詳細な説明の項目に記載されている。長さBのHOA係数列の重複しない入力フレームD(k)を用いた圧縮のためのフレーム単位の処理が使用される。ここで、kは、フレームのインデックスを表す。フレームは、下記の式(1)に特定されたHOA係数列に関して規定される。
によって表される。ここで、添字Dは方向推定値の個数を表す。方向推定値は行列
に、下記のように配列されるものと仮定される。
に無効値を割り当てることによってこれを示すことができる。そして、
において推定された方向を利用して、HOA表現は、分解ステップまたはステージ12に
おいて最大の数Dの支配的な方向性信号XDIR(k−1)と、支配的な方向性信号からの残差のHOA成分の空間領域信号の予測を記述する幾らかのパラメータζ(k−1)と、予測誤りを表すアンビエントHOA成分DA(k−2)とに分解される。HOA分解の項目でこの分解についての詳細な説明を行う。
圧縮解除処理は図2aおよび図2bに示されている。圧縮処理の場合と同様に、圧縮解除処理は2つの連続したステップからなる。図2aにおいて、方向性信号
および残差のアンビエントHOA成分を表現する時間領域信号
の知覚圧縮解除が、知覚復号または知覚圧縮解除のステップまたはステージ21において行われる。結果として得られる知覚圧縮解除された時間領域信号
は次数NREDの残差の成分のHOA表現
を供給するために、再相関ステップまたはステージ22において再相関される。必要に応じて、この再相関は、ステップ/ステージ14に記載された2つの代替的な処理に対して記載されたのとは逆の手順で実行することができ、使用された相関解除方法に依存して送信あるいは格納されたパラメータα(k−2)が使用される。その後、次数拡張によって、次数拡張ステップまたはステージ23において、
から、次数Nの適切なHOA表現
が推定される。次数拡張は、対応する「零」値の列を
に付加することによって行われ、これにより、より高い次数に関し、HOA係数が零値を有するものと仮定する。
が対応する方向
および予測パラメータζ(k−1)とから、さらに、残差のアンビエントHOA成分
から、合成ステップまたはステージ24において再合成される。結果として、HOA係数の圧縮解除され再合成されたフレーム
となる。
および圧縮された時間領域信号
の知覚圧縮解除もまた、対応する方法で共に行われる。
HOA分解のために実行される処理を例示するブロック図が図3に与えられている。この処理を以下のように要約する。最初に、平滑化された支配的な方向性信号XDIR(k−1)は計算され、知覚圧縮のために出力される。次に、支配的な方向性信号のHOA表現DDIR(k−1)と当初のHOA表現D(k−1)との間の残差は、“Ο”個の数の方向性信号
によって表現される。これは、均一に分布した方向からの一般的な平面波と考えることができる。これらの方向性信号は、支配的な方向性信号XDIR(k−1)から予測される。ここで、予測パラメータζ(k−1)が出力される。最終的に、当初のHOA表現D(k−2)と支配的な方向性信号のHOA表現DDIR(k−1)との間の残差DA(k−2)が均一に分布した方向からの予測された方向性信号のHOA表現
と共に計算され、出力される。
HOA係数列の現在のフレームD(k)に対する
内の推定された音源方向からの、ステップまたはステージ30での瞬時支配的な方向信号の計算は、M.A.Poletti著、“Three−Dimensional Surround Sound Systems Based on Spehrical Harmonics(球面調和関数に基づく3次元サラウンド・サウンド・システム)”、アメリカ音響学会誌、53(11)、1004〜1025頁、2005年、に記載されたモード・マッチングに基づいている。特に、所与のHOA信号の最も良い近似となるHOA表現の方向性信号がサーチされる。
を明確に特定できるものと仮定する。
は、実数値の球面調和関数を示しており、これは、実数値の球面調和関数の定義の項目で定義されている。
が下記の式にしたがって計算され、これは、(k−1)番目およびk番目のフレームに対する全ての支配的な方向性信号の瞬時推定値を含む。
ステップまたはステージ31に関しては、方向性信号
についてのみ平滑化を説明する。その理由は、信号の他のタイプの平滑化は、完全に類似の方法で行うことができるからである。式(6)に従った行列
にサンプルが含まれる方向性信号の推定値
は、適切な窓関数w(l)によって窓を掛けられる。
XDIR(k−1)および
から、ステップまたはステージ32において、連続的な信号xDIR,d(l)に依存して、HOA合成のために行われる処理と同様の処理を真似るために、平滑化された支配的な方向性信号のHOA表現が計算される。連続するフレーム間の方向推定値の変化が不連続を生じさせることがあるため、長さ2Bの重複するフレームの瞬時HOA表現が再び計算され、連続して重複するフレームの結果が適切な窓関数を使用することによって平滑化される。よって、HOA表現DDIR(k−1)は、以下の式によって取得される。
DDIR(k−1)およびD(k−1)(すなわち、フレーム遅延381によって遅延されたD(k))から、均一なグリッド上の方向性信号による残差HOA表現がステップまたはステージ33で計算される。この処理の目的は、残差[D(k−2)D(k−1)]−[DDIR(k−2)DDIR(k−1)]を表すために、何らかの固定された、ほぼ均一に分布する方向
(グリッド方向とも称する)から到来する方向性信号(すなわち、一般的な平面波関数)を取得することにある。
およびXDIR(k−1)から、ステップまたはステージ34で均一なグリッド上の方向性信号が予測される。方向性信号からのグリッド方向
から構成される均一なグリッド上の方向性信号の予測は、平滑化の目的で、2つの連続したフレームに基づく、すなわち、(長さ2Bの)グリッド信号
の拡張されたフレームは、平滑化された支配的な方向性信号の拡張されたフレームから下記のように予測される。
に含まれる各グリッド信号
が
に含まれる支配的な方向性信号
に割り当てられる。この割り当ては、グリッド信号と全ての支配的な方向性信号との間の正規化された相互相関関数の計算に基づくことができる。特に、その支配的な方向性信号はグリッド信号に割り当てられ、これは正規化された相互相関関数の最も高い値をもたらすグリッド。この割り当ての結果は、ο番目のグリッド信号をfA,k−1(ο)番目の支配的な方向性信号に割り当てる割り当て関数
によって定式化することができる。
は、割り当てられた支配的な方向性信号
から予測される。予測されたグリッド信号
は、割り当てられた支配的な方向性信号
からの遅延およびスケーリングによって、以下のように計算することができる。
の(ステップ/ステージ36における)時間的平滑化されたバージョンである
と、D(k)の2フレーム遅延されたバージョンである(遅延381および383)D(k−2)と、DDIR(k−1)の1フレーム遅延されたバージョン(遅延382)であるDDIR(k−2)とから、残差のアンビエント音場成分のHOA表現がステップまたはステージ37において、下記の式によって計算される。
図4における個々のステップまたはステージの処理について詳細に説明する前に、概要について述べる。均一に分布した方向に対して方向性信号
は、予測パラメータ
を使用して、復号された支配的な方向性信号
から予測される。次に、支配的な方向性信号のHOA表現
と、予測された方向性信号のHOA表現
と、残差のアンビエントHOA成分
とから、全体のHOA表現
が合成される。
および
は、支配的な方向性信号のHOA表現を求めるために、ステップまたはステージ41に入力される。モード行列
および
をk番目および(k−1)番目のフレームに対するアクティブな音源の方向推定値に基づいて方向推定値
および
から計算した後、支配的な方向性信号
のHOA表現は、下記のように取得される。
および
は、支配的な方向性信号から均一なグリッド上の方向性信号を予測するため
に、ステップまたはステージ43に入力される。均一なグリッド上の予測された方向性信
号の拡張フレームは、下記の式に従って要素
から構成される。
均一なグリッド上の予測された方向性信号のHOA表現を計算するステップまたはステージ44において、予測されたグリッド方向性信号のHOA表現は、下記の式によって取得される。
(すなわち、フレーム遅延42によって遅延された
)と、
(ステップ/ステージ45において、
の時間的平滑化されたバージョン)と、
とから、ステップまたはステージ46において全体の音場表現が最終的に下記のように合成される。
高次アンビソニックスは注目されるコンパクトな領域内の音場の記述に基づいていており、音源が存在しないものと仮定される。その場合、注目領域内の時間tおよび位置xでの音圧p(t,x)の空間時間的な挙動は、均質媒質の波動方程式によって物理的に完全に求められる。以下の内容は、図5に示された球面座標システムに基づいている。x軸は、前方の位置を指し、y軸は、左側を指し、z軸は上方を指す。空間内の位置x=(r,θ,φ)Tは、半径r>0(すなわち、座標原点へ距離)、極軸zから測定される傾斜角θ∈[0,π]、さらに、x軸からの、x−y平面内で反時計周りに測定される、方位角φ∈[0,2π]によって表される。(・)Tは、転置を表す。
は、実数値の球面調和関数の定義の項目で定義されている次数nおよび位数mの実数値の球面調和関数を示している。展開係数
は、角波数kのみに依存する。なお、音圧は、空間的に帯域制限されているものと暗黙的に仮定されている。したがって、級数が次数インデックスnに対して上限Nで打ち切られ、これは、HOA表現の次数と呼ばれる。
は、
と下記の式によって関連する。
が角周波数ωの関数であると仮定すると、逆フーリエ変換(
によって示される)を適用することにより、各次数nおよび位数mに対し、下記の時間領域関数をもたらす。
の位置インデックスは、n(n+1)+1+mによって与えられる。
は、実数値であり、したがって、アンビソニックス係数は、実数値である。
実数値の球面調和関数
は、下記の式によって与えられる。
方向Ω0=(θ0,φ0)Tから到来する一般的な平面波関数x(t)は、下記の式によってHOAにおいて表現される。
は、下記の式によって与えられる。
平面波振幅の空間密度がΟ個の空間方向Ωo(1≦ο≦Οで離散化される場合、空間方向Ωoは単位球面上でほぼ均一に分布するのだが、Ο個の方向性信号d(t,Ωo)が取得される。これらの信号をベクトルにまとめると、下記の式で表され、
dSPAT(t)=ΨHd(t) (52)
ここで、(・)Hは、複素共役転置を示し、Ψは、下記の式によって定義されるモード行列を表す。
d(t)= Ψ-HdSPAT(t) (55)
双方の式は、アンビソニックス表現と空間領域との間の変換および逆変換を構成する。本願において、これらの変換は、球面調和関数変換および逆球面調和関数変換と呼ばれる。
いくつかの態様を記載しておく。
〔態様1〕
音場に対するHOAと称する高次アンビソニックス表現を圧縮する方法であって、
−HOA係数(D(k))の現在の時間フレームから支配的な音源方向(
)を推定するステップ(11)と、
−前記HOA係数(D(k))および前記支配的な音源方向(
)に依存して、前記HOA表現を時間領域内の支配的な方向性信号(X DIR (k−1))と残差のHOA成分(D A (k−2))とに分解するステップ(12)であって、該残差のHOA成分を表現する均一なサンプリング方向で平面波関数を取得するために前記残差のHOA成分が離散空間領域に変換され(33)、前記平面波関数が前記支配的な方向性信号(X DIR (k−1))から予測されること(34)によって、前記予測を記述するパラメータ(ζ(k−1))がもたらされ、対応する予測誤りが前記HOAの領域に再び変換される(35)、該ステップ(12)と、
−前記残差のHOA成分(D A (k−2))の現在の次数(N)をより低い次数(N RED )に低減するステップ(13)であって、結果として、低次元化された残差のHOA成分(D A,RED (k−2))が得られる、該ステップ(13)と、
−前記低次元化された残差のHOA成分(D A,RED (k−2)を相関除去して対応する残差のHOA成分時間領域信号(W A,RED (k−2))を取得するステップ(14)と、
−圧縮された支配的な方向性信号(
)および圧縮された残差の成分信号(
)を供給するように、前記支配的な方向性信号(X DIR (k−1))および前記残差のHOA成分時間領域信号(W A,RED (k−2))を知覚符号化するステップ(15)と、
を含む、前記方法。
〔態様2〕
音場に対するHOAと称する高次アンビソニックス表現を圧縮する装置であって、
−HOA係数(D(k))の現在の時間フレームから支配的な音源方向(
)を推定するように構成された手段(11)と、
−前記HOA係数(D(k))および前記支配的な音源方向(
)に依存して、前記HOA表現を時間領域内の支配的な方向性信号(X DIR (k−1))と残差のHOA成分(D A (k−2))とに分解するように構成された手段(12)であって、該残差のHOA成分を表現する均一なサンプリング方向で平面波関数を取得するために前記残差のHOA成分が離散空間領域に変換され(33)、前記平面波関数が前記支配的な方向性信号(X DIR (k−1)から予測されること(34)によって前記予測を記述するパラメータ(ζ(k−1))がもたらされ、対応する予測誤りが前記HOAの領域に再び変換される(35)、前記手段(12)と、
−前記残差のHOA成分(D A (k−2))の現在の次数(N)をより低い次数(N RED )に低減するように構成された手段(13)であって、結果として、低次元化された残差のHOA成分(D A,RED (k−2))を生成する、該手段(13)と、
−前記低次元化された残差のHOA成分(D A,RED (k−2)を相関除去して、対応する残差のHOA成分時間領域信号(W A,RED (k−2))を取得するように構成された手段(14)と、
−圧縮された支配的な方向性信号(
)および圧縮された残差の成分信号(
)を供給するように、前記支配的な方向性信号(X DIR (k−1)および前記残差のHOA成分時間領域信号(W A,RED (k−2))を知覚符号化するように構成された手段と、
を備える、前記装置。
〔態様3〕
態様1に記載の方法に従って圧縮された高次アンビソニックス表現を圧縮解除する方法であって、
−圧縮解除された支配的な方向性信号(
)および空間領域内の残差のHOA成分を表現する圧縮解除された時間領域信号(
)を供給するように、前記圧縮された支配的な方向性信号(
)および前記圧縮された残差の成分信号(
)を知覚復号するステップ(21)と、
−前記圧縮解除された時間領域信号(
)を再相関させて、対応する低次元化された残差のHOA成分(
)を取得するステップ(22)と、
−前記低次元化された残差のHOA成分(
)の次数(N RED )を当初の次数(N)に拡張するステップ(23)であって、それによって対応する圧縮解除された残差のHOA成分(
)を供給する、該ステップ(23)と、
−前記圧縮解除された支配的な方向性信号(
)と、前記当初の次数の圧縮解除された残差のHOA成分(
)と、前記推定された(11)支配的な音源方向(
)と、前記予測を記述する前記パラメータ(ζ(k−1))とを使用して、HOA係数の対応する圧縮解除され、再合成されたフレーム
を合成するステップ(24)と、
を含む、前記方法。
〔態様4〕
態様1に記載の方法に従って圧縮された高次アンビソニックス表現を圧縮解除する装置であって、
−圧縮解除された支配的な方向性信号(
)および空間領域内の残差のHOA成分を表現する圧縮解除された時間領域信号(
)を供給するように、前記圧縮された支配的な方向性信号(
)および前記圧縮された残差の成分信号(
)を知覚復号するように構成された手段(21)と、
−前記圧縮解除された時間領域信号(
)を再相関させて、対応する低次元化された残差のHOA成分(
)を取得するように構成された手段(22)と、
−前記低次元化された残差のHOA成分(
)の次数(N RED )を当初の次数(N)に拡張するように構成された手段(23)であって、それによって対応する圧縮解除されたHOA成分(
)を供給する、該手段(23)と、
−前記圧縮解除された支配的な方向性信号(
)と、前記当初の次数の圧縮解除された残差のHOA成分(
)と、前記推定された(11)支配的な音源方向(
)と、前記予測を記述する前記パラメータ(ζ(k−1))とを使用して、HOA係数の対応する圧縮解除され、再合成されたフレーム(
)を合成するように構成された手段(24)と、
を備える、前記装置。
〔態様5〕
前記低次元化された残差のHOA成分(D A,RED (k−2))の前記相関除去(14)は、球面調和関数変換を使用して、前記低次元化された残差のHOA成分を空間領域内で対応する次数の等価信号に変換することによって行われる、態様1に記載の方法、または態様2に記載の装置。
〔態様6〕
前記低次元化された残差のHOA成分(D A,RED (k−2))の前記相関除去(14)は、球面調和関数変換を使用して、前記低次元化された残差のHOA成分を空間領域内で対応する次数の等価信号に変換することによって行われ、前記相関除去の反転を可能にする副情報(α(k−2))を提供することによって、サンプリング方向のグリッドが回転されて最大限の相関除去効果を得る、態様1に記載の方法、または態様2に記載の装置。
〔態様7〕
前記支配的な方向性信号(X DIR (k−1))および前記残差のHOA成分時間領域信号(W A,RED (k−2))の知覚圧縮(15)が共に行われ、前記圧縮された方向性信号(
)および前記圧縮された時間領域信号(
)の前記知覚圧縮(21)が対応する方法で共に行われる、態様1、3、5、および6のいずれか1項に記載の方法、または態様2および4〜6のいずれか1項に記載の装置に従った方法。
〔態様8〕
前記分解するステップ(12)は、
−HOA係数の現在のフレーム(D(k))に対して(
)における推定された音源方向から支配的な方向性信号(
)を計算するステップ(30)であって、その後の時間的平滑化(31)によって平滑化された支配的な方向性信号(X DIR (k−1))が取得される、該ステップと、
−(
)における前記推定された音源方向および前記平滑化された支配的な方向性信号(X DIR (k−1))から平滑化された支配的な方向性信号(D DIR (k−1))のHOA表現を計算するステップ(32)と、
−均一なグリッド上の方向性信号(
)による対応する残差のHOA表現を表現するステップ(33)と、
−前記平滑化された支配的な方向性信号(X DIR (k−1))および方向性信号(
)による前記残差のHOA表現から、均一なグリッド上の方向性信号(
)を予測し(34)、該予測から均一なグリッド上の予測された方向性信号のHOA表現を計算し(35)、その後、時間的平滑化を行う(36)、ステップと、
−均一なグリッド上での前記平滑化された予測された方向性信号(
)と、HOA係数の前記現在のフレーム(D(k))の2フレーム遅延したバージョンと、前記平滑化された支配的な方向性信号(X DIR (k−1))の1フレーム遅延したバージョンとから、残差のアンビエント音場成分のHOA表現(D A (k−2))を計算するステップと、
を含む、態様1および5〜7のいずれか1項に記載の方法に従った方法、または態様2および5〜7のいずれか1項に記載の装置に従った装置。
〔態様9〕
前記合成するステップ(24)は、
−HOA係数の現在のフレーム(D(k))に対して前記推定された音源方向(
)と、前記圧縮解除された支配的な方向性信号(
)とから、支配的な方向性信号(
)のHOA表現を計算するステップ(41)と、
前記圧縮解除された支配的な方向性信号(
)と、前記予測を記述した前記パラメータ(ζ(k−1))とから、均一なグリッド上の方向性信号
を予測するステップ(43)と、当該予測から、均一なグリッド上の予測された方向性信号のHOA表現
を計算するステップ(44)であって、その後に、時間的平滑化を行う
、該ステップと、
−均一なグリッド上の予測された方向性信号
の前記平滑化されたHOA表現と、支配的な方向性信号(
)の前記HOA表現の1フレーム遅延された(42)バージョンと、前記圧縮解除された残差のHOA成分(
)とから、HOA音場表現(
)を合成するステップ(46)と、
を含む、態様3または7に記載の方法に従った方法、または態様4または7に記載の装置に従った装置。
〔態様10〕
均一なグリッド上の方向性信号(
)の前記予測(34)において、予測されたグリッド信号(
)が、割り当てられた支配的な方向性信号(
)からの遅延および全帯域スケーリングによって計算される、態様8に記載の方法に従った方法、または態様8に記載の装置に従った装置。
〔態様11〕
均一なグリッド上の方向性信号(
)の前記予測(34)において、知覚指向の周波数帯域に対するスケーリング係数が求められる、態様8に記載の方法に従った方法、または態様8に記載の装置に従った装置。
〔態様12〕
態様1、5〜8、10、および11のいずれか1項に記載の方法に従って符号化されるディジタル・オーディオ信号。
Claims (14)
- 音場に対する高次アンビソニックス(HOA)表現を圧縮する方法であって、
−HOA係数の現在の時間フレームから支配的な音源方向を推定するステップと、
−前記HOA表現を時間領域内の支配的な方向性信号と残差のHOA成分とに分解するステップであって、該残差のHOA成分を表現する均一なサンプリング方向で平面波関数を取得するために前記残差のHOA成分が離散空間領域に変換され、前記平面波関数が前記支配的な方向性信号から予測され、それにより、前記予測を記述するパラメータが与えられ、前記予測からの対応する予測誤りがHOA領域に再び変換される、ステップと、
−前記残差のHOA成分の現在の次数をより低い次数に低減するステップであって、結果として、低次化された残差のHOA成分が得られる、ステップと、
−前記低次化された残差のHOA成分を相関除去して対応する残差のHOA成分時間領域信号を取得するステップと、
−圧縮された支配的な方向性信号および圧縮された残差の成分信号を供給するように、前記支配的な方向性信号および前記残差のHOA成分時間領域信号を知覚符号化するステップと、
を含む、方法。 - 前記低次化された残差のHOA成分の前記相関除去は、球面調和関数変換を使用して、前記低次化された残差のHOA成分を空間領域内で対応する次数の等価信号に変換することによって行われる、請求項1に記載の方法。
- 前記低次化された残差のHOA成分の前記相関除去は、均一なサンプリング方向のグリッドを回転させる球面調和関数変換を使用して、前記低次化された残差のHOA成分を空間領域内で対応する次数の等価信号に変換し、前記相関除去の反転を可能にする副情報を提供することによって行われる、請求項1に記載の方法。
- 前記知覚符号化は、前記支配的な方向性信号および前記残差のHOA成分時間領域信号の合同の圧縮を含む、請求項1記載の方法。
- 前記分解するステップは、
−HOA係数の現在のフレームについての推定された支配的な音源方向から、支配的な方向性信号を計算するステップであって、その後の時間的平滑化によって平滑化された支配的な方向性信号が取得される、ステップと、
−前記推定された支配的な音源方向および前記平滑化された支配的な方向性信号から、平滑化された支配的な方向性信号のHOA表現を計算するステップと、
−均一なグリッド上の方向性信号による対応する残差のHOA表現を表現するステップと、
−前記平滑化された支配的な方向性信号および方向性信号による前記残差のHOA表現から、均一なグリッド上の方向性信号を予測し、該予測から均一なグリッド上の予測された方向性信号のHOA表現を計算し、その後、時間的平滑化を行う、ステップと、
−均一なグリッド上での前記平滑化された予測された方向性信号と、HOA係数の前記現在のフレームの2フレーム遅延したバージョンと、前記平滑化された支配的な方向性信号の1フレーム遅延したバージョンとから、残差のアンビエント音場成分のHOA表現を計算するステップと、
を含む、請求項1に記載の方法。 - 音場に対する高次アンビソニックス(HOA)表現を圧縮する装置であって、
−HOA係数の現在の時間フレームから支配的な音源方向を推定する推定器と、
−前記HOA表現を時間領域内の支配的な方向性信号と残差のHOA成分とに分解する分解器であって、該残差のHOA成分を表現する均一なサンプリング方向で平面波関数を取得するために前記残差のHOA成分が離散空間領域に変換され、前記平面波関数が前記支配的な方向性信号から予測され、それにより前記予測を記述するパラメータが与えられ、前記予測からの対応する予測誤りが前記HOAの領域に再び変換される、分解器と、
−前記残差のHOA成分の現在の次数をより低い次数に低減する次数低減器であって、結果として、低次化された残差のHOA成分を生成する、次数低減器と、
−前記低次化された残差のHOA成分を相関除去して、対応する残差のHOA成分時間領域信号を取得する相関除去器と、
−圧縮された支配的な方向性信号および圧縮された残差の成分信号を供給するように、前記支配的な方向性信号および前記残差のHOA成分時間領域信号を知覚符号化する符号化器と、
を備える、装置。 - 前記低次化された残差のHOA成分の前記相関除去は、球面調和関数変換を使用して、前記低次化された残差のHOA成分を空間領域内で対応する次数の等価信号に変換することによって行われる、請求項6に記載の装置。
- 前記低次化された残差のHOA成分の前記相関除去は、均一なサンプリング方向のグリッドを回転させる球面調和関数変換を使用して、前記低次化された残差のHOA成分を空間領域内で対応する次数の等価信号に変換し、前記相関除去の反転を可能にする副情報を提供することによって行われる、請求項6に記載の装置。
- 前記支配的な方向性信号および前記残差のHOA成分時間領域信号の前記知覚符号化は、合同して行なわれる、請求項6記載の装置。
- 前記分解することは、
−HOA係数の現在のフレームについての推定された支配的な音源方向から、支配的な方向性信号を計算するステップであって、その後の時間的平滑化によって平滑化された支配的な方向性信号が取得される、ステップと、
−前記推定された支配的な音源方向および前記平滑化された支配的な方向性信号から、平滑化された支配的な方向性信号のHOA表現を計算するステップと、
−均一なグリッド上の方向性信号による対応する残差のHOA表現を表現するステップと、
−前記平滑化された支配的な方向性信号および方向性信号による前記残差のHOA表現から、均一なグリッド上の方向性信号を予測し、該予測から均一なグリッド上の予測された方向性信号のHOA表現を計算し、その後、時間的平滑化を行う、ステップと、
−均一なグリッド上での前記平滑化された予測された方向性信号と、HOA係数の前記現在のフレームの2フレーム遅延したバージョンと、前記平滑化された支配的な方向性信号の1フレーム遅延したバージョンとから、残差のアンビエント音場成分のHOA表現を計算するステップと、
を含む、請求項6に記載の装置。 - 均一なグリッド上の方向性信号の前記予測が、割り当てられた支配的な方向性信号からの遅延および全帯域スケーリングによって計算される、請求項10に記載の装置。
- 均一なグリッド上の方向性信号の前記予測において、知覚指向の周波数帯域に対するスケーリング係数が求められる、請求項10に記載の装置。
- 高次アンビソニックス(HOA)表現を圧縮解除する方法であって、
−圧縮解除された支配的な方向性信号および空間領域内の残差のHOA成分を表現する圧縮解除された時間領域信号を供給するように、圧縮された支配的な方向性信号および圧縮された残差の成分信号を知覚復号するステップと、
−前記圧縮解除された時間領域信号を再相関させて、対応する低次化された残差のHOA成分を取得するステップと、
−前記低次化された残差のHOA成分の次数を当初の次数に拡張するステップであって、それによって当初の次数の圧縮解除された残差のHOA成分を供給する、ステップと、
−前記圧縮解除された支配的な方向性信号と、前記当初の次数の圧縮解除された残差のHOA成分と、推定された支配的な音源方向とを使用して、HOA係数の対応する圧縮解除され、再合成されたフレームを生成するステップと、
を含む、方法。 - 圧縮された高次アンビソニックス(HOA)表現を圧縮解除する装置であって、
−圧縮解除された支配的な方向性信号および空間領域内の残差のHOA成分を表現する圧縮解除された時間領域信号を供給するように、圧縮された支配的な方向性信号および圧縮された残差の成分信号を知覚復号する復号器と、
−前記圧縮解除された時間領域信号を再相関させて、対応する低次化された残差のHOA成分を取得する再相関器と、
−前記低次化された残差のHOA成分の次数を当初の次数に拡張する次数拡張器であって、それによって当初の次数の圧縮解除されたHOA成分を供給する、次数拡張器と、
−前記圧縮解除された支配的な方向性信号と、前記当初の次数の圧縮解除された残差のHOA成分と、推定された支配的な音源方向とを使用して、HOA係数の圧縮解除され、再合成されたフレームを生成する合成器と、
を備える、装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12306569.0 | 2012-12-12 | ||
EP12306569.0A EP2743922A1 (en) | 2012-12-12 | 2012-12-12 | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
PCT/EP2013/075559 WO2014090660A1 (en) | 2012-12-12 | 2013-12-04 | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018016193A Division JP6640890B2 (ja) | 2012-12-12 | 2018-02-01 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2015537256A JP2015537256A (ja) | 2015-12-24 |
JP2015537256A5 JP2015537256A5 (ja) | 2017-01-12 |
JP6285458B2 true JP6285458B2 (ja) | 2018-02-28 |
Family
ID=47715805
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015546945A Active JP6285458B2 (ja) | 2012-12-12 | 2013-12-04 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2018016193A Active JP6640890B2 (ja) | 2012-12-12 | 2018-02-01 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2019235978A Active JP6869322B2 (ja) | 2012-12-12 | 2019-12-26 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2021067565A Active JP7100172B2 (ja) | 2012-12-12 | 2021-04-13 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2022105790A Active JP7353427B2 (ja) | 2012-12-12 | 2022-06-30 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2023151430A Pending JP2023169304A (ja) | 2012-12-12 | 2023-09-19 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018016193A Active JP6640890B2 (ja) | 2012-12-12 | 2018-02-01 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2019235978A Active JP6869322B2 (ja) | 2012-12-12 | 2019-12-26 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2021067565A Active JP7100172B2 (ja) | 2012-12-12 | 2021-04-13 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2022105790A Active JP7353427B2 (ja) | 2012-12-12 | 2022-06-30 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
JP2023151430A Pending JP2023169304A (ja) | 2012-12-12 | 2023-09-19 | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 |
Country Status (12)
Country | Link |
---|---|
US (7) | US9646618B2 (ja) |
EP (4) | EP2743922A1 (ja) |
JP (6) | JP6285458B2 (ja) |
KR (4) | KR102428842B1 (ja) |
CN (9) | CN117037813A (ja) |
CA (6) | CA3125228C (ja) |
HK (1) | HK1216356A1 (ja) |
MX (5) | MX344988B (ja) |
MY (2) | MY169354A (ja) |
RU (2) | RU2623886C2 (ja) |
TW (6) | TWI788833B (ja) |
WO (1) | WO2014090660A1 (ja) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
US9685163B2 (en) | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9502044B2 (en) * | 2013-05-29 | 2016-11-22 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
EP2824661A1 (en) | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
KR20220085848A (ko) | 2014-01-08 | 2022-06-22 | 돌비 인터네셔널 에이비 | 사운드 필드의 고차 앰비소닉스 표현을 코딩하기 위해 요구되는 사이드 정보의 코딩을 개선하기 위한 방법 및 장치 |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
WO2015140292A1 (en) | 2014-03-21 | 2015-09-24 | Thomson Licensing | Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal |
EP2922057A1 (en) | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
CN109410960B (zh) | 2014-03-21 | 2023-08-29 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
EP2960903A1 (en) * | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
US9794713B2 (en) | 2014-06-27 | 2017-10-17 | Dolby Laboratories Licensing Corporation | Coded HOA data frame representation that includes non-differential gain values associated with channel signals of specific ones of the dataframes of an HOA data frame representation |
CN113793618A (zh) * | 2014-06-27 | 2021-12-14 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
JP6641304B2 (ja) | 2014-06-27 | 2020-02-05 | ドルビー・インターナショナル・アーベー | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
KR102363275B1 (ko) * | 2014-07-02 | 2022-02-16 | 돌비 인터네셔널 에이비 | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 |
WO2016001355A1 (en) * | 2014-07-02 | 2016-01-07 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a hoa signal representation |
EP2963949A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
US9838819B2 (en) * | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
EP2963948A1 (en) | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
EP3164868A1 (en) | 2014-07-02 | 2017-05-10 | Dolby International AB | Method and apparatus for decoding a compressed hoa representation, and method and apparatus for encoding a compressed hoa representation |
US9847088B2 (en) * | 2014-08-29 | 2017-12-19 | Qualcomm Incorporated | Intermediate compression for higher order ambisonic audio data |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
EP3007167A1 (en) | 2014-10-10 | 2016-04-13 | Thomson Licensing | Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field |
US10140996B2 (en) | 2014-10-10 | 2018-11-27 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
EP3739578A1 (en) | 2015-07-30 | 2020-11-18 | Dolby International AB | Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation |
WO2017036609A1 (en) | 2015-08-31 | 2017-03-09 | Dolby International Ab | Method for frame-wise combined decoding and rendering of a compressed hoa signal and apparatus for frame-wise combined decoding and rendering of a compressed hoa signal |
US9961467B2 (en) | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from channel-based audio to HOA |
US9961475B2 (en) | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from object-based audio to HOA |
US10249312B2 (en) * | 2015-10-08 | 2019-04-02 | Qualcomm Incorporated | Quantization of spatial vectors |
WO2017087650A1 (en) * | 2015-11-17 | 2017-05-26 | Dolby Laboratories Licensing Corporation | Headtracking for parametric binaural output system and method |
US9881628B2 (en) * | 2016-01-05 | 2018-01-30 | Qualcomm Incorporated | Mixed domain coding of audio |
JP6710768B2 (ja) * | 2016-01-27 | 2020-06-17 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | 音場データを処理するための装置および方法 |
JP6674021B2 (ja) * | 2016-03-15 | 2020-04-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音場記述を生成する装置、方法、及びコンピュータプログラム |
CN107945810B (zh) * | 2016-10-13 | 2021-12-14 | 杭州米谟科技有限公司 | 用于编码和解码hoa或多声道数据的方法和装置 |
US10332530B2 (en) * | 2017-01-27 | 2019-06-25 | Google Llc | Coding of a soundfield representation |
JP6811312B2 (ja) | 2017-05-01 | 2021-01-13 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置及び符号化方法 |
US10657974B2 (en) * | 2017-12-21 | 2020-05-19 | Qualcomm Incorporated | Priority information for higher order ambisonic audio data |
US10264386B1 (en) * | 2018-02-09 | 2019-04-16 | Google Llc | Directional emphasis in ambisonics |
JP2019213109A (ja) * | 2018-06-07 | 2019-12-12 | 日本電信電話株式会社 | 音場信号推定装置、音場信号推定方法、プログラム |
CN111193990B (zh) * | 2020-01-06 | 2021-01-19 | 北京大学 | 一种抗高频空间混叠的3d音频系统及实现方法 |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0575675B1 (en) * | 1992-06-26 | 1998-11-25 | Discovision Associates | Method and apparatus for transformation of signals from a frequency to a time domaine |
EP1230586B1 (en) | 1999-11-12 | 2011-10-12 | Jerry Moscovitch | Horizontal three screen lcd display system |
FR2801108B1 (fr) | 1999-11-16 | 2002-03-01 | Maxmat S A | Analyseur chimique ou biochimique a regulation de la temperature reactionnelle |
US8009966B2 (en) * | 2002-11-01 | 2011-08-30 | Synchro Arts Limited | Methods and apparatus for use in sound replacement with automatic synchronization to images |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
CN102163429B (zh) * | 2005-04-15 | 2013-04-10 | 杜比国际公司 | 用于处理去相干信号或组合信号的设备和方法 |
US8139685B2 (en) * | 2005-05-10 | 2012-03-20 | Qualcomm Incorporated | Systems, methods, and apparatus for frequency control |
JP4616074B2 (ja) * | 2005-05-16 | 2011-01-19 | 株式会社エヌ・ティ・ティ・ドコモ | アクセスルータ、サービス制御システム、サービス制御方法 |
TW200715145A (en) * | 2005-10-12 | 2007-04-16 | Lin Hui | File compression method of digital sound signals |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US8165124B2 (en) * | 2006-10-13 | 2012-04-24 | Qualcomm Incorporated | Message compression methods and apparatus |
WO2008096313A1 (en) * | 2007-02-06 | 2008-08-14 | Koninklijke Philips Electronics N.V. | Low complexity parametric stereo decoder |
FR2916078A1 (fr) * | 2007-05-10 | 2008-11-14 | France Telecom | Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d'ordinateur associes |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
CN101884065B (zh) * | 2007-10-03 | 2013-07-10 | 创新科技有限公司 | 用于双耳再现和格式转换的空间音频分析和合成的方法 |
WO2009067741A1 (en) * | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
EP2205007B1 (en) * | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
BR122019023947B1 (pt) * | 2009-03-17 | 2021-04-06 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
US20100296579A1 (en) * | 2009-05-22 | 2010-11-25 | Qualcomm Incorporated | Adaptive picture type decision for video coding |
EP2285139B1 (en) * | 2009-06-25 | 2018-08-08 | Harpex Ltd. | Device and method for converting spatial audio signal |
EP2268064A1 (en) * | 2009-06-25 | 2010-12-29 | Berges Allmenndigitale Rädgivningstjeneste | Device and method for converting spatial audio signal |
US9113281B2 (en) * | 2009-10-07 | 2015-08-18 | The University Of Sydney | Reconstruction of a recorded sound field |
KR101717787B1 (ko) * | 2010-04-29 | 2017-03-17 | 엘지전자 주식회사 | 디스플레이장치 및 그의 음성신호 출력 방법 |
CN101977349A (zh) * | 2010-09-29 | 2011-02-16 | 华南理工大学 | Ambisonic声重发系统解码的优化改进方法 |
US8855341B2 (en) * | 2010-10-25 | 2014-10-07 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals |
EP2451196A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9190065B2 (en) * | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
EP2688066A1 (en) | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
CN104471641B (zh) * | 2012-07-19 | 2017-09-12 | 杜比国际公司 | 用于改善对多声道音频信号的呈现的方法和设备 |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP2765791A1 (en) * | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
EP2800401A1 (en) * | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9502044B2 (en) * | 2013-05-29 | 2016-11-22 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
-
2012
- 2012-12-12 EP EP12306569.0A patent/EP2743922A1/en not_active Withdrawn
-
2013
- 2013-12-04 CA CA3125228A patent/CA3125228C/en active Active
- 2013-12-04 RU RU2015128090A patent/RU2623886C2/ru active
- 2013-12-04 CN CN202310889802.1A patent/CN117037813A/zh active Pending
- 2013-12-04 CN CN201910024894.0A patent/CN109410965B/zh active Active
- 2013-12-04 CA CA3168326A patent/CA3168326A1/en active Pending
- 2013-12-04 CN CN201910024906.XA patent/CN109545235B/zh active Active
- 2013-12-04 MY MYPI2015001234A patent/MY169354A/en unknown
- 2013-12-04 CA CA3168322A patent/CA3168322C/en active Active
- 2013-12-04 EP EP13801563.1A patent/EP2932502B1/en active Active
- 2013-12-04 EP EP18196348.9A patent/EP3496096B1/en active Active
- 2013-12-04 WO PCT/EP2013/075559 patent/WO2014090660A1/en active Application Filing
- 2013-12-04 US US14/651,313 patent/US9646618B2/en active Active
- 2013-12-04 KR KR1020217000640A patent/KR102428842B1/ko active IP Right Grant
- 2013-12-04 CN CN202310889797.4A patent/CN117037812A/zh active Pending
- 2013-12-04 CN CN201910024905.5A patent/CN109616130B/zh active Active
- 2013-12-04 CN CN201910024898.9A patent/CN109448743B/zh active Active
- 2013-12-04 CN CN201910024895.5A patent/CN109448742B/zh active Active
- 2013-12-04 MX MX2015007349A patent/MX344988B/es active IP Right Grant
- 2013-12-04 KR KR1020237020580A patent/KR20230098355A/ko active IP Right Grant
- 2013-12-04 JP JP2015546945A patent/JP6285458B2/ja active Active
- 2013-12-04 KR KR1020157015332A patent/KR102202973B1/ko active IP Right Grant
- 2013-12-04 CA CA3125248A patent/CA3125248C/en active Active
- 2013-12-04 CA CA3125246A patent/CA3125246C/en active Active
- 2013-12-04 CA CA2891636A patent/CA2891636C/en active Active
- 2013-12-04 RU RU2017118830A patent/RU2744489C2/ru active
- 2013-12-04 KR KR1020227026512A patent/KR102546541B1/ko active IP Right Grant
- 2013-12-04 CN CN201380064856.9A patent/CN104854655B/zh active Active
- 2013-12-04 CN CN202311300470.5A patent/CN117392989A/zh active Pending
- 2013-12-04 EP EP21209477.5A patent/EP3996090A1/en active Pending
- 2013-12-05 TW TW110115843A patent/TWI788833B/zh active
- 2013-12-05 TW TW111146080A patent/TW202338788A/zh unknown
- 2013-12-05 TW TW102144508A patent/TWI611397B/zh active
- 2013-12-05 TW TW106137200A patent/TWI645397B/zh active
- 2013-12-05 TW TW108142367A patent/TWI729581B/zh active
- 2013-12-05 TW TW107135270A patent/TWI681386B/zh active
-
2015
- 2015-06-10 MX MX2022008693A patent/MX2022008693A/es unknown
- 2015-06-10 MX MX2022008695A patent/MX2022008695A/es unknown
- 2015-06-10 MX MX2022008697A patent/MX2022008697A/es unknown
- 2015-06-10 MX MX2022008694A patent/MX2022008694A/es unknown
-
2016
- 2016-04-11 HK HK16104077.0A patent/HK1216356A1/zh unknown
-
2017
- 2017-02-16 US US15/435,175 patent/US10038965B2/en active Active
-
2018
- 2018-02-01 JP JP2018016193A patent/JP6640890B2/ja active Active
- 2018-06-26 US US16/019,256 patent/US10257635B2/en active Active
- 2018-11-07 MY MYPI2018704146A patent/MY191376A/en unknown
-
2019
- 2019-02-14 US US16/276,363 patent/US10609501B2/en active Active
- 2019-12-26 JP JP2019235978A patent/JP6869322B2/ja active Active
-
2020
- 2020-03-25 US US16/828,961 patent/US11184730B2/en active Active
-
2021
- 2021-04-13 JP JP2021067565A patent/JP7100172B2/ja active Active
- 2021-11-22 US US17/532,246 patent/US11546712B2/en active Active
-
2022
- 2022-06-30 JP JP2022105790A patent/JP7353427B2/ja active Active
- 2022-12-19 US US18/068,096 patent/US20230179940A1/en active Pending
-
2023
- 2023-09-19 JP JP2023151430A patent/JP2023169304A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6285458B2 (ja) | 音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 | |
JP6606241B2 (ja) | 高次アンビソニックス表現を圧縮および圧縮解除する方法および装置 | |
JP6698903B2 (ja) | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 | |
JP2015520411A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20151021 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20160603 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20160610 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20160826 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161122 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161122 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6285458 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |