JP2020060789A - 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 - Google Patents
非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 Download PDFInfo
- Publication number
- JP2020060789A JP2020060789A JP2019237716A JP2019237716A JP2020060789A JP 2020060789 A JP2020060789 A JP 2020060789A JP 2019237716 A JP2019237716 A JP 2019237716A JP 2019237716 A JP2019237716 A JP 2019237716A JP 2020060789 A JP2020060789 A JP 2020060789A
- Authority
- JP
- Japan
- Prior art keywords
- hoa
- representation
- signal
- frame
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007906 compression Methods 0.000 title abstract description 18
- 230000006835 compression Effects 0.000 title abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 43
- 230000005236 sound signal Effects 0.000 claims description 25
- 238000000034 method Methods 0.000 claims description 16
- 238000012937 correction Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 238000010606 normalization Methods 0.000 abstract description 14
- 239000013598 vector Substances 0.000 description 51
- 238000012545 processing Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 13
- 230000008859 change Effects 0.000 description 11
- 238000002156 mixing Methods 0.000 description 10
- 230000006837 decompression Effects 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 238000009877 rendering Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 241001306293 Ophrys insectifera Species 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000005428 wave function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Analysis (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Stereophonic System (AREA)
Abstract
Description
前記HOAデータ・フレーム表現は空間領域においてO個の仮想スピーカー信号wj(t)にレンダリングされており、それらの仮想スピーカーの位置は単位球上にあり、その単位球上で一様に分布させられるよう目標とされており、前記レンダリングは行列乗算
前記HOAデータ・フレーム表現は
・前記の正規化されたHOAデータ・フレーム表現から動作a)、b)、c)、すなわち
a)前記チャネル信号における優勢音信号を表現するために、HOA係数シーケンスの前記ベクトルc(t)に混合行列Aを乗算する動作であって、混合行列Aのユークリッド・ノルムは1より大きくなく、混合行列Aは前記正規化されたHOAデータ・フレーム表現の係数シーケンスの線形結合を表わす、動作;
b)前記チャネル信号における周囲成分cAMB(t)を表現するために、前記正規化されたHOAデータ・フレーム表現から前記優勢音信号を減算し、前記周囲成分cAMB(t)の係数シーケンスの少なくとも一部を選択し、||cAMB(t)||2 2≦||c(t)||2 2であり、結果として得られる最小周囲成分cAMB,MIN(t)を、wMIN(t)=ΨMIN -1・cAMB,MIN(t)を計算することによって変換し、||ΨMIN -1||2<1であり、ΨMINは前記最小周囲成分cAMB,MIN(t)についてのモード行列である、動作;
c)前記HOA係数シーケンスc(t)の一部を選択する動作であって、選択された係数シーケンスは、空間変換が適用される前記周囲HOA成分の係数シーケンスに関係し、前記選択された係数シーケンスの数を記述する最小次数NMINはNMIN≦9である、動作;
のうちの一つまたは複数によって前記チャネル信号を形成する手段と;
・前記チャネル信号についての前記非差分的な利得値を表現するために必要とされる前記最低整数ビット数βeを
特許文献3に記載されるHOA圧縮器の全体的なアーキテクチャーが図1に示されている。これは、図1のAに描かれる空間的HOAエンコード部と、図1のBに描かれる知覚的および源エンコード部とを有する。空間的HOAエンコーダは、I個の信号からなる第一の圧縮されたHOA表現を、そのHOA表現をどのように生成するかを記述するサイド情報とともに提供する。知覚的およびサイド情報源符号化器では、該I個の信号は知覚的にエンコードされ、該サイド情報は源エンコードにかけられる。その後、二つの符号化された表現が多重化される。
第一段階では、もとのHOA表現の現在のk番目のフレームC(k)が方向およびベクトル推定処理段階またはステージ11に入力される。該段階はタプル集合MDIR(k)およびMVEC(k)を提供すると想定される。タプル集合MDIR(k)は、第一の要素が方向性信号のインデックスを表わし、第二の要素がそれぞれの量子化された方向を表わす諸タプルからなる。タプル集合MVEC(k)は、第一の要素がベクトル・ベースの信号のインデックスを表わし、第二の要素がそれらの信号の方向分布、すなわち該ベクトル・ベースの信号のHOA表現がどのようにして計算されるかを定義するベクトルを表わす諸タプルからなる。
特許文献3に記載されるHOA圧縮解除器の全体的なアーキテクチャーが図2に示されている。これは、上記HOA圧縮器のコンポーネントの、逆順に配列された対応物からなり、図2のAに描かれる知覚的および源デコード部と、図2のBに描かれる空間的HOAデコード部とを含む。
空間的HOAデコード部では、知覚的にデコードされた信号
本発明の処理を使うために、(全)入力HOA表現信号の正規化が、事前に実行される。HOA圧縮については、フレームごとの処理が実行される。ここで、もとの入力HOA表現のk番目のフレームC(k)は、〈高次アンビソニックスの基礎〉の節の式(54)において指定される時間連続的なHOA係数シーケンスのベクトルc(t)に関して
fliege/nodes/nodes.htmlにある。これらの位置は一般に、「球状の一様分布」の定義の種類に依存するもので、よって曖昧さがないこともない。
においてまとめられる。ここで、(・)Tは転置を表わす。仮想方向Ωj (N)、1≦j≦Oに関するモード行列を
w(t)=(Ψ)-1・c(t) (5)
として定式化されることができる。
入力HOA表現の正規化が〈入力HOA表現の正規化〉の節の記述に従って実行されるとして、HOA圧縮器における利得制御処理ユニット15、151に入力される信号yi、i=1,…,lの値範囲について以下で考察する。これらの信号は、HOA係数シーケンスまたは優勢音信号xPS,d、d=1,…,Dおよび/または周囲HOA成分cAMB,n、n=1,…,Oの特定の諸係数シーケンス(その一部には空間変換が適用される)のうちの一つまたは複数の、利用可能なI個のチャネルへの割り当てによって生成される。よって、式(6)での正規化の想定のもとに、ここに挙げた異なる信号型の可能な値範囲を分析することが必要である。すべての種類の信号は、もとのHOA係数シーケンスから中間的に計算されるので、それらの可能な値範囲を見ておく。
時間連続的なHOA表現は仮想スピーカー信号から
c(t)=Ψw(t) (8)
によって得られる。これは、式(5)の逆演算である。よって、すべてのHOA係数シーケンスの全パワーは、式(8)および(7)を使って次のように制限される。
||Ψ||2 2=K・O (10a)
によって書くことができる。ここで、
K=||Ψ||2 2/O (10b)
はモード行列の二乗されたユークリッド・ノルムとHOA係数シーケンスの数Oとの間の比を表わす。この比は特定のHOA次数Nおよび特定の諸仮想スピーカー方向Ωj (N)、1≦j≦Oに依存する。このことは、
K=K(N,Ω1 (N),…,ΩO (N)) (10c)
のように、この比の後に個々のパラメータ・リストを付けることによって表わせる。
優勢音信号の両方の型(方向性およびベクトル・ベース)は、HOA表現への寄与が、N+1のユークリッド・ノルムをもつ、すなわち
||v1||2=N+1 (13)
となる単一のベクトルv1∈ROによって記述されることで共通している。
x(t)=[x1(t) x2(t) … xD(t)]T (16)
に従ってベクトルx(t)に集められることができる。これらの信号は、モノラルの優勢音信号xd(t)、d=1,…,Dの方向性分布を表わすすべてのベクトルvd、d=1,…,Dから形成される行列
V:=[v1 v2 … vD] (17)
に基づいて決定される必要がある。
a)各優勢音信号はもとのHOA表現の係数シーケンスの線形結合として得られる、すなわち
x(t)=A・c(t) (18)
ここで、A∈RD×Oは混合行列を表わす。
b)混合行列Aは、そのユークリッド・ノルムが値1を超えない、すなわち
制約条件(20)を満たす混合行列をどのようにして決定するかの例が、抽出後の残差のユークリッド・ノルムが最小化される、すなわち
x(t)=V+c(t) (27)
によって与えられる。ここで、(・)+はムーア・ペンローズの擬似逆行列を示す。式(27)を式(18)と比較することによって、この場合、混合行列が行列Vのムーア・ペンローズ擬似逆行列に等しい、すなわちA=V+となることがわかる。
周囲HOA成分は、もとのHOA表現から優勢音信号のHOA表現を引くことによって計算される。すなわち、
特許文献2および上述した非特許文献1のMPEG文書において提案されたHOA圧縮処理におけるさらなる側面は、周囲HOA成分の最初のOMIN個の係数シーケンスが常に、トランスポート・チャネルに割り当てられるよう選ばれるということである。ここで、OMIN=(NMIN+1)2であり、NMIN≦Nは典型的にはもとのHOA表現の次数よりも小さな次数である。これらのHOA係数シーケンスを脱相関させるために、これらは(〈入力HOA表現の正規化〉の節で述べた概念と同様に)いくつかのあらかじめ定義された方向ΩMIN,d、d=1,…,OMINから入射する仮想スピーカー信号に変換されることができる。次数インデックスn≦NMINをもつ周囲HOA成分のすべての係数シーケンスのベクトルをcAMB,MIN(t)によって定義し、仮想方向ΩMIN,d、d=1,…,OMINに関するモード行列をΨMINによって定義すると、wMIN(t)という(によって定義される)すべての仮想スピーカー信号のベクトルは
a)すべての優勢音信号x(t)のベクトルが式/制約条件(18)、(19)、(20)に従って計算される;
b)仮想スピーカー位置として上述した非特許文献2の論文において定義されるものが使われる場合、空間変換が適用される周囲HOA成分の最初の諸係数シーケンスの数OMINを決定する最小次数NMINが9未満である必要がある。
〈HOA圧縮〉、〈空間的HOAエンコード〉、〈HOA圧縮解除〉および〈空間的HOAデコード〉の節において述べたような具体的なHOA圧縮/圧縮解除システムを実装するとき、前記指数を符号化するためのビットの量βeが、スケーリング因子KMAX,DESに依存して式(42)に従って設定される必要がある。このKMAX,DES自身は圧縮されるべきHOA表現の所望される(desired)最大次数NMAX,DESおよびある種の仮想スピーカー方向
γdB=20log10(γ) (44)
によって得られる。
高次アンビソニックス(HOA)は、音源がないと想定されるコンパクトな関心領域内の音場の記述に基づく。その場合、関心領域内の位置xおよび時刻tにおける音圧の空間時間的挙動p(t,x)は、斉次の波の式(homogeneous wave equation)によって物理的に完全に決定される。以下では、図6に示される球面座標系を想定する。使用されるこの座標系では、x軸は前方位置を向き、y軸は左を向き、z軸は上を向く。空間内の位置x=(r,θ,φ)Tは動径r>0(すなわち、座標原点までの距離)、極軸zから測った傾斜角θ∈[0,π]およびxy平面においてx軸から反時計回りに測った方位角φ∈[0,2π[によって表現される。さらに、(・)Tは転置を表わす。
Ft(・)によって表わされる時間に関する音圧のフーリエ変換、すなわち
An m(k)=inCn m(k) (52)
によって関係付けられる。個々の係数Cn m(k=ω/cs)が角周波数ωの関数であるとすると、逆フーリエ変換(F-1(・)によって表わされる)の適用は、各次数nおよび陪数mについて、時間領域関数
n(n+1)+1+m
によって与えられる。ベクトルc(t)内の全体的な要素数はO=(N+1)2によって与えられる。
最終的なアンビソニックス・フォーマットは、サンプリング周波数fsを使って、c(t)のサンプリングされたバージョンを、
実数値の球面調和関数Sn m(θ,φ)(非特許文献5、3.1章に基づくSN3D規格化を想定)は次式によって与えられる。
〔態様1〕
HOAデータ・フレーム表現(C(k))の圧縮のために、前記HOAデータ・フレームのうちの個々のもののチャネル信号についての非差分的な利得値(2e)を表現するために必要とされる最低の整数ビット数βeを決定する装置であって、各フレームにおける各チャネル信号はサンプル値のグループを含み、前記HOAデータ・フレームの各フレームの各チャネル信号(y1(k−2),…,yI(k−2))に対して差分利得値が割り当てられ、そのような差分利得値は現在HOAデータ・フレーム((k−2))におけるチャネル信号のサンプル値の振幅の、直前のHOAデータ・フレーム((k−3))におけるそのチャネル信号のサンプル値に対する変化を引き起こすものであり、そのような利得適応されたチャネル信号はエンコーダ(16)においてエンコードされ、
前記HOAデータ・フレーム表現(C(k))は空間領域においてO個の仮想スピーカー信号wj(t)にレンダリングされており、それらの仮想スピーカーの位置は単位球上にあり、その単位球上で一様に分布させられるよう目標とされており、前記レンダリングは行列乗算w(t)=(Ψ)-1・c(t)によって表現され、w(t)はすべての仮想スピーカー信号を含むベクトルであり、Ψは仮想スピーカー位置モード行列であり、c(t)は前記HOAデータ・フレーム表現(C(k))の対応するHOA係数シーケンスのベクトルであり、
前記HOAデータ・フレーム表現(C(k))は
・前記の正規化されたHOAデータ・フレーム表現(C(k))から、前記チャネル信号(y1(k−2),…,yI(k−2))を、動作a)、b)、c)、すなわち
a)前記チャネル信号における優勢音信号(x(t))を表現するために、HOA係数シーケンスの前記ベクトルc(t)に混合行列Aを乗算する動作であって、混合行列Aのユークリッド・ノルムは1より大きくなく、混合行列Aは前記正規化されたHOAデータ・フレーム表現の係数シーケンスの線形結合を表わす、動作;
b)前記チャネル信号における周囲成分cAMB(t)を表現するために、前記正規化されたHOAデータ・フレーム表現(C(k))から前記優勢音信号を減算し、前記周囲成分cAMB(t)の係数シーケンスの少なくとも一部を選択し、||cAMB(t)||2 2≦||c(t)||2 2であり、結果として得られる最小周囲成分cAMB,MIN(t)を、wMIN(t)=ΨMIN -1・cAMB,MIN(t)を計算することによって変換し、||ΨMIN -1||2<1であり、ΨMINは前記最小周囲成分cAMB,MIN(t)についてのモード行列である、動作;
c)前記HOA係数シーケンスc(t)の一部を選択する動作であって、選択された係数シーケンスは、空間変換が適用される前記周囲HOA成分の係数シーケンスに関係し、前記選択された係数シーケンスの数を記述する最小次数NMINはNMIN≦9である、動作;
のうちの一つまたは複数によって形成する手段(12、13、14)と;
・前記チャネル信号についての前記非差分的な利得値(2e)を表現するために必要とされる前記最低の整数ビット数βeを
装置。
〔態様2〕
前記変換された最小周囲成分に加えて、前記周囲成分cAMB(t)の変換されていない周囲係数シーケンスが前記チャネル信号(y1(k−2),…,yI(k−2))に含まれる、態様1記載の装置。
〔態様3〕
前記HOAデータ・フレームのうちの個々のものの前記チャネル信号に関連付けられた前記非差分的な利得値(2e)がサイド情報として転送され、そのそれぞれがβeビットによって表現される、態様1または2記載の装置。
〔態様4〕
前記最低の整数ビット数βeが
態様1ないし3のうちいずれか一項記載の装置。
〔態様5〕
√KMAX=1.5である、態様1ないし4のうちいずれか一項記載の装置。
〔態様6〕
前記混合行列Aが、モノラル優勢音信号の方向分布を表わすすべてのベクトルから形成されるモード行列のムーア・ペンローズの擬似逆行列を取ることによって、もとのHOA表現と優勢音信号のものとの間の残差のユークリッド・ノルムを最小にするよう決定される、態様1ないし5のうちいずれか一項記載の装置。
〔態様7〕
前記O個の仮想スピーカー信号の位置がβeの計算のために想定されたものと一致せず、
・これらの仮想スピーカー位置についてのモード行列Ψを計算し(51);
・このモード行列のユークリッド・ノルム||Ψ||2を計算し(52);
・前記正規化における最大の許容される振幅1を置き換える最大許容される振幅値
態様1ないし6のうちいずれか一項記載の装置。
Claims (2)
- 音または音場の圧縮された高次アンビソニックス(HOA)音表現をデコードする方法であって:
前記圧縮されたHOA表現を含むビットストリームを受領し、前記圧縮されたHOA表現をデコードして、知覚的にデコードされた信号
前記知覚的にデコードされた信号
優勢音信号のフレーム
前のフレームにおけるトランスポート・チャネルの信号に適用されるビットの最低の整数の数βeは
方法。 - 音または音場の圧縮された高次アンビソニックス(HOA)音表現をデコードする装置であって、当該装置は:
前記圧縮されたHOA表現を含むビットストリームを受領し、前記圧縮されたHOA表現をデコードして、知覚的にデコードされた信号
前記プロセッサはさらに、前記知覚的にデコードされた信号
前記プロセッサはさらに、優勢音信号のフレーム
前のフレームにおけるトランスポート・チャネルの信号に適用されるビットの最低の整数の数βeは
装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021071874A JP7267340B2 (ja) | 2014-06-27 | 2021-04-21 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2023068243A JP2023083435A (ja) | 2014-06-27 | 2023-04-19 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14306024 | 2014-06-27 | ||
EP14306024.2 | 2014-06-27 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016575019A Division JP6641304B2 (ja) | 2014-06-27 | 2015-06-22 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021071874A Division JP7267340B2 (ja) | 2014-06-27 | 2021-04-21 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2020060789A true JP2020060789A (ja) | 2020-04-16 |
JP2020060789A5 JP2020060789A5 (ja) | 2020-12-10 |
JP6874115B2 JP6874115B2 (ja) | 2021-05-19 |
Family
ID=51178840
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016575019A Active JP6641304B2 (ja) | 2014-06-27 | 2015-06-22 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2019237716A Active JP6874115B2 (ja) | 2014-06-27 | 2019-12-27 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2021071874A Active JP7267340B2 (ja) | 2014-06-27 | 2021-04-21 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2023068243A Pending JP2023083435A (ja) | 2014-06-27 | 2023-04-19 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016575019A Active JP6641304B2 (ja) | 2014-06-27 | 2015-06-22 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021071874A Active JP7267340B2 (ja) | 2014-06-27 | 2021-04-21 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2023068243A Pending JP2023083435A (ja) | 2014-06-27 | 2023-04-19 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Country Status (7)
Country | Link |
---|---|
US (4) | US9792924B2 (ja) |
EP (3) | EP4354432A2 (ja) |
JP (4) | JP6641304B2 (ja) |
KR (4) | KR102381202B1 (ja) |
CN (7) | CN106471822B (ja) |
TW (3) | TWI809394B (ja) |
WO (1) | WO2015197514A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2960903A1 (en) * | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
KR20240047489A (ko) * | 2014-06-27 | 2024-04-12 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 방법 |
DE102016104665A1 (de) * | 2016-03-14 | 2017-09-14 | Ask Industries Gmbh | Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals |
US10332530B2 (en) | 2017-01-27 | 2019-06-25 | Google Llc | Coding of a soundfield representation |
US10015618B1 (en) * | 2017-08-01 | 2018-07-03 | Google Llc | Incoherent idempotent ambisonics rendering |
US10264386B1 (en) * | 2018-02-09 | 2019-04-16 | Google Llc | Directional emphasis in ambisonics |
GB2572761A (en) * | 2018-04-09 | 2019-10-16 | Nokia Technologies Oy | Quantization of spatial audio parameters |
CA3187342A1 (en) * | 2020-07-30 | 2022-02-03 | Guillaume Fuchs | Apparatus, method and computer program for encoding an audio signal or for decoding an encoded audio scene |
WO2022082665A1 (en) * | 2020-10-22 | 2022-04-28 | Nokia Shanghai Bell Co., Ltd. | Method, apparatus, and computer program |
CN113314129B (zh) * | 2021-04-30 | 2022-08-05 | 北京大学 | 一种适应环境的声场重放空间解码方法 |
CN113345448B (zh) * | 2021-05-12 | 2022-08-05 | 北京大学 | 一种基于独立成分分析的hoa信号压缩方法 |
CN115376529A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
CN115376528A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
CN115376530A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133366A (ja) * | 2010-12-21 | 2012-07-12 | Thomson Licensing | 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置 |
WO2013171083A1 (en) * | 2012-05-14 | 2013-11-21 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics signal representation |
WO2014012944A1 (en) * | 2012-07-16 | 2014-01-23 | Thomson Licensing | Method and apparatus for encoding multi-channel hoa audio signals for noise reduction, and method and apparatus for decoding multi-channel hoa audio signals for noise reduction |
WO2014090660A1 (en) * | 2012-12-12 | 2014-06-19 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE522453C2 (sv) * | 2000-02-28 | 2004-02-10 | Scania Cv Ab | Sätt och anordning för styrning av ett mekaniskt tillsatsaggregat i ett motorfordon |
CN1138254C (zh) * | 2001-03-19 | 2004-02-11 | 北京阜国数字技术有限公司 | 一种基于小波变换的音频信号压缩编/解码方法 |
ATE430360T1 (de) * | 2004-03-01 | 2009-05-15 | Dolby Lab Licensing Corp | Mehrkanalige audiodekodierung |
CN1677492A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
US20080232601A1 (en) * | 2007-03-21 | 2008-09-25 | Ville Pulkki | Method and apparatus for enhancement of audio reconstruction |
WO2009001874A1 (ja) * | 2007-06-27 | 2008-12-31 | Nec Corporation | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
US8509454B2 (en) * | 2007-11-01 | 2013-08-13 | Nokia Corporation | Focusing on a portion of an audio scene for an audio signal |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
WO2009155361A1 (en) * | 2008-06-17 | 2009-12-23 | Earlens Corporation | Optical electro-mechanical hearing devices with combined power and signal architectures |
EP2352304B1 (en) * | 2008-09-17 | 2015-07-01 | Panasonic Intellectual Property Management Co., Ltd. | Recording medium, reproduction device, and integrated circuit |
CN102823277B (zh) * | 2010-03-26 | 2015-07-15 | 汤姆森特许公司 | 解码用于音频回放的音频声场表示的方法和装置 |
ES2935911T3 (es) * | 2010-04-09 | 2023-03-13 | Dolby Int Ab | Descodificación estéreo de predicción compleja basada en MDCT |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
JP6230602B2 (ja) * | 2012-07-16 | 2017-11-15 | ドルビー・インターナショナル・アーベー | オーディオ再生のためのオーディオ音場表現をレンダリングするための方法および装置 |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
EP2824661A1 (en) | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
-
2015
- 2015-06-22 CN CN201580035125.0A patent/CN106471822B/zh active Active
- 2015-06-22 EP EP24158677.5A patent/EP4354432A2/en active Pending
- 2015-06-22 CN CN201910922110.6A patent/CN110662158B/zh active Active
- 2015-06-22 US US15/319,707 patent/US9792924B2/en active Active
- 2015-06-22 CN CN201910861274.2A patent/CN110556120B/zh active Active
- 2015-06-22 WO PCT/EP2015/063914 patent/WO2015197514A1/en active Application Filing
- 2015-06-22 EP EP15729523.9A patent/EP3162086B1/en active Active
- 2015-06-22 EP EP21159478.3A patent/EP3860154B1/en active Active
- 2015-06-22 CN CN202311556422.2A patent/CN117636885A/zh active Pending
- 2015-06-22 KR KR1020167036547A patent/KR102381202B1/ko active IP Right Grant
- 2015-06-22 JP JP2016575019A patent/JP6641304B2/ja active Active
- 2015-06-22 CN CN201910861296.9A patent/CN110415712B/zh active Active
- 2015-06-22 CN CN202311558626.XA patent/CN117612540A/zh active Pending
- 2015-06-22 KR KR1020247010754A patent/KR20240050436A/ko active Search and Examination
- 2015-06-22 CN CN201910861280.8A patent/CN110459229B/zh active Active
- 2015-06-22 KR KR1020227010252A patent/KR102454747B1/ko active IP Right Grant
- 2015-06-22 KR KR1020227035215A patent/KR102654275B1/ko active IP Right Grant
- 2015-06-26 TW TW110117878A patent/TWI809394B/zh active
- 2015-06-26 TW TW108142368A patent/TWI728563B/zh active
- 2015-06-26 TW TW104120627A patent/TWI679633B/zh active
-
2017
- 2017-09-12 US US15/702,418 patent/US10037764B2/en active Active
-
2018
- 2018-06-26 US US16/019,288 patent/US10262670B2/en active Active
-
2019
- 2019-04-08 US US16/377,661 patent/US10580426B2/en active Active
- 2019-12-27 JP JP2019237716A patent/JP6874115B2/ja active Active
-
2021
- 2021-04-21 JP JP2021071874A patent/JP7267340B2/ja active Active
-
2023
- 2023-04-19 JP JP2023068243A patent/JP2023083435A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012133366A (ja) * | 2010-12-21 | 2012-07-12 | Thomson Licensing | 二次元または三次元音場のアンビソニックス表現の一連のフレームをエンコードおよびデコードする方法および装置 |
WO2013171083A1 (en) * | 2012-05-14 | 2013-11-21 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics signal representation |
WO2014012944A1 (en) * | 2012-07-16 | 2014-01-23 | Thomson Licensing | Method and apparatus for encoding multi-channel hoa audio signals for noise reduction, and method and apparatus for decoding multi-channel hoa audio signals for noise reduction |
WO2014090660A1 (en) * | 2012-12-12 | 2014-06-19 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7267340B2 (ja) | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 | |
JP6972195B2 (ja) | Hoaデータ・フレーム表現のデータ・フレームの個々のもののチャネル信号に関連付けられた非差分的な利得値を含む符号化されたhoaデータ・フレーム表現 | |
JP6869296B2 (ja) | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する方法および装置 | |
JP7275191B2 (ja) | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 | |
RU2802176C2 (ru) | Способ и устройство для декодирования сжатого звукового представления звука или звукового поля с помощью hoa | |
TW202418268A (zh) | 用於將聲音或聲場的高階保真立體音響(hoa)表示予以解碼的方法及裝置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201029 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210421 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6874115 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |