JP6641303B2 - 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 - Google Patents
非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 Download PDFInfo
- Publication number
- JP6641303B2 JP6641303B2 JP2016575018A JP2016575018A JP6641303B2 JP 6641303 B2 JP6641303 B2 JP 6641303B2 JP 2016575018 A JP2016575018 A JP 2016575018A JP 2016575018 A JP2016575018 A JP 2016575018A JP 6641303 B2 JP6641303 B2 JP 6641303B2
- Authority
- JP
- Japan
- Prior art keywords
- hoa
- representation
- data frame
- channel signal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007906 compression Methods 0.000 title claims description 19
- 230000006835 compression Effects 0.000 title claims description 18
- 239000013598 vector Substances 0.000 claims description 54
- 239000011159 matrix material Substances 0.000 claims description 51
- 230000005236 sound signal Effects 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 21
- 230000014509 gene expression Effects 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 13
- 238000002156 mixing Methods 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 13
- 238000009877 rendering Methods 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 description 24
- 230000006870 function Effects 0.000 description 11
- 230000006837 decompression Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 241001306293 Ophrys insectifera Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- NRNCYVBFPDDJNE-UHFFFAOYSA-N pemoline Chemical compound O1C(N)=NC(=O)C1C1=CC=CC=C1 NRNCYVBFPDDJNE-UHFFFAOYSA-N 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 230000005428 wave function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
前記HOAデータ・フレーム表現は空間領域においてO個の仮想スピーカー信号wj(t)にレンダリングされており、前記O個の仮想スピーカーの位置は単位球上にあり、βeの計算のために想定された位置に一致せず、前記レンダリングは行列乗算w(t)=(Ψ)-1・c(t)によって表現され、w(t)はすべての仮想スピーカー信号を含むベクトルであり、Ψはこれらの仮想スピーカー位置について計算されたモード行列であり、c(t)は前記HOAデータ・フレーム表現の対応するHOA係数シーケンスのベクトルであり、 最大許容される振幅値
・前記の正規化されたHOAデータ・フレーム表現から、サブステップa)、b)、c)、すなわち
a)前記チャネル信号における優勢音信号を表現するために、HOA係数シーケンスの前記ベクトルc(t)に混合行列Aを乗算するサブステップであって、混合行列Aのユークリッド・ノルムは1より大きくなく、混合行列Aは前記正規化されたHOAデータ・フレーム表現の係数シーケンスの線形結合を表わす、サブステップ;
b)前記チャネル信号における周囲成分cAMB(t)を表現するために、前記正規化されたHOAデータ・フレーム表現から前記優勢音信号を減算し、前記周囲成分cAMB(t)の係数シーケンスの少なくとも一部を選択し、||cAMB(t)||2 2≦||c(t)||2 2であり、結果として得られる最小周囲成分cAMB,MIN(t)を、wMIN(t)=ΨMIN -1・cAMB,MIN(t)を計算することによって変換し、||ΨMIN -1||2<1であり、ΨMINは前記最小周囲成分cAMB,MIN(t)についてのモード行列である、サブステップ;
c)前記HOA係数シーケンスc(t)の一部を選択するサブステップであって、選択された係数シーケンスは、空間変換が適用される前記周囲HOA成分の係数シーケンスに関係し、前記選択された係数シーケンスの数を記述する最小次数NMINはNMIN≦9である、サブステップ;
のうちの一つまたは複数によって前記チャネル信号を形成する段階と;
・前記チャネル信号についての前記非差分的な利得値を表現するために必要とされる前記最低整数ビット数βeを
[外1]
であり、Nは前記次数であり、NMAXは関心対象の最大次数であり、Ω1 (N),…,ΩO (N)は前記仮想スピーカーの方向であり、O=(N+1)2はHOA係数シーケンスの数であり、Kは前記モード行列の二乗されたユークリッド・ノルム||Ψ||2 2とOとの間の比である。
特許文献3に記載されるHOA圧縮器の全体的なアーキテクチャーが図1に示されている。これは、図1のAに描かれる空間的HOAエンコード部と、図1のBに描かれる知覚的および源エンコード部とを有する。空間的HOAエンコーダは、I個の信号からなる第一の圧縮されたHOA表現を、そのHOA表現をどのように生成するかを記述するサイド情報とともに提供する。知覚的およびサイド情報源符号化器では、該I個の信号は知覚的にエンコードされ、該サイド情報は源エンコードにかけられる。その後、二つの符号化された表現が多重化される。
第一段階では、もとのHOA表現の現在のk番目のフレームC(k)が方向およびベクトル推定処理段階またはステージ11に入力される。該段階はタプル集合MDIR(k)およびMVEC(k)を提供すると想定される。タプル集合MDIR(k)は、第一の要素が方向性信号のインデックスを表わし、第二の要素がそれぞれの量子化された方向を表わす諸タプルからなる。タプル集合MVEC(k)は、第一の要素がベクトル・ベースの信号のインデックスを表わし、第二の要素がそれらの信号の方向分布、すなわち該ベクトル・ベースの信号のHOA表現がどのようにして計算されるかを定義するベクトルを表わす諸タプルからなる。
特許文献3に記載されるHOA圧縮解除器の全体的なアーキテクチャーが図2に示されている。これは、上記HOA圧縮器のコンポーネントの、逆順に配列された対応物からなり、図2のAに描かれる知覚的および源デコード部と、図2のBに描かれる空間的HOAデコード部とを含む。
空間的HOAデコード部では、知覚的にデコードされた信号
本発明の処理を使うために、(全)入力HOA表現信号の正規化が、事前に実行される。HOA圧縮については、フレームごとの処理が実行される。ここで、もとの入力HOA表現のk番目のフレームC(k)は、〈高次アンビソニックスの基礎〉の節の式(54)において指定される時間連続的なHOA係数シーケンスのベクトルc(t)に関して
fliege/nodes/nodes.htmlにある。これらの位置は一般に、「球状の一様分布」の定義の種類に依存するもので、よって曖昧さがないこともない。
においてまとめられる。ここで、(・)Tは転置を表わす。仮想方向Ωj (N)、1≦j≦Oに関するモード行列を
w(t)=(Ψ)-1・c(t) (5)
として定式化されることができる。
入力HOA表現の正規化が〈入力HOA表現の正規化〉の節の記述に従って実行されるとして、HOA圧縮器における利得制御処理ユニット15、151に入力される信号yi、i=1,…,lの値範囲について以下で考察する。これらの信号は、HOA係数シーケンスまたは優勢音信号xPS,d、d=1,…,Dおよび/または周囲HOA成分cAMB,n、n=1,…,Oの特定の諸係数シーケンス(その一部には空間変換が適用される)のうちの一つまたは複数の、利用可能なI個のチャネルへの割り当てによって生成される。よって、式(6)での正規化の想定のもとに、ここに挙げた異なる信号型の可能な値範囲を分析することが必要である。すべての種類の信号は、もとのHOA係数シーケンスから中間的に計算されるので、それらの可能な値範囲を見ておく。
時間連続的なHOA表現は仮想スピーカー信号から
c(t)=Ψw(t) (8)
によって得られる。これは、式(5)の逆演算である。よって、すべてのHOA係数シーケンスの全パワーは、式(8)および(7)を使って次のように制限される。
||Ψ||2 2=K・O (10a)
によって書くことができる。ここで、
K=||Ψ||2 2/O (10b)
はモード行列の二乗されたユークリッド・ノルムとHOA係数シーケンスの数Oとの間の比を表わす。この比は特定のHOA次数Nおよび特定の諸仮想スピーカー方向Ωj (N)、1≦j≦Oに依存する。このことは、
K=K(N,Ω1 (N),…,ΩO (N)) (10c)
のように、この比の後に個々のパラメータ・リストを付けることによって表わせる。
優勢音信号の両方の型(方向性およびベクトル・ベース)は、HOA表現への寄与が、N+1のユークリッド・ノルムをもつ、すなわち
||v1||2=N+1 (13)
となる単一のベクトルv1∈ROによって記述されることで共通している。
x(t)=[x1(t) x2(t) … xD(t)]T (16)
に従ってベクトルx(t)に集められることができる。これらの信号は、モノラルの優勢音信号xd(t)、d=1,…,Dの方向性分布を表わすすべてのベクトルvd、d=1,…,Dから形成される行列
V:=[v1 v2 … vD] (17)
に基づいて決定される必要がある。
a)各優勢音信号はもとのHOA表現の係数シーケンスの線形結合として得られる、すなわち
x(t)=A・c(t) (18)
ここで、A∈RD×Oは混合行列を表わす。
b)混合行列Aは、そのユークリッド・ノルムが値1を超えない、すなわち
制約条件(20)を満たす混合行列をどのようにして決定するかの例が、抽出後の残差のユークリッド・ノルムが最小化される、すなわち
x(t)=V+c(t) (27)
によって与えられる。ここで、(・)+はムーア・ペンローズの擬似逆行列を示す。式(27)を式(18)と比較することによって、この場合、混合行列が行列Vのムーア・ペンローズ擬似逆行列に等しい、すなわちA=V+となることがわかる。
周囲HOA成分は、もとのHOA表現から優勢音信号のHOA表現を引くことによって計算される。すなわち、
特許文献2および上述した非特許文献1のMPEG文書において提案されたHOA圧縮処理におけるさらなる側面は、周囲HOA成分の最初のOMIN個の係数シーケンスが常に、トランスポート・チャネルに割り当てられるよう選ばれるということである。ここで、OMIN=(NMIN+1)2であり、NMIN≦Nは典型的にはもとのHOA表現の次数よりも小さな次数である。これらのHOA係数シーケンスを脱相関させるために、これらは(〈入力HOA表現の正規化〉の節で述べた概念と同様に)いくつかのあらかじめ定義された方向ΩMIN,d、d=1,…,OMINから入射する仮想スピーカー信号に変換されることができる。次数インデックスn≦NMINをもつ周囲HOA成分のすべての係数シーケンスのベクトルをcAMB,MIN(t)によって定義し、仮想方向ΩMIN,d、d=1,…,OMINに関するモード行列をΨMINによって定義すると、wMIN(t)という(によって定義される)すべての仮想スピーカー信号のベクトルは
a)すべての優勢音信号x(t)のベクトルが式/制約条件(18)、(19)、(20)に従って計算される;
b)仮想スピーカー位置として上述した非特許文献2の論文において定義されるものが使われる場合、空間変換が適用される周囲HOA成分の最初の諸係数シーケンスの数OMINを決定する最小次数NMINが9未満である必要がある。
〈HOA圧縮〉、〈空間的HOAエンコード〉、〈HOA圧縮解除〉および〈空間的HOAデコード〉の節において述べたような具体的なHOA圧縮/圧縮解除システムを実装するとき、前記指数を符号化するためのビットの量βeが、スケーリング因子KMAX,DESに依存して式(42)に従って設定される必要がある。このKMAX,DES自身は圧縮されるべきHOA表現の所望される(desired)最大次数NMAX,DESおよびある種の仮想スピーカー方向
γdB=20log10(γ) (44)
によって得られる。
高次アンビソニックス(HOA)は、音源がないと想定されるコンパクトな関心領域内の音場の記述に基づく。その場合、関心領域内の位置xおよび時刻tにおける音圧の空間時間的挙動p(t,x)は、斉次の波の式(homogeneous wave equation)によって物理的に完全に決定される。以下では、図6に示される球面座標系を想定する。使用されるこの座標系では、x軸は前方位置を向き、y軸は左を向き、z軸は上を向く。空間内の位置x=(r,θ,φ)Tは動径r>0(すなわち、座標原点までの距離)、極軸zから測った傾斜角θ∈[0,π]およびxy平面においてx軸から反時計回りに測った方位角φ∈[0,2π[によって表現される。さらに、(・)Tは転置を表わす。
Ft(・)によって表わされる時間に関する音圧のフーリエ変換、すなわち
An m(k)=inCn m(k) (52)
によって関係付けられる。個々の係数Cn m(k=ω/cs)が角周波数ωの関数であるとすると、逆フーリエ変換(F-1(・)によって表わされる)の適用は、各次数nおよび陪数mについて、時間領域関数
n(n+1)+1+m
によって与えられる。ベクトルc(t)内の全体的な要素数はO=(N+1)2によって与えられる。
最終的なアンビソニックス・フォーマットは、サンプリング周波数fsを使って、c(t)のサンプリングされたバージョンを、
実数値の球面調和関数Sn m(θ,φ)(非特許文献5、3.1章に基づくSN3D規格化を想定)は次式によって与えられる。
Claims (12)
- HOAデータ・フレーム表現(C(k))の圧縮のために、前記HOAデータ・フレームのチャネル信号について振幅変化に対応する非差分的な利得値の表現を2の指数(2e)として記述するための最低の整数ビット数βeを決定する方法であって、各フレームにおける各チャネル信号はサンプル値のグループを含み、前記HOAデータ・フレームの各フレームの各チャネル信号(y1(k−2),…,yI(k−2))に対して差分利得値が割り当てられ、該差分利得値は現在HOAデータ・フレーム((k−2))におけるチャネル信号の第一のサンプル値の振幅の、直前のHOAデータ・フレーム((k−3))におけるチャネル信号の第二のサンプル値に対する変化を引き起こすものであり、結果として得られる利得適応されたチャネル信号はエンコーダ(16)においてエンコードされ、
前記HOAデータ・フレーム表現は空間領域においてO個の仮想スピーカー信号wj(t)にレンダリングされており、それらの仮想スピーカーの位置は単位球上にあり、その単位球上で一様に分布させられるよう目標とされており、前記レンダリングは行列乗算w(t)=(Ψ)-1・c(t)によって表現され、w(t)はすべての仮想スピーカー信号を含むベクトルであり、Ψは仮想スピーカー位置モード行列であり、c(t)は前記HOAデータ・フレーム表現(C(k))の対応するHOA係数シーケンスのベクトルであり、
前記HOAデータ・フレーム表現(C(k))は
・チャネル信号を、
a)前記チャネル信号における優勢音信号(x(t))を表現するために、HOA係数シーケンスのベクトルc(t)に混合行列Aを乗算するサブステップであって、混合行列Aは正規化されたHOAデータ・フレーム表現の係数シーケンスの線形結合を表わす、サブステップ;
b)前記チャネル信号における周囲HOA成分cAMB(t)を表現するために、前記正規化されたHOAデータ・フレーム表現から前記優勢音信号を減算し、結果として得られる最小周囲HOA成分cAMB,MIN(t)を、wMIN(t)=ΨMIN -1・cAMB,MIN(t)を計算することによって変換し、||ΨMIN -1||2<1であり、ΨMINは前記最小周囲HOA成分cAMB,MIN(t)についてのモード行列である、サブステップ;
c)前記HOA係数シーケンスc(t)のうち、空間変換が適用される前記周囲HOA成分の係数シーケンスに関係する一部を選択するサブステップ;
を実行することによって形成する段階と;
・ビットストリーム中に独立アクセス単位が存在するときは前記整数ビット数βeを
方法。 - HOAデータ・フレーム表現(C(k))の圧縮のために、前記HOAデータ・フレームのチャネル信号について振幅変化に対応する非差分的な利得値の表現を2の指数(2e)として記述するための最低の整数ビット数βeを決定する装置であって、各フレームにおける各チャネル信号はサンプル値のグループを含み、前記HOAデータ・フレームの各フレームの各チャネル信号(y1(k−2),…,yI(k−2))に対して差分利得値が割り当てられ、該差分利得値は現在HOAデータ・フレーム((k−2))におけるチャネル信号の第一のサンプル値の振幅の、直前のHOAデータ・フレーム((k−3))におけるチャネル信号の第二のサンプル値に対する変化を引き起こすものであり、結果として得られる利得適応されたチャネル信号はエンコーダ(16)においてエンコードされ、
前記HOAデータ・フレーム表現は空間領域においてO個の仮想スピーカー信号wj(t)にレンダリングされており、それらの仮想スピーカーの位置は単位球上にあり、その単位球上で一様に分布させられるよう目標とされており、前記レンダリングは行列乗算w(t)=(Ψ)-1・c(t)によって表現され、w(t)はすべての仮想スピーカー信号を含むベクトルであり、Ψは仮想スピーカー位置モード行列であり、c(t)は前記HOAデータ・フレーム表現(C(k))の対応するHOA係数シーケンスのベクトルであり、前記HOAデータ・フレーム表現(C(k))は
・前記チャネル信号(y1(k−2),…,yI(k−2))を
a)前記チャネル信号における優勢音信号(x(t))を表現するために、HOA係数シーケンスの前記ベクトルc(t)に混合行列Aを乗算する動作であって、混合行列Aは正規化されたHOAデータ・フレーム表現の係数シーケンスの線形結合を表わす、動作;
b)前記チャネル信号における周囲HOA成分cAMB(t)を表現するために、前記正規化されたHOAデータ・フレーム表現から前記優勢音信号を減算し、結果として得られる最小周囲HOA成分cAMB,MIN(t)を、wMIN(t)=ΨMIN -1・cAMB,MIN(t)を計算することによって変換し、||ΨMIN -1||2<1であり、ΨMINは前記最小周囲HOA成分cAMB,MIN(t)についてのモード行列である、動作;
c)前記HOA係数シーケンスc(t)のうち、空間変換が適用される前記周囲HOA成分の係数シーケンスに関係する一部を選択する動作;
を実行することによって形成する手段(12、13、14)と;
・ビットストリーム中に独立アクセス単位が存在するときは前記整数ビット数βeを
装置。 - 前記変換された最小周囲HOA成分に加えて、前記周囲HOA成分cAMB(t)の変換されていない周囲係数シーケンスが前記チャネル信号(y1(k−2),…,yI(k−2))に含まれる、請求項1記載の方法。
- 前記HOAデータ・フレームのうちの個々のものの前記チャネル信号に関連付けられた前記非差分的な利得値の表現(2e)がサイド情報として転送され、そのそれぞれがβeビットによって表現される、請求項1または3記載の方法。
- √KMAX=1.5である、請求項1および3ないし5のうちいずれか一項記載の方法。
- 前記混合行列Aが、モノラル優勢音信号の方向分布を表わすすべてのベクトルから形成されるモード行列のムーア・ペンローズの擬似逆行列を取ることによって、もとのHOA表現と優勢音信号のものとの間の残差のユークリッド・ノルムを最小にするよう決定される、請求項1および3ないし6のうちいずれか一項記載の方法。
- 前記O個の仮想スピーカー信号の位置がβeの計算のために想定されたものと一致せず、
・該一致しない仮想スピーカー位置に基づいてモード行列Ψを計算し(51);
・このモード行列のユークリッド・ノルム||Ψ||2を計算し(52);
・前記正規化における最大の許容される振幅を置き換える最大許容される振幅値
請求項1および3ないし7のうちいずれか一項記載の方法。 - コンピュータに請求項1および3ないし8のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
- 音または音場の圧縮された高次アンビソニックス(HOA)音表現をデコードする方法であって:
前記圧縮されたHOA表現を含むビットストリームを受領する段階であって、前記ビットストリームは前記圧縮されたHOA表現に対応するいくつかのHOA係数を含む、段階と;
前記ビットストリーム中に独立アクセス単位が存在するとき、最低の整数数βeに基づいて前記圧縮されたHOA表現をデコードする段階であって、前記最低の整数数βeは
方法。 - 音または音場の圧縮された高次アンビソニックス(HOA)音表現をデコードする装置であって:
前記圧縮されたHOA表現を含むビットストリームを受領する手段であって、前記ビットストリームは前記圧縮されたHOA表現に対応するいくつかのHOA係数を含む、手段と;
前記ビットストリーム中に独立アクセス単位が存在するとき、最低の整数数βeに基づいて前記圧縮されたHOA表現をデコードする手段であって、前記最低の整数数βeは
装置。 - KMAX=1.5である、請求項10記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14306026 | 2014-06-27 | ||
EP14306026.7 | 2014-06-27 | ||
PCT/EP2015/063917 WO2015197516A1 (en) | 2014-06-27 | 2015-06-22 | Method for determining for the compression of an hoa data frame representation a lowest integer number of bits required for representing non-differential gain values |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019237723A Division JP6872002B2 (ja) | 2014-06-27 | 2019-12-27 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017523457A JP2017523457A (ja) | 2017-08-17 |
JP6641303B2 true JP6641303B2 (ja) | 2020-02-05 |
Family
ID=51178841
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016575018A Active JP6641303B2 (ja) | 2014-06-27 | 2015-06-22 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2019237723A Active JP6872002B2 (ja) | 2014-06-27 | 2019-12-27 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2021069477A Active JP7275191B2 (ja) | 2014-06-27 | 2021-04-16 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2023076033A Active JP7516610B2 (ja) | 2014-06-27 | 2023-05-02 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2024107100A Pending JP2024147600A (ja) | 2014-06-27 | 2024-07-03 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019237723A Active JP6872002B2 (ja) | 2014-06-27 | 2019-12-27 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2021069477A Active JP7275191B2 (ja) | 2014-06-27 | 2021-04-16 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2023076033A Active JP7516610B2 (ja) | 2014-06-27 | 2023-05-02 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
JP2024107100A Pending JP2024147600A (ja) | 2014-06-27 | 2024-07-03 | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Country Status (7)
Country | Link |
---|---|
US (3) | US9922657B2 (ja) |
EP (3) | EP4057280A1 (ja) |
JP (5) | JP6641303B2 (ja) |
KR (3) | KR20240047489A (ja) |
CN (6) | CN113808598A (ja) |
TW (4) | TW202403729A (ja) |
WO (1) | WO2015197516A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113808598A (zh) * | 2014-06-27 | 2021-12-17 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
EP2960903A1 (en) | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
US10075802B1 (en) | 2017-08-08 | 2018-09-11 | Qualcomm Incorporated | Bitrate allocation for higher order ambisonic audio data |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
SE522453C2 (sv) * | 2000-02-28 | 2004-02-10 | Scania Cv Ab | Sätt och anordning för styrning av ett mekaniskt tillsatsaggregat i ett motorfordon |
CN1138254C (zh) * | 2001-03-19 | 2004-02-11 | 北京阜国数字技术有限公司 | 一种基于小波变换的音频信号压缩编/解码方法 |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
ATE527654T1 (de) * | 2004-03-01 | 2011-10-15 | Dolby Lab Licensing Corp | Mehrkanal-audiodecodierung |
WO2009001874A1 (ja) | 2007-06-27 | 2008-12-31 | Nec Corporation | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
EP2605244B1 (en) * | 2008-09-17 | 2015-11-04 | Panasonic Intellectual Property Management Co., Ltd. | Recording medium and playback device |
TWI529703B (zh) * | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
CA3097372C (en) * | 2010-04-09 | 2021-11-30 | Dolby International Ab | Mdct-based complex prediction stereo coding |
EP2450880A1 (en) | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
CN102760437B (zh) * | 2011-04-29 | 2014-03-12 | 上海交通大学 | 实时声道控制转换的音频解码装置 |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
CN107071687B (zh) | 2012-07-16 | 2020-02-14 | 杜比国际公司 | 用于渲染音频声场表示以供音频回放的方法和设备 |
EP2733963A1 (en) * | 2012-11-14 | 2014-05-21 | Thomson Licensing | Method and apparatus for facilitating listening to a sound signal for matrixed sound signals |
EP2738962A1 (en) * | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
EP2824661A1 (en) | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
CN106471822B (zh) * | 2014-06-27 | 2019-10-25 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的设备 |
EP2960903A1 (en) * | 2014-06-27 | 2015-12-30 | Thomson Licensing | Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values |
KR102606212B1 (ko) * | 2014-06-27 | 2023-11-29 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 데이터 프레임들 중 특정 데이터 프레임들의 채널 신호들과 연관된 비차분 이득 값들을 포함하는 코딩된 hoa 데이터 프레임 표현 |
CN113808598A (zh) * | 2014-06-27 | 2021-12-17 | 杜比国际公司 | 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法 |
-
2015
- 2015-06-22 CN CN202111089783.1A patent/CN113808598A/zh active Pending
- 2015-06-22 EP EP22165452.8A patent/EP4057280A1/en active Pending
- 2015-06-22 CN CN202111089841.0A patent/CN113808600A/zh active Pending
- 2015-06-22 KR KR1020247011011A patent/KR20240047489A/ko active Search and Examination
- 2015-06-22 US US15/319,711 patent/US9922657B2/en active Active
- 2015-06-22 JP JP2016575018A patent/JP6641303B2/ja active Active
- 2015-06-22 KR KR1020167036543A patent/KR102428425B1/ko active IP Right Grant
- 2015-06-22 EP EP18196350.5A patent/EP3489953B8/en active Active
- 2015-06-22 EP EP15732579.6A patent/EP3161821B1/en active Active
- 2015-06-22 CN CN201580035127.XA patent/CN106663434B/zh active Active
- 2015-06-22 CN CN202111089981.8A patent/CN113793618A/zh active Pending
- 2015-06-22 KR KR1020227026372A patent/KR102655047B1/ko active IP Right Grant
- 2015-06-22 WO PCT/EP2015/063917 patent/WO2015197516A1/en active Application Filing
- 2015-06-22 CN CN202111089797.3A patent/CN113808599A/zh active Pending
- 2015-06-22 CN CN202111089793.5A patent/CN113793617A/zh active Pending
- 2015-06-26 TW TW112108235A patent/TW202403729A/zh unknown
- 2015-06-26 TW TW108142370A patent/TWI735083B/zh active
- 2015-06-26 TW TW110123995A patent/TWI797658B/zh active
- 2015-06-26 TW TW104120628A patent/TWI681385B/zh active
-
2018
- 2018-02-07 US US15/891,066 patent/US10224044B2/en active Active
- 2018-12-03 US US16/208,284 patent/US10621995B2/en active Active
-
2019
- 2019-12-27 JP JP2019237723A patent/JP6872002B2/ja active Active
-
2021
- 2021-04-16 JP JP2021069477A patent/JP7275191B2/ja active Active
-
2023
- 2023-05-02 JP JP2023076033A patent/JP7516610B2/ja active Active
-
2024
- 2024-07-03 JP JP2024107100A patent/JP2024147600A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7267340B2 (ja) | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 | |
JP7423585B2 (ja) | Hoaデータ・フレーム表現のデータ・フレームの個々のもののチャネル信号に関連付けられた非差分的な利得値を含む符号化されたhoaデータ・フレーム表現 | |
JP6869296B2 (ja) | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する方法および装置 | |
JP7275191B2 (ja) | 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170224 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180615 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190716 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6641303 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |