JP2017513338A - 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 - Google Patents
高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 Download PDFInfo
- Publication number
- JP2017513338A JP2017513338A JP2016557317A JP2016557317A JP2017513338A JP 2017513338 A JP2017513338 A JP 2017513338A JP 2016557317 A JP2016557317 A JP 2016557317A JP 2016557317 A JP2016557317 A JP 2016557317A JP 2017513338 A JP2017513338 A JP 2017513338A
- Authority
- JP
- Japan
- Prior art keywords
- hoa
- signal
- component
- vector
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000005236 sound signal Effects 0.000 claims abstract description 83
- 239000010410 layer Substances 0.000 claims description 182
- 230000015572 biosynthetic process Effects 0.000 claims description 32
- 238000003786 synthesis reaction Methods 0.000 claims description 32
- 238000000354 decomposition reaction Methods 0.000 claims description 29
- 230000004048 modification Effects 0.000 claims description 16
- 238000012986 modification Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 12
- 230000005540 biological transmission Effects 0.000 claims description 11
- 239000002356 single layer Substances 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 7
- 230000008901 benefit Effects 0.000 claims description 5
- 230000002093 peripheral effect Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 3
- 230000008447 perception Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims 2
- 230000004044 response Effects 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 claims 1
- HLOPMQJRUIOMJO-SWOZAWMQSA-N L-2-amino-4-methoxy-cis-but-3-enoic acid Chemical compound CO\C=C/[C@H](N)C(O)=O HLOPMQJRUIOMJO-SWOZAWMQSA-N 0.000 description 27
- NTABMUJQZABQGD-UHFFFAOYSA-N dimethylindole red Chemical compound CC1(C)C2=CC=CC=C2N(C)\C1=C\C=C\C1=CC=[N+](CCCS([O-])(=O)=O)C2=CC=CC=C12 NTABMUJQZABQGD-UHFFFAOYSA-N 0.000 description 15
- 230000006835 compression Effects 0.000 description 13
- 238000007906 compression Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 230000006837 decompression Effects 0.000 description 8
- 238000012937 correction Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000002355 dual-layer Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000005428 wave function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Stereophonic System (AREA)
Abstract
Description
CAMB(k−1)=C(k−1)−CPS(k−1) (1)
に従ってもとのHOA表現C(k−1)から優勢音HOA表現CPS(k−1)を減算することによって実行される。
CAMB(k−1)=C(k−1)−CPS(k−1) (1)
に従ってもとのHOA表現C(k−1)から優勢音HOA表現CPS(k−1)を減算することによって実行される。
を有する。
階層化モード指示LMFDが少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、優勢HOA音成分^CPS(k−1)と周囲HOA成分
方向およびベクトル推定ブロック301においてHOA信号の方向およびベクトル推定処理801を実行する段階であって、方向性信号についての第一のタプル集合MDIR(k)およびベクトル・ベースの信号についての第二のタプル集合MVEC(k)を含むデータが得られ、各第一のタプル集合MDIR(k)は、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、各第二のタプル集合MVEC(k)は、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む、段階と;
HOA分解ブロック303において、HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号XPS(k−1)のフレームと、周囲HOA成分
周囲成分修正ブロック304において、周囲HOA成分CAMB(k−1)を、前記目標割り当てベクトルvA,T(k−1)によって与えられる情報に従って修正803する段階であって、周囲HOA成分CAMB(k−1)のどの係数シーケンスが所与の数I個のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定され、修正された(modified)周囲HOA成分CM,A(k−2)および時間的に予測された(predicted)修正された周囲HOA成分CP,M,A(k−1)が得られ、前記目標割り当てベクトルvA,T(k−1)内の情報から、最終的な割り当てベクトルvA(k−2)が得られる、段階と;
チャネル割り当てブロック105において、上記分解から得られた優勢音信号XPS(k−1)と、修正された周囲HOA成分CM,A(k−2)および時間的に予測された修正された周囲HOA成分CP,M,A(k−1)の決定された係数シーケンスを、最終的な割り当てベクトルvA(k−2)によって与えられる情報を使って、上記所与の数I個のチャネルに割り当てる804段階であって、トランスポート信号yi(k−2)、i=1,…,Iおよび予測されたトランスポート信号yP,i(k−2)、i=1,…,Iが得られる、段階と;
複数の利得制御ブロック306において、前記トランスポート信号yi(k−2)および前記予測されたトランスポート信号yP,i(k−2)に対して利得制御805を実行する段階であって、利得修正されたトランスポート信号zi(k−2)、指数ei(k−2)および例外フラグβi(k−2)が得られる、段階とを含む。
知覚的符号化器310において、前記利得修正されたトランスポート信号zi(k−2)を知覚的に符号化する806段階であって、知覚的にエンコードされたトランスポート信号
一つまたは複数のサイド情報源符号化器320、330において、前記指数ei(k−2)および例外フラグβi(k−2)、前記第一のタプル集合MDIR(k)および第二のタプル集合MVEC(k)、前記予測パラメータξ(k−1)および前記最終的な割り当てベクトルvA(k−2)を含むサイド情報をエンコードする段階であって、エンコードされたサイド情報
知覚的にエンコードされたトランスポート信号
圧縮された基本層ビットストリーム
圧縮された向上層ビットストリーム
知覚的にエンコードされたトランスポート信号
基本層サイド情報源デコーダ530において、第一のエンコードされたサイド情報
向上層サイド情報源デコーダ560において、第二のエンコードされたサイド情報
逆利得制御を実行910する段階であって、前記第一の知覚的にデコードされたトランスポート信号
チャネル再割り当てブロック605において、前記第一および第二の利得補正された信号フレーム^yi(k)、i=1,…,IをI個のチャネルに再分配911する段階であって、優勢音信号のフレーム^XPS(k)が再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分
チャネル再割り当てブロック605において、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合IAMB,ACT(k)と、(k−1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合IE(k−1)、ID(k−1)、IU(k−1)とを生成911bする段階と;
優勢音合成ブロック606において、優勢HOA音成分^CPS(k−1)のHOA表現を、前記優勢音信号^XPS(k)から合成912する段階であって、前記第一および第二のタプル集合MDIR(k+1)、MVEC(k+1)、予測パラメータζ(k+1)およびインデックスの第二の集合IE(k−1)、ID(k−1)、IU(k−1)が使用される、段階と;
周囲合成ブロック607において、周囲HOA成分
HOA合成ブロック608において、優勢HOA音成分^CPS(k−1)および周囲HOA成分
階層化モード指示LMFDが少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、優勢HOA音成分^CPS(k−1)と周囲HOA成分
Claims (18)
- HOA係数シーケンスの入力時間フレーム(C(k))をもつ次数Nの入力HOA表現である高次アンビソニックス(HOA)信号を圧縮するための方法(800)であって、当該方法は、前記入力時間フレームの空間的HOAエンコードならびにその後の知覚的エンコードおよび源エンコードを含み、
前記空間的HOAエンコードは、
・方向およびベクトル推定ブロック(301)において前記HOA信号の方向およびベクトル推定処理(801)を実行する段階であって、方向性信号についての第一のタプル集合(MDIR(k))およびベクトル・ベースの信号についての第二のタプル集合(MVEC(k))を含むデータが得られ、前記第一のタプル集合(MDIR(k))のそれぞれは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、前記第二のタプル集合(MVEC(k))のそれぞれは、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む、段階と;
・HOA分解ブロック(303)において、前記HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号(XPS(k−1))のフレームと、周囲HOA成分
・周囲成分修正ブロック(304)において、前記周囲HOA成分(CAMB(k−1))を、前記目標割り当てベクトル(vA,T(k−1))によって与えられる情報に従って修正(803)する段階であって、前記周囲HOA成分(CAMB(k−1))のどの係数シーケンスが前記所与の数(I)のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定され、修正された周囲HOA成分(CM,A(k−2))および時間的に予測された修正された周囲HOA成分(CP,M,A(k−1))が得られ、前記目標割り当てベクトル(vA,T(k−1))内の情報から、最終的な割り当てベクトル(vA(k−2))が得られる、段階と;
・チャネル割り当てブロック(105)において、前記分解から得られた前記優勢音信号(XPS(k−1))と、前記修正された周囲HOA成分(CM,A(k−2))および前記時間的に予測された修正された周囲HOA成分(CP,M,A(k−1))の決定された係数シーケンスを、前記最終的な割り当てベクトル(vA(k−2))によって与えられる情報を使って、前記所与の数(I)のチャネルに割り当てる(804)段階であって、トランスポート信号yi(k−2)、i=1,…,Iおよび予測されたトランスポート信号yP,i(k−2)、i=1,…,Iが得られる、段階と;
・複数の利得制御ブロック(306)において、前記トランスポート信号(yi(k−2))および前記予測されたトランスポート信号(yP,i(k−2))に対して利得制御(805)を実行する段階であって、利得修正されたトランスポート信号(zi(k−2))、指数(ei(k−2))および例外フラグ(βi(k−2))が得られる、段階とを含み、
前記知覚的エンコードおよび源エンコードは、
・知覚的符号化器(310)において、前記利得修正されたトランスポート信号(zi(k−2))を知覚的に符号化する(806)段階であって、知覚的にエンコードされたトランスポート信号
・サイド情報源符号化器(320、330)において、前記指数(ei(k−2))および例外フラグ(βi(k−2))、前記第一のタプル集合(MDIR(k))および第二のタプル集合(MVEC(k))、前記予測パラメータ(ξ(k−1))および前記最終的な割り当てベクトル(vA(k−2))を含むサイド情報をエンコードする(807)段階であって、エンコードされたサイド情報
・前記知覚的にエンコードされたトランスポート信号
・前記分解する段階(802)において得られる前記周囲HOA成分
・最初のOMIN個の指数(ei(k−2)、i=1,…,OMIN)および例外フラグ(βi(k−2)、i=1,…,OMIN)は基本層サイド情報源符号化器(320)においてエンコードされ、エンコードされた基本層サイド情報
・前記最初のOMIN個の知覚的にエンコードされたトランスポート信号
・残りのI−OMIN個の指数(ei(k−2)、i=OMIN+1,…,I)および例外フラグ(βi(k−2)、i=OMIN+1,…,I)、前記第一のタプル集合(MDIR(k−1))および第二のタプル集合(MVEC(k−1))、前記予測パラメータ(ξ(k−1))および前記最終的な割り当てベクトル(vA(k−2))は、向上層サイド情報エンコーダ(330)においてエンコードされ、エンコードされた向上層サイド情報
・残りのI−OMIN個の知覚的にエンコードされたトランスポート信号
・階層化モードの使用を信号伝達するモード指示が加えられ(811)、
当該方法がさらに、基本層ビットストリーム
方法。 - 前記優位方向推定は、エネルギー的に優位なHOA成分の方向性パワー分布に依存する、請求項1記載の方法。
- 選ばれるHOA係数シーケンスのHOAシーケンス・インデックスが相続くフレーム間で変わる場合には、前記周囲HOA成分を修正する際、係数シーケンスのフェードインおよびフェードアウトが実行される、請求項1または2記載の方法。
- 前記周囲HOA成分を修正する際、前記周囲HOA成分(CAMB(k−1))の部分的脱相関が実行される、請求項1ないし3のうちいずれか一項記載の方法。
- 前記第一のタプル集合(MDIR(k))に含まれる量子化された方向は優位方向である、請求項1ないし4のうちいずれか一項記載の方法。
- 多重化された圧縮された高次アンビソニックス(HOA)信号を圧縮解除する方法(900)であって、当該方法は、HOA係数シーケンスの出力時間フレーム(^C(k−1))を得るために、知覚的デコードおよび源デコードならびにその後の空間的HOAデコードを含み、当該方法は、
・前記圧縮された高次アンビソニックス(HOA)信号が圧縮された基本層ビットストリーム
・階層化モードの前記検出に際して、前記多重化された圧縮されたHOA信号を多重分離する段階であって、圧縮された基本層ビットストリームおよび圧縮された向上層ビットストリームが得られる、段階とを含み、
前記知覚的デコードおよび源デコードは、
・前記圧縮された基本層ビットストリーム
・圧縮された向上層ビットストリーム
・前記知覚的にエンコードされたトランスポート信号
・基本層サイド情報源デコーダ(530)において、前記第一のエンコードされたサイド情報
・向上層サイド情報源デコーダ(560)において、前記第二のエンコードされたサイド情報
前記空間的HOAデコードは、
・逆利得制御(604)を実行する(910)段階であって、前記第一の知覚的にデコードされたトランスポート信号
・チャネル再割り当てブロック(605)において、前記第一および第二の利得補正された信号フレーム(^yi(k)、i=1,…,I)をI個のチャネルに再分配する(911)段階であって、優勢音信号のフレーム(^XPS(k))が再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分
・チャネル再割り当てブロック(605)において、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合(IAMB,ACT(k))と、(k−1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合(IE(k−1)、ID(k−1)、IU(k−1))とを生成する(911b)段階と;
・優勢音合成ブロック(606)において、前記優勢HOA音成分(^CPS(k−1))のHOA表現を、前記優勢音信号(^XPS(k))から合成する(912)段階であって、前記第一および第二のタプル集合(MDIR(k+1)、MVEC(k+1))、前記予測パラメータ(ζ(k+1))およびインデックスの前記第二の集合(IE(k−1)、ID(k−1)、IU(k−1))が使用される、段階と;
・周囲合成ブロック(607)において、周囲HOA成分
前記階層化モード指示(LMFD)が少なくとも二つの層をもつ階層化モードを示す場合、前記周囲HOA成分は、そのOMIN個の最低位の位置に、圧縮解除されたHOA信号(^C(k−1))のHOA係数シーケンスを含み、残りのより高位の位置に、圧縮解除されたHOA信号(^C(k−1))と、優勢HOA音成分(^CPS(k−1))のHOA表現との間の残差のHOA表現の一部である係数シーケンスを含み、
前記階層化モード指示(LMFD)が単一層モードを示す場合には、前記周囲HOA成分は、圧縮解除されたHOA信号(^C(k−1))と、優勢HOA音成分(^CPS(k−1))のHOA表現との間の残差である、段階と;
・HOA合成ブロック(608)において、前記優勢HOA音成分(^CPS(k−1))および前記周囲HOA成分
前記階層化モード指示(LMFD)が少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、前記優勢HOA音成分(^CPS(k−1))と前記周囲HOA成分
前記階層化モード指示(LMFD)が単一層モードを示す場合には、圧縮解除されたHOA信号(^C'(k−1))のすべての係数チャネルは、前記優勢HOA音成分(^CPS(k−1))と前記周囲HOA成分
方法。 - HOA係数シーケンスの入力時間フレーム(C(k))をもつ次数Nの入力HOA表現である高次アンビソニックス(HOA)信号を圧縮するための装置であって、当該装置は、前記入力時間フレームの空間的HOAエンコードならびにその後の知覚的エンコードのための空間的HOAエンコードおよび知覚的エンコード部と、源エンコードのための源符号化器部とを有し、
前記空間的HOAエンコードおよび知覚的エンコード部は、
・前記HOA信号の方向およびベクトル推定処理を実行するよう適応された方向およびベクトル推定ブロック(301)であって、方向性信号についての第一のタプル集合(MDIR(k))およびベクトル・ベースの信号についての第二のタプル集合(MVEC(k))を含むデータが得られ、前記第一のタプル集合(MDIR(k))のそれぞれは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、前記第二のタプル集合(MVEC(k))のそれぞれは、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む、方向およびベクトル推定ブロック(301)と;
・前記HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号(XPS(k−1))のフレームと、周囲HOA成分
・前記周囲HOA成分(CAMB(k−1))を、前記目標割り当てベクトル(vA,T(k−1))によって与えられる情報に従って修正するよう適応された周囲成分修正ブロック(304)であって、前記周囲HOA成分(CAMB(k−1))のどの係数シーケンスが前記所与の数(I)のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定され、修正された周囲HOA成分(CM,A(k−2))および時間的に予測された修正された周囲HOA成分(CP,M,A(k−1))が得られ、前記目標割り当てベクトル(vA,T(k−1))内の情報から、最終的な割り当てベクトル(vA(k−2))が得られる、周囲成分修正ブロック(304)と;
・前記分解から得られた前記優勢音信号(XPS(k−1))と、前記修正された周囲HOA成分(CM,A(k−2))および前記時間的に予測された修正された周囲HOA成分(CP,M,A(k−1))の決定された係数シーケンスを、前記最終的な割り当てベクトルvA(k−2)によって与えられる情報を使って、前記所与の数(I)のチャネルに割り当てるよう適応されたチャネル割り当てブロック(305)であって、トランスポート信号yi(k−2)、i=1,…,Iおよび予測されたトランスポート信号yP,i(k−2)、i=1,…,Iが得られる、チャネル割り当てブロック(305)と;
・前記トランスポート信号(yi(k−2))および前記予測されたトランスポート信号(yP,i(k−2))に対して利得制御(805)を実行するよう適応された複数の利得制御ブロック(306)であって、利得修正されたトランスポート信号(zi(k−2))、指数(ei(k−2))および例外フラグ(βi(k−2))が得られる、複数の利得制御ブロック(306)とを有しており、
前記源符号化器部は、
・前記利得修正されたトランスポート信号(zi(k−2))を知覚的に符号化する(806)よう適応された知覚的符号化器(310)であって、知覚的にエンコードされたトランスポート信号
・前記指数(ei(k−2))および例外フラグ(βi(k−2))、前記第一のタプル集合(MDIR(k))および第二のタプル集合(MVEC(k))、前記予測パラメータ(ξ(k−1))および前記最終的な割り当てベクトル(vA(k−2))を含むサイド情報をエンコードする(807)よう適応されたサイド情報源符号化器(320、330)であって、エンコードされたサイド情報
・前記知覚的にエンコードされたトランスポート信号
・前記分解において得られる前記周囲HOA成分
・最初のOMIN個の指数(ei(k−2)、i=1,…,OMIN)および例外フラグ(βi(k−2)、i=1,…,OMIN)は基本層サイド情報源符号化器(320)においてエンコードされ、エンコードされた基本層サイド情報
・前記最初のOMIN個の知覚的にエンコードされたトランスポート信号
・残りのI−OMIN個の指数(ei(k−2)、i=OMIN+1,…,I)および例外フラグ(βi(k−2)、i=OMIN+1,…,I)、前記第一のタプル集合(MDIR(k−1))および第二のタプル集合(MVEC(k−1))、前記予測パラメータ(ξ(k−1))および前記最終的な割り当てベクトル(vA(k−2))は、前記サイド情報源符号化器内の向上層サイド情報エンコーダ(330)においてエンコードされ、エンコードされた向上層サイド情報
・残りのI−OMIN個の知覚的にエンコードされたトランスポート信号
・マルチプレクサまたは追加器において、階層化モードの使用を信号伝達するモード指示が加えられ、
前記基本層ビットストリーム
装置。 - 前記第一のタプル集合(MDIR(k−1))および第二のタプル集合(MVEC(k−1))を遅延させるための二つの遅延ブロック(302)をさらに有する、請求項8記載の装置。
- 前記優位方向推定は、エネルギー的に優位なHOA成分の方向性パワー分布に依存する、請求項8または9記載の装置。
- 選ばれるHOA係数シーケンスのHOAシーケンス・インデックスが相続くフレーム間で変わる場合には、前記周囲HOA成分を修正する際、係数シーケンスのフェードインおよびフェードアウトが実行される、請求項8ないし10のうちいずれか一項記載の装置。
- 前記周囲HOA成分を修正する際、前記周囲HOA成分(CAMB(k−1))の部分的脱相関が実行される、請求項8ないし11のうちいずれか一項記載の装置。
- 前記第一のタプル集合(MDIR(k))に含まれる量子化された方向は優位方向である、請求項8ないし12のうちいずれか一項記載の装置。
- 多重化された圧縮された高次アンビソニックス(HOA)信号を圧縮解除してHOA係数シーケンスの出力時間フレーム(^C(k−1))を得る装置であって、当該装置は、知覚的デコードおよび源デコード部ならびに空間的HOAデコード部を含み、当該装置は、
・前記圧縮された高次アンビソニックス(HOA)信号が圧縮された基本層ビットストリーム
・前記モード検出器に応答して、前記多重化された圧縮されたHOA信号を多重分離するデマルチプレクサであって、圧縮された基本層ビットストリームおよび圧縮された向上層ビットストリームが得られる、デマルチプレクサとを有しており、
前記知覚的デコードおよび源デコード部は、
・前記圧縮された基本層ビットストリーム
・前記圧縮された向上層ビットストリーム
・前記知覚的にエンコードされたトランスポート信号
・前記第一のエンコードされたサイド情報
・前記第二のエンコードされたサイド情報
前記空間的HOAデコード部は、
・逆利得制御(604)を実行する(910)複数の逆利得制御ユニットであって、前記第一の知覚的にデコードされたトランスポート信号
・前記第一および第二の利得補正された信号フレーム(^yi(k)、i=1,…,I)をI個のチャネルに再分配する(911)よう適応されたチャネル再割り当てブロック(605)であって、優勢音信号のフレーム(^XPS(k))が再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分
前記チャネル再割り当てブロック(605)は、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合(IAMB,ACT(k))と、(k−1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合(IE(k−1)、ID(k−1)、IU(k−1))とを生成する(911b)よう適応されている、チャネル再割り当てブロック(605)と;
・前記優勢HOA音成分(^CPS(k−1))のHOA表現を、前記優勢音信号(^XPS(k))から合成する(912)よう適応された優勢音合成ブロック(606)であって、前記第一および第二のタプル集合(MDIR(k+1)、MVEC(k+1))、前記予測パラメータ(ζ(k+1))およびインデックスの前記第二の集合(IE(k−1)、ID(k−1)、IU(k−1))が使用される、優勢音合成ブロック(606)と;
・周囲HOA成分
前記階層化モード指示(LMFD)が少なくとも二つの層をもつ階層化モードを示す場合、前記周囲HOA成分は、そのOMIN個の最低位の位置に、圧縮解除されたHOA信号(^C(k−1))のHOA係数シーケンスを含み、残りのより高位の位置に、圧縮解除されたHOA信号(^C(k−1))と、優勢HOA音成分(^CPS(k−1))のHOA表現との間の残差のHOA表現の一部である係数シーケンスを含み、
前記階層化モード指示(LMFD)が単一層モードを示す場合には、前記周囲HOA成分は、圧縮解除されたHOA信号(^C(k−1))と、優勢HOA音成分(^CPS(k−1))のHOA表現との間の残差である、周囲合成ブロック(607)と;
・前記優勢HOA音成分(^CPS(k−1))および前記周囲HOA成分
前記階層化モード指示(LMFD)が少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、前記優勢HOA音成分(^CPS(k−1))と前記周囲HOA成分
前記階層化モード指示(LMFD)が単一層モードを示す場合には、圧縮解除されたHOA信号(^C'(k−1))のすべての係数チャネルは、前記優勢HOA音成分(^CPS(k−1))と前記周囲HOA成分
装置。 - HOA係数シーケンスの入力時間フレームをもつ次数Nの入力HOA表現である高次アンビソニックス(HOA)信号を圧縮するための方法(800)をコンピュータに実行させるための実行可能命令を有する非一時的なコンピュータ可読記憶媒体であって、前記方法は、前記入力時間フレームの空間的HOAエンコードならびにその後の知覚的エンコードおよび源エンコードを含み、
前記空間的HOAエンコードは、
・方向およびベクトル推定ブロックにおいて前記HOA信号の方向およびベクトル推定処理を実行する段階であって、方向性信号についての第一のタプル集合およびベクトル・ベースの信号についての第二のタプル集合を含むデータが得られ、前記第一のタプル集合のそれぞれは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、前記第二のタプル集合のそれぞれは、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む、段階と;
・HOA分解ブロックにおいて、前記HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号のフレームと、周囲HOA成分のフレームとに分解する段階であって、前記優勢音信号は前記方向性音信号および前記ベクトル・ベースの音信号を含み、該分解はさらに、予測パラメータおよび目標割り当てベクトルを提供し、前記予測パラメータは、前記優勢音信号内の前記方向性信号からどのようにして、優勢音HOA成分を豊かにするよう前記HOA信号表現の諸部分を予測するかを記述し、前記目標割り当てベクトルは、所与の数(I)のチャネルに前記優勢音信号をどのようにして割り当てるかについての情報を含む、段階と;
・周囲成分修正ブロックにおいて、前記周囲HOA成分を、前記目標割り当てベクトルによって与えられる情報に従って修正する段階であって、前記周囲HOA成分のどの係数シーケンスが前記所与の数のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定され、修正された周囲HOA成分および時間的に予測された修正された周囲HOA成分が得られ、前記目標割り当てベクトル内の情報から、最終的な割り当てベクトルが得られる、段階と;
・チャネル割り当てブロックにおいて、前記分解から得られた前記優勢音信号と、前記修正された周囲HOA成分および前記時間的に予測された修正された周囲HOA成分の決定された係数シーケンスを、前記最終的な割り当てベクトルによって与えられる情報を使って、前記所与の数のチャネルに割り当てる段階であって、トランスポート信号yi(k−2)、i=1,…,Iおよび予測されたトランスポート信号yP,i(k−2)、i=1,…,Iが得られる、段階と;
・複数の利得制御ブロックにおいて、前記トランスポート信号および前記予測されたトランスポート信号に対して利得制御を実行する段階であって、利得修正されたトランスポート信号、指数および例外フラグが得られる、段階とを含み、
前記知覚的エンコードおよび源エンコードは、
・知覚的符号化器において、前記利得修正されたトランスポート信号を知覚的に符号化する段階であって、知覚的にエンコードされたトランスポート信号が得られる、段階と;
・サイド情報源符号化器において、前記指数および例外フラグ、前記第一のタプル集合および第二のタプル集合、前記予測パラメータおよび前記最終的な割り当てベクトルを含むサイド情報をエンコードする段階であって、エンコードされたサイド情報が得られる、段階と;
・前記知覚的にエンコードされたトランスポート信号および前記エンコードされたサイド情報を多重化する段階であって、多重化されたデータ・ストリームが得られる、段階とを含み、
・前記分解する段階において得られる前記周囲HOA成分は、前記入力HOA表現の最初の諸HOA係数シーケンスをOMIN個の最低位の位置に、第二のHOA係数シーケンスを残りのより高位の位置に含み、前記第二のHOA係数シーケンスは、前記入力HOA表現と前記優勢音信号の前記HOA表現との間の残差のHOA表現の一部であり、
・最初のOMIN個の指数および例外フラグは基本層サイド情報源符号化器においてエンコードされ、エンコードされた基本層サイド情報が得られ、OMIN=(NMIN+1)2であり、O=(N+1)2であり、NMIN≦NかつOMIN≦Iであり、NMINはあらかじめ定義された整数値であり、
・前記最初のOMIN個の知覚的にエンコードされたトランスポート信号およびエンコードされた基本層サイド情報は基本層ビットストリーム・マルチプレクサにおいて多重化され、基本層ビットストリームが得られ、
・残りのI−OMIN個の指数および例外フラグ、前記第一のタプル集合および第二のタプル集合、前記予測パラメータおよび前記最終的な割り当てベクトルは、向上層サイド情報エンコーダにおいてエンコードされ、エンコードされた向上層サイド情報が得られ、
・残りのI−OMIN個の知覚的にエンコードされたトランスポート信号およびエンコードされた向上層サイド情報は、向上層ビットストリーム・マルチプレクサにおいて多重化され、向上層ビットストリームが得られ、
・階層化モードの使用を信号伝達するモード指示が加えられ、
前記方法がさらに、前記基本層ビットストリームと、向上層ビットストリームと、モード指示とを単一のビットストリームに多重化する最終段階を含む、
記憶媒体。 - 多重化された圧縮された高次アンビソニックス(HOA)信号を圧縮解除する方法(900)をコンピュータに実行させるための実行可能命令を有する非一時的なコンピュータ可読記憶媒体であって、前記方法は、HOA係数シーケンスの出力時間フレームを得るために、知覚的デコードおよび源デコードならびにその後の空間的HOAデコードを含み、前記方法は、
・前記圧縮された高次アンビソニックス(HOA)信号が圧縮された基本層ビットストリームおよび圧縮された向上層ビットストリームを含むことを示す階層化モード指示を検出する段階と;
・前記検出に際して、前記多重化された圧縮されたHOA信号を多重分離する段階であって、圧縮された基本層ビットストリームおよび圧縮された向上層ビットストリームが得られる、段階とを含み、
前記知覚的デコードおよび源デコードは、
・前記圧縮された基本層ビットストリームを多重分離する段階であって、第一の知覚的にエンコードされたトランスポート信号
・圧縮された向上層ビットストリームを多重分離する段階であって、第二の知覚的にエンコードされたトランスポート信号
・前記知覚的にエンコードされたトランスポート信号を知覚的にデコードする段階であって、知覚的にデコードされたトランスポート信号が得られ、基本層知覚的デコーダにおいて、基本層の前記第一の知覚的にエンコードされたトランスポート信号がデコードされて、第一の知覚的にデコードされたトランスポート信号が得られ、向上層知覚的デコーダにおいて、向上層の前記第二の知覚的にエンコードされたトランスポート信号がデコードされて、第二の知覚的にデコードされたトランスポート信号が得られる、段階と;
・基本層サイド情報源デコーダにおいて、前記第一のエンコードされたサイド情報をデコードする段階であって、第一の指数および第一の例外フラグが得られる、段階と;
・向上層サイド情報源デコーダにおいて、前記第二のエンコードされたサイド情報をデコードする段階であって、第二の指数および第二の例外フラグが得られ、さらなるデータが得られ、前記さらなるデータは、方向性信号についての第一のタプル集合およびベクトル・ベースの信号についての第二のタプル集合を含み、前記第一のタプル集合の各タプルは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、前記第二のタプル集合の各タプルは、ベクトル・ベースの信号のインデックスおよび該ベクトル・ベースの信号の方向分布を定義するベクトルを含み、さらに、予測パラメータおよび周囲割り当てベクトルが得られ、前記周囲割り当てベクトルは、各伝送チャネルについて、前記周囲HOA成分の係数シーケンスを含んでいるかどうかおよびどの係数シーケンスを含んでいるかを示す成分を含む、段階とを含み;
前記空間的HOAデコードは、
・逆利得制御を実行する段階であって、前記第一の知覚的にデコードされたトランスポート信号が、前記第一の指数および前記第一の例外フラグに従って、第一の利得補正された信号フレームに変換され、前記第二の知覚的にデコードされたトランスポート信号が、前記第二の指数および前記第二の例外フラグに従って、第二の利得補正された信号フレームに変換される、段階と;
・チャネル再割り当てブロックにおいて、前記第一および第二の利得補正された信号フレーム(^yi(k)、i=1,…,I)をI個のチャネルに再分配する段階であって、優勢音信号のフレームが再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分が得られ、前記割り当ては、前記周囲割り当てベクトルならびに前記第一および第二のタプル集合内の情報に従ってなされる、段階と;
・チャネル再割り当てブロックにおいて、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合と、(k−1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合とを生成する段階と;
・優勢音合成ブロックにおいて、前記優勢HOA音成分のHOA表現を、前記優勢音信号から合成する段階であって、前記第一および第二のタプル集合、前記予測パラメータおよびインデックスの前記第二の集合が使用される、段階と;
・周囲合成ブロックにおいて、周囲HOA成分を、修正された周囲HOA成分から合成する段階であって、最初のOMIN個のチャネルについての逆空間的変換がなされ、インデックスの前記第一の集合が使用され、インデックスの前記第一の集合は、k番目のフレームにおいてアクティブである前記周囲HOA成分の係数シーケンスのインデックスであり、
前記階層化モード指示が少なくとも二つの層をもつ階層化モードを示す場合、前記周囲HOA成分は、そのOMIN個の最低位の位置に、圧縮解除されたHOA信号のHOA係数シーケンスを含み、残りのより高位の位置に、圧縮解除されたHOA信号と、優勢HOA音成分のHOA表現との間の残差のHOA表現の一部である係数シーケンスを含み、
前記階層化モード指示が単一層モードを示す場合には、前記周囲HOA成分は、圧縮解除されたHOA信号と、優勢HOA音成分のHOA表現との間の残差である、段階と;
・HOA合成ブロックにおいて、前記優勢HOA音成分および前記周囲HOA成分のHOA表現を加算する段階であって、前記優勢音信号のHOA表現の係数と、前記周囲HOA成分の対応する係数とが加算され、圧縮解除されたHOA信号が得られ、
前記階層化モード指示が少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、前記優勢HOA音成分と前記周囲HOA成分の加算によって得られ、圧縮解除されたHOA信号の低いほうからのOMIN個の係数チャネルは、前記周囲HOA成分からコピーされ、
前記階層化モード指示が単一層モードを示す場合には、圧縮解除されたHOA信号のすべての係数チャネルは、前記優勢HOA音成分と前記周囲HOA成分の加算によって得られる、段階とを含む、
記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14305413.8 | 2014-03-21 | ||
EP14305413 | 2014-03-21 | ||
PCT/EP2015/055917 WO2015140293A1 (en) | 2014-03-21 | 2015-03-20 | Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017215451A Division JP6526153B2 (ja) | 2014-03-21 | 2017-11-08 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017513338A true JP2017513338A (ja) | 2017-05-25 |
JP6243060B2 JP6243060B2 (ja) | 2017-12-06 |
Family
ID=50439307
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016557317A Active JP6243060B2 (ja) | 2014-03-21 | 2015-03-20 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2017215451A Active JP6526153B2 (ja) | 2014-03-21 | 2017-11-08 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2019087310A Active JP6949900B2 (ja) | 2014-03-21 | 2019-05-07 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2021153985A Active JP7374969B2 (ja) | 2014-03-21 | 2021-09-22 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2023135299A Pending JP2023153310A (ja) | 2014-03-21 | 2023-08-23 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017215451A Active JP6526153B2 (ja) | 2014-03-21 | 2017-11-08 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2019087310A Active JP6949900B2 (ja) | 2014-03-21 | 2019-05-07 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2021153985A Active JP7374969B2 (ja) | 2014-03-21 | 2021-09-22 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2023135299A Pending JP2023153310A (ja) | 2014-03-21 | 2023-08-23 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Country Status (6)
Country | Link |
---|---|
US (5) | US9818413B2 (ja) |
EP (1) | EP3120353B1 (ja) |
JP (5) | JP6243060B2 (ja) |
KR (5) | KR101846373B1 (ja) |
CN (7) | CN106233755B (ja) |
WO (1) | WO2015140293A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018535447A (ja) * | 2015-10-08 | 2018-11-29 | ドルビー・インターナショナル・アーベー | 圧縮された音または音場表現のための層構成の符号化 |
JP2021036341A (ja) * | 2015-10-08 | 2021-03-04 | ドルビー・インターナショナル・アーベー | 圧縮された音または音場表現のための層構成の符号化 |
JP7346676B2 (ja) | 2015-10-08 | 2023-09-19 | ドルビー・インターナショナル・アーベー | 圧縮された音または音場表現のための層構成の符号化 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
US10140996B2 (en) | 2014-10-10 | 2018-11-27 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
US9984693B2 (en) | 2014-10-10 | 2018-05-29 | Qualcomm Incorporated | Signaling channels for scalable coding of higher order ambisonic audio data |
AU2016335091B2 (en) * | 2015-10-08 | 2021-08-19 | Dolby International Ab | Layered coding and data structure for compressed higher-order Ambisonics sound or sound field representations |
JP7455812B2 (ja) | 2018-08-21 | 2024-03-26 | ドルビー・インターナショナル・アーベー | 即時再生フレーム(ipf)の生成、輸送及び処理のための方法、装置及びシステム |
CN109036456B (zh) * | 2018-09-19 | 2022-10-14 | 电子科技大学 | 用于立体声的源分量环境分量提取方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014535231A (ja) * | 2011-11-11 | 2014-12-25 | トムソン ライセンシングThomson Licensing | 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL2154677T3 (pl) * | 2008-08-13 | 2013-12-31 | Fraunhofer Ges Forschung | Urządzenie do wyznaczania konwertowanego przestrzennego sygnału audio |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2686654A4 (en) | 2011-03-16 | 2015-03-11 | Dts Inc | CODING AND PLAYING THREE-DIMENSIONAL AUDIOSPURES |
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
US9473870B2 (en) * | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
EP2688065A1 (en) | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for avoiding unmasking of coding noise when mixing perceptually coded multi-channel audio signals |
TWI590234B (zh) | 2012-07-19 | 2017-07-01 | 杜比國際公司 | 編碼聲訊資料之方法和裝置,以及解碼已編碼聲訊資料之方法和裝置 |
US9479886B2 (en) * | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9466305B2 (en) * | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9489955B2 (en) * | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
KR102201726B1 (ko) * | 2014-03-21 | 2021-01-12 | 돌비 인터네셔널 에이비 | 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치 |
IL276591B2 (en) * | 2015-10-08 | 2023-09-01 | Dolby Int Ab | Layered coding for voice or compressed sound field representations |
MY193124A (en) * | 2015-10-08 | 2022-09-26 | Dolby Int Ab | Layered coding for compressed sound or sound field representations |
-
2015
- 2015-03-20 JP JP2016557317A patent/JP6243060B2/ja active Active
- 2015-03-20 CN CN201580015027.0A patent/CN106233755B/zh active Active
- 2015-03-20 CN CN201811371620.0A patent/CN109410962B/zh active Active
- 2015-03-20 CN CN201811371617.9A patent/CN109410960B/zh active Active
- 2015-03-20 KR KR1020167026020A patent/KR101846373B1/ko active IP Right Grant
- 2015-03-20 WO PCT/EP2015/055917 patent/WO2015140293A1/en active Application Filing
- 2015-03-20 KR KR1020207022528A patent/KR102201961B1/ko active IP Right Grant
- 2015-03-20 CN CN202311226000.9A patent/CN117253494A/zh active Pending
- 2015-03-20 CN CN201811371619.8A patent/CN109410961B/zh active Active
- 2015-03-20 KR KR1020187009293A patent/KR102143037B1/ko active IP Right Grant
- 2015-03-20 CN CN202311226031.4A patent/CN117198304A/zh active Pending
- 2015-03-20 US US15/127,526 patent/US9818413B2/en active Active
- 2015-03-20 EP EP15715181.2A patent/EP3120353B1/en active Active
- 2015-03-20 KR KR1020227026503A patent/KR20220113837A/ko not_active Application Discontinuation
- 2015-03-20 KR KR1020217000404A patent/KR102428794B1/ko active IP Right Grant
- 2015-03-20 CN CN201811371621.5A patent/CN109410963B/zh active Active
-
2017
- 2017-09-22 US US15/713,174 patent/US10089992B2/en active Active
- 2017-11-08 JP JP2017215451A patent/JP6526153B2/ja active Active
-
2018
- 2018-08-28 US US16/115,251 patent/US10192559B2/en active Active
- 2018-12-17 US US16/222,901 patent/US10388292B2/en active Active
-
2019
- 2019-05-07 JP JP2019087310A patent/JP6949900B2/ja active Active
- 2019-07-10 US US16/508,201 patent/US10629212B2/en active Active
-
2021
- 2021-09-22 JP JP2021153985A patent/JP7374969B2/ja active Active
-
2023
- 2023-08-23 JP JP2023135299A patent/JP2023153310A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014535231A (ja) * | 2011-11-11 | 2014-12-25 | トムソン ライセンシングThomson Licensing | 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 |
Non-Patent Citations (2)
Title |
---|
HELLERUD, ERIC: ""SPATIAL REDUNDANCY IN HIGHER ORDER AMBISONICS AND ITS USE FOR LOW DELAY LOSSLESS COMPRESSION"", ICASSP 2009, JPN6017037954, 19 April 2009 (2009-04-19), US, pages 269 - 272, ISSN: 0003655870 * |
MOREAU, SEBASTIEN: ""3D Sound Field Recording with Higher Order Ambisonics - Objective Measurements and Validation of Sp", AES CONVENTION PAPER 6857, JPN6017037955, 1 May 2006 (2006-05-01), JP, ISSN: 0003655871 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018535447A (ja) * | 2015-10-08 | 2018-11-29 | ドルビー・インターナショナル・アーベー | 圧縮された音または音場表現のための層構成の符号化 |
JP2021036341A (ja) * | 2015-10-08 | 2021-03-04 | ドルビー・インターナショナル・アーベー | 圧縮された音または音場表現のための層構成の符号化 |
US11232801B2 (en) | 2015-10-08 | 2022-01-25 | Dolby International Ab | Layered coding for compressed sound or sound field representations |
JP7122359B2 (ja) | 2015-10-08 | 2022-08-19 | ドルビー・インターナショナル・アーベー | 圧縮された音または音場表現のための層構成の符号化 |
US11626119B2 (en) | 2015-10-08 | 2023-04-11 | Dolby International Ab | Layered coding for compressed sound or sound field representations |
JP7346676B2 (ja) | 2015-10-08 | 2023-09-19 | ドルビー・インターナショナル・アーベー | 圧縮された音または音場表現のための層構成の符号化 |
US11948587B2 (en) | 2015-10-08 | 2024-04-02 | Dolby International Ab | Layered coding for compressed sound or sound field representations |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6416352B2 (ja) | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 | |
JP6599516B2 (ja) | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 | |
JP7374969B2 (ja) | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171010 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171108 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6243060 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |