JP2021152681A - 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 - Google Patents
高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 Download PDFInfo
- Publication number
- JP2021152681A JP2021152681A JP2021109000A JP2021109000A JP2021152681A JP 2021152681 A JP2021152681 A JP 2021152681A JP 2021109000 A JP2021109000 A JP 2021109000A JP 2021109000 A JP2021109000 A JP 2021109000A JP 2021152681 A JP2021152681 A JP 2021152681A
- Authority
- JP
- Japan
- Prior art keywords
- hoa
- signal
- component
- representation
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000005236 sound signal Effects 0.000 abstract description 83
- 239000010410 layer Substances 0.000 description 157
- 239000013598 vector Substances 0.000 description 151
- 230000032258 transport Effects 0.000 description 105
- HLOPMQJRUIOMJO-SWOZAWMQSA-N L-2-amino-4-methoxy-cis-but-3-enoic acid Chemical compound CO\C=C/[C@H](N)C(O)=O HLOPMQJRUIOMJO-SWOZAWMQSA-N 0.000 description 36
- 238000000354 decomposition reaction Methods 0.000 description 30
- 230000006872 improvement Effects 0.000 description 26
- 230000015572 biosynthetic process Effects 0.000 description 24
- 238000003786 synthesis reaction Methods 0.000 description 24
- NTABMUJQZABQGD-UHFFFAOYSA-N dimethylindole red Chemical compound CC1(C)C2=CC=CC=C2N(C)\C1=C\C=C\C1=CC=[N+](CCCS([O-])(=O)=O)C2=CC=CC=C12 NTABMUJQZABQGD-UHFFFAOYSA-N 0.000 description 23
- 230000002093 peripheral effect Effects 0.000 description 16
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 230000006835 compression Effects 0.000 description 13
- 238000007906 compression Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 239000002356 single layer Substances 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000012937 correction Methods 0.000 description 8
- 230000006837 decompression Effects 0.000 description 8
- 239000013256 coordination polymer Substances 0.000 description 7
- 230000009466 transformation Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000002355 dual-layer Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000005428 wave function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
CAMB(k−1)=C(k−1)−CPS(k−1) (1)
に従ってもとのHOA表現C(k−1)から優勢音HOA表現CPS(k−1)を減算することによって実行される。
CAMB(k−1)=C(k−1)−CPS(k−1) (1)
に従ってもとのHOA表現C(k−1)から優勢音HOA表現CPS(k−1)を減算することによって実行される。
を有する。
階層化モード指示LMFDが少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、優勢HOA音成分^CPS(k−1)と周囲HOA成分
方向およびベクトル推定ブロック301においてHOA信号の方向およびベクトル推定処理801を実行する段階であって、方向性信号についての第一のタプル集合MDIR(k)およびベクトル・ベースの信号についての第二のタプル集合MVEC(k)を含むデータが得られ、各第一のタプル集合MDIR(k)は、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、各第二のタプル集合MVEC(k)は、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む、段階と;
HOA分解ブロック303において、HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号XPS(k−1)のフレームと、周囲HOA成分
周囲成分修正ブロック304において、周囲HOA成分CAMB(k−1)を、前記目標割り当てベクトルvA,T(k−1)によって与えられる情報に従って修正803する段階であって、周囲HOA成分CAMB(k−1)のどの係数シーケンスが所与の数I個のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定され、修正された(modified)周囲HOA成分CM,A(k−2)および時間的に予測された(predicted)修正された周囲HOA成分CP,M,A(k−1)が得られ、前記目標割り当てベクトルvA,T(k−1)内の情報から、最終的な割り当てベクトルvA(k−2)が得られる、段階と;
チャネル割り当てブロック105において、上記分解から得られた優勢音信号XPS(k−1)と、修正された周囲HOA成分CM,A(k−2)および時間的に予測された修正された周囲HOA成分CP,M,A(k−1)の決定された係数シーケンスを、最終的な割り当てベクトルvA(k−2)によって与えられる情報を使って、上記所与の数I個のチャネルに割り当てる804段階であって、トランスポート信号yi(k−2)、i=1,…,Iおよび予測されたトランスポート信号yP,i(k−2)、i=1,…,Iが得られる、段階と;
複数の利得制御ブロック306において、前記トランスポート信号yi(k−2)および前記予測されたトランスポート信号yP,i(k−2)に対して利得制御805を実行する段階であって、利得修正されたトランスポート信号zi(k−2)、指数ei(k−2)および例外フラグβi(k−2)が得られる、段階とを含む。
知覚的符号化器310において、前記利得修正されたトランスポート信号zi(k−2)を知覚的に符号化する806段階であって、知覚的にエンコードされたトランスポート信号
一つまたは複数のサイド情報源符号化器320、330において、前記指数ei(k−2)および例外フラグβi(k−2)、前記第一のタプル集合MDIR(k)および第二のタプル集合MVEC(k)、前記予測パラメータξ(k−1)および前記最終的な割り当てベクトルvA(k−2)を含むサイド情報をエンコードする段階であって、エンコードされたサイド情報
知覚的にエンコードされたトランスポート信号
圧縮された基本層ビットストリーム
圧縮された向上層ビットストリーム
知覚的にエンコードされたトランスポート信号
基本層サイド情報源デコーダ530において、第一のエンコードされたサイド情報
向上層サイド情報源デコーダ560において、第二のエンコードされたサイド情報
逆利得制御を実行910する段階であって、前記第一の知覚的にデコードされたトランスポート信号
チャネル再割り当てブロック605において、前記第一および第二の利得補正された信号フレーム^yi(k)、i=1,…,IをI個のチャネルに再分配911する段階であって、優勢音信号のフレーム^XPS(k)が再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分
チャネル再割り当てブロック605において、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合IAMB,ACT(k)と、(k−1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合IE(k−1)、ID(k−1)、IU(k−1)とを生成911bする段階と;
優勢音合成ブロック606において、優勢HOA音成分^CPS(k−1)のHOA表現を、前記優勢音信号^XPS(k)から合成912する段階であって、前記第一および第二のタプル集合MDIR(k+1)、MVEC(k+1)、予測パラメータζ(k+1)およびインデックスの第二の集合IE(k−1)、ID(k−1)、IU(k−1)が使用される、段階と;
周囲合成ブロック607において、周囲HOA成分
HOA合成ブロック608において、優勢HOA音成分^CPS(k−1)および周囲HOA成分
階層化モード指示LMFDが少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、優勢HOA音成分^CPS(k−1)と周囲HOA成分
い。
〔態様1〕
HOA係数シーケンスの入力時間フレーム(C(k))をもつ次数Nの入力HOA表現である高次アンビソニックス(HOA)信号を圧縮するための方法(800)であって、当該方法は、前記入力時間フレームの空間的HOAエンコードならびにその後の知覚的エンコードおよび源エンコードを含み、
前記空間的HOAエンコードは、
・方向およびベクトル推定ブロック(301)において前記HOA信号の方向およびベクトル推定処理(801)を実行する段階であって、方向性信号についての第一のタプル集合(MDIR(k))およびベクトル・ベースの信号についての第二のタプル集合(MVEC(k))を含むデータが得られ、前記第一のタプル集合(MDIR(k))のそれぞれは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、前記第二のタプル集合(MVEC(k))のそれぞれは、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む、段階と;
・HOA分解ブロック(303)において、前記HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号(XPS(k−1))のフレームと、周囲HOA成分
・周囲成分修正ブロック(304)において、前記周囲HOA成分(CAMB(k−1))を、前記目標割り当てベクトル(vA,T(k−1))によって与えられる情報に従って修正(803)する段階であって、前記周囲HOA成分(CAMB(k−1))のどの係数シーケンスが前記所与の数(I)のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定され、修正された周囲HOA成分(CM,A(k−2))および時間的に予測された修正された周囲HOA成分(CP,M,A(k−1))が得られ、前記目標割り当てベクトル(vA,T(k−1))内の情報から、最終的な割り当てベクトル(vA(k−2))が得られる、段階と;
・チャネル割り当てブロック(105)において、前記分解から得られた前記優勢音信号(XPS(k−1))と、前記修正された周囲HOA成分(CM,A(k−2))および前記時間的に予測された修正された周囲HOA成分(CP,M,A(k−1))の決定された係数シーケンスを、前記最終的な割り当てベクトル(vA(k−2))によって与えられる情報を使って、前記所与の数(I)のチャネルに割り当てる(804)段階であって、トランスポート信号yi(k−2)、i=1,…,Iおよび予測されたトランスポート信号yP,i(k−2)、i=1,…,Iが得られる、段階と;
・複数の利得制御ブロック(306)において、前記トランスポート信号(yi(k−2))および前記予測されたトランスポート信号(yP,i(k−2))に対して利得制御(805)を実行する段階であって、利得修正されたトランスポート信号(zi(k−2))、指数(ei(k−2))および例外フラグ(βi(k−2))が得られる、段階とを含み、
前記知覚的エンコードおよび源エンコードは、
・知覚的符号化器(310)において、前記利得修正されたトランスポート信号(zi(k−2))を知覚的に符号化する(806)段階であって、知覚的にエンコードされたトランスポート信号
・サイド情報源符号化器(320、330)において、前記指数(ei(k−2))および例外フラグ(βi(k−2))、前記第一のタプル集合(MDIR(k))および第二のタプル集合(MVEC(k))、前記予測パラメータ(ξ(k−1))および前記最終的な割り当てベクトル(vA(k−2))を含むサイド情報をエンコードする(807)段階であって、エンコードされたサイド情報
・前記知覚的にエンコードされたトランスポート信号
・前記分解する段階(802)において得られる前記周囲HOA成分
・最初のOMIN個の指数(ei(k−2)、i=1,…,OMIN)および例外フラグ(βi(k−2)、i=1,…,OMIN)は基本層サイド情報源符号化器(320)においてエンコードされ、エンコードされた基本層サイド情報
・前記最初のOMIN個の知覚的にエンコードされたトランスポート信号
・残りのI−OMIN個の指数(ei(k−2)、i=OMIN+1,…,I)および例外フラグ(βi(k−2)、i=OMIN+1,…,I)、前記第一のタプル集合(MDIR(k−1))および第二のタプル集合(MVEC(k−1))、前記予測パラメータ(ξ(k−1))および前記最終的な割り当てベクトル(vA(k−2))は、向上層サイド情報エンコーダ(330)においてエンコードされ、エンコードされた向上層サイド情報
・残りのI−OMIN個の知覚的にエンコードされたトランスポート信号
・階層化モードの使用を信号伝達するモード指示が加えられる(811)、
方法。
〔態様2〕
前記基本層ビットストリーム
〔態様3〕
前記優位方向推定は、エネルギー的に優位なHOA成分の方向性パワー分布に依存する、態様1または2記載の方法。
〔態様4〕
選ばれるHOA係数シーケンスのHOAシーケンス・インデックスが相続くフレーム間で変わる場合には、前記周囲HOA成分を修正する際、係数シーケンスのフェードインおよびフェードアウトが実行される、態様1ないし3のうちいずれか一項記載の方法。
〔態様5〕
前記周囲HOA成分を修正する際、前記周囲HOA成分(CAMB(k−1))の部分的脱相関が実行される、態様1ないし4のうちいずれか一項記載の方法。
〔態様6〕
前記第一のタプル集合(MDIR(k))に含まれる量子化された方向は優位方向である、態様1ないし5のうちいずれか一項記載の方法。
〔態様7〕
前記エンコードすることはモードを選択することを含み、前記モードは、前記指示(LMFE)によって示され、階層化モードおよび非階層化モードの一方であり、前記非階層化モードにおいては、前記周囲HOA成分
〔態様8〕
圧縮された高次アンビソニックス(HOA)信号を圧縮解除する方法(900)であって、当該方法は、HOA係数シーケンスの出力時間フレーム(^C(k−1))を得るために、知覚的デコードおよび源デコードならびにその後の空間的HOAデコードを含み、当該方法は、
・前記圧縮された高次アンビソニックス(HOA)信号が圧縮された基本層ビットストリーム
前記知覚的デコードおよび源デコードは、
・前記圧縮された基本層ビットストリーム
・圧縮された向上層ビットストリーム
・前記知覚的にエンコードされたトランスポート信号
・基本層サイド情報源デコーダ(530)において、前記第一のエンコードされたサイド情報
・向上層サイド情報源デコーダ(560)において、前記第二のエンコードされたサイド情報
前記空間的HOAデコードは、
・逆利得制御(604)を実行する(910)段階であって、前記第一の知覚的にデコードされたトランスポート信号
・チャネル再割り当てブロック(605)において、前記第一および第二の利得補正された信号フレーム(^yi(k)、i=1,…,I)をI個のチャネルに再分配する(911)段階であって、優勢音信号のフレーム(^XPS(k))が再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分
・チャネル再割り当てブロック(605)において、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合(IAMB,ACT(k))と、(k−1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合(IE(k−1)、ID(k−1)、IU(k−1))とを生成する(911b)段階と;
・優勢音合成ブロック(606)において、前記優勢HOA音成分(^CPS(k−1))のHOA表現を、前記優勢音信号(^XPS(k))から合成する(912)段階であって、前記第一および第二のタプル集合(MDIR(k+1)、MVEC(k+1))、前記予測パラメータ(ζ(k+1))およびインデックスの前記第二の集合(IE(k−1)、ID(k−1)、IU(k−1))が使用される、段階と;
・周囲合成ブロック(607)において、周囲HOA成分
前記階層化モード指示(LMFD)が少なくとも二つの層をもつ階層化モードを示す場合、前記周囲HOA成分は、そのOMIN個の最低位の位置に、圧縮解除されたHOA信号(^C(k−1))のHOA係数シーケンスを含み、残りのより高位の位置に、圧縮解除されたHOA信号(^C(k−1))と、優勢HOA音成分(^CPS(k−1))のHOA表現との間の残差のHOA表現の一部である係数シーケンスを含み、
前記階層化モード指示(LMFD)が単一層モードを示す場合には、前記周囲HOA成分は、圧縮解除されたHOA信号(^C(k−1))と、優勢HOA音成分(^CPS(k−1))のHOA表現との間の残差である、段階と;
・HOA合成ブロック(608)において、前記優勢HOA音成分(^CPS(k−1))および前記周囲HOA成分
前記階層化モード指示(LMFD)が少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、前記優勢HOA音成分(^CPS(k−1))と前記周囲HOA成分
前記階層化モード指示(LMFD)が単一層モードを示す場合には、圧縮解除されたHOA信号(^C'(k−1))のすべての係数チャネルは、前記優勢HOA音成分(^CPS(k−1))と前記周囲HOA成分
方法。
〔態様9〕
前記圧縮された高次アンビソニックス(HOA)信号表現は多重化されたビットストリーム中にあり、当該方法は、前記圧縮された高次アンビソニックス(HOA)信号表現を多重分離する初期段階であって、前記圧縮された基本層ビットストリーム
〔態様10〕
HOA係数シーケンスの入力時間フレーム(C(k))をもつ次数Nの入力HOA表現である高次アンビソニックス(HOA)信号を圧縮するための装置であって、当該装置は、前記入力時間フレームの空間的HOAエンコードならびにその後の知覚的エンコードのための空間的HOAエンコードおよび知覚的エンコード部と、源エンコードのための源符号化器部とを有し、
前記空間的HOAエンコードおよび知覚的エンコード部は、
・前記HOA信号の方向およびベクトル推定処理を実行するよう適応された方向およびベクトル推定ブロック(301)であって、方向性信号についての第一のタプル集合(MDIR(k))およびベクトル・ベースの信号についての第二のタプル集合(MVEC(k))を含むデータが得られ、前記第一のタプル集合(MDIR(k))のそれぞれは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、前記第二のタプル集合(MVEC(k))のそれぞれは、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む、方向およびベクトル推定ブロック(301)と;
・前記HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号(XPS(k−1))のフレームと、周囲HOA成分
・前記周囲HOA成分(CAMB(k−1))を、前記目標割り当てベクトル(vA,T(k−1))によって与えられる情報に従って修正するよう適応された周囲成分修正ブロック(304)であって、前記周囲HOA成分(CAMB(k−1))のどの係数シーケンスが前記所与の数(I)のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定され、修正された周囲HOA成分(CM,A(k−2))および時間的に予測された修正された周囲HOA成分(CP,M,A(k−1))が得られ、前記目標割り当てベクトル(vA,T(k−1))内の情報から、最終的な割り当てベクトル(vA(k−2))が得られる、周囲成分修正ブロック(304)と;
・前記分解から得られた前記優勢音信号(XPS(k−1))と、前記修正された周囲HOA成分(CM,A(k−2))および前記時間的に予測された修正された周囲HOA成分(CP,M,A(k−1))の決定された係数シーケンスを、前記最終的な割り当てベクトルvA(k−2)によって与えられる情報を使って、前記所与の数(I)のチャネルに割り当てるよう適応されたチャネル割り当てブロック(305)であって、トランスポート信号yi(k−2)、i=1,…,Iおよび予測されたトランスポート信号yP,i(k−2)、i=1,…,Iが得られる、チャネル割り当てブロック(305)と;
・前記トランスポート信号(yi(k−2))および前記予測されたトランスポート信号(yP,i(k−2))に対して利得制御(805)を実行するよう適応された複数の利得制御ブロック(306)であって、利得修正されたトランスポート信号(zi(k−2))、指数(ei(k−2))および例外フラグ(βi(k−2))が得られる、複数の利得制御ブロック(306)とを有しており、
前記源符号化器部は、
・前記利得修正されたトランスポート信号(zi(k−2))を知覚的に符号化する(806)よう適応された知覚的符号化器(310)であって、知覚的にエンコードされたトランスポート信号
・前記指数(ei(k−2))および例外フラグ(βi(k−2))、前記第一のタプル集合(MDIR(k))および第二のタプル集合(MVEC(k))、前記予測パラメータ(ξ(k−1))および前記最終的な割り当てベクトル(vA(k−2))を含むサイド情報をエンコードする(807)よう適応されたサイド情報源符号化器(320、330)であって、エンコードされたサイド情報
・前記知覚的にエンコードされたトランスポート信号
・前記分解において得られる前記周囲HOA成分
・最初のOMIN個の指数(ei(k−2)、i=1,…,OMIN)および例外フラグ(βi(k−2)、i=1,…,OMIN)は基本層サイド情報源符号化器(320)においてエンコードされ、エンコードされた基本層サイド情報
・前記最初のOMIN個の知覚的にエンコードされたトランスポート信号
・残りのI−OMIN個の指数(ei(k−2)、i=OMIN+1,…,I)および例外フラグ(βi(k−2)、i=OMIN+1,…,I)、前記第一のタプル集合(MDIR(k−1))および第二のタプル集合(MVEC(k−1))、前記予測パラメータ(ξ(k−1))および前記最終的な割り当てベクトル(vA(k−2))は、前記サイド情報源符号化器内の向上層サイド情報エンコーダ(330)においてエンコードされ、エンコードされた向上層サイド情報
・残りのI−OMIN個の知覚的にエンコードされたトランスポート信号
・マルチプレクサまたは追加器において、階層化モードの使用を信号伝達するモード指示が加えられる、
装置。
〔態様11〕
前記第一のタプル集合(MDIR(k−1))および第二のタプル集合(MVEC(k−1))を遅延させるための二つの遅延ブロック(302)をさらに有する、態様10記載の装置。
〔態様12〕
前記基本層ビットストリーム
〔態様13〕
前記優位方向推定は、エネルギー的に優位なHOA成分の方向性パワー分布に依存する、態様10ないし12のうちいずれか一項記載の装置。
〔態様14〕
選ばれるHOA係数シーケンスのHOAシーケンス・インデックスが相続くフレーム間で変わる場合には、前記周囲HOA成分を修正する際、係数シーケンスのフェードインおよびフェードアウトが実行される、態様10ないし13のうちいずれか一項記載の装置。
〔態様15〕
前記周囲HOA成分を修正する際、前記周囲HOA成分(CAMB(k−1))の部分的脱相関が実行される、態様10ないし14のうちいずれか一項記載の装置。
〔態様16〕
前記第一のタプル集合(MDIR(k))に含まれる量子化された方向は優位方向である、態様10ないし15のうちいずれか一項記載の装置。
〔態様17〕
モードを選択するよう適応されたモード選択器をさらに有しており、前記モードは、前記指示(LMFE)によって示され、階層化モードおよび非階層化モードの一方であり、前記非階層化モードにおいては、前記周囲HOA成分
〔態様18〕
圧縮された高次アンビソニックス(HOA)信号を圧縮解除してHOA係数シーケンスの出力時間フレーム(^C(k−1))を得る装置であって、当該装置は、知覚的デコードおよび源デコード部ならびに空間的HOAデコード部を含み、当該装置は、
・前記圧縮された高次アンビソニックス(HOA)信号が圧縮された基本層ビットストリーム
前記知覚的デコードおよび源デコード部は、
・前記圧縮された基本層ビットストリーム
・前記圧縮された向上層ビットストリーム
・前記知覚的にエンコードされたトランスポート信号
・前記第一のエンコードされたサイド情報
・前記第二のエンコードされたサイド情報
前記空間的HOAデコード部は、
・逆利得制御(604)を実行する(910)複数の逆利得制御ユニットであって、前記第一の知覚的にデコードされたトランスポート信号
・前記第一および第二の利得補正された信号フレーム(^yi(k)、i=1,…,I)をI個のチャネルに再分配する(911)よう適応されたチャネル再割り当てブロック(605)であって、優勢音信号のフレーム(^XPS(k))が再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分
前記チャネル再割り当てブロック(605)は、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合(IAMB,ACT(k))と、(k−1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合(IE(k−1)、ID(k−1)、IU(k−1))とを生成する(911b)よう適応されている、チャネル再割り当てブロック(605)と;
・前記優勢HOA音成分(^CPS(k−1))のHOA表現を、前記優勢音信号(^XPS(k))から合成する(912)よう適応された優勢音合成ブロック(606)であって、前記第一および第二のタプル集合(MDIR(k+1)、MVEC(k+1))、前記予測パラメータ(ζ(k+1))およびインデックスの前記第二の集合(IE(k−1)、ID(k−1)、IU(k−1))が使用される、優勢音合成ブロック(606)と;
・周囲HOA成分
前記階層化モード指示(LMFD)が少なくとも二つの層をもつ階層化モードを示す場合、前記周囲HOA成分は、そのOMIN個の最低位の位置に、圧縮解除されたHOA信号(^C(k−1))のHOA係数シーケンスを含み、残りのより高位の位置に、圧縮解除されたHOA信号(^C(k−1))と、優勢HOA音成分(^CPS(k−1))のHOA表現との間の残差のHOA表現の一部である係数シーケンスを含み、
前記階層化モード指示(LMFD)が単一層モードを示す場合には、前記周囲HOA成分は、圧縮解除されたHOA信号(^C(k−1))と、優勢HOA音成分(^CPS(k−1))のHOA表現との間の残差である、周囲合成ブロック(607)と;
・前記優勢HOA音成分(^CPS(k−1))および前記周囲HOA成分
前記階層化モード指示(LMFD)が少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、前記優勢HOA音成分(^CPS(k−1))と前記周囲HOA成分
前記階層化モード指示(LMFD)が単一層モードを示す場合には、圧縮解除されたHOA信号(^C'(k−1))のすべての係数チャネルは、前記優勢HOA音成分(^CPS(k−1))と前記周囲HOA成分
装置。
〔態様19〕
前記圧縮された高次アンビソニックス(HOA)信号表現は多重化されたビットストリーム中にあり、当該装置は、前記圧縮された高次アンビソニックス(HOA)信号表現を初期に多重分離するよう適応されたデマルチプレクサであって、前記圧縮された基本層ビットストリーム
〔態様20〕
HOA係数シーケンスの入力時間フレームをもつ次数Nの入力HOA表現である高次アンビソニックス(HOA)信号を圧縮するための方法(800)をコンピュータに実行させるための実行可能命令を有する非一時的なコンピュータ可読記憶媒体であって、前記方法は、前記入力時間フレームの空間的HOAエンコードならびにその後の知覚的エンコードおよび源エンコードを含み、
前記空間的HOAエンコードは、
・方向およびベクトル推定ブロックにおいて前記HOA信号の方向およびベクトル推定処理を実行する段階であって、方向性信号についての第一のタプル集合およびベクトル・ベースの信号についての第二のタプル集合を含むデータが得られ、前記第一のタプル集合のそれぞれは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、前記第二のタプル集合のそれぞれは、ベクトル・ベースの信号のインデックスおよび信号の方向分布を定義するベクトルを含む、段階と;
・HOA分解ブロックにおいて、前記HOA係数シーケンスの各入力時間フレームを、複数の優勢音信号のフレームと、周囲HOA成分のフレームとに分解する段階であって、前記優勢音信号は前記方向性音信号および前記ベクトル・ベースの音信号を含み、該分解はさらに、予測パラメータおよび目標割り当てベクトルを提供し、前記予測パラメータは、前記優勢音信号内の前記方向性信号からどのようにして、優勢音HOA成分を豊かにするよう前記HOA信号表現の諸部分を予測するかを記述し、前記目標割り当てベクトルは、所与の数(I)のチャネルに前記優勢音信号をどのようにして割り当てるかについての情報を含む、段階と;
・周囲成分修正ブロックにおいて、前記周囲HOA成分を、前記目標割り当てベクトルによって与えられる情報に従って修正する段階であって、前記周囲HOA成分のどの係数シーケンスが前記所与の数のチャネルにおいて伝送されるべきかが、何個のチャネルが優勢音信号によって占められているかに依存して、決定され、修正された周囲HOA成分および時間的に予測された修正された周囲HOA成分が得られ、前記目標割り当てベクトル内の情報から、最終的な割り当てベクトルが得られる、段階と;
・チャネル割り当てブロックにおいて、前記分解から得られた前記優勢音信号と、前記修正された周囲HOA成分および前記時間的に予測された修正された周囲HOA成分の決定された係数シーケンスを、前記最終的な割り当てベクトルによって与えられる情報を使って、前記所与の数のチャネルに割り当てる段階であって、トランスポート信号yi(k−2)、i=1,…,Iおよび予測されたトランスポート信号yP,i(k−2)、i=1,…,Iが得られる、段階と;
・複数の利得制御ブロックにおいて、前記トランスポート信号および前記予測されたトランスポート信号に対して利得制御を実行する段階であって、利得修正されたトランスポート信号、指数および例外フラグが得られる、段階とを含み、
前記知覚的エンコードおよび源エンコードは、
・知覚的符号化器において、前記利得修正されたトランスポート信号を知覚的に符号化する段階であって、知覚的にエンコードされたトランスポート信号が得られる、段階と;
・サイド情報源符号化器において、前記指数および例外フラグ、前記第一のタプル集合および第二のタプル集合、前記予測パラメータおよび前記最終的な割り当てベクトルを含むサイド情報をエンコードする段階であって、エンコードされたサイド情報が得られる、段階と;
・前記知覚的にエンコードされたトランスポート信号および前記エンコードされたサイド情報を多重化する段階であって、多重化されたデータ・ストリームが得られる、段階とを含み、
・前記分解する段階において得られる前記周囲HOA成分は、前記入力HOA表現の最初の諸HOA係数シーケンスをOMIN個の最低位の位置に、第二のHOA係数シーケンスを残りのより高位の位置に含み、前記第二のHOA係数シーケンスは、前記入力HOA表現と前記優勢音信号の前記HOA表現との間の残差のHOA表現の一部であり、
・最初のOMIN個の指数および例外フラグは基本層サイド情報源符号化器においてエンコードされ、エンコードされた基本層サイド情報が得られ、OMIN=(NMIN+1)2であり、O=(N+1)2であり、NMIN≦NかつOMIN≦Iであり、NMINはあらかじめ定義された整数値であり、
・前記最初のOMIN個の知覚的にエンコードされたトランスポート信号およびエンコードされた基本層サイド情報は基本層ビットストリーム・マルチプレクサにおいて多重化され、基本層ビットストリームが得られ、
・残りのI−OMIN個の指数および例外フラグ、前記第一のタプル集合および第二のタプル集合、前記予測パラメータおよび前記最終的な割り当てベクトルは、向上層サイド情報エンコーダにおいてエンコードされ、エンコードされた向上層サイド情報が得られ、
・残りのI−OMIN個の知覚的にエンコードされたトランスポート信号およびエンコードされた向上層サイド情報は、向上層ビットストリーム・マルチプレクサにおいて多重化され、向上層ビットストリームが得られ、
・階層化モードの使用を信号伝達するモード指示が加えられる、
記憶媒体。
〔態様21〕
圧縮された高次アンビソニックス(HOA)信号を圧縮解除する方法(900)をコンピュータに実行させるための実行可能命令を有する非一時的なコンピュータ可読記憶媒体であって、前記方法は、HOA係数シーケンスの出力時間フレームを得るために、知覚的デコードおよび源デコードならびにその後の空間的HOAデコードを含み、前記方法は、
・前記圧縮された高次アンビソニックス(HOA)信号が圧縮された基本層ビットストリームおよび圧縮された向上層ビットストリームを含むことを示す階層化モード指示を検出する段階を含み、
前記知覚的デコードおよび源デコードは、
・前記圧縮された基本層ビットストリームを多重分離する段階であって、第一の知覚的にエンコードされたトランスポート信号
・圧縮された向上層ビットストリームを多重分離する段階であって、第二の知覚的にエンコードされたトランスポート信号
・前記知覚的にエンコードされたトランスポート信号を知覚的にデコードする段階であって、知覚的にデコードされたトランスポート信号が得られ、基本層知覚的デコーダにおいて、基本層の前記第一の知覚的にエンコードされたトランスポート信号がデコードされて、第一の知覚的にデコードされたトランスポート信号が得られ、向上層知覚的デコーダにおいて、向上層の前記第二の知覚的にエンコードされたトランスポート信号がデコードされて、第二の知覚的にデコードされたトランスポート信号が得られる、段階と;
・基本層サイド情報源デコーダにおいて、前記第一のエンコードされたサイド情報をデコードする段階であって、第一の指数および第一の例外フラグが得られる、段階と;
・向上層サイド情報源デコーダにおいて、前記第二のエンコードされたサイド情報をデコードする段階であって、第二の指数および第二の例外フラグが得られ、さらなるデータが得られ、前記さらなるデータは、方向性信号についての第一のタプル集合およびベクトル・ベースの信号についての第二のタプル集合を含み、前記第一のタプル集合の各タプルは、方向性信号のインデックスおよびそれぞれの量子化された方向を含み、前記第二のタプル集合の各タプルは、ベクトル・ベースの信号のインデックスおよび該ベクトル・ベースの信号の方向分布を定義するベクトルを含み、さらに、予測パラメータおよび周囲割り当てベクトルが得られ、前記周囲割り当てベクトルは、各伝送チャネルについて、前記周囲HOA成分の係数シーケンスを含んでいるかどうかおよびどの係数シーケンスを含んでいるかを示す成分を含む、段階とを含み;
前記空間的HOAデコードは、
・逆利得制御を実行する段階であって、前記第一の知覚的にデコードされたトランスポート信号が、前記第一の指数および前記第一の例外フラグに従って、第一の利得補正された信号フレームに変換され、前記第二の知覚的にデコードされたトランスポート信号が、前記第二の指数および前記第二の例外フラグに従って、第二の利得補正された信号フレームに変換される、段階と;
・チャネル再割り当てブロックにおいて、前記第一および第二の利得補正された信号フレーム(^yi(k)、i=1,…,I)をI個のチャネルに再分配する段階であって、優勢音信号のフレームが再構成され、該優勢音信号は方向性信号およびベクトル・ベースの信号を含み、修正された周囲HOA成分が得られ、前記割り当ては、前記周囲割り当てベクトルならびに前記第一および第二のタプル集合内の情報に従ってなされる、段階と;
・チャネル再割り当てブロックにおいて、k番目のフレームにおいてアクティブである、修正された周囲HOA成分の係数シーケンスのインデックスの第一の集合と、(k−1)番目のフレームにおいて有効にされる、無効にされるまたはアクティブなままである必要がある修正された周囲HOA成分の係数シーケンスのインデックスの第二の集合とを生成する段階と;
・優勢音合成ブロックにおいて、前記優勢HOA音成分のHOA表現を、前記優勢音信号から合成する段階であって、前記第一および第二のタプル集合、前記予測パラメータおよびインデックスの前記第二の集合が使用される、段階と;
・周囲合成ブロックにおいて、周囲HOA成分を、修正された周囲HOA成分から合成する段階であって、最初のOMIN個のチャネルについての逆空間的変換がなされ、インデックスの前記第一の集合が使用され、インデックスの前記第一の集合は、k番目のフレームにおいてアクティブである前記周囲HOA成分の係数シーケンスのインデックスであり、
前記階層化モード指示が少なくとも二つの層をもつ階層化モードを示す場合、前記周囲HOA成分は、そのOMIN個の最低位の位置に、圧縮解除されたHOA信号のHOA係数シーケンスを含み、残りのより高位の位置に、圧縮解除されたHOA信号と、優勢HOA音成分のHOA表現との間の残差のHOA表現の一部である係数シーケンスを含み、
前記階層化モード指示が単一層モードを示す場合には、前記周囲HOA成分は、圧縮解除されたHOA信号と、優勢HOA音成分のHOA表現との間の残差である、段階と;
・HOA合成ブロックにおいて、前記優勢HOA音成分および前記周囲HOA成分のHOA表現を加算する段階であって、前記優勢音信号のHOA表現の係数と、前記周囲HOA成分の対応する係数とが加算され、圧縮解除されたHOA信号が得られ、
前記階層化モード指示が少なくとも二つの層をもつ階層化モードを示す場合、最高のI−OMIN個の係数チャネルだけが、前記優勢HOA音成分と前記周囲HOA成分の加算によって得られ、圧縮解除されたHOA信号の低いほうからのOMIN個の係数チャネルは、前記周囲HOA成分からコピーされ、
前記階層化モード指示が単一層モードを示す場合には、圧縮解除されたHOA信号のすべての係数チャネルは、前記優勢HOA音成分と前記周囲HOA成分の加算によって得られる、段階とを含む、
記憶媒体。
Claims (1)
- デコード装置によって実行される、音または音場の圧縮された高次アンビソニックス(HOA)表現をデコードする方法であって、当該方法は、
前記圧縮されたHOA表現を含むビットストリームを受領する段階と;
前記圧縮されたHOA表現に関係する複数の層があるかどうかを判定する段階と;
複数の層があるとの判定に基づいて、前記ビットストリームからの前記圧縮されたHOA表現をデコードして、デコードされたHOA表現のシーケンスを得る段階とを含み、
デコードされたHOA表現の前記シーケンスの第一の部分集合はインデックスの第一の集合に対応し、デコードされたHOA表現の前記シーケンスの第二の部分集合はインデックスの第二の集合に対応し、
前記第一の集合のインデックスは1≦n≦OMNであり、前記第二の集合のインデックスはOMN+1≦n≦Oであり、Oはチャネルの総数であり、OMNは1からOまでの間の数を示す、
方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022178231A JP2023001241A (ja) | 2014-03-21 | 2022-11-07 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14305411.2 | 2014-03-21 | ||
EP14305411.2A EP2922057A1 (en) | 2014-03-21 | 2014-03-21 | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
JP2020087855A JP6907383B2 (ja) | 2014-03-21 | 2020-05-20 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020087855A Division JP6907383B2 (ja) | 2014-03-21 | 2020-05-20 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022178231A Division JP2023001241A (ja) | 2014-03-21 | 2022-11-07 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021152681A true JP2021152681A (ja) | 2021-09-30 |
JP7174810B2 JP7174810B2 (ja) | 2022-11-17 |
JP7174810B6 JP7174810B6 (ja) | 2022-12-20 |
Family
ID=50439305
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016557322A Active JP6220082B2 (ja) | 2014-03-21 | 2015-03-20 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2017187920A Active JP6416352B2 (ja) | 2014-03-21 | 2017-09-28 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2018188504A Active JP6707604B2 (ja) | 2014-03-21 | 2018-10-03 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2020087855A Active JP6907383B2 (ja) | 2014-03-21 | 2020-05-20 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2021109000A Active JP7174810B6 (ja) | 2014-03-21 | 2021-06-30 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2022178231A Pending JP2023001241A (ja) | 2014-03-21 | 2022-11-07 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016557322A Active JP6220082B2 (ja) | 2014-03-21 | 2015-03-20 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2017187920A Active JP6416352B2 (ja) | 2014-03-21 | 2017-09-28 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2018188504A Active JP6707604B2 (ja) | 2014-03-21 | 2018-10-03 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
JP2020087855A Active JP6907383B2 (ja) | 2014-03-21 | 2020-05-20 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022178231A Pending JP2023001241A (ja) | 2014-03-21 | 2022-11-07 | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Country Status (7)
Country | Link |
---|---|
US (7) | US9930464B2 (ja) |
EP (3) | EP2922057A1 (ja) |
JP (6) | JP6220082B2 (ja) |
KR (7) | KR20230156453A (ja) |
CN (5) | CN111145766B (ja) |
TW (3) | TWI770522B (ja) |
WO (1) | WO2015140291A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
WO2015140292A1 (en) | 2014-03-21 | 2015-09-24 | Thomson Licensing | Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal |
US10140996B2 (en) | 2014-10-10 | 2018-11-27 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
US9984693B2 (en) | 2014-10-10 | 2018-05-29 | Qualcomm Incorporated | Signaling channels for scalable coding of higher order ambisonic audio data |
UA123055C2 (uk) * | 2015-10-08 | 2021-02-10 | Долбі Інтернешнл Аб | Багаторівневе кодування стиснених представлень звуку або звукового поля |
MX2020011754A (es) * | 2015-10-08 | 2022-05-19 | Dolby Int Ab | Codificacion en capas para representaciones de sonido o campo de sonido comprimidas. |
SG10202001597WA (en) * | 2015-10-08 | 2020-04-29 | Dolby Int Ab | Layered coding and data structure for compressed higher-order ambisonics sound or sound field representations |
CN108140392B (zh) | 2015-10-08 | 2023-04-18 | 杜比国际公司 | 用于压缩声音或声场表示的分层编解码 |
EA038833B1 (ru) * | 2016-07-13 | 2021-10-26 | Долби Интернэшнл Аб | Многоуровневое кодирование сжатых представлений звука или звукового поля |
US10332530B2 (en) | 2017-01-27 | 2019-06-25 | Google Llc | Coding of a soundfield representation |
CN108550369B (zh) * | 2018-04-14 | 2020-08-11 | 全景声科技南京有限公司 | 一种可变长度的全景声信号编解码方法 |
US10999693B2 (en) * | 2018-06-25 | 2021-05-04 | Qualcomm Incorporated | Rendering different portions of audio data using different renderers |
CA3122164C (en) * | 2018-12-07 | 2024-01-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding using diffuse compensation |
CN112908345B (zh) * | 2019-01-29 | 2022-05-31 | 桂林理工大学南宁分校 | 一种物联网语音压缩与解压方法 |
US11430451B2 (en) | 2019-09-26 | 2022-08-30 | Apple Inc. | Layered coding of audio with discrete objects |
US20210409888A1 (en) * | 2020-06-29 | 2021-12-30 | Qualcomm Incorporated | Sound field adjustment |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57107277A (en) | 1980-12-24 | 1982-07-03 | Babcock Hitachi Kk | Brush removing type bolt cleaner |
JPS6351748A (ja) | 1986-08-21 | 1988-03-04 | Nec Corp | 交換回線接続方法 |
JPH0453956Y2 (ja) | 1986-09-22 | 1992-12-18 | ||
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
KR100658222B1 (ko) * | 2004-08-09 | 2006-12-15 | 한국전자통신연구원 | 3차원 디지털 멀티미디어 방송 시스템 |
EP1839297B1 (en) * | 2005-01-11 | 2018-11-14 | Koninklijke Philips N.V. | Scalable encoding/decoding of audio signals |
US8345899B2 (en) * | 2006-05-17 | 2013-01-01 | Creative Technology Ltd | Phase-amplitude matrixed surround decoder |
EP2154677B1 (en) | 2008-08-13 | 2013-07-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a converted spatial audio signal |
EP2306456A1 (en) * | 2009-09-04 | 2011-04-06 | Thomson Licensing | Method for decoding an audio signal that has a base layer and an enhancement layer |
AU2011231565B2 (en) * | 2010-03-26 | 2014-08-28 | Dolby International Ab | Method and device for decoding an audio soundfield representation for audio playback |
EP2395505A1 (en) * | 2010-06-11 | 2011-12-14 | Thomson Licensing | Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer |
EP2450880A1 (en) | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
KR102374897B1 (ko) * | 2011-03-16 | 2022-03-17 | 디티에스, 인코포레이티드 | 3차원 오디오 사운드트랙의 인코딩 및 재현 |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
HUE054452T2 (hu) | 2011-07-01 | 2021-09-28 | Dolby Laboratories Licensing Corp | Rendszer és eljárás adaptív hangjel elõállítására, kódolására és renderelésére |
EP2592845A1 (en) | 2011-11-11 | 2013-05-15 | Thomson Licensing | Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field |
EP2637427A1 (en) | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
EP2688066A1 (en) | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
EP2688065A1 (en) | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for avoiding unmasking of coding noise when mixing perceptually coded multi-channel audio signals |
KR102201713B1 (ko) * | 2012-07-19 | 2021-01-12 | 돌비 인터네셔널 에이비 | 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스 |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
US9479886B2 (en) | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
EP2800401A1 (en) * | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9502044B2 (en) * | 2013-05-29 | 2016-11-22 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
CN105264595B (zh) * | 2013-06-05 | 2019-10-01 | 杜比国际公司 | 用于编码和解码音频信号的方法和装置 |
US9502045B2 (en) * | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US20150243292A1 (en) * | 2014-02-25 | 2015-08-27 | Qualcomm Incorporated | Order format signaling for higher-order ambisonic audio data |
WO2015140292A1 (en) | 2014-03-21 | 2015-09-24 | Thomson Licensing | Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal |
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
KR102428794B1 (ko) * | 2014-03-21 | 2022-08-04 | 돌비 인터네셔널 에이비 | 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치 |
US9847087B2 (en) * | 2014-05-16 | 2017-12-19 | Qualcomm Incorporated | Higher order ambisonics signal compression |
US9984693B2 (en) * | 2014-10-10 | 2018-05-29 | Qualcomm Incorporated | Signaling channels for scalable coding of higher order ambisonic audio data |
MX2020011754A (es) | 2015-10-08 | 2022-05-19 | Dolby Int Ab | Codificacion en capas para representaciones de sonido o campo de sonido comprimidas. |
CN108140392B (zh) | 2015-10-08 | 2023-04-18 | 杜比国际公司 | 用于压缩声音或声场表示的分层编解码 |
-
2014
- 2014-03-21 EP EP14305411.2A patent/EP2922057A1/en not_active Withdrawn
-
2015
- 2015-03-20 CN CN202010011901.6A patent/CN111145766B/zh active Active
- 2015-03-20 KR KR1020237038132A patent/KR20230156453A/ko active Search and Examination
- 2015-03-20 US US15/127,577 patent/US9930464B2/en active Active
- 2015-03-20 KR KR1020187020825A patent/KR102144389B1/ko active IP Right Grant
- 2015-03-20 TW TW109118435A patent/TWI770522B/zh active
- 2015-03-20 JP JP2016557322A patent/JP6220082B2/ja active Active
- 2015-03-20 CN CN202010011881.2A patent/CN111179948A/zh active Pending
- 2015-03-20 CN CN202010011894.XA patent/CN111182442B/zh active Active
- 2015-03-20 KR KR1020217010049A patent/KR102428815B1/ko active IP Right Grant
- 2015-03-20 CN CN201580014972.9A patent/CN106463123B/zh active Active
- 2015-03-20 TW TW107139029A patent/TWI697893B/zh active
- 2015-03-20 KR KR1020227026504A patent/KR102600284B1/ko active IP Right Grant
- 2015-03-20 WO PCT/EP2015/055914 patent/WO2015140291A1/en active Application Filing
- 2015-03-20 CN CN202010011895.4A patent/CN111179949B/zh active Active
- 2015-03-20 KR KR1020167025844A patent/KR101838056B1/ko active IP Right Grant
- 2015-03-20 KR KR1020187005988A patent/KR101882654B1/ko active IP Right Grant
- 2015-03-20 TW TW104108896A patent/TWI648729B/zh active
- 2015-03-20 EP EP15710808.5A patent/EP3120350B1/en active Active
- 2015-03-20 KR KR1020207022907A patent/KR102238609B1/ko active IP Right Grant
- 2015-03-20 EP EP20157672.5A patent/EP3686887B1/en active Active
-
2017
- 2017-09-28 JP JP2017187920A patent/JP6416352B2/ja active Active
-
2018
- 2018-02-08 US US15/891,606 patent/US10334382B2/en active Active
- 2018-10-03 JP JP2018188504A patent/JP6707604B2/ja active Active
-
2019
- 2019-06-03 US US16/429,575 patent/US10542364B2/en active Active
- 2019-12-16 US US16/716,424 patent/US10779104B2/en active Active
-
2020
- 2020-05-20 JP JP2020087855A patent/JP6907383B2/ja active Active
- 2020-09-03 US US17/010,827 patent/US11395084B2/en active Active
-
2021
- 2021-06-30 JP JP2021109000A patent/JP7174810B6/ja active Active
-
2022
- 2022-07-14 US US17/864,708 patent/US11722830B2/en active Active
- 2022-11-07 JP JP2022178231A patent/JP2023001241A/ja active Pending
-
2023
- 2023-06-22 US US18/339,368 patent/US20240007813A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6907383B2 (ja) | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 | |
JP6870052B2 (ja) | 圧縮されたhoa信号をデコードする方法および装置 | |
JP6949900B2 (ja) | 高次アンビソニックス(hoa)信号を圧縮する方法、圧縮されたhoa信号を圧縮解除する方法、hoa信号を圧縮する装置および圧縮されたhoa信号を圧縮解除する装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7174810 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |