JP6542295B2 - フレームパラメータ再使用可能性を示すこと - Google Patents
フレームパラメータ再使用可能性を示すこと Download PDFInfo
- Publication number
- JP6542295B2 JP6542295B2 JP2017126157A JP2017126157A JP6542295B2 JP 6542295 B2 JP6542295 B2 JP 6542295B2 JP 2017126157 A JP2017126157 A JP 2017126157A JP 2017126157 A JP2017126157 A JP 2017126157A JP 6542295 B2 JP6542295 B2 JP 6542295B2
- Authority
- JP
- Japan
- Prior art keywords
- syntax element
- value
- vector
- current frame
- bitstream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 claims description 593
- 238000000034 method Methods 0.000 claims description 121
- 238000003860 storage Methods 0.000 claims description 27
- 238000009877 rendering Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 4
- 238000013139 quantization Methods 0.000 description 262
- 239000011159 matrix material Substances 0.000 description 72
- 230000007613 environmental effect Effects 0.000 description 57
- 238000000605 extraction Methods 0.000 description 56
- 230000000875 corresponding effect Effects 0.000 description 48
- 238000000354 decomposition reaction Methods 0.000 description 35
- 230000006870 function Effects 0.000 description 33
- 238000004458 analytical method Methods 0.000 description 30
- 230000009467 reduction Effects 0.000 description 25
- 230000015572 biosynthetic process Effects 0.000 description 16
- 230000006835 compression Effects 0.000 description 14
- 238000007906 compression Methods 0.000 description 14
- 230000005236 sound signal Effects 0.000 description 14
- 230000007704 transition Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 108010074864 Factor XI Proteins 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 9
- 230000008520 organization Effects 0.000 description 8
- 230000003111 delayed effect Effects 0.000 description 7
- 230000011664 signaling Effects 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- ZAKOWWREFLAJOT-CEFNRUSXSA-N D-alpha-tocopherylacetate Chemical compound CC(=O)OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C ZAKOWWREFLAJOT-CEFNRUSXSA-N 0.000 description 1
- 101100219690 Drosophila melanogaster cav gene Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000009940 knitting Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/15—Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
2014年1月30日に出願された「COMPRESSION OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD」という名称の米国仮出願第61/933,706号、
2014年1月30日に出願された「COMPRESSION OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD」という名称の米国仮出願第61/933,714号、
2014年1月30日に出願された「INDICATING FRAM(登録商標)E
PARAMETER REUSABILITY FOR DECODING SPATIAL VECTORS」という名称の米国仮出願第61/933,731号、
2014年3月7日に出願された「IMMEDIATE PLAY−OUT FRAME FOR SPHERICAL HARMONIC COEFFICIENTS」という名称の米国仮出願第61/949,591号、
2014年3月7日に出願された「FADE−IN/FADE−OUT OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD」という名称の米国仮出願第61/949,583号、
2014年5月16日に出願された「CODING V−VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS (HOA)
AUDIO SIGNAL」という名称の米国仮出願第61/994,794号、
2014年5月28日に出願された「INDICATING FRAME PARAMETER REUSABILITY FOR DECODING SPATIAL VECTORS」という名称の米国仮出願第62/004,147号、
2014年5月28日に出願された「IMMEDIATE PLAY−OUT FRAME FOR SPHERICAL HARMONIC COEFFICIENTS AND FADE−IN/FADE−OUT OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD」という名称の米国仮出願第62/004,067号、
2014年5月28日に出願された「CODING V−VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS (HOA)
AUDIO SIGNAL」という名称の米国仮出願第62/004,128号、
2014年7月1日に出願された「CODING V−VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS (HOA) AUDIO SIGNAL」という名称の米国仮出願第62/019,663号、
2014年7月22日に出願された「CODING V−VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS (HOA)
AUDIO SIGNAL」という名称の米国仮出願第62/027,702号、
2014年7月23日に出願された「CODING V−VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS (HOA)
AUDIO SIGNAL」という名称の米国仮出願第62/028,282号、
2014年7月25日に出願された「IMMEDIATE PLAY−OUT FRAME FOR SPHERICAL HARMONIC COEFFICIENTS AND FADE−IN/FADE−OUT OF DECOMPOSED REPRESENTATIONS OF A SOUND FIELD」という名称の米国仮出願第62/029,173号、
2014年8月1日に出願された「CODING V−VECTORS OF A DECOMPOSED HIGHER ORDER AMBISONICS (HOA) AUDIO SIGNAL」という名称の米国仮出願第62/032,440号、
2014年9月26日に出願された「SWITCHED V−VECTOR QUANTIZATION OF A HIGHER ORDER AMBISONICS (HOA) AUDIO SIGNAL」という名称の米国仮出願第62/056,248号、および
2014年9月26日に出願された「PREDICTIVE VECTOR QUANTIZATION OF A DECOMPOSED HIGHER ORDER AMBISONICS (HOA) AUDIO SIGNAL」という名称の米国仮出願第62/056,286号、および
2015年1月12日に出願された「TRANSITIONING OF AMBIENT HIGHER−ORDER AMBISONIC COEFFICIENTS」という名称の米国仮出願第62/102,243号の利益を主張し、 上記に記載された米国仮出願の各々は、それらのそれぞれの全体として本明細書に記載されたかのように、参照により組み込まれる。
PSD = hoaFrame’*hoaFrame;
[V, S_squared] = svd(PSD,’econ’);
S = sqrt(S_squared);
U = hoaFrame * pinv(S*V’);
[0058]HOA係数自体ではなくHOA係数の電力スペクトル密度(PSD)に関してSVDを実行することによって、LITユニット30は潜在的に、プロセッササイクルおよび記憶空間のうちの1つまたは複数に関してSVDを実行することの計算的な複雑さを低減しつつ、SVDがHOA係数に直接適用されたかのように同じソースオーディオ符号化効率を達成することができる。すなわち、上記で説明されたPSDタイプのSVDは、Mがフレーム長さ、すなわち、1024以上のサンプルである、M*F行列と比較して、F*F行列(HOA係数の数Fをもつ)において完了するので、潜在的にそれほど計算的に厳しくないことがある。ここで、SVDの複雑さは、HOA係数11ではなくPSDへの適用を通じて、HOA係数11に適用されたときのO(M*L2)と比較して、O(L3)前後であり得る(ここで、O(*)は、コンピュータサイエンス技術において一般的な計算の複雑さである大文字Oの表記を示す)。
V=[0.23 0.31 −0.47 ・・・ 0.85] を検討する。この例示的なVベクトルをスカラー量子化するために、成分の各々が個々に量子化(すなわち、スカラー量子化)され得る。たとえば、量子化ステップが0.1である場合、0.23成分が0.2に量子化され得、0.31成分が0.3に量子化され得るなどとなる。スカラー量子化された成分は、スカラー量子化されたVベクトルを集合的に形成し得る。
NumVecIndices ベクトル量子化されたVベクトルを逆量子化するために使用されるベクトルの数。 AddAmbHoaInfoChannel(i) このペイロードは、追加の環境HOA係数のための情報を保持する。
0〜3: 予約済み
4: ベクトル量子化
5: ハフマンコーディングなしのスカラー量子化
6: ハフマンコーディングありの6ビットスカラー量子化
7: ハフマンコーディングありの7ビットスカラー量子化
8: ハフマンコーディングありの8ビットスカラー量子化
... ...
16: ハフマンコーディングありの16ビットスカラー量子化 上記では、6〜16のNbitsQシンタックス要素の値は、スカラー量子化がハフマンコーディングとともに実行されるべきであることのみではなく、スカラー量子化の量子化ステップサイズをも示す。この点において、量子化モードは、ベクトル量子化モードと、ハフマンコーディングなしのスカラー量子化モードと、ハフマンコーディングありのスカラー量子化モードとを備えることができる。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
効率的なビット使用の方法であって、
球面調和関数領域における直交空間軸を表すベクトルを備えるビットストリームを取得することを備え、前記ビットストリームは、前記ベクトルを圧縮するときに使用される情報を示す少なくとも1つのシンタックス要素を、以前のフレームから、再使用するかどうかのためのインジケータをさらに備える、
方法。
[C2]
前記インジケータは、前記ベクトルを圧縮するときに使用される量子化モードを示すシンタックス要素の1つまたは複数のビットを備える、
C1に記載の方法。
[C3]
前記シンタックス要素の前記1つまたは複数のビットは、ゼロ値に設定されるとき、前記以前のフレームからの前記少なくとも1つのシンタックス要素を再使用することを示す、
C2に記載の方法。
[C4]
前記量子化モードは、ベクトル量子化モードを備える、
C2に記載の方法。
[C5]
前記量子化モードは、ハフマンコーディングなしのスカラー量子化モードを備える、
C2に記載の方法。
[C6]
前記量子化モードは、ハフマンコーディングありのスカラー量子化モードを備える、
C2に記載の方法。
[C7]
前記シンタックス要素の一部分は、前記シンタックス要素の最上位ビットと前記シンタックス要素の第2の最上位ビットとを備える、
C2に記載の方法。
[C8]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用される以前のモードを示すシンタックス要素を備える、
C1に記載の方法。
[C9]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるハフマンテーブルを示すシンタックス要素を備える、
C1に記載の方法。
[C10]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルが対応する圧縮カテゴリーを識別するカテゴリー識別子を示すシンタックス要素を備える、
C1に記載の方法。
[C11]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルの要素が正の値であるか負の値であるかを示すシンタックス要素を備える、
C1に記載の方法。
[C12]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるコード化ベクトルの数を示すシンタックス要素を備える、
C1に記載の方法。
[C13]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるベクトル量子化コードブックを示す前記以前のフレームからのシンタックス要素を備える、
C1に記載の方法。
[C14]
前記ベクトルの前記圧縮されたバージョンは、前記ベクトルの要素の残差値を表すために、少なくとも部分的に、ハフマンコードを使用して前記ビットストリームにおいて表される、
C1に記載の方法。
[C15]
前記ベクトルを取得するために高次アンビソニックオーディオデータを分解することと、
前記ビットストリームを取得するために前記ビットストリームにおける前記ベクトルを指定することと
をさらに備える、C1に記載の方法。
[C16]
前記ベクトルに対応するオーディオオブジェクトを、前記ビットストリームから、取得することと、
高次アンビソニックオーディオデータを再構成するために、前記ベクトルと前記オーディオオブジェクトを組み合わせることと
をさらに備える、C1に記載の方法。
[C17]
前記ベクトルの前記圧縮は、前記ベクトルの量子化を含む、
C1に記載の方法。
[C18]
効率的なビット使用を実行するように構成されたデバイスであって、
球面調和関数領域における直交空間軸を表すベクトルを備えるビットストリームを取得すること、ここにおいて、前記ビットストリームは、前記ベクトルを圧縮するときに使用される情報を示す少なくとも1つのシンタックス要素を、以前のフレームから、再使用するかどうかのためのインジケータをさらに備える、と、
前記ビットストリームを記憶するように構成されるメモリと
を備える、デバイス。
[C19]
前記インジケータは、前記ベクトルを圧縮するときに使用される量子化モードを示すシンタックス要素の1つまたは複数のビットを備える、
C18に記載のデバイス。
[C20]
前記シンタックス要素の前記1つまたは複数のビットは、ゼロ値に設定されるとき、前記以前のフレームからの前記少なくとも1つのシンタックス要素を再使用することを示す、
C19に記載のデバイス。
[C21]
前記量子化モードは、ベクトル量子化モードを備える、
C19に記載のデバイス。
[C22]
前記量子化モードは、ハフマンコーディングなしのスカラー量子化モードを備える、
C19に記載のデバイス。
[C23]
前記量子化モードは、ハフマンコーディングありのスカラー量子化モードを備える、
C19に記載のデバイス。
[C24]
前記シンタックス要素の一部分は、前記シンタックス要素の最上位ビットと前記シンタックス要素の第2の最上位ビットとを備える、
C19に記載のデバイス。
[C25]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用される以前のモードを示すシンタックス要素を備える、
C18に記載のデバイス。
[C26]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるハフマンテーブルを示すシンタックス要素を備える、
C18に記載のデバイス。
[C27]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるハフマンテーブルを示すシンタックス要素を備える、
C18に記載のデバイス。
[C28]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルの要素が正の値であるか負の値であるかを示すシンタックス要素を備える、
C18に記載のデバイス。
[C29]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるコード化ベクトルの数を示すシンタックス要素を備える、
C18に記載のデバイス。
[C30]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるベクトル量子化コードブックを示す前記以前のフレームからのシンタックス要素を備える、
C18に記載のデバイス。
[C31]
前記ベクトルの前記圧縮されたバージョンは、前記ベクトルの要素の残差値を表すために、少なくとも部分的に、ハフマンコードを使用して前記ビットストリームにおいて表される、
C18に記載のデバイス。
[C32]
前記1つまたは複数のプロセッサは、前記ベクトルを取得するために高次アンビソニックオーディオデータを分解することと、前記ビットストリームを取得するために前記ビットストリームにおける前記ベクトルを指定することとを行うようにさらに構成される、
C18に記載のデバイス。
[C33]
前記1つまたは複数のプロセッサは、前記ベクトルに対応するオーディオオブジェクトを、前記ビットストリームから、取得することと、高次アンビソニックオーディオデータを再構成するために、前記ベクトルと前記オーディオオブジェクトを組み合わせることとを行うようにさらに構成される、
C1に記載の方法。
[C34]
前記ベクトルの前記圧縮は、前記ベクトルの量子化を含む、
C18に記載のデバイス。
[C35]
効率的なビット使用のデバイスであって、
球面調和関数領域における直交空間軸を表すベクトルを備えるビットストリームを取得するための手段、ここにおいて、前記ビットストリームは、前記ベクトルを圧縮するときに使用される情報を示す少なくとも1つのシンタックス要素を、以前のフレームから、再使用するかどうかのためのインジケータをさらに備える、と、
前記インジケータを記憶するための手段と
を備える、デバイス。
[C36]
前記インジケータは、前記ベクトルを圧縮するときに使用される量子化モードを示すシンタックス要素の1つまたは複数のビットを備える、
C35に記載のデバイス。
[C37]
前記シンタックス要素の前記1つまたは複数のビットは、ゼロ値に設定されるとき、前記以前のフレームからの前記少なくとも1つのシンタックス要素を再使用することを示す、
C36に記載のデバイス。
[C38]
前記量子化モードは、ベクトル量子化モードを備える、
C36に記載のデバイス。
[C39]
前記量子化モードは、ハフマンコーディングなしのスカラー量子化モードを備える、
C36に記載のデバイス。
[C40]
前記量子化モードは、ハフマンコーディングありのスカラー量子化モードを備える、
C36に記載のデバイス。
[C41]
前記シンタックス要素の一部分は、前記シンタックス要素の最上位ビットと前記シンタックス要素の第2の最上位ビットとを備える、
C36に記載のデバイス。
[C42]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用される以前のモードを示すシンタックス要素を備える、
C35に記載のデバイス。
[C43]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるハフマンテーブルを示すシンタックス要素を備える、
C35に記載のデバイス。
[C44]
前記以前のフレームからの前記シンタックス要素は、ベクトルが対応する圧縮カテゴリーを識別するカテゴリー識別子を示すシンタックス要素を備える、
C35に記載のデバイス。
[C45]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルの要素が正の値であるか負の値であるかを示すシンタックス要素を備える、
C35に記載のデバイス。
[C46]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるコード化ベクトルの数を示すシンタックス要素を備える、
C35に記載のデバイス。
[C47]
前記以前のフレームからの前記シンタックス要素は、前記ベクトルを圧縮するときに使用されるベクトル量子化コードブックを示す前記以前のフレームからのシンタックス要素を備える、
C35に記載のデバイス。
[C48]
前記ベクトルの前記圧縮されたバージョンは、前記ベクトルの要素の残差値を表すために、少なくとも部分的に、ハフマンコードを使用して前記ビットストリームにおいて表される、
C35に記載のデバイス。
[C49]
前記ベクトルを取得するために高次アンビソニックオーディオデータを分解するための手段と、
前記ビットストリームを取得するために前記ビットストリームにおける前記ベクトルを指定するための手段と
をさらに備える、C35に記載のデバイス。
[C50]
前記ベクトルに対応するオーディオオブジェクトを、前記ビットストリームから、取得するための手段と、
高次アンビソニックオーディオデータを再構成するために、前記ベクトルと前記オーディオオブジェクトを組み合わせるための手段と
をさらに備える、C35に記載のデバイス。
[C51]
前記ベクトルの前記圧縮は、前記ベクトルの量子化を含む、
C35に記載のデバイス。
[C52]
実行されると、1つまたは複数のプロセッサに、
球面調和関数領域における直交空間軸を表すベクトルを備えるビットストリームを取得することを行わせる命令を記憶し、前記ビットストリームは、前記ベクトルを圧縮するときに使用される情報を示す少なくとも1つのシンタックス要素を、以前のフレームから、再使用するかどうかのためのインジケータをさらに備える、
非一時的コンピュータ可読記憶媒体。
Claims (30)
- ビットストリームを処理するためのデバイスであって、前記デバイスは、
前記ビットストリームを取得すること、前記ビットストリームは、サウンドフィールドの空間成分の圧縮されたバージョンを備え、前記サウンドフィールドの前記空間成分は、球面調和関数領域におけるベクトルによって表され、現在のフレームのためのシンタックス要素の値は、特定のハフマンコードブックを決定するインデックスを示し、前記ビットストリームは、インジケータをさらに含み、
前記インジケータは、前記ビットストリームが前記現在のフレームのための前記シンタックス要素の前記値を含まないこと、および前記現在のフレームのための前記シンタックス要素の前記値が以前のフレームのための前記シンタックス要素の値に等しいことを示す特定の値を有する、と、
前記ベクトルに関連付けられたデータをコーディングするために前記特定のハフマンコードブックを使用することと
を行うように構成された1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサに結合されたメモリ、前記メモリは、前記ビットストリームを記憶するように構成される、と
を備える、デバイス。 - 前記インジケータは、前記現在のフレームのための前記シンタックス要素の前記値の1つまたは複数のビットを備える、
請求項1に記載のデバイス。 - 前記シンタックス要素は、第1のシンタックス要素であり、
前記インジケータは、前記現在のフレームのための第2のシンタックス要素の値と、前記現在のフレームのための第3のシンタックス要素の値とを備え、
前記現在のフレームのための前記第2のシンタックス要素の前記値プラス前記現在のフレームのための前記第3のシンタックス要素の前記値がゼロに等しいことは、前記ビットストリームが前記現在のフレームのための前記第1のシンタックス要素の前記値を含まないこと、および前記現在のフレームのための前記第1のシンタックス要素の前記値が前記以前のフレームのための前記第1のシンタックス要素の前記値に等しいことを示す、
請求項2に記載のデバイス。 - 前記インジケータは、前記現在のフレームのための第1のシンタックス要素の前記値の最上位ビットと、前記現在のフレームのための前記第1のシンタックス要素の前記値の第2の最上位ビットとを含む、
請求項2に記載のデバイス。 - 前記現在のフレームのための前記シンタックス要素の前記値は、前記現在のフレームのための前記シンタックス要素の前記値が5よりも大きいことに基づいて、前記特定のハフマンコードブックを示す、
請求項1に記載のデバイス。 - 前記シンタックス要素は、第1のシンタックス要素であり、
6から15までの前記第1のシンタックス要素の各それぞれの許容可能な値は、5個のハフマンコードブックのそれぞれのセットに関連付けられ、
前記ビットストリームを示す前記特定の値を有する前記インジケータは、前記現在のフレームのための第2のシンタックス要素の値を含まず、前記ビットストリームは、前記現在のフレームのための第3のシンタックス要素の値を含まず、前記現在のフレームのための前記第2のシンタックス要素の前記値は、前記以前のフレームのための前記第2のシンタックス要素の値に等しく、前記現在のフレームのための前記第3のシンタックス要素の前記値は、前記以前のフレームのための前記第3のシンタックス要素の値に等しく、
前記第2のシンタックス要素は、予測が前記ベクトルに関して実行されるかどうかを示し、
前記第3のシンタックス要素は、前記ビットストリームにおいてシグナリングされる前記第1のシンタックス要素の値に関連付けられた5個のハフマンコードブックの前記セットから、特定のハフマンコードブックを選択するために使用される追加のハフマンコードブック情報を示し、
前記1つまたは複数のプロセッサは、前記現在のフレームのための前記第2のシンタックス要素の前記値および前記現在のフレームのための前記第3のシンタックス要素の前記値に基づいて、前記ビットストリームにおいてシグナリングされる前記現在のフレームのための前記第1のシンタックス要素の前記値に関連付けられた5個のハフマンコードブックの前記セットの中から、前記特定のハフマンコードブックを決定するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記ベクトルに関連付けられた前記データをコーディングするために前記特定のハフマンコードブックを使用することの一部として、前記1つまたは複数のプロセッサが、前記ベクトルの少なくとも1つのベクトル要素をコーディングするために前記特定のハフマンコードブックを使用するように構成される、
請求項5に記載のデバイス。 - 前記1つまたは複数のプロセッサは、
前記ベクトルを取得するために高次アンビソニックオーディオデータを分解することと、
前記ビットストリームを取得するために前記ビットストリームにおける前記ベクトルを指定することと
を行うようにさらに構成される、請求項1に記載のデバイス。 - 前記1つまたは複数のプロセッサは、
前記ベクトルに対応するオーディオオブジェクトを、前記ビットストリームから取得することと、
高次アンビソニック(HOA)オーディオデータを再構成するために、前記ベクトルと前記オーディオオブジェクトを組み合わせることと
を行うようにさらに構成される、請求項1に記載のデバイス。 - 前記1つまたは複数のプロセッサは、1つまたは複数のラウドスピーカーフィードを出力するためにHOA係数をレンダリングするように構成され、
前記デバイスは、1つまたは複数のラウドスピーカーに結合され、前記1つまたは複数のラウドスピーカーフィードは、前記1つまたは複数のラウドスピーカーを駆動する、
請求項8に記載のデバイス。 - 前記シンタックス要素は、第1のシンタックス要素であり、前記1つまたは複数のプロセッサは、
前記インジケータが前記特定の値を有していないことに基づいて、前記ビットストリームから第2のシンタックス要素を取得することを行うようにさらに構成され、前記第2のシンタックス要素は、前記現在のフレームのための前記第1のシンタックス要素の前記値の最下位ビットを示す、
請求項1に記載のデバイス。 - ビットストリームを処理する方法であって、前記方法は、
前記ビットストリームを取得すること、前記ビットストリームは、サウンドフィールドの空間成分の圧縮されたバージョンを備え、前記サウンドフィールドの前記空間成分は、球面調和関数領域におけるベクトルによって表され、現在のフレームのためのシンタックス要素の値は、特定のハフマンコードブックを決定するインデックスを示し、前記ビットストリームは、インジケータをさらに含み、
前記インジケータは、前記ビットストリームが前記現在のフレームのための前記シンタックス要素の前記値を含まないこと、および前記現在のフレームのための前記シンタックス要素の前記値が以前のフレームのための前記シンタックス要素の値に等しいことを示す特定の値を有する、と、
前記ベクトルに関連付けられたデータをコーディングするために前記特定のハフマンコードブックを使用することと、
前記ビットストリームを記憶することと
を備える、方法。 - 前記インジケータは、前記現在のフレームのための前記シンタックス要素の前記値の1つまたは複数のビットを備える、
請求項11に記載の方法。 - 前記シンタックス要素は、第1のシンタックス要素であり、
前記インジケータは、前記現在のフレームのための第2のシンタックス要素の値と、前記現在のフレームのための第3のシンタックス要素の値とを備え、
前記現在のフレームのための前記第2のシンタックス要素の前記値プラス前記現在のフレームのための前記第3のシンタックス要素の前記値がゼロに等しいことは、前記ビットストリームが前記現在のフレームのための前記第1のシンタックス要素の前記値を含まないこと、および前記現在のフレームのための前記第1のシンタックス要素の前記値が前記以前のフレームのための前記第1のシンタックス要素の前記値に等しいことを示す、
請求項12に記載の方法。 - 前記インジケータは、前記現在のフレームのための第1のシンタックス要素の前記値の最上位ビットと、前記現在のフレームのための前記第1のシンタックス要素の前記値の第2の最上位ビットとを含む、
請求項12に記載の方法。 - 前記現在のフレームのための前記シンタックス要素の前記値は、前記現在のフレームのための前記シンタックス要素の前記値が5よりも大きいことに基づいて、前記特定のハフマンコードブックを示す、
請求項11に記載の方法。 - 前記シンタックス要素は、第1のシンタックス要素であり、
6から15までの前記第1のシンタックス要素の各それぞれの許容可能な値は、5個のハフマンコードブックのそれぞれのセットに関連付けられ、
前記ビットストリームを示す前記特定の値を有する前記インジケータは、前記現在のフレームのための第2のシンタックス要素の値を含まず、前記ビットストリームは、前記現在のフレームのための第3のシンタックス要素の値を含まず、前記現在のフレームのための前記第2のシンタックス要素の前記値は、前記以前のフレームのための前記第2のシンタックス要素の値に等しく、前記現在のフレームのための前記第3のシンタックス要素の前記値は、前記以前のフレームのための前記第3のシンタックス要素の値に等しく、
前記第2のシンタックス要素は、予測が前記ベクトルに関して実行されるかどうかを示し、
前記第3のシンタックス要素は、前記ビットストリームにおいてシグナリングされる前記第1のシンタックス要素の値に関連付けられた5個のハフマンコードブックの前記セットから、特定のハフマンコードブックを選択するために使用される追加のハフマンコードブック情報を示し、
前記方法は、前記現在のフレームのための前記第2のシンタックス要素の前記値および前記現在のフレームのための前記第3のシンタックス要素の前記値に基づいて、前記ビットストリームにおいてシグナリングされる前記現在のフレームのための前記第1のシンタックス要素の前記値に関連付けられた5個のハフマンコードブックの前記セットの中から、前記特定のハフマンコードブックを決定することをさらに備え、
前記ベクトルに関連付けられた前記データをコーディングするために前記特定のハフマンコードブックを使用することは、前記ベクトルの少なくとも1つのベクトル要素をコーディングするために前記特定のハフマンコードブックを使用することを備える、
請求項15に記載の方法。 - 前記ベクトルを取得するために高次アンビソニックオーディオデータを分解することと、
前記ビットストリームを取得するために前記ビットストリームにおける前記ベクトルを指定することと
をさらに備える、請求項11に記載の方法。 - 前記ベクトルに対応するオーディオオブジェクトを、前記ビットストリームから取得することと、
高次アンビソニック(HOA)オーディオデータを再構成するために、前記ベクトルと前記オーディオオブジェクトを組み合わせることと
をさらに備える、請求項11に記載の方法。 - 1つまたは複数のラウドスピーカーフィードを出力するためにHOA係数をレンダリングすることをさらに備え、
前記1つまたは複数のラウドスピーカーフィードを出力するために前記HOA係数をレンダリングするデバイスは、1つまたは複数のラウドスピーカーに結合され、前記1つまたは複数のラウドスピーカーフィードは、前記1つまたは複数のラウドスピーカーを駆動する、
請求項18に記載の方法。 - 前記シンタックス要素は、第1のシンタックス要素であり、前記方法は、
前記インジケータが前記特定の値を有していないことに基づいて、前記ビットストリームから第2のシンタックス要素を取得することをさらに備え、前記第2のシンタックス要素は、前記現在のフレームのための前記第1のシンタックス要素の前記値の最下位ビットを示す、
請求項11に記載の方法。 - ビットストリームを処理するためのデバイスであって、前記デバイスは、
前記ビットストリームを取得するための手段、前記ビットストリームは、サウンドフィールドの空間成分の圧縮されたバージョンを備え、前記サウンドフィールドの前記空間成分は、球面調和関数領域におけるベクトルによって表され、現在のフレームのためのシンタックス要素の値は、特定のハフマンコードブックを決定するインデックスを示し、前記ビットストリームは、インジケータをさらに含み、
前記インジケータは、前記ビットストリームが前記現在のフレームのための前記シンタックス要素の前記値を含まないこと、および前記現在のフレームのための前記シンタックス要素の前記値が以前のフレームのための前記シンタックス要素の値に等しいことを示す特定の値を有する、と、
前記ベクトルに関連付けられたデータをコーディングするために前記特定のハフマンコードブックを使用するための手段と、
前記ビットストリームを記憶するための手段と
を備える、デバイス。 - 前記インジケータは、前記現在のフレームのための前記シンタックス要素の前記値の1つまたは複数のビットを備える、
請求項21に記載のデバイス。 - 前記シンタックス要素は、第1のシンタックス要素であり、
前記インジケータは、前記現在のフレームのための第2のシンタックス要素の値と、前記現在のフレームのための第3のシンタックス要素の値とを備え、
前記現在のフレームのための前記第2のシンタックス要素の前記値プラス前記現在のフレームのための前記第3のシンタックス要素の前記値がゼロに等しいことは、前記ビットストリームが前記現在のフレームのための前記第1のシンタックス要素の前記値を含まないこと、および前記現在のフレームのための前記第1のシンタックス要素の前記値が前記以前のフレームのための前記第1のシンタックス要素の前記値に等しいことを示す、
請求項21に記載のデバイス。 - 前記ベクトルを取得するために高次アンビソニックオーディオデータを分解するための手段と、
前記ビットストリームを取得するために前記ビットストリームにおける前記ベクトルを指定するための手段と
さらに備える、請求項21に記載のデバイス。 - 前記シンタックス要素は、第1のシンタックス要素であり、前記デバイスは、
前記インジケータが前記特定の値を有していないことに基づいて、前記ビットストリームから第2のシンタックス要素を取得するための手段をさらに備え、前記第2のシンタックス要素は、前記現在のフレームのための前記第1のシンタックス要素の前記値の最下位ビットを示す、
請求項21に記載のデバイス。 - 命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されると、
ビットストリームを取得すること、前記ビットストリームは、サウンドフィールドの空間成分の圧縮されたバージョンを備え、前記サウンドフィールドの前記空間成分は、球面調和関数領域におけるベクトルによって表され、ここにおいて、現在のフレームのためのシンタックス要素の値は、特定のハフマンコードブックを決定するインデックスを示し、前記ビットストリームは、インジケータをさらに含み、
前記インジケータは、前記ビットストリームが前記現在のフレームのための前記シンタックス要素の前記値を含まないこと、および前記現在のフレームのための前記シンタックス要素の前記値が以前のフレームのための前記シンタックス要素の値に等しいことを示す特定の値を有する、と、
前記ベクトルに関連付けられたデータをコーディングするために前記特定のハフマンコードブックを使用することと
前記ビットストリームを記憶することと
を行うようにデバイスを構成する、非一時的コンピュータ可読記憶媒体。 - 前記インジケータは、前記現在のフレームのための前記シンタックス要素の前記値の1つまたは複数のビットを備える、
請求項26に記載の非一時的コンピュータ可読記憶媒体。 - 前記シンタックス要素は、第1のシンタックス要素であり、
前記インジケータは、前記現在のフレームのための第2のシンタックス要素の値と、前記現在のフレームのための第3のシンタックス要素の値とを備え、
前記現在のフレームのための前記第2のシンタックス要素の前記値プラス前記現在のフレームのための前記第3のシンタックス要素の前記値がゼロに等しいことは、前記ビットストリームが前記現在のフレームのための前記第1のシンタックス要素の前記値を含まないこと、および前記現在のフレームのための前記第1のシンタックス要素の前記値が前記以前のフレームのための前記第1のシンタックス要素の前記値に等しいことを示す、
請求項26に記載の非一時的コンピュータ可読記憶媒体。 - 前記命令は、実行されると、
前記ベクトルを取得するために高次アンビソニックオーディオデータを分解することと、
前記ビットストリームを取得するために前記ビットストリームにおける前記ベクトルを指定することと
を行うように前記デバイスをさらに構成する、請求項26に記載の非一時的コンピュータ可読記憶媒体。 - 前記シンタックス要素は、第1のシンタックス要素であり、前記命令は、実行されると、
前記インジケータが前記特定の値を有していないことに基づいて、前記ビットストリームから第2のシンタックス要素を取得することを行うように前記デバイスをさらに構成し、前記第2のシンタックス要素は、前記現在のフレームのための前記第1のシンタックス要素の前記値の最下位ビットを示す、
請求項26に記載の非一時的コンピュータ可読記憶媒体。
Applications Claiming Priority (36)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201461933706P | 2014-01-30 | 2014-01-30 | |
US201461933731P | 2014-01-30 | 2014-01-30 | |
US201461933714P | 2014-01-30 | 2014-01-30 | |
US61/933,714 | 2014-01-30 | ||
US61/933,731 | 2014-01-30 | ||
US61/933,706 | 2014-01-30 | ||
US201461949591P | 2014-03-07 | 2014-03-07 | |
US201461949583P | 2014-03-07 | 2014-03-07 | |
US61/949,591 | 2014-03-07 | ||
US61/949,583 | 2014-03-07 | ||
US201461994794P | 2014-05-16 | 2014-05-16 | |
US61/994,794 | 2014-05-16 | ||
US201462004147P | 2014-05-28 | 2014-05-28 | |
US201462004067P | 2014-05-28 | 2014-05-28 | |
US201462004128P | 2014-05-28 | 2014-05-28 | |
US62/004,147 | 2014-05-28 | ||
US62/004,128 | 2014-05-28 | ||
US62/004,067 | 2014-05-28 | ||
US201462019663P | 2014-07-01 | 2014-07-01 | |
US62/019,663 | 2014-07-01 | ||
US201462027702P | 2014-07-22 | 2014-07-22 | |
US62/027,702 | 2014-07-22 | ||
US201462028282P | 2014-07-23 | 2014-07-23 | |
US62/028,282 | 2014-07-23 | ||
US201462029173P | 2014-07-25 | 2014-07-25 | |
US62/029,173 | 2014-07-25 | ||
US201462032440P | 2014-08-01 | 2014-08-01 | |
US62/032,440 | 2014-08-01 | ||
US201462056286P | 2014-09-26 | 2014-09-26 | |
US201462056248P | 2014-09-26 | 2014-09-26 | |
US62/056,248 | 2014-09-26 | ||
US62/056,286 | 2014-09-26 | ||
US201562102243P | 2015-01-12 | 2015-01-12 | |
US62/102,243 | 2015-01-12 | ||
US14/609,190 | 2015-01-29 | ||
US14/609,190 US9489955B2 (en) | 2014-01-30 | 2015-01-29 | Indicating frame parameter reusability for coding vectors |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016548734A Division JP6169805B2 (ja) | 2014-01-30 | 2015-01-30 | フレームパラメータ再使用可能性を示すこと |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017215590A JP2017215590A (ja) | 2017-12-07 |
JP6542295B2 true JP6542295B2 (ja) | 2019-07-10 |
Family
ID=53679595
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016548729A Active JP6208373B2 (ja) | 2014-01-30 | 2015-01-30 | 環境高次アンビソニック係数の独立フレームをコード化すること |
JP2016548734A Active JP6169805B2 (ja) | 2014-01-30 | 2015-01-30 | フレームパラメータ再使用可能性を示すこと |
JP2017126159A Active JP6542297B2 (ja) | 2014-01-30 | 2017-06-28 | フレームパラメータ再使用可能性を示すこと |
JP2017126157A Active JP6542295B2 (ja) | 2014-01-30 | 2017-06-28 | フレームパラメータ再使用可能性を示すこと |
JP2017126158A Active JP6542296B2 (ja) | 2014-01-30 | 2017-06-28 | フレームパラメータ再使用可能性を示すこと |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016548729A Active JP6208373B2 (ja) | 2014-01-30 | 2015-01-30 | 環境高次アンビソニック係数の独立フレームをコード化すること |
JP2016548734A Active JP6169805B2 (ja) | 2014-01-30 | 2015-01-30 | フレームパラメータ再使用可能性を示すこと |
JP2017126159A Active JP6542297B2 (ja) | 2014-01-30 | 2017-06-28 | フレームパラメータ再使用可能性を示すこと |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017126158A Active JP6542296B2 (ja) | 2014-01-30 | 2017-06-28 | フレームパラメータ再使用可能性を示すこと |
Country Status (19)
Country | Link |
---|---|
US (6) | US9502045B2 (ja) |
EP (2) | EP3100265B1 (ja) |
JP (5) | JP6208373B2 (ja) |
KR (3) | KR102095091B1 (ja) |
CN (4) | CN106415714B (ja) |
AU (1) | AU2015210791B2 (ja) |
BR (2) | BR112016017283B1 (ja) |
CA (2) | CA2933901C (ja) |
CL (1) | CL2016001898A1 (ja) |
ES (1) | ES2922451T3 (ja) |
HK (1) | HK1224073A1 (ja) |
MX (1) | MX350783B (ja) |
MY (1) | MY176805A (ja) |
PH (1) | PH12016501506B1 (ja) |
RU (1) | RU2689427C2 (ja) |
SG (1) | SG11201604624TA (ja) |
TW (3) | TWI595479B (ja) |
WO (2) | WO2015116949A2 (ja) |
ZA (1) | ZA201605973B (ja) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9723305B2 (en) | 2013-03-29 | 2017-08-01 | Qualcomm Incorporated | RTP payload format designs |
US20140355769A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
EP2922057A1 (en) * | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
CN117253494A (zh) * | 2014-03-21 | 2023-12-19 | 杜比国际公司 | 用于对压缩的hoa信号进行解码的方法、装置和存储介质 |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9536531B2 (en) * | 2014-08-01 | 2017-01-03 | Qualcomm Incorporated | Editing of higher-order ambisonic audio data |
US9747910B2 (en) * | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
US20160093308A1 (en) * | 2014-09-26 | 2016-03-31 | Qualcomm Incorporated | Predictive vector quantization techniques in a higher order ambisonics (hoa) framework |
US9961475B2 (en) | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from object-based audio to HOA |
US10249312B2 (en) * | 2015-10-08 | 2019-04-02 | Qualcomm Incorporated | Quantization of spatial vectors |
US9961467B2 (en) | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from channel-based audio to HOA |
BR122021007299B1 (pt) | 2015-10-08 | 2023-04-18 | Dolby International Ab | Método para decodificar uma representação de som ambissônica de ordem superior (hoa) compactada de um som ou campo sonoro |
UA123399C2 (uk) * | 2015-10-08 | 2021-03-31 | Долбі Інтернешнл Аб | Багаторівневе кодування стиснених представлень звуку або звукового поля |
US9959880B2 (en) * | 2015-10-14 | 2018-05-01 | Qualcomm Incorporated | Coding higher-order ambisonic coefficients during multiple transitions |
US10142755B2 (en) * | 2016-02-18 | 2018-11-27 | Google Llc | Signal processing methods and systems for rendering audio on virtual loudspeaker arrays |
US20180113810A1 (en) * | 2016-10-20 | 2018-04-26 | Avago Technologies General Ip (Singapore) Pte. Ltd. | Method and system for efficient hashing optimized for hardware accelerated caching |
CN113242508B (zh) | 2017-03-06 | 2022-12-06 | 杜比国际公司 | 基于音频数据流渲染音频输出的方法、解码器系统和介质 |
JP7055595B2 (ja) * | 2017-03-29 | 2022-04-18 | 古河機械金属株式会社 | Iii族窒化物半導体基板、及び、iii族窒化物半導体基板の製造方法 |
US20180338212A1 (en) * | 2017-05-18 | 2018-11-22 | Qualcomm Incorporated | Layered intermediate compression for higher order ambisonic audio data |
US10405126B2 (en) * | 2017-06-30 | 2019-09-03 | Qualcomm Incorporated | Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems |
US10075802B1 (en) | 2017-08-08 | 2018-09-11 | Qualcomm Incorporated | Bitrate allocation for higher order ambisonic audio data |
KR102641362B1 (ko) * | 2017-11-30 | 2024-02-27 | 엘지전자 주식회사 | 비디오 신호의 처리 방법 및 장치 |
US10999693B2 (en) * | 2018-06-25 | 2021-05-04 | Qualcomm Incorporated | Rendering different portions of audio data using different renderers |
CN109101315B (zh) * | 2018-07-04 | 2021-11-19 | 上海理工大学 | 基于包簇框架的云数据中心资源分配方法 |
WO2020039734A1 (ja) * | 2018-08-21 | 2020-02-27 | ソニー株式会社 | オーディオ再生装置、オーディオ再生方法及びオーディオ再生プログラム |
MX2021001970A (es) | 2018-08-21 | 2021-05-31 | Dolby Int Ab | Métodos, aparatos y sistemas para generación, transporte y procesamiento de tramas de ejecución inmediata (ipfs). |
GB2577698A (en) * | 2018-10-02 | 2020-04-08 | Nokia Technologies Oy | Selection of quantisation schemes for spatial audio parameter encoding |
KR102599744B1 (ko) | 2018-12-07 | 2023-11-08 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 방향 컴포넌트 보상을 사용하는 DirAC 기반 공간 오디오 코딩과 관련된 인코딩, 디코딩, 장면 처리 및 기타 절차를 위한 장치, 방법 및 컴퓨터 프로그램 |
US12073842B2 (en) * | 2019-06-24 | 2024-08-27 | Qualcomm Incorporated | Psychoacoustic audio coding of ambisonic audio data |
TW202123220A (zh) | 2019-10-30 | 2021-06-16 | 美商杜拜研究特許公司 | 使用方向性元資料之多通道音頻編碼及解碼 |
US10904690B1 (en) * | 2019-12-15 | 2021-01-26 | Nuvoton Technology Corporation | Energy and phase correlated audio channels mixer |
GB2590650A (en) * | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | The merging of spatial audio parameters |
CA3187342A1 (en) * | 2020-07-30 | 2022-02-03 | Guillaume Fuchs | Apparatus, method and computer program for encoding an audio signal or for decoding an encoded audio scene |
CN111915533B (zh) * | 2020-08-10 | 2023-12-01 | 上海金桥信息股份有限公司 | 一种基于低动态范围的高精图像信息提取方法 |
US11743670B2 (en) | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
CN115346537A (zh) * | 2021-05-14 | 2022-11-15 | 华为技术有限公司 | 一种音频编码、解码方法及装置 |
CN115376528A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
CN115376530A (zh) * | 2021-05-17 | 2022-11-22 | 华为技术有限公司 | 三维音频信号编码方法、装置和编码器 |
CN115881140A (zh) * | 2021-09-29 | 2023-03-31 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序产品 |
Family Cites Families (144)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1159034B (it) | 1983-06-10 | 1987-02-25 | Cselt Centro Studi Lab Telecom | Sintetizzatore vocale |
US5012518A (en) | 1989-07-26 | 1991-04-30 | Itt Corporation | Low-bit-rate speech coder using LPC data reduction processing |
SG49883A1 (en) | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
US5757927A (en) | 1992-03-02 | 1998-05-26 | Trifield Productions Ltd. | Surround sound apparatus |
US5790759A (en) | 1995-09-19 | 1998-08-04 | Lucent Technologies Inc. | Perceptual noise masking measure based on synthesis filter frequency response |
US5819215A (en) | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
JP3849210B2 (ja) | 1996-09-24 | 2006-11-22 | ヤマハ株式会社 | 音声符号化復号方式 |
US5821887A (en) | 1996-11-12 | 1998-10-13 | Intel Corporation | Method and apparatus for decoding variable length codes |
US6167375A (en) | 1997-03-17 | 2000-12-26 | Kabushiki Kaisha Toshiba | Method for encoding and decoding a speech signal including background noise |
US6263312B1 (en) | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
AUPP272698A0 (en) | 1998-03-31 | 1998-04-23 | Lake Dsp Pty Limited | Soundfield playback from a single speaker system |
EP1018840A3 (en) | 1998-12-08 | 2005-12-21 | Canon Kabushiki Kaisha | Digital receiving apparatus and method |
US6370502B1 (en) | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US20020049586A1 (en) | 2000-09-11 | 2002-04-25 | Kousuke Nishio | Audio encoder, audio decoder, and broadcasting system |
JP2002094989A (ja) | 2000-09-14 | 2002-03-29 | Pioneer Electronic Corp | ビデオ信号符号化装置及びビデオ信号符号化方法 |
US20020169735A1 (en) | 2001-03-07 | 2002-11-14 | David Kil | Automatic mapping from data to preprocessing algorithms |
GB2379147B (en) | 2001-04-18 | 2003-10-22 | Univ York | Sound processing |
US20030147539A1 (en) | 2002-01-11 | 2003-08-07 | Mh Acoustics, Llc, A Delaware Corporation | Audio system based on at least second-order eigenbeams |
US7262770B2 (en) | 2002-03-21 | 2007-08-28 | Microsoft Corporation | Graphics image rendering with radiance self-transfer for low-frequency lighting environments |
US8160269B2 (en) | 2003-08-27 | 2012-04-17 | Sony Computer Entertainment Inc. | Methods and apparatuses for adjusting a listening area for capturing sounds |
ES2297083T3 (es) | 2002-09-04 | 2008-05-01 | Microsoft Corporation | Codificacion entropica por adaptacion de la codificacion entre modos por longitud de ejecucion y por nivel. |
FR2844894B1 (fr) | 2002-09-23 | 2004-12-17 | Remy Henri Denis Bruno | Procede et systeme de traitement d'une representation d'un champ acoustique |
US6961696B2 (en) * | 2003-02-07 | 2005-11-01 | Motorola, Inc. | Class quantization for distributed speech recognition |
US7920709B1 (en) | 2003-03-25 | 2011-04-05 | Robert Hickling | Vector sound-intensity probes operating in a half-space |
JP2005086486A (ja) | 2003-09-09 | 2005-03-31 | Alpine Electronics Inc | オーディオ装置およびオーディオ処理方法 |
US7433815B2 (en) | 2003-09-10 | 2008-10-07 | Dilithium Networks Pty Ltd. | Method and apparatus for voice transcoding between variable rate coders |
KR100556911B1 (ko) * | 2003-12-05 | 2006-03-03 | 엘지전자 주식회사 | 무선 동영상 스트리밍 서비스를 위한 동영상 데이터의 구조 |
US7283634B2 (en) | 2004-08-31 | 2007-10-16 | Dts, Inc. | Method of mixing audio channels using correlated outputs |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
FR2880755A1 (fr) | 2005-01-10 | 2006-07-14 | France Telecom | Procede et dispositif d'individualisation de hrtfs par modelisation |
KR100636229B1 (ko) * | 2005-01-14 | 2006-10-19 | 학교법인 성균관대학 | 신축형 부호화를 위한 적응적 엔트로피 부호화 및 복호화방법과 그 장치 |
WO2006122146A2 (en) | 2005-05-10 | 2006-11-16 | William Marsh Rice University | Method and apparatus for distributed compressed sensing |
ATE378793T1 (de) | 2005-06-23 | 2007-11-15 | Akg Acoustics Gmbh | Methode zur modellierung eines mikrofons |
US8510105B2 (en) | 2005-10-21 | 2013-08-13 | Nokia Corporation | Compression and decompression of data vectors |
WO2007048900A1 (fr) | 2005-10-27 | 2007-05-03 | France Telecom | Individualisation de hrtfs utilisant une modelisation par elements finis couplee a un modele correctif |
US8190425B2 (en) | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US8712061B2 (en) | 2006-05-17 | 2014-04-29 | Creative Technology Ltd | Phase-amplitude 3-D stereo encoder and decoder |
US8379868B2 (en) | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
US8345899B2 (en) | 2006-05-17 | 2013-01-01 | Creative Technology Ltd | Phase-amplitude matrixed surround decoder |
US20080004729A1 (en) | 2006-06-30 | 2008-01-03 | Nokia Corporation | Direct encoding into a directional audio coding format |
DE102006053919A1 (de) | 2006-10-11 | 2008-04-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert |
US7663623B2 (en) | 2006-12-18 | 2010-02-16 | Microsoft Corporation | Spherical harmonics scaling |
JP2008227946A (ja) * | 2007-03-13 | 2008-09-25 | Toshiba Corp | 画像復号装置 |
US8908873B2 (en) | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US9015051B2 (en) | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
EP2137973B1 (en) * | 2007-04-12 | 2019-05-01 | InterDigital VC Holdings, Inc. | Methods and apparatus for video usability information (vui) for scalable video coding (svc) |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
WO2009007639A1 (fr) | 2007-07-03 | 2009-01-15 | France Telecom | Quantification apres transformation lineaire combinant les signaux audio d'une scene sonore, codeur associe |
CN101884065B (zh) | 2007-10-03 | 2013-07-10 | 创新科技有限公司 | 用于双耳再现和格式转换的空间音频分析和合成的方法 |
EP2234104B1 (en) | 2008-01-16 | 2017-06-14 | III Holdings 12, LLC | Vector quantizer, vector inverse quantizer, and methods therefor |
EP2094032A1 (en) * | 2008-02-19 | 2009-08-26 | Deutsche Thomson OHG | Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same |
KR101230479B1 (ko) | 2008-03-10 | 2013-02-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법 |
US8219409B2 (en) | 2008-03-31 | 2012-07-10 | Ecole Polytechnique Federale De Lausanne | Audio wave field encoding |
JP5383676B2 (ja) | 2008-05-30 | 2014-01-08 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
EP2297557B1 (en) | 2008-07-08 | 2013-10-30 | Brüel & Kjaer Sound & Vibration Measurement A/S | Reconstructing an acoustic field |
US8831958B2 (en) * | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
JP5697301B2 (ja) | 2008-10-01 | 2015-04-08 | 株式会社Nttドコモ | 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、及び動画像符号化・復号システム |
GB0817950D0 (en) | 2008-10-01 | 2008-11-05 | Univ Southampton | Apparatus and method for sound reproduction |
US8207890B2 (en) | 2008-10-08 | 2012-06-26 | Qualcomm Atheros, Inc. | Providing ephemeris data and clock corrections to a satellite navigation system receiver |
US8391500B2 (en) | 2008-10-17 | 2013-03-05 | University Of Kentucky Research Foundation | Method and system for creating three-dimensional spatial audio |
FR2938688A1 (fr) | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
US8817991B2 (en) | 2008-12-15 | 2014-08-26 | Orange | Advanced encoding of multi-channel digital audio signals |
US8964994B2 (en) | 2008-12-15 | 2015-02-24 | Orange | Encoding of multichannel digital audio signals |
EP2205007B1 (en) | 2008-12-30 | 2019-01-09 | Dolby International AB | Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction |
GB2476747B (en) | 2009-02-04 | 2011-12-21 | Richard Furse | Sound system |
EP2237270B1 (en) | 2009-03-30 | 2012-07-04 | Nuance Communications, Inc. | A method for determining a noise reference signal for noise compensation and/or noise reduction |
GB0906269D0 (en) | 2009-04-09 | 2009-05-20 | Ntnu Technology Transfer As | Optimal modal beamformer for sensor arrays |
US8629600B2 (en) | 2009-05-08 | 2014-01-14 | University Of Utah Research Foundation | Annular thermoacoustic energy converter |
JP4778591B2 (ja) | 2009-05-21 | 2011-09-21 | パナソニック株式会社 | 触感処理装置 |
ES2690164T3 (es) | 2009-06-25 | 2018-11-19 | Dts Licensing Limited | Dispositivo y método para convertir una señal de audio espacial |
WO2011041834A1 (en) | 2009-10-07 | 2011-04-14 | The University Of Sydney | Reconstruction of a recorded sound field |
AU2009353896B2 (en) | 2009-10-15 | 2013-05-23 | Widex A/S | Hearing aid with audio codec and method |
BR112012009490B1 (pt) * | 2009-10-20 | 2020-12-01 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados |
SI2510515T1 (sl) | 2009-12-07 | 2014-06-30 | Dolby Laboratories Licensing Corporation | Dekodiranje večkanalnih avdio kodiranih bitnih prenosov s pomočjo adaptivne hibridne transformacije |
CN102104452B (zh) | 2009-12-22 | 2013-09-11 | 华为技术有限公司 | 信道状态信息反馈方法、信道状态信息获得方法及设备 |
TWI443646B (zh) * | 2010-02-18 | 2014-07-01 | Dolby Lab Licensing Corp | 音訊解碼器及使用有效降混之解碼方法 |
EP2539892B1 (fr) | 2010-02-26 | 2014-04-02 | Orange | Compression de flux audio multicanal |
RU2586848C2 (ru) | 2010-03-10 | 2016-06-10 | Долби Интернейшнл АБ | Декодер звукового сигнала, кодирующее устройство звукового сигнала, способы и компьютерная программа, использующие зависящее от частоты выборки кодирование контура деформации времени |
WO2011117399A1 (en) | 2010-03-26 | 2011-09-29 | Thomson Licensing | Method and device for decoding an audio soundfield representation for audio playback |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
US9398308B2 (en) * | 2010-07-28 | 2016-07-19 | Qualcomm Incorporated | Coding motion prediction direction in video coding |
NZ587483A (en) | 2010-08-20 | 2012-12-21 | Ind Res Ltd | Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions |
US9271081B2 (en) | 2010-08-27 | 2016-02-23 | Sonicemotion Ag | Method and device for enhanced sound field reproduction of spatially encoded audio input signals |
US9084049B2 (en) | 2010-10-14 | 2015-07-14 | Dolby Laboratories Licensing Corporation | Automatic equalization using adaptive frequency-domain filtering and dynamic fast convolution |
US9552840B2 (en) | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
EP2450880A1 (en) | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
KR101401775B1 (ko) | 2010-11-10 | 2014-05-30 | 한국전자통신연구원 | 스피커 어레이 기반 음장 합성을 이용한 음장 재생 장치 및 방법 |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
US20120163622A1 (en) | 2010-12-28 | 2012-06-28 | Stmicroelectronics Asia Pacific Pte Ltd | Noise detection and reduction in audio devices |
US8809663B2 (en) | 2011-01-06 | 2014-08-19 | Hank Risan | Synthetic simulation of a media recording |
US9008176B2 (en) * | 2011-01-22 | 2015-04-14 | Qualcomm Incorporated | Combined reference picture list construction for video coding |
US20120189052A1 (en) * | 2011-01-24 | 2012-07-26 | Qualcomm Incorporated | Signaling quantization parameter changes for coded units in high efficiency video coding (hevc) |
CN105244034B (zh) | 2011-04-21 | 2019-08-13 | 三星电子株式会社 | 针对语音信号或音频信号的量化方法以及解码方法和设备 |
EP2541547A1 (en) | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
US8548803B2 (en) | 2011-08-08 | 2013-10-01 | The Intellisis Corporation | System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain |
US9641951B2 (en) | 2011-08-10 | 2017-05-02 | The Johns Hopkins University | System and method for fast binaural rendering of complex acoustic scenes |
EP2560161A1 (en) | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
EP2592846A1 (en) | 2011-11-11 | 2013-05-15 | Thomson Licensing | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field |
EP2592845A1 (en) | 2011-11-11 | 2013-05-15 | Thomson Licensing | Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field |
US9584912B2 (en) | 2012-01-19 | 2017-02-28 | Koninklijke Philips N.V. | Spatial audio rendering and encoding |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9288603B2 (en) | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US9190065B2 (en) | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
CN107071687B (zh) | 2012-07-16 | 2020-02-14 | 杜比国际公司 | 用于渲染音频声场表示以供音频回放的方法和设备 |
EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
US9473870B2 (en) | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
EP2688065A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for avoiding unmasking of coding noise when mixing perceptually coded multi-channel audio signals |
EP2875511B1 (en) | 2012-07-19 | 2018-02-21 | Dolby International AB | Audio coding for improving the rendering of multi-channel audio signals |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
US9479886B2 (en) | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
JP5967571B2 (ja) | 2012-07-26 | 2016-08-10 | 本田技研工業株式会社 | 音響信号処理装置、音響信号処理方法、及び音響信号処理プログラム |
WO2014068167A1 (en) | 2012-10-30 | 2014-05-08 | Nokia Corporation | A method and apparatus for resilient vector quantization |
US9336771B2 (en) | 2012-11-01 | 2016-05-10 | Google Inc. | Speech recognition using non-parametric models |
EP2743922A1 (en) | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
US9736609B2 (en) | 2013-02-07 | 2017-08-15 | Qualcomm Incorporated | Determining renderers for spherical harmonic coefficients |
EP2765791A1 (en) | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
US10178489B2 (en) | 2013-02-08 | 2019-01-08 | Qualcomm Incorporated | Signaling audio rendering information in a bitstream |
US9609452B2 (en) | 2013-02-08 | 2017-03-28 | Qualcomm Incorporated | Obtaining sparseness information for higher order ambisonic audio renderers |
US9883310B2 (en) | 2013-02-08 | 2018-01-30 | Qualcomm Incorporated | Obtaining symmetry information for higher order ambisonic audio renderers |
US9338420B2 (en) | 2013-02-15 | 2016-05-10 | Qualcomm Incorporated | Video analysis assisted generation of multi-channel audio data |
US9685163B2 (en) | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
SG11201507066PA (en) | 2013-03-05 | 2015-10-29 | Fraunhofer Ges Forschung | Apparatus and method for multichannel direct-ambient decomposition for audio signal processing |
US9197962B2 (en) | 2013-03-15 | 2015-11-24 | Mh Acoustics Llc | Polyhedral audio system based on at least second-order eigenbeams |
US9170386B2 (en) | 2013-04-08 | 2015-10-27 | Hon Hai Precision Industry Co., Ltd. | Opto-electronic device assembly |
EP2800401A1 (en) | 2013-04-29 | 2014-11-05 | Thomson Licensing | Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US20140355769A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
US9384741B2 (en) | 2013-05-29 | 2016-07-05 | Qualcomm Incorporated | Binauralization of rotated higher order ambisonics |
WO2014195190A1 (en) * | 2013-06-05 | 2014-12-11 | Thomson Licensing | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals |
EP3933834B1 (en) | 2013-07-05 | 2024-07-24 | Dolby International AB | Enhanced soundfield coding using parametric component generation |
TWI631553B (zh) | 2013-07-19 | 2018-08-01 | 瑞典商杜比國際公司 | 將以<i>L</i><sub>1</sub>個頻道為基礎之輸入聲音訊號產生至<i>L</i><sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於<i>L</i><sub>1</sub>個聲音頻道至<i>L</i><sub>2</sub>個揚聲器頻道 |
US20150127354A1 (en) | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9502045B2 (en) | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US20150264483A1 (en) | 2014-03-14 | 2015-09-17 | Qualcomm Incorporated | Low frequency rendering of higher-order ambisonic audio data |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10142642B2 (en) | 2014-06-04 | 2018-11-27 | Qualcomm Incorporated | Block adaptive color-space conversion coding |
US20160093308A1 (en) | 2014-09-26 | 2016-03-31 | Qualcomm Incorporated | Predictive vector quantization techniques in a higher order ambisonics (hoa) framework |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
-
2015
- 2015-01-29 US US14/609,208 patent/US9502045B2/en active Active
- 2015-01-29 US US14/609,190 patent/US9489955B2/en active Active
- 2015-01-30 MX MX2016009785A patent/MX350783B/es active IP Right Grant
- 2015-01-30 KR KR1020177018248A patent/KR102095091B1/ko active IP Right Grant
- 2015-01-30 KR KR1020167023093A patent/KR101798811B1/ko active IP Right Grant
- 2015-01-30 JP JP2016548729A patent/JP6208373B2/ja active Active
- 2015-01-30 CN CN201580005153.8A patent/CN106415714B/zh active Active
- 2015-01-30 CA CA2933901A patent/CA2933901C/en active Active
- 2015-01-30 BR BR112016017283-3A patent/BR112016017283B1/pt active IP Right Grant
- 2015-01-30 TW TW104103381A patent/TWI595479B/zh active
- 2015-01-30 TW TW104103380A patent/TWI603322B/zh active
- 2015-01-30 AU AU2015210791A patent/AU2015210791B2/en active Active
- 2015-01-30 EP EP15703712.8A patent/EP3100265B1/en active Active
- 2015-01-30 EP EP15703428.1A patent/EP3100264A2/en not_active Ceased
- 2015-01-30 MY MYPI2016702092A patent/MY176805A/en unknown
- 2015-01-30 KR KR1020167023092A patent/KR101756612B1/ko active IP Right Grant
- 2015-01-30 CN CN202010075175.4A patent/CN111383645B/zh active Active
- 2015-01-30 CN CN201580005068.1A patent/CN105917408B/zh active Active
- 2015-01-30 SG SG11201604624TA patent/SG11201604624TA/en unknown
- 2015-01-30 ES ES15703712T patent/ES2922451T3/es active Active
- 2015-01-30 RU RU2016130323A patent/RU2689427C2/ru active
- 2015-01-30 BR BR112016017589-1A patent/BR112016017589B1/pt active IP Right Grant
- 2015-01-30 CA CA2933734A patent/CA2933734C/en active Active
- 2015-01-30 JP JP2016548734A patent/JP6169805B2/ja active Active
- 2015-01-30 CN CN201911044211.4A patent/CN110827840B/zh active Active
- 2015-01-30 WO PCT/US2015/013811 patent/WO2015116949A2/en active Application Filing
- 2015-01-30 TW TW106124181A patent/TWI618052B/zh active
- 2015-01-30 WO PCT/US2015/013818 patent/WO2015116952A1/en active Application Filing
-
2016
- 2016-07-26 CL CL2016001898A patent/CL2016001898A1/es unknown
- 2016-07-29 PH PH12016501506A patent/PH12016501506B1/en unknown
- 2016-08-29 ZA ZA2016/05973A patent/ZA201605973B/en unknown
- 2016-10-11 US US15/290,206 patent/US9747911B2/en active Active
- 2016-10-11 US US15/290,213 patent/US9653086B2/en active Active
- 2016-10-11 US US15/290,214 patent/US9747912B2/en active Active
- 2016-10-11 US US15/290,181 patent/US9754600B2/en active Active
- 2016-10-24 HK HK16112175.4A patent/HK1224073A1/zh unknown
-
2017
- 2017-06-28 JP JP2017126159A patent/JP6542297B2/ja active Active
- 2017-06-28 JP JP2017126157A patent/JP6542295B2/ja active Active
- 2017-06-28 JP JP2017126158A patent/JP6542296B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6542295B2 (ja) | フレームパラメータ再使用可能性を示すこと | |
JP6549156B2 (ja) | 音場を表す複数の高次アンビソニック(hoa)係数を取得するように構成された装置およびそれを取得する方法 | |
KR102329373B1 (ko) | 고차 앰비소닉 오디오 신호들로부터 분해된 코딩 벡터들에 대한 코드북들 선택 | |
JP2017520785A (ja) | 高次アンビソニック係数の閉ループ量子化 | |
JP6605725B2 (ja) | 複数の遷移の間の高次アンビソニック係数のコーディング |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190612 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6542295 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |