JP2018534617A - 複数の遷移の間の高次アンビソニック係数のコーディング - Google Patents
複数の遷移の間の高次アンビソニック係数のコーディング Download PDFInfo
- Publication number
- JP2018534617A JP2018534617A JP2018519046A JP2018519046A JP2018534617A JP 2018534617 A JP2018534617 A JP 2018534617A JP 2018519046 A JP2018519046 A JP 2018519046A JP 2018519046 A JP2018519046 A JP 2018519046A JP 2018534617 A JP2018534617 A JP 2018534617A
- Authority
- JP
- Japan
- Prior art keywords
- indication
- frame
- foreground
- vector
- bitstream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007704 transition Effects 0.000 title claims abstract description 205
- 239000013598 vector Substances 0.000 claims abstract description 436
- 230000005236 sound signal Effects 0.000 claims abstract description 257
- 230000007613 environmental effect Effects 0.000 claims abstract description 206
- 238000000034 method Methods 0.000 claims abstract description 144
- 230000004044 response Effects 0.000 claims description 42
- 238000003860 storage Methods 0.000 claims description 23
- 238000009877 rendering Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 description 55
- 238000013139 quantization Methods 0.000 description 36
- 238000004458 analytical method Methods 0.000 description 33
- 230000009467 reduction Effects 0.000 description 33
- 230000006870 function Effects 0.000 description 18
- 238000000605 extraction Methods 0.000 description 16
- 238000000354 decomposition reaction Methods 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000009826 distribution Methods 0.000 description 6
- 230000008520 organization Effects 0.000 description 6
- 238000007792 addition Methods 0.000 description 5
- 230000011664 signaling Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 108010074864 Factor XI Proteins 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009940 knitting Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- PEIBAWRLFPGPAT-UHFFFAOYSA-N 1-(diazomethyl)pyrene Chemical compound C1=C2C(C=[N+]=[N-])=CC=C(C=C3)C2=C2C3=CC=CC2=C1 PEIBAWRLFPGPAT-UHFFFAOYSA-N 0.000 description 1
- VBRBNWWNRIMAII-WYMLVPIESA-N 3-[(e)-5-(4-ethylphenoxy)-3-methylpent-3-enyl]-2,2-dimethyloxirane Chemical compound C1=CC(CC)=CC=C1OC\C=C(/C)CCC1C(C)(C)O1 VBRBNWWNRIMAII-WYMLVPIESA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/15—Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Analysis (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
2014年7月25日付けのISO/IEC JTC 1/SC 29/WG 11による「Information technology − High efficiency coding and media delivery in heterogeneous environments − Part 3:3D audio」と題するISO/IEC DIS 23008-3文書(http://mpeg.chiariglione.org/standards/mpeg−h/3d−audio/dis−mpeg−h−3d−audioにおいて入手可能であり、以下で「MPEG−H 3Dオーディオ規格のフェーズI」と呼ばれる)、
2015年7月25日付けのISO/IEC JTC 1/SC 29/WG 11による「Information technology − High efficiency coding and media delivery in heterogeneous environments − Part 3:3D audio, AMENDMENT 3:MPEG−H 3D Audio Phase 2」と題するISO/IEC DIS 23008−3:2015/PDAM 3文書(http://mpeg.chiariglione.org/standards/mpeg−h/3d−audio/text−isoiec−23008−3201xpdam−3−mpeg−h−3d−audio−phase−2において入手可能であり、以下で「MPEG−H 3Dオーディオ規格のフェーズII」と呼ばれる)、および
2015年8月付けのIEEE Journal of Selected Topics in Signal ProcessingのVol. 9、No. 5で発表された、Jurgen Herreらの「MPEG−H 3D Audio − The New Standard for Coding of Immersive Spatial Audio」に見出せる。
X=USV*
Uはy×yの実ユニタリー行列または複素ユニタリー行列を表し得、ここで、Uのy個の列は、マルチチャネルオーディオデータの左特異ベクトル(left-singular vectors)として知られる。Sは、対角線上に非負実数(non-negative real numbers)をもつy×zの矩形対角行列(rectangular diagonal matrix)を表し得、ここで、Sの対角線値(diagonal values)は、マルチチャネルオーディオデータの特異値(singular values)として知られる。V*(Vの共役転置(conjugate transpose)を示し得る)は、z×zの実ユニタリー行列または複素ユニタリー行列を表し得、ここで、V*のz個の列は、マルチチャネルオーディオデータの右特異ベクトル(right-singular vectors)として知られる。
[0081] 従来のオーディオデコーダ(上述の米国特許出願第14/594,533号および米国特許出願第14/609,208号において論じられる)は、バックグラウンドチャネル800Eからの追加環境HOA係数とともに、フォアグラウンドチャネル800Dを介して、全ての25個のvベクトル要素を受信した。HOA係数を再構成する際、従来のオーディオデコーダは、フォアグラウンドHOA係数を取得するために、全ての25個のvベクトル要素を利用し、次に、フォアグラウンドHOA係数を冗長追加環境HOA係数と組み合わせ、結果として、HOA係数を再構成するときに冗長情報が2回利用されることから、エネルギー増幅が生じる。
bNewChannelTypeOne(k)[i]=(1!=ChannelType(k−1)[i])。
擬似コードにおいて、係数低減ユニット46は、フレーム14(第1のフレームと呼ばれ得る)についてのフォアグラウンド指示を、フレーム13(第2のフレーム、先行フレーム、または直接先行フレームと呼ばれ得る)のトランスポートチャネル800Aについてのタイプに基づいて取得し得る。上記擬似コードに従って、係数低減ユニット46は、第1のフレームについてのフォアグラウンド指示を、第2のフレームについてのChannelTypeシンタックス要素が1に等しくないときは1に等しいものとして、第2のフレームについてのChannelTypeシンタックス要素が1に等しいときはゼロに等しいものとして取得し得る。
ビットストリーム中でHOAレンダリング行列をシグナリングするために、HOAレンダリング行列は、重み付け値ごとに最大0.125dBの精度で量子化される。ただし、所望のレンダリング行列が、エネルギー正規化されるように意図的に設計されている場合、この量子化ノイズは、復号されたHOAレンダリング行列を、それ以上エネルギー正規化されないようにさせる。従って、逆量子化されたレンダリング行列を、その元のエネルギー正規化された状態に再正規化するための選択肢を提案する。
この場合、左ラウドスピーカーについての個々の行列要素を復号するためのコードワードは、相応に低減されるか、または完全に省かれる。
の後に、
ビットフィールドisNormalizedが1にセットされた場合、非LFEラウドスピーカーに関連付けられた、HOAレンダリング行列のL個の行中の各重み付け値を、非LFEラウドスピーカーに関連付けられた行列のL個の行から計算された、行列のフロベニウスノルム
を追加する。
ベクトルコードブックのサイズは、値NumVvecIndicesに、およびHOA次数に依存する。変数NumVvecIndicesが1にセットされている場合、付属書類Fから導出されたHOA拡張係数を含むベクトルコードブックが使われる。NumVvecIndicesが1よりも大きい場合、Oベクトルをもつベクトルコードブックが、256×8個の重み付け値(付属書類F.12中の表)と組み合わせて使われる。HOA次数4の場合、付属書類F.6中の表から導出される32個のエントリをもつベクトルコードブックが使われる。
を、
ベクトルコードブックのサイズは、値CodebkIdx(k)[i]に、値NumVvecIndices(k)[i]に、およびHOA次数に依存する。NumVvecIndicesが1よりも大きい場合、(付属書類F.12中の表)256×8個の重み付け値が使用される。NumVvecIndicesが8よりも大きい場合、256×8個の重み付け値(付属書類F.12中の表)の最後の2列が、モジュール演算子とともに繰り返し使用される。
で置き換える。
−第kのフレーム(そのインデックスがセットIE(k)中に含まれる)中で明示的にさらに送信され、フェードインされる環境HOA成分の係数シーケンスがある場合、HOA表現のそれぞれの係数シーケンス
を、
−第kのフレーム(そのインデックスがセットIE(k)中に含まれる)中で明示的にさらに送信され、フェードインされる環境HOA成分の係数シーケンスがある場合、HOA表現のそれぞれの係数シーケンス
で置き換える。
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1] 高次アンビソニック(HOA)オーディオデータを表すビットストリームを復号するように構成されたデバイスであって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を行うように構成された1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサに結合され、前記ベクトルを記憶するように構成されたメモリとを備えるデバイス。
[C2] 前記1つまたは複数のプロセッサは、前記ビットストリームの前記フレームの間に遷移中である環境HOA係数の数のバックグラウンド指示を取得するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記バックグラウンド指示に基づいて前記複数遷移指示を取得するように構成される、C1に記載のデバイス。
[C3] 前記1つまたは複数のプロセッサは、前記環境HOA係数のうちの1つに関して遷移が起きたことを示す指示に応答して、前記バックグラウンド指示を取得するように構成される、C2に記載のデバイス。
[C4] 前記1つまたは複数のプロセッサは、前記環境HOA係数のうちのどれが前記ビットストリームの前記フレームの間に遷移中であるかを示す指示を取得するように構成される、C2に記載のデバイス。
[C5] 前記1つまたは複数のプロセッサは、フォアグラウンドオーディオ信号が前記ビットストリームの前記フレームの間に遷移中であるかどうかのフォアグラウンド指示を取得するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記フォアグラウンド指示に基づいて前記複数遷移指示を取得するように構成される、C1に記載のデバイス。
[C6] 前記複数遷移指示は、前記フォアグラウンドオーディオ信号がフェードインされるときの前記ビットストリームの前記同じフレームの間に前記環境HOA係数がフェードインされるかどうかを示す、C1に記載のデバイス。
[C7] 前記複数遷移指示は、前記フォアグラウンドオーディオ信号がフェードアウトされるときの前記ビットストリームの前記同じフレームの間に前記環境HOA係数がフェードアウトされるかどうかを示す、C1に記載のデバイス。
[C8] 前記1つまたは複数のプロセッサは、
前記ベクトルに基づいて前記HOAオーディオデータを再構成し、
前記HOAオーディオデータに基づいて、1つまたは複数のラウドスピーカーフィードをレンダリングするようにさらに構成される、C1に記載のデバイス。
[C9] 1つまたは複数のラウドスピーカーをさらに備え、
前記1つまたは複数のプロセッサは、前記1つまたは複数のラウドスピーカーを駆動するために、前記1つまたは複数のラウドスピーカーフィードを出力するようにさらに構成される、C8に記載のデバイス。
[C10] 前記デバイスはテレビジョンを備え、前記テレビジョンは、1つまたは複数の統合されたラウドスピーカーを含み、
前記1つまたは複数のプロセッサは、前記1つまたは複数のラウドスピーカーを駆動するために、前記1つまたは複数のラウドスピーカーフィードを出力するようにさらに構成される、C8に記載のデバイス。
[C11] 前記デバイスは受信機を備え、前記受信機は、1つまたは複数のラウドスピーカーに結合され、
前記1つまたは複数のプロセッサは、前記1つまたは複数のラウドスピーカーを駆動するために、前記1つまたは複数のラウドスピーカーフィードを出力するようにさらに構成される、C8に記載のデバイス。
[C12] 高次アンビソニック(HOA)オーディオデータを表すビットストリームを復号する方法であって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を備える方法。
[C13] 前記ビットストリームの前記フレームの間に遷移中である環境HOA係数の数のバックグラウンド指示を取得することと、
フォアグラウンドオーディオ信号が前記ビットストリームの前記フレームの間に遷移中であるかどうかのフォアグラウンド指示を取得することとをさらに備え、
前記複数遷移指示を取得することは、前記フォアグラウンド指示および前記バックグラウンド指示に基づいて前記複数遷移指示を取得することを備える、C12に記載の方法。
[C14] 前記バックグラウンド指示を取得することは、前記環境HOA係数のうちの1つに関して遷移が起きたことを示す指示に応答して前記バックグラウンド指示を取得することを備える、C13に記載の方法。
[C15] 前記環境HOA係数のうちのどれが前記ビットストリームの前記フレームの間に遷移中であるかを示す指示を取得することをさらに備える、C13に記載の方法。
[C16] 前記フォアグラウンド指示を取得することは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記ビットストリームの異なるフレームのトランスポートチャネルについてのタイプの指示に基づいて、前記フォアグラウンド指示を取得することを備える、C13に記載の方法。
[C17] 前記ビットストリームの前記フレームから、第1のフレームが、前記ビットストリームの異なるフレームを参照することなく前記フレームが復号されることを可能にする独立フレームであるかどうかの独立フレーム指示を取得することをさらに備える、C13に記載の方法。
[C18] 前記フォアグラウンド指示を取得することは、前記第1のフレームが独立フレームであることを示す前記独立フレーム指示に応答して、前記ビットストリームから、前記フォアグラウンド指示を取得することを備える、C17に記載の方法。
[C19] 前記第1のフレームが独立フレームでないことを示す前記独立フレーム指示に応答して、前記異なるフレームの前記トランスポートチャネルについてのタイプの指示を取得することをさらに備える、C17に記載の方法。
[C20] 前記フォアグラウンド指示を取得することは、前記異なるフレームの前記トランスポートチャネルについての前記タイプの前記指示に基づいて、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記フォアグラウンド指示を取得することを備える、C19に記載の方法。
[C21] 前記フォアグラウンド指示を取得することは、前記フォアグラウンドオーディオ信号に対応するベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記異なるフレームの前記トランスポートチャネルについての前記タイプの前記指示に基づいて、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記フォアグラウンド指示を取得することを備える、C19に記載の方法。
[C22] 前記独立フレーム指示を取得することは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記独立フレーム指示を取得することを備える、C19に記載の方法。
[C23] 前記方法は、1つまたは複数のラウドスピーカーに結合されたデバイスによって行われ、
前記方法は、
前記ベクトルに基づいて前記HOAオーディオデータを再構成することと、
前記HOAオーディオデータに基づいて、1つまたは複数のラウドスピーカーフィードをレンダリングすることと、
前記1つまたは複数のラウドスピーカーを駆動するために前記1つまたは複数のラウドスピーカーフィードを出力することとをさらに備える、C12に記載の方法。
[C24] 前記デバイスはテレビジョンを備え、
前記1つまたは複数のラウドスピーカーは、前記テレビジョン内に統合された1つまたは複数のラウドスピーカーを備える、C23に記載の方法。
ここにおいて、前記1つまたは複数のプロセッサは、前記1つまたは複数のラウドスピーカーを駆動するために、前記1つまたは複数のラウドスピーカーフィードを出力するようにさらに構成される。
[C25] 前記デバイスは受信機を備える、C23に記載の方法。
[C26] 実行されると、1つまたは複数のプロセッサに、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を行わせる命令を記憶した非一時的コンピュータ可読記憶媒体。
[C27] 高次アンビソニック(HOA)オーディオデータを表すビットストリームを復号するためのデバイスであって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得するための手段と、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得するための手段と、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を備えるデバイス。
[C28] 高次アンビソニック(HOA)オーディオデータを表すビットストリームを符号化するように構成されたデバイスであって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を行うように構成された1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサに結合され、前記ベクトルを記憶するように構成されたメモリとを備えるデバイス。
[C29] 前記1つまたは複数のプロセッサは、前記環境HOA係数のうちの1つに関して遷移が起きたことを示す指示に応答して、前記ビットストリームの前記フレームの間に遷移中である環境HOA係数の数のバックグラウンド指示を取得するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記バックグラウンド指示に基づいて前記複数遷移指示を取得するように構成される、C28に記載のデバイス。
[C30] 前記1つまたは複数のプロセッサは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、および前記ビットストリームの異なるフレームのトランスポートチャネルについてのタイプの指示に基づいて、フォアグラウンドオーディオ信号が前記ビットストリームの前記フレームの間に遷移中であるかどうかのフォアグラウンド指示を取得するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記フォアグラウンド指示に基づいて前記複数遷移指示を取得するように構成される、C28に記載のデバイス。
[C31] 前記複数遷移指示は、前記フォアグラウンドオーディオ信号がフェードインされるときの前記ビットストリームの前記同じフレームの間に前記環境HOA係数がフェードインされるかどうかを示す、C28に記載のデバイス。
[C32] 前記複数遷移指示は、前記フォアグラウンドオーディオ信号がフェードアウトされるときの前記ビットストリームの前記同じフレームの間に前記環境HOA係数がフェードアウトされるかどうかを示す、C28に記載のデバイス。
[C33] 前記HOAオーディオデータまたはその表現をキャプチャするように構成されたマイクロフォンをさらに備える、C28に記載のデバイス。
[C34] 高次アンビソニック(HOA)オーディオデータを表すビットストリームを符号化する方法であって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を備える方法。
[C35] 前記環境HOA係数のうちの1つに関して遷移が起きたことを示す指示に応答して、前記ビットストリームの前記フレームの間に遷移中である環境HOA係数の数のバックグラウンド指示を取得することと、
前記ビットストリーム中で、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、および前記ビットストリームの異なるフレームのトランスポートチャネルについてのタイプの指示に基づいて、フォアグラウンドオーディオ信号が前記ビットストリームの前記フレームの間に遷移中であるかどうかのフォアグラウンド指示を指定することとをさらに備え、
前記複数遷移指示を取得することは、前記フォアグラウンド指示および前記バックグラウンド指示に基づいて前記複数遷移指示を取得することを備える、C34に記載の方法。
[C36] 前記フォアグラウンド指示を取得することは、前記ビットストリーム中で、および前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記フォアグラウンド指示を指定することを備える、C35に記載の方法。
[C37] 前記ビットストリームの前記フレーム中で、前記フレームが、前記ビットストリームの異なるフレームを参照することなく前記フレームが復号されることを可能にする独立フレームであるかどうかの独立フレーム指示を指定することをさらに備える、C35に記載の方法。
[C38] 前記フォアグラウンド指示を取得することは、前記フレームが独立フレームであることを示す前記独立フレーム指示に応答して、前記ビットストリームから、前記フォアグラウンド指示を取得することを備える、C37に記載の方法。
[C39] 前記フレームが独立フレームでないことを示す前記独立フレーム指示に応答して、前記異なるフレームの前記トランスポートチャネルについてのタイプの指示を取得することをさらに備える、C37に記載の方法。
[C40] 前記フォアグラウンド指示を取得することは、前記異なるフレームの前記トランスポートチャネルについての前記タイプの前記指示に基づいて、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記フォアグラウンド指示を取得することを備える、C37に記載の方法。
[C41] 前記フォアグラウンド指示を取得することは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記異なるフレームの前記トランスポートチャネルについての前記タイプの前記指示に基づいて、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記フォアグラウンド指示を取得することを備える、C40に記載の方法。
[C42] 前記独立フレーム指示を取得することは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記独立フレーム指示を取得することを備える、C40に記載の方法。
[C43] 前記方法は、マイクロフォンに結合されたデバイスによって行われ、
前記方法は、前記マイクロフォンで、前記HOAオーディオデータまたはその表現をキャプチャすることをさらに備える、C34に記載の方法。
[C44] 実行されると、1つまたは複数のプロセッサに、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を行わせる命令を記憶した非一時的コンピュータ可読記憶媒体。
[C45] 高次アンビソニック(HOA)オーディオデータを表すビットストリームを符号化するためのデバイスであって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得するための手段と、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得するための手段と、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を備えるデバイス。
Claims (45)
- 高次アンビソニック(HOA)オーディオデータを表すビットストリームを復号するように構成されたデバイスであって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を行うように構成された1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサに結合され、前記ベクトルを記憶するように構成されたメモリとを備えるデバイス。 - 前記1つまたは複数のプロセッサは、前記ビットストリームの前記フレームの間に遷移中である環境HOA係数の数のバックグラウンド指示を取得するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記バックグラウンド指示に基づいて前記複数遷移指示を取得するように構成される、請求項1に記載のデバイス。 - 前記1つまたは複数のプロセッサは、前記環境HOA係数のうちの1つに関して遷移が起きたことを示す指示に応答して、前記バックグラウンド指示を取得するように構成される、請求項2に記載のデバイス。
- 前記1つまたは複数のプロセッサは、前記環境HOA係数のうちのどれが前記ビットストリームの前記フレームの間に遷移中であるかを示す指示を取得するように構成される、請求項2に記載のデバイス。
- 前記1つまたは複数のプロセッサは、フォアグラウンドオーディオ信号が前記ビットストリームの前記フレームの間に遷移中であるかどうかのフォアグラウンド指示を取得するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記フォアグラウンド指示に基づいて前記複数遷移指示を取得するように構成される、請求項1に記載のデバイス。 - 前記複数遷移指示は、前記フォアグラウンドオーディオ信号がフェードインされるときの前記ビットストリームの前記同じフレームの間に前記環境HOA係数がフェードインされるかどうかを示す、請求項1に記載のデバイス。
- 前記複数遷移指示は、前記フォアグラウンドオーディオ信号がフェードアウトされるときの前記ビットストリームの前記同じフレームの間に前記環境HOA係数がフェードアウトされるかどうかを示す、請求項1に記載のデバイス。
- 前記1つまたは複数のプロセッサは、
前記ベクトルに基づいて前記HOAオーディオデータを再構成し、
前記HOAオーディオデータに基づいて、1つまたは複数のラウドスピーカーフィードをレンダリングするようにさらに構成される、請求項1に記載のデバイス。 - 1つまたは複数のラウドスピーカーをさらに備え、
前記1つまたは複数のプロセッサは、前記1つまたは複数のラウドスピーカーを駆動するために、前記1つまたは複数のラウドスピーカーフィードを出力するようにさらに構成される、請求項8に記載のデバイス。 - 前記デバイスはテレビジョンを備え、前記テレビジョンは、1つまたは複数の統合されたラウドスピーカーを含み、
前記1つまたは複数のプロセッサは、前記1つまたは複数のラウドスピーカーを駆動するために、前記1つまたは複数のラウドスピーカーフィードを出力するようにさらに構成される、請求項8に記載のデバイス。 - 前記デバイスは受信機を備え、前記受信機は、1つまたは複数のラウドスピーカーに結合され、
前記1つまたは複数のプロセッサは、前記1つまたは複数のラウドスピーカーを駆動するために、前記1つまたは複数のラウドスピーカーフィードを出力するようにさらに構成される、請求項8に記載のデバイス。 - 高次アンビソニック(HOA)オーディオデータを表すビットストリームを復号する方法であって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を備える方法。 - 前記ビットストリームの前記フレームの間に遷移中である環境HOA係数の数のバックグラウンド指示を取得することと、
フォアグラウンドオーディオ信号が前記ビットストリームの前記フレームの間に遷移中であるかどうかのフォアグラウンド指示を取得することとをさらに備え、
前記複数遷移指示を取得することは、前記フォアグラウンド指示および前記バックグラウンド指示に基づいて前記複数遷移指示を取得することを備える、請求項12に記載の方法。 - 前記バックグラウンド指示を取得することは、前記環境HOA係数のうちの1つに関して遷移が起きたことを示す指示に応答して前記バックグラウンド指示を取得することを備える、請求項13に記載の方法。
- 前記環境HOA係数のうちのどれが前記ビットストリームの前記フレームの間に遷移中であるかを示す指示を取得することをさらに備える、請求項13に記載の方法。
- 前記フォアグラウンド指示を取得することは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記ビットストリームの異なるフレームのトランスポートチャネルについてのタイプの指示に基づいて、前記フォアグラウンド指示を取得することを備える、請求項13に記載の方法。
- 前記ビットストリームの前記フレームから、第1のフレームが、前記ビットストリームの異なるフレームを参照することなく前記フレームが復号されることを可能にする独立フレームであるかどうかの独立フレーム指示を取得することをさらに備える、請求項13に記載の方法。
- 前記フォアグラウンド指示を取得することは、前記第1のフレームが独立フレームであることを示す前記独立フレーム指示に応答して、前記ビットストリームから、前記フォアグラウンド指示を取得することを備える、請求項17に記載の方法。
- 前記第1のフレームが独立フレームでないことを示す前記独立フレーム指示に応答して、前記異なるフレームの前記トランスポートチャネルについてのタイプの指示を取得することをさらに備える、請求項17に記載の方法。
- 前記フォアグラウンド指示を取得することは、前記異なるフレームの前記トランスポートチャネルについての前記タイプの前記指示に基づいて、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記フォアグラウンド指示を取得することを備える、請求項19に記載の方法。
- 前記フォアグラウンド指示を取得することは、前記フォアグラウンドオーディオ信号に対応するベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記異なるフレームの前記トランスポートチャネルについての前記タイプの前記指示に基づいて、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記フォアグラウンド指示を取得することを備える、請求項19に記載の方法。
- 前記独立フレーム指示を取得することは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記独立フレーム指示を取得することを備える、請求項19に記載の方法。
- 前記方法は、1つまたは複数のラウドスピーカーに結合されたデバイスによって行われ、
前記方法は、
前記ベクトルに基づいて前記HOAオーディオデータを再構成することと、
前記HOAオーディオデータに基づいて、1つまたは複数のラウドスピーカーフィードをレンダリングすることと、
前記1つまたは複数のラウドスピーカーを駆動するために前記1つまたは複数のラウドスピーカーフィードを出力することとをさらに備える、請求項12に記載の方法。 - 前記デバイスはテレビジョンを備え、
前記1つまたは複数のラウドスピーカーは、前記テレビジョン内に統合された1つまたは複数のラウドスピーカーを備える、請求項23に記載の方法。
ここにおいて、前記1つまたは複数のプロセッサは、前記1つまたは複数のラウドスピーカーを駆動するために、前記1つまたは複数のラウドスピーカーフィードを出力するようにさらに構成される。 - 前記デバイスは受信機を備える、請求項23に記載の方法。
- 実行されると、1つまたは複数のプロセッサに、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を行わせる命令を記憶した非一時的コンピュータ可読記憶媒体。 - 高次アンビソニック(HOA)オーディオデータを表すビットストリームを復号するためのデバイスであって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得するための手段と、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得するための手段と、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を備えるデバイス。 - 高次アンビソニック(HOA)オーディオデータを表すビットストリームを符号化するように構成されたデバイスであって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を行うように構成された1つまたは複数のプロセッサと、
前記1つまたは複数のプロセッサに結合され、前記ベクトルを記憶するように構成されたメモリとを備えるデバイス。 - 前記1つまたは複数のプロセッサは、前記環境HOA係数のうちの1つに関して遷移が起きたことを示す指示に応答して、前記ビットストリームの前記フレームの間に遷移中である環境HOA係数の数のバックグラウンド指示を取得するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記バックグラウンド指示に基づいて前記複数遷移指示を取得するように構成される、請求項28に記載のデバイス。 - 前記1つまたは複数のプロセッサは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、および前記ビットストリームの異なるフレームのトランスポートチャネルについてのタイプの指示に基づいて、フォアグラウンドオーディオ信号が前記ビットストリームの前記フレームの間に遷移中であるかどうかのフォアグラウンド指示を取得するようにさらに構成され、
前記1つまたは複数のプロセッサは、前記フォアグラウンド指示に基づいて前記複数遷移指示を取得するように構成される、請求項28に記載のデバイス。 - 前記複数遷移指示は、前記フォアグラウンドオーディオ信号がフェードインされるときの前記ビットストリームの前記同じフレームの間に前記環境HOA係数がフェードインされるかどうかを示す、請求項28に記載のデバイス。
- 前記複数遷移指示は、前記フォアグラウンドオーディオ信号がフェードアウトされるときの前記ビットストリームの前記同じフレームの間に前記環境HOA係数がフェードアウトされるかどうかを示す、請求項28に記載のデバイス。
- 前記HOAオーディオデータまたはその表現をキャプチャするように構成されたマイクロフォンをさらに備える、請求項28に記載のデバイス。
- 高次アンビソニック(HOA)オーディオデータを表すビットストリームを符号化する方法であって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を備える方法。 - 前記環境HOA係数のうちの1つに関して遷移が起きたことを示す指示に応答して、前記ビットストリームの前記フレームの間に遷移中である環境HOA係数の数のバックグラウンド指示を取得することと、
前記ビットストリーム中で、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、および前記ビットストリームの異なるフレームのトランスポートチャネルについてのタイプの指示に基づいて、フォアグラウンドオーディオ信号が前記ビットストリームの前記フレームの間に遷移中であるかどうかのフォアグラウンド指示を指定することとをさらに備え、
前記複数遷移指示を取得することは、前記フォアグラウンド指示および前記バックグラウンド指示に基づいて前記複数遷移指示を取得することを備える、請求項34に記載の方法。 - 前記フォアグラウンド指示を取得することは、前記ビットストリーム中で、および前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記フォアグラウンド指示を指定することを備える、請求項35に記載の方法。
- 前記ビットストリームの前記フレーム中で、前記フレームが、前記ビットストリームの異なるフレームを参照することなく前記フレームが復号されることを可能にする独立フレームであるかどうかの独立フレーム指示を指定することをさらに備える、請求項35に記載の方法。
- 前記フォアグラウンド指示を取得することは、前記フレームが独立フレームであることを示す前記独立フレーム指示に応答して、前記ビットストリームから、前記フォアグラウンド指示を取得することを備える、請求項37に記載の方法。
- 前記フレームが独立フレームでないことを示す前記独立フレーム指示に応答して、前記異なるフレームの前記トランスポートチャネルについてのタイプの指示を取得することをさらに備える、請求項37に記載の方法。
- 前記フォアグラウンド指示を取得することは、前記異なるフレームの前記トランスポートチャネルについての前記タイプの前記指示に基づいて、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記フォアグラウンド指示を取得することを備える、請求項37に記載の方法。
- 前記フォアグラウンド指示を取得することは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記異なるフレームの前記トランスポートチャネルについての前記タイプの前記指示に基づいて、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記フォアグラウンド指示を取得することを備える、請求項40に記載の方法。
- 前記独立フレーム指示を取得することは、前記フォアグラウンドオーディオ信号に対応する前記ベクトルのコーディングモードが、前記ベクトルが低減されたベクトルであることを示すとき、前記異なるフレームの同じトランスポートチャネルが前記ベクトルベースのオーディオ信号を含んでいたかどうかを示す、前記フレームの前記トランスポートチャネルについての前記独立フレーム指示を取得することを備える、請求項40に記載の方法。
- 前記方法は、マイクロフォンに結合されたデバイスによって行われ、
前記方法は、前記マイクロフォンで、前記HOAオーディオデータまたはその表現をキャプチャすることをさらに備える、請求項34に記載の方法。 - 実行されると、1つまたは複数のプロセッサに、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得することと、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得することと、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を行わせる命令を記憶した非一時的コンピュータ可読記憶媒体。 - 高次アンビソニック(HOA)オーディオデータを表すビットストリームを符号化するためのデバイスであって、
フォアグラウンドオーディオ信号が遷移中であるときの前記ビットストリームの同じフレームの間に、環境HOA係数が遷移中であるかどうかの複数遷移指示を取得するための手段と、
前記複数遷移指示に基づいて、対応するフォアグラウンドオーディオ信号の空間的特性を記述するベクトルを取得するための手段と、前記ベクトルと、前記対応するフォアグラウンドオーディオ信号の両方が前記HOAオーディオデータから分解されている、を備えるデバイス。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562241665P | 2015-10-14 | 2015-10-14 | |
US62/241,665 | 2015-10-14 | ||
US15/290,229 US9959880B2 (en) | 2015-10-14 | 2016-10-11 | Coding higher-order ambisonic coefficients during multiple transitions |
US15/290,229 | 2016-10-11 | ||
PCT/US2016/056625 WO2017066312A1 (en) | 2015-10-14 | 2016-10-12 | Coding higher-order ambisonic coefficients during multiple transitions |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018534617A true JP2018534617A (ja) | 2018-11-22 |
JP2018534617A5 JP2018534617A5 (ja) | 2019-04-25 |
JP6605725B2 JP6605725B2 (ja) | 2019-11-13 |
Family
ID=57178550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018519046A Active JP6605725B2 (ja) | 2015-10-14 | 2016-10-12 | 複数の遷移の間の高次アンビソニック係数のコーディング |
Country Status (7)
Country | Link |
---|---|
US (1) | US9959880B2 (ja) |
EP (1) | EP3363213B1 (ja) |
JP (1) | JP6605725B2 (ja) |
KR (1) | KR102077412B1 (ja) |
CN (1) | CN108141690B (ja) |
CA (1) | CA2999289C (ja) |
WO (1) | WO2017066312A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022528837A (ja) * | 2019-03-27 | 2022-06-16 | ノキア テクノロジーズ オサケユイチア | 音場関連のレンダリング |
JP7704686B2 (ja) | 2019-03-27 | 2025-07-08 | ノキア テクノロジーズ オサケユイチア | 音場関連のレンダリング |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9959880B2 (en) * | 2015-10-14 | 2018-05-01 | Qualcomm Incorporated | Coding higher-order ambisonic coefficients during multiple transitions |
WO2019197404A1 (en) | 2018-04-11 | 2019-10-17 | Dolby International Ab | Methods, apparatus and systems for 6dof audio rendering and data representations and bitstream structures for 6dof audio rendering |
WO2020253941A1 (en) | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
US12142285B2 (en) | 2019-06-24 | 2024-11-12 | Qualcomm Incorporated | Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding |
US12308034B2 (en) | 2019-06-24 | 2025-05-20 | Qualcomm Incorporated | Performing psychoacoustic audio coding based on operating conditions |
US20240129681A1 (en) * | 2022-10-12 | 2024-04-18 | Qualcomm Incorporated | Scaling audio sources in extended reality systems |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010070225A1 (fr) | 2008-12-15 | 2010-06-24 | France Telecom | Codage perfectionne de signaux audionumeriques multicanaux |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9082198B2 (en) * | 2012-10-19 | 2015-07-14 | Qualcomm Technologies, Inc. | Method for creating automatic cinemagraphs on an imagine device |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
US9959880B2 (en) * | 2015-10-14 | 2018-05-01 | Qualcomm Incorporated | Coding higher-order ambisonic coefficients during multiple transitions |
-
2016
- 2016-10-11 US US15/290,229 patent/US9959880B2/en active Active
- 2016-10-12 EP EP16784721.9A patent/EP3363213B1/en active Active
- 2016-10-12 WO PCT/US2016/056625 patent/WO2017066312A1/en active Application Filing
- 2016-10-12 KR KR1020187009995A patent/KR102077412B1/ko active Active
- 2016-10-12 CN CN201680059641.1A patent/CN108141690B/zh active Active
- 2016-10-12 CA CA2999289A patent/CA2999289C/en active Active
- 2016-10-12 JP JP2018519046A patent/JP6605725B2/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022528837A (ja) * | 2019-03-27 | 2022-06-16 | ノキア テクノロジーズ オサケユイチア | 音場関連のレンダリング |
US12058511B2 (en) | 2019-03-27 | 2024-08-06 | Nokia Technologies Oy | Sound field related rendering |
JP7704686B2 (ja) | 2019-03-27 | 2025-07-08 | ノキア テクノロジーズ オサケユイチア | 音場関連のレンダリング |
Also Published As
Publication number | Publication date |
---|---|
BR112018007574A2 (pt) | 2018-10-23 |
CN108141690B (zh) | 2021-03-02 |
US20170110140A1 (en) | 2017-04-20 |
CA2999289C (en) | 2021-10-19 |
JP6605725B2 (ja) | 2019-11-13 |
EP3363213B1 (en) | 2021-09-29 |
KR20180068974A (ko) | 2018-06-22 |
EP3363213A1 (en) | 2018-08-22 |
WO2017066312A1 (en) | 2017-04-20 |
KR102077412B1 (ko) | 2020-02-13 |
CA2999289A1 (en) | 2017-04-20 |
US9959880B2 (en) | 2018-05-01 |
CN108141690A (zh) | 2018-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6542295B2 (ja) | フレームパラメータ再使用可能性を示すこと | |
JP6449455B2 (ja) | 高次アンビソニック(hoa)バックグラウンドチャネル間の相関の低減 | |
JP6612337B2 (ja) | 高次アンビソニックオーディオデータのスケーラブルコーディングのためのレイヤのシグナリング | |
CN106575506B (zh) | 用于执行高阶立体混响音频数据的中间压缩的装置和方法 | |
JP6605725B2 (ja) | 複数の遷移の間の高次アンビソニック係数のコーディング | |
KR102329373B1 (ko) | 고차 앰비소닉 오디오 신호들로부터 분해된 코딩 벡터들에 대한 코드북들 선택 | |
KR102077375B1 (ko) | Hoa 콘텐츠의 스크린 관련된 적응 | |
JP6293930B2 (ja) | 高次アンビソニック係数においてスカラー量子化とベクトル量子化との間で決定すること | |
JP2017516149A (ja) | 高次アンビソニックスオーディオ信号から分解されたベクトルをコード化すること | |
JP2017513053A (ja) | 音場の記述へのオーディオチャンネルの挿入 | |
JP2017534910A (ja) | 高次アンビソニックオーディオデータのスケーラブルコーディングのためのチャネルのシグナリング | |
JP2017520785A (ja) | 高次アンビソニック係数の閉ループ量子化 | |
JP2017519417A (ja) | 高次アンビソニック信号の間のクロスフェージング | |
JP6297721B2 (ja) | 高次アンビソニックオーディオレンダラのための希薄情報を取得すること | |
JP6423009B2 (ja) | 高次アンビソニックオーディオレンダラのためのシンメトリ情報を取得すること | |
BR112018007574B1 (pt) | Codificação de coeficientes ambissônicos de ordem superior durante múltiplas transições |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190311 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190311 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190311 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190807 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6605725 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |