JP2017525318A - 高次アンビソニック(hoa)バックグラウンドチャネル間の相関の低減 - Google Patents
高次アンビソニック(hoa)バックグラウンドチャネル間の相関の低減 Download PDFInfo
- Publication number
- JP2017525318A JP2017525318A JP2017521041A JP2017521041A JP2017525318A JP 2017525318 A JP2017525318 A JP 2017525318A JP 2017521041 A JP2017521041 A JP 2017521041A JP 2017521041 A JP2017521041 A JP 2017521041A JP 2017525318 A JP2017525318 A JP 2017525318A
- Authority
- JP
- Japan
- Prior art keywords
- environmental
- ambisonic
- coefficient
- unit
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009467 reduction Effects 0.000 title description 16
- 230000007613 environmental effect Effects 0.000 claims abstract description 191
- 238000000034 method Methods 0.000 claims abstract description 118
- 230000006870 function Effects 0.000 claims description 54
- 238000010606 normalization Methods 0.000 claims description 29
- 230000002596 correlated effect Effects 0.000 claims description 16
- 238000000354 decomposition reaction Methods 0.000 claims description 11
- 230000011664 signaling Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 5
- 230000006835 compression Effects 0.000 abstract description 6
- 238000007906 compression Methods 0.000 abstract description 6
- 239000013598 vector Substances 0.000 description 159
- 239000011159 matrix material Substances 0.000 description 105
- 238000013139 quantization Methods 0.000 description 36
- 238000004364 calculation method Methods 0.000 description 29
- 238000004458 analytical method Methods 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 27
- 238000003860 storage Methods 0.000 description 18
- 230000008520 organization Effects 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 13
- 230000009466 transformation Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 238000000605 extraction Methods 0.000 description 11
- 238000009877 rendering Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 230000007704 transition Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000010363 phase shift Effects 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000000873 masking effect Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000009940 knitting Methods 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 108010074864 Factor XI Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000116 mitigating effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
Description
2014年7月2日に出願された「REDUCING CORRELATION BETWEEN HOA BACKGROUND CHANNELS」と題する米国仮特許出願第62/020,348号、および
2014年10月6日に出願された「REDUCING CORRELATION BETWEEN HOA BACKGROUND CHANNELS」と題する米国仮特許出願第62/060,512号
の利益を主張する。
NbitQ値 量子化モードのタイプ
0〜3: 予約済み
4: ベクトル量子化
5: ハフマンコーディングなしのスカラー量子化
6: ハフマンコーディングありの6ビットスカラー量子化
7: ハフマンコーディングありの7ビットスカラー量子化
8: ハフマンコーディングありの8ビットスカラー量子化
… ・・・
16: ハフマンコーディングありの16ビットスカラー量子化
また、量子化ユニット52は、前述のタイプの量子化モードのいずれかの量子化モードの予測されたバージョンを実行することもでき、以前のフレームのVベクトルの要素(またはベクトル量子化が実行されるときの重み)と、現在のフレームのVベクトルの要素(またはベクトル量子化が実行されるときの重み)との間の差が決定される。量子化ユニット52は、その際、現在のフレーム自体のVベクトルの要素の値ではなく、現在のフレームの要素または重みと、以前のフレームの要素または重みとの間の差を量子化することができる。
CP,AMB(k−1)の第1のOMIN HOA係数シーケンスのための位相ベース変換は、それに応じて定義される。説明される変換は、1フレームの遅延を導入する場合がある。
以下に、出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
少なくとも左信号と右信号とを有する環境アンビソニック係数の無相関化された表現を取得することと、ここで、前記環境アンビソニック係数は、複数の高次アンビソニック係数から抽出されており、前記複数の高次アンビソニック係数によって記述された音場のバックグラウンド成分を表し、ここにおいて、前記複数の高次アンビソニック係数のうちの少なくとも1つは、1よりも大きい次数を有する球面基底関数に関連付けられる、
前記環境アンビソニック係数の前記無相関化された表現に基づいてスピーカーフィードを生成することと
を備える方法。
[C2]
複数の相関化された環境アンビソニック係数を取得するために、再相関化変換を前記環境アンビソニック係数の前記無相関化された表現に適用することをさらに備える、上記C1に記載の方法。
[C3]
前記再相関化変換を適用することが、逆位相ベース変換を前記環境アンビソニック係数に適用することを備える、上記C2に記載の方法。
[C4]
前記逆位相ベース変換が、N3D(フル3D)正規化の1つに従って正規化されている、上記C3に記載の方法。
[C5]
前記逆位相ベース変換が、SN3D正規化(シュミット半正規化)に従って正規化されている、上記C3に記載の方法。
[C6]
前記環境アンビソニック係数が、0の次数または1の次数を有する球面基底関数に関連付けられ、前記逆位相ベース変換を適用することが、前記環境アンビソニック係数の前記無相関化された表現に対して位相ベース変換のスカラー乗算を実行することを備える、上記C3に記載の方法。
[C7]
環境アンビソニック係数の前記無相関化された表現が無相関化変換で無相関化されたという指示を取得することをさらに備える、上記C1に記載の方法。
[C8]
前記音場のフォアグラウンド成分の空間特性を定義する1つまたは複数の空間成分を取得すること、ここで、前記空間成分は、球面調和領域において定義され、前記複数の高次アンビソニック係数に対して分解を実行することによって生成される、をさらに備え、
前記スピーカーフィードを生成することが、前記相関化された環境アンビソニック係数を、前記1つまたは複数の空間成分に基づいて取得された1つまたは複数のフォアグラウンドチャネルと組み合わせることを備える、
上記C1に記載の方法。
[C9]
環境アンビソニック係数の無相関化された表現を取得するために、無相関化変換を前記環境アンビソニック係数に適用すること、ここで、環境HOA係数は、複数の高次アンビソニック係数から抽出されており、前記複数の高次アンビソニック係数によって記述された音場のバックグラウンド成分を表し、ここにおいて、前記複数の高次アンビソニック係数のうちの少なくとも1つは、1よりも大きい次数を有する球面基底関数に関連付けられる、
を備える方法。
[C10]
前記無相関化変換を適用することが、位相ベース変換を前記環境アンビソニック係数に適用することを備える、上記C9に記載の方法。
[C11]
N3D(フル3D)正規化に従って前記位相ベース変換を正規化することをさらに備える、上記C10に記載の方法。
[C12]
SN3D正規化(シュミット半正規化)に従って前記位相ベース変換を正規化することをさらに備える、上記C10に記載の方法。
[C13]
前記環境アンビソニック係数が、0の次数または1の次数を有する球面基底関数に関連付けられ、前記位相ベース変換を前記環境アンビソニック係数に適用することが、前記環境アンビソニック係数の少なくともサブセットに対して前記位相ベース変換のスカラー乗算を実行することを備える、上記C10に記載の方法。
[C14]
前記無相関化変換が前記環境アンビソニック係数に適用されているという指示をシグナリングすることをさらに備える、上記C10に記載の方法。
[C15]
オーディオデータを処理するためのデバイスであって、
処理されるべき前記オーディオデータの少なくとも一部分を記憶するように構成されたメモリと、
1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサが、
少なくとも左信号と右信号とを有する環境アンビソニック係数の無相関化された表現を取得することと、ここで、前記環境アンビソニック係数は、複数の高次アンビソニック係数から抽出されており、前記複数の高次アンビソニック係数によって記述された音場のバックグラウンド成分を表し、ここにおいて、前記複数の高次アンビソニック係数のうちの少なくとも1つは、1よりも大きい次数を有する球面基底関数に関連付けられる、
前記環境アンビソニック係数の前記無相関化された表現に基づいてスピーカーフィードを生成することと
を行うように構成される、
デバイス。
[C16]
前記スピーカーフィードを生成するために、前記1つまたは複数のプロセッサが、ステレオ再生システムによる出力のために、前記左信号に基づいて左スピーカーフィードを生成し、前記右信号に基づいて右スピーカーフィードを生成するように構成される、上記C15に記載のデバイス。
[C17]
前記スピーカーフィードを生成するために、前記1つまたは複数のプロセッサが、再相関化変換を前記右信号と前記左信号とに適用することなしに、左スピーカーフィードとして前記左信号を使用し、右スピーカーフィードとして前記右信号を使用するように構成される、上記C15に記載のデバイス。
[C18]
前記スピーカーフィードを生成するために、前記1つまたは複数のプロセッサが、モノオーディオシステムによる出力のために、前記左信号と前記右信号とを混合するように構成される、上記C15に記載のデバイス。
[C19]
前記スピーカーフィードを生成するために、前記1つまたは複数のプロセッサが、前記相関化された環境アンビソニック係数を1つまたは複数のフォアグラウンドチャネルと組み合わせるように構成される、上記C15に記載のデバイス。
[C20]
前記1つまたは複数のプロセッサが、前記相関化された環境アンビソニック係数と組み合わせるべきフォアグラウンドチャネルが利用可能ではないと決定するようにさらに構成される、上記C15に記載のデバイス。
[C21]
前記1つまたは複数のプロセッサが、
前記音場がモノオーディオ再生システムを介して出力されるべきであると決定することと、
前記モノオーディオ再生システムによる出力のためのデータを含む前記無相関化された環境アンビソニック係数の少なくともサブセットを復号することと
を行うようにさらに構成される、上記C15に記載のデバイス。
[C22]
前記1つまたは複数のプロセッサが、環境アンビソニック係数の前記無相関化された表現が無相関化変換で無相関化されたという指示を取得するようにさらに構成される、上記C15に記載のデバイス。
[C23]
前記環境アンビソニック係数の前記無相関化された表現に基づいて生成された前記スピーカーフィードを出力するように構成されたラウドスピーカーをさらに備える、上記C15に記載のデバイス。
[C24]
オーディオデータを圧縮するためのデバイスであって、
圧縮されるべき前記オーディオデータの少なくとも一部分を記憶するように構成されたメモリと、
1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサが、
環境アンビソニック係数の無相関化された表現を取得するために、無相関化変換を前記環境アンビソニック係数に適用すること、ここで、環境HOA係数は、複数の高次アンビソニック係数から抽出されており、前記複数の高次アンビソニック係数によって記述された音場のバックグラウンド成分を表し、ここにおいて、前記複数の高次アンビソニック係数のうちの少なくとも1つは、1よりも大きい次数を有する球面基底関数に関連付けられる、
を行うように構成される、
デバイス。
[C25]
前記1つまたは複数のプロセッサが、1つまたは複数のフォアグラウンドチャネルとともに前記無相関化された環境アンビソニック係数をシグナリングするようにさらに構成される、上記C24に記載のデバイス。
[C26]
1つまたは複数のフォアグラウンドチャネルとともに前記無相関化された環境アンビソニック係数をシグナリングするために、前記1つまたは複数のプロセッサが、ターゲットビットレートが所定の閾値を満たすかまたは超えるという決定に応答して、1つまたは複数のフォアグラウンドチャネルとともに前記無相関化された環境アンビソニック係数をシグナリングするように構成される、上記C24に記載のデバイス。
[C27]
前記1つまたは複数のプロセッサが、いかなるフォアグラウンドチャネルもシグナリングすることなしに、前記無相関化された環境アンビソニック係数をシグナリングするようにさらに構成される、上記C24に記載のデバイス。
[C28]
いかなるフォアグラウンドチャネルもシグナリングすることなしに、前記無相関化された環境アンビソニック係数をシグナリングするために、前記1つまたは複数のプロセッサが、ターゲットビットレートが所定の閾値を下回るという決定に応答して、いかなるフォアグラウンドチャネルもシグナリングすることなしに、前記無相関化された環境アンビソニック係数をシグナリングするように構成される、上記C27に記載のデバイス。
[C29]
前記1つまたは複数のプロセッサが、前記無相関化変換が前記環境アンビソニック係数に適用されているという指示をシグナリングするようにさらに構成される、上記C28に記載のデバイス。
[C30]
圧縮されるべき前記オーディオデータをキャプチャするように構成されたマイクロフォンをさらに備える、上記C24に記載のデバイス。
Claims (30)
- 少なくとも左信号と右信号とを有する環境アンビソニック係数の無相関化された表現を取得することと、ここで、前記環境アンビソニック係数は、複数の高次アンビソニック係数から抽出されており、前記複数の高次アンビソニック係数によって記述された音場のバックグラウンド成分を表し、ここにおいて、前記複数の高次アンビソニック係数のうちの少なくとも1つは、1よりも大きい次数を有する球面基底関数に関連付けられる、
前記環境アンビソニック係数の前記無相関化された表現に基づいてスピーカーフィードを生成することと
を備える方法。 - 複数の相関化された環境アンビソニック係数を取得するために、再相関化変換を前記環境アンビソニック係数の前記無相関化された表現に適用することをさらに備える、請求項1に記載の方法。
- 前記再相関化変換を適用することが、逆位相ベース変換を前記環境アンビソニック係数に適用することを備える、請求項2に記載の方法。
- 前記逆位相ベース変換が、N3D(フル3D)正規化の1つに従って正規化されている、請求項3に記載の方法。
- 前記逆位相ベース変換が、SN3D正規化(シュミット半正規化)に従って正規化されている、請求項3に記載の方法。
- 前記環境アンビソニック係数が、0の次数または1の次数を有する球面基底関数に関連付けられ、前記逆位相ベース変換を適用することが、前記環境アンビソニック係数の前記無相関化された表現に対して位相ベース変換のスカラー乗算を実行することを備える、請求項3に記載の方法。
- 環境アンビソニック係数の前記無相関化された表現が無相関化変換で無相関化されたという指示を取得することをさらに備える、請求項1に記載の方法。
- 前記音場のフォアグラウンド成分の空間特性を定義する1つまたは複数の空間成分を取得すること、ここで、前記空間成分は、球面調和領域において定義され、前記複数の高次アンビソニック係数に対して分解を実行することによって生成される、をさらに備え、
前記スピーカーフィードを生成することが、前記相関化された環境アンビソニック係数を、前記1つまたは複数の空間成分に基づいて取得された1つまたは複数のフォアグラウンドチャネルと組み合わせることを備える、
請求項1に記載の方法。 - 環境アンビソニック係数の無相関化された表現を取得するために、無相関化変換を前記環境アンビソニック係数に適用すること、ここで、環境HOA係数は、複数の高次アンビソニック係数から抽出されており、前記複数の高次アンビソニック係数によって記述された音場のバックグラウンド成分を表し、ここにおいて、前記複数の高次アンビソニック係数のうちの少なくとも1つは、1よりも大きい次数を有する球面基底関数に関連付けられる、
を備える方法。 - 前記無相関化変換を適用することが、位相ベース変換を前記環境アンビソニック係数に適用することを備える、請求項9に記載の方法。
- N3D(フル3D)正規化に従って前記位相ベース変換を正規化することをさらに備える、請求項10に記載の方法。
- SN3D正規化(シュミット半正規化)に従って前記位相ベース変換を正規化することをさらに備える、請求項10に記載の方法。
- 前記環境アンビソニック係数が、0の次数または1の次数を有する球面基底関数に関連付けられ、前記位相ベース変換を前記環境アンビソニック係数に適用することが、前記環境アンビソニック係数の少なくともサブセットに対して前記位相ベース変換のスカラー乗算を実行することを備える、請求項10に記載の方法。
- 前記無相関化変換が前記環境アンビソニック係数に適用されているという指示をシグナリングすることをさらに備える、請求項10に記載の方法。
- オーディオデータを処理するためのデバイスであって、
処理されるべき前記オーディオデータの少なくとも一部分を記憶するように構成されたメモリと、
1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサが、
少なくとも左信号と右信号とを有する環境アンビソニック係数の無相関化された表現を取得することと、ここで、前記環境アンビソニック係数は、複数の高次アンビソニック係数から抽出されており、前記複数の高次アンビソニック係数によって記述された音場のバックグラウンド成分を表し、ここにおいて、前記複数の高次アンビソニック係数のうちの少なくとも1つは、1よりも大きい次数を有する球面基底関数に関連付けられる、
前記環境アンビソニック係数の前記無相関化された表現に基づいてスピーカーフィードを生成することと
を行うように構成される、
デバイス。 - 前記スピーカーフィードを生成するために、前記1つまたは複数のプロセッサが、ステレオ再生システムによる出力のために、前記左信号に基づいて左スピーカーフィードを生成し、前記右信号に基づいて右スピーカーフィードを生成するように構成される、請求項15に記載のデバイス。
- 前記スピーカーフィードを生成するために、前記1つまたは複数のプロセッサが、再相関化変換を前記右信号と前記左信号とに適用することなしに、左スピーカーフィードとして前記左信号を使用し、右スピーカーフィードとして前記右信号を使用するように構成される、請求項15に記載のデバイス。
- 前記スピーカーフィードを生成するために、前記1つまたは複数のプロセッサが、モノオーディオシステムによる出力のために、前記左信号と前記右信号とを混合するように構成される、請求項15に記載のデバイス。
- 前記スピーカーフィードを生成するために、前記1つまたは複数のプロセッサが、前記相関化された環境アンビソニック係数を1つまたは複数のフォアグラウンドチャネルと組み合わせるように構成される、請求項15に記載のデバイス。
- 前記1つまたは複数のプロセッサが、前記相関化された環境アンビソニック係数と組み合わせるべきフォアグラウンドチャネルが利用可能ではないと決定するようにさらに構成される、請求項15に記載のデバイス。
- 前記1つまたは複数のプロセッサが、
前記音場がモノオーディオ再生システムを介して出力されるべきであると決定することと、
前記モノオーディオ再生システムによる出力のためのデータを含む前記無相関化された環境アンビソニック係数の少なくともサブセットを復号することと
を行うようにさらに構成される、請求項15に記載のデバイス。 - 前記1つまたは複数のプロセッサが、環境アンビソニック係数の前記無相関化された表現が無相関化変換で無相関化されたという指示を取得するようにさらに構成される、請求項15に記載のデバイス。
- 前記環境アンビソニック係数の前記無相関化された表現に基づいて生成された前記スピーカーフィードを出力するように構成されたラウドスピーカーをさらに備える、請求項15に記載のデバイス。
- オーディオデータを圧縮するためのデバイスであって、
圧縮されるべき前記オーディオデータの少なくとも一部分を記憶するように構成されたメモリと、
1つまたは複数のプロセッサとを備え、前記1つまたは複数のプロセッサが、
環境アンビソニック係数の無相関化された表現を取得するために、無相関化変換を前記環境アンビソニック係数に適用すること、ここで、環境HOA係数は、複数の高次アンビソニック係数から抽出されており、前記複数の高次アンビソニック係数によって記述された音場のバックグラウンド成分を表し、ここにおいて、前記複数の高次アンビソニック係数のうちの少なくとも1つは、1よりも大きい次数を有する球面基底関数に関連付けられる、
を行うように構成される、
デバイス。 - 前記1つまたは複数のプロセッサが、1つまたは複数のフォアグラウンドチャネルとともに前記無相関化された環境アンビソニック係数をシグナリングするようにさらに構成される、請求項24に記載のデバイス。
- 1つまたは複数のフォアグラウンドチャネルとともに前記無相関化された環境アンビソニック係数をシグナリングするために、前記1つまたは複数のプロセッサが、ターゲットビットレートが所定の閾値を満たすかまたは超えるという決定に応答して、1つまたは複数のフォアグラウンドチャネルとともに前記無相関化された環境アンビソニック係数をシグナリングするように構成される、請求項24に記載のデバイス。
- 前記1つまたは複数のプロセッサが、いかなるフォアグラウンドチャネルもシグナリングすることなしに、前記無相関化された環境アンビソニック係数をシグナリングするようにさらに構成される、請求項24に記載のデバイス。
- いかなるフォアグラウンドチャネルもシグナリングすることなしに、前記無相関化された環境アンビソニック係数をシグナリングするために、前記1つまたは複数のプロセッサが、ターゲットビットレートが所定の閾値を下回るという決定に応答して、いかなるフォアグラウンドチャネルもシグナリングすることなしに、前記無相関化された環境アンビソニック係数をシグナリングするように構成される、請求項27に記載のデバイス。
- 前記1つまたは複数のプロセッサが、前記無相関化変換が前記環境アンビソニック係数に適用されているという指示をシグナリングするようにさらに構成される、請求項28に記載のデバイス。
- 圧縮されるべき前記オーディオデータをキャプチャするように構成されたマイクロフォンをさらに備える、請求項24に記載のデバイス。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462020348P | 2014-07-02 | 2014-07-02 | |
US62/020,348 | 2014-07-02 | ||
US201462060512P | 2014-10-06 | 2014-10-06 | |
US62/060,512 | 2014-10-06 | ||
US14/789,961 | 2015-07-01 | ||
US14/789,961 US9838819B2 (en) | 2014-07-02 | 2015-07-01 | Reducing correlation between higher order ambisonic (HOA) background channels |
PCT/US2015/038943 WO2016004277A1 (en) | 2014-07-02 | 2015-07-02 | Reducing correlation between higher order ambisonic (hoa) background channels |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017525318A true JP2017525318A (ja) | 2017-08-31 |
JP2017525318A5 JP2017525318A5 (ja) | 2018-04-26 |
JP6449455B2 JP6449455B2 (ja) | 2019-01-09 |
Family
ID=55017979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017521041A Active JP6449455B2 (ja) | 2014-07-02 | 2015-07-02 | 高次アンビソニック(hoa)バックグラウンドチャネル間の相関の低減 |
Country Status (20)
Country | Link |
---|---|
US (1) | US9838819B2 (ja) |
EP (1) | EP3165001B1 (ja) |
JP (1) | JP6449455B2 (ja) |
KR (1) | KR101962000B1 (ja) |
CN (1) | CN106663433B (ja) |
AU (1) | AU2015284004B2 (ja) |
BR (1) | BR112016030558B1 (ja) |
CA (1) | CA2952333C (ja) |
CL (1) | CL2016003315A1 (ja) |
ES (1) | ES2729624T3 (ja) |
HU (1) | HUE043457T2 (ja) |
IL (1) | IL249257A0 (ja) |
MX (1) | MX357008B (ja) |
MY (1) | MY183858A (ja) |
NZ (1) | NZ726830A (ja) |
PH (1) | PH12016502356A1 (ja) |
RU (1) | RU2741763C2 (ja) |
SA (1) | SA516380612B1 (ja) |
SG (1) | SG11201609676VA (ja) |
WO (1) | WO2016004277A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104823459B (zh) * | 2012-11-28 | 2018-04-17 | 歌乐株式会社 | 数字扬声器系统以及数字扬声器系统的接线方法 |
US10140996B2 (en) * | 2014-10-10 | 2018-11-27 | Qualcomm Incorporated | Signaling layers for scalable coding of higher order ambisonic audio data |
US10600425B2 (en) * | 2015-11-17 | 2020-03-24 | Dolby Laboratories Licensing Corporation | Method and apparatus for converting a channel-based 3D audio signal to an HOA audio signal |
US9854375B2 (en) * | 2015-12-01 | 2017-12-26 | Qualcomm Incorporated | Selection of coded next generation audio data for transport |
WO2017126895A1 (ko) * | 2016-01-19 | 2017-07-27 | 지오디오랩 인코포레이티드 | 오디오 신호 처리 장치 및 처리 방법 |
MC200186B1 (fr) * | 2016-09-30 | 2017-10-18 | Coronal Encoding | Procédé de conversion, d'encodage stéréophonique, de décodage et de transcodage d'un signal audio tridimensionnel |
FR3060830A1 (fr) * | 2016-12-21 | 2018-06-22 | Orange | Traitement en sous-bandes d'un contenu ambisonique reel pour un decodage perfectionne |
US10560661B2 (en) | 2017-03-16 | 2020-02-11 | Dolby Laboratories Licensing Corporation | Detecting and mitigating audio-visual incongruence |
US10893373B2 (en) | 2017-05-09 | 2021-01-12 | Dolby Laboratories Licensing Corporation | Processing of a multi-channel spatial audio format input signal |
US20180338212A1 (en) | 2017-05-18 | 2018-11-22 | Qualcomm Incorporated | Layered intermediate compression for higher order ambisonic audio data |
CN117133297A (zh) | 2017-08-10 | 2023-11-28 | 华为技术有限公司 | 时域立体声参数的编码方法和相关产品 |
US10972851B2 (en) * | 2017-10-05 | 2021-04-06 | Qualcomm Incorporated | Spatial relation coding of higher order ambisonic coefficients |
US10657974B2 (en) * | 2017-12-21 | 2020-05-19 | Qualcomm Incorporated | Priority information for higher order ambisonic audio data |
GB201818959D0 (en) | 2018-11-21 | 2019-01-09 | Nokia Technologies Oy | Ambience audio representation and associated rendering |
KR102323529B1 (ko) | 2018-12-17 | 2021-11-09 | 한국전자통신연구원 | 복합 차수 앰비소닉을 이용한 오디오 신호 처리 방법 및 장치 |
US11538489B2 (en) * | 2019-06-24 | 2022-12-27 | Qualcomm Incorporated | Correlating scene-based audio data for psychoacoustic audio coding |
US11361776B2 (en) | 2019-06-24 | 2022-06-14 | Qualcomm Incorporated | Coding scaled spatial components |
US20200402521A1 (en) * | 2019-06-24 | 2020-12-24 | Qualcomm Incorporated | Performing psychoacoustic audio coding based on operating conditions |
US11743670B2 (en) * | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013536630A (ja) * | 2010-07-26 | 2013-09-19 | クゥアルコム・インコーポレイテッド | 空間における、音響イメージのエンハンスされた生成のための、システム、方法および装置 |
EP2688065A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for avoiding unmasking of coding noise when mixing perceptually coded multi-channel audio signals |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2858512A1 (fr) * | 2003-07-30 | 2005-02-04 | France Telecom | Procede et dispositif de traitement de donnees sonores en contexte ambiophonique |
CN101518100B (zh) * | 2006-09-14 | 2011-12-07 | Lg电子株式会社 | 对话增强技术 |
CN101136197B (zh) * | 2007-10-16 | 2011-07-20 | 得理微电子(上海)有限公司 | 基于时变延迟线的数字混响处理器 |
EP2094032A1 (en) * | 2008-02-19 | 2009-08-26 | Deutsche Thomson OHG | Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same |
CN101981811B (zh) * | 2008-03-31 | 2013-10-23 | 创新科技有限公司 | 音频信号的自适应主体-环境分解 |
US8964994B2 (en) | 2008-12-15 | 2015-02-24 | Orange | Encoding of multichannel digital audio signals |
GB2467534B (en) * | 2009-02-04 | 2014-12-24 | Richard Furse | Sound system |
EP2539892B1 (fr) * | 2010-02-26 | 2014-04-02 | Orange | Compression de flux audio multicanal |
NZ587483A (en) * | 2010-08-20 | 2012-12-21 | Ind Res Ltd | Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions |
US9271081B2 (en) * | 2010-08-27 | 2016-02-23 | Sonicemotion Ag | Method and device for enhanced sound field reproduction of spatially encoded audio input signals |
ES2553398T3 (es) * | 2010-11-03 | 2015-12-09 | Huawei Technologies Co., Ltd. | Codificador paramétrico para codificar una señal de audio multicanal |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2544466A1 (en) * | 2011-07-05 | 2013-01-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor |
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
EP2665208A1 (en) | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
US9288603B2 (en) * | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US20140086416A1 (en) * | 2012-07-15 | 2014-03-27 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
EP2688066A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction |
US9473870B2 (en) * | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
US9761229B2 (en) * | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
FR2995752B1 (fr) * | 2012-09-18 | 2015-06-05 | Parrot | Enceinte acoustique active monobloc configurable pour etre utilisee isolement ou par paire, avec renforcement de l'image stereo. |
US9124966B2 (en) * | 2012-11-28 | 2015-09-01 | Qualcomm Incorporated | Image generation for collaborative sound systems |
EP2738962A1 (en) * | 2012-11-29 | 2014-06-04 | Thomson Licensing | Method and apparatus for determining dominant sound source directions in a higher order ambisonics representation of a sound field |
CN108174341B (zh) * | 2013-01-16 | 2021-01-08 | 杜比国际公司 | 测量高阶高保真度立体声响复制响度级的方法及设备 |
US20140358565A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
CN105706468B (zh) * | 2013-09-17 | 2017-08-11 | 韦勒斯标准与技术协会公司 | 用于音频信号处理的方法和设备 |
EP2866475A1 (en) * | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9940937B2 (en) * | 2014-10-10 | 2018-04-10 | Qualcomm Incorporated | Screen related adaptation of HOA content |
-
2015
- 2015-07-01 US US14/789,961 patent/US9838819B2/en active Active
- 2015-07-02 JP JP2017521041A patent/JP6449455B2/ja active Active
- 2015-07-02 MY MYPI2016704357A patent/MY183858A/en unknown
- 2015-07-02 NZ NZ72683015A patent/NZ726830A/en unknown
- 2015-07-02 EP EP15741701.5A patent/EP3165001B1/en active Active
- 2015-07-02 ES ES15741701T patent/ES2729624T3/es active Active
- 2015-07-02 SG SG11201609676VA patent/SG11201609676VA/en unknown
- 2015-07-02 CA CA2952333A patent/CA2952333C/en active Active
- 2015-07-02 MX MX2016016566A patent/MX357008B/es active IP Right Grant
- 2015-07-02 AU AU2015284004A patent/AU2015284004B2/en active Active
- 2015-07-02 WO PCT/US2015/038943 patent/WO2016004277A1/en active Application Filing
- 2015-07-02 RU RU2016151352A patent/RU2741763C2/ru not_active Application Discontinuation
- 2015-07-02 CN CN201580033805.9A patent/CN106663433B/zh active Active
- 2015-07-02 KR KR1020167036985A patent/KR101962000B1/ko active IP Right Grant
- 2015-07-02 HU HUE15741701A patent/HUE043457T2/hu unknown
- 2015-07-02 BR BR112016030558-2A patent/BR112016030558B1/pt active IP Right Grant
-
2016
- 2016-11-25 PH PH12016502356A patent/PH12016502356A1/en unknown
- 2016-11-28 IL IL249257A patent/IL249257A0/en active IP Right Grant
- 2016-12-22 CL CL2016003315A patent/CL2016003315A1/es unknown
- 2016-12-27 SA SA516380612A patent/SA516380612B1/ar unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013536630A (ja) * | 2010-07-26 | 2013-09-19 | クゥアルコム・インコーポレイテッド | 空間における、音響イメージのエンハンスされた生成のための、システム、方法および装置 |
EP2688065A1 (en) * | 2012-07-16 | 2014-01-22 | Thomson Licensing | Method and apparatus for avoiding unmasking of coding noise when mixing perceptually coded multi-channel audio signals |
EP2743922A1 (en) * | 2012-12-12 | 2014-06-18 | Thomson Licensing | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
Also Published As
Publication number | Publication date |
---|---|
WO2016004277A1 (en) | 2016-01-07 |
BR112016030558B1 (pt) | 2023-05-02 |
BR112016030558A2 (ja) | 2017-08-22 |
CA2952333A1 (en) | 2016-01-07 |
CN106663433A (zh) | 2017-05-10 |
CA2952333C (en) | 2020-10-27 |
SG11201609676VA (en) | 2017-01-27 |
IL249257A0 (en) | 2017-02-28 |
RU2016151352A3 (ja) | 2020-08-13 |
EP3165001A1 (en) | 2017-05-10 |
HUE043457T2 (hu) | 2019-08-28 |
MX357008B (es) | 2018-06-22 |
SA516380612B1 (ar) | 2020-09-06 |
CN106663433B (zh) | 2020-12-29 |
PH12016502356A1 (en) | 2017-02-13 |
RU2016151352A (ru) | 2018-08-02 |
KR20170024584A (ko) | 2017-03-07 |
CL2016003315A1 (es) | 2017-07-07 |
MX2016016566A (es) | 2017-04-25 |
RU2741763C2 (ru) | 2021-01-28 |
NZ726830A (en) | 2019-09-27 |
ES2729624T3 (es) | 2019-11-05 |
US20160007132A1 (en) | 2016-01-07 |
MY183858A (en) | 2021-03-17 |
KR101962000B1 (ko) | 2019-03-25 |
AU2015284004B2 (en) | 2020-01-02 |
EP3165001B1 (en) | 2019-03-06 |
AU2015284004A1 (en) | 2016-12-15 |
US9838819B2 (en) | 2017-12-05 |
JP6449455B2 (ja) | 2019-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6449455B2 (ja) | 高次アンビソニック(hoa)バックグラウンドチャネル間の相関の低減 | |
JP6169805B2 (ja) | フレームパラメータ再使用可能性を示すこと | |
JP6612337B2 (ja) | 高次アンビソニックオーディオデータのスケーラブルコーディングのためのレイヤのシグナリング | |
CN106575506B (zh) | 用于执行高阶立体混响音频数据的中间压缩的装置和方法 | |
JP6549225B2 (ja) | 高次アンビソニックオーディオデータのスケーラブルコーディングのためのチャネルのシグナリング | |
JP6599451B2 (ja) | Hoaコンテンツの画面関連の適応 | |
US20150332682A1 (en) | Spatial relation coding for higher order ambisonic coefficients | |
JP2017513053A (ja) | 音場の記述へのオーディオチャンネルの挿入 | |
US10134403B2 (en) | Crossfading between higher order ambisonic signals | |
US9959876B2 (en) | Closed loop quantization of higher order ambisonic coefficients | |
JP6297721B2 (ja) | 高次アンビソニックオーディオレンダラのための希薄情報を取得すること | |
JP6605725B2 (ja) | 複数の遷移の間の高次アンビソニック係数のコーディング | |
JP6423009B2 (ja) | 高次アンビソニックオーディオレンダラのためのシンメトリ情報を取得すること |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180319 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180319 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180319 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180626 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181022 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181205 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6449455 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |