JP2017535174A - Hoaコンテンツの画面関連の適応 - Google Patents
Hoaコンテンツの画面関連の適応 Download PDFInfo
- Publication number
- JP2017535174A JP2017535174A JP2017518939A JP2017518939A JP2017535174A JP 2017535174 A JP2017535174 A JP 2017535174A JP 2017518939 A JP2017518939 A JP 2017518939A JP 2017518939 A JP2017518939 A JP 2017518939A JP 2017535174 A JP2017535174 A JP 2017535174A
- Authority
- JP
- Japan
- Prior art keywords
- display window
- hoa
- audio
- reference screen
- fov
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000006978 adaptation Effects 0.000 title description 10
- 238000000034 method Methods 0.000 claims abstract description 100
- 238000009877 rendering Methods 0.000 claims abstract description 76
- 230000005236 sound signal Effects 0.000 claims abstract description 69
- 239000011159 matrix material Substances 0.000 claims description 117
- 230000000694 effects Effects 0.000 claims description 65
- 238000013507 mapping Methods 0.000 claims description 60
- 238000003860 storage Methods 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000005070 sampling Methods 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 2
- 230000000007 visual effect Effects 0.000 abstract description 3
- 239000013598 vector Substances 0.000 description 166
- 230000006870 function Effects 0.000 description 64
- 230000007613 environmental effect Effects 0.000 description 61
- 238000013139 quantization Methods 0.000 description 37
- 238000004458 analytical method Methods 0.000 description 27
- 230000009467 reduction Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 238000000354 decomposition reaction Methods 0.000 description 13
- 238000000605 extraction Methods 0.000 description 11
- 230000008520 organization Effects 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 8
- 230000007704 transition Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 230000011664 signaling Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 4
- 238000009940 knitting Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000007993 MOPS buffer Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/301—Automatic calibration of stereophonic sound system, e.g. with test microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
Abstract
Description
φr}における圧力piが、SHC、
NbitQ値 量子化モードのタイプ
0〜3: 予約済み
4: ベクトル量子化
5: ハフマンコーディングなしのスカラー量子化
6: ハフマンコーディングありの6ビットスカラー量子化
7: ハフマンコーディングありの7ビットスカラー量子化
8: ハフマンコーディングありの8ビットスカラー量子化
・・・ ・・・
16: ハフマンコーディングありの16ビットスカラー量子化
また、量子化ユニット52は、前述のタイプの量子化モードのいずれかの量子化モードの予測されたバージョンを実行することもでき、以前のフレームのVベクトルの要素(またはベクトル量子化が実行されるときの重み)と、現在のフレームのVベクトルの要素(またはベクトル量子化が実行されるときの重み)との間の差が決定される。量子化ユニット52は、その際、現在のフレーム自体のVベクトルの要素の値ではなく、現在のフレームの要素または重みと、以前のフレームの要素または重みとの間の差を量子化することができる。
%1.相対画面マッピングパラメータを計算する。
%4.音場を回転させる。
(3.)において処理された空間位置をoriginalCenterからnewCenterに回転させる。
%5.HOA効果行列を計算する。
元の空間位置および処理された空間位置(4.から)を使用する。
1.相対画面マッピングパラメータを計算する:
heightRatioおよびwidthRatioを使用して画面関連マッピング関数を用いてΩ900を
4.位置を回転させる:
空間位置
5.HOA効果行列を計算する:
ただし、φ’は、第1のスピーカーのための修正方位角を表し、
φは第1のスピーカーのための方位角を表し、
ただし、θ’は、第1のスピーカーのための修正仰角を表し、
ただし、θは、第1のスピーカーのための仰角を表し、
ただし、φ’は、第1のスピーカーのための修正方位角を表し、
φは第1のスピーカーのための方位角を表し、
ただし、θ’は、第1のスピーカーのための修正仰角を表し、
ただし、θは、第1のスピーカーのための仰角を表し、
以下に本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
高次アンビソニック(HOA)オーディオ信号をレンダリングするためのデバイスであって、
1つまたは複数のプロセッサを備え、前記プロセッサは、
基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングするように構成される、デバイス。
[C2]
前記1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、
符号化されたオーディオデータのためのレンダラを決定し、
前記表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正するように構成される、C1に記載のデバイス。
[C3]
前記符号化されたオーディオデータのための前記レンダラを決定するために、前記1つまたは複数のプロセッサはさらに、スピーカー構成に基づいて、前記レンダラを決定するように構成される、C2に記載のデバイス。
[C4]
前記レンダラは、レンダリングフォーマットと、前記符号化されたオーディオデータを再現フォーマットに変換するためのアルゴリズムとのうちの1つまたは複数を備える、C2に記載のデバイス。
[C5]
前記レンダラを修正するために、1つまたは複数のプロセッサはさらに、
前記基準画面の前記1つまたは複数のFOVパラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、スピーカーの角度を修正するための角度マッピング関数を決定し、
前記1つまたは複数のスピーカーの第1のスピーカーのための修正された角度を生成するために、前記角度マッピング関数に基づいて、前記第1のスピーカーのための角度を修正するように構成される、C2に記載のデバイス。
[C6]
前記1つまたは複数のプロセッサはさらに、
ユーザ起動ズーム機能に応答して、ズームされた表示窓の1つまたは複数のFOVパラメータを決定し、
前記基準画面の前記1つまたは複数のFOVパラメータと、前記ズームされた表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正するように構成される、C2に記載のデバイス。
[C7]
前記レンダラを修正するために、前記1つまたは複数のプロセッサはさらに、
ユーザ起動ズーム動作に応答して、倍率を取得し、
前記倍率と、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、ズームされた表示窓の1つまたは複数のFOVパラメータを決定し、
前記ズームされた表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、スピーカーの角度を修正するための角度マッピング関数を決定し、
前記1つまたは複数のスピーカーの第1のスピーカーのための修正された角度を生成するために、前記角度マッピング関数に基づいて、前記第1のスピーカーのための角度を修正するように構成される、C6に記載のデバイス。
[C8]
前記ズームされた表示窓の前記1つまたは複数のFOVパラメータを決定するために、前記1つまたは複数のプロセッサはさらに、前記表示窓のための1つまたは複数の方位角と、前記倍率とに基づいて、前記ズームされた表示窓のための1つまたは複数の方位角を決定するように構成され、前記ズームされた表示窓の前記1つまたは複数のFOVパラメータを決定するために、前記1つまたは複数のプロセッサはさらに、前記表示窓のための1つまたは複数の仰角と、前記倍率とに基づいて、前記ズームされた表示窓のための1つまたは複数の仰角を決定するように構成される、C6に記載のデバイス。
[C9]
前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面のための1つまたは複数の方位角または前記基準画面のための1つまたは複数の仰角のうちの少なくとも1つを備える、C1に記載のデバイス。
[C10]
前記表示窓のための1つまたは複数のFOVパラメータは、前記表示窓のための1つまたは複数の方位角または前記表示窓のための1つまたは複数の仰角のうちの少なくとも1つを備える、C1に記載のデバイス。
[C11]
前記1つまたは複数のプロセッサはさらに、ユーザ起動ズーム動作に応答して取得された倍率に基づいて、前記HOAオーディオ信号をレンダリングするように構成される、C1に記載のデバイス。
[C12]
前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面の中心の場所および前記表示窓の中心の場所を備える、C1に記載のデバイス。
[C13]
1つまたは複数のプロセッサはさらに、
前記基準画面の前記1つまたは複数のFOVパラメータに基づいて、前記基準画面の前記中心を決定し、
前記表示窓の前記1つまたは複数のFOVパラメータに基づいて、前記表示窓の前記中心を決定するように構成される、C12に記載のデバイス。
[C14]
前記1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、
符号化されたオーディオデータのためのレンダラを決定し、
前記表示窓の前記中心と、前記基準画面の前記中心とに基づいて、前記レンダラを修正するように構成される、C12に記載のデバイス。
[C15]
前記1つまたは複数のプロセッサはさらに、
前記HOAオーディオ信号の音場を前記基準画面の前記中心から前記表示窓の前記中心に回転させるように構成される、C12に記載のデバイス。
[C16]
前記HOAオーディオ信号は、MPEG−H 3D準拠ビットストリームを備える、C1に記載のデバイス。
[C17]
前記1つまたは複数のプロセッサはさらに構成され、前記基準画面の前記1つまたは複数の視野(FOV)パラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記HOAオーディオ信号のレンダリングが有効にされるどうかを指示するシンタックス要素を受信する、C1に記載のデバイス。
[C18]
前記デバイスはさらに、前記1つまたは複数のスピーカーのうちの少なくとも1つのスピーカーを備え、前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、前記少なくとも1つのスピーカーを駆動するために、ラウドスピーカーフィードを生成するように構成される、C1に記載のデバイス。
[C19]
前記デバイスはさらに、前記表示窓を表示するためのディスプレイを備え、前記表示窓の前記1つまたは複数のFOVパラメータ、C1に記載のデバイス。
[C20]
前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、複数のHOA係数を決定するために前記HOAオーディオ信号を復号し、前記HOA係数をレンダリングするように構成される、C1に記載のデバイス。
[C21]
前記HOA係数をレンダリングするために、前記1つまたは複数のプロセッサはさらに、
球の900個のサンプリング点のためのモード行列を生成し、
効果行列を生成するために、前記基準画面の前記1つまたは複数のFOVパラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記モード行列を修正し、
前記効果行列に基づいて、前記HOA係数をレンダリングするように構成される、C20に記載のデバイス。
[C22]
高次アンビソニック(HOA)オーディオ信号をレンダリングする方法であって、
基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングすることを含む、方法。
[C23]
前記HOAオーディオ信号を備える符号化されたオーディオデータのビットストリームを受信することと、ここにおいて、前記符号化されたオーディオデータは対応するビデオデータに関連付けられる、
前記ビットストリームから、前記対応するビデオデータのための前記基準画面の前記1つまたは複数のFOVパラメータを取得することと、
前記対応するビデオデータを表示するための前記表示窓の前記1つまたは複数のFOVパラメータを取得することとをさらに備える、C22に記載の方法。
[C24]
1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングすることは、
前記符号化されたオーディオデータのためのレンダラを決定することと、
前記表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正することとを備える、C22に記載の方法。
[C25]
前記符号化されたオーディオデータのための前記レンダラを決定することは、前記1つまたは複数のスピーカーのスピーカー構成に基づいて、前記レンダラを決定することを備える、C24に記載の方法。
[C26]
前記基準画面の前記1つまたは複数のFOVパラメータは、前記基準画面のための1つまたは複数の方位角または前記基準画面のための1つまたは複数の仰角のうちの少なくとも1つを備える、C25に記載の方法。
[C27]
複数のHOA係数を決定するために、前記HOAオーディオ信号を復号することと、
前記HOA係数をレンダリングすることとをさらに備える、C22に記載の方法。
[C28]
高次アンビソニック(HOA)オーディオ信号をレンダリングするための装置であって、
前記HOAオーディオ信号を受信するための手段と、
基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングするための手段とを備える、装置。
[C29]
前記HOAオーディオ信号を備える符号化されたオーディオデータのビットストリームを受信するための手段と、ここにおいて、前記符号化されたオーディオデータは対応するビデオデータに関連付けられる、
前記ビットストリームから、前記対応するビデオデータのための前記基準画面の前記1つまたは複数のFOVパラメータを取得するための手段と、
前記対応するビデオデータを表示するための前記表示窓の前記1つまたは複数のFOVパラメータを取得するための手段とをさらに備える、C28に記載の装置。
[C30]
命令を記憶するコンピュータ可読記憶媒体であって、前記命令は、1つまたは複数のプロセッサによって実行されるとき、前記1つまたは複数のプロセッサに、
高次アンビソニック(HOA)オーディオ信号をレンダリングすることを行わせ、前記レンダリングすることは、
基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングすること含む、コンピュータ可読記憶媒体。
Claims (30)
- 高次アンビソニック(HOA)オーディオ信号をレンダリングするためのデバイスであって、
1つまたは複数のプロセッサを備え、前記プロセッサは、
基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングするように構成される、デバイス。 - 前記1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、
符号化されたオーディオデータのためのレンダラを決定し、
前記表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正するように構成される、請求項1に記載のデバイス。 - 前記符号化されたオーディオデータのための前記レンダラを決定するために、前記1つまたは複数のプロセッサはさらに、スピーカー構成に基づいて、前記レンダラを決定するように構成される、請求項2に記載のデバイス。
- 前記レンダラは、レンダリングフォーマットと、前記符号化されたオーディオデータを再現フォーマットに変換するためのアルゴリズムとのうちの1つまたは複数を備える、請求項2に記載のデバイス。
- 前記レンダラを修正するために、1つまたは複数のプロセッサはさらに、
前記基準画面の前記1つまたは複数のFOVパラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、スピーカーの角度を修正するための角度マッピング関数を決定し、
前記1つまたは複数のスピーカーの第1のスピーカーのための修正された角度を生成するために、前記角度マッピング関数に基づいて、前記第1のスピーカーのための角度を修正するように構成される、請求項2に記載のデバイス。 - 前記1つまたは複数のプロセッサはさらに、
ユーザ起動ズーム機能に応答して、ズームされた表示窓の1つまたは複数のFOVパラメータを決定し、
前記基準画面の前記1つまたは複数のFOVパラメータと、前記ズームされた表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正するように構成される、請求項2に記載のデバイス。 - 前記レンダラを修正するために、前記1つまたは複数のプロセッサはさらに、
ユーザ起動ズーム動作に応答して、倍率を取得し、
前記倍率と、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、ズームされた表示窓の1つまたは複数のFOVパラメータを決定し、
前記ズームされた表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、スピーカーの角度を修正するための角度マッピング関数を決定し、
前記1つまたは複数のスピーカーの第1のスピーカーのための修正された角度を生成するために、前記角度マッピング関数に基づいて、前記第1のスピーカーのための角度を修正するように構成される、請求項6に記載のデバイス。 - 前記ズームされた表示窓の前記1つまたは複数のFOVパラメータを決定するために、前記1つまたは複数のプロセッサはさらに、前記表示窓のための1つまたは複数の方位角と、前記倍率とに基づいて、前記ズームされた表示窓のための1つまたは複数の方位角を決定するように構成され、前記ズームされた表示窓の前記1つまたは複数のFOVパラメータを決定するために、前記1つまたは複数のプロセッサはさらに、前記表示窓のための1つまたは複数の仰角と、前記倍率とに基づいて、前記ズームされた表示窓のための1つまたは複数の仰角を決定するように構成される、請求項6に記載のデバイス。
- 前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面のための1つまたは複数の方位角または前記基準画面のための1つまたは複数の仰角のうちの少なくとも1つを備える、請求項1に記載のデバイス。
- 前記表示窓のための1つまたは複数のFOVパラメータは、前記表示窓のための1つまたは複数の方位角または前記表示窓のための1つまたは複数の仰角のうちの少なくとも1つを備える、請求項1に記載のデバイス。
- 前記1つまたは複数のプロセッサはさらに、ユーザ起動ズーム動作に応答して取得された倍率に基づいて、前記HOAオーディオ信号をレンダリングするように構成される、請求項1に記載のデバイス。
- 前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面の中心の場所および前記表示窓の中心の場所を備える、請求項1に記載のデバイス。
- 1つまたは複数のプロセッサはさらに、
前記基準画面の前記1つまたは複数のFOVパラメータに基づいて、前記基準画面の前記中心を決定し、
前記表示窓の前記1つまたは複数のFOVパラメータに基づいて、前記表示窓の前記中心を決定するように構成される、請求項12に記載のデバイス。 - 前記1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、
符号化されたオーディオデータのためのレンダラを決定し、
前記表示窓の前記中心と、前記基準画面の前記中心とに基づいて、前記レンダラを修正するように構成される、請求項12に記載のデバイス。 - 前記1つまたは複数のプロセッサはさらに、
前記HOAオーディオ信号の音場を前記基準画面の前記中心から前記表示窓の前記中心に回転させるように構成される、請求項12に記載のデバイス。 - 前記HOAオーディオ信号は、MPEG−H 3D準拠ビットストリームを備える、請求項1に記載のデバイス。
- 前記1つまたは複数のプロセッサはさらに構成され、前記基準画面の前記1つまたは複数の視野(FOV)パラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記HOAオーディオ信号のレンダリングが有効にされるどうかを指示するシンタックス要素を受信する、請求項1に記載のデバイス。
- 前記デバイスはさらに、前記1つまたは複数のスピーカーのうちの少なくとも1つのスピーカーを備え、前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、前記少なくとも1つのスピーカーを駆動するために、ラウドスピーカーフィードを生成するように構成される、請求項1に記載のデバイス。
- 前記デバイスはさらに、前記表示窓を表示するためのディスプレイを備え、前記表示窓の前記1つまたは複数のFOVパラメータ、請求項1に記載のデバイス。
- 前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、複数のHOA係数を決定するために前記HOAオーディオ信号を復号し、前記HOA係数をレンダリングするように構成される、請求項1に記載のデバイス。
- 前記HOA係数をレンダリングするために、前記1つまたは複数のプロセッサはさらに、
球の900個のサンプリング点のためのモード行列を生成し、
効果行列を生成するために、前記基準画面の前記1つまたは複数のFOVパラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記モード行列を修正し、
前記効果行列に基づいて、前記HOA係数をレンダリングするように構成される、請求項20に記載のデバイス。 - 高次アンビソニック(HOA)オーディオ信号をレンダリングする方法であって、
基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングすることを含む、方法。 - 前記HOAオーディオ信号を備える符号化されたオーディオデータのビットストリームを受信することと、ここにおいて、前記符号化されたオーディオデータは対応するビデオデータに関連付けられる、
前記ビットストリームから、前記対応するビデオデータのための前記基準画面の前記1つまたは複数のFOVパラメータを取得することと、
前記対応するビデオデータを表示するための前記表示窓の前記1つまたは複数のFOVパラメータを取得することとをさらに備える、請求項22に記載の方法。 - 1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングすることは、
前記符号化されたオーディオデータのためのレンダラを決定することと、
前記表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正することとを備える、請求項22に記載の方法。 - 前記符号化されたオーディオデータのための前記レンダラを決定することは、前記1つまたは複数のスピーカーのスピーカー構成に基づいて、前記レンダラを決定することを備える、請求項24に記載の方法。
- 前記基準画面の前記1つまたは複数のFOVパラメータは、前記基準画面のための1つまたは複数の方位角または前記基準画面のための1つまたは複数の仰角のうちの少なくとも1つを備える、請求項25に記載の方法。
- 複数のHOA係数を決定するために、前記HOAオーディオ信号を復号することと、
前記HOA係数をレンダリングすることとをさらに備える、請求項22に記載の方法。 - 高次アンビソニック(HOA)オーディオ信号をレンダリングするための装置であって、
前記HOAオーディオ信号を受信するための手段と、
基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングするための手段とを備える、装置。 - 前記HOAオーディオ信号を備える符号化されたオーディオデータのビットストリームを受信するための手段と、ここにおいて、前記符号化されたオーディオデータは対応するビデオデータに関連付けられる、
前記ビットストリームから、前記対応するビデオデータのための前記基準画面の前記1つまたは複数のFOVパラメータを取得するための手段と、
前記対応するビデオデータを表示するための前記表示窓の前記1つまたは複数のFOVパラメータを取得するための手段とをさらに備える、請求項28に記載の装置。 - 命令を記憶するコンピュータ可読記憶媒体であって、前記命令は、1つまたは複数のプロセッサによって実行されるとき、前記1つまたは複数のプロセッサに、
高次アンビソニック(HOA)オーディオ信号をレンダリングすることを行わせ、前記レンダリングすることは、
基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、1つまたは複数のスピーカーを介して前記HOAオーディオ信号をレンダリングすること含む、コンピュータ可読記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462062761P | 2014-10-10 | 2014-10-10 | |
US62/062,761 | 2014-10-10 | ||
US14/878,948 US9940937B2 (en) | 2014-10-10 | 2015-10-08 | Screen related adaptation of HOA content |
US14/878,948 | 2015-10-08 | ||
PCT/US2015/054964 WO2016057935A1 (en) | 2014-10-10 | 2015-10-09 | Screen related adaptation of hoa content |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017535174A true JP2017535174A (ja) | 2017-11-24 |
JP2017535174A5 JP2017535174A5 (ja) | 2019-04-25 |
JP6599451B2 JP6599451B2 (ja) | 2019-10-30 |
Family
ID=54364703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017518939A Active JP6599451B2 (ja) | 2014-10-10 | 2015-10-09 | Hoaコンテンツの画面関連の適応 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9940937B2 (ja) |
EP (2) | EP3668124B1 (ja) |
JP (1) | JP6599451B2 (ja) |
KR (1) | KR102077375B1 (ja) |
CN (1) | CN106797527B (ja) |
BR (1) | BR112017007267B1 (ja) |
ES (2) | ES2900653T3 (ja) |
HU (1) | HUE047302T2 (ja) |
SG (1) | SG11201701554PA (ja) |
WO (1) | WO2016057935A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
US9838819B2 (en) * | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
US9536531B2 (en) * | 2014-08-01 | 2017-01-03 | Qualcomm Incorporated | Editing of higher-order ambisonic audio data |
US9854375B2 (en) * | 2015-12-01 | 2017-12-26 | Qualcomm Incorporated | Selection of coded next generation audio data for transport |
KR102631929B1 (ko) * | 2016-02-24 | 2024-02-01 | 한국전자통신연구원 | 스크린 사이즈에 연동하는 전방 오디오 렌더링 장치 및 방법 |
CN108346432B (zh) * | 2017-01-25 | 2022-09-09 | 北京三星通信技术研究有限公司 | 虚拟现实vr音频的处理方法及相应设备 |
US10390166B2 (en) * | 2017-05-31 | 2019-08-20 | Qualcomm Incorporated | System and method for mixing and adjusting multi-input ambisonics |
US10405126B2 (en) * | 2017-06-30 | 2019-09-03 | Qualcomm Incorporated | Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems |
US11164606B2 (en) * | 2017-06-30 | 2021-11-02 | Qualcomm Incorporated | Audio-driven viewport selection |
US10469968B2 (en) * | 2017-10-12 | 2019-11-05 | Qualcomm Incorporated | Rendering for computer-mediated reality systems |
GB2598751A (en) * | 2020-09-10 | 2022-03-16 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
US11743670B2 (en) | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4775609A (en) | 1987-05-18 | 1988-10-04 | Hoescht Celanese Corporation | Image reversal |
US8964994B2 (en) | 2008-12-15 | 2015-02-24 | Orange | Encoding of multichannel digital audio signals |
US20100328419A1 (en) * | 2009-06-30 | 2010-12-30 | Walter Etter | Method and apparatus for improved matching of auditory space to visual space in video viewing applications |
US20120162362A1 (en) | 2010-12-22 | 2012-06-28 | Microsoft Corporation | Mapping sound spatialization fields to panoramic video |
EP2541547A1 (en) | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2946468B1 (en) * | 2013-01-16 | 2016-12-21 | Thomson Licensing | Method for measuring hoa loudness level and device for measuring hoa loudness level |
US20140355769A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
US10020000B2 (en) * | 2014-01-03 | 2018-07-10 | Samsung Electronics Co., Ltd. | Method and apparatus for improved ambisonic decoding |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
-
2015
- 2015-10-08 US US14/878,948 patent/US9940937B2/en active Active
- 2015-10-09 CN CN201580054248.9A patent/CN106797527B/zh active Active
- 2015-10-09 EP EP19198794.0A patent/EP3668124B1/en active Active
- 2015-10-09 SG SG11201701554PA patent/SG11201701554PA/en unknown
- 2015-10-09 KR KR1020177009268A patent/KR102077375B1/ko active IP Right Grant
- 2015-10-09 JP JP2017518939A patent/JP6599451B2/ja active Active
- 2015-10-09 EP EP15787775.4A patent/EP3205122B1/en active Active
- 2015-10-09 ES ES19198794T patent/ES2900653T3/es active Active
- 2015-10-09 ES ES15787775T patent/ES2774449T3/es active Active
- 2015-10-09 BR BR112017007267-0A patent/BR112017007267B1/pt active IP Right Grant
- 2015-10-09 WO PCT/US2015/054964 patent/WO2016057935A1/en active Application Filing
- 2015-10-09 HU HUE15787775A patent/HUE047302T2/hu unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
JP2013187908A (ja) * | 2012-03-06 | 2013-09-19 | Thomson Licensing | 高次アンビソニックス・オーディオ信号の再生のための方法および装置 |
EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
Non-Patent Citations (1)
Title |
---|
""WD1-HOA TEXT OF MPEG-H 3D AUDIO"", MPEG MEETING;13-1-2014 - 17-1-2014; SAN JOSE; (MOTION PICTURE EXPERT GROUP OR ISO/IEC JTC1/SC29/WG11, vol. N14264, JPN5017002435, 21 February 2014 (2014-02-21), ISSN: 0004034661 * |
Also Published As
Publication number | Publication date |
---|---|
BR112017007267A2 (pt) | 2018-01-23 |
US20160104495A1 (en) | 2016-04-14 |
BR112017007267B1 (pt) | 2022-03-03 |
ES2774449T3 (es) | 2020-07-21 |
SG11201701554PA (en) | 2017-04-27 |
CN106797527A (zh) | 2017-05-31 |
KR20170066400A (ko) | 2017-06-14 |
CN106797527B (zh) | 2019-06-21 |
EP3668124B1 (en) | 2021-11-17 |
EP3205122A1 (en) | 2017-08-16 |
US9940937B2 (en) | 2018-04-10 |
HUE047302T2 (hu) | 2020-04-28 |
ES2900653T3 (es) | 2022-03-17 |
EP3668124A1 (en) | 2020-06-17 |
JP6599451B2 (ja) | 2019-10-30 |
EP3205122B1 (en) | 2019-11-20 |
WO2016057935A1 (en) | 2016-04-14 |
KR102077375B1 (ko) | 2020-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6599451B2 (ja) | Hoaコンテンツの画面関連の適応 | |
JP6449455B2 (ja) | 高次アンビソニック(hoa)バックグラウンドチャネル間の相関の低減 | |
JP6820386B2 (ja) | 高次アンビソニック(hoa)コンテンツの画面に関連した適応 | |
JP6612337B2 (ja) | 高次アンビソニックオーディオデータのスケーラブルコーディングのためのレイヤのシグナリング | |
JP2017513053A (ja) | 音場の記述へのオーディオチャンネルの挿入 | |
JP2017534910A (ja) | 高次アンビソニックオーディオデータのスケーラブルコーディングのためのチャネルのシグナリング | |
US9959876B2 (en) | Closed loop quantization of higher order ambisonic coefficients | |
JP6297721B2 (ja) | 高次アンビソニックオーディオレンダラのための希薄情報を取得すること | |
JP6605725B2 (ja) | 複数の遷移の間の高次アンビソニック係数のコーディング | |
JP2017519417A (ja) | 高次アンビソニック信号の間のクロスフェージング | |
JP6423009B2 (ja) | 高次アンビソニックオーディオレンダラのためのシンメトリ情報を取得すること |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170616 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180918 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180918 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190311 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20190311 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190513 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191002 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6599451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |