JP2017535174A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2017535174A5 JP2017535174A5 JP2017518939A JP2017518939A JP2017535174A5 JP 2017535174 A5 JP2017535174 A5 JP 2017535174A5 JP 2017518939 A JP2017518939 A JP 2017518939A JP 2017518939 A JP2017518939 A JP 2017518939A JP 2017535174 A5 JP2017535174 A5 JP 2017535174A5
- Authority
- JP
- Japan
- Prior art keywords
- display window
- hoa
- audio signal
- fov
- processors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims 31
- 239000011159 matrix material Substances 0.000 claims 16
- 238000009877 rendering Methods 0.000 claims 14
- 230000000875 corresponding Effects 0.000 claims 6
- 230000004044 response Effects 0.000 claims 3
- 230000000694 effects Effects 0.000 claims 2
- 238000005070 sampling Methods 0.000 claims 1
Claims (32)
- 高次アンビソニック(HOA)オーディオ信号をレンダリングするためのデバイスであって、
HOAオーディオ信号に関連付けられるHOAオーディオデータおよび視野(FOV)パラメータ情報を記憶するように構成されたメモリと、
前記メモリに結合された1つまたは複数のプロセッサと
を備え、前記1つまたは複数のプロセッサは、
修正されたレンダリング行列を形成するために、基準画面の1つまたは複数のFOVパラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、レンダリング行列を修正し、
前記HOAオーディオ信号を1つまたは複数のスピーカーフィードへとレンダリングするために、前記記憶されたHOAオーディオデータの少なくとも一部に前記修正されたレンダリング行列を適用する
ように構成される、デバイス。 - 前記1つまたは複数のプロセッサはさらに、
前記HOAオーディオデータのためのレンダラを決定し、
前記表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正する
ように構成される、請求項1に記載のデバイス。 - 前記HOAオーディオデータのための前記レンダラを決定するために、前記1つまたは複数のプロセッサはさらに、前記1つまたは複数のスピーカーフィードに関連付けられるスピーカー構成に基づいて、前記レンダラを決定するように構成される、請求項2に記載のデバイス。
- 前記レンダラは、レンダリングフォーマットまたは前記HOAオーディオデータを再現フォーマットに変換するためのアルゴリズムのうちの1つまたは複数を備える、請求項2に記載のデバイス。
- 前記レンダラを修正するために、前記1つまたは複数のプロセッサはさらに、
前記基準画面の前記1つまたは複数のFOVパラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、スピーカー角度情報を修正するための角度マッピング関数を決定し、
前記1つまたは複数のスピーカーフィードに関連付けられるスピーカーのための修正された角度を生成するために、前記角度マッピング関数に基づいて、前記スピーカーのための角度を修正する
ように構成される、請求項2に記載のデバイス。 - 前記1つまたは複数のプロセッサはさらに、ユーザ起動ズーム機能を検出することに応答して、ズームされた表示窓の1つまたは複数のFOVパラメータを決定する決定するように構成され、前記レンダラを修正するために、前記1つまたは複数のプロセッサはさらに、前記ズームされた表示窓の前記1つまたは複数のFOVパラメータに基づいて、前記レンダラを修正するように構成される、請求項2に記載のデバイス。
- 前記レンダラを修正するために、前記1つまたは複数のプロセッサはさらに、
ユーザ起動ズーム動作を検出することに応答して、倍率を取得し、
前記倍率と、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、ズームされた表示窓の1つまたは複数のFOVパラメータを決定し、
前記ズームされた表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、スピーカー角度情報を修正するための角度マッピング関数を決定し、
前記1つまたは複数のスピーカーの第1のスピーカーのための修正された角度を生成するために、前記角度マッピング関数に基づいて、前記第1のスピーカーに関連付けられる角度を修正する
ように構成される、請求項6に記載のデバイス。 - 前記ズームされた表示窓の前記1つまたは複数のFOVパラメータを決定するために、前記1つまたは複数のプロセッサはさらに、前記表示窓のための1つまたは複数の方位角と、前記倍率とに基づいて、前記ズームされた表示窓のための1つまたは複数の方位角を決定するように構成され、前記ズームされた表示窓の前記1つまたは複数のFOVパラメータを決定するために、前記1つまたは複数のプロセッサはさらに、前記表示窓のための1つまたは複数の仰角と、前記倍率とに基づいて、前記ズームされた表示窓のための1つまたは複数の仰角を決定するように構成される、請求項7に記載のデバイス。
- 前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面のための1つまたは複数の方位角または前記基準画面のための1つまたは複数の仰角のうちの少なくとも1つを備える、請求項1に記載のデバイス。
- 前記表示窓のための前記1つまたは複数のFOVパラメータは、前記表示窓のための1つまたは複数の方位角または前記表示窓のための1つまたは複数の仰角のうちの少なくとも1つを備える、請求項1に記載のデバイス。
- 前記1つまたは複数のプロセッサはさらに、ユーザ起動ズーム動作を検出することに応答して取得された倍率に基づいて、前記HOAオーディオ信号を前記1つまたは複数のスピーカーフィードへとレンダリングするように構成される、請求項1に記載のデバイス。
- 前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面の中心の座標および前記表示窓の中心の座標を備える、請求項1に記載のデバイス。
- 前記1つまたは複数のプロセッサはさらに、
前記基準画面の前記1つまたは複数のFOVパラメータに基づいて、前記基準画面の前記中心の前記座標を決定し、
前記表示窓の前記1つまたは複数のFOVパラメータに基づいて、前記表示窓の前記中心の前記座標を決定する
ように構成される、請求項12に記載のデバイス。 - 前記1つまたは複数のプロセッサはさらに、
前記HOAオーディオデータのためのレンダラを決定し、
前記表示窓の前記中心の前記座標と、前記基準画面の前記中心の前記座標とに基づいて、前記レンダラを修正する
ように構成される、請求項12に記載のデバイス。 - 前記1つまたは複数のプロセッサはさらに、
前記HOAオーディオ信号によって記述される音場を前記基準画面の前記中心から前記表示窓の前記中心に回転させる
ように構成される、請求項12に記載のデバイス。 - 前記HOAオーディオ信号は、MPEG−H 3D準拠ビットストリームを備える、請求項1に記載のデバイス。
- 前記1つまたは複数のプロセッサはさらに構成され、前記基準画面の前記1つまたは複数の視野(FOV)パラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記HOAオーディオ信号のレンダリングが有効にされるどうかを指示するシンタックス要素を受信する、請求項1に記載のデバイス。
- 前記デバイスはさらに、前記1つまたは複数のスピーカーフィードに関連付けられる少なくとも1つのスピーカーを備え、前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、前記少なくとも1つのスピーカーを駆動するために、ラウドスピーカーフィードを生成するように構成される、請求項1に記載のデバイス。
- 前記デバイスはさらに、前記表示窓を表示するためのディスプレイを備える、請求項1に記載のデバイス。
- 前記1つまたは複数のプロセッサはさらに、複数のHOA係数を決定するために前記HOAオーディオ信号を復号するように構成される、請求項1に記載のデバイス。
- 前記1つまたは複数のプロセッサはさらに、
球の900個のサンプリング点のためのモード行列を生成し、
効果行列を生成するために、前記基準画面の前記1つまたは複数のFOVパラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記モード行列を修正し、
前記効果行列に基づいて、前記HOA係数をレンダリングする
ように構成される、請求項20に記載のデバイス。 - 前記記憶されたHOAオーディオデータは、1つまたは複数のフォアグラウンドオーディオオブジェクトを含み、前記1つまたは複数のプロセッサはさらに、前記1つまたは複数のフォアグラウンドオーディオオブジェクトに基づいて、前記記憶されたHOAオーディオデータを再構成するように構成され、前記レンダリングされたHOAオーディオ信号は、前記再構成された1つまたは複数のフォアグラウンドオーディオオブジェクトを表すHOA係数を備える、請求項1に記載のデバイス。
- 高次アンビソニック(HOA)オーディオ信号をレンダリングする方法であって、
修正されたレンダリング行列を形成するために、基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、レンダリング行列を修正することと、
前記HOAオーディオ信号を1つまたは複数のスピーカーフィードへとレンダリングするために、前記HOAオーディオ信号の少なくとも一部に前記修正されたレンダリング行列を適用することと
を備える、方法。 - 前記HOAオーディオ信号を備える符号化されたオーディオデータのビットストリームを受信することと、ここにおいて、前記符号化されたオーディオデータは、対応するビデオデータに関連付けられる、
前記ビットストリームから、前記対応するビデオデータのための前記基準画面の前記1つまたは複数のFOVパラメータを取得することと、
前記対応するビデオデータを表示するための前記表示窓の前記1つまたは複数のFOVパラメータを取得することと
をさらに備える、請求項23に記載の方法。 - 前記HOAオーディオ信号のためのレンダラを決定することと、
前記表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正することと
をさらに備える、請求項23に記載の方法。 - 前記HOAオーディオ信号のための前記レンダラを決定することは、前記1つまたは複数のスピーカーフィードのスピーカー構成に基づいて、前記レンダラを決定することを備える、請求項25に記載の方法。
- 前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面のための1つまたは複数の方位角または前記基準画面のための1つまたは複数の仰角のうちの少なくとも1つを備える、請求項26に記載の方法。
- 複数のHOA係数を決定するために、前記HOAオーディオ信号を復号することと、
前記HOA係数をレンダリングすることと
をさらに備える、請求項23に記載の方法。 - 前記HOAオーディオ信号は、支配的オーディオ信号を含み、前記方法は、前記支配的オーディオ信号に基づいて、前記HOAオーディオ信号を再構成することをさらに備え、ここにおいて、前記レンダリングされたHOAオーディオ信号は、前記再構成された支配的オーディオ信号を表すHOA係数を備える、請求項23に記載の方法。
- 高次アンビソニック(HOA)オーディオ信号をレンダリングするための装置であって、
前記HOAオーディオ信号を受信するための手段と、
修正されたレンダリング行列を形成するために、基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、レンダリング行列を修正するための手段と、
前記HOAオーディオ信号を1つまたは複数のスピーカーフィードへとレンダリングするために、前記HOAオーディオ信号の少なくとも一部に前記修正されたレンダリング行列を適用するための手段と
を備える、装置。 - 前記HOAオーディオ信号を備える符号化されたオーディオデータのビットストリームを受信するための手段と、ここにおいて、前記符号化されたオーディオデータは、対応するビデオデータに関連付けられる、
前記ビットストリームから、前記対応するビデオデータのための前記基準画面の前記1つまたは複数のFOVパラメータを取得するための手段と、
前記対応するビデオデータを表示するための前記表示窓の前記1つまたは複数のFOVパラメータを取得するための手段と
をさらに備える、請求項30に記載の装置。 - 命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記命令は、高次アンビソニック(HOA)オーディオ信号をレンダリングするためのデバイスの1つまたは複数のプロセッサによって実行されるとき、前記1つまたは複数のプロセッサに、
修正されたレンダリング行列を形成するために、基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、レンダリング行列を修正することと、
前記HOAオーディオ信号を1つまたは複数のスピーカーフィードへとレンダリングするために、前記HOAオーディオ信号の少なくとも一部に前記修正されたレンダリング行列を適用することと
を行わせる、非一時的コンピュータ可読記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462062761P | 2014-10-10 | 2014-10-10 | |
US62/062,761 | 2014-10-10 | ||
US14/878,948 | 2015-10-08 | ||
US14/878,948 US9940937B2 (en) | 2014-10-10 | 2015-10-08 | Screen related adaptation of HOA content |
PCT/US2015/054964 WO2016057935A1 (en) | 2014-10-10 | 2015-10-09 | Screen related adaptation of hoa content |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017535174A JP2017535174A (ja) | 2017-11-24 |
JP2017535174A5 true JP2017535174A5 (ja) | 2019-04-25 |
JP6599451B2 JP6599451B2 (ja) | 2019-10-30 |
Family
ID=54364703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017518939A Active JP6599451B2 (ja) | 2014-10-10 | 2015-10-09 | Hoaコンテンツの画面関連の適応 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9940937B2 (ja) |
EP (2) | EP3205122B1 (ja) |
JP (1) | JP6599451B2 (ja) |
KR (1) | KR102077375B1 (ja) |
CN (1) | CN106797527B (ja) |
BR (1) | BR112017007267B1 (ja) |
ES (2) | ES2900653T3 (ja) |
HU (1) | HUE047302T2 (ja) |
SG (1) | SG11201701554PA (ja) |
WO (1) | WO2016057935A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
US9838819B2 (en) * | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
US9536531B2 (en) * | 2014-08-01 | 2017-01-03 | Qualcomm Incorporated | Editing of higher-order ambisonic audio data |
US9854375B2 (en) * | 2015-12-01 | 2017-12-26 | Qualcomm Incorporated | Selection of coded next generation audio data for transport |
KR102631929B1 (ko) * | 2016-02-24 | 2024-02-01 | 한국전자통신연구원 | 스크린 사이즈에 연동하는 전방 오디오 렌더링 장치 및 방법 |
CN108346432B (zh) | 2017-01-25 | 2022-09-09 | 北京三星通信技术研究有限公司 | 虚拟现实vr音频的处理方法及相应设备 |
US10390166B2 (en) * | 2017-05-31 | 2019-08-20 | Qualcomm Incorporated | System and method for mixing and adjusting multi-input ambisonics |
US10405126B2 (en) * | 2017-06-30 | 2019-09-03 | Qualcomm Incorporated | Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems |
US11164606B2 (en) | 2017-06-30 | 2021-11-02 | Qualcomm Incorporated | Audio-driven viewport selection |
US10469968B2 (en) * | 2017-10-12 | 2019-11-05 | Qualcomm Incorporated | Rendering for computer-mediated reality systems |
GB2598751A (en) * | 2020-09-10 | 2022-03-16 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
US11743670B2 (en) | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4775609A (en) * | 1987-05-18 | 1988-10-04 | Hoescht Celanese Corporation | Image reversal |
US8964994B2 (en) | 2008-12-15 | 2015-02-24 | Orange | Encoding of multichannel digital audio signals |
US20100328419A1 (en) * | 2009-06-30 | 2010-12-30 | Walter Etter | Method and apparatus for improved matching of auditory space to visual space in video viewing applications |
US20120162362A1 (en) | 2010-12-22 | 2012-06-28 | Microsoft Corporation | Mapping sound spatialization fields to panoramic video |
EP2541547A1 (en) | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2637427A1 (en) * | 2012-03-06 | 2013-09-11 | Thomson Licensing | Method and apparatus for playback of a higher-order ambisonics audio signal |
JP6271586B2 (ja) * | 2013-01-16 | 2018-01-31 | ドルビー・インターナショナル・アーベー | Hoaラウドネスレベルを測定する方法及びhoaラウドネスレベルを測定する装置 |
US20140358565A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
US10020000B2 (en) * | 2014-01-03 | 2018-07-10 | Samsung Electronics Co., Ltd. | Method and apparatus for improved ambisonic decoding |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
-
2015
- 2015-10-08 US US14/878,948 patent/US9940937B2/en active Active
- 2015-10-09 EP EP15787775.4A patent/EP3205122B1/en active Active
- 2015-10-09 CN CN201580054248.9A patent/CN106797527B/zh active Active
- 2015-10-09 HU HUE15787775A patent/HUE047302T2/hu unknown
- 2015-10-09 ES ES19198794T patent/ES2900653T3/es active Active
- 2015-10-09 SG SG11201701554PA patent/SG11201701554PA/en unknown
- 2015-10-09 WO PCT/US2015/054964 patent/WO2016057935A1/en active Application Filing
- 2015-10-09 KR KR1020177009268A patent/KR102077375B1/ko active IP Right Grant
- 2015-10-09 BR BR112017007267-0A patent/BR112017007267B1/pt active IP Right Grant
- 2015-10-09 ES ES15787775T patent/ES2774449T3/es active Active
- 2015-10-09 JP JP2017518939A patent/JP6599451B2/ja active Active
- 2015-10-09 EP EP19198794.0A patent/EP3668124B1/en active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2017535174A5 (ja) | ||
EP3646619B1 (en) | Mixed-order ambisonics (moa) audio data for computer-mediated reality systems | |
US11082662B2 (en) | Enhanced audiovisual multiuser communication | |
JP2018534853A5 (ja) | ||
JP2019523921A5 (ja) | ||
US10334220B2 (en) | Aggregating images and audio data to generate virtual reality content | |
EP3343349B1 (en) | An apparatus and associated methods in the field of virtual reality | |
TWI595785B (zh) | 用於螢幕相關音訊物件再對映之裝置及方法 | |
EP3254281A1 (en) | Coding higher-order ambisonic audio data with motion stabilization | |
WO2017088491A1 (zh) | 一种视频的播放方法和装置 | |
TW201907707A (zh) | 音訊驅動之視埠選擇 | |
WO2018121524A1 (zh) | 一种数据处理方法及装置、采集设备及存储介质 | |
JP6672327B2 (ja) | ユーザヘッドセットへの球状ビデオ帯域幅を減少させる方法および装置 | |
JP2017534911A5 (ja) | ||
BR112020017489A2 (pt) | Métodos, aparelho e sistemas para extensão com três graus de liberdade (3dof+) de áudio 3d mpeg-h | |
US10993067B2 (en) | Apparatus and associated methods | |
JP7388492B2 (ja) | 信号処理装置および方法、並びにプログラム | |
CN113302690A (zh) | 音频处理 | |
KR20170065208A (ko) | 3d 이미지 처리 방법 및 장치, 및 그래픽 처리 장치 | |
GB2565301A (en) | Three-dimensional video processing | |
US11503226B2 (en) | Multi-camera device | |
US20220150655A1 (en) | Generating audio output signals | |
US20210092543A1 (en) | 3d sound orientation adaptability | |
GB2568726A (en) | Object prioritisation of virtual content | |
CN114128312A (zh) | 用于低频效果的音频渲染 |