JP2017535174A5 - - Google Patents

Download PDF

Info

Publication number
JP2017535174A5
JP2017535174A5 JP2017518939A JP2017518939A JP2017535174A5 JP 2017535174 A5 JP2017535174 A5 JP 2017535174A5 JP 2017518939 A JP2017518939 A JP 2017518939A JP 2017518939 A JP2017518939 A JP 2017518939A JP 2017535174 A5 JP2017535174 A5 JP 2017535174A5
Authority
JP
Japan
Prior art keywords
display window
hoa
audio signal
fov
processors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017518939A
Other languages
English (en)
Other versions
JP6599451B2 (ja
JP2017535174A (ja
Filing date
Publication date
Priority claimed from US14/878,948 external-priority patent/US9940937B2/en
Application filed filed Critical
Publication of JP2017535174A publication Critical patent/JP2017535174A/ja
Publication of JP2017535174A5 publication Critical patent/JP2017535174A5/ja
Application granted granted Critical
Publication of JP6599451B2 publication Critical patent/JP6599451B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (32)

  1. 高次アンビソニック(HOA)オーディオ信号をレンダリングするためのデバイスであって、
    HOAオーディオ信号に関連付けられるHOAオーディオデータおよび視野(FOV)パラメータ情報を記憶するように構成されたメモリと、
    前記メモリに結合された1つまたは複数のプロセッサと
    を備え、前記1つまたは複数のプロセッサは、
    修正されたレンダリング行列を形成するために、基準画面の1つまたは複数のFVパラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、レンダリング行列を修正し、
    前記HOAオーディオ信号を1つまたは複数のスピーカーフィードへとレンダリングするために、前記記憶されたHOAオーディオデータの少なくとも一部に前記修正されたレンダリング行列を適用する
    ように構成される、デバイス。
  2. 記1つまたは複数のプロセッサはさらに、
    前記HOAオーディオデータのためのレンダラを決定し、
    前記表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正する
    ように構成される、請求項1に記載のデバイス。
  3. 前記HOAオーディオデータのための前記レンダラを決定するために、前記1つまたは複数のプロセッサはさらに、前記1つまたは複数のスピーカーフィードに関連付けられるスピーカー構成に基づいて、前記レンダラを決定するように構成される、請求項2に記載のデバイス。
  4. 前記レンダラは、レンダリングフォーマットまたは前記HOAオーディオデータを再現フォーマットに変換するためのアルゴリズムのうちの1つまたは複数を備える、請求項2に記載のデバイス。
  5. 前記レンダラを修正するために、前記1つまたは複数のプロセッサはさらに、
    前記基準画面の前記1つまたは複数のFOVパラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、スピーカー角情報を修正するための角度マッピング関数を決定し、
    前記1つまたは複数のスピーカーフィードに関連付けられるスピーカーのための修正された角度を生成するために、前記角度マッピング関数に基づいて、前記スピーカーのための角度を修正する
    ように構成される、請求項2に記載のデバイス。
  6. 前記1つまたは複数のプロセッサはさらに、ユーザ起動ズーム機能を検出することに応答して、ズームされた表示窓の1つまたは複数のFOVパラメータを決定する決定するように構成され、前記レンダラを修正するために、前記1つまたは複数のプロセッサはさらに、前記ズームされた表示窓の前記1つまたは複数のFOVパラメータに基づいて、前記レンダラを修正するように構成される、請求項2に記載のデバイス。
  7. 前記レンダラを修正するために、前記1つまたは複数のプロセッサはさらに、
    ユーザ起動ズーム動作を検出することに応答して、倍率を取得し、
    前記倍率と、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、ズームされた表示窓の1つまたは複数のFOVパラメータを決定し、
    前記ズームされた表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、スピーカー角情報を修正するための角度マッピング関数を決定し、
    前記1つまたは複数のスピーカーの第1のスピーカーのための修正された角度を生成するために、前記角度マッピング関数に基づいて、前記第1のスピーカーに関連付けられる角度を修正する
    ように構成される、請求項6に記載のデバイス。
  8. 前記ズームされた表示窓の前記1つまたは複数のFOVパラメータを決定するために、前記1つまたは複数のプロセッサはさらに、前記表示窓のための1つまたは複数の方位角と、前記倍率とに基づいて、前記ズームされた表示窓のための1つまたは複数の方位角を決定するように構成され、前記ズームされた表示窓の前記1つまたは複数のFOVパラメータを決定するために、前記1つまたは複数のプロセッサはさらに、前記表示窓のための1つまたは複数の仰角と、前記倍率とに基づいて、前記ズームされた表示窓のための1つまたは複数の仰角を決定するように構成される、請求項に記載のデバイス。
  9. 前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面のための1つまたは複数の方位角または前記基準画面のための1つまたは複数の仰角のうちの少なくとも1つを備える、請求項1に記載のデバイス。
  10. 前記表示窓のための前記1つまたは複数のFOVパラメータは、前記表示窓のための1つまたは複数の方位角または前記表示窓のための1つまたは複数の仰角のうちの少なくとも1つを備える、請求項1に記載のデバイス。
  11. 前記1つまたは複数のプロセッサはさらに、ユーザ起動ズーム動作を検出することに応答して取得された倍率に基づいて、前記HOAオーディオ信号を前記1つまたは複数のスピーカーフィードへとレンダリングするように構成される、請求項1に記載のデバイス。
  12. 前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面の中心の座標および前記表示窓の中心の座標を備える、請求項1に記載のデバイス。
  13. 前記1つまたは複数のプロセッサはさらに、
    前記基準画面の前記1つまたは複数のFOVパラメータに基づいて、前記基準画面の前記中心の前記座標を決定し、
    前記表示窓の前記1つまたは複数のFOVパラメータに基づいて、前記表示窓の前記中心の前記座標を決定する
    ように構成される、請求項12に記載のデバイス。
  14. 記1つまたは複数のプロセッサはさらに、
    前記HOAオーディオデータのためのレンダラを決定し、
    前記表示窓の前記中心の前記座標と、前記基準画面の前記中心の前記座標とに基づいて、前記レンダラを修正する
    ように構成される、請求項12に記載のデバイス。
  15. 前記1つまたは複数のプロセッサはさらに、
    前記HOAオーディオ信号によって記述される音場を前記基準画面の前記中心から前記表示窓の前記中心に回転させる
    ように構成される、請求項12に記載のデバイス。
  16. 前記HOAオーディオ信号は、MPEG−H 3D準拠ビットストリームを備える、請求項1に記載のデバイス。
  17. 前記1つまたは複数のプロセッサはさらに構成され、前記基準画面の前記1つまたは複数の視野(FOV)パラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記HOAオーディオ信号のレンダリングが有効にされるどうかを指示するシンタックス要素を受信する、請求項1に記載のデバイス。
  18. 前記デバイスはさらに、前記1つまたは複数のスピーカーフィードに関連付けられる少なくとも1つのスピーカーを備え、前記HOAオーディオ信号をレンダリングするために、前記1つまたは複数のプロセッサはさらに、前記少なくとも1つのスピーカーを駆動するために、ラウドスピーカーフィードを生成するように構成される、請求項1に記載のデバイス。
  19. 前記デバイスはさらに、前記表示窓を表示するためのディスプレイを備える、請求項1に記載のデバイス。
  20. 記1つまたは複数のプロセッサはさらに、複数のHOA係数を決定するために前記HOAオーディオ信号を復号するように構成される、請求項1に記載のデバイス。
  21. 記1つまたは複数のプロセッサはさらに、
    球の900個のサンプリング点のためのモード行列を生成し、
    効果行列を生成するために、前記基準画面の前記1つまたは複数のFOVパラメータと、前記表示窓の前記1つまたは複数のFOVパラメータとに基づいて、前記モード行列を修正し、
    前記効果行列に基づいて、前記HOA係数をレンダリングする
    ように構成される、請求項20に記載のデバイス。
  22. 前記記憶されたHOAオーディオデータは、1つまたは複数のフォアグラウンドオーディオオブジェクトを含み、前記1つまたは複数のプロセッサはさらに、前記1つまたは複数のフォアグラウンドオーディオオブジェクトに基づいて、前記記憶されたHOAオーディオデータを再構成するように構成され、前記レンダリングされたHOAオーディオ信号は、前記再構成された1つまたは複数のフォアグラウンドオーディオオブジェクトを表すHOA係数を備える、請求項1に記載のデバイス。
  23. 高次アンビソニック(HOA)オーディオ信号をレンダリングする方法であって、
    修正されたレンダリング行列を形成するために、基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、レンダリング行列を修正することと、
    前記HOAオーディオ信号を1つまたは複数のスピーカーフィードへとレンダリングするために、前記HOAオーディオ信号の少なくとも一部に前記修正されたレンダリング行列を適用することと
    備える、方法。
  24. 前記HOAオーディオ信号を備える符号化されたオーディオデータのビットストリームを受信することと、ここにおいて、前記符号化されたオーディオデータは対応するビデオデータに関連付けられる、
    前記ビットストリームから、前記対応するビデオデータのための前記基準画面の前記1つまたは複数のFOVパラメータを取得することと、
    前記対応するビデオデータを表示するための前記表示窓の前記1つまたは複数のFOVパラメータを取得することと
    をさらに備える、請求項23に記載の方法。
  25. HOAオーディオ信号のためのレンダラを決定することと、
    前記表示窓の前記1つまたは複数のFOVパラメータと、前記基準画面の前記1つまたは複数のFOVパラメータとに基づいて、前記レンダラを修正することと
    さらに備える、請求項23に記載の方法。
  26. 前記HOAオーディオ信号のための前記レンダラを決定することは、前記1つまたは複数のスピーカーフィードのスピーカー構成に基づいて、前記レンダラを決定することを備える、請求項25に記載の方法。
  27. 前記基準画面のための前記1つまたは複数のFOVパラメータは、前記基準画面のための1つまたは複数の方位角または前記基準画面のための1つまたは複数の仰角のうちの少なくとも1つを備える、請求項26に記載の方法。
  28. 複数のHOA係数を決定するために、前記HOAオーディオ信号を復号することと、
    前記HOA係数をレンダリングすることと
    をさらに備える、請求項23に記載の方法。
  29. 前記HOAオーディオ信号は、支配的オーディオ信号を含み、前記方法は、前記支配的オーディオ信号に基づいて、前記HOAオーディオ信号を再構成することをさらに備え、ここにおいて、前記レンダリングされたHOAオーディオ信号は、前記再構成された支配的オーディオ信号を表すHOA係数を備える、請求項23に記載の方法。
  30. 高次アンビソニック(HOA)オーディオ信号をレンダリングするための装置であって、
    前記HOAオーディオ信号を受信するための手段と、
    修正されたレンダリング行列を形成するために、基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、レンダリング行列を修正するための手段と
    前記HOAオーディオ信号を1つまたは複数のスピーカーフィードへとレンダリングするために、前記HOAオーディオ信号の少なくとも一部に前記修正されたレンダリング行列を適用するための手段と
    を備える、装置。
  31. 前記HOAオーディオ信号を備える符号化されたオーディオデータのビットストリームを受信するための手段と、ここにおいて、前記符号化されたオーディオデータは対応するビデオデータに関連付けられる、
    前記ビットストリームから、前記対応するビデオデータのための前記基準画面の前記1つまたは複数のFOVパラメータを取得するための手段と、
    前記対応するビデオデータを表示するための前記表示窓の前記1つまたは複数のFOVパラメータを取得するための手段と
    をさらに備える、請求項30に記載の装置。
  32. 命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記命令は、高次アンビソニック(HOA)オーディオ信号をレンダリングするためのデバイスの1つまたは複数のプロセッサによって実行されるとき、前記1つまたは複数のプロセッサに、
    修正されたレンダリング行列を形成するために、基準画面の1つまたは複数の視野(FOV)パラメータと、表示窓の1つまたは複数のFOVパラメータとに基づいて、レンダリング行列を修正することと、
    前記HOAオーディオ信号を1つまたは複数のスピーカーフィードへとレンダリングするために、前記HOAオーディオ信号の少なくとも一部に前記修正されたレンダリング行列を適用することと
    を行わせる非一時的コンピュータ可読記憶媒体。
JP2017518939A 2014-10-10 2015-10-09 Hoaコンテンツの画面関連の適応 Active JP6599451B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201462062761P 2014-10-10 2014-10-10
US62/062,761 2014-10-10
US14/878,948 2015-10-08
US14/878,948 US9940937B2 (en) 2014-10-10 2015-10-08 Screen related adaptation of HOA content
PCT/US2015/054964 WO2016057935A1 (en) 2014-10-10 2015-10-09 Screen related adaptation of hoa content

Publications (3)

Publication Number Publication Date
JP2017535174A JP2017535174A (ja) 2017-11-24
JP2017535174A5 true JP2017535174A5 (ja) 2019-04-25
JP6599451B2 JP6599451B2 (ja) 2019-10-30

Family

ID=54364703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017518939A Active JP6599451B2 (ja) 2014-10-10 2015-10-09 Hoaコンテンツの画面関連の適応

Country Status (10)

Country Link
US (1) US9940937B2 (ja)
EP (2) EP3205122B1 (ja)
JP (1) JP6599451B2 (ja)
KR (1) KR102077375B1 (ja)
CN (1) CN106797527B (ja)
BR (1) BR112017007267B1 (ja)
ES (2) ES2900653T3 (ja)
HU (1) HUE047302T2 (ja)
SG (1) SG11201701554PA (ja)
WO (1) WO2016057935A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2637427A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
US9838819B2 (en) * 2014-07-02 2017-12-05 Qualcomm Incorporated Reducing correlation between higher order ambisonic (HOA) background channels
US9536531B2 (en) * 2014-08-01 2017-01-03 Qualcomm Incorporated Editing of higher-order ambisonic audio data
US9854375B2 (en) * 2015-12-01 2017-12-26 Qualcomm Incorporated Selection of coded next generation audio data for transport
KR102631929B1 (ko) * 2016-02-24 2024-02-01 한국전자통신연구원 스크린 사이즈에 연동하는 전방 오디오 렌더링 장치 및 방법
CN108346432B (zh) 2017-01-25 2022-09-09 北京三星通信技术研究有限公司 虚拟现实vr音频的处理方法及相应设备
US10390166B2 (en) * 2017-05-31 2019-08-20 Qualcomm Incorporated System and method for mixing and adjusting multi-input ambisonics
US10405126B2 (en) * 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
US11164606B2 (en) 2017-06-30 2021-11-02 Qualcomm Incorporated Audio-driven viewport selection
US10469968B2 (en) * 2017-10-12 2019-11-05 Qualcomm Incorporated Rendering for computer-mediated reality systems
GB2598751A (en) * 2020-09-10 2022-03-16 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4775609A (en) * 1987-05-18 1988-10-04 Hoescht Celanese Corporation Image reversal
US8964994B2 (en) 2008-12-15 2015-02-24 Orange Encoding of multichannel digital audio signals
US20100328419A1 (en) * 2009-06-30 2010-12-30 Walter Etter Method and apparatus for improved matching of auditory space to visual space in video viewing applications
US20120162362A1 (en) 2010-12-22 2012-06-28 Microsoft Corporation Mapping sound spatialization fields to panoramic video
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
EP2637427A1 (en) * 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
JP6271586B2 (ja) * 2013-01-16 2018-01-31 ドルビー・インターナショナル・アーベー Hoaラウドネスレベルを測定する方法及びhoaラウドネスレベルを測定する装置
US20140358565A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Compression of decomposed representations of a sound field
US10020000B2 (en) * 2014-01-03 2018-07-10 Samsung Electronics Co., Ltd. Method and apparatus for improved ambisonic decoding
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
EP2928216A1 (en) * 2014-03-26 2015-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for screen related audio object remapping

Similar Documents

Publication Publication Date Title
JP2017535174A5 (ja)
EP3646619B1 (en) Mixed-order ambisonics (moa) audio data for computer-mediated reality systems
US11082662B2 (en) Enhanced audiovisual multiuser communication
JP2018534853A5 (ja)
JP2019523921A5 (ja)
US10334220B2 (en) Aggregating images and audio data to generate virtual reality content
EP3343349B1 (en) An apparatus and associated methods in the field of virtual reality
TWI595785B (zh) 用於螢幕相關音訊物件再對映之裝置及方法
EP3254281A1 (en) Coding higher-order ambisonic audio data with motion stabilization
WO2017088491A1 (zh) 一种视频的播放方法和装置
TW201907707A (zh) 音訊驅動之視埠選擇
WO2018121524A1 (zh) 一种数据处理方法及装置、采集设备及存储介质
JP6672327B2 (ja) ユーザヘッドセットへの球状ビデオ帯域幅を減少させる方法および装置
JP2017534911A5 (ja)
BR112020017489A2 (pt) Métodos, aparelho e sistemas para extensão com três graus de liberdade (3dof+) de áudio 3d mpeg-h
US10993067B2 (en) Apparatus and associated methods
JP7388492B2 (ja) 信号処理装置および方法、並びにプログラム
CN113302690A (zh) 音频处理
KR20170065208A (ko) 3d 이미지 처리 방법 및 장치, 및 그래픽 처리 장치
GB2565301A (en) Three-dimensional video processing
US11503226B2 (en) Multi-camera device
US20220150655A1 (en) Generating audio output signals
US20210092543A1 (en) 3d sound orientation adaptability
GB2568726A (en) Object prioritisation of virtual content
CN114128312A (zh) 用于低频效果的音频渲染