JP2016523467A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2016523467A5 JP2016523467A5 JP2016516820A JP2016516820A JP2016523467A5 JP 2016523467 A5 JP2016523467 A5 JP 2016523467A5 JP 2016516820 A JP2016516820 A JP 2016516820A JP 2016516820 A JP2016516820 A JP 2016516820A JP 2016523467 A5 JP2016523467 A5 JP 2016523467A5
- Authority
- JP
- Japan
- Prior art keywords
- hierarchical elements
- rendering
- conversion information
- function
- reduced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009877 rendering Methods 0.000 claims 66
- 238000006243 chemical reaction Methods 0.000 claims 38
- 238000005316 response function Methods 0.000 claims 8
- 238000004134 energy conservation Methods 0.000 claims 3
Claims (30)
- バイノーラルオーディオレンダリングの方法であって、
変換情報および符号化されたオーディオデータを含むビットストリームを取得することと、
減少された複数の階層的な要素を取得するために前記符号化されたオーディオデータを復号することと、前記変換情報は、前記減少された複数の階層的な要素を生成するために複数の階層的な要素によって表される音場がどのように変換されたかについて説明し、前記減少された複数の階層的な要素は、前記複数の階層的な要素の数よりも小さい階層的な要素の数を有する、
前記変換情報に基づいて、前記減少された複数の階層的な要素に対して前記バイノーラルオーディオレンダリングを実行することと
を備える、バイノーラルオーディオレンダリングの方法。 - 前記バイノーラルオーディオレンダリングを実行することは、前記変換情報に基づいて、前記減少された複数の階層的な要素をレンダリングする基準フレームを複数のチャンネルに変換することを備える、請求項1に記載の方法。
- 前記変換情報は、前記音場が変換された仰角角度と方位角角度とを少なくとも指定する回転情報を備える、請求項1に記載の方法。
- 前記バイノーラルオーディオレンダリングを実行することは、
前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換することと、
前記変換されたレンダリング関数に対してエネルギー保存関数を適用することと
を備える、請求項1に記載の方法。 - 前記バイノーラルオーディオレンダリングを実行することは、
前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換することによって前記レンダリング関数を変換することと、
乗算演算を使用して、前記変換されたレンダリング関数を複素数両耳室内インパルス応答関数と結合することと
を備える、請求項1に記載の方法。 - 前記バイノーラルオーディオレンダリングを実行することは、
前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換することによって前記レンダリング関数を変換することと、
畳み込み演算を必要とすることなく、乗算演算を使用して、前記変換されたレンダリング関数を複素数両耳室内インパルス応答関数と結合することと
を備える、請求項1に記載の方法。 - 前記バイノーラルオーディオレンダリングを実行することは、
前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換することによってレンダリング関数を変換することと、
回転されたバイノーラルオーディオレンダリング関数を生成するために、前記変換されたレンダリング関数を複素数両耳室内インパルス応答関数と結合することと、
左チャンネルと右チャンネルとを生成するために、前記回転されたバイノーラルオーディオレンダリング関数を前記減少された複数の階層的な要素に適用することと
を備える、請求項1に記載の方法。 - 前記複数の階層的な要素は複数の球面調和係数を備え、前記複数の球面調和係数のうち少なくとも1つは、1よりも大きい次数と関連付けられる、請求項1に記載の方法。
- 解析された符号化されたオーディオデータを取得するために、前記ビットストリームからの前記符号化されたオーディオデータを解析することと、
前記減少された複数の階層的な要素を取得するために、前記解析された符号化されたオーディオデータを復号することと、
前記ビットストリームからの前記変換情報を解析することと
をさらに備える、請求項1に記載の方法。 - 前記複数の階層的な要素によって表される前記音場に対する聴取者の頭部の位置を取得することと、
前記変換情報および前記聴取者の前記頭部の前記位置に基づいて、更新された変換情報を決定することと
をさらに備え、
ここにおいて、前記バイノーラルオーディオレンダリングを実行することは、前記更新された変換情報に基づいて、前記減少された複数の階層的な要素に対して前記バイノーラルオーディオレンダリングを実行することを備える、請求項1に記載の方法。 - 1つまたは複数のプロセッサは、
変換情報および符号化されたオーディオデータを含むビットストリームを取得し、
減少された複数の階層的な要素を取得するために前記符号化されたオーディオデータを復号し、前記変換情報は、前記減少された複数の階層的な要素を生成するために複数の階層的な要素によって表される音場がどのように変換されたかについて説明し、前記減少された複数の階層的な要素は、前記複数の階層的な要素の数よりも小さい階層的な要素の数を有する、
前記変換情報に基づいて、前記減少された複数の階層的な要素に対してバイノーラルオーディオレンダリングを実行する
ように構成される、前記1つまたは複数のプロセッサを備えるデバイス。 - 前記バイノーラルオーディオレンダリングを実行するために、前記1つまたは複数のプロセッサは、前記変換情報に基づいて、前記減少された複数の階層的な要素をレンダリングする基準フレームを複数のチャンネルに変換するようにさらに構成される、請求項11に記載のデバイス。
- 前記変換情報は、前記音場が変換された仰角角度と方位角角度とを少なくとも指定する回転情報を備える、請求項11に記載のデバイス。
- 前記バイノーラルオーディオレンダリングを実行するために、前記1つまたは複数のプロセッサは、前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換し、前記変換されたレンダリング関数に対してエネルギー保存関数を適用するようにさらに構成される、請求項11に記載のデバイス。
- 前記バイノーラルオーディオレンダリングを実行するために、前記1つまたは複数のプロセッサは、前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換することによって前記レンダリング関数を変換し、乗算演算を使用して、前記変換されたレンダリング関数を複素数両耳室内インパルス応答関数と結合するようにさらに構成される、請求項11に記載のデバイス。
- 前記バイノーラルオーディオレンダリングを実行するために、前記1つまたは複数のプロセッサは、前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換することによって前記レンダリング関数を変換し、畳み込み演算を必要とすることなく、乗算演算を使用して、前記変換されたレンダリング関数を複素数両耳室内インパルス応答関数と結合するようにさらに構成される、請求項11に記載のデバイス。
- 前記バイノーラルオーディオレンダリングを実行するために、前記1つまたは複数のプロセッサは、前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換することによって前記レンダリング関数を変換し、回転されたバイノーラルオーディオレンダリング関数を生成するために、前記変換されたレンダリング関数を複素数両耳室内インパルス応答関数と結合し、左チャンネルと右チャンネルとを生成するために、前記回転されたバイノーラルオーディオレンダリング関数を前記減少された複数の階層的な要素に適用するようにさらに構成される、請求項11に記載のデバイス。
- 前記複数の階層的な要素は複数の球面調和係数を備え、前記複数の球面調和係数のうち少なくとも1つは、1よりも大きい次数と関連付けられる、請求項11に記載のデバイス。
- 前記1つまたは複数のプロセッサは、
前記ビットストリームからの前記符号化されたオーディオデータを解析し、
前記減少された複数の階層的な要素を生成するために、前記解析された符号化されたオーディオデータを復号し、
前記ビットストリームからの前記変換情報を解析する
ようにさらに構成される、請求項11に記載のデバイス。 - 前記1つまたは複数のプロセッサは、
前記複数の階層的な要素によって表される前記音場に対する聴取者の頭部の位置を取得し、
前記変換情報および前記聴取者の前記頭部の前記位置に基づいて、更新された変換情報を決定する
ようにさらに構成され、
ここにおいて、前記バイノーラルオーディオレンダリングを実行するために、前記1つまたは複数のプロセッサは、前記更新された変換情報に基づいて、前記減少された複数の階層的な要素に対して前記バイノーラルオーディオレンダリングを実行するようにさらに構成される、請求項11に記載のデバイス。 - 変換情報および符号化されたオーディオデータを含むビットストリームを取得するための手段と、
減少された複数の階層的な要素を取得するために前記符号化されたオーディオデータを復号するための手段と、前記変換情報は、前記減少された複数の階層的な要素を生成するために複数の階層的な要素によって表される音場がどのように変換されたかについて説明し、前記減少された複数の階層的な要素は、前記複数の階層的な要素の数よりも小さい階層的な要素の数を有する、
前記変換情報に基づいて、前記減少された複数の階層的な要素に対してバイノーラルオーディオレンダリングを実行するための手段と
を備える装置。 - 前記バイノーラルオーディオレンダリングを実行するための前記手段は、前記変換情報に基づいて、前記減少された複数の階層的な要素をレンダリングする基準フレームを複数のチャンネルに変換するための手段を備える、請求項21に記載の装置。
- 前記変換情報は、前記音場が変換された仰角角度と方位角角度とを少なくとも指定する回転情報を備える、請求項21に記載の装置。
- 前記バイノーラルオーディオレンダリングを実行するための前記手段は、
前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換するための手段と、
前記変換されたレンダリング関数に対してエネルギー保存関数を適用するための手段と
を備える、請求項21に記載の装置。 - 前記バイノーラルオーディオレンダリングを実行するための前記手段は、
前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換することによって前記レンダリング関数を変換するための手段と、
畳み込み演算を必要とすることなく、乗算演算を使用して、前記変換されたレンダリング関数を複素数両耳室内インパルス応答関数と結合するための手段と
を備える、請求項21に記載の装置。 - 前記バイノーラルオーディオレンダリングを実行するための前記手段は、
前記変換情報に基づいて、レンダリング関数が前記減少された複数の階層的な要素をレンダリング可能である基準フレームを変換することによって前記レンダリング関数を変換するための手段と、
回転されたバイノーラルオーディオレンダリング関数を生成するために、前記変換されたレンダリング関数を複素数両耳室内インパルス応答関数と結合するための手段と、
左チャンネルと右チャンネルとを生成するために、前記回転されたバイノーラルオーディオレンダリング関数を前記減少された複数の階層的な要素に適用するための手段と
を備える、請求項21に記載の装置。 - 前記複数の階層的な要素は複数の球面調和係数を備え、前記複数の球面調和係数のうち少なくとも1つは、1よりも大きい次数と関連付けられる、請求項21に記載の装置。
- 解析された符号化されたオーディオデータを取得するために、前記ビットストリームからの前記符号化されたオーディオデータを解析するための手段と、
前記減少された複数の階層的な要素を取得するために、前記解析された符号化されたオーディオデータを復号するための手段と、
前記ビットストリームからの前記変換情報を解析するための手段と、
をさらに備える、請求項21に記載の装置。 - 前記複数の階層的な要素によって表される前記音場に対する聴取者の頭部の位置を取得するための手段と、
前記変換情報および前記聴取者の前記頭部の前記位置に基づいて、更新された変換情報を決定するための手段と
をさらに備え、
ここにおいて、前記バイノーラルオーディオレンダリングを実行するための前記手段は、前記更新された変換情報に基づいて、前記減少された複数の階層的な要素に対して前記バイノーラルオーディオレンダリングを実行するための手段を備える、請求項21に記載の装置。 - 実行されると、1つまたは複数のプロセッサを、
変換情報および符号化されたオーディオデータを含むビットストリームを取得し、
減少された複数の階層的な要素を取得するために前記符号化されたオーディオデータを復号し、前記変換情報は、前記減少された複数の階層的な要素を生成するために複数の階層的な要素によって表される音場がどのように変換されたかについて説明し、前記減少された複数の階層的な要素は、前記複数の階層的な要素の数よりも小さい階層的な要素の数を有する、
前記変換情報に基づいて、前記減少された複数の階層的な要素に対してバイノーラルオーディオレンダリングを実行する
ように構成する、その上に記憶された命令を備える、非一時的コンピュータ可読記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361828313P | 2013-05-29 | 2013-05-29 | |
US61/828,313 | 2013-05-29 | ||
US14/289,602 | 2014-05-28 | ||
US14/289,602 US9384741B2 (en) | 2013-05-29 | 2014-05-28 | Binauralization of rotated higher order ambisonics |
PCT/US2014/040021 WO2014194088A2 (en) | 2013-05-29 | 2014-05-29 | Binauralization of rotated higher order ambisonics |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016523467A JP2016523467A (ja) | 2016-08-08 |
JP2016523467A5 true JP2016523467A5 (ja) | 2016-10-06 |
JP6067935B2 JP6067935B2 (ja) | 2017-01-25 |
Family
ID=51985121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016516820A Expired - Fee Related JP6067935B2 (ja) | 2013-05-29 | 2014-05-29 | 回転された高次アンビソニックスのバイノーラル化 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9384741B2 (ja) |
EP (1) | EP3005738B1 (ja) |
JP (1) | JP6067935B2 (ja) |
KR (1) | KR101723332B1 (ja) |
CN (1) | CN105325015B (ja) |
WO (1) | WO2014194088A2 (ja) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9131305B2 (en) * | 2012-01-17 | 2015-09-08 | LI Creative Technologies, Inc. | Configurable three-dimensional sound system |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
WO2015145782A1 (en) * | 2014-03-26 | 2015-10-01 | Panasonic Corporation | Apparatus and method for surround audio signal processing |
US9852737B2 (en) | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
US9712936B2 (en) * | 2015-02-03 | 2017-07-18 | Qualcomm Incorporated | Coding higher-order ambisonic audio data with motion stabilization |
CN106297820A (zh) | 2015-05-14 | 2017-01-04 | 杜比实验室特许公司 | 具有基于迭代加权的源方向确定的音频源分离 |
EP3748994B1 (en) | 2015-08-25 | 2023-08-16 | Dolby Laboratories Licensing Corporation | Audio decoder and decoding method |
WO2017119320A1 (ja) * | 2016-01-08 | 2017-07-13 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
EP3852394A1 (en) | 2016-06-21 | 2021-07-21 | Dolby Laboratories Licensing Corporation | Headtracking for pre-rendered binaural audio |
US9653095B1 (en) | 2016-08-30 | 2017-05-16 | Gopro, Inc. | Systems and methods for determining a repeatogram in a music composition using audio features |
WO2018064528A1 (en) * | 2016-09-29 | 2018-04-05 | The Trustees Of Princeton University | Ambisonic navigation of sound fields from an array of microphones |
EP3324407A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
EP3324406A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
EP3651480A4 (en) * | 2017-07-05 | 2020-06-24 | Sony Corporation | SIGNAL PROCESSING DEVICE, METHOD, AND PROGRAM |
RU2736274C1 (ru) | 2017-07-14 | 2020-11-13 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Принцип формирования улучшенного описания звукового поля или модифицированного описания звукового поля с использованием dirac-технологии с расширением глубины или других технологий |
JP7119060B2 (ja) | 2017-07-14 | 2022-08-16 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチポイント音場記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト |
KR102652670B1 (ko) | 2017-07-14 | 2024-04-01 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 다중-층 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 |
US10674301B2 (en) * | 2017-08-25 | 2020-06-02 | Google Llc | Fast and memory efficient encoding of sound objects using spherical harmonic symmetries |
CN111316353B (zh) * | 2017-11-10 | 2023-11-17 | 诺基亚技术有限公司 | 确定空间音频参数编码和相关联的解码 |
SG11202004389VA (en) | 2017-11-17 | 2020-06-29 | Fraunhofer Ges Forschung | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding |
JP7354107B2 (ja) | 2017-12-18 | 2023-10-02 | ドルビー・インターナショナル・アーベー | 仮想現実環境における聴取位置間のグローバル遷移を扱う方法およびシステム |
CN111542877B (zh) * | 2017-12-28 | 2023-11-24 | 诺基亚技术有限公司 | 空间音频参数编码和相关联的解码的确定 |
GB2572761A (en) * | 2018-04-09 | 2019-10-16 | Nokia Technologies Oy | Quantization of spatial audio parameters |
CN111712875B (zh) * | 2018-04-11 | 2024-09-06 | 杜比国际公司 | 用于6dof音频渲染的方法、设备和系统及用于6dof音频渲染的数据表示和位流结构 |
GB2577698A (en) | 2018-10-02 | 2020-04-08 | Nokia Technologies Oy | Selection of quantisation schemes for spatial audio parameter encoding |
CN111107481B (zh) | 2018-10-26 | 2021-06-22 | 华为技术有限公司 | 一种音频渲染方法及装置 |
GB2586214A (en) * | 2019-07-31 | 2021-02-17 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
GB2586461A (en) * | 2019-08-16 | 2021-02-24 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
US11521623B2 (en) | 2021-01-11 | 2022-12-06 | Bank Of America Corporation | System and method for single-speaker identification in a multi-speaker environment on a low-frequency audio recording |
US12165622B2 (en) * | 2023-02-03 | 2024-12-10 | Applied Insights, Llc | Audio infusion system and method |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
WO2009046223A2 (en) | 2007-10-03 | 2009-04-09 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
EP2539892B1 (fr) * | 2010-02-26 | 2014-04-02 | Orange | Compression de flux audio multicanal |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
US9685163B2 (en) * | 2013-03-01 | 2017-06-20 | Qualcomm Incorporated | Transforming spherical harmonic coefficients |
US9420393B2 (en) * | 2013-05-29 | 2016-08-16 | Qualcomm Incorporated | Binaural rendering of spherical harmonic coefficients |
-
2014
- 2014-05-28 US US14/289,602 patent/US9384741B2/en active Active
- 2014-05-29 JP JP2016516820A patent/JP6067935B2/ja not_active Expired - Fee Related
- 2014-05-29 EP EP14734329.7A patent/EP3005738B1/en active Active
- 2014-05-29 KR KR1020157036670A patent/KR101723332B1/ko active IP Right Grant
- 2014-05-29 WO PCT/US2014/040021 patent/WO2014194088A2/en active Application Filing
- 2014-05-29 CN CN201480035774.6A patent/CN105325015B/zh active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016523467A5 (ja) | ||
JP2016513811A5 (ja) | ||
JP2022120119A (ja) | 高次アンビソニックス信号表現を圧縮又は圧縮解除するための方法又は装置 | |
TWI590234B (zh) | 編碼聲訊資料之方法和裝置,以及解碼已編碼聲訊資料之方法和裝置 | |
CN109616130B (zh) | 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 | |
JP2016076972A5 (ja) | ||
JP2015522183A5 (ja) | ||
JP2015527610A5 (ja) | ||
JP2014523699A5 (ja) | ||
JP2013017167A5 (ja) | ||
JP2015194666A5 (ja) | ||
WO2014194088A3 (en) | Binauralization of rotated higher order ambisonics | |
JP2016524727A5 (ja) | ||
JP2016140108A5 (ja) | ||
JP2015039191A5 (ja) | ||
JP2015006006A5 (ja) | ||
IL309130B2 (en) | Coding of audio scenes | |
CN104995675B (zh) | 音频帧丢失隐藏 | |
JP2015092654A5 (ja) | ||
EP4425489A3 (en) | Enhanced soundfield coding using parametric component generation | |
WO2014134472A3 (en) | Transforming spherical harmonic coefficients | |
JP7333855B2 (ja) | 高次アンビソニックス信号にダイナミックレンジ圧縮を適用するための方法および装置 | |
JP2015128311A5 (ja) | ||
JP2017526957A5 (ja) | ||
JP2017535174A5 (ja) |