JP2023066402A - アコースティック環境間のオーディオ遷移のための方法および装置 - Google Patents

アコースティック環境間のオーディオ遷移のための方法および装置 Download PDF

Info

Publication number
JP2023066402A
JP2023066402A JP2022171185A JP2022171185A JP2023066402A JP 2023066402 A JP2023066402 A JP 2023066402A JP 2022171185 A JP2022171185 A JP 2022171185A JP 2022171185 A JP2022171185 A JP 2022171185A JP 2023066402 A JP2023066402 A JP 2023066402A
Authority
JP
Japan
Prior art keywords
acoustic
acoustic environment
audio
distance threshold
environment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022171185A
Other languages
English (en)
Inventor
シャムスンダル マテ スジート
Shyamsundar Mate Sujeet
アルットゥリ レッパネン ユッシ
Artturi Leppanen Jussi
ヨハンネス エロネン アンティ
Johannes Eronen Antti
ビルヤミ ハルユ オット
Viljami Harju Otto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Technologies Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Technologies Oy filed Critical Nokia Technologies Oy
Publication of JP2023066402A publication Critical patent/JP2023066402A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • G10K15/10Arrangements for producing a reverberation or echo sound using time-delay networks comprising electromechanical or electro-acoustic devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • H04S7/306For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/07Use of position data from wide-area or local-area positioning systems in hearing devices, e.g. program or information selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/15Transducers incorporated in visual displaying devices, e.g. televisions, computer displays, laptops
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Stereophonic System (AREA)

Abstract

【課題】アコースティック環境間のオーディオ遷移のための方法及び装置を提供する。【解決手段】少なくとも2つのアコースティック環境間のオーディオ遷移を可能にする装置は、第1アコースティック環境100と第2アコースティック環境102とを備えるオーディオシーンに関連付けられ、少なくとも第1アコースティック環境体情報を取得するステップと、前記オーディオシーン内のリスニング位置に応じて、両アコースティック環境間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1の距離閾値を取得するステップと、両アコースティック環境のうちの少なくとも1つの環境特性を調整するためにリスニング位置を決定するステップと、リスニング位置に応じて両アコースティック環境のうちの少なくとも1つの環境特性を調整するステップとを、実行する手段を備える。環境特性は、オーディオシーン内で適応的に制御される。【選択図】図1

Description

本出願は、没入型オーディオシーンにおけるアコースティック環境間の遅延残響断面フェード実装のための方法および装置に関し、6自由度レンダリングのための没入型オーディオシーンにおけるアコースティック環境間の遅延残響断面フェード実装のための方法および装置に関するが、これに限定されない。
ヘッドマウントデバイス(HMD)を装着しているユーザに仮想シーンが表される、拡張現実(AR)アプリケーション(および混合現実(MR)および仮想現実(VR)などの他の同様の仮想シーン作成アプリケーション)は、時間の経過とともにより複雑かつ高度になっている。用途は、ビジュアルコンポーネント(またはオーバーレイ)と、ユーザに提示されるオーディオコンポーネント(またはオーバーレイ)とを含むデータを含むことができる。これらの構成要素は、拡張現実(AR)シーン内の(6自由度アプリケーションのための)ユーザの位置および向きに応じてユーザに提供され得る。
ARシーンをレンダリングするためのシーン情報は、通常、2つの部分を含む。1つの部分は、コンテンツ作成中に(または適切なキャプチャ装置またはデバイスによって)記述され得、キャプチャされた(または最初に生成された)シーンを表す仮想シーン情報である。仮想シーンは、エンコーダ入力フォーマット(EIF)データフォーマットで提供され得る。EIFおよび(キャプチャまたは生成された)オーディオデータはエンコーダによって、シーン記述および空間オーディオメタデータ(および符号化オーディオ信号)を生成するために使用され、それはビットストリームを介してレンダリング(再生)デバイスまたは装置に配信され得る。EIFは、ISO/IEC JTC1 SC29 WG6 MPEGオーディオ符号化におけるMPEG-I 6DoFオーディオの提案(CfP)のために開発されたMPEG-I 6DoFオーディオエンコーダ入力フォーマットに記載されている。実装形態は主に、本明細書に従って説明されるが、シーン/コンテンツクリエータによって提供または使用され得る他のシーン記述フォーマットを使用することもできる。
EIFによれば、エンコーダ入力データは、MPEG-I 6DoFオーディオシーンを記述する情報を含む。これは、仮想聴覚シーンのすべての内容、すなわちそのすべての音源、およびオーディオ波形、音源放射パターン、アコースティック環境に関する情報などのリソースデータをカバーする。したがって、コンテンツは、オブジェクト、チャネル、および高次アンビソニックスなどのオーディオ生成要素と、それらのメタデータ(位置および向きおよびソース指向性パターンなど)と、非オーディオ生成要素(アコースティック的に関連するシーンジオメトリおよびマテリアルプロパティなど)との両方を含むことができる。入力データはまた、シーンの変化を記述することを可能にする。更新と呼ばれるこれらの変化は異なる時間に発生することができ、シーンをアニメーション化することができる(例えば、移動するオブジェクト)。代替的に、それらは、手動で、または条件(例えば、リスナが近接に入る)によってトリガされるか、または外部エンティティから動的に更新されることができる。
したがって、EIF情報は、作成された、またはキャプチャされたアコースティック環境を定義する。これは、いくつかの状況では一連のアコースティック的に結合された(すなわち、オーディオの伝達を可能にするための接続)アコースティック環境としてモデル化され得る。したがって、残響特性を指定するためのアコースティック環境に加えて、アコースティック的に結合された空間は、全体的なレンダリングを現実的にするために「ポータル」の概念を必要とする。アコースティックポータルは、隣接する部屋から残響をレンダリングする機能を有する。ポータルは特に、隣接するアコースティック環境の残響から供給されるオーディオを有するアコースティック環境において、音源としてモデル化またはレンダリングすることができる。
少なくとも2つのアコースティック環境の間のオーディオ遷移を可能にするための装置であって、該装置は、オーディオシーンに関連付けられた少なくとも第1アコースティック環境の情報を取得するステップであって、前記オーディオシーンが前記第1アコースティック環境と第2アコースティック環境とを備える、ステップと、前記オーディオシーン内のリスニング位置に応じて前記第1および第2アコースティック環境の間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に画定する第1距離閾値を取得するステップと、前記リスニング位置を決定して前記第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整するステップと、前記リスニング位置に応じて前記第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整するステップであって、前記環境特性が前記オーディオシーン内で適応的に制御される、ステップと、を実行するように構成された手段を含む、装置である。
オーディオシーンに関連付けられた少なくとも第1アコースティック環境の情報を取得するように構成された手段であって、前記オーディオシーンが、第1アコースティック環境および第2アコースティック環境を備える、手段が、オーディオシーンに関連付けられた少なくとも第1アコースティック環境の情報を備えるビットストリームを受信する、ように構成される。
ビットストリームは第1距離閾値をさらに備えることができ、第1距離閾値を取得するように構成された手段はビットストリームから第1距離閾値を取得するように構成することができる。
第1アコースティック環境および第2アコースティック環境は、第1アコースティック環境と第2アコースティック環境との間の境界に位置する第1のアコースティックカップリングによって結合され得る。
オーディオ遷移領域を少なくとも部分的に画定する第1距離閾値は、第1アコースティック環境内に位置し、第2アコースティック環境と関連付けることができる。
リスニング位置に応じて第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整するように構成された手段は、リスナ位置がオーディオ移行領域内にあることを決定し、第1アコースティック環境と第2アコースティック環境との間の境界とに対するリスニング位置に基づいて、第1アコースティック環境の第1の残響ゲインパラメータまたは第2アコースティック環境の第2の残響ゲインパラメータのうちの少なくとも1つを調整するように構成することができる。
手段は第1の距離閾値に関連する第1の機能を取得するようにさらに構成することができ、リスニング位置に応じて第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整するように構成された手段は、第1の距離閾値に対するリスニング位置に適用された第1の機能と、第1アコースティック環境と第2アコースティック環境との間の境界とにさらに基づいて、第1アコースティック環境の第1の残響利得パラメータまたは第2アコースティック環境の第の残響利得パラメータのうちの少なくとも1つを調整するように構成することができる。
本願手段は空間オーディオ信号をレンダリングするようにさらに構成することができ、空間オーディオ信号は、第1および第2アコースティック環境のうちの少なくとも1つの環境特性に基づいて生成された残響から少なくとも部分的に構成することができる。
空間オーディオ信号をレンダリングするように構成された手段は、第1アコースティック環境の第1の残響ゲインパラメータに基づいて第1の残響部分を備える空間オーディオ信号を生成するように構成することができ、および/または第2アコースティック環境の第2の残響ゲインパラメータに基づいて第2の残響部分を生成するように構成することができる。
第1アコースティック環境の第1の残響利得パラメータ、および/または、第2アコースティック環境の第の残響利得パラメータに基づいた、第の残響利得パラメータに基づいた、第1の残響利得パラメータを備える空間オーディオ信号を生成するように構成された手段は、リスナ位置が第1アコースティック環境内にあるときに、現在のアコースティック環境を第1アコースティック環境として設定するステップと、寄与を提供しないように、第1アコースティック環境とは別に、他のすべてのアコースティック環境の残響減衰を設定するステップと、第2のアコースティック環境に対して定義された寄与を提供するために、残響減衰を設定するステップであって、リスナ位置が、閾値によって定義された第1のアコースティック環境内の領域内にある、ステップと、現在のアコースティック環境と他のアコースティック環境に対する残響寄与を決定するステップと、空間オーディオ信号の一部を形成するために、残響寄与を組み合わるステップと、を実行するように構成できる。
リスナ位置が閾値によって定義される第1アコースティック環境内の領域内にある第2アコースティック環境のための定義された寄与を提供するように残響減衰を設定するように構成された手段は、第1の機能に基づいて第2アコースティック環境のための定義された寄与を提供するように残響減衰を設定するように構成することができる。
オーディオ場面内のリスナ位置に応じて第1および第2アコースティック環境間の適応レンダリングを可能にする第1距離閾値を少なくとも部分的に規定する第1距離閾値を取得するように構成された手段は、第1距離閾値が適用可能なアコースティック環境の数を示す情報、第1距離閾値が適用可能なアコースティック環境を示す情報、第1距離閾値がどのアコースティック環境に位置するかを示す情報、第1距離閾値に対する距離値を示す情報、第1距離閾値に関連する形状またはプロファイルを示す情報、ヒステリシス領域を規定するヒステリシスオフセット値を示す情報、リスナ位置が第1距離閾値の外側から第1および第2アコースティック環境の間の境界まで移動するときの減衰レベルを修正するための機能を規定する減衰変調タイプを示す情報、現在のアコースティック環境から目的のアコースティック環境までのホップの数を規定するホップを示す情報、および、最大減衰レベルを規定するパラメータ減衰上限を示す情報のうちの少なくとも1つを取得するように構成されることができる。
第2の態様によれば、オーディオシーンのレンダリングを支援するためのアコースティック環境情報を生成するための装置が提供され、装置は、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得することであって、オーディオシーンが第1アコースティック環境と第2の環境とを備える、取得することと、オーディオシーン内のリスニング位置に応じて第1と第2アコースティック環境との間の適応レンダリングを可能にするオーディオ移行領域を少なくとも部分的に定義する第1距離閾値を取得することと、情報と第1距離閾値とを符号化して出力することとを行うように構成された手段を備える。
本願手段は、第1の距離閾値に関連付けられた第1の機能を取得するようにさらに構成することができ、第1の機能は第1アコースティック環境および第2アコースティック環境のうちの少なくとも1つに特徴的な環境の調節を定義する。
オーディオ場面内のリスナ位置に応じて第1および第2アコースティック環境間の適応レンダリングを可能にする第1距離閾値を少なくとも部分的に規定する第1距離閾値を取得するように構成された手段は、第1距離閾値が適用可能なアコースティック環境の数を示す情報と、第1距離閾値が適用可能なアコースティック環境を示す情報と、第1距離閾値がどのアコースティック環境に位置するかを示す情報と、第1距離閾値に対する距離値を示す情報と、第1距離閾値に関連付けられた形状またはプロファイルを示す情報と、ヒステリシス領域を規定するヒステリシスオフセット値を示す情報と、リスナ位置が第1距離閾値外から第1および第2アコースティック環境間の境界まで移動するときの減衰レベルを修正するための機能を規定する減衰変調タイプを示す情報と、現在のアコースティック環境から目的アコースティック環境までのホップ数を規定するホップを示す情報と、最大減衰レベルを規定するパラメータ減衰上限を示す情報とのうちの少なくとも1つを取得するように構成されてもよい。
情報を符号化および出力するように構成された手段は、符号化された情報と第1の距離閾値とを備えるビットストリームを生成するように構成することができる。この手段は、オーディオシーンに関連付けられた少なくとも1つのオーディオ信号を取得するようにさらに構成することができ、情報を符号化および出力するように構成された手段は符号化された少なくとも1つのオーディオ信号を備えるビットストリームを生成するように構成される。
第3の態様によれば、少なくとも2つのアコースティック環境間のオーディオ遷移を可能にするための装置が提供され、この方法は、オーディオシーンに関連する少なくとも第1アコースティック環境体情報を取得するステップであって、オーディオシーンが第1アコースティック環境と第2アコースティック環境とを備える、ステップと、オーディオシーン内のリスナ位置に応じて、第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するステップと、第1アコースティック環境と第2アコースティック環境とのうちの少なくとも1つの環境特性を調整するために、リスナ位置を決定するステップと、リスナ位置に応じて、第1アコースティック環境と第2アコースティック環境とのうちの少なくとも1つの環境特性を調整するステップであって、環境特性がオーディオシーン内で適応的に制御される、ステップと、を含む。
オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得することは、オーディオシーンは第1アコースティック環境を含み、第2アコースティック環境はオーディオシーンに関連する少なくとも第1アコースティック環境の情報を含むことができ、ここで、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を含むビットストリームを受信することを含む。
ビットストリームは第1距離閾値をさらに備えることができ、第1距離閾値を取得することはビットストリームから第1距離閾値を取得することを含むことができる。
第1アコースティック環境および第2アコースティック環境は、第1アコースティック環境と第2アコースティック環境との間の境界に位置する第1のアコースティックカップリングによって結合され得る。
オーディオ遷移領域を少なくとも部分的に画定する第1距離閾値は第1アコースティック環境内に位置し、第2アコースティック環境と関連付けることができる。
リスニング位置に応じて第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整するステップは、リスナ位置がオーディオ遷移領域内にあることを決定するステップと、第1距離閾値および第1アコースティック環境と第2アコースティック環境との間の境界に対するリスナ位置に基づいて、第1アコースティック環境の第1の残響利得パラメータまたは第2アコースティック環境の第の残響利得パラメータのうちの少なくとも1つを調整するステップと、を含むことができる。
本方法は、第1距離閾値に関連する第1の機能を取得することをさらに備えることができ、リスニング位置に応じて第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整することは、第1距離閾値および第1アコースティック環境と第2アコースティック環境との間の境界に対してリスニング位置に適用される第1の機能にさらに基づいて、第1アコースティック環境の第1の残響利得パラメータまたは第2アコースティック環境の第の残響利得パラメータのうちの少なくとも1つを調整することを含むことができる。
本方法は空間オーディオ信号をレンダリングすることをさらに備えることができ、空間オーディオ信号は、第1および第2アコースティック環境のうちの少なくとも1つの環境特性に基づいて生成された残響から少なくとも部分的に含むことができる。
空間オーディオ信号をレンダリングすることは、第1アコースティック環境の第1の残響利得パラメータに基づいて第1の残響部分を備える空間オーディオ信号を生成すること、および/または、第2アコースティック環境の第の残響利得パラメータに基づいて第2の残響部分を生成することを含むことができる。
第2アコースティック環境の第の残響利得パラメータに基づいて、第1アコースティック環境の第1の残響利得パラメータおよび/または第2の残響利得パラメータに基づいて、第1の残響利得パラメータを備える空間オーディオ信号を生成することは、リスナ位置が第1アコースティック環境内にあるときに、現在のアコースティック環境を第1アコースティック環境として設定することと、寄与を提供しないように、第1アコースティック環境とは別に、他のすべてのアコースティック環境のための残響減衰を設定することと、リスナ位置が閾値によって定義される第1アコースティック環境内の領域内にある第2アコースティック環境のための定義された寄与を提供するように、残響減衰を設定することと、現在のアコースティック環境および他のアコースティック環境のための残響寄与を決定することと、空間オーディオ信号の一部を形成するために、残響寄与を組み合わせることとを含むことができる。
リスナ位置が閾値によって定義される第1アコースティック環境内の領域内にある第2アコースティック環境のための定義された寄与を提供するように残響減衰を設定することは、第1の機能に基づいて第2アコースティック環境のための定義された寄与を提供するように残響減衰を設定することを含むことができる。
オーディオシーン内のリスナ位置に応じて第1および第2アコースティック環境間の適応レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得することは、第1距離閾値が適用可能なアコースティック環境の数を示す情報、第1距離閾値が適用可能なアコースティック環境を示す情報、第1距離閾値がどのアコースティック環境に位置するかを示す情報、第1距離閾値に対する距離値を示す情報、第1距離閾値に関連する形状またはプロファイルを示す情報、ヒステリシス領域を定義するヒステリシスオフセット値を示す情報、リスナ位置が第1距離閾値の外側から第1および第2アコースティック環境の間の境界まで移動するときの減衰レベルを修正するための機能を定義する減衰変調タイプを示す情報、現在のアコースティック環境から目的のアコースティック環境へのホップの数を定義するホップを示す情報、および、最大減衰レベルを定義するパラメータ減衰上限を示す情報のうちの少なくとも1つを取得することを含むことができる。
第4の態様によれば、オーディオシーンのレンダリングを支援するためにアコースティック環境情報を生成するための装置のための方法が提供され、この方法は、オーディオシーンに関連する少なくとも第1アコースティック環境体情報を取得するステップであって、オーディオシーンが第1アコースティック環境と第2の環境とを備える、ステップと、オーディオシーン内のリスニング位置に応じて、第1アコースティック環境と第2アコースティック環境との間の適応レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するステップと、情報と第1距離閾値とを符号化して出力するステップとを備える。
本方法は第1距離閾値に関連する第1の機能を取得することをさらに含むことができ、第1の機能は第1および第2アコースティック環境のうちの少なくとも1つの環境特性の調整を定義する。
オーディオシーン内のリスナ位置に応じて第1および第2アコースティック環境間の適応レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得することは、第1距離閾値が適用可能なアコースティック環境の数を示す情報、第1距離閾値が適用可能なアコースティック環境を示す情報、第1距離閾値がどのアコースティック環境にあるかを示す情報、第1距離閾値に対する距離値を示す情報、第1距離閾値に関連する形状またはプロファイルを示す情報、ヒステリシス領域を定義するヒステリシスオフセット値を示す情報、リスナ位置が第1距離閾値の外側から第1および第2アコースティック環境の間の境界まで移動するときの減衰レベルを修正するための機能を定義する減衰変調タイプを示す情報、現在のアコースティック環境から目的のアコースティック環境へのホップの数を定義するホップを示す情報、および、最大減衰レベルを定義するパラメータ減衰上限を示す情報のうちの少なくとも1つを取得することを含むことができる。
情報を符号化および出力することは、符号化された情報と第1距離閾値とを備えるビットストリームを生成することを備え得る。
本願方法は、オーディオシーンに関連付けられた少なくとも1つのオーディオ信号を取得するステップをさらに含むことができ、情報を符号化および出力するステップは、符号化された少なくとも1つのオーディオ信号を備えるビットストリームを生成するステップを含むことができる。
第5の態様によれば、コンピュータプログラムコードを含む少なくとも1つのメモリとを備えた装置であって、該少なくとも1つのメモリおよび該コンピュータプログラムコードは、該少なくとも1つのプロセッサを用いて、該装置に、少なくとも、オーディオシーンに関連する少なくとも1つの第1アコースティック環境の情報を取得させ、ここで、オーディオシーンが、第1アコースティック環境および第2アコースティック環境を備え、オーディオシーン内のリスナ位置に応じて第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得させ、第1および第2のアコースティック環境の少なくとも一方の環境特性を調整するために、リスニングポジションを決定させ、リスナ位置に応じて、第1および第2のアコースティック環境の少なくとも一方の環境特性を調整し、環境特性は、オーディオシーン内で適応的に制御させるように構成される、装置が提供される。
第1アコースティック環境を備えるオーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得する装置は、第2アコースティック環境が、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を備えるビットストリームを受信することができる。
ビットストリームは第1距離閾値をさらに備えることができ、第1距離閾値を取得するように構成された手段はビットストリームから第1距離閾値を取得するように構成することができる。
第1アコースティック環境および第2アコースティック環境は、第1アコースティック環境と第2アコースティック環境との間の境界に位置する第1のアコースティックカップリングによって結合され得る。
オーディオ遷移領域を少なくとも部分的に画定する第1距離閾値は第1アコースティック環境内に位置し、第2アコースティック環境と関連付けることができる。
リスニング位置に応じて第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整させる装置は、リスナ位置がオーディオ遷移領域内にあることを決定し、第1距離閾値および第1アコースティック環境と第2アコースティック環境との間の境界に対するリスニング位置に基づいて、第1アコースティック環境の第1の残響ゲインパラメータまたは第2アコースティック環境の第2の残響ゲインパラメータのうちの少なくとも1つを調整させることができる。
装置は第1距離閾値に関連する第1の機能を取得することをさらにさせることができ、リスニング位置に応じて第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整することを引き起こされる装置は、第1距離閾値に対するリスニング位置に適用される第1の機能と、第1アコースティック環境と第2アコースティック環境との間の境界とにさらに基づいて、第1アコースティック環境の第1の残響利得パラメータまたは第2アコースティック環境の第の残響利得パラメータのうちの少なくとも1つを調整することをさせることができる。
本願装置は、空間オーディオ信号をレンダリングするようにされることができ、空間オーディオ信号は、第1および第2アコースティック環境のうちの少なくとも1つの環境特性に基づいて生成された残響から少なくとも部分的に備えることができる。
空間オーディオ信号をレンダリングさせる装置は、第1アコースティック環境の第1の残響利得パラメータに基づいて第1の残響部分を備える空間オーディオ信号を生成させることができ、および/または、第2アコースティック環境の第2の残響利得パラメータに基づいて第2の残響部分を生成させることができる。
第1アコースティック環境の第1の残響利得パラメータに基づいて、第1の残響部分を含む空間オーディオ信号を生成させる装置、および/または、第2の残響利得パラメータに基づいて、第2の残響部分を備える空間オーディオ信号を生成することを引き起こす装置は、リスナ位置が第1アコースティック環境内にあるときに、現在のアコースティック環境を第1アコースティック環境として設定することと、寄与を提供しないように、第1アコースティック環境とは別に、他のすべてのアコースティック環境のための残響減衰を設定することと、リスナ位置が閾値によって定義される第1アコースティック環境内の領域内にある第2アコースティック環境のための定義された寄与を提供するように、残響減衰を設定することと、現在のアコースティック環境および他のアコースティック環境のための残響寄与を決定することと、空間オーディオ信号の一部を形成するために、残響寄与を組み合わせることとを実行することができる。
閾値によって定義される第1アコースティック環境内の領域内にリスナ位置がある第2アコースティック環境のための定義された寄与を提供するように残響減衰を設定させる装置は、第1の機能に基づいて第2アコースティック環境のための定義された寄与を提供するように残響減衰を設定させることができる。
オーディオシーン内のリスナ位置に応じて第1アコースティック環境と第2アコースティック環境との間の適応的なレンダリングを可能にするオーディオ遷移領域を少なくとも部分的に規定する第1距離閾値を取得するようにした装置は、第1距離閾値が適用可能なアコースティック環境の数を示す情報と、第1距離閾値が適用可能なアコースティック環境を示す情報と、第1距離閾値がどのアコースティック環境にあるかを示す情報と、第1距離閾値についての距離値を示す情報と、第1距離閾値に関連付けられた形状またはパラメータを示す情報と、ヒステリシス領域を定義するヒステリシスオフセット値を示す情報と、減衰レベルを変更する機能を定義する減衰変調タイプを示す情報であって、前記リスナ位置が前記第1の距離閾値の外側から前記第1のアコースティック環境と前記第2のアコースティック環境との境界まで移動したときに、前記減衰レベルを変更する機能を定義する減衰変調タイプを示す情報と、現在の音環境から目的地の音環境までのホップ数を示すホップ情報と、減衰量の最大値を示すパラメータ減衰量上限値を示す情報と、の少なくとも1つを得るようにすることができる。
第6の態様によれば、少なくとも1つのプロセッサと、コンピュータプログラムコードを含む少なくとも1つの記憶装置とを備える装置が提供され、少なくとも1つの記憶装置およびコンピュータプログラムコードは、少なくとも1つのプロセッサを用いて、装置に、少なくとも、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得させ、オーディオシーンは、第1アコースティック環境および第2の環境を備え、オーディオシーン内のリスナ位置に応じて、第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得させ、情報および第1距離閾値を符号化して出力させるように構成される。
装置は第1距離閾値に関連する第1の機能を取得することをさらにさせることができ、第1の機能は第1および第2アコースティック環境のうちの少なくとも1つの環境特性の調整を定義する。
オーディオシーン内のリスナ位置に応じて、第1および第2アコースティック環境間の適応レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するための装置は、第1距離閾値が適用可能なアコースティック環境の数を示す情報と、第1距離閾値が適用可能なアコースティック環境を示す情報と、第1距離閾値がどのアコースティック環境にあるかを示す情報と、第1距離閾値に対する距離値を示す情報と、第1距離閾値に関する距離値を示す情報と、第1距離閾値に関連付けられた形状またはプロファイルを示す情報と、ヒステリシス領域を定義するヒステリシスオフセット値を示す情報と、リスナ位置が第1距離閾値の外側から第1および第2アコースティック環境の間の境界まで移動するときの減衰レベルを修正するための機能を定義する減衰変調タイプを示す情報と、現在のアコースティック環境から目的のアコースティック環境へのホップの数を定義するホップを示す情報と、最大減衰レベルを定義するパラメータ減衰上限を示す情報と、のうちの少なくとも1つを取得することができる。
情報を符号化して出力させる装置は、符号化された情報と第1距離閾値とを備えるビットストリームを生成させることができる。
装置はオーディオシーンに関連付けられた少なくとも1つのオーディオ信号を取得することをさらにさせることができ、情報を符号化および出力することを引き起こされる装置は符号化された少なくとも1つのオーディオ信号を備えるビットストリームを生成することをさせることができる。
第7の態様によれば、オーディオシーンに関連する少なくとも第1のアコースティック装置の情報を取得するための手段であって、オーディオシーンが第1のアコースティック装置および第2のアコースティック装置を備える、手段と、オーディオシーン内のリスナ位置に応じて、第1のアコースティック装置と第2のアコースティック装置との間の適応的レンダリングを可能にするオーディオ移行領域を少なくとも部分的に定義する第1の距離閾値を取得するための手段と、第1のアコースティック装置および第2のアコースティック装置のうちの少なくとも1つの装置特性を調整するために、リスナ位置を決定するための手段と、前記第1及び第2のアコースティック環境の少なくとも一方の環境特性を前記リスナ位置に応じて調整する手段であって、前記環境特性が前記オーディオシーン内で適応的に制御される、手段と、を備える装置が提供される。
第8の態様によれば、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得するための手段であって、オーディオシーンが、第1アコースティック環境と第2の環境とを備える、手段と、オーディオシーン内のリスナ位置に応じて、第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ移行領域を少なくとも部分的に定義する第1の距離閾値を取得するための手段と、情報および第1の距離閾値を符号化および出力するための手段とを備える装置が提供される。
第9の態様によれば、装置に、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得するステップであって、オーディオシーンは第1アコースティック環境と第2アコースティック環境とを備える、ステップと、オーディオシーン内のリスナ位置に応じて、第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するステップと、第1アコースティック環境と第2アコースティック環境とのうちの少なくとも1つの環境特性を調整するために、リスニング位置を決定するステップと、および、リスニング位置に応じて、第1アコースティック環境と第2アコースティック環境とのうちの少なくとも1つの環境特性を調整するステップであって、環境特性は、オーディオシーン内で適応的に制御される、ステップとを少なくとも実行させるための命令[またはプログラム命令を備えるコンピュータ可読媒体]を備えるコンピュータプログラムが提供される。
第10の態様によれば、装置に、少なくとも、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得することであって、オーディオシーンが第1アコースティック環境および第2の環境を備える、取得するステップと、オーディオシーン内のリスニング位置に応じて第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するステップと、情報および第1距離閾値を符号化および出力するステップと、を実行させるための命令[またはプログラム命令を備えるコンピュータ可読媒体]を備えるコンピュータプログラムが提供される。
第11の態様によれば、装置に、少なくとも、オーディオシーンに関連付けられた少なくとも第1アコースティック環境の情報を取得するステップであって、前記オーディオシーンは、前記第1のアコースティック環境と前記第2のアコースティック環境とを含む、ステップと、オーディオシーン内のリスニング位置に応じて第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するステップと、第1アコースティック環境と第2アコースティック環境とのうちの少なくとも1つの環境特性を調整するためにリスニング位置を決定するステップと、リスニング位置に応じて第1アコースティック環境と第2アコースティック環境とのうちの少なくとも1つの環境特性を調整するステップであって、環境特性はオーディオシーン内で適応的に制御される、ステップと、を実行させるためのプログラム命令を備える非一時的コンピュータ可読媒体が提供される。
第12の態様によれば、装置に、少なくとも、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得するステップであって、オーディオシーンが第1アコースティック環境と第2の環境とを備える、ステップと、取得することオーディオシーン内のリスニング位置に応じて、第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するステップと、前記情報および前記第1距離閾値を符号化し、出力するステップと、を実行させるためのプログラム命令を備える非一時的コンピュータ可読媒体が提供される。
第13の態様によれば、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得するように構成された取得回路であって、前記オーディオシーンは前記第1アコースティック環境と第2アコースティック環境とを備える、取得回路と、前記オーディオシーンは前記オーディオシーン内のリスニング位置に応じて、前記第1アコースティック環境と前記第2アコースティック環境との間の適応レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に画定する第1距離閾値を取得するように構成された取得回路と、前記第1アコースティック環境と前記第2アコースティック環境とのうちの少なくとも1つの環境特性を調整するように前記リスニング位置を決定するように構成された決定回路と、前記リスニング位置に応じて、前記第1アコースティック環境と前記第2アコースティック環境とのうちの少なくとも1つの環境特性を調整する調整回路であって、該環境特性は、オーディオシーン内で適応的に制御される、調整回路と、を備える装置が提供される。
第14の態様によれば、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得するように構成された取得回路であって、オーディオシーンは、第1アコースティック環境と第2の環境とを備える、取得回路と、オーディオシーン内のリスニング位置に応じて、第1アコースティック環境と第2アコースティック環境との間の適応レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するように構成された取得回路と、情報および第1距離閾値を符号化および出力するように構成された符号化および出力回路とを備える装置が提供される。
第15の態様によれば、装置に、少なくとも、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得するステップであって、前記オーディオシーンは、前記第1のアコースティック環境と前記第2のアコースティック環境を含む、ステップと、
オーディオシーン内のリスニング位置に応じて第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するステップと、第1アコースティック環境と第2アコースティック環境とのうちの少なくとも1つの環境特性を調整するためにリスニング位置を決定するステップと、リスニング位置に応じて第1アコースティック環境と第2アコースティック環境とのうちの少なくとも1つの環境特性を調整するステップであって、環境特性は、オーディオシーン内で適応的に制御される、ステップと、を実行させるためのプログラム命令を備えるコンピュータ可読媒体が提供される。
第16の態様によれば、装置に、少なくとも、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得するステップであって、オーディオシーンは、第1アコースティック環境および第2の環境を備える、ステップと、オーディオシーン内のリスニング位置に応じて、第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するステップと、情報および第1距離閾値を符号化および出力するステップと、を実行させるためのプログラム命令を備えるコンピュータ可読媒体が提供される。
装置は、上述のような動作を実行するための手段を含む。
装置は、上記に記載の方法のアクションを実行するように構成される。
コンピュータプログラムは、上記の方法をコンピュータに実行させるためのプログラム命令を含む。
媒体上に記憶されたコンピュータプログラム製品は装置に、本明細書で説明する方法を実行させ得る。
電子デバイスは、本明細書で説明されるような装置を備え得る。
チップセットは、本明細書に記載の装置を備えてもよい。
本出願の実施形態は、最新技術に関連する課題に対処することを目的とする。
本出願をより良く理解するために、ここで、例として添付の図面を参照する。
図1は、いくつかの実施形態を実施することができる複数のアコースティック環境の例を概略的に示す。 図2は、いくつかの実施形態を実施することができるアコースティック環境間のアコースティックカップリングを有する複数のアコースティック環境の例を概略的に示す。 図3は、いくつかの実施形態を実施することができる例示的なシステムを概略的に示す。 図4aおよび4bは、いくつかの実施形態による、図3に示されるような装置の例示的システムの動作のフロー図を示す。 図4aおよび4bは、いくつかの実施形態による、図3に示されるような装置の例示的システムの動作のフロー図を示す。 図5は、隣接するアコースティック環境に対する後期残響のシームレスなアコースティック環境遷移処理を可能にする近接閾値を概略的に示す。 図6は、リスナがアコースティック環境間の境界から離れた近接閾値距離よりも小さい場合の、近接閾値距離と、隣接するアコースティック環境に対する後期残響の減衰の変化との間の例示的なマッピングを示す。 図7および図8は近接距離に応じて一定の減衰量を用いてレンダリングされ得る例示的な複数のアコースティック環境を示す。 図7および図8は近接距離に応じて一定の減衰量を用いてレンダリングされ得る例示的な複数のアコースティック環境を示す。 図9は、示される装置を実装するのに適した例示的なデバイスを概略的に示す。
上述のように、作成またはキャプチャされたオーディオシーンは、一連のアコースティック環境としてモデル化することができる。
各アコースティック環境について、個々のアコースティック環境の特性に応じた特性を有する別個の構成された残響器(例えば、残響をモデル化する遅延線の出力タップからの15個の無相関出力を有する)をモデル化することができる。
本明細書の実施形態で論じられる概念は、2つ以上のアコースティック環境間のシームレスな遷移を可能にする装置および方法が提供されるものである。各アコースティック環境に対する残響のモデリングはアコースティック特性、例えば、環境の物理的サイズに応じて、各アコースティック環境に対して異なるように実行することができる。
その結果、レンダラはアコースティック環境ごとに残響フィルタを個別に構成することができ、異なるアコースティック環境において異なる拡散遅延残響モデリングを生成する。
そのようなモデリングアプローチはリスナが2つのアコースティック環境間の境界を横切って移動するとき、急激な変化を作り出す。このような急激な変化と、アコースティック環境ごとの拡散後期残響の明確な差異は、不自然で気が散り、没入感を壊すような効果を生み出す。これは、あるアコースティック環境から別のアコースティック環境へ移行する際に、現実世界での経験や知覚がそれほど劇的でないことが一般的だからである。例えば、ホールと廊下を行き来する際にも、オーディオが急に変化して邪魔になるようなことはない。
したがって、本明細書に記載の実施形態では、リスニング体験をより信用できるようにする、滑らかで継ぎ目のない遷移を可能にするための装置および方法が提供される。
拡散後期残響はいくつかの実施形態ではアコースティック環境内のリスナ位置に本質的に無知であるが、その結果得られる残響レンダリングは、特殊な状況(アコースティック環境の境界付近など)において、より信憑性を高めるために修正される。
いくつかの実施形態では、したがって、この装置と方法は、アコースティック環境(AE)間のシームレスな移行を得ることに関連しており、2つのアコースティック環境間の知覚的にシームレスな遷移を有する結果的な遅延残響レンダリングを達成するように実行される、第2のアコースティック的に結合されたAEに近接するリスナ位置に応じて、第1のAEにおける遅延リバーベーションを修正するための機構が提供される。知覚的にシームレスな遷移は、いくつかの実施形態では、ビットストリーム内のオーディオシーンメタデータからのアコースティック環境エクステント情報を取得するステップ、ビットストリーム内のオーディオシーンメタデータ内の他のAEに対する近接閾値距離を取得するステップ、リスナの位置に応じたリスナの現在のアコースティック環境を決定するステップ、
現在のアコースティック環境を、残響の減衰量がゼロになるように設定するステップと、によって達成することができる。こうして、残響を最大のゲインレベルでレンダリングする。
他のAEとのリスナの近接度が、取得された近接閾値距離内にあるかどうかを決定する。
それぞれの近接閾値距離内のすべてのAEについて、遅延残響減衰量は、それぞれのAEについての近接閾値距離に(線形に)修正される。例えば、近接閾値距離が1mの場合、リスナが第2のAEから90cmの場合、第2のAE残響の減衰値は90%に設定される。
後期残響は、それらのそれぞれの判定された減衰値に従って、全てのAEについてレンダリングすることができる。
その後、すべての残響が合計され、結果として得られる後期残響が得られる。
いくつかの実施形態では、近接閾値が、RT60などのアコースティック環境パラメータ、アコースティック環境のサイズ、およびアコースティックカップリングのサイズ(たとえば、幅および高さ、幅、高さ、および長さなど)のうちの1つまたは複数の差に比例して生成される。
いくつかの実施形態では、リスナが隣接するアコースティック的に結合されたAEまでの近接閾値距離内にあるときの減衰値の変動が、オーディオシーンレンダリングビットストリーム内で定義されたタイプに従って変動することができる。変動のタイプは、線形、指数関数などであり得る。
いくつかのさらなる実施形態では、減衰量最大値が100%未満の値でさえあり得るようにシグナリングされる。これにより、特定のアコースティック環境は、時間、オーディオシーン全体に全く存在しなくなる。そのようなパラメータはポータルを介して残響ルーティングを具体的に組み込む必要なしに、シーン全体において特定のAEの遅延残響の音を拡散するための単純な方法であり得る。これは、連結されたアコースティック環境(例えば、AE間のアコースティックカップリングを有する複数のAEを含む)を有する複雑なシーンにおいて、有意な利益となり得る。
クロスフェードを伴うシームレスな遷移を実施するためのアコースティック遷移情報はAEにわたる後期残響遷移挙動を修正するために、ビットストリームを介してシグナリングされ得る。そのような信号は、いくつかの実施形態ではビットストリーム中の個々のパラメータまたは事前定義されたテーブルの信号インデックスを備えることができる。
いくつかの実施形態では、近接閾値がエリアまたはボリュームであり得る。
図1および図2に関して、例示的なオーディオシーンが示される。オーディオ場面は、ドア104領域と、第1アコースティック環境AE 100と、第2アコースティック環境AE 102と、を備える。第2アコースティック環境AE 102は、2つのオーディオソース、すなわち第1のオーディオソースS 105および第2のオーディオソースS 103と共に示されている。さらに、オーディオシーン内で自由に2回移動し、第2アコースティック環境AE 102内の第1の位置P 115、第1アコースティック環境AE 100内の第2の位置P 113、
およびリスナが屋外104にいるときの第3の位置P 111に示されるリスナが示される。
図1および図2に示されるオーディオ場面の違いは、第1アコースティック環境AE 100と第2アコースティック環境AE 102との間の既知のアコースティックカップリングAC 200の存在であり、第2アコースティック環境AE 102は、2つのAE間のオーディオの「自由である」やり取りを定義する。
各アコースティック環境は、モデル化され、指定されたアコースティック特性に従って後期残響を再現するように構成される。アコースティック特性は、RT60および拡散対方向比(DDR)などのパラメータを含む。DDRパラメータの値は、特定の計算アプローチに基づいて、またはコンテンツ作成者の意図として指定されるかのいずれかで割り当てることができる。
例えば、DDRを決定または計算するための公知の方法は、MPEG-I I Immersive Audio CfP Supplemental Information、Recommendations and Clarifications、Version1、N00083の第3.3項に記載されている。DDRは、3.9 EIF N00054項でも定義されている。
上述のように、オーディオシーンは、2つの活性オーディオ源S 105及びS 103を含むように示されている。加えて、アコースティック環境AE 100とAE 102とを接続するアコースティックカップリングAC(または開口部)により、オーディオエネルギは、AE 102からAE 100に移動することができる。
アコースティックカップリング情報の存在および詳細は、任意の適切な方法に基づいて取得または決定することができる。例えば、この情報は開口部を識別するために、全ての方向に光線の密集した設定を撮影する、ジオメトリ分析によって決定することができる。しかしながら、アコースティックカップリングの存在および程度を決定するための方法は、以下でさらに詳細には説明されない。本発明では、リスナが遷移することが予想されるアコースティックカップリングが、AE間のシームレスな遷移を提供するために特別なレンダリングを必要とするので、より重要である。
上述のように、リスナが2つのアコースティック環境間を遷移するときに、後期残響レンダリングにおけるシームレスな遷移を可能にすることが重要である。
図3および4に関して、いくつかの実施形態を実施するのに適した装置の模式図、および実施形態の流れ図が示される。したがって、シームレスな遷移後の残響の実施形態の実装は、そのため、6DoFオーディオシーンにおける妥当性およびその結果としての没入感を損ねるような急激な変化を避けることを目的としている。
図3に示されるように、仮想シーン定義パラメータおよびオーディオ信号の形成でコンテンツを取得し、オーディオ信号および仮想シーン定義パラメータを備える適切なビットストリーム/データファイルを提供するように構成された例示的な作成装置301がある。
図3に示されるようないくつかの実施形態では、作成装置301がエンコーダ入力フォーマット(EIF)データ生成器311を備える。エンコーダ入力フォーマット(EIF)データ生成部311は、コンテンツ作成者シーン記述であるEIF(Encoder Input Format)データを生成する。シーン記述情報は、オーディオ要素の位置などの仮想シーンジオメトリ情報を含む。さらに、シーン記述情報は、指向性およびサイズ、ならびに他のアコースティック的に関連する素子などの他の関連メタデータを備え得る。例えば、関連するメタデータは、仮想壁の位置と、それらのアコースティック特性と、オクルーダなどの他のアコースティック的に関連するオブジェクトとを含むことができる。アコースティック特性の例は、(周波数依存性の)吸収または反射係数、散乱エネルギーの量、または透過特性などのアコースティック材料特性である。いくつかの実施形態では、仮想アコースティック環境がその(周波数依存の)残響時間または拡散対直接音比に従って説明することができる。いくつかの実施形態におけるEIFデータジェネレータ311は、より一般的には仮想シーン情報ジェネレータとして知られ得る。仮想シーン記述は、いくつかの実施形態ではいくつかのアコースティック環境記述を含むことができる。いくつかの実施形態における仮想シーン残響パラメータは、オーディオ信号が初期レベルよりも60dB下に減衰するのに必要な時間を指定するプリディレイ、-60dB残響時間(RT60)、または、EIFで指定されたアコースティック環境説明の各々における総放射音のレベルに対する拡散残響のレベルを指定する拡散対直接比(DDR)などの残響キャラクタリゼーション情報に基づいて導出される。RT60およびDDRは、周波数に依存するプロパティである。EIFパラメータ312は、いくつかの実施形態では適切なビットストリームエンコーダ317に提供され得る。
本出願においてさらに詳細に説明されるように、後期残響および継ぎ目のない後期残響遷移ビットストリーム生成において使用されるパラメータのうちの1つは、近接閾値距離である。近接閾値距離は、リスナが隣接するARから残響を聞くことができる距離である。近接閾値距離はプログラム的に、またはコンテンツクリエータの創造的意図に基づいて、導出されてもよい。
いくつかの実施形態では、近接閾値距離が以下の式から導出され得る。
Figure 2023066402000002
上記の式ではDTHが電流AE(発信元AEとも呼ばれる)におけるリスナの近接距離閾値に対応し、リスナが(たとえば、ウォーキングまたはテポートによって)遷移している近隣AEは送信先AEと呼ばれる。RT60DおよびRT60Sは、宛先および送信元AEのRT60を表す。DDRD およびDDRSの値は、送信先およびソースAEのDDR値を表す。VDとVSは、宛先と送信元AE の容量を表す。K1、K2とK3は、シーンデータに応じてエンコーダで指定できる。上記は、近接距離を導出する一例に過ぎない。この距離は、手動チューニングによってコンテンツ作成者によって導出され、符号化されたビットストリームにおいて指定され得る。他の実施形態では、近接距離がレンダラ実装選択であってもよい。
いくつかの実施形態では、クリエータ装置301がオーディオコンテンツジェネレータ313を備える。オーディオコンテンツ発生剤313は、オーディオシーンに対応するオーディオコンテンツを生成するように構成される。いくつかの実施形態では、オーディオコンテンツ発生剤313が仮想シーンに関連付けられたオーディオ信号を生成するか、そうでなければ取得するように構成される。例えば、いくつかの実施形態では、これらのオーディオ信号が適切なマイクロフォンまたはマイクロフォンのアレイを使用して取得または捕捉されてもよく、処理された捕捉オーディオ信号に基づいてもよく、または合成されてもよい。いくつかの実施形態では、オーディオコンテンツジェネレータ313が、さらに、いくつかの実施形態では、仮想シーン内の位置または信号の指向性など、オーディオ信号に関連するオーディオパラメータを生成または取得するように構成される。オーディオ信号および/またはパラメータ312は、いくつかの実施形態では適切なオーディオエンコーダ315およびビットストリームエンコーダ317に提供され得る。
クリエータ装置301は、適切なオーディオエンコーダ315をさらに備えることができる。オーディオエンコーダ315はいくつかの実施形態ではオーディオ信号を使用し、ビットストリームエンコーダ317に渡されるエンコーダオーディオを生成するように構成される。
いくつかの実施形態では、クリエータ装置301がビットストリームエンコーダ317を備える。ビットストリームエンコーダ317はEIFパラメータ312および符号化オーディオ信号/パラメータを受信し、この情報に基づいて適切な符号化ビットストリームを生成するように構成される。これは、例えば、MPEG-I 6DoFオーディオビットストリームであり得る。いくつかの実施形態では、ビットストリームエンコーダ317が専用の符号化デバイスとすることができる。ビットストリームエンコーダ317の出力は、配信または記憶装置303に渡すことができる。MPEG-I 6DoFオーディオビットストリーム内のオーディオ信号は、一実施形態では、「ISO/IEC 23008-3:2018 High efficiency coding and media delivery in heterogenous environments - Part 3: 3D audio」において記載されるMPEG-H 3Dフォーマットで符号化されることができる。本明細書は、オーディオオブジェクト、チャネル、および高次アンビソニクスのための適切な符号化方法を説明する。本明細書の低複雑度(LC)プロファイルは、オーディオ信号を符号化するために特に有用であり得る。
いくつかの実施形態では、遅延残響レンダリングメタデータに組み込むことができるビットストリームシンタックスが以下の例である。
Figure 2023066402000003
AcousticEnvironmentTransitionStruct()に関して、num_AcousticEnvironmentsパラメータは、リスナがアコースティックカップリングを介して通過することができるAEの数を提供するように構成される。含まれるAEは、隣接する隣接オブジェクトのみに限定されず、隣接する隣接オブジェクトにアコースティック的に結合されるAEにも限定され得る。
current_acousticEnvironment_IDパラメータは、電流AEの環境IDを提供する。これは、AcousticEnvironmentTransitionStruct()がLateReverbStruct()内で配信される場合は存在しない可能性がある。
destination_acousticEnvironment_IDは、リスナが通過できる送信先AEの環境IDを提供するように構成することができる。移行は、単純歩行またはテレポーテーションのいずれかによって起こり得る。
さらに、proximity_threshold_distanceパラメータは、リスナがAE間の境界の近くにいるときに、近隣からの後期残響の継ぎ目のない遷移を開始するための距離(ミリメートル単位)を識別するように構成される。

パラメータnum_hopsは、電流AEから送信先AEへのホップ数を定義することができる。
直近の場合、ホップサイズは1である。さらに、リスナがAE間の境界の近くにいるとき、近隣からの後期残響の継ぎ目のない遷移を開始するための値距離(ミリメートル)。
さらに、パラメータhysteresis_offsetは、リスナがオーディオシーン内の他のAEに対してproximity_threshold_distanceよりも短い距離を有する後に、proximity_threshold_distanceに追加される距離(ミリメートル単位)である。この値は、ユーザがproximity_threshold_distance境界でわずかな量だけ前後に移動した場合の不自然な動作を防ぐために追加される。他の実施形態では、ヒステリシス_オフセットが1~100の範囲のパーセンテージポイントとして指定することができる。
いくつかの実施形態におけるattenuation_modulation_typeは、リスナが近接閾値距離の外側から境界まで移動するときに、100から0に減衰レベルを修正するための方法を識別する。値は例えば、使用される曲線のタイプ、線形、指数等を示すことができる。
パラメータattenuation_upperbound_indexは、最大減衰レベルである。0の屈折率値は、最大減衰レベルが100%であることを示す。1より大きい指数の値の場合、最大減衰は95%、90%などに制限される。
上記のシームレスな遷移データ構造は、いくつかの実施形態では以下に説明する方法でLateReverbStruct()に埋め込むことができる。
Figure 2023066402000004
Figure 2023066402000005
LateReverbStruct()の構造のいくつかの実施形態では、パラメータnumberOfSpatialPositionsが遅延残響ペイロードの遅延ライン位置の数を定義する。この値は、特定の数の遅延線に対応するインデックスを使用して定義される。
ビット列「0b00」の値は、遅延線のための15の空間方向の値にレンダラをシグナリングする。
他の3つの値「0b01」、「0b10」、「0b11」は予約済みである。
いくつかの実施形態では、方位パラメータがリスナに対する遅延線の方位を定義する。
範囲は-180~180度である。
パラメータ仰角は、リスナに対する遅延線の仰角を定義する仰角を識別することができる。
範囲は-90~90度である。
パラメータnumberOfAcousticEnvironmentsは、オーディオシーンのアコースティック可境の数を定義する。いくつかの実施形態におけるLateReverbStruct()は、その時点でオーディオシーンに存在する1つまたは複数のアコースティック環境に関する情報を搬送する。
さらに、パラメータenvironmentIdは、アコースティック環境の一意の識別子を定義する。
delayLineLength値は、減衰フィルタの設定に使用されるグラフィックイコライザ(GEQ)フィルタのサンプル単位の長さを定義する。
同じアコースティック環境に対応する異なる遅延線の長さは、互いに素である。
構造filterParamsStruct()は、いくつかの実施形態では遅延線のための減衰フィルタを構成するためのグラフィックイコライザカスケードフィルタを記述することができる。同じ構造が拡散-直接残響比のためのフィルタを構成するために、その後に使用される。
filterParamsStruct()SOSLengthパラメータは、2次セクションフィルタ係数の各々の長さである。b1、b2、a1、a2の値はフィルタ係数b1、b2、a1、a2である。
さらに、globalGainパラメータは、GEQのゲイン係数をデシベルで指定することができる。
levelDB値は、ディレイラインごとのサウンドレベルをデシベル単位で指定する。
別の実装形態では、パラメータfadeInDistanceおよびシームレス遷移有効化フラグがレンダラ設定に存在し得る。他の実施形態では、これらは以下のようにビットストリームに含まれ得る。
Figure 2023066402000006
「fadeInDistance」はクロスフェードを有効にする近接距離の閾値で、「enabled」フィールドは特定のAEに対してこのクロスフェード機能を有効/無効にするフラグである。
AEパラメータを選択または生成する方法は、図4aの流れ図に関して示すことができる。
したがって、例えば、ステップ451によって、図4aに示されるような全てのAEのリストが得られる。
次いで、ステップ453によって、図4aに示されるように、AE間のアコースティックカップリングが決定/取得または受信される。
次いで、ステップ455によって、図4aに示されるように、AEのうちの1つに関するオーディオシーンにおける許容可能なAE遷移の各セットのパラメータが取得される
(さらに、いくつかの実施形態では、AEのうちの1つが「電流AE」として設定される)。
ステップ457によって、図4aに示されるように、電流AEに対する他のAEのための近接閾値が決定される。
次に、ステップ459によって、図4aに示すように、特定の電流AEと他のAEとの間のシームレスな遷移を可能にするために、電流AEの後期残響ペイロードパラメータに近接閾値距離が挿入される。
次いで、ステップ461によって、電流AEに対するすべてのアコースティック的に結合されたAEについて、この手法が繰り返され、図4aに示される。
反復ループにおいて、近接閾値距離はステップ463によって、図4aに示されるように、他のすべてのアコースティック的に結合されたAEに関して、各AEについて決定される。
さらに、図3に示される装置のシステムは、(任意の)格納/配信装置303を備える。
格納/配信装置303は、(パラメータおよびオーディオ信号を含む)符号化ビットストリーム316を作成装置301から取得し、これらを適切な再生装置305に格納および/または配信するように構成される。いくつかの実施形態では、格納/配信装置303の機能がクリエータ装置301内に統合される。
いくつかの実施形態では、ビットストリームが任意の所望の配信フォーマットを有するネットワークを介して配信される。いくつかの実施形態で採用され得る例示的な配信フォーマットは、DASH(Dynamic Adaptive Streaming over HTTP)、CMAF(Common Media Application Format)、HLS(HTP live streaming)などの任意の適切なアプローチでも可能である。
いくつかの実施形態ではこの例ではさらに詳細に説明しないが、オーディオ信号は別個のデータストリームで符号化パラメータに送信される。
いくつかの実施形態では、記憶/配信装置303が符号化されたオーディオおよびパラメータを取得し、記憶するように構成されたビットストリーム記憶装置321を備える。
さらに、いくつかの実施形態では、格納/配信装置303が符号化されたビットストリーム(符号化されたオーディオおよびパラメータ)を配信するように構成されたコンテンツセレクタ/供給者323を備える。いくつかの実施形態では、コンテンツセレクタ/サプライヤが図3に示されるように、リスナ位置情報に基づいて、符号化されたパラメータおよびオーディオデータ324の形態でメタデータを供給するように構成される。
図3に示される装置のシステムは、再生装置305をさらに備える。再生装置305は記憶/配信装置303から、符号化されたパラメータおよび(リスナ位置に基づく)符号化されたオーディオ信号324を取得するように構成される。加えて、いくつかの実施形態では、再生装置305が(物理的な聴取空間に関連する)センサデータ330を取得するように構成され、例えば、図3に示されるように、ヘッドマウントデバイスHMD307(いくつかの実施形態ではセンサおよびヘッドホンを備えることができる)ユーザに提供される適切な1つまたは複数のレンダリングされたオーディオ信号334を生成するように構成される。センサは例えば、リスナが位置する物理的空間、又はリスナの位置及び/又は向きを決定することができる。
再生装置305は、いくつかの実施形態では(パラメータおよびオーディオデータを含む)ビットストリーム324を受信するように構成された(MPEG-I 6DoF)プレーヤ321を備える。プレーヤ321は、いくつかの実施形態では、ARレンダリングの場合、装置はまた、リスニング空間の物理的特性を得るために、AR感知モジュールを備えることが期待される。
6DoFビットストリーム(パラメータおよびオーディオ信号を含む)のみで、VRシナリオにおけるレンダリングを実行するのに十分である。すなわち、VRシナリオでは、
必要なアコースティック情報がビットストリームで搬送され、材料および残響パラメータなどの仮想アコースティック特性に従って、シーン内の異なる仮想位置でオーディオシーンをレンダリングするのに十分である。
ARシナリオの場合、レンダラはレンダリング中に、例えばLSDFフォーマットでレンダラに提供されるARセンシングを使用してリスナ空間情報を取得することができる。これは、リスナの物理的空間反射要素(壁、カーテン、窓、部屋間の開口など)などの情報を提供する。
したがって、例えば、いくつかの実施形態では、ユーザまたはリスナが適切なヘッドマウントデバイス(HMD)207を操作(または装着)している。HMDは、再生装置305に渡すことができる適切なセンサデータ330を生成するように構成されたセンサを装備することができる。
再生装置305(およびMPEG-I 6DoFプレーヤ321)はさらに、いくつかの実施形態では、ARセンサアナライザ331を備える。ARセンサ分析器331は、物理的空間情報を(HMD感知データまたはその他から)生成するように構成される。これは、例えば、LSDFパラメータフォーマットと、適切なレンダラ333に渡される関連するLSDFパラメータとであり得る。
いくつかの実施形態では、再生装置305(およびMPEG-I 6DoFプレーヤ321)がコンテンツセレクタ342をさらに備える。いくつかの実施形態におけるコンテンツセレクタ342は、コンテンツセレクタ/供給者323がリスナ位置に基づいてオーディオおよびパラメータを提供することができるように、リスナ位置および/または向きを取得し、この情報をコンテンツセレクタ/供給者323に渡すように構成される。
再生装置305(およびMPEG-I 6DoFプレーヤ321)は、さらに、いくつかの実施形態では、仮想空間パラメータ、オーディオ信号(およびいくつかの実施形態では物理リスニング空間パラメータ)を受信し、図3に示されるようにHMD307に出力される適切な空間オーディオ信号を、たとえばヘッドホンによって出力されるバイノーラルオーディオ信号として生成するように構成されたレンダラ333を備える。
いくつかの実施形態では、レンダラ333がジオメトリチェッカ334を備える。幾何学チェッカ334はいくつかの実施形態ではリスナ位置を決定または取得するように構成され、さらに、リスナ位置がアコースティック環境のうちの1つにリスナを位置付けているかどうか、およびそのような場合、どのアコースティック環境にあるかをチェックするように構成されたリスナ位置に基づく。このアコースティック環境は、電流AEとして決定することができる。
ジオメトリチェッカ334はさらに、リスナ位置に基づいて、リスナ位置が近隣AEの近傍内にあるかどうかを決定するための幾何学的チェックを実行するように構成することができ、近接閾値は、6DoFレンダリングバイストリーム中の受信された遅延残響レンダリングメタデータから取得される。
いくつかの実施形態では、レンダラ333が電流AE残響器336を備える。電流AE残響器336は電流AEに関連付けられた残響器であり、任意の適切な方法に従って実装することができる。例えば、いくつかの実施形態では、残響器336が可変利得フィードバックループまたは可変利得フィードフォワードループを有する遅延線として実装される。
いくつかの実施形態では、レンダラ333が送信先AE残響器338を備える。送信先AE残響器338は送信先AEに関連付けられた残響器であり、任意の適切な方式に従って実装され得る。例えば、いくつかの実施形態では、残響器338が可変利得フィードバックループまたは可変利得フィードフォワードループを有する遅延線として実装される。いくつかの実施形態では、電流および送信先残響音に寄与する他のAEが存在し得る。そのようなAEは、電流および送信先AE遅延残響レンダリングのためのレンダリングに含まれることが暗黙的であると考えられる。
いくつかの実施形態では、レンダラ333が遅延残響ミキサ332を備える。後期残響ミキサは電流及び送信先の後期レンダラからの後期残響器からの出力を取得し、それらを組み合わせて、組み合わせられたレンダリング出力を生成するように構成される。
したがって、一般に、シームレス遷移は、以下の方法で実施される。リスナが特定のAEエクステント境界内にあることが分かった場合、リスナはそのAE内にあるように設定される。例えば、リスナは、AEおよびAEのアコースティックエンバイロメントを含む場面について、リスナがAEの境界内にある場合、AE内にあるように設定される。続いて、レンダラがリスナがAE内にあるが、AE、AE減衰までの近接閾値距離からさらに離れていることに気付いた場合、シームレストランジションハンドリングのために、AE減衰は0に設定され、100に設定される。これは、リスナが遷移ゾーンからかなり遠いためである。続いて、リスナがAEへの近接閾値距離未満であるがリスナ位置がAE内にあり続けるように、AEの減衰量を0に、AEの減衰量を近接距離(近接閾値以下)に応じてレンダリングさせるシームレスな遷移機構が有効である。このように、減衰量0のAEの後期残響と減衰量100未満0以上のAEの後期残響を合計した残響をシームレスにトランジションレンダリングすることになる。これは、リスナがAEとAEの境界に移動するまで続く。この時点で、アッテネーションはAE とAEに対して0になる。
いくつかの実施形態(上記の実装形態をさらに詳細に説明する)に関してレンダラで実行される動作を、図4bのフロー図に示す。
したがって、ステップ401によって、図4bに示すように、オーディオシーン内のすべてのAEに関する情報が取得される。いくつかの実施形態では、この情報が現在消費されている6DoFオーディオシーンに対応するビットストリーム内の6DoFメタデータの形態で取得される。したがって、情報は、オーディオシーン内の1つまたは複数のAEのための情報を備える。いくつかの実施形態では、オーディオシーンが2つ以上のAEを含む。さらに、いくつかの実施形態では、オーディオシーンがリスナがアコースティック環境にわたって遷移することができる、AE間のアコースティックカップリングをさらに含む。さらに、後期残響レンダリングパラメータは、オーディオシーン内の1つまたは複数のAEについて取得される。
オーディオシーンのすべてのAEの減衰レベルは、フルまたは100%に設定される。言い換えれば、ステップ403によって、図4bに示されるように、すべてのAEのためのすべての後期残響レンダリングが、音を生成しないように設定される。
次いで、ステップ405によって、図4bに示されるように、リスナが存在するAEを識別するために、オーディオシーン内のリスナの現在位置に基づいて幾何学的チェックが実行される。
リスナが存在すると判定されたAEについては、ステップ407によって、図4bに示されるように、減衰レベルが0に設定される。
したがって、電流AE遅延残響はステップ409によって、図4bに示されるように、フルボリュームに設定される。
次のステップでは、レンダラが、シーン消費中にリスナがAE境界を通って遷移することを可能にすると決定された他のAE(たとえば、近隣AE)の各々についてリスナ近接閾値を取得または検索するように構成することができる。近接閾値の取得は、ステップ411によって図4bに示される。
近接閾値の例を図5に示す。この例では第1および第2のアコースティックエンバイロメントをAE 500およびAE 510として示す。アコースティック環境間には、アコースティックカップリング520がある。さらに、AE内の近接閾値DTH-AE-AE 501が示され、AEと関連付けられる。近接閾値DTH-AE-AE 501は、AR1内の音波結合520から離れた位置505に配置される。さらに、AE内に近接閾値DTH-AE-AE 503が示され、AEと関連付けられる。
近接閾値DTH-AE-AE 503は、AE 510内の音波結合520からさらに離れた位置507に配置される。近接閾値は、シームレス遷移処理閾値マーカ511を定義する。
ステップ413によって図4に示されるように、リスナに対する隣人AEの近接度について、近接閾値が6DoFレンダリングバイストリーム内の受信された遅延残響レンダリングメタデータから取得される、
前記幾何学的検査で前記近傍AEを決定する(proximity)ことに基づいて、少なくとも1つの近傍AEを決定する場合、図4にステップ413で示すように、さらなる幾何学的なチェックが行われる。いくつかの実施形態における減衰は、近隣AEへのリスナの近接度に従って変調または修正される。
いくつかの実施形態では、リスナ距離が他のAEに対する近接閾値よりも大きい場合、減衰量が100に設定されるように、減衰量変調または修正が線形に実行される。一方、リスナが他のAEから0距離にある場合、減衰量は0に設定される。
この初期リニア設定は、ステップ415によって図4bに示される。
0と100との間の変動は、任意の適切なマッピングまたは関数に基づいて制御することができる。さらに、いくつかの実施形態では、このマッピングまたは関数が、変動が線形、指数関数的などであるかどうかを指定する、ビットストリームから配信されるパラメータに基づいて決定される。ゲイン値に適用される修正またはマッピング関数は、ステップ417によって図4bに示される。
図6を参照すると、例示的な線形マッピング600および非線形マッピング610が示されている。したがって、線形マッピング607の例に関して示されるように、0%から100%までの減衰601は、0の距離から他のAE 603からの近接閾値距離605まで変化する。0%から100%までの減衰量611が、0の距離から他のAE 613からの近接閾値距離615まで変化する、例示的なリニア(または指数関数的)マッピング617も示されている。
次に、利得を設定すると、ステップ419によって、図4bに示すように、それぞれの減衰値に従ってAEがレンダリングされる。
残響レンダリング部分を生成すると、ステップ421によって、図4bに示されるように、すべてのAE部分が合計される。
次に、ステップ423によって、図4bに示すように、レンダリングが出力される。
オーディオシーン内の2つを超えるAEの場合、複数のAE間にアコースティックカップリングが存在し得ることに留意されたい。例えば、図7に示すように、AE 700とAE 710との間に第1のアコースティックカップリングAC 702があり、
AE 710とAE 720との間に第2のアコースティックカップリングAC 712がある、第1、第2、および第3のアコースティック環境AE 700、AE 710、およびAE 720が示されている。さらに、AE 700内の第1の近接閾値DTH-AE-AE 701と、AE 700内に位置するAEおよび第2の近接閾値DTH-AE-AE 703とが示されており、AEと関連付けられている。
そのようなケースでは、近接閾値がAE 710およびAE 720に対応するAE 700内のリスナL 705に適用される。先の例と異なる点は、AEからAEへの移行時にAEの減衰量が0にならないことである。リスナがAEとの境目にいるときに、後期残響のAE減衰量が0になるからである。この手法の利点はAEをAE2に供給し、次いでAEをAEに混合する必要がないことである。
したがって、そのような実施形態は遅延残響レンダリング出力を実行する前に、カスケード結合AEを供給することによって誘発される全体的な処理遅延を低減する。
さらに、このアプローチは、4つのAEを含むオーディオシーンに対して、図8に示されるような他のジオメトリに適用することができる。この実例では、第1、第2、第3、および第4のアコースティック環境AE 800、AE 810、AE 820、およびAE 830が示されており、ここで、AE 800とAE 810との間に第1のアコースティックカップリングAC 802があり、AE 810とAE 820との間に第2のアコースティックカップリングAC 812があり、AE 800とAE 830との間に第3のアコースティックカップリングAC 822がある。さらに、AE 800内の、AEに関連する第1の近接閾値DTH-AE-AE 801と、AE 800内にも位置し、AEに関連する第2の近接閾値DTH-AE-AE 811と、AE 800内にも位置し、AEに関連する第3の近接閾値DTH-AE-AE 821とが示されている。
そのような場合、ジオメトリチェックは、関連する遷移に向かうリスナの動きを識別するように構成される。例えば、AE->AEと比較した遷移AE->AEは、アッテネーションフィルタの様々な選択をもたらす。
したがって、ジオメトリチェックがAE->AE推移からの推移を決定するように構成されるいくつかの実施形態では、AEはまた、AEに加えてAEからAEへのシームレスな推移を可能にするために、リスナからAEへの接近中にレンダリングされ得る。ただし、AEの近接閾値はAE内のリスナ位置まで拡張する必要がある。
同様に、リスナがAE->AEから遷移するいくつかの実施形態では、AEのみがレンダリングされ、近接閾値内のシームレスな遷移をAEに可能にする。
いくつかの実施形態では、近接距離閾値が近接領域として実装され得る(領域がエリアまたはボリュームによって指定され得る)。領域またはボリュームは、プリミティブとすることができる。いくつかの実装形態では、近接容積はまた、メッシュによって指定され得る。
さらに、本明細書で論じるように、ARアプリケーション内の没入型オーディオのための実用的なレンダリングを提供する装置および可能な機構がある。
本明細書で説明する実施形態は、リスニング空間特性と仮想シーンレンダリングパラメータとを組み合わせて、シーン特性に関係なく適切なオーディオ性能を提供する融合レンダリングを取得する。
いくつかの実施形態で説明される融合(または組み合わせ)は、オーラライゼーションは、レンダリングがAR用であるかVR用であるかを認識しないように実装される。言い換えれば、本明細書で説明する実施形態は、AR、VR(および複合現実(MR))を実行するのに適したシステム内で実装され得る。そのような機構は、ARレンダリングが多くの異なる聴覚化実装を用いて展開可能であることを可能にする。
いくつかの実施形態では、本明細書で説明される装置および可能な機構が、6自由度
(すなわち、リスナまたはリスニング位置がシーン内で移動することができ、リスナ位置が追跡される)を有するシステム内でオーディオのバイノーラルレンダリングを実施することができる。
このような実施形態では、仮想シーン記述とレンダリング中に得られたリスナの物理空間の記述とからなるビットストリームで指定されたオーディオシーンからの情報を使用して、仮想空間と物理空間に不可知な可聴化を可能にし、物理空間内で高品質の没入感をもたらす統一シーン表現を得る装置および方法が提案される。
図9に関して、上に示される装置のいずれかを表し得る例示的な電子デバイス(例えば、コンピュータ1 511、コンピュータ2 521、またはコンピュータ3 531)。デバイスは、任意の適切な電子デバイスまたは装置であってもよい。例えば、いくつかの実施形態では、デバイス1400がモバイルデバイス、ユーザ機器、タブレットコンピュータ、コンピュータ、オーディオ再生装置などである。
いくつかの実施形態では、デバイス1400が少なくとも1つのプロセッサまたは中央処理装置1407を備える。プロセッサ1407は、本明細書で説明されるような方法などの様々なプログラムコードを実行するように構成することができる。
いくつかの実施形態では、装置1400が記憶装置1411を備える。いくつかの実施形態では、少なくとも1つのプロセッサ1407が記憶装置1411に結合される。記憶装置1411は、任意の適切な記憶手段とすることができる。いくつかの実施形態では、記憶装置1411がプロセッサ1407上で実施可能なプログラムコードを記憶するためのプログラムコードセクションを備える。さらに、いくつかの実施形態では、記憶装置1411が、データ、たとえば、本明細書で説明する実施形態に従って処理された、または処理されるべきデータを記憶するための記憶データセクションをさらに備えることができる。プログラムコードセクション内に記憶された実施されたプログラムコードおよび記憶されたデータセクション内に記憶されたデータは、必要に応じて、メモリ-プロセッサ結合を介してプロセッサ1407によって取り出すことができる。
いくつかの実施形態では、装置1400がユーザインターフェース1405を備える。
ユーザインターフェース1405は、いくつかの実施形態ではプロセッサ1407に結合され得る。
いくつかの実施形態では、プロセッサ1407がユーザインターフェース1405の動作を制御し、ユーザインターフェース1405から入力を受信することができる。いくつかの実施形態では、ユーザインターフェース1405がユーザが、例えばキーパッドを介して、デバイス1400にコマンドを入力することを可能にすることができる。いくつかの実施形態では、ユーザインターフェース1405がユーザが装置1400から情報を取得することを可能にすることができる。例えば、ユーザインターフェース1405は、装置1400からの情報をユーザに表示するように構成されたディスプレイを備えてもよい。ユーザインターフェース1405は、いくつかの実施形態では、情報がデバイス1400に入力されることを可能にすることと、デバイス1400のユーザに情報をさらに表示することとの両方が可能なタッチスクリーンまたはタッチインターフェースを備えることができる。いくつかの実施形態では、ユーザインターフェース1405が本明細書で説明されるように、位置決定器と通信するためのユーザインターフェースであり得る。
いくつかの実施形態では、装置1400が入力/出力ポート1409を備える。いくつかの実施形態では、入力/出力ポート1409がトランシーバを備える。そのような実施形態におけるトランシーバは、プロセッサ1407に結合され、例えば、無線通信ネットワークを介して、他の装置または電子デバイスとの通信を可能にするように構成することができる。トランシーバまたは任意の好適なトランシーバまたは送信機および/または受信機手段は、いくつかの実施形態では有線または有線結合を介して他の電子機器または機器と通信するように構成することができる。
トランシーバは、任意の適切な既知の通信プロトコルによって、さらなる装置と通信することができる。例えば、いくつかの実施形態では、トランシーバが、適切なユニバーサルモバイルテレコミュニケーションシステム(UMTS)プロトコル、例えばIEEE802.Xなどのワイヤレスローカルエリアネットワーク(WLAN)プロトコル、Bluetooth(登録商標)などの適切な短距離無線周波数通信プロトコル、または、赤外線データ通信経路(IRDA)を使用することができる。
トランシーバ入力/出力ポート1409は、信号を受信するように構成することができ、
いくつかの実施形態では、適切なコードを実行するプロセッサ1407を使用することによって、本明細書で説明するようにパラメータを決定する。
また、本明細書では、上記で例示的な実施形態を説明したが、本発明の技術的範囲から逸脱することなく、開示された溶液に対して行うことができるいくつかの変形形態および修正形態があることに留意されたい。
一般に、様々な態様は、ハードウェアまたは専用回路、ソフトウェア、ロジック、またはそれらの任意の組合せで実装され得る。本開示のいくつかの態様は、ハードウェアで実装され得、他の態様はコントローラ、マイクロプロセッサ、または他の計算装置によって実行され得るファームウェアまたはソフトウェアで実装され得るが、本開示はそれらに限定されない。本開示の様々な態様はブロック図、フローチャートとして、または何らかの他の図表現を使用して図示および目的され得るが、本明細書で目的するこれらのブロック、装置、システム、技術または方法は、非限定的な例として、ハードウェア、ソフトウェア、ファームウェア、専用回路または論理、汎用ハードウェアもしくはコントローラ、または他の計算装置、あるいはそれらの何らかの組合せで実装され得ることが十分に理解される。
本出願で使用される場合、「回路」という用語は、以下のうちの1つまたは複数またはすべてを指し得る。
(a)ハードウェアのみの回路実装(アナログおよび/またはデジタル回路のみの実装など)および
(b)(該当する場合)などのハードウェア回路とソフトウェアの組み合わせ、
(i)アナログおよび/またはデジタルハードウェア回路とソフトウェア/ファームウェアとの組み合わせ、および、
(ii)(デジタル信号プロセッサを含む)ソフトウェア、ソフトウェア、および記憶装置を有するハードウェアプロセッサの任意の部分は、
携帯電話またはサーバなどの装置に様々な機能を実行させるように協働し、
(c)マイクロプロセッサやマイクロプロセッサの一部など、動作にソフトウェア(例:ファームウェア)を必要とするハードウェア回路やプロセッサ、動作のために必要とされないときにはソフトウェアは存在しなくてもよい。
回路のこの定義は、任意の特許請求の範囲を含む、本出願におけるこの用語の全ての使用に適用される。さらなる例として、本出願で使用されるように、回路という用語は、単にハードウェア回路もしくはプロセッサ(または複数のプロセッサ)、またはハードウェア回路もしくはプロセッサの一部、およびそれ(またはそれらの)付随するソフトウェアおよび/またはファームウェアの実装も包含する。
回路という用語は例えば、特定の請求項要素に適用可能な場合、サーバ、セルラーネットワークデバイス、または他のコンピューティングもしくはネットワークデバイスにおけるモバイルデバイスまたは同様の集積回路のためのベースバンド集積回路またはプロセッサ集積回路も包含する。
本開示の実施形態は、プロセッサエンティティ内などのモバイルデバイスのデータプロセッサによって、またはハードウェアによって、またはソフトウェアとハードウェアとの組合せによって実行可能なコンピュータソフトウェアによって実装され得る。ソフトウェアルーチン、アプレット、および/またはマクロを含む、プログラム製品とも呼ばれるコンピュータソフトウェアまたはプログラムは、任意の装置可読データ記憶媒体に記憶され得、それらは特定のタスクを実行するためのプログラム命令を備える。コンピュータプログラム製品はプログラムが実行されるとき、実施形態を実行するように構成される、1つまたは複数のコンピュータ実行可能構成要素を備え得る。1つまたは複数のコンピュータ実行可能コンポーネントは、少なくとも1つのソフトウェアコードまたはその一部であってもよい。
さらに、この点に関して、図のような論理フローの任意のブロックは、プログラムステップ、または相互接続された論理回路、ブロックおよび機能、またはプログラムステップと論理回路、ブロックおよび機能の組合せを表し得ることに留意されたい。ソフトウェアは、メモリチップなどの物理的媒体、またはプロセッサ内に実装されたメモリブロック、ハードディスクまたはフロッピーディスクなどの磁気媒体、およびたとえばDVDおよびそのデータ変異体CDなどの光媒体に記憶され得る。物理媒体は、非一時的な媒体である。
メモリはローカル技術環境に適した任意のタイプのものとすることができ、半導体ベースの記憶装置、磁気記憶装置およびシステム、光記憶装置およびシステム、固定メモリおよび取り外し可能メモリなどの任意の適切なデータ記憶技術を使用して実装することができる。データプロセッサは、ローカル技術環境に適した任意のタイプであってもよく、非限定的な例として、汎用コンピュータ、専用コンピュータ、マイクロプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、FPGA、ゲートレベル回路、およびマルチコアプロセッサアーキテクチャに基づくプロセッサのうちの1つまたは複数を備えてもよい。
本開示の実施形態は、集積回路モジュールなどの様々な部品において実施され得る。集積回路の設計は、大規模で高度に自動化された処理によるものである。論理レベル設計を、エッチングされて半導体基板上に形成される準備ができた半導体回路設計に変換するために、複雑で強力なソフトウェアツールが利用可能である。
本開示の様々な実施形態のために求められる保護の範囲は、独立請求項によって示される。本明細書に記載され、独立請求項の技術的範囲に含まれない実施形態および特徴は、本開示の様々な実施形態を理解するのに有用な例として解釈されるべきである。
前述の説明は、非限定的な例として、本開示の例示的な実施形態の完全かつ有益な説明を提供した。しかしながら、添付の図面および付随の請求項を熟読する際に、前述の説明を考慮して、種々の修正および適合が、当業者に明白になるのであろう。しかしながら、本開示の教示のすべてのそのようなおよび同様の修正は、添付の特許請求の範囲に定義される本発明の範囲内に依然として含まれる。実際、1つ以上の実施形態と、先に論じた他の実施形態のいずれかとの組み合わせを含むさらなる実施形態がある。

Claims (19)

  1. 少なくとも2つのアコースティック環境の間のオーディオ遷移を可能にするための装置であって、前記装置は、オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得し、ここで、該オーディオシーンは、第1アコースティック環境と第2アコースティック環境とを備え、前記オーディオシーン内のリスニング位置に応じて前記第1および第2アコースティック環境間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得し、前記第1および第2アコースティック環境のうちの少なくとも1つの前記環境特性を調整するためにリスニング位置を決定し、前記オーディオシーン内で適応的に制御されるようにする前記リスニング位置に応じて前記第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整する、ように構成される手段を備える、装置。
  2. 前記手段は、前記オーディオシーンに関連する少なくとも第1アコースティック環境の情報を取得するように構成され、ここで、前記オーディオシーンは前記第1アコースティック環境を含み、第2アコースティック環境は、前記オーディオシーンに関連する少なくとも前記第1アコースティック環境の情報を含むビットストリームを受信するように構成される、請求項1に記載の装置。
  3. 前記ビットストリームは前記第1距離閾値をさらに備え、前記第1距離閾値を取得するように構成された前記手段は、前記ビットストリームから前記第1距離閾値を取得するように構成される、請求項2に装置の方法。
  4. 前記第1アコースティック環境と前記第2アコースティック環境とは、前記第1アコースティック環境と前記第2アコースティック環境との間の境界に位置する第1のアコースティックカップリングによって結合される、請求項1ないし3のいずれか1項に記載の装置。
  5. 前記オーディオ遷移領域を少なくとも部分的に画定する前記第1距離閾値は、
    前記第1アコースティック環境内に位置し、前記第2アコースティック環境と関連付けられる、請求項1ないし4のいずれか1項に記載の装置。
  6. 前記リスニング位置に応じて、前記第1および第2アコースティック環境のうちの少なくとも1つの前記環境特性を調整するように構成された前記手段は、前記リスナ位置がオーディオ遷移領域内にあることを決定し、前記第1距離閾値に対するリスニング位置、および、前記第1アコースティック環境と前記第2アコースティック環境との間の境界に基づいて、第1アコースティック環境の第1の残響利得パラメータ、または、第2アコースティック環境の第の残響利得パラメータのうちの少なくとも1つを調整するように構成される、請求項1ないし5のいずれか1項に記載の装置。
  7. 前記手段は、前記第1距離閾値に関連する第1の機能を取得するようにさらに構成され、前記リスニング位置に応じて前記第1および第2アコースティック環境のうちの少なくとも1つの前記環境特性を調整するように構成された前記手段は、前記第1距離閾値に対する前記リスニング位置に適用された前記第1の機能と、前記第1アコースティック環境と前記第2アコースティック環境との間の前記境界とにさらに基づいて、前記第1アコースティック環境の第1の残響利得パラメータまたは前記第2アコースティック環境の第の残響利得パラメータのうちの少なくとも1つを調整するように構成される、請求項6に記載の装置。
  8. 前記手段は空間オーディオ信号をレンダリングするようにさらに構成され、前記空間オーディオ信号は、前記第1および第2アコースティック環境のうちの少なくとも1つの前記環境特性に基づいて、少なくとも部分的に生成された残響???を有する、請求項1ないし7のいずれか1項に記載の装置。
  9. 前記空間オーディオ信号をレンダリングするように構成された前記手段が、前記第1アコースティック環境の前記第1の残響ゲインパラメータに基づいて第1の残響部分を備える前記空間オーディオ信号を生成し、および/または、前記第2アコースティック環境の前記第2の残響ゲインパラメータに基づいて第2の残響部分を生成するように構成される、請求項6または7のいずれかに従属するとき、請求項8に記載の装置。
  10. 前記第1アコースティック環境の前記第1の残響ゲインパラメータに基づいて、第1の残響部分、および/または、前記第2の残響ゲインパラメータに基づいて、第2の残響部分を備える前記空間オーディオ信号を生成するように構成された前記手段は、前記リスナ位置が前記第1アコースティック環境内にあるとき、現在のアコースティック環境を前記第1アコースティックアコースティックとして設定し、寄与しない前記第1アコースティック環境を除いて、他のすべてのアコースティック環境に対して残響減衰を設定し、前記リスナ位置が前記閾値によって定義される前記第1アコースティック環境内の領域内にある前記第2アコースティック環境のための定義された寄与を提供するように残響減衰を設定し、現在のアコースティック環境および他のアコースティック環境に対する残響寄与を決定し、空間オーディオ信号の一部を形成するために、残響寄与を組み合わせるように構成される、請求項9に記載の装置。
  11. 請求項7に従属するとき前記閾値によって定義される前記第1アコースティック環境内の前記領域内に前記リスナ位置がある前記第2アコースティック環境に前記定義された寄与を提供するように残響減衰を設定するように構成される前記手段は、前記第1の機能に基づいて前記第2アコースティック環境に前記定義された寄与を提供するように前記残響減衰を設定するように構成される、請求項10に記載の装置。
  12. 前記オーディオシーン内のリスニング位置に応じて前記第1および第2のアコースティック環境間の適応レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に画定する第1の距離閾値を取得するように構成された前記手段は、前記第1距離閾値が適用可能なアコースティック環境の数を示す情報、前記第1距離閾値がどのアコースティック環境に適用可能であるかを示す情報、前記第1距離閾値がどのアコースティック環境にあるかを示す情報、前記第1距離閾値に対する距離値を示す情報、前記第1距離閾値に関連する形状またはプロフィーを示す情報、ヒステリシス領域を定義するヒステリシスオフセット値を示す情報、前記リスナ位置が、前記第1距離閾値の外側から前記第1アコースティック環境と前記第2アコースティック環境との間の境界まで移動するときに減衰レベルを修正するための機能を定義する減衰変調タイプを示す情報、現在のアコースティック環境から目的アコースティック環境までのホップ数を規定するホップを示す情報と、最大減衰量レベルを規定するパラメータ減衰量上限を示す情報と、のうちの少なくとも1つを取得するように構成される、請求項1から11のいずれかに記載の装置。
  13. オーディオシーンのレンダリングを支援するためにアコースティック環境を生成するための装置であって、前記装置は、前記オーディオシーンに関連する少なくとも第1アコースティック音境の情報を取得し、ここで、前記オーディオシーンは、前記第1アコースティック環境と第2の環境とを備え、前記オーディオシーン内のリスニング位置に応じて前記第1および第2アコースティック環境間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得し、前記情報と前記第1距離閾値とを符号化して出力するように構成される手段を備える、装置。
  14. 前記手段は、前記第1の距離閾値に関連する第1の機能を取得するようにさらに構成され、前記第1の機能は、前記第1および第2アコースティック環境のうちの少なくとも1つに特徴的な環境の調節を定義する、請求項12に記載の装置。
  15. 前記オーディオシーン内のリスニング位置に応じて前記第1および第2のアコースティック環境間の適応レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に画定する前記第1の距離閾値を取得するように構成された前記手段は、前記第1距離閾値が適用可能なアコースティック環境の数を示す情報、 前記第1距離閾値がどのアコースティック環境に適用可能であるかを示す情報、前記第1距離閾値がどのアコースティック環境にあるかを示す情報、前記第1距離閾値に対する距離値を示す情報、前記第1距離閾値に関連する形状またはプロファイルを示す情報、ヒステリシス領域を定義するヒステリシスオフセット値を示す情報、前記リスナ位置が第1距離閾値の外側から第1アコースティック環境と第2アコースティック環境との間の境界まで移動するときに減衰レベルを修正するための機能を定義する減衰変調タイプを示す情報、現在のアコースティック環境から目的アコースティック環境までのホップ数を規定するホップを示す情報と、最大減衰量レベルを規定するパラメータ減衰量上限を示す情報と、のうちの少なくとも1つを取得するように構成される、請求項13または14に記載の装置。
  16. 前記情報を符号化して出力するように構成された前記手段は、符号化された情報と第1の距離閾値とを備えるビットストリームを生成するように構成される、請求項13ないし15のいずれか1項に装置。
  17. 前記手段は、前記オーディオシーンに関連付けられた少なくとも1つのオーディオ信号を取得するようにさらに構成され、前記情報を符号化し出力するように構成された前記手段は、符号化された少なくとも1つのオーディオ信号を含む前記ビットストリームを生成する請求項16に記載の装置。
  18. 少なくとも2つのアコースティック環境間のオーディオ遷移を可能にするための装置のための方法であって、該方法は、オーディオシーンに関連付けられた少なくとも第1アコースティック環境の情報を取得するステップであって、前記オーディオシーンが第1アコースティック環境および第2アコースティック環境を備える、ステップと、前記オーディオシーン内のリスニング位置に応じて、前記第1アコースティック環境と前記第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1距離閾値を取得するステップと、前記第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整するために前記リスニング位置を決定するステップと、前記リスニング位置に応じて、前記第1および第2アコースティック環境のうちの少なくとも1つの環境特性を調整するステップであって、前記環境特性がオーディオシーン内で適応的に制御される、ステップと、を含む、方法。
  19. オーディオシーンのレンダリングを支援するためにアコースティック環境情報を生成するための装置のための方法であって、該方法は、前記オーディオシーンに関連付けられた少なくとも第1アコースティック環境の情報を取得するステップであって、前記オーディオシーンは、前記第1アコースティック環境と第2の環境とを備える、ステップと、前記オーディオシーン内のリスニング位置に応じて前記第1アコースティック環境と第2アコースティック環境との間の適応的レンダリングを可能にするオーディオ遷移領域を少なくとも部分的に定義する第1の距離閾値を取得するステップと、前記情報および第1の距離閾値を符号化および出力するステップと、を含む、方法。
JP2022171185A 2021-10-28 2022-10-26 アコースティック環境間のオーディオ遷移のための方法および装置 Pending JP2023066402A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB2115533.8 2021-10-28
GBGB2115533.8A GB202115533D0 (en) 2021-10-28 2021-10-28 A method and apparatus for audio transition between acoustic environments

Publications (1)

Publication Number Publication Date
JP2023066402A true JP2023066402A (ja) 2023-05-15

Family

ID=78828372

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022171185A Pending JP2023066402A (ja) 2021-10-28 2022-10-26 アコースティック環境間のオーディオ遷移のための方法および装置

Country Status (4)

Country Link
US (1) US20230133555A1 (ja)
EP (1) EP4175326A1 (ja)
JP (1) JP2023066402A (ja)
GB (1) GB202115533D0 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114242110A (zh) * 2021-12-17 2022-03-25 北京达佳互联信息技术有限公司 模型训练方法、音频处理方法、装置、设备、介质及产品
GB2626746A (en) * 2023-01-31 2024-08-07 Nokia Technologies Oy Apparatus, methods and computer programs for processing audio signals

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115175064A (zh) * 2017-10-17 2022-10-11 奇跃公司 混合现实空间音频
EP3729830B1 (en) * 2017-12-18 2023-01-25 Dolby International AB Method and system for handling local transitions between listening positions in a virtual reality environment
EP3506082B1 (en) * 2017-12-27 2022-12-28 Nokia Technologies Oy Audio rendering for augmented reality
WO2020144061A1 (en) * 2019-01-08 2020-07-16 Telefonaktiebolaget Lm Ericsson (Publ) Spatially-bounded audio elements with interior and exterior representations
US11356793B2 (en) * 2019-10-01 2022-06-07 Qualcomm Incorporated Controlling rendering of audio data
US11606662B2 (en) * 2021-05-04 2023-03-14 Microsoft Technology Licensing, Llc Modeling acoustic effects of scenes with dynamic portals
US11570568B1 (en) * 2021-08-10 2023-01-31 Verizon Patent And Licensing Inc. Audio processing methods and systems for a multizone augmented reality space

Also Published As

Publication number Publication date
US20230133555A1 (en) 2023-05-04
GB202115533D0 (en) 2021-12-15
EP4175326A1 (en) 2023-05-03

Similar Documents

Publication Publication Date Title
CN108712711B (zh) 使用元数据处理的耳机的双耳呈现
US11089425B2 (en) Audio playback method and audio playback apparatus in six degrees of freedom environment
US11140507B2 (en) Rendering of spatial audio content
JP2023066402A (ja) アコースティック環境間のオーディオ遷移のための方法および装置
KR102427809B1 (ko) 객체-기반 공간 오디오 마스터링 디바이스 및 방법
CN114026885A (zh) 扩展现实体验的音频捕获和渲染
US11395087B2 (en) Level-based audio-object interactions
US12114148B2 (en) Audio scene change signaling
CN114051736A (zh) 用于音频流送和渲染的基于定时器的访问
CN116671133A (zh) 用于融合虚拟场景描述和收听者空间描述的方法和装置
US20230088922A1 (en) Representation and rendering of audio objects
KR20240008827A (ko) 가상 현실 환경에서 오디오 소스의 지향성을 제어하기 위한 방법 및 시스템
US20240196159A1 (en) Rendering Reverberation
US11974117B2 (en) Information processing device and method, reproduction device and method, and program
CN118511547A (zh) 使用空间扩展声源的渲染器、解码器、编码器、方法及比特流
GB2610845A (en) A method and apparatus for communication audio handling in immersive audio scene rendering
US20230143857A1 (en) Spatial Audio Reproduction by Positioning at Least Part of a Sound Field
US12009877B1 (en) Modification of signal attenuation relative to distance based on signal characteristics
US20240135953A1 (en) Audio rendering method and electronic device performing the same
WO2023131744A1 (en) Conditional disabling of a reverberator
KR20240073145A (ko) 크기를 갖는 오디오 요소를 렌더링하는 방법, 대응하는 장치 및 컴퓨터 프로그램
WO2023169819A2 (en) Spatial audio rendering of reverberation
CN118749206A (zh) 混响级别补偿

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230227

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240402

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240701

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241001