JP2024507945A - オーディオオブジェクトをレンダリングするための装置及び方法 - Google Patents

オーディオオブジェクトをレンダリングするための装置及び方法 Download PDF

Info

Publication number
JP2024507945A
JP2024507945A JP2023552008A JP2023552008A JP2024507945A JP 2024507945 A JP2024507945 A JP 2024507945A JP 2023552008 A JP2023552008 A JP 2023552008A JP 2023552008 A JP2023552008 A JP 2023552008A JP 2024507945 A JP2024507945 A JP 2024507945A
Authority
JP
Japan
Prior art keywords
loudspeakers
loudspeaker
signal
virtual position
panning gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023552008A
Other languages
English (en)
Inventor
ヴァルター・アンドレアス
ファラー・クリストフ
ヘレ・ユルゲン
シュミット・マークス
ボース・クリスティアン
クラップ・ユリアン
ゴッツ・フィリップ
Original Assignee
フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2024507945A publication Critical patent/JP2024507945A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)

Abstract

3Dパンニングを可能にするオーディオオブジェクトのより効率的なレンダリングは、パンニングを2段階、すなわち、垂直方向にオフセットされた第1の仮想(スピーカ)位置及び第2の仮想又は実際(スピーカ)の位置に通じる少なくとも1つの水平層内パンニングと、2つの位置の間の垂直方向の別のパンニングとに実行することによって達成される。このように動作すると、計算の複雑さが増すように見えるが、この段階的な処理は、実際には、レンダリングの安定性及び意図された仮想位置のロケーションを高くする。さらに、段階的な処理は、一実施形態によれば、振幅パンニングゲインのみを使用してパンニングを実行することを可能にし、すなわち位相処理は必要ではなく、それによって計算の複雑さを低くレンダリングする。さらに、レンダリングは、様々なラウドスピーカセットアップへの適用性に関して柔軟である。

Description

本発明は、オーディオ再生の技術分野に関する。具体的には、本明細書では、上昇又は下降した高さのサウンドの再生を伴うマルチチャネルオーディオの再生について説明する。
サウンドの再生のために、それらの複雑さ及び再生品質に関して異なる様々な種類のシステムがある。映画のサウンドの基準は映画館である。映画館は、マルチチャネルのサラウンドサウンドを提供し、ラウドスピーカは、聴取者の前方(通常はスクリーンの背後)だけでなく、側部及び後部、さらに最近では天井にも設置されている。側部及び後部ラウドスピーカは、水平方向に包囲するサウンドの再生を可能にし、これは、高さ及び天井ラウドスピーカを使用してサウンドを垂直方向に包囲することによってさらに強化することができる。
最新のコーディング技術では、没入型、対話型、及びオブジェクトベースのオーディオコンテンツを専門的な環境で使用できるだけでなく、消費者の家に便利に送信して、例えば高さ再現などのさらなる特徴及び寸法を追加することもできる。
現実的なサウンドの再生のための強化された再生セットアップは、水平面(通常は聴取者の耳の高さ又はその近く)に取り付けられたラウドスピーカだけでなく、垂直方向に広がるラウドスピーカも使用する。これらのラウドスピーカは、例えば、上昇する(天井に、又は頭部の高さより上のある角度で取り付けられる)か、又は聴取者の耳の高さより下(例えば、床の上、又は何らかの中間又は特定の角度の上)に配置される。
多くの場合、ラウドスピーカを上方向又は下方向に設置することは不便又は不可能である。
家庭環境では、専門的な環境、研究室、又は映画館で使用されるラウドスピーカセットアップを再現するのに必要な数のラウドスピーカを設置するのは、おそらくファンのみである。ここで、ラウドスピーカセットアップという用語は、サウンドバー、ラウドスピーカ内蔵TV、ブームボックス、サウンドプレート、ラウドスピーカアレイ、スマートスピーカなどのデバイス及びトポロジも含む。
それにもかかわらず、没入型サウンド体験又は仮想現実のためにサウンドをレンダリングするとき、高さ(上及び下)方向(以下では「上方向及び下方向」と呼ばれる)でもサウンドをレンダリングすることがしばしば望ましい。当然ながら、常に両方向を処理する必要はないので、これは「(上又は下のいずれかの)方向」又は「上方向/下方向」)と等価である。
したがって、高さラウドスピーカ、例えば上部ラウドスピーカ及び/又は下部ラウドスピーカを有することなく、サウンドを上方向及び下方向にレンダリングする必要が生じる。
これらのかなり複雑なセットアップに対する便利な代替手段は、強化されたラウドスピーカセットアップと同等又は同様の空間聴覚を生成するために信号処理手段を使用するコンパクトな再生システムである。ここで、再生システムという用語は、多数の個別のラウドスピーカ、サウンドバー、内蔵ラウドスピーカを備えたTV、ブームボックス、サウンドプレート、ラウドスピーカアレイ、スマートスピーカなどを含むセットアップのようなオーディオ再生のためのすべてのデバイス及びトポロジを含む。
これを達成するための実際的な方法及び装置を以下に提示する。
本発明の目的は、3Dパンニングを可能にするオーディオオブジェクトのより効率的なレンダリングを提供することであり、効率の向上は、例えば、レンダリング安定性、パンニング精度の改善、計算効率、及び/又はより多数のラウドスピーカセットアップ、ラウドスピーカの数の変更、ラウドスピーカ位置の変更、聴取者位置の変更、オブジェクト位置の変更の適合性などに関連する。
この目的は、独立請求項の主題によって達成される。
3Dパンニングを可能にするオーディオオブジェクトのより効率的なレンダリングは、パンニングを2段階、すなわち、垂直方向にオフセットされた第1の仮想(スピーカ)位置及び第2の仮想又は実際の(スピーカ)位置に通じる少なくとも1つの水平層内パンニングと、2つの位置の間の垂直方向の別のパンニングとで実行することによって達成される。このように動作すると、計算の複雑さが増すように見えるが、この段階的な処理は、実際には、レンダリングの安定性及び意図された仮想位置の位置特定の精度を高める。さらに、段階的な処理は、一実施形態によれば、振幅パンニングゲインのみを使用してパンニングを実行することを可能にし、すなわち位相処理は必要ではなく、それによって計算の複雑さを低くレンダリングする。さらに、レンダリングは、様々なラウドスピーカセットアップへの適用性に関して柔軟である。
本出願の実施形態は、複数のラウドスピーカにおけるラウドスピーカ信号の適用が少なくとも1つのオーディオオブジェクトを意図された仮想位置にレンダリングするように、複数のラウドスピーカのラウドスピーカ信号を生成するための装置に関する。この装置は、少なくとも1つのオーディオオブジェクトを表すオーディオ入力信号を受信するように構成されたインターフェースを備える。これは、チャネルベースのオーディオ信号、オブジェクトベースのオーディオ信号、及び/又はシーンベースのオーディオ信号のうちの1つであってもよい。第1のパンニングゲイン決定部は、意図された仮想位置に応じて、1つ又は複数の第1の水平層の第1の層セット内に配置された、複数のラウドスピーカのうちのラウドスピーカの第1のセットの第1のパンニングゲインを決定するように構成され、第1のパンニングゲインは、ラウドスピーカの第1のセットへの第1の部分ラウドスピーカ信号の適用時の第1の仮想位置における少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられた、少なくとも1つのオーディオ入力信号からの第1の部分ラウドスピーカ信号の導出を定義する。これは、前述の層内パンニングである。垂直パンニングゲイン決定部は、意図された仮想位置に応じて、第1の部分ラウドスピーカ信号と、1つ又は複数のラウドスピーカの第2のセットに適用され、第1の仮想位置と第2の位置との間をパンニングするように、第1の位置に対して垂直方向にオフセットされた第2の位置における少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられた1つ又は複数の第2の部分ラウドスピーカ信号との間のパンニング(又はフェード)のためのさらなるパンニングゲインを決定するように構成される。これが垂直パンニングである。1つ又は複数の第2の部分ラウドスピーカ信号は、別の層内パンニングの結果であってもよく、この場合、第2の位置は第2の仮想位置であり、又は第2の位置は、ラウドスピーカの第1のセットに対して垂直方向にオフセットして配置されたラウドスピーカのうちの別の1つの実際の位置であってもよい。装置は、第1のパンニングゲイン及びさらなるパンニングゲインを使用して、第1の部分ラウドスピーカ信号及び1つ又は複数の第2の部分ラウドスピーカ信号からラウドスピーカ信号を合成するように構成される。すなわち、合成では、第1のパンニングゲイン及びさらなるパンニングゲインが実際にオーディオ入力信号に適用され、それによってラウドスピーカ信号がもたらされる。1つ又は複数のラウドスピーカ信号が存在する可能性があり、その生成にはパンニングゲインの1つのみ、例えば、実際のラウドスピーカ位置に配置され、第2の部分ラウドスピーカ信号が供給される上述の第2のラウドスピーカなどが使用される。
いくつかの実施形態によれば、上記のように、1つ又は複数のラウドスピーカの第2のセットは複数のラウドスピーカを含み、1つ又は複数の第2の部分ラウドスピーカ信号は複数の第2の部分ラウドスピーカ信号を含み、装置は、意図された仮想位置に応じて、ラウドスピーカの第2のセットの第2のパンニングゲインを決定するように構成された第2のパンニングゲイン決定部をさらに含み、第2のパンニングゲインは、少なくとも1つのオーディオ入力信号からの第2の部分ラウドスピーカ信号の導出を定義し、装置は、第1のパンニングゲイン及び第2のパンニングゲイン並びにさらなるパンニングゲインを使用して第1の部分ラウドスピーカ信号及び第2の部分ラウドスピーカ信号からラウドスピーカ信号を合成するように構成される。ここで、一実施形態によれば、第2の部分ラウドスピーカ信号は、スペクトル整形によって少なくとも1つのオーディオ信号から導出されてもよく、その結果、第2の位置は、1つ又は複数の第1の水平層と、ラウドスピーカの第2のセットが配置されている1つ又は複数の第2の水平層との間ではなく、これらの水平層に対して垂直に一方の側にあるような、第2の層セットの上方又は下方の仮想位置である。対応する実施形態によれば、複数のラウドスピーカでのラウドスピーカ信号の適用が、少なくとも1つのオーディオオブジェクトを意図された仮想位置にレンダリングするように、複数のラウドスピーカのためのラウドスピーカ信号を生成するための装置が得られ、複数のラウドスピーカが1つ又は複数の水平層に分配され、装置は、少なくとも1つのオーディオオブジェクトを表すオーディオ入力信号を受信するように構成されたインターフェースと、意図された仮想位置に応じて、複数のラウドスピーカのうちのラウドスピーカの第1のセットについて、第1の仮想位置がラウドスピーカの第1のセットの位置の間にあるように、第1のパンニングゲイン、例えば純粋な振幅パンニングゲインを決定し、第1のパンニングゲインを使用して、ラウドスピーカの第1のセットへの第1の部分ラウドスピーカ信号の適用時の第1の仮想位置における少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられた、少なくとも1つのオーディオ入力信号から第1の部分ラウドスピーカ信号を導出するように構成された第1のラウドスピーカ信号セット決定部と、第2のラウドスピーカ信号セット決定部であって、スペクトル整形により、少なくとも1つのオーディオ信号から第2の部分ラウドスピーカ信号を導出するように構成され、第2の部分ラウドスピーカ信号は、ラウドスピーカの第2のセットへの第2の部分ラウドスピーカ信号の適用時の第2の仮想位置における少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられ、第2の仮想位置は、1つ又は複数の水平層の上方又は下方であり、例えば、1つ又は複数の水平層のいずれかの間ではなく、1つ又は複数の水平層に対して一方の側、垂直方向にある、第2のラウドスピーカ信号セット決定部と、意図された仮想位置に応じて、第1の仮想位置と第2の仮想位置との間でパンニングするように、第1の部分ラウドスピーカ信号及び第2の部分ラウドスピーカ信号の第2のパンニングゲインを決定するように構成された、垂直パンニングゲイン決定部と、第2のパンニングゲインを使用して第1の部分ラウドスピーカ信号及び第2の部分ラウドスピーカ信号からラウドスピーカ信号を合成するように構成された合成器と、を備える。
したがって、本明細書に記載の実施形態は、少なくとも1つのオーディオ入力信号から少なくとも1つのオーディオオブジェクトをラウドスピーカセットにレンダリングするための概念を明らかにする。要するに、オーディオ入力信号は、ラウドスピーカによって出力されるオーディオオブジェクトに関する情報を含んでもよい。例えば、そのようなオーディオオブジェクトは、映画の中を飛行するヘリコプターのサウンド、管弦楽団で演奏する楽器のサウンド、又は音声のサウンドであり得る。オーディオオブジェクトは、ラウドスピーカを使用してレンダリングされる。オーディオ入力信号は、オーディオオブジェクトが個別のラウドスピーカでどのように出力されるかを決定するために処理される。このために、各オーディオ入力信号は、少なくとも1つのオーディオオブジェクトの位置情報に関連付けられる。そのような位置情報は、静的であってもよく、例えば、バイオリンは管弦楽団の左側に位置し、スピーカは聴取者の前方に位置し、又は動的であってもよく、例えば、ヘリコプターは右から左に飛行する。オーディオオブジェクトをレンダリングするために使用されるラウドスピーカセットは、ラウドスピーカの1つ又は複数のグループを含んでもよく、各グループは1つの水平層に位置する。追加のラウドスピーカは、1つ又は複数のグループの上方又は下方に位置する物理又は仮想ラウドスピーカであってもよい。
これは、ラウドスピーカセットについて、層と、層の上方又は下方の層にオフセットされた位置との関連付けが定義され得ることを意味する。例えば、セットアップは、1つの層に4つのラウドスピーカ、例えばすべて同じ高さにある4つのラウドスピーカと、4つの他のラウドスピーカよりも高い、例えば上昇した1つの物理又は仮想ラウドスピーカとを含むことができる。このセットアップは、1つの層を有する。追加の1つ又は複数の層も可能である。
有利な実施形態は、従属請求項の主題である。
特に、本出願の好ましい実施形態は、図面に関して以下に説明される。
一実施形態によるオーディオレンダリングのための装置のブロック図を示す。 ここでは両方の部分ラウドスピーカ信号セットに対する水平パンニングの可能性、並びにそれらのうちの1つに対する等化を含むように説明されている、オーディオレンダリングのための装置の別の実施形態を示す。 例示的なラウドスピーカセットアップと、ラウドスピーカ間に配置された聴取者とを概略的に示し、オーディオレンダリングのための仮想上部ラウドスピーカの考慮事項をさらに示している。 第1の(水平)パンニングを示す、図3のシナリオの概略図を示す。 図3のシナリオを示しており、仮想上部ラウドスピーカを実現するためのモノラルキューを提供するための等化又はスペクトル整形の使用を示す。 図5a3の状況を示す図であり、仮想上部ラウドスピーカのレンダリングに関与するために採用されたラウドスピーカと、仮想上部ラウドスピーカの位置を特定するために使用されるゲインとの間のパンニングを示している。 上部/下部仮想ラウドスピーカのレンダリングのための水平パンニングと等化との間の異なる順序によって図2の実施形態と比較して変更されたオーディオレンダリングのための装置のブロック図を示す。 オーディオレンダリングのための装置の別の実施形態のブロック図、又は別の方法で示されている、2つの利用可能なラウドスピーカ層の間の意図された仮想位置のオーディオオブジェクトのレンダリングに関与する図1の装置の要素のブロック図を示す。 図7の要素に加えて、聴取者の位置を考慮する可能性を示すブロック図を示す。 可能なラウドスピーカセットアップ、ここでは5.0ラウドスピーカセットアップの概略上面図を示す。 ラウドスピーカセットアップの別の例、ここでは5.0+2Hラウドスピーカセットアップの別の概略3次元図を示す。 ここでは5.0+4Hラウドスピーカセットアップを使用する例について、2つの利用可能な層の間の意図された仮想位置でオブジェクトのオーディオレンダリングを実行する際の2段階プロセスを示すための概略図を示す。 ここでは5.0+4Hラウドスピーカセットアップを使用する例について、2つの利用可能な層の間の意図された仮想位置でオブジェクトのオーディオレンダリングを実行する際の2段階プロセスを示すための概略図を示す。 利用可能な層に対して垂直方向にオフセットされた、ここではすべての層の最上部に対して例示的な、意図された仮想位置におけるオブジェクトの2段階レンダリングを示す。 利用可能な層に対して垂直方向にオフセットされた、ここではすべての層の最上部に対して例示的な、意図された仮想位置におけるオブジェクトの2段階レンダリングを示す。 仮想上部/下部ラウドスピーカ信号をレンダリングするためのモノラルキューを形成するために等化又はスペクトル整形で使用される整形関数の例を示す。
以下の説明は、複数のラウドスピーカのためのラウドスピーカ信号を生成するための装置の一実施形態の説明から始まる。より具体的な実施形態は、個別に又はグループで、図1の装置に適用され得る詳細の説明と共に本明細書の以下に概説される。
図1の装置は、一般に、参照符号10を使用して示されており、複数のラウドスピーカ14において又は複数のラウドスピーカ14にラウドスピーカ信号12を適用することにより、少なくとも1つのオーディオオブジェクトが意図された仮想位置にレンダリングされるように、複数のラウドスピーカ14のラウドスピーカ信号12を生成するためのものである。
装置10は、ラウドスピーカ14の特定の配置、すなわち、複数のラウドスピーカ14が配置又は配置され配向される特定の位置に対して構成されてもよい。しかしながら、装置は、代替的に、ラウドスピーカ14の異なるラウドスピーカ配置に対して構成可能であってもよい。同様に、ラウドスピーカ14の数は、複数であってもよく、装置は、設定された数のラウドスピーカ14のために設計されてもよく、又は任意の数のラウドスピーカ14に対応するように構成可能であってもよい。
装置10は、装置10が少なくとも1つのオーディオオブジェクトを表すオーディオ信号18を受信するインターフェース16を備える。しばらくの間、オーディオ入力信号18が、ヘリコプターのサウンドなどのオーディオオブジェクトを表すモノラルオーディオ信号であると仮定する。さらなる例及びさらなる詳細を以下に提供する。いずれの場合でも、オーディオ信号18は、時間領域、周波数領域、又は任意の他の領域においてオーディオオブジェクトを表してもよく、圧縮された方法で、又は圧縮なしでオーディオオブジェクトを表してもよい。
図1に示すように、装置10は、意図された仮想位置を受け取るための位置入力をさらに備える。すなわち、位置入力20において、装置10は、ラウドスピーカ14におけるラウドスピーカ信号12の適用によってオーディオオブジェクトが仮想的にレンダリングされることになる意図された仮想位置について通知される。すなわち、装置10は、意図された仮想位置の情報を入力20で受信し、この情報は、ラウドスピーカ14の配置/位置に対して、聴取者の位置及び/又は頭部の向きに対して、及び/又は現実世界の座標に対して提供され得る。この情報は、例えば、デカルト座標系又は極座標系に基づくことができる。これは、例えば、デカルト座標系又は極座標系のいずれかとしてのルーム中心座標系又は聴取者中心座標系に基づくことができる。
図1に示すように、装置10は、入力20で受信された意図された仮想位置21に応じて、複数のラウドスピーカ14のうちのラウドスピーカの第1のセット26の第1のパンニングゲイン24を決定するように構成された第1のパンニングゲイン決定部22を備える。ラウドスピーカのこのセット26は、1つ又は複数の第1の水平層の第1の層セット内に配置される。すなわち、ラウドスピーカのこのセット26は、擬似的に、同様の高さに配置される。第1のパンニングゲイン24は、少なくとも1つのオーディオ入力信号18からの第1の部分ラウドスピーカ信号28の導出を定義するか、又は生成に関与し、第1の部分ラウドスピーカ信号28は、第1の部分ラウドスピーカ信号がラウドスピーカの第1のセット26に適用されると、第1の仮想位置における少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられる。以下でより詳細に概説するように、一実施形態によれば、第1のパンニングゲイン決定部22は、第1の部分ラウドスピーカ信号28の各部分ラウドスピーカ信号に対して振幅ゲインを計算してもよく、その結果、第1の仮想位置がセット26のラウドスピーカ間にパンニングされ、場合によっては、第1の仮想位置がラウドスピーカ位置のうちの1つと一致する可能性のある場合を含み、その場合、その位置にあるラウドスピーカのみが非ゼロパンニングゲインを受信し得る。さらに言い換えれば、第1のパンニングゲイン決定部22は、セット26内の水平パンニングの振幅ゲインを計算するためのものであり、その結果、この水平パンニングは、ラウドスピーカセット26の第1の層セット内の仮想レンダリング位置になる。
図1の装置10は、意図された仮想位置21に応じて、一方では第1の部分ラウドスピーカ信号28と他方では1つ又は複数の第2の部分ラウドスピーカ信号34との間のパンニングのためのさらなるパンニングゲインを決定するように構成された垂直パンニングゲイン決定部30をさらに備える。1つ又は複数の第2の部分ラウドスピーカ信号34は、1つのラウドスピーカのみ又は複数のラウドスピーカを含むラウドスピーカ14から1つ又は複数のラウドスピーカの第2のセット36に適用される。
図1は、セット36内の第2の部分ラウドスピーカ信号34及びラウドスピーカの数が複数である場合を示しているが、セット36内に1つのラウドスピーカしかなく、したがって1つの第2の部分ラウドスピーカ信号34しかないこともまた真実であり得る。後者の場合、セット36の単一のラウドスピーカは、第1の部分ラウドスピーカ信号28が専用であるラウドスピーカセット26の外部にあることになる。複数のラウドスピーカを含むセット36の場合、セット26及び36は、互いに分離していてもよく、部分的に重なり合っていてもよく、一致していてもよく、又は完全に重なり合っていてもよく、すなわち、一方は他方の適切なサブセットであってもよい。例は、以下により詳細に記載される。いずれの場合も、第2の位置は、第1の位置に対して垂直方向にオフセットされている。第1のセット26と第2のセット36とが一致する場合であっても、第1の位置と第2の位置との間の垂直方向オフセットをどのようにして達成するかの様々な例が、本明細書において以下に記載される。図に関して概説した実施形態では、各セット26及び36は、各層のラウドスピーカから作られるか、又は一層に対応するため、セット26及び36が一致する場合、層セット、すなわちセット26及び32の層も一致することに留意されたい。しかしながら、セット26及び32のいずれかが複数の層のラウドスピーカから構成され得るように、セットと層との間のこの対応関係は変更されてもよい。
垂直パンニングゲイン決定部30によって決定されたさらなるパンニングゲイン32は、最終的に、第1の仮想位置と第2の位置との間のパンニングをもたらす。
図1に示すように、装置10は、第1のパンニングゲイン24及びさらなるパンニングゲイン32を使用して入力オーディオ信号18からラウドスピーカ信号12を合成するようにさらに構成された合成器40をさらに備える。前述したように、第1のパンニングゲインは単純な振幅ゲインであってもよく、したがって、合成器40は、入力オーディオ信号18と対応するパンニングゲイン24との乗算のための各部分ラウドスピーカ信号28の乗算器42を備えてもよい。したがって、パンニングゲイン24は、部分ラウドスピーカ信号28に対して個別である。すなわち、部分入力信号28ごとに1つのパンニングゲイン24がある。同様に、以下でさらに概説されるように、垂直パンニングゲイン決定部30によって出力されるパンニングゲイン32は、単純な振幅ゲインであってもよい。ここでは、セット28及び34ごとにそれぞれ1つのパンニングゲイン32がある。したがって、合成器40は、セット28及び34の各々に対してそれぞれ1つの乗算器44a、44bを備えてもよく、乗算器44aは、セット28の各ラウドスピーカ信号にそのセット28に関連付けられたパンニングゲイン32を乗算し、乗算器44bは、セット34からの各部分ラウドスピーカ信号にそのセット34に関連付けられたパンニングゲイン32を乗算する。
合成器40のさらなるタスクは、上述したように、ラウドスピーカセット26及び36が重なり合っていても、いなくてもよいことである。合成器40のタスクとして、合成器40は、パンニングゲイン24及び32を使用してパンニングすることによって得られた部分ラウドスピーカ信号28及び34をラウドスピーカ14上に正確に分配する。セット28及び34のうちの一方にのみ属するセット28及び34の部分ラウドスピーカ信号の場合、対応する部分ラウドスピーカ信号はラウドスピーカ信号12のうちの一方になる。しかしながら、ラウドスピーカ14のうちの同じラウドスピーカに関連付けられているそれらの1つ又は複数の部分ラウドスピーカ信号について、合成器40は、加算器46を使用してそれらを加算し、それにより、セット28及び34のうちの互いに対応する部分ラウドスピーカ信号の和がそれぞれラウドスピーカ信号12のうちの一方になる。
乗算の結合特性及び交換特性のために、合成器40は、図1に示す順序で各部分ラウドスピーカ信号の乗算を実行するように制限されないことに留意されたい。すなわち、図1の合成器40は、設定されたグローバルパンニングゲイン32との乗算の前に第1のパンニングゲイン24との部分ラウドスピーカ信号個別乗算を実行するように示されているが、乗算は異なる順序で実行されてもよい。
図1はまた、以下でさらに説明される実施形態に従って使用される詳細を示す。特に、これらの詳細は、入力オーディオ信号18からの部分ラウドスピーカ信号34の導出又は生成に関する。オーディオ入力信号18からの部分ラウドスピーカ信号34の導出/生成には、さらに2つの処理ステップを関連付けてもよい。これらの2つの処理ステップ及び図1の対応する要素は任意選択であり、したがって、入力オーディオ信号は、対応するパンニングゲイン32による垂直パンニングを受ける1つの部分ラウドスピーカ信号34を直接表してもよい。存在する場合、一方又は両方の処理ステップのみが適用され、装置10内で具現化されてもよい。
最初の処理ステップは、部分ラウドスピーカ信号34に対して要素22、24及び42によって実現される水平パンニングに実質的に対応する方法で、部分ラウドスピーカ信号28に対する水平パンニングに対応する。すなわち、図1に示すように、装置10は、意図された仮想位置21に応じて、ラウドスピーカの第2のセット36の第2のパンニングゲイン54を決定するように構成された第2のパンニングゲイン決定部52を備えてもよく、第2のパンニングゲイン54は、少なくとも1つのオーディオ入力信号18からの第2の部分ラウドスピーカ信号34の導出を定義する。合成器40は、対応する乗算器56、すなわち部分ラウドスピーカ信号34ごとに1つを備え、対応するパンニングゲイン54をオーディオ入力信号に乗算する。言い換えれば、合成器40は、セット36内の各ラウドスピーカの部分ラウドスピーカ信号34を、セット36内の対応するラウドスピーカに関連付けられたパンニングゲイン54との乗算にかける。これにより、水平パンニング及び部分ラウドスピーカ信号34に関連付けられた仮想ラウドスピーカ位置がもたらされる。
要素52~56に加えて、又は代替的に、装置10は、乗算器56での水平パンニング及び乗算器44bでの垂直パンニングの結果として入力オーディオ信号又は中間生成物若しくは最終生成物に対してスペクトル整形を実行するスペクトル整形器58を備えてもよく、その結果、第2の部分ラウドスピーカ信号34は、このスペクトル整形によって少なくとも1つのオーディオ入力信号から導出される。スペクトル整形は、例えば、部分ラウドスピーカ信号34の各々に対して等しい、すなわち、同じスペクトル整形関数が使用されてもよい。以下により詳細に概説されるように、スペクトル整形器58によって使用されるスペクトル整形関数60は、第2の部分ラウドスピーカ信号34に関連付けられた第2の仮想位置がラウドスピーカの第2のセット36の上方又は下方に配置されるという、聴取者に対する心理音響キューを形成するように選択される。
スペクトル整形器58によって実行されるスペクトル整形は、部分ラウドスピーカ信号のスペクトルと整形関数60との乗算によってスペクトル領域で実行されてもよく、又はIIRフィルタ又はFIRフィルタなどの時間領域フィルタによってなどの時間領域で実行されてもよく、その場合、その時間領域フィルタは、スペクトル整形関数60に対応する周波数応答を有する。セット26及び36に関してさらに注記する。装置は、現在のスピーカセットアップに応じて同じものを選択してもよい。言い換えれば、装置は、異なるセットアップに適応し得る。装置は、意図された仮想位置の水平成分に応じて、複数のラウドスピーカのうちのラウドスピーカの第1のセット26を選択してもよく、例えば、意図された仮想位置の水平成分に応じて、例えば、意図された仮想位置に最も近いスピーカを一層から選択してもよく(一層へのその垂直投影に関する限り)、又は、意図された仮想位置の水平成分及び意図された仮想位置の垂直成分に応じて、例えば、意図された仮想位置に最も近い最外層を選択し、次いで、その一層内のスピーカを選択することによって選択してもよい。加えて、又は代替的に、ラウドスピーカの第2のセット36は、意図された仮想位置に最も近い最外層を選択し、その層に属するすべてのスピーカをセット36に使用するなど、意図された仮想位置の垂直成分に応じて、又は、意図された仮想位置に最も近い最外層を選択し、意図された仮想位置に最も近くなるように層のスピーカからセット36を選択するなど、意図された仮想位置の水平成分及び意図された仮想位置の垂直成分に応じて、複数のラウドスピーカから選択されてもよい(一層へのその垂直投影に関する限り)。
第1の部分ラウドスピーカ信号28に関して前述したように、合成器40は、任意の順序で乗算56及び44b並びにスペクトル整形58を実行するように構成されてもよく、すなわち、対応する部分ラウドスピーカ信号34をもたらすために、任意の順序で3つのタスクをオーディオ入力信号18に適用してもよい。
最後に、一例によれば、スペクトル整形器58を使用する場合であっても、セット36内のラウドスピーカの数、したがって部分ラウドスピーカ信号34の数はそれぞれ1つであってもよいことに留意されたい。
参照符号及び上記で提示された説明を再使用することによって以下に記載される本出願の特定の詳細及び実施形態の説明を進める前に、合成器40に関して以下の注意がなされる。図1の場合、パンニングゲイン決定部22、30、及び52は、パンニングゲインの実際の適用が合成器40によって実行された間に、意図された仮想位置21に基づいてパンニングゲインを計算するための一種の中間モジュールを形成する。さらに、スペクトル整形器58は、そのサブモジュールとして合成器40内に含まれることが示された。しかしながら、上記のように、図1の図示と比較して変更が可能である。例えば、スペクトル整形器58は、最終的に合成器40の外部の、特に上流のモジュールになるように、上流要素52、54、及び56に配置することができる。次に、合成器40は、第1のラウドスピーカセット36に関する限り、オーディオ入力信号18の予め整形されたバージョンに基づいてラウドスピーカ信号12の合成を実行する。加えて、又は代替的に、後述する実施形態の大部分は合成を利用し、水平パンニングの後に垂直パンニングが適用され、水平パンニングは、乗算器42及び/又は56、並びに適用可能であればスペクトル整形58によって実現され、その場合、合成器40及びその合成は、要素44a、44b、並びに適用可能であれば加算器46のみを含んでもよく、要素22、24及び42は第1のラウドスピーカ信号セット決定部70を形成し、要素52、54、56、58及び60(又は水平パンニング若しくはスペクトル整形が欠落している場合はその一部)は第2のラウドスピーカ信号決定部72を形成する。
発表されたさらなる詳細及びさらなる詳細な実施形態を用いて説明を再開する前に、図1に示すオーディオレンダリングの概念から生じる達成された利点について簡単に述べる。特に、上述したように、図1の概念のオーディオレンダリングは、意図された仮想位置21の正確な角度変化に基づいて、又はそれに従って正確に適応又は選択される異なるHRTFを適用する使用及び関連する計算的に複雑なタスクなしに、オーディオ再生を進めることを可能にする。すべての水平及び垂直パンニングは振幅パンニングのみによって行われ、スペクトル整形58は、セット36内のすべてのラウドスピーカのすべての部分ラウドスピーカ信号34に対して、1つのスペクトル整形又は等しいスペクトル整形関数60を使用してもよい。以下にさらに説明する実施形態では、装置10は、意図された仮想位置21(例えば、意図された仮想位置21が、ラウドスピーカ14の高さ、内部、間、又は上方の聴取者位置又は層の位置に制限されている場合、又はその逆の場合、ラウドスピーカ14の高さ、内部、間、又は下方の聴取者位置又は層の位置に制限されている場合)に関係なく連続的に同じスペクトル整形関数60を使用するか、又は2つのスペクトル整形関数60を区別し得り、一方は、意図された仮想位置21が、それぞれ聴取者の位置又は最も高いラウドスピーカ層よりも高い場合に使用され、他方は、それぞれ聴取者の位置又は最も低いラウドスピーカ層よりも低い場合に使用される。したがって、図1のレンダリングの計算の複雑さは低い。これは、任意選択のスペクトル整形58を利用する場合にも当てはまる。
さらに、一方では水平パンニング及び他方では垂直パンニングへの3Dパンニングの分解は、より複雑なレンダリング手順をもたらすように見えるかもしれないが、結果として生じる計算の複雑さは依然として低いが、この計算の中程度の複雑さであっても、意図された仮想位置を位置決めする点でのレンダリング精度は依然として高い。
すなわち、本明細書に記載の実施形態は、本明細書の導入部分におけるかなり複雑なセットアップの代替を提供し、より複雑なラウドスピーカセットアップとして同等又は同様の空間聴覚を生成するために信号処理手段を使用するコンパクトな再生を形成する。上記及び以下に提示される概念は、以下のことが可能である。
(1)1つ又は複数の仮想ラウドスピーカを考慮することによって、欠けているラウドスピーカ/ラウドスピーカアレイを知覚的に置き換えること。これらの仮想ラウドスピーカの生成について本明細書で説明する。
(2)3Dラウドスピーカセットアップでサウンドを効率的にレンダリングすることであって、仮想ラウドスピーカ(1)が使用される場合だけでなく必要なラウドスピーカが物理的に利用可能なシナリオでもレンダリングを使用することができる、レンダリングすること。(2)の利点は、柔軟性及び効率性であり、これにより、聴取者の位置がリアルタイムで追跡され、レンダリングがリアルタイムで聴取者の現在位置に適応されるシナリオにも適用可能になる。
本明細書に記載の実施形態は、再生環境から独立しており、例えば、自動車環境で使用することもできることに留意されたい。さらに、実施形態は、再生に使用される特定のタイプのトランスデューサ又はトポロジとは無関係である。すなわち、実施形態は、例えば、ヘッドフォン再生、並びにラウドスピーカアレイ、サウンドバー、スマートスピーカなどの特定のラウドスピーカを使用する再生に適用することができる。
すなわち、なされたばかりの注記は、ラウドスピーカ14がヘッドフォンラウドスピーカ又はステレオラウドスピーカであってもよいが、同様に、ラウドスピーカアレイ、サウンドバー、又はラウドスピーカセット、スマートスピーカ、又はスマートスピーカセットを、サラウンドサウンドセットアップから形成してもよいし、個別のラウドスピーカであってもよく、組合せも実現可能であり得ることを明らかにする。さらに、この説明は、ラウドスピーカ信号12の合成を、時間的に変化し得る意図された仮想位置21にリアルタイムで適応させるために、装置10が適応的に動作することを明らかにした。
これに関連して、レンダリング装置の実施形態は、特定のラウドスピーカセットアップのために予め構成されてもよく、すなわち、予め定義されたラウドスピーカ14のセットが所定の位置に配置されることを期待しているが、本明細書に記載の装置は、装置の初期化に関して及び/又は移動するラウドスピーカ位置への適応に関して、ラウドスピーカの数及び/又はスピーカ位置が異なる、異なるラウドスピーカセットアップに適応し得ることに簡単に留意されたい。前者の場合、装置は、初期化後、ラウドスピーカセットアップが一定であると仮定し得る。後者の場合、装置は、実行中のスピーカセットアップ変動にさえ適応し得る。スピーカの数さえも、実行中に変化し得る。したがって、装置は、この任意選択の状況でラウドスピーカ位置に関する情報を受信してもよいが、図には明示的に示されていない。したがって、聴取者位置情報のオプションの受信と同様に、図1の装置(及びその後に示される実施形態)は、スピーカ14の数及びその位置を明らかにするラウドスピーカセットアップ情報を受信するためのさらなる位置入力を含んでもよい。この情報は、聴取者の位置及び/又は頭部の向きに対して、及び/又は現実世界の座標に対して提供され得る。この情報は、例えば、デカルト座標系又は極座標系に基づくことができる。これは、例えば、デカルト座標系又は極座標系のいずれかとしてのルーム中心座標系又は聴取者中心座標系に基づくことができる。
レンダリングに一般的に使用される方法は、振幅パンニング技術である。ラウドスピーカ(例えば、複数のラウドスピーカの間にない)によってカバーされない位置で聴覚オブジェクトの知覚を生成するために、クロストークキャンセルなどのレンダリング技術を利用することができる。クロストークキャンセル(XTC)[1-7]は、ラウドスピーカによって聴取者の左右の耳信号を制御することを目的としている。これは、ラウドスピーカの信号が聴取者に到達するときに発生する「耳間のクロストークをキャンセルする」ことによって達成される。耳信号を直接制御することができると、バイノーラル技術[8、9]を適用して、サウンドを上方向及び下方向にレンダリングすることができる。前述の技術には2つの主要な制限がある。第1に、XTCは、サウンドの色調、極めて小さいスイートスポット、及び聴取者に対するラウドスピーカ位置への高い依存性に関する制限を有する。第2に、頭部追跡/聴取者追跡及び/又は個別化頭部伝達関数(HRTF)又はバイノーラルルームインパルスレスポンス(BRIR)がなければ、バイノーラル技術は達成可能な品質/性能が制限される。これらの両方は、システムに高い複雑さ、コスト、及びユーザの不便さを追加する。
ラウドスピーカセットアップによってカバーされない寸法の仮想ラウドスピーカを使用して、従来の振幅パンニングに対する強化が提案されている(例えば[14、15]を参照)。そのような技術を使用した高さパンニングは、音色が高さで真にレンダリングされた音源から逸脱するため、完全に現実的ではない。
垂直半球振幅パンニング(VHAP)[10、11]は、2つの横ラウドスピーカを使用して、聴取者の上部の高さのオブジェクトをレンダリングする。ラウドスピーカは±90度の横方向になければならないため、VHAPは聴取者の位置に関して柔軟性がない。
本明細書では、仮想ラウドスピーカという用語は、オブジェクトをパンニングするプロセス中に考慮される存在しないラウドスピーカに使用される。
図1の概念は、上部レンダリング及び/又は下部レンダリングの概念を利用しており、上述した最先端技術に対して以下の利点を有する。
・より忠実な上部/下部/高さ知覚のために、上部/下部仮想ラウドスピーカ信号に等化(スペクトル整形58)が適用される。
・スピーカ14には任意のラウドスピーカセットアップを使用することができるが、それにもかかわらず、(仮想)上部及び下部レンダリングの強化が達成可能である。例えば、ステレオセットアップ又は5.1セットアップが、スピーカ14の基礎として使用されてもよい。高さラウドスピーカ、例えば5.1+4Hを有するラウドスピーカセットアップであっても、図1の概念を使用して、上部レンダリング(例えば、「天の声」ラウドスピーカ)又は下位層レンダリングなどに関して強化することができる。これとは対照的に、VHAPは、例えば、聴取者の両側(±90度)にラウドスピーカを有する正確で特定のラウドスピーカセットアップを必要とする。
・さらに、図1の上部及び下部レンダリングは、聴取者に対する特定のラウドスピーカ位置に依存しない。言い換えれば、図1のスキームは、聴取者が移動するシナリオ、例えば追跡レンダリングにも適用できる。
本明細書に記載の実施形態は、仮想高さレンダリングの非常に簡単な実装を可能にする。
すなわち、図1によるオブジェクトパンニングは、図2によるレンダリング装置又はオブジェクトパンニングプロセッサにつながる方法で実装し得り、装置は合成器40の出力においてラウドスピーカ信号12を生成し、一方では部分ラウドスピーカ信号34を、他方では合成器40に部分ラウドスピーカ信号28を提供する2つの経路、すなわち、一方の経路がオーディオ入力信号18及び意図される仮想位置21を受け取り、部分ラウドスピーカ信号28を出力する部分ラウドスピーカセット決定部70を備え、もう一方の経路が、2つの入力18及び21に基づいて部分ラウドスピーカ信号34を生成し、装置などが任意のラウドスピーカセットアップにわたって3D空間内のオブジェクトを以下のことによってレンダリングするモジュール72を備える。
・少なくとも1つの仮想ラウドスピーカ(上又は下)を垂直(上又は下)方向で考慮すること。これは、以下により詳細に概説されるように、第1の部分ラウドスピーカ信号34によって再生されるサウンドが上又は下からそれぞれ到来するという聴取者のための心理音響キューをもたらすスペクトル整形58によって行われ、又は達成される。
・ラウドスピーカセットアップと1つ又は複数の仮想ラウドスピーカとを考慮して、オブジェクトを振幅パンニングすること。振幅パンニングは、合成器40内の垂直パンニング、及びモジュール70内及びモジュール72内の水平パンニングによって実行される。
・仮想及び/又は実際のラウドスピーカ信号に等化を適用すること。等化は、スペクトル整形器58内のこのスペクトル整形によって行われる。
・図1に関して説明したように、セットアップのサブセット又はすべてのラウドスピーカにわたって各仮想ラウドスピーカ信号を再生することであって、第2のラウドスピーカセット36はセット26と一致してもよく、したがってすべてのラウドスピーカ14を含んでもよく、又はラウドスピーカ14のサブセットのみに関連してもよい、再生すること。
以下では、本出願の実施形態の概念を3次元的に視覚化する。図3を参照されたい。図3では、聴取者を参照符号100で示している。個別のラウドスピーカ14は、小さい文字によって互いに区別される。図3において、ラウドスピーカセットアップは、例示的に、4つのラウドスピーカを備える。図3は、聴取者100の上又は上にある1つの仮想ラウドスピーカ102を示す。図3は、当然、単なる例である。代替的に、聴取者100の下又は下方にある仮想ラウドスピーカ102が考えられる。さらに、聴取者100が水平方向に移動することを可能にしても、すなわち聴取者の位置を追跡することによっても、仮想ラウドスピーカ102を聴取者100の真上に配置し得り、又は聴取者100が実際に仮想ラウドスピーカ102の真下/真上にあるかどうかに関係なく、聴取者100の位置をデフォルトで固定し得る。
別の言い方をすれば、図3は、ラウドスピーカ14の位置決めの一例、ここでは例示的な4つのラウドスピーカ14a~14dを示し、図1及び図2に示す実施形態が、第1の部分ラウドスピーカ信号34に関連付けられたレンダリングの上述の仮想位置である仮想位置に配置された仮想ラウドスピーカを含んでもよいことを説明する。すなわち、図3は、スペクトル整形器58を利用する限り、図2の実施形態及び図1の実施形態が、利用可能なラウドスピーカ14に加えて仮想ラウドスピーカ102をさらに考慮することを示している。
図4、図5a及び図5bは、利用可能なラウドスピーカ14a~14d及び仮想ラウドスピーカ102を使用して意図された仮想位置104におけるレンダリングがどのように行われるかについて、個別の下位概念又はステップに分解して示している。
図4は、意図された仮想位置104を示している。この位置104は、ラウドスピーカ14a~14dがある層又は平面の垂直上方にあるように示されている。図4はまた、ラウドスピーカ14a~14dの層又は平面内への意図された仮想位置104の投影、すなわち、ラウドスピーカ14a~14dの層又は平面内への垂直方向に沿った投影104を示す。結果として得られる投影された位置106、すなわち、ラウドスピーカ14a~14dの層への意図された仮想位置104の投影は、参照符号106を使用して示されている。モジュール70は、この投影された仮想位置106におけるオーディオオブジェクトのレンダリングに関連付けられた部分ラウドスピーカ信号をもたらすように振幅パンニングを使用し得る。したがって、図4は、ここまで図1及び図2に関してまだ説明されていない別の状況を示す。特に、図1及び図2の装置はそれぞれ、利用可能なすべてのラウドスピーカ14の中から26を選択するように、又は図4のラウドスピーカ14aから14dなどの特定の層に属するラウドスピーカのグループなどのラウドスピーカのグループの中からを選択するように構成されてもよい。特に、ハッチングの使用によって示されるように、2つのラウドスピーカ14c及び14dのみが選択されてもよく、すなわち、聴取者100の水平面に属するラウドスピーカのグループのものが、保護された仮想位置106に最も近い対応する部分ラウドスピーカ信号28を受信するように選択される。別の観点によれば、水平パンニングは、対応するラウドスピーカ層セットのサブセットに関してのみ非ゼロの重みをもたらすが、対応する層セットのすべてのラウドスピーカに連続的に関連する。ここで、ラウドスピーカ14c及び14dのみが水平パンニングの非ゼロ重みに関連付けられ、他の2つのスピーカ14a及び14bはゼロの重みに関連付けられ、それによって水平パンニングに関与しない。したがって、仮想ラウドスピーカ102に加えて、ラウドスピーカセットアップの2つのラウドスピーカ14c及び14dが使用される。図4は、それぞれモジュール70又は決定部22によって達成される水平パンニングに集中しているが、以下の図は、モジュール72及び最終レンダリングへのその寄与に注目している。すなわち、以下の図は、仮想上部ラウドスピーカ102と共にラウドスピーカセットアップの2つのラウドスピーカ14c及び14dが、意図された仮想位置104においてオブジェクトを振幅パンニングするためにどのように使用されるかについて明らかにする。
意図された仮想位置104の距離は、本明細書の文脈において主要な役割を果たさず、したがって、位置104は、より簡単な視点表現のためだけに聴取者から遠くにあるように示されていることに留意されたい。レンダリングは、任意選択的に、位置104に向かう方向のみに依存して動作し得る。
図5aは、等化又はスペクトル整形58が仮想ラウドスピーカ102のラウドスピーカ信号に使用されるか、又は適用される下位概念又はステップを示す。再び、図3~図5bは、この仮想ラウドスピーカ102が仮想上部ラウドスピーカである例に注目しているが、これは一例に過ぎない。同様に、等化又はスペクトル整形58は、仮想下部ラウドスピーカを形成するために使用されてもよい。
図5bは、仮想ラウドスピーカ102の位置におけるオーディオオブジェクトの再生に注目している。仮想ラウドスピーカ102に直接適用されるラウドスピーカ信号、すなわちオーディオ入力信号は、等化又はスペクトル整形58、及びここでは対応する乗算器56a~56dによって示されている水平パンニングを受ける。後者の乗算器は任意である。それらは、仮想ラウドスピーカ位置102が静的ではなく、聴取者100の聴取者位置に垂直に調整されるように、すなわち、ラウドスピーカ14a~14dの平面へのその垂直投影がラウドスピーカ14a~14dのこの平面又は層内の聴取者100の位置と一致するように水平に位置するように配置される場合にのみ必要である。例示的な図5bは、セット36が、1つの水平層内の対応するグループのすべてのラウドスピーカ14a~14d又は少なくともすべてのラウドスピーカを包含し得ることを示している。すなわち、5bは、サブセット又は図5bに示すように、セットアップのすべてのラウドスピーカ14aから14dにわたる各第2の部分ラウドスピーカ信号34の再生を示す。仮想ラウドスピーカ102は物理的に利用可能ではないため、対応する等化信号34は、上述のラウドスピーカのサブセットにわたって再生される。ゲインは、仮想方向のレベル及び結果として生じる方向ベクトルを調整するために、合計で、又は各ラウドスピーカに個別に適用される。計算コストが低減されているために有益である代替の実装形態は、既に上述されており、図6に示されている。すなわち、図6は、レンダリングのための装置の別の例、又はオブジェクトパンニングプロセッサの代替実施形態、すなわち、図2と比較して、等化又はスペクトル整形58がモジュール72内の要素52、54及び56によって水平パンニングの上流で実行されるものを示す。すなわち、聴取者に心理音響キューをもたらし、上部ラウドスピーカ又は下部ラウドスピーカ102をもたらすような等化又はスペクトル整形は、各部分ラウドスピーカ信号34に個別にではなく、オーディオ入力信号18に直接適用される。すなわち、オーディオ入力信号18は、等化又はスペクトル整形を受け、ここで、任意選択的に、仮想位置102の位置を水平に制御するための水平パンニング、及び垂直パンニング係数又は垂直パンニングゲイン決定部によって提供されるゲインを使用して達成される垂直パンニングなどのパンニングを受ける。ラウドスピーカセット36間のオプションの水平パンニングの前に部分ラウドスピーカ信号34の垂直パンニングゲインが適用される場合、さらに低い計算の複雑さが達成される。後者の場合、等化された、又は周波数整形され、レベル整合された信号は、仮想高さラウドスピーカ102の再生のために選択されたラウドスピーカ上にコピーされ分配されてもよい。
上記の概念によれば、仮想高さ再現の効率的な生成は、任意のラウドスピーカセットアップにおいて対応する仮想高さスピーカを使用することを可能にするパンニングアルゴリズムの一部である。さらなる詳細を以下に記載する。
図1、図2、及び図6のいずれかによる(オブジェクト)パンニングアルゴリズム/パンニングプロセッサ又は装置は、静的及び移動音源の両方について、3D再生空間内の聴覚オブジェクトの知覚されたロケーションを位置決めするために使用することができる。
基礎となる概念の効率性のために、静的及び移動する聴取者位置、すなわち、例えば、聴取者100の位置が追跡され、装置によるレンダリングが聴取者位置に適応される用途にも使用することができる。適応例を以下に記載する。さらに、本明細書に記載の装置は、静的及び移動するラウドスピーカ14を有するシナリオにも適用することができる。
典型的な再生シナリオでは、ラウドスピーカ位置は固定されているが、聴取者の100位置は連続的に変化し得る。そのような場合、聴取者100がラウドスピーカ14を見る角度、並びにラウドスピーカ間のそれぞれの角度は、聴取者100の位置に応じて変化する。
VBAPなどの従来のパンニングアルゴリズムは、通常、考慮される不変のスイートスポット及びラウドスピーカ位置の初期化を必要とする。初期化位相では、ラウドスピーカをペア、トリプレット、又はクワドルプレットパンニンググループにマッピングするなど、いくつかの複雑な動作が使用される。
追跡シナリオでは、ラウドスピーカ14と聴取者100との相対的な位置は頻繁に変化するため、複雑な初期化位相及び固定マッピングを有することは望ましくない。図1、図2、及び図6による記載されたパンニングは、これらの問題に対処し、特にラウドスピーカによってカバーされる/囲まれるエリア内にない位置でのパンニングに関連するいくつかの他の新規性を含む。
特に、以下のステップは、図3~図5bに例示的に示されているように、効率的なレンダリングを達成し、スピーカ14a~14dの複数の層を有するスピーカセットアップに対応するのを支援し、本明細書に記載の装置の2つの機能として追加されてもよい。
・振幅パンニングゲインは、70及び72の水平パンニング段階のいずれかなど、水平ラウドスピーカ層について計算される。装置は、スピーカの層の数が1であるか否かに応じることができる。層が1つだけ存在する場合、要素52、54、56は使用されないか、又は聴取者100の真上/真下に上部/下部仮想スピーカ位置102を位置決めするためだけである。複数の層が存在する場合、以下が当てはまる。
・スピーカ14の複数の層が存在する場合、
〇複数のラウドスピーカ層の振幅パンニングゲインは、それぞれモジュール70及び72を使用して、高さ層及び最下層などについて計算し得る。これは、例えば、意図された仮想位置が両方の層の間の垂直方向の位置を指す場合に行われ得る。3つ以上の層がそのように扱われてもよいことに留意されたい。
〇パンニングでは、図4の106のような、すなわち水平パンニングが実行される各層におけるオブジェクトの任意のレンダリングされた水平/方位角仮想位置が、レンダリング、すなわち垂直パンニングにおいて考慮される。2つの層、すなわち各々が異なる高さの別の水平層に関連付けられたスピーカ14の2つのグループが、例えば、一方はセット26を形成する、若しくはセット26を選択する、又は他方はセット36を形成する、若しくはセット36を選択するために使用されてもよい。いくつかの(3つ以上の)利用可能な層からの選択は、以下に説明するように、すなわち意図された仮想位置に最も近い層を取得することによって行ってもよい。各層の上の、そこに示されている例示的な一層についての図4の106などの「レンダリングされたオブジェクト位置」は、次に、層間でオブジェクトを垂直方向にパンニングするための仮想ラウドスピーカとして使用されてもよい。詳細を以下に示す。
〇オブジェクト位置が最上層の上又は最下層の下にある場合、オブジェクトは1つの層(すなわち、それぞれ最上層又は最下層)上でのみ水平方向にパンニングされる。その場合、モジュール72は、仮想上部/下部スピーカ102に対して動作し、水平パンニングは、このオプションが使用される場合にのみ、上部/下部スピーカ102の水平位置を聴取者位置100に調整するためのものであり(この聴取者位置適応性が使用されない代替形態が以下に説明される)、モジュール70は、使用される垂直方向最も外側のスピーカ層又は水平層を形成するスピーカ14の最も外側のグループにおける水平パンニングに対して動作する。両方のモジュール70及び72は、スピーカ14のそれらのセット26及び36が、言及された垂直方向最も外側のスピーカ層又はスピーカ14の最も外側のグループに対応するか、又はその一部であるように選択される。
・したがって、オブジェクト位置104、21が最も高い(最も低い)ラウドスピーカ層(又は、ラウドスピーカ層(例えば、おおよそ耳の高さで)が1つしか利用できない場合には、)の上方(下方)にある場合、仮想垂直上部(垂直下部)ラウドスピーカ102は、聴覚オブジェクトをラウドスピーカ層の上方(下方)に知覚的にレンダリングすると考えられる。
・上部イコライザ又は下部イコライザ、すなわち対応する関数60を使用するスペクトル整形58がオブジェクトオーディオ信号に適用され、上方向又は下方向再生のために選択されたラウドスピーカ、すなわちセット36に分配される。
2つの層、又は2つの層のスピーカ間のレンダリングに関与するステップ/機能/ブロックが図7に示されている。より正確には、図7は、2つのスピーカ層間でレンダリングされるオーディオオブジェクトを3次元的にパンニングすることができる追加の実施形態による装置を示すか、又は、図7は、意図される仮想位置21が2つのそのようなスピーカ層間にある場合にレンダリングに関与する図1の装置の部分の協働を示し、一方、スペクトル整形器/イコライザ58などの図1に示される他の要素は、この場合(むしろ、意図される仮想位置がスピーカ14のすべてのスピーカ層の上又はそれらの利用可能なスピーカ層の下にある場合)にレンダリングに関与しない。図示のように、入力はオーディオ入力信号18である。水平パンニングは、一方の層に対してモジュール70によって実行され、要素52、54、及び56は、他方の層のモジュール72の一部である。対応する部分ラウドスピーカ信号28及び34は、それぞれ合成器40によってラウドスピーカ信号12になるように合成され、さらに決定部30によって提供されるパンニングゲインを使用して垂直パンニングを実行する。部分ラウドスピーカ信号34及び28がそれぞれ対応するスピーカセット36及び26は、異なる層に属するため、図7に示すように互いに分離していてもよい。しかしながら、スピーカ14の「層」への関連付けは、あるスピーカ14が異なる層に関連付けられるようなものであってもよいことに留意されたい。言い換えると、スピーカ14をスピーカの層グループにグループ化することは、それらが重なり合うようにしてもよい。ただし、図7の図示は一例であり、変形してもよい。
図7の個別の要素の協働については、以下でより詳細に説明する。図示及び上述のように、パンニング、水平パンニング及び垂直パンニングの両方は、位置情報21によって制御される。それは、別個のデータストリーム、すなわちオーディオ入力信号18に対して別個の追加情報の形態などの追加情報として、例えば、オーディオ情報の少なくとも1つのチャネル及び意図された位置を定義する関連するメタデータを含むオーディオオブジェクトとして配信することができる。オーディオ入力信号18がメタデータのないマルチチャネルファイルである場合、オーディオ信号に含まれる異なる要素の意図された位置21は、信号が生成された既知のターゲットラウドスピーカレイアウトが与えられた信号分析に基づいて推定及び抽出することができる。例えば、オーディオ入力信号18は、上部ラウドスピーカ及び/又は下部ラウドスピーカ位置に関連付けられたチャネルを含んでもよいが、利用可能なスピーカ14はそのようなスピーカを有していない。その場合、意図された仮想位置21は、そのチャネルのスピーカの位置である。他の例も当然利用可能である。これは、搬送されるすべてのチャネルに対して行われ得る。チャネルが関係する相互スピーカ位置は、レンダリング装置によって維持されてもよい。
一実施形態によれば、両方の水平パンニング、すなわち、部分ラウドスピーカ信号28に関する1つ又は複数のモジュール70と、要素52から56による他の部分ラウドスピーカ信号34に関する一方とは、パンニングに同じ方位角を使用する。すなわち、両方の層で同じ方位角が使用される。言い換えれば、水平パンニングは、図4に示す投影された仮想位置106が互いに垂直投影で一致するように行われる。当然ながら、これは異なる方法で実施されてもよい。制限は必要なく、異なる層に対して異なる方位角を使用してもよい。
本明細書で論じる実施形態の有益な特徴は、それらが広範な初期化を必要としないという事実である。代わりに、パンニングパラメータは、与えられた、又は変化する聴取者及びラウドスピーカの座標又は位置から直接計算される。レンダリングの初期化は、ラウドスピーカの所定のペア、トリプレット、又はクワドルプレットに依存しない。
図8は、水平及び垂直パンニングの両方が、聴取者の位置に関する情報、すなわち情報110によって制御され得ることを示している。より正確には、意図された仮想位置21が、聴取者100がレンダリングされるオーディオオブジェクトを知覚する特定の方向を示す立体角によって表されると仮定する。聴取者の位置110に応じて、仮想上部/下部スピーカの位置を船尾位置に適応させること以外に、もしあれば、聴取者の位置に依存する水平パンニングを適用して、聴取者のこの知覚方向を達成することができる。聴取者位置情報110が水平位置だけでなく、聴取者の耳の位置の高さなどの高さで聴取者100の位置を示す場合も同様である。
上記の説明から明らかなように、本出願の実施形態による装置は、利用可能なラウドスピーカ14が1つの層にのみ配置されるラウドスピーカセットアップに対応することに限定されない。後者の例は、図3~図5bに示されている。むしろ、装置に利用可能なラウドスピーカ14は、異なる層に関連付けられてもよい。上述した一方の部分ラウドスピーカ信号34及び他方の部分ラウドスピーカ信号28、又は異なる言い方をすれば、モジュール70及び72がそれぞれ直列に接続される2つの経路は、そのようなスピーカ層のうちの1つ又は複数に関連付けられてもよい。以下の説明では、各々が1つのスピーカ層に関連付けられているものとする。すなわち、各々が1つの層を形成するラウドスピーカの1つのグループに関連付けられる。いくつかのラウドスピーカは、以下の説明から明らかになるように、複数の層に関連付けられてもよく、既に上述した。個別の経路、すなわちモジュール70の経路及びモジュール72の経路に対する層の属性又は関連付けは、固定されてもよく、又は意図された仮想位置21及び/又は聴取者位置110に適応されてもよい。これは既に上述されている:利用可能な3つ以上の層がある場合、意図された仮想位置がこれらの層のペアの間にあり、これらの層が2つの経路に関連付けられている場合には、2つの層を選択し得る。意図された仮想位置21が利用可能なすべての層を超え、利用可能な実際の上部又は下部スピーカがない場合、意図された仮想位置に最も近い最外層が、両方の経路が使用されるラウドスピーカ層として選択される。
任意のラウドスピーカセットアップを考えると、初期化は、各ラウドスピーカ14が以下のカテゴリのうちの1つ又は複数に属するものとして分類されることのみを含んでもよい。
層1:
通常、このラウドスピーカ層は、オブジェクトを水平(座った聴取者の耳の高さの略水平)にパンニングするために使用される。
層2~N:
任意選択で、高さ(上部又は下部)層のラウドスピーカなど、第2の層のラウドスピーカを定義することができる。これらは、層1の垂直上方又は下方の層である。したがって、ラウドスピーカ層は3つ以上であってもよい。耳の高さにある層1と、任意の他の層又は他の層との区別は任意である。
上部:
垂直上方向が再生されるラウドスピーカ。これは、専用ラウドスピーカ、又は他の層のラウドスピーカのサブセットであり得る。
下部:
垂直下方向が再生されるラウドスピーカ。これは、専用ラウドスピーカ、又は他の層のサブセットであり得る。
上記の説明は、規則的なセットアップに限定されず、規則的とは、例えば、すべての層に等しい数のラウドスピーカが存在し、それらの間の角度/距離が等しいこと、又はすべての層が聴取者を完全に取り囲むこと、又はすべての層が聴取者から見て正確に同じ垂直角度で配置されたラウドスピーカを有することを意味する。
実際には、前述したように、任意のセットアップを使用することができる。異なるラウドスピーカは、異なる/任意の方位角、及び異なる/任意の仰角(すなわち、異なる高さ)に配置することができる。1つの層の一部であると考えられるラウドスピーカは、必ずしも平面内にある必要はない。それらの垂直位置の変動が許容される。
図9及び図10は、実現例/分類例を示す。これらの図は、異なる利用可能なラウドスピーカを異なる層に割り当てる手順を例示するものとする。これらは単なる例であり、同じ状況における異なるマッピングが可能であり、ユーザの好みに従う。
図9は、5.0ラウドスピーカセットアップを使用した分類を示す。ここでは、以下の図と同様に、利用可能なスピーカ14を示すために簡単にするために以下の識別子が使用される。聴取者のほぼ耳の高さに設置されるセットアップを通常形成する水平に配置されたラウドスピーカは、「M_X」の形式でラベル付けされ、ここでMはMIDDLEのインジケータであり、この層が通常、上側ラウドスピーカ層と下側ラウドスピーカ層との間にあることを示唆している。したがって、これは上記の命名法における層1である。Xは、この層内の特定のラウドスピーカを識別し、例えば、M_Lは「中間層の前方左ラウドスピーカ」になる。同様に、上位層ラウドスピーカを「U_X」として識別するので、「U_Rs」は「上位層の右サラウンドラウドスピーカ」になる。下位層のラウドスピーカは「L_X」で識別される。したがって、U及びLスピーカは、上記の命名法における層2~層Nのスピーカである。天井(すなわち、聴取者の真上、又はラウドスピーカアレイの中心の真上のいずれか)に取り付けられたラウドスピーカは、「上」と示されている。それぞれ、「下」という用語は、聴取者の真下、又はラウドスピーカアレイの中心の真下のラウドスピーカに使用される。図9では、スピーカの分類は次のようになる
Figure 2024507945000002
モジュール70による水平パンニングは、利用可能なすべてのラウドスピーカ(層1)を使用して行われる。上方向及び下方向は、中心(C)を除くすべてのラウドスピーカにわたってモジュール72を使用してレンダリングされる。すなわち、セット36は、中心を除くすべてのラウドスピーカを含み、セット28は、すべてのスピーカを包含する。
これはこの例についての明示的な決定であることに留意されたい。当然ながら、中心ラウドスピーカを高さレンダリングに使用することもできる。
5.0+2Hラウドスピーカセットアップを使用するさらなる分類を図10に示す。ここで、利用可能なセットアップには2つの層が存在し、分類又は関連付けは次のようになる
Figure 2024507945000003
この例では、中間層サラウンドラウドスピーカ(M_Ls及びM_Rs)が両方の層(層1及び層2)に使用されているが、これは、そうでなければ層2が聴取者を囲まないためである。すなわち、層1及び層2スピーカは、図7及び図8に示すように層内パンニングに使用され、例えば、セット26の層1及びセット36の層2のスピーカ、又はその逆であり、意図された仮想位置が両方の層の外側になるとすぐに、その上部又は下部に、分類「上」に属するスピーカは、アクティブな等化58を有するセット36に使用され、セット26の層2スピーカを使用するか、又は分類「下」スピーカは、アクティブな等化58を有するセット36に使用され、セット26の層1スピーカを使用する。
このセットアップにおける代替的な分類は、層2なしでレンダリングを決定することであり得る。上は、上昇したラウドスピーカU_L及びU_Rのみを使用してレンダリングすることができ、代替的に、上述したように、U_L、U_R、M_Ls、及びM_Rsの組合せによってレンダリングすることもできる。
さらなる例は、例えば、最下層ラウドスピーカを用いて、又はより多くの又はより少ない上昇ラウドスピーカを用いて、又はより多くの又はより少ないラウドスピーカを中間層に用いて、又はより任意の又は不規則なラウドスピーカセットアップを用いて容易に導出することができる。
以下では、3Dでオブジェクトをレンダリングする場合について、オブジェクトが2つの物理的に存在するラウドスピーカ層(異なる高さにある)の間にある方向(聴取者から見て)にパンニングされる場合を例に説明する。これは、図7及び図8に関して既に論じたが、図11及び図12においてより明確に示されている。ここでは、5.0+4Hラウドスピーカセットアップが例示的に示されている。聴取者100の位置及びオーディオオブジェクト104の位置の例が示されている。スピーカは、異なるタイプの線を使用して区別された2つの別個の層に分類され、第2の層は破線であり、第1の層は実線である。
オブジェクトは、異なるゲイン24を有するこの層内のラウドスピーカにオブジェクト信号を与えることによって、例えば、図11の最下層グレードット位置106に振幅パンニングされるようにオブジェクト信号をM_L及びM_Lsに与えることによって、第1の層内で振幅パンニングされる。同様に、オブジェクトは、図11の高さ層グレードット位置106まで第2の層で振幅パンニングされる。図から分かるように、位置106及び106は、それらが互いに垂直に重なるように、及び/又は意図された位置104の垂直投影と位置106及び106も一致するように選択し得る。
図12は、層間に振幅パンニングを適用することによって最終的なオブジェクト方向をレンダリングすることを示しており、すなわち垂直パンニングを示している。位置106及び106にある仮想オブジェクトを仮想ラウドスピーカと考えると、要素30及び40による振幅パンニングが適用され、オブジェクトの方向に現れる2つの層間の意図された位置104に仮想オブジェクトがレンダリングされる。層間のこの振幅パンニングの結果は、2つの層の信号34及び28が重み付けされる2つのゲイン係数32である。
(実際の)ラウドスピーカ層間の水平パンニングに対するこの重み付けは、垂直パンニングにおいて異なる周波数範囲が異なる高さで知覚され得るという影響を補償するために、周波数にさらに依存し得る[13]。
層又は最外層の上方又は下方にオブジェクトをレンダリングすることは、上記の説明に対する追加情報として、ここでさらに検査される。
オブジェクトは、図11及び図12に関して説明したように、2つの層間の方向の範囲内にない方向又は位置104を有し得る。この場合について、図13及び図14を参照して説明する。オブジェクトの意図された位置104は、(物理的に存在する)層の上方又は下方、ここでは任意の利用可能な層の上、特に破線で示された上側の層の上である。一例として、オブジェクトは、図11及び図12においても一例のセットアップとして使用されている5.0+4Hセットアップの最上部ラウドスピーカ層の上方の方向/位置104を有する。
この場合、水平振幅パンニングは、モジュール70によって高さ層に適用され、その層内のオブジェクトをレンダリングする。結果として得られるレンダリングされたオブジェクトの位置106は、図13において高さ層グレードット位置106として示されている。
次に、図14においてグレードット位置106として示される、高さ層の位置106と垂直方向/位置106との間にパンニングが適用される。結果として得られる3Dパンニングされた仮想オブジェクトは、グレードット位置104’として示される。
垂直上又は垂直下方向に実際のラウドスピーカは存在しないので、106における垂直信号は、それぞれ上又は下のサウンドの色調を模倣するようにモジュール58によって等化される(等化の詳細については後述の説明を参照されたい)。次いで、垂直信号は、上方向/下方向に指定されたラウドスピーカ、すなわちセット36に与えられる。
仮想上部ラウドスピーカ又は下部ラウドスピーカ102のレンダリングに関して、以下のことが言える。
一般に、仮想垂直上部ラウドスピーカ又は下部ラウドスピーカをレンダリングするために、異なるアプローチを選択することができる。
一般に、以下2つの異なるアプローチを選択することができる。
(1)110で示すように、仮想上部/下部は常に実際の聴取位置の上にレンダリングされる。
(2)仮想上部/下部スピーカは常に、(メイン)ラウドスピーカアレイの「スイートスポット」又は中心の上にレンダリングされる。
適用例として、(1)は、聴取者の位置を追跡できる場合に有利に選択することができ、(2)は、聴取者の追跡の可能性が利用できない場合に選択することができる。
単純な実装では、上部レンダリング又は下部レンダリングのために選択された各ラウドスピーカに同じゲインが使用され、すなわち、ゲイン54は等しくなるように選択される。このスキームはうまく機能する(これは、例えば、最も単純な実装として使用することができ、聴取者の位置が追跡されず、そのように知られていない場合に特に有用である。)。
特に、聴取者がラウドスピーカセットアップ内の中央に位置していない場合、次の考慮事項により、上部レンダリング及び下部レンダリングを改善することができる。
・高さ層があり、その高さ層の上でパンニングしたい場合、(高さ層)ラウドスピーカ36に適用されるゲイン係数54を上方向に使用し得り、結果として得られるパン方向ベクトルは垂直に上を向く(又は代替的に仮想上部ラウドスピーカ位置102に向かう)、すなわち102が聴取者100の真上になる。
・下部ラウドスピーカ層がある場合の下方向についても同様である。
・高さ層がなく、水平層の上でパンニングしたい場合、振幅パンニングベクトルが消える(水平方向バイアスなし)ように、ラウドスピーカにゲインが適用される。より単純には、聴取者における信号振幅又は電力が各上部/下部レンダリングラウドスピーカについて同じになるように、ラウドスピーカにゲイン54を適用することができる。
・下部ラウドスピーカ層がない場合の下方向についても同様である。
以下では、さらなる詳細を使用してイコライザ(又はスペクトル整形器)58をさらに例示する。聴取者100が水平面内で音源を位置特定することを可能にする主なキューは、左右の耳入力信号の差(両耳間時間差(ITD)及び両耳間レベル差(ILD))である。音源の垂直位置を推定するための主なキューは、聴取者の頭部、胴体、及び耳介によって生成される反射によるスペクトル変動である。そのようなキューは、上記の説明では心理音響キューと呼ばれるモノラルキュー(MC)と呼ばれることが多い。
各個人の固有の身体特徴及び考慮される入射方向に起因して発生する特定のILD、ITD、及びMCは、一般に、頭部伝達関数(HRTF)という用語の下でまとめられる。特に、MCは高度に個別的である。それでも、一般に高さ知覚に影響を及ぼすいくつかの共通の特徴がある。
1つの方向から受信される特定のソース信号の周波数コンテンツを整形することによって、このサウンドが実際に同じ錯乱円錐上の異なる仰角及び/又は前後方向から来るという錯覚をサポートすることができる。これは、MCの変更に対応し、イコライザ(EQ)58の目的である。
仮想上部ラウドスピーカ/下部ラウドスピーカを使用し、これらの信号を等化するという概念の単純だがうまく機能する実装形態は、それぞれ上方向及び下方向に特定の静的EQを使用する。
図15は、そのようなヒューリスティックに決定された2つのイコライザを例として示しており、又は異なる言い方をすれば、仮想上部スピーカレンダリングのための整形関数60a及び仮想下部スピーカレンダリングのための整形関数60bを示している。これらは、聴取者の上方又は下方の音源を暗示するキューに対応する、測定されたHRTFデータの分析によって決定されている。多くの対象のHRTFを考慮し、対象間で過度に変動するスペクトル変化を無視することによってEQを決定した。
上方向用のイコライザ60aは、通常、1つ又は複数のノッチ及び/又はピークを有する。通常、1kHz未満にノッチがあり、より高い周波数に1つ又は複数のピークがある。下方向用のイコライザ60bは、「ボディシャドウイング」の効果があり、全体的に高周波が減衰される。言い換えれば、関数60aにより、第2の部分ラウドスピーカ信号34は、オーディオ入力信号18に対して、200Hzから1000Hzまでのノッチスペクトル範囲120で減衰され、ピークスペクトル範囲122及び122のうちの1つ又は複数の範囲内で増幅され、ここでは例示的に、1000kHzから10kHzまでの間にある2つが存在する。関数60bにより、第2の部分ラウドスピーカ信号34は、少なくとも1つのオーディオ信号に対して、1000Hzを超えるスペクトル範囲124において減衰され、スペクトル範囲124内のスペクトル部分範囲126内の減衰が低減され、この部分範囲は5kHzから10kHzの間に位置する。さらに、図15に示す関数60bは、500Hz~1kHzのスペクトル範囲128内の信号34の増幅をもたらし得る。当然ながら、範囲及び例は変更されてもよい。
聴取者に到達する音響信号の有効な全体スペクトルは、部分的に非EQ’ed信号(層内の振幅パンニング)28によって、及び部分的にEQ’ed信号(仮想上部/下部からの信号)34によって決定される。したがって、有効な全体的なEQは、単位及び上部/下部EQ60a/60bの線形結合である。このようにして、聴取者のEQingは、音源104が上部位置に向かって(又はそれに対応して下部位置に向かって)移動するにつれて徐々にフェードしていく。
EQingの量のこのような連続的なフェード/変化は、人間の聴覚システムが受信信号のスペクトルの変化を使用してそのロケーションを判断できるため、特に有益である。特に追跡されるシナリオでは、この変化を使用して、特定のスペクトル特徴が実際の信号の特性である天候、又は聴取者が移動している間の変化を区別することができ、ソースロケーションに関連する特徴として解釈することができる。
要約すると、上昇又は下降した高さのサウンド(上部及び下部)の再生を伴うオブジェクトベースのオーディオ又はマルチチャネルオーディオの再生が可能になる。任意のラウドスピーカセットアップでの入力オーディオ信号(上昇したラウドスピーカ層又は下のラウドスピーカ層での再生を目的としたサウンドを特徴とする)の再生が可能である。ここで、「ラウドスピーカセットアップ」には、サウンドバー、ラウドスピーカ内蔵TV、ブームボックス、サウンドプレート、ラウドスピーカアレイ、スマートスピーカなどのデバイス及びトポロジも含まれる。ラウドスピーカ層を高くしたり低くしたりする必要はない。したがって、ほぼすべての任意のラウドスピーカセットアップ(上昇又は下降したラウドスピーカがない場合であっても)における上又は下のサウンドの知覚効果が可能になる。
実施形態は、計算上効率的であり、その結果、(変化する)聴取者の位置が再生システムによって知られている、及び/又は(常に)追跡されるシナリオでも有益に使用することができる。
実施形態は、チャネルベースのオーディオ、オブジェクトベースのオーディオ、及びシーンベースのオーディオ(例えば、アンビソニックス)入力フォーマット信号に使用することができる。
HRTFベースのレンダリング方法と比較して、実施形態は、すべての可能な方向の特定のオブジェクト位置に対して詳細な特定のバイノーラルキューをシミュレートすることを目的としていない(広範囲にわたって達成することは困難であり得る)ことを強調する。代わりに、1つの特定の位置/方向で聴取者の上方又は下方の音源(すなわち、上方又は下方に仮想ソースを生成する)の知覚を引き起こすキューの良好なシミュレーションが生成される。したがって、それらの2方向(上部/下部102)の知覚を非常に良好/説得力のある方法で模倣しようとする。選択されたこれら2つの特定の方向の利点は、スペクトルキューに加えて、他の2つの支配的な空間オーディオキュー(すなわち、ITD及びILD)が最小であることである。理論的には、聴取者の完全に上又は下の音源ではITDもILDも発生しない、すなわち、水平方向の粒子速度は音源からの直接のサウンドではゼロに近い。したがって、水平及び垂直のパンニングによる、潜在的に上部/下部スピーカ102を仮想的にレンダリングする2段階アプローチは、安定しており、高精度につながる。
以下では、仮想ラウドスピーカの再生のために複数のラウドスピーカのラウドスピーカをラウドスピーカセット又は層に自動的に割り当てることができるいくつかのさらなる選択基準例について説明する。
〇セット/層のラウドスピーカを選択するための基準:
・好ましくは聴取者の周りを360度パンニングできるように、すべての層を選択する。
〇仮想高さチャネルの再生のためのラウドスピーカの選択:
・複数のラウドスピーカを使用する。
1)好ましくは、既に上昇位置にあるラウドスピーカを選択する
2)1)を考慮して、聴取者を取り囲むアレイを達成するために(さらなる)ラウドスピーカを選択する
・選択されたラウドスピーカは、聴取者位置で生成された音場が水平方向にゼロ又は小さい粒子速度を有するように、仮想高さチャネルの信号を再生できることを可能な限り良好にする必要がある。
・複数の適切なラウドスピーカが利用可能である場合、それらのすべてを使用することができるか、又は選択手順は以下のとおりであり得る。
・可能であれば、聴取者の周りで対称的に(理想的には可能な限り(回転対称)に)ラウドスピーカを選択する。
・意図された仮想高さ源の所望の高さ位置に向かって既に上昇した位置(上又は下)に配置されているラウドスピーカが利用可能である場合
・ラウドスピーカの仰角は可能な限り大きくなければならず、すなわち、常に最大の仰角(可能な限り垂直)を有するラウドスピーカを選択する。
〇理想的には、上記の基準を満たすようにできる限り少ないラウドスピーカを選択する。
〇当然ながら、ラウドスピーカは、ユーザが「手動で」選択/割り当てることもできる。
(場合によっては適応的な)レンダリングのための可能な入力パラメータ:
〇聴取者位置からラウドスピーカまでの角度(方位角及び仰角)
・これは、すべてのラウドスピーカが等しく遠く離れており、聴取位置で同様のレベルを生成すると仮定している。
・それらが等しく遠く離れていない場合、レベル及び/又は遅延は、聴取者の位置に等しいレベル/到着時間を達成するようにバランスをとることができる。
〇聴取者が追跡されるシナリオでは、角度に加えて各ラウドスピーカまでの距離も必要であり、その結果、レベル及び/又は遅延を適応させることができる。
・追跡されるシナリオにおけるそのようなレベル及び遅延適応はまた、仮想高さ信号の再生のための上述の「水平方向の小粒子速度」基準を達成するために有益であり得る。
結論として、本明細書に記載の実施形態は、本明細書に記載の重要な点又は態様のいずれかによって任意に補足することができる。しかしながら、本明細書に記載された重要な点及び態様は、個別に又は組み合わせて使用することができ、個別に及び組み合わせて本明細書に記載された実施形態のいずれかに導入することができることに留意されたい。後者の結果として、上記の説明は、とりわけ、複数のラウドスピーカ14におけるラウドスピーカ信号12の適用が意図された仮想位置104に少なくとも1つのオーディオオブジェクトをレンダリングするように、複数のラウドスピーカ14のラウドスピーカ信号12を生成するための装置を含み、装置は、少なくとも1つのオーディオオブジェクトを表すオーディオ入力信号18を受信するように構成されたインターフェース16と、意図された仮想位置に応じて、第1の水平層内に配置されるか、又は第1の水平層を形成する複数のラウドスピーカのラウドスピーカの第1のセット26の第1のパンニングゲイン24を決定するように構成された第1のパンニングゲイン決定部22とを備え、第1のパンニングゲイン24は、少なくとも1つのオーディオ入力信号18からの第1の部分ラウドスピーカ信号28の導出を定義し、ラウドスピーカの第1のセット26上への第1の部分ラウドスピーカ信号28の適用時の第1の仮想位置106における少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられた垂直パンニングゲイン決定部30であって、意図された仮想位置に応じて、第2の水平層内に配置される、又は第2の水平層を形成するように第1の層セットに対して垂直方向にオフセットされているラウドスピーカ第2のセット36に適用される第1の部分ラウドスピーカ信号28と第2の部分ラウドスピーカ信号34との間のパンニングのためのさらなるパンニングゲイン32を決定するように構成されており、第1の仮想位置106と第2の位置102との間をパンニングするように第2の位置102における少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられ、装置は、第1のパンニングゲイン24及びさらなるパンニングゲイン32を使用してオーディオ入力信号18からラウドスピーカ信号12を合成するように構成されている。意図された仮想位置に応じて、ラウドスピーカの第2のセットの第2のパンニングゲイン54を決定するように構成された第2のパンニングゲイン決定部52も備えられ、第2のパンニングゲイン54は、少なくとも1つのオーディオ入力信号からの第2の部分ラウドスピーカ信号34の導出を定義し、装置は、第1のパンニングゲイン及び第2のパンニングゲイン並びにさらなるパンニングゲインを使用してオーディオ入力信号18からラウドスピーカ信号12を合成するように構成される。第1のパンニングゲイン及び第2のパンニングゲイン決定部22、52は、第1の及び第2の層セットが、複数のラウドスピーカが分配されている水平層の中で、それらの間に垂直な意図された仮想位置104を有するように、複数のラウドスピーカのうちのラウドスピーカの第1の及び第2のセット26、36を選択するように構成されている。ラウドスピーカの第1のセット26及びラウドスピーカの第2のセット36は部分的に重なり合ってもよく、すなわち、一方のラウドスピーカが両方のセット26及び36に含まれてもよいことに留意されたい。より正確には、複数のラウドスピーカは、水平層ごとに、その水平層に属するラウドスピーカが聴取者位置を取り囲み、水平に(すなわち、水平投影である)、又は別の言い方をすれば、水平に、聴取者位置の周りを360度パンニングすることを可能にするように、水平層に分配されてもよく、この状況を達成するために、例えば、少なくとも1つのペアの水平層がそれらのラウドスピーカのうちの1つ又は複数を共有してもよい。すなわち、水平層の水平度及び垂直方向のオフセットは、少なくとも1つのペアの水平層などについて、1つ又は複数のラウドスピーカがそれぞれ複数の水平層に属する場合がある程度まで抽象化されてもよい。さらに言い換えれば、上記の説明は、とりわけ、複数のラウドスピーカ14におけるラウドスピーカ信号12の適用が意図された仮想位置104に少なくとも1つのオーディオオブジェクトをレンダリングするように、複数のラウドスピーカ14のラウドスピーカ信号12を生成するための装置を含み、複数のラウドスピーカは、1つ又は複数の水平層に分配され、装置は、少なくとも1つのオーディオオブジェクトを表すオーディオ入力信号18を受信するように構成されたインターフェース16と、意図された仮想位置に応じて、複数のラウドスピーカのうちのラウドスピーカの第1のセット26の第1のパンニングゲイン24を決定し、第1のパンニングゲイン24を使用して少なくとも1つのオーディオ入力信号18から第1の部分ラウドスピーカ信号28を導出するように構成された第1のラウドスピーカ信号セット決定部70とを備え、ラウドスピーカの第1のセット26上への第1の部分ラウドスピーカ信号の適用時の第1の仮想位置106における少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられた第2のラウドスピーカ信号セット決定部72と、スペクトル整形により、少なくとも1つのオーディオ入力信号18から第2の部分ラウドスピーカ信号34を導出するように構成された第2のラウドスピーカ信号セット決定部72であって、第2の部分ラウドスピーカ信号34は、第2の部分ラウドスピーカ信号34のラウドスピーカの第2のセット36上への適用時の第2の仮想位置102における少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられ、第2の仮想位置は、1つ又は複数の水平層の上方又は下方にある、第2のラウドスピーカ信号セット決定部72と、意図された仮想位置に応じて、第1の仮想位置と第2の仮想位置との間をパンニングするように第1の部分ラウドスピーカ信号のためのさらなるパンニングゲイン32を決定するように構成された垂直パンニングゲイン決定部30とを含み、さらなるパンニングゲイン32を使用して第1の部分ラウドスピーカ信号及び第2の部分ラウドスピーカ信号からラウドスピーカ信号を合成するように構成された合成器40とを含む。ここでも、ラウドスピーカの第1のセット26及びラウドスピーカの第2のセット36は部分的に重なり合ってもよく、すなわち、一方のラウドスピーカが両方のセット26及び36に含まれてもよいことに留意されたい。より正確には、複数のラウドスピーカは、各水平層について、その水平層に属するラウドスピーカが聴取者位置を取り囲み、水平に(すなわち、水平投影である)、又は別の言い方をすれば、水平に、聴取者位置の周りを360度パンニングすることを可能にするように、水平層上に分配されてもよく、この状況を達成するために、例えば、少なくとも1つのペアの水平層は、それらのラウドスピーカのうちの1つ又は複数を共有してもよい。すなわち、水平層の水平度及び垂直方向のオフセットは、少なくとも1つのペアの水平層などについて、1つ又は複数のラウドスピーカがそれぞれ水平層よりも多くに属する場合がある程度まで抽象化し得る。水平層のうちの最も高いものの上又は最も低いものの下の仮想位置102である第2の位置をもたらすために、少なくとも1つのオーディオ信号18から第2の部分ラウドスピーカ信号34を導出するためのスペクトル整形58の使用など、上記及び後続の特許請求の範囲で述べられている他のすべての変更も実現可能である。
いくつかの態様を装置の文脈で説明してきたが、これらの態様が対応する方法の説明も表すことは明らかであり、デバイス又はその一部は方法ステップ又は方法ステップの特徴に対応する。同様に、方法ステップの文脈で説明される態様はまた、対応する装置又は装置の一部、又は対応する装置のアイテム又は特徴の説明を表す。方法ステップの一部又はすべては、例えばマイクロプロセッサ、プログラマブルコンピュータ、又は電子回路などのハードウェア装置によって(又は使用して)実行されてもよい。いくつかの実施形態では、最も重要な方法ステップの1つ又は複数は、そのような装置によって実行されてもよい。
特定の実装要件に応じて、本発明の実施形態は、ハードウェア又はソフトウェアで実装することができる。実装は、電子的に読み取り可能な制御信号が格納されたデジタル記憶媒体、例えばフロッピーディスク、DVD、Blu-Ray、CD、ROM、PROM、EPROM、EEPROM又はフラッシュメモリを使用して実行することができ、これらはそれぞれの方法が実行されるようにプログラム可能なコンピュータシステムと協働する(又は協働することができる)。したがって、デジタル記憶媒体はコンピュータ可読なものであってもよい。
本発明によるいくつかの実施形態は、本明細書に記載の方法のうちの1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実装することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法のうちの1つを実行するように動作する。プログラムコードは、例えば、機械可読キャリアに格納し得る。
他の実施形態は、機械可読キャリアに格納された、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを含む。
言い換えれば、したがって、本発明の方法の一実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書に記載の方法のうちの1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを記録して含むデータキャリア(又はデジタル記憶媒体、又はコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、又は記録された媒体は、通常、有形及び/又は非一時的である。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを表すデータストリーム又は信号シーケンスである。データストリーム又は信号シーケンスは、例えば、データ通信接続を介して、例えばインターネットを介して転送されるように構成し得る。
さらなる実施形態は、本明細書に記載の方法のうちの1つを実行するように構成又は適応された処理手段、例えばコンピュータ又はプログラマブル論理デバイスを含む。
さらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
本発明によるさらなる実施形態は、本明細書に記載の方法のうちの1つを実行するためのコンピュータプログラムを受信機に転送する(例えば、電子的又は光学的に)ように構成された装置又はシステムを備える。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであってもよい。装置又はシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバを備えてもよい。
いくつかの実施形態では、プログラマブル論理デバイス(例えば、フィールドプログラマブルゲートアレイ)を使用して、本明細書に記載の方法の機能の一部又はすべてを実行し得る。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法のうちの1つを実行するためにマイクロプロセッサと協働し得る。一般に、方法は、任意のハードウェア装置によって実行されることが好ましい。
本明細書に記載の装置は、ハードウェア装置を使用して、又はコンピュータを使用して、又はハードウェア装置とコンピュータとの組合せを使用して実装され得る。
本明細書に記載の装置、又は本明細書に記載の装置の任意の構成要素は、少なくとも部分的にハードウェア及び/又はソフトウェアで実装されてもよい。
本明細書に記載の方法は、ハードウェア装置を使用して、又はコンピュータを使用して、又はハードウェア装置とコンピュータとの組合せを使用して実行され得る。
本明細書に記載の方法、又は本明細書に記載の方法の任意の部分は、少なくとも部分的にハードウェア及び/又はソフトウェアによって実行されてもよい。
上述の実施形態は、本発明の原理の単なる例示である。本明細書に記載の構成及び詳細の修正及び変形は、当業者には明らかであることが理解される。したがって、本明細書の実施形態の説明及び説明として提示された特定の詳細によってではなく、差し迫った特許請求の範囲によってのみ限定されることが意図される。
参考文献
[1] A.B.S and S.M.R.Apparent sound source translator.February 1966.US Patent 3,236,949
[2] Philip A Nelson,Hareo Hamada,and Stephen J Elliott.Adaptive inverse filters for stereophonic sound reproduction.IEEE Transactions on Signal Processing,40(7):1621-
1632,1992
[3] P.A.Nelson and J.F.W.Rose.Errors in two-point sound reproduction.The Journal of the Acoustical Society of America,118(1):193,2005
[4] Takashi Takeuchi and Philip A.Nelson.Optimal source distribution for binaural syn-
thesis over loudspeakers.The Journal of the Acoustical Society of America,112(6):2786,2002
[5] Hironori Tokuno,Ole Kirkeby,Philip A Nelson,and Hareo Hamada.Inverse filter of sound reproduction systems using regularization.IEICE Transactions on Fundamen-
tals of Electronics,Communications and Computer Sciences,80(5):809-820,1997
[6] Ole Kirkeby,Philip A.Nelson,Hareo Hamada,and Felipe Orduna-Bustamante.Fast deconvolution of multichannel systems using regularization.IEEE Transactions on Speech and Audio Processing,6(2):189-194,1998
[7] Edgar Y Choueiri.Optimal crosstalk cancellation for binaural audio with two loud-
speakers.Princeton University,page 28,2008
[8] B.B.Bauer.Stereophonic earphones and binaural loudspeakers.J.Audio Eng.Soc.,9:148-151,1961
[9] J.Huopaniemi.Virtual Acoustics and 3D Sound in Multimedia Signal Processing.
PhD thesis,Laboratory of Acoustics and Audio Signal Processing,Helsinki University of Technology,Finland,1999.Rep.53
[10] Hyunkook Lee.Sound source and loudspeaker base angle dependency of phantom image elevation effect.J.Audio Eng.Soc,65(9):733-748,2017
[11] Hyunkook Lee,Dale Johnson,and Maksims Mironovs.Virtual hemispherical amplitude panning(vhap):A method for 3d panning without elevated loudspeakers.In Audio Engineering Society Convention 144,May 2018
[12] Young Woo Lee et al.,“Virtual Height Speaker Rendering for Samsung 10.2-channel Vertical Surround System”.In Audio Engineering Society Convention 131,October 2011
[13] Reinhard Gretzki and Andreas Silzle,“A new method for elevation panning reducing the size of the resulting auditory events”,TecniAcustica,Bilbao,2003
[14] Christian Borss,“A Polygon-Based Panning Method for 3D Loudspeaker Setups,” Audio Engineering Society Convention 137,Oct,2014
[15] MPEG-H Standard,ISO/IEC 23008-3:2015(E).

Claims (46)

  1. 複数のラウドスピーカ(14)におけるラウドスピーカ信号(12)の適用が少なくとも1つのオーディオオブジェクトを意図された仮想位置(104)にレンダリングするように、前記複数のラウドスピーカ(14)のための前記ラウドスピーカ信号(12)を生成するための装置であって、前記装置が、
    前記少なくとも1つのオーディオオブジェクトを表すオーディオ入力信号(18)を受信するように構成されたインターフェース(16)と、
    前記意図された仮想位置に応じて、1つ又は複数の第1の水平層の第1の層セット内に配置された前記複数のラウドスピーカのうちのラウドスピーカの第1のセット(26)の第1のパンニングゲイン(24)を決定するように構成された第1のパンニングゲイン決定部(22)であって、前記第1のパンニングゲイン(24)が、前記少なくとも1つのオーディオ入力信号(18)からの第1の部分ラウドスピーカ信号(28)の導出を定義し、前記ラウドスピーカの第1のセット(26)上への前記第1の部分ラウドスピーカ信号(28)の適用時の第1の仮想位置(106)における前記少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられている第1のパンニングゲイン決定部(22)と、
    前記意図された仮想位置に応じて、前記第1の部分ラウドスピーカ信号(28)と、前記第1の層セットに対して垂直方向にオフセットされた1つ又は複数のラウドスピーカの第2のセット(36)に適用されることになる1つ又は複数の第2の部分ラウドスピーカ信号(34)との間のパンニングのためのさらなるパンニングゲイン(32)を決定するように構成され、前記第1の仮想位置(106)と前記第2の位置(102)との間をパンニングするように第2の位置(102)における前記少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられた垂直パンニングゲイン決定部(30)と、を備え
    前記装置が、前記第1のパンニングゲイン(24)及び前記さらなるパンニングゲイン(32)を使用して前記オーディオ入力信号(18)から前記ラウドスピーカ信号(12)を合成するように構成されている、装置。
  2. 前記1つ又は複数のラウドスピーカの第2のセット(36)が、複数のラウドスピーカを備え、前記1つ又は複数の第2の部分ラウドスピーカ信号(34)が、複数の第2の部分ラウドスピーカ信号を含み、前記装置が、
    前記意図された仮想位置に応じて、前記ラウドスピーカの第2のセットの第2のパンニングゲイン(54)を決定するように構成された第2のパンニングゲイン決定部(52)であって、前記第2のパンニングゲイン(54)は、前記少なくとも1つのオーディオ入力信号からの前記第2の部分ラウドスピーカ信号(34)の導出を定義する、第2のパンニングゲイン決定部(52)と、
    前記装置は、前記第1のパンニングゲイン及び第2のパンニングゲイン並びに前記さらなるパンニングゲインを使用して前記オーディオ入力信号(18)から前記ラウドスピーカ信号(12)を合成するように構成されている、請求項1に記載の装置。
  3. 前記ラウドスピーカの第2のセット(36)が、1つ又は複数の水平層からなる第2の層セット内にあり、前記第1の層セット及び第2の層セットが、互いに垂直方向にオフセットされている、
    請求項2に記載の装置。
  4. 前記ラウドスピーカの第2のセット(36)が、1つ又は複数の水平層からなる第2の層セット内にあり、前記第1の層セット及び第2の層セットが、前記意図された仮想位置(104)を垂直に挟んで互いに垂直方向にオフセットされている、
    請求項2又は3に記載の装置。
  5. 前記ラウドスピーカの第2のセット(36)が、1つ又は複数の水平層からなる第2の層セット内にあり、前記第1のパンニングゲイン及び第2のパンニングゲイン決定部(22、52)が、前記第1の層セット及び第2の層セットが、前記複数のラウドスピーカが分配されている水平層のうち、前記意図された仮想位置(104)に垂直に最も近く、前記意図された仮想位置(104)を垂直に挟んで互いに垂直方向にオフセットされるように、前記複数のラウドスピーカの前記ラウドスピーカの第1のセット及び第2のセット(26、36)を選択するように構成されている、
    請求項2から4のいずれか一項に記載の装置。
  6. 前記第1のパンニングゲイン及び第2のパンニングゲイン決定部(22、52)が、前記第1の仮想位置(106)と前記第2の位置(106)とが垂直投影において一致するように、前記第1のパンニングゲイン及び第2のパンニングゲイン(24、54)を導出するように構成されている、請求項2から5のいずれか一項に記載の装置。
  7. 前記第2の位置が前記第2の層セットの上方又は下方の仮想位置(102)であるように、スペクトル整形(58)によって前記少なくとも1つのオーディオ信号(18)から前記第2の部分ラウドスピーカ信号(34)を導出するようにさらに構成されている、
    請求項2又は3に記載の装置。
  8. 前記スペクトル整形(58)が、前記第2の位置(102)からの知覚方向に沿って頭部伝達関数HRTFの特性を模倣する、
    請求項7に記載の装置。
  9. 前記第2の位置が前記第2の層セットの垂直上方にあるように、かつ前記少なくとも1つのオーディオ入力信号に対して、前記第2の部分ラウドスピーカ信号(34)が、200Hzから1000Hzまでのノッチスペクトル範囲(120)で減衰され、1000kHzから10kHzまでのピークスペクトル範囲(122、122)のうちの1つ又は複数の範囲内で増幅されるように、前記スペクトル整形(58)を実行するように、又は、
    前記第2の位置が前記第2の層セットの垂直下方にあり、前記第2の部分ラウドスピーカ信号(34)が、前記少なくとも1つのオーディオ信号に対して、1000Hzより上のスペクトル範囲で減衰するように、前記スペクトル整形を実行するように構成されている、
    請求項7又は8に記載の装置。
  10. 前記第2の位置が前記第2の層セットの垂直上方にあるように、かつ前記少なくとも1つのオーディオ入力信号に対して、前記第2の部分ラウドスピーカ信号(34)が、200Hzから1000Hzまでのノッチスペクトル範囲(120)で減衰され、1000kHzから10kHzまでのピークスペクトル範囲(122、122)のうちの1つ又は複数の範囲内で増幅されるように、前記スペクトル整形(58)を実行するように、又は、
    前記第2の位置が前記第2の層セットの垂直下方にあり、前記第2の部分ラウドスピーカ信号(34)が、前記少なくとも1つのオーディオ信号に対して、1000Hzより上のスペクトル範囲(124)で減衰され、前記スペクトル範囲内のスペクトル部分範囲(126)内の減衰が中間的に低減され、5kHzから10kHzの間に位置し、500Hzから1kHzの間で増幅される(128)ように、前記スペクトル整形を実行するように構成されている、
    請求項7から9のいずれか一項に記載の装置。
  11. 前記意図された仮想位置(104)が前記第2の層セットの垂直上方にある場合、前記第2の位置を前記第2の層セットの垂直上方になるように位置決めし、前記第2の部分ラウドスピーカ信号が、前記少なくとも1つのオーディオ信号に対して、200から1000Hzのノッチスペクトル範囲で減衰され、1000から10kHzの間のピークスペクトル範囲のうちの1つ又は複数の範囲内で増幅されるように、前記スペクトル整形を実行し、
    前記意図された仮想位置が前記第2の層セットの垂直下方にある場合、前記第2の位置を前記第2の層セットの垂直下方に位置させ、前記第2の部分ラウドスピーカ信号が、前記少なくとも1つのオーディオ信号に対して、1000Hzを超えるスペクトル範囲で減衰されるように、前記スペクトル整形を実行するようにさらに構成されている、
    請求項7から10のいずれか一項に記載の装置。
  12. 前記複数のラウドスピーカ(14)が、前記ラウドスピーカが水平層に関連付けられるセットアップを形成し、前記装置が、前記意図された仮想位置の変化に応じて、
    前記意図された仮想位置が2つの水平層の間にある場合、
    前記第1の層セットを前記2つの水平層のうちの第1の水平層とし、前記第2の層セットを前記2つの水平層のうちの第2の水平層とするように選択し、前記第1の水平層に関連付けられたラウドスピーカのうちの前記第1のセット(26)と、前記第2の水平層に関連付けられたラウドスピーカのうちの前記第2のセット(36)とを選択し、前記第1のパンニングゲイン及び第2のパンニングゲイン決定部(22、52)が、前記意図された仮想位置に応じて、前記第1のパンニングゲイン及び第2のパンニングゲインを決定するように構成されており、前記スペクトル整形(58)が、前記第1の仮想位置が前記第1の水平層内にあり、前記第2の仮想位置が前記第2の水平層内にあるようにオフにされ、
    前記意図された仮想位置が水平層の上方又は下方に向かってすべての水平層に対して垂直方向にオフセットされている場合、
    前記第1の層セット及び前記第2の層セットを、前記意図された仮想位置に最も近い前記水平層の最外層であるように選択し、前記最外層に関連付けられたラウドスピーカのうちの前記第1のセット(26)及び前記第2のセット(36)を選択し、前記第1のパンニングゲイン決定部(22)が、前記第2の位置が、前記意図された仮想位置(104)が存在する方向に向かって前記最外層に対して垂直方向にオフセットした仮想位置(102)であるように、前記意図された仮想位置に応じて、使用されている前記第1のパンニングゲイン及び前記スペクトル整形(58)を決定するように構成されている、
    請求項7から11のいずれか一項に記載の装置。
  13. 装置であって、前記意図された仮想位置の変化に応じて、
    前記意図された仮想位置が2つの水平層の間にある場合、
    前記第1のパンニングゲイン及び第2のパンニングゲイン決定部(22、52)が、前記意図された仮想位置に応じて、前記第1の仮想位置(106)と前記第2の位置(106)とが垂直投影において一致し、前記スペクトル整形(58)がオフに切り替えられるように前記第1のパンニングゲイン及び第2のパンニングゲインを決定するように構成され、かつ/又は、
    前記意図された仮想位置が水平層の上方又は下方に向かってすべての水平層に対して垂直方向にオフセットされている場合、
    前記第1のパンニングゲイン決定部(22)が、前記意図された仮想位置に応じて、前記第1の仮想位置(106)が垂直投影において前記意図された仮想位置と一致するように前記第1のパンニングゲインを決定するように構成されている、
    請求項12に記載の装置。
  14. 前記複数のラウドスピーカ(14)が、前記ラウドスピーカが1つ又は複数の水平層に関連付けられるセットアップを形成し、前記装置が、前記1つ又は複数の水平層の数及び前記意図された仮想位置の変化に応じて、
    1つ又は複数の水平層の数が1より大きい場合、
    前記意図された仮想位置が2つの水平層の間にある場合、
    前記第1の層セットを前記2つの水平層のうちの第1の水平層とし、前記第2の層セットを前記2つの水平層のうちの第2の水平層とするように選択し、前記第1の水平層に関連付けられたラウドスピーカのうちの前記第1のセット(26)と、前記第2の水平層に関連付けられたラウドスピーカのうちの前記第2のセット(36)とを選択し、前記第1のパンニングゲイン及び第2のパンニングゲイン決定部(22、52)が、前記意図された仮想位置に応じて、前記第1のパンニングゲイン及び第2のパンニングゲインを決定するように構成されており、前記スペクトル整形(58)が、前記第1の仮想位置が前記第1の水平層内にあり、前記第2の仮想位置が前記第2の水平層内にあるようにオフにされ、
    前記意図された仮想位置が水平層の上方又は下方に向かってすべての水平層に対して垂直方向にオフセットされている場合、
    前記意図された仮想位置に最も近い前記水平層の最外層であるように前記第1の層セット及び前記第2の層セットを選択し、前記最外層に関連付けられたラウドスピーカのうちの前記第1のセット(26)及び前記第2のセット(36)を選択し、前記第1のパンニングゲイン決定部(22)が、前記意図された仮想位置に応じて、前記第1のパンニングゲイン及び前記スペクトル整形(58)が使用されることを決定するように構成され、その結果、前記第2の位置が、前記意図された仮想位置(104)がある方向に向かって前記最外層に対して垂直方向にオフセットした仮想位置(102)であり、
    1つ又は複数の水平層の数が1である場合、
    前記意図された仮想位置が前記1つの水平層内にある場合、
    純粋に前記第1の部分ラウドスピーカ信号から前記ラウドスピーカ信号(12)を合成し、
    前記意図された仮想位置が前記1つの水平層に対して垂直方向にオフセットされている場合、
    前記第1の層セット及び前記第2の層セットを前記一方の水平層になるように選択し、前記一方の水平層に関連付けられたラウドスピーカから前記第1のセット(26)及び前記第2のセット(36)を選択し、前記第1のパンニングゲイン決定部(22)が、前記意図された仮想位置に応じて、前記第1のパンニングゲイン及び前記スペクトル整形(58)が使用されることを決定するように構成され、その結果、前記第2の位置が、前記意図された仮想位置(104)がある方向に向かって前記一方の水平層に対して垂直方向にオフセットされた仮想位置(102)である、
    請求項7から13のいずれか一項に記載の装置。
  15. 装置であって、前記1つ又は複数の水平層の数及び前記意図された仮想位置の変化に応じて、
    1つ又は複数の水平層の数が1より大きい場合、
    前記意図された仮想位置が2つの水平層の間にある場合、
    前記第1のパンニングゲイン及び第2のパンニングゲイン決定部(22、52)は、前記意図された仮想位置に応じて、前記第1の仮想位置(106)と前記第2の位置(106)とが垂直投影で一致するように前記第1のパンニングゲイン及び第2のパンニングゲインを決定するように構成されており、かつ/又は、
    前記意図された仮想位置が水平層の上方又は下方に向かってすべての水平層に対して垂直方向にオフセットされている場合、
    前記第1のパンニングゲイン決定部(22)は、前記意図された仮想位置に応じて、前記第1の仮想位置(106)が垂直投影において前記意図された仮想位置と一致するように前記第1のパンニングゲインを決定するように構成されており、かつ/又は、
    1つ又は複数の水平層の数が1である場合、
    前記意図された仮想位置が前記1つの水平層に対して垂直方向にオフセットされている場合、
    前記第1のパンニングゲイン決定部(22)は、前記意図された仮想位置に応じて、前記第1の仮想位置(106)が垂直投影において前記意図された仮想位置と一致するように前記第1のパンニングゲインを決定するように構成されている、請求項14に記載の装置。
  16. 前記ラウドスピーカの第1のセット(26)は、前記1つ又は複数のラウドスピーカの第2のセット(36)に含まれ、かつ/又は、
    前記1つ又は複数のラウドスピーカの第2のセット(36)は前記ラウドスピーカの第1のセット(26)に含まれ、かつ/又は、
    前記ラウドスピーカの第1のセット(26)と前記1つ又は複数のラウドスピーカの第2のセット(36)とは一致し、かつ/又は、
    前記ラウドスピーカの第1のセット(26)及び前記1つ又は複数のラウドスピーカの第2のセット(36)は部分的に重なり合い、かつ/又は、
    前記ラウドスピーカの第1のセット(26)及び前記1つ又は複数のラウドスピーカの第2のセット(36)は分離したセットである、
    請求項1から15のいずれか一項に記載の装置。
  17. 前記意図された仮想位置の水平成分に応じて、又は前記意図された仮想位置の水平成分及び前記意図された仮想位置の垂直成分に応じて、前記複数のラウドスピーカの中から前記ラウドスピーカの第1のセット(26)を選択するように構成されており、かつ/又は、
    前記意図された仮想位置の垂直成分に応じて、又は前記意図された仮想位置の水平成分及び前記意図された仮想位置の垂直成分に応じて、前記複数のラウドスピーカのうちの前記1つ又は複数のラウドスピーカの第2のセット(36)を選択するように構成されている、
    請求項1から16のいずれか一項に記載の装置。
  18. 前記1つ又は複数のラウドスピーカの第2のセットが、前記第2の位置又は前記第2の位置を水平に取り囲み、前記ラウドスピーカの第1のセット間に水平に配置された1つ又は複数のラウドスピーカを備える、請求項1から17のいずれか一項に記載の装置。
  19. 前記第1のパンニングゲイン決定部及び/又は第2のパンニングゲイン決定部(22、52)が、聴取者の位置にさらに応じて前記第1のパンニングゲイン及び/又は第2のパンニングゲイン(24、54)を決定するように構成されている、
    請求項1から18のいずれか一項に記載の装置。
  20. 前記複数のラウドスピーカが、1つ又は複数のラウドスピーカアレイ、1つ又は複数のサウンドバー、1つ又は複数のスマートスピーカ、1つ又は複数のステレオスピーカ、1つ又は複数のサラウンドサウンドセットアップ、又は個別のラウドスピーカの1つ又は複数のセットのうちのいずれか1つ、又はそれらの組合せを指す、
    請求項1から19のいずれか一項に記載の装置。
  21. 前記オーディオ入力信号が、チャネルベースのオーディオ信号、オブジェクトベースオーディオ信号、及び/又はシーンベースのオーディオ信号のうちの1つである、
    請求項1から20のいずれか一項に記載の装置。
  22. 前記オーディオ入力信号から前記意図された仮想位置を導出するように構成された、
    請求項1から21のいずれか一項に記載の装置。
  23. 前記パンニングゲインが振幅パンニングゲインである、
    請求項1から22のいずれか一項に記載の装置。
  24. 前記オーディオ入力信号が、信号固有ラウドスピーカ位置の各々についてオーディオ信号を定義するチャネルベースのオーディオ信号であり、
    前記装置が、前記信号固有ラウドスピーカ位置についての前記オーディオ信号のうちの1つ又は複数(又は全部)の選択の各々を、前記少なくとも1つのオーディオオブジェクトのうちの1つとして扱うように構成されている、
    請求項1から23のいずれか一項に記載の装置。
  25. それぞれのオーディオ信号のラウドスピーカ位置から1つのオーディオオブジェクトの意図された仮想位置を導出するようにさらに構成されている、
    請求項24に記載の装置。
  26. 前記1つのオーディオオブジェクトの前記意図された仮想位置が、前記信号固有ラウドスピーカ位置の間の相互の位置関係が維持されるように、前記それぞれのオーディオ信号の前記ラウドスピーカ位置から導出されるように構成されている、
    請求項25に記載の装置。
  27. 前記オーディオ入力信号が、1つ又は複数のレンダリング可能なオーディオオブジェクトを定義するオブジェクトベースオーディオ信号であり、
    前記装置が、前記少なくとも1つのオーディオオブジェクトのうちの1つとして、前記1つ又は複数のレンダリング可能なオーディオオブジェクトのうちの1つ又は複数(又は全部)の選択を使用するように構成されている、
    請求項1から26のいずれか一項に記載の装置。
  28. ラウドスピーカ位置に関する前記複数のラウドスピーカの変化に関する情報を受信し、前記ラウドスピーカ信号のその後の生成において前記変化を考慮に入れるように構成され、かつ/又は、
    ラウドスピーカの数に関する前記複数のラウドスピーカの変化に関する情報を受信し、前記ラウドスピーカ信号のその後の生成において前記変化を考慮に入れるように構成されている、
    請求項1から27のいずれか一項に記載の装置。
  29. 複数のラウドスピーカ(14)におけるラウドスピーカ信号(12)の適用が、少なくとも1つのオーディオオブジェクトを意図された仮想位置(104)にレンダリングするように、前記複数のラウドスピーカ(14)のための前記ラウドスピーカ信号(12)を生成するための装置であって、前記複数のラウドスピーカが、1つ又は複数の水平層に分配され、前記装置が、
    前記少なくとも1つのオーディオオブジェクトを表すオーディオ入力信号(18)を受信するように構成されたインターフェース(16)と、
    前記意図された仮想位置に応じて、前記複数のラウドスピーカのうちのラウドスピーカの第1のセット(26)の第1のパンニングゲイン(24)を決定し、前記第1のパンニングゲイン(24)を使用して、前記少なくとも1つのオーディオ入力信号(18)から第1の部分ラウドスピーカ信号(28)を導出するように構成された第1のラウドスピーカ信号セット決定部(70)であって、前記第1の部分ラウドスピーカ信号を前記ラウドスピーカの第1のセット(26)に適用すると、第1の仮想位置(106)における前記少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられた第1の部分ラウドスピーカ信号を導出するように構成された第1のラウドスピーカ信号セット決定部(70)と、
    スペクトル整形によって、前記少なくとも1つのオーディオ入力信号(18)から第2の部分ラウドスピーカ信号(34)を導出するように構成された第2のラウドスピーカ信号セット決定部(72)であって、前記第2の部分ラウドスピーカ信号(34)が、前記第2の部分ラウドスピーカ信号(34)がラウドスピーカの第2のセット(36)に適用されたときの第2の仮想位置(102)における前記少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられ、前記第2の仮想位置が前記1つ又は複数の水平層の上方又は下方にある、第2のラウドスピーカ信号セット決定部(72)と、
    前記意図された仮想位置に応じて、前記第1の仮想位置と前記第2の仮想位置との間をパンニングするように前記第1の部分ラウドスピーカ信号及び前記第2の部分ラウドスピーカ信号のためのさらなるパンニングゲイン(32)を決定するように構成された垂直パンニングゲイン決定部(30)と、
    前記さらなるパンニングゲイン(32)を使用して前記第1の部分ラウドスピーカ信号及び第2の部分ラウドスピーカ信号から前記ラウドスピーカ信号を合成するように構成された合成器(40)と、を備える、装置。
  30. 前記ラウドスピーカの第1のセットが、前記1つ又は複数の水平層のうち、前記意図された仮想位置に垂直方向に最も近い1つ又は複数の水平層内にある、
    請求項29に記載の装置。
  31. 前記第1のラウドスピーカ信号セット決定部(70)が、前記ラウドスピーカの第1のセットが、前記1つ又は複数の水平層のうちの、前記意図された仮想位置に垂直方向に最も近い1つ又は複数の水平層内にあるように、前記複数のラウドスピーカのうちの前記ラウドスピーカの第1のセット(26)を選択するように構成されている、
    請求項29又は30に記載の装置。
  32. 前記第1のラウドスピーカ信号セット決定部(70)が、前記ラウドスピーカの第1のセットが1つの水平層内にあり、前記1つの水平層内の前記ラウドスピーカの第1のセットの位置にさらに応じて前記第1のパンニングゲインを決定するように構成されている、
    請求項29又は30に記載の装置。
  33. 前記第1のラウドスピーカ信号セット決定部(70)が、前記第1の仮想位置が前記第1のラウドスピーカセットの位置の間にあるように、前記第1のパンニングゲインが純粋な振幅パンニングを実施するように構成されている、
    請求項29から32のいずれか一項に記載の装置。
  34. 前記第1のラウドスピーカ信号セット決定部(70)が、聴取者の位置にさらに応じて前記第1のパンニングゲインを決定するように構成されている、
    請求項29から33のいずれか一項に記載の装置。
  35. 前記第2のラウドスピーカ信号セット決定部(72)が、前記スペクトル整形が、前記第2の仮想位置からの知覚方向に沿って頭部伝達関数HRTFの特性を模倣するように構成されている、
    請求項29から34のいずれか一項に記載の装置。
  36. 前記第2のラウドスピーカ信号セット決定部(72)が、前記少なくとも1つのオーディオ信号から前記第2の部分ラウドスピーカ信号を導出するように構成され、
    そのため、前記第2の部分ラウドスピーカ信号が、前記第2の部分ラウドスピーカ信号のすべてについて等しい振幅ゲイン係数を使用して前記少なくとも1つのオーディオ信号から、又は、
    前記ラウドスピーカの第2のセット間の水平中心位置又はスイートスポット位置に対応するパンニングゲインを使用してパンニングすることによって、又は、
    垂直投影に沿った聴取者位置と一致する水平位置に対応するパンニングゲインによって生成される、
    請求項29から35のいずれか一項に記載の装置。
  37. 前記ラウドスピーカの第1のセットが前記ラウドスピーカの第2のセットに含まれ、かつ/又は、
    前記ラウドスピーカの第2のセット(36)が前記ラウドスピーカの第1のセット(26)に含まれ、かつ/又は、
    前記ラウドスピーカの第1のセットと前記ラウドスピーカの第2のセットとが一致し、かつ/又は、
    前記ラウドスピーカの第1のセット(26)と前記ラウドスピーカの第2のセット(36)とは部分的に重なり合い、かつ/又は、
    前記ラウドスピーカの第1のセットと前記ラウドスピーカの第2のセットとは互いに排他的である、
    請求項29から36のいずれか一項に記載の装置。
  38. 前記意図された仮想位置の水平成分に応じて、又は前記意図された仮想位置の水平成分及び前記意図された仮想位置の垂直成分に応じて、前記複数のラウドスピーカの中から前記ラウドスピーカの第1のセット(26)を選択するように構成されており、かつ/又は、
    前記意図された仮想位置の垂直成分に応じて、又は前記意図された仮想位置の前記水平成分及び前記意図された仮想位置の前記垂直成分に応じて、前記複数のラウドスピーカのうちの前記ラウドスピーカの第2のセット(36)を選択するように構成されている、
    請求項29から37のいずれか一項に記載の装置。
  39. 前記第2のラウドスピーカ信号セット決定部(72)が、前記第2の仮想位置が前記1つ又は複数の水平層の垂直上方にあるように、かつ前記第2の部分ラウドスピーカ信号が、前記少なくとも1つのオーディオ信号に対して、200から1000Hzのノッチスペクトル範囲で減衰し、1000から10kHzのピークスペクトル範囲のうちの1つ又は複数の範囲内で増幅されるように、前記スペクトル整形を実行するように構成され、又は、
    前記第2のラウドスピーカ信号セット決定部(72)が、前記第2の仮想位置が前記1つ又は複数の水平層の垂直下方にあるように、かつ前記第2の部分ラウドスピーカ信号が、前記少なくとも1つのオーディオ信号に対して、1000Hzを超えるスペクトル範囲で減衰するように、前記スペクトル整形を実行するように構成されている、
    請求項29から38のいずれか一項に記載の装置。
  40. 前記第2のラウドスピーカ信号セット決定部(72)が、前記第2の仮想位置が前記1つ又は複数の水平層の垂直上方にあるように、かつ前記第2の部分ラウドスピーカ信号が、前記少なくとも1つのオーディオ信号に対して、200から1000Hzのノッチスペクトル範囲で減衰し、1000から10kHzのピークスペクトル範囲のうちの1つ又は複数の範囲内で増幅されるように、前記スペクトル整形を実行するように構成され、又は、
    前記第2のラウドスピーカ信号セット決定部(72)が、前記第2の仮想位置が前記1つ又は複数の水平層の垂直下方にあるように、かつ前記第2の部分ラウドスピーカ信号が、前記少なくとも1つのオーディオ信号に対して、1000Hzを超えるスペクトル範囲で減衰し、前記スペクトル範囲内のスペクトル部分範囲内の減衰が中間的に低減され、5kHzから10kHzの間に位置し、500Hzから1kHzの間で増幅されるように、前記スペクトル整形を実行するように構成されている、
    請求項29から39のいずれか一項に記載の装置。
  41. 前記第2のラウドスピーカ信号セット決定部(72)が、
    前記意図された仮想位置が前記1つ又は複数の水平層の垂直上方にある場合、前記1つ又は複数の水平層の垂直上方になるように前記第2の仮想位置を位置決めし、前記第2の部分ラウドスピーカ信号が、前記少なくとも1つのオーディオ信号に対して、200から1000Hzのノッチスペクトル範囲で減衰され、1000から10kHzの間のピークスペクトル範囲で1つ又は複数内で増幅されるように、前記スペクトル整形を実行し、
    前記意図された仮想位置が前記1つ又は複数の水平層の垂直下方にある場合、前記第2の仮想位置を前記1つ又は複数の水平層の垂直下方に位置させ、前記第2の部分ラウドスピーカ信号が、前記少なくとも1つのオーディオ信号に対して、1000Hzを超えるスペクトル範囲で減衰するように、前記スペクトル整形を実行するようにさらに構成されている、
    請求項29から40のいずれか一項に記載の装置。
  42. 前記合成器が、前記1つ又は複数の層内又は前記1つ又は複数の層間の垂直方向の層内位置から、前記1つ又は複数の水平層から垂直方向にオフセットした位置への前記意図された仮想位置の変化に応じるように構成されており、
    前記さらなるパンニングゲインが前記第1の仮想位置から前記第2の仮想位置に向かってパンニングするように、純粋に前記第1の部分ラウドスピーカ信号から前記ラウドスピーカ信号を合成することからフェードして、前記第1の部分ラウドスピーカ信号及び第2の部分ラウドスピーカ信号から前記ラウドスピーカ信号を合成するように前記さらなるパンニングゲインを制御すること、を含む、
    請求項29から41のいずれか一項に記載の装置。
  43. システムであって、
    複数のラウドスピーカと、
    請求項1から42のいずれか一項に記載の装置と、
    を備える、システム。
  44. 複数のラウドスピーカ(14)におけるラウドスピーカ信号(12)の適用が少なくとも1つのオーディオオブジェクトを意図された仮想位置(104)にレンダリングするように、前記複数のラウドスピーカ(14)に対する前記ラウドスピーカ信号(12)を生成するための方法であって、
    前記少なくとも1つのオーディオオブジェクトを表すオーディオ入力信号(18)を受信することと、
    前記意図された仮想位置に応じて、1つ又は複数の第1の水平層の第1の層セット内に配置された前記複数のラウドスピーカのうちのラウドスピーカの第1のセット(26)の第1のパンニングゲイン(24)を決定することであって、前記第1のパンニングゲイン(24)が、前記ラウドスピーカの第1のセット(26)への前記第1の部分ラウドスピーカ信号(28)の適用時の第1の仮想位置(106)における前記少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられ前記少なくとも1つのオーディオ入力信号(18)からの第1の部分ラウドスピーカ信号(28)の導出を定義する、前記第1のパンニングゲイン(24)を決定することと、
    前記意図された仮想位置に応じて、前記第1の部分ラウドスピーカ信号(28)と、1つ又は複数のラウドスピーカのうちの第2のセット(36)に適用される1つ又は複数の第2の部分ラウドスピーカ信号(34)との間のパンニングのためのさらなるパンニングゲイン(32)を決定することであって、前記第2の部分ラウドスピーカ信号が、前記第1の層セットに対して垂直方向にオフセットされており、前記第1の仮想位置(106)と前記第2の位置(102)との間をパンニングするように、第2の位置(102)における前記少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられている、前記さらなるパンニングゲイン(32)を決定することと、
    前記第1のパンニングゲイン(24)及び前記さらなるパンニングゲイン(32)を使用して前記オーディオ入力信号(18)から前記ラウドスピーカ信号(12)を合成することと、を含む、方法。
  45. 複数のラウドスピーカ(14)におけるラウドスピーカ信号(12)の適用が、少なくとも1つのオーディオオブジェクトを意図された仮想位置(104)にレンダリングするように、前記複数のラウドスピーカ(14)に対する前記ラウドスピーカ信号(12)を生成するための方法であって、前記複数のラウドスピーカが、1つ又は複数の水平層に分配され、前記方法が、
    前記少なくとも1つのオーディオオブジェクトを表すオーディオ入力信号(18)を受信することと、
    前記意図された仮想位置に応じて、前記複数のラウドスピーカのうちの第ラウドスピーカの第1のセット(26)の第1のパンニングゲイン(24)を決定することであって、前記第1のパンニングゲイン(24)を使用して、前記少なくとも1つのオーディオ入力信号(18)から第1の部分ラウドスピーカ信号(28)を導出し、前記第1の部分ラウドスピーカ信号が、前記ラウドスピーカの第1のセット(26)への前記第1の部分ラウドスピーカ信号の適用時の第1の仮想位置(106)における前記少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられる、前記第1のパンニングゲイン(24)を決定することと、
    スペクトル整形によって、前記少なくとも1つのオーディオ入力信号(18)から第2の部分ラウドスピーカ信号(34)を導出することであって、前記第2の部分ラウドスピーカ信号(34)が、前記第2の部分ラウドスピーカ信号(34)をラウドスピーカの第2のセット(36)に適用したときの第2の仮想位置(102)における前記少なくとも1つのオーディオオブジェクトのレンダリングに関連付けられ、前記第2の仮想位置が、前記1つ又は複数の水平層の上方又は下方にある、導出することと、
    前記意図された仮想位置に応じて、前記第1の仮想位置と前記第2の仮想位置との間をパンニングするように、前記第1の部分ラウドスピーカ信号及び前記第2の部分ラウドスピーカ信号のためのさらなるパンニングゲイン(32)を決定することと、
    前記さらなるパンニングゲイン(32)を使用して前記第1の部分ラウドスピーカ信号及び第2の部分ラウドスピーカ信号から前記ラウドスピーカ信号を合成することと、を含む、方法。
  46. コンピュータ上で実行されると、請求項44又は45に記載の方法を実行するためのプログラムコードを有するコンピュータプログラムが格納された、コンピュータ可読デジタル記憶媒体。

JP2023552008A 2021-02-26 2022-02-25 オーディオオブジェクトをレンダリングするための装置及び方法 Pending JP2024507945A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/EP2021/054853 WO2022179701A1 (en) 2021-02-26 2021-02-26 Apparatus and method for rendering audio objects
EPPCT/EP2021/054853 2021-02-26
PCT/EP2022/054880 WO2022180248A2 (en) 2021-02-26 2022-02-25 Apparatus and method for rendering audio objects

Publications (1)

Publication Number Publication Date
JP2024507945A true JP2024507945A (ja) 2024-02-21

Family

ID=74797940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023552008A Pending JP2024507945A (ja) 2021-02-26 2022-02-25 オーディオオブジェクトをレンダリングするための装置及び方法

Country Status (11)

Country Link
US (1) US20230396950A1 (ja)
EP (1) EP4298799A2 (ja)
JP (1) JP2024507945A (ja)
KR (1) KR20230147674A (ja)
CN (1) CN117397256A (ja)
AU (1) AU2022225084A1 (ja)
BR (1) BR112023017225A2 (ja)
CA (1) CA3209747A1 (ja)
TW (1) TWI821922B (ja)
WO (2) WO2022179701A1 (ja)
ZA (1) ZA202308151B (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3236949A (en) 1962-11-19 1966-02-22 Bell Telephone Labor Inc Apparent sound source translator
TWI701952B (zh) * 2011-07-01 2020-08-11 美商杜比實驗室特許公司 用於增強3d音頻編輯與呈現之設備、方法及非暫態媒體
CN105103569B (zh) * 2013-03-28 2017-05-24 杜比实验室特许公司 使用被组织为任意n边形的网格的扬声器呈现音频
EP3024253A1 (en) * 2014-11-21 2016-05-25 Harman Becker Automotive Systems GmbH Audio system and method
US20170188170A1 (en) * 2015-12-29 2017-06-29 Koninklijke Kpn N.V. Automated Audio Roaming
US10863297B2 (en) * 2016-06-01 2020-12-08 Dolby International Ab Method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position
CN111937413B (zh) * 2018-04-09 2022-12-06 索尼公司 信息处理设备、方法和程序
EP3949446A1 (en) * 2019-03-29 2022-02-09 Sony Group Corporation Apparatus, method, sound system

Also Published As

Publication number Publication date
US20230396950A1 (en) 2023-12-07
WO2022180248A3 (en) 2022-10-13
KR20230147674A (ko) 2023-10-23
CA3209747A1 (en) 2022-09-01
AU2022225084A1 (en) 2023-09-14
CN117397256A (zh) 2024-01-12
TW202234385A (zh) 2022-09-01
ZA202308151B (en) 2024-04-24
BR112023017225A2 (pt) 2023-09-26
EP4298799A2 (en) 2024-01-03
TWI821922B (zh) 2023-11-11
WO2022180248A2 (en) 2022-09-01
WO2022179701A1 (en) 2022-09-01

Similar Documents

Publication Publication Date Title
US11178503B2 (en) System for rendering and playback of object based audio in various listening environments
US10469970B2 (en) Audio channel spatial translation
Hacihabiboglu et al. Perceptual spatial audio recording, simulation, and rendering: An overview of spatial-audio techniques based on psychoacoustics
US9532158B2 (en) Reflected and direct rendering of upmixed content to individually addressable drivers
US9154896B2 (en) Audio spatialization and environment simulation
US9197977B2 (en) Audio spatialization and environment simulation
CN113170271B (zh) 用于处理立体声信号的方法和装置
US10764709B2 (en) Methods, apparatus and systems for dynamic equalization for cross-talk cancellation
EP3579584A1 (en) Controlling rendering of a spatial audio scene
WO2017063688A1 (en) Method and device for generating an elevated sound impression
Malham Approaches to spatialisation
JP2024507945A (ja) オーディオオブジェクトをレンダリングするための装置及び方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231023

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231023